KR20220108036A

KR20220108036A - 최소 아레스틴 도메인 함유 단백질 1 (arrdc1) 구축물

Info

Publication number: KR20220108036A
Application number: KR1020227013827A
Authority: KR
Inventors: 콴 루; 치유 왕
Original assignee: 프레지던트 앤드 펠로우즈 오브 하바드 칼리지
Priority date: 2019-09-26
Filing date: 2020-09-25
Publication date: 2022-08-02
Also published as: EP4034088A1; CN114901257A; AU2020353149A1; EP4034088A4; JP2022550130A; US20220403003A1; CA3152414A1; WO2021062196A1

Abstract

아레스틴 도메인 함유 단백질 1 (ARRDC1)-매개된 미세소포 (ARMM)의 형성을 유도하는 최소 ARRDC1 구축물이 본원에 개시된다. 이들 소포는 다양한 분자 화물, 예컨대 소분자, 핵산, 및 단백질을 패키징하고 전달하도록 활용될 수 있다. 이러한 화물의 예는 게놈 편집제 Cas9이다.

Description

최소 아레스틴 도메인 함유 단백질 1 (ARRDC1) 구축물

아레스틴 도메인 함유 단백질 1 (ARRDC1)은 ARRDC1-매개된 미세소포 (ARMM: ARRDC1-mediated microvesicle)로 공지된 세포외 소포의 형성을 유도하며, 이들 소포는 다양한 분자 화물, 예컨대 소분자, 단백질, 및 핵산을 패키징하고 전달하도록 활용될 수 있다.

아레스틴 도메인 함유 단백질 1 (ARRDC1)은 ARMM으로 공지된 세포외 소포의 형성을 유도하며 (Nabhan J et al., PNAS 2012), 이들 소포는 다양한 화물, 예컨대 단백질, 핵산, 및 소분자를 패키징하고 전달하도록 활용될 수 있다 (Wang Q and Lu Q, Nat Commun 2018). 전장 ARRDC1 단백질 (~46 kD의 433개의 아미노산)은 분자 화물과의 직접 융합을 통해 또는 단백질-단백질 상호작용을 통해 분자 화물을 소포 내로 동원하는데 사용되었다. ARRDC1 단백질 그 자체가 ARMM 내로 패키징되기 때문에, 및 소포의 크기가 제한되기 때문에 (~80-100 nm), 버딩을 유도하는데 있어서 여전히 기능할 수 있는 보다 작은 ARRDC1 단백질은 소포 내로 패키징될 수 있는 화물의 수를 잠재적으로 증가시킬 것이다. 더욱이, 보다 작은 ARRDC1은 상대적으로 큰 분자 화물의 동원을 허용할 수 있다.

ARMM 버딩을 유도하는데 충분한 최소 ARRDC1 단백질이 본원에 개시된다. 본원에 기재된 ARMM 전달 시스템은 세포에의 분자 화물, 예컨대 소분자, 단백질, 및 핵산의 안전하고 효율적인 전달을 방지하는 현재의 전달 시스템의 많은 한계를 다룬다. ARMM은 내인성 버딩 경로로부터 유도되기 때문에, 이들은 염증 반응을 촉발시키는 것으로 공지된 바이러스 전달 시스템과는 달리, 강한 면역 반응을 유발할 가능성이 적다 (Sen D. et al., "Cellular unfolded protein response against viruses used in gene therapy", Front Microbiology. 2014; 5:250, 1-16.). 추가로, ARMM은 관심의 임의의 화물 단백질 (예를 들어, 가이드 RNA (gRNA)를 갖는 표적화된 엔도뉴클레아제, 예컨대 Cas9 단백질, 또는 Cas9 변이체)의 특이적 패키징을 허용한다. 이어서 이들 화물은 항체 또는 다른 유형의 분자를 조직-특이적 마커를 인식하는 ARMM에 혼입함으로써 특이적 수용자 세포/조직에 의한 융합 또는 흡수에 의해 전달될 수 있다. 일부 측면에서, 표적화된 엔도뉴클레아제, 예컨대Cas9-gRNA 및 그들의 변이체는 표적 세포에의 전달을 위해 ARMM 내로 로딩될 수 있다.

ARMM은 엑소좀과는 별개인 미세소포이며, 버딩 바이러스와 같이, 직접적 형질막 버딩 (DPMB)에 의해 생산된다. DPMB는 그의 아레스틴 도메인을 통해 형질막에 국재화된 아레스틴-도메인-함유 단백질 ARRDC1 보조 단백질의 테트라펩티드 PSAP (서열식별번호(SEQ ID NO): 122) 또는 PTAP (서열식별번호: 123) 모티프와의 TSG101의 특이적 상호작용에 의해 유도된다. ARMM은 예를 들어, 그 전체 내용이 본원에 참조로 포함되는 루 큐.(Lu Q.) 등에 의해 2013년 2월 6일에 출원되고, 발명의 명칭이 "Arrdc1-매개된 미세소포 (ARMM) 및 그의 용도"인 PCT 출원 번호 PCT/US2013/024839 (WO 2013/119602 A1로서 공개됨); 그의 전체 내용이 본원에 참조로 포함되는 루 큐. 등에 의해 2015년 10월 30일에 출원되고, 발명의 명칭이 "ARRDC1-매개된 미세소포 (ARMM)를 통한 Cas9의 전달"인 미국 출원 번호 14/929177 (US 20160206566 A1로서 공개됨); 및 그의 전체 내용이 본원에 참조로 포함되는 루 큐. 등에 의해 2017년 10월 3일에 출원되고, 발명의 명칭이 "ARRDC1-매개된 미세소포를 통한 치료 RNA의 전달"인 PCT 출원 번호 PCT/US2017/054912 (WO 2018/067546 A1로서 공개됨)에 상세하게 기재되었다. ARRDC1/TSG101 상호작용은 엔도좀으로부터 형질막으로의 TSG101의 재배치를 발생시키고, TSG101, ARRDC1, 및 다른 세포 성분을 함유하는 미세소포의 방출을 매개한다.

따라서, 일부 실시양태에서, 본 개시내용은 하기를 포함하는 최소 아레스틴 도메인-함유 단백질 1 (ARRDC1)로서: 아레스틴 도메인, 적어도 1개의 PSAP (서열식별번호: 122) 또는 PTAP (서열식별번호: 123) 모티프, 및 적어도 1개의 PPXY 모티프, 여기서 최소 ARRDC1은 전장 ARRDC1 단백질보다 더 짧은 것인 최소 ARRDC1을 제공한다. 일부 실시양태에서, 최소 ARRDC1은 적어도 2개의 PPXY 모티프를 포함한다. 일부 실시양태에서, 최소 ARRDC1은 400개 미만의 아미노산의 길이이다. 일부 실시양태에서, PPXY 모티프 중 1개 이상은 PPEY (서열식별번호: 124)이다. 일부 실시양태에서, PPXY 모티프 중 1개 이상은 PPSY (서열식별번호: 115)이다. 일부 실시양태에서, 적어도 2개의 PPXY 모티프는 PPEY (서열식별번호: 124) 및 PPSY (서열식별번호: 115)이다. 일부 실시양태에서, 최소 ARRDC1은 서열식별번호: 1에 제시된 아미노산 서열을 포함한다.

본 개시내용의 측면은 하기를 포함하는 아레스틴 도메인-함유 단백질 1 (ARRDC1)-매개된 미세소포 (ARMM)를 제공한다: 지질 이중층 및 최소 ARRDC1 단백질 또는 그의 변이체. 일부 실시양태에서, 최소 ARRDC1 단백질은 적어도 1개의 PSAP (서열식별번호: 122) 또는 PTAP (서열식별번호: 123) 모티프 및 적어도 1개의 PPXY 모티프를 포함하고, 여기서 최소 ARRDC1 단백질은 전장 ARRDC1 단백질보다 더 짧다. 일부 실시양태에서, 최소 ARRDC1 단백질은 서열식별번호: 1에 제시된 아미노산 서열을 포함한다. 일부 실시양태에서, 미세소포는 화물, 예를 들어, 핵산, 단백질, 및/또는 소분자를 추가로 포함한다.

일부 실시양태에서, 미세소포는 TSG101 단백질 또는 그의 단편을 추가로 포함한다. 일부 실시양태에서, TSG101 단백질 단편은 TSG101 UEV 도메인을 포함한다. 일부 실시양태에서, 전달되는 화물은 최소 ARRDC1 단백질, 최소 ARRDC1 단편, TSG101 단백질, 또는 TSG101 단편에 접합된다. 일부 실시양태에서, 미세소포는 인테그린, 수용체 티로신 키나제, G-단백질 커플링된 수용체, 또는 막-결합된 이뮤노글로불린을 추가로 포함한다.

일부 실시양태에서, 미세소포는 Cas9 단백질 또는 Cas9 단백질 변이체, Oct4, Sox2, c-Myc, KLF4 재프로그래밍 인자, p53, Rb (망막모세포종 단백질), BRCA1, BRCA2, PTEN, APC, CD95, ST7, ST14, BCL-2 패밀리 단백질, 카스파제;,BRMS1, CRSP3, DRG1, KAI1, KISS1, NM23, TIMP-패밀리 단백질, BMP-패밀리 성장 인자, EGF, EPO, FGF, G-CSF, GM-CSF, GDF-패밀리 성장 인자, HGF, HDGF, IGF, PDGF, TPO, TGF-α, TGF-β, VEGF; 아연 핑거 뉴클레아제, Cre 리콤비나제, Dre 리콤비나제, FLP 리콤비나제, Hin, Gin, Tn3, β-six, CinH, ParA, γδ, Bxb1, ΦC31, TP901, TG1, φBT1, R4, φRV1, φFC1, MR11, A118, U153, gp29, Cre, FLP, R, Lambda, HK101, HK022, pSAM2, CAS9 뉴클레아제 또는 다른 Cas9-유사 표적화된 엔도뉴클레아제, 예컨대 Cpf1, CasX, CasY, 또는 Geo), Sp1, NF1, CCAAT, GATA, HNF, PIT-1, MyoD, Myf5, Hox, 날개 나선, SREBP, p53, CREB, AP-1, Mef2, STAT, R-SMAD, NF-κB, Notch, TUBBY, NFAT, α1β1 인테그린, α2β1 인테그린, α4β1 인테그린, α5β1 인테그린, α6β1 인테그린, αLβ2 인테그린, αMβ2 인테그린, αIIbβ3 인테그린, αVβ3 인테그린, αVβ5 인테그린, αVβ6 인테그린, α6β4 인테그린, EGF 수용체 (ErbB 패밀리), 인슐린 수용체, PDGF 수용체, FGF 수용체, VEGF 수용체, HGF 수용체, Trk 수용체, Eph 수용체, AXL 수용체, LTK 수용체, TIE 수용체, ROR 수용체, DDR 수용체, RET 수용체, KLG 수용체, RYK 수용체, MuSK 수용체, 로돕신-유사 수용체, 세크레틴 수용체, 대사자극성 글루타메이트/페로몬 수용체, 시클릭 AMP 수용체, 프리즐드/스무든드 수용체, CXCR4, CCR5, 베타-아드레날린성 수용체, CA19-9, c-met, PD-1, CTLA-4, ALK, AFP, EGFR, 에스트로겐 수용체 (ER), 프로게스테론 수용체 (PR), HER2/neu, KIT, B-RAF, S100, MAGE, 티로글로불린, MUC-1, 및 PSMA로 이루어진 군으로부터 선택되는 작용제를 포함한다.

일부 실시양태에서, 전달되는 작용제 (페이로드 또는 화물)는 핵산이다. 일부 실시양태에서, 핵산은 RNA를 포함한다. 특정 실시양태에서, RNA는 RNAi 작용제이다. RNA는 코딩 RNA, 비-코딩 RNA, 안티센스 RNA, mRNA, 가이드 RNA, 작은 RNA, siRNA, shRNA, 마이크로RNA, snRNA, snoRNA, lincRNA, 또는 구조적 RNA, 또는 rRNA 또는 리보자임일 수 있다.

일부 실시양태에서, 핵산은 DNA를 포함한다. 일부 실시양태에서, DNA는 레트로트랜스포존 서열, LINE 서열, SINE 서열, 복합 SINE 서열, 또는 LTR-레트로트랜스포존 서열을 포함한다.

일부 실시양태에서, 핵산 작용제는 단백질을 코딩한다. 일부 실시양태에서, 작용제는 검출가능한 표지를 포함한다.

일부 실시양태에서, 작용제는 치료제를 포함한다.

일부 실시양태에서, 작용제는 효소, 항체, Fab, Fab', F(ab')2, Fd, scFv, Fv, dsFv, 디아바디, 및 아피바디로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 작용제는 세포독성제를 포함한다.

일부 실시양태에서, 작용제는 단백질을 포함한다. 일부 실시양태에서, 작용제는 전사 인자, 전사 억제제, 형광 단백질, 키나제, 포스파타제, 프로테아제, 리가제, 또는 리콤비나제를 포함한다.

일부 실시양태에서 작용제는 지질, 또는 지단백질, 또는 당단백질, 또는 다당류, 또는 지질다당류를 포함한다.

일부 실시양태에서, 작용제는 ARRDC1 단백질 또는 그의 단편, 또는 TSG101 단백질 또는 그의 단편에 공유 결합된다. 일부 실시양태에서, 작용제는 링커를 통해 ARRDC1 단백질 또는 그의 단편 또는 TSG101 단백질 또는 그의 단편에 접합된다. 일부 실시양태에서, 링커는 절단가능한 링커이다. 일부 실시양태에서, 링커는 프로테아제 인식 부위 또는 UV-절단가능한 모이어티, 광절단가능한 링커, 또는 생물학적 메커니즘, 공유 결합의 화학적 분해, 비-공유 회합의 해리, 열 불안정성 링크, 또는 pH 불안정성 링크에 의해 절단가능한 다른 링커를 포함한다.

일부 실시양태에서, 전달되는 작용제는 적어도 1개의 WW 도메인 또는 그의 변이체에 융합된다. 일부 실시양태에서, 작용제는 2, 3, 4 또는 5개의 WW 도메인 또는 그의 변이체를 포함한다. 일부 실시양태에서, WW 도메인은 유비퀴틴 리가제 WWP1, WWP2, Nedd4-1, Nedd4-2, Smurf1, Smurf2, ITCH, NEDL1, 또는 NEDL2의 WW 도메인으로부터 유래된다. 일부 실시양태에서, WW 도메인은 서열식별번호: 6 내지 14로 이루어진 군으로부터 선택되는 서열을 포함한다.

일부 실시양태에서, 작용제는 단백질이다. 일부 실시양태에서, 작용제는 Cas9 단백질을 포함한다. 일부 실시양태에서, Cas9 단백질 또는 그의 변이체는 적어도 1개의 핵 국재화 서열 (NLS)을 포함한다. 일부 실시양태에서, 미세소포는 가이드 RNA (gRNA)를 추가로 포함한다. 일부 실시양태에서, WW 도메인은 단백질의 N-말단에 융합된다. 일부 실시양태에서, WW 도메인은 단백질의 C-말단에 융합된다. 일부 실시양태에서, 미세소포는 엑소좀 바이오마커를 포함하지 않는다. 일부 실시양태에서, 미세소포는 엑소좀 바이오마커에 대해 음성이다.

일부 실시양태에서, 엑소좀 바이오마커는 CD63, Lamp-1, Lamp-2, CD9, HSPA8, GAPDH, CD81, SDCBP, PDCD6IP, ENO1, ANXA2, ACTB, YWHAZ, HSP90AA129, ANXA5, EEF1A1, YWHAE, PPIA, MSN, CFL1, ALDOA, PGK1, EEF2, ANXA1, PKM2, HLA-DRA, 및 YWHAB로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 미세소포는 Lamp-1을 포함하지 않거나 또는 그에 대해 음성이다. 일부 실시양태에서, 미세소포 직경은 약 30 nm 내지 약 500 nm이다.

본 개시내용의 측면은 Cas9 화물 단백질을 추가로 포함하는 상기 기재된 바와 같은 아레스틴 도메인-함유 단백질 1 (ARRDC1)-매개된 미세소포 (ARMM)를 개시한다. Cas9 화물 단백질은 최소 ARRDC1 단백질에 연결될 수 있다. ARRDC1 단백질은 Cas9 화물 단백질에 공유 연결될 수 있다. 일부 실시양태에서, 최소 ARRDC1 단백질은 절단가능한 링커를 통해 Cas9 단백질에 연결된다. 링커는 UV-절단가능한 링커일 수 있고, 프로테아제 인식 부위 또는 생물학적 메커니즘, 공유 결합의 화학적 분해, 비-공유 회합의 해리, 열 불안정성 링크, 또는 pH 불안정성 링크에 의해 절단가능한 다른 링커를 포함할 수 있다.

일부 측면에서, 본 개시내용은 하기를 포함하는 아레스틴 도메인-함유 단백질 1 (ARRDC1)-매개된 미세소포 (ARMM)로서: 최소 ARRDC1 단백질 또는 그의 변이체, 및 화물 단백질, 여기서 화물 단백질은 TSG101 단백질 또는 그의 변이체에 연결된 것인 미세소포를 제공한다. 일부 측면에서 화물 단백질은 화물-TSG101 융합 단백질로서의 발현에 의해 TSG101 단백질 또는 변이체에 연결된다.

일부 측면에서, 본 개시내용은 하기를 포함하는 아레스틴 도메인-함유 단백질 1 (ARRDC1)-매개된 미세소포 (ARMM)로서: 최소 ARRDC1 단백질 또는 그의 변이체, 및 표적화된 엔도뉴클레아제, 여기서 표적화된 엔도뉴클레아제는 TSG101 단백질 또는 그의 변이체에 연결된 것인 미세소포를 제공한다.

일부 측면에서, 본 개시내용은 하기를 포함하는 아레스틴 도메인-함유 단백질 1 (ARRDC1)-매개된 미세소포 (ARMM)로서: 최소 ARRDC1 단백질 또는 그의 변이체, 및 Cas9 화물 단백질, 여기서 Cas9 화물 단백질은 TSG101 단백질 또는 그의 변이체에 연결된 것인 미세소포를 제공한다.

본 개시내용의 일부 측면은 최소 ARRDC1 융합 단백질에 관한 것이다. 일부 실시양태에서, 최소 ARRDC1 융합 단백질은 최소 ARRDC1 단백질 또는 그의 변이체를 포함하고, 여기서 최소 ARRDC1 단백질은 아레스틴 도메인, 적어도 1개의 PSAP (서열식별번호: 122) 모티프, 적어도 1개의 PPXY 모티프, 및 Cas9 단백질 또는 그의 변이체를 포함한다.

일부 측면에서, 본 개시내용은 이종 프로모터의 제어 하에서 최소 ARRDC1 단백질을 코딩하는 재조합 발현 구축물을 포함하는 미세소포-생산 세포를 제공한다. 일부 실시양태에서, 미세소포-생산 세포는 이종 프로모터의 제어 하에서 화물 단백질을 코딩하는 재조합 발현 구축물을 추가로 포함한다. 화물 단백질은 적어도 1개의 WW 도메인 또는 그의 변이체에 융합될 수 있다. 화물 단백질은 최소 ARRDC1과의 융합 단백질로서 발현될 수 있다. 화물 단백질은 TSG101과의 융합 단백질로서 발현될 수 있다. 일부 실시양태에서, 미세소포-생산 세포는 이종 프로모터의 제어 하에서 생산된 화물 핵산을 코딩하는 재조합 발현 구축물을 추가로 포함한다.

일부 측면에서, 본 개시내용은 이종 프로모터의 제어 하에서 최소 ARRDC1 단백질을 코딩하는 재조합 발현 구축물을 포함하는 미세소포-생산 세포로서, 여기서 최소 ARRDC1 단백질은 아레스틴 도메인, 적어도 1개의 PSAP (서열식별번호: 122) 모티프 또는 PTAP (서열식별번호: 123) 모티프, 및 적어도 1개의 PPXY 모티프를 포함하고, 여기서 최소 ARRDC1 단백질은 전장 ARRDC1 단백질보다 더 짧고; 여기서 최소 ARRDC1 단백질은 Cas9 화물 단백질 또는 그의 변이체에 연결된 것인 미세소포-생산 세포를 포함한다. 일부 실시양태에서, 미세소포 생산 세포는 적어도 2개의 PPXY 모티프를 포함하는 최소 ARRDC1을 포함한다.

본 개시내용의 측면은 표적 세포를 본원에 개시된 임의의 미세소포 또는 미세소포-생산 세포와 접촉시킴으로써 화물을 표적 세포에 전달하는 방법을 포함한다. 본 개시내용의 일부 측면은 표적 세포를 본원에 개시된 임의의 미세소포 또는 미세소포-생산 세포와 접촉시키는 것을 포함하는, 유전자 편집의 방법을 제공한다.

본 발명의 다른 이점, 특색, 및 용도는 특정 예시적인 비-제한적 실시양태의 상세한 설명; 도면; 비-제한적 작업 실시예; 및 청구항으로부터 명백할 것이다.

도 1은 전장 ARRDC1 단백질 및 최소 ARRDC1의 예에서의 도메인/모티프를 제시하는 개략도이다.
도 2a 내지 2c - 도 2a는 전장 ARRDC1, 최소 ARRDC1의 예, 및 짧은 N-말단을 갖는 ARRDC1에서의 도메인/모티프를 제시하는 개략도이다. 도 2b는 웨스턴 블롯의 화상을 제시한다. 구축물 (모두 GFP 단백질에 융합됨)을 HEK293T 세포 내로 형질감염시켰다. 형질감염 후 48시간에, 세포외 소포 (EV)를 초원심분리를 통해 단리하고, 항-GFP 웨스턴 블롯팅에 사용하였다. 형질감염된 세포의 전체 세포 용해물이 포함되었다. 도 2c는 나노사이트(Nanosight) NS300 기기에 의해 측정된 바와 같은 형질감염된 세포 (도 2b에서와 같음)로부터의 배양 배지에서의 EV의 수를 제시하는 그래프이다.
도 3a 내지 3c - 도 3a는 Cas9에의 최소 ARRDC1의 융합을 나타내는 개략도이다. 도 3b는 항-Flag 웨스턴 블롯팅의 결과를 제시한다. Cas9, ARRDC1-Cas9, 및 미니ARRDC1-Cas9 (모두 C-말단에 Flag 태그를 가짐)를 HEK293T 세포 내로 형질감염시켰다. 형질감염 후 48시간에, EV를 초원심분리를 통해 단리하고, 항-Flag 웨스턴 블롯팅에 사용하였다. 형질감염된 세포의 전체 세포 용해물이 포함되었다. 도 3c는 Cas9/GFP-gRNA, 최소 ARRDC1-Cas9/GFP-gRNA, 및 대조군에 대한 gRNA 비 (ARMM/세포)를 제시하는 그래프이다. GFP 유전자를 표적화하는 가이드 RNA (gRNA)와 함께 Cas9 및 미니ARRDC1-Cas9를 공여자 HEK293T 세포 내로 형질감염시켰다. 형질감염 후 48시간에, EV를 초원심분리를 통해 단리하였다. ARMM 중의 gRNA 양을 qRT-PCR에 의해 측정하고, 세포 gRNA에 대해 정규화하였다.
도 4는 미니ARRDC1-Cas9의 유전자 편집 활성을 제시한다. 단일 카피 GFP 유전자를 표적화하는 가이드 RNA (gRNA)와 함께 Cas9, ARRDC1-Cas9, 및 미니ARRDC1-Cas9를 U2OS 세포 내로 형질감염시켰다. 형질감염 후 48시간에, 게놈 DNA를 단리하고, gRNA 표적화 부위를 함유하는 GFP 단편을 증폭시키고, T7E1 절단 검정에 의해 분석하여 인델 (삽입 또는 결실)을 검출하였다.
도 5는 전장 ARRDC1 및 최소 ARRDC1의 예의 단백질 서열을 제시한다.

정의

ARRDC1: ARRDC1은 또한 본원에서 각각 PSAP (서열식별번호: 122) 및 PPXY 모티프로 지칭되는 PSAP (서열식별번호: 122) 및 PPXY 모티프를 그의 C-말단에 포함하고, 본원에 제시된 바와 같은 TSG101과 상호작용하는 단백질이다. 예시적인 비-제한적 ARRDC1 단백질 서열은 본원에서 제공되며, 본 발명의 측면에 따른 추가의 적합한 ARRDC1 단백질 변이체는 관련 기술분야에 공지되어 있다. 또한, 예시적인 비-제한적 최소 ARRDC1 단백질 서열은 본원에서 제공된다. 본 발명은 이에 관하여 제한되지 않음이 관련 기술분야의 통상의 기술자에 의해 인지될 것이다. 예시적인 ARRDC1 서열은 하기를 포함한다 (PSAP (서열식별번호: 122) 및 PPXY 모티프는 표시됨):

>gi|22748653|ref|NP_689498.1| 아레스틴 도메인-함유 단백질 1 [호모 사피엔스(Homo sapiens)]

>gi|244798004|ref|NP_001155957.1| 아레스틴 도메인-함유 단백질 1 이소형 a [무스 무스쿨루스(Mus musculus)]

>gi|244798112|ref|NP_848495.2| 아레스틴 도메인-함유 단백질 1 이소형 b [무스 무스쿨루스]

본원에 사용된 용어 "ARMM"은 ARRDC1 단백질 또는 그의 변이체, 및/또는 TSG101 단백질 또는 그의 변이체를 포함하는 미세소포를 지칭한다. 일부 실시양태에서, ARRDC1 단백질 또는 그의 변이체는 최소 ARRDC1 단백질 또는 그의 변이체이다. 일부 실시양태에서, ARMM은 세포로부터 쉐딩되고, 세포질에 존재하거나 세포의 막과 회합된 분자, 예를 들어, 핵산, 단백질, 또는 소분자를 포함한다. 일부 실시양태에서, ARMM은 트랜스진을 포함하는 재조합 발현 구축물을 포함하는 트랜스제닉 세포로부터 쉐딩되고, ARMM은 유전자 산물, 예를 들어, 발현 구축물에 의해 코딩되는 전사체 또는 단백질 (예를 들어, 화물 단백질)을 포함한다. 일부 실시양태에서, 발현 구축물에 의해 코딩되는 단백질은 최소 ARRDC1 단백질과 회합하여 ARMM 내로의 Cas9 화물 단백질의 로딩을 용이하게 할 수 있는 Cas9 융합 단백질, 또는 적어도 1개의 WW 도메인, 또는 그의 변이체에 융합된 Cas9 화물 단백질이다. 일부 실시양태에서, ARMM은 합성적으로, 예를 들어, TSG101, 또는 그의 변이체의 존재 하에서 무세포 시스템에서 지질 이중층을 ARRDC1 단백질, 또는 그의 변이체와 접촉시킴으로써 생산된다. 다른 실시양태에서, ARMM은 지질 이중층을 HECT 도메인 리가제, 및 VPS4a와 접촉시킴으로써 합성적으로 생산된다. 일부 실시양태에서, ARMM은 후기 엔도좀 마커를 결여한다. 본원에서 제공된 바와 같은 일부 ARMM은 1종 이상의 엑소좀 바이오마커를 포함하지 않거나 또는 그에 대해 음성이다. 엑소좀 바이오마커는 관련 기술분야의 통상의 기술자에게 공지되어 있으며, CD63, Lamp-1, Lamp-2, CD9, HSPA8, GAPDH, CD81, SDCBP, PDCD6IP, ENO1, ANXA2, ACTB, YWHAZ, HSP90AA1, ANXA5, EEF1A1, YWHAE, PPIA, MSN, CFL1, ALDOA, PGK1, EEF2, ANXA1, PKM2, HLA-DRA, 및 YWHAB를 포함하나 이에 제한되지는 않는다. 예를 들어, 본원에서 제공된 일부 ARMM은 CD63을 결여하고, 일부 ARMM은 LAMP1을 결여하고, 일부 ARMM은 CD9를 결여하고, 일부 ARMM은 CD81을 결여하고, 일부 ARMM은 CD63 및 Lamp-1을 결여하고, 일부 ARMM은 CD63, Lamp-1, 및 CD9를 결여하고, 일부 ARMM은 CD63, Lamp-1, CD81, 및 CD9를 결여하는 등이다. 본원에서 제공된 특정 ARMM은 엑소좀 바이오마커를 포함할 수 있다. 따라서, 일부 ARMM은 1종 이상의 엑소좀 바이오마커에 대해 음성이지만, 1종 이상의 다른 엑소좀 바이오마커에 대해서는 양성일 수 있다. 예를 들어, 이러한 ARMM은 CD63 및 Lamp-1에 대해 음성일 수 있지만, PGK1 또는 GAPDH를 포함할 수 있거나; 또는 CD63, Lamp-1, CD9, 및 CD81에 대해 음성일 수 있지만, HLA-DRA에 대해서는 양성일 수 있다. 일부 실시양태에서, ARMM은 엑소좀 바이오마커를 포함하지만, 엑소좀에서 전형적으로 발견되는 것들보다 더 낮은 수준에서이다. 예를 들어, 일부 ARMM은 엑소좀에서 발견되는 그 바이오마커의 수준의 약 1% 미만, 약 5% 미만, 약 10% 미만, 약 20% 미만, 약 30% 미만, 약 40% 미만, 또는 약 50% 미만의 수준으로 1종 이상의 엑소좀 바이오마커를 포함한다. 비-제한적 예를 제공하기 위해, 일부 실시양태에서, ARMM은 CD63 및 Lamp-1에 대해 음성일 수 있고, 엑소좀에서 전형적으로 발견되는 CD9의 수준의 약 5% 미만의 수준으로 CD9를 포함하고, ACTB에 대해 양성일 수 있다. 상기 열거된 것들 외에도 엑소좀 바이오마커는 관련 기술분야의 통상의 기술자에게 공지되어 있으며, 본 발명은 이에 관하여 제한되지 않는다.

작용제 및 전달되는 작용제: 본원에 사용된 용어 "작용제"는 ARMM에, 예를 들어, ARMM의 액체 상 내로 또는 ARMM의 지질 이중층 내로 혼입될 수 있는 물질을 지칭한다. 용어 "전달되는 작용제"는 대상체, 기관, 조직, 또는 세포에 전달될 수 있는 임의의 물질을 지칭한다. 일부 실시양태에서, 작용제는 표적 세포에 전달되는 작용제이다. 일부 실시양태에서, 전달되는 작용제는 생물학적으로 활성인 작용제이며, 즉, 이는 세포, 생물학적 시스템, 및/또는 대상체에서 활성을 갖는다. 예를 들어, 대상체에게 투여되는 경우 그 대상체에 대해 생물학적 효과를 갖는 물질은 생물학적으로 활성인 것으로 간주된다. 일부 실시양태에서, 전달되는 작용제는 치료제이다. 본원에 사용된 용어 "치료제"는 대상체에게 투여되는 경우, 유익한 효과를 갖는 임의의 작용제를 지칭한다. 용어 "치료제"는 대상체에게 투여되는 경우, 치료, 진단, 및/또는 예방 효과를 갖고/거나, 바람직한 생물학적 및/또는 약리학적 효과를 유발하는 임의의 작용제를 지칭한다. 본원에 사용된 용어 "치료제"는 그의 ARMM과의 회합 또는 그 내로의 포함을 통해 세포에 전달되는 핵산일 수 있다. 특정 실시양태에서, 전달되는 작용제는 핵산이다. 특정 실시양태에서, 전달되는 작용제는 DNA이다. 특정 실시양태에서, 전달되는 작용제는 RNA이다. 특정 실시양태에서, 전달되는 작용제는 펩티드 또는 단백질이다. 일부 실시양태에서, 세포 내로 전달되는 기능적 단백질 또는 펩티드는 전사 인자, 종양 서프레서, 발달 조절제, 재프로그래밍 인자, 성장 인자, 전이 서프레서, 프로-아폽토시스 단백질, 아연-핑거 뉴클레아제, 전사 활성화제-유사 이펙터 뉴클레아제, Cas9 단백질, 또는 리콤비나제이다. 일부 실시양태에서, 전달되는 단백질은 p53, Rb (망막모세포종 단백질), BRCA1, BRCA2, PTEN, APC, CD95, ST7, ST14, BCL-2 패밀리 단백질, 카스파제; BRMS1, CRSP3, DRG1, KAI1, KISS1, NM23, TIMP-패밀리 단백질, BMP-패밀리 성장 인자, EGF, EPO, FGF, G-CSF, GM-CSF, GDF-패밀리 성장 인자, HGF, HDGF, IGF, PDGF, TPO, TGF-α, TGF-β, VEGF; 아연 핑거 뉴클레아제, Cre, Dre, 또는 FLP 리콤비나제이다. 특정 실시양태에서, 전달되는 작용제는 소분자이다. 일부 실시양태에서, 소분자는 FDA-승인된 약물이다. 일부 실시양태에서, 전달되는 작용제는 진단제이다. 일부 실시양태에서, 전달되는 작용제는 영상화제로서 유용하다. 이들 실시양태의 일부에서, 진단제 또는 영상화제는 생물학적으로 활성이고, 다른 것들에서는 그렇지 않다.

동물: 본원에 사용된 용어 "동물"은 동물계의 임의의 구성원을 지칭한다. 일부 실시양태에서, "동물"은 임의의 발달 단계에 있는 양쪽 성별의 인간을 지칭한다. 일부 실시양태에서, "동물"은 임의의 발달 단계에 있는 비-인간 동물을 지칭한다. 특정 실시양태에서, 비-인간 동물은 포유동물 (예를 들어, 설치류, 마우스, 래트, 토끼, 원숭이, 개, 고양이, 양, 소, 영장류, 또는 돼지)이다. 일부 실시양태에서, 동물은 포유동물, 조류, 파충류, 양서류, 어류, 및 벌레를 포함하나 이에 제한되지는 않는다. 일부 실시양태에서, 동물은 트랜스제닉 동물, 유전자-조작된 동물, 또는 클론이다. 일부 실시양태에서, 동물은 트랜스제닉 비-인간 동물, 유전자-조작된 비-인간 동물, 또는 비-인간 클론이다.

대략: 관심의 1개 이상의 값에 적용되는 바와 같은 본원에 사용된 용어 "대략" 또는 "약"은 언급된 참조 값과 유사한 값을 지칭한다. 특정 실시양태에서, 용어 "대략" 또는 "약"은 달리 언급되거나 다르게는 맥락으로부터 명백하지 않는 한 (이러한 수가 가능한 값의 100%를 초과한 경우를 제외하고), 언급된 참조 값의 양쪽 방향에서 (초과 또는 미만) 25%, 20%, 19%, 18%, 17%, 16%, 15%, 14%, 13%, 12%, 11%, 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 1%, 또는 그 미만 내에 해당하는 값의 범위를 지칭한다.

회합된: 2개 이상의 실체, 예를 들어, 모이어티, 분자, 및/또는 ARMM에 관하여 사용되는 경우 본원에 사용된 용어 "회합된", "접합된", "연결된", "부착된", 및 "묶인"은 실체가 직접적으로 또는 링커로서 역할을 하는 1개 이상의 추가의 모이어티를 통해 서로와 물리적으로 회합되거나 연결되어, 실체가 구조가 사용되는 조건, 예를 들어, 생리학적 조건 하에서 물리적으로 회합되어 남아 있도록, 충분히 안정한 구조를 형성함을 의미한다. ARMM은 전형적으로 공유 또는 비-공유 회합을 수반하는 메커니즘에 의해 작용제, 예를 들어, 핵산, 단백질, 또는 소분자와 회합된다. 특정 실시양태에서, 전달되는 작용제는 ARMM의 일부인 분자, 예를 들어, ARRCD1 단백질 또는 그의 단편, TSG101 단백질 또는 그의 단편, 또는 ARMM의 지질 이중층의 일부를 형성하는 지질 또는 단백질에 공유 결합된다. 일부 실시양태에서, 펩티드 또는 단백질은 공유 결합 (예를 들어, 아미드 결합)에 의해 ARRCD1 단백질 또는 그의 단편, TSG101 단백질 또는 그의 단편, 또는 지질 이중층-회합된 단백질과 회합된다. 일부 실시양태에서, 회합은 링커, 예를 들어, 절단가능한 링커를 통해서이다. 일부 실시양태에서, 실체는 ARMM에서의 포함에 의해, 예를 들어, ARMM 내의 실체 (예를 들어, 작용제)의 캡슐화에 의해 ARMM과 회합된다. 예를 들어, 일부 실시양태에서, ARMM-생산 세포의 세포질에 존재하는 작용제는 ARMM 버딩 시 ARMM에서의 작용제-포함 세포질의 캡슐화에 의해 ARMM과 회합된다. 유사하게, 막 단백질, 또는 ARMM 생산 세포의 세포막과 회합된 다른 분자는 버딩 시 ARMM 막 내로의 포함에 의해 세포에 의해 생산된 ARMM과 회합될 수 있다. 특정 실시양태에서, 전달되는 작용제는 ARMM의 일부인 분자에서 프롤린 함유 또는 프롤린 풍부 도메인에의 결합을 실행하는 WW 도메인을 포함한다.

생물학적으로 활성인: 본원에 사용된 어구 "생물학적으로 활성인"은 생물학적 시스템 및/또는 유기체에서 활성을 갖는 임의의 물질의 특징을 지칭한다. 예를 들어, 유기체에게 투여되는 경우 그 유기체에 대해 생물학적 효과를 갖는 물질은 생물학적으로 활성인 것으로 간주된다. 특정 실시양태에서, 핵산이 생물학적으로 활성인 경우, 전체 핵산의 적어도 하나의 생물학적 활성을 공유하는 그 핵산의 부분은 전형적으로 "생물학적으로 활성인" 부분으로 지칭된다. 한 예로서, 뉴클레아제 화물 단백질은 그것이 대상체에게 투여되는 경우 유전자 산물의 발현을 증가시키거나 감소시키는 경우 생물학적으로 활성인 것으로 간주될 수 있다.

바이오마커: ARMM-기반 진단의 맥락에서 본원에 사용된 용어 "바이오마커"는 ARMM을 함유하는 생물학적 샘플에 존재하거나 그로부터 유래된 검출가능한 분자 (예를 들어, 단백질, 펩티드, 프로테오글리칸, 당단백질, 지단백질, 탄수화물, 지질, 핵산 (예를 들어, DNA, 예컨대 cDNA 또는 증폭된 DNA, 또는 RNA, 예컨대 mRNA), 유기 또는 무기 화학적 화합물, 소분자 (예를 들어, 제2 메신저, 대사물), 또는 상기 중 임의의 것의 식별 분자 또는 식별 단편), 또는 임의의 비의 이러한 분자, 또는 특이적 생물학적 특색 또는 프로세스의, 예를 들어, 세포 또는 소포 신원의, 정상적인 또는 병리학적 프로세스, 또는 치료 개입에 대한 약리학적 반응, 또는 그의 적응증의 지표로서 객관적으로 측정되거나 평가되는 임의의 다른 특징을 지칭한다. 문헌 [Atkinson, A. J., et al., Biomarkers and Surrogate Endpoints: Preferred Definitions and Conceptual Framework, Clinical Pharm. & Therapeutics, 2001 March; 69(3): 89-95]을 참조한다. 이 맥락에서, 용어 "로부터 유래된"은 검출되는 경우, 생물학적 샘플에 존재하는 특정 분자를 지시하는 화합물을 지칭한다. 예를 들어, 특정 cDNA의 검출은 생물학적 샘플에서의 특정 RNA 전사체 또는 단백질의 존재를 지시할 수 있다. 또 다른 예로서, 특정 항체의 검출 또는 그에의 결합은 생물학적 샘플에서의 특정 항원 (예를 들어, 단백질)의 존재를 지시할 수 있다. 일부 실시양태에서, 식별 분자 또는 단편은 검출되는 경우, 그의 존재가 지시하는 화합물의 존재 또는 풍부성을 지시하는 분자 또는 단편이다. 바이오마커는 예를 들어, ARMM으로부터 단리되거나, ARMM의 일부로서 직접적으로 측정되거나, ARMM에서 검출되거나 그에 포함되는 것으로 결정될 수 있다. 일부 실시양태에서, 대상체로부터의 샘플에서 또는 대상체로부터 얻어진 샘플로부터 유래된 세포 집단에서 검출된 ARMM의 양, 또는 대상체로부터 얻어진 샘플 또는 세포 집단 내의 ARMM 생성의 비율은 바이오마커로서 역할을 한다. 바이오마커의 검출을 위한 방법은 관련 기술분야의 통상의 기술자에게 공지되어 있으며, 핵산 검출 방법, 단백질 검출 방법, 탄수화물 검출 방법, 항원 검출 방법, 소분자 검출 방법, 및 다른 적합한 방법을 포함한다.

바이오마커 프로파일: "바이오마커 프로파일"은 1종 이상의 바이오마커 (예를 들어, mRNA 분자, cDNA 분자, 단백질, 및/또는 탄수화물, 또는 그의 지표)를 포함한다. 바이오마커 프로파일의 바이오마커는 동일한 또는 상이한 부류, 예컨대, 예를 들어, 핵산, 탄수화물, 대사물, 및 단백질일 수 있다. 바이오마커 프로파일은 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100종, 또는 그 초과의 바이오마커를 포함할 수 있다. 일부 실시양태에서, 바이오마커 프로파일은 수 백, 또는 심지어 수 천의 바이오마커를 포함한다. 바이오마커 프로파일은 1종 이상의 대조군 또는 내부 표준물을 추가로 포함할 수 있다. 일부 실시양태에서, 바이오마커 프로파일은 내부 표준물로서 역할을 하는 적어도 1종의 바이오마커를 포함한다. 일부 실시양태에서, 샘플 또는 세포 집단 중의 ARRDC1 또는 TSG101의 존재 또는 수준은 내부 표준물로서 사용된다. 몇명 상태, 질환, 및 병리증상에 대한, 및 또한 정상적인 상태에 대한 바이오마커 프로파일은 관련 기술분야의 통상의 기술자에게 공지되어 있으며, 본 발명은 임의의 특정 바이오마커 프로파일에 제한되지 않는다. 일부 실시양태에서, 본원에 기재된 바와 같은 ARMM-기반 진단 방법의 맥락에서 사용된 바이오마커 프로파일은 엑소좀-기반 진단에 유용한 것으로 기재된 바이오마커 프로파일이다. 엑소좀 바이오마커 프로파일은 관련 기술분야의 통상의 기술자에게 공지되어 있으며, 상이한 암, 뇌졸중, 자폐증, 및 다른 질환을 포함한 다양한 질환의 진단에 유용한 바이오마커 프로파일은 예를 들어, 그의 전체 내용이 본원에 참조로 포함되는 카스(Kaas) 등에 의해 2011년 1월 19일에 출원되고, 발명의 명칭이 표현형을 결정하기 위해 엑소좀을 사용하는 방법 및 시스템인 미국 특허 출원 U.S.S.N. 13/009,285 (US 2011/0151460 A1로서 공개됨)에 기재되었다.

Cas9 또는 Cas9 단백질: 용어 "Cas9" 또는 "Cas9 단백질"은 Cas9 단백질, 또는 그의 변이체 (예를 들어, Cas9의 활성, 불활성, 또는 변경된 DNA 절단 도메인, 및/또는 Cas9의 gRNA 결합 도메인을 포함하는 단백질)를 포함하는 RNA-가이드된 뉴클레아제를 지칭한다. Cas9 뉴클레아제는 또한 때때로 casn1 뉴클레아제 또는 CRISPR (군집화된 규칙적으로 간격화된 짧은 회문구조 반복부)-연관된 뉴클레아제로 지칭된다. CRISPR은 이동성 유전자 요소 (바이러스, 수송가능한 요소 및 접합 플라스미드)에 대한 보호를 제공하는 적응성 면역계이다. CRISPR 클러스터는 스페이서, 선행 이동성 요소에 상보적인 서열, 및 표적 침입 핵산을 함유한다. CRISPR 클러스터는 CRISPR RNA (crRNA)로 전사되고 프로세싱된다. 유형 II CRISPR 시스템에서 프리-crRNA의 정확한 프로세싱은 트랜스-코딩된 작은 RNA (tracrRNA), 내인성 리보뉴클레아제 3 (rnc) 및 Cas9 단백질을 요구한다. tracrRNA는 프리-crRNA의 리보뉴클레아제 3-보조된 프로세싱을 위한 가이드로서 역할을 한다. 이어서, Cas9/crRNA/tracrRNA는 스페이서에 상보적인 선형 또는 원형 dsDNA 표적을 내핵산용해적으로 절단한다. crRNA에 상보적이지 않은 표적 가닥은 먼저 내핵산용해적으로 절단되고, 이어서 3'-5' 외핵산용해적으로 트리밍된다. 자연에서, DNA-결합 및 절단은 전형적으로 단백질 및 둘 다의 RNA를 요구한다. 그러나, 단일 가이드 RNA ("sgRNA", 또는 간단히 "gNRA")는 단일 RNA 종 내로 crRNA 및 tracrRNA 둘 다의 측면을 혼입하도록 조작될 수 있다. 예를 들어, 그의 전체 내용이 본원에 참조로 포함되는 문헌 [Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J.A., Charpentier E. Science 337:816-821(2012)]을 참조한다. Cas9는 CRISPR 반복 서열에서 짧은 모티프 (PAM 또는 프로토스페이서 인접 모티프)를 인식하여 자기 대 비-자기를 구별하는 것을 돕는다. Cas9 뉴클레아제 서열 및 구조는 관련 기술분야의 통상의 기술자에게 널리 공지되어 있다 (예를 들어, 그의 각각의 전체 내용이 본원에 참조로 포함되는 문헌 ["Complete genome sequence of an M1 strain of Streptococcus pyogenes." Ferretti et al., J.J., McShan W.M., Ajdic D.J., Savic D.J., Savic G., Lyon K., Primeaux C., Sezate S., Suvorov A.N., Kenton S., Lai H.S., Lin S.P., Qian Y., Jia H.G., Najar F.Z., Ren Q., Zhu H., Song L., White J., Yuan X., Clifton S.W., Roe B.A., McLaughlin R.E., Proc. Natl. Acad. Sci. U.S.A. 98:4658-4663(2001)]; ["CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III." Deltcheva E., Chylinski K., Sharma C.M., Gonzales K., Chao Y., Pirzada Z.A., Eckert M.R., Vogel J., Charpentier E., Nature 471:602-607(2011)]; 및 ["A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity." Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J.A., Charpentier E. Science 337:816-821(2012)] 참조). Cas9 오르토로그는 에스. 피오게네스(S. pyogenes) 및 에스. 써모필루스(S. thermophilus)를 포함하나 이에 제한되지는 않는 다양한 종에서 기재되었다. 추가의 적합한 Cas9 뉴클레아제 및 서열은 본 개시내용에 기반하여 관련 기술분야의 통상의 기술자에게 명백할 것이며, 이러한 Cas9 뉴클레아제 및 서열은 그의 전체 내용이 본원에 참조로 포함되는 문헌 [Chylinski, Rhun, and Charpentier, "The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems" (2013) RNA Biology 10:5, 726-737]에 개시된 유기체 및 로커스로부터의 Cas9 서열을 포함한다. 일부 실시양태에서, Cas9 뉴클레아제는 불활성 (예를 들어, 불활성화된) DNA 절단 도메인을 갖는다.

뉴클레아제-불활성화된 Cas9 단백질은 "dCas9" 단백질 (뉴클레아제-"죽은" Cas9에 대해)로 상호교환가능하게 지칭될 수 있다. 불활성 DNA 절단 도메인을 갖는 Cas9 단백질 (또는 그의 변이체)을 생성하는 방법은 공지되어 있다 (예를 들어, 그의 각각의 전체 내용이 본원에 참조로 포함되는 문헌 [Jinek et al., Science. 337:816-821(2012)]; [Qi et al., "Repurposing CRISPR as an RNA-Guided Platform for Sequence-Specific Control of Gene Expression" (2013) Cell. 28;152(5):1173-83] 참조). 예를 들어, Cas9의 DNA 절단 도메인은 2개의 서브도메인, 즉, HNH 뉴클레아제 서브도메인 및 RuvC1 서브도메인을 포함하는 것으로 공지되어 있다. HNH 서브도메인은 gRNA에 상보적인 가닥을 절단하는 반면, RuvC1 서브도메인은 비-상보적 가닥을 절단한다. 이들 서브도메인 내의 돌연변이는 Cas9의 뉴클레아제 활성을 침묵시킬 수 있다. 예를 들어, 돌연변이 D10A 및 H841A는 에스. 피오게네스 Cas9의 뉴클레아제 활성을 완전히 불활성화시킨다 (Jinek et al., Science. 337:816-821(2012); Qi et al., Cell. 28;152(5):1173-83 (2013)). 일부 실시양태에서, Cas9의 변이체를 포함하는 단백질이 제공된다. 예를 들어, 일부 실시양태에서, 단백질은 2개의 Cas9 도메인 중 하나를 포함한다: (1) Cas9의 gRNA 결합 도메인; 또는 (2) Cas9의 DNA 절단 도메인. 일부 실시양태에서, Cas9 또는 그의 변이체를 포함하는 단백질은 "Cas9 변이체"로 지칭된다. Cas9 변이체는 Cas9, 또는 그의 변이체와 상동성을 공유한다. 예를 들어, Cas9 변이체는 야생형 Cas9와 적어도 약 70% 동일하거나, 적어도 약 80% 동일하거나, 적어도 약 90% 동일하거나, 적어도 약 95% 동일하거나, 적어도 약 96% 동일하거나, 적어도 약 97% 동일하거나, 적어도 약 98% 동일하거나, 적어도 약 99% 동일하거나, 적어도 약 99.5% 동일하거나, 또는 적어도 약 99.9% 동일하다. 일부 실시양태에서, Cas9 변이체는, 변이체가 야생형 Cas9의 상응하는 변이체와 적어도 약 70% 동일하거나, 적어도 약 80% 동일하거나, 적어도 약 90% 동일하거나, 적어도 약 95% 동일하거나, 적어도 약 96% 동일하거나, 적어도 약 97% 동일하거나, 적어도 약 98% 동일하거나, 적어도 약 99% 동일하거나, 적어도 약 99.5% 동일하거나, 또는 적어도 약 99.9% 동일하도록, Cas9 (예를 들어, gRNA 결합 도메인 또는 DNA-절단 도메인)의 변이체를 포함한다. 일부 실시양태에서, 야생형 Cas9는 스트렙토코쿠스 피오게네스(Streptococcus pyogenes)로부터의 Cas9 (NCBI 참조 서열: NC_017053.1, 서열식별번호: 108(뉴클레오티드); 서열식별번호: 2 (아미노산))에 상응한다.

(단일 밑줄: HNH 도메인; 이중 밑줄: RuvC 도메인)

일부 실시양태에서, 야생형 (에스. 피오게네스) Cas9는 서열식별번호: 3 (뉴클레오티드) 및/또는 서열식별번호: 4 (아미노산)에 상응하거나, 이를 포함한다:

(단일 밑줄: HNH 도메인; 이중 밑줄: RuvC 도메인)

일부 실시양태에서, dCas9는 Cas9 뉴클레아제 활성을 불활성화시키는 1개 이상의 돌연변이를 갖는 Cas9 아미노산 서열에 부분적으로 또는 전체적으로 상응하거나, 이를 포함한다. 예를 들어, 일부 실시양태에서, dCas9 도메인은 D10A 및/또는 H820A 돌연변이를 포함한다.

dCas9 (D10A 및 H840A):

(단일 밑줄: HNH 도메인; 이중 밑줄: RuvC 도메인)

다른 실시양태에서, 예를 들어, 뉴클레아제 불활성화된 Cas9 (dCas9)를 발생시키는 D10A 및 H820A 이외의 돌연변이를 갖는 dCas9 변이체가 제공된다. 이러한 돌연변이는, 예로서, D10 및 H820에서 다른 아미노산 치환, 또는 Cas9의 뉴클레아제 도메인 내에 다른 치환 (예를 들어, HNH 뉴클레아제 서브도메인 및/또는 RuvC1 서브도메인에서의 치환)을 포함한다. 일부 실시양태에서, 서열식별번호:5와 적어도 약 70% 동일한, 적어도 약 80% 동일한, 적어도 약 90% 동일한, 적어도 약 95% 동일한, 적어도 약 98% 동일한, 적어도 약 99% 동일한, 적어도 약 99.5% 동일한, 또는 적어도 약 99.9% 동일한 dCas9의 변이체 또는 동족체 (예를 들어, 서열식별번호: 5의 변이체)가 제공된다. 일부 실시양태에서, 서열식별번호: 5보다 약 5개의 아미노산, 약 10개의 아미노산, 약 15개의 아미노산, 약 20개의 아미노산, 약 25개의 아미노산, 약 30개의 아미노산, 약 40개의 아미노산, 약 50개의 아미노산, 약 75개의 아미노산, 약 100개의 아미노산, 또는 그 초과만큼 더 짧거나, 더 긴 아미노산 서열을 갖는 dCas9의 변이체 (예를 들어, 서열식별번호: 5의 변이체)가 제공된다.

일부 실시양태에서, 본원에서 제공된 바와 같은 Cas9 융합 단백질은 Cas9 단백질의 전장 아미노산, 예를 들어, 상기 제공된 서열 중 하나를 포함한다. 그러나, 다른 실시양태에서, 본원에서 제공된 바와 같은 융합 단백질은 전장 Cas9 서열을 포함하지 않지만, 단지 그의 단편을 포함한다. 예를 들어, 일부 실시양태에서, 본원에서 제공된 Cas9 융합 단백질은 Cas9 단편을 포함하고, 여기서 단편은 crRNA 및 tracrRNA 또는 sgRNA에 결합하지만, 예를 들어, 그것이 단지 뉴클레아제 도메인의 말단절단된 버전을 포함하거나, 뉴클레아제 도메인을 전혀 포함하지 않는다는 점에서, 기능적 뉴클레아제 도메인을 포함하지 않는다. 적합한 Cas9 도메인 및 Cas9 단편의 예시적인 아미노산 서열은 본원에서 제공되고, Cas9 도메인 및 단편의 추가의 적합한 서열은 관련 기술분야의 통상의 기술자에게 명백할 것이다.

일부 실시양태에서, Cas9는 코리네박테리움 울세란스(Corynebacterium ulcerans) (NCBI 참조: NC_015683.1, NC_017317.1); 코리네박테리움 디프테리아(Corynebacterium diphtheria) (NCBI 참조: NC_016782.1, NC_016786.1); 스피로플라스마 시르피디콜라(Spiroplasma syrphidicola) (NCBI 참조: NC_021284.1); 프레보텔라 인터메디아(Prevotella intermedia) (NCBI 참조: NC_017861.1); 스피로플라스마 타이와넨스(Spiroplasma taiwanense) (NCBI 참조: NC_021846.1); 스트렙토코쿠스 이니아에(Streptococcus iniae) (NCBI 참조: NC_021314.1); 벨리엘라 발티카(Belliella baltica) (NCBI 참조: NC_018010.1); 시크로플렉수스 토르퀴스(Psychroflexus torquis) (NCBI 참조: NC_018721.1); 스트렙토코쿠스 써모필루스(Streptococcus thermophilus) (NCBI 참조: YP_820832.1); 리스테리아 인노쿠아(Listeria innocua) (NCBI 참조: NP_472073.1); 캄필로박터 제주니(Campylobacter jejuni) (NCBI 참조: YP_002344900.1); 또는 네이세리아 메닌기티디스(Neisseria meningitidis) (NCBI 참조: YP_002342100.1)로부터의 Cas9를 지칭한다.

최소-ARRDC1을 포함하는 ARRM에서 페이로드로서 Cas9 또는 Cas9-유사 분자의 전달에 관하여 본원의 교시내용은 비-제한적 예로서 제공된다. 관련 기술분야의 통상의 기술자는 본 개시내용이 세포내 전달을 필요로 하는 관련 기술분야에 공지된 것과 같은 다른 RNA 가이드된 DNA-뉴클레아제를 포함한 다른 표적화된 엔도뉴클레아제를 포함하나 이에 제한되지는 않는 다른 페이로드를 로딩하는 수단을 제공함을 인식할 것이다.

용어 "데아미나제"는 탈아미노화 반응을 촉매하는 효소를 지칭한다. 일부 실시양태에서, 데아미나제는 시토신의 우라실로의 가수분해적 탈아미노화를 촉매하는 시티딘 데아미나제이다.

화물 단백질: 본원에 사용된 용어 "화물 단백질"은 ARMM에, 예를 들어, ARMM의 액체 상 내로 또는 ARMM의 지질 이중층 내로 혼입될 수 있는 단백질을 지칭한다. 용어 "전달되는 화물 단백질"은 그의 ARMM과의 회합 또는 그에서의 포함을 통해 대상체, 기관, 조직, 또는 세포에 전달될 수 있는 임의의 단백질을 지칭한다. 일부 실시양태에서, 화물 단백질은 시험관내에서, 생체내에서, 또는 생체외에서 표적 세포에 전달된다. 일부 실시양태에서, 전달되는 화물 단백질은 생물학적으로 활성인 작용제이며, 즉, 이는 세포, 기관, 조직, 및/또는 대상체에서 활성을 갖는다. 예를 들어, 대상체에게 투여되는 경우 그 대상체에 대해 생물학적 효과를 갖는 단백질은 생물학적으로 활성인 것으로 간주된다. 특정 실시양태에서 화물 단백질은 뉴클레아제, 데아미나제, 리콤비나제, 또는 그의 변이체 (예를 들어, Cas9 단백질 또는 그의 변이체)이다. 특정 실시양태에서, 뉴클레아제는 Cas9 뉴클레아제, TALE 뉴클레아제, 아연 핑거 뉴클레아제, 또는 그의 임의의 변이체일 수 있다. Cas9 단백질 및 그들의 변이체를 포함한 뉴클레아제는 본원의 다른 곳에 보다 상세하게 기재되어 있다. 일부 실시양태에서, Cas9 단백질 또는 그의 변이체는 핵산과 회합된다. 예를 들어, 화물 단백질은 gRNA와 회합된 Cas9 단백질일 수 있다. 일부 실시양태에서, 전달되는 화물 단백질은 치료제이다. 본원에 사용된 용어 "치료제"는 대상체에게 투여되는 경우 유익한 효과를 갖는 임의의 작용제를 지칭한다. 일부 실시양태에서, 세포에 전달되는 화물 단백질은 전사 인자, 종양 서프레서, 발달 조절제, 성장 인자, 전이 서프레서, 프로-아폽토시스 단백질, 뉴클레아제, 이뮤노글로불린 또는 그의 단편, 수용체, T-세포 수용체, 시토카인, 효소 또는 리콤비나제이다. 일부 실시양태에서, 전달되는 단백질은 p53, Rb (망막모세포종 단백질), BRCA1, BRCA2, PTEN, APC, CD95, ST7, ST14, BCL-2 패밀리 단백질, 카스파제, BRMS1, CRSP3, DRG1, KAI1, KISS1, NM23, TIMP-패밀리 단백질, BMP-패밀리 성장 인자, EGF, EPO, FGF, G-CSF, GM-CSF, GDF-패밀리 성장 인자, HGF, HDGF, IGF, PDGF, TPO, TGF-α, TGF-β, VEGF; 아연 핑거 뉴클레아제, Cre 리콤비나제, Dre 리콤비나제, 또는 FLP 리콤비나제이다. 일부 실시양태에서, 화물 단백질은 소분자와 회합된다. 일부 실시양태에서, 전달되는 화물 단백질은 진단제이다. 일부 실시양태에서, 전달되는 화물 단백질은 예방제이다. 일부 실시양태에서, 전달되는 화물 단백질은 영상화제로서 유용하다. 이들 실시양태의 일부에서, 진단제 또는 영상화제는 생물학적으로 활성이고, 다른 것에서는 그렇지 않다.

보존된: 본원에 사용된 용어 "보존된"은 비교되는 2개 이상의 관련된 서열의 동일한 위치에서 비변경되어 발생하는 것들인, 각각 폴리뉴클레오티드 서열 또는 아미노산 서열의 뉴클레오티드 또는 아미노산 잔기를 지칭한다. 상대적으로 보존된 뉴클레오티드 또는 아미노산은 서열에서 다른 곳에서 나타나는 뉴클레오티드 또는 아미노산보다 더 관련된 서열 중에서 보존된 것들이다. 일부 실시양태에서, 2개 이상의 서열은 이들이 서로와 100% 동일한 경우 "완전히 보존된" 것으로 이야기된다. 일부 실시양태에서, 2개 이상의 서열은 이들이 서로와 적어도 70% 동일한, 적어도 80% 동일한, 적어도 90% 동일한, 또는 적어도 95% 동일한 경우 "고도로 보존된" 것으로 이야기된다. 일부 실시양태에서, 2개 이상의 서열은 이들이 서로와 약 70% 동일한, 약 80% 동일한, 약 90% 동일한, 약 95% 동일한, 약 98% 동일한, 또는 약 99% 동일한 경우 "고도로 보존된" 것으로 이야기된다. 일부 실시양태에서, 2개 이상의 서열은 이들이 서로와 적어도 60% 동일한, 적어도 70% 동일한, 적어도 80% 동일한, 적어도 90% 동일한, 또는 적어도 95% 동일한 경우 "보존된" 것으로 이야기된다. 일부 실시양태에서, 2개 이상의 서열은 이들이 서로와 약 30% 동일한, 약 40% 동일한, 약 50% 동일한, 약 60% 동일한, 약 70% 동일한, 약 80% 동일한, 약 90% 동일한, 약 95% 동일한, 약 98% 동일한, 또는 약 99% 동일한 경우 "보존된" 것으로 이야기된다.

조작된: 본원에 사용된 용어 "조작된"은 인간에 의해 디자인된, 생산된, 제조된, 합성된, 및/또는 제작된 단백질, 핵산, 복합체, 물질, 또는 실체를 지칭한다. 따라서, 조작된 산물은 자연에서 발생하지 않는 산물이다. 일부 실시양태에서, 조작된 단백질 또는 핵산은 특정 요건을 충족시키도록 또는 특정 디자인 특색을 갖도록 디자인된 단백질 또는 핵산이다. 예를 들어, Cas9 화물 단백질은 1개 이상의 WW 도메인을 Cas9 단백질에 융합시킴으로써 최소 ARRDC1과 회합되어 ARMM 내로의 Cas9 화물 단백질의 로딩을 용이하게 하도록 조작될 수 있다. 또 다른 예로서, 가이드 RNA (gRNA)는 특이적 게놈 서열에의 Cas9 화물 단백질의 전달을 표적화하도록 조작될 수 있다.

발현: 본원에 사용된 핵산 서열의 "발현"은 하기 사건 중 하나 이상을 지칭한다: (1) DNA 서열로부터의 RNA 주형의 생성 (예를 들어, 전사에 의해); (2) RNA 전사체의 프로세싱 (예를 들어, 스플라이싱, 편집, 5' 캡 형성, 및/또는 3' 단부 프로세싱에 의해); (3) 폴리펩티드 또는 단백질로의 RNA의 번역; 및 (4) 폴리펩티드 또는 단백질의 번역후 변형.

기능적: 본원에 사용된 "기능적" 생물학적 분자는 그것이 특징규명되거나 유용한 특성 및/또는 활성을 나타내는 형태의 생물학적 분자이다.

융합 단백질: 본원에 사용된 "융합 단백질"은 제2 단백질 모이어티, 예를 들어, 표적 세포에 전달되는 단백질과의 펩티드 연결을 갖는 제1 단백질 모이어티, 예를 들어, ARRCD1 단백질 또는 그의 단편, 또는 TSG101 단백질 또는 그의 단편을 포함한다. 특정 실시양태에서, 융합 단백질은 단일 융합 유전자에 의해 코딩된다.

유전자: 본원에 사용된 용어 "유전자"는 관련 기술분야에서 이해되는 바와 같은 그의 의미를 갖는다. 용어 "유전자"는 유전자 조절 서열 (예를 들어, 프로모터, 인핸서 등) 및/또는 인트론 서열을 포함할 수 있음이 관련 기술분야의 통상의 기술자에 의해 인지될 것이다. 유전자의 정의는 단백질을 코딩하지 않지만, 오히려 기능적 RNA 분자, 예컨대 gRNA, RNAi 작용제, 리보자임, tRNA, rRNA 등을 코딩하는 핵산에 대한 언급을 포함함이 추가로 인지될 것이다. 명확성의 목적을 위해, 본 출원에 사용된 용어 "유전자"는 일반적으로 단백질을 코딩하는 핵산의 부분을 지칭하며; 상기 용어는 관련 기술분야의 통상의 기술자에게 맥락으로부터 명백할 것인 바와 같이, 임의로 조절 서열을 포괄할 수 있음이 주목되어야 한다. 이 정의는 비-단백질-코딩 발현 단위에 대한 용어 "유전자"의 적용을 배제하는 것으로 의도되지 않으며, 오히려 대부분의 경우에, 본원에 사용된 용어가 단백질-코딩 핵산을 지칭함을 명확하게 하도록 의도된다.

유전자 산물 또는 발현 산물: 본원에 사용된 용어 "유전자 산물" 또는 "발현 산물"은 일반적으로 유전자로부터 전사된 RNA (프로세싱전 및/또는 프로세싱후) 또는 유전자로부터 전사된 RNA에 의해 코딩된 폴리펩티드 (변형전 및/또는 변형후)를 지칭한다.

녹색 형광 단백질: 본원에 사용된 용어 "녹색 형광 단백질" (GFP)은 원래 청색 광에 노출되는 경우 녹색을 형광시키는 해파리 아에쿠오레아 빅토리아(Aequorea victoria)로부터 단리된 단백질 또는 이러한 단백질의 유도체 (예를 들어, 단백질의 증진된 또는 파장-이동된 버전)를 지칭한다. 야생형 GFP의 아미노산 서열은 하기와 같다:

적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 또는 적어도 99% 동일한 단백질은 또한 녹색 형광 단백질인 것으로 간주된다.

상동성: 본원에 사용된 용어 "상동성"은 중합체성 분자 사이의, 예를 들어, 핵산 분자 (예를 들어 DNA 분자 및/또는 RNA 분자) 사이의 및/또는 폴리펩티드 분자 사이의 전체적 관련성을 지칭한다. 일부 실시양태에서, 중합체성 분자는 그들의 서열이 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일한 경우 서로에 대해 "상동"인 것으로 간주된다. 일부 실시양태에서, 중합체성 분자는 그들의 서열이 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 유사한 경우 서로에 대해 "상동"인 것으로 간주된다. 용어 "상동"은 필수적으로 적어도 2개의 서열 (뉴클레오티드 서열 또는 아미노산 서열) 사이의 비교를 지칭한다. 본 발명에 따르면, 2개의 뉴클레오티드 서열은 이들이 코딩하는 폴리펩티드가 적어도 약 20개의 아미노산의 적어도 1개의 스트레치에 대해 적어도 약 50% 동일한, 적어도 약 60% 동일한, 적어도 약 70% 동일한, 적어도 약 80% 동일한, 또는 적어도 약 90% 동일한 경우 상동인 것으로 간주된다. 일부 실시양태에서, 상동 뉴클레오티드 서열은 적어도 4 내지 5개의 고유하게 특정된 아미노산의 스트레치를 코딩하는 능력을 특징으로 한다. 서로에 비해 이들 아미노산의 동일성 및 대략적 간격 둘 다는 상동인 것으로 간주되는 뉴클레오티드 서열에 대해 고려되어야 한다. 60개 미만의 뉴클레오티드의 길이의 뉴클레오티드 서열에 대해, 상동성은 적어도 4 내지 5개의 고유하게 특정된 아미노산의 스트레치를 코딩하는 능력에 의해 결정된다. 본 발명에 따르면, 2개의 단백질 서열은 단백질이 적어도 약 20개의 아미노산의 적어도 1개의 스트레치에 대해 적어도 약 50% 동일한, 적어도 약 60% 동일한, 적어도 약 70% 동일한, 적어도 약 80% 동일한, 또는 적어도 약 90% 동일한 경우 상동인 것으로 간주된다.

동일성: 본원에 사용된 용어 "동일성"은 중합체성 분자 사이의, 예를 들어, 핵산 분자 (예를 들어 DNA 분자 및/또는 RNA 분자) 사이의 및/또는 폴리펩티드 분자 사이의 전체적 관련성을 지칭한다. 2개의 핵산 서열의 퍼센트 동일성의 계산은 예를 들어, 최적 비교 목적을 위해 2개의 서열을 정렬함으로써 수행될 수 있다 (예를 들어, 갭은 최적 정렬을 위해 제1 및 제2 핵산 서열 중 하나 또는 둘 다에 도입될 수 있고, 비-동일한 서열은 비교 목적을 위해 무시될 수 있음). 특정 실시양태에서, 비교 목적을 위해 정렬된 서열의 길이는 참조 서열의 길이의 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 또는 100%이다. 이어서 상응하는 뉴클레오티드 위치에서의 뉴클레오티드가 비교된다. 제1 서열에서의 위치가 제2 서열에서의 상응하는 위치와 동일한 뉴클레오티드에 의해 점유되는 경우, 분자는 그 위치에서 동일하다. 2개의 서열 사이의 퍼센트 동일성은 2개의 서열의 최적 정렬을 위해 도입될 필요가 있는 갭의 수, 및 각각의 갭의 길이를 고려한, 서열에 의해 공유되는 동일한 위치의 수의 함수이다. 2개의 서열 사이의 서열의 비교 및 퍼센트 동일성의 결정은 수학적 알고리즘을 사용하여 달성될 수 있다. 예를 들어, 2개의 뉴클레오티드 서열 사이의 퍼센트 동일성은 그의 각각이 본원에 참조로 포함되는 문헌 [Computational Molecular Biology, Lesk, A. M., ed., Oxford University Press, New York, 1988]; [Biocomputing: Informatics and Genome Projects, Smith, D. W., ed., Academic Press, New York, 1993]; [Sequence Analysis in Molecular Biology, von Heinje, G., Academic Press, 1987]; [Computer Analysis of Sequence Data, Part I, Griffin, A. M., and Griffin, H. G., eds., Humana Press, New Jersey, 1994]; 및 [Sequence Analysis Primer, Gribskov, M. and Devereux, J., eds., M Stockton Press, New York, 1991]에 기재된 것들과 같은 방법을 사용하여 결정될 수 있다. 예를 들어, 2개의 뉴클레오티드 서열 사이의 퍼센트 동일성은 PAM120 가중치 잔기 표, 12의 갭 길이 페널티 및 4의 갭 페널티를 사용하여 ALIGN 프로그램 (버전 2.0)에 포함된 문헌 [Meyers and Miller (CABIOS, 1989, 4:11-17)]의 알고리즘을 사용하여 결정될 수 있다. 2개의 뉴클레오티드 서열 사이의 퍼센트 동일성은 대안적으로, NWSgapdna.CMP 매트릭스를 사용한 GCG 소프트웨어 패키지에서의 GAP 프로그램을 사용하여 결정될 수 있다. 서열 사이의 퍼센트 동일성을 결정하기 위해 통상적으로 채용되는 방법은 본원에 참조로 포함되는 문헌 [Carillo, H., and Lipman, D., SIAM J Applied Math., 48:1073 (1988)]에 개시된 것들을 포함하나 이에 제한되지는 않는다. 동일성을 결정하기 위한 기술은 공개적으로 이용가능한 컴퓨터 프로그램에서 성문화된다. 2개의 서열 사이의 상동성을 결정하기 위한 예시적인 컴퓨터 소프트웨어는 GCG 프로그램 패키지 (Devereux, J., et al., Nucleic Acids Research, 12(1), 387 (1984)), BLASTP, BLASTN, 및 FASTA (Atschul, S. F. et al., J. Molec. Biol., 215, 403 (1990))을 포함하나 이에 제한되지는 않는다.

유전자의 발현을 억제하다: 본원에 사용된 어구 "유전자의 발현을 억제하다"는 유전자의 발현 산물의 양의 검소를 유발하는 것을 의미한다. 발현 산물은 유전자로부터 전사된 RNA (예를 들어, mRNA) 또는 유전자로부터 전사된 mRNA로부터 번역된 폴리펩티드일 수 있다. 전형적으로 mRNA의 수준의 감소는 그로부터 번역되는 폴리펩티드의 수준의 감소를 발생시킨다. 유전자 발현의 수준은 mRNA 및/또는 단백질 수준을 측정하기 위한 표준 기술을 사용하여 결정될 수 있다.

시험관내에서: 본원에 사용된 용어 "시험관내에서"는 유기체 (예를 들어, 동물, 식물, 또는 미생물) 내에서라기 보다는 인공 환경에서, 예를 들어, 시험 튜브 또는 반응 용기에서, 세포 배양물에서, 페트리 디쉬에서 등에서 일어나는 사건을 지칭한다.

생체내에서: 본원에 사용된 용어 "생체내에서"는 유기체 (예를 들어, 동물, 식물, 또는 미생물) 내에서 일어나는 사건을 지칭한다.

단리된: 본원에 사용된 용어 "단리된"은 (1) 그것이 처음에 생산될 때 (자연에서든 또는 실험실 환경에서든) 그것이 회합된 성분의 적어도 일부로부터 분리된, 및/또는 (2) 사람의 손에 의해 생산된, 제조된, 및/또는 제작된 물질 또는 실체를 지칭한다. 단리된 물질 및/또는 실체는 이들이 처음에 회합된 다른 성분의 적어도 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 90%, 또는 그 초과로부터 분리될 수 있다. 일부 실시양태에서, 단리된 물질은 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98%, 약 99% 초과, 또는 약 99% 초과 순수하다. 본원에 사용된 물질은 그것이 다른 성분이 실질적으로 없는 경우 "순수하다."

링커: 본원에 사용된 용어 "링커"는 2개의 분자 또는 모이어티, 예를 들어, 최소 ARRDC1 단백질 및 표적, 예컨대 Cas9 뉴클레아제를 연결하는 화학적 모이어티를 지칭한다. 전형적으로, 링커는 2개의 기, 분자, 또는 다른 모이어티 사이에 위치하거나, 그에 의해 플랭킹되며, 공유 결합을 통해 매개에 연결되고, 따라서 2개를 연결한다. 일부 실시양태에서, 링커는 아미노산 또는 복수의 아미노산 (예를 들어, 펩티드 또는 단백질)을 포함한다. 일부 실시양태에서, 링커는 유기 분자, 기, 중합체, 또는 다른 화학적 모이어티이다. 일부 실시양태에서, 링커는 절단가능한 링커이며, 예를 들어, 링커는 예를 들어, UV 광 또는 가수분해 효소, 예컨대 프로테아제 또는 에스테라제에의 노출 시 절단될 수 있는 결합을 포함한다. 일부 실시양태에서, 링커는 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 40개, 적어도 50개, 또는 그 초과의 아미노산을 갖는 아미노산의 임의의 스트레치이다. 다른 실시양태에서, 링커는 화학 결합 (예를 들어, 공유 결합)이다.

마이크로RNA (miRNA): 본원에 사용된 용어 "마이크로RNA" 또는 "miRNA"는 대략 21 뉴클레오티드 (nt) 내지 23 nt의 길이인 RNAi 작용제를 지칭한다. miRNA는 18 nt 내지 26 nt의 길이의 범위일 수 있다. 전형적으로, miRNA는 단일-가닥이다. 그러나, 일부 실시양태에서, miRNA는 적어도 부분적으로 이중-가닥일 수 있다. 특정 실시양태에서, miRNA는 RNA 듀플렉스 (본원에서 "듀플렉스 영역"으로 지칭됨)를 포함할 수 있고, 임의로 1 내지 3개의 단일-가닥 오버행을 추가로 포함할 수 있다. 일부 실시양태에서, RNAi 작용제는 15 bp 내지 29 bp의 길이의 범위이고 임의로 1 또는 2개의 단일-가닥 오버행을 추가로 포함하는 듀플렉스 영역을 포함한다. miRNA는 함께 혼성화하는 2개의 RNA 분자로부터 형성될 수 있거나, 또는 대안적으로 자기-혼성화 부분을 포함하는 단일 RNA 분자로부터 생성될 수 있다. 일반적으로, miRNA 분자의 유리 5' 단부는 포스페이트 기를 갖고, 유리 3' 단부는 히드록실 기를 갖는다. miRNA의 듀플렉스 부분은 통상적으로, 그러나 반드시 그렇지는 않지만, 1개 이상의 비쌍형성된 뉴클레오티드로 이루어진 1개 이상의 벌지를 포함한다. miRNA의 한 가닥은 표적 RNA와 혼성화하는 부분을 포함한다. 특정 실시양태에서, miRNA의 한 가닥은 표적 RNA의 영역과 정확하게 상보적이지는 않으며, 이는 miRNA가 1개 이상의 미스매치를 갖고 표적 RNA에 혼성화함을 의미한다. 일부 실시양태에서, miRNA의 한 가닥은 표적 RNA의 영역과 정확하게 상보적이며, 이는 miRNA가 미스매치 없이 표적 RNA에 혼성화함을 의미한다. 전형적으로, miRNA는 표적 전사체의 번역을 억제함으로써 유전자 발현의 억제를 매개하는 것으로 생각된다. 그러나, 일부 실시양태에서, miRNA는 표적 전사체의 분해를 유발함으로써 유전자 발현의 억제를 매개할 수 있다.

본원에 사용된 용어 "미세소포"는 지질 이중층에 의해 둘러싸인 액체의 액적을 지칭한다. 일부 실시양태에서, 미세소포는 약 10 nm 내지 약 1000 nm의 직경을 갖는다. 일부 실시양태에서, 미세소포는 적어도 약 10 nm, 적어도 약 20 nm, 적어도 약 30 nm, 적어도 약 40 nm, 적어도 약 50 nm, 적어도 약 60 nm, 적어도 약 70 nm, 적어도 약 80 nm, 적어도 약 90 nm, 적어도 약 100 nm, 적어도 약 125 nm, 적어도 약 150 nm, 적어도 약 175 nm, 적어도 약 200 nm, 적어도 약 250 nm, 적어도 약 300 nm, 적어도 약 400 nm, 또는 적어도 약 500 nm의 직경을 갖는다. 일부 실시양태에서, 미세소포는 약 1000 nm 미만, 약 900 nm 미만, 약 800 nm 미만, 약 700 nm 미만, 약 600 nm 미만, 약 500 nm 미만, 약 400 nm 미만, 약 300 nm 미만, 약 250 nm 미만, 약 200 nm 미만, 약 150 nm 미만, 약 100 nm 미만, 약 90 nm 미만, 약 80 nm 미만, 약 70 nm 미만, 약 60 nm 미만, 또는 약 50 nm 미만의 직경을 갖는다. 용어 미세소포는 세포로부터 쉐딩된 미세소포 뿐만 아니라 합성적으로 생산된 미세소포를 포함한다. 세포로부터 쉐딩된 미세소포는 전형적으로 이들이 기원하는 세포의 항원 내용물을 포함한다. 세포로부터 쉐딩된 미세소포는 또한 전형적으로 이들이 기원하는 세포의 인지질 분포를 반영하는 인지질의 비대칭 분포를 포함한다. 일부 실시양태에서, 예를 들어, 일부 ARMM의 본원에서 제공된 미세소포의 내막은 지질 이중층 내에 대다수의 아미노인지질, 포스피타딜세린, 및/또는 포스파티딜에탄올아민을 포함한다.

최소 ARRDC1: 본원에 사용된 용어 "최소 ARRDC1"은 전장 ARRDC1 단백질보다 더 짧고, 적어도, 아레스틴 도메인의 부분, 적어도 1개의 PSAP (서열식별번호: 122) 또는 PTAP (서열식별번호: 123) 모티프, 및 적어도 1개의 PPXY 모티프를 포함하는 ARRDC1 단백질을 지칭한다. 예시적인 최소 ARRDC1은 서열식별번호: 1에 제공된다.

핵산: 그의 가장 넓은 의미에서 본원에 사용된 용어 "핵산"은 올리고뉴클레오티드 쇄 내로 혼입되거나 혼입될 수 있는 임의의 화합물 및/또는 물질을 지칭한다. 일부 실시양태에서, 핵산은 포스포디에스테르 연결을 통해 올리고뉴클레오티드 쇄 내로 혼입되거나 혼입될 수 있는 화합물 및/또는 물질이다. 일부 실시양태에서, "핵산"은 개별적 핵산 잔기 (예를 들어, 뉴클레오티드 및/또는 뉴클레오시드)를 지칭한다. 일부 실시양태에서, "핵산"은 개별적 핵산 잔기를 포함하는 올리고뉴클레오티드 쇄를 지칭한다. 본원에 사용된 용어 "올리고뉴클레오티드" 및 "폴리뉴클레오티드"는 뉴클레오티드의 중합체 (예를 들어, 적어도 2개의 뉴클레오티드의 스트링)를 지칭하기 위해 상호교환가능하게 사용될 수 있다. 일부 실시양태에서, "핵산"은 RNA 뿐만 아니라 단일 및/또는 이중-가닥 DNA를 포괄한다. 더욱이, 용어 "핵산", "DNA", "RNA", 및/또는 유사한 용어는 핵산 유사체, 즉, 포스포디에스테르 백본 이외를 갖는 유사체를 포함한다. 예를 들어, 관련 기술분야에 공지되어 있고 백본에 포스포디에스테르 결합 대신 펩티드 결합을 갖는 소위 "펩티드 핵산"은 본 발명의 범위 내인 것으로 간주된다. 용어 "아미노산 서열을 코딩하는 뉴클레오티드 서열"은 서로의 축퇴성 버전이고/거나 동일한 아미노산 서열을 코딩하는 모든 뉴클레오티드 서열을 포함한다. 단백질 및/또는 RNA를 코딩하는 뉴클레오티드 서열은 인트론을 포함할 수 있다. 핵산은 자연 공급원으로부터 정제되고, 재조합 발현 시스템을 사용하여 생산되고, 임의로 정제되고, 화학적으로 합성될 수 있는 등이다. 적절한 경우, 예를 들어, 화학적으로 합성된 분자의 경우, 핵산은 뉴클레오시드 유사체, 예컨대 화학적으로 변형된 염기 또는 당, 백본 변형 등을 갖는 유사체를 포함할 수 있다. 핵산 서열은 달리 지시되지 않는 한, 5'에서 3' 방향으로 제시된다. 용어 "핵산 절편"은 보다 긴 핵산 서열의 부분인 핵산 서열을 지칭하기 위해 본원에서 사용된다. 많은 실시양태에서, 핵산 절편은 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 또는 그 초과의 잔기를 포함한다. 일부 실시양태에서, 핵산은 천연 뉴클레오시드 (예를 들어, 아데노신, 티미딘, 구아노신, 시티딘, 우리딘, 데옥시아데노신, 데옥시티미딘, 데옥시구아노신, 및 데옥시시티딘); 뉴클레오시드 유사체 (예를 들어, 2-아미노아데노신, 2-티오티미딘, 이노신, 피롤로-피리미딘, 3-메틸 아데노신, 5-메틸시티딘, 2-아미노아데노신, C5-브로모우리딘, C5-플루오로우리딘, C5-아이오도우리딘, C5-프로피닐-우리딘, C5-프로피닐-시티딘, C5-메틸시티딘, 2-아미노아데노신, 7-데아자아데노신, 7-데아자구아노신, 8-옥소아데노신, 8-옥소구아노신, O(6)-메틸구아닌, 및 2-티오시티딘); 화학적으로 변형된 염기; 생물학적으로 변형된 염기 (예를 들어, 메틸화된 염기); 개재된 염기; 변형된 당 (예를 들어, 2'-플루오로리보스, 리보스, 2'-데옥시리보스, 아라비노스, 및 헥소스); 및/또는 변형된 포스페이트 기 (예를 들어, 포스포로티오에이트 및 5'-N-포스포로아미다이트 연결)이거나 이를 포함한다. 일부 실시양태에서, 본 발명은 구체적으로 "비변형된 핵산"에 관한 것이며, 이는 전달을 용이하게 하거나 달성하기 위해 화학적으로 변형되지 않은 핵산 (예를 들어, 뉴클레오티드 및/또는 뉴클레오시드를 포함한 폴리뉴클레오티드 및 잔기)을 의미한다.

단백질: 용어 "단백질"은 본원에서 용어 폴리펩티드 및 펩티드와 상호교환가능하게 사용되며, 폴리펩티드 (즉, 펩티드 결합에 의해 서로에 연결된 적어도 2개의 아미노산의 스트링)를 지칭한다. 단백질은 아미노산 이외의 모이어티를 포함할 수 있고/거나 (예를 들어, 당단백질일 수 있음), 다르게는 프로세싱되거나 변형될 수 있다. 관련 기술분야의 통상의 기술자는 "단백질"이 세포에 의해 생산된 바와 같은 완전한 폴리펩티드 쇄 (신호 서열을 갖거나 갖지 않음)일 수 있거나, 또는 그의 기능적 부분일 수 있음을 인지할 것이다. 통상의 기술자는 단백질이 때때로 예를 들어 1개 이상의 디술피드 결합에 의해 연결되거나 다른 수단에 의해 회합된 1개 초과의 폴리펩티드 쇄를 포함할 수 있음을 추가로 인지할 것이다. 폴리펩티드는 L-아미노산, D-아미노산, 또는 둘 다를 함유할 수 있고, 관련 기술분야에 공지된 임의의 다양한 아미노산 변형 또는 유사체를 함유할 수 있다. 유용한 변형은 예를 들어, 화학적 실체, 예컨대 탄수화물 기, 포스페이트 기, 파르네실 기, 이소파르네실 기, 지방산 기, 아미드 기, 말단 아세틸 기, 접합, 관능화, 또는 다른 변형 (예를 들어, 알파 아미드화)을 위한 링커 등의 첨가를 포함한다. 특정 실시양태에서, 펩티드의 변형은 보다 안정한 펩티드 (예를 들어, 생체내에서 보다 큰 반감기)를 초래한다. 이들 변형은 펩티드의 환화, D-아미노산의 혼입 등을 포함할 수 있다. 어떠한 변형도 펩티드의 바람직한 생물학적 활성을 실질적으로 방해하지 않아야 한다. 특정 실시양태에서, 펩티드의 변형은 보다 생물학적으로 활성인 펩티드를 초래한다. 일부 실시양태에서, 폴리펩티드는 천연 아미노산, 비-천연 아미노산, 합성 아미노산, 아미노산 유사체, 및 이들의 조합을 포함할 수 있다.

리콤비나제: 본원에 사용된 용어 "리콤비나제"는 리콤비나제 인식 서열 사이의 DNA 단편의 절제, 통합, 역전, 또는 교환 (예를 들어, 전위)을 발생시키는 리콤비나제 인식 서열 사이의 DNA의 재조합을 매개하는 부위-특이적 효소를 지칭한다. 리콤비나제는 2개의 별개의 패밀리로 분류될 수 있다: 세린 리콤비나제 (예를 들어, 리졸바제 및 인버타제) 및 티로신 리콤비나제 (예를 들어, 인테그라제). 세린 리콤비나제의 예는 제한 없이, Hin, Gin, Tn3, β-six, CinH, ParA, γδ, Bxb1, ΦC31, TP901, TG1, φBT1, R4, φRV1, φFC1, MR11, A118, U153, 및 gp29를 포함한다. 티로신 리콤비나제의 예는 제한 없이, Cre, FLP, R, Lambda, HK101, HK022, 및 pSAM2를 포함한다. 세린 및 티로신 리콤비나제 명칭은 리콤비나제가 DNA를 공격하기 위해 사용하고 가닥 교환 동안 DNA에 공유 연결되게 되는 보존된 친핵성 아미노산 잔기로부터 유래한다. 리콤비나제는 유전자 넉아웃/넉-인의 생성 및 유전자 요법 적용을 포함한 다수의 적용을 갖는다. 예를 들어, 문헌 [Brown et al., "Serine recombinases as tools for genome engineering." Methods. 2011;53(4):372-9]; [Hirano et al., "Site-specific recombinases as tools for heterologous gene integration." Appl. Microbiol. Biotechnol. 2011; 92(2):227-39]; [Chavez and Calos, "Therapeutic applications of the ΦC31 integrase system." Curr. Gene Ther. 2011;11(5):375-81]; [Turan and Bode, "Site-specific recombinases: from tag-and-target- to tag-and-exchange-based genomic modifications." FASEB J. 2011; 25(12):4088-107]; [Venken and Bellen, "Genome-wide manipulations of Drosophila melanogaster with transposons, Flp recombinase, and ΦC31 integrase." Methods Mol. Biol. 2012; 859:203-28]; [Murphy, "Phage recombinases and their applications." Adv. Virus Res. 2012; 83:367-414]; [Zhang et al., "Conditional gene manipulation: Cre-ating a new biological era." J. Zhejiang Univ. Sci. B. 2012; 13(7):511-24]; [Karpenshif and Bernstein, "From yeast to mammals: recent advances in genetic control of homologous recombination." DNA Repair (Amst). 2012; 1;11(10):781-8]을 참조하며; 각각의 전체 내용은 그 전문이 본원에 참조로 포함된다. 본원에서 제공된 리콤비나제는 본 발명의 실시양태에 사용될 수 있는 리콤비나제의 배타적인 예인 것으로 의미되지 않는다. 본 발명의 방법 및 조성물은 새로운 직교 리콤비나제에 대한 데이터베이스를 채굴하거나 한정된 DNA 특이성을 갖는 합성 리콤비나제를 디자인함으로써 확장될 수 있다 (예를 들어, 문헌 [Groth et al., "Phage integrases: biology and applications." J. Mol. Biol. 2004; 335, 667-678]; [Gordley et al., "Synthesis of programmable integrases." Proc. Natl. Acad. Sci. U S A. 2009; 106, 5053-5058] 참조; 각각의 전체 내용은 그 전문이 본원에 참조로 포함됨). 본원에 기재된 방법 및 조성물에 유용한 리콤비나제의 다른 예는 관련 기술분야의 통상의 기술자에게 공지되어 있으며, 발견되거나 생성되는 임의의 새로운 리콤비나제는 본 발명의 상이한 실시양태에 사용될 수 있을 것으로 예상된다. 일부 실시양태에서, 리콤비나제 (또는 그의 촉매 도메인)는 Cas9 단백질 (예를 들어, dCas9)에 융합된다.

재조합하다: 핵산 변형 (예를 들어, 게놈 변형)의 맥락에서 용어 "재조합하다" 또는 "재조합"은 2개 이상의 핵산 분자, 또는 단일 핵산 분자의 2개 이상의 영역이 리콤비나제 단백질의 작용에 의해 변형되는 프로세스를 지칭하기 위해 사용된다. 재조합은 그 중에서도, 예를 들어 1개 이상의 핵산 분자에서 또는 그 사이에 핵산 서열의 삽입, 역전, 절제, 또는 전위를 발생시킬 수 있다.

재프로그래밍 인자: 본원에 사용된 용어 "재프로그래밍 인자"는 단독으로 또는 다른 인자와 조합으로 세포의 상태를 체세포, 분화된 상태로부터 다능성 줄기 세포 상태로 변화시킬 수 있는 인자를 지칭한다. 재프로그래밍 인자의 비-제한적 예는 단백질 (예를 들어, 전사 인자), 펩티드, 핵산, 또는 소분자를 포함한다. 세포 재프로그래밍에 유용한 공지된 재프로그래밍 인자는 Oct4, Sox2, Klf4, 및 c-myc를 포함하나 이에 제한되지는 않는다. 유사하게, 프로그래밍 인자는 세포 분화 또는 탈-분화를 조정하는데, 예를 들어, 바람직한 계통을 향한 세포 분화를 용이하게 하거나 유도하는데 사용될 수 있다.

RNA 간섭 (RNAi): 본원에 사용된 용어 "RNA 간섭" 또는 "RNAi"는 유전자 발현의 서열-특이적 억제 및/또는 RNA에 의해 매개되는 표적 RNA 수준의 감소를 지칭하며, 여기서 RNA는 표적 RNA에 실질적으로 상보적인 부분을 포함한다. 전형적으로, 실질적으로 상보적인 부분의 적어도 일부는 RNA의 이중 가닥 영역 내에 있다. 일부 실시양태에서, RNAi는 RNA의 선택적 세포내 분해를 통해 일어날 수 있다. 일부 실시양태에서, RNAi는 번역 억제에 의해 일어날 수 있다.

RNAi 작용제: 본원에 사용된 용어 "RNAi 작용제" 또는 "RNAi"는 RNAi 메커니즘을 통해 유전자 발현의 억제를 매개할 수 있는 분자의 구조 특징을 갖는 1종 이상의 뉴클레오티드 유사체 또는 변형을 임의로 포함하는 RNA를 지칭한다. 일부 실시양태에서, RNAi 작용제는 표적 전사체의 분해를 유발함으로써 유전자 발현의 억제를 매개한다. 일부 실시양태에서, RNAi 작용제는 표적 전사체의 번역을 억제함으로써 유전자 발현의 억제를 매개한다. 일반적으로, RNAi 작용제는 표적 RNA에 실질적으로 상보적인 부분을 포함한다. 일부 실시양태에서, RNAi 작용제는 적어도 부분적으로 이중-가닥이다. 일부 실시양태에서, RNAi 작용제는 단일-가닥이다. 일부 실시양태에서, 예시적인 RNAi 작용제는 siRNA, shRNA, 및/또는 miRNA를 포함할 수 있다. 일부 실시양태에서, RNAi 작용제는 천연 RNA 뉴클레오티드 (즉, 아데닌, 구아닌, 시토신, 및 우라실)로 전체적으로 구성될 수 있다. 일부 실시양태에서, RNAi 작용제는 1종 이상의 비-천연 RNA 뉴클레오티드 (예를 들어, 뉴클레오티드 유사체, DNA 뉴클레오티드 등)를 포함할 수 있다. 비-천연 RNA 핵산 잔기의 포함은 RNAi 작용제를 RNA보다 세포 분해에 더 저항성으로 만드는데 사용될 수 있다. 일부 실시양태에서, 용어 "RNAi 작용제"는 RNAi 효과 (예를 들어, 표적 RNA의 분해 및/또는 번역의 억제)를 유도하는 RNA를 코딩하는 임의의 RNA, RNA 유도체, 및/또는 핵산을 지칭할 수 있다. 일부 실시양태에서, RNAi 작용제는 다이서(Dicer) 기질로서 작용할 수 있는 블런트-단부 (즉, 오버행이 없는) dsRNA를 포함할 수 있다. 예를 들어, 이러한 RNAi 작용제는 임의로 화학적으로 변형되어 면역 반응을 철폐할 수 있는 ≥ 25 염기 쌍 길이인 블런트-단부 dsRNA를 포함할 수 있다.

RNAi-유도제: 본원에 사용된 용어 "RNAi-유도제"는 RNAi 작용제의 활성을 전달하고/거나, 조절하고/거나, 변형시키는 임의의 실체를 포괄한다. 일부 실시양태에서, RNAi-유도제는 세포 내의 그의 존재가 RNAi를 발생시키고 RNAi-유도제가 표적화되는 전사체의 감소된 발현을 초래하는 벡터 (사람의 손에 의해 변형되지 않은 천연 발생 분자 이외의)를 포함할 수 있다. 일부 실시양태에서, RNAi-유도제는 RNAi-유도 벡터이다. 일부 실시양태에서, RNAi-유도제는 RNAi 작용제 및 1종 이상의 제약상 허용되는 부형제 및/또는 담체를 포함하는 조성물이다. 일부 실시양태에서, RNAi-유도제는 "RNAi-유도 벡터"이며, 이는 세포 내의 그의 존재가 자기-혼성화하거나 서로에 혼성화하여 RNAi 작용제 (예를 들어 siRNA, shRNA, 및/또는 miRNA)를 형성하는 1종 이상의 RNA의 생산을 발생시키는 벡터를 지칭한다. 다양한 실시양태에서, 이 용어는 세포 내의 그의 존재가 자기-혼성화하거나 서로에 혼성화하여 RNAi 작용제를 형성하는 1종 이상의 RNA의 생산을 발생시키는 플라스미드, 예를 들어, DNA 벡터 (그의 서열이 바이러스로부터 유래된 서열 요소를 포함할 수 있음), 또는 바이러스 (사람의 손에 의해 변형되지 않은 천연 발생 바이러스 또는 플라스미드 이외의)를 포괄한다. 일반적으로, 벡터는 혼성화하거나 자기-혼성화하여 RNAi 작용제를 형성하는 1종 이상의 RNA가 벡터가 세포 내에 존재하는 경우 전사되도록 발현 신호(들)에 작동가능하게 연결된 핵산을 포함한다. 따라서 벡터는 RNA 또는 RNA들 또는 그의 전구체의 세포내 합성을 위한 주형을 제공한다. RNAi를 유도하는 목적을 위해, 세포에서의 바이러스 게놈의 존재 (예를 들어, 세포막과의 바이러스 외피의 융합 후)는 세포 내의 바이러스의 존재를 구성하는데 충분한 것으로 간주된다. 또한, RNAi를 유도하는 목적을 위해, 벡터는 그것이 세포 내에서 후속적으로 변형되거나 프로세싱되는지 여부와 무관하게, 그것이 세포 내로 도입되거나, 세포에 진입하거나, 모 세포로부터 유전되는 경우, 세포 내에 존재하는 것으로 간주된다. RNAi-유도 벡터는 세포 내의 벡터의 존재가 서로에 혼성화하거나 자기-혼성화하여 전사체에 표적화된 RNAi 작용제를 형성하는 1종 이상의 RNA의 생산을 발생시키는 경우, 즉, 세포 내의 벡터의 존재가 전사체에 표적화된 1종 이상의 RNAi 작용제의 생산을 발생시키는 경우, 전사체에 표적화되는 것으로 간주된다.

RNA-프로그램가능한 뉴클레아제: 용어 "RNA-프로그램가능한 뉴클레아제" 및 "RNA-가이드된 뉴클레아제"는 본원에서 상호교환가능하게 사용되며, 절단을 위한 표적이 아닌 1개 이상의 RNA 분자와 복합체를 형성하는 (예를 들어, 그와 결합하거나 회합하는) 뉴클레아제를 지칭한다. 일부 실시양태에서, RNA-프로그램가능한 뉴클레아제는, RNA와의 복합체에서의 경우, 뉴클레아제:RNA 복합체로 지칭될 수 있다. RNA-프로그램가능한 뉴클레아제는 Cas9 뉴클레아제를 포함한다. 전형적으로, 결합된 RNA(들)는 가이드 RNA (gRNA)로 지칭된다. gRNA는 2개 이상의 RNA의 복합체로서, 또는 단일 RNA 분자로서 존재할 수 있다. 단일 RNA 분자로서 존재하는 gRNA는 단일-가이드 RNA (sgRNA)로 지칭될 수 있지만, "gRNA"는 단일 분자로서 또는 2개 이상의 분자로서 존재하는 가이드 RNA를 지칭하기 위해 상호교환가능하게 사용된다. 전형적으로, 단일 RNA 종으로서 존재하는 gRNA는 2개의 도메인을 포함한다: (1) 표적 핵산과 상동성을 공유하는 도메인 (예를 들어, 및 표적에의 Cas9 복합체의 결합을 지정함); 및 (2) 엔도뉴클레아제 효소 (예를 들어, Cas9 단백질)에 결합하는 도메인. gRNA는 표적 부위를 보완하는 뉴클레오티드 서열을 포함하며, 이는 상기 표적 부위에의 뉴클레아제/RNA 복합체의 결합을 매개하고, 뉴클레아제:RNA 복합체의 서열 특이성을 제공한다.

짧은 간섭 RNA (siRNA): 본원에 사용된 용어 "짧은 간섭 RNA" 또는 "siRNA"는 대략 19 염기 쌍 (bp)의 길이이고 임의로 1 내지 3개의 단일-가닥 오버행을 추가로 포함하는 RNA 듀플렉스 (본원에서 "듀플렉스 영역"으로 지칭됨)를 포함하는 RNAi 작용제를 지칭한다. 일부 실시양태에서, RNAi 작용제는 15 bp 내지 29 bp의 길이의 범위이고 임의로 1 또는 2개의 단일-가닥 오버행을 추가로 포함하는 듀플렉스 영역을 포함한다. siRNA는 함께 혼성화하는 2개의 RNA 분자로부터 형성될 수 있거나, 또는 대안적으로 자기-혼성화 부분을 포함하는 단일 RNA 분자로부터 생성될 수 있다. 일반적으로, siRNA 분자의 유리 5'-단부는 포스페이트 기를 갖고, 유리 3'-단부는 히드록실 기를 갖는다. siRNA의 듀플렉스 부분은 1개 이상의 비쌍형성된 뉴클레오티드로 이루어진 1개 이상의 벌지를 포함할 수 있지만, 전형적으로 그렇지 않다. siRNA의 한 가닥은 표적 전사체와 혼성화하는 부분을 포함한다. 특정 실시양태에서, siRNA의 한 가닥은 표적 전사체의 영역과 정확하게 상보적이며, 이는 siRNA가 단일 미스매치 없이 표적 전사체에 혼성화함을 의미한다. 일부 실시양태에서, siRNA 및 표적 전사체의 표적화된 부분 사이에 1개 이상의 미스매치가 존재할 수 있다. 완벽한 상보성이 달성되지 않는 일부 실시양태에서, 임의의 미스매치는 일반적으로 siRNA 말단에 또는 그 부근에 위치한다. 일부 실시양태에서, siRNA는 표적 전사체의 분해를 유발함으로써 유전자 발현의 억제를 매개한다.

짧은 헤어핀 RNA (shRNA): 본원에 사용된 용어 "짧은 헤어핀 RNA" 또는 "shRNA"는 혼성화된 또는 혼성화되어 RNAi를 매개하는데 충분히 긴 이중-가닥 (듀플렉스) 구조 (전형적으로 적어도 대략 19 bp의 길이)를 형성할 수 있는 적어도 2개의 상보적 부분, 및 루프를 형성하는 전형적으로 대략 1 뉴클레오티드 (nt) 내지 대략 10 nt의 길이의 범위인 적어도 1개의 단일-가닥 부분을 갖는 RNA를 포함하는 RNAi 작용제를 지칭한다. 일부 실시양태에서, shRNA는 15 bp 내지 29 bp의 길이의 범위인 듀플렉스 부분 및 루프를 형성하는 전형적으로 대략 1 nt 내지 대략 10 nt의 길이의 범위인 적어도 1개의 단일-가닥 부분을 포함한다. 듀플렉스 부분은 1개 이상의 비쌍형성된 뉴클레오티드로 이루어진 1개 이상의 벌지를 포함할 수 있지만, 전형적으로 그렇지 않다. 일부 실시양태에서, siRNA는 표적 전사체의 분해를 유발함으로써 유전자 발현의 억제를 매개한다. shRNA는 보존된 세포 RNAi 기구에 의해 siRNA로 프로세싱되는 것으로 생각된다. 따라서, shRNA는 siRNA의 전구체일 수 있다. 이와 무관하게, siRNA는 일반적으로 siRNA와 유사하게 표적 RNA의 발현을 억제할 수 있다.

소분자: 일반적으로, "소분자"는 실험실에서 제조되거나 자연에서 발견되는 실질적으로 비-펩티드성, 비-올리고머성 유기 화합물을 지칭한다. 본원에 사용된 소분자는 "천연 산물-유사"인 화합물을 지칭할 수 있지만, 용어 "소분자"는 "천연 산물-유사" 화합물에 제한되지 않는다. 오히려, 소분자는 전형적으로 그것이 몇몇 탄소-탄소 결합을 함유하고, 2000 g/mol 미만, 1500 g/mol 미만, 1250 g/mol 미만, 1000 g/mol 미만, 750 g/mol 미만, 500 g/mol 미만, 또는 250 g/mol 미만의 분자량을 갖는 것을 특징으로 하지만, 이 특징은 본 발명의 목적을 위해 제한적인 것으로 의도되지 않는다. 특정 다른 실시양태에서, 천연-산물-유사 소분자가 이용된다.

유사성: 본원에 사용된 용어 "유사성"은 중합체성 분자 사이의, 예를 들어, 핵산 분자 (예를 들어 DNA 분자 및/또는 RNA 분자) 사이의 및/또는 폴리펩티드 분자 사이의 전체적 관련성을 지칭한다. 서로에 대한 중합체성 분자의 퍼센트 유사성의 계산은 퍼센트 유사성의 계산이 관련 기술분야에서 이해되어 있는 바와 같이 보존적 치환을 고려한다는 점을 제외하고는 퍼센트 동일성의 계산과 동일한 방식으로 수행될 수 있다.

대상체: 본원에 사용된 용어 "대상체" 또는 "환자"는 본 발명에 따른 조성물이 예를 들어, 실험, 진단, 예방, 및/또는 치료 목적으로 투여될 수 있는 임의의 유기체를 지칭한다. 전형적인 대상체는 동물 (예를 들어, 포유동물, 예컨대 마우스, 래트, 토끼, 비-인간 영장류, 및 인간) 및/또는 식물을 포함한다.

치료 유효량: 본원에 사용된 용어 "치료 유효량"은 질환, 장애, 및/또는 상태를 앓고 있거나 이에 대해 감수성인 대상체에게 투여되는 경우, 질환, 장애, 및/또는 상태를 치료하고/거나, 그의 증상을 개선시키고/거나, 진단하고/거나, 예방하고/거나, 그의 발병을 지연시키는데 충분한 전달되는 작용제 (예를 들어, 핵산, 약물, 치료제, 진단제, 예방제 등)의 양을 의미한다.

전사 인자: 본원에 사용된 용어 "전사 인자"는 예를 들어, 전사의 활성화 또는 억제에 의해 DNA의 RNA로의 전사를 조절하는 DNA-결합 단백질을 지칭한다. 일부 전사 인자는 단독으로 전사의 조절을 실행하는 반면, 다른 것들은 다른 단백질과 협력하여 작용한다. 일부 전사 인자는 특정 조건 하에서 전사를 활성화시키고 억제하는 둘 다를 할 수 있다. 일반적으로, 전사 인자는 표적 유전자의 조절 영역에서 특이적 컨센서스 서열과 매우 유사한 특이적 표적 서열 또는 서열들에 결합한다. 전사 인자는 단독으로 또는 다른 분자와 복합체로 표적 유전자의 전사를 조절할 수 있다. 전사 인자의 예는 Sp1, NF1, CCAAT, GATA, HNF, PIT-1, MyoD, Myf5, Hox, 날개 나선, SREBP, p53, CREB, AP-1, Mef2, STAT, R-SMAD, NF-κB, Notch, TUBBY, 및 NFAT를 포함하나 이에 제한되지는 않는다.

치료하는 것: 본원에 사용된 용어 "치료하는 것"은 특정 질환, 장애, 및/또는 상태의 1종 이상의 증상 또는 특색을 부분적으로 또는 완전히 경감시키고/거나, 개선시키고/거나, 개선시키고/거나, 완화시키고/거나, 그의 발병을 지연시키고/거나, 그의 진행을 억제하고/거나, 그의 중증도를 감소시키고/거나, 그의 발생을 감소시키는 것을 지칭한다. 예를 들어, 암을 "치료하는 것"은 종양의 생존, 성장, 및/또는 확산을 억제하는 것을 지칭할 수 있다. 치료는 질환, 장애, 및/또는 상태와 연관된 병리증상을 발달시킬 위험을 감소시킬 목적으로 질환, 장애, 및/또는 상태의 징후를 나타내지 않는 대상체에게 및/또는 질환, 장애, 및/또는 상태의 단지 초기 징후를 나타내는 대상체에게 투여될 수 있다.

벡터: 본원에 사용된 "벡터"는 그것이 연결된 또 다른 핵산을 수송할 수 있는 핵산 분자를 지칭한다. 일부 실시양태에서, 벡터는 이들이 숙주 세포, 예컨대 진핵생물 및/또는 원핵생물 세포에서 연결되는 핵산의 염색체외 복제 및/또는 발현을 달성할 수 있다. 작동적으로 연결된 유전자의 발현을 지정할 수 있는 벡터는 본원에서 "발현 벡터"로 지칭된다.

WW 도메인: 본원에 기재된 용어 "WW 도메인"은 짧은 프롤린-풍부 또는 프롤린-함유 모티프와의 단백질-단백질 상호작용을 매개하는 C-말단에 2개의 염기성 잔기를 갖는 단백질 도메인이다. 2개의 염기성 C-말단 아미노산 잔기를 갖는 WW 도메인은 짧은 프롤린-풍부 또는 프롤린-함유 모티프 (즉, PPXY 모티프)와 회합하는 능력을 가질 수 있다. WW 도메인은 AARDC1에서 발견되는 코어 프롤린-풍부 서열, 예컨대 PPXY를 갖는 모티프를 포함한 다양한 별개의 펩티드 리간드에 결합한다. WW 도메인은 20 내지 22개의 아미노산만큼 이격된 2개의 시그니처 트립토판 잔기를 갖는 30 내지 40개의 아미노산 단백질 상호작용 도메인일 수 있다. WW 도메인의 3차원 구조는 이들이 일반적으로 2개의 리간드-결합 그루브를 갖는 3-가닥, 역평행 β 쉬트로 폴딩됨을 제시한다.

WW 도메인은 많은 진핵생물에서 발견되며, 대략 50개의 인간 단백질에 존재한다 (Bork, P. & Sudol, M. The WW domain: a signaling site in dystrophin? Trends Biochem Sci 19, 531-533 (1994)). WW 도메인은 막 표적화 도메인, 예컨대 NEDD4 패밀리 단백질에서의 C2, FE65 단백질에서의 포스포티로신-결합 (PTB) 도메인, CA150 및 FBPIl에서의 FF 도메인, 및 PLEKHA5에서의 플렉스트린 상동성 (PH) 도메인을 포함한 몇몇 다른 상호작용 도메인과 함께 존재할 수 있다. WW 도메인은 또한 NEDD4 패밀리 단백질에서의 HECT E3 단백질-유비퀴틴 리가제 도메인, Pinl에서의 로토머라제 또는 펩티딜 프롤릴이소머라제 도메인, 및 ArhGAP9 및 ArhGAP12에서의 Rho GAP 도메인을 포함한 다양한 촉매 도메인에 연결된다.

본 개시내용에서, WW 도메인은 C-말단에 2개의 염기성 아미노산을 천연적으로 갖는 WW 도메인일 수 있으며, 예를 들어 WW 도메인 또는 WW 도메인 변이체는 인간 유비퀴틴 리가제 WWP1, WWP2, Nedd4-1, Nedd4-2, Smurf1, Smurf2, ITCH, NEDL1, 또는 NEDL2로부터의 것일 수 있다. WW 도메인 함유 단백질의 예시적인 아미노산 서열 (WW 도메인은 밑줄침)은 하기 열거된다. 본원에 기재된 예시적인 단백질의 임의의 WW 도메인 또는 WW 도메인 변이체는 본 발명에 사용될 수 있으며, 제한적인 것으로 의미되지 않음이 인지되어야 한다.

인간 WWP1 아미노산 서열 (uniprot.org/uniprot/Q9H0M0). 4개의 밑줄친 WW 도메인은 아미노산 349 - 382 (WW1), 381 - 414 (WW2), 456 - 489 (WW3), 및 496 - 529 (WW4)에 상응한다.

인간 WWP2 아미노산 서열 (uniprot.org/uniprot/ O00308). 4개의 밑줄친 WW 도메인은 아미노산 300 - 333 (WW1), 330 - 363 (WW2), 405 - 437 (WW3), 및 444 - 547 (WW4)에 상응한다.

인간 Nedd4-1 아미노산 서열 (uniprot.org/uniprot/ P46934). 4개의 밑줄친 WW 도메인은 아미노산 610 - 643 (WW1), 767 - 800 (WW2), 840 - 873 (WW3), 및 892 - 925 (WW4)에 상응한다.

인간 Nedd4-2 아미노산 서열 (>gi|21361472|ref|NP_056092.2| E3 유비퀴틴-단백질 리가제 NEDD4-유사 이소형 3 [호모 사피엔스]). 4개의 밑줄친 WW 도메인은 아미노산 198 - 224 (WW1), 368 - 396 (WW2), 480 - 510 (WW3), 및 531 - 561 (WW4)에 상응한다.

인간 Smurf1 아미노산 서열 (uniprot.org/uniprot/ Q9HCE7). 2개의 밑줄친 WW 도메인은 아미노산 234 - 267 (WW1), 및 306 - 339 (WW2)에 상응한다.

인간 Smurf2 아미노산 서열 (uniprot.org/uniprot/Q9HAU4). 3개의 밑줄친 WW 도메인은 아미노산 157 - 190 (WW1), 251 - 284 (WW2), 및 297 - 330 (WW3)에 상응한다.

인간 ITCH 아미노산 서열 (uniprot.org/uniprot/Q96J02). 4개의 밑줄친 WW 도메인은 아미노산 326 - 359 (WW1), 358 - 391 (WW2), 438 - 471 (WW3), 및 478 - 511 (WW4)에 상응한다.

인간 NEDL1 아미노산 서열 (uniprot.org/uniprot/Q76N89). 2개의 밑줄친 WW 도메인은 아미노산 829 - 862 (WW1), 및 1018 - 1051 (WW2)에 상응한다.

인간 NEDL2 아미노산 서열 (uniprot.org/uniprot/ Q9P2P5). 2개의 밑줄친 WW 도메인은 아미노산 807 - 840 (WW1), 및 985 - 1018 (WW2)에 상응한다.

일부 실시양태에서, WW 도메인은 아미노산 서열 (서열식별번호: 6); (서열식별번호: 7); (서열식별번호: 8); (서열식별번호: 9); (서열식별번호: 10); (서열식별번호: 11); (서열식별번호: 12); (서열식별번호: 13); 또는 (서열식별번호: 14)로부터의 WW 도메인 또는 WW 도메인 변이체를 포함한다. 다른 실시양태에서, WW 도메인은 아미노산 서열 (서열식별번호: 6); (서열식별번호: 7); (서열식별번호: 8); (서열식별번호: 9); (서열식별번호: 10); (서열식별번호: 11); (서열식별번호: 12); (서열식별번호: 13); 또는 (서열식별번호: 14)로부터의 WW 도메인 또는 WW 도메인 변이체로 이루어진다. 또 다른 실시양태에서, WW 도메인은 아미노산 서열 (서열식별번호: 6); (서열식별번호: 7); (서열식별번호: 8); (서열식별번호: 9); (서열식별번호: 10); (서열식별번호: 11); (서열식별번호: 12); (서열식별번호: 13); 또는 (서열식별번호: 14)로부터의 WW 도메인 또는 WW 도메인 변이체로 본질적으로 이루어진다. 본질적으로 이루어진다는 도메인, 펩티드 또는 폴리펩티드가 이러한 아미노산 서열이 도메인, 펩티드 또는 폴리펩티드에 단지 소수의 추가의 아미노산 잔기, 예를 들어, 약 1 내지 약 10개 또는 그러한 추가의 잔기, 전형적으로 1 내지 약 5개의 추가의 잔기와 함께 존재하는 경우 아미노산 서열로 본질적으로 이루어짐을 의미한다.

대안적으로, WW 도메인은 도메인의 C-말단에 2개의 염기성 아미노산을 포함하도록 변형된 WW 도메인일 수 있다. 기술은 관련 기술분야에 공지되어 있으며, 관련 기술분야에, 예를 들어, 문헌 [Sambrook et al. ((2001) Molecular Cloning: a Laboratory Manual, 3rd ed., Cold Spring Harbour Laboratory Press)]에 기재되어 있다. 따라서, 통상의 기술자는 C-말단에 2개의 염기성 잔기를 포함하도록 2개의 C-말단 염기성 잔기를 통상적으로 갖지 않는 기존의 WW 도메인을 용이하게 변형시킬 수 있다.

염기성 아미노산은 7 초과의 pKa를 갖는 측쇄 관능기를 갖는 아미노산이며, 리신, 아르기닌, 및 히스티딘, 뿐만 아니라 단백질에 통상적으로 포함되는 20개의 α-아미노산에 포함되지 않는 염기성 아미노산을 포함한다. WW 도메인의 C-말단에서의 2개의 염기성 아미노산은 동일한 염기성 아미노산일 수 있거나, 또는 상이한 염기성 아미노산일 수 있다. 한 실시양태에서, 2개의 염기성 아미노산은 2개의 아르기닌이다.

용어 WW 도메인은 또한 WW 도메인의 변이체를 포함하되, 임의의 이러한 변이체는 그의 C-말단에 2개의 염기성 아미노산을 갖고, PPXY 모티프와 회합하는 WW 도메인의 능력을 유지한다. 이러한 WW 도메인의 변이체는 PPXY 모티프 (즉, 최소 ARRDC1의 PPXY 모티프)와 회합하는 능력을 보유하고, 점, 삽입 또는 결실 돌연변이를 포함한 1개 이상의 아미노산에서 돌연변이되었지만, PPXY 모티프와 회합하는 능력을 여전히 보유하는 WW 도메인을 지칭한다. 따라서, 변이체 또는 유도체는 말단절단 및 단편을 포함한 결실; 삽입 및 부가, 예를 들어, 보존적 치환, 부위-지정 돌연변이체 및 대립유전자 변이체; 및 펩티드에 공유 연결된 1개 이상의 비-아미노 아실 기 (예를 들어, 당, 지질 등) 및 번역후 변형을 포함한 변형을 포함한다. 이러한 변화를 생성하는데 있어서, 유사한 아미노산 잔기의 치환은 측쇄 치환기의 상대적 유사성, 예를 들어, 그들의 크기, 전하, 소수성, 친수성 등에 기반하여 이루어질 수 있으며, 이러한 치환은 통상적인 시험에 의해 펩티드의 기능에 대한 그들의 효과에 대해 검정될 수 있다.

WW 도메인은 보다 긴 단백질의 일부일 수 있다. 따라서, 단백질은, 다양한 상이한 실시양태에서, 본원에서 정의된 바와 같이, WW 도메인을 포함하거나, WW 도메인으로 이루어지거나, 또는 WW 도메인으로 본질적으로 이루어진다. 폴리펩티드는 단백질 서열 내의 기능적 도메인으로서 WW 도메인을 포함하는 단백질일 수 있다. 일부 실시양태에서, 폴리펩티드는 엔도뉴클레아제이다. 일부 실시양태에서, 엔도뉴클레아제는 Cas9 단백질 또는 Cas9 단백질 변이체이다. 다른 실시양태에서, 폴리펩티드는 (서열식별번호: 6); (서열식별번호: 7); (서열식별번호: 8); (서열식별번호: 9); (서열식별번호: 10); (서열식별번호: 11); (서열식별번호: 12); (서열식별번호: 13); 또는 (서열식별번호: 14)에 제시된 서열을 포함하거나, (서열식별번호: 6); (서열식별번호: 7); (서열식별번호: 8); (서열식별번호: 9); (서열식별번호: 10); (서열식별번호: 11); (서열식별번호: 12); (서열식별번호: 13); 또는 (서열식별번호: 14)로 이루어지거나, 또는 (서열식별번호: 6); (서열식별번호: 7); (서열식별번호: 8); (서열식별번호: 9); (서열식별번호: 10); (서열식별번호: 11); (서열식별번호: 12); (서열식별번호: 13); 또는 (서열식별번호: 14)로 본질적으로 이루어진다.

핵산 분자, 예컨대 뉴클레아제, 데아미나제, 및 전사 활성화제 또는 억제제에 결합하는 기능적 이펙터 단백질의 맥락에서 본원에 사용된 용어 "표적 부위"는 이펙터 단백질에 의해 결합되고 작용화된, 예를 들어, 뉴클레아제에 의해 절단되거나, 각각 전사 활성화제 또는 억제제에 의해 전사 활성화되거나 억제된 핵산 분자 내의 서열을 지칭한다. 표적 부위는 단일-가닥 또는 이중-가닥일 수 있다. RNA-가이드된 (예를 들어, RNA-프로그램가능한) 뉴클레아제 (예를 들어, Cas9 gRNA 결합 도메인 및 활성 Cas9 DNA 절단 도메인을 포함하는 단백질 이량체)의 맥락에서, 표적 부위는 전형적으로 RNA-프로그램가능한 뉴클레아제의 gRNA에 상보적인 뉴클레오티드 서열, 및 gRNA-상보적 서열에 인접한 3' 단부에 프로토스페이서 인접 모티프 (PAM)를 포함한다. RNA-가이드된 뉴클레아제 Cas9에 대해, 표적 부위는 일부 실시양태에서, 20개의 염기 쌍 플러스 3개의 염기 쌍 PAM (예를 들어, NNN, 여기서 N은 임의의 뉴클레오티드를 나타냄)일 수 있다. 전형적으로, PAM의 제1 뉴클레오티드는 임의의 뉴클레오티드일 수 있는 반면, 2개의 하류 뉴클레오티드는 특이적 RNA-가이드된 뉴클레아제에 따라 특정된다. RNA-가이드된 뉴클레아제, 예컨대 Cas9에 대한 예시적인 표적 부위는 관련 기술분야의 통상의 기술자에게 공지되어 있으며, 제한 없이, NNG, NGN, NAG, 및 NGG를 포함하고, 여기서 N은 임의의 뉴클레오티드를 나타낸다. 또한, 상이한 종 (예를 들어, 에스. 피오게네스 대신 에스. 써모필루스)으로부터의 Cas9 뉴클레아제는 서열 NGGNG를 포함하는 PAM을 인식한다. NNAGAAW (서열식별번호: 121) 및 NAAR을 포함하나 이에 제한되지는 않는 추가의 PAM 서열은 공지되어 있다 (예를 들어, 그의 전체 내용이 본원에 참조로 포함되는 문헌 [Esvelt and Wang, Molecular Systems Biology, 9:641 (2013)] 참조). 예를 들어, RNA-가이드된 뉴클레아제, 예컨대, 예를 들어, Cas9의 표적 부위는 구조 [NZ]-[PAM]을 포함할 수 있고, 여기서 각각의 N은 독립적으로 임의의 뉴클레오티드이고, Z는 1 내지 50 (포함적)의 정수이다. 일부 실시양태에서, Z는 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15, 적어도 16, 적어도 17, 적어도 18, 적어도 19, 적어도 20, 적어도 25, 적어도 30, 적어도 35, 적어도 40, 적어도 45, 또는 적어도 50이다. 일부 실시양태에서, Z는 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 또는 50이다. 일부 실시양태에서, Z는 20이다. 일부 실시양태에서, "표적 부위"는 또한 뉴클레아제에 의해 결합되지만 절단되지 않는 핵산 분자 내의 서열을 지칭할 수 있다. 예를 들어, 본원에 기재된 특정 실시양태는 불활성 (또는 불활성화된) Cas9 DNA 절단 도메인을 포함하는 단백질을 제공한다. 이러한 단백질 (예를 들어, 또한 Cas9 RNA 결합 도메인을 포함하는 경우)은 gRNA에 의해 특정된 표적 부위에 결합할 수 있지만, DNA 절단 부위는 불활성화되기 때문에, 표적 부위는 특정 단백질에 의해 절단되지 않는다. 그러나, 본원에 기재된 바와 같은 이러한 단백질은 전형적으로 핵산 분자의 절단을 매개하는 또 다른 단백질 (예를 들어, 뉴클레아제 또는 전사 인자) 또는 분자와 회합된다. 일부 실시양태에서, 실제적으로 절단되는 서열은 핵산 분자의 절단을 매개하는 단백질 (예를 들어, 뉴클레아제) 또는 분자에 의존할 것이고, 일부 경우에, 예를 들어, 불활성화된 Cas9 단백질(들)이 결합되는 근접성 또는 거리와 관련될 것이다.

본 발명의 특정 실시양태의 상세한 설명

본 개시내용은 최소 ARRDC1 단백질이 화물을 효율적으로 패키징할 수 있다는 발견에 관한 것이다. 최소 ARRDC1의 과발현은 ARMM 내로의 화물의 패키징을 여전히 달성하면서, 전장 ARRDC1의 과발현보다 더 많은 양의 기능적 ARRDC1을 생산할 수 있다. 최소 ARRDC1 구축물은 ARMM에서 ARRDC1의 부피를 감소시킬 수 있으며, 따라서 ARMM의 로딩 용량을 증가시킬 수 있다. 화물의 패키징을 달성하는데 필요한 ARRDC1의 크기를 감소시키는 것은 또한 직접적 융합물로서 최소 ARRDC1과 함께 발현되거나 번역후에 최소 ARRDC1 분자에 연결될 수 있는 화물의 실제적 한계를 증가시킨다. 최소 ARRDC1 단백질에서의 모티프는 효율적인 ARMM 버딩을 생성한다: 아레스틴 도메인은 단백질을 형질막에 지정하고; 테트라펩티드 PSAP (서열식별번호: 122) 또는 PTAP (서열식별번호: 123)는 TSG101 및 ESCRT I 복합체 단백질과 상호작용하고 이를 형질막에 동원하고; PPXY 모티프(들)는 NEDD4 E3 리가제의 WW 도메인과 상호작용하여 ARMM 버딩을 증진시킨다 (Nabhan et al., 2012).

본 개시내용의 측면은 전장 ARRDC1 단백질보다 더 짧지만, 미세소포 형성에 관하여 그의 동일한 기능을 유지하는 최소 ARRDC1을 제공한다. 일부 실시양태에서, 최소 ARRDC1은 아레스틴 도메인의 적어도 부분, 적어도 1개의 PSAP (서열식별번호: 122) 또는 PTAP (서열식별번호: 123) 모티프, 및 적어도 1개의 PPXY 모티프를 포함하고, 여기서 최소 ARRDC1은 전장 ARRDC1 단백질보다 더 짧다. 최소 ARRDC1의 비-제한적 예는 서열식별번호: 1에 제공된다.

최소 ARRDC1의 또 다른 비-제한적 예는 서열식별번호: 125에 제공된다:

최소 ARRDC1을 코딩하는 핵산 서열의 비-제한적 예는 서열식별번호: 126에 제공된다:

최소 ARRDC1은 서열식별번호: 1과 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 일부 실시양태에서, 최소 ARRDC1은 서열식별번호: 1을 포함한다. 일부 실시양태에서, 최소 ARRDC1은 서열식별번호: 1로 이루어진다.

본원에서 제공된 바와 같은 최소 ARRDC1은 전장 ARRDC1보다 더 적은 아미노산인 임의의 길이 아미노산 서열을 포함할 수 있다. 일부 실시양태에서, 최소 ARRDC1은 100 내지 400개의 아미노산을 포함한다. 일부 실시양태에서, 최소 ARRDC1은 100 내지 350개의 아미노산, 100 내지 300개의 아미노산, 100 내지 250개의 아미노산, 100 내지 200개의 아미노산, 또는 100 내지 150개의 아미노산을 포함한다. 일부 실시양태에서, 최소 ARRDC1은 150 내지 350개의 아미노산, 200 내지 350개의 아미노산, 250 내지 350개의 아미노산, 또는 300 내지 350개의 아미노산을 포함한다.

일부 실시양태에서, 최소 ARRDC1은 최대 400개의 아미노산, 최대 375개의 아미노산, 최대 350개의 아미노산, 최대 325개의 아미노산, 최대 300개의 아미노산, 최대 275개의 아미노산, 최대 250개의 아미노산, 최대 225개의 아미노산, 최대 200개의 아미노산, 최대 200개의 아미노산, 최대 175개의 아미노산, 최대 150개의 아미노산, 최대 125개의 아미노산, 또는 최대 100개의 아미노산을 포함한다.

일부 실시양태에서, 최소 ARRDC1은 약 400개의 아미노산, 약 375개의 아미노산, 약 350개의 아미노산, 약 325개의 아미노산, 약 300개의 아미노산, 약 275개의 아미노산, 약 250개의 아미노산, 약 225개의 아미노산, 약 200개의 아미노산, 약 175개의 아미노산, 약 150개의 아미노산, 약 125개의 아미노산, 또는 약 100개의 아미노산을 포함한다.

일부 실시양태에서, 최소 ARRDC1은 아레스틴 도메인의 적어도 부분을 포함한다. 일부 실시양태에서, 아레스틴 도메인의 부분은 서열식별번호: 116의 아미노산 1-308을 포함한다.

본원에서 제공된 바와 같은 최소 ARRDC1은 임의의 수의 PSAP (서열식별번호: 122) 모티프 및/또는 PTAP (서열식별번호: 123) 모티프를 포함할 수 있다. 일부 실시양태에서, 최소 ARRDC1은 적어도 1개의 PSAP (서열식별번호: 122) 모티프 또는 적어도 1개의 PTAP (서열식별번호: 123) 모티프를 포함한다. 일부 실시양태에서, 최소 ARRDC1은 적어도 1개의 PSAP (서열식별번호: 122) 모티프를 포함한다. 일부 실시양태에서, 최소 ARRDC1은 적어도 1개의 PTAP (서열식별번호: 123) 모티프를 포함한다. 일부 실시양태에서, 최소 ARRDC1은 적어도 1개의 PSAP (서열식별번호: 122) 모티프 및 적어도 1개의 PTAP (서열식별번호: 123) 모티프를 포함한다.

본원에서 제공된 바와 같은 최소 ARRDC1은 임의의 수의 PPXY 모티프를 포함할 수 있다. 일부 실시양태에서, 최소 ARRDC1은 적어도 1개의 PPXY 모티프를 포함한다. 일부 실시양태에서, 최소 ARRDC1은 적어도 2개의 PPXY 모티프를 포함한다. 일부 실시양태에서, 최소 ARRDC1은 적어도 3개의 PPXY 모티프를 포함한다.

최소 ARRDC1은, 일부 실시양태에서, 기능적 변이체를 포괄한다. 기능적 변이체는 그의 기능에 영향을 미치지 않는, 최소 ARRDC1의 기능적 도메인(들) 외부의 1개 이상의 돌연변이, 예를 들어, 아레스틴 도메인 외부의 돌연변이, 또는 아레스틴 도메인 내의 돌연변이를 함유할 수 있다. 기능적 도메인(들) 외부의 돌연변이는 단백질의 생물학적 활성에 영향을 미칠 것으로 예상되지 않을 것이다. 예를 들어, 기능적 도메인 외부의 돌연변이는 미세소포의 형성 또는 버딩에 실질적으로 영향을 미칠 것으로 예상되지 않을 것이다. 일부 실시양태에서, 기능적 변이체는 서열식별번호: 1과 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다.

대안적으로 또는 추가로, 기능적 돌연변이는 최소 ARRDC1에서의 1개 이상의 위치에 보존적 돌연변이(들)를 함유할 수 있다. 예를 들어, 기능적 변이체는 최대 20개의 위치, 최대 15개의 위치, 최대 10개의 위치, 최대 5개의 위치, 최대 4개의 위치, 최대 3개의 위치, 최대 2개의 위치에, 또는 단지 1개의 위치에 보존적 돌연변이를 함유할 수 있다.

WW-도메인-함유-화물을 갖는 미세소포

본 발명의 일부 측면은 WW 도메인에 융합된 화물을 함유하는 아레스틴 도메인-함유 단백질 1 (ARRDC1)-매개된 미세소포 (ARMM)를 제공한다. 이러한 ARMM은 전형적으로 지질 이중층 및 최소 ARRDC1 단백질 또는 그의 변이체를 포함한다. 일부 실시양태에서, 화물은 ARMM 내로의 화물의 로딩을 용이하게 할 수 있는 최소 ARRDC1의 PPXY (여기서 x는 임의의 아미노산임) 도메인과 회합하는 WW 도메인에 융합된다. 일부 실시양태에서, 화물은 단백질, 핵산, 또는 소분자이다. 일부 실시양태에서, 화물은 Cas9 단백질 또는 Cas9 변이체이다. 일부 실시양태에서 Cas9 단백질 또는 변이체는 융합 단백질이다. 예를 들어, Cas9 단백질 또는 Cas9 변이체는 1개 이상의 WW 도메인에 융합되어 ARMM 내로의 로딩을 용이하게 할 수 있다. 일부 실시양태에서, Cas9 융합 단백질 또는 Cas9 변이체는 1개 이상의 핵 국재화 서열 (NLS)에 융합되어 표적 세포의 핵 내로의 Cas9 융합 단백질의 전위를 용이하게 한다. 특정 실시양태에서 Cas9 변이체는 Cas9의 활성 또는 불활성 DNA 절단 도메인 또는 부분적으로 불활성 DNA 절단 도메인 (예를 들어, Cas9 "니카제"), 및/또는 Cas9의 gRNA 결합 도메인을 포함하는 Cas9 단백질 또는 Cas9 단백질 변이체이다. 관련 기술분야에 공지된 임의의 수의 단백질, 핵산, 또는 소분자는 1개 이상의 WW 도메인에 융합되어 ARMM 내로 로딩될 수 있는 화물을 생성할 수 있고, 예를 들어, 재프로그래밍 인자 (예를 들어, Oct4, Sox2, c-Myc, 또는 KLF4)는 1개 이상의 WW 도메인에 융합되어 ARMM 내로의 1개 이상의 재프로그래밍 인자의 로딩을 용이하게 할 수 있음이 인지되어야 한다. 일부 실시양태에서, 화물 단백질은 1개 이상의 WW 도메인에 융합된 치료 단백질 (예를 들어, 전사 인자, 종양 서프레서, 발달 조절제, 성장 인자, 전이 서프레서, 프로-아폽토시스 단백질, 아연 핑거 뉴클레아제, 또는 리콤비나제)이다. 다른 실시양태에서, ARMM은 ARMM의 방출을 용이하게 하는 비-화물 단백질, 예컨대 TSG101 단백질 또는 그의 변이체를 추가로 포함한다. TSG101 단백질은 ARRDC1과 상호작용하며, 이는 엔도좀으로부터 형질막으로의 TSG101의 재배치를 발생시키고, TSG101, ARRDC1, 및 예를 들어, 화물 단백질, 핵산 (즉, gRNA), 및 소분자를 포함한 다른 세포 성분을 함유하는 미세소포의 방출을 매개한다.

일부 실시양태에서, 최소 ARRDC1 단백질 단편, 및/또는 TSG101 단백질 단편을 포함하는 미세소포, 예를 들어, ARMM이 제공된다. 일부 실시양태에서, 최소 ARRDC1 단백질 단편 및/또는 TSG101 단백질 단편을 포함하는 융합 단백질이 제공된다. 일부 실시양태에서, 최소 ARRDC1 단백질 단편 및/또는 TSG101 단백질 단편을 코딩하는 발현 구축물이 제공된다. 일부 실시양태에서, 최소 ARRDC1 단백질 단편은 C-말단 최소 ARRDC1 단백질 단편이다. 일부 실시양태에서, ARRDC1 단백질 단편은 PSAP (서열식별번호: 122) 모티프 및 최소 ARRCD1 서열의 적어도 10개, 적어도 20개, 적어도 30개, 적어도 40개, 적어도 50개, 적어도 60개, 적어도 70개, 적어도 80개, 적어도 90개, 적어도 100개, 적어도 110개, 적어도 120개, 적어도 130개, 적어도 140개, 적어도 150개, 적어도 160개, 적어도 170개, 적어도 180개, 적어도 190개, 적어도 200개, 적어도 210개, 적어도 220개, 적어도 230개, 적어도 240개, 적어도 250개, 적어도 260개, 적어도 270개, 적어도 280개, 적어도 290개, 또는 적어도 300개의 인접한 아미노산을 포함한다. 일부 실시양태에서, TSG101 단백질 단편은 TSG101 UEV 도메인을 포함한다. 일부 실시양태에서, TSG101 단백질 단편은 UEV 도메인을 포함하고, TSG101 서열의 적어도 150개, 적어도 160개, 적어도 170개, 적어도 180개, 적어도 190개, 적어도 200개, 적어도 210개, 적어도 220개, 적어도 230개, 적어도 240개, 적어도 250개, 적어도 260개, 적어도 270개, 적어도 280개, 적어도 290개, 또는 적어도 300개의 인접한 아미노산을 포함한다.

일부 실시양태에서, 최소 ARRDC1을 포함하는 본 발명 미세소포, 예를 들어, ARMM은 세포 표면 단백질, 예를 들어, 인테그린, 수용체 티로신 키나제, G-단백질 커플링된 수용체, 또는 막-결합된 이뮤노글로불린을 추가로 포함한다. 다른 세포 표면 단백질은 또한 ARMM에 포함될 수 있다. 본 발명의 실시양태와 함께 사용하는데 적합한 인테그린, 수용체 티로신 키나제, G-단백질 커플링된 수용체, 및 막-결합된 이뮤노글로불린은 관련 기술분야의 통상의 기술자에게 명백할 것이며, 본 발명은 이에 관하여 제한되지 않는다. 예를 들어, 일부 실시양태에서, 인테그린은 α1β1, α2β1, α4β1, α5β1, α6β1, αLβ2, αMβ2, αIIbβ3, αVβ3, αVβ5, αVβ6, 또는 α6β4 인테그린이다. 일부 실시양태에서, 수용체 티로신 키나제는 EGF 수용체 (ErbB 패밀리), 인슐린 수용체, PDGF 수용체, FGF 수용체, VEGF 수용체, HGF 수용체, Trk 수용체, Eph 수용체, AXL 수용체, LTK 수용체, TIE 수용체, ROR 수용체, DDR 수용체, RET 수용체, KLG 수용체, RYK 수용체, 또는 MuSK 수용체이다. 일부 실시양태에서, G-단백질 커플링된 수용체는 로돕신-유사 수용체, 세크레틴 수용체, 대사자극성 글루타메이트/페로몬 수용체, 시클릭 AMP 수용체, 프리즐드/스무든드 수용체, CXCR4 수용체, CCR5 수용체, 또는 베타-아드레날린성 수용체이다.

본 발명의 일부 측면은 ARMM이 표적 세포에 의해 흡수되고, ARMM 흡수가 표적 세포의 세포질 내로의 ARMM의 내용물의 방출을 발생시킨다는 인식에 관한 것이다. 본 발명의 일부 측면은 이것이 예를 들어, 표적 세포를 전달되는 작용제를 포함하는 ARMM과 접촉시킴으로써, ARMM에서의 작용제를 표적 세포 또는 표적 세포의 집단에 전달하는데 사용될 수 있다는 인식에 관한 것이다. 따라서, 본 발명의 일부 측면은 작용제, 예를 들어, 재조합 핵산, 재조합 단백질, 또는 합성 소분자를 포함하는 ARMM을 제공한다.

일부 실시양태에서, 작용제는 표적 세포의 바람직한 변화, 예를 들어, 세포 생존, 증식률의 변화, 분화 단계의 변화, 세포 신원의 변화, 염색질 상태의 변화, 1개 이상의 유전자의 전사율의 변화, 전사 프로파일의 변화, 또는 표적 세포의 유전자 압축의 전사후 변화를 실행하는 작용제이다. 전달되는 작용제는 표적 세포에서의 바람직한 효과에 따라 선택될 것임이 관련 기술분야의 통상의 기술자에 의해 이해될 것이다. 예를 들어, 표적 세포의 분화 단계의 변화를 실행하기 위해, 예를 들어, 분화된 표적 세포를 배아 줄기 세포-유사 단계로 재프로그램하기 위해, 세포는 일부 실시양태에서, 재프로그래밍 인자, 예를 들어, Oct4, Sox2, c-Myc, 및/또는 KLF4를 갖는 ARMM과 접촉된다. 유사하게, 표적 세포의 염색질 상태의 변화를 실행하기 위해, 세포는 일부 실시양태에서, 염색질 조정제, 예를 들어, DNA 메틸트랜스퍼라제 또는 히스톤 데아세틸라제를 함유하는 ARMM과 접촉된다. 또 다른 예를 들어, 표적 세포의 생존이 감소되어야 하는 경우, 표적 세포는 일부 실시양태에서, 세포독성제, 예를 들어, 화학치료 약물을 포함하는 ARMM과 접촉된다. ARMM 내로의 포함에 및 표적 세포 또는 표적 세포 집단에의 ARMM-매개된 전달에 적합한 추가의 작용제는 관련 기술분야의 통상의 기술자에게 명백할 것이며, 본 발명은 이에 관하여 제한되지 않는다.

일부 실시양태에서, 작용제는 ARMM을 생산하는 세포를 작용제와 접촉시킴으로써 ARMM에 포함된다. 예를 들어, 작용제가 소분자, 예를 들어 대상체의 신체 내의 표적 세포 집단에 전달되는 치료 약물인 경우, 약물을 함유하는 ARMM은 최소 ARRDC1을 발현하는 세포를 약물을 함유하는 ARMM을 생성하는데 충분한 양으로 및 시간 동안 약물과 접촉시킴으로써 생산된다. 또 다른 예를 들어, 작용제가 핵산 또는 단백질인 경우, 핵산 또는 단백질을 함유하는 ARMM은 예를 들어, 재조합 발현 구축물로부터 최소 ARRDC1 및 TSG101을 발현하는 세포에서 핵산 또는 단백질을 발현시킴으로써 생산된다.

일부 실시양태에서, 작용제는 최소 ARRDC1 단백질, 최소 ARRDC1 단편, TSG101 단백질, 또는 TSG101 단편에 접합된다. 일부 실시양태에서, 작용제가 단백질인 경우, 단백질은 단백질 작용제를 ARRDC1 단백질, ARRDC1 단편, TSG101 단백질, 또는 TSG101 단편과의 융합물로서 발현시킴으로써, ARRDC 단백질, 최소 ARRDC1 단편, TSG101 단백질, 또는 TSG101 단편에 접합될 수 있다.

일부 실시양태에서, 재조합 또는 합성 핵산을 포함하는 최소 ARRDC1을 포함하는 ARMM이 제공된다. 이러한 ARMM은 재조합 또는 합성 핵산을 표적 세포 또는 표적 세포 집단에 전달하는데 사용될 수 있다. 일부 실시양태에서, 재조합 핵산은 RNA, 예를 들어, 단백질을 코딩하는 RNA (예를 들어, mRNA), 또는 비-코딩 RNA를 포함한다. 일부 실시양태에서, 핵산은 RNAi 작용제, 예를 들어, 안티센스 RNA, 작은 간섭 RNA (siRNA), 작은 헤어핀 RNA (shRNA), 마이크로RNA (miRNA), 작은 핵 RNA (snRNA), 작은 핵소체 RNA (snoRNA), 또는 긴 유전자간 비-코딩 RNA (lincRNA), 또는 그의 전구체를 포함한다. 일부 실시양태에서, 재조합 구조적 RNA, 리보자임, 또는 그의 전구체를 포함하는 ARMM이 제공된다.

코딩 RNA, RNAi 작용제, 구조적 RNA, 및 리보자임, 뿐만 아니라 그의 전구체는 관련 기술분야의 통상의 기술자에게 널리 공지되어 있으며, 본 발명의 측면에 따른 적합한 RNA 및 RNAi 작용제는 통상의 기술자에게 명백할 것이다. 본 발명은 이에 관하여 제한되지 않음이 인지될 것이다. RNA를 포함하는 ARMM은 표적 세포의 유전자 조작에 대한 필요 없이 표적 세포에서 RNA 기능을 발현시키는데 사용될 수 있다. 예를 들어, 단백질-코딩 핵산을 포함하는 ARMM은 표적 세포 또는 세포 집단을 유전자 조작할 필요 없이 ARMM 흡수 시 표적 세포 또는 세포 집단에서 코딩된 단백질을 발현시키는데 사용될 수 있다. 또 다른 예를 들어, RNAi 작용제를 포함하는 ARMM은 유전자 보정된 청구항 부분 세포 또는 세포 집단에 대한 필요 없이 표적 세포 또는 표적 세포 집단에서 관심의 유전자를 넉 다운시키는데 사용될 수 있다. 세번째 예를 들어, 리보자임을 포함하는 ARMM은 유전자 조작에 대한 필요 없이 표적 핵산의 발현을 조정하거나, 표적 mRNA 및 표적 세포를 편집하는데 사용될 수 있다.

일부 실시양태에서, DNA, 예를 들어, 발현 구축물, LINE 서열, SINE 서열, 복합 SINE 서열, 또는 LTR-레트로트랜스포존 서열을 포함하는 벡터를 포함하는 최소 ARRDC1을 포함하는 ARMM이 제공된다. DNA를 함유하는 ARMM은 세포로부터 세포로의 유전자 또는 DNA 요소의 전달, 또는, 일부 실시양태에서, 대상체에서 표적 세포 또는 표적 세포 유형, 예를 들어 병리학적 표적 세포 유형 내로의 유전자 또는 DNA 요소의 표적화된 삽입을 허용한다. 일부 실시양태에서, 단백질을 코딩하는 DNA를 포함하는 ARMM이 제공된다. 일부 실시양태에서, 비-코딩 RNA, 예를 들어, 안티센스 RNA, 작은 간섭 RNA (siRNA), 작은 헤어핀 RNA (shRNA), 마이크로RNA (miRNA), 작은 핵 RNA (snRNA), 작은 핵소체 RNA (snoRNA), 또는 긴 유전자간 비-코딩 RNA (lincRNA), 또는 그의 전구체를 코딩하는 DNA를 포함하는 ARMM이 제공된다. 일부 실시양태에서, DNA를 함유하는 ARMM의 사용은 단백질 또는 RNA의 직접적 전달과 비교하여 코딩된 단백질 또는 RNA의 보다 높은 수준의 발현 또는 보다 지속된 발현이 표적 세포에서 달성될 수 있다는 이점을 갖는다. 일부 실시양태에서, ARMM에 포함되는 DNA는 코딩된 단백질 또는 RNA의 징집을 제어하는 세포 유형 특이적 프로모터를 포함한다. 세포 유형 특이적 프로모터의 사용은 단백질의 표적화된 발현이 ARMM-전달된 DNA에 의해 코딩되는 RNA였음을 허용하며, 이는 예를 들어 일부 치료 실시양태에서, 표적화되지 않지만 ARMM을 흡수할 수 있는 하위집단에 대한 효과를 최소화하는데 사용될 수 있다.

일부 실시양태에서, 검출가능한 표지를 포함하는 최소 ARRDC1을 포함하는 ARMM이 제공된다. 이러한 ARMM은 유전자 조작 없이 표적 세포의 표지화를 허용한다. 표적 세포에의 직접적 전달에 적함한 검출가능한 표지는 관련 기술분야에 공지되어 있으며, 형광 단백질, 형광 염료, 막-결합된 염료, 및 효소, 예를 들어, 검출가능한 반응 산물을 발생시키는 반응을 촉매하는 막-결합된 효소를 포함하나 이에 제한되지는 않는다. 본 발명의 일부 측면에 따른 적합한 검출가능한 표지는 통상적으로 이용가능한 항체 또는 항원 결합제로 검출될 수 있는 막-결합된 항원, 예를 들어, 막-결합된 리간드를 추가로 포함한다.

일부 실시양태에서, 치료제를 포함하는 ARMM이 제공된다. ARMM을 쉐딩하는 세포 내로 도입될 수 있는 또는 합성 ARMM 내로 패키징될 수 있는 임의의 치료제는 본 발명의 일부 측면에 따른 ARMM 내로의 포함에 적합함이 인지될 것이다. 적합한 치료제는 또한 소분자로 지칭되는 작은 유기 분자, 또는 작은 화합물, 및 생물제제, 예를 들어, 치료 단백질, 또는 단백질 단편을 포함하나 이에 제한되지는 않는다. ARMM에서의 포함에 적합한 치료제의 일부 비-제한적 예는 항박테리아제, 항진균 항생제, 항미오박테리아제, 뉴라미니다제 억제제, 항신생물제, 세포독성제, 콜린성 작용제, 부교감신경흥분모방제, 항콜린성 작용제, 항우울제, 항정신병제, 호흡 및 뇌 자극제, 양성자 펌프 억제제, 호르몬 및 합성 치환체, 수용체 리간드, 키나제 억제제, 화학치료제, 신호전달 분자, 키나제, 포스파타제, 프로테아제, RNA 편집 효소, 뉴클레아제, 및 아연 핑거 단백질을 포함한다.

일부 실시양태에서, 표적 세포에 전달되는 단백질을 포함하는 ARMM이 제공된다. 일부 실시양태에서, 단백질은 전사 인자, 전사 억제제, 형광 단백질, 키나제, 포스파타제, 프로테아제, 리가제, 염색질 조정제, 또는 리콤비나제이거나 이를 포함한다. 일부 실시양태에서, 단백질은 치료 단백질이다. 일부 실시양태에서 단백질은 표적 세포의 상태 또는 신원의 변화를 실행하는 단백질이다. 예를 들어, 일부 실시양태에서, 단백질은 재프로그래밍 인자이다. 적합한 전사 인자, 전사 억제제, 형광 단백질, 키나제, 포스파타제, 프로테아제, 리가제, 염색질 조정제, 리콤비나제, 및 재프로그래밍 인자는 관련 기술분야의 통상의 기술자에게 공지되어 있으며, 본 발명은 이에 관하여 제한되지 않는다.

일부 실시양태에서, 최소 ARRDC1 단백질 또는 그의 단편, 또는 TSG101 단백질 또는 그의 단편에 공유 또는 비-공유 결합되거나, 접합된 작용제, 예를 들어, 소분자, 핵산, 또는 단백질을 포함하는 ARMM이 제공된다. 일부 실시양태에서, 작용제는 링커를 통해 최소 ARRDC1 단백질 또는 그의 단편, 또는 TSG101 단백질 또는 그의 단편에 접합된다. 링커는 절단가능하거나 또는 비절단가능할 수 있다. 일부 실시양태에서, 링커는 아미드, 에스테르, 에테르, 탄소-탄소, 또는 디술피드 결합을 포함하지만, 화학 기술분야에서의 임의의 공유 결합이 사용될 수 있다. 일부 실시양태에서, 링커는 그의 절단이 전달되는 펩티드 또는 단백질로부터의 초하전된 단백질의 분리를 발생시키는 불안정성 결합을 포함한다. 일부 실시양태에서, 링커는 표적 세포에서 발견되는 조건 (예를 들어, 특이적 pH, 환원 환경, 또는 세포성 효소의 존재) 하에서 절단된다. 일부 실시양태에서, 링커는 효소, 예를 들어, 세포성 효소에 의해 절단된다. 일부 실시양태에서, 효소는 세포성 프로테아제 또는 세포성 에스테라제이다. 일부 실시양태에서, 세포성 프로테아제는 세포질 프로테아제, 엔도좀 프로테아제, 또는 엔도좀 에스테라제이다. 일부 실시양태에서, 세포성 효소는 표적 세포 또는 세포 유형에서 특이적으로 발현되어, 표적 세포 또는 세포 유형에서의 기능적 단백질 또는 펩티드의 우선적 또는 특이적 방출을 발생시킨다. 프로테아제의 표적 서열은 전달되는 작용제 및 최소 ARRDC1 단백질 또는 TSG101 단백질 또는 그의 단편 사이의 링커 내로 조작될 수 있다. 일부 실시양태에서, 표적 세포 또는 세포 유형은 암 세포 또는 암 세포 유형, 면역계의 세포 또는 세포 유형, 또는 병리학적 또는 질환에 걸린 세포 또는 세포 유형이고, 링커는 효소에 의해 또는 표적 세포에 대해 특이적인 특징에 기반하여 절단된다. 일부 실시양태에서, 링커는 AGVF (서열식별번호: 114), GFLG (서열식별번호: 117), FK, AL, ALAL (서열식별번호: 118), 또는 ALALA (서열식별번호: 119)를 포함하는 군으로부터 선택되는 아미노산 서열을 포함한다. 다른 적합한 링커는 관련 기술분야의 통상의 기술자에게 명백할 것이다. 일부 실시양태에서, 링커는 절단가능한 링커이다. 일부 실시양태에서, 링커는 프로테아제 인식 부위를 포함한다. 특정 실시양태에서, 링커는 UV-절단가능한 모이어티이다. 적합한 링커, 예를 들어, 프로테아제 인식 부위를 포함하는 링커, 또는 UV 절단가능한 모이어티를 포함하는 링커는 관련 기술분야의 통상의 기술자에게 공지되어 있다. 일부 실시양태에서, 작용제는 소르타제 반응을 통해 최소 ARRDC1 단백질 또는 그의 단편에 접합되고, 링커는 LPXTG (서열식별번호: 120) 모티프를 포함한다. 본 발명의 일부 측면에 따른 작용제를 단백질에 접합시키기 위한 방법 및 시약은 관련 기술분야의 통상의 기술자에게 공지되어 있다. 따라서, ARMM에 포함되는 작용제를 최소 ARRDC1 단백질 또는 그의 단편, 또는 TSG101 단백질 또는 그의 단편에 접합시키는 적합한 방법은 본 개시내용에 기반하여 관련 기술분야의 통상의 기술자에게 명백할 것이다.

ARMM을 단리하는 방법이 또한 본원에서 제공된다. 한 예시적인 방법은 미세소포-생산 세포를 포함하는 세포 배양물의 배양 배지, 또는 상청액을 수집하는 것을 포함한다. 일부 실시양태에서, 세포 배양물은 대상체로부터 얻어진 세포, 예를 들어, 병리학적 표현형, 예를 들어, 과다증식성 표현형을 나타낼 것으로 의심되는 세포를 포함한다. 일부 실시양태에서, 세포 배양물은 ARMM을 생산하는 유전자 조작된 세포, 예를 들어, 재조합 ARMM 단백질, 예를 들어, 재조합 최소 ARRDC1 또는 TSG101 단백질, 예컨대 최소 ARRDC1 또는 TSG101 융합 단백질을 발현하는 세포를 포함한다. 일부 실시양태에서, 상청액은 원심분리에 의해, 예를 들어, 증가하는 G 값 (예를 들어, 500G 및 2000G)의 2회의 연속적 원심분리에 의해 세포 데브리스가 사전-청소된다. 일부 실시양태에서, 방법은 상청액을 0.2 μm 필터를 통해 통과시키고, 세포 데브리스의 모든 큰 조각 및 전체 세포를 제거하는 것을 포함한다. 일부 실시양태에서, 상청액은 원심분리물의 부피에 따라, 예를 들어, 120,000g에서 2시간 동안 초원심분리로 처리된다. 얻어진 펠릿은 미세소포를 포함한다. 일부 실시양태에서, 엑소좀은 본원에 기재된 바와 같은 엑소좀 마커를 사용한 염색 및/또는 분류에 의해 (예를 들어, FACS 또는 MACS에 의해) 미세소포 펠릿으로부터 고갈된다. 단리된 또는 풍부화된 ARMM은 본원에 기재된 바와 같이 배양 배지 또는 적합한 완충제에 현탁될 수 있다.

WW 도메인 함유 화물

본 개시내용의 측면은 적어도 1개의 WW 도메인과 회합된 화물을 포함하는 ARMM에 관한 것이다. 일부 측면에서, 적어도 1개의 WW 도메인을 갖는 화물 단백질을 포함하는 융합 단백질이 제공된다. 일부 측면에서, 적어도 1개의 WW 도메인과 회합된 화물 단백질을 코딩하는 발현 구축물이 제공된다. 화물 단백질의 WW 도메인은 ARRDC1, 또는 그의 변이체의 PPXY 모티프와 회합하여 ARMM 내로의 화물 단백질과의 회합 또는 그의 포함을 용이하게 할 수 있다. ARRDC1의 PPXY 모티프와 회합하는 WW 도메인에 융합된 Cas9 화물 단백질의 개략적 제시는 도 2에서 볼 수 있다. 일부 실시양태에서, 화물 단백질은 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 또는 그 초과의 WW 도메인에 융합된다. WW 도메인은 유비퀴틴 리가제 WWP1, WWP2, Nedd4-1, Nedd4-2, Smurf1, Smurf2, ITCH, NEDL1, 또는 NEDL2의 WW 도메인으로부터 유래될 수 있다 (도 1). 예를 들어, WW 도메인은 (서열식별번호: 6); (서열식별번호: 7); (서열식별번호: 8); (서열식별번호: 9); (서열식별번호: 10); (서열식별번호: 11); (서열식별번호: 12); (서열식별번호: 13); 또는 (서열식별번호: 14)에 제시된 아미노산 서열로부터의 WW 도메인 또는 WW 도메인 변이체를 포함할 수 있다. 특정 실시양태에서, 화물 단백질은 하기 아미노산 서열을 갖는 인간 ITCH 단백질로부터의 2개의 WW 도메인 또는 WW 도메인 변이체를 포함할 수 있다:

다른 실시양태에서, 화물 단백질은 하기 아미노산 서열을 갖는 인간 ITCH 단백질로부터의 4개의 WW 도메인 또는 WW 도메인 변이체를 포함할 수 있다:

적어도 1개의 WW 도메인 또는 WW 도메인 변이체에 융합된 본원에 기재된 화물 단백질은 비-천연 발생이며, 즉, 이들은 자연에 존재하지 않는다.

일부 실시양태에서, 1개 이상의 WW 도메인은 화물 단백질의 N-말단에 융합될 수 있다. 다른 실시양태에서, 1개 이상의 WW 도메인은 화물 단백질의 C-말단 또는 N-말단에 융합될 수 있다. 추가의 다른 실시양태에서, 1개 이상의 WW 도메인은 화물 단백질 내로 삽입될 수 있다. WW 도메인은 관련 기술분야의 통상의 기술자에게 공지된 방법에 의해 시험될 수 있는, 화물 단백질의 기능을 유지하는 임의의 수의 방식으로 배치될 수 있음이 인지되어야 한다.

본 발명 미세소포의 화물 단백질은 적어도 1개의 WW 도메인을 포함하는 단백질일 수 있다. 예를 들어, 화물 단백질은 WW 도메인 함유 단백질 또는 적어도 1개의 WW 도메인에 융합된 단백질일 수 있다. 일부 실시양태에서, 화물 단백질은 적어도 1개의 WW 도메인에 융합된 Cas9 단백질 또는 Cas9 변이체일 수 있다. 일부 실시양태에서, 화물 단백질은 재조합 화물 단백질일 수 있다. 예를 들어 재조합 화물 단백질은 적어도 1개의 핵 국재화 서열 (NLS)에 융합된 Cas9 단백질, 또는 Cas9 변이체일 수 있다. 본원에 지칭된 NLS는 핵 수송에 의해 세포 핵 내로의 단백질의 이입을 용이하게 하는 아미노산 서열이다. 일부 실시양태에서, NLS는 Cas9 단백질, 또는 Cas9 변이체의 N-말단에 융합된다. 일부 실시양태에서, NLS는 Cas9 단백질, 또는 Cas9 변이체의 C-말단에 융합된다. 일부 실시양태에서, Cas9는 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 또는 그 초과의 핵 국재화 서열 (NLS)에 융합된다. 특정 실시양태에서, 하나의 NLS는 N-말단에 융합되고, 하나의 NLS는 Cas9 단백질의 C-말단에 융합되어 재조합 NLS:Cas9:NLS 융합 단백질을 생성한다. 특정 실시양태에서, 적어도 1개의 NLS에 융합된 Cas9 단백질, 또는 Cas9 변이체는 또한 적어도 1개의 WW 도메인에 융합될 수 있다. 상기 기재된 바와 같이, WW 도메인은 Cas9 단백질 또는 Cas9 변이체가 표적 세포에의 전달을 위해 ARMM 내로 로딩되고, 표적 세포의 핵 내로 전위되어 그의 뉴클레아제 기능을 수행할 수 있도록 하는 임의의 수의 방식으로 배치될 수 있음이 인지되어야 한다. 특정 실시양태에서, 1개 이상의 WW 도메인은 재조합 NLS:Cas9:NLS 융합 단백질의 N-말단에 융합된다. 특정 실시양태에서, 1개 이상의 WW 도메인은 재조합 NLS:Cas9:NLS 융합 단백질의 C-말단에 융합된다. 특정 실시양태에서, 화물 단백질은 서열 (서열식별번호: 109) 또는 (서열식별번호: 110)을 포함한다. 특정 실시양태에서, 화물 단백질은 서열 (서열식별번호: 109) 또는 (서열식별번호: 110)으로 이루어진다. 특정 실시양태에서, 화물 단백질은 (서열식별번호: 109) 또는 (서열식별번호: 110)으로 본질적으로 이루어진다.

하기 아미노산 서열은 pX330 플라스미드 (애드진(Addgene))의 AgeI 부위 내로 클로닝된 2개의 WW 도메인 (서열식별번호: 109) 또는 4개의 WW 도메인 (서열식별번호: 110) 중 어느 하나를 갖는 예시적인 Cas9 화물 단백질 서열이다.

본원에 기재된 미세소포는 핵산을 추가로 포함할 수 있다. 일부 실시양태에서, 미세소포는 예를 들어, 뉴클레아제 또는 니카제와 회합될 수 있는 적어도 1개의 가이드 RNA (gRNA)를 포함할 수 있다. 한 예로서, gRNA는 Cas9 화물 단백질 또는 Cas9 변이체 화물 단백질과 회합될 수 있다. gRNA는 표적 부위를 보완하는 뉴클레오티드 서열을 포함할 수 있으며, 이는 상기 표적 부위에의 뉴클레아제/RNA 복합체의 결합을 매개하고, 뉴클레아제:RNA 복합체의 서열 특이성을 제공한다. 특정 실시양태에서, gRNA는 관련 기술분야에 공지된 임의의 표적에 상보적인 뉴클레오티드 서열을 포함한다. 예를 들어, gRNA는 치료 표적 (예를 들어, APOC3, 알파 1 안티트립신, HBV, 또는 HIV)에 상보적인 뉴클레오티드 서열을 포함할 수 있다. 특정 실시양태에서 gRNA는 증진된 녹색 형광 단백질 (EGFP)에 상보적인 서열을 포함한다. 예를 들어, gRNA 서열은 서열식별번호: 113에 제시된 핵산 서열에 의해 코딩될 수 있다.

하기는 EGFP를 표적화하는 가이드 RNA (gRNA)를 코딩하는 예시적인 핵산 서열이다. EGFP 표적 서열은 하기에서 밑줄친다.

TSG101

특정 실시양태에서, 본 발명 미세소포는 TSG101을 추가로 포함한다. 또한 본원에서 TSG101로 지칭되는 종양 감수성 유전자 101은 유비퀴틴-접합 효소의 명백하게 불활성인 동족체의 군에 속하는 이 유전자에 의해 코딩되는 단백질이다. 단백질은 종양형성에 연루된 시토졸 인단백질인 스타트민과 상호작용하는 코일화-코일 도메인을 함유한다. TSG101은 UEV 도메인을 포함하는 단백질이며, ARRDC1과 상호작용한다. 예시적인 비-제한적 TSG101 단백질 서열은 본원에 제공되며, 본 발명의 측면에 따른 추가의 적합한 TSG101 단백질 서열, 이소형, 및 변이체는 관련 기술분야에 공지되어 있다. 본 발명은 이에 관하여 제한되지 않음이 관련 기술분야의 통상의 기술자에 의해 인지될 것이다. 예시적인 TSG101 서열은 하기를 포함한다:

>gi|5454140|ref|NP_006283.1| 종양 감수성 유전자 101 단백질 [호모 사피엔스]

>gi|11230780|ref|NP_068684.1| 종양 감수성 유전자 101 단백질 [무스 무스쿨루스]

>gi|48374087|ref|NP_853659.2| 종양 감수성 유전자 101 단백질 [라투스 노르베기쿠스]

이들 서열에서의 UEV 도메인은 아미노산 1-145 (상기 서열에서 밑줄침)를 포함한다. UEV 도메인의 구조는 관련 기술분야의 통상의 기술자에게 공지되어 있다 (예를 들어, 그의 전체 내용이 본원에 참조로 포함되는 문헌 [Owen Pornillos et al., Structure and functional interactions of the Tsg101 UEV domain, EMBO J. 2002 May 15; 21(10): 2397-2406] 참조).

최소 ARRDC1에 융합된 Cas9 화물 단백질

일부 측면에서, Cas9 단백질 또는 Cas9 변이체에 융합된 최소 ARRDC1 단백질, 또는 그의 변이체를 포함하는 미세소포, 예를 들어, ARMM이 제공된다. 일부 측면에서, Cas9 단백질에 융합된 최소 ARRDC1 단백질, 또는 그의 변이체 및/또는 Cas9 단백질에 융합된 TSG101 단백질, 또는 그의 변이체를 포함하는 융합 단백질이 제공된다. 일부 측면에서, Cas9 화물 단백질에 융합된 최소 ARRDC1 단백질, 또는 그의 변이체 및/또는 Cas9 화물 단백질에 융합된 TSG101 단백질, 또는 그의 변이체를 코딩하는 발현 구축물이 제공된다. 일부 실시양태에서, 최소 ARRDC1 단백질 변이체는 C-말단 최소 ARRDC1 단백질 변이체이다. 일부 실시양태에서, TSG101 단백질 변이체는 TSG101 UEV 도메인을 포함한다. 일부 실시양태에서, TSG101 단백질 변이체는 UEV 도메인을 포함하고, TSG101 서열의 적어도 150개, 적어도 160개, 적어도 170개, 적어도 180개, 적어도 190개, 적어도 200개, 적어도 210개, 적어도 220개, 적어도 230개, 적어도 240개, 적어도 250개, 적어도 260개, 적어도 270개, 적어도 280개, 적어도 290개, 또는 적어도 300개의 인접한 아미노산을 포함한다.

본 발명의 일부 측면은 최소 ARRDC1 단백질 또는 그의 변이체, 및 최소 ARRDC1 단백질 또는 그의 변이체와 회합된 엔도뉴클레아제 (예를 들어, Cas9 단백질, 또는 Cas9 변이체)를 포함하는 ARRDC1 융합 단백질을 제공한다. 일부 실시양태에서 엔도뉴클레아제는 최소 ARRDC1 단백질, 또는 그의 변이체에 공유 연결된다. 엔도뉴클레아제는 예를 들어, 최소 ARRDC1 단백질의 N-말단, C-말단에 공유 연결되거나, 또는 그의 아미노산 서열 내에 있을 수 있다.

특정 실시양태에서, 엔도뉴클레아제 (예를 들어, Cas9 단백질 또는 Cas9 변이체)는 최소 ARRDC1 단백질 또는 단백질 변이체의 C-말단에, 또는 TSG101 단백질 또는 단백질 변이체의 C-말단에 융합된다. Cas9 단백질 또는 Cas9 변이체는 또한 최소 ARRDC1 단백질 또는 단백질 변이체의 N 말단에, 또는 TSG101 단백질 또는 단백질 변이체의 N 말단에 융합될 수 있다. 일부 실시양태에서, Cas9 단백질 또는 Cas9 변이체는 최소 ARRDC1 또는 TSG101 단백질 또는 그의 변이체 내에 있을 수 있다.

특정 실시양태에서, Cas9 단백질은 공유 결합을 통해 최소 ARRDC1 단백질, 최소 ARRDC1 변이체, TSG101 단백질, 또는 TSG101 변이체와 회합된다. 일부 실시양태에서, Cas9 단백질은 링커를 통해 최소 ARRDC1 단백질, 최소 ARRDC1 단백질 변이체, TSG101 단백질, 또는 TSG101 단백질 변이체와 회합된다. 일부 실시양태에서, 링커는 절단가능한 링커이며, 예를 들어, 링커는 프로테아제 인식 부위를 함유할 수 있다. 링커의 프로테아제 인식 부위는 표적 세포에서 발현되는 프로테아제에 의해 인식되어, ARMM의 흡수 시 표적 세포의 세포질 내로 방출되는 최소 ARRDC1 단백질 또는 그의 변이체 또는 TSG101 단백질 또는 그의 변이체에 융합된 Cas9 단백질을 발생시킬 수 있다. 관련 기술분야의 통상의 기술자는 임의의 수의 링커가 Cas9 단백질 또는 Cas9 변이체를 최소 ARRDC1 단백질 또는 그의 변이체 또는 TSG101 단백질 또는 그의 변이체에 융합시키는데 사용될 수 있음을 인지할 것이다.

최소 ARRDC1 단백질, 최소 ARRDC1 단백질 변이체, TSG101 단백질, 또는 TSG101 단백질 변이체와 회합된 Cas9 단백질 또는 Cas9 변이체는 핵 국재화 서열 (NLS)을 추가로 포함할 수 있다. 일부 실시양태에서, Cas9 융합 단백질은 적어도 1개의 NLS에 융합된다. 일부 실시양태에서, 1개 이상의 핵 국재화 서열 (NLS)은 Cas9의 N-말단에 융합된다. 일부 실시양태에서, 1개 이상의 NLS는 Cas9의 C-말단에 융합된다. 일부 실시양태에서, Cas9는 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 또는 그 초과의 NLS에 융합된다. 1개 이상의 NLS는 Cas9에 융합되어 표적 세포의 핵 내로의 Cas9 융합 단백질의 전위를 허용할 수 있음이 인지되어야 한다. 일부 실시양태에서, 적어도 1개의 NLS에 융합된 Cas9 단백질은 링커를 통해 ARRDC1, 최소 ARRDC1 단백질 변이체, TSG101 단백질, 또는 TSG101 단백질 변이체와 회합된다. 일부 실시양태에서, 링커는 프로테아제 인식 부위를 함유한다. 다른 실시양태에서, 링커는 UV-절단가능한 모이어티를 함유한다. 일부 실시양태에서, 프로테아제 인식 부위는 표적 세포에서 발현되는 프로테아제에 의해 인식되어, 최소 ARRDC1 단백질 또는 그의 변이체 또는 TSG101 단백질 또는 그의 변이체로부터 세포질 내로 방출되는 적어도 1개의 NLS에 융합된 Cas9 단백질을 발생시키고, 여 기서 이는 ARMM의 흡수 시 핵 내로 전위될 수 있다.

RNA 결합 단백질

본 개시내용의 일부 측면은 RNA에 결합하는 단백질에 관한 것이다. 일부 실시양태에서, RNA 결합 단백질은 RNA, 예를 들어, 특이적 서열 또는 구조를 갖는 RNA에 결합하는 천연-발생 단백질, 또는 그의 비-천연-발생 변이체, 또는 비-천연 발생 단백질이다.

특정 실시양태에서, RNA 결합 단백질은 전사-활성화 반응 요소 (TAR 요소)에 특이적으로 결합하는 전사의 전사-활성화제 (Tat) 단백질이다. 예시적인 Tat 단백질은 서열식별번호: 65에 제시된 바와 같은 아미노산 서열을 포함한다 (표 1). TAR 요소에 결합하는 Tat 단백질, 뿐만 아니라 Tat 단백질 단편의 예시적인 아미노산 서열은 표 1에 제시된다. 일부 실시양태에서, RNA 결합 단백질은 서열식별번호: 65 내지 84 중 어느 하나의 아미노산 서열과 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 또는 99% 동일하고, TAR 요소에 결합한다. 일부 실시양태에서, RNA 결합 단백질은 서열식별번호: 65 내지 84 중 어느 하나의 적어도 10개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 35개, 적어도 40개, 적어도 45개, 적어도 50개, 적어도 55개, 적어도 60개, 적어도 65개, 적어도 70개, 적어도 75개, 적어도 80개, 적어도 85개, 적어도 90개, 적어도 95개, 적어도 100개, 적어도 105개, 적어도 110개, 적어도 115개, 적어도 120개, 적어도 125개, 또는 적어도 130개의 동일한 인접한 아미노산을 갖고, TAR 요소에 결합한다. 일부 실시양태에서, RNA 결합 단백질은 서열식별번호: 65 내지 84에 제시된 아미노산 서열 중 어느 하나에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50개 또는 그 초과의 돌연변이를 갖고, TAR 요소에 결합한다. 일부 실시양태에서, RNA 결합 단백질은 서열식별번호: 65 내지 84에 제시된 아미노산 서열 중 어느 하나를 포함한다. 일부 실시양태에서, Tat 단백질은 서열식별번호: 65 내지 84 중 어느 하나에 제시된 바와 같은 아미노산 서열을 포함한다. RNA 결합 단백질은 또한 TAR 요소와 회합할 수 있는 Tat 단백질의 변이체일 수 있다. TAR 요소에 결합하는 Tat 단백질, 뿐만 아니라 Tat 단백질의 변이체는 관련 기술분야에 공지되어 있으며, 예를 들어, 문헌 [Kamine et al., "Mapping of HIV-1 Tat Protein Sequences Required for Binding to Tar RNA", Virology 182, 570-577 (1991)]; 및 [Patel, "Adaptive recognition in RNA complexes with peptides and protein modules" Curr Opin Struct Biol. 1999 Feb;9(1):74-87]에 이전에 기재되었으며; 그의 각각의 전체 내용은 본원에 참조로 포함된다. 일부 실시양태에서, Tat 단백질은 HIV-1 Tat 단백질, 또는 그의 변이체이다. 일부 실시양태에서, Tat 단백질은 소 면역결핍 바이러스 (BIV) Tat 단백질, 또는 그의 변이체이다.

Tat 단백질은 LTR 프로모터로부터의 바이러스 전사 및 복제에 필수적인 바이러스 유전자 발현의 핵 전사 활성화제이며; 이는 세포 전사 기구의 성분을 바이러스 RNA에 지정하여 RNA 폴리머라제 II (RNA pol II) 복합체에 의한 진행적 전사 신장을 촉진시킴으로써, 전장 전사체의 수준을 증가시키는 서열-특이적 분자 어댑터로서 작용한다. Tat는 CCNT1-독립적 방식으로 전사활성화 반응성 RNA 요소 (TAR RNA)로 지칭되는 모든 발생기 바이러스 mRNA의 5'-단부에서 헤어핀 구조에 결합한다.

Tat 단백질은 몇몇 도메인으로 이루어지며, 하나는 핵 국재화에 중요한 짧은 리신 및 아르기닌 풍부 영역이다. HIV-1 Tat의 9 아미노산 염기성 영역은 서열식별번호: 65의 위치 49 내지 57에서 발견되고, TAR 요소에 결합할 수 있다. 일부 실시양태에서, Tat 서열은 Tat (서열식별번호: 73)의 9 아미노산 염기성 영역을 포함한다. 일부 실시양태에서 RNA 결합 단백질은 서열식별번호: 65 내지 67, 69, 70, 또는 73 내지 84에 제시된 바와 같은 아미노산 서열 중 어느 하나를 포함한다. 일부 실시양태에서, Tat 단백질은 융합 단백질이다.

표 1. Tat 서열

일부 실시양태에서, RNA 결합 단백질은 Rev 반응 요소 (RRE)에 결합하는 비리온 발현 (Rev) 단백질 (예를 들어, HIV-1로부터의 Rev), 또는 그의 변이체의 조절제이다. Rev 단백질은 관련 기술분야에 공지되어 있으며, 통상의 기술자에게 공지되어 있다. 예를 들어, Rev 단백질은 문헌 [Fernandes et al., "The HIV-1 Rev response element: An RNA scaffold that directs the cooperative assembly of a homo-oligomeric ribonucleoprotein complex" RNA Biology 9:1, 6-11; January 2012]; [Cochrane et al., "The human immunodeficiency virus Rev protein is a nuclear phosphoprotein" Virology 171 (1):264-266, 1989]; [Grate et al., "Role REVersal: understanding how RRE RNA binds its peptide ligand" Structure. 1997 Jan 15;5(1):7-11]; 및 [Patel, "Adaptive recognition in RNA complexes with peptides and protein modules" Curr Opin Struct Biol. 1999 Feb;9(1):74-87]에 기재되었으며; 그의 각각의 전체 내용은 그 전문이 본원에 참조로 포함된다. 예시적인 Rev 단백질은 서열식별번호: 93 내지 95 (표 3)에 제시된 바와 같은 아미노산 서열을 포함한다. 일부 실시양태에서, RNA 결합 단백질은 서열식별번호: 93 내지 95 중 어느 하나의 아미노산 서열과 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 또는 99% 동일하고, Rev 반응 요소에 결합한다. 일부 실시양태에서, RNA 결합 단백질은 서열식별번호: 93 내지 95 중 어느 하나의 적어도 10개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 35개, 적어도 40개, 적어도 45개, 적어도 50개, 적어도 55개, 적어도 60개, 적어도 65개, 적어도 70개, 적어도 75개, 적어도 80개, 적어도 85개, 적어도 90개, 적어도 95개, 적어도 100개, 적어도 105개, 적어도 110개, 또는 적어도 115개의 동일한 인접한 아미노산을 갖고, Rev 반응 요소에 결합한다. 일부 실시양태에서, RNA 결합 단백질은 서열식별번호: 93 내지 95에 제시된 아미노산 서열 중 어느 하나에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50개 또는 그 초과의 돌연변이를 갖고, Rev 반응 요소에 결합한다. 일부 실시양태에서, RNA 결합 단백질은 서열식별번호: 93 내지 95에 제시된 아미노산 서열 중 어느 하나를 포함한다. 일부 실시양태에서, RNA 결합 단백질은 RRE에 결합할 수 있는 서열식별번호: 93 내지 95에 제시된 바와 같은 아미노산 서열 중 어느 하나의 변이체를 포함한다. 이러한 변이체는 본 개시내용 및 관련 기술분야의 지식에 기반하여 통상의 기술자에게 명백할 것이고, 관련 기술분야에 공지된 통상적인 방법을 사용하여 (예를 들어 RRE에의 결합에 대해) 시험될 수 있다.

일부 실시양태에서, RNA 결합 단백질은 MS2 RNA에 특이적으로 결합하는 MS2 박테리오파지의 코트 단백질이다. MS2 RNA에 특이적으로 결합하는 MS2 박테리오파지 코트 단백질은 관련 기술분야에 공지되어 있다. 예를 들어 MS2 파지 코트 단백질은 문헌 [Parrott et al., "RNA aptamers for the MS2 bacteriophage coat protein and the wild-type RNA operator have similar solution behavior" Nucl. Acids Res. 28(2):489-497 (2000)]; [Keryer-Bibens et al., "Tethering of proteins to RNAs by bacteriophage proteins" Biol. Cell. 100(2): 125-38 (2008)]; 및 [Patel, "Adaptive recognition in RNA complexes with peptides and protein modules" Curr Opin Struct Biol. 1999 Feb;9(1):74-87]에 기재되었으며; 각각의 전체 내용은 그 전문이 본원에 참조로 포함된다. 예시적인 MS2 파지 코트 단백질은 서열식별번호: 99에 제시된 바와 같은 아미노산 서열을 포함한다 (표 4). 일부 실시양태에서, RNA 결합 단백질은 서열식별번호: 99의 아미노산 서열과 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 또는 99% 동일하고, MS2 RNA에 결합한다. 일부 실시양태에서, RNA 결합 단백질은 서열식별번호: 99의 적어도 10개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 35개, 적어도 40개, 적어도 45개, 적어도 50개, 적어도 55개, 적어도 60개, 적어도 65개, 적어도 70개, 적어도 75개, 적어도 80개, 적어도 85개, 적어도 90개, 적어도 95개, 적어도 100개, 적어도 105개, 적어도 110개, 또는 적어도 115개의 동일한 인접한 아미노산을 갖고, MS2 RNA에 결합한다. 일부 실시양태에서, RNA 결합 단백질은 서열식별번호: 99에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50개 또는 그 초과의 돌연변이를 갖고, MS2 RNA에 결합한다. 일부 실시양태에서, RNA 결합 단백질은 서열식별번호: 99에 제시된 아미노산 서열을 포함한다. 일부 실시양태에서, RNA 결합 단백질은 MS2 RNA에 결합할 수 있는 서열식별번호: 99의 단편 또는 변이체를 포함한다. MS2 파지 코트 단백질의 변이체 또는 단편이 MS2 RNA (예를 들어, 서열식별번호: 99)에 결합하는지 여부를 시험하는 방법은 통상적인 실험을 사용하여 수행될 수 있으며, 통상의 기술자에게 명백할 것이다.

일부 실시양태에서, RNA 결합 단백질은 P22 boxB RNA에 결합하는 P22 N 단백질 (예를 들어, 박테리오파지로부터의 P22 N), 또는 그의 변이체이다. P22 N 단백질은 관련 기술분야에 공지되어 있으며, 통상의 기술자에게 명백할 것이다. 예를 들어, P22 N 단백질은 문헌 [Cai et al., "Solution structure of P22 transcriptional antitermination N peptide-boxB RNA complex" Nat Struct Biol. 1998 Mar;5(3):203-12]; 및 [Patel, "Adaptive recognition in RNA complexes with peptides and protein modules" Curr Opin Struct Biol. 1999 Feb;9(1):74-87]에 기재되었으며; 각각의 전체 내용은 본원에 참조로 포함된다. 단백질 P22 boxB RNA에 특이적으로 결합하는 예시적인 P22 N은 아미노산 서열 NAKTRRHERRRKLAIERDTI (서열식별번호: 100)를 포함한다.

일부 실시양태에서, RNA 결합 단백질은 λ boxB RNA에 결합하는 λ N 단백질 (예를 들어, 박테리오파지로부터의 λ N), 또는 그의 변이체이다. λ N 단백질은 관련 기술분야에 공지되어 있으며, 통상의 기술자에게 명백할 것이다. 예를 들어, λ N 단백질은 문헌 [Keryer-Bibens et al., "Tethering of proteins to RNAs by bacteriophage proteins" Biol Cell. 2008 Feb;100(2):125-38]; [Legault et al., "NMR structure of the bacteriophage lambda N peptide/boxB RNA complex: recognition of a GNRA fold by an arginine-rich motif" Cell. 1998 Apr 17;93(2):289-99]; 및 [Patel, "Adaptive recognition in RNA complexes with peptides and protein modules" Curr Opin Struct Biol. 1999 Feb;9(1):74-87]에 기재되었으며; 각각의 전체 내용은 본원에 참조로 포함된다. λ boxB에 특이적으로 결합하는 예시적인 λ N 단백질은 아미노산 서열 GSMDAQTRRRERRAEKQAQWKAAN (서열식별번호: 101)을 포함한다.

일부 실시양태에서, RNA 결합 단백질은 φ21 boxB RNA에 결합하는 φ21 N 단백질 (예를 들어, 박테리오파지로부터의 φ21 N), 또는 그의 변이체이다. φ21 N 단백질은 관련 기술분야에 공지되어 있으며, 통상의 기술자에게 명백할 것이다. 예를 들어, φ21 단백질은 문헌 [Cilley et al. "Structural mimicry in the phage φ21 N peptide-boxB RNA complex." RNA. 2003;9(6):663-676]; 및 [Patel, "Adaptive recognition in RNA complexes with peptides and protein modules" Curr Opin Struct Biol. 1999 Feb;9(1):74-87]에 기재되었으며; 각각의 전체 내용은 본원에 참조로 포함된다. φ21 boxB RNA에 특이적으로 결합하는 예시적인 φ21 N 단백질은 아미노산 서열 GTAKSRYKARRAELIAERR(서열식별번호: 102)을 포함한다. N 펩티드는 α-나선으로서 결합하고, boxB RNA 줄기-루프의 5' 절반의 주요 그루브 측과 지배적으로 상호작용한다. 이 결합 계면은 극성 및 비극성 상호작용의 표면 상보성에 의해 한정된다. φ21 boxB 루프의 노출된 면과 복합체화된 N 펩티드는 관련된 λ 및 P22 박테리오파지 N 펩티드-boxB RNA 복합체의 GNRA 테트라루프-유사 폴드와 유사하다.

일부 실시양태에서, RNA 결합 단백질은 SL3 ψ RNA에 결합하는 HIV-1 뉴클레오캡시드 (예를 들어, HIV-1로부터의 뉴클레오캡시드), 또는 그의 변이체이다. HIV-1 뉴클레오캡시드 단백질은 관련 기술분야에 공지되어 있으며, 통상의 기술자에게 명백할 것이다. 예를 들어, HIV-1 뉴클레오캡시드 단백질은 문헌 [Patel, "Adaptive recognition in RNA complexes with peptides and protein modules" Curr Opin Struct Biol. 1999 Feb;9(1):74-87]에 기재되었으며; 그의 전체 내용은 본원에 참조로 포함된다. SL3 ψ RNA에 특이적으로 결합하는 예시적인 HIV-1 뉴클레오캡시드는 아미노산 서열: MQKGNFRNQRKTVKCFNCGKEGHIAKNCRAPRKKGCWKCGKEGHQMKDCTERQAN (서열식별번호: 103)을 포함한다.

결합 RNA

본 개시내용의 일부 측면은 단백질에 결합하는 RNA 분자에 관한 것이다. 일부 실시양태에서, 결합 RNA는 특이적 아미노산 서열 또는 구조를 갖는 단백질에 결합하는 천연 발생 RNA, 또는 그의 비-천연 발생 변이체, 또는 비-천연 발생 RNA이다.

특정 실시양태에서, 결합 RNA는 발생기 인간 면역결핍 바이러스-1 (HIV-1) 전사체의 5' 단부에서 발견되고 전사의 전사-활성화제 (Tat) 단백질에 특이적으로 결합하는 RNA 줄기-루프 구조인 전사-활성화 반응 요소 (TAR 요소)이다. 일부 실시양태에서, TAR 요소는 소 면역결핍 바이러스 (BIV) TAR이다. 예시적인 TAR 요소는 서열식별번호: 84에 제시된 바와 같은 핵산 서열을 포함한다. 추가의 예시적인 TAR 서열은 표 2에서 발견될 수 있지만; 이들 서열은 제한적인 것으로 의미되지 않으며, Tat 단백질, 또는 그의 변이체에 결합하는 추가의 TAR 요소 서열은 또한 본 개시내용의 범위 내에 있다. 결합 RNA는 또한 바이러스 게놈의 전사에 관여하는 조절 단백질인 RNA 결합 단백질, 전사의 전사-활성화제 (Tat 단백질)와 회합할 수 있는 TAR 요소의 변이체일 수 있다. Tat 단백질과 회합할 수 있는 TAR 요소의 변이체는 본 개시내용 및 관련 기술분야의 지식에 기반하여 통상의 기술자에게 명백할 것이며, 본 개시내용의 범위 내에 있다. 또한, TAR 변이체 및 Tat 단백질, 또는 Tat 단백질 변이체 사이의 회합은 통상적인 방법을 사용하여 시험될 수 있다. Tat 단백질에 결합하는 TAR 요소 및 TAR 요소의 변이체는 관련 기술분야에 공지되어 있고, 예를 들어 문헌 [Kamine et al., "Mapping of HIV-1 Tat Protein Sequences Required for Binding to Tar RNA" Virology 182, 570-577 (1991)]; 및 [Patel, "Adaptive recognition in RNA complexes with peptides and protein modules" Curr Opin Struct Biol. 1999 Feb;9(1):74-87]에 이전에 기재되었으며; 각각의 전체 내용은 본원에 참조로 포함된다. 일부 실시양태에서, 결합 RNA는 서열식별번호: 85 내지 90에 제시된 바와 같은 핵산 서열을 포함한다. 일부 실시양태에서, 결합 RNA는 Tat 단백질 또는 그의 변이체에 결합할 수 있는 서열식별번호: 85 내지 90에 제시된 임의의 핵산 서열의 변이체를 포함한다.

임의의 특정 이론에 구애되기를 원하지는 않지만, TAR 요소는 천연 바이러스 RNA에서 안정한 줄기-루프 구조를 형성할 수 있다 (Muesing et al., 1987). TAR의 줄기 상에, 3개의 뉴클레오티드 벌지는 TAR 요소에의 Tat 단백질의 고-친화도 결합에서 역할을 하는 것으로 입증되었다 (Roy et al., 1990; Cordingley et al., 1990; Dingwall et al., 1989; Weeks et al., 1990). TAR 요소에서, 줄기 및 벌지의 초기 U22의 통합성은 Tat 단백질 결합에 기여할 수 있다 (Roy et al., 1990b). TAR 부위에의 Tat 단백질의 결합에 영향을 미치지 않을 수 있는 다른 서열은 생체내에서 전사의 전사-활성화에서 역할을 한다. 한 이러한 영역은 Tat 단백질과 상호작용하여 전사활성화를 매개할 수 있는 세포 인자의 결합에 요구되는 루프에서의 서열이다 (Gatignol et al., 1989; Gaynor et al., 1989; Marciniak et al., 1990a; Gatignol et al., 1991).

표 2. TAR 서열

일부 실시양태에서, 결합 RNA는 Rev 단백질 (예를 들어, HIV-1로부터의 Rev)에 결합하는 Rev 반응 요소 (RRE), 또는 그의 변이체이다. Rev 반응 요소는 관련 기술분야에 공지되어 있으며, 본 발명에서 사용하기 위해 통상의 기술자에게 명백할 것이다. 예를 들어, Rev 반응 요소는 문헌 [Fernandes et al., "The HIV-1 Rev response element: An RNA scaffold that directs the cooperative assembly of a homo-oligomeric ribonucleoprotein complex." RNA Biology 9:1, 6-11, January 2012]; [Cook et al., "Characterization of HIV-1 REV protein: binding stoichiometry and minimal RNA substrate." Nucleic Acids Res. Apr 11; 19(7):1577-1583, 1991]; [Grate et al., "Role REVersal: understanding how RRE RNA binds its peptide ligand" Structure. 1997 Jan 15;5(1):7-11]; 및 [Patel, "Adaptive recognition in RNA complexes with peptides and protein modules" Curr Opin Struct Biol. 1999 Feb;9(1):74-87]에 기재되었으며; 각각의 전체 내용은 본원에 참조로 포함된다. 상기 참고문헌에 기재된 임의의 RRE 핵산 서열 또는 RRE 핵산 서열의 임의의 단편은 본 개시내용에 따른 결합 RNA로서 사용될 수 있다. Rev에 결합하는 예시적인 RRE 핵산 서열은 제한 없이, 서열식별번호: 91 및 92에 제시된 핵산 서열을 포함한다 (표 3).

일부 실시양태에서, Rev 펩티드는 특정 구조를 채택할 수 있고, 단일 아르기닌이라기 보다는 몇몇 아미노산은 서열-특이적 RNA 상호작용에 참여할 수 있다. 임의의 특정 이론에 구애되기를 원하지는 않지만, RRE의 Rev 인식은, TAR의 Tat 인식과 같이, 직접적 결합에 기인한다. 결합은 긴밀하고 (Kd =1 내지 3 nM), RRE에 대해 고도로 특이적일 수 있다. Rev의 농도가 증가함에 따라, 점차적으로 보다 큰 RRE RNA와의 복합체가 형성되는 반면, Tat는 TAR RNA와 일-대-일 복합체를 형성한다.

일반적으로, Rev 단백질은 처음에 고 친화도 부위에 결합할 수 있고, 이어서 추가의 Rev 분자는 보다 낮은 친화도 부위를 점유한다. Rev에 결합하는 RNA는 문헌 [Heaphy et al., "HIV-1 regulator of virion expression (Rev) protein binds to an RNA stem-loop structure located within the Rev-response element region" Cell, 1990. 60, 685-693]에 기재되었으며; 그의 전체 내용은 본원에 참조로 포함된다.

표 3. RRE/Rev 서열

일부 실시양태에서, 결합 RNA는 MS2 파지 코트 단백질에 특이적으로 결합하는 MS2 RNA이다. 전형적으로, RNA 박테리오파지 MS2의 코트 단백질은 바이러스 RNA (예를 들어, MS2 RNA)에서 특이적 줄기-루프 구조에 결합하여 게놈의 외피화 및 레플리카제 합성의 번역 억제를 달성한다. MS2 파지 코트 단백질에 특이적으로 결합하는 RNA는 관련 기술분야에 공지되어 있으며, 통상의 기술자에게 명백할 것이다. 예를 들어 MS2 파지 코트 단백질에 결합하는 RNA는 문헌 [Parrott et al., "RNA aptamers for the MS2 bacteriophage coat protein and the wild-type RNA operator have similar solution behavior." Nucl. Acids Res. 28(2): 489-497 (2000)]; [Witherell et al., "Specific interaction between RNA phage coat proteins and RNA." Prog Nucleic Acid Res Mol Biol. 1991;40:185-220]; [Stockley et al., "Probing sequence-specific RNA recognition by the bacteriophage MS2 coat protein." Nucleic Acids Res. 1995 Jul 11;23(13):2512-8]; [Keryer-Bibens C., et al., "Tethering of proteins to RNAs by bacteriophage proteins." Biol. Cell. 100(2): 125-38 (2008)]; 및 [Patel. "Adaptive recognition in RNA complexes with peptides and protein modules." Curr Opin Struct Biol. 1999 Feb;9(1):74-87]에 기재되었으며; 각각의 전체 내용은 그 전문이 본원에 참조로 포함된다. 일부 실시양태에서, MS2 파지 코트 단백질에 특이적으로 결합하는 예시적인 MS2 RNA는 서열식별번호: 96 내지 98 중 어느 하나에 제시된 바와 같은 핵산 서열을 포함한다 (표 4). 일부 실시양태에서, 결합 RNA는 서열식별번호: 96, 97, 또는 98 중 어느 하나의 핵산 서열을 포함한다.

표 4. MS2 서열

일부 실시양태에서, 결합 RNA믐 P22 N 단백질 (예를 들어, 박테리오파지로부터의 P22 N), 또는 그의 변이체에 특이적으로 결합하는 RNA이다. P22 N 단백질은 관련 기술분야에 공지되어 있으며, 통상의 기술자에게 명백할 것이다. 예를 들어, P22 N 단백질은 문헌 [Cai et al., "Solution structure of P22 transcriptional antitermination N peptide-boxB RNA complex" Nat Struct Biol. 1998 Mar;5(3):203-12]; [Weiss, "RNA-mediated signaling in transcription" Nat Struct Biol. 1998 May;5(5):329-33]; 및 [Patel, "Adaptive recognition in RNA complexes with peptides and protein modules" Curr Opin Struct Biol. 1999 Feb;9(1):74-87]에 기재되었으며; 각각의 전체 내용은 본원에 참조로 포함된다. P22 N 단백질에 특이적으로 결합하는 예시적인 P22 boxB RNA는 gcgcugacaaagcgc (서열식별번호: 104)에 제시된 바와 같은 핵산 서열을 포함한다.

일부 실시양태에서, 결합 RNA는 λ N 단백질 (예를 들어, 박테리오파지로부터의 λ N), 또는 그의 변이체에 특이적으로 결합하는 RNA이다. λ N 단백질은 관련 기술분야에 공지되어 있으며, 통상의 기술자에게 명백할 것이다. 예를 들어, λ N 단백질은 문헌 [Keryer-Bibens et al., "Tethering of proteins to RNAs by bacteriophage proteins." Biol Cell. 2008 Feb;100(2):125-38]; [Weiss. "RNA-mediated signaling in transcription." Nat Struct Biol. 1998 May;5(5):329-33]; [Legault et al., "NMR structure of the bacteriophage lambda N peptide/boxB RNA complex: recognition of a GNRA fold by an arginine-rich motif." Cell. 1998 Apr 17;93(2):289-99]; 및 [Patel, "Adaptive recognition in RNA complexes with peptides and protein modules." Curr Opin Struct Biol. 1999 Feb;9(1):74-87]에 기재되었으며; 각각의 전체 내용은 본원에 참조로 포함된다. λ N 단백질에 특이적으로 결합하는 예시적인 λ boxB RNA는 gggcccugaagaagggccc (서열식별번호: 105)에 제시된 바와 같은 핵산 서열을 포함한다.

일부 실시양태에서, 결합 RNA는 φ21 N 단백질 (예를 들어, 박테리오파지로부터의 φ21 N), 또는 그의 변이체에 특이적으로 결합하는 RNA이다. φ21 N 단백질은 관련 기술분야에 공지되어 있으며, 통상의 기술자에게 명백할 것이다. 예를 들어, φ21 단백질은 문헌 [Cilley et al. "Structural mimicry in the phage φ21 N peptide-boxB RNA complex." RNA. 2003;9(6):663-676]; 및 [Patel, "Adaptive recognition in RNA complexes with peptides and protein modules." Curr Opin Struct Biol. 1999 Feb;9(1):74-87]에 기재되었으며; 각각의 전체 내용은 본원에 참조로 포함된다. φ21 N 단백질에 특이적으로 결합하는 예시적인 φ21 boxB RNA는 ucucaaccuaaccguugaga (서열식별번호: 106)에 제시된 바와 같은 핵산 서열을 포함한다.

일부 실시양태에서, 결합 RNA는 HIV-1 뉴클레오캡시드 단백질 (예를 들어, HIV-1로부터의 뉴클레오캡시드) 또는 그의 변이체에 특이적으로 결합하는 RNA이다. HIV-1 뉴클레오캡시드 단백질은 관련 기술분야에 공지되어 있으며, 통상의 기술자에게 명백할 것이다. 예를 들어, HIV-1 뉴클레오캡시드 단백질은 문헌 [Patel, "Adaptive recognition in RNA complexes with peptides and protein modules." Curr Opin Struct Biol. 1999 Feb;9(1):74-87]에 기재되었으며; 그의 전체 내용은 본원에 참조로 포함된다. HIV-1 뉴클레오캡시드에 특이적으로 결합하는 예시적인 SL3 ψ RNA는 ggacuagcggaggcuagucc (서열식별번호: 107)에 제시된 바와 같은 핵산 서열을 포함한다.

본 개시내용의 결합 RNA는 단백질 결합 상대를 인식한 천연-발생 RNA 또는 그의 비-천연-발생 변이체에 제한될 필요가 없음이 인지되어야 한다. 일부 실시양태에서, 결합 RNA는 또한 합성적으로 생산된 RNA, 예를 들어 단백질 (예를 들어, RNA 결합 단백질)에 특이적으로 결합하도록 디자인된 RNA일 수 있다. 일부 실시양태에서, 결합 RNA는 임의의 관심의 단백질, 예를 들어 ARRDC1에 특이적으로 결합하도록 디자인된다. 일부 실시양태에서, 결합 RNA는 지수적 풍부화에 의한 리간드의 체계적 진화 (SELEX)에 의해 생산된 RNA이다. SELEX 방법론은 통상의 기술자에게 명백할 것이며, 예를 들어 미국 특허 번호 5,270,163; 5,817,785; 5,595,887; 5,496,938; 5,475,096; 5,861,254; 5,958,691; 5,962,219; 6,013,443; 6,030,776; 6,083,696; 6,110,900; 6,127,119; 및 6,147,204; 미국 출원 20030175703 및 20030083294, 문헌 [Potti et al., Expert Opin. Biol. Ther. 4:1641-1647 (2004)], 및 [Nimjee et al., Annu. Rev. Med. 56:555-83 (2005)]에 이전에 기재되었다. SELEX의 기술은 다양한 표적 단백질에 대한 극도로 높은 결합 친화도를 갖는 압타머를 진화시키는데 사용되었다. 예를 들어, 혈관 내피 성장 인자 (VEGF)에 결합하는 압타머를 디자인하기 위해 SELEX를 사용하는 그의 개시내용에 대해 문헌 [Trujillo U. H., et al., "DNA and RNA aptamers: from tools for basic research towards therapeutic applications". Comb Chem High Throughput Screen 9 (8): 619-32 (2006)]을 참조한다. 일부 실시양태에서, 결합 RNA는 표적 단백질, 예를 들어, ARMM에서 발견되는 단백질 (예를 들어, ARRDC1 또는 TSG101)에 특이적으로 결합하는 압타머이다.

화물 RNA

본 개시내용의 일부 측면은 ARMM과 회합된, 예를 들어, 그의 액체 상 내로 혼입된 RNA를 제공한다. 일부 실시양태에서, 화물 RNA는 그의 ARMM와의 회합 또는 그에서의 포함을 통해 대상체, 기관, 조직, 또는 세포에 전달될 수 있는 RNA 분자이다. 일부 실시양태에서, 화물 RNA는 시험관내에서, 생체내에서, 또는 생체외에서 표적 세포에 전달된다. 일부 실시양태에서, 전달되는 화물 RNA는 생물학적으로 활성인 작용제이며, 즉, 이는 세포, 기관, 조직, 및/또는 대상체에서 활성을 갖는다. 예를 들어, 대상체에게 투여되는 경우, 그 대상체에 대해 생물학적 효과를 갖는 RNA는 생물학적으로 활성인 것으로 간주된다. 특정 실시양태에서, 화물 RNA는 메신저 RNA 또는 세포에서 단백질을 발현하는 RNA이다. 특정 실시양태에서, 화물 RNA는 세포에서 1종 이상의 유전자의 발현을 억제하는 작은 간섭 RNA (siRNA)이다. 일부 실시양태에서, 전달되는 화물 RNA는 치료제, 예를 들어, 대상체에게 투여되는 경우 대상체에 대해 유익한 효과를 갖는 작용제이다. 일부 실시양태에서, 세포에 전달되는 화물 RNA는 전사 인자, 종양 서프레서, 발달 조절제, 성장 인자, 전이 서프레서, 프로-아폽토시스 단백질, 뉴클레아제, 또는 리콤비나제를 발현하는 RNA이다. 일부 실시양태에서, 전달되는 화물 RNA는 p53, Rb (망막모세포종 단백질), BIM 단백질, BRCA1, BRCA2, PTEN, 선종성 결장 폴립증 (APC), CDKN1B, 시클린-의존성 키나제 억제제 1C, HEPACAM, INK4, Mir-145, p16, p63, p73, SDHB, SDHD, 분비된 프리즐드-관련된 단백질 1, TCF21, TIG1, TP53, 결절성 경화증 복합체 종양 서프레서, 폰 히펠-린다우 (VHL) 종양 서프레서, CD95, ST7, ST14, BCL-2 패밀리 단백질, 카스파제; BRMS1, CRSP3, DRG1, KAI1, KISS1, NM23, TIMP-패밀리 단백질, BMP-패밀리 성장 인자, EGF, EPO, FGF, G-CSF, GM-CSF, GDF-패밀리 성장 인자, HGF, HDGF, IGF, PDGF, TPO, TGF-α, TGF-β, VEGF; 아연 핑거 뉴클레아제, Cre, Dre, 또는 FLP 리콤비나제를 발현하는 RNA이다.

일부 실시양태에서, 화물 RNA는 세포에서 1종 이상의 유전자의 발현을 억제하는 RNA일 수 있다. 예를 들어, 일부 실시양태에서, 화물 RNA는 마이크로RNA (miRNA), 작은 간섭 RNA (siRNA), 또는 안티센스 RNA (asRNA)이다.

일부 실시양태에서, 전달되는 화물 RNA는 메신저 RNA (mRNA), 리보솜 RNA (rRNA), 신호 인식 입자 RNA (SRP RNA), 또는 운반 RNA (tRNA)를 포함한다. 일부 실시양태에서, 전달되는 화물 RNA는 작은 핵 RNA (snRNA), 작은 핵소체 (snoRNA), SmY RNA (smY), 가이드 RNA (gRNA), 리보뉴클레아제 P (RN아제 P), 리보뉴클레아제 MRP (RN아제 MRP), Y RNA, 텔로머라제 RNA 성분 (TERC), 또는 스플라이싱된 리더 RNA (SL RNA)를 포함한다. 일부 실시양태에서, 전달되는 화물 RNA는 안티센스 RNA (asRNA), 시스-천연 안티센스 서열 (시스-NAT), CRISPR RNA (crRNA), 긴 비코딩 RNA (lncRNA), 마이크로RNA (miRNA), 피위-상호작용 RNA (piRNA), 작은 간섭 RNA (siRNA), 또는 트랜스-작용 siRNA (tasiRNA)를 포함한다.

일부 실시양태에서, 전달되는 화물 RNA는 진단제이다. 일부 실시양태에서, 전달되는 화물 RNA는 예방제이다. 일부 실시양태에서, 전달되는 화물 RNA는 영상화제로서 유용하다. 이들 실시양태의 일부에서, 진단제 또는 영상화제는 생물학적으로 활성이고, 다른 것들에서 이는 그렇지 않다.

일부 실시양태에서, 본원에서 제공된 임의의 화물 RNA는 결합 RNA와 회합된다. 일부 실시양태에서, 화물 RNA는 결합 RNA와 공유 회합된다. 일부 실시양태에서, 화물 RNA 및 결합 RNA는 동일한 RNA 분자 (예를 들어, 단일 전사체로부터의 RNA)의 일부이다. 일부 실시양태에서, 화물 RNA 및 결합 RNA는 링커를 통해 공유 회합된다. 일부 실시양태에서, 링커는 뉴클레오티드 또는 핵산 (예를 들어, DNA 또는 RNA)을 포함한다. 일부 실시양태에서, 링커는 RNA를 포함한다. 일부 실시양태에서, 링커는 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 40개, 적어도 50개, 적어도 100개, 적어도 150개, 적어도 200개, 적어도 250개, 적어도 300개, 적어도 400개, 또는 적어도 500개의 뉴클레오티드 (예를 들어, DNA 또는 RNA)를 포함한다.

다른 실시양태에서, 화물 RNA는 결합 RNA와 비-공유 회합된다. 예를 들어, 화물 RNA는 상보적 염기 쌍형성을 통해 결합 RNA와 회합할 수 있다. 일부 실시양태에서, 화물 RNA는 인접하거나 비-인접할 수 있는 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 40개, 적어도 50개의 상보적 염기 쌍을 통해 결합 RNA에 결합된다. 일부 실시양태에서, 화물 RNA는 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 40개, 적어도 50개의 인접한 상보적 염기 쌍을 통해 결합 RNA에 결합된다.

본원에서 제공된 임의의 RNA (예를 들어, 결합 RNA, 화물 RNA, 및/또는 화물 RNA에 융합된 결합 RNA)는 1개 이상의 변형된 올리고뉴클레오티드를 포함할 수 있음이 인지되어야 한다. 일부 실시양태에서, 본원에 기재된 임의의 RNA는 변형될 수 있으며, 예를 들어, 변형된 당 모이어티, 변형된 뉴클레오시드간 연결, 변형된 뉴클레오티드 및/또는 이들의 조합을 포함할 수 있다. 일부 실시양태에서, 본 발명의 RNA 올리고뉴클레오티드는 핵산분해적 분해에 대해, 예컨대 변형, 예를 들어, 뉴클레오티드 변형의 혼입에 의해 안정화될 수 있다. 예를 들어, 본 발명의 핵산 서열은 뉴클레오티드 서열의 5' 또는 3' 단부에 포스포로티오에이트 적어도 제1, 제2, 또는 제3 뉴클레오티드간 연결을 포함한다. 또 다른 예로서, 핵산 서열은 2'-변형된 뉴클레오티드, 예를 들어, 2'-데옥시, 2'-데옥시-2'-플루오로, 2'-O-메틸, 2'-O-메톡시에틸 (2'-O-MOE), 2'-O-아미노프로필 (2'-O-AP), 2'-O-디메틸아미노에틸 (2'-O-DMAOE), 2'-O-디메틸아미노프로필 (2'-O-DMAP), 2'-O-디메틸아미노에틸옥시에틸 (2'-O-DMAEOE), 또는 2'-O--N-메틸아세트아미도 (2'-O--NMA)를 포함할 수 있다. 또 다른 예로서, 핵산 서열은 적어도 1개의 2'-O-메틸-변형된 뉴클레오티드를 포함할 수 있고, 일부 실시양태에서, 모든 뉴클레오티드는 2'-O-메틸 변형을 포함한다. 일부 실시양태에서, 핵산은 "잠금되고", 즉, 리보스 고리가 2'-O 원자 및 4'-C 원자를 연결하는 메틸렌 가교에 의해 "잠금된" 핵산 유사체를 포함한다.

본원에 기재된 RNA 올리고뉴클레오티드의 임의의 변형된 화학 또는 형식은 서로와 조합될 수 있고, 그 1, 2, 3, 4, 5, 또는 그 초과의 상이한 유형의 변형은 동일한 분자 내에 포함될 수 있다.

일부 실시양태에서, RNA 올리고뉴클레오티드는 적어도 1개의 가교된 뉴클레오티드를 포함할 수 있다. 일부 실시양태에서, 올리고뉴클레오티드는 가교된 뉴클레오티드, 예컨대 잠금된 핵산 (LNA) 뉴클레오티드, 구속된 에틸 (cEt) 뉴클레오티드, 또는 에틸렌 가교된 핵산 (ENA) 뉴클레오티드를 포함할 수 있다. 이러한 뉴클레오티드의 예는 본원에 개시되어 있으며, 관련 기술분야에 공지되어 있다. 일부 실시양태에서, 올리고뉴클레오티드는 하기 미국 특허 또는 특허 출원 공개 중 하나에 개시된 뉴클레오티드 유사체를 포함하며, 그의 각각의 전체 내용은 모든 목적을 위해 본원에 참조로 포함된다: US 7,399,845, US 7,741,457, US 8,022,193, US 7,569,686, US 7,335,765, US 7,314,923, US 7,335,765, 및 US 7,816,333, US 20110009471. 올리고뉴클레오티드는 1개 이상의 2' O-메틸 뉴클레오티드를 가질 수 있다. 올리고뉴클레오티드는 2' O-메틸 뉴클레오티드로 전적으로 이루어질 수 있다.

발현 구축물

본 발명의 일부 측면은 본원에 기재된 임의의 최소 ARRDC1 융합 단백질, TSG101 융합 단백질, 또는 화물 융합 단백질을 코딩하는 발현 구축물을 제공한다. 일부 실시양태에서, 본원에 기재된 발현 구축물은 가이드 RNA (gRNA)를 추가로 코딩할 수 있다. gRNA는 동일한 프로모터 서열 또는 상이한 프로모터 서열의 제어 하에서 본원에 기재된 임의의 융합 단백질로서 발현될 수 있음이 인지되어야 한다. 일부 실시양태에서, gRNA를 코딩하는 발현 구축물은 본원에 기재된 임의의 발현 구축물과 공동-발현될 수 있다.

일부 실시양태에서, 본원에 기재된 발현 구축물은 이러한 구축물을 함유하는 세포에서 ARMM의 생성을 유도하거나 용이하게 하는 유전자 산물 또는 유전자 산물들을 추가로 코딩할 수 있다. 일부 실시양태에서, 발현 구축물은 최소 ARRDC1 단백질, 또는 그의 변이체, 및/또는 TSG101 단백질, 또는 그의 변이체를 코딩한다. 일부 실시양태에서, 세포에서의 이들 유전자 산물 중 어느 하나 또는 둘 다의 과발현은 세포에서 ARMM의 생산을 증가시키고, 따라서 세포를 미세소포 생산 세포로 변화시킨다. 일부 실시양태에서, 이러한 발현 구축물은 코딩되는 최소 ARRDC1 및/또는 TSG101 단백질 또는 그의 변이체의 C-말단에서, 또는 N-말단에서 융합되는 Cas9 서열의 인-프레임 클로닝을 허용하는 적어도 1개의 제한 또는 재조합 부위를 포함한다.

일부 실시양태에서, 발현 구축물은 (a) 이종 프로모터에 작동가능하게 연결된 최소 ARRDC1 단백질, 또는 그의 변이체를 코딩하는 뉴클레오티드 서열, 및 (b) ARRDC1-코딩 뉴클레오티드 서열과 프레임 내에서 추가의 폴리펩티드를 코딩하는 뉴클레오티드 서열의 삽입을 허용하는 최소 ARRDC1-코딩 뉴클레오티드 서열에 인접하여 위치한 제한 부위 또는 재조합 부위를 포함한다. 일부 실시양태에서, 발현 구축물은 (a) 이종 프로모터에 작동가능하게 연결된 최소 ARRDC1 단백질, 또는 그의 변이체를 코딩하는 뉴클레오티드 서열, 및 (b) 최소 ARRDC1-코딩 뉴클레오티드 서열과 프레임 내에서 Cas9 또는 Cas9 변이체 서열의 삽입을 허용하는 최소 ARRDC1-코딩 뉴클레오티드 서열에 인접하여 위치한 제한 부위 또는 재조합 부위를 포함한다. 본 발명의 일부 측면은 (a) 이종 프로모터에 작동가능하게 연결된 TSG101 단백질, 또는 그의 변이체를 코딩하는 뉴클레오티드 서열, 및 (b) TSG101-코딩 뉴클레오티드 서열과 프레임 내에서 Cas9 또는 Cas9 변이체 서열의 삽입을 허용하는 TSG101-코딩 뉴클레오티드 서열에 인접하여 위치한 제한 부위 또는 재조합 부위를 포함하는 발현 구축물을 제공한다.

발현 구축물은 적어도 1개의 WW 도메인에 융합된 화물 단백질을 코딩할 수 있다. 일부 실시양태에서, 발현 구축물은 적어도 1개의 WW 도메인, 또는 그의 변이체에 융합된 Cas9 단백질, 또는 그의 변이체를 코딩한다. 본원에 기재된 임의의 발현 구축물은 임의의 WW 도메인 또는 그의 변이체를 코딩할 수 있다. 예를 들어, 발현 구축물은 폴리 펩티드 서열 (서열식별번호: 6); (서열식별번호: 7); (서열식별번호: 8); (서열식별번호: 9); (서열식별번호: 10); (서열식별번호: 11); (서열식별번호: 12); (서열식별번호: 13); (서열식별번호: 14); (서열식별번호: 18) 또는 (서열식별번호: 19)로부터의 WW 도메인 또는 그의 변이체를 코딩할 수 있는 임의의 뉴클레오티드 서열을 포함할 수 있다.

본원에 기재된 발현 구축물은 WW 도메인 또는 그의 변이체를 코딩할 수 있는 임의의 핵산 서열을 포함할 수 있다. 예를 들어, WW 도메인 또는 WW 도메인 변이체를 코딩하는 핵산 서열은 인간 유비퀴틴 리가제 WWP1, WWP2, Nedd4-1, Nedd4-2, Smurf1, Smurf2, ITCH, NEDL1, 또는 NEDL2로부터의 것일 수 있다. WW 도메인 함유 단백질의 예시적인 핵산 서열은 하기 열거된다. 본원에 기재된 예시적인 단백질의 WW 도메인 또는 WW 도메인 변이체를 코딩하는 임의의 핵산은 본 발명에 사용될 수 있으며, 제한적인 것으로 의미되지 않음이 인지되어야 한다.

특정 실시양태에서, 핵산은 하기 핵산 서열을 갖는 인간 ITCH 단백질로부터의 2개의 WW 도메인 또는 WW 도메인 변이체를 갖는 화물 단백질을 코딩할 수 있다:

다른 실시양태에서, 핵산은 하기 핵산 서열을 갖는 인간 ITCH 단백질로부터의 4개의 WW 도메인 또는 WW 도메인 변이체를 갖는 화물 단백질을 코딩할 수 있다:

적어도 1개의 WW 도메인 또는 WW 도메인 변이체에 융합된 본원에 기재된 화물 단백질을 코딩하는 핵산 구축물은 비-천연 발생이며, 즉, 이들은 자연에 존재하지 않는다.

일부 실시양태에서 발현 구축물은 핵산 서열 (서열식별번호: 23); (서열식별번호: 24); (서열식별번호: 25); (서열식별번호: 26); (서열식별번호: 27); (서열식별번호: 28); (서열식별번호: 29); (서열식별번호: 30); (서열식별번호: 31); (서열식별번호: 32) 또는 (서열식별번호: 33)으로부터의 WW 도메인, 또는 그의 변이체를 코딩하는 핵산 서열을 포함한다. 특정 실시양태에서, 발현 구축물은 WW 도메인 또는 다수의 WW 도메인, 핵 국재화 서열 (NLS), 및 Cas9 단백질 또는 그의 변이체를 포함하는 융합 단백질을 코딩한다. 특정 실시양태에서, 발현 구축물은 핵산 서열 (서열식별번호: 111) 또는 (서열식별번호: 112)를 포함한다. 특정 실시양태에서, 발현 구축물은 핵산 서열 (서열식별번호: 111) 또는 (서열식별번호: 112)로 이루어진다. 특정 실시양태에서, 발현 구축물은 핵산 서열 (서열식별번호: 111) 또는 (서열식별번호: 112)로 본질적으로 이루어진다.

하기 핵산 서열은 pX330 플라스미드 (애드진)의 AgeI 부위 내로 클로닝된 2개의 WW 도메인 (서열식별번호: 109) 또는 4개의 WW 도메인 (서열식별번호: 110) 중 어느 하나를 갖는 예시적인 Cas9 화물 단백질 서열을 코딩한다.

본원에 기재된 임의의 단백질을 코딩하는 핵산은 관련 기술분야에 공지된 임의의 수의 핵산 "벡터"에 있을 수 있다. 본원에 사용된 "벡터"는 숙주 세포 내로 핵산을 전달하는데 사용될 수 있는 임의의 핵산 또는 핵산-함유 입자, 세포, 또는 유기체를 포함할 수 있다. 용어 "벡터"는 바이러스 및 비바이러스 산물 둘 다 및 세포 내로 핵산을 도입하는 수단을 포함한다. "벡터"는 시험관내에서, 생체외에서, 또는 생체내에서 사용될 수 있다. 비-바이러스 벡터는 플라스미드, 코스미드, 인공 염색체 (예를 들어, 박테리아 인공 염색체 또는 효모 인공 염색체)를 포함하고, 예를 들어 리포솜, 전기적으로 하전된 지질 (시토펙틴), DNA-단백질 복합체, 및 생체중합체를 포함할 수 있다. 바이러스 벡터는 예를 들어 레트로바이러스, 렌티바이러스, 아데노-연관된 바이러스, 폭스 바이러스, 바쿨로바이러스, 레오바이러스, 백시니아 바이러스, 단순 포진 바이러스, 엡스타인-바르 바이러스, 및 아데노바이러스 벡터를 포함한다. 벡터는 또한 바이러스의 전체 게놈 서열 또는 재조합 게놈 서열을 포함할 수 있다. 벡터는 또한 세포를 감염시키거나, 그에 진입하거나, 그에 도입되어 그 안에 핵산을 전달할 수 있는 바이러스의 생산을 위한 기능적 서열을 포함하는 게놈의 부분을 포함할 수 있다.

본원에 기재된 임의의 융합 단백질의 발현은 관련 기술분야에 공지된 임의의 조절 서열 (예를 들어 프로모터 서열)에 의해 제어될 수 있다. 본원에 기재된 바와 같은 조절 서열은 핵산 서열의 발현을 조절하는 핵산 서열이다. 조절 또는 제어 서열은 특정 핵산 (즉, Cas9 화물 단백질)을 발현하는 것을 담당하는 서열을 포함할 수 있거나, 또는 다른 서열, 예컨대 이종, 합성, 또는 부분적으로 합성 서열을 포함할 수 있다. 서열은 특이적 또는 비-특이적 방식으로 및 유도성 또는 비-유도성 방식으로 유전자의 전사를 자극시키거나 억제하는 진핵생물, 원핵생물 또는 바이러스 기원의 것일 수 있다. 조절 또는 제어 영역은 복제 원점, RNA 스플라이스 부위, 인트론, 키메라 또는 하이브리드 인트론, 프로모터, 인핸서, 전사 종결 서열, 폴리 A 부위, 로커스 제어 영역, 표적 세포의 분비 경로 내로 폴리펩티드를 지정하는 신호 서열, 및 인트론을 포함할 수 있다. 이종 조절 영역은 그것이 연결되는 발현된 핵산과 자연적으로 회합되지 않는다. 이종 조절 영역 중에서 포함되는 것은 상이한 종으로부터의 조절 영역, 상이한 유전자로부터의 조절 영역, 하이브리드 조절 서열, 및 자연에서 발생하지 않지만, 관련 기술분야의 통상의 기술자에 의해 디자인된 조절 서열이다.

용어 작동가능하게 연결된은 성분이 그들의 통상적인 또는 의도된 기능을 수행하도록 구성된 서열 또는 영역의 배열을 지칭한다. 따라서, 코딩 서열에 작동가능하게 연결된 조절 또는 제어 서열은 코딩 서열의 발현에 영향을 미칠 수 있다. 조절 또는 제어 서열은 이들이 적절한 발현 또는 폴리펩티드 생산을 지정하도록 기능하는 한, 코딩 서열과 인접할 필요는 없다. 따라서, 예를 들어, 개재하는 비번역되지만 전사된 서열은 프로모터 서열 및 코딩 서열 사이에 존재할 수 있고, 프로모터 서열은 여전히 코딩 서열에 작동가능하게 연결된 것으로 간주될 수 있다. 본원에 기재된 바와 같은 프로모터 서열은 RNA 폴리머라제에 대한 결합 부위로서 작용하는 유전자의 5' 단부로부터 짧은 거리의 DNA 조절 영역이다. 프로모터 서열은 세포에서 RNA 폴리머라제에 결합하고/거나, 하류 (3' 방향) 코딩 서열의 전사를 개시할 수 있다. 프로모터 서열은 원핵생물 또는 진핵생물에서 전사를 개시할 수 있는 프로모터일 수 있다. 진핵생물 프로모터의 일부 비-제한적 예는 시토메갈로바이러스 (CMV) 프로모터, 닭 β-액틴 (CBA) 프로모터, 및 CBA 프로모터의 하이브리드 형태 (CBh)를 포함한다.

특정 실시양태에서, Cas9 화물 단백질은 pX330 플라스미드 (애드진)로부터 발현된다. 밑줄친 (단일 밑줄) 5' AgeI 클로닝 부위 및 밑줄친 (이중 밑줄) 3' EcoRI 클로닝 부위를 갖는 pX330 플라스미드의 예시적인 핵산 서열은 (서열식별번호: 34)로서 제시된다. 본원에 기재된 WW 도메인 또는 WW 도메인 변이체를 코딩하는 임의의 핵산은 서열식별번호: 34로부터의 Cas9를 코딩하는 서열과 프레임 내에서 클로닝될 수 있다. 예를 들어, 핵산 서열 (서열식별번호: 32), 또는 (서열식별번호: 33)에서 코딩된 2개의 ITCH WW 도메인 또는 4개의 ITCH WW 도메인은 5' AgeI 클로닝 부위 또는 3' EcoRI 클로닝 부위 내로 클로닝될 수 있다. 본원에 기재된 임의의 WW 도메인 또는 WW 도메인 변이체를 코딩하는 핵산은 (서열식별번호: 34)의 Cas9 서열 내로 클로닝될 수 있으며, 제공된 예는 제한적인 것으로 의미되지 않음이 인지되어야 한다.

화물 단백질을 함유하는 미세소포를 생산하는 세포

본 발명의 미세소포-생산 세포는 본원에 기재된 임의의 발현 구축물 또는 임의의 화물 단백질을 함유하는 세포일 수 있다. 예를 들어, 본 발명 미세소포-생산 세포는 이종 프로모터의 제어 하에서 (1) 최소 ARRDC1 단백질, 또는 그의 PSAP (서열식별번호: 122) 또는 PTAP (서열식별번호: 23) 모티프-함유 변이체, 및 (2) 적어도 1개의 WW 도메인, 또는 그의 변이체에 융합된 화물 단백질을 코딩하는 1종 이상의 재조합 발현 구축물을 함유할 수 있다. 특정 실시양태에서, 미세소포 생산 세포에서의 발현 구축물은 1개 이상의 WW 도메인 또는 그의 변이체를 갖는 화물 단백질을 코딩한다. 일부 실시양태에서, 발현 구축물은 1개 이상의 WW 도메인 또는 그의 변이체에 융합된 Cas9 화물 단백질 또는 그의 변이체를 코딩한다. 일부 실시양태에서, 발현 구축물은 적어도 1개의 WW 도메인 및 적어도 1개의 NLS에 융합된 Cas9 화물 단백질 또는 그의 변이체를 코딩한다. 일부 실시양태에서, 발현 구축물은 가이드 RNA (gRNA)를 추가로 코딩한다. 일부 실시양태에서, 발현 구축물은 TSG101 단백질, 또는 TSG101 단백질 변이체를 추가로 코딩한다. 이러한 미세소포 생산 세포에 의해 상산되는 ARMM은 전형적으로 본원에 기재된 발현 구축물에 의해 코딩되는 화물 단백질을 함유하는 WW 도메인을 포함함이 인지되어야 한다.

또 다른 본 발명 미세소포-생산 세포는 이종 프로모터의 제어 하에서 (2) Cas9 화물 단백질, 또는 그의 변이체에 연결된 (1) 최소 ARRDC1 단백질, 또는 그의 PSAP (서열식별번호: 122) 또는 PTAP (서열식별번호: 23) 모티프-함유 변이체를 코딩하는 재조합 발현 구축물을 함유할 수 있다. 본 발명의 일부 측면은 이종 프로모터의 제어 하에서 (2) Cas9 화물 단백질 또는 그의 변이체에 연결된 (1) TSG101 단백질, 또는 그의 UEV 도메인-함유 변이체를 코딩하는 재조합 발현 구축물을 포함하는 미세소포-생산 세포를 제공한다.

본원에 기재된 임의의 발현 구축물은 세포의 게놈 내로 안정하게 삽입될 수 있다. 일부 실시양태에서, 발현 구축물은 세포에서 유지되지만, 세포의 게놈 내로 삽입되지 않는다. 일부 실시양태에서, 발현 구축물은 벡터, 예를 들어, 플라스미드 벡터, 코스미드 벡터, 바이러스 벡터, 또는 인공 염색체에 있다. 일부 실시양태에서, 발현 구축물은 미세소포-생산 세포에서 발현 구축물의 유지 및/또는 복제를 용이하게 하는, 또는 세포에서 융합 단백질의 발현을 개선시키는 추가의 서열 또는 요소를 추가로 포함한다. 이러한 추가의 서열 또는 요소는 예를 들어, 복제 원점, 항생제 저항성 카세트, 폴리A 서열, 및/또는 전사 단리제를 포함할 수 있다. 본 발명의 측면에 따른 미세소포 생산 세포의 생산에 적합한 일부 발현 구축물은 본원의 다른 곳에 기재되어 있다. 본 발명의 측면에 따른 미세소포 생산 세포의 생성에 적합한 추가의 발현 구축물의 생성을 위한 방법 및 시약은 본 개시내용에 기반하여 관련 기술분야의 통상의 기술자에게 명백할 것이다. 일부 실시양태에서, 미세소포 생산 세포는 포유동물 세포, 예를 들어, 마우스 세포, 래트 세포, 햄스터 세포, 설치류 세포, 또는 비인간 영장류 세포이다. 일부 실시양태에서, 미세소포 생산 세포는 인간 세포이다.

관련 기술분야의 통상의 기술자는 통상적인 기술, 예컨대 분자 또는 세포 생물학, 바이러스학, 미생물학, 및 재조합 DNA 기술을 채용할 수 있다. 예시적인 기술은 문헌에 충분히 설명되어 있다. 예를 들어, 본 발명을 생성하고 사용하기 위해 하기 일반 텍스트에 의존할 수 있다: 문헌 [Sambrook et al., Molecular Cloning: A Laboratory Manual, Second Edition (1989) Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York], 및 [Sambrook et al. Third Edition (2001)]; [DNA Cloning: A Practical Approach, Volumes I and II (D.N. Glover ed. 1985)]; [Oligonucleotide Synthesis (M.J. Gaited. 1984)]; [Nucleic Acid Hybridization (B.D. Hames & S.J. Higgins eds. (1985))]; [Transcription and Translation Hames & Higgins, eds. (1984)]; [Animal Cell Culture (RI. Freshney, ed. (1986))]; [Immobilized Cells And Enzymes (IRL Press, (1986))]; [Gennaro et al. (eds.) Remington's Pharmaceutical Sciences, 18th edition]; [B. Perbal, A Practical Guide To Molecular Cloning (1984)]; [F.M. Ausubel et al. (eds.), Current Protocols in Molecular Biology, John Wiley & Sons, Inc.(updates through 2001)], [Coligan et al. (eds.), Current Protocols in Immunology, John Wiley & Sons, Inc.(updates through 2001)]; [W. Paul et al. (eds.) Fundamental Immunology, Raven Press]; [E.J. Murray et al. (ed.) Methods in Molecular Biology: Gene Transfer and Expression Protocols, The Humana Press Inc. (1991)(especially vol.7)]; 및 [J.E. Celis et al., Cell Biology: A Laboratory Handbook, Academic Press (1994)].

화물 단백질을 함유하는 ARMM의 전달

본원에 기재된 화물 단백질을 함유하는 본 발명 미세소포 (예를 들어, ARMM)는 표적화 모이어티를 추가로 가질 수 있다. 표적화 모이어티는 특이적 세포 유형에의 ARMM의 전달을 표적화하여, 특이적 표적화된 세포 유형의 세포질 내로의 ARMM의 내용물의 방출을 발생시키는데 사용될 수 있다. 표적화 모이어티는 표적 세포의 항원에 선택적으로 결합할 수 있다. 예를 들어, 표적화 모이어티는 막-결합된 이뮤노글로불린, 인테그린, 수용체, 수용체 리간드, 압타머, 소분자, 또는 그의 변이체일 수 있다. 임의의 수의 세포 표면 단백질은 또한 표적 세포에의 ARMM의 결합을 용이하게 하기 위해 및/또는 표적 세포 내로의 ARMM의 흡수를 용이하게 하기 위해 ARMM에 포함될 수 있다. 본 발명의 실시양태에 사용하는데 적합한 인테그린, 수용체 티로신 키나제, G-단백질 커플링된 수용체, 및 막-결합된 이뮤노글로불린은 관련 기술분야의 통상의 기술자에게 명백할 것이며, 본 발명은 이에 관하여 제한되지 않는다. 예를 들어, 일부 실시양태에서, 인테그린은 α1β1, α2β1, α4β1, α5β1, α6β1, αLβ2, αMβ2, αIIbβ3, αVβ3, αVβ5, αVβ6, 또는 α6β4 인테그린이다. 일부 실시양태에서, 수용체 티로신 키나제는 EGF 수용체 (ErbB 패밀리), 인슐린 수용체, PDGF 수용체, FGF 수용체, VEGF 수용체, HGF 수용체, Trk 수용체, Eph 수용체, AXL 수용체, LTK 수용체, TIE 수용체, ROR 수용체, DDR 수용체, RET 수용체, KLG 수용체, RYK 수용체, 또는 MuSK 수용체이다. 일부 실시양태에서, G-단백질 커플링된 수용체는 로돕신-유사 수용체, 세크레틴 수용체, 대사자극성 글루타메이트/페로몬 수용체, 시클릭 AMP 수용체, 프리즐드/스무든드 수용체, CXCR4 수용체, CCR5 수용체, 또는 베타-아드레날린성 수용체이다.

관련 기술분야에 공지된 임의의 수의 막-결합된 이뮤노글로불린은 임의의 수의 표적 세포 유형에의 화물 단백질을 함유하는 ARMM의 전달을 표적화하는 표적화 모이어티로서 사용될 수 있다. 특정 실시양태에서, 막-결합된 이뮤노글로불린 표적화 모이어티는 종양 연관된 또는 종양 특이적 항원에 결합한다. 종양 항원의 일부 비-제한적 예는 CA19-9, c-met, PD-1, CTLA-4, ALK, AFP, EGFR, 에스트로겐 수용체 (ER), 프로게스테론 수용체 (PR), HER2/neu, KIT, B-RAF, S100, MAGE, 티로글로불린, MUC-1, 및 PSMA를 포함한다 (문헌 [Bigbee W., et al. "Tumor markers and immunodiagnosis.", Cancer Medicine. 6th ed. Hamilton, Ontario, Canada: BC Decker Inc., 2003.]; [Andriole G, et al. "Mortality results from a randomized prostate-cancer screening trial.", New England Journal of Medicine, 360(13):1310-1319, 2009.]; [Schroeder FH, et al. "Screening and prostate-cancer mortality in a randomized European study." New England Journal of Medicine, 360(13):1320-1328, 2009.]; [Buys SS, et al. "Effect of screening on ovarian cancer mortality: the Prostate, Lung, Colorectal and Ovarian (PLCO) Cancer Screening Randomized Controlled Trial.", JAMA, 305(22):2295-2303, 2011]; [Cramer DW et al. "Ovarian cancer biomarker performance in prostate, lung, colorectal, and ovarian cancer screening trial specimens." Cancer Prevention Research, 4(3):365-374, 2011.]; [Roy DM, et al. "Candidate prognostic markers in breast cancer: focus on extracellular proteases and their inhibitors.", Breast Cancer. Jul 3;6:81-91, 2014.]; [Tykodi SS. et al. "PD-1 as an emerging therapeutic target in renal cell carcinoma: current evidence." Onco Targets Ther. Jul 25;7:1349-59, 2014.]; 및 [Weinberg RA. The Biology of Cancer, Garland Science, Taylor & Francis Group LLC, New York, NY, 2007.]; 각각의 전체 내용은 본원에 참조로 포함됨).

특정 실시양태에서, 막-결합된 이뮤노글로불린 표적화 모이어티는 특이적 세포 유형의 항원에 결합한다. 세포 유형은 줄기 세포, 예컨대 다능성 줄기 세포일 수 있다. 다능성 줄기 세포에 특이적인 항원의 일부 비-제한적 예는 배아 줄기 세포에서 초기 배아 발생 및 다능성 유지 둘 다에 필수적인 것으로 확인된 최초 단백질인 Oct4 및 나노그(Nanog)를 포함한다 (Nichols J, et al. "Formation of pluripotent stem cells in the mammalian embryo depends on the POU transcription factor Oct4.", Cell. 95:379-91, 1998; 그의 내용은 본원에 참조로 포함됨). Oct4, Sox2 및 나노그 외에도, Sall4, Dax1, Essrb, Tbx3, Tcl1, Rif1, Nac1 및 Zfp281을 포함한 많은 다른 다능성 줄기 세포 마커가 확인되었다 (Loh Y, et al. "The Oct4 and Nanog transcription network regulates pluripotency in mouse embryonic stem cells.", Nat Genet. 38:431-40, 2006). 막-결합된 이뮤노글로불린 표적화 모이어티는 또한 분화된 세포 유형의 항원에 결합할 수 있다. 예를 들어, 표적화 모이어티는 폐 상피 세포에의 ARMM 화물 단백질의 전달을 지정하는 폐 상피 세포에 대해 특이적인 항원에 결합할 수 있다. 비-제한적 예로서, 막-결합된 이뮤노글로불린 표적화 모이어티는 화물 단백질을 폐포 상피 유형 1 세포에 전달하는 폐포 상피 유형 1 세포 특이적 단백질 RTI₄₀ 또는 HTI₅₆에 결합할 수 있다 (McElroy MC et al. "The use of alveolar epithelial type I cell-selective markers to investigate lung injury and repair.", European Respiratory Journal 24:4, 664-673, 2004; 그의 전체 내용은 본원에 참조로 포함됨). 또 다른 예로서, 표적화 모이어티는 뮤신, 예컨대 muc5ac, 또는 muc5b에 결합할 수 있다. 본 출원에서 제공된 항원의 예는 제한적이지 않으며, 표적화 모이어티는 관련 기술분야에 공지된 임의의 세포 항원에 결합할 수 있는 임의의 모이어티일 수 있음이 인지되어야 한다.

본 발명의 일부 측면은 ARMM이 표적 세포에 의해 흡수되고, ARMM 흡수는 표적 세포의 세포질 내로의 ARMM의 내용물의 방출을 발생시킨다는 인식에 관한 것이다. 일부 실시양태에서, 융합 단백질은 표적 세포에서 바람직한 변화, 예를 들어, 세포 생존, 증식률의 변화, 분화 상태의 변화, 세포 신원의 변화, 염색질 상태의 변화, 1개 이상의 유전자의 전사율의 변화, 전사 프로파일의 변화, 또는 표적 세포의 유전자 압축의 전사후 변화에 영향을 미치는 작용제이다. 전달되는 작용제는 표적 세포에서의 바람직한 효과에 따라 선택될 것임이 관련 기술분야의 통상의 기술자에 의해 이해될 것이다.

표적 세포의 게놈은 본원에 개시된 전략 또는 방법을 통해 세포에 전달되는 뉴클레아제에 의해, 예를 들어, RNA-프로그램가능한 뉴클레아제 (예를 들어, Cas9), TALEN, 또는 아연-핑거 뉴클레아제, 또는 이러한 뉴클레아제의 복수 또는 조합에 의해 편집될 수 있다. 본 발명의 일부 비-제한적 측면은 ARMM이 예를 들어, 표적 세포를 전달되는 융합 단백질을 포함하는 ARMM과 접촉시킴으로써, ARMM에서의 적어도 1개의 WW 도메인, 또는 그의 변이체에 융합된 화물 단백질, 또는 Cas9 융합 단백질을 표적 세포 또는 표적 세포의 집단에 전달하는데 사용될 수 있다는 인식에 관한 것이다. 따라서, 본 발명의 일부 측면은 융합 단백질, 예를 들어, WW 도메인, 최소 ARRDC1단백질, 또는 그의 변이체, 또는 TSG101 단백질 또는 그의 변이체에 융합된 Cas9 단백질, 또는 그의 변이체를 포함하는 ARMM을 제공한다.

본원에 기재된 임의의 뉴클레아제, 또는 관련 기술분야에 공지된 임의의 뉴클레아제를 사용하여, 단일- 또는 이중-가닥 파단은 뉴클레아제에 의해 표적 세포의 게놈 내의 특이적 부위에서 도입되어, 표적화된 게놈 서열의 파괴를 발생시킬 수 있다. 일부 실시양태에서, 표적화된 게놈 서열은 유전자의 코딩 영역 내의 핵산 서열이다. 일부 실시양태에서, 뉴클레아제에 의해 도입된 가닥 파단은 코딩된 유전자 산물의 발현을 손상시키는 표적 유전자 내의 돌연변이를 초래한다. 일부 실시양태에서, 핵산은 뉴클레아제와 함께 세포에 공동-전달된다. 일부 실시양태에서, 핵산은 뉴클레아제 표적 부위에 인접한 서열과 동일하거나 상동인 서열을 포함한다. 일부 이러한 실시양태에서, 뉴클레아제에 의해 실행된 가닥 파단은 공동-전달된 핵산의 전부 또는 일부를 파단 부위에서의 세포 DNA 내로 도입하여, 공동-전달된 핵산, 또는 그의 일부의 표적화된 삽입을 발생시키는 세포 DNA 복구 기구에 의해 복구된다. 일부 실시양태에서, 삽입은 병리학적 대립유전자의 파괴 또는 복구를 발생시킨다. 일부 실시양태에서, 삽입은 적합한 검정, 예를 들어, DNA 시퀀싱 검정, 서던 블롯 검정, 또는 공동-전달된 핵산에 의해 코딩되는 리포터 유전자, 예를 들어, 형광 단백질 또는 항생제에 대한 저항성에 대한 검정에 의해 검출된다. 일부 실시양태에서, 핵산은 초하전된 단백질에의 회합에 의해 공동-전달된다. 일부 실시양태에서, 초하전된 단백질은 또한 기능적 이펙터 단백질, 예를 들어, 뉴클레아제에 회합된다. 일부 실시양태에서, 표적 세포에의 뉴클레아제의 전달은 유전자의 기능의 임상적으로 또는 치료적으로 유익한 파괴를 발생시킨다.

일부 실시양태에서, 대상체로부터의 세포가 얻어지고, 뉴클레아제는 생체외에서 본원에서 제공된 시스템 또는 방법에 의해 세포에 전달된다. 일부 실시양태에서, 처리된 세포는 바람직한 뉴클레아제-매개된 게놈 편집 사건이 실행된 세포에 대해 선택된다. 일부 실시양태에서, 바람직한 게놈 돌연변이 또는 변경을 운반하는 처리된 세포는 이들이 얻어진 대상체로 복귀된다.

특이적 서열을 표적화하는 뉴클레아제, 예를 들어, Cas9, TALE, 또는 아연 핑거 뉴클레아제의 조작, 생성, 및 단리, 및 특이적 표적 서열에서 세포 게놈을 편집하는 방법은 관련 기술분야에 널리 공지되어 있다 (예를 들어, 문헌 [Mani et al., Biochemical and Biophysical Research Communications 335:447-457, 2005]; [Perez et al., Nature Biotechnology 26:808-16, 2008]; [Kim et al., Genome Research, 19:1279-88, 2009]; [Urnov et al., Nature 435:646-51, 2005]; [Carroll et al., Gene Therapy 15:1463-68, 2005]; [Lombardo et al., Nature Biotechnology 25:1298-306, 2007]; [Kandavelou et al., Biochemical and Biophysical Research Communications 388:56-61, 2009]; 및 [Hockemeyer et al., Nature Biotechnology 27(9):851-59, 2009], 뿐만 아니라 각각의 뉴클레아제에 대한 각각의 섹션에 나열된 참고문헌 참조). 통상의 기술자는 본원에서 제공된 지침에 기반하여 본 개시내용의 맥락에서 사용하기 위한 적합한 방법을 확인할 수 있을 것이다.

또 다른 예로서, 표적 세포의 분화 단계를 증강시키기 위해, 예를 들어, 분화된 표적 세포를 배아 줄기 세포-유사 단계로 재프로그램하기 위해, 세포는 일부 실시양태에서, 적어도 1개의 WW 도메인, 또는 그의 변이체에 융합된 재프로그래밍 인자, 예를 들어, Oct4, Sox2, c-Myc, 및/또는 KLF4를 갖는 ARMM과 접촉된다. 유사하게, 표적 세포의 염색질 상태의 변화에 영향을 미치기 위해, 세포는 일부 실시양태에서, 적어도 1개의 WW 도메인, 또는 그의 변이체에 융합된 염색질 조정제, 예를 들어, DNA 메틸트랜스퍼라제, 또는 히스톤 데아세틸라제를 함유하는 ARMM과 접촉된다. 또 다른 예를 들어, 표적 세포의 생존이 감소되어야 하는 경우, 표적 세포는 일부 실시양태에서, 적어도 1개의 WW 도메인 또는 그의 변이체에 융합된 세포독성제, 예를 들어, 세포독성 단백질을 포함하는 ARMM과 접촉된다. ARMM 내로의 포함에 및 표적 세포 또는 표적 세포 집단에의 ARMM-매개된 전달에 적합한 추가의 작용제는 관련 기술분야의 통상의 기술자에게 명백할 것이며, 본 발명은 이에 관하여 제한되지 않는다.

일부 실시양태에서, 검출가능한 표지를 추가로 포함하는, WW 도메인, 또는 그의 변이체에 융합된 화물을 포함하는 ARMM이 제공된다. 이러한 ARMM은 유전자 조작 없이 표적 세포의 표지화를 허용한다. 표적 세포에의 직접적 전달에 적합한 검출가능한 표지는 관련 기술분야에 공지되어 있으며, 형광 단백질, 형광 염료, 막-결합된 염료, 및 효소, 예를 들어, 검출가능한 반응 산물을 발생시키는 반응을 촉매하는 막-결합된 또는 시토졸 효소를 포함하나 이에 제한되지는 않는다. 본 발명의 일부 측면에 따른 적합한 검출가능한 표지는 통상적으로 이용가능한 항체 또는 항원 결합제로 검출될 수 있는 막-결합된 항원, 예를 들어, 막-결합된 리간드를 추가로 포함한다.

일부 실시양태에서, 표적 세포에 전달되는 WW 도메인 또는 그의 변이체를 포함하는 단백질 또는 융합 단백질을 함유하는 WW 도메인을 포함하는 ARMM이 제공된다. 일부 실시양태에서, 융합 단백질은 전사 인자, 전사 억제제, 형광 단백질, 키나제, 포스파타제, 프로테아제, 리가제, 염색질 조정제, 또는 리콤비나제이거나 이를 포함한다. 일부 실시양태에서, 단백질은 치료 단백질이다. 일부 실시양태에서 단백질은 표적 세포의 상태 또는 신원의 변화에 영향을 미치는 단백질이다. 예를 들어, 일부 실시양태에서, 단백질은 재프로그래밍 인자이다. 적합한 전사 인자, 전사 억제제, 형광 단백질, 키나제, 포스파타제, 프로테아제, 리가제, 염색질 조정제, 리콤비나제, 및 재프로그래밍 인자는 ARMM 내로의 그들의 혼입을 용이하게 하는 1개 이상의 WW 도메인에 융합될 수 있고, 그들의 기능은 관련 기술분야의 통상의 기술자에게 공지된 임의의 방법에 의해 시험될 수 있으며, 본 발명은 이에 관하여 제한되지 않는다.

본원에 기재된 ARMM을 단리하는 방법이 또한 제공된다. 한 예시적인 방법은 미세소포-생산 세포를 포함하는 세포 배양물의 배양 배지, 또는 상청액을 수집하는 것을 포함한다. 일부 실시양태에서, 세포 배양물은 대상체로부터 얻어진 세포, 예를 들어, 병리학적 표현형, 예를 들어, 과다증식성 표현형을 나타낼 것으로 의심되는 세포를 포함한다. 일부 실시양태에서, 세포 배양물은 ARMM을 생산하는 유전자 조작된 세포, 예를 들어, 재조합 ARMM 단백질, 예를 들어, 재조합 ARRDC1 또는 TSG101 단백질, 예컨대 Cas9 단백질 또는 그의 변이체에 융합된 최소 ARRDC1 또는 TSG101 단백질을 발현하는 세포를 포함한다. 일부 실시양태에서, 상청액은 원심분리에 의해, 예를 들어, 증가하는 G 값 (예를 들어, 500G 및 2000G)의 2회의 연속적 원심분리에 의해 세포 데브리스가 사전-청소된다. 일부 실시양태에서, 방법은 상청액을 0.2 μm 필터를 통해 통과시키고, 세포 데브리스의 모든 큰 조각 및 전체 세포를 제거하는 것을 포함한다. 일부 실시양태에서, 상청액은 원심분리물의 부피에 따라, 예를 들어, 120,000G에서 2시간 동안 초원심분리로 처리된다. 얻어진 펠릿은 미세소포를 포함한다. 일부 실시양태에서, 엑소좀은 본원에 기재된 바와 같은 엑소좀 마커를 사용한 염색 및/또는 분류에 의해 (예를 들어, FACS 또는 MACS에 의해) 미세소포 펠릿으로부터 고갈된다. 단리된 또는 풍부화된 ARMM은 본원에 기재된 바와 같이 배양 배지 또는 적합한 완충제에 현탁될 수 있다.

화물의 미세소포-매개된 전달의 방법

본 발명의 일부 측면은 작용제, 예를 들어, WW 도메인에 융합된 화물 (예를 들어, WW 도메인에 융합된 Cas9 단백질)을 표적 세포에 전달하는 방법을 제공한다. 표적 세포는 상이한 방식으로 최소 ARRDC1을 포함하는 ARMM과 접촉될 수 있다. 예를 들어, 표적 세포는 본원에 기재된 바와 같은 ARMM과, 또는 미세소포 생산 세포로부터의 단리된 ARMM과 직접적으로 접촉될 수 있다. 접촉은 배양 디쉬에서 ARMM을 표적 세포에 투여함으로써 시험관내에서, 또는 ARMM을 대상체에게 투여함으로써 생체내에서 수행될 수 있다. 대안적으로, 표적 세포는 예를 들어, 표적 세포 및 미세소포 생산 세포를 공동-배양함으로써 시험관내에서, 또는 미세소포 생산 세포를 표적 세포를 함유하는 대상체에게 투여함으로써 생체내에서 본원에 기재된 바와 같은 미세소포 생산 세포와 접촉될 수 있다. 따라서, 방법은 표적 세포를 미세소포, 예를 들어, 본원에 기재된 바와 같은 전달되는 임의의 화물 단백질을 함유하는 ARMM과 접촉시키는 것을 포함할 수 있다. 표적 세포는 본원에 기재된 바와 같은 미세소포-생산 세포와, 또는 지질 이중층, 최소 ARRDC1 단백질 또는 그의 변이체, 및 화물 단백질을 갖는 단리된 미세소포와 접촉될 수 있다.

표적 세포는 임의의 기원의 것일 수 있음이 인지되어야 한다. 예를 들어, 표적 세포는 인간 세포일 수 있다. 표적 세포는 포유동물 세포일 수 있다. 포유동물 세포의 일부 비-제한적 예는 마우스 세포, 래트 세포, 햄스터 세포, 설치류 세포, 및 비인간 영장류 세포를 포함한다. 표적 세포는 임의의 세포 유형의 것일 수 있음이 또한 인지되어야 한다. 예를 들어, 표적 세포는 배아 줄기 세포, 유도 다능성 줄기 세포 (iPS 세포), 태아 줄기 세포, 제대혈 줄기 세포, 또는 성체 줄기 세포 (즉, 조직 특이적 줄기 세포)를 포함할 수 있는 줄기 세포일 수 있다. 다른 경우에, 표적 세포는 대상체에서 발견되는 임의의 분화된 세포 유형일 수 있다. 일부 실시양태에서, 표적 세포는 시험관내에서의 세포이고, 방법은 시험관내에서 미세소포를 세포에 투여하거나, 시험관내에서 표적 세포를 미세소포-생산 세포와 공동-배양하는 것을 포함한다. 일부 실시양태에서, 표적 세포는 대상체에서의 세포이고, 방법은 미세소포 또는 미세소포-생산 세포를 대상체에게 투여하는 것을 포함한다. 일부 실시양태에서, 대상체는 포유동물 대상체, 예를 들어, 설치류, 마우스, 래트, 햄스터, 또는 비-인간 영장류이다. 일부 실시양태에서, 대상체는 인간 대상체이다.

일부 실시양태에서, 표적 세포는 병리학적 세포이다. 일부 실시양태에서, 표적 세포는 암 세포이다. 일부 실시양태에서, 미세소포는 표적 세포의 표면 상의 항원에 선택적으로 결합하는 결합제와 회합된다. 일부 실시양태에서, 표적 세포의 항원은 세포 표면 항원이다. 일부 실시양태에서, 결합제는 막-결합된 이뮤노글로불린, 인테그린, 수용체, 또는 수용체 리간드이다. 예를 들어 특이적 표적 세포 유형의 표적 세포, 예를 들어 암 세포의 적합한 표면 항원은 이러한 항원에 특이적으로 결합하는 적합한 작용제인 바와 같이, 관련 기술분야의 통상의 기술자에게 공지되어 있다. 암 세포의 표면 상에 발현된 표면 항원에 특이적으로 결합하는 막-결합된 결합제, 예를 들어, 막-결합된 이뮤노글로불린, 예를 들어, 막-결합된 항체 또는 항체 단편을 생산하는 방법은 또한 관련 기술분야의 통상의 기술자에게 공지되어 있다. 결합제의 선택은 물론 표적 세포의 신원 또는 유형에 의존할 것이다. 막-결합된 결합제를 포함하는 ARMM에 의해 표적화될 수 있는 다양한 유형의 세포 상에 특이적으로 발현되는 세포 표면 항원은 관련 기술분야의 통상의 기술자에게 명백할 것이다. 본 발명은 이에 관하여 제한되지 않음이 인지될 것이다.

공동-배양 시스템

본 발명의 일부 측면은 적어도 2가지 유형의 세포: 미세소포 생산 세포 및 생산된 미세소포를 흡수하는 표적 세포를 갖는 시험관내 세포 배양 시스템을 제공한다. 따라서, 본원에서 제공된 공동-배양 시스템에서, 표적 세포에 대한 미세소포 (예를 들어, 최소 ARRDC1을 포함하는 ARMM)의 내용물의 셔플링이 있다. 이러한 공동-배양 시스템은 표적 세포의 유전자 조작 없이 표적 세포에서 미세소포 생산 세포에 의해 생성된 유전자 산물 또는 다수의 유전자 산물의 발현을 허용한다.

일부 실시양태에서, (a) (i) 이종 프로모터의 제어 하에서 화물 (예를 들어, 엔도뉴클레아제, 예컨대 Cas9 단백질 또는 그의 변이체)에 융합된 최소 ARRDC1 단백질, 또는 그의 변이체, 및/또는 (ii) 이종 프로모터의 제어 하에서 Cas9 단백질 또는 그의 변이체에 융합된 TSG101 단백질 또는 그의 변이체, 및/또는 (iii) WW 도메인에 융합된 화물 단백질을 코딩하는 재조합 발현 구축물을 갖는 미세소포-생산 세포 집단; 및 (b) 표적 세포 집단을 포함하는 공동-배양 시스템이 제공된다. 일부 실시양태에서, 최소 ARRDC1 변이체는 PSAP (서열식별번호: 122) 또는 PTAP (서열식별번호: 123) 모티프를 포함하고/거나, TSG101 변이체는 UEV 도메인을 포함한다. 일부 실시양태에서, 발현 구축물은 표적 부위에의 뉴클레아제 (예를 들어, Cas9 뉴클레아제)의 결합을 매개함으로써 뉴클레아제:RNA 복합체의 서열 특이성을 제공하는 표적 부위를 보완하는 뉴클레오티드 서열을 포함할 수 있는 가이드 RNA (gRNA)를 추가로 코딩한다. 일부 실시양태에서, 숙주 세포는 복수의 최소 ARRDC1:Cas9 융합 단백질 및/또는 TSG101:Cas9 융합 단백질 및/또는 WW 도메인에 융합된 화물 단백질을 코딩하는 복수의 발현 구축물을 포함한다.

본원에서 제공된 바와 같은 공동-배양 시스템의 한 예시적인 적용은 유전자 조작 없는 표적 세포의 프로그래밍 또는 재프로그래밍이다. 예를 들어, 일부 실시양태에서, 표적 세포는 분화된 세포, 예를 들어, 섬유모세포 세포이다. 일부 실시양태에서, 미세소포 생산 세포는 공급자 세포 또는 비-증식 세포이다. 일부 실시양태에서, 미세소포 생산 세포는 1개 이상의 WW 도메인에 융합된 재프로그래밍 인자, 또는 1개 이상의 WW 도메인에 융합된 복수의 재프로그래밍 인자를 포함하는 ARMM을 생산한다. 일부 실시양태에서, 미세소포 생산 세포와의 분화된 표적 세포의 공동-배양은 배아 상태로의 분화된 표적 세포의 재프로그래밍을 발생시킨다. 일부 실시양태에서, 미세소포 생산 세포와의 분화된 표적 세포의 공동-배양은 표적 세포의 원래 세포 상태와 상이한 분화된 세포 상태로의 표적 세포의 프로그래밍, 또는 직접교차-분화를 발생시킨다.

본원에서 제공된 바와 같은 공동-배양 시스템의 또 다른 예시적인 적용은 배아 줄기 세포의 지정된 분화이다. 일부 실시양태에서, 표적 세포는 비분화된 배아 줄기 세포이고, 미세소포 생산 세포는 1개 이상의 WW 도메인에 융합된 1종 이상의 분화 인자, 예를 들어, 바람직한 계통의 분화된 세포, 예를 들어 뉴런 세포, 또는 중간엽 세포로의 배아 줄기 세포의 분화를 촉발시키거나 용이하게 하는 신호전달 분자 또는 전사 인자를 발현한다.

본원에서 제공된 바와 같은 공동-배양 시스템의 추가의 또 다른 예시적인 적용은 비분화된 상태의 줄기 세포의, 예를 들어, 배아 줄기 세포의 또는 성체 줄기 세포의 유지이다. 일부 이러한 실시양태에서, 미세소포 생산 세포는 줄기 세포 유지를 촉진시키고/거나 줄기 세포 분화를 억제하는 1개 이상의 WW 도메인에 융합된 신호전달 분자 및/또는 전사 인자를 발현한다. 미세소포 생산 세포는 천연 발생 줄기 세포 니체를 모방하는 줄기 세포에 대한 미세환경을 생성할 수 있다.

배양 시스템의 미세소포-생산 세포는 본원에 기재된 임의의 ARMM을 생산할 수 있는 임의의 유형 또는 기원의 세포일 수 있다. 예를 들어, 미세소포-생산 세포는 포유동물 세포일 수 있으며, 그의 예는 설치류, 마우스, 래트, 햄스터, 또는 비-인간 영장류로부터의 세포를 포함하나 이에 제한되지는 않는다. 미세소포-생산 세포는 또한 인간으로부터의 것일 수 있다. ARMM을 생산할 수 있는 미세소포-생산 세포의 한 비-제한적 예는 인간 배아 신장 293T 세포이다. 미세소포-생산 세포는 증식 또는 비-증식 세포일 수 있다. 일부 실시양태에서, 미세소포-생산 세포는 배양에서 다른 세포의 성장을 지지하는 공급자 세포이다. 공급자 세포는 부착 기질, 영양분, 또는 배양에서 세포의 성장에 필요한 다른 인자를 제공할 수 있다.

배양 시스템의 표적 세포는 본원에 기재된 임의의 미세소포-생산 세포로부터의 ARMM과 접촉될 수 있는 임의의 유형 또는 기원의 세포일 수 있다. 예를 들어, 표적 세포는 포유동물 세포일 수 있으며, 그의 예는 설치류, 마우스, 래트, 햄스터, 또는 비-인간 영장류로부터의 세포를 포함하나 이에 제한되지는 않는다. 표적 세포는 또한 인간으로부터의 것일 수 있다. 표적 세포는 확립된 세포주 (예를 들어, 293T 세포), 또는 생체외에서 배양된 1차 세포 (예를 들어, 대상체로부터 얻어지고 배양에서 성장된 세포)로부터의 것일 수 있다. 표적 세포는 혈액 세포 (예를 들어, 조혈 줄기 세포, 백혈구, 혈소판 또는 적혈구), 또는 고형 조직으로부터의 세포, 예컨대 간 세포, 신장 세포, 폐 세포, 심장 세포, 뼈 세포, 피부 세포, 뇌 세포, 또는 대상체에서 발견되는 임의의 다른 세포일 수 있다. 대상체로부터 얻어진 세포는 미세소포-생산 세포로부터의 ARMM과 접촉되고, 이어서 동일한 또는 또 다른 대상체 내로 재-도입될 수 있다. 일부 실시양태에서, 표적 세포는 줄기 세포이다. 줄기 세포는 배아 및 배아외 세포 유형으로 분화될 수 있는 전능성 줄기 세포일 수 있다. 줄기 세포는 또한 다능성 줄기 세포, 다분화능 줄기 세포, 올리고분화능 줄기 세포 또는 단일분화능 줄기 세포일 수 있다. 다른 실시양태에서, 표적 세포는 분화된 세포이다.

유전자 편집 방법

본 발명의 일부 측면은 표적 세포를 본원에 기재된 임의의 RNA-프로그램가능한 융합 단백질 (즉, Cas9 융합 단백질)을 함유하는 ARMM과 접촉시키는 것에 의한 유전자 편집을 위한 방법을 제공한다. 본 발명의 다른 측면은 표적 세포를 본원에 기재된 임의의 RNA-프로그램가능한 융합 단백질을 코딩하는 재조합 발현 구축물을 포함하는 미세소포-생산 세포와 접촉시키는 것에 의한 유전자 편집을 위한 방법을 제공한다. RNA-가이드된 또는 RNA-프로그램가능한 융합 단백질은 본원에서 제공된 임의의 시스템 또는 방법에 의해 표적 세포에 전달될 수 있다. 예를 들어, RNA-프로그램가능한 융합 단백질은 본원에서 제공된 시스템 또는 방법에 의해 표적 세포에 전달될 수 있는 Cas9 뉴클레아제, 또는 그의 변이체, 1개 이상의 WW 도메인, 또는 그의 변이체, 또는 임의로 1개 이상의 NLS를 함유할 수 있다.

일부 실시양태에서, RNA-프로그램가능한 뉴클레아제는 본원에 기재된 임의의 Cas9 융합 단백질을 포함한다. RNA-프로그램가능한 뉴클레아제 (즉, Cas9)는 RNA:DNA 혼성화를 사용하여 표적 DNA 절단 부위를 결정하기 때문에, 이들 단백질은 원칙적으로 가이드 RNA에 의해 특정된 임의의 서열을 절단할 수 있다. 부위-특이적 절단을 위한 (예를 들어, 게놈을 변형시키기 위한) RNA-프로그램가능한 뉴클레아제, 예컨대 Cas9를 사용하는 방법은 관련 기술분야에 공지되어 있다 (예를 들어, 문헌 [Cong, L. et al. Multiplex genome engineering using CRISPR/Cas systems. Science 339, 819-823 (2013)]; [Mali, P. et al. RNA-guided human genome engineering via Cas9. Science 339, 823-826 (2013)]; [Hwang, W.Y. et al. Efficient genome editing in zebrafish using a CRISPR-Cas system. Nature biotechnology 31, 227-229 (2013)]; [Jinek, M. et al. RNA-programmed genome editing in human cells. eLife 2, e00471 (2013)]; [Dicarlo, J.E. et al. Genome engineering in Saccharomyces cerevisiae using CRISPR-Cas systems. Nucleic acids research (2013)]; [Jiang, W. et al. RNA-guided editing of bacterial genomes using CRISPR-Cas systems. Nature biotechnology 31, 233-239 (2013)] 참조; 그의 각각의 전체 내용은 본원에 참조로 포함됨).

본 개시내용의 일부 측면은 gRNA에 결합할 수 있고, 이는 다시 표적 핵산 서열에 결합하는 RNA-가이드된 또는 RNA-프로그램가능한 융합 단백질 (즉, Cas9 단백질, 또는 Cas9 변이체); 및 DNA-편집 도메인을 갖는 융합 단백질을 제공한다. DNA-편집 도메인의 일부 비-제한적 예는 뉴클레아제, 니카제, 리콤비나제 또는 데아미나제를 포함하나 이에 제한되지는 않는다. 한 예로서, 핵염기, 예컨대, 예를 들어, 시티딘을 탈아미노화할 수 있는 데아미나제 도메인은 RNA-가이드된 또는 RNA-프로그램가능한 융합 단백질에 융합된다. 일부 실시양태에서, 데아미나제는 본원에 기재된 임의의 Cas9 융합 단백질에 융합된다. 데아미나제에 의한 핵염기의 탈아미노화는 각각의 잔기에서 점 돌연변이를 초래할 수 있으며, 이는 본원에서 핵산 편집으로 지칭된다. 따라서 Cas9 단백질 또는 Cas9 변이체, DNA 편집 도메인, 및 ARMM 내로의 화물 단백질의 혼입을 용이하게 할 수 있는 단백질 (예를 들어, WW 도메인, 최소 ARRDC1 단백질, 또는 TSG101 단백질)을 갖는 화물 단백질은 핵산 서열의 표적화된 편집에 사용될 수 있다. 관련 기술분야에 공지된 임의의 수의 DNA 편집 도메인 (예를 들어, 뉴클레아제, 니카제, 리콤비나제 및 데아미나제)은 (i) RNA-가이드된 또는 RNA-프로그램가능한 융합 단백질 (예를 들어, Cas9 또는 Cas9 변이체), 및 (ii) 1개 이상의 WW 도메인 또는 WW 도메인 변이체, 또는 (iii) 최소 ARRDC1 단백질, 또는 그의 변이체, 또는 (iv) TSG101 단백질, 또는 그의 변이체에 융합될 수 있음이 인지되어야 한다. 이러한 융합 단백질은 시험관내에서 DNA의 표적화된 편집에, 예를 들어, 돌연변이체 세포 또는 동물의 생성에; 표적화된 돌연변이의 도입에, 예를 들어, 이어서 동일한 또는 또 다른 대상체 내로 재-도입되는 생체외에서의 세포에서, 예를 들어, 대상체로부터 얻어진 세포에서, 유전적 결함의 교정에; 및 표적화된 돌연변이의 도입, 예를 들어, 대상체에서 유전적 결함의 교정 또는 질환-연관된 유전자에서의 탈활성화 돌연변이의 도입에 유용하다. 본원에 기재된 임의의 화물 단백질은 생체내에서 DNA의 표적화된 편집에, 예를 들어, 대상체에서 돌연변이체 세포의 생성에 유용함이 또한 인지되어야 한다. 본원에 기재된 임의의 융합 단백질을 함유하는 ARMM의 전달은 본원에 기재된 임의의 방법 또는 시스템에 의해 대상체에게 투여될 수 있다.

본원에 기재된 유전자 편집의 방법은 유전적 결함의 교정, 예를 들어, 유전자 산물에서 기능의 소실을 초래하는 점 돌연변이의 교정을 발생시킬 수 있다. 일부 실시양태에서, 유전적 결함은 질환 또는 장애, 예를 들어, 리소좀 저장 장애 또는 대사 질환, 예컨대, 예를 들어, 제I형 당뇨병과 연관된다. 일부 실시양태에서, 본원에서 제공된 방법은 질환 또는 장애와 연관된 유전자 산물을 코딩하는 유전자 또는 대립유전자 내로 탈활성화 점 돌연변이를 도입하는데 사용된다. 예를 들어, 일부 실시양태에서, DNA 편집 화물 단백질 및 적어도 1개의 WW 도메인, 또는 그의 변이체, 또는 최소 ARRDC1 단백질, 또는 그의 변이체, 또는 TSG101 단백질, 또는 그의 변이체에 융합된 RNA-가이드된 또는 RNA-프로그램가능한 융합 단백질 (즉, Cas9 단백질, 또는 Cas9 변이체)을 채용하여 종양유전자 내로 탈활성화 점 돌연변이를 도입하는 방법이 본원에서 제공된다. 탈활성화 돌연변이는 일부 실시양태에서, 전장 단백질의 기능을 결여한 말단절단된 유전자 산물, 예를 들어, 말단절단된 단백질의 발현을 발생시키는 코딩 서열에서 조숙한 정지 코돈을 생성할 수 있다.

본원에서 제공된 방법의 목적은 게놈 편집을 통해 기능이상 유전자의 기능을 복원시키는데 사용될 수 있다. 본원에서 제공된 화물 단백질은 예를 들어, 인간 세포 배양물에서 질환-연관된 돌연변이를 교정함으로써, 시험관내에서 유전자 편집-기반 인간 치료제에 대해 확인될 수 있다. 본원에서 제공된 화물 단백질, 예를 들어, Cas9 단백질 또는 Cas9 변이체, 핵산 편집 도메인, 및 적어도 1개의 WW 도메인 또는 최소 ARRDC1 단백질 또는 TSG101 단백질을 포함하는 융합 단백질은 임의의 단일 점 T>C 또는 A>G 돌연변이를 교정하는데 사용될 수 있음이 통상의 기술자에 의해 이해될 것이다. 예를 들어, 돌연변이체 C의 다시 U로의 탈아미노화는 돌연변이를 교정하고, 후자의 경우에, 돌연변이체 G와 염기-쌍형성된 C의 탈아미노화, 이어서 복제의 라운드는 돌연변이를 교정한다.

시험관내에서 또는 생체내에서 본원에서 제공된 화물 단백질에 의해 교정될 수 있는 예시적인 질환-관련 돌연변이는 PIK3CA 단백질에서의 H1047R (A3140G) 다형성이다. 포스포이노시티드-3-키나제, 촉매 알파 서브유닛 (PIK3CA) 단백질은 포스파티딜이노시톨의 이노시톨 고리의 3-OH 기를 인산화하도록 작용한다. PIK3CA 유전자는 많은 상이한 암종에서 돌연변이되는 것으로 밝혀졌으며, 따라서 이는 매우 강력한 종양유전자인 것으로 간주된다 (Lee JWet al. "PIK3CA gene is frequently mutated in breast carcinomas and hepatocellular carcinomas.", Oncogene. 2005; 24(8):1477-80; 그의 전체 내용은 본원에 참조로 포함됨). 사실, A3140G 돌연변이는 아메리칸 타입 컬쳐 콜렉션(American Type Culture Collection) (ATCC)으로부터 용이하게 입수가능한 몇몇 NCI-60 암 세포주, 예컨대 HCT116, SKOV3, 및 T47D 세포주에 존재한다 (Ikediobi ON et al. "Mutation analysis of 24 known cancer genes in the NCI-60 cell line set.", Mol Cancer Ther. 2006; 5(11):2606-12).

일부 실시양태에서, 교정될 돌연변이를 운반하는 세포, 예를 들어, PIK3CA 단백질에서 H1047R 또는 A3140G 치환을 발생시키는 점 돌연변이를 운반하는 세포는 (ii) 적어도 1개의 WW 도메인 또는 그의 변이체, 또는 최소 ARRDC1 단백질 또는 그의 변이체, 또는 TSG101 단백질 또는 그의 변이체에 융합된 (i) Cas9 단백질 또는 Cas9 변이체, (iii) 데아미나제 융합 단백질 및 융합 단백질을 코딩 PIK3CA 유전자에서 각각의 돌연변이 부위에 표적화하는 적절하게 디자인된 gRNA를 함유하는 ARMM과 접촉된다. gRNA가 융합 단백질을 PIK3CA 유전자 내에 있는 비-C 잔기에 표적화하도록 디자인된 대조 실험이 수행될 수 있다. 처리된 세포의 게놈 DNA를 추출하고, PIK3CA 유전자의 관련 서열을 PCR 증폭시키고, 시퀀싱하여 인간 세포 배양물에서 융합 단백질의 활성을 평가할 수 있다.

PIK3CA에서 점 돌연변이를 교정하는 예는 예시 목적을 위해 제공되며, 본 개시내용을 제한하는 것으로 의미되지 않음이 이해될 것이다. 통상의 기술자는 본원에 기재된 본 개시된 DNA-편집 화물 단백질이 다른 점 돌연변이 및 다른 암과 및 암 이외의 질환과 연관된 돌연변이를 교정하는데 사용될 수 있음을 이해할 것이다.

본원에 기재된 임의의 ARMM 또는 융합 단백질을 사용한 질환-연관된 유전자 및 대립유전자에서의 돌연변이의 성공적인 교정은 질환 치료제 및 유전자 연구에서의 적용을 갖는 유전자 교정을 위한 새로운 전략을 열고 있다. DNA-편집 도메인 및 적어도 1개의 WW 단백질 또는 최소 ARRDC1 단백질 또는 TSG101 단백질에 융합된 개시된 Cas9 변이체와 같은 부위-특이적 뉴클레오티드 변형 단백질은 또한 유전자 기능이 의도적으로 억제되거나 없어진 "역" 유전자 요법에서의 적용을 갖는다. 이들 경우에, Trp (TGG), Gln (CAA 및 CAG), 또는 Arg (CGA) 잔기를 조숙한 정지 코돈 (TAA, TAG, TGA)으로 부위-특이적으로 돌연변이시키는 것은 시험관내에서, 생체외에서, 또는 생체내에서 단백질 기능을 없애는데 사용될 수 있다.

본 개시내용은 본원에서 제공된 임의의 DNA 편집 화물 단백질에 의해 교정될 수 있는 돌연변이와 연관되거나 그에 의해 유발되는 질환으로 진단된 대상체의 치료를 위한 방법을 제공한다. 예를 들어, 일부 실시양태에서, 점 돌연변이를 교정하거나 탈활성화 돌연변이를 질환-연관된 유전자 내로 도입하는 본원에 기재된 임의의 화물 단백질을 함유하는 ARMM의 유효량을 상기 기재된 바와 같은 이러한 질환 (예를 들어, PIK3CA 점 돌연변이와 연관된 암)을 갖는 대상체에게 투여하는 것을 포함하는 방법이 제공된다. 본 발명 ARMM은 본원에 기재된 임의의 표적 세포에의 본원에 기재된 임의의 화물 단백질의 전달을 표적화하는데 사용될 수 있음이 인지되어야 한다. 일부 실시양태에서, 질환은 신생물성 질환이다. 일부 실시양태에서, 질환은 대사 질환이다. 일부 실시양태에서, 질환은 리소좀 저장 질환이다. 돌연변이를 교정하거나 탈활성화 돌연변이를 질환-연관된 유전자 내로 도입함으로써 치료될 수 있는 다른 질환은 관련 기술분야의 통상의 기술자에게 공지되어 있을 것이며, 본 개시내용은 이에 관하여 제한되지 않는다.

일부 실시양태에서, 표적 세포의 게놈은 본원에 개시된 시스템 또는 방법을 통해 표적 세포에 전달되는 뉴클레아제에 의해, 예를 들어, 본원에 기재된 임의의 ARMM 또는 ARMM 생산 세포를 사용하여 임의의 Cas9 융합 단백질을 전달함으로써 편집된다. 일부 실시양태에서, 단일- 또는 이중-가닥 파단은 Cas9 단백질에 의해 표적 세포의 게놈 내의 특이적 부위에서 도입되어, 표적화된 게놈 서열의 파괴를 발생시킨다. 일부 실시양태에서, 표적화된 게놈 서열은 유전자의 코딩 영역 내의 핵산 서열이다. 일부 실시양태에서, 표적화된 게놈 서열은 유전자의 코딩 영역 외부의 핵산 서열이며, 예를 들어, 표적화된 게놈 서열은 유전자의 프로모터 영역 내에 있을 수 있다. 일부 실시양태에서, 뉴클레아제에 의해 도입된 가닥 파단은 코딩된 유전자 산물의 발현을 손상시키는 표적 유전자 내의 돌연변이를 초래한다.

핵산 (예를 들어, gRNA)은 DNA 편집 도메인 및 적어도 1개의 WW 도메인, 또는 그의 변이체, 또는 최소 ARRDC1 단백질, 또는 그의 변이체, 또는 TSG101 단백질, 또는 그의 변이체에 융합된 RNA-가이드된 단백질 (예를 들어, Cas9 단백질, 또는 Cas9 변이체)과 회합될 수 있다. 전형적으로, gRNA는 표적 부위를 보완하는 뉴클레오티드 서열을 함유하며, 이는 표적 부위에의 단백질:RNA 복합체의 결합을 매개하고, 단백질:RNA 복합체의 서열 특이성을 제공한다. 따라서, 핵산 (예를 들어, gRNA)은 본원에 기재된 임의의 RNA-가이드된 융합 단백질에 표적 서열 특이성을 부여하기 위해, 본원에 기재된 임의의 화물 단백질과 공동-발현될 수 있다. 한 비-제한적 예로서, WW 도메인에 융합된 Cas9 변이체는 gRNA가 Cas9 융합 단백질과 회합하고, gRNA와 복합체로 Cas9 융합 단백질이 ARMM 내로 로딩되도록 세포에서 gRNA와 공동-발현될 수 있다. 일부 실시양태에서, 핵산은 뉴클레아제 표적 부위에 인접한 서열과 동일하거나 상동인 서열을 갖는다. 일부 이러한 실시양태에서, 뉴클레아제에 의해 실행된 가닥 파단은 공동-전달된 핵산의 전부 또는 일부를 파단 부위에서의 세포 DNA 내로 도입하여, 공동-전달된 핵산, 또는 그의 일부의 표적화된 삽입을 발생시키는 세포 DNA 복구 기구에 의해 복구된다. 일부 실시양태에서, 삽입은 병리학적 대립유전자의 파괴 또는 복구를 발생시킨다.

특정 실시양태에서, 촉매적으로 불활성인 Cas9 융합 단백질은 (그의 gRNA-결합 능력을 보유하는) 불활성 효소를 공지된 조절 도메인에 융합시킴으로써 유전자 발현을 활성화시키거나 억제하는데 사용된다. 유전자 발현을 제어하는데 사용될 수 있는 Cas9 변이체는 예를 들어, 우 에프.(Wu F.) 등에 의해 2014년 3월 17일에 출원된, 발명의 명칭이 게놈 변형 및 유전자 조정을 위한 Crispr/cas 시스템인 미국 특허 출원 번호 USSN 14/216,655 (US 2014-0273226 A1으로서 공개됨)에, 및 장 에프.(Zhang F.) 등에 의해 2013년 12월 12일에 출원된, 발명의 명칭이 기능적 도메인으로의 서열 조작을 위한 시스템, 방법 및 조성물의 조작 및 최적화인 PCT 출원 번호 PCT/US2013/074736 (WO 2014/093655 A2로서 공개됨)에 상세하게 기재되었으며; 각각의 전체 내용은 본원에 참조로 포함된다. 예를 들어, 촉매적으로 불활성인 Cas9 융합 단백질은 전사 활성화제 (예를 들어 VP64)에 융합될 수 있다. 특정 실시양태에서, 본원에 기재된 임의의 Cas9 융합 단백질은 전사 활성화제에 융합되는 경우 표적화된 유전자의 유전자 전사를 상향-조절하여 발현을 증진시킬 수 있다. 일부 실시양태에서, 촉매적으로 불활성인 Cas9 융합 단백질은 전사 억제제 (예를 들어 KRAB)에 융합될 수 있다. 특정 실시양태에서, 본원에 기재된 임의의 Cas9 융합 단백질은 전사 억제제에 융합되어 표적화된 유전자의 유전자 전사를 하향-조절하여 발현을 감소시킬 수 있다. 일부 실시양태에서, 표적 세포에의 뉴클레아제의 전달은 유전자의 기능의 임상적으로 또는 치료적으로 유익한 파괴 또는 증진을 발생시킨다. 본원에 기재된 방법은 제한적인 것으로 의미되지 않으며, 관련 기술분야에 널리 공지된 Cas9를 사용하는 임의의 방법을 포함할 수 있음이 인지되어야 한다.

본 발명의 이들 및 다른 실시양태의 기능 및 이점은 하기 실시예로부터 보다 완전히 이해될 것이다. 하기 실시예는 본 발명의 이익을 예시하고 특정 실시양태를 기재하는 것으로 의도되지만, 본 발명의 완전한 범위를 예시하는 것으로 의도되지 않는다. 따라서, 실시예는 본 발명의 범위를 제한하는 것으로 의미되지 않음이 이해될 것이다.

실시예

실시예 1: 최소 ARRDC1은 전장 ARRDC1 단백질만큼 효율적으로 ARMM 형성 및 버딩을 유도한다

아레스틴 도메인, PSAP (서열식별번호: 122) 모티프 및 2개의 PPXY 모티프를 함유하는 ARRDC1 구축물을 제조하였다. 이 "최소" ARRDC1은 약 330개 아미노산 길이이다 (전장 ARRDC1보다 100개의 아미노산이 더 짧음) (도 1 및 도 5). HEK293T 세포에서 발현되는 경우, 최소 ARRDC1은 전장 ARRDC1만큼 효율적으로 EV로 버딩한다 (도 2b). 음성 대조군으로서, 유사한 크기의 것이지만 N-말단 아레스틴 도메인의 일부를 결여한 또 다른 ARRDC1 구축물은 버딩하지 않았다. 중요하게는, 최소 ARRDC1 발현에 의해 생성된 세포외 소포의 수는 전장 ARRDC1의 그것과 필적한다 (도 2c). 이들 데이터는 최소 ARRDC1이 전장 ARRDC1 단백질만큼 효율적으로 ARMM 형성 및 버딩을 유도할 수 있음을 지시한다.

실시예 2: ARMM 내로 화물을 패키징하는데 있어서 최소 ARRDC1

ARMM 내로 화물을 패키징하는데 있어서 최소 ARRDC1의 능력을 시험하였다. Cas9 단백질에의 최소 ARRDC1의 융합 구축물 (도 3a)을 제조하였다. HEK293T 세포에서 발현되는 경우, 미니ARRDC1-Cas9 단백질은 세포외 소포 (EV)로 버딩할 수 있는 반면, 전장 ARRDC1에의 Cas9 융합은 버딩하지 않았다 (도 3b). 더욱이, Cas9와 회합된 가이드 RNA (gRNA)는 대조군 Cas9보다 미니ARRDC1-Cas9 융합 단백질로부터 생산된 ARMM에서 훨씬 더 풍부화되었다. 중요하게는, 미니ARRDC1-Cas9 융합 단백질은 GFP DNA 로커스를 표적화하는 검정에 의해 입증된 바와 같이 효율적인 유전자 편집 활성을 유지한다 (도 4). 이들 결과는 최소 ARRDC1이 Cas9 및 회합된 gRNA를 지정을 통해 ARMM 내로 패키징할 수 있음을 지시한다.

상기 열거된 항목을 포함한 본원에 언급된 모든 간행물, 특허 및 서열 데이터베이스 엔트리는 각각의 개별적 간행물 또는 특허가 구체적으로 및 개별적으로 참조로 포함되는 것으로 지시된 것처럼 그 전문이 본원에 참조로 포함된다. 상충되는 경우, 본원의 임의의 정의를 포함한 본 출원이 지배할 것이다.

등가물 및 범위

관련 기술분야의 통상의 기술자는 통상적인 실험 이하를 사용하여, 본원에 기재된 본 발명의 구체적인 실시양태에 대한 많은 등가물을 인식하거나, 확인할 수 있을 것이다. 본 발명의 범위는 상기 설명에 제한되는 것으로 의도되지 않으며, 오히려 첨부된 청구항에 제시된 바와 같다.

청구항에서 단수형은 반대로 지시되거나 다르게는 맥락으로부터 명백하지 않는 한, 하나 또는 하나 초과를 의미할 수 있다. 군의 하나 이상의 구성원 사이에 "또는"을 포함하는 청구항 또는 설명은 반대로 지시되거나 다르게는 맥락으로부터 명백하지 않는 한, 군 구성원의 하나, 하나 초과, 또는 전부가 주어진 산물 또는 프로세스에 존재하거나, 그에 채용되거나, 다르게는 그와 관련되는 경우 충족되는 것으로 간주된다. 본 발명은 군의 정확하게 하나의 구성원이 주어진 산물 또는 프로세스에 존재하거나, 그에 채용되거나, 다르게는 그와 관련되는 실시양태를 포함한다. 본 발명은 또한 군의 하나 초과, 또는 전부가 주어진 산물 또는 프로세스에 존재하거나, 그에 채용되거나, 다르게는 그와 관련되는 실시양태를 포함한다.

더욱이, 본 발명은 청구항 중 하나 이상으로부터 또는 설명의 관련 부분으로부터 하나 이상의 제한, 요소, 조항, 설명적 용어 등이 또 다른 청구항 내로 도입되는 모든 변형, 조합, 및 순열을 포괄함이 이해되어야 한다. 예를 들어, 또 다른 청구항에 종속하는 임의의 청구항은 동일한 기초 청구항에 종속하는 임의의 다른 청구항에서 발견되는 하나 이상의 제한을 포함하도록 변형될 수 있다. 더욱이, 청구항이 조성물을 나열하는 경우, 달리 지시되지 않는 한, 또는 그것이 모순 또는 불일치가 발생할 것으로 관련 기술분야의 통상의 기술자에게 명백할 것이지 않는 한, 본원에 개시된 임의의 목적을 위해 조성물을 사용하는 방법이 포함되고, 본원에 개시된 임의의 제조 방법 또는 관련 기술분야에 공지된 다른 방법에 따라 조성물을 제조하는 방법이 포함됨이 이해되어야 한다.

요소가 목록으로서 제시되는 경우, 예를 들어, 마쿠시 군 형식에서, 요소의 각각의 하위군이 또한 개시되고, 임의의 요소(들)는 군으로부터 제거될 수 있음이 이해되어야 한다. 용어 "포함하는"은 개방적인 것으로 의도되며, 추가의 요소 또는 단계의 포함을 허용함이 또한 주목된다. 일반적으로, 본 발명, 또는 본 발명의 측면이 특정 요소, 특색, 단계 등을 포함하는 것으로 지칭되는 경우, 본 발명 또는 본 발명의 측면의 특정 실시양태는 이러한 요소, 특색, 단계 등으로 이루어지거나, 이로 본질적으로 이루어짐이 이해되어야 한다. 간결함의 목적을 위해 그들 실시양태는 본원에 문자 그대로 구체적으로 제시되지는 않았다. 따라서, 하나 이상의 요소, 특색, 단계 등을 포함하는 본 발명의 각각의 실시양태에 대해, 본 발명은 또한 그들 요소, 특색, 단계 등으로 이루어지거나 이로 본질적으로 이루어진 실시양태를 제공한다.

범위가 주어지는 경우, 종점이 포함된다. 더욱이, 달리 지시되거나 다르게는 맥락 및/또는 관련 기술분야의 통상의 기술자의 이해로부터 명백하지 않는 한, 범위로서 표현된 값은 본 발명의 상이한 실시양태에서 언급된 범위 내의 임의의 구체적인 값을 맥락이 달리 명백하게 나타내지 않는 한, 범위의 하한의 단위의 1/10까지 가정할 수 있음이 이해되어야 한다. 달리 지시되거나 다르게는 맥락 및/또는 관련 기술분야의 통상의 기술자의 이해로부터 명백하지 않는 한, 범위로서 표현된 값은 주어진 범위 내의 임의의 하위범위를 가정할 수 있음이 또한 이해되어야 하고, 여기서 하위범위의 종점은 범위의 하한의 단위의 1/10과 동일한 정확성의 정도까지 표현된다.

또한, 본 발명의 임의의 특정 실시양태는 청구항 중 임의의 하나 이상으로부터 명백하게 배제될 수 있음이 이해되어야 한다. 범위가 주어지는 경우, 범위 내의 임의의 값은 청구항 중 임의의 하나 이상으로부터 명백하게 배제될 수 있다. 본 발명의 조성물 및/또는 방법의 임의의 실시양태, 요소, 특색, 적용, 또는 측면은 임의의 하나 이상의 청구항으로부터 배제될 수 있다. 간결성의 목적을 위해, 하나 이상의 요소, 특색, 목적, 또는 측면이 배제된 모든 실시양태는 본원에서 명백하게 제시되지 않는다.

SEQUENCE LISTING <110> President and Fellows of Harvard College <120> MINIMAL ARRESTIN DOMAIN CONTAINING PROTEIN 1(ARRDC1) CONSTRUCTS <130> H0824.70331WO00 <140> Not Yet Assigned <141> Concurrently Herewith <150> US 62/906,685 <151> 2019-09-26 <160> 124 <170> PatentIn version 3.5 <210> 1 <211> 330 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 1 Met Gly Arg Val Gln Leu Phe Glu Ile Ser Leu Ser His Gly Arg Val 1 5 10 15 Val Tyr Ser Pro Gly Glu Pro Leu Ala Gly Thr Val Arg Val Arg Leu 20 25 30 Gly Ala Pro Leu Pro Phe Arg Ala Ile Arg Val Thr Cys Ile Gly Ser 35 40 45 Cys Gly Val Ser Asn Lys Ala Asn Asp Thr Ala Trp Val Val Glu Glu 50 55 60 Gly Tyr Phe Asn Ser Ser Leu Ser Leu Ala Asp Lys Gly Ser Leu Pro 65 70 75 80 Ala Gly Glu His Ser Phe Pro Phe Gln Phe Leu Leu Pro Ala Thr Ala 85 90 95 Pro Thr Ser Phe Glu Gly Pro Phe Gly Lys Ile Val His Gln Val Arg 100 105 110 Ala Ala Ile His Thr Pro Arg Phe Ser Lys Asp His Lys Cys Ser Leu 115 120 125 Val Phe Tyr Ile Leu Ser Pro Leu Asn Leu Asn Ser Ile Pro Asp Ile 130 135 140 Glu Gln Pro Asn Val Ala Ser Ala Thr Lys Lys Phe Ser Tyr Lys Leu 145 150 155 160 Val Lys Thr Gly Ser Val Val Leu Thr Ala Ser Thr Asp Leu Arg Gly 165 170 175 Tyr Val Val Gly Gln Ala Leu Gln Leu His Ala Asp Val Glu Asn Gln 180 185 190 Ser Gly Lys Asp Thr Ser Pro Val Val Ala Ser Leu Leu Gln Lys Val 195 200 205 Ser Tyr Lys Ala Lys Arg Trp Ile His Asp Val Arg Thr Ile Ala Glu 210 215 220 Val Glu Gly Ala Gly Val Lys Ala Trp Arg Arg Ala Gln Trp His Glu 225 230 235 240 Gln Ile Leu Val Pro Ala Leu Pro Gln Ser Ala Leu Pro Gly Cys Ser 245 250 255 Leu Ile His Ile Asp Tyr Tyr Leu Gln Val Ser Leu Lys Ala Pro Glu 260 265 270 Ala Thr Val Thr Leu Pro Val Phe Ile Gly Asn Ile Ala Val Asn His 275 280 285 Ala Pro Val Ser Pro Arg Pro Gly Leu Gly Leu Pro Pro Gly Ala Pro 290 295 300 Pro Leu Val Val Pro Ser Ala Pro Pro Gln Glu Glu Ala Glu Pro Pro 305 310 315 320 Glu Tyr Pro Tyr Glu Ala Pro Pro Ser Tyr 325 330 <210> 2 <211> 1367 <212> PRT <213> Streptococcus pyogenes <400> 2 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Asp Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Gly Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Ala Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Ile Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Arg Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Arg Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Ser Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Ala Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Gly Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly His Ser Leu 705 710 715 720 His Glu Gln Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Ile Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr 755 760 765 Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu 770 775 780 Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val 785 790 795 800 Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln 805 810 815 Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu 820 825 830 Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Ile Lys Asp 835 840 845 Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly 850 855 860 Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn 865 870 875 880 Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 885 890 895 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys 900 905 910 Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys 915 920 925 His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu 930 935 940 Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys 945 950 955 960 Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu 965 970 975 Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val 980 985 990 Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val 995 1000 1005 Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys 1010 1015 1020 Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr 1025 1030 1035 Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn 1040 1045 1050 Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr 1055 1060 1065 Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg 1070 1075 1080 Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu 1085 1090 1095 Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg 1100 1105 1110 Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys 1115 1120 1125 Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu 1130 1135 1140 Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser 1145 1150 1155 Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe 1160 1165 1170 Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu 1175 1180 1185 Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe 1190 1195 1200 Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu 1205 1210 1215 Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn 1220 1225 1230 Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro 1235 1240 1245 Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His 1250 1255 1260 Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg 1265 1270 1275 Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr 1280 1285 1290 Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile 1295 1300 1305 Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe 1310 1315 1320 Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr 1325 1330 1335 Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly 1340 1345 1350 Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 3 <211> 4212 <212> DNA <213> Homo Sapiens <400> 3 atggataaaa agtattctat tggtttagac atcggcacta attccgttgg atgggctgtc 60 ataaccgatg aatacaaagt accttcaaag aaatttaagg tgttggggaa cacagaccgt 120 cattcgatta aaaagaatct tatcggtgcc ctcctattcg atagtggcga aacggcagag 180 gcgactcgcc tgaaacgaac cgctcggaga aggtatacac gtcgcaagaa ccgaatatgt 240 tacttacaag aaatttttag caatgagatg gccaaagttg acgattcttt ctttcaccgt 300 ttggaagagt ccttccttgt cgaagaggac aagaaacatg aacggcaccc catctttgga 360 aacatagtag atgaggtggc atatcatgaa aagtacccaa cgatttatca cctcagaaaa 420 aagctagttg actcaactga taaagcggac ctgaggttaa tctacttggc tcttgcccat 480 atgataaagt tccgtgggca ctttctcatt gagggtgatc taaatccgga caactcggat 540 gtcgacaaac tgttcatcca gttagtacaa acctataatc agttgtttga agagaaccct 600 ataaatgcaa gtggcgtgga tgcgaaggct attcttagcg cccgcctctc taaatcccga 660 cggctagaaa acctgatcgc acaattaccc ggagagaaga aaaatgggtt gttcggtaac 720 cttatagcgc tctcactagg cctgacacca aattttaagt cgaacttcga cttagctgaa 780 gatgccaaat tgcagcttag taaggacacg tacgatgacg atctcgacaa tctactggca 840 caaattggag atcagtatgc ggacttattt ttggctgcca aaaaccttag cgatgcaatc 900 ctcctatctg acatactgag agttaatact gagattacca aggcgccgtt atccgcttca 960 atgatcaaaa ggtacgatga acatcaccaa gacttgacac ttctcaaggc cctagtccgt 1020 cagcaactgc ctgagaaata taaggaaata ttctttgatc agtcgaaaaa cgggtacgca 1080 ggttatattg acggcggagc gagtcaagag gaattctaca agtttatcaa acccatatta 1140 gagaagatgg atgggacgga agagttgctt gtaaaactca atcgcgaaga tctactgcga 1200 aagcagcgga ctttcgacaa cggtagcatt ccacatcaaa tccacttagg cgaattgcat 1260 gctatactta gaaggcagga ggatttttat ccgttcctca aagacaatcg tgaaaagatt 1320 gagaaaatcc taacctttcg cataccttac tatgtgggac ccctggcccg agggaactct 1380 cggttcgcat ggatgacaag aaagtccgaa gaaacgatta ctccatggaa ttttgaggaa 1440 gttgtcgata aaggtgcgtc agctcaatcg ttcatcgaga ggatgaccaa ctttgacaag 1500 aatttaccga acgaaaaagt attgcctaag cacagtttac tttacgagta tttcacagtg 1560 tacaatgaac tcacgaaagt taagtatgtc actgagggca tgcgtaaacc cgcctttcta 1620 agcggagaac agaagaaagc aatagtagat ctgttattca agaccaaccg caaagtgaca 1680 gttaagcaat tgaaagagga ctactttaag aaaattgaat gcttcgattc tgtcgagatc 1740 tccggggtag aagatcgatt taatgcgtca cttggtacgt atcatgacct cctaaagata 1800 attaaagata aggacttcct ggataacgaa gagaatgaag atatcttaga agatatagtg 1860 ttgactctta ccctctttga agatcgggaa atgattgagg aaagactaaa aacatacgct 1920 cacctgttcg acgataaggt tatgaaacag ttaaagaggc gtcgctatac gggctgggga 1980 cgattgtcgc ggaaacttat caacgggata agagacaagc aaagtggtaa aactattctc 2040 gattttctaa agagcgacgg cttcgccaat aggaacttta tgcagctgat ccatgatgac 2100 tctttaacct tcaaagagga tatacaaaag gcacaggttt ccggacaagg ggactcattg 2160 cacgaacata ttgcgaatct tgctggttcg ccagccatca aaaagggcat actccagaca 2220 gtcaaagtag tggatgagct agttaaggtc atgggacgtc acaaaccgga aaacattgta 2280 atcgagatgg cacgcgaaaa tcaaacgact cagaaggggc aaaaaaacag tcgagagcgg 2340 atgaagagaa tagaagaggg tattaaagaa ctgggcagcc agatcttaaa ggagcatcct 2400 gtggaaaata cccaattgca gaacgagaaa ctttacctct attacctaca aaatggaagg 2460 gacatgtatg ttgatcagga actggacata aaccgtttat ctgattacga cgtcgatcac 2520 attgtacccc aatccttttt gaaggacgat tcaatcgaca ataaagtgct tacacgctcg 2580 gataagaacc gagggaaaag tgacaatgtt ccaagcgagg aagtcgtaaa gaaaatgaag 2640 aactattggc ggcagctcct aaatgcgaaa ctgataacgc aaagaaagtt cgataactta 2700 actaaagctg agaggggtgg cttgtctgaa cttgacaagg ccggatttat taaacgtcag 2760 ctcgtggaaa cccgccaaat cacaaagcat gttgcacaga tactagattc ccgaatgaat 2820 acgaaatacg acgagaacga taagctgatt cgggaagtca aagtaatcac tttaaagtca 2880 aaattggtgt cggacttcag aaaggatttt caattctata aagttaggga gataaataac 2940 taccaccatg cgcacgacgc ttatcttaat gccgtcgtag ggaccgcact cattaagaaa 3000 tacccgaagc tagaaagtga gtttgtgtat ggtgattaca aagtttatga cgtccgtaag 3060 atgatcgcga aaagcgaaca ggagataggc aaggctacag ccaaatactt cttttattct 3120 aacattatga atttctttaa gacggaaatc actctggcaa acggagagat acgcaaacga 3180 cctttaattg aaaccaatgg ggagacaggt gaaatcgtat gggataaggg ccgggacttc 3240 gcgacggtga gaaaagtttt gtccatgccc caagtcaaca tagtaaagaa aactgaggtg 3300 cagaccggag ggttttcaaa ggaatcgatt cttccaaaaa ggaatagtga taagctcatc 3360 gctcgtaaaa aggactggga cccgaaaaag tacggtggct tcgatagccc tacagttgcc 3420 tattctgtcc tagtagtggc aaaagttgag aagggaaaat ccaagaaact gaagtcagtc 3480 aaagaattat tggggataac gattatggag cgctcgtctt ttgaaaagaa ccccatcgac 3540 ttccttgagg cgaaaggtta caaggaagta aaaaaggatc tcataattaa actaccaaag 3600 tatagtctgt ttgagttaga aaatggccga aaacggatgt tggctagcgc cggagagctt 3660 caaaagggga acgaactcgc actaccgtct aaatacgtga atttcctgta tttagcgtcc 3720 cattacgaga agttgaaagg ttcacctgaa gataacgaac agaagcaact ttttgttgag 3780 cagcacaaac attatctcga cgaaatcata gagcaaattt cggaattcag taagagagtc 3840 atcctagctg atgccaatct ggacaaagta ttaagcgcat acaacaagca cagggataaa 3900 cccatacgtg agcaggcgga aaatattatc catttgttta ctcttaccaa cctcggcgct 3960 ccagccgcat tcaagtattt tgacacaacg atagatcgca aacgatacac ttctaccaag 4020 gaggtgctag acgcgacact gattcaccaa tccatcacgg gattatatga aactcggata 4080 gatttgtcac agcttggggg tgacggatcc cccaagaaga agaggaaagt ctcgagcgac 4140 tacaaagacc atgacggtga ttataaagat catgacatcg attacaagga tgacgatgac 4200 aaggctgcag ga 4212 <210> 4 <211> 1368 <212> PRT <213> Homo Sapiens <400> 4 Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 5 <211> 1368 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 5 Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 6 <211> 922 <212> PRT <213> Homo Sapiens <400> 6 Met Ala Thr Ala Ser Pro Arg Ser Asp Thr Ser Asn Asn His Ser Gly 1 5 10 15 Arg Leu Gln Leu Gln Val Thr Val Ser Ser Ala Lys Leu Lys Arg Lys 20 25 30 Lys Asn Trp Phe Gly Thr Ala Ile Tyr Thr Glu Val Val Val Asp Gly 35 40 45 Glu Ile Thr Lys Thr Ala Lys Ser Ser Ser Ser Ser Asn Pro Lys Trp 50 55 60 Asp Glu Gln Leu Thr Val Asn Val Thr Pro Gln Thr Thr Leu Glu Phe 65 70 75 80 Gln Val Trp Ser His Arg Thr Leu Lys Ala Asp Ala Leu Leu Gly Lys 85 90 95 Ala Thr Ile Asp Leu Lys Gln Ala Leu Leu Ile His Asn Arg Lys Leu 100 105 110 Glu Arg Val Lys Glu Gln Leu Lys Leu Ser Leu Glu Asn Lys Asn Gly 115 120 125 Ile Ala Gln Thr Gly Glu Leu Thr Val Val Leu Asp Gly Leu Val Ile 130 135 140 Glu Gln Glu Asn Ile Thr Asn Cys Ser Ser Ser Pro Thr Ile Glu Ile 145 150 155 160 Gln Glu Asn Gly Asp Ala Leu His Glu Asn Gly Glu Pro Ser Ala Arg 165 170 175 Thr Thr Ala Arg Leu Ala Val Glu Gly Thr Asn Gly Ile Asp Asn His 180 185 190 Val Pro Thr Ser Thr Leu Val Gln Asn Ser Cys Cys Ser Tyr Val Val 195 200 205 Asn Gly Asp Asn Thr Pro Ser Ser Pro Ser Gln Val Ala Ala Arg Pro 210 215 220 Lys Asn Thr Pro Ala Pro Lys Pro Leu Ala Ser Glu Pro Ala Asp Asp 225 230 235 240 Thr Val Asn Gly Glu Ser Ser Ser Phe Ala Pro Thr Asp Asn Ala Ser 245 250 255 Val Thr Gly Thr Pro Val Val Ser Glu Glu Asn Ala Leu Ser Pro Asn 260 265 270 Cys Thr Ser Thr Thr Val Glu Asp Pro Pro Val Gln Glu Ile Leu Thr 275 280 285 Ser Ser Glu Asn Asn Glu Cys Ile Pro Ser Thr Ser Ala Glu Leu Glu 290 295 300 Ser Glu Ala Arg Ser Ile Leu Glu Pro Asp Thr Ser Asn Ser Arg Ser 305 310 315 320 Ser Ser Ala Phe Glu Ala Ala Lys Ser Arg Gln Pro Asp Gly Cys Met 325 330 335 Asp Pro Val Arg Gln Gln Ser Gly Asn Ala Asn Thr Glu Thr Leu Pro 340 345 350 Ser Gly Trp Glu Gln Arg Lys Asp Pro His Gly Arg Thr Tyr Tyr Val 355 360 365 Asp His Asn Thr Arg Thr Thr Thr Trp Glu Arg Pro Gln Pro Leu Pro 370 375 380 Pro Gly Trp Glu Arg Arg Val Asp Asp Arg Arg Arg Val Tyr Tyr Val 385 390 395 400 Asp His Asn Thr Arg Thr Thr Thr Trp Gln Arg Pro Thr Met Glu Ser 405 410 415 Val Arg Asn Phe Glu Gln Trp Gln Ser Gln Arg Asn Gln Leu Gln Gly 420 425 430 Ala Met Gln Gln Phe Asn Gln Arg Tyr Leu Tyr Ser Ala Ser Met Leu 435 440 445 Ala Ala Glu Asn Asp Pro Tyr Gly Pro Leu Pro Pro Gly Trp Glu Lys 450 455 460 Arg Val Asp Ser Thr Asp Arg Val Tyr Phe Val Asn His Asn Thr Lys 465 470 475 480 Thr Thr Gln Trp Glu Asp Pro Arg Thr Gln Gly Leu Gln Asn Glu Glu 485 490 495 Pro Leu Pro Glu Gly Trp Glu Ile Arg Tyr Thr Arg Glu Gly Val Arg 500 505 510 Tyr Phe Val Asp His Asn Thr Arg Thr Thr Thr Phe Lys Asp Pro Arg 515 520 525 Asn Gly Lys Ser Ser Val Thr Lys Gly Gly Pro Gln Ile Ala Tyr Glu 530 535 540 Arg Gly Phe Arg Trp Lys Leu Ala His Phe Arg Tyr Leu Cys Gln Ser 545 550 555 560 Asn Ala Leu Pro Ser His Val Lys Ile Asn Val Ser Arg Gln Thr Leu 565 570 575 Phe Glu Asp Ser Phe Gln Gln Ile Met Ala Leu Lys Pro Tyr Asp Leu 580 585 590 Arg Arg Arg Leu Tyr Val Ile Phe Arg Gly Glu Glu Gly Leu Asp Tyr 595 600 605 Gly Gly Leu Ala Arg Glu Trp Phe Phe Leu Leu Ser His Glu Val Leu 610 615 620 Asn Pro Met Tyr Cys Leu Phe Glu Tyr Ala Gly Lys Asn Asn Tyr Cys 625 630 635 640 Leu Gln Ile Asn Pro Ala Ser Thr Ile Asn Pro Asp His Leu Ser Tyr 645 650 655 Phe Cys Phe Ile Gly Arg Phe Ile Ala Met Ala Leu Phe His Gly Lys 660 665 670 Phe Ile Asp Thr Gly Phe Ser Leu Pro Phe Tyr Lys Arg Met Leu Ser 675 680 685 Lys Lys Leu Thr Ile Lys Asp Leu Glu Ser Ile Asp Thr Glu Phe Tyr 690 695 700 Asn Ser Leu Ile Trp Ile Arg Asp Asn Asn Ile Glu Glu Cys Gly Leu 705 710 715 720 Glu Met Tyr Phe Ser Val Asp Met Glu Ile Leu Gly Lys Val Thr Ser 725 730 735 His Asp Leu Lys Leu Gly Gly Ser Asn Ile Leu Val Thr Glu Glu Asn 740 745 750 Lys Asp Glu Tyr Ile Gly Leu Met Thr Glu Trp Arg Phe Ser Arg Gly 755 760 765 Val Gln Glu Gln Thr Lys Ala Phe Leu Asp Gly Phe Asn Glu Val Val 770 775 780 Pro Leu Gln Trp Leu Gln Tyr Phe Asp Glu Lys Glu Leu Glu Val Met 785 790 795 800 Leu Cys Gly Met Gln Glu Val Asp Leu Ala Asp Trp Gln Arg Asn Thr 805 810 815 Val Tyr Arg His Tyr Thr Arg Asn Ser Lys Gln Ile Ile Trp Phe Trp 820 825 830 Gln Phe Val Lys Glu Thr Asp Asn Glu Val Arg Met Arg Leu Leu Gln 835 840 845 Phe Val Thr Gly Thr Cys Arg Leu Pro Leu Gly Gly Phe Ala Glu Leu 850 855 860 Met Gly Ser Asn Gly Pro Gln Lys Phe Cys Ile Glu Lys Val Gly Lys 865 870 875 880 Asp Thr Trp Leu Pro Arg Ser His Thr Cys Phe Asn Arg Leu Asp Leu 885 890 895 Pro Pro Tyr Lys Ser Tyr Glu Gln Leu Lys Glu Lys Leu Leu Phe Ala 900 905 910 Ile Glu Glu Thr Glu Gly Phe Gly Gln Glu 915 920 <210> 7 <211> 870 <212> PRT <213> Homo Sapiens <400> 7 Met Ala Ser Ala Ser Ser Ser Arg Ala Gly Val Ala Leu Pro Phe Glu 1 5 10 15 Lys Ser Gln Leu Thr Leu Lys Val Val Ser Ala Lys Pro Lys Val His 20 25 30 Asn Arg Gln Pro Arg Ile Asn Ser Tyr Val Glu Val Ala Val Asp Gly 35 40 45 Leu Pro Ser Glu Thr Lys Lys Thr Gly Lys Arg Ile Gly Ser Ser Glu 50 55 60 Leu Leu Trp Asn Glu Ile Ile Ile Leu Asn Val Thr Ala Gln Ser His 65 70 75 80 Leu Asp Leu Lys Val Trp Ser Cys His Thr Leu Arg Asn Glu Leu Leu 85 90 95 Gly Thr Ala Ser Val Asn Leu Ser Asn Val Leu Lys Asn Asn Gly Gly 100 105 110 Lys Met Glu Asn Met Gln Leu Thr Leu Asn Leu Gln Thr Glu Asn Lys 115 120 125 Gly Ser Val Val Ser Gly Gly Glu Leu Thr Ile Phe Leu Asp Gly Pro 130 135 140 Thr Val Asp Leu Gly Asn Val Pro Asn Gly Ser Ala Leu Thr Asp Gly 145 150 155 160 Ser Gln Leu Pro Ser Arg Asp Ser Ser Gly Thr Ala Val Ala Pro Glu 165 170 175 Asn Arg His Gln Pro Pro Ser Thr Asn Cys Phe Gly Gly Arg Ser Arg 180 185 190 Thr His Arg His Ser Gly Ala Ser Ala Arg Thr Thr Pro Ala Thr Gly 195 200 205 Glu Gln Ser Pro Gly Ala Arg Ser Arg His Arg Gln Pro Val Lys Asn 210 215 220 Ser Gly His Ser Gly Leu Ala Asn Gly Thr Val Asn Asp Glu Pro Thr 225 230 235 240 Thr Ala Thr Asp Pro Glu Glu Pro Ser Val Val Gly Val Thr Ser Pro 245 250 255 Pro Ala Ala Pro Leu Ser Val Thr Pro Asn Pro Asn Thr Thr Ser Leu 260 265 270 Pro Ala Pro Ala Thr Pro Ala Glu Gly Glu Glu Pro Ser Thr Ser Gly 275 280 285 Thr Gln Gln Leu Pro Ala Ala Ala Gln Ala Pro Asp Ala Leu Pro Ala 290 295 300 Gly Trp Glu Gln Arg Glu Leu Pro Asn Gly Arg Val Tyr Tyr Val Asp 305 310 315 320 His Asn Thr Lys Thr Thr Thr Trp Glu Arg Pro Leu Pro Pro Gly Trp 325 330 335 Glu Lys Arg Thr Asp Pro Arg Gly Arg Phe Tyr Tyr Val Asp His Asn 340 345 350 Thr Arg Thr Thr Thr Trp Gln Arg Pro Thr Ala Glu Tyr Val Arg Asn 355 360 365 Tyr Glu Gln Trp Gln Ser Gln Arg Asn Gln Leu Gln Gly Ala Met Gln 370 375 380 His Phe Ser Gln Arg Phe Leu Tyr Gln Ser Ser Ser Ala Ser Thr Asp 385 390 395 400 His Asp Pro Leu Gly Pro Leu Pro Pro Gly Trp Glu Lys Arg Gln Asp 405 410 415 Asn Gly Arg Val Tyr Tyr Val Asn His Asn Thr Arg Thr Thr Gln Trp 420 425 430 Glu Asp Pro Arg Thr Gln Gly Met Ile Gln Glu Pro Ala Leu Pro Pro 435 440 445 Gly Trp Glu Met Lys Tyr Thr Ser Glu Gly Val Arg Tyr Phe Val Asp 450 455 460 His Asn Thr Arg Thr Thr Thr Phe Lys Asp Pro Arg Pro Gly Phe Glu 465 470 475 480 Ser Gly Thr Lys Gln Gly Ser Pro Gly Ala Tyr Asp Arg Ser Phe Arg 485 490 495 Trp Lys Tyr His Gln Phe Arg Phe Leu Cys His Ser Asn Ala Leu Pro 500 505 510 Ser His Val Lys Ile Ser Val Ser Arg Gln Thr Leu Phe Glu Asp Ser 515 520 525 Phe Gln Gln Ile Met Asn Met Lys Pro Tyr Asp Leu Arg Arg Arg Leu 530 535 540 Tyr Ile Ile Met Arg Gly Glu Glu Gly Leu Asp Tyr Gly Gly Ile Ala 545 550 555 560 Arg Glu Trp Phe Phe Leu Leu Ser His Glu Val Leu Asn Pro Met Tyr 565 570 575 Cys Leu Phe Glu Tyr Ala Gly Lys Asn Asn Tyr Cys Leu Gln Ile Asn 580 585 590 Pro Ala Ser Ser Ile Asn Pro Asp His Leu Thr Tyr Phe Arg Phe Ile 595 600 605 Gly Arg Phe Ile Ala Met Ala Leu Tyr His Gly Lys Phe Ile Asp Thr 610 615 620 Gly Phe Thr Leu Pro Phe Tyr Lys Arg Met Leu Asn Lys Arg Pro Thr 625 630 635 640 Leu Lys Asp Leu Glu Ser Ile Asp Pro Glu Phe Tyr Asn Ser Ile Val 645 650 655 Trp Ile Lys Glu Asn Asn Leu Glu Glu Cys Gly Leu Glu Leu Tyr Phe 660 665 670 Ile Gln Asp Met Glu Ile Leu Gly Lys Val Thr Thr His Glu Leu Lys 675 680 685 Glu Gly Gly Glu Ser Ile Arg Val Thr Glu Glu Asn Lys Glu Glu Tyr 690 695 700 Ile Met Leu Leu Thr Asp Trp Arg Phe Thr Arg Gly Val Glu Glu Gln 705 710 715 720 Thr Lys Ala Phe Leu Asp Gly Phe Asn Glu Val Ala Pro Leu Glu Trp 725 730 735 Leu Arg Tyr Phe Asp Glu Lys Glu Leu Glu Leu Met Leu Cys Gly Met 740 745 750 Gln Glu Ile Asp Met Ser Asp Trp Gln Lys Ser Thr Ile Tyr Arg His 755 760 765 Tyr Thr Lys Asn Ser Lys Gln Ile Gln Trp Phe Trp Gln Val Val Lys 770 775 780 Glu Met Asp Asn Glu Lys Arg Ile Arg Leu Leu Gln Phe Val Thr Gly 785 790 795 800 Thr Cys Arg Leu Pro Val Gly Gly Phe Ala Glu Leu Ile Gly Ser Asn 805 810 815 Gly Pro Gln Lys Phe Cys Ile Asp Lys Val Gly Lys Glu Thr Trp Leu 820 825 830 Pro Arg Ser His Thr Cys Phe Asn Arg Leu Asp Leu Pro Pro Tyr Lys 835 840 845 Ser Tyr Glu Gln Leu Arg Glu Lys Leu Leu Tyr Ala Ile Glu Glu Thr 850 855 860 Glu Gly Phe Gly Gln Glu 865 870 <210> 8 <211> 1319 <212> PRT <213> Homo Sapiens <400> 8 Met Ala Gln Ser Leu Arg Leu His Phe Ala Ala Arg Arg Ser Asn Thr 1 5 10 15 Tyr Pro Leu Ser Glu Thr Ser Gly Asp Asp Leu Asp Ser His Val His 20 25 30 Met Cys Phe Lys Arg Pro Thr Arg Ile Ser Thr Ser Asn Val Val Gln 35 40 45 Met Lys Leu Thr Pro Arg Gln Thr Ala Leu Ala Pro Leu Ile Lys Glu 50 55 60 Asn Val Gln Ser Gln Glu Arg Ser Ser Val Pro Ser Ser Glu Asn Val 65 70 75 80 Asn Lys Lys Ser Ser Cys Leu Gln Ile Ser Leu Gln Pro Thr Arg Tyr 85 90 95 Ser Gly Tyr Leu Gln Ser Ser Asn Val Leu Ala Asp Ser Asp Asp Ala 100 105 110 Ser Phe Thr Cys Ile Leu Lys Asp Gly Ile Tyr Ser Ser Ala Val Val 115 120 125 Asp Asn Glu Leu Asn Ala Val Asn Asp Gly His Leu Val Ser Ser Pro 130 135 140 Ala Ile Cys Ser Gly Ser Leu Ser Asn Phe Ser Thr Ser Asp Asn Gly 145 150 155 160 Ser Tyr Ser Ser Asn Gly Ser Asp Phe Gly Ser Cys Ala Ser Ile Thr 165 170 175 Ser Gly Gly Ser Tyr Thr Asn Ser Val Ile Ser Asp Ser Ser Ser Tyr 180 185 190 Thr Phe Pro Pro Ser Asp Asp Thr Phe Leu Gly Gly Asn Leu Pro Ser 195 200 205 Asp Ser Thr Ser Asn Arg Ser Val Pro Asn Arg Asn Thr Thr Pro Cys 210 215 220 Glu Ile Phe Ser Arg Ser Thr Ser Thr Asp Pro Phe Val Gln Asp Asp 225 230 235 240 Leu Glu His Gly Leu Glu Ile Met Lys Leu Pro Val Ser Arg Asn Thr 245 250 255 Lys Ile Pro Leu Lys Arg Tyr Ser Ser Leu Val Ile Phe Pro Arg Ser 260 265 270 Pro Ser Thr Thr Arg Pro Thr Ser Pro Thr Ser Leu Cys Thr Leu Leu 275 280 285 Ser Lys Gly Ser Tyr Gln Thr Ser His Gln Phe Ile Ile Ser Pro Ser 290 295 300 Glu Ile Ala His Asn Glu Asp Gly Thr Ser Ala Lys Gly Phe Leu Ser 305 310 315 320 Thr Ala Val Asn Gly Leu Arg Leu Ser Lys Thr Ile Cys Thr Pro Gly 325 330 335 Glu Val Arg Asp Ile Arg Pro Leu His Arg Lys Gly Ser Leu Gln Lys 340 345 350 Lys Ile Val Leu Ser Asn Asn Thr Pro Arg Gln Thr Val Cys Glu Lys 355 360 365 Ser Ser Glu Gly Tyr Ser Cys Val Ser Val His Phe Thr Gln Arg Lys 370 375 380 Ala Ala Thr Leu Asp Cys Glu Thr Thr Asn Gly Asp Cys Lys Pro Glu 385 390 395 400 Met Ser Glu Ile Lys Leu Asn Ser Asp Ser Glu Tyr Ile Lys Leu Met 405 410 415 His Arg Thr Ser Ala Cys Leu Pro Ser Ser Gln Asn Val Asp Cys Gln 420 425 430 Ile Asn Ile Asn Gly Glu Leu Glu Arg Pro His Ser Gln Met Asn Lys 435 440 445 Asn His Gly Ile Leu Arg Arg Ser Ile Ser Leu Gly Gly Ala Tyr Pro 450 455 460 Asn Ile Ser Cys Leu Ser Ser Leu Lys His Asn Cys Ser Lys Gly Gly 465 470 475 480 Pro Ser Gln Leu Leu Ile Lys Phe Ala Ser Gly Asn Glu Gly Lys Val 485 490 495 Asp Asn Leu Ser Arg Asp Ser Asn Arg Asp Cys Thr Asn Glu Leu Ser 500 505 510 Asn Ser Cys Lys Thr Arg Asp Asp Phe Leu Gly Gln Val Asp Val Pro 515 520 525 Leu Tyr Pro Leu Pro Thr Glu Asn Pro Arg Leu Glu Arg Pro Tyr Thr 530 535 540 Phe Lys Asp Phe Val Leu His Pro Arg Ser His Lys Ser Arg Val Lys 545 550 555 560 Gly Tyr Leu Arg Leu Lys Met Thr Tyr Leu Pro Lys Thr Ser Gly Ser 565 570 575 Glu Asp Asp Asn Ala Glu Gln Ala Glu Glu Leu Glu Pro Gly Trp Val 580 585 590 Val Leu Asp Gln Pro Asp Ala Ala Cys His Leu Gln Gln Gln Gln Glu 595 600 605 Pro Ser Pro Leu Pro Pro Gly Trp Glu Glu Arg Gln Asp Ile Leu Gly 610 615 620 Arg Thr Tyr Tyr Val Asn His Glu Ser Arg Arg Thr Gln Trp Lys Arg 625 630 635 640 Pro Thr Pro Gln Asp Asn Leu Thr Asp Ala Glu Asn Gly Asn Ile Gln 645 650 655 Leu Gln Ala Gln Arg Ala Phe Thr Thr Arg Arg Gln Ile Ser Glu Glu 660 665 670 Thr Glu Ser Val Asp Asn Arg Glu Ser Ser Glu Asn Trp Glu Ile Ile 675 680 685 Arg Glu Asp Glu Ala Thr Met Tyr Ser Asn Gln Ala Phe Pro Ser Pro 690 695 700 Pro Pro Ser Ser Asn Leu Asp Val Pro Thr His Leu Ala Glu Glu Leu 705 710 715 720 Asn Ala Arg Leu Thr Ile Phe Gly Asn Ser Ala Val Ser Gln Pro Ala 725 730 735 Ser Ser Ser Asn His Ser Ser Arg Arg Gly Ser Leu Gln Ala Tyr Thr 740 745 750 Phe Glu Glu Gln Pro Thr Leu Pro Val Leu Leu Pro Thr Ser Ser Gly 755 760 765 Leu Pro Pro Gly Trp Glu Glu Lys Gln Asp Glu Arg Gly Arg Ser Tyr 770 775 780 Tyr Val Asp His Asn Ser Arg Thr Thr Thr Trp Thr Lys Pro Thr Val 785 790 795 800 Gln Ala Thr Val Glu Thr Ser Gln Leu Thr Ser Ser Gln Ser Ser Ala 805 810 815 Gly Pro Gln Ser Gln Ala Ser Thr Ser Asp Ser Gly Gln Gln Val Thr 820 825 830 Gln Pro Ser Glu Ile Glu Gln Gly Phe Leu Pro Lys Gly Trp Glu Val 835 840 845 Arg His Ala Pro Asn Gly Arg Pro Phe Phe Ile Asp His Asn Thr Lys 850 855 860 Thr Thr Thr Trp Glu Asp Pro Arg Leu Lys Ile Pro Ala His Leu Arg 865 870 875 880 Gly Lys Thr Ser Leu Asp Thr Ser Asn Asp Leu Gly Pro Leu Pro Pro 885 890 895 Gly Trp Glu Glu Arg Thr His Thr Asp Gly Arg Ile Phe Tyr Ile Asn 900 905 910 His Asn Ile Lys Arg Thr Gln Trp Glu Asp Pro Arg Leu Glu Asn Val 915 920 925 Ala Ile Thr Gly Pro Ala Val Pro Tyr Ser Arg Asp Tyr Lys Arg Lys 930 935 940 Tyr Glu Phe Phe Arg Arg Lys Leu Lys Lys Gln Asn Asp Ile Pro Asn 945 950 955 960 Lys Phe Glu Met Lys Leu Arg Arg Ala Thr Val Leu Glu Asp Ser Tyr 965 970 975 Arg Arg Ile Met Gly Val Lys Arg Ala Asp Phe Leu Lys Ala Arg Leu 980 985 990 Trp Ile Glu Phe Asp Gly Glu Lys Gly Leu Asp Tyr Gly Gly Val Ala 995 1000 1005 Arg Glu Trp Phe Phe Leu Ile Ser Lys Glu Met Phe Asn Pro Tyr 1010 1015 1020 Tyr Gly Leu Phe Glu Tyr Ser Ala Thr Asp Asn Tyr Thr Leu Gln 1025 1030 1035 Ile Asn Pro Asn Ser Gly Leu Cys Asn Glu Asp His Leu Ser Tyr 1040 1045 1050 Phe Lys Phe Ile Gly Arg Val Ala Gly Met Ala Val Tyr His Gly 1055 1060 1065 Lys Leu Leu Asp Gly Phe Phe Ile Arg Pro Phe Tyr Lys Met Met 1070 1075 1080 Leu His Lys Pro Ile Thr Leu His Asp Met Glu Ser Val Asp Ser 1085 1090 1095 Glu Tyr Tyr Asn Ser Leu Arg Trp Ile Leu Glu Asn Asp Pro Thr 1100 1105 1110 Glu Leu Asp Leu Arg Phe Ile Ile Asp Glu Glu Leu Phe Gly Gln 1115 1120 1125 Thr His Gln His Glu Leu Lys Asn Gly Gly Ser Glu Ile Val Val 1130 1135 1140 Thr Asn Lys Asn Lys Lys Glu Tyr Ile Tyr Leu Val Ile Gln Trp 1145 1150 1155 Arg Phe Val Asn Arg Ile Gln Lys Gln Met Ala Ala Phe Lys Glu 1160 1165 1170 Gly Phe Phe Glu Leu Ile Pro Gln Asp Leu Ile Lys Ile Phe Asp 1175 1180 1185 Glu Asn Glu Leu Glu Leu Leu Met Cys Gly Leu Gly Asp Val Asp 1190 1195 1200 Val Asn Asp Trp Arg Glu His Thr Lys Tyr Lys Asn Gly Tyr Ser 1205 1210 1215 Ala Asn His Gln Val Ile Gln Trp Phe Trp Lys Ala Val Leu Met 1220 1225 1230 Met Asp Ser Glu Lys Arg Ile Arg Leu Leu Gln Phe Val Thr Gly 1235 1240 1245 Thr Ser Arg Val Pro Met Asn Gly Phe Ala Glu Leu Tyr Gly Ser 1250 1255 1260 Asn Gly Pro Gln Ser Phe Thr Val Glu Gln Trp Gly Thr Pro Glu 1265 1270 1275 Lys Leu Pro Arg Ala His Thr Cys Phe Asn Arg Leu Asp Leu Pro 1280 1285 1290 Pro Tyr Glu Ser Phe Glu Glu Leu Trp Asp Lys Leu Gln Met Ala 1295 1300 1305 Ile Glu Asn Thr Gln Gly Phe Asp Gly Val Asp 1310 1315 <210> 9 <211> 955 <212> PRT <213> Homo Sapiens <400> 9 Met Ala Thr Gly Leu Gly Glu Pro Val Tyr Gly Leu Ser Glu Asp Glu 1 5 10 15 Gly Glu Ser Arg Ile Leu Arg Val Lys Val Val Ser Gly Ile Asp Leu 20 25 30 Ala Lys Lys Asp Ile Phe Gly Ala Ser Asp Pro Tyr Val Lys Leu Ser 35 40 45 Leu Tyr Val Ala Asp Glu Asn Arg Glu Leu Ala Leu Val Gln Thr Lys 50 55 60 Thr Ile Lys Lys Thr Leu Asn Pro Lys Trp Asn Glu Glu Phe Tyr Phe 65 70 75 80 Arg Val Asn Pro Ser Asn His Arg Leu Leu Phe Glu Val Phe Asp Glu 85 90 95 Asn Arg Leu Thr Arg Asp Asp Phe Leu Gly Gln Val Asp Val Pro Leu 100 105 110 Ser His Leu Pro Thr Glu Asp Pro Thr Met Glu Arg Pro Tyr Thr Phe 115 120 125 Lys Asp Phe Leu Leu Arg Pro Arg Ser His Lys Ser Arg Val Lys Gly 130 135 140 Phe Leu Arg Leu Lys Met Ala Tyr Met Pro Lys Asn Gly Gly Gln Asp 145 150 155 160 Glu Glu Asn Ser Asp Gln Arg Asp Asp Met Glu His Gly Trp Glu Val 165 170 175 Val Asp Ser Asn Asp Ser Ala Ser Gln His Gln Glu Glu Leu Pro Pro 180 185 190 Pro Pro Leu Pro Pro Gly Trp Glu Glu Lys Val Asp Asn Leu Gly Arg 195 200 205 Thr Tyr Tyr Val Asn His Asn Asn Arg Thr Thr Gln Trp His Arg Pro 210 215 220 Ser Leu Met Asp Val Ser Ser Glu Ser Asp Asn Asn Ile Arg Gln Ile 225 230 235 240 Asn Gln Glu Ala Ala His Arg Arg Phe Arg Ser Arg Arg His Ile Ser 245 250 255 Glu Asp Leu Glu Pro Glu Pro Ser Glu Gly Gly Asp Val Pro Glu Pro 260 265 270 Trp Glu Thr Ile Ser Glu Glu Val Asn Ile Ala Gly Asp Ser Leu Gly 275 280 285 Leu Ala Leu Pro Pro Pro Pro Ala Ser Pro Gly Ser Arg Thr Ser Pro 290 295 300 Gln Glu Leu Ser Glu Glu Leu Ser Arg Arg Leu Gln Ile Thr Pro Asp 305 310 315 320 Ser Asn Gly Glu Gln Phe Ser Ser Leu Ile Gln Arg Glu Pro Ser Ser 325 330 335 Arg Leu Arg Ser Cys Ser Val Thr Asp Ala Val Ala Glu Gln Gly His 340 345 350 Leu Pro Pro Pro Ser Val Ala Tyr Val His Thr Thr Pro Gly Leu Pro 355 360 365 Ser Gly Trp Glu Glu Arg Lys Asp Ala Lys Gly Arg Thr Tyr Tyr Val 370 375 380 Asn His Asn Asn Arg Thr Thr Thr Trp Thr Arg Pro Ile Met Gln Leu 385 390 395 400 Ala Glu Asp Gly Ala Ser Gly Ser Ala Thr Asn Ser Asn Asn His Leu 405 410 415 Ile Glu Pro Gln Ile Arg Arg Pro Arg Ser Leu Ser Ser Pro Thr Val 420 425 430 Thr Leu Ser Ala Pro Leu Glu Gly Ala Lys Asp Ser Pro Val Arg Arg 435 440 445 Ala Val Lys Asp Thr Leu Ser Asn Pro Gln Ser Pro Gln Pro Ser Pro 450 455 460 Tyr Asn Ser Pro Lys Pro Gln His Lys Val Thr Gln Ser Phe Leu Pro 465 470 475 480 Pro Gly Trp Glu Met Arg Ile Ala Pro Asn Gly Arg Pro Phe Phe Ile 485 490 495 Asp His Asn Thr Lys Thr Thr Thr Trp Glu Asp Pro Arg Leu Lys Phe 500 505 510 Pro Val His Met Arg Ser Lys Thr Ser Leu Asn Pro Asn Asp Leu Gly 515 520 525 Pro Leu Pro Pro Gly Trp Glu Glu Arg Ile His Leu Asp Gly Arg Thr 530 535 540 Phe Tyr Ile Asp His Asn Ser Lys Ile Thr Gln Trp Glu Asp Pro Arg 545 550 555 560 Leu Gln Asn Pro Ala Ile Thr Gly Pro Ala Val Pro Tyr Ser Arg Glu 565 570 575 Phe Lys Gln Lys Tyr Asp Tyr Phe Arg Lys Lys Leu Lys Lys Pro Ala 580 585 590 Asp Ile Pro Asn Arg Phe Glu Met Lys Leu His Arg Asn Asn Ile Phe 595 600 605 Glu Glu Ser Tyr Arg Arg Ile Met Ser Val Lys Arg Pro Asp Val Leu 610 615 620 Lys Ala Arg Leu Trp Ile Glu Phe Glu Ser Glu Lys Gly Leu Asp Tyr 625 630 635 640 Gly Gly Val Ala Arg Glu Trp Phe Phe Leu Leu Ser Lys Glu Met Phe 645 650 655 Asn Pro Tyr Tyr Gly Leu Phe Glu Tyr Ser Ala Thr Asp Asn Tyr Thr 660 665 670 Leu Gln Ile Asn Pro Asn Ser Gly Leu Cys Asn Glu Asp His Leu Ser 675 680 685 Tyr Phe Thr Phe Ile Gly Arg Val Ala Gly Leu Ala Val Phe His Gly 690 695 700 Lys Leu Leu Asp Gly Phe Phe Ile Arg Pro Phe Tyr Lys Met Met Leu 705 710 715 720 Gly Lys Gln Ile Thr Leu Asn Asp Met Glu Ser Val Asp Ser Glu Tyr 725 730 735 Tyr Asn Ser Leu Lys Trp Ile Leu Glu Asn Asp Pro Thr Glu Leu Asp 740 745 750 Leu Met Phe Cys Ile Asp Glu Glu Asn Phe Gly Gln Thr Tyr Gln Val 755 760 765 Asp Leu Lys Pro Asn Gly Ser Glu Ile Met Val Thr Asn Glu Asn Lys 770 775 780 Arg Glu Tyr Ile Asp Leu Val Ile Gln Trp Arg Phe Val Asn Arg Val 785 790 795 800 Gln Lys Gln Met Asn Ala Phe Leu Glu Gly Phe Thr Glu Leu Leu Pro 805 810 815 Ile Asp Leu Ile Lys Ile Phe Asp Glu Asn Glu Leu Glu Leu Leu Met 820 825 830 Cys Gly Leu Gly Asp Val Asp Val Asn Asp Trp Arg Gln His Ser Ile 835 840 845 Tyr Lys Asn Gly Tyr Cys Pro Asn His Pro Val Ile Gln Trp Phe Trp 850 855 860 Lys Ala Val Leu Leu Met Asp Ala Glu Lys Arg Ile Arg Leu Leu Gln 865 870 875 880 Phe Val Thr Gly Thr Ser Arg Val Pro Met Asn Gly Phe Ala Glu Leu 885 890 895 Tyr Gly Ser Asn Gly Pro Gln Leu Phe Thr Ile Glu Gln Trp Gly Ser 900 905 910 Pro Glu Lys Leu Pro Arg Ala His Thr Cys Phe Asn Arg Leu Asp Leu 915 920 925 Pro Pro Tyr Glu Thr Phe Glu Asp Leu Arg Glu Lys Leu Leu Met Ala 930 935 940 Val Glu Asn Ala Gln Gly Phe Glu Gly Val Asp 945 950 955 <210> 10 <211> 757 <212> PRT <213> Homo Sapiens <400> 10 Met Ser Asn Pro Gly Thr Arg Arg Asn Gly Ser Ser Ile Lys Ile Arg 1 5 10 15 Leu Thr Val Leu Cys Ala Lys Asn Leu Ala Lys Lys Asp Phe Phe Arg 20 25 30 Leu Pro Asp Pro Phe Ala Lys Ile Val Val Asp Gly Ser Gly Gln Cys 35 40 45 His Ser Thr Asp Thr Val Lys Asn Thr Leu Asp Pro Lys Trp Asn Gln 50 55 60 His Tyr Asp Leu Tyr Val Gly Lys Thr Asp Ser Ile Thr Ile Ser Val 65 70 75 80 Trp Asn His Lys Lys Ile His Lys Lys Gln Gly Ala Gly Phe Leu Gly 85 90 95 Cys Val Arg Leu Leu Ser Asn Ala Ile Ser Arg Leu Lys Asp Thr Gly 100 105 110 Tyr Gln Arg Leu Asp Leu Cys Lys Leu Asn Pro Ser Asp Thr Asp Ala 115 120 125 Val Arg Gly Gln Ile Val Val Ser Leu Gln Thr Arg Asp Arg Ile Gly 130 135 140 Thr Gly Gly Ser Val Val Asp Cys Arg Gly Leu Leu Glu Asn Glu Gly 145 150 155 160 Thr Val Tyr Glu Asp Ser Gly Pro Gly Arg Pro Leu Ser Cys Phe Met 165 170 175 Glu Glu Pro Ala Pro Tyr Thr Asp Ser Thr Gly Ala Ala Ala Gly Gly 180 185 190 Gly Asn Cys Arg Phe Val Glu Ser Pro Ser Gln Asp Gln Arg Leu Gln 195 200 205 Ala Gln Arg Leu Arg Asn Pro Asp Val Arg Gly Ser Leu Gln Thr Pro 210 215 220 Gln Asn Arg Pro His Gly His Gln Ser Pro Glu Leu Pro Glu Gly Tyr 225 230 235 240 Glu Gln Arg Thr Thr Val Gln Gly Gln Val Tyr Phe Leu His Thr Gln 245 250 255 Thr Gly Val Ser Thr Trp His Asp Pro Arg Ile Pro Ser Pro Ser Gly 260 265 270 Thr Ile Pro Gly Gly Asp Ala Ala Phe Leu Tyr Glu Phe Leu Leu Gln 275 280 285 Gly His Thr Ser Glu Pro Arg Asp Leu Asn Ser Val Asn Cys Asp Glu 290 295 300 Leu Gly Pro Leu Pro Pro Gly Trp Glu Val Arg Ser Thr Val Ser Gly 305 310 315 320 Arg Ile Tyr Phe Val Asp His Asn Asn Arg Thr Thr Gln Phe Thr Asp 325 330 335 Pro Arg Leu His His Ile Met Asn His Gln Cys Gln Leu Lys Glu Pro 340 345 350 Ser Gln Pro Leu Pro Leu Pro Ser Glu Gly Ser Leu Glu Asp Glu Glu 355 360 365 Leu Pro Ala Gln Arg Tyr Glu Arg Asp Leu Val Gln Lys Leu Lys Val 370 375 380 Leu Arg His Glu Leu Ser Leu Gln Gln Pro Gln Ala Gly His Cys Arg 385 390 395 400 Ile Glu Val Ser Arg Glu Glu Ile Phe Glu Glu Ser Tyr Arg Gln Ile 405 410 415 Met Lys Met Arg Pro Lys Asp Leu Lys Lys Arg Leu Met Val Lys Phe 420 425 430 Arg Gly Glu Glu Gly Leu Asp Tyr Gly Gly Val Ala Arg Glu Trp Leu 435 440 445 Tyr Leu Leu Cys His Glu Met Leu Asn Pro Tyr Tyr Gly Leu Phe Gln 450 455 460 Tyr Ser Thr Asp Asn Ile Tyr Met Leu Gln Ile Asn Pro Asp Ser Ser 465 470 475 480 Ile Asn Pro Asp His Leu Ser Tyr Phe His Phe Val Gly Arg Ile Met 485 490 495 Gly Leu Ala Val Phe His Gly His Tyr Ile Asn Gly Gly Phe Thr Val 500 505 510 Pro Phe Tyr Lys Gln Leu Leu Gly Lys Pro Ile Gln Leu Ser Asp Leu 515 520 525 Glu Ser Val Asp Pro Glu Leu His Lys Ser Leu Val Trp Ile Leu Glu 530 535 540 Asn Asp Ile Thr Pro Val Leu Asp His Thr Phe Cys Val Glu His Asn 545 550 555 560 Ala Phe Gly Arg Ile Leu Gln His Glu Leu Lys Pro Asn Gly Arg Asn 565 570 575 Val Pro Val Thr Glu Glu Asn Lys Lys Glu Tyr Val Arg Leu Tyr Val 580 585 590 Asn Trp Arg Phe Met Arg Gly Ile Glu Ala Gln Phe Leu Ala Leu Gln 595 600 605 Lys Gly Phe Asn Glu Leu Ile Pro Gln His Leu Leu Lys Pro Phe Asp 610 615 620 Gln Lys Glu Leu Glu Leu Ile Ile Gly Gly Leu Asp Lys Ile Asp Leu 625 630 635 640 Asn Asp Trp Lys Ser Asn Thr Arg Leu Lys His Cys Val Ala Asp Ser 645 650 655 Asn Ile Val Arg Trp Phe Trp Gln Ala Val Glu Thr Phe Asp Glu Glu 660 665 670 Arg Arg Ala Arg Leu Leu Gln Phe Val Thr Gly Ser Thr Arg Val Pro 675 680 685 Leu Gln Gly Phe Lys Ala Leu Gln Gly Ser Thr Gly Ala Ala Gly Pro 690 695 700 Arg Leu Phe Thr Ile His Leu Ile Asp Ala Asn Thr Asp Asn Leu Pro 705 710 715 720 Lys Ala His Thr Cys Phe Asn Arg Ile Asp Ile Pro Pro Tyr Glu Ser 725 730 735 Tyr Glu Lys Leu Tyr Glu Lys Leu Leu Thr Ala Val Glu Glu Thr Cys 740 745 750 Gly Phe Ala Val Glu 755 <210> 11 <211> 748 <212> PRT <213> Homo Sapiens <400> 11 Met Ser Asn Pro Gly Gly Arg Arg Asn Gly Pro Val Lys Leu Arg Leu 1 5 10 15 Thr Val Leu Cys Ala Lys Asn Leu Val Lys Lys Asp Phe Phe Arg Leu 20 25 30 Pro Asp Pro Phe Ala Lys Val Val Val Asp Gly Ser Gly Gln Cys His 35 40 45 Ser Thr Asp Thr Val Lys Asn Thr Leu Asp Pro Lys Trp Asn Gln His 50 55 60 Tyr Asp Leu Tyr Ile Gly Lys Ser Asp Ser Val Thr Ile Ser Val Trp 65 70 75 80 Asn His Lys Lys Ile His Lys Lys Gln Gly Ala Gly Phe Leu Gly Cys 85 90 95 Val Arg Leu Leu Ser Asn Ala Ile Asn Arg Leu Lys Asp Thr Gly Tyr 100 105 110 Gln Arg Leu Asp Leu Cys Lys Leu Gly Pro Asn Asp Asn Asp Thr Val 115 120 125 Arg Gly Gln Ile Val Val Ser Leu Gln Ser Arg Asp Arg Ile Gly Thr 130 135 140 Gly Gly Gln Val Val Asp Cys Ser Arg Leu Phe Asp Asn Asp Leu Pro 145 150 155 160 Asp Gly Trp Glu Glu Arg Arg Thr Ala Ser Gly Arg Ile Gln Tyr Leu 165 170 175 Asn His Ile Thr Arg Thr Thr Gln Trp Glu Arg Pro Thr Arg Pro Ala 180 185 190 Ser Glu Tyr Ser Ser Pro Gly Arg Pro Leu Ser Cys Phe Val Asp Glu 195 200 205 Asn Thr Pro Ile Ser Gly Thr Asn Gly Ala Thr Cys Gly Gln Ser Ser 210 215 220 Asp Pro Arg Leu Ala Glu Arg Arg Val Arg Ser Gln Arg His Arg Asn 225 230 235 240 Tyr Met Ser Arg Thr His Leu His Thr Pro Pro Asp Leu Pro Glu Gly 245 250 255 Tyr Glu Gln Arg Thr Thr Gln Gln Gly Gln Val Tyr Phe Leu His Thr 260 265 270 Gln Thr Gly Val Ser Thr Trp His Asp Pro Arg Val Pro Arg Asp Leu 275 280 285 Ser Asn Ile Asn Cys Glu Glu Leu Gly Pro Leu Pro Pro Gly Trp Glu 290 295 300 Ile Arg Asn Thr Ala Thr Gly Arg Val Tyr Phe Val Asp His Asn Asn 305 310 315 320 Arg Thr Thr Gln Phe Thr Asp Pro Arg Leu Ser Ala Asn Leu His Leu 325 330 335 Val Leu Asn Arg Gln Asn Gln Leu Lys Asp Gln Gln Gln Gln Gln Val 340 345 350 Val Ser Leu Cys Pro Asp Asp Thr Glu Cys Leu Thr Val Pro Arg Tyr 355 360 365 Lys Arg Asp Leu Val Gln Lys Leu Lys Ile Leu Arg Gln Glu Leu Ser 370 375 380 Gln Gln Gln Pro Gln Ala Gly His Cys Arg Ile Glu Val Ser Arg Glu 385 390 395 400 Glu Ile Phe Glu Glu Ser Tyr Arg Gln Val Met Lys Met Arg Pro Lys 405 410 415 Asp Leu Trp Lys Arg Leu Met Ile Lys Phe Arg Gly Glu Glu Gly Leu 420 425 430 Asp Tyr Gly Gly Val Ala Arg Glu Trp Leu Tyr Leu Leu Ser His Glu 435 440 445 Met Leu Asn Pro Tyr Tyr Gly Leu Phe Gln Tyr Ser Arg Asp Asp Ile 450 455 460 Tyr Thr Leu Gln Ile Asn Pro Asp Ser Ala Val Asn Pro Glu His Leu 465 470 475 480 Ser Tyr Phe His Phe Val Gly Arg Ile Met Gly Met Ala Val Phe His 485 490 495 Gly His Tyr Ile Asp Gly Gly Phe Thr Leu Pro Phe Tyr Lys Gln Leu 500 505 510 Leu Gly Lys Ser Ile Thr Leu Asp Asp Met Glu Leu Val Asp Pro Asp 515 520 525 Leu His Asn Ser Leu Val Trp Ile Leu Glu Asn Asp Ile Thr Gly Val 530 535 540 Leu Asp His Thr Phe Cys Val Glu His Asn Ala Tyr Gly Glu Ile Ile 545 550 555 560 Gln His Glu Leu Lys Pro Asn Gly Lys Ser Ile Pro Val Asn Glu Glu 565 570 575 Asn Lys Lys Glu Tyr Val Arg Leu Tyr Val Asn Trp Arg Phe Leu Arg 580 585 590 Gly Ile Glu Ala Gln Phe Leu Ala Leu Gln Lys Gly Phe Asn Glu Val 595 600 605 Ile Pro Gln His Leu Leu Lys Thr Phe Asp Glu Lys Glu Leu Glu Leu 610 615 620 Ile Ile Cys Gly Leu Gly Lys Ile Asp Val Asn Asp Trp Lys Val Asn 625 630 635 640 Thr Arg Leu Lys His Cys Thr Pro Asp Ser Asn Ile Val Lys Trp Phe 645 650 655 Trp Lys Ala Val Glu Phe Phe Asp Glu Glu Arg Arg Ala Arg Leu Leu 660 665 670 Gln Phe Val Thr Gly Ser Ser Arg Val Pro Leu Gln Gly Phe Lys Ala 675 680 685 Leu Gln Gly Ala Ala Gly Pro Arg Leu Phe Thr Ile His Gln Ile Asp 690 695 700 Ala Cys Thr Asn Asn Leu Pro Lys Ala His Thr Cys Phe Asn Arg Ile 705 710 715 720 Asp Ile Pro Pro Tyr Glu Ser Tyr Glu Lys Leu Tyr Glu Lys Leu Leu 725 730 735 Thr Ala Ile Glu Glu Thr Cys Gly Phe Ala Val Glu 740 745 <210> 12 <211> 903 <212> PRT <213> Homo Sapiens <400> 12 Met Ser Asp Ser Gly Ser Gln Leu Gly Ser Met Gly Ser Leu Thr Met 1 5 10 15 Lys Ser Gln Leu Gln Ile Thr Val Ile Ser Ala Lys Leu Lys Glu Asn 20 25 30 Lys Lys Asn Trp Phe Gly Pro Ser Pro Tyr Val Glu Val Thr Val Asp 35 40 45 Gly Gln Ser Lys Lys Thr Glu Lys Cys Asn Asn Thr Asn Ser Pro Lys 50 55 60 Trp Lys Gln Pro Leu Thr Val Ile Val Thr Pro Val Ser Lys Leu His 65 70 75 80 Phe Arg Val Trp Ser His Gln Thr Leu Lys Ser Asp Val Leu Leu Gly 85 90 95 Thr Ala Ala Leu Asp Ile Tyr Glu Thr Leu Lys Ser Asn Asn Met Lys 100 105 110 Leu Glu Glu Val Val Val Thr Leu Gln Leu Gly Gly Asp Lys Glu Pro 115 120 125 Thr Glu Thr Ile Gly Asp Leu Ser Ile Cys Leu Asp Gly Leu Gln Leu 130 135 140 Glu Ser Glu Val Val Thr Asn Gly Glu Thr Thr Cys Ser Glu Asn Gly 145 150 155 160 Val Ser Leu Cys Leu Pro Arg Leu Glu Cys Asn Ser Ala Ile Ser Ala 165 170 175 His Cys Asn Leu Cys Leu Pro Gly Leu Ser Asp Ser Pro Ile Ser Ala 180 185 190 Ser Arg Val Ala Gly Phe Thr Gly Ala Ser Gln Asn Asp Asp Gly Ser 195 200 205 Arg Ser Lys Asp Glu Thr Arg Val Ser Thr Asn Gly Ser Asp Asp Pro 210 215 220 Glu Asp Ala Gly Ala Gly Glu Asn Arg Arg Val Ser Gly Asn Asn Ser 225 230 235 240 Pro Ser Leu Ser Asn Gly Gly Phe Lys Pro Ser Arg Pro Pro Arg Pro 245 250 255 Ser Arg Pro Pro Pro Pro Thr Pro Arg Arg Pro Ala Ser Val Asn Gly 260 265 270 Ser Pro Ser Ala Thr Ser Glu Ser Asp Gly Ser Ser Thr Gly Ser Leu 275 280 285 Pro Pro Thr Asn Thr Asn Thr Asn Thr Ser Glu Gly Ala Thr Ser Gly 290 295 300 Leu Ile Ile Pro Leu Thr Ile Ser Gly Gly Ser Gly Pro Arg Pro Leu 305 310 315 320 Asn Pro Val Thr Gln Ala Pro Leu Pro Pro Gly Trp Glu Gln Arg Val 325 330 335 Asp Gln His Gly Arg Val Tyr Tyr Val Asp His Val Glu Lys Arg Thr 340 345 350 Thr Trp Asp Arg Pro Glu Pro Leu Pro Pro Gly Trp Glu Arg Arg Val 355 360 365 Asp Asn Met Gly Arg Ile Tyr Tyr Val Asp His Phe Thr Arg Thr Thr 370 375 380 Thr Trp Gln Arg Pro Thr Leu Glu Ser Val Arg Asn Tyr Glu Gln Trp 385 390 395 400 Gln Leu Gln Arg Ser Gln Leu Gln Gly Ala Met Gln Gln Phe Asn Gln 405 410 415 Arg Phe Ile Tyr Gly Asn Gln Asp Leu Phe Ala Thr Ser Gln Ser Lys 420 425 430 Glu Phe Asp Pro Leu Gly Pro Leu Pro Pro Gly Trp Glu Lys Arg Thr 435 440 445 Asp Ser Asn Gly Arg Val Tyr Phe Val Asn His Asn Thr Arg Ile Thr 450 455 460 Gln Trp Glu Asp Pro Arg Ser Gln Gly Gln Leu Asn Glu Lys Pro Leu 465 470 475 480 Pro Glu Gly Trp Glu Met Arg Phe Thr Val Asp Gly Ile Pro Tyr Phe 485 490 495 Val Asp His Asn Arg Arg Thr Thr Thr Tyr Ile Asp Pro Arg Thr Gly 500 505 510 Lys Ser Ala Leu Asp Asn Gly Pro Gln Ile Ala Tyr Val Arg Asp Phe 515 520 525 Lys Ala Lys Val Gln Tyr Phe Arg Phe Trp Cys Gln Gln Leu Ala Met 530 535 540 Pro Gln His Ile Lys Ile Thr Val Thr Arg Lys Thr Leu Phe Glu Asp 545 550 555 560 Ser Phe Gln Gln Ile Met Ser Phe Ser Pro Gln Asp Leu Arg Arg Arg 565 570 575 Leu Trp Val Ile Phe Pro Gly Glu Glu Gly Leu Asp Tyr Gly Gly Val 580 585 590 Ala Arg Glu Trp Phe Phe Leu Leu Ser His Glu Val Leu Asn Pro Met 595 600 605 Tyr Cys Leu Phe Glu Tyr Ala Gly Lys Asp Asn Tyr Cys Leu Gln Ile 610 615 620 Asn Pro Ala Ser Tyr Ile Asn Pro Asp His Leu Lys Tyr Phe Arg Phe 625 630 635 640 Ile Gly Arg Phe Ile Ala Met Ala Leu Phe His Gly Lys Phe Ile Asp 645 650 655 Thr Gly Phe Ser Leu Pro Phe Tyr Lys Arg Ile Leu Asn Lys Pro Val 660 665 670 Gly Leu Lys Asp Leu Glu Ser Ile Asp Pro Glu Phe Tyr Asn Ser Leu 675 680 685 Ile Trp Val Lys Glu Asn Asn Ile Glu Glu Cys Asp Leu Glu Met Tyr 690 695 700 Phe Ser Val Asp Lys Glu Ile Leu Gly Glu Ile Lys Ser His Asp Leu 705 710 715 720 Lys Pro Asn Gly Gly Asn Ile Leu Val Thr Glu Glu Asn Lys Glu Glu 725 730 735 Tyr Ile Arg Met Val Ala Glu Trp Arg Leu Ser Arg Gly Val Glu Glu 740 745 750 Gln Thr Gln Ala Phe Phe Glu Gly Phe Asn Glu Ile Leu Pro Gln Gln 755 760 765 Tyr Leu Gln Tyr Phe Asp Ala Lys Glu Leu Glu Val Leu Leu Cys Gly 770 775 780 Met Gln Glu Ile Asp Leu Asn Asp Trp Gln Arg His Ala Ile Tyr Arg 785 790 795 800 His Tyr Ala Arg Thr Ser Lys Gln Ile Met Trp Phe Trp Gln Phe Val 805 810 815 Lys Glu Ile Asp Asn Glu Lys Arg Met Arg Leu Leu Gln Phe Val Thr 820 825 830 Gly Thr Cys Arg Leu Pro Val Gly Gly Phe Ala Asp Leu Met Gly Ser 835 840 845 Asn Gly Pro Gln Lys Phe Cys Ile Glu Lys Val Gly Lys Glu Asn Trp 850 855 860 Leu Pro Arg Ser His Thr Cys Phe Asn Arg Leu Asp Leu Pro Pro Tyr 865 870 875 880 Lys Ser Tyr Glu Gln Leu Lys Glu Lys Leu Leu Phe Ala Ile Glu Glu 885 890 895 Thr Glu Gly Phe Gly Gln Glu 900 <210> 13 <211> 1606 <212> PRT <213> Homo Sapiens <400> 13 Met Leu Leu His Leu Cys Ser Val Lys Asn Leu Tyr Gln Asn Arg Phe 1 5 10 15 Leu Gly Leu Ala Ala Met Ala Ser Pro Ser Arg Asn Ser Gln Ser Arg 20 25 30 Arg Arg Cys Lys Glu Pro Leu Arg Tyr Ser Tyr Asn Pro Asp Gln Phe 35 40 45 His Asn Met Asp Leu Arg Gly Gly Pro His Asp Gly Val Thr Ile Pro 50 55 60 Arg Ser Thr Ser Asp Thr Asp Leu Val Thr Ser Asp Ser Arg Ser Thr 65 70 75 80 Leu Met Val Ser Ser Ser Tyr Tyr Ser Ile Gly His Ser Gln Asp Leu 85 90 95 Val Ile His Trp Asp Ile Lys Glu Glu Val Asp Ala Gly Asp Trp Ile 100 105 110 Gly Met Tyr Leu Ile Asp Glu Val Leu Ser Glu Asn Phe Leu Asp Tyr 115 120 125 Lys Asn Arg Gly Val Asn Gly Ser His Arg Gly Gln Ile Ile Trp Lys 130 135 140 Ile Asp Ala Ser Ser Tyr Phe Val Glu Pro Glu Thr Lys Ile Cys Phe 145 150 155 160 Lys Tyr Tyr His Gly Val Ser Gly Ala Leu Arg Ala Thr Thr Pro Ser 165 170 175 Val Thr Val Lys Asn Ser Ala Ala Pro Ile Phe Lys Ser Ile Gly Ala 180 185 190 Asp Glu Thr Val Gln Gly Gln Gly Ser Arg Arg Leu Ile Ser Phe Ser 195 200 205 Leu Ser Asp Phe Gln Ala Met Gly Leu Lys Lys Gly Met Phe Phe Asn 210 215 220 Pro Asp Pro Tyr Leu Lys Ile Ser Ile Gln Pro Gly Lys His Ser Ile 225 230 235 240 Phe Pro Ala Leu Pro His His Gly Gln Glu Arg Arg Ser Lys Ile Ile 245 250 255 Gly Asn Thr Val Asn Pro Ile Trp Gln Ala Glu Gln Phe Ser Phe Val 260 265 270 Ser Leu Pro Thr Asp Val Leu Glu Ile Glu Val Lys Asp Lys Phe Ala 275 280 285 Lys Ser Arg Pro Ile Ile Lys Arg Phe Leu Gly Lys Leu Ser Met Pro 290 295 300 Val Gln Arg Leu Leu Glu Arg His Ala Ile Gly Asp Arg Val Val Ser 305 310 315 320 Tyr Thr Leu Gly Arg Arg Leu Pro Thr Asp His Val Ser Gly Gln Leu 325 330 335 Gln Phe Arg Phe Glu Ile Thr Ser Ser Ile His Pro Asp Asp Glu Glu 340 345 350 Ile Ser Leu Ser Thr Glu Pro Glu Ser Ala Gln Ile Gln Asp Ser Pro 355 360 365 Met Asn Asn Leu Met Glu Ser Gly Ser Gly Glu Pro Arg Ser Glu Ala 370 375 380 Pro Glu Ser Ser Glu Ser Trp Lys Pro Glu Gln Leu Gly Glu Gly Ser 385 390 395 400 Val Pro Asp Gly Pro Gly Asn Gln Ser Ile Glu Leu Ser Arg Pro Ala 405 410 415 Glu Glu Ala Ala Val Ile Thr Glu Ala Gly Asp Gln Gly Met Val Ser 420 425 430 Val Gly Pro Glu Gly Ala Gly Glu Leu Leu Ala Gln Val Gln Lys Asp 435 440 445 Ile Gln Pro Ala Pro Ser Ala Glu Glu Leu Ala Glu Gln Leu Asp Leu 450 455 460 Gly Glu Glu Ala Ser Ala Leu Leu Leu Glu Asp Gly Glu Ala Pro Ala 465 470 475 480 Ser Thr Lys Glu Glu Pro Leu Glu Glu Glu Ala Thr Thr Gln Ser Arg 485 490 495 Ala Gly Arg Glu Glu Glu Glu Lys Glu Gln Glu Glu Glu Gly Asp Val 500 505 510 Ser Thr Leu Glu Gln Gly Glu Gly Arg Leu Gln Leu Arg Ala Ser Val 515 520 525 Lys Arg Lys Ser Arg Pro Cys Ser Leu Pro Val Ser Glu Leu Glu Thr 530 535 540 Val Ile Ala Ser Ala Cys Gly Asp Pro Glu Thr Pro Arg Thr His Tyr 545 550 555 560 Ile Arg Ile His Thr Leu Leu His Ser Met Pro Ser Ala Gln Gly Gly 565 570 575 Ser Ala Ala Glu Glu Glu Asp Gly Ala Glu Glu Glu Ser Thr Leu Lys 580 585 590 Asp Ser Ser Glu Lys Asp Gly Leu Ser Glu Val Asp Thr Val Ala Ala 595 600 605 Asp Pro Ser Ala Leu Glu Glu Asp Arg Glu Glu Pro Glu Gly Ala Thr 610 615 620 Pro Gly Thr Ala His Pro Gly His Ser Gly Gly His Phe Pro Ser Leu 625 630 635 640 Ala Asn Gly Ala Ala Gln Asp Gly Asp Thr His Pro Ser Thr Gly Ser 645 650 655 Glu Ser Asp Ser Ser Pro Arg Gln Gly Gly Asp His Ser Cys Glu Gly 660 665 670 Cys Asp Ala Ser Cys Cys Ser Pro Ser Cys Tyr Ser Ser Ser Cys Tyr 675 680 685 Ser Thr Ser Cys Tyr Ser Ser Ser Cys Tyr Ser Ala Ser Cys Tyr Ser 690 695 700 Pro Ser Cys Tyr Asn Gly Asn Arg Phe Ala Ser His Thr Arg Phe Ser 705 710 715 720 Ser Val Asp Ser Ala Lys Ile Ser Glu Ser Thr Val Phe Ser Ser Gln 725 730 735 Asp Asp Glu Glu Glu Glu Asn Ser Ala Phe Glu Ser Val Pro Asp Ser 740 745 750 Met Gln Ser Pro Glu Leu Asp Pro Glu Ser Thr Asn Gly Ala Gly Pro 755 760 765 Trp Gln Asp Glu Leu Ala Ala Pro Ser Gly His Val Glu Arg Ser Pro 770 775 780 Glu Gly Leu Glu Ser Pro Val Ala Gly Pro Ser Asn Arg Arg Glu Gly 785 790 795 800 Glu Cys Pro Ile Leu His Asn Ser Gln Pro Val Ser Gln Leu Pro Ser 805 810 815 Leu Arg Pro Glu His His His Tyr Pro Thr Ile Asp Glu Pro Leu Pro 820 825 830 Pro Asn Trp Glu Ala Arg Ile Asp Ser His Gly Arg Val Phe Tyr Val 835 840 845 Asp His Val Asn Arg Thr Thr Thr Trp Gln Arg Pro Thr Ala Ala Ala 850 855 860 Thr Pro Asp Gly Met Arg Arg Ser Gly Ser Ile Gln Gln Met Glu Gln 865 870 875 880 Leu Asn Arg Arg Tyr Gln Asn Ile Gln Arg Thr Ile Ala Thr Glu Arg 885 890 895 Ser Glu Glu Asp Ser Gly Ser Gln Ser Cys Glu Gln Ala Pro Ala Gly 900 905 910 Gly Gly Gly Gly Gly Gly Ser Asp Ser Glu Ala Glu Ser Ser Gln Ser 915 920 925 Ser Leu Asp Leu Arg Arg Glu Gly Ser Leu Ser Pro Val Asn Ser Gln 930 935 940 Lys Ile Thr Leu Leu Leu Gln Ser Pro Ala Val Lys Phe Ile Thr Asn 945 950 955 960 Pro Glu Phe Phe Thr Val Leu His Ala Asn Tyr Ser Ala Tyr Arg Val 965 970 975 Phe Thr Ser Ser Thr Cys Leu Lys His Met Ile Leu Lys Val Arg Arg 980 985 990 Asp Ala Arg Asn Phe Glu Arg Tyr Gln His Asn Arg Asp Leu Val Asn 995 1000 1005 Phe Ile Asn Met Phe Ala Asp Thr Arg Leu Glu Leu Pro Arg Gly 1010 1015 1020 Trp Glu Ile Lys Thr Asp Gln Gln Gly Lys Ser Phe Phe Val Asp 1025 1030 1035 His Asn Ser Arg Ala Thr Thr Phe Ile Asp Pro Arg Ile Pro Leu 1040 1045 1050 Gln Asn Gly Arg Leu Pro Asn His Leu Thr His Arg Gln His Leu 1055 1060 1065 Gln Arg Leu Arg Ser Tyr Ser Ala Gly Glu Ala Ser Glu Val Ser 1070 1075 1080 Arg Asn Arg Gly Ala Ser Leu Leu Ala Arg Pro Gly His Ser Leu 1085 1090 1095 Val Ala Ala Ile Arg Ser Gln His Gln His Glu Ser Leu Pro Leu 1100 1105 1110 Ala Tyr Asn Asp Lys Ile Val Ala Phe Leu Arg Gln Pro Asn Ile 1115 1120 1125 Phe Glu Met Leu Gln Glu Arg Gln Pro Ser Leu Ala Arg Asn His 1130 1135 1140 Thr Leu Arg Glu Lys Ile His Tyr Ile Arg Thr Glu Gly Asn His 1145 1150 1155 Gly Leu Glu Lys Leu Ser Cys Asp Ala Asp Leu Val Ile Leu Leu 1160 1165 1170 Ser Leu Phe Glu Glu Glu Ile Met Ser Tyr Val Pro Leu Gln Ala 1175 1180 1185 Ala Phe His Pro Gly Tyr Ser Phe Ser Pro Arg Cys Ser Pro Cys 1190 1195 1200 Ser Ser Pro Gln Asn Ser Pro Gly Leu Gln Arg Ala Ser Ala Arg 1205 1210 1215 Ala Pro Ser Pro Tyr Arg Arg Asp Phe Glu Ala Lys Leu Arg Asn 1220 1225 1230 Phe Tyr Arg Lys Leu Glu Ala Lys Gly Phe Gly Gln Gly Pro Gly 1235 1240 1245 Lys Ile Lys Leu Ile Ile Arg Arg Asp His Leu Leu Glu Gly Thr 1250 1255 1260 Phe Asn Gln Val Met Ala Tyr Ser Arg Lys Glu Leu Gln Arg Asn 1265 1270 1275 Lys Leu Tyr Val Thr Phe Val Gly Glu Glu Gly Leu Asp Tyr Ser 1280 1285 1290 Gly Pro Ser Arg Glu Phe Phe Phe Leu Leu Ser Gln Glu Leu Phe 1295 1300 1305 Asn Pro Tyr Tyr Gly Leu Phe Glu Tyr Ser Ala Asn Asp Thr Tyr 1310 1315 1320 Thr Val Gln Ile Ser Pro Met Ser Ala Phe Val Glu Asn His Leu 1325 1330 1335 Glu Trp Phe Arg Phe Ser Gly Arg Ile Leu Gly Leu Ala Leu Ile 1340 1345 1350 His Gln Tyr Leu Leu Asp Ala Phe Phe Thr Arg Pro Phe Tyr Lys 1355 1360 1365 Ala Leu Leu Arg Leu Pro Cys Asp Leu Ser Asp Leu Glu Tyr Leu 1370 1375 1380 Asp Glu Glu Phe His Gln Ser Leu Gln Trp Met Lys Asp Asn Asn 1385 1390 1395 Ile Thr Asp Ile Leu Asp Leu Thr Phe Thr Val Asn Glu Glu Val 1400 1405 1410 Phe Gly Gln Val Thr Glu Arg Glu Leu Lys Ser Gly Gly Ala Asn 1415 1420 1425 Thr Gln Val Thr Glu Lys Asn Lys Lys Glu Tyr Ile Glu Arg Met 1430 1435 1440 Val Lys Trp Arg Val Glu Arg Gly Val Val Gln Gln Thr Glu Ala 1445 1450 1455 Leu Val Arg Gly Phe Tyr Glu Val Val Asp Ser Arg Leu Val Ser 1460 1465 1470 Val Phe Asp Ala Arg Glu Leu Glu Leu Val Ile Ala Gly Thr Ala 1475 1480 1485 Glu Ile Asp Leu Asn Asp Trp Arg Asn Asn Thr Glu Tyr Arg Gly 1490 1495 1500 Gly Tyr His Asp Gly His Leu Val Ile Arg Trp Phe Trp Ala Ala 1505 1510 1515 Val Glu Arg Phe Asn Asn Glu Gln Arg Leu Arg Leu Leu Gln Phe 1520 1525 1530 Val Thr Gly Thr Ser Ser Val Pro Tyr Glu Gly Phe Ala Ala Leu 1535 1540 1545 Arg Gly Ser Asn Gly Leu Arg Arg Phe Cys Ile Glu Lys Trp Gly 1550 1555 1560 Lys Ile Thr Ser Leu Pro Arg Ala His Thr Cys Phe Asn Arg Leu 1565 1570 1575 Asp Leu Pro Pro Tyr Pro Ser Tyr Ser Met Leu Tyr Glu Lys Leu 1580 1585 1590 Leu Thr Ala Val Glu Glu Thr Ser Thr Phe Gly Leu Glu 1595 1600 1605 <210> 14 <211> 1572 <212> PRT <213> Homo Sapiens <400> 14 Met Ala Ser Ser Ala Arg Glu His Leu Leu Phe Val Arg Arg Arg Asn 1 5 10 15 Pro Gln Met Arg Tyr Thr Leu Ser Pro Glu Asn Leu Gln Ser Leu Ala 20 25 30 Ala Gln Ser Ser Met Pro Glu Asn Met Thr Leu Gln Arg Ala Asn Ser 35 40 45 Asp Thr Asp Leu Val Thr Ser Glu Ser Arg Ser Ser Leu Thr Ala Ser 50 55 60 Met Tyr Glu Tyr Thr Leu Gly Gln Ala Gln Asn Leu Ile Ile Phe Trp 65 70 75 80 Asp Ile Lys Glu Glu Val Asp Pro Ser Asp Trp Ile Gly Leu Tyr His 85 90 95 Ile Asp Glu Asn Ser Pro Ala Asn Phe Trp Asp Ser Lys Asn Arg Gly 100 105 110 Val Thr Gly Thr Gln Lys Gly Gln Ile Val Trp Arg Ile Glu Pro Gly 115 120 125 Pro Tyr Phe Met Glu Pro Glu Ile Lys Ile Cys Phe Lys Tyr Tyr His 130 135 140 Gly Ile Ser Gly Ala Leu Arg Ala Thr Thr Pro Cys Ile Thr Val Lys 145 150 155 160 Asn Pro Ala Val Met Met Gly Ala Glu Gly Met Glu Gly Gly Ala Ser 165 170 175 Gly Asn Leu His Ser Arg Lys Leu Val Ser Phe Thr Leu Ser Asp Leu 180 185 190 Arg Ala Val Gly Leu Lys Lys Gly Met Phe Phe Asn Pro Asp Pro Tyr 195 200 205 Leu Lys Met Ser Ile Gln Pro Gly Lys Lys Ser Ser Phe Pro Thr Cys 210 215 220 Ala His His Gly Gln Glu Arg Arg Ser Thr Ile Ile Ser Asn Thr Thr 225 230 235 240 Asn Pro Ile Trp His Arg Glu Lys Tyr Ser Phe Phe Ala Leu Leu Thr 245 250 255 Asp Val Leu Glu Ile Glu Ile Lys Asp Lys Phe Ala Lys Ser Arg Pro 260 265 270 Ile Ile Lys Arg Phe Leu Gly Lys Leu Thr Ile Pro Val Gln Arg Leu 275 280 285 Leu Glu Arg Gln Ala Ile Gly Asp Gln Met Leu Ser Tyr Asn Leu Gly 290 295 300 Arg Arg Leu Pro Ala Asp His Val Ser Gly Tyr Leu Gln Phe Lys Val 305 310 315 320 Glu Val Thr Ser Ser Val His Glu Asp Ala Ser Pro Glu Ala Val Gly 325 330 335 Thr Ile Leu Gly Val Asn Ser Val Asn Gly Asp Leu Gly Ser Pro Ser 340 345 350 Asp Asp Glu Asp Met Pro Gly Ser His His Asp Ser Gln Val Cys Ser 355 360 365 Asn Gly Pro Val Ser Glu Asp Ser Ala Ala Asp Gly Thr Pro Lys His 370 375 380 Ser Phe Arg Thr Ser Ser Thr Leu Glu Ile Asp Thr Glu Glu Leu Thr 385 390 395 400 Ser Thr Ser Ser Arg Thr Ser Pro Pro Arg Gly Arg Gln Asp Ser Leu 405 410 415 Asn Asp Tyr Leu Asp Ala Ile Glu His Asn Gly His Ser Arg Pro Gly 420 425 430 Thr Ala Thr Cys Ser Glu Arg Ser Met Gly Ala Ser Pro Lys Leu Arg 435 440 445 Ser Ser Phe Pro Thr Asp Thr Arg Leu Asn Ala Met Leu His Ile Asp 450 455 460 Ser Asp Glu Glu Asp His Glu Phe Gln Gln Asp Leu Gly Tyr Pro Ser 465 470 475 480 Ser Leu Glu Glu Glu Gly Gly Leu Ile Met Phe Ser Arg Ala Ser Arg 485 490 495 Ala Asp Asp Gly Ser Leu Thr Ser Gln Thr Lys Leu Glu Asp Asn Pro 500 505 510 Val Glu Asn Glu Glu Ala Ser Thr His Glu Ala Ala Ser Phe Glu Asp 515 520 525 Lys Pro Glu Asn Leu Pro Glu Leu Ala Glu Ser Ser Leu Pro Ala Gly 530 535 540 Pro Ala Pro Glu Glu Gly Glu Gly Gly Pro Glu Pro Gln Pro Ser Ala 545 550 555 560 Asp Gln Gly Ser Ala Glu Leu Cys Gly Ser Gln Glu Val Asp Gln Pro 565 570 575 Thr Ser Gly Ala Asp Thr Gly Thr Ser Asp Ala Ser Gly Gly Ser Arg 580 585 590 Arg Ala Val Ser Glu Thr Glu Ser Leu Asp Gln Gly Ser Glu Pro Ser 595 600 605 Gln Val Ser Ser Glu Thr Glu Pro Ser Asp Pro Ala Arg Thr Glu Ser 610 615 620 Val Ser Glu Ala Ser Thr Arg Pro Glu Gly Glu Ser Asp Leu Glu Cys 625 630 635 640 Ala Asp Ser Ser Cys Asn Glu Ser Val Thr Thr Gln Leu Ser Ser Val 645 650 655 Asp Thr Arg Cys Ser Ser Leu Glu Ser Ala Arg Phe Pro Glu Thr Pro 660 665 670 Ala Phe Ser Ser Gln Glu Glu Glu Asp Gly Ala Cys Ala Ala Glu Pro 675 680 685 Thr Ser Ser Gly Pro Ala Glu Gly Ser Gln Glu Ser Val Cys Thr Ala 690 695 700 Gly Ser Leu Pro Val Val Gln Val Pro Ser Gly Glu Asp Glu Gly Pro 705 710 715 720 Gly Ala Glu Ser Ala Thr Val Pro Asp Gln Glu Glu Leu Gly Glu Val 725 730 735 Trp Gln Arg Arg Gly Ser Leu Glu Gly Ala Ala Ala Ala Ala Glu Ser 740 745 750 Pro Pro Gln Glu Glu Gly Ser Ala Gly Glu Ala Gln Gly Thr Cys Glu 755 760 765 Gly Ala Thr Ala Gln Glu Glu Gly Ala Thr Gly Gly Ser Gln Ala Asn 770 775 780 Gly His Gln Pro Leu Arg Ser Leu Pro Ser Val Arg Gln Asp Val Ser 785 790 795 800 Arg Tyr Gln Arg Val Asp Glu Ala Leu Pro Pro Asn Trp Glu Ala Arg 805 810 815 Ile Asp Ser His Gly Arg Ile Phe Tyr Val Asp His Val Asn Arg Thr 820 825 830 Thr Thr Trp Gln Arg Pro Thr Ala Pro Pro Ala Pro Gln Val Leu Gln 835 840 845 Arg Ser Asn Ser Ile Gln Gln Met Glu Gln Leu Asn Arg Arg Tyr Gln 850 855 860 Ser Ile Arg Arg Thr Met Thr Asn Glu Arg Pro Glu Glu Asn Thr Asn 865 870 875 880 Ala Ile Asp Gly Ala Gly Glu Glu Ala Asp Phe His Gln Ala Ser Ala 885 890 895 Asp Phe Arg Arg Glu Asn Ile Leu Pro His Ser Thr Ser Arg Ser Arg 900 905 910 Ile Thr Leu Leu Leu Gln Ser Pro Pro Val Lys Phe Leu Ile Ser Pro 915 920 925 Glu Phe Phe Thr Val Leu His Ser Asn Pro Ser Ala Tyr Arg Met Phe 930 935 940 Thr Asn Asn Thr Cys Leu Lys His Met Ile Thr Lys Val Arg Arg Asp 945 950 955 960 Thr His His Phe Glu Arg Tyr Gln His Asn Arg Asp Leu Val Gly Phe 965 970 975 Leu Asn Met Phe Ala Asn Lys Gln Leu Glu Leu Pro Arg Gly Trp Glu 980 985 990 Met Lys His Asp His Gln Gly Lys Ala Phe Phe Val Asp His Asn Ser 995 1000 1005 Arg Thr Thr Thr Phe Ile Asp Pro Arg Leu Pro Leu Gln Ser Ser 1010 1015 1020 Arg Pro Thr Ser Ala Leu Val His Arg Gln His Leu Thr Arg Gln 1025 1030 1035 Arg Ser His Ser Ala Gly Glu Val Gly Glu Asp Ser Arg His Ala 1040 1045 1050 Gly Pro Pro Val Leu Pro Arg Pro Ser Ser Thr Phe Asn Thr Val 1055 1060 1065 Ser Arg Pro Gln Tyr Gln Asp Met Val Pro Val Ala Tyr Asn Asp 1070 1075 1080 Lys Ile Val Ala Phe Leu Arg Gln Pro Asn Ile Phe Glu Ile Leu 1085 1090 1095 Gln Glu Arg Gln Pro Asp Leu Thr Arg Asn His Ser Leu Arg Glu 1100 1105 1110 Lys Ile Gln Phe Ile Arg Thr Glu Gly Thr Pro Gly Leu Val Arg 1115 1120 1125 Leu Ser Ser Asp Ala Asp Leu Val Met Leu Leu Ser Leu Phe Glu 1130 1135 1140 Glu Glu Ile Met Ser Tyr Val Pro Pro His Ala Leu Leu His Pro 1145 1150 1155 Ser Tyr Cys Gln Ser Pro Arg Gly Ser Pro Val Ser Ser Pro Gln 1160 1165 1170 Asn Ser Pro Gly Thr Gln Arg Ala Asn Ala Arg Ala Pro Ala Pro 1175 1180 1185 Tyr Lys Arg Asp Phe Glu Ala Lys Leu Arg Asn Phe Tyr Arg Lys 1190 1195 1200 Leu Glu Thr Lys Gly Tyr Gly Gln Gly Pro Gly Lys Leu Lys Leu 1205 1210 1215 Ile Ile Arg Arg Asp His Leu Leu Glu Asp Ala Phe Asn Gln Ile 1220 1225 1230 Met Gly Tyr Ser Arg Lys Asp Leu Gln Arg Asn Lys Leu Tyr Val 1235 1240 1245 Thr Phe Val Gly Glu Glu Gly Leu Asp Tyr Ser Gly Pro Ser Arg 1250 1255 1260 Glu Phe Phe Phe Leu Val Ser Arg Glu Leu Phe Asn Pro Tyr Tyr 1265 1270 1275 Gly Leu Phe Glu Tyr Ser Ala Asn Asp Thr Tyr Thr Val Gln Ile 1280 1285 1290 Ser Pro Met Ser Ala Phe Val Asp Asn His His Glu Trp Phe Arg 1295 1300 1305 Phe Ser Gly Arg Ile Leu Gly Leu Ala Leu Ile His Gln Tyr Leu 1310 1315 1320 Leu Asp Ala Phe Phe Thr Arg Pro Phe Tyr Lys Ala Leu Leu Arg 1325 1330 1335 Ile Leu Cys Asp Leu Ser Asp Leu Glu Tyr Leu Asp Glu Glu Phe 1340 1345 1350 His Gln Ser Leu Gln Trp Met Lys Asp Asn Asp Ile His Asp Ile 1355 1360 1365 Leu Asp Leu Thr Phe Thr Val Asn Glu Glu Val Phe Gly Gln Ile 1370 1375 1380 Thr Glu Arg Glu Leu Lys Pro Gly Gly Ala Asn Ile Pro Val Thr 1385 1390 1395 Glu Lys Asn Lys Lys Glu Tyr Ile Glu Arg Met Val Lys Trp Arg 1400 1405 1410 Ile Glu Arg Gly Val Val Gln Gln Thr Glu Ser Leu Val Arg Gly 1415 1420 1425 Phe Tyr Glu Val Val Asp Ala Arg Leu Val Ser Val Phe Asp Ala 1430 1435 1440 Arg Glu Leu Glu Leu Val Ile Ala Gly Thr Ala Glu Ile Asp Leu 1445 1450 1455 Ser Asp Trp Arg Asn Asn Thr Glu Tyr Arg Gly Gly Tyr His Asp 1460 1465 1470 Asn His Ile Val Ile Arg Trp Phe Trp Ala Ala Val Glu Arg Phe 1475 1480 1485 Asn Asn Glu Gln Arg Leu Arg Leu Leu Gln Phe Val Thr Gly Thr 1490 1495 1500 Ser Ser Ile Pro Tyr Glu Gly Phe Ala Ser Leu Arg Gly Ser Asn 1505 1510 1515 Gly Pro Arg Arg Phe Cys Val Glu Lys Trp Gly Lys Ile Thr Ala 1520 1525 1530 Leu Pro Arg Ala His Thr Cys Phe Asn Arg Leu Asp Leu Pro Pro 1535 1540 1545 Tyr Pro Ser Phe Ser Met Leu Tyr Glu Lys Leu Leu Thr Ala Val 1550 1555 1560 Glu Glu Thr Ser Thr Phe Gly Leu Glu 1565 1570 <210> 15 <211> 433 <212> PRT <213> Homo Sapiens <400> 15 Met Gly Arg Val Gln Leu Phe Glu Ile Ser Leu Ser His Gly Arg Val 1 5 10 15 Val Tyr Ser Pro Gly Glu Pro Leu Ala Gly Thr Val Arg Val Arg Leu 20 25 30 Gly Ala Pro Leu Pro Phe Arg Ala Ile Arg Val Thr Cys Ile Gly Ser 35 40 45 Cys Gly Val Ser Asn Lys Ala Asn Asp Thr Ala Trp Val Val Glu Glu 50 55 60 Gly Tyr Phe Asn Ser Ser Leu Ser Leu Ala Asp Lys Gly Ser Leu Pro 65 70 75 80 Ala Gly Glu His Ser Phe Pro Phe Gln Phe Leu Leu Pro Ala Thr Ala 85 90 95 Pro Thr Ser Phe Glu Gly Pro Phe Gly Lys Ile Val His Gln Val Arg 100 105 110 Ala Ala Ile His Thr Pro Arg Phe Ser Lys Asp His Lys Cys Ser Leu 115 120 125 Val Phe Tyr Ile Leu Ser Pro Leu Asn Leu Asn Ser Ile Pro Asp Ile 130 135 140 Glu Gln Pro Asn Val Ala Ser Ala Thr Lys Lys Phe Ser Tyr Lys Leu 145 150 155 160 Val Lys Thr Gly Ser Val Val Leu Thr Ala Ser Thr Asp Leu Arg Gly 165 170 175 Tyr Val Val Gly Gln Ala Leu Gln Leu His Ala Asp Val Glu Asn Gln 180 185 190 Ser Gly Lys Asp Thr Ser Pro Val Val Ala Ser Leu Leu Gln Lys Val 195 200 205 Ser Tyr Lys Ala Lys Arg Trp Ile His Asp Val Arg Thr Ile Ala Glu 210 215 220 Val Glu Gly Ala Gly Val Lys Ala Trp Arg Arg Ala Gln Trp His Glu 225 230 235 240 Gln Ile Leu Val Pro Ala Leu Pro Gln Ser Ala Leu Pro Gly Cys Ser 245 250 255 Leu Ile His Ile Asp Tyr Tyr Leu Gln Val Ser Leu Lys Ala Pro Glu 260 265 270 Ala Thr Val Thr Leu Pro Val Phe Ile Gly Asn Ile Ala Val Asn His 275 280 285 Ala Pro Val Ser Pro Arg Pro Gly Leu Gly Leu Pro Pro Gly Ala Pro 290 295 300 Pro Leu Val Val Pro Ser Ala Pro Pro Gln Glu Glu Ala Glu Ala Glu 305 310 315 320 Ala Ala Ala Gly Gly Pro His Phe Leu Asp Pro Val Phe Leu Ser Thr 325 330 335 Lys Ser His Ser Gln Arg Gln Pro Leu Leu Ala Thr Leu Ser Ser Val 340 345 350 Pro Gly Ala Pro Glu Pro Cys Pro Gln Asp Gly Ser Pro Ala Ser His 355 360 365 Pro Leu His Pro Pro Leu Cys Ile Ser Thr Gly Ala Thr Val Pro Tyr 370 375 380 Phe Ala Glu Gly Ser Gly Gly Pro Val Pro Thr Thr Ser Thr Leu Ile 385 390 395 400 Leu Pro Pro Glu Tyr Ser Ser Trp Gly Tyr Pro Tyr Glu Ala Pro Pro 405 410 415 Ser Tyr Glu Gln Ser Cys Gly Gly Val Glu Pro Ser Leu Thr Pro Glu 420 425 430 Ser <210> 16 <211> 434 <212> PRT <213> Mus musculus <400> 16 Met Gly Arg Val Gln Leu Phe Glu Ile Arg Leu Ser Gln Gly Arg Val 1 5 10 15 Val Tyr Gly Pro Gly Glu Pro Leu Ala Gly Thr Val His Leu Arg Leu 20 25 30 Gly Ala Pro Leu Pro Phe Arg Ala Ile Arg Val Thr Cys Met Gly Ser 35 40 45 Cys Gly Val Ser Thr Lys Ala Asn Asp Gly Ala Trp Val Val Glu Glu 50 55 60 Ser Tyr Phe Asn Ser Ser Leu Ser Leu Ala Asp Lys Gly Ser Leu Pro 65 70 75 80 Ala Gly Glu His Asn Phe Pro Phe Gln Phe Leu Leu Pro Ala Thr Ala 85 90 95 Pro Thr Ser Phe Glu Gly Pro Phe Gly Lys Ile Val His Gln Val Arg 100 105 110 Ala Ser Ile Asp Thr Pro Arg Phe Ser Lys Asp His Lys Cys Ser Leu 115 120 125 Val Phe Tyr Ile Leu Ser Pro Leu Asn Leu Asn Ser Ile Pro Asp Ile 130 135 140 Glu Gln Pro Asn Val Ala Ser Thr Thr Lys Lys Phe Ser Tyr Lys Leu 145 150 155 160 Val Lys Thr Gly Asn Val Val Leu Thr Ala Ser Thr Asp Leu Arg Gly 165 170 175 Tyr Val Val Gly Gln Val Leu Arg Leu Gln Ala Asp Ile Glu Asn Gln 180 185 190 Ser Gly Lys Asp Thr Ser Pro Val Val Ala Ser Leu Leu Gln Lys Val 195 200 205 Ser Tyr Lys Ala Lys Arg Trp Ile Tyr Asp Val Arg Thr Ile Ala Glu 210 215 220 Val Glu Gly Thr Gly Val Lys Ala Trp Arg Arg Ala Gln Trp Gln Glu 225 230 235 240 Gln Ile Leu Val Pro Ala Leu Pro Gln Ser Ala Leu Pro Gly Cys Ser 245 250 255 Leu Ile His Ile Asp Tyr Tyr Leu Gln Val Ser Met Lys Ala Pro Glu 260 265 270 Ala Thr Val Thr Leu Pro Leu Phe Val Gly Asn Ile Ala Val Asn Gln 275 280 285 Thr Pro Leu Ser Pro Cys Pro Gly Arg Glu Ser Ser Pro Gly Thr Leu 290 295 300 Ser Leu Val Val Pro Ser Ala Pro Pro Gln Glu Glu Ala Glu Ala Val 305 310 315 320 Ala Ser Gly Pro His Phe Ser Asp Pro Val Ser Leu Ser Thr Lys Ser 325 330 335 His Ser Gln Gln Gln Pro Leu Ser Ala Pro Leu Gly Ser Val Ser Val 340 345 350 Thr Thr Thr Glu Pro Trp Val Gln Val Gly Ser Pro Ala Arg His Ser 355 360 365 Leu His Pro Pro Leu Cys Ile Ser Ile Gly Ala Thr Val Pro Tyr Phe 370 375 380 Ala Glu Gly Ser Ala Gly Pro Val Pro Thr Thr Ser Ala Leu Ile Leu 385 390 395 400 Pro Pro Glu Tyr Ser Ser Trp Gly Tyr Pro Tyr Glu Ala Pro Pro Ser 405 410 415 Tyr Glu Gln Ser Cys Gly Ala Ala Gly Thr Asp Leu Gly Leu Ile Pro 420 425 430 Gly Ser <210> 17 <211> 433 <212> PRT <213> Mus musculus <400> 17 Met Gly Arg Val Gln Leu Phe Glu Ile Arg Leu Ser Gln Gly Arg Val 1 5 10 15 Val Tyr Gly Pro Gly Glu Pro Leu Ala Gly Thr Val His Leu Arg Leu 20 25 30 Gly Ala Pro Leu Pro Phe Arg Ala Ile Arg Val Thr Cys Met Gly Ser 35 40 45 Cys Gly Val Ser Thr Lys Ala Asn Asp Gly Ala Trp Val Val Glu Glu 50 55 60 Ser Tyr Phe Asn Ser Ser Leu Ser Leu Ala Asp Lys Gly Ser Leu Pro 65 70 75 80 Ala Gly Glu His Asn Phe Pro Phe Gln Phe Leu Leu Pro Ala Thr Ala 85 90 95 Pro Thr Ser Phe Glu Gly Pro Phe Gly Lys Ile Val His Gln Val Arg 100 105 110 Ala Ser Ile Asp Thr Pro Arg Phe Ser Lys Asp His Lys Cys Ser Leu 115 120 125 Val Phe Tyr Ile Leu Ser Pro Leu Asn Leu Asn Ser Ile Pro Asp Ile 130 135 140 Glu Gln Pro Asn Val Ala Ser Thr Thr Lys Lys Phe Ser Tyr Lys Leu 145 150 155 160 Val Lys Thr Gly Asn Val Val Leu Thr Ala Ser Thr Asp Leu Arg Gly 165 170 175 Tyr Val Val Gly Gln Val Leu Arg Leu Gln Ala Asp Ile Glu Asn Gln 180 185 190 Ser Gly Lys Asp Thr Ser Pro Val Val Ala Ser Leu Leu Gln Val Ser 195 200 205 Tyr Lys Ala Lys Arg Trp Ile Tyr Asp Val Arg Thr Ile Ala Glu Val 210 215 220 Glu Gly Thr Gly Val Lys Ala Trp Arg Arg Ala Gln Trp Gln Glu Gln 225 230 235 240 Ile Leu Val Pro Ala Leu Pro Gln Ser Ala Leu Pro Gly Cys Ser Leu 245 250 255 Ile His Ile Asp Tyr Tyr Leu Gln Val Ser Met Lys Ala Pro Glu Ala 260 265 270 Thr Val Thr Leu Pro Leu Phe Val Gly Asn Ile Ala Val Asn Gln Thr 275 280 285 Pro Leu Ser Pro Cys Pro Gly Arg Glu Ser Ser Pro Gly Thr Leu Ser 290 295 300 Leu Val Val Pro Ser Ala Pro Pro Gln Glu Glu Ala Glu Ala Val Ala 305 310 315 320 Ser Gly Pro His Phe Ser Asp Pro Val Ser Leu Ser Thr Lys Ser His 325 330 335 Ser Gln Gln Gln Pro Leu Ser Ala Pro Leu Gly Ser Val Ser Val Thr 340 345 350 Thr Thr Glu Pro Trp Val Gln Val Gly Ser Pro Ala Arg His Ser Leu 355 360 365 His Pro Pro Leu Cys Ile Ser Ile Gly Ala Thr Val Pro Tyr Phe Ala 370 375 380 Glu Gly Ser Ala Gly Pro Val Pro Thr Thr Ser Ala Leu Ile Leu Pro 385 390 395 400 Pro Glu Tyr Ser Ser Trp Gly Tyr Pro Tyr Glu Ala Pro Pro Ser Tyr 405 410 415 Glu Gln Ser Cys Gly Ala Ala Gly Thr Asp Leu Gly Leu Ile Pro Gly 420 425 430 Ser <210> 18 <211> 65 <212> PRT <213> Homo Sapiens <400> 18 Pro Leu Pro Pro Gly Trp Glu Gln Arg Val Asp Gln His Gly Arg Val 1 5 10 15 Tyr Tyr Val Asp His Val Glu Lys Arg Thr Thr Trp Asp Arg Pro Glu 20 25 30 Pro Leu Pro Pro Gly Trp Glu Arg Arg Val Asp Asn Met Gly Arg Ile 35 40 45 Tyr Tyr Val Asp His Phe Thr Arg Thr Thr Thr Trp Gln Arg Pro Thr 50 55 60 Leu 65 <210> 19 <211> 185 <212> PRT <213> Homo Sapiens <400> 19 Pro Leu Pro Pro Gly Trp Glu Gln Arg Val Asp Gln His Gly Arg Val 1 5 10 15 Tyr Tyr Val Asp His Val Glu Lys Arg Thr Thr Trp Asp Arg Pro Glu 20 25 30 Pro Leu Pro Pro Gly Trp Glu Arg Arg Val Asp Asn Met Gly Arg Ile 35 40 45 Tyr Tyr Val Asp His Phe Thr Arg Thr Thr Thr Trp Gln Arg Pro Thr 50 55 60 Leu Glu Ser Val Arg Asn Tyr Glu Gln Trp Gln Leu Gln Arg Ser Gln 65 70 75 80 Leu Gln Gly Ala Met Gln Gln Phe Asn Gln Arg Phe Ile Tyr Gly Asn 85 90 95 Gln Asp Leu Phe Ala Thr Ser Gln Ser Lys Glu Phe Asp Pro Leu Gly 100 105 110 Pro Leu Pro Pro Gly Trp Glu Lys Arg Thr Asp Ser Asn Gly Arg Val 115 120 125 Tyr Phe Val Asn His Asn Thr Arg Ile Thr Gln Trp Glu Asp Pro Arg 130 135 140 Ser Gln Gly Gln Leu Asn Glu Lys Pro Leu Pro Glu Gly Trp Glu Met 145 150 155 160 Arg Phe Thr Val Asp Gly Ile Pro Tyr Phe Val Asp His Asn Arg Arg 165 170 175 Thr Thr Thr Tyr Ile Asp Pro Arg Thr 180 185 <210> 20 <211> 390 <212> PRT <213> Homo Sapiens <400> 20 Met Ala Val Ser Glu Ser Gln Leu Lys Lys Met Val Ser Lys Tyr Lys 1 5 10 15 Tyr Arg Asp Leu Thr Val Arg Glu Thr Val Asn Val Ile Thr Leu Tyr 20 25 30 Lys Asp Leu Lys Pro Val Leu Asp Ser Tyr Val Phe Asn Asp Gly Ser 35 40 45 Ser Arg Glu Leu Met Asn Leu Thr Gly Thr Ile Pro Val Pro Tyr Arg 50 55 60 Gly Asn Thr Tyr Asn Ile Pro Ile Cys Leu Trp Leu Leu Asp Thr Tyr 65 70 75 80 Pro Tyr Asn Pro Pro Ile Cys Phe Val Lys Pro Thr Ser Ser Met Thr 85 90 95 Ile Lys Thr Gly Lys His Val Asp Ala Asn Gly Lys Ile Tyr Leu Pro 100 105 110 Tyr Leu His Glu Trp Lys His Pro Gln Ser Asp Leu Leu Gly Leu Ile 115 120 125 Gln Val Met Ile Val Val Phe Gly Asp Glu Pro Pro Val Phe Ser Arg 130 135 140 Pro Ile Ser Ala Ser Tyr Pro Pro Tyr Gln Ala Thr Gly Pro Pro Asn 145 150 155 160 Thr Ser Tyr Met Pro Gly Met Pro Gly Gly Ile Ser Pro Tyr Pro Ser 165 170 175 Gly Tyr Pro Pro Asn Pro Ser Gly Tyr Pro Gly Cys Pro Tyr Pro Pro 180 185 190 Gly Gly Pro Tyr Pro Ala Thr Thr Ser Ser Gln Tyr Pro Ser Gln Pro 195 200 205 Pro Val Thr Thr Val Gly Pro Ser Arg Asp Gly Thr Ile Ser Glu Asp 210 215 220 Thr Ile Arg Ala Ser Leu Ile Ser Ala Val Ser Asp Lys Leu Arg Trp 225 230 235 240 Arg Met Lys Glu Glu Met Asp Arg Ala Gln Ala Glu Leu Asn Ala Leu 245 250 255 Lys Arg Thr Glu Glu Asp Leu Lys Lys Gly His Gln Lys Leu Glu Glu 260 265 270 Met Val Thr Arg Leu Asp Gln Glu Val Ala Glu Val Asp Lys Asn Ile 275 280 285 Glu Leu Leu Lys Lys Lys Asp Glu Glu Leu Ser Ser Ala Leu Glu Lys 290 295 300 Met Glu Asn Gln Ser Glu Asn Asn Asp Ile Asp Glu Val Ile Ile Pro 305 310 315 320 Thr Ala Pro Leu Tyr Lys Gln Ile Leu Asn Leu Tyr Ala Glu Glu Asn 325 330 335 Ala Ile Glu Asp Thr Ile Phe Tyr Leu Gly Glu Ala Leu Arg Arg Gly 340 345 350 Val Ile Asp Leu Asp Val Phe Leu Lys His Val Arg Leu Leu Ser Arg 355 360 365 Lys Gln Phe Gln Leu Arg Ala Leu Met Gln Lys Ala Arg Lys Thr Ala 370 375 380 Gly Leu Ser Asp Leu Tyr 385 390 <210> 21 <211> 391 <212> PRT <213> Mus musculus <400> 21 Met Ala Val Ser Glu Ser Gln Leu Lys Lys Met Met Ser Lys Tyr Lys 1 5 10 15 Tyr Arg Asp Leu Thr Val Arg Gln Thr Val Asn Val Ile Ala Met Tyr 20 25 30 Lys Asp Leu Lys Pro Val Leu Asp Ser Tyr Val Phe Asn Asp Gly Ser 35 40 45 Ser Arg Glu Leu Val Asn Leu Thr Gly Thr Ile Pro Val Arg Tyr Arg 50 55 60 Gly Asn Ile Tyr Asn Ile Pro Ile Cys Leu Trp Leu Leu Asp Thr Tyr 65 70 75 80 Pro Tyr Asn Pro Pro Ile Cys Phe Val Lys Pro Thr Ser Ser Met Thr 85 90 95 Ile Lys Thr Gly Lys His Val Asp Ala Asn Gly Lys Ile Tyr Leu Pro 100 105 110 Tyr Leu His Asp Trp Lys His Pro Arg Ser Glu Leu Leu Glu Leu Ile 115 120 125 Gln Ile Met Ile Val Ile Phe Gly Glu Glu Pro Pro Val Phe Ser Arg 130 135 140 Pro Thr Val Ser Ala Ser Tyr Pro Pro Tyr Thr Ala Thr Gly Pro Pro 145 150 155 160 Asn Thr Ser Tyr Met Pro Gly Met Pro Ser Gly Ile Ser Ala Tyr Pro 165 170 175 Ser Gly Tyr Pro Pro Asn Pro Ser Gly Tyr Pro Gly Cys Pro Tyr Pro 180 185 190 Pro Ala Gly Pro Tyr Pro Ala Thr Thr Ser Ser Gln Tyr Pro Ser Gln 195 200 205 Pro Pro Val Thr Thr Val Gly Pro Ser Arg Asp Gly Thr Ile Ser Glu 210 215 220 Asp Thr Ile Arg Ala Ser Leu Ile Ser Ala Val Ser Asp Lys Leu Arg 225 230 235 240 Trp Arg Met Lys Glu Glu Met Asp Gly Ala Gln Ala Glu Leu Asn Ala 245 250 255 Leu Lys Arg Thr Glu Glu Asp Leu Lys Lys Gly His Gln Lys Leu Glu 260 265 270 Glu Met Val Thr Arg Leu Asp Gln Glu Val Ala Glu Val Asp Lys Asn 275 280 285 Ile Glu Leu Leu Lys Lys Lys Asp Glu Glu Leu Ser Ser Ala Leu Glu 290 295 300 Lys Met Glu Asn Gln Ser Glu Asn Asn Asp Ile Asp Glu Val Ile Ile 305 310 315 320 Pro Thr Ala Pro Leu Tyr Lys Gln Ile Leu Asn Leu Tyr Ala Glu Glu 325 330 335 Asn Ala Ile Glu Asp Thr Ile Phe Tyr Leu Gly Glu Ala Leu Arg Arg 340 345 350 Gly Val Ile Asp Leu Asp Val Phe Leu Lys His Val Arg Leu Leu Ser 355 360 365 Arg Lys Gln Phe Gln Leu Arg Ala Leu Met Gln Lys Ala Arg Lys Thr 370 375 380 Ala Gly Leu Ser Asp Leu Tyr 385 390 <210> 22 <211> 391 <212> PRT <213> Rattus norvegicus <400> 22 Met Ala Val Ser Glu Ser Gln Leu Lys Lys Met Met Ser Lys Tyr Lys 1 5 10 15 Tyr Arg Asp Leu Thr Val Arg Gln Thr Val Asn Val Ile Ala Met Tyr 20 25 30 Lys Asp Leu Lys Pro Val Leu Asp Ser Tyr Val Phe Asn Asp Gly Ser 35 40 45 Ser Arg Glu Leu Val Asn Leu Thr Gly Thr Ile Pro Val Arg Tyr Arg 50 55 60 Gly Asn Ile Tyr Asn Ile Pro Ile Cys Leu Trp Leu Leu Asp Thr Tyr 65 70 75 80 Pro Tyr Asn Pro Pro Ile Cys Phe Val Lys Pro Thr Ser Ser Met Thr 85 90 95 Ile Lys Thr Gly Lys His Val Asp Ala Asn Gly Lys Ile Tyr Leu Pro 100 105 110 Tyr Leu His Asp Trp Lys His Pro Arg Ser Glu Leu Leu Glu Leu Ile 115 120 125 Gln Ile Met Ile Val Ile Phe Gly Glu Glu Pro Pro Val Phe Ser Arg 130 135 140 Pro Thr Val Ser Ala Ser Tyr Pro Pro Tyr Thr Ala Ala Gly Pro Pro 145 150 155 160 Asn Thr Ser Tyr Leu Pro Ser Met Pro Ser Gly Ile Ser Ala Tyr Pro 165 170 175 Ser Gly Tyr Pro Pro Asn Pro Ser Gly Tyr Pro Gly Cys Pro Tyr Pro 180 185 190 Pro Ala Gly Pro Tyr Pro Ala Thr Thr Ser Ser Gln Tyr Pro Ser Gln 195 200 205 Pro Pro Val Thr Thr Ala Gly Pro Ser Arg Asp Gly Thr Ile Ser Glu 210 215 220 Asp Thr Ile Arg Ala Ser Leu Ile Ser Ala Val Ser Asp Lys Leu Arg 225 230 235 240 Trp Arg Met Lys Glu Glu Met Asp Gly Ala Gln Ala Glu Leu Asn Ala 245 250 255 Leu Lys Arg Thr Glu Glu Asp Leu Lys Lys Gly His Gln Lys Leu Glu 260 265 270 Glu Met Val Thr Arg Leu Asp Gln Glu Val Ala Glu Val Asp Lys Asn 275 280 285 Ile Glu Leu Leu Lys Lys Lys Asp Glu Glu Leu Ser Ser Ala Leu Glu 290 295 300 Lys Met Glu Asn Gln Ser Glu Asn Asn Asp Ile Asp Glu Val Ile Ile 305 310 315 320 Pro Thr Ala Pro Leu Tyr Lys Gln Ile Leu Asn Leu Tyr Ala Glu Glu 325 330 335 Asn Ala Ile Glu Asp Thr Ile Phe Tyr Leu Gly Glu Ala Leu Arg Arg 340 345 350 Gly Val Ile Asp Leu Asp Val Phe Leu Lys His Val Arg Leu Leu Ser 355 360 365 Arg Lys Gln Phe Gln Leu Arg Ala Leu Met Gln Lys Ala Arg Lys Thr 370 375 380 Ala Gly Leu Ser Asp Leu Tyr 385 390 <210> 23 <211> 3475 <212> DNA <213> Homo Sapiens <400> 23 gaattcgcgg ccgcgtcgac cgcttctgtg gccacggcag atgaaacaga aaggctaaag 60 agggctggag tcaggggact tctcttccac cagcttcacg gtgatgatat ggcatctgcc 120 agctctagcc gggcaggagt ggccctgcct tttgagaagt ctcagctcac tttgaaagtg 180 gtgtccgcaa agcccaaggt gcataatcgt caacctcgaa ttaactccta cgtggaggtg 240 gcggtggatg gactccccag tgagaccaag aagactggga agcgcattgg gagctctgag 300 cttctctgga atgagatcat cattttgaat gtcacggcac agagtcattt agatttaaag 360 gtctggagct gccatacctt gagaaatgaa ctgctaggca ccgcatctgt caacctctcc 420 aacgtcttga agaacaatgg gggcaaaatg gagaacatgc agctgaccct gaacctgcag 480 acggagaaca aaggcagcgt tgtctcaggc ggaaaactga caattttcct ggacgggcca 540 actgttgatc tgggaaatgt gcctaatggc agtgccctga cagatggatc acagctgcct 600 tcgagagact ccagtggaac agcagtagct ccagagaacc ggcaccagcc ccccagcaca 660 aactgctttg gtggaagatc ccggacgcac agacattcgg gtgcttcagc cagaacaacc 720 ccagcaaccg gcgagcaaag ccccggtgct cggagccggc accgccagcc cgtcaagaac 780 tcaggccaca gtggcttggc caatggcaca gtgaatgatg aacccacaac agccactgat 840 cccgaagaac cttccgttgt tggtgtgacg tccccacctg ctgcaccctt gagtgtgacc 900 ccgaatccca acacgacttc tctccctgcc ccagccacac cggctgaagg agaggaaccc 960 agcacttcgg gtacacagca gctcccagcg gctgcccagg cccccgacgc tctgcctgct 1020 ggatgggaac agcgagagct gcccaacgga cgtgtctatt atgttgacca caataccaag 1080 accaccacct gggagcggcc ccttcctcca ggctgggaaa aacgcacaga tccccgaggc 1140 aggttttact atgtggatca caatactcgg accaccacct ggcagcgtcc gaccgcggag 1200 tacgtgcgca actatgagca gtggcagtcg cagcggaatc agctccaggg ggccatgcag 1260 cacttcagcc aaagattcct ataccagttt tggagtgctt cgactgacca tgatcccctg 1320 ggccccctcc ctcctggttg ggagaaaaga caggacaatg gacgggtgta ttacgtgaac 1380 cataacactc gcacgaccca gtgggaggat ccccggaccc aggggatgat ccaggaacca 1440 gctttgcccc caggatggga gatgaaatac accagcgagg gggtgcgata ctttgtggac 1500 cacaataccc gcaccaccac ctttaaggat cctcgcccgg ggtttgagtc ggggacgaag 1560 caaggttccc ctggtgctta tgaccgcagt tttcggtgga agtatcacca gttccgtttc 1620 ctctgccatt caaatgccct acctagccac gtgaagatca gcgtttccag gcagacgctt 1680 ttcgaagatt ccttccaaca gatcatgaac atgaaaccct atgacctgcg ccgccggctt 1740 tacatcatca tgcgtggcga ggagggcctg gactatgggg gcatcgccag agagtggttt 1800 ttcctcctgt ctcacgaggt gctcaaccct atgtattgtt tatttgaata tgccggaaag 1860 aacaattact gcctgcagat caaccccgcc tcctccatca acccggacca cctcacctac 1920 tttcgcttta taggcagatt catcgccatg gcgctgtacc atggaaagtt catcgacacg 1980 ggcttcaccc tccctttcta caagcggatg ctcaataaga gaccaaccct gaaagacctg 2040 gagtccattg accctgagtt ctacaactcc attgtctgga tcaaagagaa caacctggaa 2100 gaatgtggcc tggagctgta cttcatccag gacatggaga tactgggcaa ggtgacgacc 2160 cacgagctga aggagggcgg cgagagcatc cgggtcacgg aggagaacaa ggaagagtac 2220 atcatgctgc tgactgactg gcgtttcacc cgaggcgtgg aagagcagac caaagccttc 2280 ctggatggct tcaacgaggt ggccccgctg gagtggctgc gctactttga cgagaaagag 2340 ctggagctga tgctgtgcgg catgcaggag atagacatga gcgactggca gaagagcacc 2400 atctaccggc actacaccaa gaacagcaag cagatccagt ggttctggca ggtggtgaag 2460 gagatggaca acgagaagag gatccggctg ctgcagtttg tcaccggtac ctgccgcctg 2520 cccgtcgggg gatttgccga actcatcggt agcaacggac cacagaagtt ttgcattgac 2580 aaagttggca aggaaacctg gctgcccaga agccacacct gcttcaaccg tctggatctt 2640 ccaccctaca agagctacga acagctgaga gagaagctgc tgtatgccat tgaggagacc 2700 gagggctttg gacaggagta accgaggccg cccctcccac gccccccagc gcacatgtag 2760 tcctgagtcc tccctgcctg agaggccact ggccccgcag cccttgggag gcccccgtgg 2820 atgtggccct gtgtgggacc acactgtcat ctcgctgctg gcagaaaagc ctgatcccag 2880 gaggccctgc agttcccccg acccgcggat ggcagtctgg aataaagccc cctagttgcc 2940 tttggcccca cctttgcaaa gttccagagg gctgaccctc tctgcaaaac tctcccctgt 3000 cctctagacc ccaccctggg tgtatgtgag tgtgcaaggg aaggtgttgc atccccaggg 3060 gctgccgcag aggccggaga cctcctggac tagttcggcg aggagactgg ccactggggg 3120 tggctgttcg ggactgagag cgccaagggt ctttgccagc aaaggaggtt ctgcctgtaa 3180 ttgagcctct ctgatgatgg agatgaagtg aaggtctgag ggacgggccc tggggctagg 3240 ccatctctgc ctgcctccct agcaggcgcc agcggtggag gctgagtcgc aggacacatg 3300 ccggccagtt aattcattct cagcaaatga aggtttgtct aagctgcctg ggtatccacg 3360 ggacaaaaac agcaaactcc ctccagactt tgtccatgtt ataaacttga aagttggttg 3420 ttgtttgtta ggtttgccag gtttttttgt ttacgcctgc tgtcactttc ctgtc 3475 <210> 24 <211> 3475 <212> DNA <213> Homo Sapiens <400> 24 gaattcgcgg ccgcgtcgac cgcttctgtg gccacggcag atgaaacaga aaggctaaag 60 agggctggag tcaggggact tctcttccac cagcttcacg gtgatgatat ggcatctgcc 120 agctctagcc gggcaggagt ggccctgcct tttgagaagt ctcagctcac tttgaaagtg 180 gtgtccgcaa agcccaaggt gcataatcgt caacctcgaa ttaactccta cgtggaggtg 240 gcggtggatg gactccccag tgagaccaag aagactggga agcgcattgg gagctctgag 300 cttctctgga atgagatcat cattttgaat gtcacggcac agagtcattt agatttaaag 360 gtctggagct gccatacctt gagaaatgaa ctgctaggca ccgcatctgt caacctctcc 420 aacgtcttga agaacaatgg gggcaaaatg gagaacatgc agctgaccct gaacctgcag 480 acggagaaca aaggcagcgt tgtctcaggc ggaaaactga caattttcct ggacgggcca 540 actgttgatc tgggaaatgt gcctaatggc agtgccctga cagatggatc acagctgcct 600 tcgagagact ccagtggaac agcagtagct ccagagaacc ggcaccagcc ccccagcaca 660 aactgctttg gtggaagatc ccggacgcac agacattcgg gtgcttcagc cagaacaacc 720 ccagcaaccg gcgagcaaag ccccggtgct cggagccggc accgccagcc cgtcaagaac 780 tcaggccaca gtggcttggc caatggcaca gtgaatgatg aacccacaac agccactgat 840 cccgaagaac cttccgttgt tggtgtgacg tccccacctg ctgcaccctt gagtgtgacc 900 ccgaatccca acacgacttc tctccctgcc ccagccacac cggctgaagg agaggaaccc 960 agcacttcgg gtacacagca gctcccagcg gctgcccagg cccccgacgc tctgcctgct 1020 ggatgggaac agcgagagct gcccaacgga cgtgtctatt atgttgacca caataccaag 1080 accaccacct gggagcggcc ccttcctcca ggctgggaaa aacgcacaga tccccgaggc 1140 aggttttact atgtggatca caatactcgg accaccacct ggcagcgtcc gaccgcggag 1200 tacgtgcgca actatgagca gtggcagtcg cagcggaatc agctccaggg ggccatgcag 1260 cacttcagcc aaagattcct ataccagttt tggagtgctt cgactgacca tgatcccctg 1320 ggccccctcc ctcctggttg ggagaaaaga caggacaatg gacgggtgta ttacgtgaac 1380 cataacactc gcacgaccca gtgggaggat ccccggaccc aggggatgat ccaggaacca 1440 gctttgcccc caggatggga gatgaaatac accagcgagg gggtgcgata ctttgtggac 1500 cacaataccc gcaccaccac ctttaaggat cctcgcccgg ggtttgagtc ggggacgaag 1560 caaggttccc ctggtgctta tgaccgcagt tttcggtgga agtatcacca gttccgtttc 1620 ctctgccatt caaatgccct acctagccac gtgaagatca gcgtttccag gcagacgctt 1680 ttcgaagatt ccttccaaca gatcatgaac atgaaaccct atgacctgcg ccgccggctt 1740 tacatcatca tgcgtggcga ggagggcctg gactatgggg gcatcgccag agagtggttt 1800 ttcctcctgt ctcacgaggt gctcaaccct atgtattgtt tatttgaata tgccggaaag 1860 aacaattact gcctgcagat caaccccgcc tcctccatca acccggacca cctcacctac 1920 tttcgcttta taggcagatt catcgccatg gcgctgtacc atggaaagtt catcgacacg 1980 ggcttcaccc tccctttcta caagcggatg ctcaataaga gaccaaccct gaaagacctg 2040 gagtccattg accctgagtt ctacaactcc attgtctgga tcaaagagaa caacctggaa 2100 gaatgtggcc tggagctgta cttcatccag gacatggaga tactgggcaa ggtgacgacc 2160 cacgagctga aggagggcgg cgagagcatc cgggtcacgg aggagaacaa ggaagagtac 2220 atcatgctgc tgactgactg gcgtttcacc cgaggcgtgg aagagcagac caaagccttc 2280 ctggatggct tcaacgaggt ggccccgctg gagtggctgc gctactttga cgagaaagag 2340 ctggagctga tgctgtgcgg catgcaggag atagacatga gcgactggca gaagagcacc 2400 atctaccggc actacaccaa gaacagcaag cagatccagt ggttctggca ggtggtgaag 2460 gagatggaca acgagaagag gatccggctg ctgcagtttg tcaccggtac ctgccgcctg 2520 cccgtcgggg gatttgccga actcatcggt agcaacggac cacagaagtt ttgcattgac 2580 aaagttggca aggaaacctg gctgcccaga agccacacct gcttcaaccg tctggatctt 2640 ccaccctaca agagctacga acagctgaga gagaagctgc tgtatgccat tgaggagacc 2700 gagggctttg gacaggagta accgaggccg cccctcccac gccccccagc gcacatgtag 2760 tcctgagtcc tccctgcctg agaggccact ggccccgcag cccttgggag gcccccgtgg 2820 atgtggccct gtgtgggacc acactgtcat ctcgctgctg gcagaaaagc ctgatcccag 2880 gaggccctgc agttcccccg acccgcggat ggcagtctgg aataaagccc cctagttgcc 2940 tttggcccca cctttgcaaa gttccagagg gctgaccctc tctgcaaaac tctcccctgt 3000 cctctagacc ccaccctggg tgtatgtgag tgtgcaaggg aaggtgttgc atccccaggg 3060 gctgccgcag aggccggaga cctcctggac tagttcggcg aggagactgg ccactggggg 3120 tggctgttcg ggactgagag cgccaagggt ctttgccagc aaaggaggtt ctgcctgtaa 3180 ttgagcctct ctgatgatgg agatgaagtg aaggtctgag ggacgggccc tggggctagg 3240 ccatctctgc ctgcctccct agcaggcgcc agcggtggag gctgagtcgc aggacacatg 3300 ccggccagtt aattcattct cagcaaatga aggtttgtct aagctgcctg ggtatccacg 3360 ggacaaaaac agcaaactcc ctccagactt tgtccatgtt ataaacttga aagttggttg 3420 ttgtttgtta ggtttgccag gtttttttgt ttacgcctgc tgtcactttc ctgtc 3475 <210> 25 <211> 2914 <212> DNA <213> Homo Sapiens <400> 25 acagttgcct gccctgggcg ggggcgagcg cgtccggttt gctggaagcg ttcggaaatg 60 gcaacttgcg cggtggaggt gttcgggctc ctggaggacg aggaaaattc acgaattgtg 120 agagtaagag ttatagccgg aataggcctt gccaagaagg atatattggg agctagtgat 180 ccttacgtga gagtgacgtt atatgaccca atgaatggag ttcttacaag tgtgcaaaca 240 aaaaccatta aaaagagttt gaatccaaag tggaatgaag aaatattatt cagagttcat 300 cctcagcagc accggcttct ttttgaagtg tttgacgaaa accgattgac aagagatgat 360 ttcctaggtc aagtggatgt tccactttat ccattaccga cagaaaatcc aagattggag 420 agaccatata catttaagga ttttgttctt catccaagaa gtcacaaatc aagagttaaa 480 ggttatctga gactaaaaat gacttattta cctaaaacca gtggctcaga agatgataat 540 gcagaacagg ctgaggaatt agagcctggc tgggttgttt tggaccaacc agatgctgct 600 tgccatttgc agcaacaaca agaaccttct cctctacctc cagggtggga agagaggcag 660 gatatccttg gaaggaccta ttatgtaaac catgaatcta gaagaacaca gtggaaaaga 720 ccaacccctc aggacaacct aacagatgct gagaatggca acattcaact gcaagcacaa 780 cgtgcattta ccaccaggcg gcagatatcc gaggaaacag aaagtgttga caaccaagag 840 tcttccgaga actgggaaat tataagagaa gatgaagcca ccatgtatag cagccaggcc 900 ttcccatcac ctccaccgtc aagtaacttg gatgttccaa ctcatcttgc agaagaattg 960 aatgccagac tcaccatttt tggaaattca gccgtgagcc agccagcatc gagctcaaat 1020 cattccagca gaagaggcag cttacaagcc tatacttttg aggaacaacc tacacttcct 1080 gtgcttttgc ctacttcatc tggattacca ccaggttggg aagaaaaaca agatgaaaga 1140 ggaagatcat attatgtaga tcacaattcc agaacgacta cttggacaaa gcccactgta 1200 caggccacag tggagaccag tcagctgacc tcaagccaga gttctgcagg ccctcaatca 1260 caagcctcca ccagtgattc aggccagcag gtgacccagc catctgaaat tgagcaagga 1320 ttccttccta aaggctggga agtccggcat gcaccaaatg ggaggccttt ctttattgac 1380 cacaacacta aaaccaccac ctgggaagat ccaagattga aaattccagc ccatctgaga 1440 ggaaagacat cacttgatac ttccaatgat ctagggcctt tacctccagg atgggaagag 1500 agaactcaca cagatggaag aatcttctac ataaatcaca atataaaaag aacacaatgg 1560 gaagatcctc ggttggagaa tgtagcaata actggaccag cagtgcccta ctccagggat 1620 tacaaaagaa agtatgagtt cttccgaaga aagttgaaga agcagaatga cattccaaac 1680 aaatttgaaa tgaaacttcg ccgagcaact gttcttgaag actcttaccg gagaattatg 1740 ggtgtcaaga gagcagactt cctgaaggct cgactgtgga ttgagtttga tggtgaaaag 1800 ggattggatt atggaggagt tgccagagaa tggttcttcc tgatctcaaa ggaaatgttt 1860 aacccttatt atgggttgtt tgaatattct gctacggaca attataccct acagataaat 1920 ccaaactctg gattgtgtaa cgaagatcac ctctcttact tcaagtttat tggtcgggta 1980 gctggaatgg cagtttatca tggcaaactg ttggatggtt ttttcatccg cccattttac 2040 aagatgatgc ttcacaaacc aataaccctt catgatatgg aatctgtgga tagtgaatat 2100 tacaattccc taagatggat tcttgaaaat gacccaacag aattggacct caggtttatc 2160 atagatgaag aactttttgg acagacacat caacatgagc tgaaaaatgg tggatcagaa 2220 atagttgtca ccaataagaa caaaaaggaa tatatttatc ttgtaataca atggcgattt 2280 gtaaaccgaa tccagaagca aatggctgct tttaaagagg gattctttga actaatacca 2340 caggatctca tcaaaatttt tgatgaaaat gaactagagc ttcttatgtg tggaccggga 2400 gatgttgatg tgaatgactg gagggaacat acaaagtata aaaatggcta cagtgcaaat 2460 catcaggtta tacagtggtt ttggaaggct gttttaatga tggattcaga aaaaagaata 2520 agattacttc agtttgtcac tggcacatct cgggtgccta tgaatggatt tgctgaacta 2580 tacggttcaa atggaccaca gtcatttaca gttgaacagt ggggtactcc tgaaaagctg 2640 ccaagagctc atacctgttt taatcgcctg gacttgccac cttatgaatc atttgaagaa 2700 ttatgggata aacttcagat ggcaattgaa aacacccagg gctttgatgg agttgattag 2760 attacaaata acaatctgta gtgtttttac tgccatagtt ttataaccaa aatcttgact 2820 taaaattttc cggggaacta ctaaaatgtg gccactgagt cttcccagat cttgaagaaa 2880 atcatataaa aagcatttga agaaatagta cgac 2914 <210> 26 <211> 2868 <212> DNA <213> Homo Sapiens <400> 26 atggcgaccg ggctcgggga gccggtctat ggactttccg aagacgaggg agagtcccgt 60 attctcagag taaaagttgt ttctggaatt gatctcgcca aaaaggacat ctttggagcc 120 agtgatccgt atgtgaaact ttcattgtac gtagcggatg agaatagaga acttgctttg 180 gtccagacaa aaacaattaa aaagacactg aacccaaaat ggaatgaaga attttatttc 240 agggtaaacc catctaatca cagactccta tttgaagtat ttgacgaaaa tagactgaca 300 cgagacgact tcctgggcca ggtggacgtg ccccttagtc accttccgac agaagatcca 360 accatggagc gaccctatac atttaaggac tttctcctca gaccaagaag tcataagtct 420 cgagttaagg gatttttgcg attgaaaatg gcctatatgc caaaaaatgg aggtcaagat 480 gaagaaaaca gtgaccagag ggatgacatg gagcatggat gggaagttgt tgactcaaat 540 gactcggctt ctcagcacca agaggaactt cctcctcctc ctctgcctcc cgggtgggaa 600 gaaaaagtgg acaatttagg ccgaacttac tatgtcaacc acaacaaccg gaccactcag 660 tggcacagac caagcctgat ggacgtgtcc tcggagtcgg acaataacat cagacagatc 720 aaccaggagg cagcacaccg gcgcttccgc tcccgcaggc acatcagcga agacttggag 780 cccgagccct cggagggcgg ggatgtcccc gagccttggg agaccatttc agaggaagtg 840 aatatcgctg gagactctct cggtctggct ctgcccccac caccggcctc cccaggatct 900 cggaccagcc ctcaggagct gtcagaggaa ctaagcagaa ggcttcagat cactccagac 960 tccaatgggg aacagttcag ctctttgatt caaagagaac cctcctcaag gttgaggtca 1020 tgcagtgtca ccgacgcagt tgcagaacag ggccatctac caccgccatc agtggcctat 1080 gtacatacca cgccgggtct gccttcaggc tgggaagaaa gaaaagatgc taaggggcgc 1140 acatactatg tcaatcataa caatcgaacc acaacttgga ctcgacctat catgcagctt 1200 gcagaagatg gtgcgtccgg atcagccaca aacagtaaca accatctaat cgagcctcag 1260 atccgccggc ctcgtagcct cagctcgcca acagtaactt tatctgcccc gctggagggt 1320 gccaaggact cacccgtacg tcgggctgtg aaagacaccc tttccaaccc acagtcccca 1380 cagccatcac cttacaactc ccccaaacca caacacaaag tcacacagag cttcttgcca 1440 cccggctggg aaatgaggat agcgccaaac ggccggccct tcttcattga tcataacaca 1500 aagactacaa cctgggaaga tccacgtttg aaatttccag tacatatgcg gtcaaagaca 1560 tctttaaacc ccaatgacct tggccccctt cctcctggct gggaagaaag aattcacttg 1620 gatggccgaa cgttttatat tgatcataat agcaaaatta ctcagtggga agacccaaga 1680 ctgcagaacc cagctattac tggtccggct gtcccttact ccagagaatt taagcagaaa 1740 tatgactact tcaggaagaa attaaagaaa cctgctgata tccccaatag gtttgaaatg 1800 aaacttcaca gaaataacat atttgaagag tcctatcgga gaattatgtc cgtgaaaaga 1860 ccagatgtcc taaaagctag actgtggatt gagtttgaat cagagaaagg tcttgactat 1920 gggggtgtgg ccagagaatg gttcttctta ctgtccaaag agatgttcaa cccctactac 1980 ggcctctttg agtactctgc cacggacaac tacacccttc agatcaaccc taattcaggc 2040 ctctgtaatg aggatcattt gtcctacttc acttttattg gaagagttgc tggtctggcc 2100 gtatttcatg ggaagctctt agatggtttc ttcattagac cattttacaa gatgatgttg 2160 ggaaagcaga taaccctgaa tgacatggaa tctgtggata gtgaatatta caactctttg 2220 aaatggatcc tggagaatga ccctactgag ctggacctca tgttctgcat agacgaagaa 2280 aactttggac agacatatca agtggatttg aagcccaatg ggtcagaaat aatggtcaca 2340 aatgaaaaca aaagggaata tatcgactta gtcatccagt ggagatttgt gaacagggtc 2400 cagaagcaga tgaacgcctt cttggaggga ttcacagaac tacttcctat tgatttgatt 2460 aaaatttttg atgaaaatga gctggagttg ctcatgtgcg gcctcggtga tgtggatgtg 2520 aatgactgga gacagcattc tatttacaag aacggctact gcccaaacca ccccgtcatt 2580 cagtggttct ggaaggctgt gctactcatg gacgccgaaa agcgtatccg gttactgcag 2640 tttgtcacag ggacatcgcg agtacctatg aatggatttg ccgaacttta tggttccaat 2700 ggtcctcagc tgtttacaat agagcaatgg ggcagtcctg agaaactgcc cagagctcac 2760 acatgcttta atcgccttga cttacctcca tatgaaacct ttgaagattt acgagagaaa 2820 cttctcatgg ccgtggaaaa tgctcaagga tttgaagggg tggattaa 2868 <210> 27 <211> 2274 <212> DNA <213> Homo Sapiens <400> 27 atgtcgaacc ccgggacacg caggaacggc tccagcatca agatccgtct gacagtgtta 60 tgtgccaaga accttgcaaa gaaagacttc ttcaggctcc ctgacccttt tgcaaagatt 120 gtcgtggatg ggtctgggca gtgccactca accgacactg tgaaaaacac attggaccca 180 aagtggaacc agcactatga tctatatgtt gggaaaacgg attcgataac cattagcgtg 240 tggaaccata agaaaattca caagaaacag ggagctggct tcctgggctg tgtgcggctg 300 ctctccaatg ccatcagcag attaaaagat accggatacc agcgtttgga tctatgcaaa 360 ctaaacccct cagatactga tgcagttcgt ggccagatag tggtcagttt acagacacga 420 gacagaatag gaaccggcgg ctcggtggtg gactgcagag gactgttaga aaatgaagga 480 acggtgtatg aagactccgg gcctgggagg ccgctcagct gcttcatgga ggaaccagcc 540 ccttacacag atagcaccgg tgctgctgct ggaggaggga attgcaggtt cgtggagtcc 600 ccaagtcaag atcaaagact tcaggcacag cggcttcgaa accctgatgt gcgaggttca 660 ctacagacgc cccagaaccg accacacggc caccagtccc cggaactgcc cgaaggctac 720 gaacaaagaa caacagtcca gggccaagtt tactttttgc atacacagac tggagttagc 780 acgtggcacg accccaggat accaagtccc tcggggacca ttcctggggg agatgcagct 840 tttctatacg aattccttct acaaggccat acatctgagc ccagagacct taacagtgtg 900 aactgtgatg aacttggacc actgccgcca ggctgggaag tcagaagtac agtttctggg 960 aggatatatt ttgtagatca taataaccga acaacccagt ttacagaccc aaggttacac 1020 cacatcatga atcaccagtg ccaactcaag gagcccagcc agccgctgcc actgcccagt 1080 gagggctctc tggaggacga ggagcttcct gcccagagat acgaaagaga tctagtccag 1140 aagctgaaag tcctcagaca cgaactgtcg cttcagcagc cccaagctgg tcattgccgc 1200 atcgaagtgt ccagagaaga aatctttgag gagtcttacc gccagataat gaagatgcga 1260 ccgaaagact tgaaaaaacg gctgatggtg aaattccgtg gggaagaagg tttggattac 1320 ggtggtgtgg ccagggagtg gctttacttg ctgtgccatg aaatgctgaa tccttattac 1380 gggctcttcc agtattctac ggacaatatt tacatgttgc aaataaatcc ggattcttca 1440 atcaaccccg accacttgtc ttatttccac tttgtggggc ggatcatggg gctggctgtg 1500 ttccatggac actacatcaa cgggggcttc acagtgccct tctacaagca gctgctgggg 1560 aagcccatcc agctctcaga tctggaatct gtggacccag agctgcataa gagcttggtg 1620 tggatcctag agaacgacat cacgcctgta ctggaccaca ccttctgcgt ggaacacaac 1680 gccttcgggc ggatcctgca gcatgaactg aaacccaatg gcagaaatgt gccagtcaca 1740 gaggagaata agaaagaata cgtccggttg tatgtaaact ggaggtttat gagaggaatc 1800 gaagcccagt tcttagctct gcagaagggg ttcaatgagc tcatccctca acatctgctg 1860 aagccttttg accagaagga actggagctg atcataggcg gcctggataa aatagacttg 1920 aacgactgga agtcgaacac gcggctgaag cactgtgtgg ccgacagcaa catcgtgcgg 1980 tggttctggc aagcggtgga gacgttcgat gaagaaagga gggccaggct cctgcagttt 2040 gtgactgggt ccacgcgagt cccgctccaa ggcttcaagg ctttgcaagg ttctacaggc 2100 gcggcagggc cccggctgtt caccatccac ctgatagacg cgaacacaga caaccttccg 2160 aaggcccata cctgctttaa ccggatcgac attccaccat atgagtccta tgagaagctc 2220 tacgagaagc tgctgacagc cgtggaggag acctgcgggt ttgctgtgga gtga 2274 <210> 28 <211> 2247 <212> DNA <213> Homo Sapiens <400> 28 atgtctaacc ccggacgccg gaggaacggg cccgtcaagc tgcgcctgac agtactctgt 60 gcaaaaaacc tggtgaaaaa ggattttttc cgacttcctg atccatttgc taaggtggtg 120 gttgatggat ctgggcaatg ccattctaca gatactgtga agaatacgct tgatccaaag 180 tggaatcagc attatgacct gtatattgga aagtctgatt cagttacgat cagtgtatgg 240 aatcacaaga agatccataa gaaacaaggt gctggatttc tcggttgtgt tcgtcttctt 300 tccaatgcca tcaaccgcct caaagacact ggttatcaga ggttggattt atgcaaactc 360 gggccaaatg acaatgatac agttagagga cagatagtag taagtcttca gtccagagac 420 cgaataggca caggaggaca agttgtggac tgcagtcgtt tatttgataa cgatttacca 480 gacggctggg aagaaaggag aaccgcctct ggaagaatcc agtatctaaa ccatataaca 540 agaactacgc aatgggagcg cccaacacga ccggcatccg aatattctag ccctggcaga 600 cctcttagct gctttgttga tgagaacact ccaattagtg gaacaaatgg tgcaacatgt 660 ggacagtctt cagatcccag gctggcagag aggagagtca ggtcacaacg acatagaaat 720 tacatgagca gaacacattt acatactcct ccagacctac cagaaggcta tgaacagagg 780 acaacgcaac aaggccaggt gtatttctta catacacaga ctggtgtgag cacatggcat 840 gatccaagag tgcccaggga tcttagcaac atcaattgtg aagagcttgg tccattgcct 900 cctggatggg agatccgtaa tacggcaaca ggcagagttt atttcgttga ccataacaac 960 agaacaacac aatttacaga tcctcggctg tctgctaact tgcatttagt tttaaatcgg 1020 cagaaccaat tgaaagacca acagcaacag caagtggtat cgttatgtcc tgatgacaca 1080 gaatgcctga cagtcccaag gtacaagcga gacctggttc agaaactaaa aattttgcgg 1140 caagaacttt cccaacaaca gcctcaggca ggtcattgcc gcattgaggt ttccagggaa 1200 gagatttttg aggaatcata tcgacaggtc atgaaaatga gaccaaaaga tctctggaag 1260 cgattaatga taaaatttcg tggagaagaa ggccttgact atggaggcgt tgccagggaa 1320 tggttgtatc tcttgtcaca tgaaatgttg aatccatact atggcctctt ccagtattca 1380 agagatgata tttatacatt gcagatcaat cctgattctg cagttaatcc ggaacattta 1440 tcctatttcc actttgttgg acgaataatg ggaatggctg tgtttcatgg acattatatt 1500 gatggtggtt tcacattgcc tttttataag caattgcttg ggaagtcaat taccttggat 1560 gacatggagt tagtagatcc ggatcttcac aacagtttag tgtggatact tgagaatgat 1620 attacaggtg ttttggacca taccttctgt gttgaacata atgcatatgg tgaaattatt 1680 cagcatgaac ttaaaccaaa tggcaaaagt atccctgtta atgaagaaaa taaaaaagaa 1740 tatgtcaggc tctatgtgaa ctggagattt ttacgaggca ttgaggctca attcttggct 1800 ctgcagaaag gatttaatga agtaattcca caacatctgc tgaagacatt tgatgagaag 1860 gagttagagc tcattatttg tggacttgga aagatagatg ttaatgactg gaaggtaaac 1920 acccggttaa aacactgtac accagacagc aacattgtca aatggttctg gaaagctgtg 1980 gagttttttg atgaagagcg acgagcaaga ttgcttcagt ttgtgacagg atcctctcga 2040 gtgcctctgc agggcttcaa agcattgcaa ggtgctgcag gcccgagact ctttaccata 2100 caccagattg atgcctgcac taacaacctg ccgaaagccc acacttgctt caatcgaata 2160 gacattccac cctatgaaag ctatgaaaag ctatatgaaa agctgctaac agccattgaa 2220 gaaacatgtg gatttgctgt ggaatga 2247 <210> 29 <211> 2869 <212> DNA <213> Homo Sapiens <400> 29 ggagtcgccg ccgccccgag ttccggtacc atgcatttca cggtggcctt gtggagacaa 60 cgccttaacc caaggaagtg actcaaactg tgagaactcc aggttttcca acctattggt 120 ggtatgtctg acagtggatc acaacttggt tcaatgggta gcctcaccat gaaatcacag 180 cttcagatca ctgtcatctc agcaaaactt aaggaaaata agaagaattg gtttggacca 240 agtccttacg tagaggtcac agtagatgga cagtcaaaga agacagaaaa atgcaacaac 300 acaaacagtc ccaagtggaa gcaacccctt acagttatcg ttacccctgt gagtaaatta 360 cattttcgtg tgtggagtca ccagacactg aaatctgatg ttttgttggg aactgctgca 420 ttagatattt atgaaacatt aaagtcaaac aatatgaaac ttgaagaagt agttgtgact 480 ttgcagcttg gaggtgacaa agagccaaca gagacaatag gagacttgtc aatttgtctt 540 gatgggctac agttagagtc tgaagttgtt accaatggtg aaactacatg ttcagaaagt 600 gcttctcaga atgatgatgg ctccagatcc aaggatgaaa caagagtgag cacaaatgga 660 tcagatgacc ctgaagatgc aggagctggt gaaaatagga gagtcagtgg gaataattct 720 ccatcactct caaatggtgg ttttaaacct tctagacctc caagaccttc acgaccacca 780 ccacccaccc cacgtagacc agcatctgtc aatggttcac catctgccac ttctgaaagt 840 gatgggtcta gtacaggctc tctgccgccg acaaatacaa atacaaatac atctgaagga 900 gcaacatctg gattaataat tcctcttact atatctggag gctcaggccc taggccatta 960 aatcctgtaa ctcaagctcc cttgccacct ggttgggagc agagagtgga ccagcacggg 1020 cgagtttact atgtagatca tgttgagaaa agaacaacat gggatagacc agaacctcta 1080 cctcctggct gggaacggcg ggttgacaac atgggacgta tttattatgt tgaccatttc 1140 acaagaacaa caacgtggca gaggccaaca ctggaatccg tccggaacta tgaacaatgg 1200 cagctacagc gtagtcagct tcaaggagca atgcagcagt ttaaccagag attcatttat 1260 gggaatcaag atttatttgc tacatcacaa agtaaagaat ttgatcctct tggtccattg 1320 ccacctggat gggagaagag aacagacagc aatggcagag tatatttcgt caaccacaac 1380 acacgaatta cacaatggga agaccccaga agtcaaggtc aattaaatga aaagccctta 1440 cctgaaggtt gggaaatgag attcacagtg gatggaattc catattttgt ggaccacaat 1500 agaagaacta ccacctatat agatccccgc acaggaaaat ctgccctaga caatggacct 1560 cagatagcct atgttcggga cttcaaagca aaggttcagt atttccggtt ctggtgtcag 1620 caactggcca tgccacagca cataaagatt acagtgacaa gaaaaacatt gtttgaggat 1680 tcctttcaac agataatgag cttcagtccc caagatctgc gaagacgttt gtgggtgatt 1740 tttccaggag aagaaggttt agattatgga ggtgtagcaa gagaatggtt ctttcttttg 1800 tcacatgaag tgttgaaccc aatgtattgc ctgtttgaat atgcagggaa ggataactac 1860 tgcttgcaga taaaccccgc ttcttacatc aatccagatc acctgaaata ttttcgtttt 1920 attggcagat ttattgccat ggctctgttc catgggaaat tcatagacac gggtttttct 1980 ttaccattct ataagcgtat cttgaacaaa ccagttggac tcaaggattt agaatctatt 2040 gatccagaat tttacaattc tctcatctgg gttaaggaaa acaatattga ggaatgtgat 2100 ttggaaatgt acttctccgt tgacaaagaa attctaggtg aaattaagag tcatgatctg 2160 aaacctaatg gtggcaatat tcttgtaaca gaagaaaata aagaggaata catcagaatg 2220 gtagctgagt ggaggttgtc tcgaggtgtt gaagaacaga cacaagcttt ctttgaaggc 2280 tttaatgaaa ttcttcccca gcaatatttg caatactttg atgcaaagga attagaggtc 2340 cttttatgtg gaatgcaaga gattgatttg aatgactggc aaagacatgc catctaccgt 2400 cattatgcaa ggaccagcaa acaaatcatg tggttttggc agtttgttaa agaaattgat 2460 aatgagaaga gaatgagact tctgcagttt gttactggaa cctgccgatt gccagtagga 2520 ggatttgctg atctcatggg gagcaatgga ccacagaaat tctgcattga aaaagttggg 2580 aaagaaaatt ggctacccag aagtcatacc tgttttaatc gcctggacct gccaccatac 2640 aagagctatg agcaactgaa ggaaaagctg ttgtttgcca tagaagaaac agaaggattt 2700 ggacaagagt aacttctgag aacttgcacc atgaatgggc aagaacttat ttgcaatgtt 2760 tgtccttctc tgcctgttgc acatcttgta aaattggaca atggctcttt agagagttat 2820 ctgagtgtaa gtaaattaat gttctcattt aaaaaaaaaa aaaaaaaaa 2869 <210> 30 <211> 5169 <212> DNA <213> Homo Sapiens <400> 30 gcgcatcagg cgctgttgtt ggagccggaa caccgtgcga ctctgaccga accggccccc 60 tcctcgcgca cacactcgcc gagccgcgcg cgcccctccg ccgtgacagt ggccgtggcc 120 tccgctctct cggggcaccc ggcagccaga gcgcagcgag agcgggcggt cgccagggtc 180 ccctccccag ccagtcccag gcgcccggtg cactatgcgg ggcacgtgcg ccccccagct 240 ctaatctgcg cgctgacagg agcatgatct gtgcccaggc cagggctgcc aaggaattga 300 tgcgcgtaca cgtggtgggt cattatgctg ctacacctgt gtagtgtgaa gaatctgtac 360 cagaacaggt ttttaggcct ggccgccatg gcgtctcctt ctagaaactc ccagagccga 420 cgccggtgca aggagccgct ccgatacagc tacaaccccg accagttcca caacatggac 480 ctcaggggcg gcccccacga tggcgtcacc attccccgct ccaccagcga cactgacctg 540 gtcacctcgg acagccgctc cacgctcatg gtcagcagct cctactattc catcgggcac 600 tctcaggacc tggtcatcca ctgggacata aaggaggaag tggacgctgg ggactggatt 660 ggcatgtacc tcattgatga ggtcttgtcc gaaaactttc tggactataa aaaccgtgga 720 gtcaatggtt ctcatcgggg ccagatcatc tggaagatcg atgccagctc gtactttgtg 780 gaacctgaaa ctaagatctg cttcaaatac taccatggag tgagtggggc cctgcgagca 840 accaccccca gtgtcacggt caaaaactcg gcagctccta tttttaaaag cattggtgct 900 gatgagaccg tccaaggaca aggaagtcgg aggctgatca gcttctctct ctcagatttc 960 caagccatgg ggttgaagaa agggatgttt ttcaacccag acccttatct gaagatttcc 1020 attcagcctg ggaaacacag catcttcccc gccctccctc accatggaca ggagaggaga 1080 tccaagatca taggcaacac cgtgaacccc atctggcagg ccgagcaatt cagttttgtg 1140 tccttgccca ctgacgtgct ggaaattgag gtgaaggaca agtttgccaa gagccgcccc 1200 atcatcaagc gcttcttggg aaagctgtcg atgcccgttc aaagactcct ggagagacac 1260 gccatagggg atagggtggt cagctacaca cttggccgca ggcttccaac agatcatgtg 1320 agtggacagc tgcaattccg atttgagatc acttcctcca tccacccaga tgatgaggag 1380 atttccctga gtaccgagcc tgagtcagcc caaattcagg acagccccat gaacaacctg 1440 atggaaagcg gcagtgggga acctcggtct gaggcaccag agtcctctga gagctggaag 1500 ccagagcagc tgggtgaggg cagtgtcccc gatggtccag ggaaccaaag catagagctt 1560 tccagaccag ctgaggaagc agcagtcatc acggaggcag gagaccaggg catggtctct 1620 gtgggacctg aaggggctgg ggagctcctg gcccaggtgc aaaaggacat ccagcctgcc 1680 cccagtgcag aagagctggc cgagcagctg gacctgggtg aggaggcatc agcactgctg 1740 ctggaagacg gtgaagcccc agccagcacc aaggaggagc ccttggagga ggaagcaacg 1800 acccagagcc gggctggaag ggaagaagag gagaaggagc aggaggagga gggagatgtg 1860 tctaccctgg agcagggaga gggcaggctg cagctgcggg cctcggtgaa gagaaaaagc 1920 aggccctgct ccttgcctgt gtccgagctg gagacggtga tcgcgtcagc ctgcggggac 1980 cccgagaccc cgcggacaca ctacatccgc atccacaccc tgctgcacag catgccctcc 2040 gcccagggcg gcagcgcggc agaggaggag gacggcgcgg aggaggagtc caccctcaag 2100 gactcctcgg agaaggatgg gctcagcgag gtggacacgg tggccgctga cccgtctgcc 2160 ctggaagagg acagagaaga gcccgagggg gctactccag gcacggcgca ccctggccac 2220 tccgggggcc acttccccag cctggccaat ggcgcggccc aggatggcga cacgcacccc 2280 agcaccggga gcgagagcga ctccagcccc aggcaaggcg gggaccacag ttgcgagggc 2340 tgtgacgcgt cctgctgcag cccctcgtgc tacagctcct cgtgctacag cacgtcctgc 2400 tacagcagct cgtgctacag cgcctcgtgc tacagcccct cctgctacaa cggcaacagg 2460 ttcgccagcc acacgcgctt ctcctccgtg gacagcgcca agatctccga gagcacggtc 2520 ttctcctcgc aagacgacga ggaggaggag aacagcgcgt tcgagtcggt acccgactcc 2580 atgcagagcc ctgagctgga cccggagtcc acgaacggcg ctgggccgtg gcaagacgag 2640 ctggccgccc ctagcgggca cgtggaaaga agcccggaag gtctggaatc ccccgtggca 2700 ggtccaagca atcggagaga agactgggaa gctcgaattg acagccacgg gcgggtcttt 2760 tatgtggacc acgtgaaccg cacaaccacc tggcagcgtc cgacggcagc agccaccccg 2820 gatggcatgc ggagatcggg gtccatccag cagatggagc aactcaacag gcggtatcaa 2880 aacattcagc gaaccattgc aacagagagg tccgaagaag attctggcag ccaaagctgc 2940 gagcaagccc cagcaggagg aggcggaggt ggagggagtg actcagaagc cgaatcttcc 3000 cagtccagct tagatctaag gagagagggg tcactttctc cagtgaactc acaaaaaatc 3060 accttgctgc tgcagtcccc agcggtcaag ttcatcacca accccgagtt cttcactgtg 3120 ctacacgcca attatagtgc ctaccgagtc ttcaccagta gcacctgctt aaagcacatg 3180 attctgaaag tccgacggga tgctcgcaat tttgaacgct accagcacaa ccgggacttg 3240 gtgaatttca tcaacatgtt cgcagacact cggctggaac tgccccgggg ctgggagatc 3300 aaaacggacc agcagggaaa gtcttttttc gtggaccaca acagtcgagc taccactttc 3360 attgaccccc gaatccctct tcagaacggt cgtcttccca atcatctaac tcaccgacag 3420 cacctccaga ggctccgaag ttacagcgcc ggagaggcct cagaagtttc tagaaacaga 3480 ggagcctctt tactggccag gccaggacac agcttagtag ctgctattcg aagccaacat 3540 caacatgagt cattgccact ggcatataat gacaagattg tggcatttct tcgccagcca 3600 aacatttttg aaatgctgca agagcgtcag ccaagcttag caagaaacca cacactcagg 3660 gagaaaatcc attacattcg gactgagggt aatcacgggc ttgagaagtt gtcctgtgat 3720 gcggatctgg tcattttgct gagtctcttt gaagaagaga ttatgtccta cgtccccctg 3780 caggctgcct tccaccctgg gtatagcttc tctccccgat gttcaccctg ttcttcacct 3840 cagaactccc caggtttaca gagagccagt gcaagagccc cttcccccta ccgaagagac 3900 tttgaggcca agctccgcaa tttctacaga aaactggaag ccaaaggatt tggtcagggt 3960 ccggggaaaa ttaagctcat tattcgccgg gatcatttgt tggagggaac cttcaatcag 4020 gtgatggcct attcgcggaa agagctccag cgaaacaagc tctacgtcac ctttgttgga 4080 gaggagggcc tggactacag tggcccctcg cgggagttct tcttccttct gtctcaggag 4140 ctcttcaacc cttactatgg actctttgag tactcggcaa atgatactta cacggtgcag 4200 atcagcccca tgtccgcatt tgtagaaaac catcttgagt ggttcaggtt tagcggtcgc 4260 atcctgggtc tggctctgat ccatcagtac cttcttgacg ctttcttcac gaggcccttc 4320 tacaaggcac tcctgagact gccctgtgat ttgagtgacc tggaatattt ggatgaggaa 4380 ttccaccaga gtttgcagtg gatgaaggac aacaacatca cagacatctt agacctcact 4440 ttcactgtta atgaagaggt ttttggacag gtcacggaaa gggagttgaa gtctggagga 4500 gccaacacac aggtgacgga gaaaaacaag aaggagtaca tcgagcgcat ggtgaagtgg 4560 cgggtggagc gcggcgtggt acagcagacc gaggcgctgg tgcgcggctt ctacgaggtt 4620 gtagactcga ggctggtgtc cgtgtttgat gccagggagc tggagctggt gatagctggc 4680 accgcggaaa tcgacctaaa tgactggcgg aataacactg agtaccgggg aggttaccac 4740 gatgggcatc ttgtgatccg ctggttctgg gctgcggtgg agcgcttcaa taatgagcag 4800 aggctgagat tactgcagtt tgtcacggga acatccagcg tgccctacga aggcttcgca 4860 gccctccgtg ggagcaatgg gcttcggcgc ttctgcatag agaaatgggg gaaaattact 4920 tctctcccca gggcacacac atgcttcaac cgactggatc ttccaccgta tccctcgtac 4980 tccatgttgt atgaaaagct gttaacagca gtagaggaaa ccagcacctt tggacttgag 5040 tgaggacatg gaacctcgcc tgacattttc ctggccagtg acatcaccct tcctgggatg 5100 atcccctttt ccctttccct taatcaactc tcctttgatt ttggtattcc atgattttta 5160 ttttcaaac 5169 <210> 31 <211> 2715 <212> DNA <213> Homo Sapiens <400> 31 agagttccat cagagcctgc agtggatgaa agacaatgat atccatgaca tcctagacct 60 cacgttcact gtgaacgaag aagtatttgg gcagataact gaacgagaat taaagccagg 120 gggtgccaat atcccagtta cagagaagaa caagaaggag tacatcgaga ggatggtgaa 180 gtggaggatt gagaggggtg ttgtacagca aacagagagc ttagtgcgtg gcttctatga 240 ggtggtggat gccaggctgg tatctgtttt tgatgcaaga gaactggaat tggtcatcgc 300 aggcacagct gaaatagacc taagtgattg gagaaacaac acagaatata gaggaggata 360 ccatgacaat catattgtaa ttcggtggtt ctgggctgca gtggaaagat tcaacaatga 420 acaacgacta aggttgttac agtttgttac aggcacatcc agcattccct atgaaggatt 480 tgcttcactc cgagggagta acggcccaag aagattctgt gtggagaaat gggggaaaat 540 cactgctctt cccagagcgc atacatgttt taaccgtctg gatctgcctc cctacccatc 600 cttttccatg ctttatgaaa aactgttgac agcagttgaa gaaaccagta cttttggact 660 tgagtgacct ggaagctgaa tgcccatctc tgtggacagg cagtttcaga agctgccttc 720 tagaagaatg attgaacatt ggaagtttca agaggatgct tcctttagga taaagctacg 780 tgctgttgtt ttccaggaac aagtgctctg tcacatttgg ggactggaga tgagtcctct 840 tggaaggatt tgggtgagct tgatgcccag ggaacaaccc aaccgtcttt caatcaacag 900 ttcttgactg ccaaactttt tccatttgtt atgttccaag acaaagatga acccatacat 960 gatcagctcc acggtaattt ttagggactc aggagaatct tgaaacttac ccttgaacgt 1020 ggttcaagcc aaactggcag catttggccc aatctccaaa ttagagcaag ttaaataata 1080 taataaaagt aaatatattt cctgaaagta cattcattta agccctaagt tataacagaa 1140 tattcatttc ttgcttatga gtgcctgcat ggtgtgcacc ataggtttcc gctttcatgg 1200 gacatgagtg aaaatgaaac caagtcaata tgaggtacct ttacagattt gcaataagat 1260 ggtctgtgac aatgtatatg caagtggtat gtgtgtaatt atggctaaag acaaaccatt 1320 attcagtgaa ttactaatga cagattttat gctttataat gcatgaaaac aattttaaaa 1380 taactagcaa ttaatcacag catatcagga aaaagtacac agtgagttct gtttattttt 1440 tgtaggctca ttatgtttat gttctttaag atgtatataa gaacctactt atcatgctgt 1500 atgtatcact cattccattt tcatgttcca tgcatactcg ggcatcatgc taatatgtat 1560 ccttttaagc actctcaagg aaacaaaagg gccttttatt tttataaagg taaaaaaaat 1620 tccccaaata ttttgcactg aatgtaccaa aggtgaaggg acattacaat atgactaaca 1680 gcaactccat cacttgagaa gtataataga aaatagcttc taaatcaaac ttccttcaca 1740 gtgccgtgtc taccactaca aggactgtgc atctaagtaa taatttttta agattcacta 1800 tatgtgatag tatgatatgc atttatttaa aatgcattag actctcttcc atccatcaaa 1860 tactttacag gatggcattt aatacagata tttcgtattt cccccactgc tttttatttg 1920 tacagcatca ttaaacacta agctcagtta aggagccatc agcaacactg aagagatcag 1980 tagtaagaat tccattttcc ctcatcagtg aagacaccac aaattgaaac tcagaactat 2040 atttctaagc ctgcattttc actgatgcat aattttctta ttaatattaa gagacagttt 2100 ttctatggca tctccaaaac tgcatgacat cactagtctt acttctgctt aattttatga 2160 gaaggtattc ttcattttaa ttgcttttgg gattactcca catctttgtt tatttcttga 2220 ctaatcagat tttcaataga gtgaagttaa attgggggtc ataaaagcat tggattgaca 2280 tatggtttgc cagcctatgg gtttacaggc attgcccaaa catttctttg agatctatat 2340 ttataagcag ccatggaatt cctattatgg gatgttggca atcttacatt ttatagaggt 2400 catatgcata gttttcatag gtgttttgta agaactgatt gctctcctgt gagttaagct 2460 atgtttacta ctgggaccct caagaggaat accacttatg ttacactcct gcactaaagg 2520 cacgtactgc agtgtgaaga aatgttctga aaaagggtta tagaaatctg gaaataagaa 2580 aggaagagct ctctgtattc tataattgga agagaaaaaa agaaaaactt ttaactggaa 2640 atgttagttt gtacttattg atcatgaata caagtatata tttaattttg caaaaaaaaa 2700 aaaaaaaaaa aaaag 2715 <210> 32 <211> 195 <212> DNA <213> Homo Sapiens <400> 32 cccttgccac ctggttggga gcagagagtg gaccagcacg ggcgagttta ctatgtagat 60 catgttgaga aaagaacaac atgggataga ccagaacctc tacctcctgg ctgggaacgg 120 cgggttgaca acatgggacg tatttattat gttgaccatt tcacaagaac aacaacgtgg 180 cagaggccaa cactg 195 <210> 33 <211> 555 <212> DNA <213> Homo Sapiens <400> 33 cccttgccac ctggttggga gcagagagtg gaccagcacg ggcgagttta ctatgtagat 60 catgttgaga aaagaacaac atgggataga ccagaacctc tacctcctgg ctgggaacgg 120 cgggttgaca acatgggacg tatttattat gttgaccatt tcacaagaac aacaacgtgg 180 cagaggccaa cactggaatc cgtccggaac tatgaacaat ggcagctaca gcgtagtcag 240 cttcaaggag caatgcagca gtttaaccag agattcattt atgggaatca agatttattt 300 gctacatcac aaagtaaaga atttgatcct cttggtccat tgccacctgg atgggagaag 360 agaacagaca gcaatggcag agtatatttc gtcaaccaca acacacgaat tacacaatgg 420 gaagacccca gaagtcaagg tcaattaaat gaaaagccct tacctgaagg ttgggaaatg 480 agattcacag tggatggaat tccatatttt gtggaccaca atagaagaac taccacctat 540 atagatcccc gcaca 555 <210> 34 <211> 8506 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Polynucleotide <400> 34 gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60 ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120 aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180 atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240 cgaaacaccg ggtcttcgag aagacctgtt ttagagctag aaatagcaag ttaaaataag 300 gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcttttttg ttttagagct 360 agaaatagca agttaaaata aggctagtcc gtttttagcg cgtgcgccaa ttctgcagac 420 aaatggctct agaggtaccc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 480 ccaacgaccc ccgcccattg acgtcaatag taacgccaat agggactttc cattgacgtc 540 aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 600 caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tgtgcccagt 660 acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 720 ccatggtcga ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac 780 ccccaatttt gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg 840 ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg gcggggcggg gcgaggcgga 900 gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa gtttcctttt atggcgaggc 960 ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg ggcgggagtc gctgcgacgc 1020 tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc gcccgccccg gctctgactg 1080 accgcgttac tcccacaggt gagcgggcgg gacggccctt ctcctccggg ctgtaattag 1140 ctgagcaaga ggtaagggtt taagggatgg ttggttggtg gggtattaat gtttaattac 1200 ctggagcacc tgcctgaaat cacttttttt caggttggac cggtgccacc atggactata 1260 aggaccacga cggagactac aaggatcatg atattgatta caaagacgat gacgataaga 1320 tggccccaaa gaagaagcgg aaggtcggta tccacggagt cccagcagcc gacaagaagt 1380 acagcatcgg cctggacatc ggcaccaact ctgtgggctg ggccgtgatc accgacgagt 1440 acaaggtgcc cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac agcatcaaga 1500 agaacctgat cggagccctg ctgttcgaca gcggcgaaac agccgaggcc acccggctga 1560 agagaaccgc cagaagaaga tacaccagac ggaagaaccg gatctgctat ctgcaagaga 1620 tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccacagactg gaagagtcct 1680 tcctggtgga agaggataag aagcacgagc ggcaccccat cttcggcaac atcgtggacg 1740 aggtggccta ccacgagaag taccccacca tctaccacct gagaaagaaa ctggtggaca 1800 gcaccgacaa ggccgacctg cggctgatct atctggccct ggcccacatg atcaagttcc 1860 ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg gacaagctgt 1920 tcatccagct ggtgcagacc tacaaccagc tgttcgagga aaaccccatc aacgccagcg 1980 gcgtggacgc caaggccatc ctgtctgcca gactgagcaa gagcagacgg ctggaaaatc 2040 tgatcgccca gctgcccggc gagaagaaga atggcctgtt cggaaacctg attgccctga 2100 gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggat gccaaactgc 2160 agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag atcggcgacc 2220 agtacgccga cctgtttctg gccgccaaga acctgtccga cgccatcctg ctgagcgaca 2280 tcctgagagt gaacaccgag atcaccaagg cccccctgag cgcctctatg atcaagagat 2340 acgacgagca ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag cagctgcctg 2400 agaagtacaa agagattttc ttcgaccaga gcaagaacgg ctacgccggc tacattgacg 2460 gcggagccag ccaggaagag ttctacaagt tcatcaagcc catcctggaa aagatggacg 2520 gcaccgagga actgctcgtg aagctgaaca gagaggacct gctgcggaag cagcggacct 2580 tcgacaacgg cagcatcccc caccagatcc acctgggaga gctgcacgcc attctgcggc 2640 ggcaggaaga tttttaccca ttcctgaagg acaaccggga aaagatcgag aagatcctga 2700 ccttccgcat cccctactac gtgggccctc tggccagggg aaacagcaga ttcgcctgga 2760 tgaccagaaa gagcgaggaa accatcaccc cctggaactt cgaggaagtg gtggacaagg 2820 gcgcttccgc ccagagcttc atcgagcgga tgaccaactt cgataagaac ctgcccaacg 2880 agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtat aacgagctga 2940 ccaaagtgaa atacgtgacc gagggaatga gaaagcccgc cttcctgagc ggcgagcaga 3000 aaaaggccat cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg aagcagctga 3060 aagaggacta cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc ggcgtggaag 3120 atcggttcaa cgcctccctg ggcacatacc acgatctgct gaaaattatc aaggacaagg 3180 acttcctgga caatgaggaa aacgaggaca ttctggaaga tatcgtgctg accctgacac 3240 tgtttgagga cagagagatg atcgaggaac ggctgaaaac ctatgcccac ctgttcgacg 3300 acaaagtgat gaagcagctg aagcggcgga gatacaccgg ctggggcagg ctgagccgga 3360 agctgatcaa cggcatccgg gacaagcagt ccggcaagac aatcctggat ttcctgaagt 3420 ccgacggctt cgccaacaga aacttcatgc agctgatcca cgacgacagc ctgaccttta 3480 aagaggacat ccagaaagcc caggtgtccg gccagggcga tagcctgcac gagcacattg 3540 ccaatctggc cggcagcccc gccattaaga agggcatcct gcagacagtg aaggtggtgg 3600 acgagctcgt gaaagtgatg ggccggcaca agcccgagaa catcgtgatc gaaatggcca 3660 gagagaacca gaccacccag aagggacaga agaacagccg cgagagaatg aagcggatcg 3720 aagagggcat caaagagctg ggcagccaga tcctgaaaga acaccccgtg gaaaacaccc 3780 agctgcagaa cgagaagctg tacctgtact acctgcagaa tgggcgggat atgtacgtgg 3840 accaggaact ggacatcaac cggctgtccg actacgatgt ggaccatatc gtgcctcaga 3900 gctttctgaa ggacgactcc atcgacaaca aggtgctgac cagaagcgac aagaaccggg 3960 gcaagagcga caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac tactggcggc 4020 agctgctgaa cgccaagctg attacccaga gaaagttcga caatctgacc aaggccgaga 4080 gaggcggcct gagcgaactg gataaggccg gcttcatcaa gagacagctg gtggaaaccc 4140 ggcagatcac aaagcacgtg gcacagatcc tggactcccg gatgaacact aagtacgacg 4200 agaatgacaa gctgatccgg gaagtgaaag tgatcaccct gaagtccaag ctggtgtccg 4260 atttccggaa ggatttccag ttttacaaag tgcgcgagat caacaactac caccacgccc 4320 acgacgccta cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac cctaagctgg 4380 aaagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg atcgccaaga 4440 gcgagcagga aatcggcaag gctaccgcca agtacttctt ctacagcaac atcatgaact 4500 ttttcaagac cgagattacc ctggccaacg gcgagatccg gaagcggcct ctgatcgaga 4560 caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc accgtgcgga 4620 aagtgctgag catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag acaggcggct 4680 tcagcaaaga gtctatcctg cccaagagga acagcgataa gctgatcgcc agaaagaagg 4740 actgggaccc taagaagtac ggcggcttcg acagccccac cgtggcctat tctgtgctgg 4800 tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa gagctgctgg 4860 ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt ctggaagcca 4920 agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac tccctgttcg 4980 agctggaaaa cggccggaag agaatgctgg cctctgccgg cgaactgcag aagggaaacg 5040 aactggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac tatgagaagc 5100 tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag cacaagcact 5160 acctggacga gatcatcgag cagatcagcg agttctccaa gagagtgatc ctggccgacg 5220 ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc atcagagagc 5280 aggccgagaa tatcatccac ctgtttaccc tgaccaatct gggagcccct gccgccttca 5340 agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag gtgctggacg 5400 ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac ctgtctcagc 5460 tgggaggcga caaaaggccg gcggccacga aaaaggccgg ccaggcaaaa aagaaaaagt 5520 aagaattcct agagctcgct gatcagcctc gactgtgcct tctagttgcc agccatctgt 5580 tgtttgcccc tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc 5640 ctaataaaat gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg 5700 tggggtgggg caggacagca agggggagga ttgggaagag aatagcaggc atgctgggga 5760 gcggccgcag gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct 5820 cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg cggcctcagt 5880 gagcgagcga gcgcgcagct gcctgcaggg gcgcctgatg cggtattttc tccttacgca 5940 tctgtgcggt atttcacacc gcatacgtca aagcaaccat agtacgcgcc ctgtagcggc 6000 gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc 6060 ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc 6120 cgtcaagctc taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc 6180 gaccccaaaa aacttgattt gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg 6240 gtttttcgcc ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact 6300 ggaacaacac tcaaccctat ctcgggctat tcttttgatt tataagggat tttgccgatt 6360 tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa 6420 atattaacgt ttacaatttt atggtgcact ctcagtacaa tctgctctga tgccgcatag 6480 ttaagccagc cccgacaccc gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc 6540 ccggcatccg cttacagaca agctgtgacc gtctccggga gctgcatgtg tcagaggttt 6600 tcaccgtcat caccgaaacg cgcgagacga aagggcctcg tgatacgcct atttttatag 6660 gttaatgtca tgataataat ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg 6720 cgcggaaccc ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga 6780 caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat 6840 ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca 6900 gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc 6960 gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca 7020 atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg 7080 caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca 7140 gtcacagaaa agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata 7200 accatgagtg ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag 7260 ctaaccgctt ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg 7320 gagctgaatg aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca 7380 acaacgttgc gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta 7440 atagactgga tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct 7500 ggctggttta ttgctgataa atctggagcc ggtgagcgtg gaagccgcgg tatcattgca 7560 gcactggggc cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag 7620 gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat 7680 tggtaactgt cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt 7740 taatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa 7800 cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 7860 gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 7920 gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 7980 agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 8040 aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 8100 agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 8160 cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 8220 accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 8280 aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 8340 ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 8400 cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 8460 gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgt 8506 <210> 35 <211> 238 <212> PRT <213> Aequorea victoria <400> 35 Met Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val 1 5 10 15 Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly Glu 20 25 30 Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys 35 40 45 Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Phe 50 55 60 Ser Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys Gln 65 70 75 80 His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg 85 90 95 Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val 100 105 110 Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile 115 120 125 Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn 130 135 140 Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn Gly 145 150 155 160 Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser Val 165 170 175 Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro 180 185 190 Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu Ser 195 200 205 Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val 210 215 220 Thr Ala Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr Lys 225 230 235 <210> 36 <211> 34 <212> PRT <213> Homo Sapiens <400> 36 Glu Thr Leu Pro Ser Gly Trp Glu Gln Arg Lys Asp Pro His Gly Arg 1 5 10 15 Thr Tyr Tyr Val Asp His Asn Thr Arg Thr Thr Thr Trp Glu Arg Pro 20 25 30 Gln Pro <210> 37 <211> 34 <212> PRT <213> Homo Sapiens <400> 37 Gln Pro Leu Pro Pro Gly Trp Glu Arg Arg Val Asp Asp Arg Arg Arg 1 5 10 15 Val Tyr Tyr Val Asp His Asn Thr Arg Thr Thr Thr Trp Gln Arg Pro 20 25 30 Thr Met <210> 38 <211> 39 <212> PRT <213> Homo Sapiens <400> 38 Glu Asn Asp Pro Tyr Gly Pro Leu Pro Pro Gly Trp Glu Lys Arg Val 1 5 10 15 Asp Ser Thr Asp Arg Val Tyr Phe Val Asn His Asn Thr Lys Thr Thr 20 25 30 Gln Trp Glu Asp Pro Arg Thr 35 <210> 39 <211> 34 <212> PRT <213> Homo Sapiens <400> 39 Glu Pro Leu Pro Glu Gly Trp Glu Ile Arg Tyr Thr Arg Glu Gly Val 1 5 10 15 Arg Tyr Phe Val Asp His Asn Thr Arg Thr Thr Thr Phe Lys Asp Pro 20 25 30 Arg Asn <210> 40 <211> 34 <212> PRT <213> Homo Sapiens <400> 40 Asp Ala Leu Pro Ala Gly Trp Glu Gln Arg Glu Leu Pro Asn Gly Arg 1 5 10 15 Val Tyr Tyr Val Asp His Asn Thr Lys Thr Thr Thr Trp Glu Arg Pro 20 25 30 Leu Pro <210> 41 <211> 33 <212> PRT <213> Homo Sapiens <400> 41 Pro Leu Pro Pro Gly Trp Glu Lys Arg Thr Asp Pro Arg Gly Arg Phe 1 5 10 15 Tyr Tyr Val Asp His Asn Thr Arg Thr Thr Thr Trp Gln Arg Pro Thr 20 25 30 Ala <210> 42 <211> 37 <212> PRT <213> Homo Sapiens <400> 42 His Asp Pro Leu Gly Pro Leu Pro Pro Gly Trp Glu Lys Arg Gln Asp 1 5 10 15 Asn Gly Arg Val Tyr Tyr Val Asn His Asn Thr Arg Thr Thr Gln Trp 20 25 30 Glu Asp Pro Arg Thr 35 <210> 43 <211> 34 <212> PRT <213> Homo Sapiens <400> 43 Pro Ala Leu Pro Pro Gly Trp Glu Met Lys Tyr Thr Ser Glu Gly Val 1 5 10 15 Arg Tyr Phe Val Asp His Asn Thr Arg Thr Thr Thr Phe Lys Asp Pro 20 25 30 Arg Pro <210> 44 <211> 34 <212> PRT <213> Homo Sapiens <400> 44 Ser Pro Leu Pro Pro Gly Trp Glu Glu Arg Gln Asp Ile Leu Gly Arg 1 5 10 15 Thr Tyr Tyr Val Asn His Glu Ser Arg Arg Thr Gln Trp Lys Arg Pro 20 25 30 Thr Pro <210> 45 <211> 34 <212> PRT <213> Homo Sapiens <400> 45 Ser Gly Leu Pro Pro Gly Trp Glu Glu Lys Gln Asp Glu Arg Gly Arg 1 5 10 15 Ser Tyr Tyr Val Asp His Asn Ser Arg Thr Thr Thr Trp Thr Lys Pro 20 25 30 Thr Val <210> 46 <211> 34 <212> PRT <213> Homo Sapiens <400> 46 Gly Phe Leu Pro Lys Gly Trp Glu Val Arg His Ala Pro Asn Gly Arg 1 5 10 15 Pro Phe Phe Ile Asp His Asn Thr Lys Thr Thr Thr Trp Glu Asp Pro 20 25 30 Arg Leu <210> 47 <211> 34 <212> PRT <213> Homo Sapiens <400> 47 Gly Pro Leu Pro Pro Gly Trp Glu Glu Arg Thr His Thr Asp Gly Arg 1 5 10 15 Ile Phe Tyr Ile Asn His Asn Ile Lys Arg Thr Gln Trp Glu Asp Pro 20 25 30 Arg Leu <210> 48 <211> 34 <212> PRT <213> Homo Sapiens <400> 48 Pro Glu Leu Pro Glu Gly Tyr Glu Gln Arg Thr Thr Val Gln Gly Gln 1 5 10 15 Val Tyr Phe Leu His Thr Gln Thr Gly Val Ser Thr Trp His Asp Pro 20 25 30 Arg Ile <210> 49 <211> 34 <212> PRT <213> Homo Sapiens <400> 49 Gly Pro Leu Pro Pro Gly Trp Glu Val Arg Ser Thr Val Ser Gly Arg 1 5 10 15 Ile Tyr Phe Val Asp His Asn Asn Arg Thr Thr Gln Phe Thr Asp Pro 20 25 30 Arg Leu <210> 50 <211> 34 <212> PRT <213> Homo Sapiens <400> 50 Asn Asp Leu Pro Asp Gly Trp Glu Glu Arg Arg Thr Ala Ser Gly Arg 1 5 10 15 Ile Gln Tyr Leu Asn His Ile Thr Arg Thr Thr Gln Trp Glu Arg Pro 20 25 30 Thr Arg <210> 51 <211> 34 <212> PRT <213> Homo Sapiens <400> 51 Pro Asp Leu Pro Glu Gly Tyr Glu Gln Arg Thr Thr Gln Gln Gly Gln 1 5 10 15 Val Tyr Phe Leu His Thr Gln Thr Gly Val Ser Thr Trp His Asp Pro 20 25 30 Arg Val <210> 52 <211> 34 <212> PRT <213> Homo Sapiens <400> 52 Gly Pro Leu Pro Pro Gly Trp Glu Ile Arg Asn Thr Ala Thr Gly Arg 1 5 10 15 Val Tyr Phe Val Asp His Asn Asn Arg Thr Thr Gln Phe Thr Asp Pro 20 25 30 Arg Leu <210> 53 <211> 34 <212> PRT <213> Homo Sapiens <400> 53 Ala Pro Leu Pro Pro Gly Trp Glu Gln Arg Val Asp Gln His Gly Arg 1 5 10 15 Val Tyr Tyr Val Asp His Val Glu Lys Arg Thr Thr Trp Asp Arg Pro 20 25 30 Glu Pro <210> 54 <211> 34 <212> PRT <213> Homo Sapiens <400> 54 Glu Pro Leu Pro Pro Gly Trp Glu Arg Arg Val Asp Asn Met Gly Arg 1 5 10 15 Ile Tyr Tyr Val Asp His Phe Thr Arg Thr Thr Thr Trp Gln Arg Pro 20 25 30 Thr Leu <210> 55 <211> 34 <212> PRT <213> Homo Sapiens <400> 55 Gly Pro Leu Pro Pro Gly Trp Glu Lys Arg Thr Asp Ser Asn Gly Arg 1 5 10 15 Val Tyr Phe Val Asn His Asn Thr Arg Ile Thr Gln Trp Glu Asp Pro 20 25 30 Arg Ser <210> 56 <211> 34 <212> PRT <213> Homo Sapiens <400> 56 Lys Pro Leu Pro Glu Gly Trp Glu Met Arg Phe Thr Val Asp Gly Ile 1 5 10 15 Pro Tyr Phe Val Asp His Asn Arg Arg Thr Thr Thr Tyr Ile Asp Pro 20 25 30 Arg Thr <210> 57 <211> 33 <212> PRT <213> Homo Sapiens <400> 57 Pro Leu Pro Pro Asn Trp Glu Ala Arg Ile Asp Ser His Gly Arg Val 1 5 10 15 Phe Tyr Val Asp His Val Asn Arg Thr Thr Thr Trp Gln Arg Pro Thr 20 25 30 Ala <210> 58 <211> 34 <212> PRT <213> Homo Sapiens <400> 58 Leu Glu Leu Pro Arg Gly Trp Glu Ile Lys Thr Asp Gln Gln Gly Lys 1 5 10 15 Ser Phe Phe Val Asp His Asn Ser Arg Ala Thr Thr Phe Ile Asp Pro 20 25 30 Arg Ile <210> 59 <211> 34 <212> PRT <213> Homo Sapiens <400> 59 Glu Ala Leu Pro Pro Asn Trp Glu Ala Arg Ile Asp Ser His Gly Arg 1 5 10 15 Ile Phe Tyr Val Asp His Val Asn Arg Thr Thr Thr Trp Gln Arg Pro 20 25 30 Thr Ala <210> 60 <211> 34 <212> PRT <213> Homo Sapiens <400> 60 Leu Glu Leu Pro Arg Gly Trp Glu Met Lys His Asp His Gln Gly Lys 1 5 10 15 Ala Phe Phe Val Asp His Asn Ser Arg Thr Thr Thr Phe Ile Asp Pro 20 25 30 Arg Leu <210> 61 <211> 27 <212> PRT <213> Homo Sapiens <400> 61 Gly Trp Glu Glu Lys Val Asp Asn Leu Gly Arg Thr Tyr Tyr Val Asn 1 5 10 15 His Asn Asn Arg Thr Thr Gln Trp His Arg Pro 20 25 <210> 62 <211> 29 <212> PRT <213> Homo Sapiens <400> 62 Pro Ser Gly Trp Glu Glu Arg Lys Asp Ala Lys Gly Arg Thr Tyr Tyr 1 5 10 15 Val Asn His Asn Asn Arg Thr Thr Thr Trp Thr Arg Pro 20 25 <210> 63 <211> 31 <212> PRT <213> Homo Sapiens <400> 63 Pro Pro Gly Trp Glu Met Arg Ile Ala Pro Asn Gly Arg Pro Phe Phe 1 5 10 15 Ile Asp His Asn Thr Lys Thr Thr Thr Trp Glu Asp Pro Arg Leu 20 25 30 <210> 64 <211> 31 <212> PRT <213> Homo Sapiens <400> 64 Pro Pro Gly Trp Glu Glu Arg Ile His Leu Asp Gly Arg Thr Phe Tyr 1 5 10 15 Ile Asp His Asn Ser Lys Ile Thr Gln Trp Glu Asp Pro Arg Leu 20 25 30 <210> 65 <211> 101 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 65 Met Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser 1 5 10 15 Gln Pro Arg Thr Pro Cys Thr Thr Cys Tyr Cys Lys Lys Cys Cys Phe 20 25 30 His Cys Gln Val Cys Phe Thr Thr Lys Ala Leu Gly Ile Ser Tyr Gly 35 40 45 Arg Lys Lys Arg Arg Gln Arg Arg Arg Pro Pro Gln Gly Ser Gln Thr 50 55 60 His Gln Val Ser Leu Ser Lys Gln Pro Ser Ser Gln Pro Arg Gly Asp 65 70 75 80 Gln Thr Gly Pro Lys Glu Ser Lys Lys Lys Val Glu Arg Glu Thr Glu 85 90 95 Ala Asp Pro Lys Pro 100 <210> 66 <211> 86 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 66 Met Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser 1 5 10 15 Gln Pro Arg Thr Pro Cys Thr Thr Cys Tyr Cys Lys Lys Cys Cys Phe 20 25 30 His Cys Gln Val Cys Phe Thr Thr Lys Ala Leu Gly Ile Ser Tyr Gly 35 40 45 Arg Lys Lys Arg Arg Gln Arg Arg Arg Pro Pro Gln Gly Ser Gln Thr 50 55 60 His Gln Val Ser Leu Ser Lys Gln Pro Ser Ser Gln Pro Arg Gly Asp 65 70 75 80 Gln Thr Gly Pro Lys Glu 85 <210> 67 <211> 36 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 67 Cys Phe Thr Thr Lys Ala Leu Gly Ile Ser Tyr Gly Arg Lys Lys Arg 1 5 10 15 Arg Gln Arg Arg Arg Pro Pro Gln Gly Ser Gln Thr His Gln Val Ser 20 25 30 Leu Ser Lys Gln 35 <210> 68 <211> 45 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 68 Met Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser 1 5 10 15 Gln Pro Arg Thr Pro Cys Thr Thr Cys Tyr Cys Lys Lys Cys Cys Phe 20 25 30 His Cys Gln Val Cys Phe Thr Thr Lys Ala Leu Gly Ile 35 40 45 <210> 69 <211> 38 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 69 Arg Lys Lys Arg Arg Gln Arg Arg Arg Pro Pro Gln Gly Ser Gln Thr 1 5 10 15 His Gln Val Ser Leu Ser Lys Gln Pro Ser Ser Gln Pro Arg Gly Asp 20 25 30 Gln Thr Gly Pro Lys Glu 35 <210> 70 <211> 35 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 70 Arg Arg Gln Arg Arg Arg Pro Pro Gln Gly Ser Gln Thr His Gln Val 1 5 10 15 Ser Leu Ser Lys Gln Pro Ser Ser Gln Pro Arg Gly Asp Gln Thr Gly 20 25 30 Pro Lys Glu 35 <210> 71 <211> 32 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 71 Arg Arg Arg Pro Pro Gln Gly Ser Gln Thr His Gln Val Ser Leu Ser 1 5 10 15 Lys Gln Pro Ser Ser Gln Pro Arg Gly Asp Gln Thr Gly Pro Lys Glu 20 25 30 <210> 72 <211> 29 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 72 Pro Pro Gln Gly Ser Gln Thr His Gln Val Ser Leu Ser Lys Gln Pro 1 5 10 15 Ser Ser Gln Pro Arg Gly Asp Gln Thr Gly Pro Lys Glu 20 25 <210> 73 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 73 Arg Lys Lys Arg Arg Gln Arg Arg Arg 1 5 <210> 74 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 74 Arg Lys Lys Arg Arg Gln Arg Arg Arg Pro Pro 1 5 10 <210> 75 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 75 Arg Lys Lys Arg Arg Gln Arg Arg Arg Pro Pro Gln Gly 1 5 10 <210> 76 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 76 Arg Lys Lys Arg Arg Gln Arg Arg Arg Pro Pro Gln Gly Ser Gln 1 5 10 15 <210> 77 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 77 Arg Lys Lys Arg Arg Gln Arg Arg Arg Pro Pro Gln Gly Ser Gln Thr 1 5 10 15 His <210> 78 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 78 Cys Phe Thr Thr Lys Ala Leu Gly Ile Ser Tyr Gly Arg Lys Lys Arg 1 5 10 15 Arg Gln Arg Arg Arg 20 <210> 79 <211> 27 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 79 Cys Phe Thr Thr Lys Ala Leu Gly Ile Ser Tyr Gly Arg Lys Lys Arg 1 5 10 15 Arg Gln Arg Arg Arg Pro Pro Gln Gly Ser Gln 20 25 <210> 80 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 80 Gly Arg Arg Lys Lys Arg Arg Gln Arg Arg Arg Pro 1 5 10 <210> 81 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 81 Ser Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg Pro Pro Gln Gly 1 5 10 15 Ser Gln Thr His 20 <210> 82 <211> 130 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 82 Met Glu Thr Pro Leu Lys Ala Pro Glu Gly Ser Leu Gly Ser Tyr Asn 1 5 10 15 Glu Pro Ser Ser Cys Thr Ser Glu Gln Asp Ala Ala Ala Gln Gly Leu 20 25 30 Val Ser Pro Gly Asp Glu Ile Leu Tyr Gln Leu Tyr Gln Pro Leu Glu 35 40 45 Ala Cys Asp Asn Lys Cys Tyr Cys Lys Lys Cys Cys Tyr His Cys Gln 50 55 60 Met Cys Phe Leu Asn Lys Gly Leu Gly Ile Trp Tyr Glu Arg Lys Gly 65 70 75 80 Arg Arg Arg Arg Thr Pro Lys Lys Thr Lys Ala His Ser Ser Ser Ala 85 90 95 Ser Asp Lys Ser Ile Ser Thr Arg Thr Gly Asn Ser Gln Pro Glu Lys 100 105 110 Lys Gln Lys Lys Thr Leu Glu Thr Ala Leu Glu Thr Ile Gly Gly Pro 115 120 125 Gly Arg 130 <210> 83 <211> 103 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 83 Met Pro Gly Pro Trp Val Ala Met Ile Met Leu Pro Gln Pro Lys Glu 1 5 10 15 Ser Phe Gly Gly Lys Pro Ile Gly Trp Leu Phe Trp Asn Thr Cys Lys 20 25 30 Gly Pro Arg Arg Asp Cys Pro His Cys Cys Cys Pro Ile Cys Ser Trp 35 40 45 His Cys Gln Leu Cys Phe Leu Gln Lys Asn Leu Gly Ile Asn Tyr Gly 50 55 60 Ser Gly Pro Arg Arg Arg Gly Thr Arg Gly Lys Gly Arg Arg Ile Arg 65 70 75 80 Arg Thr Ala Ser Gly Gly Asp Gln Arg Arg Glu Ala Asp Ser Gln Arg 85 90 95 Ser Phe Thr Asn Met Asp Gln 100 <210> 84 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 84 Ser Gly Pro Arg Pro Arg Gly Thr Arg Gly Lys Gly Arg Arg Ile Arg 1 5 10 15 Arg <210> 85 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Polynucleotide <400> 85 gggcccggag accagacgag ccgggagccc ggcaacaggg aacccacg 48 <210> 86 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Polynucleotide <400> 86 gggcccggag accagacgag ccgggccggc aacagggaac ccacg 45 <210> 87 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Polynucleotide <400> 87 gggcccggag accagacgag ccgggagccc ggcaacaggg aacc 44 <210> 88 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Polynucleotide <400> 88 agacgagccg ggagccc 17 <210> 89 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Polynucleotide <400> 89 gccggagccg ggaagcccga gc 22 <210> 90 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Polynucleotide <400> 90 cggagccaag cccga 15 <210> 91 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Polynucleotide <400> 91 ggcgggcgca gcgcaagcga cggacaggcc 30 <210> 92 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 92 ggcggaccga ccggacggag aaacagcc 28 <210> 93 <211> 116 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 93 Met Ala Gly Arg Ser Gly Asp Ser Asp Glu Glu Leu Ile Arg Thr Val 1 5 10 15 Arg Leu Ile Lys Leu Leu Tyr Gln Ser Asn Pro Pro Pro Asn Pro Glu 20 25 30 Gly Thr Arg Gln Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Glu Arg 35 40 45 Gln Arg Gln Ile His Ser Ile Ser Glu Arg Ile Leu Gly Thr Tyr Leu 50 55 60 Gly Arg Ser Ala Glu Pro Val Pro Leu Gln Leu Pro Pro Leu Glu Arg 65 70 75 80 Leu Thr Leu Asp Cys Asn Glu Asp Cys Gly Thr Ser Gly Thr Gln Gly 85 90 95 Val Gly Ser Pro Gln Ile Leu Val Glu Ser Pro Thr Val Leu Glu Ser 100 105 110 Gly Thr Lys Glu 115 <210> 94 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 94 Thr Arg Gln Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Glu Arg Gln 1 5 10 15 Arg <210> 95 <211> 23 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 95 Arg Asp Arg Arg Arg Arg Gly Ser Arg Pro Ser Gly Ala Glu Arg Arg 1 5 10 15 Arg Arg Arg Ala Ala Ala Ala 20 <210> 96 <211> 19 <212> RNA <213> Artificial Sequence <220> <223> Synthetic Polynucleotide <400> 96 acaugaggau uacccaugu 19 <210> 97 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Synthetic Polynucleotide <400> 97 ccggaggauc accacggg 18 <210> 98 <211> 14 <212> RNA <213> Artificial Sequence <220> <223> Synthetic Polynucleotide <400> 98 ccacagucac uggg 14 <210> 99 <211> 129 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 99 Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Gly Thr Gly 1 5 10 15 Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu Trp 20 25 30 Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser Val 35 40 45 Arg Gln Ser Ser Ala Gln Asn Arg Lys Tyr Thr Ile Lys Val Glu Val 50 55 60 Pro Lys Val Ala Thr Gln Thr Val Gly Gly Val Glu Leu Pro Val Ala 65 70 75 80 Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile Pro Ile Phe Ala 85 90 95 Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu Leu 100 105 110 Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly Ile 115 120 125 Tyr <210> 100 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 100 Asn Ala Lys Thr Arg Arg His Glu Arg Arg Arg Lys Leu Ala Ile Glu 1 5 10 15 Arg Asp Thr Ile 20 <210> 101 <211> 24 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 101 Gly Ser Met Asp Ala Gln Thr Arg Arg Arg Glu Arg Arg Ala Glu Lys 1 5 10 15 Gln Ala Gln Trp Lys Ala Ala Asn 20 <210> 102 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 102 Gly Thr Ala Lys Ser Arg Tyr Lys Ala Arg Arg Ala Glu Leu Ile Ala 1 5 10 15 Glu Arg Arg <210> 103 <211> 55 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 103 Met Gln Lys Gly Asn Phe Arg Asn Gln Arg Lys Thr Val Lys Cys Phe 1 5 10 15 Asn Cys Gly Lys Glu Gly His Ile Ala Lys Asn Cys Arg Ala Pro Arg 20 25 30 Lys Lys Gly Cys Trp Lys Cys Gly Lys Glu Gly His Gln Met Lys Asp 35 40 45 Cys Thr Glu Arg Gln Ala Asn 50 55 <210> 104 <211> 15 <212> RNA <213> Artificial Sequence <220> <223> Synthetic Polynucleotide <400> 104 gcgcugacaa agcgc 15 <210> 105 <211> 19 <212> RNA <213> Artificial Sequence <220> <223> Synthetic Polynucleotide <400> 105 gggcccugaa gaagggccc 19 <210> 106 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Synthetic Polynucleotide <400> 106 ucucaaccua accguugaga 20 <210> 107 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Synthetic Polynucleotide <400> 107 ggacuagcgg aggcuagucc 20 <210> 108 <211> 4104 <212> DNA <213> Streptococcus pyogenes <400> 108 atggataaga aatactcaat aggcttagat atcggcacaa atagcgtcgg atgggcggtg 60 atcactgatg attataaggt tccgtctaaa aagttcaagg ttctgggaaa tacagaccgc 120 cacagtatca aaaaaaatct tataggggct cttttatttg gcagtggaga gacagcggaa 180 gcgactcgtc tcaaacggac agctcgtaga aggtatacac gtcggaagaa tcgtatttgt 240 tatctacagg agattttttc aaatgagatg gcgaaagtag atgatagttt ctttcatcga 300 cttgaagagt cttttttggt ggaagaagac aagaagcatg aacgtcatcc tatttttgga 360 aatatagtag atgaagttgc ttatcatgag aaatatccaa ctatctatca tctgcgaaaa 420 aaattggcag attctactga taaagcggat ttgcgcttaa tctatttggc cttagcgcat 480 atgattaagt ttcgtggtca ttttttgatt gagggagatt taaatcctga taatagtgat 540 gtggacaaac tatttatcca gttggtacaa atctacaatc aattatttga agaaaaccct 600 attaacgcaa gtagagtaga tgctaaagcg attctttctg cacgattgag taaatcaaga 660 cgattagaaa atctcattgc tcagctcccc ggtgagaaga gaaatggctt gtttgggaat 720 ctcattgctt tgtcattggg attgacccct aattttaaat caaattttga tttggcagaa 780 gatgctaaat tacagctttc aaaagatact tacgatgatg atttagataa tttattggcg 840 caaattggag atcaatatgc tgatttgttt ttggcagcta agaatttatc agatgctatt 900 ttactttcag atatcctaag agtaaatagt gaaataacta aggctcccct atcagcttca 960 atgattaagc gctacgatga acatcatcaa gacttgactc ttttaaaagc tttagttcga 1020 caacaacttc cagaaaagta taaagaaatc ttttttgatc aatcaaaaaa cggatatgca 1080 ggttatattg atgggggagc tagccaagaa gaattttata aatttatcaa accaatttta 1140 gaaaaaatgg atggtactga ggaattattg gtgaaactaa atcgtgaaga tttgctgcgc 1200 aagcaacgga cctttgacaa cggctctatt ccccatcaaa ttcacttggg tgagctgcat 1260 gctattttga gaagacaaga agacttttat ccatttttaa aagacaatcg tgagaagatt 1320 gaaaaaatct tgacttttcg aattccttat tatgttggtc cattggcgcg tggcaatagt 1380 cgttttgcat ggatgactcg gaagtctgaa gaaacaatta ccccatggaa ttttgaagaa 1440 gttgtcgata aaggtgcttc agctcaatca tttattgaac gcatgacaaa ctttgataaa 1500 aatcttccaa atgaaaaagt actaccaaaa catagtttgc tttatgagta ttttacggtt 1560 tataacgaat tgacaaaggt caaatatgtt actgagggaa tgcgaaaacc agcatttctt 1620 tcaggtgaac agaagaaagc cattgttgat ttactcttca aaacaaatcg aaaagtaacc 1680 gttaagcaat taaaagaaga ttatttcaaa aaaatagaat gttttgatag tgttgaaatt 1740 tcaggagttg aagatagatt taatgcttca ttaggcgcct accatgattt gctaaaaatt 1800 attaaagata aagatttttt ggataatgaa gaaaatgaag atatcttaga ggatattgtt 1860 ttaacattga ccttatttga agataggggg atgattgagg aaagacttaa aacatatgct 1920 cacctctttg atgataaggt gatgaaacag cttaaacgtc gccgttatac tggttgggga 1980 cgtttgtctc gaaaattgat taatggtatt agggataagc aatctggcaa aacaatatta 2040 gattttttga aatcagatgg ttttgccaat cgcaatttta tgcagctgat ccatgatgat 2100 agtttgacat ttaaagaaga tattcaaaaa gcacaggtgt ctggacaagg ccatagttta 2160 catgaacaga ttgctaactt agctggcagt cctgctatta aaaaaggtat tttacagact 2220 gtaaaaattg ttgatgaact ggtcaaagta atggggcata agccagaaaa tatcgttatt 2280 gaaatggcac gtgaaaatca gacaactcaa aagggccaga aaaattcgcg agagcgtatg 2340 aaacgaatcg aagaaggtat caaagaatta ggaagtcaga ttcttaaaga gcatcctgtt 2400 gaaaatactc aattgcaaaa tgaaaagctc tatctctatt atctacaaaa tggaagagac 2460 atgtatgtgg accaagaatt agatattaat cgtttaagtg attatgatgt cgatcacatt 2520 gttccacaaa gtttcattaa agacgattca atagacaata aggtactaac gcgttctgat 2580 aaaaatcgtg gtaaatcgga taacgttcca agtgaagaag tagtcaaaaa gatgaaaaac 2640 tattggagac aacttctaaa cgccaagtta atcactcaac gtaagtttga taatttaacg 2700 aaagctgaac gtggaggttt gagtgaactt gataaagctg gttttatcaa acgccaattg 2760 gttgaaactc gccaaatcac taagcatgtg gcacaaattt tggatagtcg catgaatact 2820 aaatacgatg aaaatgataa acttattcga gaggttaaag tgattacctt aaaatctaaa 2880 ttagtttctg acttccgaaa agatttccaa ttctataaag tacgtgagat taacaattac 2940 catcatgccc atgatgcgta tctaaatgcc gtcgttggaa ctgctttgat taagaaatat 3000 ccaaaacttg aatcggagtt tgtctatggt gattataaag tttatgatgt tcgtaaaatg 3060 attgctaagt ctgagcaaga aataggcaaa gcaaccgcaa aatatttctt ttactctaat 3120 atcatgaact tcttcaaaac agaaattaca cttgcaaatg gagagattcg caaacgccct 3180 ctaatcgaaa ctaatgggga aactggagaa attgtctggg ataaagggcg agattttgcc 3240 acagtgcgca aagtattgtc catgccccaa gtcaatattg tcaagaaaac agaagtacag 3300 acaggcggat tctccaagga gtcaatttta ccaaaaagaa attcggacaa gcttattgct 3360 cgtaaaaaag actgggatcc aaaaaaatat ggtggttttg atagtccaac ggtagcttat 3420 tcagtcctag tggttgctaa ggtggaaaaa gggaaatcga agaagttaaa atccgttaaa 3480 gagttactag ggatcacaat tatggaaaga agttcctttg aaaaaaatcc gattgacttt 3540 ttagaagcta aaggatataa ggaagttaaa aaagacttaa tcattaaact acctaaatat 3600 agtctttttg agttagaaaa cggtcgtaaa cggatgctgg ctagtgccgg agaattacaa 3660 aaaggaaatg agctggctct gccaagcaaa tatgtgaatt ttttatattt agctagtcat 3720 tatgaaaagt tgaagggtag tccagaagat aacgaacaaa aacaattgtt tgtggagcag 3780 cataagcatt atttagatga gattattgag caaatcagtg aattttctaa gcgtgttatt 3840 ttagcagatg ccaatttaga taaagttctt agtgcatata acaaacatag agacaaacca 3900 atacgtgaac aagcagaaaa tattattcat ttatttacgt tgacgaatct tggagctccc 3960 gctgctttta aatattttga tacaacaatt gatcgtaaac gatatacgtc tacaaaagaa 4020 gttttagatg ccactcttat ccatcaatcc atcactggtc tttatgaaac acgcattgat 4080 ttgagtcagc taggaggtga ctga 4104 <210> 109 <211> 1493 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 109 Met Pro Leu Pro Pro Gly Trp Glu Gln Arg Val Asp Gln His Gly Arg 1 5 10 15 Val Tyr Tyr Val Asp His Val Glu Lys Arg Thr Thr Trp Asp Arg Pro 20 25 30 Glu Pro Leu Pro Pro Gly Trp Glu Arg Arg Val Asp Asn Met Gly Arg 35 40 45 Ile Tyr Tyr Val Asp His Phe Thr Arg Thr Thr Thr Trp Gln Arg Pro 50 55 60 Thr Leu Thr Gly Ala Thr Met Asp Tyr Lys Asp His Asp Gly Asp Tyr 65 70 75 80 Lys Asp His Asp Ile Asp Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro 85 90 95 Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala Ala Asp Lys 100 105 110 Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val Gly Trp Ala 115 120 125 Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu 130 135 140 Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu 145 150 155 160 Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr 165 170 175 Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln 180 185 190 Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His 195 200 205 Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg 210 215 220 His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys 225 230 235 240 Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp 245 250 255 Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys 260 265 270 Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser 275 280 285 Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu 290 295 300 Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile 305 310 315 320 Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala 325 330 335 Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala 340 345 350 Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala 355 360 365 Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu 370 375 380 Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu 385 390 395 400 Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg 405 410 415 Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys 420 425 430 Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val 435 440 445 Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser 450 455 460 Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu 465 470 475 480 Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu 485 490 495 Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg 500 505 510 Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu 515 520 525 His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp 530 535 540 Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr 545 550 555 560 Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg 565 570 575 Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp 580 585 590 Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp 595 600 605 Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr 610 615 620 Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr 625 630 635 640 Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala 645 650 655 Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln 660 665 670 Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu 675 680 685 Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His 690 695 700 Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu 705 710 715 720 Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu 725 730 735 Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe 740 745 750 Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp 755 760 765 Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser 770 775 780 Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg 785 790 795 800 Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp 805 810 815 Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His 820 825 830 Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln 835 840 845 Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys 850 855 860 Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln 865 870 875 880 Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly 885 890 895 Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn 900 905 910 Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly 915 920 925 Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp 930 935 940 Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser 945 950 955 960 Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser 965 970 975 Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp 980 985 990 Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn 995 1000 1005 Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala 1010 1015 1020 Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys 1025 1030 1035 His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 1040 1045 1050 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys 1055 1060 1065 Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys 1070 1075 1080 Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu 1085 1090 1095 Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu 1100 1105 1110 Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg 1115 1120 1125 Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala 1130 1135 1140 Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu 1145 1150 1155 Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu 1160 1165 1170 Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp 1175 1180 1185 Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile 1190 1195 1200 Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser 1205 1210 1215 Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys 1220 1225 1230 Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val 1235 1240 1245 Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser 1250 1255 1260 Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met 1265 1270 1275 Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala 1280 1285 1290 Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro 1295 1300 1305 Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu 1310 1315 1320 Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro 1325 1330 1335 Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys 1340 1345 1350 Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val 1355 1360 1365 Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser 1370 1375 1380 Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys 1385 1390 1395 Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu 1400 1405 1410 Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly 1415 1420 1425 Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys 1430 1435 1440 Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His 1445 1450 1455 Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln 1460 1465 1470 Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln 1475 1480 1485 Ala Lys Lys Lys Lys 1490 <210> 110 <211> 1616 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 110 Met Pro Leu Pro Pro Gly Trp Glu Gln Arg Val Asp Gln His Gly Arg 1 5 10 15 Val Tyr Tyr Val Asp His Val Glu Lys Arg Thr Thr Trp Asp Arg Pro 20 25 30 Glu Pro Leu Pro Pro Gly Trp Glu Arg Arg Val Asp Asn Met Gly Arg 35 40 45 Ile Tyr Tyr Val Asp His Phe Thr Arg Thr Thr Thr Trp Gln Arg Pro 50 55 60 Thr Leu Glu Ser Val Arg Asn Tyr Glu Gln Trp Gln Leu Gln Arg Ser 65 70 75 80 Gln Leu Gln Gly Ala Met Gln Gln Phe Asn Gln Arg Phe Ile Tyr Gly 85 90 95 Asn Gln Asp Leu Phe Ala Thr Ser Gln Ser Lys Glu Phe Asp Pro Leu 100 105 110 Gly Pro Leu Pro Pro Gly Trp Glu Lys Arg Thr Asp Ser Asn Gly Arg 115 120 125 Val Tyr Phe Val Asn His Asn Thr Arg Ile Thr Gln Trp Glu Asp Pro 130 135 140 Arg Ser Gln Gly Gln Leu Asn Glu Lys Pro Leu Pro Glu Gly Trp Glu 145 150 155 160 Met Arg Phe Thr Val Asp Gly Ile Pro Tyr Phe Val Asp His Asn Arg 165 170 175 Arg Thr Thr Thr Tyr Ile Asp Pro Arg Thr Gly Gly Gly Thr Gly Ala 180 185 190 Thr Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile 195 200 205 Asp Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys 210 215 220 Val Gly Ile His Gly Val Pro Ala Ala Asp Lys Lys Tyr Ser Ile Gly 225 230 235 240 Leu Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu 245 250 255 Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg 260 265 270 His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly 275 280 285 Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr 290 295 300 Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn 305 310 315 320 Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser 325 330 335 Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly 340 345 350 Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr 355 360 365 His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg 370 375 380 Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe 385 390 395 400 Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu 405 410 415 Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro 420 425 430 Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu 435 440 445 Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu 450 455 460 Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu 465 470 475 480 Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu 485 490 495 Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala 500 505 510 Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu 515 520 525 Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile 530 535 540 Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His 545 550 555 560 His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro 565 570 575 Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala 580 585 590 Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile 595 600 605 Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys 610 615 620 Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly 625 630 635 640 Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg 645 650 655 Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile 660 665 670 Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala 675 680 685 Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr 690 695 700 Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala 705 710 715 720 Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn 725 730 735 Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val 740 745 750 Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys 755 760 765 Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu 770 775 780 Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr 785 790 795 800 Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu 805 810 815 Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile 820 825 830 Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu 835 840 845 Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile 850 855 860 Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met 865 870 875 880 Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg 885 890 895 Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu 900 905 910 Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu 915 920 925 Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln 930 935 940 Val Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala 945 950 955 960 Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val 965 970 975 Asp Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val 980 985 990 Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn 995 1000 1005 Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu 1010 1015 1020 Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu 1025 1030 1035 Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp 1040 1045 1050 Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr 1055 1060 1065 Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser 1070 1075 1080 Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys 1085 1090 1095 Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn 1100 1105 1110 Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 1115 1120 1125 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu 1130 1135 1140 Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln 1145 1150 1155 Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr 1160 1165 1170 Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile 1175 1180 1185 Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln 1190 1195 1200 Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp 1205 1210 1215 Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr 1220 1225 1230 Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr 1235 1240 1245 Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys 1250 1255 1260 Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe 1265 1270 1275 Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro 1280 1285 1290 Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys 1295 1300 1305 Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln 1310 1315 1320 Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser 1325 1330 1335 Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala 1340 1345 1350 Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser 1355 1360 1365 Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys 1370 1375 1380 Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile 1385 1390 1395 Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe 1400 1405 1410 Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile 1415 1420 1425 Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys 1430 1435 1440 Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu 1445 1450 1455 Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His 1460 1465 1470 Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln 1475 1480 1485 Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu 1490 1495 1500 Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn 1505 1510 1515 Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro 1520 1525 1530 Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr 1535 1540 1545 Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile 1550 1555 1560 Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr 1565 1570 1575 Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp 1580 1585 1590 Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr Lys Lys 1595 1600 1605 Ala Gly Gln Ala Lys Lys Lys Lys 1610 1615 <210> 111 <211> 4479 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Polynucleotide <400> 111 atgcccttgc cacctggttg ggagcagaga gtggaccagc acgggcgagt ttactatgta 60 gatcatgttg agaaaagaac aacatgggat agaccagaac ctctacctcc tggctgggaa 120 cggcgggttg acaacatggg acgtatttat tatgttgacc atttcacaag aacaacaacg 180 tggcagaggc caacactgac cggtgccacc atggactata aggaccacga cggagactac 240 aaggatcatg atattgatta caaagacgat gacgataaga tggccccaaa gaagaagcgg 300 aaggtcggta tccacggagt cccagcagcc gacaagaagt acagcatcgg cctggacatc 360 ggcaccaact ctgtgggctg ggccgtgatc accgacgagt acaaggtgcc cagcaagaaa 420 ttcaaggtgc tgggcaacac cgaccggcac agcatcaaga agaacctgat cggagccctg 480 ctgttcgaca gcggcgaaac agccgaggcc acccggctga agagaaccgc cagaagaaga 540 tacaccagac ggaagaaccg gatctgctat ctgcaagaga tcttcagcaa cgagatggcc 600 aaggtggacg acagcttctt ccacagactg gaagagtcct tcctggtgga agaggataag 660 aagcacgagc ggcaccccat cttcggcaac atcgtggacg aggtggccta ccacgagaag 720 taccccacca tctaccacct gagaaagaaa ctggtggaca gcaccgacaa ggccgacctg 780 cggctgatct atctggccct ggcccacatg atcaagttcc ggggccactt cctgatcgag 840 ggcgacctga accccgacaa cagcgacgtg gacaagctgt tcatccagct ggtgcagacc 900 tacaaccagc tgttcgagga aaaccccatc aacgccagcg gcgtggacgc caaggccatc 960 ctgtctgcca gactgagcaa gagcagacgg ctggaaaatc tgatcgccca gctgcccggc 1020 gagaagaaga atggcctgtt cggaaacctg attgccctga gcctgggcct gacccccaac 1080 ttcaagagca acttcgacct ggccgaggat gccaaactgc agctgagcaa ggacacctac 1140 gacgacgacc tggacaacct gctggcccag atcggcgacc agtacgccga cctgtttctg 1200 gccgccaaga acctgtccga cgccatcctg ctgagcgaca tcctgagagt gaacaccgag 1260 atcaccaagg cccccctgag cgcctctatg atcaagagat acgacgagca ccaccaggac 1320 ctgaccctgc tgaaagctct cgtgcggcag cagctgcctg agaagtacaa agagattttc 1380 ttcgaccaga gcaagaacgg ctacgccggc tacattgacg gcggagccag ccaggaagag 1440 ttctacaagt tcatcaagcc catcctggaa aagatggacg gcaccgagga actgctcgtg 1500 aagctgaaca gagaggacct gctgcggaag cagcggacct tcgacaacgg cagcatcccc 1560 caccagatcc acctgggaga gctgcacgcc attctgcggc ggcaggaaga tttttaccca 1620 ttcctgaagg acaaccggga aaagatcgag aagatcctga ccttccgcat cccctactac 1680 gtgggccctc tggccagggg aaacagcaga ttcgcctgga tgaccagaaa gagcgaggaa 1740 accatcaccc cctggaactt cgaggaagtg gtggacaagg gcgcttccgc ccagagcttc 1800 atcgagcgga tgaccaactt cgataagaac ctgcccaacg agaaggtgct gcccaagcac 1860 agcctgctgt acgagtactt caccgtgtat aacgagctga ccaaagtgaa atacgtgacc 1920 gagggaatga gaaagcccgc cttcctgagc ggcgagcaga aaaaggccat cgtggacctg 1980 ctgttcaaga ccaaccggaa agtgaccgtg aagcagctga aagaggacta cttcaagaaa 2040 atcgagtgct tcgactccgt ggaaatctcc ggcgtggaag atcggttcaa cgcctccctg 2100 ggcacatacc acgatctgct gaaaattatc aaggacaagg acttcctgga caatgaggaa 2160 aacgaggaca ttctggaaga tatcgtgctg accctgacac tgtttgagga cagagagatg 2220 atcgaggaac ggctgaaaac ctatgcccac ctgttcgacg acaaagtgat gaagcagctg 2280 aagcggcgga gatacaccgg ctggggcagg ctgagccgga agctgatcaa cggcatccgg 2340 gacaagcagt ccggcaagac aatcctggat ttcctgaagt ccgacggctt cgccaacaga 2400 aacttcatgc agctgatcca cgacgacagc ctgaccttta aagaggacat ccagaaagcc 2460 caggtgtccg gccagggcga tagcctgcac gagcacattg ccaatctggc cggcagcccc 2520 gccattaaga agggcatcct gcagacagtg aaggtggtgg acgagctcgt gaaagtgatg 2580 ggccggcaca agcccgagaa catcgtgatc gaaatggcca gagagaacca gaccacccag 2640 aagggacaga agaacagccg cgagagaatg aagcggatcg aagagggcat caaagagctg 2700 ggcagccaga tcctgaaaga acaccccgtg gaaaacaccc agctgcagaa cgagaagctg 2760 tacctgtact acctgcagaa tgggcgggat atgtacgtgg accaggaact ggacatcaac 2820 cggctgtccg actacgatgt ggaccatatc gtgcctcaga gctttctgaa ggacgactcc 2880 atcgacaaca aggtgctgac cagaagcgac aagaaccggg gcaagagcga caacgtgccc 2940 tccgaagagg tcgtgaagaa gatgaagaac tactggcggc agctgctgaa cgccaagctg 3000 attacccaga gaaagttcga caatctgacc aaggccgaga gaggcggcct gagcgaactg 3060 gataaggccg gcttcatcaa gagacagctg gtggaaaccc ggcagatcac aaagcacgtg 3120 gcacagatcc tggactcccg gatgaacact aagtacgacg agaatgacaa gctgatccgg 3180 gaagtgaaag tgatcaccct gaagtccaag ctggtgtccg atttccggaa ggatttccag 3240 ttttacaaag tgcgcgagat caacaactac caccacgccc acgacgccta cctgaacgcc 3300 gtcgtgggaa ccgccctgat caaaaagtac cctaagctgg aaagcgagtt cgtgtacggc 3360 gactacaagg tgtacgacgt gcggaagatg atcgccaaga gcgagcagga aatcggcaag 3420 gctaccgcca agtacttctt ctacagcaac atcatgaact ttttcaagac cgagattacc 3480 ctggccaacg gcgagatccg gaagcggcct ctgatcgaga caaacggcga aaccggggag 3540 atcgtgtggg ataagggccg ggattttgcc accgtgcgga aagtgctgag catgccccaa 3600 gtgaatatcg tgaaaaagac cgaggtgcag acaggcggct tcagcaaaga gtctatcctg 3660 cccaagagga acagcgataa gctgatcgcc agaaagaagg actgggaccc taagaagtac 3720 ggcggcttcg acagccccac cgtggcctat tctgtgctgg tggtggccaa agtggaaaag 3780 ggcaagtcca agaaactgaa gagtgtgaaa gagctgctgg ggatcaccat catggaaaga 3840 agcagcttcg agaagaatcc catcgacttt ctggaagcca agggctacaa agaagtgaaa 3900 aaggacctga tcatcaagct gcctaagtac tccctgttcg agctggaaaa cggccggaag 3960 agaatgctgg cctctgccgg cgaactgcag aagggaaacg aactggccct gccctccaaa 4020 tatgtgaact tcctgtacct ggccagccac tatgagaagc tgaagggctc ccccgaggat 4080 aatgagcaga aacagctgtt tgtggaacag cacaagcact acctggacga gatcatcgag 4140 cagatcagcg agttctccaa gagagtgatc ctggccgacg ctaatctgga caaagtgctg 4200 tccgcctaca acaagcaccg ggataagccc atcagagagc aggccgagaa tatcatccac 4260 ctgtttaccc tgaccaatct gggagcccct gccgccttca agtactttga caccaccatc 4320 gaccggaaga ggtacaccag caccaaagag gtgctggacg ccaccctgat ccaccagagc 4380 atcaccggcc tgtacgagac acggatcgac ctgtctcagc tgggaggcga caaaaggccg 4440 gcggccacga aaaaggccgg ccaggcaaaa aagaaaaag 4479 <210> 112 <211> 4848 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Polynucleotide <400> 112 atgcccttgc cacctggttg ggagcagaga gtggaccagc acgggcgagt ttactatgta 60 gatcatgttg agaaaagaac aacatgggat agaccagaac ctctacctcc tggctgggaa 120 cggcgggttg acaacatggg acgtatttat tatgttgacc atttcacaag aacaacaacg 180 tggcagaggc caacactgga atccgtccgg aactatgaac aatggcagct acagcgtagt 240 cagcttcaag gagcaatgca gcagtttaac cagagattca tttatgggaa tcaagattta 300 tttgctacat cacaaagtaa agaatttgat cctcttggtc cattgccacc tggatgggag 360 aagagaacag acagcaatgg cagagtatat ttcgtcaacc acaacacacg aattacacaa 420 tgggaagacc ccagaagtca aggtcaatta aatgaaaagc ccttacctga aggttgggaa 480 atgagattca cagtggatgg aattccatat tttgtggacc acaatagaag aactaccacc 540 tatatagatc cccgcacagg cggaggaacc ggtgccacca tggactataa ggaccacgac 600 ggagactaca aggatcatga tattgattac aaagacgatg acgataagat ggccccaaag 660 aagaagcgga aggtcggtat ccacggagtc ccagcagccg acaagaagta cagcatcggc 720 ctggacatcg gcaccaactc tgtgggctgg gccgtgatca ccgacgagta caaggtgccc 780 agcaagaaat tcaaggtgct gggcaacacc gaccggcaca gcatcaagaa gaacctgatc 840 ggagccctgc tgttcgacag cggcgaaaca gccgaggcca cccggctgaa gagaaccgcc 900 agaagaagat acaccagacg gaagaaccgg atctgctatc tgcaagagat cttcagcaac 960 gagatggcca aggtggacga cagcttcttc cacagactgg aagagtcctt cctggtggaa 1020 gaggataaga agcacgagcg gcaccccatc ttcggcaaca tcgtggacga ggtggcctac 1080 cacgagaagt accccaccat ctaccacctg agaaagaaac tggtggacag caccgacaag 1140 gccgacctgc ggctgatcta tctggccctg gcccacatga tcaagttccg gggccacttc 1200 ctgatcgagg gcgacctgaa ccccgacaac agcgacgtgg acaagctgtt catccagctg 1260 gtgcagacct acaaccagct gttcgaggaa aaccccatca acgccagcgg cgtggacgcc 1320 aaggccatcc tgtctgccag actgagcaag agcagacggc tggaaaatct gatcgcccag 1380 ctgcccggcg agaagaagaa tggcctgttc ggaaacctga ttgccctgag cctgggcctg 1440 acccccaact tcaagagcaa cttcgacctg gccgaggatg ccaaactgca gctgagcaag 1500 gacacctacg acgacgacct ggacaacctg ctggcccaga tcggcgacca gtacgccgac 1560 ctgtttctgg ccgccaagaa cctgtccgac gccatcctgc tgagcgacat cctgagagtg 1620 aacaccgaga tcaccaaggc ccccctgagc gcctctatga tcaagagata cgacgagcac 1680 caccaggacc tgaccctgct gaaagctctc gtgcggcagc agctgcctga gaagtacaaa 1740 gagattttct tcgaccagag caagaacggc tacgccggct acattgacgg cggagccagc 1800 caggaagagt tctacaagtt catcaagccc atcctggaaa agatggacgg caccgaggaa 1860 ctgctcgtga agctgaacag agaggacctg ctgcggaagc agcggacctt cgacaacggc 1920 agcatccccc accagatcca cctgggagag ctgcacgcca ttctgcggcg gcaggaagat 1980 ttttacccat tcctgaagga caaccgggaa aagatcgaga agatcctgac cttccgcatc 2040 ccctactacg tgggccctct ggccagggga aacagcagat tcgcctggat gaccagaaag 2100 agcgaggaaa ccatcacccc ctggaacttc gaggaagtgg tggacaaggg cgcttccgcc 2160 cagagcttca tcgagcggat gaccaacttc gataagaacc tgcccaacga gaaggtgctg 2220 cccaagcaca gcctgctgta cgagtacttc accgtgtata acgagctgac caaagtgaaa 2280 tacgtgaccg agggaatgag aaagcccgcc ttcctgagcg gcgagcagaa aaaggccatc 2340 gtggacctgc tgttcaagac caaccggaaa gtgaccgtga agcagctgaa agaggactac 2400 ttcaagaaaa tcgagtgctt cgactccgtg gaaatctccg gcgtggaaga tcggttcaac 2460 gcctccctgg gcacatacca cgatctgctg aaaattatca aggacaagga cttcctggac 2520 aatgaggaaa acgaggacat tctggaagat atcgtgctga ccctgacact gtttgaggac 2580 agagagatga tcgaggaacg gctgaaaacc tatgcccacc tgttcgacga caaagtgatg 2640 aagcagctga agcggcggag atacaccggc tggggcaggc tgagccggaa gctgatcaac 2700 ggcatccggg acaagcagtc cggcaagaca atcctggatt tcctgaagtc cgacggcttc 2760 gccaacagaa acttcatgca gctgatccac gacgacagcc tgacctttaa agaggacatc 2820 cagaaagccc aggtgtccgg ccagggcgat agcctgcacg agcacattgc caatctggcc 2880 ggcagccccg ccattaagaa gggcatcctg cagacagtga aggtggtgga cgagctcgtg 2940 aaagtgatgg gccggcacaa gcccgagaac atcgtgatcg aaatggccag agagaaccag 3000 accacccaga agggacagaa gaacagccgc gagagaatga agcggatcga agagggcatc 3060 aaagagctgg gcagccagat cctgaaagaa caccccgtgg aaaacaccca gctgcagaac 3120 gagaagctgt acctgtacta cctgcagaat gggcgggata tgtacgtgga ccaggaactg 3180 gacatcaacc ggctgtccga ctacgatgtg gaccatatcg tgcctcagag ctttctgaag 3240 gacgactcca tcgacaacaa ggtgctgacc agaagcgaca agaaccgggg caagagcgac 3300 aacgtgccct ccgaagaggt cgtgaagaag atgaagaact actggcggca gctgctgaac 3360 gccaagctga ttacccagag aaagttcgac aatctgacca aggccgagag aggcggcctg 3420 agcgaactgg ataaggccgg cttcatcaag agacagctgg tggaaacccg gcagatcaca 3480 aagcacgtgg cacagatcct ggactcccgg atgaacacta agtacgacga gaatgacaag 3540 ctgatccggg aagtgaaagt gatcaccctg aagtccaagc tggtgtccga tttccggaag 3600 gatttccagt tttacaaagt gcgcgagatc aacaactacc accacgccca cgacgcctac 3660 ctgaacgccg tcgtgggaac cgccctgatc aaaaagtacc ctaagctgga aagcgagttc 3720 gtgtacggcg actacaaggt gtacgacgtg cggaagatga tcgccaagag cgagcaggaa 3780 atcggcaagg ctaccgccaa gtacttcttc tacagcaaca tcatgaactt tttcaagacc 3840 gagattaccc tggccaacgg cgagatccgg aagcggcctc tgatcgagac aaacggcgaa 3900 accggggaga tcgtgtggga taagggccgg gattttgcca ccgtgcggaa agtgctgagc 3960 atgccccaag tgaatatcgt gaaaaagacc gaggtgcaga caggcggctt cagcaaagag 4020 tctatcctgc ccaagaggaa cagcgataag ctgatcgcca gaaagaagga ctgggaccct 4080 aagaagtacg gcggcttcga cagccccacc gtggcctatt ctgtgctggt ggtggccaaa 4140 gtggaaaagg gcaagtccaa gaaactgaag agtgtgaaag agctgctggg gatcaccatc 4200 atggaaagaa gcagcttcga gaagaatccc atcgactttc tggaagccaa gggctacaaa 4260 gaagtgaaaa aggacctgat catcaagctg cctaagtact ccctgttcga gctggaaaac 4320 ggccggaaga gaatgctggc ctctgccggc gaactgcaga agggaaacga actggccctg 4380 ccctccaaat atgtgaactt cctgtacctg gccagccact atgagaagct gaagggctcc 4440 cccgaggata atgagcagaa acagctgttt gtggaacagc acaagcacta cctggacgag 4500 atcatcgagc agatcagcga gttctccaag agagtgatcc tggccgacgc taatctggac 4560 aaagtgctgt ccgcctacaa caagcaccgg gataagccca tcagagagca ggccgagaat 4620 atcatccacc tgtttaccct gaccaatctg ggagcccctg ccgccttcaa gtactttgac 4680 accaccatcg accggaagag gtacaccagc accaaagagg tgctggacgc caccctgatc 4740 caccagagca tcaccggcct gtacgagaca cggatcgacc tgtctcagct gggaggcgac 4800 aaaaggccgg cggccacgaa aaaggccggc caggcaaaaa agaaaaag 4848 <210> 113 <211> 717 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Polynucleotide <400> 113 atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60 ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120 ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180 ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240 cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300 ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360 gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420 aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480 ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540 gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600 tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660 ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaag 717 <210> 114 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 114 Ala Gly Val Phe 1 <210> 115 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 115 Pro Pro Ser Tyr 1 <210> 116 <211> 433 <212> PRT <213> Homo Sapiens <400> 116 Met Gly Arg Val Gln Leu Phe Glu Ile Ser Leu Ser His Gly Arg Val 1 5 10 15 Val Tyr Ser Pro Gly Glu Pro Leu Ala Gly Thr Val Arg Val Arg Leu 20 25 30 Gly Ala Pro Leu Pro Phe Arg Ala Ile Arg Val Thr Cys Ile Gly Ser 35 40 45 Cys Gly Val Ser Asn Lys Ala Asn Asp Thr Ala Trp Val Val Glu Glu 50 55 60 Gly Tyr Phe Asn Ser Ser Leu Ser Leu Ala Asp Lys Gly Ser Leu Pro 65 70 75 80 Ala Gly Glu His Ser Phe Pro Phe Gln Phe Leu Leu Pro Ala Thr Ala 85 90 95 Pro Thr Ser Phe Glu Gly Pro Phe Gly Lys Ile Val His Gln Val Arg 100 105 110 Ala Ala Ile His Thr Pro Arg Phe Ser Lys Asp His Lys Cys Ser Leu 115 120 125 Val Phe Tyr Ile Leu Ser Pro Leu Asn Leu Asn Ser Ile Pro Asp Ile 130 135 140 Glu Gln Pro Asn Val Ala Ser Ala Thr Lys Lys Phe Ser Tyr Lys Leu 145 150 155 160 Val Lys Thr Gly Ser Val Val Leu Thr Ala Ser Thr Asp Leu Arg Gly 165 170 175 Tyr Val Val Gly Gln Ala Leu Gln Leu His Ala Asp Val Glu Asn Gln 180 185 190 Ser Gly Lys Asp Thr Ser Pro Val Val Ala Ser Leu Leu Gln Lys Val 195 200 205 Ser Tyr Lys Ala Lys Arg Trp Ile His Asp Val Arg Thr Ile Ala Glu 210 215 220 Val Glu Gly Ala Gly Val Lys Ala Trp Arg Arg Ala Gln Trp His Glu 225 230 235 240 Gln Ile Leu Val Pro Ala Leu Pro Gln Ser Ala Leu Pro Gly Cys Ser 245 250 255 Leu Ile His Ile Asp Tyr Tyr Leu Gln Val Ser Leu Lys Ala Pro Glu 260 265 270 Ala Thr Val Thr Leu Pro Val Phe Ile Gly Asn Ile Ala Val Asn His 275 280 285 Ala Pro Val Ser Pro Arg Pro Gly Leu Gly Leu Pro Pro Gly Ala Pro 290 295 300 Pro Leu Val Val Pro Ser Ala Pro Pro Gln Glu Glu Ala Glu Ala Glu 305 310 315 320 Ala Ala Ala Gly Gly Pro His Phe Leu Asp Pro Val Phe Leu Ser Thr 325 330 335 Lys Ser His Ser Gln Arg Gln Pro Leu Leu Ala Thr Leu Ser Ser Val 340 345 350 Pro Gly Ala Pro Glu Pro Cys Pro Gln Asp Gly Ser Pro Ala Ser His 355 360 365 Pro Leu His Pro Pro Leu Cys Ile Ser Thr Gly Ala Thr Val Pro Tyr 370 375 380 Phe Ala Glu Gly Ser Gly Gly Pro Val Pro Thr Thr Ser Thr Leu Ile 385 390 395 400 Leu Pro Pro Glu Tyr Ser Ser Trp Gly Tyr Pro Tyr Glu Ala Pro Pro 405 410 415 Ser Tyr Glu Gln Ser Cys Gly Gly Val Glu Pro Ser Leu Thr Pro Glu 420 425 430 Ser <210> 117 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 117 Gly Phe Leu Gly 1 <210> 118 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 118 Ala Leu Ala Leu 1 <210> 119 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 119 Ala Leu Ala Leu Ala 1 5 <210> 120 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <220> <221> misc_feature <222> (3)..(3) <223> Xaa can be any naturally occurring amino acid <400> 120 Leu Pro Xaa Thr Gly 1 5 <210> 121 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 121 Asn Asn Ala Gly Ala Ala Trp 1 5 <210> 122 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 122 Pro Ser Ala Pro 1 <210> 123 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 123 Pro Thr Ala Pro 1 <210> 124 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Polypeptide <400> 124 Pro Pro Glu Tyr 1

Claims

하기를 포함하는 최소 아레스틴 도메인-함유 단백질 1 (ARRDC1)로서:
아레스틴 도메인,
적어도 1개의 PSAP (서열식별번호: 122) 또는 PTAP (서열식별번호: 123) 모티프, 및
적어도 1개의 PPXY 모티프,
여기서 최소 ARRDC1은 전장 ARRDC1 단백질보다 더 짧은 것인
최소 ARRDC1.
제1항에 있어서, ARRDC1이 적어도 2개의 PPXY 모티프를 포함하는 것인 최소 ARRDC1.
제1항 또는 제2항에 있어서, 최소 ARRDC1이 400개 미만의 아미노산의 길이인 최소 ARRDC1.
제1항 내지 제3항 중 어느 한 항에 있어서, 최소 ARRDC1이 350개 미만의 아미노산의 길이인 최소 ARRDC1.
제1항 내지 제3항 중 어느 한 항에 있어서, 적어도 1개의 PPXY 모티프가 PPEY (서열식별번호: 124)인 최소 ARRDC1.
제1항 내지 제3항 중 어느 한 항에 있어서, 적어도 1개의 PPXY 모티프가 PPSY (서열식별번호: 125)인 최소 ARRDC1.
제2항에 있어서, 적어도 2개의 PPXY 모티프가 PPEY (서열식별번호: 124) 및 PPSY (서열식별번호: 125)인 최소 ARRDC1.
제1항 내지 제7항 중 어느 한 항에 있어서, 최소 ARRDC1이 서열식별번호: 1에 제시된 아미노산 서열과 적어도 85% 동일한, 또는 임의로 90% 동일한, 또는 임의로 95% 동일한 아미노산 서열을 포함하는 것인 최소 ARRDC1.
제1항 내지 제8항 중 어느 한 항에 있어서, 최소 ARRDC1이 서열식별번호: 1에 제시된 아미노산 서열을 포함하는 것인 최소 ARRDC1.
하기를 포함하는 아레스틴 도메인-함유 단백질 1 (ARRDC1)-매개된 미세소포 (ARMM)로서:
지질 이중층 및 최소 ARRDC1 단백질 또는 그의 변이체,
여기서 ARRDC1 단백질은 적어도 1개의 PSAP (서열식별번호: 122) 또는 PTAP (서열식별번호: 123) 모티프 및 적어도 1개의 PPXY 모티프를 포함하고, 여기서 ARRDC1 단백질은 전장 ARRDC1 단백질보다 더 짧은 것인
미세소포.
제10항에 있어서, 최소 ARRDC1이 적어도 2개의 PPXY 모티프를 포함하는 것인 미세소포.
제10항 또는 제11항에 있어서, 최소 ARRDC1 단백질이 서열식별번호: 1에 제시된 아미노산 서열을 포함하는 것인 미세소포.
제10항 내지 제12항 중 어느 한 항에 있어서, 작용제를 추가로 포함하는 미세소포.
제13항에 있어서, 작용제가 핵산, 단백질, 및 소분자로 이루어진 군으로부터 선택되는 것인 미세소포.
제10항 내지 제14항 중 어느 한 항에 있어서, 미세소포가 TSG101 단백질 또는 그의 단편을 추가로 포함하는 것인 미세소포.
제15항에 있어서, TSG101 단백질 단편이 TSG101 UEV 도메인을 포함하는 것인 미세소포.
제10항 내지 제16항 중 어느 한 항에 있어서, 작용제가 최소 ARRDC1 단백질, 최소 ARRDC1 단편, TSG101 단백질, 또는 TSG101 단편에 접합되거나, 또는 그와의 융합 단백질로서 발현되는 것인 미세소포.
제10항 내지 제17항 중 어느 한 항에 있어서, 미세소포가 인테그린, 수용체 티로신 키나제, G-단백질 커플링된 수용체, 또는 막-결합된 이뮤노글로불린을 추가로 포함하는 것인 미세소포.
제10항 내지 제18항 중 어느 한 항에 있어서, 미세소포가 Cas9 단백질 또는 Cas9 단백질 변이체, Oct4, Sox2, c-Myc, 및 KLF4 재프로그래밍 인자, p53, Rb (망막모세포종 단백질), BRCA1, BRCA2, PTEN, APC, CD95, ST7, ST14, BCL-2 패밀리 단백질, 카스파제; BRMS1, CRSP3, DRG1, KAI1, KISS1, NM23, TIMP-패밀리 단백질, BMP-패밀리 성장 인자, EGF, EPO, FGF, G-CSF, GM-CSF, GDF-패밀리 성장 인자, HGF, HDGF, IGF, PDGF, TPO, TGF-α TGF-β, VEGF; 아연 핑거 뉴클레아제, Cre, Dre, FLP 리콤비나제, Hin, Gin, Tn3, β-six, CinH, ParA, γδ, Bxb1, ΦC31, TP901, TG1, φBT1, R4, φRV1, φFC1, MR11, A118, U153, gp29, Cre, FLP, R, Lambda, HK101, HK022, pSAM2, CAS9 뉴클레아제, Sp1, NF1, CCAAT, GATA, HNF, PIT-1, MyoD, Myf5, Hox, 날개 나선, SREBP, p53, CREB, AP-1, Mef2, STAT, R-SMAD, NF-κB, Notch, TUBBY, NFAT, α1β1 인테그린, α2β1 인테그린, α4β1 인테그린, α5β1 인테그린, α6β1 인테그린, αLβ2 인테그린, αMβ2 인테그린, αIIbβ3 인테그린, αVβ3 인테그린, αVβ5 인테그린, αVβ6 인테그린, α6β4 인테그린, EGF 수용체 (ErbB 패밀리), 인슐린 수용체, PDGF 수용체, FGF 수용체, VEGF 수용체, HGF 수용체, Trk 수용체, Eph 수용체, AXL 수용체, LTK 수용체, TIE 수용체, ROR 수용체, DDR 수용체, RET 수용체, KLG 수용체, RYK 수용체, MuSK 수용체, 로돕신-유사 수용체, 세크레틴 수용체, 대사자극성 글루타메이트/페로몬 수용체, 시클릭 AMP 수용체, 프리즐드/스무든드 수용체, CXCR4 수용체, CCR5 수용체, 베타-아드레날린성 수용체, CA19-9, c-met, PD-1, CTLA-4, ALK, AFP, EGFR, 에스트로겐 수용체 (ER), 프로게스테론 수용체 (PR), HER2/neu, KIT, B-RAF, S100, MAGE, 티로글로불린, MUC-1, 및 PSMA로 이루어진 군으로부터 선택되는 작용제를 포함하는 것인 미세소포.
제14항 내지 제19항 중 어느 한 항에 있어서, 핵산이 RNA를 포함하는 것인 미세소포.
제14항 내지 제20항 중 어느 한 항에 있어서, 핵산이 RNAi 작용제를 포함하는 것인 미세소포.
제14항 내지 제20항 중 어느 한 항에 있어서, 핵산이 코딩 RNA, 비-코딩 RNA, 안티센스 RNA, mRNA, 작은 RNA, siRNA, shRNA, 마이크로RNA, snRNA, snoRNA, lincRNA, 구조적 RNA, 리보자임, 또는 그의 전구체를 포함하는 것인 미세소포.
제14항 내지 제19항 중 어느 한 항에 있어서, 핵산이 DNA를 포함하는 것인 미세소포.
제23항에 있어서, DNA가 레트로트랜스포존 서열, LINE 서열, SINE 서열, 복합 SINE 서열, 또는 LTR-레트로트랜스포존 서열을 포함하는 것인 미세소포.
제14항 내지 제24항 중 어느 한 항에 있어서, 핵산이 단백질을 코딩하는 것인 미세소포.
제13항 내지 제25항 중 어느 한 항에 있어서, 작용제가 검출가능한 표지를 포함하는 것인 미세소포.
제13항 내지 제26항 중 어느 한 항에 있어서, 작용제가 치료제를 포함하는 것인 미세소포.
제27항에 있어서, 작용제가 효소, 항체, Fab, Fab', F(ab')2, Fd, scFv, Fv, dsFv, 디아바디, 및 아피바디로 이루어진 군으로부터 선택되는 것인 미세소포.
제13항 내지 제28항 중 어느 한 항에 있어서, 작용제가 세포독성제를 포함하는 것인 미세소포.
제13항 내지 제29항 중 어느 한 항에 있어서, 작용제가 단백질을 포함하는 것인 미세소포.
제30항에 있어서, 작용제가 전사 인자, 전사 억제제, 형광 단백질, 키나제, 포스파타제, 프로테아제, 리가제, 또는 리콤비나제를 포함하는 것인 미세소포.
제13항 내지 제31항 중 어느 한 항에 있어서, 작용제가 최소 ARRDC1 단백질 또는 그의 단편, 또는 TSG101 단백질 또는 그의 단편에 공유 결합된 것인 미세소포.
제13항 내지 제32항 중 어느 한 항에 있어서, 작용제가 링커를 통해 최소 ARRDC1 단백질 또는 그의 단편 또는 TSG101 단백질 또는 그의 단편에 접합된 것인 미세소포.
제33항에 있어서, 링커가 절단가능한 링커인 미세소포.
제34항에 있어서, 링커가 프로테아제 인식 부위 또는 UV-절단가능한 모이어티를 포함하는 것인 미세소포.
제13항 내지 제31항 중 어느 한 항에 있어서, 작용제가 적어도 1개의 WW 도메인 또는 그의 변이체에 융합된 것인 미세소포.
제36항에 있어서, 작용제가 2, 3, 4, 또는 5개의 WW 도메인 또는 그의 변이체를 포함하는 것인 미세소포.
제36항 또는 제37항에 있어서, WW 도메인이 유비퀴틴 리가제 WWP1, WWP2, Nedd4-1, Nedd4-2, Smurf1, Smurf2, ITCH, NEDL1, 또는 NEDL2의 WW 도메인으로부터 유래된 것인 미세소포.
제36항 내지 제38항 중 어느 한 항에 있어서, WW 도메인이 서열식별번호: 6 내지 14로 이루어진 군으로부터 선택되는 서열을 포함하는 것인 미세소포.
제36항 내지 제39항 중 어느 한 항에 있어서, 작용제가 단백질이고, 임의로 작용제가 융합 단백질인 미세소포.
제36항 내지 제40항 중 어느 한 항에 있어서, 작용제가 Cas9 단백질인 미세소포.
제41항에 있어서, Cas9 단백질 또는 그의 변이체가 적어도 1개의 핵 국재화 서열 (NLS)을 포함하는 것인 미세소포.
제41항 또는 제42항에 있어서, 가이드 RNA (gRNA)를 추가로 포함하는 미세소포.
제36항 내지 제43항 중 어느 한 항에 있어서, WW 도메인이 단백질의 N-말단에 융합된 것인 미세소포.
제36항 내지 제44항 중 어느 한 항에 있어서, WW 도메인이 단백질의 C-말단에 융합된 것인 미세소포.
제10항 내지 제45항 중 어느 한 항에 있어서, 미세소포가 엑소좀 바이오마커를 포함하지 않는 것인 미세소포.
제10항 내지 제46항 중 어느 한 항에 있어서, 미세소포가 엑소좀 바이오마커에 대해 음성인 미세소포.
제46항 또는 제47항에 있어서, 엑소좀 바이오마커가 CD63, Lamp-1, Lamp-2, CD9, HSPA8, GAPDH, CD81, SDCBP, PDCD6IP, ENO1, ANXA2, ACTB, YWHAZ, HSP90AA129, ANXA5, EEF1A1, YWHAE, PPIA, MSN, CFL1, ALDOA, PGK1, EEF2, ANXA1, PKM2, HLA-DRA, 및 YWHAB로 이루어진 군으로부터 선택되는 것인 미세소포.
제46항 내지 제48항 중 어느 한 항에 있어서, 미세소포가 CD63 및 Lamp-1을 포함하지 않거나 또는 그에 대해 음성인 미세소포.
제10항 내지 제49항 중 어느 한 항에 있어서, 미세소포 직경이 약 30 nm 내지 약 500 nm인 미세소포.
하기를 포함하는 아레스틴 도메인-함유 단백질 1 (ARRDC1)-매개된 미세소포 (ARMM):
지질 이중층;
ARRDC1 단백질이 아레스틴 도메인, 적어도 1개의 PSAP (서열식별번호: 122) 또는 PTAP (서열식별번호: 123) 모티프, 및 적어도 2개의 PPXY 모티프를 포함하고, ARRDC1 단백질이 전장 ARRDC1 단백질보다 더 짧은 것인 최소 ARRDC1 단백질 또는 그의 변이체; 및
최소 ARRDC1 단백질에 연결된 Cas9 화물 단백질.
제51항에 있어서, 최소 ARRDC1 단백질이 Cas9 화물 단백질에 공유 연결된 것인 미세소포.
제51항 또는 제52항에 있어서, 최소 ARRDC1 단백질이 절단가능한 링커를 통해 Cas9 단백질에 연결된 것인 미세소포.
제51항 내지 제53항 중 어느 한 항에 있어서, 링커가 프로테아제 인식 부위를 포함하는 것인 미세소포.
제51항 내지 제54항 중 어느 한 항에 있어서, 링커가 UV-절단가능한 링커를 포함하는 것인 미세소포.
하기를 포함하는 아레스틴 도메인-함유 단백질 1 (ARRDC1)-매개된 미세소포 (ARMM):
지질 이중층;
최소 ARRDC1 단백질이 아레스틴 도메인, 적어도 1개의 PSAP (서열식별번호: 122) 및/또는 PTAP (서열식별번호: 123) 모티프, 및 적어도 2개의 PPXY 모티프를 포함하고, 최소 ARRDC1 단백질이 전장 ARRDC1 단백질보다 더 짧은 것인 최소 ARRDC1 단백질;
TSG101 단백질 또는 그의 변이체; 및
TSG101 단백질 또는 그의 변이체에 연결된 Cas9 단백질.
하기를 포함하는 최소 ARRDC1 융합 단백질:
최소 ARRDC1 단백질이 아레스틴 도메인, 적어도 1개의 PSAP (서열식별번호: 122) 모티프, 및 적어도 2개의 PPXY 모티프를 포함하고, 최소 ARRDC1 단백질이 전장 ARRDC1 단백질보다 더 짧은 것인 최소 ARRDC1 단백질 또는 그의 변이체; 및
Cas9 단백질 또는 그의 변이체.
하기를 포함하는 미세소포-생산 세포:
이종 프로모터의 제어 하에서 제A1항 내지 제A7항 중 어느 한 항의 최소 ARRDC1 단백질을 코딩하는 재조합 발현 구축물, 및
이종 프로모터의 제어 하에서 화물 단백질을 코딩하는 재조합 발현 구축물.
제58항에 있어서, 화물 단백질이 적어도 1개의 WW 도메인 또는 그의 변이체에 융합된 것인 미세소포-생산 세포.
이종 프로모터의 제어 하에서 최소 ARRDC1 단백질을 코딩하는 재조합 발현 구축물을 포함하는 미세소포-생산 세포로서, 여기서 최소 ARRDC1 단백질은 아레스틴 도메인, 적어도 1개의 PSAP (서열식별번호: 122) 및/또는 PTAP (서열식별번호: 123) 모티프, 및 적어도 2개의 PPXY 모티프를 포함하고, 여기서 최소 ARRDC1 단백질은 전장 ARRDC1 단백질보다 더 짧고; 여기서 최소 ARRDC1 단백질은 Cas9 화물 단백질 또는 그의 변이체에 연결된 것인 미세소포-생산 세포.
표적 세포를 제10항 내지 제56항 중 어느 한 항의 미세소포와 접촉시키는 것을 포함하는, 화물을 표적 세포에 전달하는 방법.
표적 세포를 제58항 내지 제60항 중 어느 한 항의 미세소포-생산 세포와 접촉시키는 것을 포함하는, 화물을 표적 세포에 전달하는 방법.
표적 세포를 제10항 내지 제56항 중 어느 한 항의 미세소포와 접촉시키는 것을 포함하는, 유전자 편집의 방법.
표적 세포를 제58항 내지 제60항 중 어느 한 항의 미세소포-생산 세포와 접촉시키는 것을 포함하는, 유전자 편집의 방법.
제1항 내지 제8항 중 어느 한 항의 최소 아레스틴 도메인-함유 단백질 1 (ARRDC1)을 코딩하는 뉴클레오티드 서열을 포함하는 핵산.