KR20210038841A

KR20210038841A - 게놈 편집을 위한 방법 및 조성물

Info

Publication number: KR20210038841A
Application number: KR1020207033207A
Authority: KR
Inventors: 안드레 로널드 왓슨; 크리스티안 포스터; 슈아일리앙 린; 사라 마리 페이로트
Original assignee: 리간달 인코포레이티드
Priority date: 2018-04-18
Filing date: 2019-04-17
Publication date: 2021-04-08
Also published as: US20200208177A1; JP2021521884A; CN112567032A; WO2019204531A1; EP3781683A4; EP3781683A1; CA3097742A1; AU2019255725A1

Abstract

점착성 말단을 사용하는 게놈 편집을 위한 방법 및 조성물이 제공된다. 대상 방법은 (a) 표적 세포의 게놈 DNA 내의 2개의 위치 각각에서 엇갈림 절단을 생성하고, 이에 따라 2개의 게놈 엇갈림 말단을 생성하는 단계; 및 (b) 게놈 DNA의 점착성 말단에 매칭/상응하는 엇갈림 말단 (즉, 점착성 말단)을 갖는 선형 이중 가닥 공여자 DNA를 제공/도입하여 공여자 DNA의 점착성 말단이 게놈 DNA의 점착성 말단과 혼성화되고 공여자 DNA가 게놈 내로 삽입되도록 하는 것인 단계를 포함한다. 일부 경우에, 엇갈림 절단은 표적 세포 내로 1개 이상의 서열 특이적 뉴클레아제 (또는 1개 이상의 서열 특이적 뉴클레아제를 코딩하는 1개 이상의 핵산)를 도입함으로써 생성된다.

Description

게놈 편집을 위한 방법 및 조성물

상호-참조

본 출원은 2018년 4월 18일에 출원된 미국 특허 가출원 번호 62/659,627, 2018년 6월 14일에 출원된 미국 특허 가출원 번호 62/685,243 및 2018년 9월 25일에 출원된 미국 특허 가출원 번호 62/736,400을 우선권 주장하며, 이들 가출원은 모두 그 전문이 본원에 참조로 포함된다.

서론

게놈 편집은 대부분의 상황에서 비효율적인 과정으로 남아있다. 효율적인 게놈 편집을 위한 조성물 및 방법은 중요한 미충족 필요로 남아있다.

점착성 말단을 사용하는 게놈 편집을 위한 조성물 및 방법이 제공된다. 일부 실시양태에서, 대상 방법은 (a) 표적 세포의 게놈 DNA 내의 2개의 위치 각각에서 엇갈림 절단을 생성하고, 이에 따라 2개의 점착성 말단 (게놈 엇갈림 말단)을 생성하는 단계; 및 (b) 게놈 DNA의 점착성 말단에 상응하는 엇갈림 말단 (즉, 점착성 말단)을 갖는 선형 이중 가닥 공여자 DNA를 제공/도입하여 공여자 DNA의 점착성 말단이 게놈 DNA의 점착성 말단과 혼성화되고 공여자 DNA가 게놈 내로 삽입되도록 하는 것인 단계를 포함한다. 이러한 방법은 또한 본원에서 일반적으로 "테트리스" 또는 "테트리스-매개"로 지칭된다. 일부 경우에, 엇갈림 절단은 표적 세포 내로 1개 이상의 서열 특이적 뉴클레아제 (또는 1개 이상의 서열 특이적 뉴클레아제를 코딩하는 1개 이상의 핵산), 예를 들어 메가뉴클레아제, 귀소 엔도뉴클레아제, 아연 핑거 뉴클레아제 (ZFN), TALEN, 부류 2 CRISPR/Cas 이펙터 단백질 (RNA-가이드 CRISPR/Cas 폴리펩티드), 예컨대 Cas9, CasX, CasY, Cpf1 (Cas12a), Cas13, MAD7 등을 도입함으로써 생성된다.

일부 경우에, 공여자 DNA 및 1개 이상의 서열 특이적 뉴클레아제 (또는 1개 이상의 서열 특이적 뉴클레아제를 코딩하는 1개 이상의 핵산)는 동일한 전달 비히클의 페이로드이다 (이는 예를 들어 시험관내, 생체외 또는 생체내에서 세포 내로 도입/세포에 전달될 수 있음). 동일한 전달 비히클 (예를 들어, 나노입자)의 일부로서 다중 페이로드를 전달하는 것의 한 이점은 각각의 페이로드의 효율이 희석되지 않는다는 것이다. 예시적인 예로서, 페이로드 A 및 페이로드 B가 2개의 개별 패키지/비히클 (각각 패키지 A 및 패키지 B)로 전달된다면, 효율은 곱셈되며, 예를 들어 패키지 A 및 패키지 B가 각각 1% 형질감염 효율을 갖는다면, 페이로드 A 및 페이로드 B를 동일한 세포에 전달할 가능성은 0.01% (1% X 1%)이다. 그러나, 페이로드 A 및 페이로드 B가 둘 다 동일한 전달 비히클의 일부로서 전달된다면, 페이로드 A 및 페이로드 B를 동일한 세포에 전달할 가능성은 0.01%보다 100배 개선된 1%이다.

일부 실시양태에서, 공여자 DNA (예를 들어, 공여자 DNA의 말단)는 전달되는 경우에 (예를 들어, 동일한 전달 비히클의 일부로서) 1개 이상의 서열 특이적 뉴클레아제 (예를 들어, 뉴클레아제 쌍(들))에 결합되며, 예를 들어 공여자 DNA는 1개 이상의 뉴클레아제와 '사전-조립'될 수 있다. 공여자 DNA와 뉴클레아제의 공동-전달은 게놈 절단 부위에 대한 결합 동안 열역학적 "전환"을 일으킬 수 있으며, 이에 의해 뉴클레아제 (예를 들어, 뉴클레아제 쌍(들))는 공여자 DNA로부터 게놈 상으로 변위되고, 공여자 DNA가 게놈 내로 끼워진다. 대상 조성물 및 방법은 상동성 지정 복구 (HDR)를 사용하지 않고 공여자 DNA를 DNA 표적 내로 삽입하는 방식을 제공하며 - 대신에 삽입은 '점착성 말단' 매칭에 의해 매개된다.

전달 비히클은 비-바이러스 비히클, 바이러스 비히클, 나노입자 (예를 들어, 표적화 리간드 및/또는 음이온성 중합체 조성물, 양이온성 중합체 조성물 및 양이온성 폴리펩티드 조성물을 포함하는 코어를 포함하는 나노입자), 리포솜, 미셀, 물-오일-물 에멀젼 입자, 오일-물 에멀젼 미셀 입자, 다층상 물-오일-물 에멀젼 입자, 하전된 중합체 폴리펩티드 도메인에 접합된 표적화 리간드 (예를 들어, 펩티드 표적화 리간드) (여기서 표적화 리간드는 세포 표면 단백질에 대한 표적화된 결합을 제공하고, 하전된 중합체 폴리펩티드 도메인은 핵산 페이로드와 축합되고/거나 단백질 페이로드와 정전기적으로 상호작용함), 페이로드에 접합된 표적화 리간드 (예를 들어, 펩티드 표적화 리간드) (여기서 표적화 리간드는 세포 표면 단백질에 대한 표적화된 결합을 제공함) 등을 포함할 수 있으나 이에 제한되지는 않는다. 일부 경우에 페이로드는 데옥시리보핵단백질 복합체 또는 리보-데옥시리보핵단백질 복합체로서 세포 내로 도입된다.

제공된 조성물 및 방법은 임의의 세포 유형 내의 임의의 유전자좌에서의 게놈 편집을 위해 (예를 들어, T-세포를, 예를 들어 생체내에서 조작하기 위해) 사용될 수 있다. 예를 들어, CD8+ T-세포 집단 또는 CD8+ 및 CD4+ T-세포의 혼합물은 항원 인식을 위한 CDR1, CDR2 및/또는 CDR3 도메인의 적절한 TCRα/TCRβ 쌍을 일시적으로 또는 영구적으로 발현하도록 프로그램화될 수 있다.

본 발명은 첨부 도면과 함께 읽는 경우에 하기 상세한 설명으로부터 가장 잘 이해된다. 통례에 따라, 도면의 다양한 특징부가 비율에 맞지 않는다는 것이 강조된다. 반대로, 다양한 특징부의 치수는 명확성을 위해 임의적으로 확대되거나 축소된다. 하기 도면이 도면에 포함된다.
도 1은 점착성 말단을 갖는 대상 선형 이중 가닥 공여자 DNA의 예시적인 실시양태의 개략적 표현을 도시한다. 도시된 한 경우에, 양쪽 말단은 5' 오버행을 갖고, 도시된 다른 경우에, 양쪽 말단은 3' 오버행을 갖는다.
도 2는 대상 방법의 한 예의 개략적 표현을 도시한다.
도 3은 전달 패키지 (도시된 경우에, 한 유형의 나노입자)의 예시적인 실시양태의 개략적 표현을 도시한다.
도 4는 전달 패키지 (도시된 경우에, 한 유형의 나노입자)의 예시적인 실시양태의 개략적 표현을 도시한다. 이 경우에서는, 도시된 나노입자는 다층이며, 코어 (제1 페이로드를 포함함)를 갖고, 이는 제1 유출가능한 층에 의해 둘러싸이고, 이는 중간 층 (추가의 페이로드를 포함함)에 의해 둘러싸이고, 이는 제2 유출가능한 층에 의해 둘러싸이고, 이는 표면 코팅되어 있다 (즉, 외부 쉘을 포함함).
도 5 (패널 A-B)는 대상 나노입자의 표면 코트의 표적화 리간드의 예시적인 구성의 개략적 표현을 도시한다. 도시된 전달 분자는 나노입자의 유출가능한 층과 정전기적으로 상호작용하는 앵커링 도메인에 접합된 표적화 리간드를 포함한다. 표적화 리간드는 N- 또는 C-말단에서 접합될 수 있지만 (각각의 패널의 좌측), 내부 위치에서도 접합될 수 있음 (각각의 패널의 우측)을 주목한다. 패널 A에서의 분자는 링커를 포함하는 반면 패널 B에서의 분자는 그렇지 않다.
도 6 (패널 A-D)은 전달 패키지의 예시적인 실시양태 (도시된 경우에, 대상 전달 분자의 예시적인 구성)의 개략적 도면을 제공한다. 표적화 리간드는 N- 또는 C-말단에서 접합될 수 있지만 (각각의 패널의 좌측), 내부 위치에서도 접합될 수 있음 (각각의 패널의 우측)을 주목한다. 패널 A 및 C에서의 분자는 링커를 포함하는 반면 패널 B 및 D의 분자는 그렇지 않다. (패널 A-B) 페이로드에 접합된 표적화 리간드를 포함하는 전달 분자. (패널 C-D) 핵산 페이로드와 축합된 (및/또는 단백질 페이로드와, 예를 들어 정전기적으로 상호작용하는) 하전된 중합체 폴리펩티드 도메인에 접합된 표적화 리간드를 포함하는 전달 분자.
도 7은 사용될 수 있는 핵 국재화 신호 (NLS)의 비제한적 예를 제공한다 (예를 들어, 나노입자의 일부로서, 예를 들어 NLS-함유 펩티드로서; NLS-함유 펩티드, 음이온성 중합체, 양이온성 중합체 및/또는 양이온성 폴리펩티드 등의 일부/그에 접합된 것으로서). 상기 도면은 문헌 [Kosugi et al., J Biol Chem. 2009 Jan 2;284(1):478-85]으로부터 적합화된 것이다. (부류 1, 위에서 아래로 (서열식별번호(SEQ ID NO): 201-221); 부류 2, 위에서 아래로 (서열식별번호: 222-224); 부류 4, 위에서 아래로 (서열식별번호: 225-230); 부류 3, 위에서 아래로 (서열식별번호: 231-245); 부류 5, 위에서 아래로 (서열식별번호: 246-264)].
도 8 (패널 A-B)은 마우스 (패널 A) 및 인간 (패널 B) 조혈 세포 계통 및 계통 내의 다양한 세포에 대해 확인된 마커의 개략적 표현을 도시한다.
도 9 (패널 A-B)는 세포 분화 및/또는 증식에 영향을 미치는데 사용될 수 있는 miRNA (패널 A) 및 단백질 (패널 B) 인자의 개략적 표현을 도시한다.
도 10-57은 실험 결과를 도시한다 - "실험" 섹션 참조.
도 58은 T 세포 수용체 편집을 위한 예시적인 표적 유전자좌를 도시한다.
도 59는 엑손 1 및 TCR 알파 및 TCR 베타의 프로모터 영역에서 이중 가닥 파괴를 생성하도록 설계된 CRISPR/CAS 가이드 서열 및 TALEN 서열의 예를 도시한다.
도 60은 게놈의 대향하는 가닥 상의 TTTV PAM 서열로부터 +24 및 +19에서 엇갈림 절단을 생성하는 Cpf1 (Cas12a)에 대해 sgRNA를 설계한 방법을 도시한다. 2개의 올리고 (ssDNA1 및 ssDNA2)를 어닐링함으로써 상용성 오버행을 갖는 dsDNA 삽입물을 생성하였다. GFP 유전자 삽입은 단일-절단 Cpf1 접근법으로는 검출되지 않았고, 반면 성공적인 테트리스-매개 (즉, 2개의 엇갈림 말단 절단물 + 엇갈림 말단을 갖는 이중 가닥 삽입물) GFP 삽입은 TRBC1 & TRBC2 유전자좌에서 이중 절단을 수행한 경우에 관찰되었다. 삽입물은 플래그 또는 GFP를 코딩하고; 상용성 오버행은 이 도면에 밑줄표시로 제시되어 있다. 뉴클레오펙션을 통해 60pmol Cpf1 RNP 및 4ug dsDNA를 자극된 T-세포에 도입하였다. 뉴클레오펙션 후 제4일-제10일에, 세포를 유동 세포측정법 및 TRBC1-TRBC2, GFP-GFP 또는 TRBC2-GFP의 PCR 증폭에 의해 TCR 녹-다운에 대해 검정하여 각각 게놈 결실, GFP 공여자의 존재 및 TRBC1-TRBC2 유전자좌 내로의 GFP 삽입을 확인하였다.
도 61은 CD3/CD28 비드와 함께 배양한 다음 날 2일 동안 해동 및 자극된 동결보존된 인간 1차 T 세포의 유동 세포측정법 결과 (아튠(Attune) NxT)를 도시한다. 세포의 1.27%는 TRBC1/C2 유전자좌의 이중-절단 Cpf1-매개 편집 및 후속하여 GFP를 코딩하는 테트리스DNA 주형 (즉, 엇갈림 말단을 갖는 이중 가닥 삽입물)을 통한 삽입 후에 GFP+였다. 비드 제거 다음 날, 론자(Lonza) 아막사 4D 시스템, P3 1차 세포 키트에 의해 세포를 전기천공하였다. 64pmol A.s. Cpf1 (IDT, 카탈로그 1081068) 및 128 pmol sgRNA (IDT)를 실온에서 10-20분 동안 인큐베이션하여 RNP를 형성하고, 이어서 이를 4μg의 dsDNA 삽입물 또는 IDT의 Cpf1 전기천공 증진제 (카탈로그 #1076301)에 첨가하고, 10분 동안 인큐베이션하였다. 20μL 중 1x10e6개의 자극된 T 세포를 첨가한 다음, 큐벳에 옮기고, 이어서 펄스 EH-115 (B, RNP 단독) 또는 EO-115 (C, RNP+DNA)로 전기천공하였다. 뉴클레오펙션 후 제7일에, TCRa/b 및 GFP 발현을 유동 세포측정법에 의해 검정하였다. 도면은 생존 집단 내의 세포 (아넥신 및 시톡스 음성)를 보여준다. 퀵익스트랙트 (루시젠(Lucigen))를 사용하여 세포로부터 DNA를 수집하였다.
도 62는 인간 범-T 세포에서 TRBC1 & TRBC2 유전자좌를 표적화하는 Cpf1 gRNA를 사용한 GFP 녹-인 (레인 4 + 5, 정사각형 내부의 밴드) 및 성공적인 TRBC1-TRBC2 녹아웃 (레인 1 + 2)을 도시한다. GFP 공여자 증폭 (레인 7 + 8)은 세포 내의 비-통합된 공여자 DNA에 기인할 가능성이 있지만, GFP-TRBC2 프라이머로 제어된다 (레인 4 + 5). TRBC1-TRBC2 결실 밴드 (731bp) 및 GFP-GFP 밴드 (774bp)는 각각 웰 1-2 및 7-8에 대해 명확하게 관찰된다. 525bp 녹-인 밴드가 레인 4 및 5에서 가시적이며, 이는 유동 세포측정법 및 GFP+ 세포를 통한 ~1.27%의 효율적인 유전자 삽입에 상응한다.
도 63은 도 62에서 관찰된 양성 및 음성 밴드를 도시한다.
도 64는 C1 및 C2 유전자좌 둘 다에 대한 특이성을 갖고 게놈에서 2개의 절단을 수행하는 Cpf1 가이드를 통해 TRB 엑손 1을 표적화하는 LL003 sgRNA - Cpf1 복합체의 생어 서열분석 트레이스 플롯을 도시한다. 그의 상응하는 서열은 TAATTTCTACTCTTGTAGATGGTGTGGGAGATCTCTGCTTCTGA이다. 플래그 서열 또는 T2A-GFP 서열을 자극된 인간 1차 T 세포의 TRAC 유전자좌 내로 삽입하였다. 이 도면에서, 세포는 형질감염되지 않았다.
도 65는 C1 및 C2 유전자좌 둘 다에 대한 특이성을 갖고 게놈에서 2개의 절단을 수행하는 Cpf1 가이드를 통해 TRB 엑손 1을 표적화하는 LL003 sgRNA - Cpf1 복합체의 생어 서열분석 트레이스 플롯을 도시한다. 그의 상응하는 서열은 TAATTTCTACTCTTGTAGATGGTGTGGGAGATCTCTGCTTCTGA이다. 플래그 서열 또는 T2A-GFP 서열을 자극된 인간 1차 T 세포의 TRAC 유전자좌 내로 삽입하였다. 이 도면에서, 공여자 DNA는 사용되지 않았다.
도 66은 C1 및 C2 유전자좌 둘 다에 대한 특이성을 갖고 게놈에서 2개의 절단을 수행하는 Cpf1 가이드를 통해 TRB 엑손 1을 표적화하는 LL003 sgRNA - Cpf1 복합체의 생어 서열분석 트레이스 플롯을 도시한다. 그의 상응하는 서열은 TAATTTCTACTCTTGTAGATGGTGTGGGAGATCTCTGCTTCTGA이다. 플래그 서열 또는 T2A-GFP 서열을 자극된 인간 1차 T 세포의 TRAC 유전자좌 내로 삽입하였다. 이 도면에서, 플래그 공여자 DNA (엇갈림 말단을 가짐)가 이용되었다.

상기 요약된 바와 같이, 점착성 말단을 사용하는 게놈 편집을 위한 조성물 및 방법이 제공된다. 대상 방법은 (a) 표적 세포의 게놈 DNA 내의 2개의 위치 각각에서 엇갈림 절단을 생성하고, 이에 따라 2개의 점착성 말단 (게놈 엇갈림 말단)을 생성하는 단계; 및 (b) 게놈 DNA의 점착성 말단에 상응하는 엇갈림 말단 (즉, 점착성 말단)을 갖는 선형 이중 가닥 공여자 DNA를 제공/도입하여 공여자 DNA의 점착성 말단이 게놈 DNA의 점착성 말단과 혼성화되고 공여자 DNA가 게놈 내로 삽입되도록 하는 것인 단계를 포함한다. 일부 경우에, 엇갈림 절단은 표적 세포 내로 1개 이상의 서열 특이적 뉴클레아제 (또는 1개 이상의 서열 특이적 뉴클레아제를 코딩하는 1개 이상의 핵산), 예를 들어 메가뉴클레아제, 귀소 엔도뉴클레아제, 아연 핑거 뉴클레아제 (ZFN), TALEN, 부류 2 CRISPR/Cas 이펙터 단백질, 예컨대 Cas9, Cpf1 등을 도입함으로써 생성된다. 일부 경우에, 공여자 DNA 및 1개 이상의 서열 특이적 뉴클레아제 (또는 1개 이상의 서열 특이적 뉴클레아제를 코딩하는 1개 이상의 핵산)는 동일한 전달 비히클의 페이로드이다. 일부 경우에, 전달 비히클은 나노입자 (예를 들어, 표적화 리간드 및/또는 음이온성 중합체 조성물, 양이온성 중합체 조성물 및 양이온성 폴리펩티드 조성물을 포함하는 코어를 포함하는 나노입자)이고 - 일부 경우에 페이로드는 나노입자의 코어의 일부이다. 일부 경우에, 전달 비히클은 하전된 중합체 폴리펩티드 도메인에 접합된 표적화 리간드 (예를 들어, 펩티드 표적화 리간드)를 갖는 대상 전달 분자이다 (여기서 표적화 리간드는 세포 표면 단백질에 대한 표적화된 결합을 제공하고, 하전된 중합체 폴리펩티드 도메인은 페이로드와 상호작용하고, 예를 들어 핵산 페이로드와 축합되고/거나 단백질 페이로드와 정전기적으로 상호작용함).

본 방법 및 조성물을 설명하기 전에, 본 발명은 기재된 특정한 방법 또는 조성물로 제한되지 않으므로, 당연히 달라질 수 있음이 이해되어야 한다. 또한, 본 발명의 범주는 단지 첨부된 청구범위에 의해서만 제한될 것이므로, 본원에 사용된 용어는 단지 특정한 실시양태를 기재하는 목적을 위한 것이며, 제한적인 것으로 의도되지 않음이 이해되어야 한다.

값의 범위가 제공되는 경우에, 문맥이 달리 명백하게 지시하지 않는 한, 그 범위의 상한치와 하한치 사이에서 하한치 단위의 1/10까지의 각각의 중간 값이 또한 구체적으로 개시되는 것으로 이해된다. 언급된 범위 내 임의의 언급된 값 또는 개재 값 내지 그 언급된 범위 내 임의의 다른 언급된 값 또는 개재 값 사이의 각각의 더 작은 범위가 본 발명 내에 포괄된다. 이러한 더 작은 범위의 상한치 및 하한치는 독립적으로 범위 내에 포함되거나 배제될 수 있고, 더 작은 범위 내에 이러한 한계치 중 어느 하나 또는 둘 다가 포함되거나 또는 둘 다가 포함되지 않는 각각의 범위는 언급된 범위 내의 임의의 구체적으로 배제된 한계치를 조건으로 하여 본 발명 내에 또한 포괄된다. 언급된 범위가 한계치 중 하나 또는 둘 다를 포함하는 경우에, 포함된 한계치 중 어느 하나 또는 둘 다를 배제하는 범위가 또한 본 발명에 포함된다.

달리 정의되지 않는 한, 본원에 사용된 모든 기술 과학 용어는 본 발명이 속하는 관련 기술분야의 통상의 기술자에 의해 통상적으로 이해되는 것과 동일한 의미를 갖는다. 본원에 기재된 것과 유사하거나 동등한 임의의 방법 및 물질이 본 발명의 실시 또는 시험에 사용될 수 있지만, 일부 잠재적인 및 바람직한 방법 및 물질이 이제 기재된다. 본원에 언급된 모든 공개물은 공개물에서 인용된 것과 관련된 방법 및/또는 물질을 개시하고 기재하기 위해 본원에 참조로 포함된다. 본 개시내용은 포함된 공개물의 임의의 개시내용을 모순이 존재하는 정도까지 대체하는 것으로 이해된다.

본 개시내용을 읽을 때 관련 기술분야의 통상의 기술자에게 분명할 바와 같이, 본원에 기재되고 예시된 각각의 개별 실시양태는 본 발명의 범주 또는 취지에서 벗어나지 않으면서 임의의 다른 여러 실시양태의 특색과 용이하게 분리되거나 조합될 수 있는 별개의 성분 및 특색을 갖는다. 임의의 인용된 방법은 인용된 사건의 순서로 또는 논리적으로 가능한 임의의 다른 순서로 수행될 수 있다.

본원 및 첨부된 청구범위에 사용된 바와 같이, 단수 형태는 문맥이 달리 명백하게 지시하지 않는 한 복수 지시대상을 포함함을 주목해야 한다. 따라서, 예를 들어, "세포"에 대한 언급은 복수의 이러한 세포를 포함하고, "엔도뉴클레아제"에 대한 언급은 관련 기술분야의 통상의 기술자에게 공지된 1개 이상의 엔도뉴클레아제 및 그의 등가물에 대한 언급을 포함하는 것 등이다. 추가로, 청구범위는 임의의 요소, 예를 들어 임의의 임의적인 요소를 배제하도록 작성될 수 있음을 주목한다. 따라서, 이러한 언급은 청구범위 요소의 열거와 관련하여 "단독으로", "단지" 등과 같은 배타적 용어의 사용, 또는 "부정적" 제한의 사용에 대한 선행 기준으로서의 역할을 하도록 의도된다.

본원에서 논의된 공개물은 본 출원의 출원일 이전의 그의 개시내용에 대해서만 제공된다. 본원에서의 어떠한 것도 본 발명이 이러한 공개물에 선행할 자격이 없다는 것을 인정하는 것으로 해석되어서는 안된다. 추가로, 제공된 공개물의 일자는 실제의 공개 일자와 상이할 수 있으며, 이는 독립적으로 확인될 필요가 있을 수 있다.

방법 및 조성물

효율적인 게놈 편집을 위한 방법 및 조성물이 제공된다. 일부 실시양태에서, 대상 방법은 (a) 표적 세포의 게놈 내의 2개의 위치에서 엇갈림 말단을 갖는 이중 가닥 절단을 생성하고, 이에 의해 제1 게놈 엇갈림 말단 및 제2 게놈 엇갈림 말단을 생성하는 단계; 및 (b) 각각의 말단에 5' 또는 3' 오버행을 갖는 선형 이중 가닥 공여자 DNA를 도입하며, 여기서 공여자 DNA의 한 말단은 제1 게놈 엇갈림 말단과 혼성화되고 공여자 DNA의 다른 말단은 제2 게놈 엇갈림 말단과 혼성화되고, 이에 의해 선형 이중 가닥 공여자 DNA가 표적 세포의 게놈 내로 삽입되도록 하는 것인 단계를 포함한다.

부위-특이적 뉴클레아제를 코딩하는 핵산은, 예를 들어 전달 비히클의 핵산 페이로드로서 임의의 관심 핵산일 수 있으며, 이는 선형 또는 원형일 수 있고, 플라스미드, 바이러스 게놈, RNA 등일 수 있다. 용어 "핵산"은 변형된 핵산을 포괄한다. 예를 들어, 핵산 분자는 모방체일 수 있고, 변형된 당 백본, 1개 이상의 변형된 뉴클레오시드간 연결 (예를 들어, 1개 이상의 포스포로티오에이트 및/또는 헤테로원자 뉴클레오시드간 연결), 1개 이상의 변형된 염기 등을 포함할 수 있다. 일부 실시양태에서, 대상 페이로드는 트리플렉스-형성 펩티드 핵산 (PNA)을 포함한다 (예를 들어, 문헌 [McNeer et al., Gene Ther. 2013 Jun;20(6):658-69] 참조). 대상 공여자 DNA는 이중 가닥이고, 선형이고, 엇갈림 말단을 갖는다 (즉, 선형 공여자 DNA의 각각의 말단은 오버행을 가짐).

2개의 위치에서의 게놈 엇갈림 말단의 생성

일부 경우에, 엇갈림 절단을 생성하기 위해, 부위-특이적 뉴클레아제 (1개 이상의 부위-특이적 뉴클레아제) (또는 이를 코딩하는 핵산, 예를 들어 1개 이상의 핵산)가 표적 세포 내로 도입된다. 표적 세포가 생체내 세포인 경우에, 이는 적절한 성분 (예를 들어, 1개 이상의 전달 비히클의 일부로서)을 개체에게 투여함으로써 달성될 수 있다. 일부 경우에, 표적 세포는 부위-특이적 뉴클레아제를 코딩하는 DNA (예를 들어, - 유도성 프로모터의 제어 하에 - 작동가능하게 연결될 수 있음)를 포함하고, 대상 방법의 '생성' 단계는 부위-특이적 뉴클레아제의 발현을 유도하는 것을 포함한다.

2개의 게놈 엇갈림 말단의 각각의 오버행 (2개의 위치에서 게놈을 절단한 후)은 독립적으로 5' 또는 3' 단일 가닥 오버행일 수 있다. 예를 들어, 일부 경우에, 게놈 엇갈림 말단 둘 다 (2개의 위치에서 게놈을 절단한 후)는 5' 오버행을 가질 수 있다. 일부 경우에, 게놈의 엇갈림 말단 둘 다는 3' 오버행을 갖는다. 일부 경우에, 한 게놈 엇갈림 말단 (2개의 절단 위치 중 하나에서)은 5' 오버행을 갖는 반면 다른 게놈 엇갈림 말단 (다른 절단 위치에서)은 3' 오버행을 갖는다.

2개의 게놈 엇갈림 말단의 각각의 오버행 (2개의 위치에서 게놈을 절단한 후)은 임의의 편리한 길이일 수 있다. 일부 실시양태에서, 2개의 게놈 엇갈림 말단의 각각의 오버행 (2개의 위치에서 게놈을 절단한 후)은 독립적으로 2-20 뉴클레오티드 (nt) 길이 (예를 들어, 2-18, 2-15, 2-12, 2-10, 2-8, 2-7, 2-6, 2-5, 3-20, 3-18, 3-15, 3-12, 3-10, 3-8, 3-7, 3-6, 3-5, 4-20, 4-18, 4-15, 4-12, 4-10, 4-8, 4-7 또는 4-6 nt)일 수 있다. 일부 경우에, 2개의 게놈 엇갈림 말단의 각각의 오버행 (2개의 위치에서 게놈을 절단한 후)은 독립적으로 2-20 뉴클레오티드 길이일 수 있다. 일부 경우에, 2개의 게놈 엇갈림 말단의 각각의 오버행 (2개의 위치에서 게놈을 절단한 후)은 독립적으로 2-15 뉴클레오티드 길이일 수 있다. 일부 경우에, 2개의 게놈 엇갈림 말단의 각각의 오버행 (2개의 위치에서 게놈을 절단한 후)은 독립적으로 2-10 뉴클레오티드 길이일 수 있다.

일부 실시양태에서, 2개의 엇갈림 말단 절단 (게놈 내의 2개의 위치)을 생성하기 전에, 2개의 위치는 1,000,000 염기 쌍 (bp) 이하 (예를 들어, 500,000 bp 이하, 100,000 bp 이하, 50,000 bp 이하, 10,000 bp 이하, 1,000 bp 이하, 750 bp 이하 또는 500 bp 이하)만큼 이격되어 있다. 일부 경우에, 2개의 위치는 100,000 bp 이하만큼 이격되어 있다. 일부 경우에, 2개의 위치는 50,000 bp 이하만큼 이격되어 있다. 일부 실시양태에서, 2개의 엇갈림 말단 절단 (게놈 내의 2개의 위치)을 생성하기 전에, 2개의 위치는 5 내지 1,000,000 염기 쌍 (bp)의 범위 (예를 들어, 5 내지 500,000, 5 내지 100,000, 5 내지 50,000, 5 내지 10,000, 5 내지 5,000, 5 내지 1,000, 5 내지 500, 10 내지 1,000,000, 10 내지 500,000, 10 내지 100,000, 10 내지 50,000, 10 내지 10,000, 10 내지 5,000, 10 내지 1,000, 10 내지 500, 50 내지 1,000,000, 50 내지 500,000, 50 내지 100,000, 50 내지 50,000, 50 내지 10,000, 50 내지 5,000, 50 내지 1,000, 50 내지 500, 100 내지 1,000,000, 100 내지 500,000, 100 내지 100,000, 100 내지 50,000, 100 내지 10,000, 100 내지 5,000, 100 내지 1,000, 100 내지 500, 300 내지 1,000,000, 300 내지 500,000, 300 내지 100,000, 300 내지 50,000, 300 내지 10,000, 300 내지 5,000, 300 내지 1,000, 300 내지 500, 500 내지 1,000,000, 500 내지 500,000, 500 내지 100,000, 500 내지 50,000, 500 내지 10,000, 500 내지 5,000, 500 내지 1,000, 1,000 내지 1,000,000, 1,000 내지 500,000, 1,000 내지 100,000, 1,000 내지 50,000, 1,000 내지 10,000, 또는 1,000 내지 5,000 bp)만큼 이격되어 있다.

일부 경우에, 2개의 위치는 20 내지 1,000,000 bp의 범위만큼 이격되어 있다. 일부 경우에, 2개의 위치는 20 내지 500,000 bp의 범위만큼 이격되어 있다. 일부 경우에, 2개의 위치는 20 내지 150,000 bp의 범위만큼 이격되어 있다. 일부 경우에, 2개의 위치는 20 내지 50,000 bp의 범위만큼 이격되어 있다. 일부 경우에, 2개의 위치는 20 내지 20,000 bp의 범위만큼 이격되어 있다. 일부 경우에, 2개의 위치는 20 내지 15,000 bp의 범위만큼 이격되어 있다. 일부 경우에, 2개의 위치는 20 내지 10,000 bp의 범위만큼 이격되어 있다.

일부 경우에, 2개의 위치는 500 내지 1,000,000 bp의 범위만큼 이격되어 있다. 일부 경우에, 2개의 위치는 500 내지 500,000 bp의 범위만큼 이격되어 있다. 일부 경우에, 2개의 위치는 500 내지 150,000 bp의 범위만큼 이격되어 있다. 일부 경우에, 2개의 위치는 500 내지 50,000 bp의 범위만큼 이격되어 있다. 일부 경우에, 2개의 위치는 500 내지 20,000 bp의 범위만큼 이격되어 있다. 일부 경우에, 2개의 위치는 500 내지 15,000 bp의 범위만큼 이격되어 있다. 일부 경우에, 2개의 위치는 500 내지 10,000 bp의 범위만큼 이격되어 있다.

일부 경우에, 2개의 위치는 1,000 내지 1,000,000 bp의 범위만큼 이격되어 있다. 일부 경우에, 2개의 위치는 1,000 내지 500,000 bp의 범위만큼 이격되어 있다. 일부 경우에, 2개의 위치는 1,000 내지 150,000 bp의 범위만큼 이격되어 있다. 일부 경우에, 2개의 위치는 1,000 내지 50,000 bp의 범위만큼 이격되어 있다. 일부 경우에, 2개의 위치는 1,000 내지 20,000 bp의 범위만큼 이격되어 있다. 일부 경우에, 2개의 위치는 1,000 내지 15,000 bp의 범위만큼 이격되어 있다. 일부 경우에, 2개의 위치는 1,000 내지 10,000 bp의 범위만큼 이격되어 있다.

일부 경우에, 2개의 위치는 5,000 내지 1,000,000 bp의 범위만큼 이격되어 있다. 일부 경우에, 2개의 위치는 5,000 내지 500,000 bp의 범위만큼 이격되어 있다. 일부 경우에, 2개의 위치는 5,000 내지 150,000 bp의 범위만큼 이격되어 있다. 일부 경우에, 2개의 위치는 5,000 내지 50,000 bp의 범위만큼 이격되어 있다. 일부 경우에, 2개의 위치는 5,000 내지 20,000 bp의 범위만큼 이격되어 있다. 일부 경우에, 2개의 위치는 5,000 내지 15,000 bp의 범위만큼 이격되어 있다. 일부 경우에, 2개의 위치는 5,000 내지 10,000 bp의 범위만큼 이격되어 있다.

대상 부위-특이적 뉴클레아제는 게놈 DNA에 이중 가닥 절단을 도입하여 엇갈림 말단을 생성할 수 있는 (예를 들어, DNA의 대향하는 가닥에서 2개의 오프셋 단일 가닥 절단을 통해) 것이다. 일부 경우에, 부위-특이적 뉴클레아제, 예컨대 메가뉴클레아제 (또는 부류 2 CRISPR/Cas 이펙터 단백질, 예컨대 Cpf1)는 자연적으로 엇갈림 말단을 생성한다. 일부 부위-특이적 뉴클레아제는 조작된 단백질 (예를 들어, 아연 핑거 뉴클레아제 (ZFN) 및 전사 활성화제-유사 이펙터 뉴클레아제 (TALEN))이고, 일부 경우에 이러한 단백질은 엇갈림 말단을 생성하기 위해 단백질 쌍으로서 사용된다. 일부 경우에, 부위-특이적 뉴클레아제는 자연적으로는 평활 단일 가닥 절단을 생성하지만 (예를 들어, 부류 2 CRISPR/Cas 이펙터 단백질, 예컨대 Cas9) 단백질이 니카제 (DNA의 단지 1개의 가닥만을 절단함)이도록 돌연변이된 것이다. 니카제 단백질, 예컨대 돌연변이된 니카제 Cas9를 사용하여 표적 DNA의 대향 가닥을 표적화하는 2개의 가이드 RNA를 사용함으로써 엇갈림 말단을 생성할 수 있다. 따라서, 일부 경우에 대상 방법은 2개의 가이드 RNA와 함께 서열 특이적 니카제 (예를 들어, 니카제 부류 2 CRISPR/Cas 이펙터 단백질, 예컨대 니카제 Cas9)를 사용하여 2개의 게놈 위치 중 (적어도) 1개에서 엇갈림 절단을 생성하는 것을 포함한다. 일부 경우에, 대상 방법은 4개의 가이드 RNA와 함께 서열 특이적 니카제 (예를 들어, 니카제 부류 2 CRISPR/Cas 이펙터 단백질, 예컨대 니카제 Cas9)를 사용하여 2개의 게놈 위치에서 2개의 엇갈림 절단을 생성하는 것을 포함한다.

임의의 편리한 부위-특이적 뉴클레아제 (예를 들어, 유전자 편집 단백질, 예컨대 임의의 편리한 프로그램가능한 유전자 편집 단백질)가 사용될 수 있다. 적합한 프로그램가능한 유전자 편집 단백질의 예는 전사 활성화제-유사 이펙터 뉴클레아제 (TALEN), 아연-핑거 뉴클레아제 (ZFN), 및 CRISPR/Cas RNA-가이드 폴리펩티드, 예컨대 Cas9, CasX, CasY, Cpf1, Cas13, MAD7 등을 포함하나 이에 제한되지는 않는다. 사용될 수 있는 부위-특이적 뉴클레아제의 예는 전사 활성화제-유사 이펙터 뉴클레아제 (TALEN), 아연-핑거 뉴클레아제 (ZFN), 및 CRISPR/Cas RNA-가이드 폴리펩티드, 예컨대 Cas9, CasX, CasY, Cpf1, Cas13, MAD7 등); 메가뉴클레아제 (예를 들어, I-SceI, I-CeuI, I-CreI, I-DmoI, I-ChuI, I-DirI, I-FlmuI, I-FlmuII, I-Anil, I-SceIV, I-CsmI, I-PanI, I-PanII, I-PanMI, I-SceII, I-PpoI, I-SceIII, I-LtrI, I-GpiI, I-GZeI, I-OnuI, I-HjeMI, I-MsoI, I-TevI, I-TevII, I-TevIII, PI-MleI, PI-MtuI, PI-PspI, PI-Tli I, PI-Tli II, PI-SceV 등); 및 귀소 엔도뉴클레아제를 포함하나 이에 제한되지는 않는다.

일부 경우에, 전달 비히클은 유전자 편집 도구 (즉, 유전자 편집 시스템, 예를 들어 부위-특이적 절단 시스템, 예컨대 프로그램가능한 유전자 편집 시스템의 성분)를 코딩하는 핵산을 전달하는데 사용된다. 예를 들어, 핵산 페이로드는 (i) CRISPR/Cas 가이드 RNA, (ii) CRISPR/Cas 가이드 RNA를 코딩하는 DNA, (iii) 프로그램가능한 유전자 편집 단백질, 예컨대 아연 핑거 단백질 (ZFP) (예를 들어, 아연 핑거 뉴클레아제 - ZFN), 전사 활성화제-유사 이펙터 (TALE) 단백질 (예를 들어, 뉴클레아제에 융합된 것 - TALEN), 및/또는 CRISPR/Cas RNA-가이드 폴리펩티드 (예를 들어, Cas9, CasX, CasY, Cpf1, Cas13, MAD7 등)을 코딩하는 DNA 및/또는 RNA; (iv) 메가뉴클레아제를 코딩하는 DNA 및/또는 RNA; (v) 귀소 엔도뉴클레아제를 코딩하는 DNA 및/또는 RNA; 및 (iv) 공여자 DNA 분자 중 1개 이상을 포함할 수 있다.

일부 경우에, 대상 전달 비히클은 단백질 페이로드, 예를 들어 단백질, 예컨대 ZFN, TALEN, CRISPR/Cas RNA-가이드 폴리펩티드 (부류 2 CRISPR/Cas 이펙터 단백질) (예를 들어, Cas9, CasX, CasY, Cpf1, Cas13, MAD7 등), 메가뉴클레아제, 및 귀소 엔도뉴클레아제, Cas13, MAD7을 전달하는데 사용된다.

시스템의 성질 및 목적하는 결과에 따라, 유전자 편집 시스템 (예를 들어 부위-특이적 유전자 편집 시스템, 예컨대 프로그램가능한 유전자 편집 시스템)은 단일 성분 (예를 들어, ZFP, ZFN, TALE, TALEN, 메가뉴클레아제 등)을 포함할 수 있거나 또는 다중 성분을 포함할 수 있다. 일부 경우에, 유전자 편집 시스템은 적어도 2개의 성분을 포함한다. 예를 들어, 일부 경우에 유전자 편집 시스템 (예를 들어 프로그램가능한 유전자 편집 시스템)은 (i) 공여자 DNA 분자 핵산; 및 (ii) 유전자 편집 단백질 (예를 들어, 프로그램가능한 유전자 편집 단백질, 예컨대 ZFP, ZFN, TALE, TALEN, DNA-가이드 폴리펩티드, 예컨대 나트로노박테리움 그레고리 아르고노트(Natronobacterium gregoryi Argonaute) (NgAgo), CRISPR/Cas RNA-가이드 폴리펩티드, 예컨대 Cas9, CasX, CasY 또는 Cpf1, Cas13, MAD7 등), 또는 유전자 편집 단백질을 코딩하는 핵산 분자 (예를 들어, DNA 또는 RNA, 예컨대 플라스미드 또는 mRNA)를 포함한다. 또 다른 예로서, 일부 경우에 유전자 편집 시스템 (예를 들어 프로그램가능한 유전자 편집 시스템)은 (i) CRISPR/Cas 가이드 RNA, 또는 CRISPR/Cas 가이드 RNA를 코딩하는 DNA; 및 (ii) CRISPR/CAS RNA-가이드 폴리펩티드 (예를 들어, Cas9, CasX, CasY, Cpf1, Cas13, MAD7 등), 또는 RNA-가이드 폴리펩티드를 코딩하는 핵산 분자 (예를 들어, DNA 또는 RNA, 예컨대 플라스미드 또는 mRNA)를 포함한다. 또 다른 예로서, 일부 경우에 유전자 편집 시스템 (예를 들어 프로그램가능한 유전자 편집 시스템)은 (i) NgAgo-유사 가이드 DNA; 및 (ii) DNA-가이드 폴리펩티드 (예를 들어, NgAgo), 또는 DNA-가이드 폴리펩티드를 코딩하는 핵산 분자 (예를 들어, DNA 또는 RNA, 예컨대 플라스미드 또는 mRNA)를 포함한다. 일부 경우에, 유전자 편집 시스템 (예를 들어 프로그램가능한 유전자 편집 시스템)은 적어도 3개의 성분: (i) 공여자 DNA 분자; (ii) CRISPR/Cas 가이드 RNA, 또는 CRISPR/Cas 가이드 RNA를 코딩하는 DNA; 및 (iii) CRISPR/Cas RNA-가이드 폴리펩티드 (예를 들어, Cas9, CasX, CasY 또는 Cpf1), 또는 RNA-가이드 폴리펩티드를 코딩하는 핵산 분자 (예를 들어, DNA 또는 RNA, 예컨대 플라스미드 또는 mRNA)를 포함한다. 일부 경우에, 유전자 편집 시스템 (예를 들어 프로그램가능한 유전자 편집 시스템)은 적어도 3개의 성분: (i) 공여자 DNA 분자; (ii) NgAgo-유사 가이드 DNA, 또는 NgAgo-유사 가이드 DNA를 코딩하는 DNA; 및 (iii) DNA-가이드 폴리펩티드 (예를 들어, NgAgo), 또는 DNA-가이드 폴리펩티드를 코딩하는 핵산 분자 (예를 들어, DNA 또는 RNA, 예컨대 플라스미드 또는 mRNA)를 포함한다.

일부 실시양태에서, 전달 비히클의 페이로드는 1개 이상의 유전자 편집 도구를 포함한다. 용어 "유전자 편집 도구"는 유전자 편집 시스템의 1개 이상의 성분을 지칭하는 것으로 본원에 사용된다. 따라서, 일부 경우에 페이로드는 유전자 편집 시스템을 포함하고, 일부 경우에 페이로드는 유전자 편집 시스템의 1개 이상의 성분 (즉, 1개 이상의 유전자 편집 도구)을 포함한다. 예를 들어, 표적 세포는 유전자 편집 시스템의 성분 중 1개를 이미 포함할 수 있고, 사용자는 단지 나머지 성분만을 첨가할 필요가 있다. 이러한 경우에 대상 나노입자의 페이로드는 주어진 유전자 편집 시스템의 성분 모두를 반드시 포함하는 것은 아니다. 따라서, 일부 경우에 페이로드는 1개 이상의 유전자 편집 도구를 포함한다.

예시적인 예로서, 표적 세포는 유전자 편집 단백질 (예를 들어, ZFP, TALE, DNA-가이드 폴리펩티드 (예를 들어, NgAgo), CRISPR/Cas RNA-가이드 폴리펩티드, 예컨대 Cas9, CasX, CasY, Cpf1, Cas13, MAD7 등), 및/또는 단백질을 코딩하는 DNA 또는 RNA를 이미 포함할 수 있고, 따라서 페이로드는 (i) 공여자 DNA 분자; 및 (ii) CRISPR/Cas 가이드 RNA, 또는 CRISPR/Cas 가이드 RNA를 코딩하는 DNA; 또는 NgAgo-유사 가이드 DNA 중 1개 이상을 포함할 수 있다. 마찬가지로, 표적 세포는 CRISPR/Cas 가이드 RNA 및/또는 가이드 RNA를 코딩하는 DNA 또는 NgAgo-유사 가이드 DNA를 이미 포함할 수 있고, 페이로드는 (i) 공여자 DNA 분자; 및 (ii) CRISPR/Cas RNA-가이드 폴리펩티드 (예를 들어, Cas9, CasX, CasY, Cpf1, Cas13, MAD7 등), 또는 RNA-가이드 폴리펩티드를 코딩하는 핵산 분자 (예를 들어, DNA 또는 RNA, 예컨대 플라스미드 또는 mRNA); 또는 DNA-가이드 폴리펩티드 (예를 들어, NgAgo), 또는 DNA-가이드 폴리펩티드를 코딩하는 핵산 분자 중 1개 이상을 포함할 수 있다.

프로그램가능한 유전자 편집 도구 (예를 들어, CRISPR/Cas RNA-가이드 단백질, 예컨대 Cas9, CasX, CasY 및 Cpf1, 아연 핑거 단백질, 예컨대 아연 핑거 뉴클레아제, TALE 단백질, 예컨대 TALEN, CRISPR/Cas 가이드 RNA 등)에 관한 추가의 정보에 대해, 예를 들어 다음 문헌을 참조한다: [Dreier, et al., (2001) J Biol Chem 276:29466-78; Dreier, et al., (2000) J Mol Biol 303:489-502; Liu, et al., (2002) J Biol Chem 277:3850-6); Dreier, et al., (2005) J Biol Chem 280:35588-97; Jamieson, et al., (2003) Nature Rev Drug Discov 2:361-8; Durai, et al., (2005) Nucleic Acids Res 33:5978-90; Segal, (2002) Methods 26:76-83; Porteus and Carroll, (2005) Nat Biotechnol 23:967-73; Pabo, et al., (2001) Ann Rev Biochem 70:313-40; Wolfe, et al., (2000) Ann Rev Biophys Biomol Struct 29:183-212; Segal and Barbas, (2001) Curr Opin Biotechnol 12:632-7; Segal, et al., (2003) Biochemistry 42:2137-48; Beerli and Barbas, (2002) Nat Biotechnol 20:135-41; Carroll, et al., (2006) Nature Protocols 1:1329; Ordiz, et al., (2002) Proc Natl Acad Sci USA 99:13290-5; Guan, et al., (2002) Proc Natl Acad Sci USA 99:13296-301; Sanjana et al., Nature Protocols, 7:171-192 (2012); Zetsche et al., Cell. 2015 Oct 22;163(3):759-71; Makarova et al., Nat Rev Microbiol. 2015 Nov;13(11):722-36; Shmakov et al., Mol Cell. 2015 Nov 5;60(3):385-97; Jinek et al., Science. 2012 Aug 17;337(6096):816-21; Chylinski et al., RNA Biol. 2013 May;10(5):726-37; Ma et al., Biomed Res Int. 2013;2013:270805; Hou et al., Proc Natl Acad Sci U S A. 2013 Sep 24;110(39):15644-9; Jinek et al., Elife. 2013;2:e00471; Pattanayak et al., Nat Biotechnol. 2013 Sep;31(9):839-43; Qi et al., Cell. 2013 Feb 28;152(5):1173-83; Wang et al., Cell. 2013 May 9;153(4):910-8; Auer et al., Genome Res. 2013 Oct 31; Chen et al., Nucleic Acids Res. 2013 Nov 1;41(20):e19; Cheng et al., Cell Res. 2013 Oct;23(10):1163-71; Cho et al., Genetics. 2013 Nov;195(3):1177-80; DiCarlo et al., Nucleic Acids Res. 2013 Apr;41(7):4336-43; Dickinson et al., Nat Methods. 2013 Oct;10(10):1028-34; Ebina et al., Sci Rep. 2013;3:2510; Fujii et al., Nucleic Acids Res. 2013 Nov 1;41(20):e187; Hu et al., Cell Res. 2013 Nov;23(11):1322-5; Jiang et al., Nucleic Acids Res. 2013 Nov 1;41(20):e188; Larson et al., Nat Protoc. 2013 Nov;8(11):2180-96; Mali et. at., Nat Methods. 2013 Oct;10(10):957-63; Nakayama et al., Genesis. 2013 Dec;51(12):835-43; Ran et al., Nat Protoc. 2013 Nov;8(11):2281-308; Ran et al., Cell. 2013 Sep 12;154(6):1380-9; Upadhyay et al., G3 (Bethesda). 2013 Dec 9;3(12):2233-8; Walsh et al., Proc Natl Acad Sci U S A. 2013 Sep 24;110(39):15514-5; Xie et al., Mol Plant. 2013 Oct 9; Yang et al., Cell. 2013 Sep 12;154(6):1370-9; Briner et al., Mol Cell. 2014 Oct 23;56(2):333-9; Burstein et al., Nature. 2016 Dec 22 - Epub ahead of print; Gao et al., Nat Biotechnol. 2016 Jul 34(7):768-73; 및 Shmakov et al., Nat Rev Microbiol. 2017 Mar;15(3):169-182]; 뿐만 아니라 국제 특허 출원 공개 번호 WO2002099084; WO00/42219; WO02/42459; WO2003062455; WO03/080809; WO05/014791; WO05/084190; WO08/021207; WO09/042186; WO09/054985; 및 WO10/065123; 미국 특허 출원 공개 번호 20030059767, 20030108880, 20140068797; 20140170753; 20140179006; 20140179770; 20140186843; 20140186919; 20140186958; 20140189896; 20140227787; 20140234972; 20140242664; 20140242699; 20140242700; 20140242702; 20140248702; 20140256046; 20140273037; 20140273226; 20140273230; 20140273231; 20140273232; 20140273233; 20140273234; 20140273235; 20140287938; 20140295556; 20140295557; 20140298547; 20140304853; 20140309487; 20140310828; 20140310830; 20140315985; 20140335063; 20140335620; 20140342456; 20140342457; 20140342458; 20140349400; 20140349405; 20140356867; 20140356956; 20140356958; 20140356959; 20140357523; 20140357530; 20140364333; 20140377868; 20150166983; 및 20160208243; 및 미국 특허 번호 6,140,466; 6,511,808; 6,453,242 8,685,737; 8,906,616; 8,895,308; 8,889,418; 8,889,356; 8,871,445; 8,865,406; 8,795,965; 8,771,945; 및 8,697,359 (이들 모두는 그 전문이 본원에 참조로 포함됨).

공여자 DNA 및 게놈의 엇갈림 말단

대상 공여자 DNA는 점착성 말단 (즉, 엇갈림 말단)을 갖는 선형 이중 가닥 DNA이다 (예를 들어, 도 1 참조). 대상 공여자 DNA는 선형이고, (i) 서로 혼성화되어 염기 쌍을 형성하는 DNA의 2개의 가닥을 갖고 (ii) 단일 가닥은 각각의 말단에 오버행을 갖는다. 일부 경우에, 2개의 공여자 DNA가 사용되며 (예를 들어, 게놈 DNA의 2개의 절편을 편집하기 위해), 이러한 경우에 4개의 엇갈림 절단이 게놈 내로 도입된다 - 공여자 DNA당 2개.

일부 경우에, 공여자 DNA의 2개의 가닥은 서로 혼성화되어 총 10 이상의 염기 쌍 (bp) (예를 들어, 20 이상, 30 이상, 50 이상, 100 이상 또는 200 이상의 bp)을 형성한다. 다시 말해서, 일부 경우에 대상 공여자 DNA는 10 이상의 bp (예를 들어, 20 이상, 30 이상, 50 이상, 100 이상 또는 200 이상의 bp)를 갖는다.

일부 경우에, 대상 공여자 DNA는 총 10 염기 쌍 (bp) 내지 100 킬로염기 쌍 (kbp) (예를 들어, 10 bp 내지 70 kbp, 10 bp 내지 50 kbp, 10 bp 내지 40 kbp, 10 bp 내지 25 kbp, 10 bp 내지 15 kbp, 10 bp 내지 10 kbp, 10 bp 내지 1 kbp, 10 bp 내지 750 bp, 10 bp 내지 500 bp, 10 bp 내지 250 bp, 10 bp 내지 150 bp, 10 bp 내지 100 bp, 10 bp 내지 50 bp, 18 bp 내지 100 kbp, 18 bp 내지 70 kbp, 18 bp 내지 50 kbp, 18 bp 내지 40 kbp, 18 bp 내지 25 kbp, 18 bp 내지 15 kbp, 18 bp 내지 10 kbp, 18 bp 내지 1 kbp, 18 bp 내지 750 bp, 18 bp 내지 500 bp, 18 bp 내지 250 bp, 18 bp 내지 150 bp, 25 bp 내지 100 kbp, 25 bp 내지 70 kbp, 25 bp 내지 50 kbp, 25 bp 내지 40 kbp, 25 bp 내지 25 kbp, 25 bp 내지 15 kbp, 25 bp 내지 10 kbp, 25 bp 내지 1 kbp, 25 bp 내지 750 bp, 25 bp 내지 500 bp, 25 bp 내지 250 bp, 25 bp 내지 150 bp, 50 bp 내지 100 kbp, 50 bp 내지 70 kbp, 50 bp 내지 50 kbp, 50 bp 내지 40 kbp, 50 bp 내지 25 kbp, 50 bp 내지 15 kbp, 50 bp 내지 10 kbp, 50 bp 내지 1 kbp, 50 bp 내지 750 bp, 50 bp 내지 500 bp, 50 bp 내지 250 bp, 50 bp 내지 150 bp, 100 bp 내지 100 kbp, 100 bp 내지 70 kbp, 100 bp 내지 50 kbp, 100 bp 내지 40 kbp, 100 bp 내지 25 kbp, 100 bp 내지 15 kbp, 100 bp 내지 10 kbp, 100 bp 내지 1 kbp, 100 bp 내지 750 bp, 100 bp 내지 500 bp, 100 bp 내지 250 bp, 200 bp 내지 100 kbp, 200 bp 내지 70 kbp, 200 bp 내지 50 kbp, 200 bp 내지 40 kbp, 200 bp 내지 25 kbp, 200 bp 내지 15 kbp, 200 bp 내지 10 kbp, 200 bp 내지 1 kbp, 200 bp 내지 750 bp, 또는 200 bp 내지 500 bp)을 갖는다. 다시 말해서, 일부 경우에, 공여자 DNA의 2개의 가닥은 서로 혼성화되어 총 10 bp 내지 100 kbp를 형성한다. 일부 경우에, 대상 공여자 DNA는 총 10 bp 내지 50 kbp를 갖는다. 일부 경우에, 대상 공여자 DNA는 총 10 bp 내지 10 kbp를 갖는다. 일부 경우에, 대상 공여자 DNA는 총 10 bp 내지 1 kbp를 갖는다. 일부 경우에, 대상 공여자 DNA는 총 20 bp 내지 50 kbp를 갖는다. 일부 경우에, 대상 공여자 DNA는 총 20 bp 내지 10 kbp를 갖는다. 일부 경우에, 대상 공여자 DNA는 총 20 bp 내지 1 kbp를 갖는다.

일부 실시양태에서 공여자 DNA 오버행의 길이는 공지되어 있고 잘 규정되어 있다. 예를 들어, 공여자 DNA가 뉴클레아제, 예컨대 TALEN을 사용하여 보다 큰 주형으로부터 절단되는 경우에 - 이는 다양한 미규정 및 미지의 오버행 길이를 갖는 공여자 DNA의 집단을 일으킬 수 있다. 다른 한편으로, 공여자 DNA는 공여자 DNA의 집단이 동일한 기지의 규정된 오버행을 갖는 동일한 공여자 DNA의 카피이도록 합성될 수 있다 (예를 들어, 시험관내 합성). 일부 경우에, 공여자 DNA는 PCR 산물로서 생산되고, 이는 후속적으로 효소 (예를 들어, 제한 효소 또는 부류 2 CRISPR/Cas 이펙터 단백질, 예컨대 Cas9)로 소화되어 점착성 말단을 생성한다.

대상 공여자 DNA의 각각의 말단은 독립적으로 5' 또는 3' 단일 가닥 오버행을 가질 수 있다. 예를 들어, 일부 경우에 공여자 DNA의 양쪽 말단은 5' 오버행을 갖는다. 일부 경우에, 공여자 DNA의 양쪽 말단은 3' 오버행을 갖는다. 일부 경우에, 공여자 DNA의 한 말단은 5' 오버행을 갖는 반면 다른 말단은 3' 오버행을 갖는다. 각각의 오버행은 임의의 편리한 길이일 수 있다. 일부 경우에, 각각의 오버행의 길이는 독립적으로 2-200 뉴클레오티드 (nt) 길이일 수 있다 (예를 들어, 2-150, 2-100, 2-50, 2-25, 2-20, 2-15, 2-12, 2-10, 2-8, 2-7, 2-6, 2-5, 3-150, 3-100, 3-50, 3-25, 3-20, 3-15, 3-12, 3-10, 3-8, 3-7, 3-6, 3-5, 4-150, 4-100, 4-50, 4-25, 4-20, 4-15, 4-12, 4-10, 4-8, 4-7, 4-6, 5-150, 5-100, 5-50, 5-25, 5-20, 5-15, 5-12, 5-10, 5-8 또는 5-7 nt 참조). 일부 경우에, 각각의 오버행의 길이는 독립적으로 2-20 nt 길이일 수 있다. 일부 경우에, 각각의 오버행의 길이는 독립적으로 2-15 nt 길이일 수 있다. 일부 경우에, 각각의 오버행의 길이는 독립적으로 2-10 nt 길이일 수 있다. 일부 경우에, 각각의 오버행의 길이는 독립적으로 2-7 nt 길이일 수 있다.

공여자 DNA가 게놈의 2개의 엇갈림 말단 (본원에서 게놈 엇갈림 말단으로도 지칭됨) 내로 삽입되는 경우에 (게놈이 2개의 위치에서 절단된 후), 공여자 DNA의 각각의 말단은 독립적으로 총 2-20 염기 쌍 (bp) (예를 들어, 2-18, 2-16, 2-15, 2-12, 2-10, 2-8, 2-6, 2-5, 3-20, 3-18, 3-16, 3-15, 3-12, 3-10, 3-8, 3-6, 3-5, 4-20, 4-18, 4-16, 4-15, 4-12, 4-10, 4-8, 4-6, 5-20, 5-18, 5-16, 5-15, 5-12, 5-10, 8-20, 8-18, 8-16, 8-15, 8-12, 8-10, 5-8, 10-20, 10-18, 10-16, 10-15 또는 10-12 bp)에 걸쳐 게놈의 오버행과 혼성화될 수 있다. 일부 경우에, 공여자 DNA의 오버행의 길이는 게놈의 오버행의 길이 이하이다. 일부 경우에, 게놈의 오버행의 길이는 공여자 DNA의 오버행의 길이 이하이다.

일부 실시양태에서, 공여자 DNA는 적어도 1개의 아데닐화된 3' 말단을 갖는다.

일부 경우에, 공여자 DNA는 모방체를 포함하고, 변형된 당 백본, 1개 이상의 변형된 뉴클레오시드간 연결 (예를 들어, 1개 이상의 포스포로티오에이트 및/또는 헤테로원자 뉴클레오시드간 연결), 1개 이상의 변형된 염기 등을 포함할 수 있다.

전달 비히클 / 페이로드

일부 실시양태에서, 대상 조성물 (예를 들어, 1개 이상의 서열 특이적 뉴클레아제, 1개 이상의 서열 특이적 뉴클레아제를 코딩하는 1개 이상의 핵산, 선형 이중 가닥 공여자 DNA 등)은 전달 비히클의 페이로드로서 (예를 들어, 일부 경우에 동일한 전달 비히클의 페이로드로서) 세포에 전달된다. 예를 들어, 일부 경우에, 대상 선형 이중 가닥 공여자 DNA (각각의 말단에 오버행을 가짐) 및 1개 이상의 서열 특이적 뉴클레아제 (예컨대 메가뉴클레아제, 귀소 엔도뉴클레아제, 아연 핑거 뉴클레아제, TALEN, CRISPR/Cas 이펙터 단백질) (또는 1개 이상의 서열 특이적 뉴클레아제를 코딩하는 1개 이상의 핵산)는 동일한 전달 비히클의 페이로드이다. 일부 이러한 경우에 페이로드는 함께 결합하여 데옥시리보핵단백질 복합체 (예를 들어, 공여자 DNA 및 뉴클레아제를 포함하는 복합체) 또는 리보-데옥시리보핵단백질 복합체 (예를 들어, CRISPR/Cas 가이드 RNA를 추가로 포함하는 복합체)를 형성한다.

전달 비히클은 비-바이러스 비히클, 바이러스 비히클, 나노입자 (예를 들어, 표적화 리간드 및/또는 음이온성 중합체 조성물, 양이온성 중합체 조성물 및 양이온성 폴리펩티드 조성물을 포함하는 코어를 포함하는 나노입자), 리포솜, 미셀, 물-오일-물 에멀젼 입자, 오일-물 에멀젼 미셀 입자, 다층상 물-오일-물 에멀젼 입자, 하전된 중합체 폴리펩티드 도메인에 접합된 표적화 리간드 (예를 들어, 펩티드 표적화 리간드) (여기서 표적화 리간드는 세포 표면 단백질에 대한 표적화된 결합을 제공하고, 하전된 중합체 폴리펩티드 도메인은 핵산 페이로드와 축합되고/거나 단백질 페이로드와 정전기적으로 상호작용함), 페이로드에 접합된 표적화 리간드 (예를 들어, 펩티드 표적화 리간드) (여기서 표적화 리간드는 세포 표면 단백질에 대한 표적화된 결합을 제공함)를 포함할 수 있으나 이에 제한되지는 않는다.

일부 경우에, 전달 비히클은 물-오일-물 에멀젼 입자이다. 일부 경우에, 전달 비히클은 오일-물 에멀젼 미셀 입자이다. 일부 경우에, 전달 비히클은 다층상 물-오일-물 에멀젼 입자이다. 일부 경우에, 전달 비히클은 다층 입자이다. 일부 경우에, 전달 비히클은 DNA 오리가미 나노봇이다. 상기 중 임의의 것에 대해, 페이로드 (핵산 및/또는 단백질)는 공유적으로, 핵산 상보적 쌍으로서, 또는 입자의 수상 내의 것으로, 입자의 내부에 존재할 수 있다. 일부 경우에, 전달 비히클은 표적화 리간드, 예를 들어 일부 경우에 물-오일-물 에멀젼 입자 상에, 오일-물 에멀젼 미셀 입자 상에, 다층상 물-오일-물 에멀젼 입자 상에, 다층 입자 상에 또는 DNA 오리가미 나노봇 상에 코팅된 표적화 리간드 (본원의 다른 곳에 보다 상세히 기재됨)를 포함한다. 일부 경우에, 전달 비히클은 금속 입자 코어를 갖고, 페이로드 (예를 들어, 공여자 DNA 및/또는 부위-특이적 뉴클레아제 또는 이를 코딩하는 핵산)는 금속 코어에 접합 (공유 결합)될 수 있다.

나노입자

본 개시내용의 나노입자는 핵산 및/또는 단백질로 제조될 수 있는 페이로드를 포함한다. 예를 들어, 일부 경우에 대상 나노입자는 핵산 페이로드 (예를 들어, DNA 및/또는 RNA)를 전달하는데 사용된다. 일부 경우에, 나노입자의 코어는 페이로드(들)를 포함한다. 일부 이러한 경우에 나노입자 코어는 또한 음이온성 중합체 조성물, 양이온성 중합체 조성물 및 양이온성 폴리펩티드 조성물을 포함할 수 있다. 일부 경우에, 나노입자는 금속성 코어를 갖고, 페이로드는 코어와 회합된다 (일부 경우에, 예를 들어 코어의 외부에 접합됨). 일부 실시양태에서, 페이로드는 나노입자 코어의 일부이다. 따라서, 대상 나노입자의 코어는 핵산, DNA, RNA 및/또는 단백질을 포함할 수 있다. 따라서, 일부 경우에 대상 나노입자는 핵산 (DNA 및/또는 RNA) 및 단백질을 포함한다. 일부 경우에, 대상 나노입자 코어는 리보핵단백질 (RNA 및 단백질) 복합체를 포함한다. 일부 경우에, 대상 나노입자 코어는 데옥시리보핵단백질 (DNA 및 단백질, 예를 들어 공여자 DNA 및 ZFN, TALEN 또는 CRISPR/Cas 이펙터 단백질) 복합체를 포함한다. 일부 경우에, 대상 나노입자 코어는 리보-데옥시리보핵단백질 (RNA 및 DNA 및 단백질, 예를 들어 가이드 RNA, 공여자 DNA 및 CRISPR/Cas 이펙터 단백질) 복합체를 포함한다. 일부 경우에, 대상 나노입자 코어는 PNA를 포함한다. 일부 경우에, 대상 코어는 PNA 및 DNA를 포함한다.

대상 핵산 페이로드 (예를 들어, 공여자 DNA 및/또는 서열 특이적 뉴클레아제를 코딩하는 핵산)는 모르폴리노 백본 구조를 포함할 수 있다. 일부 경우에, 대상 핵산 페이로드 (예를 들어, 공여자 DNA 및/또는 서열 특이적 뉴클레아제를 코딩하는 핵산)는 1개 이상의 잠금 핵산 (LNA)을 가질 수 있다. 적합한 당 치환기는 메톡시 (-O-CH₃), 아미노프로폭시 (--O CH₂ CH₂ CH₂NH₂), 알릴 (-CH₂-CH=CH₂), -O-알릴 (--O-- CH₂-CH=CH₂) 및 플루오로 (F)를 포함한다. 2'-당 치환 기는 아라비노 (상부) 위치 또는 리보 (하부) 위치에 있을 수 있다. 적합한 염기 변형은 합성 및 천연 핵염기, 예컨대 5-메틸시토신 (5-me-C), 5-히드록시메틸 시토신, 크산틴, 하이포크산틴, 2-아미노아데닌, 아데닌 및 구아닌의 6-메틸 및 다른 알킬 유도체, 아데닌 및 구아닌의 2-프로필 및 다른 알킬 유도체, 2-티오우라실, 2-티오티민 및 2-티오시토신, 5-할로우라실 및 시토신, 5-프로피닐 (-C=C-CH₃) 우라실 및 시토신 및 피리미딘 염기의 다른 알키닐 유도체, 6-아조 우라실, 시토신 및 티민, 5-우라실 (슈도우라실), 4-티오우라실, 8-할로, 8-아미노, 8-티올, 8-티오알킬, 8-히드록실 및 다른 8-치환된 아데닌 및 구아닌, 5-할로 특히 5-브로모, 5-트리플루오로메틸 및 다른 5-치환된 우라실 및 시토신, 7-메틸구아닌 및 7-메틸아데닌, 2-F-아데닌, 2-아미노-아데닌, 8-아자구아닌 및 8-아자아데닌, 7-데아자구아닌 및 7-데아자아데닌 및 3-데아자구아닌 및 3-데아자아데닌을 포함한다. 추가의 변형된 핵염기는 트리시클릭 피리미딘, 예컨대 페녹사진 시티딘 (1H-피리미도(5,4-b)(1,4)벤족사진-2(3H)-온), 페노티아진 시티딘 (1H-피리미도(5,4-b)(1,4)벤조티아진-2(3H)-온), G-클램프, 예컨대 치환된 페녹사진 시티딘 (예를 들어 9-(2-아미노에톡시)-H-피리미도(5,4-(b) (1,4)벤족사진-2(3H)-온), 카르바졸 시티딘 (2H-피리미도(4,5-b)인돌-2-온), 피리도인돌 시티딘 (H-피리도(3',2':4,5)피롤로(2,3-d)피리미딘-2-온)을 포함한다.

일부 경우에, 핵산 페이로드는 접합체 모이어티 (예를 들어, 핵산 페이로드의 활성, 안정성, 세포 분포 또는 세포 흡수를 증진시키는 것)를 포함할 수 있다. 이들 모이어티 또는 접합체는 관능기, 예컨대 1급 또는 2급 히드록실 기에 공유 결합된 접합체 기를 포함할 수 있다. 접합체 기는 삽입제, 리포터 분자, 폴리아민, 폴리아미드, 폴리에틸렌 글리콜, 폴리에테르, 올리고머의 약역학적 특성을 증진시키는 기 및 올리고머의 약동학적 특성을 증진시키는 기를 포함하나 이에 제한되지는 않는다. 적합한 접합체 기는 콜레스테롤, 지질, 인지질, 비오틴, 페나진, 폴레이트, 페난트리딘, 안트라퀴논, 아크리딘, 플루오레세인, 로다민, 쿠마린 및 염료를 포함하나 이에 제한되지는 않는다. 약역학적 특성을 증진시키는 군은 흡수를 개선시키고/거나, 분해에 대한 저항성을 증진시키고/거나, 표적 핵산과의 서열-특이적 혼성화를 강화시키는 군을 포함한다. 약동학적 특성을 증진시키는 기는 대상 핵산의 흡수, 분포, 대사 또는 배출을 개선시키는 기를 포함한다.

임의의 편리한 폴리뉴클레오티드는 공여자 DNA (예를 들어, 부위-특이적 뉴클레아제를 전달하기 위한)가 아닌 대상 핵산 페이로드로서 사용될 수 있다. 예는 다음을 포함하나 이에 제한되지는 않는다: DNA 및 RNA의 종, 예컨대 mRNA, m1A 변형된 mRNA (아데노신의 위치 1에서의 모노메틸화), 모르폴리노 RNA, 펩토이드 및 펩티드 핵산, cDNA, DNA 오리가미, 합성 뉴클레오티드를 갖는 DNA 및 RNA, 미리 규정된 2차 구조를 갖는 DNA 및 RNA, 및 상기 언급된 것의 다량체 및 올리고머.

일부 실시양태에서, 1개 초과의 페이로드가 동일한 패키지 (예를 들어, 나노입자)의 일부로서 전달되고, 예를 들어 일부 경우에는 상이한 페이로드가 상이한 코어의 일부이다. 동일한 전달 비히클 (예를 들어, 나노입자)의 일부로서 다중 페이로드를 전달하는 것의 한 이점은 각각의 페이로드의 효율이 희석되지 않는다는 것이다. 예시적인 예로서, 페이로드 A 및 페이로드 B가 2개의 개별 패키지/비히클 (각각 패키지 A 및 패키지 B)로 전달된다면, 효율은 곱셈되며, 예를 들어 패키지 A 및 패키지 B가 각각 1% 형질감염 효율을 갖는다면, 페이로드 A 및 페이로드 B를 동일한 세포에 전달할 가능성은 0.01% (1% X 1%)이다. 그러나, 페이로드 A 및 페이로드 B가 둘 다 동일한 전달 비히클의 일부로서 전달된다면, 페이로드 A 및 페이로드 B를 동일한 세포에 전달할 가능성은 0.01%보다 100배 개선된 1%이다.

마찬가지로, 패키지 A 및 패키지 B가 각각 0.1% 형질감염 효율을 갖는 시나리오에서, 페이로드 A 및 페이로드 B를 동일한 세포에 전달할 가능성은 0.0001% (0.1% X 0.1%)이다. 그러나, 페이로드 A 및 페이로드 B가 둘 다 이 시나리오에서 동일한 패키지의 일부 (예를 들어, 동일한 나노입자의 일부 - 패키지 A)로서 전달된다면, 페이로드 A 및 페이로드 B를 동일한 세포에 전달할 가능성은 0.0001% 초과의 1000배 개선된 0.1%이다.

따라서, 일부 실시양태에서, 1개 이상의 유전자 편집 도구 (예를 들어, 상기 기재된 바와 같음) 및 공여자 DNA는 게놈 편집 효율을 증가시키는 단백질 (및/또는 이를 코딩하는 DNA 또는 mRNA) 및/또는 비-코딩 RNA와 조합되어 (예를 들어, 동일한 나노입자의 일부로서) 전달된다. 일부 경우에, 1개 이상의 유전자 편집 도구 (예를 들어, 상기 기재된 바와 같음) 및 공여자 DNA는 세포 분열 및/또는 분화를 제어하는 단백질 (및/또는 이를 코딩하는 DNA 또는 mRNA) 및/또는 비-코딩 RNA와 조합되어 (예를 들어, 동일한 나노입자의 일부로서) 전달된다.

상기의 비제한적 예로서, 일부 실시양태에서 1개 이상의 유전자 편집 도구 및 공여자 DNA는 SCF (및/또는 SCF를 코딩하는 DNA 또는 mRNA), HoxB4 (및/또는 HoxB4를 코딩하는 DNA 또는 mRNA), BCL-XL (및/또는 BCL-XL을 코딩하는 DNA 또는 mRNA), SIRT6 (및/또는 SIRT6을 코딩하는 DNA 또는 mRNA), miR-155를 억제하는 핵산 분자 (예를 들어, siRNA 및/또는 LNA), ku70 발현을 감소시키는 핵산 분자 (예를 들어, siRNA, shRNA, 마이크로RNA), 및 ku80 발현을 감소시키는 핵산 분자 (예를 들어, siRNA, shRNA, 마이크로RNA) 중 1개 이상과 조합되어 전달될 수 있다.

유전자 편집 도구 (예를 들어, 부위-특이적 뉴클레아제) 및 공여자 DNA와 조합되어 전달될 수 있는 마이크로RNA의 예에 대해서는, 도 9A를 참조한다. 예를 들어, 하기 마이크로RNA가 하기 목적을 위해 사용될 수 있다: 만능 줄기 세포의 외배엽 계통으로의 분화를 차단하기 위해: miR-430/427/302 (예를 들어, MiR 염기 등록번호: MI0000738, MI0000772, MI0000773, MI0000774, MI0006417, MI0006418, MI0000402, MI0003716, MI0003717 및 MI0003718 참조); 만능 줄기 세포의 내배엽 계통으로의 분화를 차단하기 위해: miR-109 및/또는 miR-24 (예를 들어, MiR 염기 등록번호: MI0000080, MI0000081, MI0000231 및 MI0000572 참조); 만능 줄기 세포의 내배엽 계통으로의 분화를 유도하기 위해: miR-122 (예를 들어, MiR 염기 등록번호: MI0000442 및 MI0000256 참조) 및/또는 miR-192 (예를 들어, MiR 염기 등록번호: MI0000234 및 MI0000551 참조); 외배엽 전구 세포의 각질세포 운명으로의 분화를 유도하기 위해: miR-203 (예를 들어, MiR 염기 등록번호: MI0000283, MI0017343 및 MI0000246 참조); 신경 능선 줄기 세포의 평활근 운명으로의 분화를 유도하기 위해: miR-145 (예를 들어, MiR 염기 등록번호: MI0000461, MI0000169 및 MI0021890 참조); 신경 줄기 세포의 신경교 세포 운명 및/또는 뉴런 운명으로의 분화를 유도하기 위해: miR-9 (예를 들어, MiR 염기 등록번호: MI0000466, MI0000467, MI0000468, MI0000157, MI0000720 및 MI0000721 참조) 및/또는 miR-124a (예를 들어, MiR 염기 등록번호: MI0000443, MI0000444, MI0000445, MI0000150, MI0000716 및 MI0000717 참조); 중배엽 전구 세포의 연골세포 운명으로의 분화를 차단하기 위해: miR-199a (예를 들어, MiR 염기 등록번호: MI0000242, MI0000281, MI0000241 및 MI0000713 참조); 중배엽 전구 세포의 골모세포 운명으로의 분화를 유도하기 위해: miR-296 (예를 들어, MiR 염기 등록번호: MI0000747 및 MI0000394 참조) 및/또는 miR-2861 (예를 들어, MiR 염기 등록번호: MI0013006 및 MI0013007 참조); 중배엽 전구 세포의 심장 근육 운명으로의 분화를 유도하기 위해: miR-1 (예를 들어, MiR 염기 등록번호번호: MI0000437, MI0000651, MI0000139, MI0000652, MI0006283 참조); 중배엽 전구 세포의 심장 근육 운명으로의 분화를 차단하기 위해: miR-133 (예를 들어, MiR 염기 등록번호: MI0000450, MI0000451, MI0000822, MI0000159, MI0000820, MI0000821 및 MI0021863 참조); 중배엽 전구 세포의 골격근 운명으로의 분화를 유도하기 위해: miR-214 (예를 들어, MiR 염기 등록번호: MI0000290 및 MI0000698 참조), miR-206 (예를 들어, MiR 염기 등록번호: MI0000490 및 MI0000249 참조), miR-1 및/또는 miR-26a (예를 들어, MiR 염기 등록번호: MI0000083, MI0000750, MI0000573 및 MI0000706 참조); 중배엽 전구 세포의 골격근 운명으로의 분화를 차단하기 위해: miR-133 (예를 들어, MiR 염기 등록번호: MI0000450, MI0000451, MI0000822, MI0000159, MI0000820, MI0000821 및 MI0021863 참조), miR-221 (예를 들어, MiR 염기 등록번호: MI0000298 및 MI0000709 참조), 및/또는 miR-222 (예를 들어, MiR 염기 등록번호: MI0000299 및 MI0000710 참조); 분화로의 조혈 전구 세포의 분화를 유도하기 위해: miR-223 (예를 들어, MiR 염기 등록번호: MI0000300 및 MI0000703 참조); 분화로의 조혈 전구 세포의 분화를 차단하기 위해: miR-128a (예를 들어, MiR 염기 등록번호: MI0000447 및 MI0000155 참조) 및/또는 miR-181a (예를 들어, MiR 염기 등록번호: MI0000269, MI0000289, MI0000223 및 MI0000697 참조); 조혈 전구 세포의 림프 전구 세포로의 분화를 유도하기 위해: miR-181 (예를 들어, MiR 염기 등록번호: MI0000269, MI0000270, MI0000271, MI0000289, MI0000683, MI0003139, MI0000223, MI0000723, MI0000697, MI0000724, MI0000823 및 MI0005450 참조); 조혈 전구 세포의 림프 전구 세포로의 분화를 차단하기 위해: miR-146 (예를 들어, MiR 염기 등록번호: MI0000477, MI0003129, MI0003782, MI0000170 및 MI0004665 참조); 조혈 전구 세포의 골수 전구 세포로의 분화를 차단하기 위해: miR-155, miR-24a, 및/또는 miR-17 (예를 들어, MiR 염기 등록번호: MI0000071 및 MI0000687 참조); 림프 전구 세포의 T 세포 운명으로의 분화를 유도하기 위해: miR-150 (예를 들어, MiR 염기 등록번호: MI0000479 및 MI0000172 참조); 골수 전구 세포의 과립구 운명으로의 분화를 차단하기 위해: miR-223 (예를 들어, MiR 염기 등록번호: MI0000300 및 MI0000703 참조); 골수 전구 세포의 단핵구 운명으로의 분화를 차단하기 위해: miR-17-5p (예를 들어, MiR 염기 등록번호: MIMAT0000070 및 MIMAT0000649 참조), miR-20a (예를 들어, MiR 염기 등록번호: MI0000076 및 MI0000568 참조), 및/또는 miR-106a (예를 들어, MiR 염기 등록번호: MI0000113 및 MI0000406 참조); 골수 전구 세포의 적혈구 운명으로의 분화를 차단하기 위해: miR-150 (예를 들어, MiR 염기 등록번호: MI0000479 및 MI0000172 참조), miR-155, miR-221 (예를 들어, MiR 염기 등록번호: MI0000298 및 MI0000709 참조), 및/또는 miR-222 (예를 들어, MiR 염기 등록번호: MI0000299 및 MI0000710 참조); 및 골수 전구 세포의 적혈구 운명으로의 분화를 유도하기 위해: miR-451 (예를 들어, MiR 염기 등록번호: MI0001729, MI0017360, MI0001730 및 MI0021960 참조) 및/또는 miR-16 (예를 들어, MiR 염기 등록번호: MI0000070, MI0000115, MI0000565 및 MI0000566 참조).

유전자 편집 도구 및 공여자 DNA와 조합되어 (예를 들어, 단백질로서 또는 단백질을 코딩하는 DNA 또는 RNA로서) 전달될 수 있는 신호전달 단백질 (예를 들어, 세포외 신호전달 단백질)의 예에 대해서는, 도 9B를 참조한다. 동일한 단백질이, 예를 들어 나노입자를 수용하는 표적 세포에서의 분화를 편향시킬 목적으로, 표적화 리간드와 유사한 방식으로 대상 나노입자의 외부 쉘의 일부로서 사용될 수 있다. 예를 들어, 하기 신호전달 단백질 (예를 들어, 세포외 신호전달 단백질)은 하기 목적을 위해 사용될 수 있다: 조혈 줄기 세포의 공통 림프 전구 세포 계통으로의 분화를 유도하기 위해: IL-7 (예를 들어, NCBI 유전자 ID 3574 참조); 조혈 줄기 세포의 공통 골수 전구 세포 계통으로의 분화를 유도하기 위해: IL-3 (예를 들어, NCBI 유전자 ID 3562 참조), GM-CSF (예를 들어, NCBI 유전자 ID 1437 참조), 및/또는 M-CSF (예를 들어, NCBI 유전자 ID 1435 참조); 공통 림프 전구 세포의 B-세포 운명으로의 분화를 유도하기 위해: IL-3, IL-4 (예를 들어, NCBI 유전자 ID: 3565 참조), 및/또는 IL-7; 공통 림프 전구 세포의 자연 킬러 세포 운명으로의 분화를 유도하기 위해: IL-15 (예를 들어, NCBI 유전자 ID 3600 참조); 공통 림프 전구 세포의 T-세포 운명으로의 분화를 유도하기 위해: IL-2 (예를 들어, NCBI 유전자 ID 3558 참조), IL-7, 및/또는 Notch (예를 들어, NCBI 유전자 ID 4851, 4853, 4854, 4855 참조); 공통 림프 전구 세포의 수지상 세포 운명으로의 분화를 유도하기 위해: Flt-3 리간드 (예를 들어, NCBI 유전자 ID 2323 참조); 공통 골수 전구 세포의 수지상 세포 운명으로의 분화를 유도하기 위해: Flt-3 리간드, GM-CSF, 및/또는 TNF-알파 (예를 들어, NCBI 유전자 ID 7124 참조); 공통 골수 전구 세포의 과립구-대식세포 전구 세포 계통으로의 분화를 유도하기 위해: GM-CSF; 공통 골수 전구 세포의 거핵구-적혈구 전구 세포 계통으로의 분화를 유도하기 위해: IL-3, SCF (예를 들어, NCBI 유전자 ID 4254 참조), 및/또는 Tpo (예를 들어, NCBI 유전자 ID 7173 참조); 거핵구-적혈구 전구 세포의 거핵구 운명으로의 분화를 유도하기 위해: IL-3, IL-6 (예를 들어, NCBI 유전자 ID 3569 참조), SCF, 및/또는 Tpo; 거핵구-적혈구 전구 세포의 적혈구 운명으로의 분화를 유도하기 위해: 에리트로포이에틴 (예를 들어, NCBI 유전자 ID 2056 참조); 거핵구의 혈소판 운명으로의 분화를 유도하기 위해: IL-11 (예를 들어, NCBI 유전자 ID 3589 참조) 및/또는 Tpo; 과립구-대식세포 전구 세포의 단핵구 계통으로의 분화를 유도하기 위해: GM-CSF 및/또는 M-CSF; 과립구-대식세포 전구 세포의 골수모세포 계통으로의 분화를 유도하기 위해: GM-CSF; 단핵구의 단핵구-유래된 수지상 세포 운명으로의 분화를 유도하기 위해: Flt-3 리간드, GM-CSF, IFN-알파 (예를 들어, NCBI 유전자 ID 3439 참조), 및/또는 IL-4; 단핵구의 대식세포 운명으로의 분화를 유도하기 위해: IFN-감마, IL-6, IL-10 (예를 들어, NCBI 유전자 ID 3586 참조), 및/또는 M-CSF; 골수모세포의 호중구 운명으로의 분화를 유도하기 위해: G-CSF (예를 들어, NCBI 유전자 ID 1440 참조), GM-CSF, IL-6, 및/또는 SCF; 골수모세포의 호산구 운명으로의 분화를 유도하기 위해: GM-CSF, IL-3, 및/또는 IL-5 (예를 들어, NCBI 유전자 ID 3567 참조); 및 골수모세포의 호염기구 운명으로의 분화를 유도하기 위해: G-CSF, GM-CSF, 및/또는 IL-3.

유전자 편집 도구 및 공여자 DNA와 조합되어 (예를 들어, 단백질 및/또는 단백질을 코딩하는 핵산, 예컨대 DNA 또는 RNA로서) 전달될 수 있는 단백질의 예는 다음을 포함하나 이에 제한되지는 않는다: SOX17, HEX, OSKM (Oct4/Sox2/Klf4/c-myc) 및/또는 bFGF (예를 들어, 간 줄기 세포 계통으로의 분화를 유도함); HNF4a (예를 들어, 간세포 운명으로의 분화를 유도함); 폴리 (I:C), BMP-4, bFGF 및/또는 8-Br-cAMP (예를 들어, 내피 줄기 세포/전구세포 계통으로의 분화를 유도함); VEGF (예를 들어, 동맥 내피 운명으로의 분화를 유도함); Sox-2, Brn4, Myt1l, Neurod2, Ascl1 (예를 들어, 신경 줄기 세포/전구세포 계통으로의 분화를 유도함); 및 BDNF, FCS, 포르스콜린 및/또는 SHH (예를 들어, 뉴런, 성상세포 및/또는 핍지교세포 운명으로의 분화를 유도함).

유전자 편집 도구 및 공여자 DNA와 조합되어 (예를 들어, 단백질 및/또는 핵산, 예컨대 단백질을 코딩하는 DNA 또는 RNA로서) 전달될 수 있는 신호전달 단백질 (예를 들어, 세포외 신호전달 단백질)의 예는 다음을 포함하나 이에 제한되지는 않는다: 시토카인 (예를 들어, 예컨대 CD8+ T-세포를 활성화시키기 위한 IL-2 및/또는 IL-15); Notch, Wnt 및/또는 Smad 신호전달 경로 중 1개 이상을 조정하는 리간드 및/또는 신호전달 단백질; SCF; 줄기 세포 프로그램화 인자 (예를 들어 Sox2, Oct3/4, Nanog, Klf4, c-Myc 등); 및 후속 단리/정제/농축을 위한 일시적 표면 마커 "태그" 및/또는 형광 리포터. 예를 들어, 섬유모세포는 Sox2의 전달을 통해 신경 줄기 세포로 전환될 수 있는 한편 Oct3/4 및 소분자 "후성적 재설정 인자"의 존재 하에서는 심근세포로 전환될 것이다. 헌팅톤병 또는 CXCR4 돌연변이를 갖는 환자에서, 이들 섬유모세포는 뉴런 및 심장 세포와 연관된 이환 표현형 형질을 각각 코딩할 수 있다. 유전자 편집 교정 및 이들 인자를 단일 패키지로 전달함으로써, 도입되는 인자/페이로드 중 1개 이상 (모두는 아님)으로 인한 유해 효과의 위험이 유의하게 감소될 수 있다.

페이로드 방출의 시기 및/또는 위치가 제어될 수 있기 때문에 (본 개시내용의 다른 곳에서 보다 상세히 기재됨), 동일한 패키지 (예를 들어, 동일한 나노입자) 내의 다수의 페이로드의 패키징은 상이한 페이로드에 대한 상이한 방출 시간/속도 및/또는 위치를 달성하는 것을 방해하지 않는다. 예를 들어, 상기 단백질 (및/또는 이를 코딩하는 DNA 또는 mRNA) 및/또는 비-코딩 RNA의 방출은 동일한 패키지의 일부인 1개 이상의 유전자 편집 도구의 방출과 별개로 제어될 수 있다. 예를 들어, 세포 증식 및/또는 분화를 제어하는 단백질 및/또는 핵산 (예를 들어, DNA, mRNA, 비-코딩 RNA, miRNA)은 1개 이상의 유전자 편집 도구보다 먼저 방출될 수 있거나 또는 1개 이상의 유전자 편집 도구보다 나중에 방출될 수 있다. 이는, 예를 들어 1개 초과의 유출가능한 층을 사용함으로써 및/또는 1개 초과의 코어를 사용함으로써 (예를 들어, 여기서 1개의 코어는 다른 것과 상이한 방출 프로파일을 갖고, 예를 들어 상이한 D- 대 L-이성질체 비를 사용하고, 상이한 ESP:ENP:EPP 프로파일을 사용하는 것 등) 달성될 수 있다. 이러한 방식으로, 공여자 및 뉴클레아제는 단계적 방식으로 방출될 수 있어 최적의 편집 및 삽입 효율을 가능하게 한다.

나노입자 코어

대상 나노입자의 코어는 음이온성 중합체 조성물 (예를 들어, 폴리(글루탐산)), 양이온성 중합체 조성물 (예를 들어, 폴리(아르기닌), 양이온성 폴리펩티드 조성물 (예를 들어, 히스톤 테일 펩티드), 및 페이로드 (예를 들어, 핵산 및/또는 단백질 페이로드, 예를 들어 공여자 RNA 및/또는 부위-특이적 뉴클레아제 또는 부위-특이적 뉴클레아제를 코딩하는 핵산)를 포함할 수 있다. 일부 경우에, 코어는 음이온성 아미노산 중합체의 존재 하에 (및 일부 경우에 양이온성 폴리펩티드 조성물의 양이온성 폴리펩티드의 존재 하에) 양이온성 아미노산 중합체과 페이로드의 축합에 의해 생성된다. 일부 실시양태에서, 코어를 구성하는 성분들의 축합은 양이온성 중합체와 페이로드와의 접합체와 비교하여 증가된 형질감염 효율을 매개할 수 있다. 나노입자 코어에 음이온성 중합체를 포함시키는 것은 나노입자의 세포내 체류 및 페이로드의 방출의 지속기간을 연장시킬 수 있다.

코어의 양이온성 및 음이온성 중합체 조성물의 경우, D-이성질체 중합체 대 L-이성질체 중합체의 비는 페이로드의 시한 방출을 제어하도록 제어될 수 있으며, 여기서 D-이성질체 중합체 대 L-이성질체 중합체의 증가된 비는 증가된 안정성 (감소된 페이로드 방출 속도)으로 이어지고, 이는 예를 들어 대상 나노입자에 의해 전달된 페이로드로부터 보다 오래 지속되는 유전자 발현을 가능하게 할 수 있다. 일부 경우에, 나노입자 코어 내의 D-대-L 이성질체 폴리펩티드의 비를 조절하는 것은 유전자 발현 프로파일 (예를 들어, 페이로드 분자에 의해 코딩되는 단백질의 발현)이 대략 1-90일 (예를 들어 1-80, 1-70, 1-60, 1-50, 1-40, 1-30, 1-25, 1-20, 1-15, 1-10, 3-90, 3-80, 3-70, 3-60, 3-50, 3-40, 3-30, 3-25, 3-20, 3-15, 3-10, 5-90, 5-80, 5-70, 5-60, 5-50, 5-40, 5-30, 5-25, 5-20, 5-15 또는 5-10일)이 되도록 할 수 있다. 페이로드 방출의 제어 (예를 들어, 유전자 편집 도구를 전달하는 경우에)는, 예를 들어 상동성-지정 복구가 요구되는 일부 경우에 게놈 편집을 수행하는데 특히 효과적일 수 있다.

일부 실시양태에서, 나노입자는 코어 및 코어를 캡슐화하는 유출가능한 층을 포함하고, 여기서 코어는 (a) 음이온성 중합체 조성물; (b) 양이온성 중합체 조성물; (c) 양이온성 폴리펩티드 조성물; 및 (d) 핵산 및/또는 단백질 페이로드를 포함하고, 여기서 (a) 및 (b) 중 하나는 아미노산의 D-이성질체 중합체를 포함하고, (a) 및 (b) 중 다른 것은 아미노산의 L-이성질체 중합체를 포함하고, 여기서 D-이성질체 중합체 대 L-이성질체 중합체의 비는 10:1 내지 1.5:1 (예를 들어, 8:1 내지 1.5:1, 6:1 내지 1.5:1, 5:1 내지 1.5:1, 4:1 내지 1.5:1, 3:1 내지 1.5:1, 2:1 내지 1.5:1, 10:1 내지 2:1; 8:1 내지 2:1, 6:1 내지 2:1, 5:1 내지 2:1, 10:1 내지 3:1; 8:1 내지 3:1, 6:1 내지 3:1, 5:1 내지 3:1, 10:1 내지 4:1; 4:1 내지 2:1, 6:1 내지 4:1, 또는 10:1 내지 5:1), 또는 1:1.5 내지 1:10 (예를 들어 1:1.5 내지 1:8, 1:1.5 내지 1:6, 1:1.5 내지 1:5, 1:1.5 내지 1:4, 1:1.5 내지 1:3, 1:1.5 내지 1:2, 1:2 내지 1:10, 1:2 내지 1:8, 1:2 내지 1:6, 1:2 내지 1:5, 1:2 내지 1:4, 1:2 내지 1:3, 1:3 내지 1:10, 1:3 내지 1:8, 1:3 내지 1:6, 1:3 내지 1:5, 1:4 내지 1:10, 1:4 내지 1:8, 1:4 내지 1:6, 또는 1:5 내지 1:10)의 범위이다. 일부 이러한 경우에, D-이성질체 중합체 대 L-이성질체 중합체의 비는 1:1이 아니다. 일부 이러한 경우에, 음이온성 중합체 조성물은 폴리(D-글루탐산) (PDEA) 및 폴리(D-아스파르트산) (PDDA)으로부터 선택된 음이온성 중합체를 포함하며, 여기서 (임의로) 양이온성 중합체 조성물은 폴리(L-아르기닌), 폴리(L-리신), 폴리(L-히스티딘), 폴리(L-오르니틴) 및 폴리(L-시트룰린)으로부터 선택된 양이온성 중합체를 포함할 수 있다. 일부 경우에, 양이온성 중합체 조성물은 폴리(D-아르기닌), 폴리(D-리신), 폴리(D-히스티딘), 폴리(D-오르니틴) 및 폴리(D-시트룰린)으로부터 선택된 양이온성 중합체를 포함하며, 여기서 (임의로) 음이온성 중합체 조성물은 폴리(L-글루탐산) (PLEA) 및 폴리(L-아스파르트산) (PLDA)으로부터 선택된 음이온성 중합체를 포함할 수 있다.

일부 실시양태에서, 나노입자는 코어 및 코어를 캡슐화하는 유출가능한 층을 포함하고, 여기서 코어는 (i) 음이온성 중합체 조성물; (ii) 양이온성 중합체 조성물; (iii) 양이온성 폴리펩티드 조성물; 및 (iv) 핵산 및/또는 단백질 페이로드를 포함하고, 여기서 (a) 상기 음이온성 중합체 조성물은 음이온성 아미노산의 D-이성질체의 중합체 및 음이온성 아미노산의 L-이성질체의 중합체를 포함하고/거나; (b) 상기 양이온성 중합체 조성물은 양이온성 아미노산의 D-이성질체의 중합체 및 양이온성 아미노산의 L-이성질체의 중합체를 포함한다. 일부 이러한 경우에, 음이온성 중합체 조성물은 폴리(D-글루탐산) (PDEA) 및 폴리(D-아스파르트산) (PDDA)으로부터 선택된 제1 음이온성 중합체를 포함하고; 폴리(L-글루탐산) (PLEA) 및 폴리(L-아스파르트산) (PLDA)으로부터 선택된 제2 음이온성 중합체를 포함한다. 일부 경우에, 양이온성 중합체 조성물은 폴리(D-아르기닌), 폴리(D-리신), 폴리(D-히스티딘), 폴리(D-오르니틴) 및 폴리(D-시트룰린)으로부터 선택된 제1 양이온성 중합체를 포함하고; 폴리(L-아르기닌), 폴리(L-리신), 폴리(L-히스티딘), 폴리(L-오르니틴) 및 폴리(L-시트룰린)으로부터 선택된 제2 양이온성 중합체를 포함한다. 일부 경우에, 음이온성 아미노산의 D-이성질체의 중합체는, 상기 음이온성 아미노산의 L-이성질체의 중합체에 대해, 10:1 내지 1:10 범위의 비로 존재한다. 일부 경우에, 양이온성 아미노산의 D-이성질체의 중합체는, 상기 양이온성 아미노산의 L-이성질체의 중합체에 대해, 10:1 내지 1:10 범위의 비로 존재한다.

나노입자 성분 (시기)

일부 실시양태에서, 페이로드 방출의 시기는 특정한 유형의 단백질을, 예를 들어 코어의 일부 (예를 들어, 양이온성 폴리펩티드 조성물의 일부, 양이온성 중합체 조성물의 일부, 및/또는 음이온성 중합체 조성물의 일부)로서 선택함으로써 제어될 수 있다. 예를 들어, 페이로드 방출을 특정한 시간 범위 동안 또는 페이로드가 특정한 세포 위치 (예를 들어, 시토졸, 핵, 리소솜, 엔도솜)에 또는 특정한 조건 (예를 들어, 낮은 pH, 높은 pH 등) 하에 존재할 때까지 지연시키는 것이 바람직할 수 있다. 따라서, 일부 경우에 특이적 단백질 활성 (예를 들어, 효소적 활성)에 감수성인, 예를 들어 특이적 단백질 활성 (예를 들어, 효소적 활성)에 대한 기질인 단백질이 (예를 들어, 코어의 일부로서) 사용되고, 이는 일반적인 편재성 세포 기구, 예를 들어 일반적인 분해 기구에 감수성인 것과 대조적이다. 특이적 단백질 활성에 감수성인 단백질은 본원에서 '효소적으로 감수성인 단백질' (ESP)로 지칭된다. ESP의 예시적인 예는 다음을 포함하나 이에 제한되지는 않는다: (i) 매트릭스 메탈로프로테이나제 (MMP) 활성 (세포외 활성의 예)에 대한 기질인 단백질, 예를 들어 MMP에 의해 인식되는 모티프를 포함하는 단백질; (ii) 카텝신 활성 (세포내 엔도솜 활성의 예)에 대한 기질인 단백질, 예를 들어 카텝신에 의해 인식되는 모티프를 포함하는 단백질; 및 (iii) 메틸트랜스퍼라제 및/또는 아세틸트랜스퍼라제 활성 (세포내 핵 활성의 예)에 대한 기질인 단백질, 예컨대 히스톤 테일 펩티드 (HTP), 예를 들어 효소적으로 메틸화/탈-메틸화될 수 있는 모티프 및/또는 효소적으로 아세틸화/탈-아세틸화될 수 있는 모티프를 포함하는 단백질. 예를 들어, 일부 경우에 핵산 페이로드는 아세틸트랜스퍼라제 활성에 대한 기질인 단백질 (예컨대 히스톤 테일 펩티드)과 축합되고, 단백질의 아세틸화는 단백질이 페이로드를 방출하게 하며 - 이에 따라, 아세틸화에 대해 다소 감수성인 단백질을 사용하도록 선택함으로써 페이로드 방출에 대한 제어를 실행할 수 있다.

일부 경우에, 대상 나노입자의 코어는 효소적으로 중성인 폴리펩티드 (ENP)를 포함하며, 이는 폴리펩티드가 특정한 활성을 갖지 않고 중성인 폴리펩티드 단독중합체 (즉, 반복 서열을 갖는 단백질)이다. 예를 들어, 둘 다 특정한 활성을 갖는 NLS 서열 및 HTP와는 달리, ENP는 그렇지 않다.

일부 경우에, 대상 나노입자의 코어는 효소적 활성에 대해 저항성인 단백질인 효소적으로 보호된 폴리펩티드 (EPP)를 포함한다. PP의 예는 다음을 포함하나 이에 제한되지는 않는다: (i) 단백질분해적 분해에 저항할 수 있는 D-이성질체 아미노산을 포함하는 폴리펩티드 (예를 들어, D-이성질체 중합체); 및 (ii) 자기-보호 도메인, 예컨대 폴리글루타민 반복 도메인 (예를 들어, QQQQQQQQQQ) (서열식별번호: 170).

대상 나노입자의 일부 (예를 들어, 나노입자 코어의 일부)인 감수성 단백질 (ESP), 중성 단백질 (ENP) 및 보호된 단백질 (EPP)의 상대량을 제어함으로써, 페이로드의 방출을 제어할 수 있다. 예를 들어, 보다 많은 ESP의 사용은 일반적으로 보다 많은 EPP의 사용보다 더 신속한 페이로드 방출을 일으킬 수 있다. 추가로, 보다 많은 ESP의 사용은 일반적으로 특정한 세트의 조건/상황, 예를 들어 ESP가 감수성인 단백질 (예를 들어, 효소)의 활성을 유도하는 조건/상황에 좌우되는 페이로드의 방출을 일으킬 수 있다.

나노입자의 음이온성 중합체 조성물

음이온성 중합체 조성물은 1개 이상의 음이온성 아미노산 중합체를 포함할 수 있다. 예를 들어, 일부 경우에 대상 음이온성 중합체 조성물은 폴리(글루탐산) (PEA), 폴리(아스파르트산) (PDA) 및 그의 조합으로부터 선택된 중합체를 포함한다. 일부 경우에, 주어진 음이온성 아미노산 중합체는 아스파르트산 및 글루탐산 잔기의 믹스를 포함할 수 있다. 각각의 중합체는 L-이성질체 또는 D-이성질체의 중합체로서 조성물 중에 존재할 수 있으며, 여기서 D-이성질체는 분해되는데 더 오래 걸리기 때문에 표적 세포에서 더 안정하다. 따라서, 나노입자 코어에 D-이성질체 폴리(아미노산)을 포함시키는 것은 코어의 분해 및 후속 페이로드 방출을 지연시킨다. 따라서 페이로드 방출 속도는 제어될 수 있고 D-이성질체의 중합체 대 L-이성질체의 중합체의 비에 비례하며, 여기서 D-이성질체 대 L-이성질체의 보다 높은 비는 페이로드 방출의 지속기간을 증가시킨다 (즉, 방출 속도를 감소시킴). 다시 말해서, D- 및 L-이성질체의 상대량은 나노입자 코어의 시한 방출 동역학 및 분해 및 페이로드 방출에 대한 효소적 감수성을 조정할 수 있다.

일부 경우에, 대상 나노입자의 음이온성 중합체 조성물은 음이온성 아미노산 중합체 (예를 들어, 폴리(글루탐산) (PEA) 및 폴리(아스파르트산) (PDA))의 D-이성질체의 중합체 및 L-이성질체의 중합체를 포함한다. 일부 경우에 D- 대 L-이성질체 비는 10:1-1:10 (예를 들어, 8:1-1:10, 6:1-1:10, 4:1-1:10, 3:1-1:10, 2:1-1:10, 1:1-1:10, 10:1-1:8, 8:1-1:8, 6:1-1:8, 4:1-1:8, 3:1-1:8, 2:1-1:8, 1:1-1:8, 10:1-1:6, 8:1-1:6, 6:1-1:6, 4:1-1:6, 3:1-1:6, 2:1-1:6, 1:1-1:6, 10:1-1:4, 8:1-1:4, 6:1-1:4, 4:1-1:4, 3:1-1:4, 2:1-1:4, 1:1-1:4, 10:1-1:3, 8:1-1:3, 6:1-1:3, 4:1-1:3, 3:1-1:3, 2:1-1:3, 1:1-1:3, 10:1-1:2, 8:1-1:2, 6:1-1:2, 4:1-1:2, 3:1-1:2, 2:1-1:2, 1:1-1:2, 10:1-1:1, 8:1-1:1, 6:1-1:1, 4:1-1:1, 3:1-1:1, 또는 2:1-1:1)의 범위이다.

따라서, 일부 경우에 음이온성 중합체 조성물은 (예를 들어, 폴리(D-글루탐산) (PDEA) 및 폴리(D-아스파르트산) (PDDA)으로부터 선택된) D-이성질체의 중합체 인 제1 음이온성 중합체 (예를 들어, 아미노산 중합체)를 포함하고; (예를 들어, 폴리(L-글루탐산) (PLEA) 및 폴리(L-아스파르트산) (PLDA)으로부터 선택된) L-이성질체의 중합체인 제2 음이온성 중합체 (예를 들어, 아미노산 중합체)를 포함한다. 일부 경우에, 제1 음이온성 중합체 (D-이성질체) 대 제2 음이온성 중합체 (L-이성질체)의 비는 10:1-1:10 (예를 들어 8:1-1:10, 6:1-1:10, 4:1-1:10, 3:1-1:10, 2:1-1:10, 1:1-1:10, 10:1-1:8, 8:1-1:8, 6:1-1:8, 4:1-1:8, 3:1-1:8, 2:1-1:8, 1:1-1:8, 10:1-1:6, 8:1-1:6, 6:1-1:6, 4:1-1:6, 3:1-1:6, 2:1-1:6, 1:1-1:6, 10:1-1:4, 8:1-1:4, 6:1-1:4, 4:1-1:4, 3:1-1:4, 2:1-1:4, 1:1-1:4, 10:1-1:3, 8:1-1:3, 6:1-1:3, 4:1-1:3, 3:1-1:3, 2:1-1:3, 1:1-1:3, 10:1-1:2, 8:1-1:2, 6:1-1:2, 4:1-1:2, 3:1-1:2, 2:1-1:2, 1:1-1:2, 10:1-1:1, 8:1-1:1, 6:1-1:1, 4:1-1:1, 3:1-1:1, 또는 2:1-1:1)의 범위이다.

일부 실시양태에서, 대상 나노입자의 코어의 음이온성 중합체 조성물은 (예를 들어, 음이온성 중합체의 임의의 상기 예에 추가로 또는 그 대신에) 글리코사미노글리칸, 당단백질, 폴리사카라이드, 폴리(만누론산), 폴리(굴루론산), 헤파린, 헤파린 술페이트, 콘드로이틴, 콘드로이틴 술페이트, 케라탄, 케라탄 술페이트, 아그레칸, 폴리(글루코사민), 또는 그의 임의의 조합을 포함하는 음이온성 중합체를 포함한다.

일부 실시양태에서, 코어 내의 음이온성 중합체는 1-200 kDa (예를 들어 1-150, 1-100, 1-50, 5-200, 5-150, 5-100, 5-50, 10-200, 10-150, 10-100, 10-50, 15-200, 15-150, 15-100, 또는 15-50 kDa) 범위의 분자량을 가질 수 있다. 예로서, 일부 경우에 음이온성 중합체는 대략 15 kDa의 분자량을 갖는 폴리(글루탐산)을 포함한다.

일부 경우에, 음이온성 아미노산 중합체는 시스테인 잔기를 포함하며, 이는 예를 들어 링커, NLS, 및/또는 양이온성 폴리펩티드 (예를 들어, 히스톤 또는 HTP)에 대한 접합을 용이하게 할 수 있다. 예를 들어, 시스테인 잔기는 술프히드릴 화학 (예를 들어, 디술피드 결합) 및/또는 아민-반응성 화학을 통한 가교 (접합)에 사용될 수 있다. 따라서, 일부 실시양태에서 음이온성 중합체 조성물의 음이온성 아미노산 중합체 (예를 들어, 폴리(글루탐산) (PEA), 폴리(아스파르트산) (PDA), 폴리(D-글루탐산) (PDEA), 폴리(D-아스파르트산) (PDDA), 폴리(L-글루탐산) (PLEA), 폴리(L-아스파르트산) (PLDA))가 시스테인 잔기를 포함한다. 일부 경우에, 음이온성 아미노산 중합체는 N- 및/또는 C-말단에 시스테인 잔기를 포함한다. 일부 경우에, 음이온성 아미노산 중합체는 내부 시스테인 잔기를 포함한다.

일부 경우에, 음이온성 아미노산 중합체는 핵 국재화 신호 (NLS) (하기에 보다 상세히 기재됨)를 포함한다 (및/또는 그에 접합됨). 따라서, 일부 실시양태에서, 음이온성 중합체 조성물의 음이온성 아미노산 중합체 (예를 들어, 폴리(글루탐산) (PEA), 폴리(아스파르트산) (PDA), 폴리(D-글루탐산) (PDEA), 폴리(D-아스파르트산) (PDDA), 폴리(L-글루탐산) (PLEA), 폴리(L-아스파르트산) (PLDA))는 1개 이상 (예를 들어, 2개 이상, 3개 이상 또는 4개 이상)의 NLS를 포함한다 (및/또는 그에 접합됨). 일부 경우에, 음이온성 아미노산 중합체는 N- 및/또는 C-말단에 NLS를 포함한다. 일부 경우에, 음이온성 아미노산 중합체는 내부 NLS를 포함한다.

일부 경우에, 음이온성 중합체는 대상 나노입자 코어를 생성할 때 양이온성 중합체 전에 첨가된다.

나노입자의 양이온성 중합체 조성물

양이온성 중합체 조성물은 1개 이상의 양이온성 아미노산 중합체를 포함할 수 있다. 예를 들어, 일부 경우에 대상 양이온성 중합체 조성물은 폴리(아르기닌) (PR), 폴리(리신) (PK), 폴리(히스티딘) (PH), 폴리(오르니틴), 폴리(시트룰린) 및 그의 조합으로부터 선택된 중합체를 포함한다. 일부 경우에, 주어진 양이온성 아미노산 중합체는 아르기닌, 리신, 히스티딘, 오르니틴 및 시트룰린 잔기의 믹스 (임의의 편리한 조합)를 포함할 수 있다. 각각의 중합체는 L-이성질체 또는 D-이성질체의 중합체로서 조성물 중에 존재할 수 있으며, 여기서 D-이성질체는 분해되는데 더 오래 걸리기 때문에 표적 세포에서 더 안정하다. 따라서, 나노입자 코어에 D-이성질체 폴리(아미노산)을 포함시키는 것은 코어의 분해 및 후속 페이로드 방출을 지연시킨다. 따라서 페이로드 방출 속도는 제어될 수 있고 D-이성질체의 중합체 대 L-이성질체의 중합체의 비에 비례하며, 여기서 D-이성질체 대 L-이성질체의 보다 높은 비는 페이로드 방출의 지속기간을 증가시킨다 (즉, 방출 속도를 감소시킴). 다시 말해서, D- 및 L-이성질체의 상대량은 나노입자 코어의 시한 방출 동역학 및 분해 및 페이로드 방출에 대한 효소적 감수성을 조정할 수 있다.

일부 경우에 대상 나노입자의 양이온성 중합체 조성물은 양이온성 아미노산 중합체 (예를 들어, 폴리(아르기닌) (PR), 폴리(리신) (PK), 폴리(히스티딘) (PH), 폴리(오르니틴), 폴리(시트룰린))의 D-이성질체의 중합체 및 L-이성질체의 중합체를 포함한다. 일부 경우에 D- 대 L-이성질체 비는 10:1-1:10 (예를 들어, 8:1-1:10, 6:1-1:10, 4:1-1:10, 3:1-1:10, 2:1-1:10, 1:1-1:10, 10:1-1:8, 8:1-1:8, 6:1-1:8, 4:1-1:8, 3:1-1:8, 2:1-1:8, 1:1-1:8, 10:1-1:6, 8:1-1:6, 6:1-1:6, 4:1-1:6, 3:1-1:6, 2:1-1:6, 1:1-1:6, 10:1-1:4, 8:1-1:4, 6:1-1:4, 4:1-1:4, 3:1-1:4, 2:1-1:4, 1:1-1:4, 10:1-1:3, 8:1-1:3, 6:1-1:3, 4:1-1:3, 3:1-1:3, 2:1-1:3, 1:1-1:3, 10:1-1:2, 8:1-1:2, 6:1-1:2, 4:1-1:2, 3:1-1:2, 2:1-1:2, 1:1-1:2, 10:1-1:1, 8:1-1:1, 6:1-1:1, 4:1-1:1, 3:1-1:1, 또는 2:1-1:1)의 범위이다.

따라서, 일부 경우에 양이온성 중합체 조성물은 (예를 들어, 폴리(D-아르기닌), 폴리(D-리신), 폴리(D-히스티딘), 폴리(D-오르니틴) 및 폴리(D-시트룰린)으로부터 선택된) D-이성질체의 중합체인 제1 양이온성 중합체 (예를 들어, 아미노산 중합체)를 포함하고; (예를 들어, 폴리(L-아르기닌), 폴리(L-리신), 폴리(L-히스티딘), 폴리(L-오르니틴) 및 폴리(L-시트룰린)으로부터 선택된) L-이성질체의 중합체인 제2 양이온성 중합체 (예를 들어, 아미노산 중합체)를 포함한다. 일부 경우에, 제1 양이온성 중합체 (D-이성질체) 대 제2 양이온성 중합체 (L-이성질체)의 비는 10:1-1:10 (예를 들어 8:1-1:10, 6:1-1:10, 4:1-1:10, 3:1-1:10, 2:1-1:10, 1:1-1:10, 10:1-1:8, 8:1-1:8, 6:1-1:8, 4:1-1:8, 3:1-1:8, 2:1-1:8, 1:1-1:8, 10:1-1:6, 8:1-1:6, 6:1-1:6, 4:1-1:6, 3:1-1:6, 2:1-1:6, 1:1-1:6, 10:1-1:4, 8:1-1:4, 6:1-1:4, 4:1-1:4, 3:1-1:4, 2:1-1:4, 1:1-1:4, 10:1-1:3, 8:1-1:3, 6:1-1:3, 4:1-1:3, 3:1-1:3, 2:1-1:3, 1:1-1:3, 10:1-1:2, 8:1-1:2, 6:1-1:2, 4:1-1:2, 3:1-1:2, 2:1-1:2, 1:1-1:2, 10:1-1:1, 8:1-1:1, 6:1-1:1, 4:1-1:1, 3:1-1:1, 또는 2:1-1:1)의 범위이다.

일부 실시양태에서, 대상 나노입자의 코어의 양이온성 중합체 조성물은 (예를 들어, 양이온성 중합체의 임의의 상기 예에 추가로 또는 그 대신에) 폴리(에틸렌이민), 폴리(아미도아민) (PAMAM), 폴리(아스파르트아미드), 폴리펩토이드 (예를 들어, 코어 축합을 위한 "거미줄"-유사 분지를 형성하기 위함), 전하-관능화 폴리에스테르, 양이온성 폴리사카라이드, 아세틸화 아미노 당, 키토산, 또는 그의 임의의 조합을 포함하는 양이온성 중합체 (예를 들어, 선형 또는 분지형 형태)를 포함한다.

일부 실시양태에서, 코어 내의 양이온성 중합체는 1-200 kDa (예를 들어 1-150, 1-100, 1-50, 5-200, 5-150, 5-100, 5-50, 10-200, 10-150, 10-100, 10-50, 15-200, 15-150, 15-100, 또는 15-50 kDa) 범위의 분자량을 가질 수 있다. 예로서, 일부 경우에 양이온성 중합체는, 예를 들어 대략 29 kDa의 분자량을 갖는 폴리(L-아르기닌)을 포함한다. 또 다른 예로서, 일부 경우에 양이온성 중합체는 대략 25 kDa의 분자량을 갖는 선형 폴리(에틸렌이민) (PEI)을 포함한다. 또 다른 예로서, 일부 경우에 양이온성 중합체는 대략 10 kDa의 분자량을 갖는 분지형 폴리(에틸렌이민)을 포함한다. 또 다른 예로서, 일부 경우에 양이온성 중합체는 대략 70 kDa의 분자량을 갖는 분지형 폴리(에틸렌이민)을 포함한다. 일부 경우에, 양이온성 중합체는 PAMAM을 포함한다.

일부 경우에, 양이온성 아미노산 중합체는 시스테인 잔기를 포함하며, 이는 예를 들어 링커, NLS, 및/또는 양이온성 폴리펩티드 (예를 들어, 히스톤 또는 HTP)에 대한 접합을 용이하게 할 수 있다. 예를 들어, 시스테인 잔기는 술프히드릴 화학 (예를 들어, 디술피드 결합) 및/또는 아민-반응성 화학을 통한 가교 (접합)에 사용될 수 있다. 따라서, 일부 실시양태에서 양이온성 중합체 조성물의 양이온성 아미노산 중합체 (예를 들어, 폴리(아르기닌) (PR), 폴리(리신) (PK), 폴리(히스티딘) (PH), 폴리(오르니틴) 및 폴리(시트룰린), 폴리(D-아르기닌) (PDR), 폴리(D-리신) (PDK), 폴리(D-히스티딘) (PDH), 폴리(D-오르니틴) 및 폴리(D-시트룰린), 폴리(L-아르기닌) (PLR), 폴리(L-리신) (PLK), 폴리(L-히스티딘) (PLH), 폴리(L-오르니틴) 및 폴리(L-시트룰린))가 시스테인 잔기를 포함한다. 일부 경우에, 양이온성 아미노산 중합체는 N- 및/또는 C-말단에 시스테인 잔기를 포함한다. 일부 경우에, 양이온성 아미노산 중합체는 내부 시스테인 잔기를 포함한다.

일부 경우에, 양이온성 아미노산 중합체는 핵 국재화 신호 (NLS) (하기에 보다 상세히 기재됨)를 포함한다 (및/또는 그에 접합됨). 따라서, 일부 실시양태에서, 양이온성 중합체 조성물의 양이온성 아미노산 중합체 (예를 들어, 폴리(아르기닌) (PR), 폴리(리신) (PK), 폴리(히스티딘) (PH), 폴리(오르니틴) 및 폴리(시트룰린), 폴리(D-아르기닌) (PDR), 폴리(D-리신) (PDK), 폴리(D-히스티딘) (PDH), 폴리(D-오르니틴) 및 폴리(D-시트룰린), 폴리(L-아르기닌) (PLR), 폴리(L-리신) (PLK), 폴리(L-히스티딘) (PLH), 폴리(L-오르니틴) 및 폴리(L-시트룰린))는 1개 이상 (예를 들어, 2개 이상, 3개 이상 또는 4개 이상)의 NLS를 포함한다 (및/또는 그에 접합됨). 일부 경우에, 양이온성 아미노산 중합체는 N- 및/또는 C-말단에 NLS를 포함한다. 일부 경우에, 양이온성 아미노산 중합체는 내부 NLS를 포함한다.

나노입자의 양이온성 폴리펩티드 조성물

일부 실시양태에서, 나노입자의 양이온성 폴리펩티드 조성물은 안정성, 세포하 구획화 및/또는 페이로드 방출을 매개할 수 있다. 한 예로서, 대상 나노입자 코어 내의, 일반적으로 히스톤 테일 펩티드로 지칭되는 히스톤 단백질의 N-말단의 단편은, 일부 경우에 다양한 히스톤 변형에 의해 탈양성자화될 수 있을 뿐만 아니라 (예컨대 히스톤 아세틸트랜스퍼라제-매개 아세틸화의 경우), 나노입자 코어의 성분 (예를 들어, 페이로드)의 효과적인 핵-특이적 탈패키징을 매개할 수 있다. 일부 경우에, 양이온성 폴리펩티드 조성물은 히스톤 및/또는 히스톤 테일 펩티드를 포함한다 (예를 들어, 양이온성 폴리펩티드는 히스톤 및/또는 히스톤 테일 펩티드일 수 있음). 일부 경우에, 양이온성 폴리펩티드 조성물은 NLS-함유 펩티드를 포함한다 (예를 들어, 양이온성 폴리펩티드는 NLS-함유 펩티드일 수 있음). 일부 경우에, 양이온성 폴리펩티드 조성물은 가교를 용이하게 하는 시스테인 잔기에 의해 분리되어 있는 1개 이상의 NLS-함유 펩티드를 포함한다. 일부 경우에, 양이온성 폴리펩티드 조성물은 미토콘드리아 국재화 신호를 포함하는 펩티드를 포함한다 (예를 들어, 양이온성 폴리펩티드는 미토콘드리아 국재화 신호를 포함하는 펩티드일 수 있음).

나노입자의 유출가능한 층 (유출가능한 코트)

일부 실시양태에서, 대상 나노입자는 코어를 둘러싸는 (캡슐화하는) 유출가능한 층 (본원에서 "일시적 안정화 층"으로도 지칭됨)을 포함한다. 일부 경우에, 대상 유출가능한 층은 초기 세포 흡수 전 및 그 동안 페이로드를 보호할 수 있다. 예를 들어, 유출가능한 층이 없으면, 세포 내재화 동안 다수의 페이로드가 상실될 수 있다. 세포 환경에 있으면, 유출가능한 층은 '유출'되어 (예를 들어, 층은 pH- 및/또는 글루타티온-민감성일 수 있음), 코어의 성분을 노출시킨다.

일부 경우에, 대상 유출가능한 층은 실리카를 포함한다. 일부 경우에, 대상 나노입자가 (예를 들어, 실리카의) 유출가능한 층을 포함하는 경우에, 감소된 세포 흡수 확률에도 불구하고 보다 큰 세포내 전달 효율이 관찰될 수 있다. 어떠한 특정한 이론에 얽매이는 것을 원하지는 않지만, 나노입자 코어를 유출가능한 층으로 코팅하는 것 (예를 들어, 실리카 코팅)은 코어를 밀봉하여, 이를 층의 유출시까지 안정화시킬 수 있으며, 이러한 유출은 (예를 들어, 의도된 세포하 구획에서의 프로세싱시) 페이로드의 방출을 일으킨다. 수용체-매개 세포내이입을 통한 세포 진입 후, 나노입자는 그의 최외각 층을 유출시키고, 유출가능한 층은 엔도솜의 산성화 환경 또는 시토졸의 환원성 환경에서 분해되어 코어를 노출시키고, 이는 일부 경우에 국재화 신호, 예컨대 핵 국재화 신호 (NLS) 및/또는 미토콘드리아 국재화 신호를 노출시킨다. 더욱이, 유출가능한 층에 의해 캡슐화된 나노입자 코어는 혈청에서 안정할 수 있고, 생체내 투여에 적합할 수 있다.

임의의 목적하는 유출가능한 층이 사용될 수 있고, 관련 기술분야의 통상의 기술자는 표적 세포에서 (예를 들어, 어떠한 조건 하에, 예컨대 낮은 pH 하에) 페이로드가 방출되기를 원하는 곳 (예를 들어, 엔도솜, 시토졸, 핵, 리소솜 등)을 고려할 수 있다. 상이한 유출가능한 층은 유출가능한 코트가 유출되기에 (및 따라서 페이로드를 방출하기에) 바람직한 시간, 곳 및/또는 조건에 따라 보다 바람직할 수 있다. 예를 들어, 유출가능한 층은 산 불안정성일 수 있다. 일부 경우에, 유출가능한 층은 음이온성 유출가능한 층 (음이온성 코트)이다. 일부 경우에, 유출가능한 층은 실리카, 펩토이드, 폴리시스테인, 및/또는 세라믹 (예를 들어, 바이오세라믹)을 포함한다. 일부 경우에, 유출가능한 층은 칼슘, 망가니즈, 마그네슘, 철 (예를 들어, 유출가능한 층은 자기성일 수 있음, 예를 들어 Fe₃MnO₂) 및 리튬 중 1개 이상을 포함한다. 이들 각각은 포스페이트 또는 술페이트를 포함할 수 있다. 따라서, 일부 경우에 유출가능한 층은 인산칼슘, 황산칼슘, 인산망가니즈, 황산망가니즈, 인산마그네슘, 황산마그네슘, 인산철, 황산철, 인산리튬 및 황산리튬 중 1개 이상을 포함하며; 이들 각각은 유출가능한 층이 '유출'될 방법 및/또는 조건에 대해 특정한 효과를 가질 수 있다. 따라서, 일부 경우에 유출가능한 층은 다음 중 1개 이상을 포함한다: 실리카, 펩토이드, 폴리시스테인, 세라믹 (예를 들어, 바이오세라믹), 칼슘, 인산칼슘, 황산칼슘, 산화칼슘, 히드록시아파타이트, 망가니즈, 인산망가니즈, 황산망가니즈, 산화망가니즈, 마그네슘, 인산마그네슘, 황산마그네슘, 산화마그네슘, 철, 인산철, 황산철, 산화철, 리튬, 인산리튬 및 황산리튬 (그의 임의의 조합) (예를 들어, 유출가능한 층은 실리카, 펩토이드, 폴리시스테인, 세라믹 (예를 들어, 바이오세라믹), 인산칼슘, 황산칼슘, 인산망가니즈, 황산망가니즈, 인산마그네슘, 황산마그네슘, 인산철, 황산철, 인산리튬, 황산리튬 또는 그의 조합의 코팅일 수 있음). 일부 경우에, 유출가능한 층은 실리카를 포함한다 (예를 들어, 유출가능한 층은 실리카 코트일 수 있음). 일부 경우에, 유출가능한 층은 알기네이트 겔을 포함한다.

일부 경우에 상이한 페이로드에 대한 상이한 방출 시간이 바람직하다. 예를 들어, 일부 경우에 페이로드를 초기에 (예를 들어, 표적 세포와의 접촉 0.5 - 7일 내에) 방출하는 것이 바람직하고, 일부 경우에 페이로드를 나중에 (예를 들어, 표적 세포와의 접촉 6일 - 30일 내에) 방출하는 것이 바람직하다. 예를 들어, 일부 경우에, 표적 세포와의 접촉 0.5-7일 내에 (예를 들어, 표적 세포와의 접촉 0.5-5일, 0.5-3일, 1-7일, 1-5일 또는 1-3일 내에) 페이로드 (예를 들어, 유전자 편집 도구, 예컨대 CRISPR/Cas 가이드 RNA, 상기 CRISPR/Cas 가이드 RNA를 코딩하는 DNA 분자, CRISPR/Cas RNA-가이드 폴리펩티드, 및/또는 상기 CRISPR/Cas RNA-가이드 폴리펩티드를 코딩하는 핵산 분자)를 방출하는 것이 바람직할 수 있다. 일부 경우에, 표적 세포와의 접촉 6-40일 내에 (예를 들어, 표적 세포와의 접촉 6-30, 6-20, 6-15, 7-40, 7-30, 7-20, 7-15, 9-40, 9-30, 9-20 또는 9-15일 내에) 페이로드 (예를 들어, 공여자 DNA 분자)를 방출하는 것이 바람직할 수 있다. 일부 경우에 방출 시간은 상이한 페이로드를 갖는 나노입자를 상이한 시간에 전달함으로써 제어될 수 있다. 일부 경우에 방출 시간은 나노입자를 동시에 (상이한 제제의 일부로서 또는 동일한 제제의 일부로서) 전달함으로써 제어될 수 있으며, 여기서 나노입자의 성분은 목적하는 방출 시간을 달성하도록 설계된다. 예를 들어, 보다 빠르게 또는 보다 느리게 분해되는 유출가능한 층, 분해에 대해 보다 더 또는 보다 덜 저항성인 코어 성분, 탈축합에 대해 보다 더 또는 보다 덜 감수성인 코어 성분 등을 사용할 수 있고, 임의의 또는 모든 성분은 목적하는 시기를 달성하기 위해 임의의 편리한 조합으로 선택될 수 있다.

일부 경우에 페이로드 (예를 들어, 공여자 DNA 분자)의 방출을 또 다른 페이로드 (예를 들어, 1개 이상의 유전자 편집 도구)에 비해 지연시키는 것이 바람직하다. 예로서, 일부 경우에, 페이로드로서 공여자 DNA 분자를 포함하는 제1 나노입자는, 페이로드가 표적 세포와의 접촉 6-40일 내에 (예를 들어, 표적 세포와의 접촉 6-30, 6-20, 6-15, 7-40, 7-30, 7-20, 7-15, 9-40, 9-30, 9-20 또는 9-15일 내에) 방출되도록 설계되는 한편, 페이로드로서 1개 이상의 유전자 편집 도구 (예를 들어, ZFP 또는 ZFP를 코딩하는 핵산, TALE 또는 TALE를 코딩하는 핵산, ZFN 또는 ZFN을 코딩하는 핵산, TALEN 또는 TALEN을 코딩하는 핵산, CRISPR/Cas 가이드 RNA 또는 CRISPR/Cas 가이드 RNA를 코딩하는 DNA 분자, CRISPR/Cas RNA-가이드 폴리펩티드 또는 CRISPR/Cas RNA-가이드 폴리펩티드를 코딩하는 핵산 분자 등)를 포함하는 제2 나노입자는, 페이로드가 표적 세포와의 접촉 0.5-7일 내에 (예를 들어, 표적 세포와의 접촉 0.5-5일, 0.5-3일, 1-7일, 1-5일 또는 1-3일 내에) 방출되도록 설계된다. 제2 나노입자는 제1 나노입자와 동일한 제제의 일부 또는 상이한 제제의 일부일 수 있다.

일부 경우에, 나노입자는 1개 초과의 페이로드를 포함하며, 여기서 페이로드는 상이한 시간에 방출되는 것이 바람직하다. 이는 다수의 상이한 방법으로 달성될 수 있다. 예를 들어, 나노입자는 1개 초과의 코어를 가질 수 있으며, 여기서 한 코어는 페이로드 (예를 들어, siRNA, mRNA, 및/또는 게놈 편집 도구, 예컨대 ZFP 또는 ZFP를 코딩하는 핵산, TALE 또는 TALE를 코딩하는 핵산, ZFN 또는 ZFN을 코딩하는 핵산, TALEN 또는 TALEN을 코딩하는 핵산, CRISPR/Cas 가이드 RNA 또는 CRISPR/Cas 가이드 RNA를 코딩하는 DNA 분자, CRISPR/Cas RNA-가이드 폴리펩티드 또는 CRISPR/Cas RNA-가이드 폴리펩티드를 코딩하는 핵산 분자 등)를 초기에 (예를 들어, 표적 세포와의 접촉 0.5-7일 내에, 예를 들어 표적 세포와의 접촉 0.5-5일, 0.5-3일, 1-7일, 1-5일 또는 1-3일 내에) 방출할 수 있는 성분으로 제조되고, 다른 것은 페이로드 (예를 들어, 공여자 DNA 분자)를 나중에 (예를 들어, 표적 세포와의 접촉 6-40일 내에, 예를 들어 표적 세포와의 접촉 6-30, 6-20, 6-15, 7-40, 7-30, 7-20, 7-15, 9-40, 9-30, 9-20 또는 9-15일 내에) 방출할 수 있는 성분으로 제조된다.

또 다른 예로서, 나노입자는 1개 초과의 유출가능한 층을 포함할 수 있으며, 여기서 외부 유출가능한 층이 유출되고 (페이로드를 방출함), 이후에 내부 유출가능한 층이 유출된다 (또 다른 페이로드를 방출함). 일부 경우에, 내부 페이로드는 공여자 DNA 분자이고, 외부 페이로드는 1개 이상의 유전자 편집 도구 (예를 들어, ZFN 또는 ZFN을 코딩하는 핵산, TALEN 또는 TALEN을 코딩하는 핵산, CRISPR/Cas 가이드 RNA 또는 CRISPR/Cas 가이드 RNA를 코딩하는 DNA 분자, CRISPR/Cas RNA-가이드 폴리펩티드 또는 CRISPR/Cas RNA-가이드 폴리펩티드를 코딩하는 핵산 분자 등)이다. 내부 및 외부 페이로드는 임의의 목적하는 페이로드일 수 있고, 어느 하나 또는 둘 다는, 예를 들어 1개 이상의 siRNA 및/또는 1개 이상의 mRNA를 포함할 수 있다. 따라서, 일부 경우에 나노입자는 1개 초과의 유출가능한 층을 가질 수 있고, 한 페이로드 (예를 들어, siRNA, mRNA, 및/또는 게놈 편집 도구, 예컨대 ZFP 또는 ZFP를 코딩하는 핵산, TALE 또는 TALE를 코딩하는 핵산, ZFN 또는 ZFN을 코딩하는 핵산, TALEN 또는 TALEN을 코딩하는 핵산, CRISPR/Cas 가이드 RNA 또는 CRISPR/Cas 가이드 RNA를 코딩하는 DNA 분자, CRISPR/Cas RNA-가이드 폴리펩티드 또는 CRISPR/Cas RNA-가이드 폴리펩티드를 코딩하는 핵산 분자 등)를 초기에 (예를 들어, 표적 세포와의 접촉 0.5-7일 내에, 예를 들어 표적 세포와의 접촉 0.5-5일, 0.5-3일, 1-7일, 1-5일 또는 1-3일 내에) 방출하도록 설계될 수 있고, 또 다른 페이로드 (예를 들어, siRNA, mRNA, 공여자 DNA 분자)를 나중에 (예를 들어, 표적 세포와의 접촉 6-40일 내에, 예를 들어 표적 세포와의 접촉 6-30, 6-20, 6-15, 7-40, 7-30, 7-20, 7-15, 9-40, 9-30, 9-20 또는 9-15일 내에) 방출하도록 설계될 수 있다.

일부 실시양태에서 (예를 들어, 상기 기재된 실시양태에서), 변경된 유전자 발현의 시간은 페이로드 방출의 시간에 대한 대용물로서 사용될 수 있다. 예시적인 예로서, 페이로드가 제12일까지 방출되었는지를 결정하고자 하는 경우에, 제12일에 나노입자 전달의 목적하는 결과를 검정할 수 있다. 예를 들어, 목적하는 결과가, 예를 들어 siRNA를 전달함으로써 표적 세포의 표적 유전자의 발현을 감소시키는 것이라면, 표적 유전자의 발현을 검정/모니터링하여 siRNA가 방출되었는지를 결정할 수 있다. 또 다른 예로서, 목적하는 결과가, 예를 들어 관심 단백질을 코딩하는 DNA 또는 mRNA를 전달함으로써 관심 단백질을 발현하는 것이라면, 관심 단백질의 발현을 검정/모니터링하여 페이로드가 방출되었는지를 결정할 수 있다. 또 다른 예로서, 목적하는 결과가, 예를 들어 게놈 DNA를 절단하고/거나 공여자 DNA 분자의 서열을 삽입함으로써 표적 세포의 게놈을 변경시키는 것이라면, 표적화된 유전자좌로부터의 발현 및/또는 게놈 변경의 존재를 검정/모니터링하여 페이로드가 방출되었는지를 결정할 수 있다.

따라서, 일부 경우에 유출가능한 층은 나노입자 성분의 단계적 방출을 제공한다. 예를 들어, 일부 경우에, 나노입자는 1개 초과 (예를 들어, 2, 3 또는 4개)의 유출가능한 층을 갖는다. 예를 들어, 2개의 유출가능한 층을 갖는 나노입자의 경우, 이러한 나노입자는, 최내각에서 최외각으로, 예를 들어 제1 페이로드를 갖는 코어; 제1 유출가능한 층, 예를 들어 제2 페이로드를 갖는 중간 층; 및 중간 층을 둘러싸는 제2 유출가능한 층을 가질 수 있다 (예를 들어, 도 4 참조). 이러한 구성 (다수의 유출가능한 층)은 다양한 목적하는 페이로드의 단계적 방출을 용이하게 한다. 추가의 예시적인 예로서, 2개의 유출가능한 층을 갖는 나노입자 (상기 기재된 바와 같음)는 코어에 1개 이상의 목적하는 유전자 편집 도구 (예를 들어, 공여자 DNA 분자, CRISPR/Cas 가이드 RNA, CRISPR/Cas 가이드 RNA를 코딩하는 DNA 등 중 1개 이상)를, 중간 층에 또 다른 목적하는 유전자 편집 도구 (예를 들어, 프로그램가능한 유전자 편집 단백질, 예컨대 CRISPR/Cas 단백질, ZFP, ZFN, TALE, TALEN 등; 프로그램가능한 유전자 편집 단백질을 코딩하는 DNA 또는 RNA; CRISPR/Cas 가이드 RNA; CRISPR/Cas 가이드 RNA를 코딩하는 DNA 등 중 1개 이상)를 - 임의의 목적하는 조합으로 포함할 수 있다.

대안적 패키징 (예를 들어, 지질 제제)

일부 실시양태에서, 대상 코어 (예를 들어, 상기 기재된 성분 및/또는 구성의 임의의 조합을 포함함)는 지질-기반 전달 시스템, 예를 들어 양이온성 지질 전달 시스템의 일부이다 (예를 들어, 문헌 [Chesnoy and Huang, Annu Rev Biophys Biomol Struct. 2000, 29:27-47; Hirko et al., Curr Med Chem. 2003 Jul 10(14):1185-93; 및 Liu et al., Curr Med Chem. 2003 Jul 10(14):1307-15] 참조). 일부 경우에, 대상 코어 (예를 들어, 상기 기재된 성분 및/또는 구성의 임의의 조합을 포함함)는 유출가능한 층에 의해 둘러싸이지 않는다. 상기 언급된 바와 같이, 코어는 음이온성 중합체 조성물 (예를 들어, 폴리(글루탐산)), 양이온성 중합체 조성물 (예를 들어, 폴리(아르기닌), 양이온성 폴리펩티드 조성물 (예를 들어, 히스톤 테일 펩티드), 및 페이로드 (예를 들어, 핵산 및/또는 단백질 페이로드)를 포함할 수 있다.

코어가 지질-기반 전달 시스템의 일부인 일부 경우에, 코어는 시한 및/또는 위치 (예를 들어, 환경-특이적) 방출을 염두에 두고 설계되었다. 예를 들어, 일부 경우에 코어는 ESP, ENP 및/또는 EPP를 포함하고, 일부 이러한 경우에 이들 성분은 목적하는 조건 (예를 들어, 세포 위치, 세포 조건, 예컨대 pH, 특정한 효소의 존재 등)이 코어 (예를 들어, 상기 기재됨)에 의해 마주쳐질 때까지 페이로드 방출이 지연되도록 하는 비로 존재한다. 일부 이러한 실시양태에서 코어는 음이온성 아미노산의 D-이성질체의 중합체 및 음이온성 아미노산의 L-이성질체의 중합체를 포함하고, 일부 경우에 D- 및 L-이성질체의 중합체는 서로에 대해 특정한 범위 내의 비 (예를 들어, 상기 기재됨)로 존재한다. 일부 경우에 코어는 양이온성 아미노산의 D-이성질체의 중합체 및 양이온성 아미노산의 L-이성질체의 중합체를 포함하고, 일부 경우에 D- 및 L-이성질체의 중합체는 서로에 대해 특정한 범위 내의 비 (예를 들어, 상기 기재됨)로 존재한다. 일부 경우에 코어는 음이온성 아미노산의 D-이성질체의 중합체 및 양이온성 아미노산의 L-이성질체의 중합체를 포함하고, 일부 경우에 D- 및 L-이성질체의 중합체는 서로에 대해 특정한 범위 내의 비 (예를 들어, 상기 기재됨)로 존재한다. 일부 경우에 코어는 음이온성 아미노산의 L-이성질체의 중합체 및 양이온성 아미노산의 D-이성질체의 중합체를 포함하고, 일부 경우에 D- 및 L-이성질체의 중합체는 서로에 대해 특정한 범위 내의 비 (예를 들어, 본원의 다른 곳에 기재됨)로 존재한다. 일부 경우에 코어는 NLS (예를 들어, 본원의 다른 곳에 기재됨)를 포함하는 단백질을 포함한다. 일부 경우에 코어는 HTP (예를 들어, 본원의 다른 곳에 기재됨)를 포함한다.

양이온성 지질은, 유전자 전달에 사용될 수 있고 플라스미드 DNA와 축합하는 능력을 갖는 비바이러스 벡터이다. 리포펙션을 위한 N-[1-(2,3-디올레일옥시)프로필]-N,N,N-트리메틸암모늄 클로라이드의 합성 후, 헤드 기, 링커 및 소수성 도메인 변형을 포함한 양이온성 지질의 분자 구조를 개선시키는 것이 활발한 분야였다. 변형은 증진된 표면 전하 밀도를 통해 DNA 결합 및 전달을 개선시킬 수 있는 다가 폴리아민의 사용 및 독성을 제한할 수 있는 스테롤계 소수성 기, 예컨대 3B-[N-(N',N'-디메틸아미노에탄)-카르바모일] 콜레스테롤의 사용을 포함하였다. 헬퍼 지질, 예컨대 디올레오일 포스파티딜에탄올아민 (DOPE)은 엔도솜 이탈을 용이하게 하기 위해 증진된 리포솜 소수성 및 육각형 역상 전이를 통해 트랜스진 발현을 개선시키는데 사용될 수 있다. 일부 경우에 지질 제제는 DLin-DMA, DLin-K-DMA, DLin-KC2-DMA, DLin-MC3-DMA, 98N12-5, C12-200, 콜레스테롤, PEG-지질, 리피도폴리아민, 덱사메타손-스페르민 (DS) 및 이치환된 스페르민 (D₂S) (예를 들어, 덱사메타손을 폴리아민 스페르민에 접합시킴으로써 생성됨) 중 1개 이상을 포함한다. DLin-DMA, DLin-K-DMA, DLin-KC2-DMA, 98N12-5, C12-200 및 DLin-MC3-DMA는 관련 기술분야에 약술된 방법에 의해 합성될 수 있다 (예를 들어, 문헌 [Heyes et al., J. Control Release, 2005, 107, 276-287; Semple et al., Nature Biotechnology, 2010, 28, 172-176; Akinc et al., Nature Biotechnology, 2008, 26, 561-569; Love et al., PNAS, 2010, 107, 1864-1869]; 국제 특허 출원 공개 WO2010054401 참조; 이들 모두는 그 전문이 본원에 참조로 포함됨).

다양한 지질-기반 전달 시스템의 예는 하기 공개물: 국제 특허 공개 번호 WO2016081029; 미국 특허 출원 공개 번호 US20160263047 및 US20160237455; 및 미국 특허 번호 9,533,047; 9,504,747; 9,504,651; 9,486,538; 9,393,200; 9,326,940; 9,315,828; 및 9,308,267에 기재된 것을 포함하나 이에 제한되지는 않으며; 이들 모두는 그 전문이 본원에 참조로 포함된다.

따라서, 일부 경우에 대상 코어는 지질 (예를 들어, 양이온성 지질, 예컨대 리포펙타민 형질감염 시약)에 의해 둘러싸인다. 일부 경우에 대상 코어는 지질 제제 (예를 들어, 지질 나노입자 제제) 내에 존재한다. 지질 제제는 리포솜 및/또는 리포플렉스를 포함할 수 있다. 지질 제제는 에탄올 희석 (SNALP) 리포솜 (예를 들어, 폴리에틸렌 글리콜 (PEG) 및/또는 프로타민으로 코팅될 수 있는 중성 헬퍼 지질과 함께 양이온성 지질을 포함하는 것)에 의한 자발적 소포 형성을 포함할 수 있다.

지질 제제는 리피도이드-기반 제제일 수 있다. 리피도이드의 합성은 광범위하게 기재되었고, 이들 화합물을 함유하는 제제는 대상 지질 제제에 포함될 수 있다 (예를 들어, 문헌 [Mahon et al., Bioconjug Chem. 2010 21:1448-1454; Schroeder et al., J Intern Med. 2010 267:9-21; Akinc et al., Nat Biotechnol. 2008 26:561-569; Love et al., Proc Natl Acad Sci USA. 2010 107:1864-1869; 및 Siegwart et al., Proc Natl Acad Sci USA. 2011 108:12996-3001] 참조; 이들 모두는 그 전문이 본원에 참조로 포함됨). 일부 경우에, 대상 지질 제제는 다음 중 1개 이상을 (임의의 목적하는 조합으로) 포함할 수 있다: 1,2-디올레오일-sn-글리세로-3-포스파티딜콜린 (DOPC); 1,2-디올레오일-sn-글리세로-3-포스파티딜에탄올아민 (DOPE); N-[1-(2,3-디올레일옥시)프로필]N,N,N-트리메틸암모늄 클로라이드 (DOTMA); 1,2-디올레오일옥시-3-트리메틸암모늄-프로판 (DOTAP); 디옥타데실아미도글리실스페르민 (DOGS); N-(3-아미노프로필)-N,N-디메틸-2,3-비스(도데실옥시)-1 (GAP-DLRIE); 프로판아미늄 브로마이드; 세틸트리메틸암모늄 브로마이드 (CTAB); 6-라우록시헥실 오르니티네이트 (LHON); 1-(2,3-디올레오일옥시프로필)-2,4,6-트리메틸피리디늄 (2Oc); 2,3-디올레일옥시-N-[2(스페르민카르복스아미도-에틸]-N,N-디메틸-1 (DOSPA); 프로판아미늄 트리플루오로아세테이트; 1,2-디올레일-3-트리메틸암모늄-프로판 (DOPA); N-(2-히드록시에틸)-N,N-디메틸-2,3-비스(테트라데실옥시)-1 (MDRIE); 프로판아미늄 브로마이드; 디미리스토옥시프로필 디메틸 히드록시에틸 암모늄브로마이드 (DMRI); 3.베타.-[N-(N',N'-디메틸아미노에탄)-카르바모일]콜레스테롤 DC-Chol; 비스-구아니듐-트렌-콜레스테롤 (BGTC); 1,3-디오데옥시-2-(6-카르복시-스페르밀)-프로필아미드 (DOSPER); 디메틸옥타데실암모늄 브로마이드 (DDAB); 디옥타데실아미도글리실스페르미딘 (DSL); rac-[(2,3-디옥타데실옥시프로필)(2-히드록시에틸)]-디메틸암모늄 (CLIP-1); 클로라이드 rac-[2(2,3-디헥사데실옥시프로필 (CLIP-6); 옥시메틸옥시)에틸]트리메틸암모늄 브로마이드; 에틸디미리스토일포스파티딜콜린 (EDMPC); 1,2-디스테아릴옥시-N,N-디메틸-3-아미노프로판 (DSDMA); 1,2-디미리스토일-트리메틸암모늄 프로판 (DMTAP); O,O'-디미리스틸-N-리실 아스파르테이트 (DMKE); 1,2-디스테아로일-sn-글리세로-3-에틸포스포콜린 (DSEPC); N-팔미토일 D-에리트로-스핑고실 카르바모일-스페르민 (CCS); N-t-부틸-N0-테트라데실-3-테트라데실아미노프로피온아미딘; 디C14-아미딘; 옥타데세노일옥시[에틸-2-헵타데세닐-3 히드록시에틸] 이미다졸리늄 (DOTIM); 클로라이드 N1-콜레스테릴옥시카르보닐-3,7-디아자노난-1,9-디아민 (CDAN); 2-[3-[비스(3-아미노프로필)아미노]프로필아미노]-N-[2-[디(테트라데실)아미노]-2-옥소에틸]아세트아미드 (RPR209120); 디테트라데실카르바모일메-에틸-아세트아미드; 1,2-디리놀레일옥시-3-디메틸아미노프로판 (DLinDMA); 2,2-디리놀레일-4-디메틸아미노에틸-[1,3]-디옥솔란; DLin-KC2-DMA; 디리놀레일-메틸-4-디메틸아미노부티레이트; DLin-MC3-DMA; DLin-K-DMA; 98N12-5; C12-200; 콜레스테롤; PEG-지질; 리피오폴리아민; 덱사메타손-스페르민 (DS); 및 이치환된 스페르민 (D₂S).

나노입자의 표면 코트 (외부 쉘)

일부 경우에, 유출가능한 층 (코트)은 그 자체가 본원에서 "외부 쉘", "외부 코트" 또는 "표면 코트"로 지칭되는 추가의 층에 의해 코팅된다. 표면 코트는 다수의 상이한 기능을 할 수 있다. 예를 들어, 표면 코트는 전달 효율을 증가시킬 수 있고/거나 대상 나노입자를 특정한 세포 유형으로 표적화할 수 있다. 표면 코트는 펩티드, 중합체 또는 리간드-중합체 접합체를 포함할 수 있다. 표면 코트는 표적화 리간드를 포함할 수 있다. 예를 들어, 1개 이상의 표적화 리간드의 수용액 (링커 도메인 존재 또는 부재)을 코팅된 나노입자 현탁액 (유출가능한 층으로 코팅된 나노입자의 현탁액)에 첨가할 수 있다. 예를 들어, 일부 경우에 (앵커링 도메인의) 양성자화된 앵커링 잔기의 최종 농도는 25 내지 300 μM이다. 일부 경우에, 표면 코트를 첨가하는 방법은 50 내지 150 nm의 평균 입자 크기 및 0 내지 -10 mV의 제타 전위를 갖는 입자의 단분산 현탁액을 생성한다.

일부 경우에, 표면 코트는 최외각 유출가능한 층과 정전기적으로 상호작용한다. 예를 들어, 일부 경우에, 나노입자는 2개의 유출가능한 층 (예를 들어, 최내각에서 최외각으로; 예를 들어 제1 페이로드를 갖는 코어; 제1 유출가능한 층, 예를 들어 제2 페이로드를 갖는 중간 층; 및 중간 층을 둘러싸는 제2 유출가능한 층)을 갖고, 외부 쉘 (표면 코트)은 제2 유출가능한 층과 (예를 들어, 정전기적으로) 상호작용할 수 있다. 일부 경우에, 나노입자는 단지 1개의 유출가능한 층 (예를 들어, 음이온성 실리카 층)을 갖고, 외부 쉘은 일부 경우에 유출가능한 층과 정전기적으로 상호작용할 수 있다.

따라서, 유출가능한 층 (예를 들어, 최외각 유출가능한 층)이 음이온성인 경우 (예를 들어, 유출가능한 층이 실리카 코트인 일부 경우), 표면 코트가 양이온성 성분을 포함하는 경우, 표면 코트는 유출가능한 층과 정전기적으로 상호작용할 수 있다. 예를 들어, 일부 경우에 표면 코트는 표적화 리간드가 양이온성 앵커링 도메인에 접합된 전달 분자를 포함한다. 양이온성 앵커링 도메인은 유출가능한 층과 정전기적으로 상호작용하고 전달 분자를 나노입자에 고정시킨다. 마찬가지로, 유출가능한 층 (예를 들어, 최외각 유출가능한 층)이 양이온성인 경우, 표면 코트가 음이온성 성분을 포함하는 경우에 표면 코트는 유출가능한 층과 정전기적으로 상호작용할 수 있다.

일부 실시양태에서, 표면 코트는 세포 관통 펩티드 (CPP)를 포함한다. 일부 경우에, 양이온성 아미노산의 중합체는 CPP ('단백질 전달 도메인' - PTD로도 지칭됨)로서 기능할 수 있고, 이는 지질 이중층, 미셀, 세포막, 소기관 막 또는 소포 막 횡단을 용이하게 하는 폴리펩티드, 폴리뉴클레오티드, 탄수화물 또는 유기 또는 무기 화합물을 지칭하는데 사용되는 용어이다. 작은 극성 분자에서부터 큰 거대분자 및/또는 나노입자까지의 범위일 수 있는 또 다른 분자 (예를 들어, 대상 나노입자의 유출가능한 층 내에 포매되고/거나 그와 상호작용함)에 부착된 PTD는 분자가 막을 횡단하는 것, 예를 들어 세포외 공간에서부터 세포내 공간으로 진행하는 것 또는 시토졸에서 소기관 (예를 들어, 핵) 내로 진행하는 것을 용이하게 한다.

CPP의 예는 최소 운데카펩티드 단백질 전달 도메인 (YGRKKRRQRRR (서열식별번호: 160)을 포함하는 HIV-1 TAT의 잔기 47-57에 상응함); 세포 내로의 진입을 지시하기에 충분한 수의 아르기닌을 포함하는 폴리아르기닌 서열 (예를 들어, 3, 4, 5, 6, 7, 8, 9, 10 또는 10-50개의 아르기닌); VP22 도메인 (Zender et al. (2002) Cancer Gene Ther. 9(6):489-96); 드로소필라 안텐나페디아 단백질 전달 도메인 (Noguchi et al. (2003) Diabetes 52(7):1732-1737); 말단절단된 인간 칼시토닌 펩티드 (Trehin et al. (2004) Pharm. Research 21:1248-1256); 폴리리신 (Wender et al. (2000) Proc. Natl. Acad. Sci. USA 97:13003-13008); RRQRRTSKLMKR (서열식별번호: 161); 트랜스포르탄 GWTLNSAGYLLGKINLKALAALAKKIL (서열식별번호: 162); KALAWEAKLAKALAKALAKHLAKALAKALKCEA (서열식별번호: 163); 및 RQIKIWFQNRRMKWKK (서열식별번호: 164)를 포함하나 이에 제한되지는 않는다. CPP의 예는 YGRKKRRQRRR (서열식별번호: 160), RKKRRQRRR (서열식별번호: 165), 3개의 아르기닌 잔기 내지 50개의 아르기닌 잔기의 아르기닌 단독중합체, RKKRRQRR (서열식별번호: 166), YARAAARQARA (서열식별번호: 167), THRLPRRRRRR (서열식별번호: 168) 및 GGRRARRRRRR (서열식별번호: 169)을 포함하나 이에 제한되지는 않는다. 일부 실시양태에서, CPP는 활성화가능한 CPP (ACPP)이다 (Aguilera et al. (2009) Integr Biol (Camb) June; 1(5-6): 371-381). ACPP는 절단가능한 링커를 통해 매칭 다가음이온 (예를 들어, Glu9 또는 "E9")에 연결된 다가양이온성 CPP (예를 들어, Arg9 또는 "R9")를 포함하며, 이는 순 전하를 거의 0으로 감소시키고, 이에 의해 세포 내로의 부착 및 흡수를 억제한다. 링커의 절단시에, 다가음이온이 방출되어, 폴리아르기닌 및 그의 고유의 부착성을 국부적으로 드러내고, 이에 따라 ACPP가 막을 횡단하도록 "활성화"시킨다.

일부 경우에, 코팅된 코어 (유출가능한 층에 의해 둘러싸인 코어)를 CPP를 포함하는 조성물 (예를 들어, 용액)과 접촉시킴으로써 CPP를 나노입자에 첨가할 수 있다. 이어서, CPP는 유출가능한 층과 (예를 들어, 정전기적으로) 상호작용할 수 있다.

일부 경우에, 표면 코트는 양이온성 아미노산의 중합체 (예를 들어, 폴리(아르기닌), 예컨대 폴리(L-아르기닌) 및/또는 폴리(D-아르기닌), 폴리(리신), 예컨대 폴리(L-리신) 및/또는 폴리(D-리신), 폴리(히스티딘), 예컨대 폴리(L-히스티딘) 및/또는 폴리(D-히스티딘), 폴리(오르니틴), 예컨대 폴리(L-오르니틴) 및/또는 폴리(D-오르니틴), 폴리(시트룰린), 예컨대 폴리(L-시트룰린) 및/또는 폴리(D-시트룰린) 등)를 포함한다. 따라서, 일부 경우에 표면 코트는 폴리(아르기닌), 예를 들어 폴리(L-아르기닌)을 포함한다.

일부 실시양태에서, 표면 코트는 헵타펩티드, 예컨대 셀랭크 (TKPRPGP - 서열식별번호: 147) (예를 들어, N-아세틸 셀랭크) 및/또는 세맥스 (MEHFPGP - 서열식별번호: 148) (예를 들어, N-아세틸 세맥스)를 포함한다. 따라서, 일부 경우에 표면 코트는 셀랭크 (예를 들어, N-아세틸 셀랭크)를 포함한다. 일부 경우에, 표면 코트는 세맥스 (예를 들어, N-아세틸 세맥스)를 포함한다.

일부 실시양태에서, 표면 코트는 전달 분자를 포함한다. 전달 분자는 표적화 리간드를 포함하고, 일부 경우에 표적화 리간드는 앵커링 도메인 (예를 들어 양이온성 앵커링 도메인 또는 음이온성 앵커링 도메인)에 접합된다. 일부 경우에 표적화 리간드는 개재 링커를 통해 앵커링 도메인 (예를 들어 양이온성 앵커링 도메인 또는 음이온성 앵커링 도메인)에 접합된다.

다가 표면 코트

일부 경우에, 표면 코트는 다음 중 어느 1개 이상을 (임의의 목적하는 조합으로) 포함한다: (i) 상기 기재된 중합체 중 1개 이상, (ii) 1개 이상의 표적화 리간드, 1개 이상의 CPP 및 1개 이상의 헵타펩티드. 예를 들어, 일부 경우에 표면 코트는 1개 이상 (예를 들어, 2개 이상, 3개 이상)의 표적화 리간드를 포함할 수 있지만, 또한 상기 기재된 양이온성 중합체 중 1개 이상을 포함할 수 있다. 일부 경우에, 표면 코트는 1개 이상 (예를 들어, 2개 이상, 3개 이상)의 표적화 리간드를 포함할 수 있지만, 또한 1개 이상의 CPP를 포함할 수 있다. 추가로, 표면 코트는 스텔스 기능성을 촉진하기 위한, 즉 혈청 단백질 흡착 및 보체 활성을 방지하기 위한 당펩티드의 임의의 조합을 포함할 수 있다. 이는 아지드-알킨 클릭 화학을 통해, 프로파르길 변형된 잔기를 함유하는 펩티드를 시알산, 뉴라민산 등의 유도체를 함유하는 아지드에 커플링시켜 달성될 수 있다.

일부 경우에, 표면 코트는 CD34 및 헤파린 술페이트 프로테오글리칸에 대한 표적화된 결합을 제공하는 표적화 리간드의 조합을 포함한다. 예를 들어, 폴리(L-아르기닌)은 헤파린 술페이트 프로테오글리칸에 대한 표적화된 결합을 제공하는 표면 코트의 일부로서 사용될 수 있다. 따라서, 일부 경우에 나노입자를 양이온성 중합체 (예를 들어, 폴리(L-아르기닌))로 표면 코팅한 후에, 코팅된 나노입자를 히알루론산과 함께 인큐베이션하고, 이에 의해 쯔비터이온성 및 다가 표면을 형성한다.

일부 실시양태에서, 표면 코트는 다가이다. 다가 표면 코트는 2개 이상의 표적화 리간드 (예를 들어, 상이한 리간드를 포함하는 2개 이상의 전달 분자)를 포함하는 것이다. 다량체 (이 경우에 삼량체) 표면 코트 (외부 쉘)의 예는 표적화 리간드 줄기 세포 인자 (SCF) (CD117로도 공지된 c-Kit 수용체를 표적화함), CD70 (CD27을 표적화함), 및 SH2 도메인-함유 단백질 1A (SH2D1A) (CD150을 표적화함)를 포함하는 것이다. 예를 들어, 일부 경우에, 조혈 줄기 세포 (HSC) [KLS (c-Kit⁺ Lin^- Sca-1⁺) 및 CD27⁺/IL-7Ra^-/CD150⁺/CD34^-]를 표적화하기 위해, 대상 나노입자는 각각 c-Kit, CD27 및 CD150을 표적화하는 표적화 리간드 SCF, CD70 및 SH2 도메인-함유 단백질 1A (SH2D1A)의 조합을 포함하는 표면 코트를 포함한다 (예를 들어, 표 1 참조). 일부 경우에, 이러한 표면 코트는 다른 림프 및 골수 전구세포에 비해 HSPC 및 장기 HSC (c-Kit+/Lin-/Sca-1+/CD27+/IL-7Ra-/CD150+/CD34-)를 선택적으로 표적화할 수 있다.

일부 예시적인 실시양태에서, 모든 3개의 표적화 리간드 (SCF, CD70 및 SH2D1A)는 양이온성 앵커링 도메인 (예를 들어, 폴리-히스티딘, 예컨대 6H, 폴리-아르기닌, 예컨대 9R 등)에 대한 융합을 통해 나노입자에 앵커링된다. 예를 들어, (1) 표적화 폴리펩티드 SCF (c-Kit 수용체를 표적화함)는

를 포함할 수 있으며, 여기서 X는 양이온성 앵커링 도메인 (예를 들어, 폴리-히스티딘, 예컨대 6H, 폴리-아르기닌, 예컨대 9R 등)이고, 예를 들어 이는 일부 경우에 N- 및/또는 C-말단 단부에 존재할 수 있거나, 또는 폴리펩티드 서열 내에 포매될 수 있고; (2) 표적화 폴리펩티드 CD70 (CD27을 표적화함)은

를 포함할 수 있으며, 여기서 X는 양이온성 앵커링 도메인 (예를 들어, 폴리-히스티딘, 예컨대 6H, 폴리-아르기닌, 예컨대 9R 등)이고, 예를 들어 이는 일부 경우에 N- 및/또는 C-말단 단부에 존재할 수 있거나, 또는 폴리펩티드 서열 내에 포매될 수 있고; (3) 표적화 폴리펩티드 SH2D1A (CD150을 표적화함)는

를 포함할 수 있으며, 여기서 X는 양이온성 앵커링 도메인 (예를 들어, 폴리-히스티딘, 예컨대 6H, 폴리-아르기닌, 예컨대 9R 등)이고, 예를 들어 이는 일부 경우에 N- 및/또는 C-말단 단부에 존재할 수 있거나, 또는 폴리펩티드 서열 내에 포매될 수 있다 (예를 들어, 예컨대

상기 언급된 바와 같이, 본 개시내용의 나노입자는 목적하는 세포 유형을 표적화하기 위해 또는 세포 유형의 목적하는 조합을 표적화하기 위해 다중 표적화 리간드 (표면 코트의 일부로서)를 포함할 수 있다. 마우스 및 인간 조혈 세포 계통 내의 관심 세포의 예가 도 8 (패널 A-B)에, 이러한 세포에 대해 확인된 마커와 함께 도시되어 있다. 예를 들어, 관심 세포 표면 마커의 다양한 조합은 다음을 포함하나 이에 제한되지는 않는다: [마우스] (i) CD150; (ii) Sca1, cKit, CD150; (iii) CD150 및 CD49b; (iv) Sca1, cKit, CD150, 및 CD49b; (v) CD150 및 Flt3; (vi) Sca1, cKit, CD150, 및 Flt3; (vii) Flt3 및 CD34; (viii) Flt3, CD34, Sca1, 및 cKit; (ix) Flt3 및 CD127; (x) Sca1, cKit, Flt3, 및 CD127; (xi) CD34; (xii) cKit 및 CD34; (xiii) CD16/32 및 CD34; (xiv) cKit, CD16/32, 및 CD34; 및 (xv) cKit; 및 [인간] (i) CD90 및 CD49f; (ii) CD34, CD90, 및 CD49f ; (iii) CD34; (iv) CD45RA 및 CD10; (v) CD34, CD45RA, 및 CD10; (vi) CD45RA 및 CD135; (vii) CD34, CD38, CD45RA, 및 CD135; (viii) CD135; (ix) CD34, CD38, 및 CD135; 및 (x) CD34 및 CD38. 따라서, 일부 경우에 표면 코트는 다음으로부터 선택된 표면 단백질 또는 표면 단백질의 조합에 대한 표적화된 결합을 제공하는 1개 이상의 표적화 리간드를 포함한다: [마우스] (i) CD150; (ii) Sca1, cKit, CD150; (iii) CD150 및 CD49b; (iv) Sca1, cKit, CD150, 및 CD49b; (v) CD150 및 Flt3; (vi) Sca1, cKit, CD150, 및 Flt3; (vii) Flt3 및 CD34; (viii) Flt3, CD34, Sca1, 및 cKit; (ix) Flt3 및 CD127; (x) Sca1, cKit, Flt3, 및 CD127; (xi) CD34; (xii) cKit 및 CD34; (xiii) CD16/32 및 CD34; (xiv) cKit, CD16/32, 및 CD34; 및 (xv) cKit; 및 [인간] (i) CD90 및 CD49f; (ii) CD34, CD90, 및 CD49f ; (iii) CD34; (iv) CD45RA 및 CD10; (v) CD34, CD45RA, 및 CD10; (vi) CD45RA 및 CD135; (vii) CD34, CD38, CD45RA, 및 CD135; (viii) CD135; (ix) CD34, CD38, 및 CD135; 및 (x) CD34 및 CD38. 대상 나노입자는 1개 초과의 표적화 리간드를 포함할 수 있고, 일부 세포는 중첩 마커를 포함하기 때문에, 다수의 상이한 세포 유형이 표면 코트의 조합을 사용하여 표적화될 수 있고, 예를 들어 일부 경우에 표면 코트는 1개의 특이적 세포 유형을 표적화할 수 있는 반면 다른 경우에 표면 코트는 1개 초과의 특이적 세포 유형 (예를 들어, 2개 이상, 3개 이상, 4개 이상의 세포 유형)을 표적화할 수 있다. 예를 들어, 조혈 계통 내의 세포의 임의의 조합이 표적화될 수 있다. 예시적인 예로서, CD34를 표적화하는 것 (CD34에 대한 표적화된 결합을 제공하는 표적화 리간드를 사용함)은 조혈 계통 내의 여러 상이한 세포로의 페이로드의 나노입자 전달을 유도할 수 있다 (예를 들어, 도 8, 패널 A 및 B 참조).

전달 분자

(i) 단백질 또는 핵산 페이로드 또는 (ii) 하전된 중합체 폴리펩티드 도메인에 접합된 표적화 리간드 (펩티드)를 포함하는 전달 분자가 제공된다. 표적화 리간드는 (i) 세포 표면 단백질에 대한 표적화된 결합 및 일부 경우에 (ii) 긴 엔도솜 재순환 경로의 결속을 제공한다. 표적화 리간드가 하전된 중합체 폴리펩티드 도메인에 접합되는 일부 경우에, 하전된 중합체 폴리펩티드 도메인은 핵산 페이로드 및/또는 단백질 페이로드와 상호작용한다 (예를 들어, 그와 축합됨). 일부 경우에 표적화 리간드는 개재 링커를 통해 접합된다. 상이한 가능한 접합 전략 (즉, 대상 전달 분자의 성분들의 상이한 가능한 배열)의 예에 대해 도 6을 참조한다. 일부 경우에, 표적화 리간드는 세포 표면 단백질에 대한 표적화된 결합을 제공하지만, 반드시 긴 엔도솜 재순환 경로의 결속을 제공하는 것은 아니다. 따라서, 단백질 또는 핵산 페이로드에 접합되거나 또는 하전된 중합체 폴리펩티드 도메인에 접합된 표적화 리간드 (예를 들어, 펩티드 표적화 리간드)를 포함하며, 여기서 표적화 리간드는 세포 표면 단백질에 대한 표적화된 결합을 제공하는 (그러나 반드시 긴 엔도솜 재순환 경로의 결속을 제공하는 것은 아닌) 것인 전달 분자가 또한 제공된다.

일부 경우에, 본원에 개시된 전달 분자는 핵산 또는 단백질 페이로드가 그의 세포외 표적에 도달하고 (예를 들어, 세포 표면 단백질에 대한 표적화된 결합을 제공함으로써) 우선적으로 리소솜 내에서 파괴되거나 '짧은' 엔도솜 재순환 엔도솜 내로 격리되지 않도록 설계된다. 대신에, 본 개시내용의 전달 분자는 '긴' (간접적/느린) 엔도솜 재순환 경로의 결속을 제공할 수 있으며, 이는 엔도솜 이탈 및/또는 소기관과의 엔도솜 융합을 가능하게 할 수 있다.

예를 들어, 일부 경우에, β-아레스틴은 (예를 들어, 세포내이입 동안) 액틴 세포골격으로부터의 7-막횡단 GPCR (McGovern et al., Handb Exp Pharmacol. 2014;219:341-59; Goodman et al., Nature. 1996 Oct 3;383(6599):447-50; Zhang et al., J Biol Chem. 1997 Oct 24;272(43):27005-14) 및/또는 단일-막횡단 수용체 티로신 키나제 (RTK)의 절단을 매개하여, 목적하는 엔도솜 분류 경로를 촉발시킨다. 따라서, 일부 실시양태에서, 본 개시내용의 전달 분자의 표적화 리간드는 (예를 들어, 신호전달 편향을 제공하고, 오르토스테릭 결합 후 세포내이입을 통한 내재화를 촉진하기 위해) 세포 표면 단백질에 대한 결합시 β-아레스틴의 결속을 제공한다.

하전된 중합체 폴리펩티드 도메인

일부 경우에 표적화 리간드 (예를 들어, 대상 전달 분자의 것)는 하전된 중합체 폴리펩티드 도메인 (앵커링 도메인, 예컨대 양이온성 앵커링 도메인 또는 음이온성 앵커링 도메인)에 접합된다 (예를 들어, 도 5 및 도 6 참조). 하전된 중합체 폴리펩티드 도메인은 반복 잔기 (예를 들어, 양이온성 잔기, 예컨대 아르기닌, 리신, 히스티딘)를 포함할 수 있다. 일부 경우에, 하전된 중합체 폴리펩티드 도메인 (앵커링 도메인)은 3 내지 30개 아미노산 (예를 들어, 3-28, 3-25, 3-24, 3-20, 4-30, 4-28, 4-25, 4-24 또는 4-20개 아미노산; 또는 예를 들어, 4-15, 4-12, 5-30, 5-28, 5-25, 5-20, 5-15, 5-12개 아미노산) 범위의 길이를 갖는다. 일부 경우에, 하전된 중합체 폴리펩티드 도메인 (앵커링 도메인)은 4 내지 24개 아미노산 범위의 길이를 갖는다. 일부 경우에, 하전된 중합체 폴리펩티드 도메인 (앵커링 도메인)은 5 내지 10개 아미노산 범위의 길이를 갖는다. 하전된 중합체 폴리펩티드 도메인의 적합한 예는 RRRRRRRRR (9R) (서열식별번호: 15) 및 HHHHHH (6H) (서열식별번호: 16)를 포함하나 이에 제한되지는 않는다.

하전된 중합체 폴리펩티드 도메인 (양이온성 앵커링 도메인, 음이온성 앵커링 도메인)은 임의의 편리한 하전된 도메인 (예를 들어, 양이온성 하전된 도메인)일 수 있다. 예를 들어, 이러한 도메인은 히스톤 테일 펩티드 (HTP)일 수 있다 (본원의 다른 곳에서 보다 상세히 기재됨). 일부 경우에, 하전된 중합체 폴리펩티드 도메인은 히스톤 및/또는 히스톤 테일 펩티드를 포함한다 (예를 들어, 양이온성 폴리펩티드는 히스톤 및/또는 히스톤 테일 펩티드일 수 있음). 일부 경우에, 하전된 중합체 폴리펩티드 도메인은 NLS-함유 펩티드를 포함한다 (예를 들어, 양이온성 폴리펩티드는 NLS-함유 펩티드일 수 있음). 일부 경우에, 하전된 중합체 폴리펩티드 도메인은 미토콘드리아 국재화 신호를 포함하는 펩티드를 포함한다 (예를 들어, 양이온성 폴리펩티드는 미토콘드리아 국재화 신호를 포함하는 펩티드일 수 있음).

일부 경우에, 대상 전달 분자의 하전된 중합체 폴리펩티드 도메인은 전달 분자가 페이로드 (예를 들어, 핵산 페이로드 및/또는 단백질 페이로드)와 상호작용하는 (예를 들어, 예컨대 축합을 위해 정전기적으로 상호작용하는) 방식으로서 사용된다.

일부 경우에, 대상 전달 분자의 하전된 중합체 폴리펩티드 도메인은, 예를 들어 표적화 리간드가 나노입자를 목적하는 세포/세포 표면 단백질로 표적화하는데 사용되도록, 나노입자의 표면을 전달 분자로 코팅하기 위한 앵커로서 사용된다 (예를 들어, 도 5 참조). 따라서, 일부 경우에 하전된 중합체 폴리펩티드 도메인은 나노입자의 하전된 안정화 층과 정전기적으로 상호작용한다. 예를 들어, 일부 경우에 나노입자는 안정화 층 (예를 들어, 실리카, 펩토이드, 폴리시스테인 또는 인산칼슘 코팅)에 의해 둘러싸인 코어 (예를 들어, 핵산, 단백질 및/또는 리보핵단백질 복합체 페이로드를 포함함)을 포함한다. 일부 경우에, 안정화 층은 음전하를 갖고, 따라서 양으로 하전된 중합체 폴리펩티드 도메인은 안정화 층과 상호작용하여, 전달 분자를 나노입자에 효과적으로 앵커링시키고, 나노입자 표면을 대상 표적화 리간드로 코팅할 수 있다 (예를 들어, 도 5 참조). 일부 경우에, 안정화 층은 양전하를 갖고, 따라서 음으로 하전된 중합체 폴리펩티드 도메인은 안정화 층과 상호작용하여, 전달 분자를 나노입자에 효과적으로 앵커링시키고, 나노입자 표면을 대상 표적화 리간드로 코팅할 수 있다. 접합은 임의의 편리한 기술에 의해 달성될 수 있고, 많은 상이한 접합 화학은 관련 기술분야의 통상의 기술자에게 공지되어 있을 것이다. 일부 경우에, 접합은 술프히드릴 화학 (예를 들어, 디술피드 결합)을 통한 것이다. 일부 경우에 접합은 아민-반응성 화학을 사용하여 달성된다. 일부 경우에, 표적화 리간드 및 하전된 중합체 폴리펩티드 도메인은 동일한 폴리펩티드의 일부에 의해 접합된다.

일부 경우에, 하전된 중합체 폴리펩티드 도메인 (양이온성)은 폴리(아르기닌) (PR), 폴리(리신) (PK), 폴리(히스티딘) (PH), 폴리(오르니틴), 폴리(시트룰린) 및 그의 조합으로부터 선택된 중합체를 포함할 수 있다. 일부 경우에, 주어진 양이온성 아미노산 중합체는 아르기닌, 리신, 히스티딘, 오르니틴 및 시트룰린 잔기의 믹스 (임의의 편리한 조합)를 포함할 수 있다. 중합체는 L-이성질체 또는 D-이성질체의 중합체로서 존재할 수 있으며, 여기서 D-이성질체는 분해되는데 더 오래 걸리기 때문에 표적 세포에서 더 안정하다. 따라서, D-이성질체 폴리(아미노산)의 포함은 분해 (및 후속 페이로드 방출)를 지연시킨다. 따라서 페이로드 방출 속도는 제어될 수 있고 D-이성질체의 중합체 대 L-이성질체의 중합체의 비에 비례하며, 여기서 D-이성질체 대 L-이성질체의 보다 높은 비는 페이로드 방출의 지속기간을 증가시킨다 (즉, 방출 속도를 감소시킴). 다시 말해서, D- 및 L-이성질체의 상대량은 방출 동역학 및 분해 및 페이로드 방출에 대한 효소적 감수성을 조정할 수 있다.

일부 경우에, 양이온성 중합체는 양이온성 아미노산 중합체 (예를 들어, 폴리(아르기닌) (PR), 폴리(리신) (PK), 폴리(히스티딘) (PH), 폴리(오르니틴), 폴리(시트룰린))의 D-이성질체 및 L-이성질체를 포함한다. 일부 경우에 D- 대 L-이성질체 비는 10:1-1:10 (예를 들어, 8:1-1:10, 6:1-1:10, 4:1-1:10, 3:1-1:10, 2:1-1:10, 1:1-1:10, 10:1-1:8, 8:1-1:8, 6:1-1:8, 4:1-1:8, 3:1-1:8, 2:1-1:8, 1:1-1:8, 10:1-1:6, 8:1-1:6, 6:1-1:6, 4:1-1:6, 3:1-1:6, 2:1-1:6, 1:1-1:6, 10:1-1:4, 8:1-1:4, 6:1-1:4, 4:1-1:4, 3:1-1:4, 2:1-1:4, 1:1-1:4, 10:1-1:3, 8:1-1:3, 6:1-1:3, 4:1-1:3, 3:1-1:3, 2:1-1:3, 1:1-1:3, 10:1-1:2, 8:1-1:2, 6:1-1:2, 4:1-1:2, 3:1-1:2, 2:1-1:2, 1:1-1:2, 10:1-1:1, 8:1-1:1, 6:1-1:1, 4:1-1:1, 3:1-1:1, 또는 2:1-1:1)의 범위이다.

따라서, 일부 경우에 양이온성 중합체는 D-이성질체의 중합체 (예를 들어, 폴리(D-아르기닌), 폴리(D-리신), 폴리(D-히스티딘), 폴리(D-오르니틴) 및 폴리(D-시트룰린)으로부터 선택됨)인 제1 양이온성 중합체 (예를 들어, 아미노산 중합체)를 포함하고; L-이성질체의 중합체 (예를 들어, 폴리(L-아르기닌), 폴리(L-리신), 폴리(L-히스티딘), 폴리(L-오르니틴) 및 폴리(L-시트룰린)으로부터 선택됨)인 제2 양이온성중합체 (예를 들어, 아미노산 중합체)를 포함한다. 일부 경우에, 제1 양이온성 중합체 (D-이성질체) 대 제2 양이온성 중합체 (L-이성질체)의 비는 10:1-1:10 (예를 들어 8:1-1:10, 6:1-1:10, 4:1-1:10, 3:1-1:10, 2:1-1:10, 1:1-1:10, 10:1-1:8, 8:1-1:8, 6:1-1:8, 4:1-1:8, 3:1-1:8, 2:1-1:8, 1:1-1:8, 10:1-1:6, 8:1-1:6, 6:1-1:6, 4:1-1:6, 3:1-1:6, 2:1-1:6, 1:1-1:6, 10:1-1:4, 8:1-1:4, 6:1-1:4, 4:1-1:4, 3:1-1:4, 2:1-1:4, 1:1-1:4, 10:1-1:3, 8:1-1:3, 6:1-1:3, 4:1-1:3, 3:1-1:3, 2:1-1:3, 1:1-1:3, 10:1-1:2, 8:1-1:2, 6:1-1:2, 4:1-1:2, 3:1-1:2, 2:1-1:2, 1:1-1:2, 10:1-1:1, 8:1-1:1, 6:1-1:1, 4:1-1:1, 3:1-1:1, 또는 2:1-1:1)의 범위이다.

일부 실시양태에서, 양이온성 중합체는 (예를 들어, 양이온성 중합체의 임의의 상기 예에 추가로 또는 그 대신에) 폴리(에틸렌이민), 폴리(아미도아민) (PAMAM), 폴리(아스파르트아미드), 폴리펩토이드 (예를 들어, 코어 축합을 위한 "거미줄"-유사 분지를 형성하기 위함), 전하-관능화 폴리에스테르, 양이온성 폴리사카라이드, 아세틸화 아미노 당, 키토산, 또는 그의 임의의 조합을 포함하는 양이온성 중합체 (예를 들어, 선형 또는 분지형 형태)를 포함한다.

일부 실시양태에서, 양이온성 중합체는 1-200 kDa (예를 들어, 1-150, 1-100, 1-50, 5-200, 5-150, 5-100, 5-50, 10-200, 10-150, 10-100, 10-50, 15-200, 15-150, 15-100, 또는 15-50 kDa) 범위의 분자량을 가질 수 있다. 예로서, 일부 경우에 양이온성 중합체는, 예를 들어 대략 29 kDa의 분자량을 갖는 폴리(L-아르기닌)을 포함한다. 또 다른 예로서, 일부 경우에 양이온성 중합체는 대략 25 kDa의 분자량을 갖는 선형 폴리(에틸렌이민) (PEI)을 포함한다. 또 다른 예로서, 일부 경우에 양이온성 중합체는 대략 10 kDa의 분자량을 갖는 분지형 폴리(에틸렌이민)을 포함한다. 또 다른 예로서, 일부 경우에 양이온성 중합체는 대략 70 kDa의 분자량을 갖는 분지형 폴리(에틸렌이민)을 포함한다. 일부 경우에, 양이온성 중합체는 PAMAM을 포함한다.

일부 경우에, 양이온성 아미노산 중합체는 핵 국재화 신호 (NLS) (하기에 보다 상세히 기재됨)를 포함한다 (및/또는 그에 접합됨). 따라서, 일부 실시양태에서, 양이온성 아미노산 중합체 (예를 들어, 폴리(아르기닌) (PR), 폴리(리신) (PK), 폴리(히스티딘) (PH), 폴리(오르니틴) 및 폴리(시트룰린), 폴리(D-아르기닌) (PDR), 폴리(D-리신) (PDK), 폴리(D-히스티딘) (PDH), 폴리(D-오르니틴) 및 폴리(D-시트룰린), 폴리(L-아르기닌) (PLR), 폴리(L-리신) (PLK), 폴리(L-히스티딘) (PLH), 폴리(L-오르니틴) 및 폴리(L-시트룰린))는 1개 이상 (예를 들어, 2개 이상, 3개 이상 또는 4개 이상)의 NLS를 포함한다. 일부 경우에, 양이온성 아미노산 중합체는 N- 및/또는 C-말단에 NLS를 포함한다. 일부 경우에, 양이온성 아미노산 중합체는 내부 NLS를 포함한다.

일부 경우에, 하전된 중합체 폴리펩티드 도메인은 핵산 페이로드 및/또는 단백질 페이로드와 축합된다 (예를 들어, 도 6 참조). 일부 경우에, 하전된 중합체 폴리펩티드 도메인은 단백질 페이로드와 정전기적으로 상호작용한다. 일부 경우에, 하전된 중합체 폴리펩티드 도메인은 실리카, 염 및/또는 음이온성 중합체와 공-축합되어, 부가된 엔도솜 완충 용량, 안정성 및 예를 들어 임의적인 시한 방출을 제공한다. 일부 경우에, 대상 전달 분자의 하전된 중합체 폴리펩티드 도메인은, 예를 들어 일부 4-25개 아미노산 길이 또는 4-15개 아미노산 길이의 반복 양이온성 잔기 (예컨대 아르기닌, 리신 및/또는 히스티딘)의 스트레치이다. 이러한 도메인은 전달 분자가 음이온성 유출가능한 매트릭스 (예를 들어, 공-축합된 음이온성 중합체)와 정전기적으로 상호작용하게 할 수 있다. 따라서, 일부 경우에 대상 전달 분자의 대상 하전된 중합체 폴리펩티드 도메인은 음이온성 유출가능한 매트릭스 및 핵산 및/또는 단백질 페이로드와 (예를 들어, 정전기적으로) 상호작용하는 반복 양이온성 잔기의 스트레치이다. 따라서, 일부 경우에 대상 전달 분자는 페이로드 (예를 들어, 핵산 및/또는 단백질)와 상호작용하고, 음이온성 중합체와 함께 조성물의 일부로서 존재한다 (예를 들어, 페이로드 및 음이온성 중합체와 공-축합됨).

음이온성 유출가능한 매트릭스의 음이온성 중합체 (즉, 대상 전달 분자의 하전된 중합체 폴리펩티드 도메인과 상호작용하는 음이온성 중합체)는 임의의 편리한 음이온성 중합체/중합체 조성물일 수 있다. 예는 폴리(글루탐산) (예를 들어, 폴리(D-글루탐산) (PDE), 폴리(L-글루탐산) (PLE), 다양한 목적하는 비의 PDE 및 PLE 둘 다 등)을 포함하나 이에 제한되지는 않는다. 일부 경우에, PDE는 음이온성 유출가능한 매트릭스로서 사용된다. 일부 경우에, PLE는 음이온성 유출가능한 매트릭스 (음이온성 중합체)로서 사용된다. 일부 경우에, PDE는 음이온성 유출가능한 매트릭스 (음이온성 중합체)로서 사용된다. 일부 경우에, PLE 및 PDE는 둘 다 음이온성 유출가능한 매트릭스 (음이온성 중합체)로서, 예를 들어 1:1 비 (50% PDE, 50% PLE)로 사용된다.

음이온성 중합체

음이온성 중합체는 1개 이상의 음이온성 아미노산 중합체를 포함할 수 있다. 예를 들어, 일부 경우에 대상 음이온성 중합체 조성물은 폴리(글루탐산) (PEA), 폴리(아스파르트산) (PDA) 및 그의 조합으로부터 선택된 중합체를 포함한다. 일부 경우에, 주어진 음이온성 아미노산 중합체는 아스파르트산 및 글루탐산 잔기의 믹스를 포함할 수 있다. 각각의 중합체는 L-이성질체 또는 D-이성질체의 중합체로서 조성물 중에 존재할 수 있으며, 여기서 D-이성질체는 분해되는데 더 오래 걸리기 때문에 표적 세포에서 더 안정하다. 따라서, D-이성질체 폴리(아미노산)의 포함은 분해 및 후속 페이로드 방출을 지연시킬 수 있다. 따라서 페이로드 방출 속도는 제어될 수 있고 D-이성질체의 중합체 대 L-이성질체의 중합체의 비에 비례하며, 여기서 D-이성질체 대 L-이성질체의 보다 높은 비는 페이로드 방출의 지속기간을 증가시킨다 (즉, 방출 속도를 감소시킴). 다시 말해서, D- 및 L-이성질체의 상대량은 나노입자 코어의 시한 방출 동역학 및 분해 및 페이로드 방출에 대한 효소적 감수성을 조정할 수 있다.

일부 경우에 음이온성 중합체 조성물은 음이온성 아미노산 중합체 (예를 들어, 폴리(글루탐산) (PEA) 및 폴리(아스파르트산) (PDA))의 D-이성질체의 중합체 및 L-이성질체의 중합체를 포함한다. 일부 경우에 D- 대 L-이성질체 비는 10:1-1:10 (예를 들어, 8:1-1:10, 6:1-1:10, 4:1-1:10, 3:1-1:10, 2:1-1:10, 1:1-1:10, 10:1-1:8, 8:1-1:8, 6:1-1:8, 4:1-1:8, 3:1-1:8, 2:1-1:8, 1:1-1:8, 10:1-1:6, 8:1-1:6, 6:1-1:6, 4:1-1:6, 3:1-1:6, 2:1-1:6, 1:1-1:6, 10:1-1:4, 8:1-1:4, 6:1-1:4, 4:1-1:4, 3:1-1:4, 2:1-1:4, 1:1-1:4, 10:1-1:3, 8:1-1:3, 6:1-1:3, 4:1-1:3, 3:1-1:3, 2:1-1:3, 1:1-1:3, 10:1-1:2, 8:1-1:2, 6:1-1:2, 4:1-1:2, 3:1-1:2, 2:1-1:2, 1:1-1:2, 10:1-1:1, 8:1-1:1, 6:1-1:1, 4:1-1:1, 3:1-1:1, 또는 2:1-1:1)의 범위이다.

일부 실시양태에서, 음이온성 중합체 조성물은 (예를 들어, 음이온성 중합체의 임의의 상기 예에 추가로 또는 그 대신에) 글리코사미노글리칸, 당단백질, 폴리사카라이드, 폴리(만누론산), 폴리(굴루론산), 헤파린, 헤파린 술페이트, 콘드로이틴, 콘드로이틴 술페이트, 케라탄, 케라탄 술페이트, 아그레칸, 폴리(글루코사민), 또는 그의 임의의 조합을 포함하는 음이온성 중합체를 포함한다.

일부 실시양태에서, 음이온성 중합체는 1-200 kDa (예를 들어, 1-150, 1-100, 1-50, 5-200, 5-150, 5-100, 5-50, 10-200, 10-150, 10-100, 10-50, 15-200, 15-150, 15-100, 또는 15-50 kDa) 범위의 분자량을 가질 수 있다. 예로서, 일부 경우에 음이온성 중합체는 대략 15 kDa의 분자량을 갖는 폴리(글루탐산)을 포함한다.

일부 경우에, 음이온성 중합체는 표적화 리간드에 접합된다.

링커

일부 실시양태에서 표적화 리간드는 앵커링 도메인 (예를 들어, 양이온성 앵커링 도메인, 음이온성 앵커링 도메인)에 또는 페이로드에 개재 링커를 통해 접합된다. 링커는 단백질 링커 또는 비-단백질 링커일 수 있다. 링커는 일부 경우에 안정성을 보조하고/거나, 보체 활성화를 방지하고/거나, 앵커링 도메인에 비해 리간드에 가요성을 제공할 수 있다.

링커에 대한 표적화 리간드의 접합 또는 앵커링 도메인에 대한 링커의 접합은 다수의 상이한 방식으로 달성될 수 있다. 일부 경우에, 접합은 술프히드릴 화학 (예를 들어, 예컨대 2개의 시스테인 잔기 사이의 디술피드 결합)을 통한 것이다. 일부 경우에 접합은 아민-반응성 화학을 사용하여 달성된다. 일부 경우에, 표적화 리간드는 시스테인 잔기를 포함하고, 시스테인 잔기를 통해 링커에 접합되고/거나; 앵커링 도메인은 시스테인 잔기를 포함하고, 시스테인 잔기를 통해 링커에 접합된다. 일부 경우에, 링커는 펩티드 링커이고, 시스테인 잔기를 포함한다. 일부 경우에, 표적화 리간드 및 펩티드 링커는 동일한 폴리펩티드의 일부가 되어 접합되고/거나; 앵커링 도메인 및 펩티드 링커는 동일한 폴리펩티드의 일부가 되어 접합된다.

일부 경우에, 대상 링커는 폴리펩티드이고, 폴리펩티드 링커로 지칭될 수 있다. 폴리펩티드 링커가 고려되지만, 비-폴리펩티드 링커 (화학적 링커)가 일부 경우에 사용되는 것으로 이해되어야 한다. 예를 들어, 일부 실시양태에서 링커는 폴리에틸렌 글리콜 (PEG) 링커이다. 적합한 단백질 링커는 4개 아미노산 내지 60개 아미노산 길이 (예를 들어, 4-50, 4-40, 4-30, 4-25, 4-20, 4-15, 4-10, 6-60, 6-50, 6-40, 6-30, 6-25, 6-20, 6-15, 6-10, 8-60, 8-50, 8-40, 8-30, 8-25, 8-20, 또는 8-15개 아미노산 길이)의 폴리펩티드를 포함한다.

일부 실시양태에서, 대상 링커는 강성이다 (예를 들어, 1개 이상의 프롤린 잔기를 포함하는 링커). 강성 링커의 하나의 비제한적 예는 GAPGAPGAP (서열식별번호: 17)이다. 일부 경우에, 폴리펩티드 링커는 N- 또는 C-말단 단부에 C 잔기를 포함한다. 따라서, 일부 경우에 강성 링커는 GAPGAPGAPC (서열식별번호: 18) 및 CGAPGAPGAP (서열식별번호: 19)로부터 선택된다.

소정의 정도의 가요성을 갖는 펩티드 링커가 사용될 수 있다. 따라서, 일부 경우에 대상 링커는 가요성이다. 연결 펩티드는 가요성 링커가 일반적으로 가요성 펩티드를 생성하는 서열을 가질 것임을 염두에 두고 사실상 임의의 아미노산 서열을 가질 수 있다. 작은 아미노산, 예컨대 글리신 및 알라닌의 사용은 가요성 펩티드를 생성하는데 사용하기 위한 것이다. 이러한 서열의 생성은 관련 기술분야의 통상의 기술자에게 상용적이다. 다양한 상이한 링커가 상업적으로 입수가능하고, 사용하기에 적합한 것으로 간주된다. 링커 폴리펩티드의 예는 글리신 중합체 (G)_n, 글리신-세린 중합체 (예를 들어, (GS)_n, GSGGS_n (서열식별번호: 20), GGSGGS_n (서열식별번호: 21) 및 GGGS_n(서열식별번호: 22) (여기서, n은 적어도 1의 정수임) 포함), 글리신-알라닌 중합체, 알라닌-세린 중합체를 포함한다. 링커의 예는 GGSG (서열식별번호: 23), GGSGG (서열식별번호: 24), GSGSG (서열식별번호: 25), GSGGG (서열식별번호: 26), GGGSG (서열식별번호: 27), GSSSG (서열식별번호: 28) 등을 포함하나 이에 제한되지는 않는 아미노산 서열을 포함할 수 있다. 통상의 기술자는 상기 기재된 임의의 요소에 접합된 펩티드의 설계가 전체적으로 또는 부분적으로 가요성인 링커를 포함할 수 있으므로, 링커가 가요성 링커뿐만 아니라 덜 가요성인 구조를 부여하는 1개 이상의 부분을 포함할 수 있다는 것을 인지할 것이다. 가요성 링커의 추가의 예는 GGGGGSGGGGG (서열식별번호: 29) 및 GGGGGSGGGGS (서열식별번호: 30)를 포함하나 이에 제한되지는 않는다. 상기 언급된 바와 같이, 일부 경우에, 폴리펩티드 링커는 N- 또는 C-말단 단부에 C 잔기를 포함한다. 따라서, 일부 경우에 가요성 링커는 GGGGGSGGGGGC (서열식별번호: 31), CGGGGGSGGGGG (서열식별번호: 32), GGGGGSGGGGSC (서열식별번호: 33) 및 CGGGGGSGGGGS (서열식별번호: 34)로부터 선택된 아미노산 서열을 포함한다.

일부 경우에, 대상 폴리펩티드 링커는 엔도솜용해성이다. 엔도솜용해성 폴리펩티드 링커는 KALA (서열식별번호: 35) 및 GALA (서열식별번호: 36)를 포함하나 이에 제한되지는 않는다. 상기 언급된 바와 같이, 일부 경우에, 폴리펩티드 링커는 N- 또는 C-말단 단부에 C 잔기를 포함한다. 따라서, 일부 경우에 대상 링커는 CKALA (서열식별번호: 37), KALAC (서열식별번호: 38), CGALA (서열식별번호: 39) 및 GALAC (서열식별번호: 40)로부터 선택된 아미노산 서열을 포함한다.

술프히드릴 커플링 반응의 예시적인 예

(예를 들어, 예컨대 시스테인 잔기를 사용하는 술프히드릴 화학을 통한 접합을 위한 것)

(예를 들어, 표적화 리간드 또는 당펩티드를 링커에 접합시키거나, 표적화 리간드 또는 당펩티드를 앵커링 도메인 (예를 들어, 양이온성 앵커링 도메인)에 접합시키거나, 링커를 앵커링 도메인 (예를 들어, 양이온성 앵커링 도메인)에 접합시키기 위한 것 등).

디술피드 결합

유리 술프히드릴 기를 함유하는 환원 상태의 시스테인 잔기는 전형적인 디술피드 교환 반응에서 보호된 티올과 디술피드 결합을 용이하게 형성한다.

티오에테르/티오에스테르 결합

시스테인의 술프히드릴 기는 말레이미드 및 아실 할라이드 기와 반응하여, 각각 안정한 티오에테르 및 티오에스테르 결합을 형성한다.

아지드 - 알킨 고리화첨가

이러한 접합은 알킨 결합을 함유하는 시스테인 잔기의 화학적 변형에 의해 또는 합성 펩티드 제조 (예를 들어, 고체 상 합성)에서 L-프로파르길 아미노산 유도체 (예를 들어, L-프로파르길 시스테인 - 하기에 도시됨)의 사용에 의해 용이해진다. 이어서, 커플링은 Cu 촉진된 클릭 화학에 의해 달성된다.

표적화 리간드의 예

표적화 리간드의 예는 하기 아미노산 서열을 포함하는 것을 포함하나 이에 제한되지는 않는다:

SCF (c-Kit 수용체를 표적화하거나/그에 결합함)

CD70 (CD27을 표적화하거나/그에 결합함)

SH2 도메인-함유 단백질 1A (SH2D1A) (CD150을 표적화하거나/그에 결합함)

따라서, 표적화 리간드 (단독으로 또는 다른 표적화 리간드와 조합되어 사용될 수 있음)의 비제한적 예는 하기를 포함한다:

전달 분자 및 성분의 예시적인 예

(0a) 시스테인 접합 앵커 1 (CCA1)

[앵커링 도메인 (예를 들어, 양이온성 앵커링 도메인) - 링커 (GAPGAPGAP) - 시스테인]

RRRRRRRRR GAPGAPGAP C (서열식별번호: 41)

(0b) 시스테인 접합 앵커 2 (CCA2)

[시스테인 - 링커 (GAPGAPGAP) - 앵커링 도메인 (예를 들어, 양이온성 앵커링 도메인)]

C GAPGAPGAP RRRRRRRRR (서열식별번호: 42)

(1a) α5β1 리간드

[앵커링 도메인 (예를 들어, 양이온성 앵커링 도메인) - 링커 (GAPGAPGAP) - 표적화 리간드]

RRRRRRRRR GAPGAPGAP RRETAWA (서열식별번호: 45)

(1b) α5β1 리간드

[표적화 리간드 - 링커 (GAPGAPGAP) - 앵커링 도메인 (예를 들어, 양이온성 앵커링 도메인)]

RRETAWA GAPGAPGAP RRRRRRRRR (서열식별번호: 46)

(1c) α5β1 리간드 - Cys 좌측

CGAPGAPGAP (서열식별번호: 19)

주: 이는 술프히드릴 화학 (예를 들어, 디술피드 결합) 또는 아민-반응성 화학을 통해 CCA1 (상기 참조)에 접합될 수 있다.

(1d) α5β1 리간드 - Cys 우측

GAPGAPGAPC (서열식별번호: 18)

주: 이는 술프히드릴 화학 (예를 들어, 디술피드 결합) 또는 아민-반응성 화학을 통해 CCA2 (상기 참조)에 접합될 수 있다.

(2a) RGD α5β1 리간드

RRRRRRRRR GAPGAPGAP RGD (서열식별번호: 47)

(2b) RGD a5b1 리간드

RGD GAPGAPGAP RRRRRRRRR (서열식별번호: 48)

(2c) RGD 리간드 - Cys 좌측

CRGD (서열식별번호: 49)

(2d) RGD 리간드 - Cys 우측

RGDC (서열식별번호: 50)

(3a) 트랜스페린 리간드

RRRRRRRRR GAPGAPGAP THRPPMWSPVWP (서열식별번호: 51)

(3b) 트랜스페린 리간드

THRPPMWSPVWP GAPGAPGAP RRRRRRRRR (서열식별번호: 52)

(3c) 트랜스페린 리간드 - Cys 좌측

CTHRPPMWSPVWP (서열식별번호: 53)

CPTHRPPMWSPVWP (서열식별번호: 54)

(3d) 트랜스페린 리간드 - Cys 우측

THRPPMWSPVWPC (서열식별번호: 55)

(4a) E-셀렉틴 리간드 [1-21]

RRRRRRRRR GAPGAPGAP MIASQFLSALTLVLLIKESGA (서열식별번호: 56)

(4b) E-셀렉틴 리간드 [1-21]

MIASQFLSALTLVLLIKESGA GAPGAPGAP RRRRRRRRR (서열식별번호: 57)

(4c) E-셀렉틴 리간드 [1-21] - Cys 좌측

CMIASQFLSALTLVLLIKESGA (서열식별번호: 58)

(4d) E-셀렉틴 리간드 [1-21] - Cys 우측

MIASQFLSALTLVLLIKESGAC (서열식별번호: 59)

(5a) FGF 단편 [26-47]

RRRRRRRRR GAPGAPGAP KNGGFFLRIHPDGRVDGVREKS (서열식별번호: 60)

(5b) FGF 단편 [26-47]

KNGGFFLRIHPDGRVDGVREKS GAPGAPGAP RRRRRRRRR (서열식별번호: 61)

(5c) FGF 단편 [25-47] - 좌측의 Cys 천연

CKNGGFFLRIHPDGRVDGVREKS (서열식별번호: 43)

(5d) FGF 단편 [26-47] - Cys 우측

KNGGFFLRIHPDGRVDGVREKSC (SEQ ID NO: 44)

(6a) 엑센딘 (S11C) [1-39]

HGEGTFTSDLCKQMEEEAVRLFIEWLKNGGPSSGAPPPS (서열식별번호: 2)

표적화 리간드

다양한 표적화 리간드 (예를 들어, 대상 전달 분자의 일부로서, 예를 들어 나노입자의 일부로서)가 사용될 수 있고, 수많은 상이한 표적화 리간드가 고려된다. 일부 실시양태에서 표적화 리간드는 야생형 단백질의 단편 (예를 들어, 결합 도메인)이다. 예를 들어, 일부 경우에 대상 전달 분자의 펩티드 표적화 리간드는 4-50개 아미노산 (예를 들어, 4-40, 4-35, 4-30, 4-25, 4-20, 4-15, 5-50, 5-40, 5-35, 5-30, 5-25, 5-20, 5-15, 7-50, 7-40, 7-35, 7-30, 7-25, 7-20, 7-15, 8-50, 8-40, 8-35, 8-30, 8-25, 8-20 또는 8-15개 아미노산)의 길이를 가질 수 있다. 표적화 리간드는 야생형 단백질의 단편일 수 있지만, 일부 경우에 야생형 아미노산 서열에 비해 돌연변이 (예를 들어, 삽입, 결실, 치환) (즉, 상응하는 야생형 단백질 서열에 비해 돌연변이)를 갖는다. 예를 들어, 표적화 리간드는 표적 세포 표면 단백질과의 결합 친화도를 증가 또는 감소시키는 돌연변이를 포함할 수 있다.

일부 경우에 표적화 리간드는 항체의 항원-결합 영역 (F(ab))이다. 일부 경우에 표적화 리간드는 ScFv이다. "Fv"는 완전한 항원-인식 및 결합 부위를 함유하는 최소 항체 단편이다. 2-쇄 Fv 종에서, 이러한 영역은 1개의 중쇄 및 1개의 경쇄 가변 도메인이 단단하게 비-공유 회합된 이량체로 이루어진다. 단일쇄 Fv (scFv) 종에서, 1개의 중쇄 및 1개의 경쇄 가변 도메인은 경쇄 및 중쇄가 2-쇄 Fv 종에서의 것과 유사한 "이량체" 구조로 회합될 수 있도록 가요성 펩티드 링커에 의해 공유 연결될 수 있다. scFv의 검토에 대해서는 문헌 [Pluckthun, in The Pharmacology of Monoclonal Antibodies, vol. 113, Rosenburg and Moore eds., Springer-Verlag, New York, pp. 269-315 (1994)]을 참조한다.

일부 경우에 표적화 리간드는 바이러스 당단백질을 포함하고, 이는 일부 경우에 편재성 표면 마커, 예컨대 헤파린 술페이트 프로테오글리칸에 결합하고, 막 러플링 연관 과정을 통해 일부 세포 집단에서 미세음세포작용 (및/또는 거대음세포작용)을 유도할 수 있다. 폴리(L-아르기닌)은 표면 마커, 예컨대 헤파린 술페이트 프로테오글리칸에 대한 결합에 또한 사용될 수 있는 또 다른 예시적인 표적화 리간드이다.

일부 경우에 표적화 리간드는 입자 표면 (예를 들어, 나노입자 표면) 상에 정전기적으로 또는 입자 표면에 대한 공유 변형 또는 입자 표면 상의 1개 이상의 중합체를 이용하여 코팅된다. 일부 경우에, 표적화 리간드는 링커 및/또는 앵커링 도메인 (예를 들어, 양이온성 앵커링 도메인)에 대한 접합을 용이하게 할 수 있는 시스테인 잔기를 부가하는 돌연변이를 포함할 수 있다. 예를 들어, 시스테인은 술프히드릴 화학 (예를 들어, 디술피드 결합) 및/또는 아민-반응성 화학을 통한 가교 (접합)에 사용될 수 있다.

일부 경우에, 표적화 리간드는 내부 시스테인 잔기를 포함한다. 일부 경우에, 표적화 리간드는 N- 및/또는 C-말단에 시스테인 잔기를 포함한다. 일부 경우에, 시스테인 잔기를 포함하기 위해, 표적화 리간드는, 예를 들어 상응하는 야생형 서열에 비해 돌연변이된다 (예를 들어, 삽입 또는 치환). 따라서, 본원에 기재된 임의의 표적화 리간드는 시스테인 잔기에의 삽입 및/또는 치환 (예를 들어, 시스테인 잔기의 내부, N-말단, C-말단 삽입 또는 그로의 치환)에 의해 변형될 수 있다.

"상응하는" 야생형 서열은 대상 서열이 유래되었거나 유래될 수 있는 야생형 서열 (예를 들어, 관심 서열과 높은 서열 동일성을 갖는 야생형 단백질 서열)을 의미한다. 일부 경우에, "상응하는" 야생형 서열은 관심 아미노산 스트레치에 걸쳐 85% 이상의 서열 동일성 (예를 들어, 90% 이상, 92% 이상, 95% 이상, 97% 이상, 98% 이상, 99% 이상, 99.5% 이상 또는 100%의 서열 동일성)을 갖는 것이다. 예를 들어, 1개 이상의 돌연변이 (예를 들어, 치환, 삽입)를 갖지만 그 외에는 야생형 서열과 고도로 유사한 표적화 리간드의 경우, 가장 유사한 아미노산 서열이 상응하는 야생형 아미노산 서열인 것으로 간주될 수 있다.

상응하는 야생형 단백질/서열은 (변형된 위치(들)의 외부에서) 100% 동일할 필요는 없지만 (예를 들어, 85% 이상 동일, 90% 이상 동일, 95% 이상 동일, 98% 이상 동일, 99% 이상 동일한 것 등일 수 있음), 표적화 리간드 및 상응하는 야생형 단백질 (예를 들어, 야생 단백질의 단편)은 의도된 세포 표면 단백질에 결합할 수 있고 (변형된 영역의 외부에서) 충분한 서열 동일성을 보유하여 이들이 상동인 것으로 간주될 수 있다. "상응하는" 야생형 단백질 서열의 아미노산 서열은 임의의 편리한 방법을 사용하여 (예를 들어, 임의의 편리한 서열 비교/정렬 소프트웨어, 예컨대 BLAST, MUSCLE, T-COFFEE 등을 사용하여) 확인/평가될 수 있다.

표면 코트의 일부로서 (예를 들어, 표면 코트의 전달 분자의 일부로서) 사용될 수 있는 표적화 리간드의 예는 표 1에 열거된 것을 포함하나 이에 제한되지는 않는다. 대상 전달 분자의 일부로서 사용될 수 있는 표적화 리간드의 예는 표 3에 열거된 것을 포함하나 이에 제한되지는 않는다 (표 3에 열거된 서열 중 다수는 링커 (예를 들어, GGGGSGGGGS)를 통해 양이온성 폴리펩티드 도메인, 예를 들어 9R, 6R 등에 접합된 표적화 리간드 (예를 들어, 2열의 SNRWLDVK)를 포함함). 표적화 리간드에 포함될 수 있는 아미노산 서열의 예는 NPKLTRMLTFKFY (서열식별번호: xx) (IL2), TSVGKYPNTGYYGD (서열식별번호: xx) (CD3), SNRWLDVK (Siglec), EKFILKVRPAFKAV (서열식별번호: xx) (SCF); EKFILKVRPAFKAV (서열식별번호: xx) (SCF), EKFILKVRPAFKAV (서열식별번호: xx) (SCF), SNYSIIDKLVNIVDDLVECVKENS (서열식별번호: xx) (cKit), 및 Ac-SNYSAibADKAibANAibADDAibAEAibAKENS (서열식별번호: xx) (cKit)를 포함하나 이에 제한되지는 않는다. 따라서, 일부 경우에 표적화 리간드는 NPKLTRMLTFKFY (서열식별번호: xx) (IL2), TSVGKYPNTGYYGD (서열식별번호: xx) (CD3), SNRWLDVK (Siglec), EKFILKVRPAFKAV (서열식별번호: xx) (SCF); EKFILKVRPAFKAV (서열식별번호: xx) (SCF), EKFILKVRPAFKAV (서열식별번호: xx) (SCF), 또는 SNYSIIDKLVNIVDDLVECVKENS (서열식별번호: xx) (cKit)와 85% 이상 (예를 들어, 90% 이상, 95% 이상, 98% 이상, 99% 이상 또는 100%)의 서열 동일성을 갖는 아미노산 서열을 포함한다.

표 1.

표적화 리간드의 예

표적화 리간드 (예를 들어, 전달 분자의 것)는 아미노산 서열 RGD 및/또는 서열식별번호: 1-12 중 어느 하나에 제시된 아미노산 서열과 85% 이상의 서열 동일성 (예를 들어, 90% 이상, 95% 이상, 97% 이상, 98% 이상, 99% 이상, 99.5% 이상 또는 100%의 서열 동일성)을 갖는 아미노산 서열을 포함할 수 있다. 일부 경우에, 표적화 리간드는 아미노산 서열 RGD 및/또는 서열식별번호: 1-12 중 어느 하나에 제시된 아미노산 서열을 포함한다. 일부 실시양태에서, 표적화 리간드는 시스테인 (내부, C-말단 또는 N-말단)을 포함할 수 있고, 또한 아미노산 서열 RGD 및/또는 서열식별번호: 1-12 중 어느 하나에 제시된 아미노산 서열과 85% 이상의 서열 동일성 (예를 들어, 90% 이상, 95% 이상, 97% 이상, 98% 이상, 99% 이상, 99.5% 이상 또는 100%의 서열 동일성)을 갖는 아미노산 서열을 포함할 수 있다.

표적화 리간드 (예를 들어, 전달 분자의 것)는 아미노산 서열 RGD 및/또는 서열식별번호: 1-12 및 181-187 중 어느 하나에 제시된 아미노산 서열과 85% 이상의 서열 동일성 (예를 들어, 90% 이상, 95% 이상, 97% 이상, 98% 이상, 99% 이상, 99.5% 이상 또는 100%의 서열 동일성)을 갖는 아미노산 서열을 포함할 수 있다. 일부 경우에, 표적화 리간드는 아미노산 서열 RGD 및/또는 서열식별번호: 1-12 및 181-187 중 어느 하나에 제시된 아미노산 서열을 포함한다. 일부 실시양태에서, 표적화 리간드는 시스테인 (내부, C-말단 또는 N-말단)을 포함할 수 있고, 또한 아미노산 서열 RGD 및/또는 서열식별번호: 1-12 및 181-187 중 어느 하나에 제시된 아미노산 서열과 85% 이상의 서열 동일성 (예를 들어, 90% 이상, 95% 이상, 97% 이상, 98% 이상, 99% 이상, 99.5% 이상 또는 100%의 서열 동일성)을 갖는 아미노산 서열을 포함할 수 있다.

표적화 리간드 (예를 들어, 전달 분자의 것)는 아미노산 서열 RGD 및/또는 서열식별번호: 1-12, 181-187 및 271-277 중 어느 하나에 제시된 아미노산 서열과 85% 이상의 서열 동일성 (예를 들어, 90% 이상, 95% 이상, 97% 이상, 98% 이상, 99% 이상, 99.5% 이상 또는 100%의 서열 동일성)을 갖는 아미노산 서열을 포함할 수 있다. 일부 경우에, 표적화 리간드는 아미노산 서열 RGD 및/또는 서열식별번호: 1-12, 181-187 및 271-277 중 어느 하나에 제시된 아미노산 서열을 포함한다. 일부 실시양태에서, 표적화 리간드는 시스테인 (내부, C-말단 또는 N-말단)을 포함할 수 있고, 또한 아미노산 서열 RGD 및/또는 서열식별번호: 1-12, 181-187 및 271-277 중 어느 하나에 제시된 아미노산 서열과 85% 이상의 서열 동일성 (예를 들어, 90% 이상, 95% 이상, 97% 이상, 98% 이상, 99% 이상, 99.5% 이상 또는 100%의 서열 동일성)을 갖는 아미노산 서열을 포함할 수 있다.

일부 경우에, 표적화 리간드 (예를 들어, 전달 분자의 것)는 서열식별번호: 181-187 및 271-277 중 어느 하나에 제시된 아미노산 서열과 85% 이상의 서열 동일성 (예를 들어, 90% 이상, 95% 이상, 97% 이상, 98% 이상, 99% 이상, 99.5% 이상 또는 100%의 서열 동일성)을 갖는 아미노산 서열을 포함할 수 있다. 일부 경우에, 표적화 리간드는 서열식별번호: 181-187 및 271-277 중 어느 하나에 제시된 아미노산 서열을 포함한다. 일부 실시양태에서, 표적화 리간드는 시스테인 (내부, C-말단 또는 N-말단)을 포함할 수 있고, 또한 서열식별번호: 181-187 및 271-277 중 어느 하나에 제시된 아미노산 서열과 85% 이상의 서열 동일성 (예를 들어, 90% 이상, 95% 이상, 97% 이상, 98% 이상, 99% 이상, 99.5% 이상 또는 100%의 서열 동일성)을 갖는 아미노산 서열을 포함할 수 있다.

일부 경우에, 표적화 리간드 (예를 들어, 전달 분자의 것)는 서열식별번호: 181-187 중 어느 하나에 제시된 아미노산 서열과 85% 이상의 서열 동일성 (예를 들어, 90% 이상, 95% 이상, 97% 이상, 98% 이상, 99% 이상, 99.5% 이상 또는 100%의 서열 동일성)을 갖는 아미노산 서열을 포함할 수 있다. 일부 경우에, 표적화 리간드는 서열식별번호: 181-187 중 어느 하나에 제시된 아미노산 서열을 포함한다. 일부 실시양태에서, 표적화 리간드는 시스테인 (내부, C-말단 또는 N-말단)을 포함할 수 있고, 또한 서열식별번호: 181-187 중 어느 하나에 제시된 아미노산 서열과 85% 이상의 서열 동일성 (예를 들어, 90% 이상, 95% 이상, 97% 이상, 98% 이상, 99% 이상, 99.5% 이상 또는 100%의 서열 동일성)을 갖는 아미노산 서열을 포함할 수 있다.

일부 경우에, 표적화 리간드 (예를 들어, 전달 분자의 것)는 서열식별번호: 271-277 중 어느 하나에 제시된 아미노산 서열과 85% 이상의 서열 동일성 (예를 들어, 90% 이상, 95% 이상, 97% 이상, 98% 이상, 99% 이상, 99.5% 이상 또는 100%의 서열 동일성)을 갖는 아미노산 서열을 포함할 수 있다. 일부 경우에, 표적화 리간드는 서열식별번호: 271-277 중 어느 하나에 제시된 아미노산 서열을 포함한다. 일부 실시양태에서, 표적화 리간드는 시스테인 (내부, C-말단 또는 N-말단)을 포함할 수 있고, 또한 서열식별번호: 271-277 중 어느 하나에 제시된 아미노산 서열과 85% 이상의 서열 동일성 (예를 들어, 90% 이상, 95% 이상, 97% 이상, 98% 이상, 99% 이상, 99.5% 이상 또는 100%의 서열 동일성)을 갖는 아미노산 서열을 포함할 수 있다.

용어 "표적" 및 "표적화된 결합"은 특이적 결합을 지칭하는 것으로 본원에 사용된다. 용어 "특이적 결합", "특이적으로 결합한다" 등은 용액 또는 반응 혼합물 내의 다른 분자 또는 모이어티에 비해 한 분자에 대한 비-공유 또는 공유 우선적 결합을 지칭한다 (예를 들어, 항체는 다른 이용가능한 폴리펩티드에 비해 특정한 폴리펩티드 또는 에피토프에 특이적으로 결합하고, 리간드는 다른 이용가능한 수용체에 비해 특정한 수용체에 특이적으로 결합함). 일부 실시양태에서, 한 분자가 특이적으로 결합하는 또 다른 분자에 대한 그의 친화도는 10^-5 M 이하 (예를 들어, 10^-6 M 이하, 10^-7 M 이하, 10^-8 M 이하, 10^-9 M 이하, 10^-10 M 이하, 10^-11 M 이하, 10^-12 M 이하, 10^-13 M 이하, 10^-14 M 이하, 10^-15 M 이하, 또는 10^-16 M 이하)의 K_d (해리 상수)를 특징으로 한다. "친화도"는 결합 강도를 지칭하고, 증가된 결합 친화도는 보다 낮은 K_d와 상관관계가 있다.

일부 경우에, 표적화 리간드는 패밀리 B G-단백질 커플링된 수용체 (GPCR), 수용체 티로신 키나제 (RTK), 세포 표면 당단백질 및 세포-세포 부착 분자로부터 선택된 세포 표면 단백질에 대한 표적화된 결합을 제공한다. 수용체 도킹시 리간드의 공간 배열의 고찰을 사용하여 목적하는 기능적 선택성 및 엔도솜 분류 편향을 달성할 수 있으므로, 예를 들어 리간드와 표적 사이의 구조 기능 관계는 페이로드 또는 앵커링 도메인 (예를 들어, 양이온성 앵커링 도메인)에 대한 표적화 리간드의 접합으로 인해 파괴되지 않는다. 예를 들어, 핵산, 단백질, 리보핵단백질 또는 앵커링 도메인 (예를 들어, 양이온성 앵커링 도메인)에 대한 접합은 잠재적으로 결합 간극(들)를 방해할 수 있다.

따라서, 일부 경우에 리간드에 결합된 목적하는 표적 (세포 표면 단백질)의 결정 구조가 이용가능한 경우 (또는 이러한 구조가 관련 단백질에 이용가능한 경우), 3D 구조 모델링 및 서열 스레딩을 사용하여 리간드와 표적 사이의 상호작용 부위를 시각화할 수 있다. 이는, 예를 들어 치환 및/또는 삽입 (예를 들어, 시스테인 잔기)의 배치를 위한 내부 부위의 선택을 용이하게 할 수 있다.

예로서, 일부 경우에, 표적화 리간드는 패밀리 B G 단백질 커플링된 수용체 (GPCR) ('세크레틴-패밀리'로도 공지됨)에 대한 결합을 제공한다. 일부 경우에, 표적화 리간드는 각각 표적화된 결합 및 긴 엔도솜 재순환 경로의 결속을 제공하는 패밀리 B GPCR의 알로스테릭-친화도 도메인 및 오르토스테릭 도메인 둘 다에 대한 결합을 제공한다.

G-단백질-커플링된 수용체 (GPCR)는 이들이 G 단백질 (이종삼량체 GTPase)과 상호작용하여 세포내 제2 메신저, 예컨대 시클릭 AMP, 이노시톨 포스페이트, 디아실글리세롤 및 칼슘 이온의 합성을 조절한다는 점에서 공통 분자 아키텍처 (7개의 추정 막횡단 절편을 가짐) 및 공통 신호전달 메카니즘을 공유한다. GPCR의 패밀리 B (세크레틴-수용체 패밀리 또는 '패밀리 2')는 원형질 막에서의 세포간 상호작용을 매개하는 것으로 생각되는 분자 및 폴리펩티드 호르몬에 대한 수용체를 포함하는 작지만 구조적으로 및 기능적으로 다양한 단백질 군이다 (예를 들어, 문헌 [Harmar et al., Genome Biol. 2001;2(12):REVIEWS3013] 참조). 결합된 리간드를 갖거나 갖지 않는 N-말단의 여러 결정 구조의 공개를 포함한, 세크레틴-수용체 패밀리의 구성원에 관한 구조 생물학에서의 중요한 진보가 존재하였으며, 이러한 연구는 리간드 결합의 이해를 확장시키고 구조-기반 리간드 설계를 위한 유용한 플랫폼을 제공한다 (예를 들어, 문헌 [Poyner et al., Br J Pharmacol. 2012 May;166(1):1-3] 참조).

예를 들어, 엑센딘-4 리간드 또는 그의 유도체 (예를 들어, 시스테인 치환된 엑센딘-4 표적화 리간드, 예컨대 서열식별번호: 2로서 제시된 것)를 사용하여 췌장 세포 표면 단백질 GLP1R을 표적화하는데 (예를 들어, β-섬을 표적화하는데) 대상 전달 분자를 사용하는 것이 바람직할 수 있다. GLP1R은 뇌 및 췌장 내에서 풍부하기 때문에, GLP1R에 대한 표적화된 결합을 제공하는 표적화 리간드는 뇌 및 췌장을 표적화하는데 사용될 수 있다. 따라서, GLP1R을 표적화하는 것은 헌팅톤병 (CAG 반복 확장 돌연변이), 파킨슨병 (LRRK2 돌연변이), ALS (SOD1 돌연변이) 및 다른 CNS 질환과 같은 질환의 치료 (예를 들어, 1개 이상의 유전자 편집 도구의 전달을 통함)에 초점을 맞춘 방법 (예를 들어, 치료 방법)을 용이하게 한다. GLP1R을 표적화하는 것은 또한 당뇨병 제I형 당뇨병, 제II형 당뇨병 및 췌장암과 같은 질환의 치료 (예를 들어, 1개 이상의 유전자 편집 도구의 전달을 통함)를 위해 췌장 β-섬에 페이로드를 전달하는 것에 초점을 맞춘 방법 (예를 들어, 치료 방법)을 용이하게 한다.

엑센딘-4의 변형된 버전을 사용하여 GLP1R을 표적화하는 경우에, 시스테인 치환 및/또는 삽입을 위한 (예를 들어, 핵산 페이로드에의 접합을 위한) 아미노산은 HGEGTFTSDLSKQMEEEAVRLFIEWLKNGGPSSGAPPPS (서열식별번호: 1)인 엑센딘-4 아미노산 서열을, 가교된 복합체가 2개의 결합 간극을 파괴하지 않도록 대면해야 하는 방향을 예상하기 위해 3D 공간에서 회전할 수 있는 PDB 3차원 렌더링을 사용하여 글루카곤-GCGR (4ERS) 및 GLP1-GLP1R-ECD 복합체 (PDB: 3IOL)의 결정 구조에 정렬시킴으로써 확인될 수 있다. 표적화 리간드 (패밀리 B GPCR을 표적화함)의 바람직한 가교 부위 (예를 들어, 시스테인 잔기의 치환/삽입을 위한 부위)가 상응하는 수용체의 2개의 결합 간극에 대해 충분히 직교인 경우에, 고친화도 결합뿐만 아니라 수반되는 긴 엔도솜 재순환 경로 격리 (예를 들어, 최적의 페이로드 방출을 위함)가 발생할 수 있다. 서열식별번호: 1의 아미노산 위치 10, 11 및/또는 12에서의 시스테인 치환은 G-편향 신호전달 캐스케이드의 이중모드 결합 및 특이적 개시, 베타 아레스틴의 결속 및 액틴 세포골격으로부터의 수용체 해리를 부여한다. 일부 경우에, 이러한 표적화 리간드는 수반되는 오르토스테릭 부위 결속 없이 GPCR의 N-말단 도메인에 대한 단순한 결합을 통해 결속되지 않는 메카니즘인 수용체-매개 세포내이입을 통해 나노입자의 내재화를 촉발한다 (친화성 가닥인 엑센딘-4 [31-39]의 단순한 결합에서와 같음).

일부 경우에, 대상 표적화 리간드는 엑센딘-4 아미노산 서열 (서열식별번호: 1)에 대해 85% 이상 (예를 들어, 90% 이상, 95% 이상, 98% 이상, 99% 이상 또는 100%)의 동일성을 갖는 아미노산 서열을 포함한다. 일부 이러한 경우에, 표적화 리간드는 서열식별번호: 1에 제시된 아미노산 서열의 L10, S11 및 K12에 상응하는 위치 중 1개 이상에서의 시스테인 치환 또는 삽입을 포함한다. 일부 경우에, 표적화 리간드는 서열식별번호: 1에 제시된 아미노산 서열의 S11에 상응하는 위치에서의 시스테인 치환 또는 삽입을 포함한다. 일부 경우에, 대상 표적화 리간드는 엑센딘-4 아미노산 서열 (서열식별번호: 1)을 갖는 아미노산 서열을 포함한다. 일부 경우에, 표적화 리간드는 앵커링 도메인 (예를 들어, 양이온성 앵커링 도메인)에 (링커와 함께 또는 링커 없이) 접합된다.

또 다른 예로서, 일부 경우에 본 개시내용에 따른 표적화 리간드는 수용체 티로신 키나제 (RTK), 예컨대 섬유모세포 성장 인자 (FGF) 수용체 (FGFR)에 대한 결합을 제공한다. 따라서, 일부 경우에 표적화 리간드는 FGF의 단편이다 (즉, FGF의 아미노산 서열을 포함함). 일부 경우에, 표적화 리간드는 오르토스테릭 결합 동안 점유된 RTK의 절편에 결합한다 (예를 들어, 하기 실시예 섹션 참조). 일부 경우에, 표적화 리간드는 RTK의 헤파린-친화성 도메인에 결합한다. 일부 경우에, 표적화 리간드는 FGF 수용체에 대한 표적화된 결합을 제공하고, 아미노산 서열 KNGGFFLRIHPDGRVDGVREKS (서열식별번호: 4)와 85% 이상의 서열 동일성 (예를 들어, 90% 이상, 95% 이상, 97% 이상, 98% 이상, 99% 이상, 99.5% 이상 또는 100%의 서열 동일성)을 갖는 아미노산 서열을 포함한다. 일부 경우에, 표적화 리간드는 FGF 수용체에 대한 표적화된 결합을 제공하고, 서열식별번호: 4로서 제시된 아미노산 서열을 포함한다.

일부 경우에, RTK의 오르토스테릭 부위를 점유하는 소형 도메인 (예를 들어, 5-40개 아미노산 길이)은 천연 성장 인자 리간드에 고유할 수 있는 세포-증식성 및 원-종양원성 신호전달 캐스케이드의 결속 없이 RTK (예를 들어, FGFR)의 핵 분류와 관련된 세포내이입 경로를 결속시키는데 사용될 수 있다. 예를 들어, 말단절단된 bFGF (tbFGF) 펩티드 (a.a.30-115)는 bFGF 수용체 결합 부위 및 헤파린-결합 부위의 일부를 함유하고, 이 펩티드는 세포 증식을 자극하지 않으면서 세포 표면 상의 FGFR에 효과적으로 결합할 수 있다. tbFGF의 서열은 KRLYCKNGGFFLRIHPDGRVDGVREKSDPHIKLQLQAEERGVVSIKGVCANRYLAMKEDGRLLASKCVTDECFFFERLESNNYNTY (서열식별번호: 13)이다 (예를 들어, 문헌 [Cai et al., Int J Pharm. 2011 Apr 15;408(1-2):173-82] 참조).

일부 경우에, 표적화 리간드는 FGF 수용체에 대한 표적화된 결합을 제공하고, 아미노산 서열 HFKDPK (서열식별번호: 5)를 포함한다 (예를 들어, 하기 실시예 섹션 참조). 일부 경우에, 표적화 리간드는 FGF 수용체에 대한 표적화된 결합을 제공하고, 아미노산 서열 LESNNYNT (서열식별번호: 6)를 포함한다 (예를 들어, 하기 실시예 섹션 참조).

일부 경우에, 본 개시내용에 따른 표적화 리간드는 세포 표면 당단백질에 대한 표적화된 결합을 제공한다. 일부 경우에, 표적화 리간드는 세포-세포 부착 분자에 대한 표적화된 결합을 제공한다. 예를 들어, 일부 경우에, 표적화 리간드는 세포-세포 부착 인자로서 기능하는 세포 표면 당단백질이고 조혈 줄기 세포 (예를 들어, 골수의 것) 상에서 발견되는 단백질인 CD34에 대한 표적화된 결합을 제공한다. 일부 경우에, 표적화 리간드는 셀렉틴, 예컨대 E-셀렉틴, L-셀렉틴 또는 P-셀렉틴의 단편 (예를 들어, 셀렉틴의 처음 40개의 아미노산에서 발견되는 신호 펩티드)이다. 일부 경우에 대상 표적화 리간드는 셀렉틴 (예를 들어, E-셀렉틴, L-셀렉틴, P-셀렉틴)의 스시 도메인을 포함한다.

일부 경우에, 표적화 리간드는 아미노산 서열 MIASQFLSALTLVLLIKESGA (서열식별번호: 7)와 85% 이상의 서열 동일성 (예를 들어, 90% 이상, 95% 이상, 97% 이상, 98% 이상, 99% 이상, 99.5% 이상 또는 100%의 서열 동일성)을 갖는 아미노산 서열을 포함한다. 일부 경우에, 표적화 리간드는 서열식별번호: 7로서 제시된 아미노산 서열을 포함한다. 일부 경우에, 표적화 리간드는 아미노산 서열 MVFPWRCEGTYWGSRNILKLWVWTLLCCDFLIHHGTHC (서열식별번호: 8)와 85% 이상의 서열 동일성 (예를 들어, 90% 이상, 95% 이상, 97% 이상, 98% 이상, 99% 이상, 99.5% 이상 또는 100%의 서열 동일성)을 갖는 아미노산 서열을 포함한다. 일부 경우에, 표적화 리간드는 서열식별번호: 8로서 제시된 아미노산 서열을 포함한다. 일부 경우에, 표적화 리간드는 아미노산 서열 MIFPWKCQSTQRDLWNIFKLWGWTMLCCDFLAHHGTDC (서열식별번호: 9)와 85% 이상의 서열 동일성 (예를 들어, 90% 이상, 95% 이상, 97% 이상, 98% 이상, 99% 이상, 99.5% 이상 또는 100%의 서열 동일성)을 갖는 아미노산 서열을 포함한다. 일부 경우에, 표적화 리간드는 서열식별번호: 9로서 제시된 아미노산 서열을 포함한다. 일부 경우에, 표적화 리간드는 아미노산 서열 MIFPWKCQSTQRDLWNIFKLWGWTMLCC (서열식별번호: 10)와 85% 이상의 서열 동일성 (예를 들어, 90% 이상, 95% 이상, 97% 이상, 98% 이상, 99% 이상, 99.5% 이상 또는 100%의 서열 동일성)을 갖는 아미노산 서열을 포함한다. 일부 경우에, 표적화 리간드는 서열식별번호: 10으로서 제시된 아미노산 서열을 포함한다.

대상 표적화 리간드로서 사용될 수 있는 셀렉틴의 단편 (예를 들어, 셀렉틴의 처음 40개의 아미노산에서 발견되는 신호 펩티드)은 일부 경우에 특이적으로 변형된 시알로뮤신에 대한 강한 결합을 달성할 수 있으며, 예를 들어 세포외 CD34의 다양한 시알릴 루이스^x 변형 / O-시알릴화는 P-셀렉틴, L-셀렉틴 및 E-셀렉틴에 대한 골수, 림프, 비장 및 편도 구획에 대한 차등 친화도를 유도할 수 있다. 반대로, 일부 경우에 표적화 리간드는 CD34의 세포외 부분일 수 있다. 일부 이러한 경우에, 리간드의 시알릴화의 변형을 이용하여 표적화 리간드를 다양한 셀렉틴에 차등적으로 표적화할 수 있다.

일부 경우에, 본 개시내용에 따른 표적화 리간드는 E-셀렉틴에 대한 표적화된 결합을 제공한다. E-셀렉틴은 내피 세포에 대한 종양 세포의 부착을 매개할 수 있고, E-셀렉틴에 대한 리간드는 암 전이에서 소정의 역할을 할 수 있다. 예로서, P-셀렉틴 당단백질-1 (PSGL-1) (예를 들어, 인간 호중구로부터 유래됨)은 E-셀렉틴 (예를 들어, 내피에 의해 발현됨)에 대한 고효율 리간드로서 기능할 수 있고, 따라서 대상 표적화 리간드는 일부 경우에 PSGL-1 아미노산 서열 (또는 E-셀렉틴에 결합하는 그의 단편)을 포함할 수 있다. 또 다른 예로서, E-셀렉틴 리간드-1 (ESL-1)은 E-셀렉틴에 결합할 수 있고, 따라서 대상 표적화 리간드는 일부 경우에 ESL-1 아미노산 서열 (또는 E-셀렉틴에 결합하는 그의 단편)을 포함할 수 있다. 일부 경우에, PSGL-1 및/또는 ESL-1 아미노산 서열 (또는 E-셀렉틴에 결합하는 그의 단편)을 갖는 표적화 리간드는 E-셀렉틴에 결합하기 위해 1개 이상의 시알릴 루이스 변형을 보유한다. 또 다른 예로서, 일부 경우에 CD44, 사멸 수용체-3 (DR3), LAMP1, LAMP2 및 Mac2-BP는 E-셀렉틴에 결합할 수 있고, 따라서 대상 표적화 리간드는 일부 경우에 CD44, 사멸 수용체-3 (DR3), LAMP1, LAMP2 및 Mac2-BP 중 어느 하나의 아미노산 서열 (또는 E-셀렉틴에 결합하는 그의 단편)을 포함할 수 있다.

일부 경우에, 본 개시내용에 따른 표적화 리간드는 P-셀렉틴에 대한 표적화된 결합을 제공한다. 일부 경우에 PSGL-1은 이러한 표적화된 결합을 제공할 수 있다. 따라서, 일부 경우에 대상 표적화 리간드는 일부 경우에 PSGL-1 아미노산 서열 (또는 P-셀렉틴에 결합하는 그의 단편)을 포함할 수 있다. 일부 경우에, PSGL-1 아미노산 서열 (또는 P-셀렉틴에 결합하는 그의 단편)을 갖는 표적화 리간드는 P-셀렉틴에 결합하기 위해 1개 이상의 시알릴 루이스 변형을 보유한다.

일부 경우에, 본 개시내용에 따른 표적화 리간드는 CD3, CD8, CD4, CD28, CD90, CD45f, CD34, CD80, CD86, CD19, CD20, CD22, CD47, CD3-엡실론, CD3-감마, CD3-델타; TCR 알파, TCR 베타, TCR 감마 및/또는 TCR 델타 불변 영역; 4-1BB, OX40, OX40L, CD62L, ARP5, CCR5, CCR7, CCR10, CXCR3, CXCR4, CD94/NKG2, NKG2A, NKG2B, NKG2C, NKG2E, NKG2H, NKG2D, NKG2F, NKp44, NKp46, NKp30, DNAM, XCR1, XCL1, XCL2, ILT, LIR, Ly49, IL2R, IL7R, IL10R, IL12R, IL15R, IL18R, TNFα, IFNγ, TGF-β 및 α5β1로부터 선택된 표적에 대한 표적화된 결합을 제공한다.

일부 경우에, 본 개시내용에 따른 표적화 리간드는 트랜스페린 수용체에 대한 표적화된 결합을 제공한다. 일부 이러한 경우에, 표적화 리간드는 아미노산 서열 THRPPMWSPVWP (서열식별번호: 11)와 85% 이상의 서열 동일성 (예를 들어, 90% 이상, 95% 이상, 97% 이상, 98% 이상, 99% 이상, 99.5% 이상 또는 100%의 서열 동일성)을 갖는 아미노산 서열을 포함한다. 일부 경우에, 표적화 리간드는 서열식별번호: 11로서 제시된 아미노산 서열을 포함한다.

일부 경우에, 본 개시내용에 따른 표적화 리간드는 인테그린 (예를 들어, α5β1 인테그린)에 대한 표적화된 결합을 제공한다. 일부 이러한 경우에, 표적화 리간드는 아미노산 서열 RRETAWA (서열식별번호: 12)와 85% 이상의 서열 동일성 (예를 들어, 90% 이상, 95% 이상, 97% 이상, 98% 이상, 99% 이상, 99.5% 이상 또는 100%의 서열 동일성)을 갖는 아미노산 서열을 포함한다. 일부 경우에, 표적화 리간드는 서열식별번호: 12로서 제시된 아미노산 서열을 포함한다. 일부 경우에, 표적화 리간드는 아미노산 서열 RGDGW (서열식별번호: 181)와 85% 이상의 서열 동일성 (예를 들어, 90% 이상, 95% 이상, 97% 이상, 98% 이상, 99% 이상, 99.5% 이상 또는 100%의 서열 동일성)을 갖는 아미노산 서열을 포함한다. 일부 경우에, 표적화 리간드는 서열식별번호: 181로서 제시된 아미노산 서열을 포함한다. 일부 경우에, 표적화 리간드는 아미노산 서열 RGD를 포함한다.

일부 경우에, 본 개시내용에 따른 표적화 리간드는 인테그린에 대한 표적화된 결합을 제공한다. 일부 이러한 경우에, 표적화 리간드는 아미노산 서열 GCGYGRGDSPG (서열식별번호: 182)와 85% 이상의 서열 동일성 (예를 들어, 90% 이상, 95% 이상, 97% 이상, 98% 이상, 99% 이상, 99.5% 이상 또는 100%의 서열 동일성)을 갖는 아미노산 서열을 포함한다. 일부 경우에, 표적화 리간드는 서열식별번호: 182로서 제시된 아미노산 서열을 포함한다. 일부 경우에 이러한 표적화 리간드는 N-말단에서 아세틸화되고/거나 C-말단에서 아미드화 (NH2)된다.

일부 경우에, 본 개시내용에 따른 표적화 리간드는 인테그린 (예를 들어, α5β3 인테그린)에 대한 표적화된 결합을 제공한다. 일부 이러한 경우에, 표적화 리간드는 아미노산 서열 DGARYCRGDCFDG (서열식별번호: 187)와 85% 이상의 서열 동일성 (예를 들어, 90% 이상, 95% 이상, 97% 이상, 98% 이상, 99% 이상, 99.5% 이상 또는 100%의 서열 동일성)을 갖는 아미노산 서열을 포함한다. 일부 경우에, 표적화 리간드는 서열식별번호: 187로서 제시된 아미노산 서열을 포함한다.

일부 실시양태에서, 뇌를 표적화하는데 사용되는 표적화 리간드는 광견병 바이러스 당단백질 (RVG)로부터의 아미노산 서열 (예를 들어, YTIWMPENPRPGTPCDIFTNSRGKRASNGGGG (서열식별번호: 183))을 포함한다. 일부 이러한 경우에, 표적화 리간드는 서열식별번호: 183으로서 제시된 아미노산 서열과 85% 이상의 서열 동일성 (예를 들어, 90% 이상, 95% 이상, 97% 이상, 98% 이상, 99% 이상, 99.5% 이상 또는 100%의 서열 동일성)을 갖는 아미노산 서열을 포함한다. 임의의 표적화 리간드 (본원의 다른 곳에 기재된 바와 같은 것)의 경우, RVG는 앵커링 도메인 (예를 들어, 9R 펩티드 서열)에 접합 및/또는 융합될 수 있다. 예를 들어, 대상 나노입자의 표면 코트의 일부로서 사용되는 대상 전달 분자는 서열 YTIWMPENPRPGTPCDIFTNSRGKRASNGGGGRRRRRRRRR (서열식별번호: 180)을 포함할 수 있다.

일부 경우에, 본 개시내용에 따른 표적화 리간드는 c-Kit 수용체에 대한 표적화된 결합을 제공한다. 일부 이러한 경우에, 표적화 리간드는 서열식별번호: 184로서 제시된 아미노산 서열과 85% 이상의 서열 동일성 (예를 들어, 90% 이상, 95% 이상, 97% 이상, 98% 이상, 99% 이상, 99.5% 이상 또는 100%의 서열 동일성)을 갖는 아미노산 서열을 포함한다. 일부 경우에, 표적화 리간드는 서열식별번호: 184로서 제시된 아미노산 서열을 포함한다.

일부 경우에, 본 개시내용에 따른 표적화 리간드는 CD27에 대한 표적화된 결합을 제공한다. 일부 이러한 경우에, 표적화 리간드는 서열식별번호: 185로서 제시된 아미노산 서열과 85% 이상의 서열 동일성 (예를 들어, 90% 이상, 95% 이상, 97% 이상, 98% 이상, 99% 이상, 99.5% 이상 또는 100%의 서열 동일성)을 갖는 아미노산 서열을 포함한다. 일부 경우에, 표적화 리간드는 서열식별번호: 185로서 제시된 아미노산 서열을 포함한다.

일부 경우에, 본 개시내용에 따른 표적화 리간드는 CD150에 대한 표적화된 결합을 제공한다. 일부 이러한 경우에, 표적화 리간드는 서열식별번호: 186으로서 제시된 아미노산 서열과 85% 이상의 서열 동일성 (예를 들어, 90% 이상, 95% 이상, 97% 이상, 98% 이상, 99% 이상, 99.5% 이상 또는 100%의 서열 동일성)을 갖는 아미노산 서열을 포함한다. 일부 경우에, 표적화 리간드는 서열식별번호: 186으로서 제시된 아미노산 서열을 포함한다.

일부 실시양태에서, 표적화 리간드는 KLS CD27+/IL-7Ra-/CD150+/CD34- 조혈 줄기 및 전구 세포 (HSPC)에 대한 표적화된 결합을 제공한다. 예를 들어, 유전자 편집 도구(들) (본원의 다른 곳에 기재됨)가 BCL11a 전사 인자의 발현을 파괴하고 결과적으로 태아 헤모글로빈을 생성하기 위해 도입될 수 있다. 또 다른 예로서, 베타-글로빈 (HBB) 유전자는 변경된 E7V 치환을 상응하는 상동성-지정 복구 공여자 DNA 분자로 교정하기 위해 직접적으로 표적화될 수 있다. 한 예시적인 예로서, CRISPR/Cas RNA-가이드 폴리펩티드 (예를 들어, Cas9, CasX, CasY, Cpf1)는 그가 HBB 유전자 내의 유전자좌에 결합하고 게놈 내에 이중-가닥 또는 단일-가닥 파괴를 생성하여 게놈 복구를 개시하도록 적절한 가이드 RNA와 함께 전달될 수 있다. 일부 경우에, 공여자 DNA 분자 (단일 가닥 또는 이중 가닥)는 (페이로드의 일부로서) 도입되고, 14-30일 동안 방출되는 한편, 가이드 RNA/CRISPR/Cas 단백질 복합체 (리보핵단백질 복합체)는 1-7일의 과정에 걸쳐 방출될 수 있다.

일부 실시양태에서, 표적화 리간드는 T-세포 수용체를 변형시키기 위해 CD4+ 또는 CD8+ T-세포, 조혈 줄기 및 전구 세포 (HSPC), 또는 말초 혈액 단핵 세포 (PBMC)에 대한 표적화된 결합을 제공한다. 예를 들어, 유전자 편집 도구(들) (본원의 다른 곳에 기재됨)가 T-세포 수용체를 변형시키기 위해 도입될 수 있다. T-세포 수용체는 직접적으로 표적화되고, 신규 T-세포 수용체에 대한 상응하는 상동성-지정 복구 공여자 DNA 분자로 치환될 수 있다. 한 예로서, CRISPR/Cas RNA-가이드 폴리펩티드 (예를 들어, Cas9, CasX, CasY, Cpf1)는 그가 TCR 유전자 내의 유전자좌에 결합하고 게놈 내에 이중-가닥 또는 단일-가닥 파괴를 생성하여 게놈 복구를 개시하도록 적절한 가이드 RNA와 함께 전달될 수 있다. 일부 경우에, 공여자 DNA 분자 (단일 가닥 또는 이중 가닥)가 도입된다 (페이로드의 일부로서). 베타-글로빈, CCR5, T-세포 수용체 또는 임의의 다른 관심 유전자를 표적화하는 다른 CRISPR 가이드 RNA 및 공여자 서열, 및/또는 다른 발현 벡터가 본 개시내용에 따라 사용될 수 있다는 것이 관련 기술분야의 통상의 기술자에게 명백할 것이다.

일부 실시양태에서, 표적화 리간드는 핵산 압타머이다. 일부 실시양태에서, 표적화 리간드는 펩토이드이다.

표적화 리간드를 함께 구성하는 2개의 상이한 펩티드 서열을 갖는 전달 분자가 또한 제공된다. 예를 들어, 일부 경우에 표적화 리간드는 2가 (예를 들어, 이종2가)이다. 일부 경우에, 세포-관통 펩티드 및/또는 헤파린 술페이트 프로테오글리칸 결합 리간드는 본 개시내용의 임의의 표적화 리간드와 함께 이종2가 세포내이입 촉발제로서 사용된다. 이종2가 표적화 리간드는 표적화 리간드 중 하나로부터의 친화성 서열 및 상이한 표적화 리간드로부터의 오르토스테릭 결합 서열 (예를 들어, 목적하는 세포내이입 트래피킹 경로를 결속시키는 것으로 공지된 것)을 포함할 수 있다.

앵커링 도메인

일부 실시양태에서, 전달 분자는 앵커링 도메인 (예를 들어, 양이온성 앵커링 도메인, 음이온성 앵커링 도메인)에 접합된 표적화 리간드를 포함한다. 일부 경우에 대상 전달 비히클은 앵커링 도메인과 축합되고/거나 앵커링 도메인과 정전기적으로 상호작용하는 페이로드를 포함한다 (예를 들어, 전달 분자는 페이로드를 전달하기 위해 사용되는 전달 비히클일 수 있음). 일부 경우에 나노입자의 표면 코트는 앵커링 도메인을 갖는 이러한 전달 분자를 포함하고, 일부 이러한 경우에 페이로드는 이러한 나노입자의 코어에 존재한다 (코어와 상호작용함). 앵커링 도메인과 관련된 추가의 세부사항에 대해서는 하전된 중합체 폴리펩티드 도메인을 기재하는 상기 섹션을 참조한다.

히스톤 테일 펩티드 (HTP)

일부 실시양태에서 대상 나노입자의 양이온성 폴리펩티드 조성물은 히스톤 펩티드 또는 히스톤 펩티드의 단편, 예컨대 N-말단 히스톤 테일 (예를 들어, H1, H2 (예를 들어, H2A, H2AX, H2B), H3 또는 H4 히스톤 단백질의 히스톤 테일)을 포함한다. 히스톤 단백질의 테일 단편은 본원에서 히스톤 테일 펩티드 (HTP)로 지칭된다. 이러한 단백질 (히스톤 및/또는 HTP)은 대상 나노입자의 코어의 일부로서 핵산 페이로드와 축합될 수 있기 때문에, 1개 이상의 히스톤 또는 HTP (예를 들어, 양이온성 폴리펩티드 조성물의 일부로서)를 포함하는 코어는 본원에서 때때로 뉴클레오솜-모방 코어로 지칭된다. 히스톤 및/또는 HTP는 단량체로서 포함될 수 있고, 일부 경우에 핵산 페이로드를 나노입자 코어 내로 축합할 때 이량체, 삼량체, 사량체 및/또는 팔량체를 형성한다. 일부 경우에, HTP는 히스톤 아세틸트랜스퍼라제-매개 아세틸화의 경우에서와 같이 다양한 히스톤 변형에 의해 탈양성자화될 수 있을 뿐만 아니라, 코어의 성분의 효과적인 핵-특이적 언패키징 (예를 들어, 페이로드의 방출)을 매개할 수 있다. 히스톤 및/또는 HTP를 포함하는 코어의 트래픽킹은 골지 및 내형질 세망을 통한 역행성 수송을 이용하는 대안적 세포내이입 경로에 의존할 수 있다. 추가로, 일부 히스톤은 선천성 핵 국재화 서열을 포함하고, 코어 내 NLS의 포함은 코어 (페이로드 포함)를 표적 세포의 핵으로 지시할 수 있다.

일부 실시양태에서, 대상 양이온성 폴리펩티드 조성물은 H2A, H2AX, H2B, H3 또는 H4 단백질의 아미노산 서열을 갖는 단백질을 포함한다. 일부 경우에, 대상 양이온성 폴리펩티드 조성물은 히스톤 단백질의 N-말단 영역에 상응하는 아미노산 서열을 갖는 단백질을 포함한다. 예를 들어, 단편 (HTP)은 히스톤 단백질의 처음 5, 10, 15, 20, 25, 30, 35, 40, 45 또는 50개의 N-말단 아미노산을 포함할 수 있다. 일부 경우에, 대상 HTP는 히스톤 단백질의 N-말단 영역으로부터의 5-50개 아미노산 (예를 들어, 5-45, 5-40, 5-35, 5-30, 5-25, 5-20, 8-50, 8-45, 8-40, 8-35, 8-30, 10-50, 10-45, 10-40, 10-35 또는 10-30개 아미노산)을 포함한다. 일부 경우에, 대상 양이온성 폴리펩티드는 5-150개 아미노산 (예를 들어, 5-100, 5-50, 5-35, 5-30, 5-25, 5-20, 8-150, 8-100, 8-50, 8-40, 8-35, 8-30, 10-150, 10-100, 10-50, 10-40, 10-35 또는 10-30개 아미노산)을 포함한다.

일부 경우에, 양이온성 폴리펩티드 조성물의 양이온성 폴리펩티드 (예를 들어, 히스톤 또는 HTP, 예를 들어 H1, H2, H2A, H2AX, H2B, H3 또는 H4)는 번역후 변형 (예를 들어, 일부 경우에 1개 이상의 히스티딘, 리신, 아르기닌 또는 다른 상보적 잔기 상에)을 포함한다. 예를 들어, 일부 경우에 양이온성 폴리펩티드는 메틸화되거나 (및/또는 메틸화 / 탈메틸화에 감수성이거나), 아세틸화되거나 (및/또는 아세틸화 / 탈아세틸화에 감수성이거나), 크로토닐화되거나 (및/또는 크로토닐화 / 탈크로토닐화에 감수성이거나), 유비퀴티닐화되거나 (및/또는 유비퀴티닐화 / 탈유비퀴티닐화에 감수성이거나), 인산화되거나 (및/또는 인산화 / 탈인산화에 감수성이거나), SUMO화되거나 (및/또는 SUMO화 / 탈SUMO화에 감수성이거나), 파르네실화되거나 (및/또는 파르네실화 / 탈파르네실화에 감수성이거나), 황산화되거나 (및/또는 황산화 / 탈황산화에 감수성이거나) 또는 달리 번역후 변형된다. 일부 경우에, 양이온성 폴리펩티드 조성물의 양이온성 폴리펩티드 (예를 들어, 히스톤 또는 HTP, 예를 들어 H1, H2, H2A, H2AX, H2B, H3 또는 H4)는 p300/CBP 기질 (예를 들어, 하기 HTP, 예를 들어 서열식별번호: 129-130 참조)이다. 일부 경우에, 양이온성 폴리펩티드 조성물의 양이온성 폴리펩티드 (예를 들어, 히스톤 또는 HTP, 예를 들어 H1, H2, H2A, H2AX, H2B, H3 또는 H4)는 (예를 들어, 티오술페이트 술퍼트랜스퍼라제 기질로서) 황산화되거나 황산화에 감수성인 1개 이상의 티올 잔기를 포함한다 (예를 들어, 시스테인 및/또는 메티오닌 잔기를 포함할 수 있음). 일부 경우에, 양이온성 폴리펩티드의 양이온성 폴리펩티드 (예를 들어, 히스톤 또는 HTP, 예를 들어 H1, H2, H2A, H2AX, H2B, H3 또는 H4)는 C-말단에서 아미드화된다. 히스톤 H2A, H2B, H3 및 H4 (및/또는 HTP)는 임의의 그의 리신에서 모노메틸화, 디메틸화 또는 트리메틸화되어 전사 활성을 촉진하거나 억제하고 핵-특이적 방출 동역학을 변경시킬 수 있다.

양이온성 폴리펩티드는 목적하는 변형을 갖도록 합성될 수 있거나 또는 시험관내 반응에서 변형될 수 있다. 대안적으로, 양이온성 폴리펩티드 (예를 들어, 히스톤 또는 HTP)는 세포 집단에서 발현될 수 있고, 목적하는 변형된 단백질이 단리/정제될 수 있다. 일부 경우에 대상 나노입자의 양이온성 폴리펩티드 조성물은 메틸화 HTP를 포함하고, 예를 들어 H3K4(Me3)의 HTP 서열을 포함하며 - 서열식별번호: 75 또는 88로서 제시된 아미노산 서열을 포함한다. 일부 경우에, 양이온성 폴리펩티드 조성물의 양이온성 폴리펩티드 (예를 들어, 히스톤 또는 HTP, 예를 들어 H1, H2, H2A, H2AX, H2B, H3 또는 H4)는 C-말단 아미드를 포함한다.

히스톤 및 HTP의 예

예는 하기 서열을 포함하나 이에 제한되지는 않는다:

따라서, 대상 양이온성 폴리펩티드 조성물의 양이온성 폴리펩티드는 서열식별번호: 62-139 중 임의의 것에 제시된 아미노산 서열을 갖는 아미노산 서열을 포함할 수 있다. 일부 경우에, 대상 양이온성 폴리펩티드 조성물의 양이온성 폴리펩티드는 서열식별번호: 62-139 중 임의의 것에 제시된 아미노산 서열과 80% 이상의 서열 동일성 (예를 들어, 85% 이상, 90% 이상, 95% 이상, 98% 이상, 99% 이상 또는 100%의 서열 동일성)을 갖는 아미노산 서열을 포함한다. 일부 경우에, 대상 양이온성 폴리펩티드 조성물의 양이온성 폴리펩티드는 서열식별번호: 62-139 중 임의의 것에 제시된 아미노산 서열과 90% 이상의 서열 동일성 (예를 들어, 95% 이상, 98% 이상, 99% 이상 또는 100%의 서열 동일성)을 갖는 아미노산 서열을 포함한다. 양이온성 폴리펩티드는 임의의 편리한 변형을 포함할 수 있고, 다수의 이러한 고려되는 변형, 예를 들어 메틸화, 아세틸화, 크로토닐화, 유비퀴티닐화, 인산화, SUMO화, 파르네실화, 황산화 등이 상기에 논의되어 있다.

일부 경우에, 양이온성 폴리펩티드 조성물의 양이온성 폴리펩티드는 서열식별번호: 94에 제시된 아미노산 서열과 80% 이상의 서열 동일성 (예를 들어, 85% 이상, 90% 이상, 95% 이상, 98% 이상, 99% 이상 또는 100%의 서열 동일성)을 갖는 아미노산 서열을 포함한다. 일부 경우에, 양이온성 폴리펩티드 조성물의 양이온성 폴리펩티드는 서열식별번호: 94에 제시된 아미노산 서열과 95% 이상의 서열 동일성 (예를 들어, 98% 이상, 99% 이상 또는 100%의 서열 동일성)을 갖는 아미노산 서열을 포함한다. 일부 경우에, 양이온성 폴리펩티드 조성물의 양이온성 폴리펩티드는 서열식별번호: 94에 제시된 아미노산 서열을 포함한다. 일부 경우에, 양이온성 폴리펩티드 조성물의 양이온성 폴리펩티드는 인간 히스톤 3 단백질의 처음 25개의 아미노산을 포함하고 리신 4에서 트리-메틸화된 (예를 들어, 일부 경우에 C-말단에서 아미드화된) H3K4(Me3) (서열식별번호: 95)로 나타내어지는 서열을 포함한다.

일부 실시양태에서, 양이온성 폴리펩티드 조성물의 양이온성 폴리펩티드 (예를 들어, 히스톤 또는 HTP, 예를 들어 H1, H2, H2A, H2AX, H2B, H3 또는 H4)는 양이온성 (또는 일부 경우에 음이온성) 아미노산 중합체, 링커, NLS 및/또는 다른 양이온성 폴리펩티드에 대한 접합을 용이하게 할 수 있는 (예를 들어, 일부 경우에 분지형 히스톤 구조를 형성함) 시스테인 잔기를 포함한다. 예를 들어, 시스테인 잔기가 술프히드릴 화학 (예를 들어, 디술피드 결합) 및/또는 아민-반응성 화학을 통한 가교 (접합)에 사용될 수 있다. 일부 경우에 시스테인 잔기는 내부 잔기이다. 일부 경우에 시스테인 잔기는 N-말단 및/또는 C-말단에 위치한다. 일부 경우에, 양이온성 폴리펩티드 조성물의 양이온성 폴리펩티드 (예를 들어, 히스톤 또는 HTP, 예를 들어 H1, H2, H2A, H2AX, H2B, H3 또는 H4)는 시스테인 잔기를 부가하는 돌연변이 (예를 들어, 삽입 또는 치환)를 포함한다. 시스테인을 포함하는 HTP의 예는 하기를 포함하나 이에 제한되지는 않는다:

일부 실시양태에서, 양이온성 폴리펩티드 조성물의 양이온성 폴리펩티드 (예를 들어, 히스톤 또는 HTP, 예를 들어 H1, H2, H2A, H2AX, H2B, H3 또는 H4)는 대상 나노입자의 코어의 양이온성 (및/또는 음이온성) 아미노산 중합체에 접합된다. 예로서, 히스톤 또는 HTP는 시스테인 잔기를 통해 양이온성 아미노산 중합체 (예를 들어, 폴리(리신)을 포함하는 것)에 접합될 수 있으며, 예를 들어 여기서 중합체의 리신(들)의 피리딜 디술피드 기(들)가 히스톤 또는 HTP의 시스테인에 대한 디술피드 결합으로 치환된다.

변형된 / 분지화 구조

일부 실시양태에서, 대상 양이온성 폴리펩티드 조성물의 양이온성 폴리펩티드는 선형 구조를 갖는다. 일부 실시양태에서, 대상 양이온성 폴리펩티드 조성물의 양이온성 폴리펩티드는 분지형 구조를 갖는다.

예를 들어, 일부 경우에, 양이온성 폴리펩티드 (예를 들어, HTP, 예를 들어 시스테인 잔기를 갖는 HTP)는 양이온성 중합체 (예를 들어, 폴리(L-아르기닌), 폴리(D-리신), 폴리(L-리신), 폴리(D-리신))의 말단에 (예를 들어, 그의 C-말단에서) 접합되어, 이에 따라 연장된 선형 폴리펩티드를 형성한다. 일부 경우에, 1개 이상 (2개 이상, 3개 이상 등)의 양이온성 폴리펩티드 (예를 들어, HTP, 예를 들어 시스테인 잔기를 갖는 HTP)는 양이온성 중합체 (예를 들어, 폴리(L-아르기닌), 폴리(D-리신), 폴리(L-리신), 폴리(D-리신))의 말단(들)에 (예를 들어, 그의 C-말단에서) 접합되어, 이에 따라 연장된 선형 폴리펩티드를 형성한다. 일부 경우에, 양이온성 중합체는 4,500 - 150,000 Da 범위의 분자량을 갖는다.

또 다른 예로서, 일부 경우에, 1개 이상 (2개 이상, 3개 이상 등)의 양이온성 폴리펩티드 (예를 들어, HTP, 예를 들어 시스테인 잔기를 갖는 HTP)는 양이온성 중합체 (예를 들어, 폴리(L-아르기닌), 폴리(D-리신), 폴리(L-리신), 폴리(D-리신))의 측쇄에 (예를 들어, 그의 C-말단에서) 접합되어, 이에 따라 분지형 구조 (분지형 폴리펩티드)를 형성한다. 나노입자 코어의 성분 (예를 들어, 대상 양이온성 폴리펩티드 조성물의 성분)에 의한 분지형 구조의 형성은 일부 경우에, 달성될 수 있는 코어 축합 (예를 들어, 핵산 페이로드의 축합)의 양을 증가시킬 수 있다. 따라서, 일부 경우에 분지형 구조를 형성하는 성분을 사용하는 것이 바람직하다. 다양한 유형의 분지 구조가 관심 대상이고, (예를 들어, 대상 양이온성 폴리펩티드, 예컨대 HTP, 예를 들어 시스테인 잔기를 갖는 HTP; 펩토이드, 폴리아미드 등을 사용하여) 생성될 수 있는 분지 구조의 예는 브러시 중합체, 웹 (예를 들어, 거미줄), 그라프트 중합체, 별형 중합체, 빗살형 중합체, 중합체 네트워크, 덴드리머 등을 포함하나 이에 제한되지는 않는다.

일부 경우에, 분지형 구조는 2-30개의 양이온성 폴리펩티드 (예를 들어, HTP) (예를 들어, 2-25, 2-20, 2-15, 2-10, 2-5, 4-30, 4-25, 4-20, 4-15 또는 4-10개의 양이온성 폴리펩티드)를 포함하며, 여기서 각각은 분지형 구조의 다른 양이온성 폴리펩티드와 동일하거나 상이할 수 있다. 일부 경우에, 양이온성 중합체는 4,500 - 150,000 Da 범위의 분자량을 갖는다. 일부 경우에, 양이온성 중합체 (예를 들어, 폴리(L-아르기닌), 폴리(D-리신), 폴리(L-리신), 폴리(D-리신))의 측쇄의 5% 이상 (예를 들어, 10% 이상, 20% 이상, 25% 이상, 30% 이상, 40% 이상 또는 50% 이상)이 대상 양이온성 폴리펩티드 (예를 들어 HTP, 예를 들어 시스테인 잔기를 갖는 HTP)에 접합된다. 일부 경우에, 양이온성 중합체 (예를 들어, 폴리(L-아르기닌), 폴리(D-리신), 폴리(L-리신), 폴리(D-리신))의 측쇄의 50% 이하 (예를 들어, 40% 이하, 30% 이하, 25% 이하, 20% 이하, 15% 이하, 10% 이하 또는 5% 이하)가 대상 양이온성 폴리펩티드 (예를 들어 HTP, 예를 들어 시스테인 잔기를 갖는 HTP)에 접합된다. 따라서, HTP는 중합체, 예컨대 양이온성 아미노산 중합체의 백본으로부터 분지될 수 있다.

일부 경우에, 분지형 구조의 형성은 펩토이드 (폴리펩토이드), 폴리아미드, 덴드리머 등과 같은 성분을 사용하여 용이해질 수 있다. 예를 들어, 일부 경우에 펩토이드 (예를 들어, 폴리펩토이드)는, 예를 들어 일부 경우에 나노입자 코어의 축합을 용이하게 할 수 있는 웹 (예를 들어, 거미줄) 구조를 생성하기 위해 나노입자 코어의 성분으로서 사용된다.

본원의 천연 또는 변형된 폴리펩티드 서열 중 1개 이상은 말단 또는 간헐적 아르기닌, 리신 또는 히스티딘 서열로 변형될 수 있다. 한 실시양태에서, 각각의 폴리펩티드는 나노입자 코어 내에 동일한 아민 몰농도로 포함된다. 이러한 실시양태에서, 각각의 폴리펩티드의 C-말단은 5R (5개의 아르기닌)로 변형될 수 있다. 일부 실시양태에서, 각각의 폴리펩티드의 C-말단은 9R (9개의 아르기닌)로 변형될 수 있다. 일부 실시양태에서, 각각의 폴리펩티드의 N-말단은 5R (5개의 아르기닌)로 변형될 수 있다. 일부 실시양태에서, 각각의 폴리펩티드의 N-말단은 9R (9개의 아르기닌)로 변형될 수 있다. 일부 경우에, H2A, H2B, H3 및/또는 H4 히스톤 단편 (예를 들어, HTP)은 각각 FKFL 카텝신 B 단백질분해적 절단 도메인 또는 RGFFP 카텝신 D 단백질분해적 절단 도메인과 연속으로 가교된다. 일부 경우에, H2A, H2B, H3 및/또는 H4 히스톤 단편 (예를 들어, HTP)은 5R (5개의 아르기닌), 9R (9개의 아르기닌), 5K (5개의 리신), 9K (9개의 리신), 5H (5개의 히스티딘) 또는 9H (9개의 히스티딘) 양이온성 스페이서 도메인에 의해 연속으로 가교될 수 있다. 일부 경우에, 1개 이상의 H2A, H2B, H3 및/또는 H4 히스톤 단편 (예를 들어, HTP)은 그의 N-말단에서 프로타민에 디술피드-결합된다.

분지형 히스톤 구조를 생성시키는 방법을 예시하기 위해, 예시적인 제조 방법이 제공된다. 이러한 방법의 한 예는 하기를 포함한다: 등몰비의 히스톤 H2AX [134-143], 히스톤 H3 [1-21 Cys], 히스톤 H3 [23-34 Cys], 히스톤 H4 [8-25 WC] 및 SV40 T-Ag-유래된 NLS의 공유 변형을 10% 피리딜 디술피드 변형된 폴리(L-리신) [MW = 5400, 18000 또는 45000 Da; n = 30, 100 또는 250]과의 반응에서 수행할 수 있다. 전형적인 반응에서, 700 μM Cys-변형된 히스톤/NLS (20 nmol)의 29 μL 수용액을 57 μL의 0.2 M 포스페이트 완충제 (pH 8.0)에 첨가할 수 있다. 둘째로, 14 μL의 100 μM 피리딜 디술피드 보호된 폴리(리신) 용액을 이어서 히스톤 용액에 첨가하여 1:2 비의 피리딜 디술피드 기 대 시스테인 잔기를 갖는 100 μL로 최종 부피를 만들 수 있다. 이 반응을 실온에서 3시간 동안 수행할 수 있다. 반응을 4회 반복할 수 있고, 343nm에서 피리딘-2-티온의 흡광도를 통해 접합 정도를 결정할 수 있다.

또 다른 예로서, 0:1, 1:4, 1:3, 1:2, 1:1, 1:2, 1:3, 1:4 또는 1:0 몰비의 히스톤 H3 [1-21 Cys] 펩티드 및 히스톤 H3 [23-34 Cys] 펩티드의 공유 변형을 10% 피리딜 디술피드 변형된 폴리(L-리신) 또는 폴리(L-아르기닌) [MW = 5400, 18000 또는 45000 Da; n = 30, 100 또는 250]과의 반응에서 수행할 수 있다. 전형적인 반응에서, 700 μM Cys-변형된 히스톤 (20 nmol)의 29 μL 수용액을 57 μL의 0.2 M 포스페이트 완충제 (pH 8.0)에 첨가할 수 있다. 둘째로, 14 μL의 100 μM 피리딜 디술피드 보호된 폴리(리신) 용액을 이어서 히스톤 용액에 첨가하여 1:2 비의 피리딜 디술피드 기 대 시스테인 잔기를 갖는 100 μL로 최종 부피를 만들 수 있다. 이 반응을 실온에서 3시간 동안 수행할 수 있다. 반응을 4회 반복할 수 있고, 343nm에서 피리딘-2-티온의 흡광도를 통해 접합 정도를 결정할 수 있다.

핵 국재화 서열 (NLS)

일부 실시양태에서, 양이온성 폴리펩티드 조성물의 양이온성 폴리펩티드 (예를 들어, 히스톤 또는 HTP, 예를 들어 H1, H2, H2A, H2AX, H2B, H3 또는 H4)는 1개 이상 (예를 들어, 2개 이상, 3개 이상 또는 4개 이상)의 핵 국재화 서열 (NLS)을 포함한다 (및/또는 그에 접합됨). 따라서, 일부 경우에 대상 나노입자의 양이온성 폴리펩티드 조성물은 NLS를 포함하는 펩티드를 포함한다. 일부 경우에, 대상 나노입자의 히스톤 단백질 (또는 HTP)은 1개 이상 (예를 들어, 2개 이상, 3개 이상)의 천연 핵 국재화 신호 (NLS)를 포함한다. 일부 경우에, 대상 나노입자의 히스톤 단백질 (또는 HTP)은 히스톤 단백질에 대해 이종인 1개 이상 (예를 들어, 2개 이상, 3개 이상)의 NLS (즉, 히스톤/HTP의 일부로서 자연 발생하지 않는 NLS, 예를 들어 인간에 의해 부가될 수 있는 NLS)를 포함한다. 일부 경우에, HTP는 N- 및/또는 C-말단에 NLS를 포함한다.

일부 실시양태에서, 양이온성 중합체 조성물의 양이온성 아미노산 중합체 (예를 들어, 폴리(아르기닌) (PR), 폴리(리신) (PK), 폴리(히스티딘) (PH), 폴리(오르니틴), 폴리(시트룰린), 폴리(D-아르기닌) (PDR), 폴리(D-리신) (PDK), 폴리(D-히스티딘) (PDH), 폴리(D-오르니틴), 폴리(D-시트룰린), 폴리(L-아르기닌) (PLR), 폴리(L-리신) (PLK), 폴리(L-히스티딘) (PLH), 폴리(L-오르니틴) 또는 폴리(L-시트룰린))는 1개 이상 (예를 들어, 2개 이상, 3개 이상 또는 4개 이상)의 NLS를 포함한다 (및/또는 그에 접합됨). 일부 경우에, 양이온성 아미노산 중합체는 N- 및/또는 C-말단에 NLS를 포함한다. 일부 경우에, 양이온성 아미노산 중합체는 내부 NLS를 포함한다.

일부 실시양태에서, 음이온성 중합체 조성물의 음이온성 아미노산 중합체 (예를 들어, 폴리(글루탐산) (PEA), 폴리(아스파르트산) (PDA), 폴리(D-글루탐산) (PDEA), 폴리(D-아스파르트산) (PDDA), 폴리(L-글루탐산) (PLEA) 또는 폴리(L-아스파르트산) (PLDA))는 1개 이상 (예를 들어, 2개 이상, 3개 이상 또는 4개 이상)의 NLS를 포함한다 (및/또는 그에 접합됨). 일부 경우에, 음이온성 아미노산 중합체는 N- 및/또는 C-말단에 NLS를 포함한다. 일부 경우에, 음이온성 아미노산 중합체는 내부 NLS를 포함한다.

임의의 편리한 NLS (예를 들어, 히스톤, HTP, 양이온성 아미노산 중합체, 음이온성 아미노산 중합체 등에 접합된 것)가 사용될 수 있다. 예는 부류 1 및 부류 2 '단일부분 NLS', 뿐만 아니라 부류 3-5의 NLS를 포함하나 이에 제한되지는 않는다 (예를 들어, 문헌 [Kosugi et al., J Biol Chem. 2009 Jan 2;284(1):478-85]로부터 적합화된 도 7 참조). 일부 경우에, NLS는 다음 식을 갖는다: (K/R) (K/R) X_10-12(K/R)_3-5. 일부 경우에, NLS는 다음 식을 갖는다: K(K/R)X(K/R).

일부 실시양태에서, 양이온성 폴리펩티드 조성물의 양이온성 폴리펩티드는 1개 이상 (예를 들어, 2개 이상, 3개 이상 또는 4개 이상)의 NLS를 포함한다. 일부 경우에, 양이온성 폴리펩티드는 히스톤 단백질 또는 히스톤 단편이 아니다 (예를 들어, HTP가 아님). 따라서, 일부 경우에 양이온성 폴리펩티드 조성물의 양이온성 폴리펩티드는 NLS-함유 펩티드이다.

일부 경우에, NLS-함유 펩티드는 양이온성 (또는 일부 경우에 음이온성) 아미노산 중합체, 링커, HTP에 대한 히스톤 단백질 및/또는 다른 양이온성 폴리펩티드 (예를 들어, 일부 경우에 분지형 히스톤 구조의 일부로서)에 대한 접합을 용이하게 할 수 있는 시스테인 잔기를 포함한다. 예를 들어, 시스테인 잔기가 술프히드릴 화학 (예를 들어, 디술피드 결합) 및/또는 아민-반응성 화학을 통한 가교 (접합)에 사용될 수 있다. 일부 경우에 시스테인 잔기는 내부 잔기이다. 일부 경우에 시스테인 잔기는 N-말단 및/또는 C-말단에 위치한다. 일부 경우에, 양이온성 폴리펩티드 조성물의 NLS-함유 펩티드는 (예를 들어, 야생형 아미노산 서열에 비해) 시스테인 잔기를 부가하는 돌연변이 (예를 들어, 삽입 또는 치환)를 포함한다.

NLS-함유 펩티드로서 사용될 수 있는 (또는 임의의 편리한 양이온성 폴리펩티드, 예컨대 HTP 또는 양이온성 중합체 또는 양이온성 아미노산 중합체 또는 음이온성 아미노산 중합체에 접합된) NLS의 예는 하기를 포함하나 이에 제한되지는 않는다 (이들 중 일부는 시스테인 잔기를 포함함):

사용될 수 있는 NLS의 비제한적 예에 대해서는, 예를 들어 문헌 [Kosugi et al., J Biol Chem. 2009 Jan 2;284(1):478-85]을 참조하며, 예를 들어 본 개시내용의 도 7을 참조한다.

미토콘드리아 국재화 신호

일부 실시양태에서, 대상 나노입자의 양이온성 폴리펩티드 (예를 들어, 히스톤 또는 HTP, 예를 들어 H1, H2, H2A, H2AX, H2B, H3 또는 H4), 음이온성 중합체 및/또는 양이온성 중합체는 1개 이상 (예를 들어, 2개 이상, 3개 이상 또는 4개 이상)의 미토콘드리아 국재화 서열을 포함한다 (및/또는 그에 접합됨). 임의의 편리한 미토콘드리아 국재화 서열이 사용될 수 있다. 미토콘드리아 국재화 서열의 예는 PEDEIWLPEPESVDVPAKPISTSSMMMP (서열식별번호: 149), SDHB의 미토콘드리아 국재화 서열, 모노/디/트리페닐포스포늄 또는 다른 포스포늄, VAMP 1A, VAMP 1B, DGAT2의 67개 N-말단 아미노산 및 Bax의 20개 N-말단 아미노산을 포함하나 이에 제한되지는 않는다.

전달

상기 언급된 바와 같이, 일부 실시양태에서 대상 방법은 게놈 DNA 내의 2개의 위치 각각에서 엇갈림 절단을 생성하는 것을 포함한다. 일부 경우에, 엇갈림 절단을 생성하기 위해, 부위-특이적 뉴클레아제 (1개 이상의 부위-특이적 뉴클레아제) (또는 이를 코딩하는 핵산, 예를 들어 1개 이상의 핵산)가 표적 세포 내로 도입된다. 표적 세포가 생체내 세포인 경우에, 이는 적절한 성분 (예를 들어, 1개 이상의 전달 비히클의 일부로서)을 개체에게 투여함으로써 달성될 수 있다. 일부 경우에, 표적 세포는 부위-특이적 뉴클레아제를 코딩하는 DNA를 포함하고, 대상 방법의 '생성' 단계는 부위-특이적 뉴클레아제의 발현을 유도하는 것을 포함한다.

따라서, 일부 경우에 대상 방법은 표적 세포 내로 부위-특이적 뉴클레아제 (예를 들어, 1개 이상의 부위-특이적 뉴클레아제)를 도입하는 것 (예를 들어, 개체에의 투여를 통해, 형질감염을 통해, 나노입자를 통해, 전달 분자를 통해 등)을 포함한다. 일부 경우에, 이러한 단계는 1개 이상의 부위-특이적 뉴클레아제를 코딩하는 핵산 (예를 들어, RNA 또는 DNA)을 세포 내로 도입하는 것을 포함한다. 마찬가지로, 일부 경우에 대상 방법은 선형 이중 가닥 공여자 DNA를 표적 세포 내로 도입하는 것 (예를 들어, 개체에의 투여를 통해, 형질감염을 통해, 나노입자를 통해, 전달 분자를 통해 등)을 포함한다. 일부 경우에, 공여자 DNA 및 부위-특이적 뉴클레아제 (또는 이를 코딩하는 핵산)는 동일한 전달 비히클 (예를 들어, 나노입자, 전달 분자 등)의 일부로서 세포 내로 도입된다. 성분 - 공여자 DNA 및 1개 이상의 부위-특이적 뉴클레아제 (또는 이를 코딩하는 1개 이상의 핵산) - 은 임의의 목적하는 표적 세포, 예를 들어 임의의 목적하는 진핵 세포로 전달될 수 있다.

일부 경우에, 표적 세포는 시험관내 세포이며 (예를 들어, 세포는 배양물 중에 존재함), 예를 들어 세포는 확립된 조직 배양 세포주의 세포일 수 있다. 일부 경우에, 표적 세포는 생체외 세포이다 (예를 들어, 세포는 개체, 예를 들어 환자로부터 단리된 1차 세포 (또는 최근의 후손)임). 일부 경우에, 표적 세포는 생체내 세포이고, 따라서 유기체의 내부에 존재한다 (그의 일부임).

예를 들어 전달 비히클의 페이로드로서 공여자 DNA 및/또는 1개 이상의 부위-특이적 뉴클레아제 (또는 이를 코딩하는 1개 이상의 핵산)가 하기 임의의 경로: 전신, 국부, 비경구, 피하 (s.c.), 정맥내 (i.v.), 두개내 (i.c.), 척수내, 안내, 피내 (i.d.), 근육내 (i.m.), 림프내 (i.l.) 또는 척수액내를 통해 대상체에게 도입될 수 있다 (즉, 개체에게 투여될 수 있음). 성분은 주사 (예를 들어, 전신 주사, 직접적 국부 주사, 종양 및/또는 종양 절제 부위 내로 또는 그 근처로의 국부 주사 등), 카테터 등에 의해 도입될 수 있다. 국부 전달 (예를 들어, 종양 및/또는 암 부위로의 전달)을 위한 방법의 예는, 예를 들어 볼루스 주사에 의해, 예를 들어 시린지에 의해, 예를 들어 관절, 종양 또는 기관 내로 또는 관절, 종양 또는 기관 근처로; 예를 들어 연속 주입에 의해, 예를 들어 캐뉼라삽입에 의해, 예를 들어 대류를 사용하는 것을 포함한다 (예를 들어 본원에 참조로 포함된 미국 출원 번호 20070254842 참조).

대상체에 대한 치료 투여 횟수는 달라질 수 있다. 예를 들어 전달 비히클의 페이로드로서 공여자 DNA 및/또는 1개 이상의 부위-특이적 뉴클레아제 (또는 이를 코딩하는 1개 이상의 핵산)를 개체 내로 도입하는 것은 1회 사건일 수 있지만; 특정 상황에서, 이러한 치료는 제한된 기간 동안 개선을 도출할 수 있고 진행중인 일련의 반복 치료를 필요로 할 수 있다. 다른 상황에서, 효과가 관찰되기 전에 공여자 DNA 및/또는 1개 이상의 부위-특이적 뉴클레아제 (또는 이를 코딩하는 1개 이상의 핵산)의 다중 투여가 필요할 수 있다. 관련 기술분야의 통상의 기술자에 의해 용이하게 이해되는 바와 같이, 정확한 프로토콜은 질환 또는 상태, 질환의 병기 및 치료될 개체의 파라미터에 좌우된다.

"치료 유효 용량" 또는 "치료 용량"은 목적하는 임상 결과를 달성하기에 (즉, 치료 효능을 달성하기에) 충분한 양이다. 치료 유효 용량은 1회 이상의 투여로 투여될 수 있다. 본 개시내용의 목적상, 공여자 DNA 및/또는 1개 이상의 부위-특이적 뉴클레아제 (또는 이를 코딩하는 1개 이상의 핵산)의 치료 유효 용량은 개체에게 투여될 때 질환 상태/질병의 진행을 완화, 호전, 안정화, 역전, 예방, 저속화 또는 지연시키기에 충분한 양이다.

예시적인 치료적 개입은 숙주 게놈 내로 통합된 임의의 레트로바이러스 DNA를 제거하는 것에 추가로 HIV 감염에 대한 저항성을 생성하는 것이다. T-세포는 HIV에 의해 직접적으로 영향을 받고, 따라서 CD34+ 및 CD45+ 세포에 대한 하이브리드 혈액 표적화 전략이 탐구될 수 있다. 예를 들어, 효과적인 치료적 개입은 HSC 및 T-세포를 동시에 표적화하고, 다수의 가이드 뉴클레아제 (예를 들어, 단일 입자 내)를 통해 CCR5-Δ32 및 gag/rev/pol 유전자에 절제 (및 대체 서열)를 전달하는 것을 포함할 수 있다.

일부 경우에, 표적 세포는 포유동물 세포 (예를 들어, 설치류 세포, 마우스 세포, 래트 세포, 유제류 세포, 소 세포, 양 세포, 돼지 세포, 말 세포, 낙타 세포, 토끼 세포, 개과 (개) 세포, 고양이과 (고양이) 세포, 영장류 세포, 비-인간 영장류 세포, 인간 세포)이다. 임의의 세포 유형이 표적화될 수 있고, 일부 경우에 특정한 세포의 특이적 표적화는 표적화 리간드의 존재에 좌우되며 (예를 들어, 나노입자의 표면 코트의 일부로서, 전달 분자의 일부로서 등), 여기서 표적화 리간드는 특정한 세포 유형에 대한 표적화된 결합을 제공한다. 예를 들어, 표적화될 수 있는 세포는 골수 세포, 조혈 줄기 세포 (HSC), 장기 HSC, 단기 HSC, 조혈 줄기 및 전구 세포 (HSPC), 말초 혈액 단핵 세포 (PBMC), 골수 전구 세포, 림프성 전구 세포, T-세포, B-세포 (예를 들어, CD19, CD20, CD22 표적화를 통해), NKT 세포, NK 세포, 수지상 세포, 단핵구, 과립구, 적혈구, 거핵구, 비만 세포, 호염기구, 호산구, 호중구, 대식세포 (예를 들어, SIRPα-모방 펩티드를 통한 CD47 표적화를 통해), 적혈구 전구 세포 (예를 들어, HUDEP 세포), 거핵구-적혈구 전구 세포 (MEP), 공통 골수 전구 세포 (CMP), 다능 전구 세포 (MPP), 조혈 줄기 세포 (HSC), 단기 HSC (ST-HSC), IT-HSC, 장기 HSC (LT-HSC), 내피 세포, 뉴런, 성상세포, 췌장 세포, 췌장 β-도세포, 근육 세포, 골격근 세포, 심근 세포, 간 세포, 지방 세포, 장 세포, 결장 세포 및 위 세포를 포함하나 이에 제한되지는 않는다.

다양한 적용 (예를 들어, 뉴런, 췌장 세포, 조혈 줄기 세포 및 다능 전구세포 등을 표적화하기 위한 것)의 예는, 예를 들어 표적화 리간드와 관련하여 상기에 논의되어 있다. 예를 들어, 조혈 줄기 세포 및 다능 전구세포는 생체내 유전자 편집 (예를 들어, 삽입)을 위해 표적화될 수 있다. 심지어 생체내 골수 세포의 1% (대략 1백5십억개 세포) 편집은 생체외 요법 (대략 1백억개 세포)보다 더 많은 세포를 표적화할 것이다. 또 다른 예로서, 췌장 세포 (예를 들어, β 도세포)는, 예를 들어 췌장암 치료, 당뇨병 치료 등을 위해 표적화될 수 있다. 또 다른 예로서, 뉴런과 같은 뇌 내의 체세포는 표적화될 수 있다 (예를 들어, 헌팅톤병, 파킨슨병 (예를 들어, LRRK2 돌연변이) 및 ALS (예를 들어, SOD1 돌연변이)와 같은 적응증 치료를 위해). 일부 경우에, 이는 직접적 두개내 주사를 통해 달성될 수 있다.

또 다른 예로서, 내피 세포 및 조혈계 세포 (예를 들어, 거핵구 및/또는 거핵구의 상류의 임의의 전구 세포, 예컨대 거핵구-적혈구 전구 세포 (MEP), 공통 골수 전구 세포 (CMP), 다능 전구 세포 (MPP), 조혈 줄기 세포 (HSC), 단기 HSC (ST-HSC), IT-HSC, 장기 HSC (LT-HSC) - 예를 들어, 도 8 참조)는 폰 빌레브란트병 치료를 위해 대상 나노입자 (또는 대상 바이러스 또는 비-바이러스 전달 비히클)에 의해 표적화될 수 있다. 예를 들어, 폰 빌레브란트 인자 (VWF)를 코딩하는 유전자 내에 돌연변이를 보유하는 세포 (예를 들어, 내피 세포, 거핵구 및/또는 거핵구의 상류의 임의의 전구 세포, 예컨대 MEP, CMP, MPP, HSC, 예컨대 ST-HSC, IT-HSC 및/또는 LT-HSC)는 돌연변이된 유전자를, 예를 들어 대체 서열을 도입함으로써 (예를 들어, 공여자 DNA의 전달을 통해) 편집 (및 교정)하기 위해 표적화될 수 있다 (시험관내, 생체외, 생체내). 상기 경우 중 일부에서 (예를 들어, 폰 빌레브란트병의 치료와 관련된 경우, VWF를 코딩하는 유전자 내 돌연변이를 보유하는 세포를 표적화하는 것과 관련된 경우), 대상 표적화 리간드는 E-셀렉틴에 대한 표적화된 결합을 제공한다.

본 개시내용의 방법 및 조성물은 공지된 원인 돌연변이, 예를 들어 게놈 내의 돌연변이와 연관된 임의의 질환을 포함한 임의의 수의 질환을 치료하는데 사용될 수 있다. 예를 들어, 본 개시내용의 방법 및 조성물은 겸상 적혈구 질환, β 지중해빈혈, HIV, 골수이형성 증후군, JAK2-매개 진성 다혈구혈증, JAK2-매개 원발성 골수섬유증, JAK2-매개 백혈병 및 다양한 혈액 장애를 치료하는데 사용될 수 있다. 추가의 비제한적 예로서, 본 개시내용의 방법 및 조성물은 또한 B-세포 항체 생성, 면역요법 (예를 들어, 체크포인트 차단 시약의 전달), 및 줄기 세포 분화 적용에 사용될 수 있다.

일부 실시양태에서, 표적화 리간드는 KLS CD27+/IL-7Ra-/CD150+/CD34- 조혈 줄기 및 전구 세포 (HSPC)에 대한 표적화된 결합을 제공한다. 예를 들어, 베타-글로빈 (HBB) 유전자는 변경된 E7V 치환을 적절한 공여자 DNA 분자로 교정하기 위해 직접적으로 표적화될 수 있다. 한 예시적인 예로서, CRISPR/Cas RNA-가이드 폴리펩티드 (예를 들어, Cas9, CasX, CasY, Cpf1)는 그가 HBB 유전자 내의 유전자좌에 결합하고 게놈 내의 2개의 위치에서 엇갈림 말단 절단을 생성하여 도입된 공여자 DNA의 삽입을 개시하도록 적절한 가이드 RNA(들)와 함께 전달될 수 있다. 일부 경우에, 공여자 DNA 분자 (단일 가닥 또는 이중 가닥)는 (페이로드의 일부로서) 도입되고, 14-30일 동안 방출되는 한편, 가이드 RNA/CRISPR/Cas 단백질 복합체 (리보핵단백질 복합체)는 1-7일의 과정에 걸쳐 방출될 수 있다.

일부 실시양태에서, 표적화 리간드는 T-세포 수용체를 변형시키기 위해 CD4+ 또는 CD8+ T-세포, 조혈 줄기 및 전구 세포 (HSPC), 또는 말초 혈액 단핵 세포 (PBMC)에 대한 표적화된 결합을 제공한다. 예를 들어, 유전자 편집 도구(들) (본원의 다른 곳에 기재됨)가 T-세포 수용체를 변형시키기 위해 도입될 수 있다. T-세포 수용체는 직접적으로 표적화되고, 신규 T-세포 수용체에 대한 상응하는 상동성-지정 복구 공여자 DNA 분자로 치환될 수 있다. 한 예로서, CRISPR/Cas RNA-가이드 폴리펩티드 (예를 들어, Cas9, CasX, CasY, Cpf1)는 그가 HBB 유전자 내의 유전자좌에 결합하고 게놈 내의 2개의 위치에서 엇갈림 말단 절단을 생성하여 도입된 공여자 DNA의 삽입을 개시하도록 적절한 가이드 RNA(들)와 함께 전달될 수 있다. 베타-글로빈, CCR5, T-세포 수용체 또는 임의의 다른 관심 유전자를 표적화하는 다른 CRISPR 가이드 RNA 및 공여자 서열, 및/또는 다른 발현 벡터가 본 개시내용에 따라 사용될 수 있다는 것이 관련 기술분야의 통상의 기술자에게 명백할 것이다.

일부 경우에, 대상 방법은, 일부 경우에 거의 100개 도메인 및 많게는 1,000,000 염기 쌍을 갖고 불변 영역이 V(D)J 영역으로부터 ~100,000 염기 쌍 또는 그 초과만큼 이격되어 있는 T 세포 수용체 (TCR)를 코딩하는 유전자좌를 표적화하는데 사용된다. 일부 경우에, 공여자 DNA의 삽입은 T 세포 수용체 (TCR) 단백질을 코딩하는 뉴클레오티드 서열 내에서 발생한다. 일부 이러한 경우에, 공여자 DNA는 TCR 단백질의 CDR1, CDR2 또는 CDR3 영역의 아미노산을 코딩한다. 예를 들어, 문헌 [Dash et al., Nature. 2017 Jul 6;547(7661):89-93. Epub 2017 Jun 21; 및 Glanville et al., Nature. 2017 Jul 6;547(7661):94-98. Epub 2017 Jun 21]을 참조한다.

일부 경우에, 대상 방법은 게놈 조작에 대한 안전 장치로서 특이적 인핸서의 제어 하에 (그와 작동가능하게 연결되도록) 두면서 유전자를 삽입하는데 사용된다. 삽입이 실패하면, 인핸서는 파괴되어 후속 유전자 및 임의의 가능한 삽입결실(indel)이 발현될 가능성이 없도록 한다. 유전자 삽입이 성공하면, 새로운 유전자가 그의 말단에서의 정지 코돈과 함께 삽입될 수 있으며, 이는 다중-부분 유전자, 예컨대 TCR 유전자좌에 특히 유용하다. 일부 경우에, 대상 방법을 사용하여 키메라 항원 수용체 (CAR) 또는 다른 구축물을 T-세포 내로 삽입하거나 또는 B-세포가 특이적 항체 또는 항체 대체물 (예컨대 나노바디, 상어 항체 등)을 생성하도록 할 수 있다.

일부 경우에, 공여자 DNA는 키메라 항원 수용체 (CAR)를 코딩하는 뉴클레오티드 서열을 포함한다. 일부 이러한 경우에, 공여자 DNA의 삽입은 CAR을 코딩하는 뉴클레오티드 서열의 내인성 T-세포 프로모터에 대한 작동가능한 연결을 유발한다 (즉, CAR의 발현은 내인성 프로모터의 제어 하에 있을 것임). 일부 경우에, 공여자 DNA는 프로모터에 작동가능하게 연결되고 키메라 항원 수용체 (CAR)를 코딩하는 뉴클레오티드 서열을 포함하며 - 따라서 삽입된 CAR은 공여자 DNA 상에 존재하는 프로모터의 제어 하에 있을 것이다.

일부 경우에 공여자 DNA는 막 결합되고 세포외로 제시되는 세포-특이적 표적화 리간드를 코딩하는 뉴클레오티드 서열을 포함한다. 일부 경우에, 상기 공여자 DNA의 삽입은 세포-특이적 표적화 리간드를 코딩하는 뉴클레오티드 서열의 내인성 프로모터에 대한 작동가능한 연결을 유발한다. 일부 경우에, 공여자 DNA는 막 결합되고 세포외로 제시되는 세포-특이적 표적화 리간드를 코딩하는 서열에 작동가능하게 연결된 프로모터를 포함하며 - 따라서, 공여자 DNA의 삽입 후에, 막 결합된 표적화 리간드의 발현은 공여자 DNA 상에 존재하는 프로모터의 제어 하에 있을 것이다.

일부 실시양태에서, 공여자 DNA의 삽입은 T 세포 수용체 (TCR) 알파 또는 델타 서브유닛을 코딩하는 뉴클레오티드 서열 내에서 발생한다. 일부 경우에, 공여자 DNA의 삽입은 TCR 베타 또는 감마 서브유닛을 코딩하는 뉴클레오티드 서열 내에서 발생한다. 일부 경우에, 대상 방법 및/또는 조성물은 2개의 공여자 DNA를 포함한다. 일부 이러한 경우에, 한 공여자 DNA의 삽입은 T 세포 수용체 (TCR) 알파 또는 델타 서브유닛을 코딩하는 뉴클레오티드 서열 내에서 발생하고, 다른 공여자 DNA의 삽입은 T 세포 수용체 (TCR) 베타 또는 감마 서브유닛을 코딩하는 뉴클레오티드 서열 내에서 발생한다.

일부 실시양태에서, 공여자 DNA의 삽입은 T 세포 수용체 (TCR) 알파 또는 델타 서브유닛 불변 영역을 코딩하는 뉴클레오티드 서열 내에서 발생한다. 일부 경우에, 공여자 DNA의 삽입은 T 세포 수용체 (TCR) 베타 또는 감마 서브유닛 불변 영역을 코딩하는 뉴클레오티드 서열 내에서 발생한다. 일부 경우에, 대상 방법 및/또는 조성물은 2개의 공여자 DNA를 포함한다. 일부 이러한 경우에, 한 공여자 DNA의 삽입은 T 세포 수용체 (TCR) 알파 또는 델타 서브유닛 불변 영역을 코딩하는 뉴클레오티드 서열 내에서 발생하고, 다른 공여자 DNA의 삽입은 T 세포 수용체 (TCR) 베타 또는 감마 서브유닛 불변 영역을 코딩하는 뉴클레오티드 서열 내에서 발생한다.

일부 실시양태에서, 공여자 DNA의 삽입은 T 세포 수용체 (TCR) 알파 또는 델타 서브유닛 프로모터로서 기능하는 뉴클레오티드 서열 내에서 발생한다. 일부 경우에, 공여자 DNA의 삽입은 T 세포 수용체 (TCR) 베타 또는 감마 서브유닛 프로모터로서 기능하는 뉴클레오티드 서열 내에서 발생한다. 일부 경우에, 대상 방법 및/또는 조성물은 2개의 공여자 DNA를 포함한다. 일부 이러한 경우에, 한 공여자 DNA의 삽입은 T 세포 수용체 (TCR) 알파 또는 델타 서브유닛 프로모터로서 기능하는 뉴클레오티드 서열 내에서 발생하고, 다른 공여자 DNA의 삽입은 T 세포 수용체 (TCR) 베타 또는 감마 서브유닛 프로모터로서 기능하는 뉴클레오티드 서열 내에서 발생한다.

일부 실시양태에서, 공여자 DNA의 서열의 삽입은 T 세포 수용체 (TCR) 알파 또는 감마 서브유닛을 코딩하는 뉴클레오티드 서열 내에서 발생한다. 일부 경우에, 공여자 DNA의 서열의 삽입은 TCR 베타 또는 델타 서브유닛을 코딩하는 뉴클레오티드 서열 내에서 발생한다. 일부 경우에, 대상 방법 및/또는 조성물은 2개의 공여자 DNA를 포함한다. 일부 이러한 경우에, 한 공여자 DNA의 서열의 삽입은 T 세포 수용체 (TCR) 알파 또는 감마 서브유닛을 코딩하는 뉴클레오티드 서열 내에서 발생하고, 다른 공여자 DNA의 서열의 삽입은 T 세포 수용체 (TCR) 베타 또는 델타 서브유닛을 코딩하는 뉴클레오티드 서열 내에서 발생한다.

일부 실시양태에서, 공여자 DNA의 서열의 삽입은 T 세포 수용체 (TCR) 알파 또는 감마 서브유닛 불변 영역을 코딩하는 뉴클레오티드 서열 내에서 발생한다. 일부 경우에, 공여자 DNA의 서열의 삽입은 T 세포 수용체 (TCR) 베타 또는 델타 서브유닛 불변 영역을 코딩하는 뉴클레오티드 서열 내에서 발생한다. 일부 경우에, 대상 방법 및/또는 조성물은 2개의 공여자 DNA를 포함한다. 일부 이러한 경우에, 한 공여자 DNA의 서열의 삽입은 T 세포 수용체 (TCR) 알파 또는 감마 서브유닛 불변 영역을 코딩하는 뉴클레오티드 서열 내에서 발생하고, 다른 공여자 DNA의 서열의 삽입은 T 세포 수용체 (TCR) 베타 또는 델타 서브유닛 불변 영역을 코딩하는 뉴클레오티드 서열 내에서 발생한다.

일부 실시양태에서, 공여자 DNA의 서열의 삽입은 T 세포 수용체 (TCR) 알파 또는 감마 서브유닛 프로모터로서 기능하는 뉴클레오티드 서열 내에서 발생한다. 일부 경우에, 공여자 DNA의 서열의 삽입은 T 세포 수용체 (TCR) 베타 또는 델타 서브유닛 프로모터로서 기능하는 뉴클레오티드 서열 내에서 발생한다. 일부 경우에, 대상 방법 및/또는 조성물은 2개의 공여자 DNA를 포함한다. 일부 이러한 경우에, 한 공여자 DNA의 서열의 삽입은 T 세포 수용체 (TCR) 알파 또는 감마 서브유닛 프로모터로서 기능하는 뉴클레오티드 서열 내에서 발생하고, 다른 공여자 DNA의 서열의 삽입은 T 세포 수용체 (TCR) 베타 또는 델타 서브유닛 프로모터로서 기능하는 뉴클레오티드 서열 내에서 발생한다.

일부 실시양태에서, 공여자 DNA의 삽입은 삽입된 공여자 DNA와 T 세포 수용체 (TCR) 알파, 베타, 감마 또는 델타 내인성 프로모터의 작동가능한 연결을 유발한다. 일부 경우에, 공여자 DNA는 TCR 알파, 베타, 감마 또는 델타 프로모터에 작동가능하게 연결된 단백질-코딩 뉴클레오티드 서열을 포함하여, 삽입 후에 단백질-코딩 서열이 공여자 DNA에 존재하는 프로모터에 작동가능하게 연결된 채로 (그의 제어 하에) 유지되도록 한다. 일부 경우에, 상기 공여자 DNA의 삽입은 삽입된 공여자 DNA (예를 들어, 단백질-코딩 뉴클레오티드 서열, 예컨대 CAR, TCR-알파, TCR-베타, TCR-감마 또는 TCR-델타 서열)와 CD3 또는 CD28 프로모터의 작동가능한 연결을 유발한다. 일부 경우에, 공여자 DNA는 프로모터 (예를 들어, T-세포 특이적 프로모터)에 작동가능하게 연결된 단백질-코딩 뉴클레오티드 서열을 포함한다. 일부 경우에, 공여자 DNA의 삽입은 삽입된 공여자 DNA와 내인성 프로모터 (예를 들어, 줄기 세포 특이적 또는 체세포 특이적 내인성 프로모터)의 작동가능한 연결을 유발한다. 일부 경우에 공여자 DNA는 리포터 단백질 (예를 들어, 유전자 편집 효율을 평가하기 위한, 예를 들어 형광 단백질, 예컨대 GFP, RFP, YFP, CFP, 근적외선 및/또는 원적외선 리포터 단백질 등)을 코딩하는 뉴클레오티드 서열을 포함한다. 일부 경우에 공여자 DNA는 인트론을 갖지 않는 단백질-코딩 뉴클레오티드 서열 (예를 들어, TCR 단백질의 전부 또는 일부를 코딩하는 것)을 포함한다.

일부 경우에, 대상 방법 (및/또는 대상 조성물)은 적용을 위한 서열의 삽입, 예컨대 형광 리포터 (예를 들어, 형광 단백질, 예컨대 녹색 형광 단백질 (GFP)/적색 형광 단백질 (RFP)/근적외선/원적외선 등)의, 예를 들어 막횡단 단백질과 같은 임의의 코딩되는 관심 단백질의 C- 및/또는 N-말단 내로의 삽입을 위해 사용될 수 있다.

일부 실시양태에서, 공여자 DNA의 뉴클레오티드 서열의 세포의 게놈 내로의 삽입은 삽입된 서열과 내인성 프로모터 (예를 들어, (i) T-세포 특이적 프로모터; (ii) CD3 프로모터; (iii) CD28 프로모터; (iv) 줄기 세포 특이적 프로모터; (v) 체세포 특이적 프로모터; (vi) T 세포 수용체 (TCR) 알파, 베타, 감마 또는 델타 프로모터; (v) B-세포 특이적 프로모터; (vi) CD19 프로모터; (vii) CD20 프로모터; (viii) CD22 프로모터; (ix) B29 프로모터; 및 (x) T-세포 또는 B-세포 V(D)J-특이적 프로모터)의 작동가능한 연결을 유발한다. 일부 경우에, 삽입되는 삽입 공여자 조성물의 뉴클레오티드 서열은 프로모터 (예를 들어, (i) T-세포 특이적 프로모터; (ii) CD3 프로모터; (iii) CD28 프로모터; (iv) 줄기 세포 특이적 프로모터; (v) 체세포 특이적 프로모터; (vi) T 세포 수용체 (TCR) 알파, 베타, 감마 또는 델타 프로모터; (v) B-세포 특이적 프로모터; (vi) CD19 프로모터; (vii) CD20 프로모터; (viii) CD22 프로모터; (ix) B29 프로모터; 및 (x) T-세포 또는 B-세포 V(D)J-특이적 프로모터)에 작동가능하게 연결된 단백질-코딩 서열을 포함한다.

일부 실시양태에서, 세포의 게놈 내로 삽입되는 뉴클레오티드 서열은 단백질을 코딩한다. 임의의 편리한 단백질이 코딩될 수 있으며 - 예는 T 세포 수용체 (TCR) 단백질; T 세포 수용체 (TCR) 단백질의 CDR1, CDR2 또는 CDR3 영역; 키메라 항원 수용체 (CAR); 막 결합되고 세포외로 제시되는 세포-특이적 표적화 리간드; 리포터 단백질 (예를 들어, 형광 단백질, 예컨대 GFP, RFP, CFP, YFP, 및 원적외선, 근적외선에서 형광을 발하는 형광 단백질 등)을 포함하나 이에 제한되지는 않는다. 일부 실시양태에서, 세포의 게놈 내로 삽입되는 뉴클레오티드 서열은 다가 (예를 들어, 이종다가) 표면 수용체를 코딩한다 (예를 들어, T-세포가 표적 세포인 일부 경우에). 임의의 편리한 다가 수용체가 사용될 수 있고, 비제한적 예는 이중특이적 또는 삼중특이적 CAR 및/또는 TCR, 또는 면역 세포 상의 다른 친화성 태그를 포함한다. 이러한 삽입은 표적화된 세포가 수용체를 발현하도록 할 것이다. 일부 경우에, 다가는 개별 수용체를 삽입함으로써 삽입되며, 삽입된 수용체는 OR 게이트 (하나 또는 다른 것이 활성화를 촉발함)로서 또는 AND 게이트 (수용체 신호전달이 공동-자극성이고 동종가 결합이 세포, 예를 들어 표적화된 T-세포를 활성화/자극시키지 않을 것임)로서 기능한다. 삽입된 DNA에 의해 코딩되는 단백질 (예를 들어, CAR, TCR, 다가 표면 수용체)은 그가 CD3, CD8, CD4, CD28, CD90, CD45f, CD34, CD80, CD86, CD19, CD20, CD22, CD47, CD3-엡실론, CD3-감마, CD3-델타; TCR 알파, TCR 베타, TCR 감마 및/또는 TCR 델타 불변 영역; 4-1BB, OX40, OX40L, CD62L, ARP5, CCR5, CCR7, CCR10, CXCR3, CXCR4, CD94/NKG2, NKG2A, NKG2B, NKG2C, NKG2E, NKG2H, NKG2D, NKG2F, NKp44, NKp46, NKp30, DNAM, XCR1, XCL1, XCL2, ILT, LIR, Ly49, IL2R, IL7R, IL10R, IL12R, IL15R, IL18R, TNFα, IFNγ, TGF-β 및 α5β1로부터 선택된 1개 이상의 표적에 결합하도록 (예를 들어, 세포, 예를 들어 T-세포를 이들에 표적화하는 기능을 하도록) 선택될 수 있다.

일부 경우에, 삽입된 뉴클레오티드 서열은 수용체를 코딩하며, 수용체에 의해 표적화 (결합)되는 표적은 개체의 질환 (예를 들어, 암/종양)에 특이적이다. 일부 경우에, 삽입된 뉴클레오티드 서열은 이종다가 수용체를 코딩하며, 이종다가 수용체에 의해 표적화되는 표적의 조합은 개체의 질환 (예를 들어, 암/종양)에 특이적이다. 한 예시적인 예로서, 개체의 암 (예를 들어, 예컨대 생검을 통한 종양)을 서열분석하여 (핵산 서열, 단백질체학, 대사체학 등), 표적일 수 있는 이환 세포의 항원 (예컨대 개체의 대조군 세포에 비해 종양에 의해 과다발현되거나 그에 독특한 항원)을 확인할 수 있고, 이러한 표적 중 1개 이상 (예를 들어, 이러한 표적 중 2개 이상, 3개 이상, 5개 이상, 10개 이상, 15개 이상 또는 약 20개)에 결합하는 수용체 (예를 들어, 이종다가 수용체)를 코딩하는 뉴클레오티드 서열을 면역 세포 (예를 들어, NK 세포, B-세포, T-세포, 예를 들어 CAR 또는 TCR을 사용함) 내로 삽입하여, 면역 세포가 개체의 이환 세포 (예를 들어, 종양 세포)를 특이적으로 표적화하도록 할 수 있다. 따라서, 삽입된 뉴클레오티드 서열은 진단상 반응성이도록 설계될 수 있고 - 코딩된 수용체(들) (예를 들어, 이종다가 수용체(들))가 환자의 단백질체학, 게놈학 또는 대사체학과 관련된 독특한 통찰을 (예를 들어, 서열분석 등을 통해) 제공받은 후에 설계될 수 있다는 의미에서 -, 따라서 열렬한 특이적 면역계 반응을 생성할 수 있다. 이러한 방식으로, 면역 세포 (예컨대 NK 세포, B 세포, T 세포 등)는 개체 자신의 질환 (예를 들어, 암)에 대해 효과적이도록 설계된 수용체, 예컨대 CAR 및/또는 TCR 단백질 (예를 들어, 이종다가 버전)을 발현하도록 게놈 편집될 수 있다. 일부 경우에, 조절 T 세포는 진단상-반응성 의약 후 자가면역에 의해 이환된 조직에 대해 유사한 결합력을 제공받을 수 있다.

일부 경우에, 세포의 게놈 내로 삽입되는 공여자 DNA의 뉴클레오티드 서열은 인트론을 갖지 않는 단백질-코딩 뉴클레오티드 서열을 포함한다. 일부 경우에, 인트론을 갖지 않는 뉴클레오티드 서열은 TCR 단백질의 전부 또는 일부를 코딩한다.

일부 실시양태에서, 1개 초과의 전달 비히클이 표적 세포 내로 도입된다. 예를 들어, 일부 경우에 대상 방법은 상기 전달 비히클 중 제1 및 제2 전달 비히클을 세포 내로 도입하는 것을 포함하며, 여기서 세포의 게놈 내로 삽입되는 제1 전달 비히클의 공여자 DNA의 뉴클레오티드 서열은 T 세포 수용체 (TCR) 알파 또는 델타 서브유닛을 코딩하고, 세포의 게놈 내로 삽입되는 제2 전달 비히클의 공여자 DNA의 뉴클레오티드 서열은 TCR 베타 또는 감마 서브유닛을 코딩한다. 일부 경우에 대상 방법은 상기 전달 비히클 중 제1 및 제2 전달 비히클을 세포 내로 도입하는 것을 포함하며, 여기서 세포의 게놈 내로 삽입되는 제1 전달 비히클의 공여자 DNA의 뉴클레오티드 서열은 T 세포 수용체 (TCR) 알파 또는 델타 서브유닛 불변 영역을 코딩하고, 세포의 게놈 내로 삽입되는 제2 전달 비히클의 공여자 DNA의 뉴클레오티드 서열은 TCR 베타 또는 감마 서브유닛 불변 영역을 코딩한다.

일부 경우에 대상 방법은 상기 전달 비히클 중 제1 및 제2 전달 비히클을 세포 내로 도입하는 것을 포함하며, 여기서 제1 전달 비히클의 공여자 DNA의 뉴클레오티드 서열은 T 세포 수용체 (TCR) 알파 또는 델타 서브유닛 프로모터로서 기능하는 뉴클레오티드 서열 내에 삽입되고, 제2 전달 비히클의 공여자 DNA의 뉴클레오티드 서열은 TCR 베타 또는 감마 서브유닛 프로모터로서 기능하는 뉴클레오티드 서열 내에 삽입된다. TCR 단백질 및 CDR과 관련된 보다 많은 정보에 대해서는, 예를 들어 문헌 [Dash et al., Nature. 2017 Jul 6;547(7661):89-93. Epub 2017 Jun 21; 및 Glanville et al., Nature. 2017 Jul 6;547(7661):94-98. Epub 2017 Jun 21]을 참조한다.

일부 경우에 대상 방법은 상기 전달 비히클 중 제1 및 제2 전달 비히클을 세포 내로 도입하는 것을 포함하며, 여기서 세포의 게놈 내로 삽입되는 제1 전달 비히클의 공여자 DNA의 뉴클레오티드 서열은 T 세포 수용체 (TCR) 알파 또는 감마 서브유닛을 코딩하고, 세포의 게놈 내로 삽입되는 제2 전달 비히클의 공여자 DNA의 뉴클레오티드 서열은 TCR 베타 또는 델타 서브유닛을 코딩한다. 일부 경우에 대상 방법은 상기 전달 비히클 중 제1 및 제2 전달 비히클을 세포 내로 도입하는 것을 포함하며, 여기서 세포의 게놈 내로 삽입되는 제1 전달 비히클의 공여자 DNA의 뉴클레오티드 서열은 T 세포 수용체 (TCR) 알파 또는 델타 서브유닛 불변 영역을 코딩하고, 세포의 게놈 내로 삽입되는 제2 전달 비히클의 공여자 DNA의 뉴클레오티드 서열은 TCR 베타 또는 감마 서브유닛 불변 영역을 코딩한다. 일부 경우에 대상 방법은 상기 전달 비히클 중 제1 및 제2 전달 비히클을 세포 내로 도입하는 것을 포함하며, 여기서 제1 전달 비히클의 공여자 DNA의 뉴클레오티드 서열은 T 세포 수용체 (TCR) 알파 또는 감마 서브유닛 프로모터로서 기능하는 뉴클레오티드 서열 내에 삽입되고, 제2 전달 비히클의 공여자 DNA의 뉴클레오티드 서열은 TCR 베타 또는 델타 서브유닛 프로모터로서 기능하는 뉴클레오티드 서열 내에 삽입된다. TCR 단백질 및 CDR과 관련된 보다 많은 정보에 대해서는, 예를 들어 문헌 [Dash et al., Nature. 2017 Jul 6;547(7661):89-93. Epub 2017 Jun 21; 및 Glanville et al., Nature. 2017 Jul 6;547(7661):94-98. Epub 2017 Jun 21]을 참조한다.

공동-전달 (반드시 본 개시내용의 나노입자는 아님)

상기 언급된 바와 같이, 동일한 패키지 (전달 비히클)의 일부로서 다중 페이로드를 전달하는 하나의 이점은 각각의 페이로드의 효율이 희석되지 않는다는 것이다. 일부 실시양태에서, 공여자 DNA 및 1개 이상의 부위-특이적 뉴클레아제 (또는 이를 코딩하는 1개 이상의 핵산)는 동일한 전달 비히클의 페이로드이다. 일부 실시양태에서, 공여자 DNA 및/또는 1개 이상의 유전자 편집 도구 (예를 들어, 본원의 다른 곳에 기재된 바와 같음)는 게놈 편집 효율을 증가시키는 단백질 (및/또는 이를 코딩하는 DNA 또는 mRNA) 및/또는 비-코딩 RNA와 조합되어 (예를 들어, 동일한 패키지/전달 비히클의 일부로서, 여기서 전달 비히클이 본 개시내용의 나노입자일 필요는 없음) 전달된다. 일부 실시양태에서, 1개 이상의 유전자 편집 도구는 세포 분열 및/또는 분화를 제어하는 단백질 (및/또는 이를 코딩하는 DNA 또는 mRNA) 및/또는 비-코딩 RNA와 조합되어 (예를 들어, 동일한 패키지/전달 비히클의 일부로서, 여기서 전달 비히클이 본 개시내용의 나노입자일 필요는 없음) 전달된다. 예를 들어, 일부 경우에 1개 이상의 유전자 편집 도구는 세포 분열을 제어하는 단백질 (및/또는 이를 코딩하는 DNA 또는 mRNA) 및/또는 비-코딩 RNA와 조합되어 (예를 들어, 동일한 패키지/전달 비히클의 일부로서, 여기서 전달 비히클이 본 개시내용의 나노입자일 필요는 없음) 전달된다. 일부 경우에, 1개 이상의 유전자 편집 도구는 분화를 제어하는 단백질 (및/또는 이를 코딩하는 DNA 또는 mRNA) 및/또는 비-코딩 RNA와 조합되어 (예를 들어, 동일한 패키지/전달 비히클의 일부로서, 여기서 전달 비히클이 본 개시내용의 나노입자일 필요는 없음) 전달된다. 일부 경우에, 1개 이상의 유전자 편집 도구는 세포 DNA 복구 기구를 편향시키는 단백질 (및/또는 이를 코딩하는 DNA 또는 mRNA) 및/또는 비-코딩 RNA와 조합되어 (예를 들어, 동일한 패키지/전달 비히클의 일부로서, 여기서 전달 비히클이 본 개시내용의 나노입자일 필요는 없음) 전달된다.

상기 언급된 바와 같이, 일부 경우에 전달 비히클은 본 개시내용의 나노입자일 필요는 없다. 예를 들어, 일부 경우에 전달 비히클은 바이러스이고, 일부 경우에 전달 비히클은 비-바이러스이다. 비-바이러스 전달 시스템의 예는 다중 핵산 페이로드 또는 단백질 및 핵산 페이로드의 조합을 공-축합시키는데 사용될 수 있는 물질을 포함한다. 예는 (1) 지질 기재 입자, 예컨대 쯔비터이온성 또는 양이온성 지질, 및 엑소솜 또는 엑소솜-유래 소포; (2) 무기/하이브리드 복합 입자, 예컨대 핵산 및/또는 단백질 페이로드와 공-축합된 이온성 복합체, 및 양이온성 이온 상태의 Ca, Mg, Si, Fe 및 생리학적 음이온, 예컨대 O^2-, OH, PO₄ ^3-, SO₄ ^2-로부터 축합될 수 있는 복합체를 포함하는 것; (3) 탄수화물 전달 비히클, 예컨대 시클로덱스트린 및/또는 알기네이트; (4) 중합체 및/또는 공-중합체 복합체, 예컨대 폴리(아미노산) 기재 정전기적 복합체, 폴리(아미도-아민), 및 양이온성 폴리(B-아미노 에스테르); 및 (5) 바이러스 유사 입자 (예를 들어, 단백질 및 핵산 기재)를 포함하나 이에 제한되지는 않는다. 바이러스 전달 시스템의 예는 AAV, 아데노바이러스, 레트로바이러스 및 렌티바이러스를 포함하나 이에 제한되지는 않는다.

공동-전달을 위한 페이로드의 예

일부 실시양태에서, 공여자 DNA 및/또는 1개 이상의 유전자 편집 도구는 SCF (및/또는 SCF를 코딩하는 DNA 또는 mRNA), HoxB4 (및/또는 HoxB4를 코딩하는 DNA 또는 mRNA), BCL-XL (및/또는 BCL-XL을 코딩하는 DNA 또는 mRNA), SIRT6 (및/또는 SIRT6을 코딩하는 DNA 또는 mRNA), miR-155를 억제하는 핵산 분자 (예를 들어, siRNA 및/또는 LNA), ku70 발현을 감소시키는 핵산 분자 (예를 들어, siRNA, shRNA, 마이크로RNA), 및 ku80 발현을 감소시키는 핵산 분자 (예를 들어, siRNA, shRNA, 마이크로RNA) 중 1개 이상과 조합되어 (예를 들어, 동일한 패키지/전달 비히클의 일부로서, 여기서 전달 비히클이 본 개시내용의 나노입자일 필요는 없음) 전달될 수 있다.

함께 전달될 수 있는 마이크로RNA (RNA로서 또는 RNA를 코딩하는 DNA로서 전달됨)의 예에 대해서는, 도 9A를 참조한다. 예를 들어, 하기 마이크로RNA가 하기 목적을 위해 사용될 수 있다: 만능 줄기 세포의 외배엽 계통으로의 분화를 차단하기 위해: miR-430/427/302; 만능 줄기 세포의 내배엽 계통으로의 분화를 차단하기 위해: miR-109 및/또는 miR-24; 만능 줄기 세포의 내배엽 계통으로의 분화를 유도하기 위해: miR-122 및/또는 miR-192; 외배엽 전구 세포의 각질세포 운명으로의 분화를 유도하기 위해: miR-203; 신경 능선 줄기 세포의 평활근 운명으로의 분화를 유도하기 위해: miR-145; 신경 줄기 세포의 신경교 세포 운명 및/또는 뉴런 운명으로의 분화를 유도하기 위해: miR-9 및/또는 miR-124a; 중배엽 전구 세포의 연골세포 운명으로의 분화를 차단하기 위해: miR-199a; 중배엽 전구 세포의 골모세포 운명으로의 분화를 유도하기 위해: miR-296 및/또는 miR-2861; 중배엽 전구 세포의 심장 근육 운명으로의 분화를 유도하기 위해: miR-1; 중배엽 전구 세포의 심장 근육 운명으로의 분화를 차단하기 위해: miR-133; 중배엽 전구 세포의 골격근 운명으로의 분화를 유도하기 위해: miR-214, miR-206, miR-1 및/또는 miR-26a; 중배엽 전구 세포의 골격근 운명으로의 분화를 차단하기 위해: miR-133, miR-221 및/또는 miR-222; 분화로의 조혈 전구 세포의 분화를 유도하기 위해: miR-223; 분화로의 조혈 전구 세포의 분화를 차단하기 위해: miR-128a 및/또는 miR-181a; 조혈 전구 세포의 림프 전구 세포로의 분화를 유도하기 위해: miR-181; 조혈 전구 세포의 림프 전구 세포로의 분화를 차단하기 위해: miR-146; 조혈 전구 세포의 골수 전구 세포로의 분화를 차단하기 위해: miR-155, miR-24a 및/또는 miR-17; 림프 전구 세포의 T 세포 운명으로의 분화를 유도하기 위해: miR-150; 골수 전구 세포의 과립구 운명으로의 분화를 차단하기 위해: miR-223; 골수 전구 세포의 단핵구 운명으로의 분화를 차단하기 위해: miR-17-5p, miR-20a 및/또는 miR-106a; 골수 전구 세포의 적혈구 운명으로의 분화를 차단하기 위해: miR-150, miR-155, miR-221 및/또는 miR-222; 및 골수 전구 세포의 적혈구 운명으로의 분화를 유도하기 위해: miR-451 및/또는 miR-16.

공여자 DND 및/또는 1개 이상의 유전자 편집 도구 (예를 들어, 본원의 다른 곳에 기재된 바와 같음)와 함께 전달될 수 있는 신호전달 단백질 (예를 들어, 세포외 신호전달 단백질)의 예에 대해서는, 도 9B를 참조한다. 예를 들어, 하기 신호전달 단백질 (예를 들어, 세포외 신호전달 단백질) (예를 들어, 단백질로서 또는 단백질을 코딩하는 핵산, 예컨대 DNA 또는 RNA로서 전달됨)은 하기 목적을 위해 사용될 수 있다: 조혈 줄기 세포의 공통 림프 전구 세포 계통으로의 분화를 유도하기 위해: IL-7; 조혈 줄기 세포의 공통 골수 전구 세포 계통으로의 분화를 유도하기 위해: IL-3, GM-CSF 및/또는 M-CSF; 공통 림프 전구 세포의 B-세포 운명으로의 분화를 유도하기 위해: IL-3, IL-4 및/또는 IL-7; 공통 림프 전구 세포의 자연 킬러 세포 운명으로의 분화를 유도하기 위해: IL-15; 공통 림프 전구 세포의 T-세포 운명으로의 분화를 유도하기 위해: IL-2, IL-7 및/또는 Notch; 공통 림프 전구 세포의 수지상 세포 운명으로의 분화를 유도하기 위해: Flt-3 리간드; 공통 골수 전구 세포의 수지상 세포 운명으로의 분화를 유도하기 위해: Flt-3 리간드, GM-CSF 및/또는 TNF-알파; 공통 골수 전구 세포의 과립구-대식세포 전구 세포 계통으로의 분화를 유도하기 위해: GM-CSF; 공통 골수 전구 세포의 거핵구-적혈구 전구 세포 계통으로의 분화를 유도하기 위해: IL-3, SCF 및/또는 Tpo; 거핵구-적혈구 전구 세포의 거핵구 운명으로의 분화를 유도하기 위해: IL-3, IL-6, SCF 및/또는 Tpo; 거핵구-적혈구 전구 세포의 적혈구 운명으로의 분화를 유도하기 위해: 에리트로포이에틴; 거핵구의 혈소판 운명으로의 분화를 유도하기 위해: IL-11 및/또는 Tpo; 과립구-대식세포 전구 세포의 단핵구 계통으로의 분화를 유도하기 위해: GM-CSF 및/또는 M-CSF; 과립구-대식세포 전구 세포의 골수모세포 계통으로의 분화를 유도하기 위해: GM-CSF; 단핵구의 단핵구-유래 수지상 세포 운명으로의 분화를 유도하기 위해: Flt-3 리간드, GM-CSF, IFN-알파 및/또는 IL-4; 단핵구의 대식세포 운명으로의 분화를 유도하기 위해: IFN-감마, IL-6, IL-10 및/또는 M-CSF; 골수모세포의 호중구 운명으로의 분화를 유도하기 위해: G-CSF, GM-CSF, IL-6 및/또는 SCF; 골수모세포의 호산구 운명으로의 분화를 유도하기 위해: GM-CSF, IL-3 및/또는 IL-5; 및 골수모세포의 호염기구 운명으로의 분화를 유도하기 위해: G-CSF, GM-CSF 및/또는 IL-3.

공여자 DNA 및/또는 1개 이상의 유전자 편집 도구 (예를 들어, 본원의 다른 곳에 기재된 바와 같음)와 함께 (예를 들어, 단백질 및/또는 단백질을 코딩하는 핵산, 예컨대 DNA 또는 RNA로서) 전달될 수 있는 단백질의 예는 다음을 포함하나 이에 제한되지는 않는다: SOX17, HEX, OSKM (Oct4/Sox2/Klf4/c-myc) 및/또는 bFGF (예를 들어, 간 줄기 세포 계통으로의 분화를 유도함); HNF4a (예를 들어, 간세포 운명으로의 분화를 유도함); 폴리 (I:C), BMP-4, bFGF 및/또는 8-Br-cAMP (예를 들어, 내피 줄기 세포/전구세포 계통으로의 분화를 유도함); VEGF (예를 들어, 동맥 내피 운명으로의 분화를 유도함); Sox-2, Brn4, Myt1l, Neurod2, Ascl1 (예를 들어, 신경 줄기 세포/전구세포 계통으로의 분화를 유도함); 및 BDNF, FCS, 포르스콜린 및/또는 SHH (예를 들어, 뉴런, 성상세포 및/또는 핍지교세포 운명으로의 분화를 유도함).

공여자 DNA 및/또는 1개 이상의 유전자 편집 도구 (예를 들어, 본원의 다른 곳에 기재된 바와 같음)와 함께 (예를 들어, 단백질 및/또는 단백질을 코딩하는 핵산, 예컨대 DNA 또는 RNA로서) 전달될 수 있는 신호전달 단백질 (예를 들어, 세포외 신호전달 단백질)의 예는 다음을 포함하나 이에 제한되지는 않는다: 시토카인 (예를 들어, 예컨대 CD8+ T-세포를 활성화시키기 위한 IL-2 및/또는 IL-15); Notch, Wnt 및/또는 Smad 신호전달 경로 중 1개 이상을 조정하는 리간드 및/또는 신호전달 단백질; SCF; 줄기 세포 프로그램화 인자 (예를 들어 Sox2, Oct3/4, Nanog, Klf4, c-Myc 등); 및 후속 단리/정제/농축을 위한 일시적 표면 마커 "태그" 및/또는 형광 리포터. 예를 들어, 섬유모세포는 Sox2의 전달을 통해 신경 줄기 세포로 전환될 수 있는 한편 Oct3/4 및 소분자 "후성적 재설정 인자"의 존재 하에서는 심근세포로 전환될 것이다. 헌팅톤병 또는 CXCR4 돌연변이를 갖는 환자에서, 이들 섬유모세포는 뉴런 및 심장 세포와 연관된 이환 표현형 형질을 각각 코딩할 수 있다. 유전자 편집 교정 및 이들 인자를 단일 패키지로 전달함으로써, 도입되는 인자/페이로드 중 1개 이상 (모두는 아님)으로 인한 유해 효과의 위험이 유의하게 감소될 수 있다.

적용은 생체내 접근법을 포함하며, 여기서 세포 사멸 단서는 유전자 편집이 성공적이지 않을 때 조건부일 수 있고, 세포 분화/증식/활성화는 조직/기관-특이적 프로모터 및/또는 외인성 인자와 관련된다. 유전자 편집을 받은 이환 세포는 활성화 및 증식할 수 있지만, 또 다른 프로모터-구동된 발현 카세트 (예를 들어 종양 억제자, 예컨대 p21 또는 p53의 부재와 관련된 것)의 존재로 인해, 이들 세포는 후속적으로 제거될 것이다. 다른 한편으로는, 목적하는 특징을 발현하는 세포는 목적하는 하류 계통으로 추가로 분화되도록 촉발될 수 있다.

키트

키트가 또한 본 개시내용의 범주 내에 있다. 예를 들어, 일부 경우에, 대상 키트는 다음 중 1개 이상을 (임의의 조합으로) 포함할 수 있다: (i) 공여자 DNA; (ii) 1개 이상의 부위-특이적 뉴클레아제 (또는 이를 코딩하는 1개 이상의 핵산), 예컨대 ZFN 쌍, TALEN 쌍, 니카제 Ca9, Cpf1 등; (iii) 표적화 리간드, (iv) 링커, (v) 링커에 접합된 표적화 리간드, (vi) 앵커링 도메인에 (예를 들어, 링커와 함께 또는 링커 없이) 접합된 표적화 리간드, (vii) 유출가능한 층으로서 사용하기 위한 작용제 (예를 들어, 실리카), (viii) 추가의 페이로드, 예를 들어 siRNA, 또는 siRNA 또는 shRNA에 대한 전사 주형; 유전자 편집 도구 등, (ix) 양이온성 중합체로서 사용될 수 있는 중합체, (x) 음이온성 중합체로서 사용될 수 있는 중합체, (xi) 양이온성 폴리펩티드로서 사용될 수 있는 폴리펩티드, 예를 들어 1개 이상의 HTP, 및 (xii) 대상 바이러스 또는 비-바이러스 전달 비히클. 일부 경우에, 대상 키트는 사용에 대한 지침서를 포함할 수 있다. 키트는 전형적으로 키트의 내용물의 의도된 용도를 표시하는 라벨을 포함한다. 용어 라벨은 키트 상에 또는 키트와 함께 공급되거나 또는 달리 키트에 동반되는 임의의 문서 또는 기록물, 예를 들어 컴퓨터-판독가능 매체를 포함한다.

나노입자 합성의 제1 예시적인 실시예

멸균 무분진 환경 (BSL-II 후드) 내에서 절차를 수행하였다. 기밀 시린지를 70% 에탄올로 멸균한 후 여과된 뉴클레아제 무함유 물로 3회 헹구고, 사용 전 4℃에서 저장하였다. 표면을 사용 전 RNAse 억제제로 처리하였다.

나노입자 코어

적절한 양의 페이로드 (이 경우에 플라스미드 DNA (EGFP-N1 플라스미드))를 폴리(D-글루탐산) 및 폴리(L-글루탐산)의 수성 혼합물 ('음이온성 중합체 조성물')과 합함으로써 제1 용액 (음이온성 용액)을 제조하였다. 이 용액을 pH 8.5의 10mM 트리스-HCl에 의해 적절한 부피로 희석하였다. 적절한 양의 축합제를 함유하는 농축된 용액을 pH 5.5의 60mM HEPES에 의해 적절한 부피로 희석함으로써 '양이온성 중합체 조성물' 및 '양이온성 폴리펩티드 조성물'의 조합인 제2 용액 (양이온성 용액)을 제조하였다. 이 경우에서는, '양이온성 중합체 조성물'은 폴리(L-아르기닌)이고, '양이온성 폴리펩티드 조성물'은 16 μg의 H3K4(me3) (히스톤 H3의 테일, K4 상의 트리 메틸화)였다.

유리 바이알 또는 저 단백질 결합 원심분리 튜브 내 페이로드 용액에 축합 용액을 적가한 후 이어서 4℃에서 30분 동안 인큐베이션함으로써 200 μl 미만의 배치에서 나노입자 코어의 침전을 수행할 수 있다. 200 μl 초과의 배치의 경우에는, 2가지 용액을 마이크로유체 포맷으로 (예를 들어, 표준 혼합 칩 (예를 들어 돌로마이트 마이크로믹서) 또는 유체역학적 유동 포커싱 칩을 사용하여) 합할 수 있다. 생성된 나노입자 코어의 현탁액이 100nm 미만의 평균 입자 크기를 나타내면서 단분산되도록 최적의 투입 유량을 결정할 수 있다.

이 경우에서는, 상기로부터의 2가지 동일한 부피의 용액 (양이온성 축합제 중 하나 및 음이온성 축합제 중 하나)을 혼합하기 위해 제조하였다. 양이온성 축합제의 용액의 경우, 중합체/펩티드 용액을 1개의 단백질 저 결합 튜브 (에펜도르프)에 첨가한 다음, 60mM HEPES (pH 5.5)에 의해 총 부피 100 μl로 희석하였다 (상기 언급된 바와 같음). 이 용액을 음이온성 용액의 제조 동안 실온에서 유지하였다. 음이온성 축합제의 용액의 경우, 음이온성 용액을 최소 광 노출 하에 얼음 상에서 냉각시켰다. 수용액 중 10μg의 핵산 (대략 1 μg/μl) 및 7μg의 수성 폴리(D-글루탐산) [.1%]을 10mM 트리스-HCl (pH 8.5)에 의해 총 부피 100 μl로 희석하였다 (상기 언급된 바와 같음).

2가지 용액 각각을 0.2-마이크로미터 시린지 필터를 사용하여 여과하고, 그 자체의 해밀턴 1ml 기밀 시린지 (유리, 삽입 제품 번호)로 옮겼다. 각각의 시린지를 하버드 펌프 11 엘리트 듀얼 시린지 펌프 상에 배치하였다. 시린지를 튜빙을 사용하여 돌로마이트 마이크로 믹서 칩의 적절한 유입구에 연결하고, 시린지 펌프를 100 μl 총 부피에 대해 120 μl/분으로 실행시켰다. 생성된 용액은 코어 조성물 (이제 핵산 페이로드, 음이온성 성분 및 양이온성 성분을 포함함)을 포함하였다.

코어 안정화 (유출가능한 층의 첨가)

코어를 유출가능한 층으로 코팅하기 위해, 생성된 나노입자 코어 현탁액을 이어서 10mM 트리스 HCl (pH8.5, 10 - 500mM) 중 규산나트륨 또는 10mM PBS (pH 8.5, 10 - 500mM) 중 염화칼슘의 희석 용액과 합하고, 실온에서 1-2시간 동안 인큐베이션되도록 하였다. 이 경우에서는, 코어 조성물을 희석된 규산나트륨 용액에 첨가하여 코어를 중합체 실리카 (유출가능한 층의 예)의 산 불안정성 코팅으로 코팅하였다. 그렇게 하기 위해, 10 μl의 원액 규산나트륨 (시그마(Sigma))을 먼저 1.99 ml의 트리스 완충제 (10mM 트리스 pH = 8.5, 1:200 희석) 중에 용해시키고, 철저히 혼합하였다. 실리케이트 용액을 멸균 0.1-마이크로미터 시린지 필터를 사용하여 여과하고, 시린지 펌프 상에 탑재된 멸균 해밀턴 기밀 시린지로 옮겼다. 상기로부터의 코어 조성물을 또한, 시린지 펌프 상에 또한 탑재된 멸균 해밀턴 기밀 시린지로 옮겼다. 시린지를 PTFE 튜빙을 사용하여 돌로마이트 마이크로 믹서 칩의 적절한 유입구에 연결하고, 시린지 펌프를 120 μl/분으로 실행시켰다.

안정화된 (코팅된) 코어는 표준 원심 여과 장치 (100 kDa 아미콘 울트라, 밀리포어(Millipore)) 또는 고분자량 컷오프 막을 사용하는 30mM HEPES (pH 7.4) 중에서의 투석을 사용하여 정제할 수 있다. 이 경우에서는, 안정화된 (코팅된) 코어를 원심 여과 장치를 사용하여 정제하였다. 수집된 코팅된 나노입자 (나노입자 용액)를 희석 PBS (1:800) 또는 HEPES로 세척하고, 다시 여과하였다 (용액을 저장을 위해 500 μl 멸균 분산 완충제 또는 뉴클레아제 무함유 물 중에 재현탁시킬 수 있음). 효과적인 실리카 코팅이 입증되었다. 안정화된 코어는 110.6 nm의 크기 및 -42.1 mV (95%)의 제타 전위를 가졌다.

표면 코트 (외부 쉘)

안정화된 (이 경우에 실리카 코팅된) 나노입자의 음으로 하전된 표면에 리간드 종 (이 경우에 양이온성 앵커링 도메인으로서의 9-Arg 펩티드 서열에 융합된 광견병 바이러스 당단백질 - 'RVG9R')을 정전기적으로 그라프팅함으로써 때때로 "표면 관능화"로 지칭되는 표면 코트 (또한 외부 쉘로 지칭됨)의 첨가를 달성하였다. 여과하고 분산 완충제 또는 물 중에 재현탁시킨 실리카 코팅된 나노입자로 시작하여, 양성자화된 아민 기의 최종 농도가 적어도 75 uM이 되도록 첨가할 중합체 또는 펩티드의 목적하는 양을 결정하는 것과 같이, 각각의 나노입자 분산액의 최종 부피를 결정하였다. 목적하는 표면 구성성분을 첨가하고, 용액을 20-30초 동안 초음파처리한 후 1시간 동안 인큐베이션하였다. 원심 여과를 300 kDa에서 수행하고 (최종 생성물은 아미콘 울트라 밀리포어로부터의 표준 원심 여과 장치, 예를 들어 300-500kDa 또는 고분자량 컷오프 막을 사용하는, 예를 들어 30mM HEPES (pH 7.4) 중에서의 투석을 사용하여 정제할 수 있음), 최종 재현탁은 세포 배양 배지 또는 분산 완충제 중에서 이루어졌다. 일부 경우에, 최적의 외부 쉘 첨가는 50 내지 150 nm의 평균 입자 크기 및 0 내지 -10 mV의 제타 전위를 갖는 입자의 단분산 현탁액을 생성한다. 이 경우에서는, 외부 쉘을 갖는 나노입자가 115.8 nm의 크기 및 -3.1 mV (100%)의 제타 전위를 가졌다.

나노입자 합성의 제2 예시적인 실시예

나노입자를 실온, 37℃ 또는 양이온성 성분과 음이온성 성분 사이에 37℃ 및 실온의 차이에서 합성하였다. 양이온성 및 음이온성 성분의 혼합 동안 천연 정전기적 상호작용을 이용하여 수성 완충제 중에서 용액을 제조하였다. 시작시에, 음이온성 성분을 트리스 완충제 (30mM - 60mM; pH = 7.4 - 9) 또는 HEPES 완충제 (30mM, pH = 5.5) 중에 용해시킨 한편 양이온성 성분을 HEPES 완충제 (30mM - 60mM, pH = 5 - 6.5) 중에 용해시켰다.

구체적으로, 페이로드 (예를 들어, 유전자 물질 (RNA 또는 DNA), 유전자 물질-단백질-핵 국재화 신호 폴리펩티드 복합체 (리보핵단백질), 또는 폴리펩티드)를 염기성, 중성 또는 산성 완충제에서 재구성하였다. 분석 목적을 위해, 페이로드를 형광단으로 공유 태그부착되도록 또는 형광단을 유전자 코딩하도록 제조하였다. pDNA 페이로드를 사용하여, AGAGAG 탠덤 반복부에 특이적인 Cy5-태그부착된 펩티드 핵산 (PNA)을 사용하여 형광 리포터 벡터 및 형광 리포터-치료 유전자 벡터에 형광 태그부착시켰다. 음으로 하전된 축합 종으로서 또한 작용할 수 있는 시한-방출 성분 (예를 들어, 폴리(글루탐산))을 염기성, 중성 또는 산성 완충제에서 재구성하였다. 링커-앵커 서열에 접합된 야생형 유래 또는 야생형 돌연변이된 표적화 펩티드를 갖는 표적화 리간드를 산성 완충제에서 재구성하였다. 추가의 축합 종 또는 핵 국재화 신호 펩티드를 나노입자에 포함시키는 경우에, 이들을 또한 양이온성 종에 대해 0.03% w/v 작업 용액 및 음이온성 종에 대해 0.015% w/v로 완충제에서 재구성하였다. 양이온성 종에 대해 0.1% w/v 작업 용액 및 음이온성 종에 대해 0.1% w/v로 실험을 또한 수행하였다. 유전자 물질과 복합체화된 것을 제외한 모든 폴리펩티드를 10분 동안 초음파처리하여 가용화를 개선시켰다.

본 개시내용의 예시적인 비제한적 측면

상기 기재된 본 발명 대상의 실시양태를 포함한 측면은 단독으로 또는 1개 이상의 다른 측면 또는 실시양태와 조합으로 유익할 수 있다. 상기 기재를 제한하지 않으면서, 본 개시내용의 특정 비제한적 측면이 하기 세트 A 및 세트 B에서 제공된다. 본 개시내용을 읽을 때 관련 기술분야의 통상의 기술자에게 분명할 바와 같이, 개별적으로 넘버링된 측면 각각은 상기 또는 하기 개별적으로 넘버링된 측면 중 임의의 것과 함께 사용되거나 조합될 수 있다. 이는 이러한 측면의 모든 조합에 대한 지지를 제공하도록 의도되며, 하기에 명시적으로 제공된 측면의 조합에 제한되지는 않는다. 본 발명의 취지 또는 범주로부터 벗어나지 않으면서 다양한 변화 및 변형이 이루어질 수 있음이 관련 기술분야의 통상의 기술자에게 분명할 것이다.

세트 A

1. (a) 표적 세포의 게놈 내의 2개의 위치에서 엇갈림 말단을 갖는 이중 가닥 절단을 생성하여, 이에 의해 제1 게놈 엇갈림 말단 및 제2 게놈 엇갈림 말단을 생성하는 단계; 및

(b) 각각의 말단에 5' 또는 3' 오버행을 갖는 선형 이중 가닥 공여자 DNA를 표적 세포 내로 도입하는 단계

를 포함하며, 여기서 공여자 DNA의 한 말단은 제1 게놈 엇갈림 말단과 혼성화되고, 공여자 DNA의 다른 말단은 제2 게놈 엇갈림 말단과 혼성화되어, 이에 의해 표적 세포의 게놈 내로 선형 이중 가닥 공여자 DNA의 삽입이 유발되는 것인,

표적 세포에서의 게놈 편집 방법.

2. 항목 1에 있어서, 공여자 DNA의 적어도 하나의 말단이 5' 오버행을 갖고, 게놈 엇갈림 말단 중 적어도 하나가 5' 오버행을 갖는 것인 방법.

3. 항목 1 또는 2에 있어서, 공여자 DNA의 적어도 하나의 말단이 3' 오버행을 갖고, 게놈 엇갈림 말단 중 적어도 하나가 3' 오버행을 갖는 것인 방법.

4. 항목 1-3 중 어느 하나에 있어서, 상기 생성이 1개 이상의 서열 특이적 뉴클레아제 또는 1개 이상의 서열 특이적 뉴클레아제를 코딩하는 1개 이상의 핵산을 표적 세포 내로 도입하여 상기 이중 가닥 절단을 생성하는 것을 포함하는 것인 방법.

5. 항목 4에 있어서, 1개 이상의 서열 특이적 뉴클레아제가 메가뉴클레아제, 귀소 엔도뉴클레아제, 아연 핑거 뉴클레아제 (ZFN) 및 전사 활성화제-유사 이펙터 뉴클레아제 (TALEN) 중 적어도 1개를 포함하는 것인 방법.

6. 항목 4에 있어서, 1개 이상의 서열 특이적 뉴클레아제가 엇갈림 말단 절단 CRISPR/Cas 이펙터 단백질을 포함하는 것인 방법.

7. 항목 6에 있어서, 상기 생성이 CRISPR/Cas 가이드 핵산 또는 CRISPR/Cas 가이드 핵산을 코딩하는 핵산을 세포 내로 도입하는 것을 추가로 포함하는 것인 방법.

8. 항목 4-7 중 어느 하나에 있어서, 동일한 전달 비히클의 페이로드로서: (i) 1개 이상의 서열 특이적 뉴클레아제 또는 1개 이상의 서열 특이적 뉴클레아제를 코딩하는 1개 이상의 핵산 및 (ii) 선형 이중 가닥 공여자 DNA를 세포 내로 도입하는 것을 포함하는 방법.

9. 항목 8있어서, 1개 이상의 서열 특이적 뉴클레아제 및 선형 이중 가닥 공여자 DNA가 데옥시리보핵단백질 복합체 또는 리보-데옥시리보핵단백질 복합체로서 세포 내로 도입되는 것인 방법.

10. 항목 8 또는 9에 있어서, 상기 도입 동안, 공여자 DNA의 말단이 1개 이상의 서열 특이적 뉴클레아제에 부위-특이적 방식으로 결합되는 것인 방법.

11. 항목 8-10 중 어느 하나에 있어서, 전달 비히클이 비-바이러스인 방법.

12. 항목 8-11 중 어느 하나에 있어서, 전달 비히클이 나노입자인 방법.

13. 항목 12에 있어서, 나노입자가 (i) 및 (ii)에 추가로, 음이온성 중합체 조성물, 양이온성 중합체 조성물 및 양이온성 폴리펩티드 조성물을 포함하는 코어를 포함하는 것인 방법.

14. 항목 13에 있어서, 상기 음이온성 중합체 조성물이 폴리(글루탐산) 및 폴리(아스파르트산)으로부터 선택된 음이온성 중합체를 포함하는 것인 방법.

15. 항목 13 또는 14에 있어서, 상기 양이온성 중합체 조성물이 폴리(아르기닌), 폴리(리신), 폴리(히스티딘), 폴리(오르니틴) 및 폴리(시트룰린)으로부터 선택된 양이온성 중합체를 포함하는 것인 방법.

16. 항목 13-15 중 어느 하나에 있어서, 나노입자가 코어를 캡슐화하는 유출가능한 층을 추가로 포함하는 것인 방법.

17. 항목 16에 있어서, 유출가능한 층이 음이온성 코트 또는 양이온성 코트인 방법.

18. 항목 16 또는 17에 있어서, 유출가능한 층이 실리카, 펩토이드, 폴리시스테인, 칼슘, 산화칼슘, 히드록시아파타이트, 인산칼슘, 황산칼슘, 망가니즈, 산화망가니즈, 인산망가니즈, 황산망가니즈, 마그네슘, 산화마그네슘, 인산마그네슘, 황산마그네슘, 철, 산화철, 인산철 및 황산철 중 1개 이상을 포함하는 것인 방법.

19. 항목 16-18 중 어느 하나에 있어서, 나노입자가 유출가능한 층을 둘러싸는 표면 코트를 추가로 포함하는 것인 방법.

20. 항목 19에 있어서, 표면 코트가 유출가능한 층과 정전기적으로 상호작용하는 양이온성 또는 음이온성 앵커링 도메인을 포함하는 것인 방법.

21. 항목 19 또는 20에 있어서, 표면 코트가 1개 이상의 표적화 리간드를 포함하는 것인 방법.

22. 항목 19 또는 20에 있어서, 표면 코트가 광견병 바이러스 당단백질 (RVG) 단편, ApoE-트랜스페린, 락토페린, 멜라노페리틴, 오보트랜스페리틴, L-셀렉틴, E-셀렉틴, P-셀렉틴, 시알릴화 펩티드, 폴리시알릴화 O-연결된 펩티드, TPO, EPO, PSGL-1, ESL-1, CD44, 사멸 수용체-3 (DR3), LAMP1, LAMP2, Mac2-BP, 줄기 세포 인자 (SCF), CD70, SH2 도메인-함유 단백질 1A (SH2D1A), 엑센딘-4, GLP1, RGD, 트랜스페린 리간드, FGF 단편, 숙신산, 비스포스포네이트, 조혈 줄기 세포 화학주성 지질, 스핑고신, 세라미드, 스핑고신-1-포스페이트, 세라미드-1-포스페이트, 및 상기 중 임의의 것의 활성 표적화 단편으로 이루어진 군으로부터 선택된 1개 이상의 표적화 리간드를 포함하는 것인 방법.

23. 항목 19 또는 20에 있어서, 표면 코트가 CD3, CD28, CD90, CD45f, CD34, CD80, CD86, CD3-엡실론, CD3-감마, CD3-델타; TCR 알파, TCR 베타, TCR 감마 및/또는 TCR 델타 불변 영역; 4-1BB, OX40, OX40L, CD62L, ARP5, CCR5, CCR7, CCR10, CXCR3, CXCR4, CD94/NKG2, NKG2A, NKG2B, NKG2C, NKG2E, NKG2H, NKG2D, NKG2F, NKp44, NKp46, NKp30, DNAM, XCR1, XCL1, XCL2, ILT, LIR, Ly49, IL-2, IL-7, IL-10, IL-12, IL-15, IL-18, TNFα, IFNγ, TGF-β 및 α5β1로부터 선택된 표적에 대한 표적화된 결합을 제공하는 1개 이상의 표적화 리간드를 포함하는 것인 방법.

24. 항목 19 또는 20에 있어서, 표면 코트가 골수 세포, 조혈 줄기 세포 (HSC), 조혈 줄기 및 전구 세포 (HSPC), 말초 혈액 단핵 세포 (PBMC), 골수 전구 세포, 림프 전구 세포, T-세포, B-세포, NKT 세포, NK 세포, 수지상 세포, 단핵구, 과립구, 적혈구, 거핵구, 비만 세포, 호염기구, 호산구, 호중구, 대식세포, 적혈구 전구 세포, 거핵구-적혈구 전구 세포 (MEP), 공통 골수 전구 세포 (CMP), 다능 전구 세포 (MPP), 조혈 줄기 세포 (HSC), 단기 HSC (ST-HSC), IT-HSC, 장기 HSC (LT-HSC), 내피 세포, 뉴런, 성상세포, 췌장 세포, 췌장 β-도세포, 간 세포, 근육 세포, 골격근 세포, 심근 세포, 간 세포, 지방 세포, 장 세포, 결장 세포 및 위 세포로부터 선택된 표적 세포에 대한 표적화된 결합을 제공하는 1개 이상의 표적화 리간드를 포함하는 것인 방법.

25. 항목 8-10 중 어느 하나에 있어서, 전달 비히클이 페이로드에 접합된 표적화 리간드이고, 여기서 표적화 리간드는 세포 표면 단백질에 대한 표적화된 결합을 제공하는 것인 방법.

26. 항목 8-10 중 어느 하나에 있어서, 전달 비히클이 하전된 중합체 폴리펩티드 도메인에 접합된 표적화 리간드이고, 여기서 표적화 리간드는 세포 표면 단백질에 대한 표적화된 결합을 제공하고, 여기서 하전된 중합체 폴리펩티드 도메인은 핵산 페이로드와 축합되고/거나 단백질 페이로드와 정전기적으로 상호작용하는 것인 방법.

27. 항목 25 또는 26에 있어서, 표적화 리간드가 펩티드, ScFv, F(ab), 핵산 압타머 또는 펩토이드인 방법.

28. 항목 26에 있어서, 하전된 중합체 폴리펩티드 도메인이 3 내지 30개 아미노산 범위의 길이를 갖는 것인 방법.

29. 항목 26-28 중 어느 하나에 있어서, 전달 비히클이 페이로드 및 하전된 중합체 폴리펩티드 도메인과 상호작용하는 음이온성 중합체를 추가로 포함하는 것인 방법.

30. 항목 29에 있어서, 음이온성 중합체가 폴리(글루탐산) 및 폴리(아스파르트산)으로부터 선택되는 것인 방법.

31. 항목 25-30 중 어느 하나에 있어서, 표적화 리간드가 5-50개 아미노산의 길이를 갖는 것인 방법.

32. 항목 25-31 중 어느 하나에 있어서, 표적화 리간드가 패밀리 B G-단백질 커플링된 수용체 (GPCR), 수용체 티로신 키나제 (RTK), 세포 표면 당단백질 및 세포-세포 부착 분자로부터 선택된 세포 표면 단백질에 대한 표적화된 결합을 제공하는 것인 방법.

33. 항목 25-31 중 어느 하나에 있어서, 표적화 리간드가 광견병 바이러스 당단백질 (RVG) 단편, ApoE-트랜스페린, 락토페린, 멜라노페리틴, 오보트랜스페리틴, L-셀렉틴, E-셀렉틴, P-셀렉틴, 시알릴화 펩티드, 폴리시알릴화 O-연결된 펩티드, TPO, EPO, PSGL-1, ESL-1, CD44, 사멸 수용체-3 (DR3), LAMP1, LAMP2, Mac2-BP, 줄기 세포 인자 (SCF), CD70, SH2 도메인-함유 단백질 1A (SH2D1A), 엑센딘-4, GLP1, RGD, 트랜스페린 리간드, FGF 단편, 숙신산, 비스포스포네이트, 조혈 줄기 세포 화학주성 지질, 스핑고신, 세라미드, 스핑고신-1-포스페이트, 세라미드-1-포스페이트, 및 상기 중 임의의 것의 활성 표적화 단편으로 이루어진 군으로부터 선택되는 것인 방법.

34. 항목 25-31 중 어느 하나에 있어서, 표적화 리간드가 CD3, CD28, CD90, CD45f, CD34, CD80, CD86, CD3-엡실론, CD3-감마, CD3-델타; TCR 알파, TCR 베타, TCR 감마 및/또는 TCR 델타 불변 영역; 4-1BB, OX40, OX40L, CD62L, ARP5, CCR5, CCR7, CCR10, CXCR3, CXCR4, CD94/NKG2, NKG2A, NKG2B, NKG2C, NKG2E, NKG2H, NKG2D, NKG2F, NKp44, NKp46, NKp30, DNAM, XCR1, XCL1, XCL2, ILT, LIR, Ly49, IL-2, IL-7, IL-10, IL-12, IL-15, IL-18, TNFα, IFNγ, TGF-β 및 α5β1로부터 선택된 표적에 대한 표적화된 결합을 제공하는 것인 방법.

35. 항목 25-31 중 어느 하나에 있어서, 표적화 리간드가 골수 세포, 조혈 줄기 세포 (HSC), 장기 HSC, 단기 HSC, 조혈 줄기 및 전구 세포 (HSPC), 말초 혈액 단핵 세포 (PBMC), 골수 전구 세포, 림프 전구 세포, T-세포, B-세포, NKT 세포, NK 세포, 수지상 세포, 단핵구, 과립구, 적혈구, 거핵구, 비만 세포, 호염기구, 호산구, 호중구, 대식세포, 적혈구 전구 세포 (예를 들어, HUDEP 세포), 거핵구-적혈구 전구 세포 (MEP), 공통 골수 전구 세포 (CMP), 다능 전구 세포 (MPP), 조혈 줄기 세포 (HSC), 단기 HSC (ST-HSC), IT-HSC, 장기 HSC (LT-HSC), 내피 세포, 뉴런, 성상세포, 췌장 세포, 췌장 β-도세포, 근육 세포, 골격근 세포, 심근 세포, 간 세포, 지방 세포, 장 세포, 결장 세포 및 위 세포로 이루어진 군으로부터 선택된 세포 유형에 대한 결합을 제공하는 것인 방법.

36. 항목 1-35 중 어느 하나에 있어서, 표적 세포의 게놈 내의 상기 2개의 위치에서 이중 가닥 절단을 생성하기 전에, 2개의 위치가 1,000,000 염기 쌍 이하만큼 이격되어 있는 것인 방법.

37. 항목 1-35 중 어느 하나에 있어서, 표적 세포의 게놈 내의 상기 2개의 위치에서 이중 가닥 절단을 생성하기 전에, 2개의 위치가 100,000 염기 쌍 이하만큼 이격되어 있는 것인 방법.

38. 항목 1-35 중 어느 하나에 있어서, 공여자 DNA가 총 10 염기 쌍 (bp) 내지 100 킬로염기 쌍 (kbp)을 갖는 것인 방법.

39. 항목 1-38 중 어느 하나에 있어서, 공여자 DNA의 삽입이 T 세포 수용체 (TCR) 단백질을 코딩하는 뉴클레오티드 서열 내에서 발생하는 것인 방법.

40. 항목 39에 있어서, 공여자 DNA가 TCR 단백질의 CDR1, CDR2 또는 CDR3 영역의 아미노산을 코딩하는 것인 방법.

41. 항목 1-38 중 어느 하나에 있어서, 공여자 DNA가 키메라 항원 수용체 (CAR)를 코딩하는 뉴클레오티드 서열을 포함하고, 상기 공여자 DNA의 삽입이 CAR을 코딩하는 뉴클레오티드 서열의 내인성 T-세포 프로모터에 대한 작동가능한 연결을 유발하는 것인 방법.

42. 항목 1-38 중 어느 하나에 있어서, 공여자 DNA가, 프로모터에 작동가능하게 연결되고 키메라 항원 수용체 (CAR)를 코딩하는 뉴클레오티드 서열을 포함하는 것인 방법.

43. 항목 1-38 중 어느 하나에 있어서, 공여자 DNA가, 막 결합되고 세포외로 제시되는 세포-특이적 표적화 리간드를 코딩하는 뉴클레오티드 서열을 포함하고, 상기 공여자 DNA의 삽입이 세포-특이적 표적화 리간드를 코딩하는 뉴클레오티드 서열의 내인성 프로모터에 대한 작동가능한 연결을 유발하는 것인 방법.

44. 항목 1-38 중 어느 하나에 있어서, 공여자 DNA가, 막 결합되고 세포외로 제시되는 세포-특이적 표적화 리간드를 코딩하는 서열에 작동가능하게 연결된 프로모터를 포함하는 것인 방법.

45. 항목 1-38 중 어느 하나에 있어서,

표적 세포의 게놈 내의 4개의 위치에서 엇갈림 말단을 갖는 이중 가닥 절단을 생성하여, 이에 의해 제1 및 제2 게놈 엇갈림 말단에 추가로 제3 게놈 엇갈림 말단 및 제4 게놈 엇갈림 말단을 생성하는 단계;

각각의 말단에 5' 또는 3' 오버행을 각각 갖는 2개의 선형 이중 가닥 공여자 DNA를 도입하는 단계

를 포함하며, 여기서 한 공여자 DNA의 말단은 제1 및 제2 게놈 엇갈림 말단과 혼성화되고, 다른 공여자 DNA의 말단은 제3 및 제4 게놈 엇갈림 말단과 혼성화되고, 이에 의해 표적 세포의 게놈 내로 상기 2개의 공여자 DNA의 삽입이 유발되는 것인 방법.

46. 항목 45에 있어서, 한 공여자 DNA의 삽입이 T 세포 수용체 (TCR) 알파 또는 델타 서브유닛을 코딩하는 뉴클레오티드 서열 내에서 발생하고, 다른 공여자 DNA의 삽입이 TCR 베타 또는 감마 서브유닛을 코딩하는 뉴클레오티드 서열 내에서 발생하는 것인 방법.

47. 항목 45에 있어서, 한 공여자 DNA의 삽입이 T 세포 수용체 (TCR) 알파 또는 델타 서브유닛 불변 영역을 코딩하는 뉴클레오티드 서열 내에서 발생하고, 다른 공여자 DNA의 삽입이 TCR 베타 또는 감마 서브유닛 불변 영역을 코딩하는 뉴클레오티드 서열 내에서 발생하는 것인 방법.

48. 항목 45에 있어서, 한 공여자 DNA의 삽입이 T 세포 수용체 (TCR) 알파 또는 델타 서브유닛 프로모터로서 기능하는 뉴클레오티드 서열 내에서 발생하고, 다른 공여자 DNA의 삽입이 TCR 베타 또는 감마 서브유닛 프로모터로서 기능하는 뉴클레오티드 서열 내에서 발생하는 것인 방법.

49. 항목 1-48 중 어느 하나에 있어서, 상기 공여자 DNA의 삽입이 삽입된 공여자 DNA와 T 세포 수용체 (TCR) 알파, 베타, 감마 또는 델타 내인성 프로모터의 작동가능한 연결을 유발하는 것인 방법.

50. 항목 1-48 중 어느 하나에 있어서, 공여자 DNA가 TCR 알파, 베타, 감마 또는 델타 프로모터에 작동가능하게 연결된 단백질-코딩 뉴클레오티드 서열을 포함하는 것인 방법.

51. 항목 1-48 중 어느 하나에 있어서, 상기 공여자 DNA의 삽입이 삽입된 공여자 DNA와 CD3 또는 CD28 프로모터의 작동가능한 연결을 유발하는 것인 방법.

52. 항목 1-48 중 어느 하나에 있어서, 공여자 DNA가 T-세포 특이적 프로모터에 작동가능하게 연결된 단백질-코딩 뉴클레오티드 서열을 포함하는 것인 방법.

53. 항목 1-48 중 어느 하나에 있어서, 공여자 DNA가 프로모터에 작동가능하게 연결된 단백질-코딩 뉴클레오티드 서열을 포함하는 것인 방법.

54. 항목 1-48 중 어느 하나에 있어서, 상기 공여자 DNA의 삽입이 삽입된 공여자 DNA와 줄기 세포 특이적 또는 체세포 특이적 내인성 프로모터의 작동가능한 연결을 유발하는 것인 방법.

55. 항목 1-54 중 어느 하나에 있어서, 공여자 DNA가 리포터 단백질 (예를 들어, 예컨대 유전자 편집 효율을 평가하기 위한 근적외선 및/또는 원적외선 리포터 단백질)을 코딩하는 뉴클레오티드 서열을 포함하는 것인 방법.

56. 항목 55에 있어서, 상기 공여자 DNA의 삽입이 삽입된 공여자 DNA와 내인성 프로모터의 작동가능한 연결을 유발하는 것인 방법.

57. 항목 55에 있어서, 공여자 DNA가 리포터 단백질을 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 프로모터를 포함하는 것인 방법.

58. 항목 1-57 중 어느 하나에 있어서, 공여자 DNA가 인트론을 갖지 않는 단백질-코딩 뉴클레오티드 서열을 포함하는 것인 방법.

59. 항목 58에 있어서, 인트론을 갖지 않는 뉴클레오티드 서열이 TCR 단백질의 전부 또는 일부를 코딩하는 것인 방법.

60. 항목 1-59 중 어느 하나에 있어서, 공여자 DNA가 적어도 1개의 아데닐화된 3' 말단을 갖는 것인 방법.

61. 항목 1-60 중 어느 하나에 있어서, 표적 세포가 포유동물 세포인 방법.

62. 항목 1-61 중 어느 하나에 있어서, 표적 세포가 인간 세포인 방법.

63. (a) 각각의 말단에 5' 또는 3' 오버행을 갖는 선형 이중 가닥 공여자 DNA; 및

(b) 서열 특이적 뉴클레아제 또는 서열 특이적 뉴클레아제를 코딩하는 핵산

을 포함하며, 여기서 (a) 및 (b)는 동일한 전달 비히클의 일부로서의 페이로드인 키트 또는 조성물.

64. 항목 63에 있어서, 전달 비히클이 나노입자인 키트 또는 조성물.

65. 항목 64에 있어서, 나노입자가 (a), (b), 음이온성 중합체 조성물, 양이온성 중합체 조성물 및 양이온성 폴리펩티드 조성물을 포함하는 코어를 포함하는 것인 키트 또는 조성물.

66. 항목 64 또는 65에 있어서, 나노입자가 나노입자를 세포 표면 단백질로 표적화하는 표적화 리간드를 포함하는 것인 키트 또는 조성물.

67. 항목 63-66 중 어느 하나에 있어서, 선형 이중 가닥 공여자 및 서열 특이적 뉴클레아제가 서로 결합되어 데옥시리보핵단백질 또는 리보-데옥시리보핵단백질 복합체를 형성하는 것인 키트 또는 조성물.

68. 항목 63-67 중 어느 하나에 있어서, 전달 비히클이 하전된 중합체 폴리펩티드 도메인에 접합된 표적화 리간드이고, 여기서 표적화 리간드는 세포 표면 단백질에 대한 표적화된 결합을 제공하고, 여기서 하전된 중합체 폴리펩티드 도메인은 페이로드와 정전기적으로 상호작용하는 것인 키트 또는 조성물.

69. 항목 68에 있어서, 전달 비히클이 페이로드 및 하전된 중합체 폴리펩티드 도메인과 상호작용하는 음이온성 중합체를 추가로 포함하는 것인 키트 또는 조성물.

70. 항목 63-67 중 어느 하나에 있어서, 전달 비히클이 (a) 및/또는 (b)에 접합된 표적화 리간드이고, 여기서 표적화 리간드는 세포 표면 단백질에 대한 표적화된 결합을 제공하는 것인 키트 또는 조성물.

71. 항목 63-67 중 어느 하나에 있어서, 전달 비히클이 물-오일-물 에멀젼 입자 상에, 오일-물 에멀젼 미셀 입자 상에, 다층상 물-오일-물 에멀젼 입자 상에, 다층 입자 상에 또는 DNA 오리가미 나노봇 상에 코팅된 표적화 리간드를 포함하는 것인 키트 또는 조성물.

72. 항목 66-71 중 어느 하나에 있어서, 표적화 리간드가 펩티드, ScFv, F(ab), 핵산 압타머 또는 펩토이드인 방법.

73. 항목 63-67 중 어느 하나에 있어서, 전달 비히클이 비-바이러스인 키트 또는 조성물.

세트 B

표적 세포에서의 게놈 편집 방법.

22. 항목 19 또는 20에 있어서, 표면 코트가 광견병 바이러스 당단백질 (RVG) 단편, ApoE-트랜스페린, 락토페린, 멜라노페리틴, 오보트랜스페리틴, L-셀렉틴, E-셀렉틴, P-셀렉틴, 시알릴화 펩티드, 폴리시알릴화 O-연결된 펩티드, TPO, EPO, PSGL-1, ESL-1, CD44, 사멸 수용체-3 (DR3), LAMP1, LAMP2, Mac2-BP, 줄기 세포 인자 (SCF), CD70, SH2 도메인-함유 단백질 1A (SH2D1A), 엑센딘, 엑센딘-S11C, GLP1, RGD, 트랜스페린 리간드, FGF 단편, α5β1 리간드, IL2, Cde3-엡실론, 펩티드-HLA-A*2402, CD80, CD86, 숙신산, 비스포스포네이트, 조혈 줄기 세포 화학주성 지질, 스핑고신, 세라미드, 스핑고신-1-포스페이트, 세라미드-1-포스페이트, 및 상기 중 임의의 것의 활성 표적화 단편으로 이루어진 군으로부터 선택된 1개 이상의 표적화 리간드를 포함하는 것인 방법.

23. 항목 19 또는 20에 있어서, 표면 코트가 CD3, CD8, CD4, CD28, CD90, CD45f, CD34, CD80, CD86, CD3-엡실론, CD3-감마, CD3-델타; TCR 알파, TCR 베타, TCR 감마 및/또는 TCR 델타 불변 영역; 4-1BB, OX40, OX40L, CD62L, ARP5, CCR5, CCR7, CCR10, CXCR3, CXCR4, CD94/NKG2, NKG2A, NKG2B, NKG2C, NKG2E, NKG2H, NKG2D, NKG2F, NKp44, NKp46, NKp30, DNAM, XCR1, XCL1, XCL2, ILT, LIR, Ly49, IL2R, IL7R, IL10R, IL12R, IL15R, IL18R, TNFα, IFNγ, TGF-β 및 α5β1로부터 선택된 표적에 대한 표적화된 결합을 제공하는 1개 이상의 표적화 리간드를 포함하는 것인 방법.

33. 항목 25-31 중 어느 하나에 있어서, 표적화 리간드가 광견병 바이러스 당단백질 (RVG) 단편, ApoE-트랜스페린, 락토페린, 멜라노페리틴, 오트랜스페리틴, L-셀렉틴, E-셀렉틴, P-셀렉틴, 시알릴화 펩티드, 폴리시알릴화 O-연결된 펩티드, TPO, EPO, PSGL-1, ESL-1, CD44, 사멸 수용체-3 (DR3), LAMP1, LAMP2, Mac2-BP, 줄기 세포 인자 (SCF), CD70, SH2 도메인-함유 단백질 1A (SH2D1A), 엑센딘, 엑센딘-S11C, GLP1, RGD, 트랜스페린 리간드, FGF 단편, α5β1 리간드, IL2, Cde3-엡실론, 펩티드-HLA-A*2402, CD80, CD86, 숙신산, 비스포스포네이트, 조혈 줄기 세포 화학주성 지질, 스핑고신, 세라미드, 스핑고신-1-포스페이트, 세라미드-1-포스페이트, 및 상기 중 임의의 것의 활성 표적화 단편으로 이루어진 군으로부터 선택되는 것인 방법.

34. 항목 25-31 중 어느 하나에 있어서, 표적화 리간드가 CD3, CD8, CD4, CD28, CD90, CD45f, CD34, CD80, CD86, CD3-엡실론, CD3-감마, CD3-델타; TCR 알파, TCR 베타, TCR 감마 및/또는 TCR 델타 불변 영역; 4-1BB, OX40, OX40L, CD62L, ARP5, CCR5, CCR7, CCR10, CXCR3, CXCR4, CD94/NKG2, NKG2A, NKG2B, NKG2C, NKG2E, NKG2H, NKG2D, NKG2F, NKp44, NKp46, NKp30, DNAM, XCR1, XCL1, XCL2, ILT, LIR, Ly49, IL2R, IL7R, IL10R, IL12R, IL15R, IL18R, TNFα, IFNγ, TGF-β 및 α5β1로부터 선택된 표적에 대한 표적화된 결합을 제공하는 것인 방법.

38. 항목 1-35 중 어느 하나에 있어서, 제1 및 제2 게놈 엇갈림 말단이 TCR 알파 유전자좌 또는 TCR 베타 유전자좌에서 생성되는 것인 방법.

39. 항목 1-35 중 어느 하나에 있어서, 제1 및 제2 게놈 엇갈림 말단 중 적어도 1개가 (1) 도 59에 도시된 CRISPR/Cas 가이드 RNA (gRNA) 서열 중 1개 이상을 사용하고/거나 (2) 도 59에 도시된 TALEN 서열 중 1개 이상을 표적화함으로써 생성되는 것인 방법.

40. 항목 1-35 중 어느 하나에 있어서, 공여자 DNA가 총 10 염기 쌍 (bp) 내지 100 킬로염기 쌍 (kbp)을 갖는 것인 방법.

41. 항목 1-40 중 어느 하나에 있어서, 공여자 DNA의 삽입이 T 세포 수용체 (TCR) 단백질을 코딩하는 뉴클레오티드 서열 내에서 발생하는 것인 방법.

42. 항목 41에 있어서, 공여자 DNA가 TCR 단백질의 CDR1, CDR2 또는 CDR3 영역의 아미노산을 코딩하는 것인 방법.

43. 항목 1-40 중 어느 하나에 있어서, 공여자 DNA가 키메라 항원 수용체 (CAR)를 코딩하는 뉴클레오티드 서열을 포함하고, 상기 공여자 DNA의 삽입이 CAR을 코딩하는 뉴클레오티드 서열의 내인성 T-세포 프로모터에 대한 작동가능한 연결을 유발하는 것인 방법.

44. 항목 1-40 중 어느 하나에 있어서, 공여자 DNA가, 프로모터에 작동가능하게 연결되고 키메라 항원 수용체 (CAR)를 코딩하는 뉴클레오티드 서열을 포함하는 것인 방법.

45. 항목 1-40 중 어느 하나에 있어서, 공여자 DNA가, 막 결합되고 세포외로 제시되는 세포-특이적 표적화 리간드를 코딩하는 뉴클레오티드 서열을 포함하고, 상기 공여자 DNA의 삽입이 세포-특이적 표적화 리간드를 코딩하는 뉴클레오티드 서열의 내인성 프로모터에 대한 작동가능한 연결을 유발하는 것인 방법.

46. 항목 1-40 중 어느 하나에 있어서, 공여자 DNA가, 막 결합되고 세포외로 제시되는 세포-특이적 표적화 리간드를 코딩하는 서열에 작동가능하게 연결된 프로모터를 포함하는 것인 방법.

47. 항목 1-40 중 어느 하나에 있어서,

48. 항목 47에 있어서,

(1) 한 공여자 DNA의 삽입이 T 세포 수용체 (TCR) 알파 또는 델타 서브유닛을 코딩하는 뉴클레오티드 서열 내에서 발생하고, 다른 공여자 DNA의 삽입이 TCR 베타 또는 감마 서브유닛을 코딩하는 뉴클레오티드 서열 내에서 발생하거나; 또는

(2) 한 공여자 DNA의 삽입이 T 세포 수용체 (TCR) 알파 또는 감마 서브유닛을 코딩하는 뉴클레오티드 서열 내에서 발생하고, 다른 공여자 DNA의 삽입이 TCR 베타 또는 델타 서브유닛을 코딩하는 뉴클레오티드 서열 내에서 발생하거나; 또는

(3) 한 공여자 DNA의 삽입이 IgA, IgD, IgE, IgG 또는 IgM 단백질의 κ 쇄를 코딩하는 뉴클레오티드 서열 내에서 발생하고, 다른 공여자 DNA의 삽입이 IgA, IgD, IgE, IgG 또는 IgM 단백질의 λ 쇄를 코딩하는 뉴클레오티드 서열 내에서 발생하는 것인 방법.

49. 항목 47에 있어서, 한 공여자 DNA의 삽입이 T 세포 수용체 (TCR) 알파 또는 델타 서브유닛 불변 영역을 코딩하는 뉴클레오티드 서열 내에서 발생하고, 다른 공여자 DNA의 삽입이 TCR 베타 또는 감마 서브유닛 불변 영역을 코딩하는 뉴클레오티드 서열 내에서 발생하는 것인 방법.

50. 항목 47에 있어서,

(1) 한 공여자 DNA의 삽입이 T 세포 수용체 (TCR) 알파 또는 델타 서브유닛 프로모터로서 기능하는 뉴클레오티드 서열 내에서 발생하고, 다른 공여자 DNA의 삽입이 TCR 베타 또는 감마 서브유닛 프로모터로서 기능하는 뉴클레오티드 서열 내에서 발생하거나; 또는

(2) 한 공여자 DNA의 삽입이 T 세포 수용체 (TCR) 알파 또는 감마 서브유닛 프로모터로서 기능하는 뉴클레오티드 서열 내에서 발생하고, 다른 공여자 DNA의 삽입이 TCR 베타 또는 델타 서브유닛 프로모터로서 기능하는 뉴클레오티드 서열 내에서 발생하거나; 또는

(3) 한 공여자 DNA의 삽입이 IgA, IgD, IgE, IgG 또는 IgM 단백질의 κ 쇄에 대한 프로모터로서 기능하는 뉴클레오티드 서열 내에서 발생하고, 다른 공여자 DNA의 삽입이 IgA, IgD, IgE, IgG 또는 IgM 단백질의 λ 쇄에 대한 프로모터로서 기능하는 뉴클레오티드 서열 내에서 발생하는 것인 방법.

51. 항목 1-50 중 어느 하나에 있어서, 상기 공여자 DNA의 삽입이 삽입된 공여자 DNA와 T 세포 수용체 (TCR) 알파, 베타, 감마 또는 델타 내인성 프로모터의 작동가능한 연결을 유발하는 것인 방법.

52. 항목 1-50 중 어느 하나에 있어서, 공여자 DNA가 TCR 알파, 베타, 감마 또는 델타 프로모터에 작동가능하게 연결된 단백질-코딩 뉴클레오티드 서열을 포함하는 것인 방법.

53. 항목 1-50 중 어느 하나에 있어서, 상기 공여자 DNA의 삽입이 삽입된 공여자 DNA와 (i) T-세포 특이적 프로모터; (ii) CD3 프로모터; (iii) CD28 프로모터; (iv) 줄기 세포 특이적 프로모터; (v) 체세포 특이적 프로모터; (vi) T 세포 수용체 (TCR) 알파, 베타, 감마 또는 델타 프로모터; (v) B-세포 특이적 프로모터; (vi) CD19 프로모터; (vii) CD20 프로모터; (viii) CD22 프로모터; (ix) B29 프로모터; 및 (x) T-세포 또는 B-세포 V(D)J-특이적 프로모터로 이루어진 군으로부터 선택된 프로모터의 작동가능한 연결을 유발하는 것인 방법.

54. 항목 1-50 중 어느 하나에 있어서, 공여자 DNA가 T-세포 특이적 프로모터에 작동가능하게 연결된 단백질-코딩 뉴클레오티드 서열을 포함하는 것인 방법.

55. 항목 1-50 중 어느 하나에 있어서, 공여자 DNA가 프로모터에 작동가능하게 연결된 단백질-코딩 뉴클레오티드 서열을 포함하는 것인 방법.

56. 항목 1-50 중 어느 하나에 있어서, 상기 공여자 DNA의 삽입이 삽입된 공여자 DNA와 줄기 세포 특이적 또는 체세포 특이적 내인성 프로모터의 작동가능한 연결을 유발하는 것인 방법.

57. 항목 1-56 중 어느 하나에 있어서, 공여자 DNA가 리포터 단백질 (예를 들어, 예컨대 유전자 편집 효율을 평가하기 위한 근적외선 및/또는 원적외선 리포터 단백질)을 코딩하는 뉴클레오티드 서열을 포함하는 것인 방법.

58. 항목 57에 있어서, 상기 공여자 DNA의 삽입이 삽입된 공여자 DNA와 내인성 프로모터의 작동가능한 연결을 유발하는 것인 방법.

59. 항목 57에 있어서, 공여자 DNA가 리포터 단백질을 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 프로모터를 포함하는 것인 방법.

60. 항목 1-59 중 어느 하나에 있어서, 공여자 DNA가 (i) T 세포 수용체 (TCR) 단백질; (ii) IgA, IgD, IgE, IgG 또는 IgM 단백질; 또는 (iii) IgA, IgD, IgE, IgG 또는 IgM 단백질의 κ 또는 λ 쇄를 코딩하는 뉴클레오티드 서열을 포함하는 것인 방법.

61. 항목 1-60 중 어느 하나에 있어서, 공여자 DNA가 인트론을 갖지 않는 단백질-코딩 뉴클레오티드 서열을 포함하는 것인 방법.

62. 항목 61에 있어서, 인트론을 갖지 않는 뉴클레오티드 서열이 TCR 단백질 또는 이뮤노글로불린의 전부 또는 일부를 코딩하는 것인 방법.

63. 항목 1-62 중 어느 하나에 있어서, 공여자 DNA가 적어도 1개의 아데닐화된 3' 말단을 갖는 것인 방법.

64. 항목 1-63 중 어느 하나에 있어서, 표적 세포가 포유동물 세포인 방법.

65. 항목 1-64 중 어느 하나에 있어서, 표적 세포가 인간 세포인 방법.

66. (a) 각각의 말단에 5' 또는 3' 오버행을 갖는 선형 이중 가닥 공여자 DNA; 및

67. 항목 66에 있어서, 전달 비히클이 나노입자인 키트 또는 조성물.

68. 항목 67에 있어서, 나노입자가 (a), (b), 음이온성 중합체 조성물, 양이온성 중합체 조성물 및 양이온성 폴리펩티드 조성물을 포함하는 코어를 포함하는 것인 키트 또는 조성물.

69. 항목 67 또는 68에 있어서, 나노입자가 나노입자를 세포 표면 단백질로 표적화하는 표적화 리간드를 포함하는 것인 키트 또는 조성물.

70. 항목 66-69 중 어느 하나에 있어서, 선형 이중 가닥 공여자 및 서열 특이적 뉴클레아제가 서로 결합되어 데옥시리보핵단백질 또는 리보-데옥시리보핵단백질 복합체를 형성하는 것인 키트 또는 조성물.

71. 항목 66-70 중 어느 하나에 있어서, 전달 비히클이 하전된 중합체 폴리펩티드 도메인에 접합된 표적화 리간드이고, 여기서 표적화 리간드는 세포 표면 단백질에 대한 표적화된 결합을 제공하고, 여기서 하전된 중합체 폴리펩티드 도메인은 페이로드와 정전기적으로 상호작용하는 것인 키트 또는 조성물.

72. 항목 71에 있어서, 전달 비히클이 페이로드 및 하전된 중합체 폴리펩티드 도메인과 상호작용하는 음이온성 중합체를 추가로 포함하는 것인 키트 또는 조성물.

73. 항목 66-70 중 어느 하나에 있어서, 전달 비히클이 (a) 및/또는 (b)에 접합된 표적화 리간드이고, 여기서 표적화 리간드는 세포 표면 단백질에 대한 표적화된 결합을 제공하는 것인 키트 또는 조성물.

74. 항목 69-73 중 어느 하나에 있어서, 세포 표면 단백질이 CD47인 키트 또는 조성물.

75. 항목 74에 있어서, 표적화 리간드가 SIRPα 단백질 모방체인 키트 또는 조성물.

76. 항목 69-75 중 어느 하나에 있어서, 전달 비히클이 세포내이입-촉발 리간드를 추가로 포함하는 것인 키트 또는 조성물.

77. 항목 66-70 중 어느 하나에 있어서, 전달 비히클이 물-오일-물 에멀젼 입자 상에, 오일-물 에멀젼 미셀 입자 상에, 다층상 물-오일-물 에멀젼 입자 상에, 다층 입자 상에 또는 DNA 오리가미 나노봇 상에 코팅된 표적화 리간드를 포함하는 것인 키트 또는 조성물.

78. 항목 69-74 중 어느 하나에 있어서, 표적화 리간드가 펩티드, ScFv, F(ab), 핵산 압타머 또는 펩토이드인 방법.

79. 항목 66-70 중 어느 하나에 있어서, 전달 비히클이 비-바이러스인 키트 또는 조성물.

실험

하기의 실시예는 본 발명의 제조 및 사용 방법의 완전한 개시 및 기재를 관련 기술분야의 통상의 기술자에게 제공하도록 제시되며, 본 발명의 범주를 제한하는 것으로 의도되지도 않고 하기 실험이 수행된 모든 실험 또는 유일한 실험임을 나타내는 것으로 의도되지도 않는다. 사용된 수치 (예를 들어, 양, 온도 등)와 관련하여 정확성을 보장하기 위해 노력이 이루어졌으나, 일부 실험 오차 및 편차가 고려되어야 한다. 달리 나타내지 않는 한, 부는 중량부이고, 분자량은 중량 평균 분자량이고, 온도는 섭씨 온도이고, 압력은 대기압 또는 대기압 근처 압력이다.

본 명세서에서 인용된 모든 공개물 및 특허 출원은 각각의 개별 공개물 또는 특허 출원이 참조로 포함되는 것으로 구체적으로 및 개별적으로 나타내어진 것처럼 본원에 참조로 포함된다.

본 발명은 발명의 실시에 바람직한 모드를 포함하도록 밝혀진 또는 제안된 특정한 실시양태에 관하여 기재되었다. 관련 기술분야의 통상의 기술자는 본 개시내용에 비추어 본 발명의 의도된 범주를 벗어나지 않으면서 예시된 특정한 실시양태에 수많은 변형 및 변화가 이루어질 수 있음을 이해할 것이다. 예를 들어, 코돈 중복성으로 인해, 단백질 서열에 영향을 미치지 않으면서 기저 DNA 서열에 변화가 이루어질 수 있다. 더욱이, 생물학적 기능 동등성 고려사항 때문에, 생물학적 작용의 종류 또는 양에 영향을 미치지 않으면서 단백질 구조에 변화가 이루어질 수 있다. 모든 이러한 변형은 첨부된 청구범위의 범주 내에 포함되는 것으로 의도된다.

실시예 1 (도 10-29)

실시예 2 (도 30-34)

실시예 3 (도 35-55)

본 발명자들은 유동 세포측정법 및 고함량 스크리닝에 의해 세포 흡수 및 표현형을 특징화하여, 다양한 세포 하위집단에 걸친 전달 효율 및 유전자 편집을 정량화한다.

이들 실험에서, 비자극 인간 1차 범-T 세포 (CD4+ 및 CD8+ T-세포의 혼합물) 및 말초 혈액 단핵 세포 (PBMC)를 급속 형질감염시키고 (나노입자와 함께 30분 인큐베이션), 10ug/ml 헤파란 술페이트를 함유하는 PBS로 2회 세척하고, 24시간 후에 아튠 NxT 유동 세포측정기 상에서 분석하였다. 세포를 CD4 및 CD8에 특이적인 항체로 염색하고, 각각의 하위집단에서 EGFP-태그부착된 Cas9의 형질도입을 정량화하였다.

실시예 4 (도 56-57)

다중모드 데이터세트

세포 흡수 및 표현형을 유동 세포측정법 및 고함량 스크리닝에 의해 특징화하여, 다양한 세포 하위집단에 걸친 전달 효율 및 유전자 편집을 정량화하였다.

이들 실험에서, 비자극 인간 1차 범-T 세포 (CD4+ 및 CD8+ T 세포의 혼합물) 및 말초 혈액 단핵 세포 (PBMC)를 급속 형질감염시키고 (나노입자와 함께 30분 인큐베이션), 10ug/ml 헤파란 술페이트를 함유하는 PBS로 2회 세척하고, 24시간 후에 아튠 NxT 유동 세포측정기 상에서 분석하였다. 세포를 CD4 및 CD8에 특이적인 항체로 염색하고, 각각의 하위집단에서 EGFP-태그부착된 Cas9의 형질도입을 정량화하였다. 하기 표는 형질감염 1시간 후에 40x 대물렌즈가 구비된 바이오텍 시테이션 5 영상화 판독기를 이용하여 수행된 영상화 대 24시간에 수집된 유동 세포측정법 데이터의 비교를 제시한다. 어떠한 특정한 이론에 얽매이는 것을 의도하지는 않지만, ≥24시간 시점은 세포 내재화를 결정하는 반면 초기 시점은 세포 친화도를 결정하는 것으로 여겨진다. 영상으로부터 1시간 시점에서의 세포 친화도를 결정하기 위해 비감독 학습을 이용하였으며, 유동 세포측정법을 통해 평가된 24시간 시점에서의 세포 흡수와 영상화 데이터를 비교하였다.

실시예 5 (도 60-66)

20M 범-T 세포 (아이큐 바이오사이언시스(IQ Biosciences))를 20mL 배지 함유 플라스크 내에서 해동시켰다. 다음 날, CD3/CD28 비드 (10M 비드)를 비자극 세포에 도입하였다. 해동 및 재현탁 2일 후, 세포를 펠릿화하고, 배지를 교체하였다. 해동 및 재현탁 3일 후, 비드를 제거하였다.

뉴클레오펙션을 위해, 160pmol sgRNA 및 126pmol Cpf1 (A.s. 또는 L.b.)을 하기 실시예에서와 같이 이용하였다:

동결보존된 인간 1차 T 세포를 해동시키고, CD3/CD28 비드와 함께 배양한 다음 날 2일 동안 자극하였다. 세포의 1.27%는 TRBC1/C2 유전자좌의 이중-절단 Cpf1-매개 편집 및 후속하여 GFP를 코딩하는 엇갈림 말단을 갖는 공여자 DNA 주형을 통한 삽입 후에 GFP+였다. 비드 제거 다음 날, 론자 아막사 4D 시스템, P3 1차 세포 키트에 의해 세포를 전기천공하였다. 64pmol A.s. Cpf1 (IDT, 카탈로그 1081068) 및 128 pmol sgRNA (IDT)를 실온에서 10-20분 동안 인큐베이션하여 RNP를 형성하고, 이어서 이를 4μg의 dsDNA 삽입물 또는 IDT의 Cpf1 전기천공 증진제 (카탈로그 #1076301)에 첨가하고, 10분 동안 인큐베이션하였다. 20μL 중 1x10e6개의 자극된 T 세포를 첨가한 다음, 큐벳에 옮기고, 이어서 펄스 EH-115 (B, RNP 단독) 또는 EO-115 (C, RNP+DNA)로 전기천공하였다 (도 62). 뉴클레오펙션 후 제7일에, TCRa/b 및 GFP 발현을 유동 세포측정법에 의해 검정하였다. 도면은 생존 집단 내의 세포 (아넥신 및 시톡스 음성)를 보여준다. 퀵익스트랙트 (루시젠)를 사용하여 세포로부터 DNA를 수집하였다.

TRBC1 / TRBC2 유전자좌 둘 다를 절단하여 4bp 오버행을 갖는 이중 가닥 파괴를 형성하는 이중-절단 Cpf1 연구에서 다양한 프라이머 (TRBC1-TRBC2, GFP-GFP 및 GFP-TRBC2)의 비교시 희미한 밴드가 발생하였다. 오버행을 GFP 삽입 서열 또는 플래그 삽입 서열에 매칭시키고, 유동 세포측정법 및 PCR (GFP 대 Cpf1 RNP 단독) 또는 생어 서열분석 (플래그 대 Cpf1 RNP 단독)을 통해 조사하였다.

표는 TRAC, TRB1 C1/C2 및 TRB 프로모터 영역에 사용된 sgRNA 서열을 도시한다.

SEQUENCE LISTING <110> Ligandal, Inc. Watson, Andre R Foster, Christian Lin, Shuailiang Peyrot, Sara M <120> Methods and Compositions for Genome Editing <130> LGDL-006WO <140> PCT/US2019/028004 <141> 2019-04-17 <150> US 62/736,400 <151> 2018-09-25 <150> US 62/685,243 <151> 2018-06-14 <150> US 62/659,627 <151> 2018-04-18 <160> 335 <170> PatentIn version 3.5 <210> 1 <211> 39 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 1 His Gly Glu Gly Thr Phe Thr Ser Asp Leu Ser Lys Gln Met Glu Glu 1 5 10 15 Glu Ala Val Arg Leu Phe Ile Glu Trp Leu Lys Asn Gly Gly Pro Ser 20 25 30 Ser Gly Ala Pro Pro Pro Ser 35 <210> 2 <211> 39 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 2 His Gly Glu Gly Thr Phe Thr Ser Asp Leu Cys Lys Gln Met Glu Glu 1 5 10 15 Glu Ala Val Arg Leu Phe Ile Glu Trp Leu Lys Asn Gly Gly Pro Ser 20 25 30 Ser Gly Ala Pro Pro Pro Ser 35 <210> 3 <211> 86 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 3 Lys Arg Leu Tyr Cys Lys Asn Gly Gly Phe Phe Leu Arg Ile His Pro 1 5 10 15 Asp Gly Arg Val Asp Gly Val Arg Glu Lys Ser Asp Pro His Ile Lys 20 25 30 Leu Gln Leu Gln Ala Glu Glu Arg Gly Val Val Ser Ile Lys Gly Val 35 40 45 Cys Ala Asn Arg Tyr Leu Ala Met Lys Glu Asp Gly Arg Leu Leu Ala 50 55 60 Ser Lys Cys Val Thr Asp Glu Cys Phe Phe Phe Glu Arg Leu Glu Ser 65 70 75 80 Asn Asn Tyr Asn Thr Tyr 85 <210> 4 <211> 22 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 4 Lys Asn Gly Gly Phe Phe Leu Arg Ile His Pro Asp Gly Arg Val Asp 1 5 10 15 Gly Val Arg Glu Lys Ser 20 <210> 5 <211> 6 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 5 His Phe Lys Asp Pro Lys 1 5 <210> 6 <211> 8 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 6 Leu Glu Ser Asn Asn Tyr Asn Thr 1 5 <210> 7 <211> 21 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 7 Met Ile Ala Ser Gln Phe Leu Ser Ala Leu Thr Leu Val Leu Leu Ile 1 5 10 15 Lys Glu Ser Gly Ala 20 <210> 8 <211> 38 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 8 Met Val Phe Pro Trp Arg Cys Glu Gly Thr Tyr Trp Gly Ser Arg Asn 1 5 10 15 Ile Leu Lys Leu Trp Val Trp Thr Leu Leu Cys Cys Asp Phe Leu Ile 20 25 30 His His Gly Thr His Cys 35 <210> 9 <211> 38 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 9 Met Ile Phe Pro Trp Lys Cys Gln Ser Thr Gln Arg Asp Leu Trp Asn 1 5 10 15 Ile Phe Lys Leu Trp Gly Trp Thr Met Leu Cys Cys Asp Phe Leu Ala 20 25 30 His His Gly Thr Asp Cys 35 <210> 10 <211> 28 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 10 Met Ile Phe Pro Trp Lys Cys Gln Ser Thr Gln Arg Asp Leu Trp Asn 1 5 10 15 Ile Phe Lys Leu Trp Gly Trp Thr Met Leu Cys Cys 20 25 <210> 11 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 11 Thr His Arg Pro Pro Met Trp Ser Pro Val Trp Pro 1 5 10 <210> 12 <211> 7 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 12 Arg Arg Glu Thr Ala Trp Ala 1 5 <210> 13 <211> 86 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 13 Lys Arg Leu Tyr Cys Lys Asn Gly Gly Phe Phe Leu Arg Ile His Pro 1 5 10 15 Asp Gly Arg Val Asp Gly Val Arg Glu Lys Ser Asp Pro His Ile Lys 20 25 30 Leu Gln Leu Gln Ala Glu Glu Arg Gly Val Val Ser Ile Lys Gly Val 35 40 45 Cys Ala Asn Arg Tyr Leu Ala Met Lys Glu Asp Gly Arg Leu Leu Ala 50 55 60 Ser Lys Cys Val Thr Asp Glu Cys Phe Phe Phe Glu Arg Leu Glu Ser 65 70 75 80 Asn Asn Tyr Asn Thr Tyr 85 <210> 14 <211> 44 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 14 taatttctac tcttgtagat ggtgtgggag atctctgctt ctga 44 <210> 15 <211> 9 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 15 Arg Arg Arg Arg Arg Arg Arg Arg Arg 1 5 <210> 16 <211> 6 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 16 His His His His His His 1 5 <210> 17 <211> 9 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 17 Gly Ala Pro Gly Ala Pro Gly Ala Pro 1 5 <210> 18 <211> 10 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 18 Gly Ala Pro Gly Ala Pro Gly Ala Pro Cys 1 5 10 <210> 19 <211> 10 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 19 Cys Gly Ala Pro Gly Ala Pro Gly Ala Pro 1 5 10 <210> 20 <211> 5 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (5)..(5) <223> The amiino acid at positoin 5 may be repeated n times, where n is an integer of at least one <400> 20 Gly Ser Gly Gly Ser 1 5 <210> 21 <211> 6 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (6)..(6) <223> The amiino acid at positoin 6 may be repeated n times, where n is an integer of at least one <400> 21 Gly Gly Ser Gly Gly Ser 1 5 <210> 22 <211> 4 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (4)..(4) <223> The amiino acid at positoin 4 may be repeated n times, where n is an integer of at least one <400> 22 Gly Gly Gly Ser 1 <210> 23 <211> 4 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 23 Gly Gly Ser Gly 1 <210> 24 <211> 5 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 24 Gly Gly Ser Gly Gly 1 5 <210> 25 <211> 5 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 25 Gly Ser Gly Ser Gly 1 5 <210> 26 <211> 5 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 26 Gly Ser Gly Gly Gly 1 5 <210> 27 <211> 5 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 27 Gly Gly Gly Ser Gly 1 5 <210> 28 <211> 5 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 28 Gly Ser Ser Ser Gly 1 5 <210> 29 <211> 11 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 29 Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly 1 5 10 <210> 30 <211> 11 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 30 Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 1 5 10 <210> 31 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 31 Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly Cys 1 5 10 <210> 32 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 32 Cys Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly 1 5 10 <210> 33 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 33 Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Cys 1 5 10 <210> 34 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 34 Cys Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 1 5 10 <210> 35 <211> 4 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 35 Lys Ala Leu Ala 1 <210> 36 <211> 4 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 36 Gly Ala Leu Ala 1 <210> 37 <211> 5 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 37 Cys Lys Ala Leu Ala 1 5 <210> 38 <211> 5 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 38 Lys Ala Leu Ala Cys 1 5 <210> 39 <211> 5 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 39 Cys Gly Ala Leu Ala 1 5 <210> 40 <211> 5 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 40 Gly Ala Leu Ala Cys 1 5 <210> 41 <211> 19 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 41 Arg Arg Arg Arg Arg Arg Arg Arg Arg Gly Ala Pro Gly Ala Pro Gly 1 5 10 15 Ala Pro Cys <210> 42 <211> 19 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 42 Cys Gly Ala Pro Gly Ala Pro Gly Ala Pro Arg Arg Arg Arg Arg Arg 1 5 10 15 Arg Arg Arg <210> 43 <211> 23 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 43 Cys Lys Asn Gly Gly Phe Phe Leu Arg Ile His Pro Asp Gly Arg Val 1 5 10 15 Asp Gly Val Arg Glu Lys Ser 20 <210> 44 <211> 23 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 44 Lys Asn Gly Gly Phe Phe Leu Arg Ile His Pro Asp Gly Arg Val Asp 1 5 10 15 Gly Val Arg Glu Lys Ser Cys 20 <210> 45 <211> 25 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 45 Arg Arg Arg Arg Arg Arg Arg Arg Arg Gly Ala Pro Gly Ala Pro Gly 1 5 10 15 Ala Pro Arg Arg Glu Thr Ala Trp Ala 20 25 <210> 46 <211> 25 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 46 Arg Arg Glu Thr Ala Trp Ala Gly Ala Pro Gly Ala Pro Gly Ala Pro 1 5 10 15 Arg Arg Arg Arg Arg Arg Arg Arg Arg 20 25 <210> 47 <211> 21 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 47 Arg Arg Arg Arg Arg Arg Arg Arg Arg Gly Ala Pro Gly Ala Pro Gly 1 5 10 15 Ala Pro Arg Gly Asp 20 <210> 48 <211> 21 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 48 Arg Gly Asp Gly Ala Pro Gly Ala Pro Gly Ala Pro Arg Arg Arg Arg 1 5 10 15 Arg Arg Arg Arg Arg 20 <210> 49 <211> 4 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 49 Cys Arg Gly Asp 1 <210> 50 <211> 4 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 50 Arg Gly Asp Cys 1 <210> 51 <211> 30 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 51 Arg Arg Arg Arg Arg Arg Arg Arg Arg Gly Ala Pro Gly Ala Pro Gly 1 5 10 15 Ala Pro Thr His Arg Pro Pro Met Trp Ser Pro Val Trp Pro 20 25 30 <210> 52 <211> 30 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 52 Thr His Arg Pro Pro Met Trp Ser Pro Val Trp Pro Gly Ala Pro Gly 1 5 10 15 Ala Pro Gly Ala Pro Arg Arg Arg Arg Arg Arg Arg Arg Arg 20 25 30 <210> 53 <211> 13 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 53 Cys Thr His Arg Pro Pro Met Trp Ser Pro Val Trp Pro 1 5 10 <210> 54 <211> 14 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 54 Cys Pro Thr His Arg Pro Pro Met Trp Ser Pro Val Trp Pro 1 5 10 <210> 55 <211> 13 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 55 Thr His Arg Pro Pro Met Trp Ser Pro Val Trp Pro Cys 1 5 10 <210> 56 <211> 39 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 56 Arg Arg Arg Arg Arg Arg Arg Arg Arg Gly Ala Pro Gly Ala Pro Gly 1 5 10 15 Ala Pro Met Ile Ala Ser Gln Phe Leu Ser Ala Leu Thr Leu Val Leu 20 25 30 Leu Ile Lys Glu Ser Gly Ala 35 <210> 57 <211> 39 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 57 Met Ile Ala Ser Gln Phe Leu Ser Ala Leu Thr Leu Val Leu Leu Ile 1 5 10 15 Lys Glu Ser Gly Ala Gly Ala Pro Gly Ala Pro Gly Ala Pro Arg Arg 20 25 30 Arg Arg Arg Arg Arg Arg Arg 35 <210> 58 <211> 22 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 58 Cys Met Ile Ala Ser Gln Phe Leu Ser Ala Leu Thr Leu Val Leu Leu 1 5 10 15 Ile Lys Glu Ser Gly Ala 20 <210> 59 <211> 22 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 59 Met Ile Ala Ser Gln Phe Leu Ser Ala Leu Thr Leu Val Leu Leu Ile 1 5 10 15 Lys Glu Ser Gly Ala Cys 20 <210> 60 <211> 40 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 60 Arg Arg Arg Arg Arg Arg Arg Arg Arg Gly Ala Pro Gly Ala Pro Gly 1 5 10 15 Ala Pro Lys Asn Gly Gly Phe Phe Leu Arg Ile His Pro Asp Gly Arg 20 25 30 Val Asp Gly Val Arg Glu Lys Ser 35 40 <210> 61 <211> 40 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 61 Lys Asn Gly Gly Phe Phe Leu Arg Ile His Pro Asp Gly Arg Val Asp 1 5 10 15 Gly Val Arg Glu Lys Ser Gly Ala Pro Gly Ala Pro Gly Ala Pro Arg 20 25 30 Arg Arg Arg Arg Arg Arg Arg Arg 35 40 <210> 62 <211> 20 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 62 Ser Gly Arg Gly Lys Gln Gly Gly Lys Ala Arg Ala Lys Ala Lys Thr 1 5 10 15 Arg Ser Ser Arg 20 <210> 63 <211> 39 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 63 Ser Gly Arg Gly Lys Gln Gly Gly Lys Ala Arg Ala Lys Ala Lys Thr 1 5 10 15 Arg Ser Ser Arg Ala Gly Leu Gln Phe Pro Val Gly Arg Val His Arg 20 25 30 Leu Leu Arg Lys Gly Gly Gly 35 <210> 64 <211> 130 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 64 Met Ser Gly Arg Gly Lys Gln Gly Gly Lys Ala Arg Ala Lys Ala Lys 1 5 10 15 Thr Arg Ser Ser Arg Ala Gly Leu Gln Phe Pro Val Gly Arg Val His 20 25 30 Arg Leu Leu Arg Lys Gly Asn Tyr Ala Glu Arg Val Gly Ala Gly Ala 35 40 45 Pro Val Tyr Leu Ala Ala Val Leu Glu Tyr Leu Thr Ala Glu Ile Leu 50 55 60 Glu Leu Ala Gly Asn Ala Ala Arg Asp Asn Lys Lys Thr Arg Ile Ile 65 70 75 80 Pro Arg His Leu Gln Leu Ala Ile Arg Asn Asp Glu Glu Leu Asn Lys 85 90 95 Leu Leu Gly Lys Val Thr Ile Ala Gln Gly Gly Val Leu Pro Asn Ile 100 105 110 Gln Ala Val Leu Leu Pro Lys Lys Thr Glu Ser His His Lys Ala Lys 115 120 125 Gly Lys 130 <210> 65 <211> 10 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 65 Cys Lys Ala Thr Gln Ala Ser Gln Glu Tyr 1 5 10 <210> 66 <211> 25 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 66 Lys Lys Thr Ser Ala Thr Val Gly Pro Lys Ala Pro Ser Gly Gly Lys 1 5 10 15 Lys Ala Thr Gln Ala Ser Gln Glu Tyr 20 25 <210> 67 <211> 143 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 67 Met Ser Gly Arg Gly Lys Thr Gly Gly Lys Ala Arg Ala Lys Ala Lys 1 5 10 15 Ser Arg Ser Ser Arg Ala Gly Leu Gln Phe Pro Val Gly Arg Val His 20 25 30 Arg Leu Leu Arg Lys Gly His Tyr Ala Glu Arg Val Gly Ala Gly Ala 35 40 45 Pro Val Tyr Leu Ala Ala Val Leu Glu Tyr Leu Thr Ala Glu Ile Leu 50 55 60 Glu Leu Ala Gly Asn Ala Ala Arg Asp Asn Lys Lys Thr Arg Ile Ile 65 70 75 80 Pro Arg His Leu Gln Leu Ala Ile Arg Asn Asp Glu Glu Leu Asn Lys 85 90 95 Leu Leu Gly Gly Val Thr Ile Ala Gln Gly Gly Val Leu Pro Asn Ile 100 105 110 Gln Ala Val Leu Leu Pro Lys Lys Thr Ser Ala Thr Val Gly Pro Lys 115 120 125 Ala Pro Ser Gly Gly Lys Lys Ala Thr Gln Ala Ser Gln Glu Tyr 130 135 140 <210> 68 <211> 11 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (5)..(5) <223> The amino acid at position 5 is crotonylated. <400> 68 Pro Glu Pro Ala Lys Ser Ala Pro Ala Pro Lys 1 5 10 <210> 69 <211> 11 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 69 Pro Glu Pro Ala Lys Ser Ala Pro Ala Pro Lys 1 5 10 <210> 70 <211> 15 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 70 Ala Gln Lys Lys Asp Gly Lys Lys Arg Lys Arg Ser Arg Lys Glu 1 5 10 15 <210> 71 <211> 126 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 71 Met Pro Glu Pro Ala Lys Ser Ala Pro Ala Pro Lys Lys Gly Ser Lys 1 5 10 15 Lys Ala Val Thr Lys Ala Gln Lys Lys Asp Gly Lys Lys Arg Lys Arg 20 25 30 Ser Arg Lys Glu Ser Tyr Ser Ile Tyr Val Tyr Lys Val Leu Lys Gln 35 40 45 Val His Pro Asp Thr Gly Ile Ser Ser Lys Ala Met Gly Ile Met Asn 50 55 60 Ser Phe Val Asn Asp Ile Phe Glu Arg Ile Ala Gly Glu Ala Ser Arg 65 70 75 80 Leu Ala His Tyr Asn Lys Arg Ser Thr Ile Thr Ser Arg Glu Ile Gln 85 90 95 Thr Ala Val Arg Leu Leu Leu Pro Gly Glu Leu Ala Lys His Ala Val 100 105 110 Ser Glu Gly Thr Lys Ala Val Thr Lys Tyr Thr Ser Ser Lys 115 120 125 <210> 72 <211> 8 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 72 Ala Arg Thr Lys Gln Thr Ala Arg 1 5 <210> 73 <211> 10 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (4)..(4) <223> The amino acid at position 4 is methylated. <400> 73 Ala Arg Thr Lys Gln Thr Ala Arg Lys Ser 1 5 10 <210> 74 <211> 10 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (4)..(4) <223> The amino acid at position 4 is attached to two methyl groups <400> 74 Ala Arg Thr Lys Gln Thr Ala Arg Lys Ser 1 5 10 <210> 75 <211> 10 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (4)..(4) <223> The amino acid at position 4 is attached to three methyl groups. <400> 75 Ala Arg Thr Lys Gln Thr Ala Arg Lys Ser 1 5 10 <210> 76 <211> 15 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (10)..(10) <223> The amino acid at position 10 is pS <400> 76 Ala Arg Thr Lys Gln Thr Ala Arg Lys Ser Thr Gly Gly Lys Ala 1 5 10 15 <210> 77 <211> 20 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 77 Ala Arg Thr Lys Gln Thr Ala Arg Lys Ser Thr Gly Gly Lys Ala Pro 1 5 10 15 Arg Lys Trp Cys 20 <210> 78 <211> 19 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (14)..(14) <223> The amino acid at position 14 is attached to an (Ac) <400> 78 Ala Arg Thr Lys Gln Thr Ala Arg Lys Ser Thr Gly Gly Lys Ala Pro 1 5 10 15 Arg Lys Gln <210> 79 <211> 19 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 79 Ala Arg Thr Lys Gln Thr Ala Arg Lys Ser Thr Gly Gly Lys Ala Pro 1 5 10 15 Arg Lys Gln <210> 80 <211> 20 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (9)..(9) <223> The amino acid at position 9 is attached to Ac <400> 80 Ala Arg Thr Lys Gln Thr Ala Arg Lys Ser Thr Gly Gly Lys Ala Pro 1 5 10 15 Arg Lys Gln Leu 20 <210> 81 <211> 21 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 81 Ala Arg Thr Lys Gln Thr Ala Arg Lys Ser Thr Gly Gly Lys Ala Pro 1 5 10 15 Arg Lys Gln Leu Ala 20 <210> 82 <211> 21 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (9)..(9) <223> The amino acid at position 9 is attached to an (Ac) group <400> 82 Ala Arg Thr Lys Gln Thr Ala Arg Lys Ser Thr Gly Gly Lys Ala Pro 1 5 10 15 Arg Lys Gln Leu Ala 20 <210> 83 <211> 21 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (9)..(9) <223> The amino acid at position 9 is attached to two methyl groups <400> 83 Ala Arg Thr Lys Gln Thr Ala Arg Lys Ser Thr Gly Gly Lys Ala Pro 1 5 10 15 Arg Lys Gln Leu Ala 20 <210> 84 <211> 21 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (9)..(9) <223> The amino acid at position 9 is attached to two methyl groups <400> 84 Ala Arg Thr Lys Gln Thr Ala Arg Lys Ser Thr Gly Gly Lys Ala Pro 1 5 10 15 Arg Lys Gln Leu Ala 20 <210> 85 <211> 21 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (9)..(9) <223> The amino acid at position 9 is attached to two methyl groups <400> 85 Ala Arg Thr Lys Gln Thr Ala Arg Lys Ser Thr Gly Gly Lys Ala Pro 1 5 10 15 Arg Lys Gln Leu Ala 20 <210> 86 <211> 21 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (4)..(4) <223> The amino acid at position 4 is attached to a methyl group. <400> 86 Ala Arg Thr Lys Gln Thr Ala Arg Lys Ser Thr Gly Gly Lys Ala Pro 1 5 10 15 Arg Lys Gln Leu Ala 20 <210> 87 <211> 21 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (4)..(4) <223> The amino acid at position 4 is attached to two methyl groups. <400> 87 Ala Arg Thr Lys Gln Thr Ala Arg Lys Ser Thr Gly Gly Lys Ala Pro 1 5 10 15 Arg Lys Gln Leu Ala 20 <210> 88 <211> 21 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (4)..(4) <223> The amino aid at position 4 is attached to three methyl groups. <400> 88 Ala Arg Thr Lys Gln Thr Ala Arg Lys Ser Thr Gly Gly Lys Ala Pro 1 5 10 15 Arg Lys Gln Leu Ala 20 <210> 89 <211> 21 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (9)..(9) <223> The amino acid at position 9 is attached to an (Ac) group <220> <221> MISC_FEATURE <222> (10)..(10) <223> The amino acid at position 10 is a pS <400> 89 Ala Arg Thr Lys Gln Thr Ala Arg Lys Ser Thr Gly Gly Lys Ala Pro 1 5 10 15 Arg Lys Gln Leu Ala 20 <210> 90 <211> 21 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (4)..(4) <223> The amino acid at position 4 is attached to three methyl groups. <220> <221> MISC_FEATURE <222> (9)..(9) <223> The amino acid at positoin 9 is attached to an (Ac) group <220> <221> MISC_FEATURE <222> (10)..(10) <223> The amino acid at position 10 is pS <400> 90 Ala Arg Thr Lys Gln Thr Ala Arg Lys Ser Thr Gly Gly Lys Ala Pro 1 5 10 15 Arg Lys Gln Leu Ala 20 <210> 91 <211> 22 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 91 Ala Arg Thr Lys Gln Thr Ala Arg Lys Ser Thr Gly Gly Lys Ala Pro 1 5 10 15 Arg Lys Gln Leu Ala Cys 20 <210> 92 <211> 24 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (9)..(9) <223> The amino acid at position 9 is attached to an (Ac) group <400> 92 Ala Arg Thr Lys Gln Thr Ala Arg Lys Ser Thr Gly Gly Lys Ala Pro 1 5 10 15 Arg Lys Gln Leu Ala Thr Lys Ala 20 <210> 93 <211> 24 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (9)..(9) <223> The amino acid at position 9 is attached to three methyl groups <400> 93 Ala Arg Thr Lys Gln Thr Ala Arg Lys Ser Thr Gly Gly Lys Ala Pro 1 5 10 15 Arg Lys Gln Leu Ala Thr Lys Ala 20 <210> 94 <211> 25 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 94 Ala Arg Thr Lys Gln Thr Ala Arg Lys Ser Thr Gly Gly Lys Ala Pro 1 5 10 15 Arg Lys Gln Leu Ala Thr Lys Ala Ala 20 25 <210> 95 <211> 25 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (4)..(4) <223> The amino acid at position 4 is attached to three methyl groups <400> 95 Ala Arg Thr Lys Gln Thr Ala Arg Lys Ser Thr Gly Gly Lys Ala Pro 1 5 10 15 Arg Lys Gln Leu Ala Thr Lys Ala Ala 20 25 <210> 96 <211> 15 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (7)..(7) <223> The amino acid at position 7 is attached to a methyl group <400> 96 Thr Lys Gln Thr Ala Arg Lys Ser Thr Gly Gly Lys Ala Pro Arg 1 5 10 15 <210> 97 <211> 15 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (9)..(9) <223> The amino acid at position 9 is attached to two methyl groups <400> 97 Thr Lys Gln Thr Ala Arg Lys Ser Thr Gly Gly Lys Ala Pro Arg 1 5 10 15 <210> 98 <211> 15 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (9)..(9) <223> The amino acid at position 9 is attached to three methyl groups <400> 98 Thr Lys Gln Thr Ala Arg Lys Ser Thr Gly Gly Lys Ala Pro Arg 1 5 10 15 <210> 99 <211> 11 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (6)..(6) <223> The amino acid at position 9 is attached to an (Ac) group <400> 99 Lys Ser Thr Gly Gly Lys Ala Pro Arg Lys Gln 1 5 10 <210> 100 <211> 19 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 100 Gln Thr Ala Arg Lys Ser Thr Gly Gly Lys Ala Pro Arg Lys Gln Leu 1 5 10 15 Ala Ser Lys <210> 101 <211> 25 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 101 Ala Pro Arg Lys Gln Leu Ala Thr Lys Ala Ala Arg Lys Ser Ala Pro 1 5 10 15 Ala Thr Gly Gly Val Lys Lys Pro His 20 25 <210> 102 <211> 24 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 102 Ala Thr Lys Ala Ala Arg Lys Ser Ala Pro Ala Thr Gly Gly Val Lys 1 5 10 15 Lys Pro His Arg Tyr Arg Pro Gly 20 <210> 103 <211> 9 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 103 Lys Ala Ala Arg Lys Ser Ala Pro Ala 1 5 <210> 104 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 104 Lys Ala Ala Arg Lys Ser Ala Pro Ala Thr Gly Gly 1 5 10 <210> 105 <211> 13 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 105 Lys Ala Ala Arg Lys Ser Ala Pro Ala Thr Gly Gly Cys 1 5 10 <210> 106 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (5)..(5) <223> The amino acid at position 5 is attached to an (Ac) group <400> 106 Lys Ala Ala Arg Lys Ser Ala Pro Ala Thr Gly Gly 1 5 10 <210> 107 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (5)..(5) <223> The amino acid at position 5 is attached to two methyl groups <400> 107 Lys Ala Ala Arg Lys Ser Ala Pro Ala Thr Gly Gly 1 5 10 <210> 108 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (5)..(5) <223> The amino acid at position 5 is attached to two methyl groups <400> 108 Lys Ala Ala Arg Lys Ser Ala Pro Ala Thr Gly Gly 1 5 10 <210> 109 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (5)..(5) <223> The amino acid at position 5 is attached to three methyl groups <400> 109 Lys Ala Ala Arg Lys Ser Ala Pro Ala Thr Gly Gly 1 5 10 <210> 110 <211> 24 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (3)..(3) <223> The amio acid at position 3 is attached to an (Ac) group <400> 110 Ala Thr Lys Ala Ala Arg Lys Ser Ala Pro Ser Thr Gly Gly Val Lys 1 5 10 15 Lys Pro His Arg Tyr Arg Pro Gly 20 <210> 111 <211> 24 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (8)..(8) <223> The amino acid at position 8 is pS <400> 111 Ala Thr Lys Ala Ala Arg Lys Ser Ala Pro Ala Thr Gly Gly Val Lys 1 5 10 15 Lys Pro His Arg Tyr Arg Pro Gly 20 <210> 112 <211> 35 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 112 Ala Arg Thr Lys Gln Thr Ala Arg Lys Ser Thr Gly Gly Lys Ala Pro 1 5 10 15 Arg Lys Gln Leu Ala Thr Lys Ala Ala Arg Lys Ser Ala Pro Ala Thr 20 25 30 Gly Gly Val 35 <210> 113 <211> 11 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (6)..(6) <223> The amino acid at positoin 6 is attached to a methyl group <400> 113 Ser Thr Gly Gly Val Lys Lys Pro His Arg Tyr 1 5 10 <210> 114 <211> 11 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (6)..(6) <223> The amino acid at position 6 is attached to two methyl groups <400> 114 Ser Thr Gly Gly Val Lys Lys Pro His Arg Tyr 1 5 10 <210> 115 <211> 11 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (6)..(6) <223> The amino acid at positoin 6 is attached to three methyl groups <400> 115 Ser Thr Gly Gly Val Lys Lys Pro His Arg Tyr 1 5 10 <210> 116 <211> 20 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (13)..(13) <223> The amino acid at position 13 is attached to an (Ac) group <400> 116 Gly Thr Val Ala Leu Arg Glu Ile Arg Arg Tyr Gln Lys Ser Thr Glu 1 5 10 15 Leu Leu Ile Arg 20 <210> 117 <211> 50 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 117 Ala Arg Thr Lys Gln Thr Ala Arg Lys Ser Thr Gly Gly Lys Ala Pro 1 5 10 15 Arg Lys Gln Leu Ala Thr Lys Ala Ala Arg Lys Ser Ala Pro Ala Thr 20 25 30 Gly Gly Val Lys Lys Pro His Arg Tyr Arg Pro Gly Thr Val Ala Leu 35 40 45 Arg Glu 50 <210> 118 <211> 32 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (22)..(22) <223> The amino acid at position 22 is attached to a methyl group <400> 118 Thr Glu Leu Leu Ile Arg Lys Leu Pro Phe Gln Arg Leu Val Arg Glu 1 5 10 15 Ile Ala Gln Asp Phe Lys Thr Asp Leu Arg Phe Gln Ser Ala Ala Ile 20 25 30 <210> 119 <211> 11 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 119 Glu Ile Ala Gln Asp Phe Lys Thr Asp Leu Arg 1 5 10 <210> 120 <211> 11 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (7)..(7) <223> The amino acid at position 7 is attached to an (Ac) group <400> 120 Glu Ile Ala Gln Asp Phe Lys Thr Asp Leu Arg 1 5 10 <210> 121 <211> 11 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (7)..(7) <223> The amino acid at position 7 is attached to three methyl groups <400> 121 Glu Ile Ala Gln Asp Phe Lys Thr Asp Leu Arg 1 5 10 <210> 122 <211> 21 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 122 Arg Leu Val Arg Glu Ile Ala Gln Asp Phe Lys Thr Asp Leu Arg Phe 1 5 10 15 Gln Ser Ser Ala Val 20 <210> 123 <211> 21 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (11)..(12) <223> A methyl group is positioned between the amino acids at positions 11 and 12 <400> 123 Arg Leu Val Arg Glu Ile Ala Gln Asp Phe Lys Thr Asp Leu Arg Phe 1 5 10 15 Gln Ser Ser Ala Val 20 <210> 124 <211> 21 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (11)..(12) <223> Two methl groups are positioned between the amino acids at positions 11 and 12 <400> 124 Arg Leu Val Arg Glu Ile Ala Gln Asp Phe Lys Thr Asp Leu Arg Phe 1 5 10 15 Gln Ser Ser Ala Val 20 <210> 125 <211> 21 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (11)..(12) <223> Three methyl groups are positioned between the amino acids at positions 11 and 12 <400> 125 Arg Leu Val Arg Glu Ile Ala Gln Asp Phe Lys Thr Asp Leu Arg Phe 1 5 10 15 Gln Ser Ser Ala Val 20 <210> 126 <211> 21 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 126 Lys Arg Val Thr Ile Met Pro Lys Asp Ile Gln Leu Ala Arg Arg Ile 1 5 10 15 Arg Gly Glu Arg Ala 20 <210> 127 <211> 136 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 127 Met Ala Arg Thr Lys Gln Thr Ala Arg Lys Ser Thr Gly Gly Lys Ala 1 5 10 15 Pro Arg Lys Gln Leu Ala Thr Lys Val Ala Arg Lys Ser Ala Pro Ala 20 25 30 Thr Gly Gly Val Lys Lys Pro His Arg Tyr Arg Pro Gly Thr Val Ala 35 40 45 Leu Arg Glu Ile Arg Arg Tyr Gln Lys Ser Thr Glu Leu Leu Ile Arg 50 55 60 Lys Leu Pro Phe Gln Arg Leu Met Arg Glu Ile Ala Gln Asp Phe Lys 65 70 75 80 Thr Asp Leu Arg Phe Gln Ser Ser Ala Val Met Ala Leu Gln Glu Ala 85 90 95 Cys Glu Ser Tyr Leu Val Gly Leu Phe Glu Asp Thr Asn Leu Cys Val 100 105 110 Ile His Ala Lys Arg Val Thr Ile Met Pro Lys Asp Ile Gln Leu Ala 115 120 125 Arg Arg Ile Arg Gly Glu Arg Ala 130 135 <210> 128 <211> 7 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 128 Ser Gly Arg Gly Lys Gly Gly 1 5 <210> 129 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 129 Arg Gly Lys Gly Gly Lys Gly Leu Gly Lys Gly Ala 1 5 10 <210> 130 <211> 21 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 130 Ser Gly Arg Gly Lys Gly Gly Lys Gly Leu Gly Lys Gly Gly Ala Lys 1 5 10 15 Arg His Arg Lys Val 20 <210> 131 <211> 20 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 131 Lys Gly Leu Gly Lys Gly Gly Ala Lys Arg His Arg Lys Val Leu Arg 1 5 10 15 Asp Asn Trp Cys 20 <210> 132 <211> 30 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (5)..(5) <223> The amino acid at position 5 is attached to an (Ac) group <220> <221> MISC_FEATURE <222> (8)..(8) <223> The amino acid at position 8 is attached to an (Ac) group <220> <221> MISC_FEATURE <222> (12)..(12) <223> The amino acid at position 12 is attached to an (Ac) group <220> <221> MISC_FEATURE <222> (16)..(16) <223> The amino acid at position 16 is attached to an (Ac) group <400> 132 Ser Gly Arg Gly Lys Gly Gly Lys Gly Leu Gly Lys Gly Gly Ala Lys 1 5 10 15 Arg His Arg Lys Val Leu Arg Asp Asn Gly Ser Gly Ser Lys 20 25 30 <210> 133 <211> 20 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 133 Ser Gly Arg Gly Lys Gly Gly Lys Gly Leu Gly Lys Gly Gly Ala Lys 1 5 10 15 Arg His Arg Lys 20 <210> 134 <211> 20 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (5)..(5) <223> The amino acid at position 5 is attached to an (Ac) group <400> 134 Ser Gly Arg Gly Lys Gly Gly Lys Gly Leu Gly Lys Gly Gly Ala Lys 1 5 10 15 Arg His Arg Lys 20 <210> 135 <211> 20 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (8)..(8) <223> The amino acid at position 8 is attached to an (Ac) group <400> 135 Ser Gly Arg Gly Lys Gly Gly Lys Gly Leu Gly Lys Gly Gly Ala Lys 1 5 10 15 Arg His Arg Lys 20 <210> 136 <211> 20 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (12)..(12) <223> The amino acid at position 12 is attached to an (Ac) group <400> 136 Ser Gly Arg Gly Lys Gly Gly Lys Gly Leu Gly Lys Gly Gly Ala Lys 1 5 10 15 Arg His Arg Lys 20 <210> 137 <211> 20 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (16)..(16) <223> The amino acid at position 16 is attached to an (Ac) group <400> 137 Ser Gly Arg Gly Lys Gly Gly Lys Gly Leu Gly Lys Gly Gly Ala Lys 1 5 10 15 Arg His Arg Lys 20 <210> 138 <211> 20 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 138 Lys Gly Leu Gly Lys Gly Gly Ala Lys Arg His Arg Lys Val Leu Arg 1 5 10 15 Asp Asn Trp Cys 20 <210> 139 <211> 103 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 139 Met Ser Gly Arg Gly Lys Gly Gly Lys Gly Leu Gly Lys Gly Gly Ala 1 5 10 15 Lys Arg His Arg Lys Val Leu Arg Asp Asn Ile Gln Gly Ile Thr Lys 20 25 30 Pro Ala Ile Arg Arg Leu Ala Arg Arg Gly Gly Val Lys Arg Ile Ser 35 40 45 Gly Leu Ile Tyr Glu Glu Thr Arg Gly Val Leu Lys Val Phe Leu Glu 50 55 60 Asn Val Ile Arg Asp Ala Val Thr Tyr Thr Glu His Ala Lys Arg Lys 65 70 75 80 Thr Val Thr Ala Met Asp Val Val Tyr Ala Leu Lys Arg Gln Gly Arg 85 90 95 Thr Leu Tyr Gly Phe Gly Gly 100 <210> 140 <211> 10 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 140 Cys Lys Ala Thr Gln Ala Ser Gln Glu Tyr 1 5 10 <210> 141 <211> 22 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 141 Ala Arg Thr Lys Gln Thr Ala Arg Lys Ser Thr Gly Gly Lys Ala Pro 1 5 10 15 Arg Lys Gln Leu Ala Cys 20 <210> 142 <211> 20 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 142 Ala Arg Thr Lys Gln Thr Ala Arg Lys Ser Thr Gly Gly Lys Ala Pro 1 5 10 15 Arg Lys Trp Cys 20 <210> 143 <211> 13 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 143 Lys Ala Ala Arg Lys Ser Ala Pro Ala Thr Gly Gly Cys 1 5 10 <210> 144 <211> 20 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 144 Lys Gly Leu Gly Lys Gly Gly Ala Lys Arg His Arg Lys Val Leu Arg 1 5 10 15 Asp Asn Trp Cys 20 <210> 145 <211> 136 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 145 Met Ala Arg Thr Lys Gln Thr Ala Arg Lys Ser Thr Gly Gly Lys Ala 1 5 10 15 Pro Arg Lys Gln Leu Ala Thr Lys Val Ala Arg Lys Ser Ala Pro Ala 20 25 30 Thr Gly Gly Val Lys Lys Pro His Arg Tyr Arg Pro Gly Thr Val Ala 35 40 45 Leu Arg Glu Ile Arg Arg Tyr Gln Lys Ser Thr Glu Leu Leu Ile Arg 50 55 60 Lys Leu Pro Phe Gln Arg Leu Met Arg Glu Ile Ala Gln Asp Phe Lys 65 70 75 80 Thr Asp Leu Arg Phe Gln Ser Ser Ala Val Met Ala Leu Gln Glu Ala 85 90 95 Cys Glu Ser Tyr Leu Val Gly Leu Phe Glu Asp Thr Asn Leu Cys Val 100 105 110 Ile His Ala Lys Arg Val Thr Ile Met Pro Lys Asp Ile Gln Leu Ala 115 120 125 Arg Arg Ile Arg Gly Glu Arg Ala 130 135 <210> 146 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> misc_feature <222> (1)..(12) <223> Xaa can be any naturally occurring amino acid <400> 146 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 <210> 147 <211> 7 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 147 Thr Lys Pro Arg Pro Gly Pro 1 5 <210> 148 <211> 7 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 148 Met Glu His Phe Pro Gly Pro 1 5 <210> 149 <211> 28 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 149 Pro Glu Asp Glu Ile Trp Leu Pro Glu Pro Glu Ser Val Asp Val Pro 1 5 10 15 Ala Lys Pro Ile Ser Thr Ser Ser Met Met Met Pro 20 25 <210> 150 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> misc_feature <222> (1)..(12) <223> Xaa can be any naturally occurring amino acid <400> 150 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 <210> 151 <211> 7 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 151 Pro Lys Lys Lys Arg Lys Val 1 5 <210> 152 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 152 Pro Lys Lys Lys Arg Lys Val Glu Asp Pro Tyr Cys 1 5 10 <210> 153 <211> 33 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 153 Pro Lys Lys Lys Arg Lys Val Gly Pro Lys Lys Lys Arg Lys Val Gly 1 5 10 15 Pro Lys Lys Lys Arg Lys Val Gly Pro Lys Lys Lys Arg Lys Val Gly 20 25 30 Cys <210> 154 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 154 Cys Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg 1 5 10 <210> 155 <211> 17 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 155 Cys Ser Ile Pro Pro Glu Val Lys Phe Asn Lys Pro Phe Val Tyr Leu 1 5 10 15 Ile <210> 156 <211> 17 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 156 Asp Arg Gln Ile Lys Ile Trp Phe Gln Asn Arg Arg Met Lys Trp Lys 1 5 10 15 Lys <210> 157 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 157 Pro Lys Lys Lys Arg Lys Val Glu Asp Pro Tyr Cys 1 5 10 <210> 158 <211> 9 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 158 Pro Ala Ala Lys Arg Val Lys Leu Asp 1 5 <210> 159 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> misc_feature <222> (1)..(12) <223> Xaa can be any naturally occurring amino acid <400> 159 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 <210> 160 <211> 11 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 160 Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg 1 5 10 <210> 161 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 161 Arg Arg Gln Arg Arg Thr Ser Lys Leu Met Lys Arg 1 5 10 <210> 162 <211> 27 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 162 Gly Trp Thr Leu Asn Ser Ala Gly Tyr Leu Leu Gly Lys Ile Asn Leu 1 5 10 15 Lys Ala Leu Ala Ala Leu Ala Lys Lys Ile Leu 20 25 <210> 163 <211> 33 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 163 Lys Ala Leu Ala Trp Glu Ala Lys Leu Ala Lys Ala Leu Ala Lys Ala 1 5 10 15 Leu Ala Lys His Leu Ala Lys Ala Leu Ala Lys Ala Leu Lys Cys Glu 20 25 30 Ala <210> 164 <211> 16 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 164 Arg Gln Ile Lys Ile Trp Phe Gln Asn Arg Arg Met Lys Trp Lys Lys 1 5 10 15 <210> 165 <211> 9 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 165 Arg Lys Lys Arg Arg Gln Arg Arg Arg 1 5 <210> 166 <211> 8 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 166 Arg Lys Lys Arg Arg Gln Arg Arg 1 5 <210> 167 <211> 11 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 167 Tyr Ala Arg Ala Ala Ala Arg Gln Ala Arg Ala 1 5 10 <210> 168 <211> 11 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 168 Thr His Arg Leu Pro Arg Arg Arg Arg Arg Arg 1 5 10 <210> 169 <211> 11 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 169 Gly Gly Arg Arg Ala Arg Arg Arg Arg Arg Arg 1 5 10 <210> 170 <211> 10 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 170 Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln 1 5 10 <210> 171 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> misc_feature <222> (1)..(12) <223> Xaa can be any naturally occurring amino acid <400> 171 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 <210> 172 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> misc_feature <222> (1)..(12) <223> Xaa can be any naturally occurring amino acid <400> 172 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 <210> 173 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> misc_feature <222> (1)..(12) <223> Xaa can be any naturally occurring amino acid <400> 173 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 <210> 174 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> misc_feature <222> (1)..(12) <223> Xaa can be any naturally occurring amino acid <400> 174 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 <210> 175 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> misc_feature <222> (1)..(12) <223> Xaa can be any naturally occurring amino acid <400> 175 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 <210> 176 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> misc_feature <222> (1)..(12) <223> Xaa can be any naturally occurring amino acid <400> 176 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 <210> 177 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> misc_feature <222> (1)..(12) <223> Xaa can be any naturally occurring amino acid <400> 177 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 <210> 178 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> misc_feature <222> (1)..(12) <223> Xaa can be any naturally occurring amino acid <400> 178 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 <210> 179 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> misc_feature <222> (1)..(12) <223> Xaa can be any naturally occurring amino acid <400> 179 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 <210> 180 <211> 41 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 180 Tyr Thr Ile Trp Met Pro Glu Asn Pro Arg Pro Gly Thr Pro Cys Asp 1 5 10 15 Ile Phe Thr Asn Ser Arg Gly Lys Arg Ala Ser Asn Gly Gly Gly Gly 20 25 30 Arg Arg Arg Arg Arg Arg Arg Arg Arg 35 40 <210> 181 <211> 5 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 181 Arg Gly Asp Gly Trp 1 5 <210> 182 <211> 11 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 182 Gly Cys Gly Tyr Gly Arg Gly Asp Ser Pro Gly 1 5 10 <210> 183 <211> 32 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 183 Tyr Thr Ile Trp Met Pro Glu Asn Pro Arg Pro Gly Thr Pro Cys Asp 1 5 10 15 Ile Phe Thr Asn Ser Arg Gly Lys Arg Ala Ser Asn Gly Gly Gly Gly 20 25 30 <210> 184 <211> 164 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 184 Glu Gly Ile Cys Arg Asn Arg Val Thr Asn Asn Val Lys Asp Val Thr 1 5 10 15 Lys Leu Val Ala Asn Leu Pro Lys Asp Tyr Met Ile Thr Leu Lys Tyr 20 25 30 Val Pro Gly Met Asp Val Leu Pro Ser His Cys Trp Ile Ser Glu Met 35 40 45 Val Val Gln Leu Ser Asp Ser Leu Thr Asp Leu Leu Asp Lys Phe Ser 50 55 60 Asn Ile Ser Glu Gly Leu Ser Asn Tyr Ser Ile Ile Asp Lys Leu Val 65 70 75 80 Asn Ile Val Asp Asp Leu Val Glu Cys Val Lys Glu Asn Ser Ser Lys 85 90 95 Asp Leu Lys Lys Ser Phe Lys Ser Pro Glu Pro Arg Leu Phe Thr Pro 100 105 110 Glu Glu Phe Phe Arg Ile Phe Asn Arg Ser Ile Asp Ala Phe Lys Asp 115 120 125 Phe Val Val Ala Ser Glu Thr Ser Asp Cys Val Val Ser Ser Thr Leu 130 135 140 Ser Pro Glu Lys Asp Ser Arg Val Ser Val Thr Lys Pro Phe Met Leu 145 150 155 160 Pro Pro Val Ala <210> 185 <211> 192 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 185 Pro Glu Glu Gly Ser Gly Cys Ser Val Arg Arg Arg Pro Tyr Gly Cys 1 5 10 15 Val Leu Arg Ala Ala Leu Val Pro Leu Val Ala Gly Leu Val Ile Cys 20 25 30 Leu Val Val Cys Ile Gln Arg Phe Ala Gln Ala Gln Gln Gln Leu Pro 35 40 45 Leu Glu Ser Leu Gly Trp Asp Val Ala Glu Leu Gln Leu Asn His Thr 50 55 60 Gly Pro Gln Gln Asp Pro Arg Leu Tyr Trp Gln Gly Gly Pro Ala Leu 65 70 75 80 Gly Arg Ser Phe Leu His Gly Pro Glu Leu Asp Lys Gly Gln Leu Arg 85 90 95 Ile His Arg Asp Gly Ile Tyr Met Val His Ile Gln Val Thr Leu Ala 100 105 110 Ile Cys Ser Ser Thr Thr Ala Ser Arg His His Pro Thr Thr Leu Ala 115 120 125 Val Gly Ile Cys Ser Pro Ala Ser Arg Ser Ile Ser Leu Leu Arg Leu 130 135 140 Ser Phe His Gln Gly Cys Thr Ile Ala Ser Gln Arg Leu Thr Pro Leu 145 150 155 160 Ala Arg Gly Asp Thr Leu Cys Thr Asn Leu Thr Gly Thr Leu Leu Pro 165 170 175 Ser Arg Asn Thr Asp Glu Thr Phe Phe Gly Val Gln Trp Val Arg Pro 180 185 190 <210> 186 <211> 138 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 186 Ser Ser Gly Leu Val Pro Arg Gly Ser His Met Asp Ala Val Ala Val 1 5 10 15 Tyr His Gly Lys Ile Ser Arg Glu Thr Gly Glu Lys Leu Leu Leu Ala 20 25 30 Thr Gly Leu Asp Gly Ser Tyr Leu Leu Arg Asp Ser Glu Ser Val Pro 35 40 45 Gly Val Tyr Cys Leu Cys Val Leu Tyr His Gly Tyr Ile Tyr Thr Tyr 50 55 60 Arg Val Ser Gln Thr Glu Thr Gly Ser Trp Ser Ala Glu Thr Ala Pro 65 70 75 80 Gly Val His Lys Arg Tyr Phe Arg Lys Ile Lys Asn Leu Ile Ser Ala 85 90 95 Phe Gln Lys Pro Asp Gln Gly Ile Val Ile Pro Leu Gln Tyr Pro Val 100 105 110 Glu Lys Lys Ser Ser Ala Arg Ser Thr Gln Gly Thr Thr Gly Ile Arg 115 120 125 Glu Asp Pro Asp Val Cys Leu Lys Ala Pro 130 135 <210> 187 <211> 13 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 187 Asp Gly Ala Arg Tyr Cys Arg Gly Asp Cys Phe Asp Gly 1 5 10 <210> 188 <211> 11 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 188 Gly Cys Gly Tyr Gly Arg Gly Asp Ser Pro Gly 1 5 10 <210> 189 <211> 174 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 189 Arg Arg Arg Arg Arg Arg Arg Arg Arg Met Glu Gly Ile Cys Arg Asn 1 5 10 15 Arg Val Thr Asn Asn Val Lys Asp Val Thr Lys Leu Val Ala Asn Leu 20 25 30 Pro Lys Asp Tyr Met Ile Thr Leu Lys Tyr Val Pro Gly Met Asp Val 35 40 45 Leu Pro Ser His Cys Trp Ile Ser Glu Met Val Val Gln Leu Ser Asp 50 55 60 Ser Leu Thr Asp Leu Leu Asp Lys Phe Ser Asn Ile Ser Glu Gly Leu 65 70 75 80 Ser Asn Tyr Ser Ile Ile Asp Lys Leu Val Asn Ile Val Asp Asp Leu 85 90 95 Val Glu Cys Val Lys Glu Asn Ser Ser Lys Asp Leu Lys Lys Ser Phe 100 105 110 Lys Ser Pro Glu Pro Arg Leu Phe Thr Pro Glu Glu Phe Phe Arg Ile 115 120 125 Phe Asn Arg Ser Ile Asp Ala Phe Lys Asp Phe Val Val Ala Ser Glu 130 135 140 Thr Ser Asp Cys Val Val Ser Ser Thr Leu Ser Pro Glu Lys Asp Ser 145 150 155 160 Arg Val Ser Val Thr Lys Pro Phe Met Leu Pro Pro Val Ala 165 170 <210> 190 <211> 201 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 190 Arg Arg Arg Arg Arg Arg Arg Arg Arg Pro Glu Glu Gly Ser Gly Cys 1 5 10 15 Ser Val Arg Arg Arg Pro Tyr Gly Cys Val Leu Arg Ala Ala Leu Val 20 25 30 Pro Leu Val Ala Gly Leu Val Ile Cys Leu Val Val Cys Ile Gln Arg 35 40 45 Phe Ala Gln Ala Gln Gln Gln Leu Pro Leu Glu Ser Leu Gly Trp Asp 50 55 60 Val Ala Glu Leu Gln Leu Asn His Thr Gly Pro Gln Gln Asp Pro Arg 65 70 75 80 Leu Tyr Trp Gln Gly Gly Pro Ala Leu Gly Arg Ser Phe Leu His Gly 85 90 95 Pro Glu Leu Asp Lys Gly Gln Leu Arg Ile His Arg Asp Gly Ile Tyr 100 105 110 Met Val His Ile Gln Val Thr Leu Ala Ile Cys Ser Ser Thr Thr Ala 115 120 125 Ser Arg His His Pro Thr Thr Leu Ala Val Gly Ile Cys Ser Pro Ala 130 135 140 Ser Arg Ser Ile Ser Leu Leu Arg Leu Ser Phe His Gln Gly Cys Thr 145 150 155 160 Ile Ala Ser Gln Arg Leu Thr Pro Leu Ala Arg Gly Asp Thr Leu Cys 165 170 175 Thr Asn Leu Thr Gly Thr Leu Leu Pro Ser Arg Asn Thr Asp Glu Thr 180 185 190 Phe Phe Gly Val Gln Trp Val Arg Pro 195 200 <210> 191 <211> 201 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 191 Pro Glu Glu Gly Ser Gly Cys Ser Val Arg Arg Arg Pro Tyr Gly Cys 1 5 10 15 Val Leu Arg Ala Ala Leu Val Pro Leu Val Ala Gly Leu Val Ile Cys 20 25 30 Leu Val Val Cys Ile Gln Arg Phe Ala Gln Ala Gln Gln Gln Leu Pro 35 40 45 Leu Glu Ser Leu Gly Trp Asp Val Ala Glu Leu Gln Leu Asn His Thr 50 55 60 Gly Pro Gln Gln Asp Pro Arg Leu Tyr Trp Gln Gly Gly Pro Ala Leu 65 70 75 80 Gly Arg Ser Phe Leu His Gly Pro Glu Leu Asp Lys Gly Gln Leu Arg 85 90 95 Ile His Arg Asp Gly Ile Tyr Met Val His Ile Gln Val Thr Leu Ala 100 105 110 Ile Cys Ser Ser Thr Thr Ala Ser Arg His His Pro Thr Thr Leu Ala 115 120 125 Val Gly Ile Cys Ser Pro Ala Ser Arg Ser Ile Ser Leu Leu Arg Leu 130 135 140 Ser Phe His Gln Gly Cys Thr Ile Ala Ser Gln Arg Leu Thr Pro Leu 145 150 155 160 Ala Arg Gly Asp Thr Leu Cys Thr Asn Leu Thr Gly Thr Leu Leu Pro 165 170 175 Ser Arg Asn Thr Asp Glu Thr Phe Phe Gly Val Gln Trp Val Arg Pro 180 185 190 Arg Arg Arg Arg Arg Arg Arg Arg Arg 195 200 <210> 192 <211> 148 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 192 Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro 1 5 10 15 Arg Gly Ser His Met Asp Ala Val Ala Val Tyr His Gly Lys Ile Ser 20 25 30 Arg Glu Thr Gly Glu Lys Leu Leu Leu Ala Thr Gly Leu Asp Gly Ser 35 40 45 Tyr Leu Leu Arg Asp Ser Glu Ser Val Pro Gly Val Tyr Cys Leu Cys 50 55 60 Val Leu Tyr His Gly Tyr Ile Tyr Thr Tyr Arg Val Ser Gln Thr Glu 65 70 75 80 Thr Gly Ser Trp Ser Ala Glu Thr Ala Pro Gly Val His Lys Arg Tyr 85 90 95 Phe Arg Lys Ile Lys Asn Leu Ile Ser Ala Phe Gln Lys Pro Asp Gln 100 105 110 Gly Ile Val Ile Pro Leu Gln Tyr Pro Val Glu Lys Lys Ser Ser Ala 115 120 125 Arg Ser Thr Gln Gly Thr Thr Gly Ile Arg Glu Asp Pro Asp Val Cys 130 135 140 Leu Lys Ala Pro 145 <210> 193 <211> 147 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 193 Arg Arg Arg Arg Arg Arg Arg Arg Arg Ser Ser Gly Leu Val Pro Arg 1 5 10 15 Gly Ser His Met Asp Ala Val Ala Val Tyr His Gly Lys Ile Ser Arg 20 25 30 Glu Thr Gly Glu Lys Leu Leu Leu Ala Thr Gly Leu Asp Gly Ser Tyr 35 40 45 Leu Leu Arg Asp Ser Glu Ser Val Pro Gly Val Tyr Cys Leu Cys Val 50 55 60 Leu Tyr His Gly Tyr Ile Tyr Thr Tyr Arg Val Ser Gln Thr Glu Thr 65 70 75 80 Gly Ser Trp Ser Ala Glu Thr Ala Pro Gly Val His Lys Arg Tyr Phe 85 90 95 Arg Lys Ile Lys Asn Leu Ile Ser Ala Phe Gln Lys Pro Asp Gln Gly 100 105 110 Ile Val Ile Pro Leu Gln Tyr Pro Val Glu Lys Lys Ser Ser Ala Arg 115 120 125 Ser Thr Gln Gly Thr Thr Gly Ile Arg Glu Asp Pro Asp Val Cys Leu 130 135 140 Lys Ala Pro 145 <210> 194 <211> 165 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (1)..(1) <223> The amino acid at position 1 is attached to X where the X is a cationic anchoring domain <220> <221> MISC_FEATURE <222> (165)..(165) <223> The amino acid at position 165 is attached to X where the X is a cationic anchoring domain <400> 194 Met Glu Gly Ile Cys Arg Asn Arg Val Thr Asn Asn Val Lys Asp Val 1 5 10 15 Thr Lys Leu Val Ala Asn Leu Pro Lys Asp Tyr Met Ile Thr Leu Lys 20 25 30 Tyr Val Pro Gly Met Asp Val Leu Pro Ser His Cys Trp Ile Ser Glu 35 40 45 Met Val Val Gln Leu Ser Asp Ser Leu Thr Asp Leu Leu Asp Lys Phe 50 55 60 Ser Asn Ile Ser Glu Gly Leu Ser Asn Tyr Ser Ile Ile Asp Lys Leu 65 70 75 80 Val Asn Ile Val Asp Asp Leu Val Glu Cys Val Lys Glu Asn Ser Ser 85 90 95 Lys Asp Leu Lys Lys Ser Phe Lys Ser Pro Glu Pro Arg Leu Phe Thr 100 105 110 Pro Glu Glu Phe Phe Arg Ile Phe Asn Arg Ser Ile Asp Ala Phe Lys 115 120 125 Asp Phe Val Val Ala Ser Glu Thr Ser Asp Cys Val Val Ser Ser Thr 130 135 140 Leu Ser Pro Glu Lys Asp Ser Arg Val Ser Val Thr Lys Pro Phe Met 145 150 155 160 Leu Pro Pro Val Ala 165 <210> 195 <211> 192 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (1)..(1) <223> The amino acid at position 1 is attached to X where the X is a cationic anchoring domain <220> <221> MISC_FEATURE <222> (192)..(192) <223> The amino acid at position 192 is attached to X where the X is a cationic anchoring domain <400> 195 Pro Glu Glu Gly Ser Gly Cys Ser Val Arg Arg Arg Pro Tyr Gly Cys 1 5 10 15 Val Leu Arg Ala Ala Leu Val Pro Leu Val Ala Gly Leu Val Ile Cys 20 25 30 Leu Val Val Cys Ile Gln Arg Phe Ala Gln Ala Gln Gln Gln Leu Pro 35 40 45 Leu Glu Ser Leu Gly Trp Asp Val Ala Glu Leu Gln Leu Asn His Thr 50 55 60 Gly Pro Gln Gln Asp Pro Arg Leu Tyr Trp Gln Gly Gly Pro Ala Leu 65 70 75 80 Gly Arg Ser Phe Leu His Gly Pro Glu Leu Asp Lys Gly Gln Leu Arg 85 90 95 Ile His Arg Asp Gly Ile Tyr Met Val His Ile Gln Val Thr Leu Ala 100 105 110 Ile Cys Ser Ser Thr Thr Ala Ser Arg His His Pro Thr Thr Leu Ala 115 120 125 Val Gly Ile Cys Ser Pro Ala Ser Arg Ser Ile Ser Leu Leu Arg Leu 130 135 140 Ser Phe His Gln Gly Cys Thr Ile Ala Ser Gln Arg Leu Thr Pro Leu 145 150 155 160 Ala Arg Gly Asp Thr Leu Cys Thr Asn Leu Thr Gly Thr Leu Leu Pro 165 170 175 Ser Arg Asn Thr Asp Glu Thr Phe Phe Gly Val Gln Trp Val Arg Pro 180 185 190 <210> 196 <211> 138 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (1)..(1) <223> The amino acid at position 1 is attached to X where the X is a cationic anchoring domain <400> 196 Ser Ser Gly Leu Val Pro Arg Gly Ser His Met Asp Ala Val Ala Val 1 5 10 15 Tyr His Gly Lys Ile Ser Arg Glu Thr Gly Glu Lys Leu Leu Leu Ala 20 25 30 Thr Gly Leu Asp Gly Ser Tyr Leu Leu Arg Asp Ser Glu Ser Val Pro 35 40 45 Gly Val Tyr Cys Leu Cys Val Leu Tyr His Gly Tyr Ile Tyr Thr Tyr 50 55 60 Arg Val Ser Gln Thr Glu Thr Gly Ser Trp Ser Ala Glu Thr Ala Pro 65 70 75 80 Gly Val His Lys Arg Tyr Phe Arg Lys Ile Lys Asn Leu Ile Ser Ala 85 90 95 Phe Gln Lys Pro Asp Gln Gly Ile Val Ile Pro Leu Gln Tyr Pro Val 100 105 110 Glu Lys Lys Ser Ser Ala Arg Ser Thr Gln Gly Thr Thr Gly Ile Arg 115 120 125 Glu Asp Pro Asp Val Cys Leu Lys Ala Pro 130 135 <210> 197 <211> 142 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (4)..(5) <223> A cationic anchoring domain is present between the amino acids at positions 4 and 5 <400> 197 Met Gly Ser Ser Ser Ser Gly Leu Val Pro Arg Gly Ser His Met Asp 1 5 10 15 Ala Val Ala Val Tyr His Gly Lys Ile Ser Arg Glu Thr Gly Glu Lys 20 25 30 Leu Leu Leu Ala Thr Gly Leu Asp Gly Ser Tyr Leu Leu Arg Asp Ser 35 40 45 Glu Ser Val Pro Gly Val Tyr Cys Leu Cys Val Leu Tyr His Gly Tyr 50 55 60 Ile Tyr Thr Tyr Arg Val Ser Gln Thr Glu Thr Gly Ser Trp Ser Ala 65 70 75 80 Glu Thr Ala Pro Gly Val His Lys Arg Tyr Phe Arg Lys Ile Lys Asn 85 90 95 Leu Ile Ser Ala Phe Gln Lys Pro Asp Gln Gly Ile Val Ile Pro Leu 100 105 110 Gln Tyr Pro Val Glu Lys Lys Ser Ser Ala Arg Ser Thr Gln Gly Thr 115 120 125 Thr Gly Ile Arg Glu Asp Pro Asp Val Cys Leu Lys Ala Pro 130 135 140 <210> 198 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> misc_feature <222> (1)..(12) <223> Xaa can be any naturally occurring amino acid <400> 198 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 <210> 199 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> misc_feature <222> (1)..(12) <223> Xaa can be any naturally occurring amino acid <400> 199 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 <210> 200 <211> 14 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 200 Glu Lys Phe Ile Leu Lys Val Arg Pro Ala Phe Lys Ala Val 1 5 10 <210> 201 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 201 Leu Pro Lys Lys Arg Lys Phe Ser Glu Ile Ser Ser 1 5 10 <210> 202 <211> 10 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 202 Lys Arg Lys Arg Trp Glu Asn Asp Ile Pro 1 5 10 <210> 203 <211> 10 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 203 Lys Arg Lys Arg Trp Glu Asn Asn Ile Pro 1 5 10 <210> 204 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 204 Thr Gly Gly Val Met Lys Arg Lys Arg Gly Ser Val 1 5 10 <210> 205 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 205 Pro Ile Leu Pro Leu Lys Arg Arg Arg Gly Ser Pro 1 5 10 <210> 206 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 206 Thr Tyr Ser Gly Val Lys Arg Lys Arg Asn Val Val 1 5 10 <210> 207 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 207 Thr His Ile Gly Tyr Lys Arg Lys Arg Asp Ser Val 1 5 10 <210> 208 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 208 Leu Ser Gly Thr Lys Arg Lys Arg Ala Tyr Phe Ile 1 5 10 <210> 209 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 209 Gln Arg Arg Leu Leu Lys Arg Lys Arg Gly Ser Leu 1 5 10 <210> 210 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 210 Gln Ile Gly Lys Lys Arg Lys Arg Asp Tyr Leu Asp 1 5 10 <210> 211 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 211 Lys Arg Gly Lys Arg Lys Arg Leu Val Arg Pro Trp 1 5 10 <210> 212 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 212 Lys Lys Gly Lys Arg Lys Arg Leu Val Arg Pro Trp 1 5 10 <210> 213 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 213 Pro Ser Arg Lys Arg Lys Arg Glu Ser Asp His Ile 1 5 10 <210> 214 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 214 Pro Ser Arg Lys Arg Lys Arg Asp His Tyr Ala Val 1 5 10 <210> 215 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 215 Ile Ser Arg Lys Arg Lys Arg Asp Leu Glu Phe Val 1 5 10 <210> 216 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 216 Ile Thr Arg Lys Arg Lys Arg Asp Leu Val Phe Thr 1 5 10 <210> 217 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 217 Glu Pro Asn Pro Arg Lys Arg Lys Arg Ser Glu Leu 1 5 10 <210> 218 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 218 Thr Ser Pro Ser Arg Lys Arg Lys Trp Asp Gln Val 1 5 10 <210> 219 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 219 Thr Leu Glu Arg Lys Arg Lys Leu Ala Val Leu Tyr 1 5 10 <210> 220 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 220 Arg Arg Arg Lys Arg Arg Arg Glu Trp Glu Asp Phe 1 5 10 <210> 221 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 221 His Arg Tyr Cys Gly Lys Arg Arg Arg Arg Thr Arg 1 5 10 <210> 222 <211> 11 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 222 Ser Val Leu Gly Lys Arg Ser Arg Thr Trp Glu 1 5 10 <210> 223 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 223 Tyr Gly Arg Val Ser Lys Arg Pro Arg Tyr Gln Phe 1 5 10 <210> 224 <211> 11 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 224 Arg Lys Arg Gly Arg Lys Arg Phe Arg Ser Val 1 5 10 <210> 225 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 225 Lys Arg Lys Tyr Ala Val Phe Leu Glu Ser Gln Asn 1 5 10 <210> 226 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 226 Lys Arg Lys Tyr Ser Ile Tyr Leu Gly Ser Gln Ser 1 5 10 <210> 227 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 227 Lys Arg Lys Trp Met Ala Phe Tyr Met Gly Asp Pro 1 5 10 <210> 228 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 228 Lys Arg Lys Cys Ala Val Phe Leu Glu Gly Gln Asn 1 5 10 <210> 229 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 229 Ile Pro Arg Lys Arg Ser Phe Ala Glu Leu Tyr Asp 1 5 10 <210> 230 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 230 Arg Leu Thr Pro Arg Lys Arg Ala Phe Ser Glu Val 1 5 10 <210> 231 <211> 9 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 231 Lys Arg Ser Trp Ser Met Ala Phe Cys 1 5 <210> 232 <211> 10 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 232 Lys Arg Thr Trp Ala Gln Ala Phe Thr Glu 1 5 10 <210> 233 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 233 Lys Arg Pro Tyr Ser Ile Ala Phe Pro Leu Gly Gln 1 5 10 <210> 234 <211> 14 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 234 Arg Arg Arg Ser Val Leu Lys Arg Ser Trp Ser Val Ala Phe 1 5 10 <210> 235 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 235 Lys Arg Arg Tyr Ser Asp Ala Phe Arg Leu Pro Val 1 5 10 <210> 236 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 236 Lys Arg Lys Tyr Ser Asp Ala Phe Gly Leu Pro Val 1 5 10 <210> 237 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 237 Ile Gly Arg Lys Arg Gly Tyr Ser Val Ala Phe Gly 1 5 10 <210> 238 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 238 Ile Gly Arg Lys Arg Val Trp Ala Val Ala Phe Tyr 1 5 10 <210> 239 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 239 Trp Ala Gly Arg Lys Arg Thr Trp Arg Asp Ala Phe 1 5 10 <210> 240 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 240 Ser Ser His Arg Lys Arg Lys Phe Ser Asp Ala Phe 1 5 10 <210> 241 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 241 Pro Ser His Arg Lys Arg Lys Phe Ser Asp Ala Phe 1 5 10 <210> 242 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 242 Thr Ala His Arg Lys Arg Lys Phe Ser Asp Ala Phe 1 5 10 <210> 243 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 243 Arg Val Gln Arg Lys Arg Lys Trp Ser Glu Ala Phe 1 5 10 <210> 244 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 244 Arg Leu Thr Arg Lys Arg Lys Tyr Asp Cys Ala Phe 1 5 10 <210> 245 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 245 Leu Val Asn Arg Lys Arg Arg Tyr Trp Glu Ala Phe 1 5 10 <210> 246 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 246 Leu Gly Lys Arg Tyr Asp Arg Asp Trp Asp Tyr Lys 1 5 10 <210> 247 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 247 Arg Ser Ser Gly Ile Leu Gly Lys Arg Lys Phe Glu 1 5 10 <210> 248 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 248 Val His Lys Thr Val Leu Gly Lys Arg Lys Tyr Trp 1 5 10 <210> 249 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 249 Ser Ile Leu Gly Lys Arg Lys Asn Arg Asp Pro Ser 1 5 10 <210> 250 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 250 Gln Ser Val Leu Gly Lys Arg Lys Ser Arg Pro Phe 1 5 10 <210> 251 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 251 Thr Val His Leu Gly Lys Arg Arg Leu Arg Pro Trp 1 5 10 <210> 252 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 252 Arg Val Leu Gly Lys Arg Lys Thr Gly Arg Ser Pro 1 5 10 <210> 253 <211> 11 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 253 Val Leu Gly Lys Arg Lys Arg Asp Asp Cys Trp 1 5 10 <210> 254 <211> 11 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 254 His Gly Arg Gln Val Leu Gly Lys Arg Lys Arg 1 5 10 <210> 255 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 255 Ser Val Leu Gly Lys Arg Lys Arg His Pro Lys Val 1 5 10 <210> 256 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 256 Ser Val Leu Gly Lys Arg Lys Arg His His Leu Asp 1 5 10 <210> 257 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 257 Pro Val Leu Gly Lys Arg Lys Arg Ser Leu Ser Ser 1 5 10 <210> 258 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 258 Arg Val Leu Gly Lys Arg Lys Arg Glu Asp Arg Pro 1 5 10 <210> 259 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 259 Ile Leu Gly Lys Arg Lys Arg Ser His His Pro Tyr 1 5 10 <210> 260 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 260 Pro Ile Leu Gly Lys Arg Lys Arg His Leu Phe Leu 1 5 10 <210> 261 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 261 Leu Leu Gly Lys Arg Lys Arg Pro Ser Ile Glu His 1 5 10 <210> 262 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 262 Ser Met Leu Gly Lys Arg Lys Arg Cys Ile Ile Ser 1 5 10 <210> 263 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 263 Thr Leu Gly Lys Arg Lys Arg Ile Ser Cys Val Thr 1 5 10 <210> 264 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 264 Asp Thr Arg Leu Gly Lys Arg Lys Arg Arg Pro Trp 1 5 10 <210> 265 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> misc_feature <222> (1)..(12) <223> Xaa can be any naturally occurring amino acid <400> 265 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 <210> 266 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> misc_feature <222> (1)..(12) <223> Xaa can be any naturally occurring amino acid <400> 266 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 <210> 267 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> misc_feature <222> (1)..(12) <223> Xaa can be any naturally occurring amino acid <400> 267 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 <210> 268 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> misc_feature <222> (1)..(12) <223> Xaa can be any naturally occurring amino acid <400> 268 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 <210> 269 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> misc_feature <222> (1)..(12) <223> Xaa can be any naturally occurring amino acid <400> 269 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 <210> 270 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> misc_feature <222> (1)..(12) <223> Xaa can be any naturally occurring amino acid <400> 270 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 <210> 271 <211> 428 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 271 Met Ala Val Gly Ala Ser Gly Leu Glu Gly Asp Lys Met Ala Gly Ala 1 5 10 15 Met Pro Leu Gln Leu Leu Leu Leu Leu Ile Leu Leu Gly Pro Gly Asn 20 25 30 Ser Leu Gln Leu Trp Asp Thr Trp Ala Asp Glu Ala Glu Lys Ala Leu 35 40 45 Gly Pro Leu Leu Ala Arg Asp Arg Arg Gln Ala Thr Glu Tyr Glu Tyr 50 55 60 Leu Asp Tyr Asp Phe Leu Pro Glu Thr Glu Pro Pro Glu Met Leu Arg 65 70 75 80 Asn Ser Thr Asp Thr Thr Pro Leu Thr Gly Pro Gly Thr Pro Glu Ser 85 90 95 Thr Thr Val Glu Pro Ala Ala Arg Arg Ser Thr Gly Leu Asp Ala Gly 100 105 110 Gly Ala Val Thr Glu Leu Thr Thr Glu Leu Ala Asn Met Gly Asn Leu 115 120 125 Ser Thr Asp Ser Ala Ala Met Glu Ile Gln Thr Thr Gln Pro Ala Ala 130 135 140 Thr Glu Ala Gln Thr Thr Gln Pro Val Pro Thr Glu Ala Gln Thr Thr 145 150 155 160 Pro Leu Ala Ala Thr Glu Ala Gln Thr Thr Arg Leu Thr Ala Thr Glu 165 170 175 Ala Gln Thr Thr Pro Leu Ala Ala Thr Glu Ala Gln Thr Thr Pro Pro 180 185 190 Ala Ala Thr Glu Ala Gln Thr Thr Gln Pro Thr Gly Leu Glu Ala Gln 195 200 205 Thr Thr Ala Pro Ala Ala Met Glu Ala Gln Thr Thr Ala Pro Ala Ala 210 215 220 Met Glu Ala Gln Thr Thr Pro Pro Ala Ala Met Glu Ala Gln Thr Thr 225 230 235 240 Gln Thr Thr Ala Met Glu Ala Gln Thr Thr Ala Pro Glu Ala Thr Glu 245 250 255 Ala Gln Thr Thr Gln Pro Thr Ala Thr Glu Ala Gln Thr Thr Pro Leu 260 265 270 Ala Ala Met Glu Ala Leu Ser Thr Glu Pro Ser Ala Thr Glu Ala Leu 275 280 285 Ser Met Glu Pro Thr Thr Lys Arg Gly Leu Phe Ile Pro Phe Ser Val 290 295 300 Ser Ser Val Thr His Lys Gly Ile Pro Met Ala Ala Ser Asn Leu Ser 305 310 315 320 Val Asn Tyr Pro Val Gly Ala Pro Asp His Ile Ser Val Lys Gln Cys 325 330 335 Leu Leu Ala Ile Leu Ile Leu Ala Leu Val Ala Thr Ile Phe Phe Val 340 345 350 Cys Thr Val Val Leu Ala Val Arg Leu Ser Arg Lys Gly His Met Tyr 355 360 365 Pro Val Arg Asn Tyr Ser Pro Thr Glu Met Val Cys Ile Ser Ser Leu 370 375 380 Leu Pro Asp Gly Gly Glu Gly Pro Ser Ala Thr Ala Asn Gly Gly Leu 385 390 395 400 Ser Lys Ala Lys Ser Pro Gly Leu Thr Pro Glu Pro Arg Glu Asp Arg 405 410 415 Glu Gly Asp Asp Leu Thr Leu His Ser Phe Leu Pro 420 425 <210> 272 <211> 1203 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 272 Met Ala Ala Cys Gly Arg Val Arg Arg Met Phe Arg Leu Ser Ala Ala 1 5 10 15 Leu His Leu Leu Leu Leu Phe Ala Ala Gly Ala Glu Lys Leu Pro Gly 20 25 30 Gln Gly Val His Ser Gln Gly Gln Gly Pro Gly Ala Asn Phe Val Ser 35 40 45 Phe Val Gly Gln Ala Gly Gly Gly Gly Pro Ala Gly Gln Gln Leu Pro 50 55 60 Gln Leu Pro Gln Ser Ser Gln Leu Gln Gln Gln Gln Gln Gln Gln Gln 65 70 75 80 Gln Gln Gln Gln Pro Gln Pro Pro Gln Pro Pro Phe Pro Ala Gly Gly 85 90 95 Pro Pro Ala Arg Arg Gly Gly Ala Gly Ala Gly Gly Gly Trp Lys Leu 100 105 110 Ala Glu Glu Glu Ser Cys Arg Glu Asp Val Thr Arg Val Cys Pro Lys 115 120 125 His Thr Trp Ser Asn Asn Leu Ala Val Leu Glu Cys Leu Gln Asp Val 130 135 140 Arg Glu Pro Glu Asn Glu Ile Ser Ser Asp Cys Asn His Leu Leu Trp 145 150 155 160 Asn Tyr Lys Leu Asn Leu Thr Thr Asp Pro Lys Phe Glu Ser Val Ala 165 170 175 Arg Glu Val Cys Lys Ser Thr Ile Thr Glu Ile Lys Glu Cys Ala Asp 180 185 190 Glu Pro Val Gly Lys Gly Tyr Met Val Ser Cys Leu Val Asp His Arg 195 200 205 Gly Asn Ile Thr Glu Tyr Gln Cys His Gln Tyr Ile Thr Lys Met Thr 210 215 220 Ala Ile Ile Phe Ser Asp Tyr Arg Leu Ile Cys Gly Phe Met Asp Asp 225 230 235 240 Cys Lys Asn Asp Ile Asn Ile Leu Lys Cys Gly Ser Ile Arg Leu Gly 245 250 255 Glu Lys Asp Ala His Ser Gln Gly Glu Val Val Ser Cys Leu Glu Lys 260 265 270 Gly Leu Val Lys Glu Ala Glu Glu Arg Glu Pro Lys Ile Gln Val Ser 275 280 285 Glu Leu Cys Lys Lys Ala Ile Leu Arg Val Ala Glu Leu Ser Ser Asp 290 295 300 Asp Phe His Leu Asp Arg His Leu Tyr Phe Ala Cys Arg Asp Asp Arg 305 310 315 320 Glu Arg Phe Cys Glu Asn Thr Gln Ala Gly Glu Gly Arg Val Tyr Lys 325 330 335 Cys Leu Phe Asn His Lys Phe Glu Glu Ser Met Ser Glu Lys Cys Arg 340 345 350 Glu Ala Leu Thr Thr Arg Gln Lys Leu Ile Ala Gln Asp Tyr Lys Val 355 360 365 Ser Tyr Ser Leu Ala Lys Ser Cys Lys Ser Asp Leu Lys Lys Tyr Arg 370 375 380 Cys Asn Val Glu Asn Leu Pro Arg Ser Arg Glu Ala Arg Leu Ser Tyr 385 390 395 400 Leu Leu Met Cys Leu Glu Ser Ala Val His Arg Gly Arg Gln Val Ser 405 410 415 Ser Glu Cys Gln Gly Glu Met Leu Asp Tyr Arg Arg Met Leu Met Glu 420 425 430 Asp Phe Ser Leu Ser Pro Glu Ile Ile Leu Ser Cys Arg Gly Glu Ile 435 440 445 Glu His His Cys Ser Gly Leu His Arg Lys Gly Arg Thr Leu His Cys 450 455 460 Leu Met Lys Val Val Arg Gly Glu Lys Gly Asn Leu Gly Met Asn Cys 465 470 475 480 Gln Gln Ala Leu Gln Thr Leu Ile Gln Glu Thr Asp Pro Gly Ala Asp 485 490 495 Tyr Arg Ile Asp Arg Ala Leu Asn Glu Ala Cys Glu Ser Val Ile Gln 500 505 510 Thr Ala Cys Lys His Ile Arg Ser Gly Asp Pro Met Ile Leu Ser Cys 515 520 525 Leu Met Glu His Leu Tyr Thr Glu Lys Met Val Glu Asp Cys Glu His 530 535 540 Arg Leu Leu Glu Leu Gln Tyr Phe Ile Ser Arg Asp Trp Lys Leu Asp 545 550 555 560 Pro Val Leu Tyr Arg Lys Cys Gln Gly Asp Ala Ser Arg Leu Cys His 565 570 575 Thr His Gly Trp Asn Glu Thr Ser Glu Phe Met Pro Gln Gly Ala Val 580 585 590 Phe Ser Cys Leu Tyr Arg His Ala Tyr Arg Thr Glu Glu Gln Gly Arg 595 600 605 Arg Leu Ser Arg Glu Cys Arg Ala Glu Val Gln Arg Ile Leu His Gln 610 615 620 Arg Ala Met Asp Val Lys Leu Asp Pro Ala Leu Gln Asp Lys Cys Leu 625 630 635 640 Ile Asp Leu Gly Lys Trp Cys Ser Glu Lys Thr Glu Thr Gly Gln Glu 645 650 655 Leu Glu Cys Leu Gln Asp His Leu Asp Asp Leu Val Val Glu Cys Arg 660 665 670 Asp Ile Val Gly Asn Leu Thr Glu Leu Glu Ser Glu Asp Ile Gln Ile 675 680 685 Glu Ala Leu Leu Met Arg Ala Cys Glu Pro Ile Ile Gln Asn Phe Cys 690 695 700 His Asp Val Ala Asp Asn Gln Ile Asp Ser Gly Asp Leu Met Glu Cys 705 710 715 720 Leu Ile Gln Asn Lys His Gln Lys Asp Met Asn Glu Lys Cys Ala Ile 725 730 735 Gly Val Thr His Phe Gln Leu Val Gln Met Lys Asp Phe Arg Phe Ser 740 745 750 Tyr Lys Phe Lys Met Ala Cys Lys Glu Asp Val Leu Lys Leu Cys Pro 755 760 765 Asn Ile Lys Lys Lys Val Asp Val Val Ile Cys Leu Ser Thr Thr Val 770 775 780 Arg Asn Asp Thr Leu Gln Glu Ala Lys Glu His Arg Val Ser Leu Lys 785 790 795 800 Cys Arg Arg Gln Leu Arg Val Glu Glu Leu Glu Met Thr Glu Asp Ile 805 810 815 Arg Leu Glu Pro Asp Leu Tyr Glu Ala Cys Lys Ser Asp Ile Lys Asn 820 825 830 Phe Cys Ser Ala Val Gln Tyr Gly Asn Ala Gln Ile Ile Glu Cys Leu 835 840 845 Lys Glu Asn Lys Lys Gln Leu Ser Thr Arg Cys His Gln Lys Val Phe 850 855 860 Lys Leu Gln Glu Thr Glu Met Met Asp Pro Glu Leu Asp Tyr Thr Leu 865 870 875 880 Met Arg Val Cys Lys Gln Met Ile Lys Arg Phe Cys Pro Glu Ala Asp 885 890 895 Ser Lys Thr Met Leu Gln Cys Leu Lys Gln Asn Lys Asn Ser Glu Leu 900 905 910 Met Asp Pro Lys Cys Lys Gln Met Ile Thr Lys Arg Gln Ile Thr Gln 915 920 925 Asn Thr Asp Tyr Arg Leu Asn Pro Met Leu Arg Lys Ala Cys Lys Ala 930 935 940 Asp Ile Pro Lys Phe Cys His Gly Ile Leu Thr Lys Ala Lys Asp Asp 945 950 955 960 Ser Glu Leu Glu Gly Gln Val Ile Ser Cys Leu Lys Leu Arg Tyr Ala 965 970 975 Asp Gln Arg Leu Ser Ser Asp Cys Glu Asp Gln Ile Arg Ile Ile Ile 980 985 990 Gln Glu Ser Ala Leu Asp Tyr Arg Leu Asp Pro Gln Leu Gln Leu His 995 1000 1005 Cys Ser Asp Glu Ile Ser Ser Leu Cys Ala Glu Glu Ala Ala Ala 1010 1015 1020 Gln Glu Gln Thr Gly Gln Val Glu Glu Cys Leu Lys Val Asn Leu 1025 1030 1035 Leu Lys Ile Lys Thr Glu Leu Cys Lys Lys Glu Val Leu Asn Met 1040 1045 1050 Leu Lys Glu Ser Lys Ala Asp Ile Phe Val Asp Pro Val Leu His 1055 1060 1065 Thr Ala Cys Ala Leu Asp Ile Lys His His Cys Ala Ala Ile Thr 1070 1075 1080 Pro Gly Arg Gly Arg Gln Met Ser Cys Leu Met Glu Ala Leu Glu 1085 1090 1095 Asp Lys Arg Val Arg Leu Gln Pro Glu Cys Lys Lys Arg Leu Asn 1100 1105 1110 Asp Arg Ile Glu Met Trp Ser Tyr Ala Ala Lys Val Ala Pro Ala 1115 1120 1125 Asp Gly Phe Ser Asp Leu Ala Met Gln Val Met Thr Ser Pro Ser 1130 1135 1140 Lys Asn Tyr Ile Leu Ser Val Ile Ser Gly Ser Ile Cys Ile Leu 1145 1150 1155 Phe Leu Ile Gly Leu Met Cys Gly Arg Ile Thr Lys Arg Val Thr 1160 1165 1170 Arg Glu Leu Lys Asp Arg Leu Gln Tyr Arg Ser Glu Thr Met Ala 1175 1180 1185 Tyr Lys Gly Leu Val Trp Ser Gln Asp Val Thr Gly Ser Pro Ala 1190 1195 1200 <210> 273 <211> 742 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 273 Met Asp Lys Phe Trp Trp His Ala Ala Trp Gly Leu Cys Leu Val Pro 1 5 10 15 Leu Ser Leu Ala Gln Ile Asp Leu Asn Ile Thr Cys Arg Phe Ala Gly 20 25 30 Val Phe His Val Glu Lys Asn Gly Arg Tyr Ser Ile Ser Arg Thr Glu 35 40 45 Ala Ala Asp Leu Cys Lys Ala Phe Asn Ser Thr Leu Pro Thr Met Ala 50 55 60 Gln Met Glu Lys Ala Leu Ser Ile Gly Phe Glu Thr Cys Arg Tyr Gly 65 70 75 80 Phe Ile Glu Gly His Val Val Ile Pro Arg Ile His Pro Asn Ser Ile 85 90 95 Cys Ala Ala Asn Asn Thr Gly Val Tyr Ile Leu Thr Ser Asn Thr Ser 100 105 110 Gln Tyr Asp Thr Tyr Cys Phe Asn Ala Ser Ala Pro Pro Glu Glu Asp 115 120 125 Cys Thr Ser Val Thr Asp Leu Pro Asn Ala Phe Asp Gly Pro Ile Thr 130 135 140 Ile Thr Ile Val Asn Arg Asp Gly Thr Arg Tyr Val Gln Lys Gly Glu 145 150 155 160 Tyr Arg Thr Asn Pro Glu Asp Ile Tyr Pro Ser Asn Pro Thr Asp Asp 165 170 175 Asp Val Ser Ser Gly Ser Ser Ser Glu Arg Ser Ser Thr Ser Gly Gly 180 185 190 Tyr Ile Phe Tyr Thr Phe Ser Thr Val His Pro Ile Pro Asp Glu Asp 195 200 205 Ser Pro Trp Ile Thr Asp Ser Thr Asp Arg Ile Pro Ala Thr Thr Leu 210 215 220 Met Ser Thr Ser Ala Thr Ala Thr Glu Thr Ala Thr Lys Arg Gln Glu 225 230 235 240 Thr Trp Asp Trp Phe Ser Trp Leu Phe Leu Pro Ser Glu Ser Lys Asn 245 250 255 His Leu His Thr Thr Thr Gln Met Ala Gly Thr Ser Ser Asn Thr Ile 260 265 270 Ser Ala Gly Trp Glu Pro Asn Glu Glu Asn Glu Asp Glu Arg Asp Arg 275 280 285 His Leu Ser Phe Ser Gly Ser Gly Ile Asp Asp Asp Glu Asp Phe Ile 290 295 300 Ser Ser Thr Ile Ser Thr Thr Pro Arg Ala Phe Asp His Thr Lys Gln 305 310 315 320 Asn Gln Asp Trp Thr Gln Trp Asn Pro Ser His Ser Asn Pro Glu Val 325 330 335 Leu Leu Gln Thr Thr Thr Arg Met Thr Asp Val Asp Arg Asn Gly Thr 340 345 350 Thr Ala Tyr Glu Gly Asn Trp Asn Pro Glu Ala His Pro Pro Leu Ile 355 360 365 His His Glu His His Glu Glu Glu Glu Thr Pro His Ser Thr Ser Thr 370 375 380 Ile Gln Ala Thr Pro Ser Ser Thr Thr Glu Glu Thr Ala Thr Gln Lys 385 390 395 400 Glu Gln Trp Phe Gly Asn Arg Trp His Glu Gly Tyr Arg Gln Thr Pro 405 410 415 Lys Glu Asp Ser His Ser Thr Thr Gly Thr Ala Ala Ala Ser Ala His 420 425 430 Thr Ser His Pro Met Gln Gly Arg Thr Thr Pro Ser Pro Glu Asp Ser 435 440 445 Ser Trp Thr Asp Phe Phe Asn Pro Ile Ser His Pro Met Gly Arg Gly 450 455 460 His Gln Ala Gly Arg Arg Met Asp Met Asp Ser Ser His Ser Ile Thr 465 470 475 480 Leu Gln Pro Thr Ala Asn Pro Asn Thr Gly Leu Val Glu Asp Leu Asp 485 490 495 Arg Thr Gly Pro Leu Ser Met Thr Thr Gln Gln Ser Asn Ser Gln Ser 500 505 510 Phe Ser Thr Ser His Glu Gly Leu Glu Glu Asp Lys Asp His Pro Thr 515 520 525 Thr Ser Thr Leu Thr Ser Ser Asn Arg Asn Asp Val Thr Gly Gly Arg 530 535 540 Arg Asp Pro Asn His Ser Glu Gly Ser Thr Thr Leu Leu Glu Gly Tyr 545 550 555 560 Thr Ser His Tyr Pro His Thr Lys Glu Ser Arg Thr Phe Ile Pro Val 565 570 575 Thr Ser Ala Lys Thr Gly Ser Phe Gly Val Thr Ala Val Thr Val Gly 580 585 590 Asp Ser Asn Ser Asn Val Asn Arg Ser Leu Ser Gly Asp Gln Asp Thr 595 600 605 Phe His Pro Ser Gly Gly Ser His Thr Thr His Gly Ser Glu Ser Asp 610 615 620 Gly His Ser His Gly Ser Gln Glu Gly Gly Ala Asn Thr Thr Ser Gly 625 630 635 640 Pro Ile Arg Thr Pro Gln Ile Pro Glu Trp Leu Ile Ile Leu Ala Ser 645 650 655 Leu Leu Ala Leu Ala Leu Ile Leu Ala Val Cys Ile Ala Val Asn Ser 660 665 670 Arg Arg Arg Cys Gly Gln Lys Lys Lys Leu Val Ile Asn Ser Gly Asn 675 680 685 Gly Ala Val Glu Asp Arg Lys Pro Ser Gly Leu Asn Gly Glu Ala Ser 690 695 700 Lys Ser Gln Glu Met Val His Leu Val Asn Lys Glu Ser Ser Glu Thr 705 710 715 720 Pro Asp Gln Phe Met Thr Ala Asp Glu Thr Arg Asn Leu Gln Asn Val 725 730 735 Asp Met Lys Ile Gly Val 740 <210> 274 <211> 426 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 274 Met Glu Gln Arg Pro Arg Gly Cys Ala Ala Val Ala Ala Ala Leu Leu 1 5 10 15 Leu Val Leu Leu Gly Ala Arg Ala Gln Gly Gly Thr Arg Ser Pro Arg 20 25 30 Cys Asp Cys Ala Gly Asp Phe His Lys Lys Ile Gly Leu Phe Cys Cys 35 40 45 Arg Gly Cys Pro Ala Gly His Tyr Leu Lys Ala Pro Cys Thr Glu Pro 50 55 60 Cys Gly Asn Ser Thr Cys Leu Val Cys Pro Gln Asp Thr Phe Leu Ala 65 70 75 80 Trp Glu Asn His His Asn Ser Glu Cys Ala Arg Cys Gln Ala Cys Asp 85 90 95 Glu Gln Ala Ser Gln Val Ala Leu Glu Asn Cys Ser Ala Val Ala Asp 100 105 110 Thr Arg Cys Gly Cys Lys Pro Gly Trp Phe Val Glu Cys Gln Val Ser 115 120 125 Gln Cys Val Ser Ser Ser Pro Phe Tyr Cys Gln Pro Cys Leu Asp Cys 130 135 140 Gly Ala Leu His Arg His Thr Arg Leu Leu Cys Ser Arg Arg Asp Thr 145 150 155 160 Asp Cys Gly Thr Cys Leu Pro Gly Phe Tyr Glu His Gly Asp Gly Cys 165 170 175 Val Ser Cys Pro Thr Pro Pro Pro Ser Leu Ala Gly Ala Pro Trp Gly 180 185 190 Ala Val Gln Ser Ala Val Pro Leu Ser Val Ala Gly Gly Arg Val Gly 195 200 205 Val Phe Trp Val Gln Val Leu Leu Ala Gly Leu Val Val Pro Leu Leu 210 215 220 Leu Gly Ala Thr Leu Thr Tyr Thr Tyr Arg His Cys Trp Pro His Lys 225 230 235 240 Pro Leu Val Thr Ala Asp Glu Ala Gly Met Glu Ala Leu Thr Pro Pro 245 250 255 Pro Ala Thr His Leu Ser Pro Leu Asp Ser Ala His Thr Leu Leu Ala 260 265 270 Pro Pro Asp Ser Ser Glu Lys Ile Cys Thr Val Gln Leu Val Gly Asn 275 280 285 Ser Trp Thr Pro Gly Tyr Pro Glu Thr Gln Glu Ala Leu Cys Pro Gln 290 295 300 Val Thr Trp Ser Trp Asp Gln Leu Pro Ser Arg Ala Leu Gly Pro Ala 305 310 315 320 Ala Ala Pro Thr Leu Ser Pro Glu Ser Pro Ala Gly Ser Pro Ala Met 325 330 335 Met Leu Gln Pro Gly Pro Gln Leu Tyr Asp Val Met Asp Ala Val Pro 340 345 350 Ala Arg Arg Trp Lys Glu Phe Val Arg Thr Leu Gly Leu Arg Glu Ala 355 360 365 Glu Ile Glu Ala Val Glu Val Glu Ile Gly Arg Phe Arg Asp Gln Gln 370 375 380 Tyr Glu Met Leu Lys Arg Trp Arg Gln Gln Gln Pro Ala Gly Leu Gly 385 390 395 400 Ala Val Tyr Ala Ala Leu Glu Arg Met Gly Leu Asp Gly Cys Val Glu 405 410 415 Asp Leu Arg Ser Arg Leu Gln Arg Gly Pro 420 425 <210> 275 <211> 417 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 275 Met Ala Ala Pro Gly Ser Ala Arg Arg Pro Leu Leu Leu Leu Leu Leu 1 5 10 15 Leu Leu Leu Leu Gly Leu Met His Cys Ala Ser Ala Ala Met Phe Met 20 25 30 Val Lys Asn Gly Asn Gly Thr Ala Cys Ile Met Ala Asn Phe Ser Ala 35 40 45 Ala Phe Ser Val Asn Tyr Asp Thr Lys Ser Gly Pro Lys Asn Met Thr 50 55 60 Phe Asp Leu Pro Ser Asp Ala Thr Val Val Leu Asn Arg Ser Ser Cys 65 70 75 80 Gly Lys Glu Asn Thr Ser Asp Pro Ser Leu Val Ile Ala Phe Gly Arg 85 90 95 Gly His Thr Leu Thr Leu Asn Phe Thr Arg Asn Ala Thr Arg Tyr Ser 100 105 110 Val Gln Leu Met Ser Phe Val Tyr Asn Leu Ser Asp Thr His Leu Phe 115 120 125 Pro Asn Ala Ser Ser Lys Glu Ile Lys Thr Val Glu Ser Ile Thr Asp 130 135 140 Ile Arg Ala Asp Ile Asp Lys Lys Tyr Arg Cys Val Ser Gly Thr Gln 145 150 155 160 Val His Met Asn Asn Val Thr Val Thr Leu His Asp Ala Thr Ile Gln 165 170 175 Ala Tyr Leu Ser Asn Ser Ser Phe Ser Arg Gly Glu Thr Arg Cys Glu 180 185 190 Gln Asp Arg Pro Ser Pro Thr Thr Ala Pro Pro Ala Pro Pro Ser Pro 195 200 205 Ser Pro Ser Pro Val Pro Lys Ser Pro Ser Val Asp Lys Tyr Asn Val 210 215 220 Ser Gly Thr Asn Gly Thr Cys Leu Leu Ala Ser Met Gly Leu Gln Leu 225 230 235 240 Asn Leu Thr Tyr Glu Arg Lys Asp Asn Thr Thr Val Thr Arg Leu Leu 245 250 255 Asn Ile Asn Pro Asn Lys Thr Ser Ala Ser Gly Ser Cys Gly Ala His 260 265 270 Leu Val Thr Leu Glu Leu His Ser Glu Gly Thr Thr Val Leu Leu Phe 275 280 285 Gln Phe Gly Met Asn Ala Ser Ser Ser Arg Phe Phe Leu Gln Gly Ile 290 295 300 Gln Leu Asn Thr Ile Leu Pro Asp Ala Arg Asp Pro Ala Phe Lys Ala 305 310 315 320 Ala Asn Gly Ser Leu Arg Ala Leu Gln Ala Thr Val Gly Asn Ser Tyr 325 330 335 Lys Cys Asn Ala Glu Glu His Val Arg Val Thr Lys Ala Phe Ser Val 340 345 350 Asn Ile Phe Lys Val Trp Val Gln Ala Phe Lys Val Glu Gly Gly Gln 355 360 365 Phe Gly Ser Val Glu Glu Cys Leu Leu Asp Glu Asn Ser Met Leu Ile 370 375 380 Pro Ile Ala Val Gly Gly Ala Leu Ala Gly Leu Val Leu Ile Val Leu 385 390 395 400 Ile Ala Tyr Leu Val Gly Arg Lys Arg Ser His Ala Gly Tyr Gln Thr 405 410 415 Ile <210> 276 <211> 410 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 276 Met Val Cys Phe Arg Leu Phe Pro Val Pro Gly Ser Gly Leu Val Leu 1 5 10 15 Val Cys Leu Val Leu Gly Ala Val Arg Ser Tyr Ala Leu Glu Leu Asn 20 25 30 Leu Thr Asp Ser Glu Asn Ala Thr Cys Leu Tyr Ala Lys Trp Gln Met 35 40 45 Asn Phe Thr Val Arg Tyr Glu Thr Thr Asn Lys Thr Tyr Lys Thr Val 50 55 60 Thr Ile Ser Asp His Gly Thr Val Thr Tyr Asn Gly Ser Ile Cys Gly 65 70 75 80 Asp Asp Gln Asn Gly Pro Lys Ile Ala Val Gln Phe Gly Pro Gly Phe 85 90 95 Ser Trp Ile Ala Asn Phe Thr Lys Ala Ala Ser Thr Tyr Ser Ile Asp 100 105 110 Ser Val Ser Phe Ser Tyr Asn Thr Gly Asp Asn Thr Thr Phe Pro Asp 115 120 125 Ala Glu Asp Lys Gly Ile Leu Thr Val Asp Glu Leu Leu Ala Ile Arg 130 135 140 Ile Pro Leu Asn Asp Leu Phe Arg Cys Asn Ser Leu Ser Thr Leu Glu 145 150 155 160 Lys Asn Asp Val Val Gln His Tyr Trp Asp Val Leu Val Gln Ala Phe 165 170 175 Val Gln Asn Gly Thr Val Ser Thr Asn Glu Phe Leu Cys Asp Lys Asp 180 185 190 Lys Thr Ser Thr Val Ala Pro Thr Ile His Thr Thr Val Pro Ser Pro 195 200 205 Thr Thr Thr Pro Thr Pro Lys Glu Lys Pro Glu Ala Gly Thr Tyr Ser 210 215 220 Val Asn Asn Gly Asn Asp Thr Cys Leu Leu Ala Thr Met Gly Leu Gln 225 230 235 240 Leu Asn Ile Thr Gln Asp Lys Val Ala Ser Val Ile Asn Ile Asn Pro 245 250 255 Asn Thr Thr His Ser Thr Gly Ser Cys Arg Ser His Thr Ala Leu Leu 260 265 270 Arg Leu Asn Ser Ser Thr Ile Lys Tyr Leu Asp Phe Val Phe Ala Val 275 280 285 Lys Asn Glu Asn Arg Phe Tyr Leu Lys Glu Val Asn Ile Ser Met Tyr 290 295 300 Leu Val Asn Gly Ser Val Phe Ser Ile Ala Asn Asn Asn Leu Ser Tyr 305 310 315 320 Trp Asp Ala Pro Leu Gly Ser Ser Tyr Met Cys Asn Lys Glu Gln Thr 325 330 335 Val Ser Val Ser Gly Ala Phe Gln Ile Asn Thr Phe Asp Leu Arg Val 340 345 350 Gln Pro Phe Asn Val Thr Gln Gly Lys Tyr Ser Thr Ala Gln Asp Cys 355 360 365 Ser Ala Asp Asp Asp Asn Phe Leu Val Pro Ile Ala Val Gly Ala Ala 370 375 380 Leu Ala Gly Val Leu Ile Leu Val Leu Leu Ala Tyr Phe Ile Gly Leu 385 390 395 400 Lys His His His Ala Gly Tyr Glu Gln Phe 405 410 <210> 277 <211> 585 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 277 Met Thr Pro Pro Arg Leu Phe Trp Val Trp Leu Leu Val Ala Gly Thr 1 5 10 15 Gln Gly Val Asn Asp Gly Asp Met Arg Leu Ala Asp Gly Gly Ala Thr 20 25 30 Asn Gln Gly Arg Val Glu Ile Phe Tyr Arg Gly Gln Trp Gly Thr Val 35 40 45 Cys Asp Asn Leu Trp Asp Leu Thr Asp Ala Ser Val Val Cys Arg Ala 50 55 60 Leu Gly Phe Glu Asn Ala Thr Gln Ala Leu Gly Arg Ala Ala Phe Gly 65 70 75 80 Gln Gly Ser Gly Pro Ile Met Leu Asp Glu Val Gln Cys Thr Gly Thr 85 90 95 Glu Ala Ser Leu Ala Asp Cys Lys Ser Leu Gly Trp Leu Lys Ser Asn 100 105 110 Cys Arg His Glu Arg Asp Ala Gly Val Val Cys Thr Asn Glu Thr Arg 115 120 125 Ser Thr His Thr Leu Asp Leu Ser Arg Glu Leu Ser Glu Ala Leu Gly 130 135 140 Gln Ile Phe Asp Ser Gln Arg Gly Cys Asp Leu Ser Ile Ser Val Asn 145 150 155 160 Val Gln Gly Glu Asp Ala Leu Gly Phe Cys Gly His Thr Val Ile Leu 165 170 175 Thr Ala Asn Leu Glu Ala Gln Ala Leu Trp Lys Glu Pro Gly Ser Asn 180 185 190 Val Thr Met Ser Val Asp Ala Glu Cys Val Pro Met Val Arg Asp Leu 195 200 205 Leu Arg Tyr Phe Tyr Ser Arg Arg Ile Asp Ile Thr Leu Ser Ser Val 210 215 220 Lys Cys Phe His Lys Leu Ala Ser Ala Tyr Gly Ala Arg Gln Leu Gln 225 230 235 240 Gly Tyr Cys Ala Ser Leu Phe Ala Ile Leu Leu Pro Gln Asp Pro Ser 245 250 255 Phe Gln Met Pro Leu Asp Leu Tyr Ala Tyr Ala Val Ala Thr Gly Asp 260 265 270 Ala Leu Leu Glu Lys Leu Cys Leu Gln Phe Leu Ala Trp Asn Phe Glu 275 280 285 Ala Leu Thr Gln Ala Glu Ala Trp Pro Ser Val Pro Thr Asp Leu Leu 290 295 300 Gln Leu Leu Leu Pro Arg Ser Asp Leu Ala Val Pro Ser Glu Leu Ala 305 310 315 320 Leu Leu Lys Ala Val Asp Thr Trp Ser Trp Gly Glu Arg Ala Ser His 325 330 335 Glu Glu Val Glu Gly Leu Val Glu Lys Ile Arg Phe Pro Met Met Leu 340 345 350 Pro Glu Glu Leu Phe Glu Leu Gln Phe Asn Leu Ser Leu Tyr Trp Ser 355 360 365 His Glu Ala Leu Phe Gln Lys Lys Thr Leu Gln Ala Leu Glu Phe His 370 375 380 Thr Val Pro Phe Gln Leu Leu Ala Arg Tyr Lys Gly Leu Asn Leu Thr 385 390 395 400 Glu Asp Thr Tyr Lys Pro Arg Ile Tyr Thr Ser Pro Thr Trp Ser Ala 405 410 415 Phe Val Thr Asp Ser Ser Trp Ser Ala Arg Lys Ser Gln Leu Val Tyr 420 425 430 Gln Ser Arg Arg Gly Pro Leu Val Lys Tyr Ser Ser Asp Tyr Phe Gln 435 440 445 Ala Pro Ser Asp Tyr Arg Tyr Tyr Pro Tyr Gln Ser Phe Gln Thr Pro 450 455 460 Gln His Pro Ser Phe Leu Phe Gln Asp Lys Arg Val Ser Trp Ser Leu 465 470 475 480 Val Tyr Leu Pro Thr Ile Gln Ser Cys Trp Asn Tyr Gly Phe Ser Cys 485 490 495 Ser Ser Asp Glu Leu Pro Val Leu Gly Leu Thr Lys Ser Gly Gly Ser 500 505 510 Asp Arg Thr Ile Ala Tyr Glu Asn Lys Ala Leu Met Leu Cys Glu Gly 515 520 525 Leu Phe Val Ala Asp Val Thr Asp Phe Glu Gly Trp Lys Ala Ala Ile 530 535 540 Pro Ser Ala Leu Asp Thr Asn Ser Ser Lys Ser Thr Ser Ser Phe Pro 545 550 555 560 Cys Pro Ala Gly His Phe Asn Gly Phe Arg Thr Val Ile Arg Pro Phe 565 570 575 Tyr Leu Thr Asn Ser Ser Gly Val Asp 580 585 <210> 278 <211> 24 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 278 catgtgcaaa cgccttcaac aaca 24 <210> 279 <211> 24 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 279 cttctctatg tttccatgaa gatg 24 <210> 280 <211> 24 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 280 ggtgtgggag atctctgctt ctga 24 <210> 281 <211> 24 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 281 cagatgggct gaagtctcca ctgt 24 <210> 282 <211> 20 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 282 gagaatcaaa atcggtgaat 20 <210> 283 <211> 20 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 283 aacaaatgtg tcacaaagta 20 <210> 284 <211> 20 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 284 gagccactgt agtctgcaga 20 <210> 285 <211> 20 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 285 ggaaccgggg atgcagtgcc 20 <210> 286 <211> 20 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 286 caaacacagc gacctcgggt 20 <210> 287 <211> 20 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 287 agagatctcc cacacccaaa 20 <210> 288 <211> 20 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 288 ccctgagaca ggggctgctt 20 <210> 289 <211> 20 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 289 ggaagcacac ccagacgaca 20 <210> 290 <211> 19 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 290 tgccgtgtac cagctgaga 19 <210> 291 <211> 19 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 291 tcggtgaata ggcagacag 19 <210> 292 <211> 18 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 292 tggagatagg gacctcac 18 <210> 293 <211> 18 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 293 tgaggccagg aactggag 18 <210> 294 <211> 18 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 294 tgaacaaggt gttcccac 18 <210> 295 <211> 18 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 295 tctgcttctg atggctca 18 <210> 296 <211> 18 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 296 tgtctcaggg ccagggaa 18 <210> 297 <211> 18 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 297 tccctgctct gtgtcctt 18 <210> 298 <211> 174 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 298 agtcacccaa gtgtggtcta atataaatcc tgtgttcctg aggtcatgca gattgagaga 60 ggaagtgatg tcactgtggg aacttccgtg taaggacggg gcgtccctcc tcctctgctc 120 ctgctcacag tgatcctgat ctggtaagag ctcccatcct gccctgaccc tgcc 174 <210> 299 <211> 20 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 299 catgtgcaaa cgccttcaac 20 <210> 300 <211> 24 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 300 ggtgtgggag atctctgctt ctga 24 <210> 301 <211> 20 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 301 tttgagaatc aaaatcggtg 20 <210> 302 <211> 28 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 302 gttgcttatc gtcatcgtct ttgtaatc 28 <210> 303 <211> 28 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 303 tctgcttatc gtcatcgtct ttgtaatc 28 <210> 304 <211> 28 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 304 gaatcttatc gtcatcgtct ttgtaatc 28 <210> 305 <211> 28 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 305 caacgattac aaagacgatg acgataag 28 <210> 306 <211> 28 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 306 cagagattac aaagacgatg acgataag 28 <210> 307 <211> 28 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 307 attcgattac aaagacgatg acgataag 28 <210> 308 <211> 31 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 308 tttgcatgtg caaacgcctt caacaacagc a 31 <210> 309 <211> 12 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 309 tgctgttgtt ga 12 <210> 310 <211> 23 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 310 tttgcatgtg caaacgcctt caa 23 <210> 311 <211> 13 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 311 Asn Pro Lys Leu Thr Arg Met Leu Thr Phe Lys Phe Tyr 1 5 10 <210> 312 <211> 14 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 312 Thr Ser Val Gly Lys Tyr Pro Asn Thr Gly Tyr Tyr Gly Asp 1 5 10 <210> 313 <211> 8 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 313 Ser Asn Arg Trp Leu Asp Val Lys 1 5 <210> 314 <211> 7 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 314 Asn Phe Tyr Leu Tyr Arg Ala 1 5 <210> 315 <211> 10 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 315 Arg Tyr Pro Leu Thr Phe Gly Trp Cys Phe 1 5 10 <210> 316 <211> 12 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 316 Val Val Leu Lys Tyr Glu Lys Asp Ala Phe Lys Arg 1 5 10 <210> 317 <211> 24 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 317 Ser Asn Tyr Ser Ile Ile Asp Lys Leu Val Asn Ile Val Asp Asp Leu 1 5 10 15 Val Glu Cys Val Lys Glu Asn Ser 20 <210> 318 <211> 24 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <220> <221> MISC_FEATURE <222> (1)..(1) <223> The amino acid at position 1 is attached to an acetyl group <220> <221> MISC_FEATURE <222> (5)..(5) <223> The amino acid at position 5 is aminoisobutyric acid <220> <221> MISC_FEATURE <222> (9)..(9) <223> The amino acid at position 9 is aminoisobutyric acid <220> <221> MISC_FEATURE <222> (12)..(12) <223> The amino acid at position 12 is aminoisobutyric acid <220> <221> MISC_FEATURE <222> (16)..(16) <223> The amino acid at position 16 is aminoisobutyric acid <220> <221> MISC_FEATURE <222> (19)..(19) <223> The amino acid at position 19 is aminoisobutyric acid <400> 318 Ser Asn Tyr Ser Xaa Ala Asp Lys Xaa Ala Asn Xaa Ala Asp Asp Xaa 1 5 10 15 Ala Glu Xaa Ala Lys Glu Asn Ser 20 <210> 319 <211> 7 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 319 Glu Asn Leu Val Leu Asn Glu 1 5 <210> 320 <211> 44 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 320 taatttctac tcttgtagat catgtgcaaa cgccttcaac aaca 44 <210> 321 <211> 40 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 321 taatttctac tcttgtagat catgtgcaaa cgccttcaac 40 <210> 322 <211> 40 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 322 taatttctac tcttgtagat tttgagaatc aaaatcggtg 40 <210> 323 <211> 774 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 323 ggctccggcg agggcagggg aagtctacta acatgcgggg acgtggagga aaatcccggc 60 ccaagcaaag gagaagaact tttcactgga gttgtcccaa ttcttgttga attagatggt 120 gatgttaatg ggcacaaatt ttctgtccgt ggagagggtg aaggtgatgc tacaaacgga 180 aaactcaccc ttaaatttat ttgcactact ggaaaactac ctgttccgtg gccaacactt 240 gtcactactc tgacctatgg tgttcaatgc ttttcccgtt atccggatca catgaaacgg 300 catgactttt tcaagagtgc catgcccgaa ggttatgtac aggaacgcac tatatctttc 360 aaagatgacg ggacctacaa gacgcgtgct gaagtcaagt ttgaaggtga tacccttgtt 420 aatcgtatcg agttaaaggg tattgatttt aaagaagatg gaaacattct tggacacaaa 480 ctcgagtaca actttaactc acacaatgta tacatcacgg cagacaaaca aaagaatgga 540 atcaaagcta acttcaaaat tcgccacaac gttgaagatg gttccgttca actagcagac 600 cattatcaac aaaatactcc aattggcgat ggccctgtcc ttttaccaga caaccattac 660 ctgtcgacac aatctgtcct ttcgaaagat cccaacgaaa agcgtgacca catggtcctt 720 cttgagtttg taactgctgc tgggattaca catggcatgg atgagctcta caaa 774 <210> 324 <211> 778 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 324 cagatttgta gagctcatcc atgccatgtg taatcccagc agcagttaca aactcaagaa 60 ggaccatgtg gtcacgcttt tcgttgggat ctttcgaaag gacagattgt gtcgacaggt 120 aatggttgtc tggtaaaagg acagggccat cgccaattgg agtattttgt tgataatggt 180 ctgctagttg aacggaacca tcttcaacgt tgtggcgaat tttgaagtta gctttgattc 240 cattcttttg tttgtctgcc gtgatgtata cattgtgtga gttaaagttg tactcgagtt 300 tgtgtccaag aatgtttcca tcttctttaa aatcaatacc ctttaactcg atacgattaa 360 caagggtatc accttcaaac ttgacttcag cacgcgtctt gtaggtcccg tcatctttga 420 aagatatagt gcgttcctgt acataacctt cgggcatggc actcttgaaa aagtcatgcc 480 gtttcatgtg atccggataa cgggaaaagc attgaacacc ataggtcaga gtagtgacaa 540 gtgttggcca cggaacaggt agttttccag tagtgcaaat aaatttaagg gtgagttttc 600 cgtttgtagc atcaccttca ccctctccac ggacagaaaa tttgtgccca ttaacatcac 660 catctaattc aacaagaatt gggacaactc cagtgaaaag ttcttctcct ttgcttgggc 720 cgggattttc ctccacgtcc ccgcatgtta gtagacttcc cctgccctcg ccggagcc 778 <210> 325 <211> 28 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 325 attcgattac aaagacgatg acgataag 28 <210> 326 <211> 33 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 326 atggtctcac aacggctccg gcgagggcag ggg 33 <210> 327 <211> 33 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 327 atggtctcac aacttatttg tagagctcat cca 33 <210> 328 <211> 33 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 328 atggtctcac agaggctccg gcgagggcag ggg 33 <210> 329 <211> 33 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 329 atggtctcac agattatttg tagagctcat cca 33 <210> 330 <211> 33 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 330 atggtctcaa ttcggctccg gcgagggcag ggg 33 <210> 331 <211> 33 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 331 atggtctcaa ttcttatttg tagagctcat cca 33 <210> 332 <211> 22 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 332 agcccgtaga actggacttg ac 22 <210> 333 <211> 22 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 333 ggcaaggaag gggtagaacc at 22 <210> 334 <211> 784 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 334 attcggctcc ggcgagggca ggggaagtct actaacatgc ggggacgtgg aggaaaatcc 60 cggcccaagc aaaggagaag aacttttcac tggagttgtc ccaattcttg ttgaattaga 120 tggtgatgtt aatgggcaca aattttctgt ccgtggagag ggtgaaggtg atgctacaaa 180 cggaaaactc acccttaaat ttatttgcac tactggaaaa ctacctgttc cgtggccaac 240 acttgtcact actctgacct atggtgttca atgcttttcc cgttatccgg atcacatgaa 300 acggcatgac tttttcaaga gtgccatgcc cgaaggttat gtacaggaac gcactatatc 360 tttcaaagat gacgggacct acaagacgcg tgctgaagtc aagtttgaag gtgataccct 420 tgttaatcgt atcgagttaa agggtattga ttttaaagaa gatggaaaca ttcttggaca 480 caaactcgag tacaacttta actcacacaa tgtatacatc acggcagaca aacaaaagaa 540 tggaatcaaa gctaacttca aaattcgcca caacgttgaa gatggttccg ttcaactagc 600 agaccattat caacaaaata ctccaattgg cgatggccct gtccttttac cagacaacca 660 ttacctgtcg acacaatctg tcctttcgaa agatcccaac gaaaagcgtg accacatggt 720 ccttcttgag tttgtaactg ctgctgggat tacacatggc atggatgagc tctacaaata 780 atag 784 <210> 335 <211> 784 <212> DNA <213> Artificial sequence <220> <223> synthetic sequence <400> 335 gttgctatta tttgtagagc tcatccatgc catgtgtaat cccagcagca gttacaaact 60 caagaaggac catgtggtca cgcttttcgt tgggatcttt cgaaaggaca gattgtgtcg 120 acaggtaatg gttgtctggt aaaaggacag ggccatcgcc aattggagta ttttgttgat 180 aatggtctgc tagttgaacg gaaccatctt caacgttgtg gcgaattttg aagttagctt 240 tgattccatt cttttgtttg tctgccgtga tgtatacatt gtgtgagtta aagttgtact 300 cgagtttgtg tccaagaatg tttccatctt ctttaaaatc aatacccttt aactcgatac 360 gattaacaag ggtatcacct tcaaacttga cttcagcacg cgtcttgtag gtcccgtcat 420 ctttgaaaga tatagtgcgt tcctgtacat aaccttcggg catggcactc ttgaaaaagt 480 catgccgttt catgtgatcc ggataacggg aaaagcattg aacaccatag gtcagagtag 540 tgacaagtgt tggccacgga acaggtagtt ttccagtagt gcaaataaat ttaagggtga 600 gttttccgtt tgtagcatca ccttcaccct ctccacggac agaaaatttg tgcccattaa 660 catcaccatc taattcaaca agaattggga caactccagt gaaaagttct tctcctttgc 720 ttgggccggg attttcctcc acgtccccgc atgttagtag acttcccctg ccctcgccgg 780 agcc 784

Claims

(a) 표적 세포의 게놈 내의 2개의 위치에서 엇갈림 말단을 갖는 이중 가닥 절단을 생성하여, 이에 의해 제1 게놈 엇갈림 말단 및 제2 게놈 엇갈림 말단을 생성하는 단계; 및
(b) 각각의 말단에 5' 또는 3' 오버행을 갖는 선형 이중 가닥 공여자 DNA를 표적 세포 내로 도입하는 단계
를 포함하며, 여기서 공여자 DNA의 한 말단은 제1 게놈 엇갈림 말단과 혼성화되고, 공여자 DNA의 다른 말단은 제2 게놈 엇갈림 말단과 혼성화되어, 이에 의해 표적 세포의 게놈 내로 선형 이중 가닥 공여자 DNA의 삽입이 유발되는 것인,
표적 세포에서의 게놈 편집 방법.
제1항에 있어서, 공여자 DNA의 적어도 하나의 말단이 5' 오버행을 갖고, 게놈 엇갈림 말단 중 적어도 하나가 5' 오버행을 갖는 것인 방법.
제1항 또는 제2항에 있어서, 공여자 DNA의 적어도 하나의 말단이 3' 오버행을 갖고, 게놈 엇갈림 말단 중 적어도 하나가 3' 오버행을 갖는 것인 방법.
제1항 내지 제3항 중 어느 한 항에 있어서, 상기 생성이 1개 이상의 서열 특이적 뉴클레아제 또는 1개 이상의 서열 특이적 뉴클레아제를 코딩하는 1개 이상의 핵산을 표적 세포 내로 도입하여 상기 이중 가닥 절단을 생성하는 것을 포함하는 것인 방법.
제4항에 있어서, 1개 이상의 서열 특이적 뉴클레아제가 메가뉴클레아제, 귀소 엔도뉴클레아제, 아연 핑거 뉴클레아제 (ZFN) 및 전사 활성화제-유사 이펙터 뉴클레아제 (TALEN) 중 적어도 1개를 포함하는 것인 방법.
제4항에 있어서, 1개 이상의 서열 특이적 뉴클레아제가 엇갈림 말단 절단 CRISPR/Cas 이펙터 단백질을 포함하는 것인 방법.
제6항에 있어서, 상기 생성이 CRISPR/Cas 가이드 핵산 또는 CRISPR/Cas 가이드 핵산을 코딩하는 핵산을 세포 내로 도입하는 것을 추가로 포함하는 것인 방법.
제4항 내지 제7항 중 어느 한 항에 있어서, 동일한 전달 비히클의 페이로드로서: (i) 1개 이상의 서열 특이적 뉴클레아제 또는 1개 이상의 서열 특이적 뉴클레아제를 코딩하는 1개 이상의 핵산 및 (ii) 선형 이중 가닥 공여자 DNA를 세포 내로 도입하는 것을 포함하는 방법.
제8항에 있어서, 1개 이상의 서열 특이적 뉴클레아제 및 선형 이중 가닥 공여자 DNA가 데옥시리보핵단백질 복합체 또는 리보-데옥시리보핵단백질 복합체로서 세포 내로 도입되는 것인 방법.
제8항 또는 제9항에 있어서, 상기 도입 동안, 공여자 DNA의 말단이 1개 이상의 서열 특이적 뉴클레아제에 부위-특이적 방식으로 결합되는 것인 방법.
제8항 내지 제10항 중 어느 한 항에 있어서, 전달 비히클이 비-바이러스인 방법.
제8항 내지 제11항 중 어느 한 항에 있어서, 전달 비히클이 나노입자인 방법.
제12항에 있어서, 나노입자가 (i) 및 (ii)에 추가로, 음이온성 중합체 조성물, 양이온성 중합체 조성물 및 양이온성 폴리펩티드 조성물을 포함하는 코어를 포함하는 것인 방법.
제13항에 있어서, 상기 음이온성 중합체 조성물이 폴리(글루탐산) 및 폴리(아스파르트산)으로부터 선택된 음이온성 중합체를 포함하는 것인 방법.
제13항 또는 제14항에 있어서, 상기 양이온성 중합체 조성물이 폴리(아르기닌), 폴리(리신), 폴리(히스티딘), 폴리(오르니틴) 및 폴리(시트룰린)으로부터 선택된 양이온성 중합체를 포함하는 것인 방법.
제13항 내지 제15항 중 어느 한 항에 있어서, 나노입자가 코어를 캡슐화하는 유출가능한 층을 추가로 포함하는 것인 방법.
제16항에 있어서, 유출가능한 층이 음이온성 코트 또는 양이온성 코트인 방법.
제16항 또는 제17항에 있어서, 유출가능한 층이 실리카, 펩토이드, 폴리시스테인, 칼슘, 산화칼슘, 히드록시아파타이트, 인산칼슘, 황산칼슘, 망가니즈, 산화망가니즈, 인산망가니즈, 황산망가니즈, 마그네슘, 산화마그네슘, 인산마그네슘, 황산마그네슘, 철, 산화철, 인산철 및 황산철 중 1개 이상을 포함하는 것인 방법.
제16항 내지 제18항 중 어느 한 항에 있어서, 나노입자가 유출가능한 층을 둘러싸는 표면 코트를 추가로 포함하는 것인 방법.
제19항에 있어서, 표면 코트가 유출가능한 층과 정전기적으로 상호작용하는 양이온성 또는 음이온성 앵커링 도메인을 포함하는 것인 방법.
제19항 또는 제20항에 있어서, 표면 코트가 1개 이상의 표적화 리간드를 포함하는 것인 방법.
제19항 또는 제20항에 있어서, 표면 코트가 광견병 바이러스 당단백질 (RVG) 단편, ApoE-트랜스페린, 락토페린, 멜라노페리틴, 오보트랜스페리틴, L-셀렉틴, E-셀렉틴, P-셀렉틴, 시알릴화 펩티드, 폴리시알릴화 O-연결된 펩티드, TPO, EPO, PSGL-1, ESL-1, CD44, 사멸 수용체-3 (DR3), LAMP1, LAMP2, Mac2-BP, 줄기 세포 인자 (SCF), CD70, SH2 도메인-함유 단백질 1A (SH2D1A), 엑센딘, 엑센딘-S11C, GLP1, RGD, 트랜스페린 리간드, FGF 단편, α5β1 리간드, IL2, Cde3-엡실론, 펩티드-HLA-A*2402, CD80, CD86, 숙신산, 비스포스포네이트, 조혈 줄기 세포 화학주성 지질, 스핑고신, 세라미드, 스핑고신-1-포스페이트, 세라미드-1-포스페이트, 및 상기 중 임의의 것의 활성 표적화 단편으로 이루어진 군으로부터 선택된 1개 이상의 표적화 리간드를 포함하는 것인 방법.
제19항 또는 제20항에 있어서, 표면 코트가 CD3, CD8, CD4, CD28, CD90, CD45f, CD34, CD80, CD86, CD3-엡실론, CD3-감마, CD3-델타; TCR 알파, TCR 베타, TCR 감마 및/또는 TCR 델타 불변 영역; 4-1BB, OX40, OX40L, CD62L, ARP5, CCR5, CCR7, CCR10, CXCR3, CXCR4, CD94/NKG2, NKG2A, NKG2B, NKG2C, NKG2E, NKG2H, NKG2D, NKG2F, NKp44, NKp46, NKp30, DNAM, XCR1, XCL1, XCL2, ILT, LIR, Ly49, IL2R, IL7R, IL10R, IL12R, IL15R, IL18R, TNFα, IFNγ, TGF-β 및 α5β1로부터 선택된 표적에 대한 표적화된 결합을 제공하는 1개 이상의 표적화 리간드를 포함하는 것인 방법.
제19항 또는 제20항에 있어서, 표면 코트가 골수 세포, 조혈 줄기 세포 (HSC), 조혈 줄기 및 전구 세포 (HSPC), 말초 혈액 단핵 세포 (PBMC), 골수 전구 세포, 림프 전구 세포, T-세포, B-세포, NKT 세포, NK 세포, 수지상 세포, 단핵구, 과립구, 적혈구, 거핵구, 비만 세포, 호염기구, 호산구, 호중구, 대식세포, 적혈구 전구 세포, 거핵구-적혈구 전구 세포 (MEP), 공통 골수 전구 세포 (CMP), 다능 전구 세포 (MPP), 조혈 줄기 세포 (HSC), 단기 HSC (ST-HSC), IT-HSC, 장기 HSC (LT-HSC), 내피 세포, 뉴런, 성상세포, 췌장 세포, 췌장 β-도세포, 간 세포, 근육 세포, 골격근 세포, 심근 세포, 간 세포, 지방 세포, 장 세포, 결장 세포 및 위 세포로부터 선택된 표적 세포에 대한 표적화된 결합을 제공하는 1개 이상의 표적화 리간드를 포함하는 것인 방법.
제8항 내지 제10항 중 어느 한 항에 있어서, 전달 비히클이 페이로드에 접합된 표적화 리간드이고, 여기서 표적화 리간드는 세포 표면 단백질에 대한 표적화된 결합을 제공하는 것인 방법.
제8항 내지 제10항 중 어느 한 항에 있어서, 전달 비히클이 하전된 중합체 폴리펩티드 도메인에 접합된 표적화 리간드이고, 여기서 표적화 리간드는 세포 표면 단백질에 대한 표적화된 결합을 제공하고, 여기서 하전된 중합체 폴리펩티드 도메인은 핵산 페이로드와 축합되고/거나 단백질 페이로드와 정전기적으로 상호작용하는 것인 방법.
제25항 또는 제26항에 있어서, 표적화 리간드가 펩티드, ScFv, F(ab), 핵산 압타머 또는 펩토이드인 방법.
제26항에 있어서, 하전된 중합체 폴리펩티드 도메인이 3 내지 30개 아미노산 범위의 길이를 갖는 것인 방법.
제26항 내지 제28항 중 어느 한 항에 있어서, 전달 비히클이 페이로드 및 하전된 중합체 폴리펩티드 도메인과 상호작용하는 음이온성 중합체를 추가로 포함하는 것인 방법.
제29항에 있어서, 음이온성 중합체가 폴리(글루탐산) 및 폴리(아스파르트산)으로부터 선택되는 것인 방법.
제25항 내지 제30항 중 어느 한 항에 있어서, 표적화 리간드가 5-50개 아미노산의 길이를 갖는 것인 방법.
제25항 내지 제31항 중 어느 한 항에 있어서, 표적화 리간드가 패밀리 B G-단백질 커플링된 수용체 (GPCR), 수용체 티로신 키나제 (RTK), 세포 표면 당단백질 및 세포-세포 부착 분자로부터 선택된 세포 표면 단백질에 대한 표적화된 결합을 제공하는 것인 방법.
제25항 내지 제31항 중 어느 한 항에 있어서, 표적화 리간드가 광견병 바이러스 당단백질 (RVG) 단편, ApoE-트랜스페린, 락토페린, 멜라노페리틴, 오트랜스페리틴, L-셀렉틴, E-셀렉틴, P-셀렉틴, 시알릴화 펩티드, 폴리시알릴화 O-연결된 펩티드, TPO, EPO, PSGL-1, ESL-1, CD44, 사멸 수용체-3 (DR3), LAMP1, LAMP2, Mac2-BP, 줄기 세포 인자 (SCF), CD70, SH2 도메인-함유 단백질 1A (SH2D1A), 엑센딘, 엑센딘-S11C, GLP1, RGD, 트랜스페린 리간드, FGF 단편, α5β1 리간드, IL2, Cde3-엡실론, 펩티드-HLA-A*2402, CD80, CD86, 숙신산, 비스포스포네이트, 조혈 줄기 세포 화학주성 지질, 스핑고신, 세라미드, 스핑고신-1-포스페이트, 세라미드-1-포스페이트, 및 상기 중 임의의 것의 활성 표적화 단편으로 이루어진 군으로부터 선택되는 것인 방법.
제25항 내지 제31항 중 어느 한 항에 있어서, 표적화 리간드가 CD3, CD8, CD4, CD28, CD90, CD45f, CD34, CD80, CD86, CD3-엡실론, CD3-감마, CD3-델타; TCR 알파, TCR 베타, TCR 감마 및/또는 TCR 델타 불변 영역; 4-1BB, OX40, OX40L, CD62L, ARP5, CCR5, CCR7, CCR10, CXCR3, CXCR4, CD94/NKG2, NKG2A, NKG2B, NKG2C, NKG2E, NKG2H, NKG2D, NKG2F, NKp44, NKp46, NKp30, DNAM, XCR1, XCL1, XCL2, ILT, LIR, Ly49, IL2R, IL7R, IL10R, IL12R, IL15R, IL18R, TNFα, IFNγ, TGF-β 및 α5β1로부터 선택된 표적에 대한 표적화된 결합을 제공하는 것인 방법.
제25항 내지 제31항 중 어느 한 항에 있어서, 표적화 리간드가 골수 세포, 조혈 줄기 세포 (HSC), 장기 HSC, 단기 HSC, 조혈 줄기 및 전구 세포 (HSPC), 말초 혈액 단핵 세포 (PBMC), 골수 전구 세포, 림프 전구 세포, T-세포, B-세포, NKT 세포, NK 세포, 수지상 세포, 단핵구, 과립구, 적혈구, 거핵구, 비만 세포, 호염기구, 호산구, 호중구, 대식세포, 적혈구 전구 세포 (예를 들어, HUDEP 세포), 거핵구-적혈구 전구 세포 (MEP), 공통 골수 전구 세포 (CMP), 다능 전구 세포 (MPP), 조혈 줄기 세포 (HSC), 단기 HSC (ST-HSC), IT-HSC, 장기 HSC (LT-HSC), 내피 세포, 뉴런, 성상세포, 췌장 세포, 췌장 β-도세포, 근육 세포, 골격근 세포, 심근 세포, 간 세포, 지방 세포, 장 세포, 결장 세포 및 위 세포로 이루어진 군으로부터 선택된 세포 유형에 대한 결합을 제공하는 것인 방법.
제1항 내지 제35항 중 어느 한 항에 있어서, 표적 세포의 게놈 내의 상기 2개의 위치에서 이중 가닥 절단을 생성하기 전에, 2개의 위치가 1,000,000 염기 쌍 이하만큼 이격되어 있는 것인 방법.
제1항 내지 제35항 중 어느 한 항에 있어서, 표적 세포의 게놈 내의 상기 2개의 위치에서 이중 가닥 절단을 생성하기 전에, 2개의 위치가 100,000 염기 쌍 이하만큼 이격되어 있는 것인 방법.
제1항 내지 제35항 중 어느 한 항에 있어서, 제1 및 제2 게놈 엇갈림 말단이 TCR 알파 유전자좌 또는 TCR 베타 유전자좌에서 생성되는 것인 방법.
제1항 내지 제35항 중 어느 한 항에 있어서, 제1 및 제2 게놈 엇갈림 말단 중 적어도 1개가 (1) 도 59에 도시된 CRISPR/Cas 가이드 RNA (gRNA) 서열 중 1개 이상을 사용하고/거나 (2) 도 59에 도시된 TALEN 서열 중 1개 이상을 표적화함으로써 생성되는 것인 방법.
제1항 내지 제35항 중 어느 한 항에 있어서, 공여자 DNA가 총 10 염기 쌍 (bp) 내지 100 킬로염기 쌍 (kbp)을 갖는 것인 방법.
제1항 내지 제40항 중 어느 한 항에 있어서, 공여자 DNA의 삽입이 T 세포 수용체 (TCR) 단백질을 코딩하는 뉴클레오티드 서열 내에서 발생하는 것인 방법.
제41항에 있어서, 공여자 DNA가 TCR 단백질의 CDR1, CDR2 또는 CDR3 영역의 아미노산을 코딩하는 것인 방법.
제1항 내지 제40항 중 어느 한 항에 있어서, 공여자 DNA가 키메라 항원 수용체 (CAR)를 코딩하는 뉴클레오티드 서열을 포함하고, 상기 공여자 DNA의 삽입이 CAR을 코딩하는 뉴클레오티드 서열의 내인성 T-세포 프로모터에 대한 작동가능한 연결을 유발하는 것인 방법.
제1항 내지 제40항 중 어느 한 항에 있어서, 공여자 DNA가, 프로모터에 작동가능하게 연결되고 키메라 항원 수용체 (CAR)를 코딩하는 뉴클레오티드 서열을 포함하는 것인 방법.
제1항 내지 제40항 중 어느 한 항에 있어서, 공여자 DNA가, 막 결합되고 세포외로 제시되는 세포-특이적 표적화 리간드를 코딩하는 뉴클레오티드 서열을 포함하고, 상기 공여자 DNA의 삽입이 세포-특이적 표적화 리간드를 코딩하는 뉴클레오티드 서열의 내인성 프로모터에 대한 작동가능한 연결을 유발하는 것인 방법.
제1항 내지 제40항 중 어느 한 항에 있어서, 공여자 DNA가, 막 결합되고 세포외로 제시되는 세포-특이적 표적화 리간드를 코딩하는 서열에 작동가능하게 연결된 프로모터를 포함하는 것인 방법.
제1항 내지 제40항 중 어느 한 항에 있어서,
표적 세포의 게놈 내의 4개의 위치에서 엇갈림 말단을 갖는 이중 가닥 절단을 생성하여, 이에 의해 제1 및 제2 게놈 엇갈림 말단에 추가로 제3 게놈 엇갈림 말단 및 제4 게놈 엇갈림 말단을 생성하는 단계;
각각의 말단에 5' 또는 3' 오버행을 각각 갖는 2개의 선형 이중 가닥 공여자 DNA를 도입하는 단계
를 포함하며, 여기서 한 공여자 DNA의 말단은 제1 및 제2 게놈 엇갈림 말단과 혼성화되고, 다른 공여자 DNA의 말단은 제3 및 제4 게놈 엇갈림 말단과 혼성화되고, 이에 의해 표적 세포의 게놈 내로 상기 2개의 공여자 DNA의 삽입이 유발되는 것인 방법.
제47항에 있어서,
(1) 한 공여자 DNA의 삽입이 T 세포 수용체 (TCR) 알파 또는 델타 서브유닛을 코딩하는 뉴클레오티드 서열 내에서 발생하고, 다른 공여자 DNA의 삽입이 TCR 베타 또는 감마 서브유닛을 코딩하는 뉴클레오티드 서열 내에서 발생하거나; 또는
(2) 한 공여자 DNA의 삽입이 T 세포 수용체 (TCR) 알파 또는 감마 서브유닛을 코딩하는 뉴클레오티드 서열 내에서 발생하고, 다른 공여자 DNA의 삽입이 TCR 베타 또는 델타 서브유닛을 코딩하는 뉴클레오티드 서열 내에서 발생하거나; 또는
(3) 한 공여자 DNA의 삽입이 IgA, IgD, IgE, IgG 또는 IgM 단백질의 κ 쇄를 코딩하는 뉴클레오티드 서열 내에서 발생하고, 다른 공여자 DNA의 삽입이 IgA, IgD, IgE, IgG 또는 IgM 단백질의 λ 쇄를 코딩하는 뉴클레오티드 서열 내에서 발생하는 것인 방법.
제47항에 있어서, 한 공여자 DNA의 삽입이 T 세포 수용체 (TCR) 알파 또는 델타 서브유닛 불변 영역을 코딩하는 뉴클레오티드 서열 내에서 발생하고, 다른 공여자 DNA의 삽입이 TCR 베타 또는 감마 서브유닛 불변 영역을 코딩하는 뉴클레오티드 서열 내에서 발생하는 것인 방법.
제47항에 있어서,
(1) 한 공여자 DNA의 삽입이 T 세포 수용체 (TCR) 알파 또는 델타 서브유닛 프로모터로서 기능하는 뉴클레오티드 서열 내에서 발생하고, 다른 공여자 DNA의 삽입이 TCR 베타 또는 감마 서브유닛 프로모터로서 기능하는 뉴클레오티드 서열 내에서 발생하거나; 또는
(2) 한 공여자 DNA의 삽입이 T 세포 수용체 (TCR) 알파 또는 감마 서브유닛 프로모터로서 기능하는 뉴클레오티드 서열 내에서 발생하고, 다른 공여자 DNA의 삽입이 TCR 베타 또는 델타 서브유닛 프로모터로서 기능하는 뉴클레오티드 서열 내에서 발생하거나; 또는
(3) 한 공여자 DNA의 삽입이 IgA, IgD, IgE, IgG 또는 IgM 단백질의 κ 쇄에 대한 프로모터로서 기능하는 뉴클레오티드 서열 내에서 발생하고, 다른 공여자 DNA의 삽입이 IgA, IgD, IgE, IgG 또는 IgM 단백질의 λ 쇄에 대한 프로모터로서 기능하는 뉴클레오티드 서열 내에서 발생하는 것인 방법.
제1항 내지 제50항 중 어느 한 항에 있어서, 상기 공여자 DNA의 삽입이 삽입된 공여자 DNA와 T 세포 수용체 (TCR) 알파, 베타, 감마 또는 델타 내인성 프로모터의 작동가능한 연결을 유발하는 것인 방법.
제1항 내지 제50항 중 어느 한 항에 있어서, 공여자 DNA가 TCR 알파, 베타, 감마 또는 델타 프로모터에 작동가능하게 연결된 단백질-코딩 뉴클레오티드 서열을 포함하는 것인 방법.
제1항 내지 제50항 중 어느 한 항에 있어서, 상기 공여자 DNA의 삽입이 삽입된 공여자 DNA와 (i) T-세포 특이적 프로모터; (ii) CD3 프로모터; (iii) CD28 프로모터; (iv) 줄기 세포 특이적 프로모터; (v) 체세포 특이적 프로모터; (vi) T 세포 수용체 (TCR) 알파, 베타, 감마 또는 델타 프로모터; (v) B-세포 특이적 프로모터; (vi) CD19 프로모터; (vii) CD20 프로모터; (viii) CD22 프로모터; (ix) B29 프로모터; 및 (x) T-세포 또는 B-세포 V(D)J-특이적 프로모터로 이루어진 군으로부터 선택된 프로모터의 작동가능한 연결을 유발하는 것인 방법.
제1항 내지 제50항 중 어느 한 항에 있어서, 공여자 DNA가 T-세포 특이적 프로모터에 작동가능하게 연결된 단백질-코딩 뉴클레오티드 서열을 포함하는 것인 방법.
제1항 내지 제50항 중 어느 한 항에 있어서, 공여자 DNA가 프로모터에 작동가능하게 연결된 단백질-코딩 뉴클레오티드 서열을 포함하는 것인 방법.
제1항 내지 제50항 중 어느 한 항에 있어서, 상기 공여자 DNA의 삽입이 삽입된 공여자 DNA와 줄기 세포 특이적 또는 체세포 특이적 내인성 프로모터의 작동가능한 연결을 유발하는 것인 방법.
제1항 내지 제56항 중 어느 한 항에 있어서, 공여자 DNA가 리포터 단백질 (예를 들어, 예컨대 유전자 편집 효율을 평가하기 위한 근적외선 및/또는 원적외선 리포터 단백질)을 코딩하는 뉴클레오티드 서열을 포함하는 것인 방법.
제57항에 있어서, 상기 공여자 DNA의 삽입이 삽입된 공여자 DNA와 내인성 프로모터의 작동가능한 연결을 유발하는 것인 방법.
제57항에 있어서, 공여자 DNA가 리포터 단백질을 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 프로모터를 포함하는 것인 방법.
제1항 내지 제59항 중 어느 한 항에 있어서, 공여자 DNA가 (i) T 세포 수용체 (TCR) 단백질; (ii) IgA, IgD, IgE, IgG 또는 IgM 단백질; 또는 (iii) IgA, IgD, IgE, IgG 또는 IgM 단백질의 κ 또는 λ 쇄를 코딩하는 뉴클레오티드 서열을 포함하는 것인 방법.
제1항 내지 제60항 중 어느 한 항에 있어서, 공여자 DNA가 인트론을 갖지 않는 단백질-코딩 뉴클레오티드 서열을 포함하는 것인 방법.
제61항에 있어서, 인트론을 갖지 않는 뉴클레오티드 서열이 TCR 단백질 또는 이뮤노글로불린의 전부 또는 일부를 코딩하는 것인 방법.
제1항 내지 제62항 중 어느 한 항에 있어서, 공여자 DNA가 적어도 1개의 아데닐화된 3' 말단을 갖는 것인 방법.
제1항 내지 제63항 중 어느 한 항에 있어서, 표적 세포가 포유동물 세포인 방법.
제1항 내지 제64항 중 어느 한 항에 있어서, 표적 세포가 인간 세포인 방법.
(a) 각각의 말단에 5' 또는 3' 오버행을 갖는 선형 이중 가닥 공여자 DNA; 및
(b) 서열 특이적 뉴클레아제 또는 서열 특이적 뉴클레아제를 코딩하는 핵산
을 포함하며, 여기서 (a) 및 (b)는 동일한 전달 비히클의 일부로서의 페이로드인 키트 또는 조성물.
제66항에 있어서, 전달 비히클이 나노입자인 키트 또는 조성물.
제67항에 있어서, 나노입자가 (a), (b), 음이온성 중합체 조성물, 양이온성 중합체 조성물 및 양이온성 폴리펩티드 조성물을 포함하는 코어를 포함하는 것인 키트 또는 조성물.
제67항 또는 제68항에 있어서, 나노입자가 나노입자를 세포 표면 단백질로 표적화하는 표적화 리간드를 포함하는 것인 키트 또는 조성물.
제66항 내지 제69항 중 어느 한 항에 있어서, 선형 이중 가닥 공여자 및 서열 특이적 뉴클레아제가 서로 결합되어 데옥시리보핵단백질 또는 리보-데옥시리보핵단백질 복합체를 형성하는 것인 키트 또는 조성물.
제66항 내지 제70항 중 어느 한 항에 있어서, 전달 비히클이 하전된 중합체 폴리펩티드 도메인에 접합된 표적화 리간드이고, 여기서 표적화 리간드는 세포 표면 단백질에 대한 표적화된 결합을 제공하고, 여기서 하전된 중합체 폴리펩티드 도메인은 페이로드와 정전기적으로 상호작용하는 것인 키트 또는 조성물.
제71항에 있어서, 전달 비히클이 페이로드 및 하전된 중합체 폴리펩티드 도메인과 상호작용하는 음이온성 중합체를 추가로 포함하는 것인 키트 또는 조성물.
제66항 내지 제70항 중 어느 한 항에 있어서, 전달 비히클이 (a) 및/또는 (b)에 접합된 표적화 리간드이고, 여기서 표적화 리간드는 세포 표면 단백질에 대한 표적화된 결합을 제공하는 것인 키트 또는 조성물.
제69항 내지 제73항 중 어느 한 항에 있어서, 세포 표면 단백질이 CD47인 키트 또는 조성물.
제74항에 있어서, 표적화 리간드가 SIRPα 단백질 모방체인 키트 또는 조성물.
제69항 내지 제75항 중 어느 한 항에 있어서, 전달 비히클이 세포내이입-촉발 리간드를 추가로 포함하는 것인 키트 또는 조성물.
제66항 내지 제70항 중 어느 한 항에 있어서, 전달 비히클이 물-오일-물 에멀젼 입자 상에, 오일-물 에멀젼 미셀 입자 상에, 다층상 물-오일-물 에멀젼 입자 상에, 다층 입자 상에 또는 DNA 오리가미 나노봇 상에 코팅된 표적화 리간드를 포함하는 것인 키트 또는 조성물.
제69항 내지 제74항 중 어느 한 항에 있어서, 표적화 리간드가 펩티드, ScFv, F(ab), 핵산 압타머 또는 펩토이드인 방법.
제66항 내지 제70항 중 어느 한 항에 있어서, 전달 비히클이 비-바이러스인 키트 또는 조성물.