KR20230053591A

KR20230053591A - 조작된 근육 표적화 조성물

Info

Publication number: KR20230053591A
Application number: KR1020237004484A
Authority: KR
Inventors: 파디스 사베티; 모하마드샤리프 타베보르드바르; 사이먼 예
Original assignee: 더 브로드 인스티튜트, 인코퍼레이티드; 프레지던트 앤드 펠로우즈 오브 하바드 칼리지; 매사추세츠 인스티튜트 오브 테크놀로지
Priority date: 2020-07-22
Filing date: 2021-07-22
Publication date: 2023-04-21
Also published as: TW202217003A; CO2023000866A2; CA3183530A1; CN116194153A; AU2021314256A1; EP4185702A4; BR112023000909A2; WO2022020616A1; CL2023000204A1; MX2023000998A; JP2023534999A; EP4185702A1; IL299431A; CL2024000275A1

Abstract

본 명세서는 근육-특이적 표적화 모이어티 및 근육 특이적 표적화 모티프를 포함하는 조성물을 기술한다. 또한, 근육-특이적 표적화 모티프 및 근육 특이적 표적화 모이어티를 포함하는 조성물의 용도를 기술한다. 일부 구현예에서, 근육-특이적 표적화 모이어티 및 근육 특이적 표적화 모이어티를 포함하는 조성물은 근육 조직에 카고의 직접 전달을 위해 사용될 수 있다.

Description

조작된 근육 표적화 조성물

관련 출원에 대한 교차-참조

본 출원은 "조작된 근육 표적화 조성물"의 명칭으로 2020년 6월 22일 출원된 미국 가출원 제63/055,265호, "조작된 근육 표적화 조성물"의 명칭으로 2020년 10월 29일 출원된 미국 가출원 제63/107,394호, 및 "조작된 근육 표적화 조성물"의 명칭으로 2021년 5월 2일 출원된 미국 가출원 제63/183,038호에 대한 우선권 및 이득을 청구하고, 이의 내용은 본 명세서에 그들 전문이 참조로 편입된다.

서열 목록

본 출원은 BROD-5215WP_ST25.txt의 파일명으로, 2021년 6월 13일 생성되고, 186,097 바이트 크기 (디스크 상에서 188 KB)를 갖는 ASCII.txt로서 전자 형식으로 제출된 서열 목록을 함유한다. 서열 목록의 내용은 그 전문이 본 명세서에 편입된다.

기술 분야

본 명세서에 개시된 주제 대상은 일반적으로 재조합 아데노-연관 바이러스 (AAV) 벡터 및 이의 시스템, 조성물, 및 이의 용도를 포함하여, 근육 표적화 조성물에 관한 것이다.

재조합 AAV (rAAV)는 유전자 요법 및 유전자 편집에 가장 일반적으로 사용되는 전달 비히클이다. 그럼에도, 천연 캡시드 변이체를 함유하는 rAAV는 제한된 세포 향성을 갖는다. 실제로, 오늘날 주로 사용되는 rAAV는 전신 전달 이후 간을 감염시킨다. 또한, 이들 천연 캡시드 변이체를 갖는 통상적인 rAAV를 사용한 다른 세포-유형, 조직, 및 장기에서 통상적인 rAAV의 형질도입 효율은 제한적이다. 그러므로, 간 이외의 세포, 조직, 및 장기 (예를 들어, 신경계, 골격근, 및 심장근)에 영향을 미치는 질환에 대한 AAV-매개 폴리뉴클레오티드 전달은 전형적으로 대용량의 바이러스 (전형적으로, 약 1 x 10¹⁴ vg/kg)의 주사를 요구하고, 종종 간 독성을 일으킨다. 또한, 통상의 rAAV를 사용할 때 대용량이 요구되기 때문에, 성인 환자 투약에 필요한 치료적 rAAV의 충분량이 제조는 극도로 도전적이다. 추가로, 유전자 발현 및 생리학의 차이로 인해서, 마우스 및 영장류 모델은 바이러스 캡시드에 차등적으로 반응한다. 상이한 바이러스 입자의 형질도입 효율은 상이한 종 간에 다양하고, 그 결과로서, 마우스에서 전임상 연구는 종종 인간을 포함한, 영장류에서 결과를 정확하게 반영하지 못한다. 이와 같이, 다양한 유전 질환의 치료에서 사용을 위한 개선된 rAAV에 대한 요구가 존재한다.

일정 예의 구현예에서, 본 명세서는 근육 조직을 표적화하는데 효과적인 표적화 모이어티로서, 표적화 모이어티는 하나 이상의 n-량체 모티프를 포함하고, 하나 이상의 n-량체 모티프의 적어도 하나의 n-량체 모티프는 X_mRGDX_n (여기서, X_m 및 X_n 은 각각이 독립적으로 임의의 아미노산으로부터 선택되고, n은 1, 2, 3, 4, 5, 6, 7, 8, 또는 9이고, m은 1-4임)을 포함하거나 또는 그로 이루어지는 것인, 표적화 모이어티; 및 임의로 카고로서, 표적화 모이어티에 커플링되거나 또는 그와 회합된 것인 카고를 포함하는 조성물을 기술한다.

일정 예의 구현예에서, 적어도 하나의 n-량체 모티프는 표 2, 표 3, 도 14, 또는 이의 임의 조합 중 어느 하나에서와 같다.

일정 예의 구현예에서, 표적화 모이어티는 폴리펩티드, 폴리뉴클레오티드, 지질, 중합체, 당, 또는 이의 조합을 포함한다.

일정 예의 구현예에서, 표적화 모이어티는 바이러스 단백질을 포함한다.

일정 예의 구현예에서, 바이러스 단백질은 캡시드 단백질이다.

일정 예의 구현예에서, 바이러스 단백질은 아데노 연관 바이러스 (AAV) 단백질이다.

일정 예의 구현예에서, n-량체 모티프는 n-량체 모티프가 바이러스 캡시드의 외부에 있도록 바이러스 단백질의 2개 아미노산 사이에 위치된다.

일정 예의 구현예에서, n-량체 모티프는 AAV9 캡시드 폴리펩티드의 아미노산 262-269, 327-332, 382-386, 452-460, 488-505, 527-539, 545-558, 581-593, 704-714, 또는 이의 임의 조합 간 임의의 2개의 인접한 아미노산 사이, 또는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV rh.74, 또는 AAV rh.10 캡시드 폴리펩티드의 유사한 위치에 삽입된다.

일정 예의 구현예에서, n-량체 모티프는 AAV9 캡시드 폴리펩티드 내 아미노산 588 내지 589 사이, 또는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV rh.74, 또는 AAV rh.10 캡시드 폴리펩티드 내 유사한 위치에 삽입된다.

일정 예의 구현예에서, 조성물은 조작된 바이러스 입자이다.

일정 예의 구현예에서, 조작된 바이러스 입자는 조작된 AAV 바이러스 입자이다.

일정 예의 구현예에서, AAV 바이러스 입자는 조작된 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV rh.74, 또는 AAV rh.10 바이러스 입자이다.

일정 예의 구현예에서, n-량체 모티프는 3-15 아미노산이다.

정 예의 구현예에서, 임의의 카고는 근육 질환 또는 장애를 치료할 수 있거나 또는 예방할 수 있다.

일정 예의 구현예에서, 근육 질환 또는 장애는

(a) 자가 면역 질환;

(b) 암;

(c) 근이영양증;

(d) 신경근 질환;

(e) 당 또는 글리코겐 저장 질환;

(f) 확장된 반복 질환;

(g) 우성 음성 질환;

(h) 심근병증;

(i) 바이러스 질환;

(j) 조로증; 또는

(k) 이의 임의 조합이다.

일정 예의 구현예에서, 카고는 모르폴리노, 펩티드-연결된 모르폴리노, 안티센스 올리고뉴클레오티드, PMO, 치료적 이식유전자, 치료적 폴리펩티드 또는 펩티드를 코딩하는 폴리뉴클레오티드, PPMO, 하나 이상의 펩티드, CRISPR-Cas 단백질, 가이드 RNA 또는 둘 모두를 코딩하는 하나 이상의 폴리뉴클레오티드, 리보뉴클레오단백질로서, CRISPR-Cas 시스템 분자, 치료적 이식유전자 RNA, 또는 다른 유전자 변형 또는 치료적 RNA 및/또는 단백질을 포함하는 것인 리보뉴클레오단백질, 또는 이의 임의 조합이다.

일정 예의 구현예에서, 카고는 유전자에서 엑손 스키핑을 유도할 수 있다.

일정 예의 구현예에서, 카고는 디스트로핀 유전자에서 엑손 스키핑을 유도할 수 있다.

일정 예의 구현예에서, 카고는 미니-디스트로핀 또는 마이크로-디스트로핀 유전자이다.

일정 예의 구현예에서, 미니-디스트로핀 또는 마이크로-디스트로핀 유전자는 스펙트린-유사 반복부 1, 2, 3, 및 24, 및 임의로 nNOS 도메인을 포함한다.

일정 예의 구현예에서, 확장된 반복 질환은 헌팅톤병, 근긴장성 이영양증, 또는 안면견갑상완근 이영양증 (FSHD)이다.

일정 예의 구현예에서, 근이영양증은 뒤쉔 근이영양증, 벡커 이영양증, 지대근 이영양증, 에머리 드레이푸스 근이영양증, 근긴장성 이영양증, 또는 FSHD이다.

일정 예의 구현예에서, 근긴장성 이영양증은 1형 또는 2형이다.

일정 예의 구현예에서, 심근병증은 확장성 심근병증, 비후생 심근병증, DMD-연관 심근병증, 또는 다논병이다.

일정 예의 구현예에서, 당 또는 글리코겐 저장병은 MPS III형 질환 또는 폼페병이다.

일정 예의 구현예에서, MPS III형 질환은 MPS IIIA형, IIIB형, IIIC, 또는 IIID형이다.

일정 예의 구현예에서, 신경근 질환은 샤르코-마리-투스병 또는 프리드라이히 운동실조이다.

일정 예의 구현예에서, 조성물은 증가된 근육 세포 역가, 근육 세포 특이성, 감소된 면역원성, 또는 이의 임의 조합을 갖는다.

본 명세서에서 기술되는 일정 예의 구현예는 각각이 근육 조직을 표적화하는데 효과적인 하나 이상의 표적화 모이어티의 전부 또는 일부를 코딩하는 하나 이상의 폴리뉴클레오티드를 포함하는 벡터로서, 각각의 표적화 모이어티는 하나 이상의 n-량체 모티프를 포함하고, 하나 이상의 n-량체 모티프의 적어도 하나의 n-량체 모티프는 X_mRGDX_n (여기서, X_m 및 X_n 은 각각 독립적으로 임의의 아미노산으로부터 선택되고, n은 1, 2, 3, 4, 5, 6, 7, 8, 또는 9이고, m은 1-4임)을 포함하거나 또는 그로 이루어지고, 하나 이상의 폴리뉴클레오티드 중 적어도 하나는 적어도 적어도 하나의 n-량체 모티프를 코딩하는 것인, 벡터; 및 임의로, 폴리뉴클레오티드(들) 중 하나 이상에 작동적으로 커플링된 조절 구성요소를 포함하는 벡터 시스템이다.

일정 예의 구현예에서, 적어도 하나의 n-량체 모티프는 표 2, 표 3, 도 14F, 또는 이의 임의 조합 중 어느 하나와 같다.

일정 예의 구현예에서, 벡터 시스템은 카고를 더 포함한다.

일정 예의 구현예에서, 카고는 카고 폴리뉴클레오티드이고, 임의로 표적화 모이어티를 코딩하는 하나 이상의 폴리뉴클레오티드 중 하나 이상에 커플링된다.

일정 예의 구현예에서, 카고 폴리뉴클레오티드는 표적화 모이어티를 코딩하는 하나 이상의 폴리뉴클레오티드와 동일한 벡터 또는 상이한 벡터에 존재한다.

일정 예의 구현예에서, 벡터 시스템은 존재할 때 카고를 함유하는 바이러스 입자를 생산할 수 있다.

일정 예의 구현예에서, 벡터 시스템은 표적화 모이어티 중 하나 이상을 포?c하는 캡시드 폴리펩티드를 생산할 수 있다.

일정 예의 구현예에서, 벡터 시스템은 AAV 바이러스 입자를 생산할 수 있다.

일정 예의 구현예에서, 캡시드 폴리펩티드는 조작된 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV rh.74, AAV rh.10 캡시드 폴리펩티드이다.

벡터 시스템의 일정 예의 구현예에서, 하나의 n-량체 모티프를 코딩하는 하나 이상의 폴리뉴클레오티드는 n-량체 모티프(들)가 바이러스 캡시드의 외부에 있도록 바이러스 단백질의 2개 아미노산에 상응하는 2개 코돈 사이에 삽입된다.

일정 예의 구현예에서, 하나 이상의 n-량체 모티프를 코딩하는 하나 이상의 폴리뉴클레오티드는 AAV9 캡시드 폴리펩티드 내 아미노산 262-269, 327-332, 382-386, 452-460, 488-505, 527-539, 545-558, 581-593, 704-714, 또는 이의 임의 조합 사이, 또는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV rh.74, AAV rh.10 캡시드 폴리펩티드 내 유사한 위치에서 임의의 2개의 인접한 아미노산에 상응하는 2개 코돈 사이에 삽입된다.

일정 예의 구현예에서, 하나 이상의 n-량체 모티프를 코딩하는 하나 이상의 폴리뉴클레오티드는 AAV9 캡시드 폴리뉴클레오티드 내 아미노산 588 및 589에 상응하는 코돈 사이 또는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV rh.74, AAV rh.10 캡시드 폴리펩티드 내 유사한 위치에 삽입된다.

일정 예의 구현예에서, 각각이 하나 이상의 표적화 모이어티의 전부 또는 일부를 코딩하는 하나 이상의 폴리뉴클레오티드를 포함하는 벡터는 스플라이스 조절 구성요소를 포함하지 않는다.

일정 예의 구현예에서, 벡터 시스템은 바이러스 rep 단백질을 코딩하는 폴리뉴클레오티드를 더 포함한다.

일정 예의 구현예에서, 바이러스 rep 단백질을 코딩하는 폴리뉴클레오티드는 AAV rep 단백질을 코딩하는 폴리뉴클레오티드이다.

일정 예의 구현예에서, 바이러스 rep 단백질을 코딩하는 폴리뉴클레오티드는 각각이 하나 이상의 표적화 모이어티를 코딩하는 하나 이상의 폴리뉴클레오티드와 동일한 벡터 또는 상이한 벡터에 존재한다.

일정 예의 구현예에서, 바이러스 rep 단백질은 조절 구성요소에 작동적으로 커플링된다.

본 명세서의 일정 예의 구현예에서 임의의 전술한 단락 또는 본 명세서에 다른 곳에 기술된 바와 같은 벡터 시스템에 의해 코딩되고/되거나 생산되는 폴리뉴클레오티드를 기술한다.

일정 예의 구현예에서, 폴리펩티드는 바이러스 폴리펩티드이다.

일정 예의 구현예에서, 바이러스 폴리펩티드는 AAV 폴리펩티드이다.

일정 예의 구현예에서, 본 명세서는 임의의 전술한 단락 또는 본 명세서의 다른 곳에 기술된 바와 같은 폴리펩티드를 포함하고/하거나 벡터 시스템에 의해 생산되는 입자를 기술한다.

일정 예의 구현예에서, 입자는 바이러스 입자이다.

일정 예의 구현예에서, 바이러스 입자는 아데노-연관 바이러스 (AAV) 입자, 렌티바이러스 입자, 또는 레트로바이러스 입자이다.

일정 예의 구현예에서, 바이러스 입자는 근육-특이적 향성을 갖는다.

일정 예의 구현예에서, 카고는 근육 질환 또는 장애를 치료할 수 있거나 또는 예방할 수 있다.

일정 예의 구현예에서, 근육 질환 또는 장애는

a. 자가 면역 질환;

b. 암;

c. 근이영양증;

d. 신경근 질환;

e. 당 또는 글리코겐 저장 질환;

f. 확장된 반복 질환;

g. 우성 음성 질환;

h. 심근병증;

i. 바이러스 질환;

j. 조로증; 또는

k. 이의 임의 조합이다.

일정 예의 구현예에서, 근이영양증은 뒤쉔 근이영양증, 벡커 근이영양증, 지대근 이영양증, 에머리 드레이푸스 근이영양증, 근긴장성 이영양증, 또는 FSHD이다.

일정 예의 구현예에서, MPS III형 질환은 MPS IIIA형, IIIB형, IIIC형, 또는 IIID형이다.

일정 예의 구현예에서, 폴리펩티드, 입자, 또는 둘 모두는 증가된 근육 세포 역가, 근육 세포 특이성, 감소된 면역원성, 또는 이의 임의 조합을 갖는다.

일정 예의 구현예에서, 본 명세서는

a. 임의의 전술한 단락 또는 본 명세서의 다른 곳에 기술된 바와 같은 조성물;

b. 전술한 단락 또는 본 명세서의 다른 곳에 기술된 바와 같은 벡터 시스템;

c. 전술한 단락 또는 본 명세서의 다른 곳에 기술된 바와 같은 폴리펩티드;

d. 임의의 전술한 단락 또는 본 명세서의 다른 곳에 기술된 바와 같은 입자; 또는

e. 이의 조합

을 포함하는 세포를 기술한다.

일정 예의 구현예에서, 세포는 원핵생물이다.

일정 예의 구현예에서, 세포는 진핵생물이다.

일정 예의 구현예에서, 본 명세서는

b. 임의의 전술한 단락 또는 본 명세서의 다른 곳에 기술된 바와 같은 벡터;

c. 임의의 전술한 단락 또는 본 명세서의 다른 곳에 기술된 바와 같은 폴리펩티드;

d. 임의의 전술한 단락 또는 본 명세서의 다른 곳에 기술된 바와 같은 입자;

e. 임의의 전술한 단락 또는 본 명세서의 다른 곳에 기술된 바와 같은 세포; 또는

f. 이의 조합; 및

약학적으로 허용가능한 담체를 포함하는 약학 제제를 기술한다.

일정 예의 구현예에서, 본 명세서는 이를 필요로 하는 대상체에게,

b. 임의의 전술한 단락 또는 본 명세서의 다른 곳에 기술된 바와 같은 벡터 시스템;

e. 임의의 전술한 단락 또는 본 명세서의 다른 곳에 기술된 바와 같은 세포;

f. 전술한 단락 또는 본 명세서의 다른 곳에 기술된 바와 같은 약학 제제; 또는

g. 이의 조합을 투여하는 단계를 포함한다.

일정 예의 구현예에서, 대상체는 근육 질환 또는 장애를 갖는다.

일정 예의 구현예에서, 근육 질환 또는 장애는

a. 자가 면역 질환;

b. 암;

c. 근이영양증;

d. 신경근 질환;

e. 당 또는 글리코겐 저장 질환;

f. 확장된 반복 질환;

g. 우성 음성 질환;

h. 심근병증;

i. 바이러스 질환;

j. 조로증; 또는

k. 이의 임의 조합이다.

일정 예의 구현예에서, 조성물은 비-근육 세포에 대해 감소되거나 또는 제거된 표적화 또는 특이성을 갖는다.

이들 및 다른 구현예, 예시적인 구현예의 목적, 특성, 및 장점은 예시된 예의 구현예의 하기 상세한 설명을 고려할 때 당업자에게 자명해질 것이다.

본 발명의 특성 및 장점의 이해는 본 발명의 원리를 이용할 수 있는, 예시적인 구현예를 기재하는 하기 상세한 설명, 및 첨부된 도면을 참조하여 수득될 것이다:
도 1 - 이식유전자로부터 mRNA의 생산을 일으키는, 아데노-연관 바이러스 (AAV) 형질도입 기전.
도 2 - AAV 변이체의 mRNA-기반 선택은 DNA-기반 선택에 비해서 더 엄격할 수 있다. 바이러스 라이브러리는 CMV 프로모터의 제어 하에서 발현되었다.
도 3A-3B - 간에서 바이러스 라이브러리 및 벡터 게놈 DNA (도 3A) 및 mRNA (도 3B) 간 상관성.
도 4A-4F - DNA 수준에서 존재하고 mRNA 수준에서 발현되는 캡시드 변이체가 상이한 조직에서 확인되었다. 이러한 실험을 위해서, 바이러스 라이브러리는 CMV 프로모터의 제어 하에서 발현되었다.
도 5A-5C - 세포-유형 특이적 프로모터의 제어 하에 상이한 조직에서 캡시드 mRNA 발현 (x-축에 표시됨). CMV는 예시적인 항상성 프로모터로서 포함되었다. CK8은 근육-특이적 프로모터이다. MHCK7은 근육-특이적 프로모터이다. hSyn은 뉴런 특이적 프로모터이다. 세포 유형 특이적 프로모터로부터 발현 수준은 각 조직에서 항상성 CMV 프로모터로부터의 발현 수준을 기반으로 정규화되었다.
도 6 - 종에 걸쳐서 조직-특이적 유전자 전달을 위한 캡시드 변이체를 생산하고 선택하는 방법의 구현예를 입증하는 개략도.
도 7 - AAV 캡시드 변이체 라이브러리를 생산하는 구현예, 특히 야생형 AAV, 예를 들어, AAV9로 무작위 n-량체 (n=3-15 아미노산)의 삽입을 입증하는 개략도.
도 8 - AAV 캡시드 변이체 라이브러리를 생산하는 구현예, 특히 변이체 AAV 입자 생산을 입증하는 개략도. 각각의 캡시드 변이체는 벡터 게놈으로서 그 자신의 코딩 서열을 캡슐화한다.
도 9 - AAV 캡시드 변이체 라이브러리를 생성시키기 위해 AAV 벡터 시스템에서 사용될 수 있는 대표적인 AAV 캡시드 플라스미드 라이브러리 벡터 (예를 들어, 도 8 참조)의 예시적인 벡터 맵.
도 10 - 상이한 항상성 및 세포-유형 특이적 포유동물 프로모터를 함유하는 구성체에 의해 생산된 바이러스 적정가 (AAV9 벡터 게놈/15 cm 디쉬로서 계산).
도 11 - 추가 최적화된 MyoAAV 캡시드 변이체 (본 명세서에서 증강된 MyoAAV 캡시드 변이체라고도 함)의 선택의 개략도.
도 12 - 증강된 MyoAAV (eMyoAAV) 캡시드 변이체는 전신 전달 후 제1 세대 MyoAAV와 비교하여 마우스 근육으로 더 효과적으로 형질도입될 수 있다.
도 13 - 제1 세대 및 제2 세대 myoAAV 캡시드 변이체는 인간 초대 근관의 형질도입을 위해 Vb6 인테그린 이종이량체 (SEQ ID NO: 2-12)에 의존적이다.
도 14A-14F - DELIVER은 RGD 모티프를 함유하는 근육-향성 AAV 캡시드 변이체의 클래스를 확인한다. 도 14A) DELIVER (SEQ ID NO: 13)를 사용한 바이러스 라이브러리 생산 및 캡시드 변이체 선택의 개략도. 도 14B) CMV, CK8, 또는 MHCK7 프로모터의 제어 하에서 AAV9 캡시드 코딩 서열을 발현하는 ITR-함유 구성체를 사용해 생산된 rAAV 적정가의 비교. 데이터는 평균 ±SD (n=4)로서 표시된다. P-값은 일원 분산 분석 (ANOVA)과 Tukey 다중 비교 검정 (MCT)에 의해 계산되었다. 도 14C-14D) 전신 주사 이후 마우스 골격근 (도 14C) 및 심장 (도14D)에서 CMV, CK8 또는 MHCK7 프로모터의 제어 하에서 발현된 AAV9 캡시드 라이브러리 mRNA의 생체내 발현. 데이터는 평균 ±SD (n=3)로서 표시된다. P값은 일원 ANOVA와 Tukey의 MCT로 계산되었다. *: P<0.05, **: P<0.01. 도 14E) 상이한 마우스 골격근에서 DNA 및 mRNA 수준에서 바이러스 라이브러리에 대한 MHCK7 프로모터 하에 발현된 캡시드 변이체의 농축을 보여주는 그래프. 도 14F) 전사물-기반 선택의 제2 라운드 이후 마우스 근육에서 상위의 고도로 발현된 캡시드 변이체의 7-량체 삽입의 서열. 각 그룹에서 동일한 색상을 갖는 변이체는 동의 DNA 코돈 (SEQ ID NO: 8-12, 14-18)에 의해 코딩된다. 도 21A-21I를 또한 참조한다.　
도 15A-15D - MyoAAV는 전신 주사 이후에 높은 효율로 마우스 골격근에 형질도입된다. 도 15A-15B) 1E+12 vg의f AAV9- 또는 MyoAAV 1A-CMV-EGFP가 전신 주사된 C57BL/6J 마우스로부터의 골격근, 심장, 및 간의 전체 고정 형광 (도 15A) 및 단면도 (도 15B) 이미지. 녹색: EGFP, 적색: 근육 경우 라미닌, 간의 경우 렉틴, 파란색: Hoechst. 단면도의 척도바: 100 ㎛. 도 15C) 주사된 숫컷 및 암컷 C57BL/6J 마우스의 다양한 조직에서 EGFP mRNA 발현의 배수 편차의 정량. 붉은 점선은 AAV9-CMV-EGFP로부터의 상대적 발현을 표시한다. 데이터는 평균 ±SD (n=3-4)로서 표시되낟; *: P<0.05, **: P<0.01 (각 그룹에 대한 AAV9 및 MyoAAV 1A 주사된 마우스 간 Student t 검정). 도 15D) 비히클, AAV9- 또는 MyoAAV 1A-CK8-Nluc가 형질도입된 마우스 (좌측) 및 인간 (우측) 초대 근관에서 시험관내 형질도입의 정량. 데이터는 평균 ±SD (n=5)로서 표시된다; **: P<0.01 (Student t 검정). 공여자 1: 29세 남성, 공여자 2: 19세 여성, 공여자 3: 20세 남성, 공여자 4: 34세 여성. 또한, 도 22A-22K 및 29A-29O을 참조한다.
도 16A-16D - MyoAAV의 전신 주사는 신체 전반의 근육에서 리포터 이식유전자 발현을 빠르게 일으키고 높은 수준으로 지속시킨다. 도 16A) 120일 동안 착수된, 4E+11 vg의 AAV8-, AAV9-, 또는 MyoAAV 1A-CMV-Fluc가 전신 주사된 BALB/cJ 마우스의 전신 생체내 생물발광 이미지. 도 16B) 120일 동안 평가된, AAV8-, AAV9-, 또는 MyoAAV 1A-CMV-Fluc가 주사된 동물의 앞다리 및 뒷다리로부터의 총 발광의 정량. P값은 AAV8, AAV9, 및 MyoAAV 1A 그룹 간에 2원 ANOVA와 Tukey의 MCT를 통해 계산되었고;　데이터는 평균 ±SD (n=5)로서 표시된다. MyoAAV 1A vs AAV8 및 MyoAAV 1A vs AAV9 둘 모두에 대해 **: P<0.01. AAV8 및 AAV9 그룹 간 차이는 어느 시점에도 통계적으로 유의하지 않다. 도 16C) 주사 후 4개월에 채취된 4E+11 vg의 AAV8-, AAV9-, 또는 MyoAAV-CMV-Fluc가 주사된 마우스로부터의 TA, 삼두근, 비복근, 사두근, 및 복근 근육의 전체 장기 발광 이미지. 색척도: 1E+7 - 1E+8. 도 16D) 주사 후 120일에 채취된 AAV8-, AAV9-, 또는 MyoAAV-CMV-Fluc가 주사된 동물의 상이한 근육으로부터 총 발광의 정량. 데이터는 평균 ±SEM (n=5)으로 표시된다. *: P<0.01 (MyoAAV 및 AAV9 그룹 간 Mann-Whitney 검정). 또한, 도 22A-22K, 23A-23B, 및 29A-29O을 참조한다.
도 17A-17O - MyoAAV-Dmd CRISPR 및 MyoAAV-인간 MTM1 의 전신 투여는 각각 DMD 및 XLMTM의 마우스 모델에서 치료적 혜택을 야기한다. 도 17A) AAV9- 또는 MyoAAV 1A-Dmd CRISPR이 주사된 mdx 근육에서 디스트로핀 (적색)에 대한 대표적인 면역형광 이미지. 척도바: 400 ㎛. 도 17B) 하단에 밀도계를 통해 결정된 상대적 신호 강도에 대한, AAV9- 또는 MyoAAV 1A-Dmd CRISPR가 주사된 마우스의 근육에서 디스트로핀 및 GAPDH를 검출하는 웨스턴 블롯. A.U.: 임의 단위, GAPDH에 대해 정규화. 도 17C) AAV9- 또는 MyoAAV 1A- Dmd CRISPR가 주사된 성체 mdx 마우스의 상이한 근육에서 엑손 23-결실 mRNA의 Taqman -기반 정량. 데이터는 평균 ±SD (n=9-10)로 표시된다; **: P<0.01 (Student t 검정). 도 17D-17E) 비히클 (n = 11)이 주사된 야생형 C57BL/6J 마우스, 및 비히클 (n = 15), AAV9-Dmd CRISPR (n=15), 또는 MyoAAV 1A-Dmd CRISPR (n=17)가 주사된 mdx 마우스에 대한 전경골근 근 비력 (도 17D) 및 6회 편심성 수축 후 비력 감소 (도 17E). **: P < 0.01 (ANOVA와 Tukey의 MCT). F) 4 주령 Mtm1 녹아웃 (KO) 마우스에게 전신으로 전달된 2E+12 vg/kg의 AAV9- 또는 MyoAAV 1A-MHCK7-인간 MTM1 (hMTM1)의 효능을 조사하기 위한 실험의 개략도. 도 17G) 비히클 또는 2E+12 vg/kg의 AAV9- 또는 MyoAAV 1A-MHCK7-hMTM1 이 주사된 Mtm1 KO 마우스 및 비히클이 주사된 야생형 한배새끼 대조군의 전 체중. 데이터는 평균 ±SD (KO AAV9 경우 n=6, KO MyoAAV 1A 경우 n=6, 야생형 비히클 경우 n=3, KO 비히클 경우 n=3)로 표시된다. P값은 MyoAAV 1A 및 AAV9 그룹 간에 계산되었다; **: P<0.01 (다중 t 검정과 Holm-Sidak MCT). 도 17H) 바이러스의 주사 후 16주에 2E+12 vg/kg의 MyoAAV 1A-hMTM1 또는 AAV9-hMTM1 가 주사된 Mtm1 KO 마우스의 사진. 도 17K) 비히클, AAV9-hMTM1, 또는 MyoAAV-hMTM1 이 주사된 Mtm1 KO 동물을 비롯하여 비히클이 주사된 야생형 한배새끼의 생존 곡선. 비히클이 주사된 Mtm1 KO 마우스에 대한 데이터 점은 이전 실험에 의한 것이다. I) 비히클이 주사된 야생형 마우스, 또는 비히클, AAV9-hMTM1, 또는 MyoAAV 1A-hMTM1 (둘 모두 2E+12 vg/kg)이 주사된 Mtm1 KO 마우스로부터 케이지 내 러닝휠 회전수로 평가된 평균 1시간 수동적 활동. 데이터는 3주 시간 기간에 걸쳐 평균낸 주간 측정에 대한 평균 ±SD (KO AAV9 경우 n=6, KO MyoAAV 1A 경우 n=6, 야생형 비히클 경우 n=3, KO 비히클 경우 n=3)로서 표시된다. P값은 MyoAAV 1A 및 AAV9 그룹 간에 계산되었다; **: P<0.01 (다중 t 검정과 Holm-Sidak MCT). 도 17J) 비히클이 주사된 야생형 마우스, 또는 AAV9-hMTM1, 또는 MyoAAV-hMTM1 (둘 모두 2E+12 vg/kg)가 주사된 Mtm1 KO 마우스에서 5분 동안 탐색 행동 (rearing events)의 수. 데이터는 3주 시간 기간에 걸쳐 평균낸 주간 측정에 대한 평균 ±SEM (KO AAV9의 경우 n=5, KO MyoAAV의 경우 n=6, 야생형 비히클의 경우 n=3)로서 표시된다. P값은 MyoAAV 및 AAV9 그룹 간에 계산되었다; *: P<0.05, **: P<0.01 (2-단계 Benjamini, Krieger, & Yekutieli 검정). 도 17K) 비히클, AAV9-hMTM1, 또는 MyoAAV 1A-hMTM1 이 주사된 Mtm1 KO 동물을 비롯하여, 비히클이 주사된 야생형 한배새끼에 대한 생존 곡선 (KO AAV9 경우 n=6, KO MyoAAV 1A 경우 n=6, 야생형 비히클 경우 n=3, KO 비히클 경우 n=4). 비히클이 주사된 Mtm1 KO 마우스에 대한 데이터 점은 이전 실험으로부터의 것이다. P값은 MyoAAV 1A 및 AAV9 그룹 간에 계산되었다; **: P<0.01 (Mantel-Cox 검정). 도 17L) 주사 후 4주에 분석된 AAV9- 또는 MyoAAV 1A-hMTM1 이 주사된 Mtm1 KO 마우스의 비복근, 사두근, 심장, 및 간에서 hMTM1 mRNA 발현의 배수 차이의 정량. 적색 점선은AAV9-hMTM1 로부터의 상대적 발현을 의미한다. 데이터는 평균 ±SD (n=4)로서 표시된다; *: P<0.05, **: P<0.01 (각 조직에 대한 AAV9 및 MyoAAV 1A 주사된 그룹 간 Student t 검정). 도 17M) 주사 후 4주에 분석된 AAV9- 또는 MyoAAV 1A-hMTM1 이 주사된 Mtm1 KO 마우스의 다양한 조직에서 이배체 게놈 당 벡터 게놈의 정량. 데이터는 평균 ±SD로서 표시된다 (n=4). *: P<0.05, **: P<0.01 (Student t 검정). 도 17N) 하단에 밀도계로 결정된 상대적 신호 강도를 갖는, 비히클, AAV9- 또는 MyoAAV 1A-hMTM1 가 주사된 Mtm1 KO 마우스의 근육에서 hMTM1 및 GAPDH를 검출하는 웨스턴 블롯. A.U.: 임의 단위, GAPDH에 대해 정규화. 도 17O) 비히클 (n = 4)이 주사된 야생형 C57BL/6J 마우스, 및 비히클 (n = 2), AAV9-hMTM1 (n=4), 또는 MyoAAV 1A-hMTM1 (n=4)가 주사된 Mtm1 KO 마우스에 대한 장지신근 (EDL) 근 비력. **: P < 0.01 (ANOVA과 Tukey의 MCT). 도 24A-24G를 또한 참조한다.
도 18A-18L - MyoAAV 형질도입은 인테그린 이종이량체 및 AAVR 둘 모두에 의존적이다. 도 18A-18B) RGD-결합 인테그린 이종이량체를 코딩하는 플라스미드 또는 pUC19로 형질감염되고, AAV9- 또는 MyoAAV-CMV-Nluc가 형질감염된 HEK293 세포에서 시험관내 형질도입의 정량 (도 18A) 및 세포 표면에 결합된 바이러스 (도 18B). 데이터는 평균 ±SEM (n=3)로 표시된다. P값은 각 그룹에서 pUC19 형질감염된 세포와 비교하여 계산되었다. *: P < 0.05, **: P<0.01 (ANOVA와 Dunnett의 다중 비교 검정). 도 18C) 상이한 농도의　GLPG-0187 범-인테그린 αV 길항제를 처리하고 AAV9- 또는 MyoAAV-CK8-Nluc를 형질도입시킨 마우스 초대 근관에서 시험관내 형질도입 효율. 데이터는 평균 ±SEM (n=5)로서 표시된다. P값은 각 그룹에서 0 nM 소형 분자와 비교하여 계산되었다. **: P<0.01 (ANOVA와 Dunnett의 다중 비교 검정). 도 18D) 상이한 농도의 GLPG-0187 범-인테그린 αV 길항제가 처리되고 AAV9- 또는 MyoAAV 1A-CK8-Nluc가 형질도입된 인간 초대 근관에서 시험관내 형질도입 효율. 데이터는 평균 ±SD로서 표시된다 (n=5). P값은 각 그룹에서 0 nM 소형 분자 조건과 비교하여 계산되었다. *: P<0.01 (ANOVA와 Dunnett의 MCT). 도 18E-18F) 상이한 농도의 αVb1, αVb3, αVβ6, αVb8, 또는 MBP 재조합 단백질과 인큐베이션된 MyoAAV 1A-CK8-Nluc (도 18E) 또는 AAV9-CK8-Nluc (도 18F)가 형질도입된 인간 초대 근관에서 시험관내 형질도입 효율. 데이터는 평균 ± SD (n=5)로 표시된다. *: P<0.01, **: P<0.001 (각 그룹에 대한 대조군으로서 설정된 0 nM 재조합 단백질에 대해 ANOVA와 Dunnett MCT). 도 18G) 상이한 농도의 항-αVβ6 항체로 처리되고 AAV9- 또는 MyoAAV-CK8-Nluc가 형질도입된 인간 초대 근관에서 시험관내 형질도입 효율. 데이터는 평균 ±SEM (n=5)로서 표시된다. P값은 각 그룹에서 0 ng/㎕ 항체 조건과 비교하여 계산되었다. **: P<0.001 (ANOVA와 Dunnett의 다중 비교 검정). 도 18G-18H) 상이한 농도의 항-αVβ6 (도 18G) 또는 이소타입 대조군 (도 18H) 항체가 처리되고 AAV9- 또는 MyoAAV 1A-CK8-Nluc가 형질도입된 인간 초대 근관에서 시험관내 형질도입 효율. 데이터는 평균 ±SD로서 표시된다 (n=5). P값은 각 그룹에서 0 ng/㎕ 항체 조건과 비교하여 계산되었다; *: P<0.01, **: P<0.001 (ANOVA와 Dunnett의 MCT). 도 18I-18J) RGD-결합 인테그린 이종이량체를 코딩하는 플라스미드 또는 pUC19가 형질감염되고 MyoAAV 1A-CMV-Nluc가 형질도입된 HEK293 세포에서 시험관내 형질도입 (도 18I) 및 세포 표면에 결합된 바이러스 (도 18J)의 정량. 데이터는 평균 ±SD로서 표시된다 (n=3); *: P<0.01 (대조군으로서 pUC19 형질감염된 세포에 대한 일원 ANOVA와 Dunnett의 MCT). 도 18K는 상이한 농도의 CWHM-12 범-인테그린 αV 길항제가 처리되고 AAV9- 또는 MyoAAV 1A-CK8-Nluc가 형질도입된 인간 초대 근관에서 시험관내 형질도입 효율을 도시한다. 데이터는 평균 ±SD로서 표시된다 (n=5). P값은 각 그룹에서 0 nM 소형 분자 조건과 비교하여 계산되었다. *: P<0.01 (ANOVA와 Dunnett의 MCT. 도 18L은 상이한 농도의 이소타입 대조군 항체가 처리되고 AAV9- 또는 MyoAAV 1A-CK8-Nluc가 형질도입된 인간 초대 근관에서 시험관내 형질도입 효율을 도시한다. 데이터는 평균 ±SD로서 표시된다 (n=5). P값은 각 그룹에서 0 ng/㎕ 항체 조건과 비교하여 계산되었다; *: P<0.01, **: P<0.001 (ANOVA와 Dunnett의 MCT). 도 25A-25K 및 26A-26O을 또한 참조한다.
도 19A-19M - DELIVER를 사용한 MyoAAV의 추가 진화는 더 증강된 근육-향성 캡시드 변이체를 생성시킨다. 도 19A) AAV9 VR-VIII 표면 루프의 구조 및 아미노산 주석달린 MyoAAV 1A VR-VIII 표면 루프의 예측된 구조. 도 19B) 바이러스 라이브러리 디자인의 개략도 및 2개 상이한 용량으로 제2-라운드 바이러스 라이브러리의 주사 후 마우스 근육으로부터 확인된 상위 히트의 서열 (SEQ ID NO: 2-7, 19-21). 도 19C) 파란색 빛이 조사된 2E+11 vg의 MyoAAV 1A-CMV-EGFP (좌측) or MyoAAV 2A-CMV-EGFP (우측)가 전신 조사된 C57BL/6J 마우스의 상이한 조직. 도 19D) 2E+11 vg의 AAV9-, MyoAAV 1A-, 또는 MyoAAV 2A-CMV-EGFP가 전신 주사된 마우스의 비복근, 삼두근, TA, 및 사두근의 전체 고정 형광 이미지. 도 19E) 동일 용량의 AAV9-CMV-EGFP가 주사된 마우스와 비교하여 2E+11 vg의 MyoAAV 1A-, 또는 MyoAAV 2A-CMV-EGFP가 전신 주사된 C57BL/6J 마우스의 다양한 조직에서 EGFP mRNA 발현의 배수 차이의 정량. 적색 점선은 AAV9-CMV-EGFP로부터의 상대적 발현을 표시한다. 데이터는 평균 ±SD로서 표시된다 (MyoAAV 1 및 MyoAAV 2A 경우 n=11, AAV9 경우 n=8). P값은 AAV9 그룹과 비교하여 계산되었다. *: P<0.05, **: P<0.01 (ANOVA와 Dunnett의 MCT). 도 19F) AAV9-, MyoAAV 1A-, 또는 MyoAAV 2A-CK8-Nluc가 형질도입된 인간 초대 근관에서 시험관내 형질도입의 정량. 데이터는 평균 ±SD로서 표시된다 (n=5). *: P<0.01 (ANOVA과 Tukey의 MCT). 도 19G) 상이한 농도의 GLPG-0187 인테그린 αV 길항제가 처리되고 AAV9- 또는 MyoAAV 2A-CK8-Nluc가 형질도입된 인간 초대 근관에서 시험관내 형질도입 효율. 데이터는 평균 ±SD로서 표시된다 (n=5). P값은 각 그룹에서 0 nM 소형 분자 조건과 비교하여 계산되었다. *: P<0.05, **: P<0.01 (ANOVA와 Dunnett의 MCT). 도 19H-19I) 상이한 농도의 αVb1, αVb3, αVβ6, αVb8, 또는 MBP 재조합 단백질과 인큐베이션된 MyoAAV 2A-CK8-Nluc (도 19H) 또는 AAV9-CK8-Nluc (도 19I)가 형질도입된 인간 초대 근관에서 시험관내 형질도입 효율. 데이터는 평균 ± SD (n=5)로서 표시된다. **:P<0.01, ***:P<0.001 (대조군으로서 각 그룹에서 0 nM 재조합 단백질 조건에 대한 일원 ANOVA과 Dunnett의 MCT). 도 19J) 21일 동안 착수된, 2E+11 vg의 AAVrh74-, AAV9-, 또는 MyoAAV 2A-CMV-Fluc가 전신 주사된 BALB/cJ 마우스의 생체내 생물발광 이미지의 전신. 색척도: 6E+6 - 1E+9. 도 19K) 21일 동안 평가된, AAVrh74-, AAV9-, 또는 MyoAAV 2A-CMV-Fluc가 주사된 동물의 뒷다리로부터의 전체 발광의 정량. P값은 2원 ANOVA과 Tukey의 MCT에 의해서 AAVrh74, AAV9, 및 MyoAAV 2A 그룹 간에 계산되었다; **: MyoAAV 2A vs AAVrh74 및 MyoAAV 2A vs AAV9 둘 모두에 대해서 P<0.01. AAVrh74 및 AAV9 그룹 간 차이는 어느 시점에도 통계적으로 유의하지 않다. 도 19L) 2E+11 vg의 AAV9-, MyoAAV 1A-, 또는 MyoAAV 2A-CMV-EGFP가 주사된 C57BL/6J 마우스의 다양한 조직에서 이배체 게놈 당 벡터 게놈의 정량. 데이터는 평균 ±SD로서 표시된다 (MyoAAV 1A 및 MyoAAV 2A 경우 n=11, AAV9 경우 n=8). P값은 MyoAAV 2A 및 AAV9 그룹 간에 계산되었다; *: P<0.05, **: P<0.01 (Student t 검정). 도 19M) 상이한 농도의 항-αVβ6 항체 (좌측) 또는 10 ng/㎕ 이소타입 대조군 항체 (우측)으로 처리되고 AAV9- 또는 CK8 프로모터의 제어 하에서 Nluc를 코딩하는 제1 또는 제2 세대 RGD-함유 캡시드 변이체가 형질도입된 인간 초대 근관에서 시험관내 형질도입 효율. 데이터는 평균 ±SD로서 표시된다 (n=5). 항-αVβ6 항체 데이터에 대한 P-값은 제1 세대 및 제2 세대 그룹 간에 계산되었다. *: P<0.05, **: P<0.01 (2원 ANOVA와 Tukey의 MCT). 이소타입 대조군 데이터에 대한 P 값은 각 그룹에서 이소타입 대조군 및 10 ng/㎕ 항-αVβ6 항체 조건 간에 계산되었다; *: P<0.01 (Student t 검정). 도 27A-27B를 도한 참조한다.
도 20A-20F - EMyoAAV-CK8-마이크로디스트로핀의 저용량의 2E+13 vg/kg의 전신 주사는 성체 DBA/2J-mdx 마우스에서 광범위 마이크로디스트로핀 발현 및 근육 기능의 효과적인 복원을 일으킨다. 도 20A) 2E+13 vg/kg AAV9- 또는 MyoAAV 2A-CK8-마이크로디스트로핀이 주사된 DBA/2J-mdx 마우스의 근육에서 마이크로디스트로핀-FLAG (적색)에 대한 대표적인 면역형광 이미지. 척도바: 400 ㎛. 도 20B) 하단에 밀도계로 결정된 상대적 신호 강도와 함께, 2E+13 vg/kg AAV9- 또는 MyoAAV 2A-CK8-마이크로디스트로핀이 주사된 마우스의 근육에서 마이크로디스트로핀-FLAG 및 GAPDH를 검출한 웨스턴 블롯. A.U.: 임의 단위, GAPDH에 대해 정규화. 도 20C) 동일 용량의 AAV9-CK8-마이크로디스트로핀이 주사된 마우스와 비교하여 2E+13 vg/kg의 MyoAAV 2A-CK8-마이크로디스트로핀이 전신 주사된 DBA/2J-mdx 마우스의 다양한 근육 및 간에서 마이크로디스트로핀 mRNA 발현의 배수 차이의 정량. 적색 점선은 AAV9-CK8-마이크로디스트로핀으로부터의 상대적 발현을 의미한다. 데이터는 평균 ±SD로서 표시된다 (n=9-10); *: P<0.05, **: P<0.01 (Student t 검정). 도 20D) 2E+13 vg/kg의 AAV9- 또는 MyoAAV 2A-CK8-마이크로디스트로핀이 주사된 DBA/2J-mdx 마우스의 다양한 근육 및 간에서 이배체 게놈 당 벡터 게놈의 정량. 데이터는 평균 ±SD로서 표시된다 (n=9-10). **: P<0.01 (Student t 검정). 도 20E-20F) 비히클 (n=10)이 주사된 DBA2/J 마우스, 및 비히클 (n = 10), AAV9-CK8-마이크로디스트로핀 (n=10), 또는 MyoAAV 2A-CK8-마이크로디스트로핀 (n=10)이 주사된 DBA/2J-mdx 마우스에 대한 근 비력 (도 20E) 및 편심성 수축 후 비력 감소 (도 20F). *: P < 0.05, **: P < 0.01, ***: P < 0.001 (ANOVA과 Tukey의 MCT).
도 21A-21I - DELIVER는 다양한 조직에서 기능성 형질도입될 수 있는 캡시드 변이체의 선택을 허용한다. 도 21A) AAV 형질도입의 상이한 단계의 개략적인 대표도. 도 21B-21G) 주사된 마우스의 뇌 (도 21B), 신장 (도 21C), 폐 (도 21D), 골격근(도 21E), 심장 (도 21F), 및 간 (도 21G)에서 DNA 및 mRNA 수준에서 바이러스 라이브러리에 대한 편재성 CMV 프로모터 하에 발현된 캡시드 변이체의 농축을 도시하는 그래프. DELIVER에서 사용되는 바와 같은 전사물-기반 선택은 DNA-기반 선택과 비교하여 기능성 캡시드 변이체의 더 엄격한 확인을 가능하게 한다. 바이러스 라이브러리에 대한 농축은 바이러스 라이브러리에서 동일한 변이체의 RPM으로 조직에서 확인된 각 변이체에 대한 백만 당 판독치 (RPM)를 나누어 계산된다. 도 21H-21I) 벡터 게놈 DNA의 존재비 (도 21H) 또는 바이러스 라이브러리가 주사된 마우스의 간에서 확인된 변이체로부터의 CMV 프로모터 제어 하에서 발현된 mRNA (도 21I)의 존재비와 바이러스 라이브러리 중 각 캡시드 변이체의 존재비 간 상관성. 각 변이체로부터의 벡터 게놈 DNA의 상대량이 바이러스 라이브러리 중 변이체의 존재비와 상관있지만, 2개 샘플 유형 간 선형 회귀를 기반으로 바이러스 라이브러리 중 변이체의 분량 및 각 변이체로부터의 캡시드 mRNA 발현 수준 간 상관성은 거의 없다. RPM: 백만 당 판독치 (Reads Per Million).
도 22A-22K - MyoAAV는 AAV9와 비교하여 유사한 역가를 갖는 재조합 AAV를 생산하고 성체 mdx-Ai9 마우스에 전신 전달 후 AAV8 및 AAV9에 비해서 더 효과적으로 근육 줄기 세포에 형질도입된다. 도 22A-22B) 1E+12 vg의 AAV9- 또는 MyoAAV 1A-CMV-EGFP가 전신 주사된 C57BL/6J 마우스로부터의 삼두근, 비복근, 및 복근 근육의 전체 고정 형광 (도 22A) 및 단면 (도 22B) 이미지. 녹색: EGFP, 적색: 라미닌, 파란색: Hoechst. 단면도의 척도바: 100 ㎛. 도 22C) 1E+12 vg의 AAV9- 또는 MyoAAV 1A-CMV-EGFP가 전신 주사된 C57BL/6J 마우스로부터의 폐, 신장, 비장, 및 뇌의 전체 고정 형광 이미지. 도 22D) 1E+12 vg의 AAV9 또는 MyoAAV 1A-CMV-EGFP가 주사된 C57BL/6J 마우스의 다양한 조직에서 이배체 게놈 당 벡터 게놈의 정량. 데이터는 평균 ±SD로서 표시된다 (n=4); *: P<0.05, **: P<0.01 (Student t 검정). 도 22E) 상위 RGD-함유 캡시드 변이체에 의해 생산된 재조합 AAV 역가와 야생형 AAV9의 비교. 데이터는 평균 ±SD로서 표시된다 (n=3). P값은 대조군으로서 AAV9에 대한 ANOVA와 Dunnett의 MCT에 의해 계산되었다. 도 22F) 위성 세포 형질도입 분석 실험의 개략도. Ai9 유전자좌를 함유하는 세포로 Cre 리콤비나제의 전달은 게놈으로부터 STOP 카세트의 제거 및 tdTomato의 발현을 일으켰다. 도 22G) 4E+11 vg의 AAV8-, AAV9-, 또는 MyoAAV 1A-CMV-Cre의 전신 주사 후 2주에, 6 개월령 mdx-Ai9 마우스로부터 단리된 tdTomato+ 형질도입된 근육 줄기 세포%. 데이터는 평균 ±SD로서 표시된다 (n=4); **: P < 0.01 (일원 ANOVA과 Tukey의 MCT). 도 22H) 주사된 mdx-Ai9 마우스로부터 단리된 근육 줄기 세포로부터의 대표적인 FACS 그래프. 도 22I) AAV8-, AAV9-, 또는 MyoAAV 1A-CMV-Cre가 전신 주사된 mdx-Ai9 마우스로부터 단리된 FACS 분류된 근육 줄기 세포로부터 분화된 근관의 대표적인 면역형광 이미지. 녹색, 미오신 중쇄 (MHC); 적색, tdTomato; 파란색, Hoechst. 척도바: 400 ㎛. 도 22J) 비히클, 또는 1E+12 vg의 AAV9- 또는 MyoAAV 1A-CMV-EGFP가 주사된 마우스의 근육에서 EGFP 및 빈큘린을 검출하는 웨스턴 블롯. 도 22K) 근육에서 단핵 세포로부터 골격근 전구체를 단리하기 위한 게이팅 전략.
도 23A-23B - MyoAAV의 전신 투여는 BALB/cJ 마우스 근육에서 장기간 높은 수준의 이식유전자 발현을 일으킨다. 도 23A) 120일 동안, 4E+11 vg의 AAV8-, AAV9-, 또는 MyoAAV-CMV-Fluc가 주사된 BALB/cJ 마우스의 전신 생체내 생물발광 이미지. 이 이미지는 AAV8- 및 AAV9-CMV-Fluc가 주사된 마우스의 근육에서 신호 검출이 가능하도록 상이한 색척도 (5E+6 - 5E+7)로 도 16A에 도시된 동일 마우스로부터의 발광 신호를 도시한다. 도 23B) 주사 후 4개월에 채취된 4E+11 vg의 AAV8-, AAV9-, 또는 MyoAAV-CMV-Fluc가 주사된 마우스의 TA, 삼두근, 비복근, 사두근, 및 복근 근육의 전체 장기 발광 이미지. 이 이미지는 AAV8- 및 AAV9-CMV-Fluc가 주사된 마우스의 근육에서 신호의 검출이 가능하도록 상이한 색척도 (5E+5 - 5E+7)로 도 16C에 도시된 동일 마우스로부터의 발광 신호를 도시한다.
도 24A-24G - MyoAAV-Dmd CRISPR 전신 투여는 신체 전반에서 다수 근육 중 AAV9-Dmd CRISPR과 비교하여 더 높은 수준의 SaCas9 및 gRNA 발현을 일으킨다. 도 24A) AAV9- 및 MyoAAV 1A-Dmd CRISPR 바이러스를 생성시키는데 사용된 AAV 구성체의 개략도. 도 24B) mdx 마우스에 AAV-Dmd CRISPR 투여 후 디스트로핀 복원의 개략도. 마우스는 4.5E+12 vg의 SaCas9 및 9E+12 vg의 gRNA AAV가 주사되었다. 도 24C-24D) 4.5E+12 vg의 AAV9- 또는 MyoAAV 1A-CMV-SaCas9 및 9E+12 vg의 AAV9- 또는 MyoAAV 1A-gRNA가 전신 주사된 8 주량 mdx 마우스의 상이한 근육에서 SaCas9 mRNA (도 24C) 또는 gRNA (도 24D) 발현의 배수 차이의 정량. 적색 점선은 AAV9-CMV-SaCas9 (도 24F) 및 AAV9-gRNA (도 24F)로부터의 상대적 발현을 표시한다. 데이터는 평균 ±SD로서 표시된다 (n=5-6); *: P<0.05, **: P<0.01, ***: P<0.001, ****: P<0.0001 (Student t 검정). 도 24E) AAV9- 및 MyoAAV 1A-MHCK7 인간 MTM1 바이러스를 생성시키는데 사용된 AAV 구성체의 개략도. 도 24F) AAV9- 및 MyoAAV 1A-MHCK7 인간 MTM1 바이러스를 생성시키는데 사용된 AAV 구성체의 개략도. 도 24G) 비히클이 주사된 야생형 마우스, 또는 비히클, AAV9-hMTM1, 또는 MyoAAV 1A-hMTM1 (둘 모두 2E+12 vg/kg)이 주사된 Mtm1 KO 마우스에 의한 5분 탐색행동의 수. 데이터는 3주 시간 기간에 걸쳐서 평균낸 주간 측정에 대해서 평균 ±SD로서 표시된다 (KO AAV9 경우 n=6, KO MyoAAV 1A 경우 n=6, 야생형 비히클 경우 n=3, KO 비히클 경우 n=4). 비히클이 주사된 Mtm1 KO 마우스에 대한 데이터 점은 이전 실험으로부터의 것이다. P값은 MyoAAV 1A 및 AAV9 그룹 간에 계산되었다; **: P<0.01 (다중 t 검정과 Holm-Sidak MCT).
도 25A-25K - HEK293 세포에서 플라스미드 형질감염 후 인테그린 알파 및 베타 단백질의 과발현을 확인한 유세포측정 및 웨스턴 블롯. 도 25A-25G) pUC19 또는 EF1 프로모터의 제어 하에서 인테그린 αV (도 25A), β1 (도 25B), α5 (도 25C), β8 (도 25D), β5 (도 25E), β3 (도 25F), 또는 β6 (도 25G)을 발현하는 플라스미드로 형질감염되고 과발현된 단백질에 대한 항체로 염색된 HEK293 세포의 유세포측정으로부터의 대표적인 히스토그램. 도 25H-25I) pUC19 (레인 3 및 4)로 형질감염된 세포와 비교하여 상응하는 인테그린 플라스미드 (레인 1 및 2)로 형질감염된 HEK293 세포에서 인테그린 α8 (도 25H), αIIb (도 25I), β3 (도 25J), 및 β8 (도 25K)의 과발현을 보여주는 웨스턴 블롯.
도 26A-26O - 인테그린 αV 길항제는 상이한 공여자로부터의 초대 인간 근관을 비롯하여, 초대 마우스 근관에서 AAV9 형질도입은 아니지만 MyoAAV는 억제한다. 도 26A-26B) 상이한 농도의 CWHM-12 (도 26A) 또는 GLPG-0187 (도 26B 및 도 26J) 인테그린 αV 길항제가 처리되고 AAV9- 또는 MyoAAV-CK8-Nluc (MyoAAV 1A-CK8-Nluc)가 형질도입된 마우스 초대 근관에서 시험관내 형질도입 효율. 데이터는 평균 ±SEM (n=5)로 표시된다. *: P < 0.05, **: P<0.01 (대조군으로서 각 그룹에 대한 0 nM 조건에 대해 ANOVA와 Dunnett의 MCT). 도 26C-26H) 상이한 농도의 CWHM-12 (도 26C, 26E, 및 26G) 또는 GLPG-0187 (도 26D, 26F, 및 26H) 인테그린 αV 길항제가 처리되고 AAV9- 또는 MyoAAV 1A-CK8-Nluc가 형질도입된 3명 상이한 공여자로부터의 인간 초대 근관에서 시험관내 형질도입 효율. 데이터는 평균 ±SD로서 표시된다 (n=5). *: P < 0.05, **: P<0.01 (대조군으로서 각 그룹에 대해 O nM 조건에 대해 ANOVA와 Dunnett의 MCT). 도 26I) AAVR을 과발현하고, RGD-결합 인테그린 이종이량체를 코딩하는 플라스미드 또는 pUC19가 형질감염되고, AAV9- 또는 MyoAAV 1A-CMV-Nluc가 형질도입된 HEK293FT 세포, HEK293FT AAVR KO 세포, 및 HEK293FT AAVR KO 세포에서 시험관내 형질도입의 정량. 데이터는 평균 ±SD로서 표시된다 (n=3). **: P<0.0001 (log 변환 데이터를 사용한 Student t 검정). 도 26J-26K) 미처리 HEK293 세포, 또는 NA가 사전처리되고 AAV2-, AAV9-, 또는 MyoAAV 1A-CMV-Nluc가 형질도입된 세포의 시험관내 형질도입 (도 26J) 및 결합 (도 25K)의 정량. 데이터는 평균 ±SD로서 표시된다 (n=5); *: P<0.01, **: P<0.0001 (log 변환 데이터를 사용한 Student t 검정). 도 26L) AAV2-, AAV9-, 또는 MyoAAV 1A-CMV-Nluc와 함께 NA 및 ECL 또는 NA 단독으로 사전 처리된 HEK293 세포의 시험관내 형질도입 (K) 및 결합 (L)의 정량. 데이터는 평균 ±SD로서 표시된다 (n=5); *: P<0.01, **: P<0.0001 (log 변환 데이터를 사용한 Student t 검정). 도 26M) AAV2-, AAV4-, AAV9-, 또는 MyoAAV 1A-CMV-Nluc가 형질도입된 HEK293FT 및 HEK293FT AAVR KO 세포 간 시험관내 형질도입의 비교. 데이터는 평균 ±SD로서 표시된다 (n=3). **: P<0.0001 (log 변환 데이터를 사용한 Student t 검정). 도 26N) AAV2-, AAV9-, 또는 MyoAAV 1A-CMV-Nluc와 함께 NA 및 ECL 또는 NA 단독으로 사전-처리된 HEK293 세포의 시험관내 결합의 정량. 데이터는 평균 ±SD로서 표시된다 (n=5); *: P<0.01, **: P<0.0001 (log 변환 데이터를 사용한 Student t 검정). 도 26O) AAV2-, AAV4-, AAV9-, 또는 MyoAAV 1A-CMV-Nluc가 형질도입된 HEK293FT 및 HEK293FT AAVR KO 세포 간 시험관내 형질도입의 비교. 데이터는 평균 ±SD로서 표시된다 (n=3). **: P<0.0001 (log 변환 데이터를 사용한 Student t 검정).
도 27A-27B - 제2 세대 RGD-함유 캡시드 변이체는 제1 세대 변이체와 비교하여 인간 초대 근관에 형질도입을 위해 αVβ6에 덜 의존한다. 도 27A) 2E+11 vg의 AAV9-, MyoAAV-, 또는 EMyoAAV-CMV-EGFP가 주사된 C57BL/6J 마우스의 다양한 조직에서 이배체 게놈 당 벡터 게놈의 정량. 데이터는 평균 ±SEM로 표시된다 (MyoAAV 및 EMyoAAV 경우 n=11, AAV9 경우 n=8). *: P<0.05 (Mann-Whitney 검정). 도 27B) 상이한 농도의 항-αVβ6 항체로 처리되고 AAV9- 또는 CK8 프로모터의 제어 하에 Nlcu를 코딩하는 제1 또는 제2 세대 RGD-함유 캡시드 변이체가 형질도입된 인간 초대 근관에서 시험관내 형질도입 효율. 데애터는 평균 ±SEM (n=5)로서 표시된다. 좌측 그래프는 각 개별 변이체에 대한 형질도입 효율을 입증한다. 우측 그래프에서, 제1 세대 변이체 (RGDLTTP (SEQ ID NO: 12), RGDLSTP (SEQ ID NO: 8), RGDLNQY (SEQ ID NO: 9), RGDATEL (SEQ ID NO: 10), and RGDTMSK (SEQ ID NO: 11)) 및 제2 세대 변이체 (GPGRGDQTTL (SEQ ID NO: 2), AEGRGDQYTR (SEQ ID NO: 3), ATGRGDLGQA (SEQ ID NO: 4), AVARGDQGLI (SEQ ID NO: 5), NISRGDQGYQ (SEQ ID NO: 6), APARGDQGSQ (SEQ ID NO: 7))의 결과가 2개 그룹으로서 그래프화된다. *: P<0.01 (제1 세대 및 제2 세대 그룹 간 2-단계 Benjamini, Krieger, & Yekutieli 검정) (SEQ ID NO: 2-12).
도 28A-28K - NHP에서 진화된 캡시드 변이체의 MyoAAV 클래스는 높은 효율로 사이노몰거스 마카크의 상이한 근육에 형질도입된다. 도 28A-28B) 바이러스 라이브러리 디자인의 개략도 및 무작위 7-량체 삽입부를 함유하는 캡시드 변이체로부터 마카크에서 생체내 선택의 2 라운드 후 NHP 근육에서 확인된 상위 히트의 서열 (도 28A) (SEQ ID NO: 13, 22-27), 또는 마우스에서 RGD-고정 선택의 1 라운드로부터 확인된 상위 120,000 변이체를 사용한 마카크에서 생체내 선택의 1 라운드로부터의 서열 (도 28B) (SEQ ID NO: 19, 28-32). 도 28C) 4명 상이한 공여자로부터 인간 초대 근관에서 마우에서 선택된 11종 근육-향성 캡시드 변이체 간 시험관내 형질도입의 비교. 데이터는 평균으로 개별 데이터 점으로서 표시된다; **: P<0.01 (대조군으로서 MyoAAV 1A에 대해 일원 ANOVA와 Dunnett MCT). 도 28D) 바코드화된 인간 프라탁신 이식유전자의 개략도 및 NHP에서 상위 근육-향성 변이체의 특징규명에 사용된 캡시드 변이체의 풀 (SEQ ID NO: 28, 30, 32-33). 도 28E) 3마리 사이노몰거스 마크카의 상이한 골격근, 심장, 및 간에서 AAVrh74에 대한 mRNA 발현 배수 변화. 각각의 캡시드 변이체와 연관된 바코드의 심층 시퀀싱으로 정량된 mRNA 발현. 데이터는 평균 ±SD로서 표시된다 (n=3). *: P<0.05, **: P<0.01, ***: P<0.001, ****: P<0.0001 (대조군으로서 AAVrh74에 대해 일원 ANOVA와 Dunnett의 MCT). 도 28F) 6개 상이한 이식유전자를 갖는 AAVrh74, MyoAAV 3A, MyoAAV 4A, MyoAAV 4C, 및 MyoAAV 4E, 및 AAV9 역가의 비교. 데이터는 평균 ±SD로서 표시된다 (n=6). *: P<0.05; ****: P<0.0001 (대조군으로서 AAVrh74에 대한 일원 ANOVA와 Dunnett의 MCT). 도 28G) 상이한 농도의 GLPG-0187 인테그린 αV 길항제가 처리되고, AAV9-, MyoAAV 3A-, MyoAAV 4A-, MyoAAV 4C-, 또는 MyoAAV 4E-CK8-Nluc가 형질도입된 인간 초대 근관에서 시험관내 형질도입 효율. 데이터는 평균 ±SD로서 표시된다 (n=5). P값은 대조군으로서 설정된 각 그룹에 대한 0 nM 조건에 대해 일원 ANOVA와 Dunnett의 MCT로 계산되었다: MyoAAV 3A, MyoAAV 4A, MyoAAV 4C, 및 MyoAAV 4E에 대해 P<0.0001; MyoAAV 4A 및 MyoAAV 4E에 대해 P<0.0001. 도 28H-28I) 상이한 농도의 αVb1, αVb3, αVb6, αVb8, 또는 MBP 재조합 단백질과 인큐베이션된 AAV9-CK8-Nluc (도 28H) 또는 MyoAAV 3A-, MyoAAV 4A-, MyoAAV 4C-, 또는 MyoAAV 4E-CK8-Nluc (도 28I)가 형질도입된 인간 초대 근관에서 시험관내 형질도입 효율. 데이터는 평균 ±SD (n=5)로 표시된다. **: P<0.01, **: P<0.001, ***: P<0.0001 (대조군으로서 각 그룹에서 0 nM 재조합 단백질 조건에 대한 일원 ANOVA와 Dunnett의 MCT). 도 28J) 상이한 농도의 항-αVb6 항체 또는 마우스 이소타입 대조군이 처리되고 AAV9-, MyoAAV 3A-, MyoAAV 4A-, MyoAAV 4C-, 또는 MyoAAV 4E-CK8-Nluc가 형질도입된 인간 초대 근관에서 시험관내 형질도입 효율. 데이터는 평균 ±SD로서 표시된다 (n=5). : MyoAAV 3A, MyoAAV 4A, MyoAAV 4C, 및 MyoAAV 4E에 대해 P<0.0001; MyoAAV 3A, MyoAAV 4A, 및 MyoAAV 4E에 대해 P<0.0001 (대조군으로서 각 그룹에 대한 0 nM 조건에 대해 일원 ANOVA와 Dunnett의 MCT). 도 28K) AAV2-, AAV4-, AAV9-, MyoAAV 3A-, MyoAAV 4A-, MyoAAV 4C-, 또는 MyoAAV 4E-CMV-Nluc가 형질도입된 HEK293FT 및 HEK293FT AAVR KO 세포 간 시험관내 형질도입의 비교. 데이터는 평균 ±SD로서 표시된다 (n=4). : P<0.0001 (log 변환된 데이터에 대한 Student t 검정).
도 29A-29O - MyoAAV 1A는 DBA/2J 및 BALB/cJ 배경으로부터의 마우스에서 전신 투여 후 상이한 골격근을 효과적으로 형질도입시키고, 근육내 전달 후 근육 형질도입에서 매우 강력하다. 도 29A-29D) 파란빛이 조사된 1E+12 vg의 AAV9-CMV-EGFP (상단) 또는 MyoAAV 1A-CMV-EGFP (하단)가 전신 주사된 암컷 DBA/2J (도 29A), 숫컷 DBA/2J (도 29B), 암컷 BALB/cJ (도 29C), 및 숫컷 BALB/cJ (도 29D) 마우스의 상이한 조직. 도 29E) 1E+12 vg의 AAV9- 또는 MyoAAV 1A-CMV-EGFP가 전신 주사된 숫컷 및 암컷 DBA/2J 및 BALB/cJ 마우스의 삼두근, 비복근, 심장, 및 간에서 EGFR mRAN 발현의 배수 차이의 정량. 회색 점선은 AAV9-CMV-EGFP로부터의 상대적 발현을 표시한다. 데이터는 평균 ±SD로서 표시된다 (n=4-5); **: P<0.01, ***: P<0.001 (각 그룹에 대해 AAV9 및 MyoAAV 1A 주사된 마우스 간 Student t 검정). 도 29F) 2E+10 vg의 AAV9- 또는 MyoAAV 1A-CMV-EGFP가 근육내 주사된 C57BL/6J 마우스의 TA에서 EGFP mRNA 발현의 배수 차이의 정량. 회색 점선은 AAV9-CMV-EGFP로부터의 상대적 발현을 의미한다. 데이터는 평균 ±SD로서 표시된다 (n=5); ****: P<0.0001 (Student t 검정). 도 29G) 비히클, 또는 2E+10 vg의 AAV9- 또는 MyoAAV 1A-CMV-EGFP가 근육내 주사된 C57BL/6J 마우스의 TA 근육에서 EGFP 및 튜불린을 검출하는 웨스턴 블롯. 도 29H) 비히클, 또는 2E+10 vg의 AAV9- 또는 MyoAAV 1A-CMV-EGFP가 근육내 주사된 C57BL/6J 마우스로부터의 TA의 면역형광 이미지. 회색톤: EGFP, 적색: 라미닌, 파란색: Hoechst. 단면의 척도바: 400 ㎛. 도 29I-29J) 주사 이전을 비롯하여, 비히클, 또는 1E+12 vg AAV9- 또는 MyoAAV 1A-CMV-EGFP의 전신 주사 후 14일 및 28일에 C57BL/6J 마우스의 혈청 중 ALT (도 29I) 및 AST (도 29J) 효소 수준의 정량. 데이터는 평균 ±SD로서 표시된다 (n=5). P값은 2원 ANOVA과 Tukey의 MCT로 계산되었다. 유의한 한계치: P<0.05. 각 시점에 임의의 2개 그룹 간 차이는 유의하지 않다. 도 29K-29L) AAV9-CMV-EGFP (도 29K) 또는 MyoAAV 1A-CMV EGFP (도 29L)가 주사된 마우스로부터의 혈청에 의한 HEK293 세포에서 AAV9- 또는 MyoAAV 1A-CMV-Nluc 형질도입의 억제; 데이터는 평균 ±SD로서 표시된다 (n=5); ****: P<0.0001 (2원 ANOVA과 Sidak의 MCT). 도 29M) 주사 후 4개월에 채취된 4E+11 vg의 AAV8-, AAV9-, 또는 MyoAAV 1A-CMV-Fluc가 주사된 마우스로부터의 TA, 삼두근, 비복근, 사두근, 및 복근 근육의 전체 장기 발광 이미지. 회색톤: 1E+7 - 1E+8. 도 29N) 주사 후 120일에 채취된 AAV8-, AAV9-, 또는 MyoAAV 1A-CMV-Fluc가 주사된 동물의 상이한 근육으로부터의 총 발광의 정량. 데이터는 평균 ±SD로서 표시된다 (n=5); **: P<0.01, ***: P<0.001 (일원 ANOVA과 Tukey의 MCT). 도 29O) 주사 후 4개월에 채취된 4E+11 vg의 AAV8-, AAV9-, 또는 MyoAAV 1A-CMV-Fluc가 주사된 마우스로부터의 TA, 삼두근, 비복근, 사두근, 및 복근 근육의 전체 장기 발광 이미지. 이러한 이미지는 AAV8- 및 AAV9-CMV-Fluc가 주사된 마우스의 근육에서 신호를 검출할 수 있도록 회색톤 (5E+5 - 5E+7)으로 도 17C에 도시된 동일 마우스로부터의 발광 신호를 도시한다.
도 30A-30C - 사이노몰거스 마카크에서 질환된 근육-향성 캡시드 변이체의 특징규명. 도 30A-30B) C57BL/6J 마우스 (도 30A) 또는 사이노몰거스 마카크 (도 30B)의 상이한 조직에서AAVrh74에 대한 mRNA 발현의 배수 변화. mRNA 발현은 각각의 캡시드 변이체와 연관된 바코드의 심층 시퀀싱에 의해서 정량되었다. 데이터는 평균 ±SD로서 표시된다 (마우스 경우 n=5 및 마카크 경우 n=3). *: P<0.05, **: P<0.01, ***: P<0.001, ****: P<0.0001 (대조군으로서 AAVrh74에 대한 일원 ANOVA와 Dunnett의 MCT). 도 30C) C57BL/6J 마우스 삼두근 근육, 사이노몰거스 마카크 삼두근 근육, 및 인간 전사각근에서 (ITGB6) 인테그린 베타-6 (회색톤) 및 이소타입 대조군 (회색톤)에 대한 대표적인 면역형광 이미지. 척도바: 400 ㎛.
본 명세서의 도면은 도면은 오직 예시의 목적을 위한 것이며, 반드시 척도에 따라 도시된 것은 아니다.

일반 정의

달리 정의하지 않으면, 본 명세서에서 사용되는 기술 및 과학 용어는 본 개시가 속하는 분야의 당업자에게 일반적으로 이해되는 바와 같은 의미를 갖는다. 분자 생물학의 공통 용어 및 기술의 정의는 하기 문헌들에서 확인할 수 있다: Molecular Cloning: A Laboratory Manual, 2^nd edition (1989) (Sambrook, Fritsch, and Maniatis); Molecular Cloning: A Laboratory Manual, 4^th edition (2012) (Green and Sambrook); Current Protocols in Molecular Biology (1987) (F.M. Ausubel et al. eds.); the series Methods in Enzymology (Academic Press, Inc.): PCR 2: A Practical Approach (1995) (M.J. MacPherson, B.D. Hames, and G.R. Taylor eds.): Antibodies, A Laboratory Manual (1988) (Harlow and Lane, eds.): Antibodies A Laboratory Manual, 2^nd edition 2013 (E.A. Greenfield ed.); Animal Cell Culture (1987) (R.I. Freshney, ed.); Benjamin Lewin, Genes IX, published by Jones and Bartlet, 2008 (ISBN 0763752223); Kendrew et al. (eds.), The Encyclopedia of Molecular Biology, published by Blackwell Science Ltd., 1994 (ISBN 0632021829); Robert A. Meyers (ed.), Molecular Biology and Biotechnology: a Comprehensive Desk Reference, published by VCH Publishers, Inc., 1995 (ISBN 9780471185710); Singleton et al., Dictionary of Microbiology and Molecular Biology 2nd ed., J. Wiley & Sons (New York, N.Y. 1994), March, Advanced Organic Chemistry Reactions, mechanisms and Structure 4th ed., John Wiley & Sons (New York, N.Y. 1992); 및 Marten H. Hofker and Jan van Deursen, Transgenic Mouse Methods and Protocols, 2^nd edition (2011).

본 명세서에서 사용되는, 단수형 표현은 문맥에서 달리 명확하게 명시하지 않는 한, 단수형 및 복수형 대상 둘 모두를 포함한다.

용어 "임의의" 또는 "임의로는"은 후술되는 사건, 상황 또는 치환기가 존재하지 않을 수도 있거나 또는 존재할 수도 있고, 그 설명은 사건 또는 상황이 일어나는 예 및 일어나지 않는 예를 포함한다는 것을 의미한다.

종료점에 의한 수치 범위의 설명은 언급된 종료점을 비롯하여, 각 범위 내에 포함된 모든 수 및 분수를 포함한다. 각 범위의 종점은 다른 종점과 관련하여, 그리고 다른 종점과는 독립적으로 중요하다는 것을 또한 이해할 것이다. 또한, 본 명세서에 개시된 다수의 값이 존재하고, 각각의 값은 또한 값 그 자체에 더하여 "약" 그 특정 값으로서 개시된다는 것을 이해한다. 예를 들어, 값 "10" 이 개시되면, "약 10" 이 또한 개시된다. 범위는 본 명세서에서 "약" 하나의 특정 값, 및/또는 "약" 다른 특정 값으로부터 표현될 수도 있다. 유사하게, 값들이 근사치들로 표현될 때, 선행하는 "약" 의 사용에 의해, 특정 값이 추가 구현예를 형성한다는 것을 이해할 것이다. 예를 들어, 값 "약 10"이 개시되면, "10"이 또한 개시된다.

이러한 범위 형식은 단지 편리함 및 간결함을 위해 사용되므로 범위의 한계치로서 명확하게 언급된 수치값을 포함할 뿐만 아니라, 또한 각 수치값 및 하위 범위로 명백하게 언급된 바와 같이 그 범위 내에 포괄되는 모든 개별 수치값 또는 하위 범위를 포함하는 것으로 탄력적인 방식으로 해석되어야 한다는 것을 이해해야 한다. 예를 들어, "약 0.1% 내지 5%"의 수치 범위는 약 0.1% 내지 약 5%의 명시적으로 인용된 값뿐만 아니라, 표시된 범위 내 개별 범위 (예를 들어, 약 1%, 약 2%, 약 3%, 및 약 4%) 및 하위-범위 (예를 들어, 약 0.5% 내지 약 1.1%; 약 5% 내지 약 2.4%; 약 0.5% 내지 약 3.2%, 및 약 0.5% 내지 약 4.4%, 및 다른 가능한 하위-범위)를 포함하는 것으로 해석되어야 한다. 범위로 표시되는 경우에, 추가 구현예는 하나의 특정한 값 부터 및/또는 다른 특정 값까지를 포함한다.

값의 범위가 제공되는 경우, 문맥이 명백히 다르게 지시하지 않는 한 그 범위의 상한 및 하한 사이의, 하한의 단위의 십분의 일에 이르는 각각의 개재 값 및 그 언급된 범위 내의 임의의 다른 언급된 또는 개재 값이 본 발명 내에 포함되는 것으로 이해된다. 이러한 더 작은 범위의 상한 및 하한은 독립적으로 더 작은 범위에 포함될 수 있고, 또한 나타낸 범위 내에서 임의의 구체적으로 배제된 제한을 조건으로 개시 내용에 포함된다. 기재된 범위가 하나 또는 둘 모두의 제한을 포함하는 경우, 이들의 포함된 제한 중 하나 또는 둘 모두를 제외하는 범위도 본 발명에 포함된다. 예를 들어, 명시된 범위가 한계 중 하나 또는 둘 모두를 포함하는 경우에, 포함된 한계 중 하나 또는 둘 모두를 배제한 범위가 또한 본 개시에 포함되고, 예를 들어, 어구 "x 내지 y"는 'x' 내지 'y' 범위를 비롯하여 'x' 초과 및 'y' 미만을 포함한다. 범위는 또한 상한치, 예를 들어, '약 x, y, z, 또는 이하'로서 표시될 수 있고 '약 x', '약 y', 및 '약 z'의 특정 범위를 비롯하여 'x 미만', 'y 미만', 및 'z 미만'의 범위를 포함하는 것으로 해석되어야 한다. 유사하게, 어구, '약 x, y, z, 또는 그 이상'은 '약 x', '약 y', 및 '약 z'의 특정 법위를 비롯하여, 'x 초과', 'y 초과', 및 'z 초과'의 범위를 포함하는 것으로 해석되어야 한다. 또한, 어구 "약 'x' 내지 'y'" (여기서, 'x' 및 'y'는 수치값임)는 "약 'x' 내지 약 'y'"를 포함한다.

측정가능한 값 예컨대 매개변수, 양, 시간적 지속기간 등을 언급할 때 본원에서 사용되는 용어 "약" 또는 "대략" 은 명시된 값과 그로부터의 변동, 예컨대 그러한 변동이 개시된 발명에서 수행하기에 적절하다면, 명시된 값과 그로부터의 +/-10% 이하, +/-5% 이하, +/-1% 이하, 및 +/-0.1% 이하의 변동을 포괄한다는 것을 의미한다. 수식어 "약" 또는 "대략" 이 언급되는 값은 그 자체로 또한 특별히, 그리고 바람직하게 개시된다는 것이 이해될 것이다. 본 명세서에서 사용되는 용어 "약" 또는 "대략", "또는 약" 및 "실질적으로"는 대상 양 또는 값이 청구항에서 열거되거나 또는 본 명세서에서 교시하는 동등한 결과 또는 효과를 제공하는 정확한 값 또는 값일 수 있다. 즉, 양, 크기, 공식, 매개변수, 및 다른 분량 및 특징이 정확하지 않고 정확할 필요도 없지만, 허용 오차, 환산 계수, 반올림, 측정 오차 등, 및 동등한 결과 또는 효과를 얻도록 당업자게 공지된 다른 인자를 반영하는, 바람직하다면, 근사치일 수 있고/있거나 더 크거나 또는 더 작을 수 있다는 것을 이해한다. 일부 상황에서, 동등한 결과 또는 효과를 제공하는 값은 타당하게 결정될 수 없다. 일반적으로, 양, 크기, 공식, 매개변수, 또는 다른 분량 또는 특징은 명시적으로 언급되었는지 여부와 무관하게 "약", "대략", 또는 "또는 약"이다. "약", "대략", "또는 약" 이 정량적 값 앞에 사용되는 경우에, 매개변수는 또한 특별히 달리 명시하지 않으면, 특별한 정량적 값 그 자체를 포함한다는 것을 이해한다.

본 명세서에서 사용되는 "생물학적 샘플"은 전체 세포 및/또는 생존 세포 및/또는 세포 찌꺼기를 함유할 수 있다. 본 명세서에서 사용되는 "생물학적 샘플"은 전체 세포 및/또는 생존 세포 및/또는 세포 찌꺼기를 함유할 수 있다. 본 발명은, 체액이 양수, 안방수, 유리체액, 담즙, 혈청, 모유, 뇌척수액, 귀지 (이구), 유미, 유미즙, 내림프, 외림프, 삼출물, 대변, 여성 사정액, 위산, 위액, 림프, 점액 (비강 배액 및 가래 포함), 심장막액, 복막액, 흉막액, 고름, 점막 분비물, 타액, 피지 (피부 기름), 정액, 객담, 활액, 땀, 눈물, 소변, 질 분비물, 구토물 및 이의 하나 이상의 혼합물에서 선택되는 구현예를 포함한다. 생물학적 샘플은 세포 배양물, 체액, 체액으로부터의 세포 배양물을 포함한다. 체액은 예를 들어 천공, 또는 기타 수집 또는 샘플링 절차에 의해 포유동물 유기체로부터 수득할 수 있다.

용어 "대상체", "개체", 및 "환자"는 척추동물, 바람직하게 포유동물, 보다 바람직하게 인간을 언급하고자 본 명세서에서 상호교환적으로 사용된다. 포유동물은 쥣과동물, 유인원, 인간, 농장 동물, 스포츠 동물, 및 반려 동물을 포함하지만, 이에 제한되지 않는다. 생체 내에서 수득되거나 또는 시험관 내에서 배양된 생물학적 독립체의 조직, 세포 및 그들 자손이 또한 포괄된다.

특별한 구현예들이 배타적인 설명으로서 또는 본원에서 논의되는 더 넓은 양태에 대한 제한으로서 의도되지 않는다는 것에 주의해야 한다. 특정 구현예와 함께 기재되는 하나의 양태는 반드시 그 구현예로 제한되지 않으며 임의의 다른 구현예(들) 로 실시될 수 있다. 본 명세서 전반에서 "하나의 구현예", "한 구현예", "예시적 구현예" 에 대한 언급은 구현예와 함께 기재된 특정한 특성, 구조 또는 특징이 본 발명의 적어도 하나의 구현예에 포함된다는 것을 의미한다. 따라서, 본 명세서 전반의 다양한 위치에서 어구 "하나의 구현예에서", "한 구현예에서", 또는 "예시적 구현예에서" 의 출현은 반드시 모두 동일한 구현예를 언급하지 않지만, 그럴 수도 있다. 또한, 특정한 특성, 구조 또는 특징은 하나 이상의 구현예에서, 본 개시물로부터 당업자에게 자명하게 되는 바와 같이, 임의의 적합한 방식으로 조합될 수 있다. 더 나아가서, 본 명세서에 기술된 일부 구현예가 다른 구현예에 포함된 다른 특성이 아닌 일부 특성을 포함하지만, 상이한 구현예의 특성의 조합은 본 발명의 범주 내에 두고자 한다. 예를 들어, 첨부된 청구항에서, 임의의 청구된 구현예들은 임의의 조합으로 사용될 수 있다.

본 명세서에서 인용되는 모든 출판물, 공개 특허 문서, 및 특허 출원은 각각의 개별 출판물, 공개 특허 문서, 또는 특허 출원이 참조로 편입된다고 특별히 개별적으로 표시한 바와 동일한 정도로 참조로 본 명세서에 편입된다.

개요

본 명세서에 개시된 구현예는 카고에 커플링될 수 있거나 또는 회합될 수 있는 근육-특이적 표적화 모이어티를 제공한다. 본 명세서에서 개시하는 구현예는 근육-특이적 표적화 모이어티 중 하나 이상을 도입할 수 있는 폴리펩티드 및 입자를 제공한다. 폴리펩티드 및/또는 입자는 카고에 커플링될 수 있거나, 부착될 수 있거나, 그를 캡슐화하거나, 또는 도입할 수 있어서, 카고를 표적화 모이어티(들)와 회합시킬 수 있다.

본 명세서에서 개시하는 구현예는 본 명세서에서 더욱 기술되는 바와 같은 n-량체 모티프 중 하나 이상을 함유할 수 있는 근육-특이적 표적화 모이어티를 제공한다. 일부 구현예에서, n-량체 모티프는 증강된 myoAAV 모티프이다. 일부 구현예에서, n-량체 모티프는 표적화 모이어티의 근육-특이성을 부여할 수 있다.

일부 구현예에서, n-량체 모티프는 모티프의 처음 3개 아미노산으로서 R-G-D를 함유하지 않는다. 일부 구현예에서, n-량체 모티프는 제2 세대 RGD 모티프이다. 일부 구현예에서, 제2 세대 RGD 모티프를 함유하는 n-량체 모티프는 제2 세대 RGD 모티프를 함유하지 않는 n-량체 모티프에 비해서 더 큰 근육 특이성, 표적화, 및/또는 효능을 갖는다.

본 명세서에서 개시하는 구현예는 세포-특이적 및/또는 종-특이적 향성을 조작된 AAV 입자에 부여하도록 조작될 수 있는 조작된 아데노-연관 바이러스 (AAV) 캡시드를 제공한다.

본 명세서에서 개시하는 구현예는 또한 변형된 표면 구조의 변이체, 예컨대 변이체 캡시드 단백질의 다양한 라이브러리의 생성을 체계적으로 유도하는 단계를 포함할 수 있는 조작된 캡시드를 갖는 rAAV를 생성시키는 방법을 제공한다. 조작된 캡시드를 갖는 rAAV를 생성시키는 방법의 구현예는 또한 특이적 세포, 조직, 및/또는 장기 유형을 표적화할 수 있는 캡시드 변이체의 엄격한 선택을 포함할 수 있다. 조작된 캡시드를 갖는 rAAV를 생성시키는 방법의 구현예는 적어도 둘 이상의 종에서 효율적이고/이거나 균질한 형질도입을 할 수 있는 캡시드 변이체의 엄격한 선택을 포함할 수 있다.

본 명세서에서 개시하는 구현예는 본 명세서에 기술된 조작된 AAV를 생산할 수 있는 벡터 및 이의 시스템을 제공한다.

본 명세서에서 개시하는 구현예는 본 명세서에 기술된 조작된 AAV 입자를 생산할 수 있는 세포를 제공한다. 일부 구현예에서, 세포는 본 명세서에 기술된 하나 이상의 벡터 또는 이의 시스템을 포함한다.

본 명세서에서 개시하는 구현예는 본 명세서에 기술된 조작된 캡시드를 포함할 수 있는 조작된 AAV를 제공한다. 일부 구현예에서, 조작된 AAV는 세포에 전달하려는 카고 폴리뉴클레오티드를 포함할 수 있다. 일부 구현예에서, 카고 폴리뉴클레오티드는 유전자 변형 폴리뉴클레오티드이다.

본 명세서에서 개시하는 구현예는 조작된 AAV 벡터 또는 이의 시스템, 조작된 AAV 캡시드, 본 명세서에 기술된 조작된 AAV 캡시드를 포함하는 조작된 AAV 입자, 및/또는 조작된 AAV 캡시드, 및/또는 조작된 AAV 벡터 또는 이의 시스템을 함유하는 본 명세서에 기술된 조작된 세포를 함유하는 제제를 제공한다. 일부 구현예에서, 제제는 또한 약학적으로 허용가능한 담체를 포함할 수 있다. 본 명세서에 기술된 제제는 이를 필요로 하는 대상체 또는 세포에 전달될 수 있다.

본 명세서에서 개시하는 구현예는 또한 폴리펩티드, 폴리뉴클레오티드, 벡터, 조작된 AAV 캡시드, 조작된 AAV 입자, 세포, 또는 본 명세서에 기술된 다른 성분 및 이의 조합 중 하나 이상 중 하나 이상 및 본 명세서에 기술된 약학 제제를 함유하는 키트를 제공한다. 구현에에서, 본 명세서에 기술된 폴리펩티드, 폴리뉴클레오티드, 벡터, 조작된 AAV 캡시드, 조작된 AAV 입자 세포, 및 이의 조합 중 하나 이상은 조합 키트로서 존재할 수 있다.

본 명세서에서 개시하는 구현예는 예를 들어, 치료적 폴리뉴클레오티드를 세포에 전달하기 위해서 본 명세서에 기술된 세포-특이적 향성을 갖는 조작된 AAV를 사용하는 방법을 제공한다. 이러한 방식으로, 본 명세서에 기술된 조작된 AAV는 이를 필요로 하는 대상체에서 질환을 치료하고/하거나 예방하는데 사용될 수 있다. 본 명세서에서 개시하는 구현예는 또한 조작된 AAV 캡시드, 조작된 AAV 바이러스 입자, 조작된 AAV 벡터 또는 이의 시스템 및/또는 이의 제제를 세포에 전달하는 방법을 제공한다. 또한 본 명세서는 조작된 AAV 입자, 조작된 AAV 캡시드, 조작된 AAV 캡시드 벡터 또는 이의 시스템, 조작된 세포, 및/또는 이의 제제를 대상체에게 전달하여 이를 필요로 하는 대상체를 치료하는 방법을 제공한다.

조작된 AAV 및 조작된 AAV를 제조하고 사용하는 방법의 구현예의 추가 특성 및 장점은 본 명세서에서 더욱 기술된다.

근육-특이적 표적화 모이어티 및 이의 조성물

본 명세서는 근육 조직을 특이적으로 표적화할 수 있거나, 그에 결합할 수 있거나, 그와 회합할 수 있거나, 또는 특이적으로 상호작용할 수 있는 표적화 모이어티를 기술한다. 일부 구현예에서, 표적화 모이어티는 n-량체 모티프일 수 있거나 또는 그를 포함할 수 있다.

일부 구현예에서, n-량체 모티프는 제2 세대 RGD 모티프를 함유한다. 용어 "제2 세대 RGD 모티프"는 아미노산 모티프 R-G-D의 존재를 포함하는 n-량체 모티프를 의미하고, X_mRGDX_n (여기서, X_m 및 X_n 은 각각 독립적으로 임의의 아미노산으로부터 선택되고, n은 1, 2, 3, 4, 5, 6, 7, 8, 또는 9이고, m은 1-4임)으로 이루어진 일반식을 갖는다. 예시적인 n-량체 모티프 및 근육 표적화할 수 있는 적합한 n-량체 모티프를 생성시키고 확인하는 방법은 본 명세서의 다른 곳에 더욱 상세히 기술된다.

일부 구현예에서, 표적화 모이어티는 하나 초과의 n-량체 모티프를 포함할 수 있다. 일부 구현예에서, 표적화 모이어티는 1, 2, 3, 4, 5 ,6, 7, 8, 9, 10 또는 그 이상의 n-량체 모티프를 포함할 수 있다. 일부 구현예에서, 표적화 모이어티에 포함되는 모든 n-모티프는 동일할 수 있다. 일부 구현예에서 하나 초과의 n-량체 모티프가 포함될 때, n-량체 모티프 중 적어도 2개는 서로 상이하다. 일부 구현예에서 하나 초과의 n-량체 모티프가 포함되는 경우에, 모든 n-량체 모티프는 서로 상이하다. 일부 구현예에서, 표적화 모이어티에 포함되는 각각의 n-량체 모티프는 임의의 표 2-3, 도 14F에 기재된 어느 것 또는 본 명세서의 다른 곳에 기술된 도면 및 작업예에 제공되는 어느 것일 수 있다. 일부 구현예에서, 제2 세대 RGD 모티프를 함유하는 n-량체 모티프는 제2 세대 RGD 모티프를 함유하지 않는 n-량체 모티프에 비해서 더 큰 근육 특이성, 표적화, 및/또는 효능을 부여한다. 일부 구현예에서, 제2 세대 RGD 모티프를 함유하는 n-량체 모티프는 모티프의 처음 3개 아미노산으로서 R-G-D를 갖는 n-량체 모티프에 비해서 더 큰 근육 특이성, 표적화, 및/또는 효능을 부여한다.

일부 구현예에서, n-량체 모티프의 처음 1, 2, 3, 또는 4개 아미노산은 이것이 삽입되고 삽입 부위에 선행하는 폴리펩티드의 1, 2, 3, 또는 4개 아미노산을 치환할 수 있다. 일부 구현예에서, n-량체 모티프가 삽입되는 폴리펩티드의 하나 이상의 아미노산을 치환시키는 n-량체 모티프의 아미노산은 n-량체 모티프에서 "RGD" 앞에 또는 바로 앞에 온다. 예를 들어, 예를 들어, 표 2-3에 표시된 10-량체 삽입부 중 하나 이상에서, 표시된 처음 3개 아미노산은 그들이 삽입될 수 있는 폴리펩티드로 1-3개 아미노산을 치환시킬 수 있다. 다른 비제한적인 예로서, AAV를 사용하여, n-량체 모티프 중 하나 이상은 예를 들어, 아미노산 588 내지 589 사이에 AAV9 캡시드 프롤릴펩티드에 삽입될 수 있고, 삽입부는 아미노산 586, 587, 및 588을 치환시켜서 삽입 후 n-량체 모티프에 바로 선행하는 아미노산은 잔기 585이다. 이러한 원리는 임의의 다른 삽입 상황에 적용될 수 있고 AAV9 캡시드의 잔기 588 내지 589 사이 또는 다른 AAV 캡시드의 동등한 위치에서의 삽입에 반드시 제한되지 않는다는 것을 이해할 것이다. 일부 구현예에서, n-량체 모티프가 삽입되는 폴리펩티드의 아미노산은 n-량체 모티프에 의해 치환되지 않는다는 것을 더욱 이해할 것이다.

근육-특이적 표적화 모이어티는 카고에 커플링될 수 있거나 또는 회합될 수 있다. 일부 구현예에서, 본 명세서에 기술된 하나 이상의 근육-특이적 표적화 모이어티는 카고에 직접 부착된다. 일부 구현예에서, 본 명세서에 기술된 하나 이상의 근육-특이적 표적화 모이어티는 예컨대 링커 분자를 통해서 카고에 간접적으로 커플링된다. 일부 구현예에서, 하나 이상의 본 명세서에 기술된 하나 이상의 근육-특이적 표적화 모이어티는 카고에 커플링되고/되거나, 부착되고/되거나, 그를 캡슐화하고/하거나 함유하는 폴리펩티드 또는 다른 입자에 커플링되거나 또는 그와 회합된다.

예시적인 입자는 제한없이, 바이러스 입자 (예를 들어, 박테리오파지 캡시드를 포함한, 바이러스 캡시드), 폴리솜, 리포솜, 나노입자, 마이크로입자, 엑소솜, 미셀 등을 포함한다. 본 명세서에서 사용되는 용어 "나노입자"는 균질 또는 불균질 물질의 나노규모 침착물을 포함한다. 나노입자는 형상이 규칙적일 수 있거나 또는 불규칙적일 수 있고, 복합 나노규모 입자를 형성하는 다수의 공-침착 입자로부터 형성될 수 있다. 나노입자는 일반적으로 형상이 구형일 수 있거나 또는 일반적으로 다수의 공-침착된 구형 입자로부터 형성된 복합 형상을 갖는다. 나노 입자에 대한 예시적인 형상은 구형, 막대형, 타원형, 원통형, 디스크 등을 포함하지만, 이에 제한되지 않는다. 일부 구현예에서, 나노입자는 실질적으로 구형 형상을 갖는다.

본 명세서에서 사용되는 용어 "특이적"은 2개 모이어티 간에 상호작용을 기술하는 것과 관련하여 사용될 때, 제1 및 제2 모이어티의 비-공유적 물리적 회합을 의미하고, 제1 및 제2 모이어티 간 회합은 결합이 일어나는, 환경에 존재하는 대부분 또는 모든 모이어티와 양쪽 모이어티의 회합에 비해서 적어도 2배 강력하거나, 적어도 5배 강력하거나, 적어도 10배 강력하거나, 적어도 50배 강력하거나, 적어도 100배 강력하거나, 또는 그 만큼 강력하다. 둘 이상의 독립체의 결합은 평형 해리 상수, Kd가 적용된 조건 하에서, 예를 들어, 예컨대 세포 생존과 일관되거나 또는 세포 내부같은 생리적 조건 하에서, 10^-3 M 이하, 10^-4 M 이하, 10^-5 M 이하, 10^-6 M 이하, 10^-7 M 이하, 10^-8M 이하, 10^-9 M 이하, 10^-10 M 이하, 10^-11 M 이하, 또는 10^-12 M 이하이면 특이적으로 간주될 수 있다. 일부 구현예에서, 특이적 결합은 다수의 다수의 보다 약한 상호작용 (예를 들어, 다수의 개별 상호작용으로서, 각각의 개별 상호작용은 10^-3 M 초과의 Kd를 특징으로 함)에 의해 수행될 수 있다. 일부 구현예에서, "분자 인식"이라고 할 수 있는 특이적 결합은 각각의 독립체 상의 작용기의 상보적 배향에 의존하는 2개 독립체 간 포화가능한 결합 상호작용이다. 특이적 상호작용의 예는 프라이머-폴리뉴클레오티드 상호작용, 압타머-압타머 표적 상호작용, 항체-항원 상호작용, 아비딘-바이오틴 상호작용, 리간드-수용체 상호작용, 메탈-킬레이트 상호작용, 항보적 핵산 간 혼성화 등을 포함한다.

일부 구현예에서, n-량체 모티프(들)이외에도, 표적화 모이어티는 폴리펩티드, 폴리뉴클레오티드, 지질, 중합체, 당, 또는 이의 조합을 포함할 수 있다.

일부 구현예에서, 표적화 모이어티는 렌티바이러스, 아데노바이러스, AAV, 박테리오파지, 레트로바이러스 단백질을 포함하지만, 이에 제한되지 않는, 바이러스 단백질, 예컨대 캡시드 단백질에 도입된다. 일부 구현예에서, n-량체 모티프는 n-량체 모티프가 바이러스 캡시드 외부에 존재 (즉, 그의 표면 상에 존재)하도록 바이러스 단백질의 2개 아미노산 사이에 위치된다.

일부 구현예에서, 본 명세서에 기술된 하나 이상의 근육-특이적 표적화 모이어티를 포함하는 조성물은 증가된 근육 세포 역가, 근육 세포 특이성, 감소된 면역원성, 또는 이의 임의 조합을 갖는다. 본 명세서에서 사용되는, "근육-특이적", "근육 세포 특이성", "근육 세포 역가" 등은 비-근육 세포에 비해서 근육 조직에 대해 근육-특이적 표적화 모이어티 및 상기 근육-특이적 표적화 모이어티를 도입한 조성물의 증가된 특이성, 선택성, 또는 역가를 의미한다. 일부 구현예에서, 근육-특이적 표적화 모이어티 또는 본 명세서에 기술된 근육-특이적 표적화 모이어티를 도입한 조성물의 세포 특이성, 또는 선택성, 또는 역가, 또는 이의 조합은 비-근육 세포에 비해서 근육 조직에서/그에 대해 적어도 2배 내지 적어도 500배 더 큰 특이적이고/이거나, 선택적이고/이거나, 강력하다. 일부 구현예에서, 본 명세서에 기술된 근육-특이적 표적화 모이어티의 특이성, 또는 선택성, 또는 역가는 비-근육 세포에 비해서 근육 세포에 대해서 적어도 2, 내지/또는 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397, 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, 479, 480, 481, 482, 483, 484, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495, 496, 497, 498, 499, 500배 더 특이적이거나 또는 선택적이다.

대안으로 언급하면, 일부 구현예에서, 근육-특이적 표적화 모이어티 및/또는 본 명세서에 기술된 근육-특이적 표적화 모이어티 중 하나 이상을 포함하는 조성물은 감소된 비-근육 세포 역가, 비-근육 세포 특이성, 감소된 면역원성, 또는 이의 임의 조합을 갖는다. 일부 구현예에서, 근육-특이적 표적화 모이어티 및/또는 본 명세서에 기술된 근육-특이적 표적화 모이어티 중 하나 이상을 함유하는 조성물은 근육 조직에 비해서 비-근육 세포에서/그에 대해 적어도 2배 내지 적어도 500배 덜 특이적이고/이거나, 덜 선택적이고/이거나, 덜 강력하다. 일부 구현예에서, 본 명세서에 기술된 근육-특이적 표적화 모이어티의 특이성, 또는 선택성, 또는 역가는 근육 세포에 비해서 비-근육 세포에 대해 적어도 2, 내지/또는 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397, 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, 479, 480, 481, 482, 483, 484, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495, 496, 497, 498, 499, 500배 덜 특이적이거나 또는 선택적이다.

근육-특이적 표적화 모이어티를 도입한 조성물의 면역원성은 예를 들어, 1-100배 이상 감소될 수 있다. 일부 구현예에서, 면역원성은 1 내지/또는 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100배 이상으로 감소된다. 카고는 본 명세서에 기술된 근육-특이적 표적화 모이어티에 커플링될 수 있거나 또는 회합될 수 있는 임의의 분자를 포함할 수 있다. 카고는 제한없이, 뉴클레오티드, 올리고뉴클레오티드, 폴리뉴클레오티드, 아미노산, 펩티드, 폴리펩티드, 리보단백질, 지질, 당, 약학적 활성제 (예를 들어, 약물, 조영제 및 다른 진단제 등), 화학적 화합물, 및 이의 조합을 포함할 수 있다. 일부 구현예에서, 카고는 DNA, RNA, 아미노산, 펩티드, 폴리펩티드, 항체, 압타머, 리보자임, 필수 종양 단백질 및 유전자의 번역 또는 전사를 억제하는 리보자임용 가이드 서열, 호르몬, 면역조절제, 해열제, 항불안제, 항정신병제, 진통제, 진경제, 항염증제, 항히스타민제, 항감염제, 방사선 감작제, 화학요법제, 방사성 화합물, 조영제, 및 이의 조합이다.

일부 구현예에서, 카고는 근육 질환 또는 장애를 치료할 수 있거나 또는 예방할 수 있다. 일부 구현예에서, 근육 질환 또는 장애는 (a) 자가 면역 질환; (b) 암; (c) 근이영양증; (d) 신경근 질환; (e) 당 또는 글리코겐 저장 질환; (f) 확장된 반복 질환; (g) 우성 음성 질환; (h) 심근병증; (i) 바이러스 질환; (j) 조로증; 또는 (k) 이의 임의 조합이다. 일부 구현예에서, 확장된 반복 질환은 헌팅톤병, 근긴장성 이영양증, 또는 안면견갑상완근 이영양증 (FSHD)이다. 일부 구현예에서, 근이영양증은 뒤쉔 근이영양증, 벡커 근이영양증, 지대근 이영양증, 에머리 드레이푸스 근이영양증, 근긴장성 이영양증, 또는 FSHD이다. 일부 구현예에서, 근긴장성 이영양증은 1형 또는 2형이다. 일부 구현예에서, 당 또는 글리코겐 저장병은 MPS III형 질환 또는 폼페병이다. 일부 구현예에서, MPS III형 질환은 MPS IIIA형, IIIB형, IIIC형, 또는 IIID형이다. 일부 구현예에서, 신경근 질환은 샤르코-마리-투스병 또는 프리드라이히 운동실조이다.

일부 구현예에서, 카고는 모르폴리노, 펩티드-연결된 모르폴리노, 안티센스 올리고뉴클레오티드, PMO, 치료적 이식유전자, 치료적 폴리펩티드 또는 펩티드를 코딩하는 폴리뉴클레오티드, PPMO, 하나 이상의 펩티드, CRISPR-Cas 단백질, 가이드 RNA 또는 둘 모두를 코딩하는 하나 이상의 폴리뉴클레오티드, 리보뉴클레오단백질로서, CRISPR-Cas 시스템 분자, 치료적 이식유전자 RNA, 또는 다른 유전자 변형 또는 치료적 RNA 및/또는 단백질을 포함하는 것인 리보뉴클레오단백질, 또는 이의 임의 조합이다.

일부 구현예에서, 카고는 유전자에서 엑손 스키핑을 유도할 수 있다.

일부 구현예에서, 카고는 디스트로핀 유전자에서 엑손 스키핑을 유도할 수 있다.

일부 구현예에서, 카고는 미니-디스트로핀 또는 마이크로-디스트로핀 유전자이다. 일부 구현예에서, 미니-디스트로핀 또는 마이크로-디스트로핀 유전자는 스펙트린-유사 반복부 1, 2, 3, 및 24, 또는 이의 조합, 및 임의로 nNOS 도메인을 포함한다.

조작된 바이러스 캡시드 및 코딩 폴리뉴클레오티드

본 명세서는 세포-특이적 향성, 예컨대 근육 특이적 향성을, 조작된 바이러스 입자에 부여하도록 조작될 수 있는, 조작된 바이러스 캡시드, 예컨대 아데노-연관 바이러스 (AAV) 캡시드의 다양한 구현예를 기술한다. 조작된 바이러스 캡시드는 렌티바이러스, 레트로바이러스, 아데노바이러스, 또는 AAV 캡시드일 수 있다. 조작된 캡시드는 조작된 바이러스 입자 (예를 들어, 조작된 렌티바이러스, 레트로바이러스, 아데노바이러스, 또는 AAV 바이러스 입자)에 포함될 수 있고, 세포-특이적 향성, 감소된 면역원성, 또는 둘 모두를 조작된 바이러스 입자에 부여할 수 있다. 본 명세서에 기술된 조작된 바이러스 캡시드는 본 명세서에 기술된 하나 이상의 조작된 바이러스 캡시드 단백질을 포함할 수 있다. 본 명세서에 기술된 조작된 바이러스 캡시드는 본 명세서의 다른 곳에 기술된 n-량체 모티프를 함유하거나 또는 그로 구성된 근육-특이적 표적화 모이어티를 함유할 수 있는 본 명세서에 기술된 하나 이상의 조작된 바이러스 캡시드 단백질을 포함할 수 있다.

조작된 바이러스 캡시드 및/또는 캡시드 단백질은 하나 이상의 조작된 바이러스 캡시드 폴리뉴클레오티드에 의해 코딩될 수 있다. 일부 구현예에서, 조작된 바이러스 캡시드 폴리뉴클레오티드는 조작된 AAV 캡시드 폴리뉴클레오티드, 조작된 렌티바이러스 캡시드 폴리뉴클레오티드, 조작된 레트로바이러스 캡시드 폴리뉴클레오티드, 또는 조작된 아데노바이러스 캡시드 폴리뉴클레오티드이다. 일부 구현예에서, 조작된 바이러스 캡시드 폴리뉴클레오티드 (예를 들어, 조작된 AAV 캡시드 폴리뉴클레오티드, 조작된 렌티바이러스 캡시드 폴리뉴클레오티드, 조작된 레트로바이러스 캡시드 폴리뉴클레오티드, 또는 조작된 아데노바이러스 캡시드 폴리뉴클레오티드)는 3' 폴리아데닐화 신호를 포함할 수 있다. 폴리아데닐화 신호는 SV40 폴리아데닐화 신호일 수 있다.

조작된 바이러스 캡시드는 야생형 바이러스 캡시드의 변이체일 수 있다. 예를 들어, 일부 구현예에서, 조작된 AAV 캡시드는 야생형 AAV 캡시드의 변이체일 수 있다. 일부 구현예에서, 야생형 AAV 캡시드는 VP1, VP2, VP3 캡시드 단백질 또는 이의 조합으로 구성될 수 있다. 달리 말해서, 조작된 AAV 캡시드는 야생형 VP1, 야생형 VP2, 및/또는 야생형 VP3 캡시드 단백질의 하나 이사으이 변이체를 포함할 수 있다. 일부 구현예에서, 기준 야생형 AAV 캡시드의 혈청형은 AAV-1, AAV-2, AAV-3, AAV-4, AAV-5, AAV-6, AAV-8, AAV-9 또는 이의 임의 조합일 수 있다. 일부 구현예에서, 야생형 AAV 캡시드의 혈청형은 AAV-9일 수 있다. 조작된 AAV 캡시드는 기준 야생형 AAV 캡시드의 것과 상이한 향성을 가질 수 있다.

조작된 바이러스 캡시드는 1-60종의 조작된 캡시드 단백질을 함유할 수 있다. 일부 구현예에서, 조작된 바이러스 캡시드는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 또는 60종의 조작된 캡시드 단백질을 함유할 수 있다. 일부 구현예에서, 조작된 바이러스 캡시드는 0-59종의 야생형 바이러스 캡시드 단백질을 함유할 수 있다. 일부 구현예에서, 조작된 바이러스 캡시드는 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 또는 59종의 야생형 바이러스 캡시드 단백질을 함유할 수 있다.

일부 구현예에서, 조작된 AAV 캡시드는 1-60종의 조작된 캡시드 단백질을 함유할 수 있다. 일부 구현예에서, 조작된 AAV 캡시드는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 또는 60종의 조작된 캡시드 단백질을 함유할 수 있다. 일부 구현예에서, 조작된 AAV 캡시드는 0-59종의 야생형 AAV 캡시드 단백질을 함유할 수 있다. 일부 구현예에서, 조작된 AAV 캡시드는 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 또는 59종의 야생형 AAV 캡시드 단백질을 함유할 수 있다.

일부 구현예에서, 조작된 바이러스 캡시드 단백질은 n-량체 아미노산 모티프를 가질 수 있고,여기서 n은 적어도 3개 아미노산일 수 있다. 일부 구현예에서, n은 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 또는 15개의 아미노산일 수 있다. 일부 구현예에서, 조작된 AAV 캡시드는 6-량체 또는 7-량체 아미노산 모티프를 가질 수 있다. 일부 구현예에서, n-량체 아미노산 모티프는 야생형 바이러스 단백질 (VP) (또는 캡시드 단백질)의 2개 아미노산 사이에 삽입될 수 있다. 일부 구현예에서, n-량체 모티프는 바이러스 캡시드 단백질의 가변 아미노산 영역 내 2개 아미노사 사이에 합입될 수 있다.

일부 구현예에서, n-량체 모티프는 AAV 캡시드 단백질의 가변 아미노산 영역 내 2개 아미노산 사이에 삽입될 수 있다. 각각의 야생형 AAV 바이러스 단백질의 코어는 자율 파보바이러스에 보존된 8-가닥 베타-배럴 모티프 (베타B 내지 베타I) 및 알파-헬릭스 (알파A)를 함유한다 (참조: 예를 들어, DiMattia et al. 2012. J. Virol. 86(12):6947-6958). 구조적 가변 영역 (VR)은 캡시드 표면에 국소 변이를 생산하도록 클러스터링된, 베타-가닥에 연갈된 표면 루프에서 일어난다. AAV는 12개 가변 영역 (초가변 영역이라고도 함)을 갖는다 (참조: 예를 들어, Weitzman and Linden. 2011. "Adeno-Associated Virus Biology." In Snyder, R.O., Moullier, P. (eds.) Totowa, NJ: Humana Press). 일부 구현예에서, 하나 이상의 n-량체 모티프는 야생형 AVV 캡시드 단백질의 12개 가변 영역 중 하나 이상에서 2개 아미노산 사이에 삽입될 수 있다. 일부 구현예에서, 하나 이상의 n-량체 모티프는 각각이 VR-I, VR-II, VR-III, VR-IV, VR-V, VR-VI, VR-VII, VR-III, VR-IX, VR-X, VR-XI, VR-XII, 또는 이의 조합 내 2개 아미노산 사이에 삽입될 수 있다. 일부 구현예에서, n-량체는 캡시드 단백질의 VR-III 내 2개 아미노산 사이에 삽입될 수 있다. 일부 구현예에서, 조작된 캡시드는 AAV9 바이러스 단백질의 아미노산 262 내지 269 사이의 임의의 2개의 인접한 아미노산 사이, 아미노산 327 내지 332 사이의 임의의 2개의 인접한 아미노산 사이, 아미노산 382 내지 386 사이의 임의의 2개의 인접한 아미노산 사이, 아미노산 452 내지 460 사이의 임의의 2개의 인접한 아미노산 사이, 아미노산 488 내지 505 사이의 임의의 2개의 인접한 아미노산 사이, 아미노산 581 내지 593 사이의 임의의 2개의 인접한 아미노산 사이, 아미노산 704 내지 714 사이의 임의의 2개의 인접한 아미노산 사이에 삽입된 n-량체를 가질 수 있다. 일부 구현예에서, 조작된 캡시드는 AAV9 바이러스 단백질의 아미노산 588 내지 589 사이에 삽입된 n-량체를 가질 수 있다. 일부 구현예에서, 조작된 캡시드는 AAV9 바이러스 단백질의 아미노산 588 내지 589 사이에 삽입된 7-량체 모티프를 가질 수 있다. SEQ ID NO: 1은 상기 논의된 삽입 부위를 적어도 참조하기 위한 기준 AAV9 캡시드 서열이다. n-량체는 다른 혈청형의 AAV 바이러스 단백질의 유사한 유치에 삽입될 수 있다는 것을 이해할 것이다. 이전에 논의된 바와 같은 일부 구현예에서, n-량체(들)는 AAV 바이러스 단백질 내 임의의 2개의 인접한 바이러스 사이에 삽입될 수 있고, 일부 구현예에서 삽입은 가변 영역에 만들어진다.

일부 구현예에서, n-량체 모티프의 처음 1, 2, 3, 또는 4개 아미노산은 이것이 삽입되는, 삽입 부위에 선행되는 폴리펩티드의 1, 2, 3, 또는 4개 아미노산을 치환시킬 수 있다. 일부 구현예에서, n-량체 모티프가 삽입되는 폴리펩티드의 1개 이상의 아미노산을 치환시키는 n-량체 모티프의 아미노산은 n-량체 모티프에서 "RGD" 앞에 또는 바로 앞에 온다. 예를 들어, 예를 들어, 표 2-3에 도시된 10-량체 삽입부 중 하나 이상에서, 도시된 처음 3개 아미노산은 그들이 삽입될 수 있는 폴리펩티드로 1-3개 아미노산을 치환시킬 수 있다. 다른 비-제한적인 예로서 AAV를 사용하여, n-량체 모티프 중 하나 이상은 예를 들어, AAV9 캡시드 프롤릴펩티드에서 아미노산 588 내지 589 사이에 삽입될 수 있고, 삽입부는 삽입 이후 n-량체 모티프에 바로 선행하는 아미노산이 잔기 585이도록 아미노산 586, 587, 및 588을 치환시킬 수 있다. 이러한 원리는 임의의 다른 삽입 상황에서 적용될 수 있고, AAV9 캡시드의 잔기 588 내지 589 사이 또는 다른 AAV 캡시드의 동등한 위치에서의 삽입데 제한될 필요는 없다는 것을 이해할 것이다. 일부 구현예에서, n-량체 모티프가 삽입되는 폴리펩티드의 아미노산은 n-량체 모티프에 의해 치환되지 않는다는 것으로 더욱 이해할 것이다.

SEQ ID NO: 1 AAV9 캡시드 기준 서열.

일부 구현예에서, n-량체는 표 2-3, 및/또는 본 명세서의 작업예에 표시된 바와 같은 핵산에 의해 표시되거나 또는 코딩되는 임의의 아미노산 모티프일 수 있는 아미노산일 수 있다. 일부 구현예에서, AAV 또는 다른 바이러스 캡시드에서 n-량체의 삽입은 본 발명의 n-량체 모티프 또는 캡시드 단백질을 포함하는 세포, 조직, 장기, 특이적 조작된 AAV 또는 다른 바이러스 캡시드 또는 다른 조성물을 생성시킬 수 있다. 일부 구현예에서, n-량체 모티프를 함유하는 조작된 캡시드 또는 다른 조성물은 뼈 조직 및/또는 세포, 폐 조직 및/또는 세포, 간 조직 및/또는 세포, 방광 조직 및/또는 세포, 신장 조직 및/또는 세포, 심장 조직 및/또는 세포, 골격근조직 및/또는 세포, 평활 근육 및/또는 세포, 뉴런 조직 및/또는 세포, 장 조직 및/또는 세포, 췌장 조직 및/또는 세포, 부신 조직 및/또는 세포, 뇌 조직 및/또는 세포, 힘줄 조직 또는 세포, 피부 조직 및/또는 세포, 비장 조직 및/또는 세포, 눈 조직 및/또는 세포, 혈액 세포, 활액 세포, 면역 세포 (특정 유형의 면역 세포에 대한 특이성을 포함), 및 이의 조합에 대한 특이성을 갖는다. 일부 구현예에서, n-량체 모티프를 함유하는 조작된 캡시드 또는 다른 조성물은 골격근 조직 및/또는 세포 및 평활 근육 조직 및/또는 세포를 포함하지만, 이에 제한되지 않는 근육 세포에 대해 특이성을 갖는다.

일부 구현예에서, AAV 캡시드 또는 다른 바이러스 캡시드 또는 조성물은 근육-특이적일 수 있다. 일부 구현예에서, 조작된 AAV 또는 다른 바이러스 캡시드 또는 다른 조성물의 근육-특이성은 본 명세서에 기술된 조작된 AAV 또는 다른 바이러스 캡시드 또는 다른 조성물에 도입된 근육 특이적 n-량체 모티프에 의해 부여된다. 이론에 국한하려는 의도는 아니지만, 본 명세서에 기술된 조작된 AAV 캡시드 또는 다른 바이러스 캡시드 또는 다른 조성물을 함유하는 바이러스 입자 또는 다른 조성물의 상호작용이 세포 표면 수용체 및/또는 근육 조직의 표면 상의 다른 분자와의 증가되거나 또는 개선된 상호작용 (예를 들어, 증가된 친화성)을 갖도록 조작된 AAV 캡시드 또는 다른 바이러스 캡시드 또는 다른 조성물의 도메인 또는 영역 내에 또는 그에 3D 구조를 부여한다고 여겨진다. 일부 구현예에서, 세포 표면 수용체는 AAV 수용체 (AAVR)이다. 일부 구현예에서, 세포 표면 수용체는 근육 조직 특이적 AAV 수용체이다. 일부 구현예에서, 세포 표면 수용체 또는 다른 분자는 근육 조직의 표면에서 선택적으로 발현되는 세포 표면 수용체 또는 다른 분자이다. 일부 구현예에서, 세포 표면 수용체 또는 분자는 인테그린 또는 이의 이량체이다. 일부 구현예에서, 세포 표면 수용체 또는 분자는 Vb6 인테그린 이종이량체이다.

일부 구현예에서, 본 명세서에 기술된 근육-특이적 캡시드, n-량체 모티프, 또는 근육-특이적 표적화 모이어티를 함유하는 본 명세서에 기술된 근육 특이적 조작된 바이러스 입자 또는 다른 조성물은 본 발명의 근육-특이적 n-량체 모티프를 함유하지 않는 다른 세포 유형 및/또는 다른 바이러스 입자 (AAV를 포함하지만, 이에 제한되지 않음)와 비교하여 근육 조직에서 증가된 흡수성, 전달률, 형질도입률, 효율, 양, 또는 이의 조합을 가질 수 있다.

또한 본 명세서는 본 명세서에 기술된 조작된 근육-특이적 표적화 모이어티 및 본 명세서에 기술된 다른 조성물 (조작된 AAV 캡시드를 포함하지만, 이에 제한되지 않음)을 코딩하는 폴리뉴클레오티드를 기술한다.

일부 구현예에서, 조작된 폴리뉴클레오티드는 본 명세서의 다른 곳에 기술된 조작된 바이러스 입자를 생성시키는데 사용될 수 있는 바이러스 벡터 시스템의 바이러스 게놈 공여자이도록 구성된 폴리뉴클레오티드에 포함될 수 있다.

일부 구현예에서, 조작된 AAV 캡시드를 코딩하는 폴리뉴클레오티드는 본 명세서의 다른 곳에 기술된 조작된 AAV 입자를 생성시키는데 사용될 수 있는 AAV 벡터 시스템의 AAV 게놈 공여자이도록 구성된 폴리뉴클레오티드에 포함될 수 있다. 일부 구현예에서, 조작된 AAV 캡시드를 코딩하는 폴리뉴클레오티드 폴리아데닐화 꼬리부에 작동적으로 커플링될 수 있다. 일부 구현예에서, 폴리아데닐화 꼬리부는 SV40 폴리아데닐화 꼬리부일 수 있다. 일부 구현예에서, AAV 캡시드를 코딩하는 폴리뉴클레오티드는 프로모터에 작동적으로 연결될 수 있다. 일부 구현예에서, 프로모터는 조직 특이적 프로모터일 수 있다. 일부 구현예에서, 조직 특이적 프로모터는 근육 (예를 들어, 심장, 골격, 및/또는 평활 근육), 뉴런 및 지지 세포 (예를 들어, 성상세포, 신경아교 세포, 슈반 세포 등), 지방, 비장, 간, 신장, 면역 세포, 척수액 세포, 활액 세포, 피부 세포, 연골, 힘줄, 결합 조직, 뼈, 췌장, 부신, 혈액 세포, 골수 세포, 태반, 내피 세포, 및 이의 조합에 특이적이다. 일부 구현예에서, 프로모터는 항상성 프로모터일 수 있다. 적합한 조직 특이적 프로모터 및 항상성 프로모터는 본 명세서의 다른 곳에서 논의되고 일반적으로 당분야에 공지되어 있고, 상업적으로 입수가능할 수 있다.

적합한 근육 특이적 프로모터는 CK8, MHCK7, 미오글로빈 프로모터 (Mb), 데스민 프로모터, 근육 크레아틴 키나제 프로모터 (MCK) 및 이의 변이체, 및 SPc5-12 합성 프로모터를 포함하지만, 이에 제한되지 않는다.

적합한 면역 세포 특이적 프로모터는 B29 프로모터 (B 세포), CD14 프로모터 (단핵구 세포), CD43 프로모터 (백혈구 및 혈소판), CD68 (마크로파지), 및 SV40/CD43 프로모터 (백혈구 및 혈소판)를 포함하지만, 이에 제한되지 않는다.

적합한 혈액 세포 특이적 프로모터는 CD43 프로모터 (백혈구 및 혈소판), CD45 프로모터 (조혈 세포), INF-베타 (조혈 세포), WASP 프로모터 (조혈 세포), SV40/CD43 프로모터 (백혈구 및 혈소판), 및 SV40/CD45 프로모터 (조혈 세포)를 포함하지만, 이에 제한되지 않는다.

적합한 췌장 특이적 프로모터는 엘라스타제-1 프로모터를 포함하지만, 이에 제한되지 않는다.

적합한 내피 세포 특이적 프로모터는 Fit-1 프로모터 및 ICAM-2 프로모터를 포함하지만, 이에 제한되지 않는다.

적합한 뉴런 조직/세포 특이적 프로모터는 GFAP 프로모터 (성상세포), SYN1 프로모터 (뉴런), 및 NSE/RU5' (성숙한 뉴런)를 포함하지만, 이에 제한되지 않는다.

적합한 신장 특이적 프로모터는 NphsI 프로모터 (족세포)를 포함하지만, 이에 제한되지 않는다.

적합한 뼈 특이적 프로모터는 OG-2 프로모터 (골아세포, 치아모세포)를 포함하지만, 이에 제한되지 않는다.

적합한 폐 특이적 프로모터는 SP-B 프롬프터 (폐)를 포함하지만, 이에 제한되지 않는다.

적합한 간 특이적 프로모터는 SV40/Alb 프로모터를 포함하지만, 이에 제한되지 않는다.

적합한 심장 특이적 프로모터는 알파-MHC를 포함하지만, 이에 제한되지 않는다.

적합한 항상성 프로모터는 CMV, RSV, SV40, EF1알파, CAG, 및 베타-액틴을 포함하지만, 이에 제한되지 않는다.

감소된 비-근육 세포 특이성을 갖는 AAV

일부 구현예에서, 본 명세서에 기술된 n-량체 모티프(들)는 하나 이상의 비-근육 세포 유형에 대해 감소된 특이성 (또는 검출가능, 측정가능, 또는 임상적 관련 상호작용 없음)을 갖는 AAV 단백질 (예를 들어, AAV 캡시드 단백질)에 삽입된다. 예시적인 비-근육 세포 유형은 간, 신장, 폐, 심장, 비장, 중추 신경계 또는 말초 신경계 세포, 뼈, 면역, 위, 장, 눈, 피부 세포 증을 포함하지만, 이에 제한되지 않는다. 일부 구현예에서, 비-근육 세포는 간 세포이다.

일정 예의 구현예에서, AAV 캡시드 단백질은 상응하는 야생형 AAV 캡시드 폴리펩티드와 비교하여 비-근육 세포에서 감소되거나 또는 제거된 흡수성을 갖는 조작된 AAV 캡시드 단백질이다.

일정 예의 구현예에서, 비-근육 세포는 간 세포이다.

일정 예의 구현예에서, 야생형 캡시드 폴리펩티드는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV rh.74, 또는 AAV rh.10 캡시드 폴리펩티드이다.

일정 예의 구현예에서, the 조작된 AAV 캡시드 단백질은 비-근육 세포에서 감소되거나 또는 제거된 흡수를 일으키는 하나 이상의 돌연변이를 포함한다.

일정 예의 구현예에서, 하나 이상의 돌연변이는 AAV9 캡시드 단백질 (SEQ ID NO: 1)의

a. 위치 267,

b. 위치 269,

c. 위치 504,

d. 위치 505,

e. 위치 590,

f. 또는 이의 임의 조합

또는, 비-AAV9 캡시드 폴리펩티드의 이에 상응하는 하나 이상의 위치에 존재한다.

일정 예의 구현예에서, 비-AAV9 캡시드 단백질은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV rh.74, 또는 AAV rh.10 캡시드 폴리펩티드이다.

일정 예의 구현예에서, AAV9 캡시드 단백질 (SEQ ID NO: 1)의 위치 267 또는 비-AAV9 캡시드 폴리펩티드의 이에 상응하는 위치에서 돌연변이는 G 또는 X에서 A로의 돌연변이이고, X는 임의의 아미노산이다.

일정 예의 구현예에서, AAV9 캡시드 단백질 (SEQ ID NO: 1)의 위치 269 또는 비-AAV9 캡시드 폴리펩티드의 이에 상응하는 위치에서 돌연변이는 S 또는 X에서 T로의 돌연변이이고, X는 임의의 아미노산이다.

일정 예의 구현예에서, AAV9 캡시드 단백질 (SEQ ID NO: 1)의 위치 504 또는 비-AAV9 캡시드 폴리펩티드의 이에 상응하는 위치에서 돌연변이는 G 또는 X에서 A로의 돌연변이이고, X는 임의의 아미노산이다.

일정 예의 구현예에서, AAV9 캡시드 단백질 (SEQ ID NO: 1)의 위치 505 또는 비-AAV9 캡시드 폴리펩티드의 이에 상응하는 위치에서 돌연변이는 P 또는 X에서 A로의 돌연변이이고, X는 임의의 아미노산이다.

일정 예의 구현예에서, AAV9 캡시드 단백질 (SEQ ID NO: 1)의 위치 590 또는 비-AAV9 캡시드 폴리펩티드의 이에 상응하는 위치에서 돌연변이는 Q 또는 X에서 A로의 돌연변이이고, X는 임의의 아미노산이다.

일정 예의 구현예에서, 조작된 AAV 캡시드 단백질은 야생형 AAV9 캡시드 단백질 (SEQ ID NO: 1)의 위치 267, 위치 269 또는 둘 모두에 돌연변이를 포함하는 조작된 AAV9 캡시드 폴리펩티드이고, 위치 267의 돌연변이는 G에서 A 돌연변이이고, 위치 269의 돌연변이는 S에서 T 돌연변이이다.

일정 예의 구현예에서, 조작된 AAV 캡시드 단백질은 야생형 AAV9 캡시드 단백질 (SEQ ID NO: 1)의 위치 590에 돌연변이를 포함하는 조작된 AAV9 캡시드 폴리펩티드이고, 위치 509의 돌연변이는 Q에서 A로의 돌연변이이다.

일정 예의 구현예에서, 조작된 AAV 캡시드 단백질은 야생형 AAV9 캡시드 단백질 (SEQ ID NO: 1)의 위치 504, 위치 505, 또는 둘 모두에 돌연변이를 포함하는 조작된 AA9 캡시드 폴리펩티드이고, 위치 504의 돌연변이는 G에서 A 돌연변이이고 위치 505의 돌연변이는 P에서 A 돌연변이이다.

일부 구현예에서, n-량체 모티프(들)가 삽입될 수 있는 AAV 캡시드 단백질은 본 명세서에 그 전문이 표시된 바와 같이 참조로 포함되는, 국제 특허 출원 공개 번호 WO 2019/217911의 SEQ ID NO: 4 또는 SEQ ID NO: 5와 80-100 (예를 들어, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 내지/또는 100) 퍼센트 동일하다. 이들 서열은 또한 각각 SEQ ID NOS: 330 및 331로서 본 명세서에 편입된다. 감소된 간 특이성을 갖는 이들 AAV9 캡시드 단백질의 변이체를 고려할 때, 잔기 267 및/또는 269는 관련된 돌연변이 또는 동등물을 함유해야만 한다는 것을 이해할 것이다.

일부 구현예에서, n-량체 모티프(들)가 삽입될 수 있는 AAV 캡시드 단백질은 비-CNS 세포, 특히 간 세포에 대해 감소된 특이성을 갖는 [Adachi et al., (Nat. Comm. 2014. 5:3075, DOI: 10.1038/ncomms4075)]에 기술된 어느 것과 80-100 (예를 들어, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 내지/또는 100) % 동일할 수 있다. [Adachi et al., (Nat. Comm. 2014. 5:3075, DOI: 10.1038/ncomms4075)]은 그 전문이 표시된 대로 본 명세서에 참조로 편입된다.

일부 구현예에서, 변형된 AAV는 야생형 AAV 또는 대조군과 비교하여 비-근육에 대한 특이성의 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100 퍼센트 또는 배수 감소를 갖는다. 일부 구현예에서, 변형된 AAV는 하나 이상의 비-근육 세포에서 측정가능하거나 또는 검출가능한 흡수 및/또는 발현을 갖지 않는다.

조작된 AAV 캡시드를 생성시키는 방법

또한 본 명세서는 조작된 AAV 캡시드를 생성시키는 방법을 제공한다. 조작된 AAV 캡시드 변이체는 야생형 AAV 캡시드의 변이체일 수 있다. 도 6-8는 본 명세서에 기술된 변이체 모티프를 갖는 조작된 AAV 캡시드를 생성시킬 수 있는 방법의 다양한 구현예를 예시할 수 있다. 일반적으로, AAV 캡시드 라이브러리는 각각이 적절한 AAV 생산자 세포주에서 이전에 기술된 조작된 AAV 캡시드 폴리뉴클레오티드를 함유하는 조작된 캡시드 벡터를 발현하여 생성될 수 있다. 예를 들어, 도 8을 참조한다. 도 8이 AAV 입자 생산의 헬퍼-독립적 방법을 도시하지만, 헬퍼-무함유 방법을 역시 통해서 이것을 수행할 수 있다는 것을 이해할 것이다. 이것은 하나 이상의 원하는 세포-특이적 조작된 AAV 캡시드 변이체를 함유하를 수 있는 AAV 캡시드 라이브러리를 생성시킬 수 있다. 도 6에 도시된 바와 같이, AAV 캡시드 라이브러리는 mRNA-기반 선택의 제1 라운드를 위한 다양한 비-인간 동물에 투여될 수 있다. 도 1에 도시된 바와 같이, AAV 및 관련 벡터에 의한 형질도입 과정은 세포에 형질도입된 바이러스의 게놈을 반영하는 mRNA 분자의 생산을 일으킬 수 있다. 적어도 본 명세서의 실시예에서 입증된 바와 같이, mRNA 기반-선택은 세포를 기능적으로 형질도입시킬 수 있는 바이러스 입자를 결정하는데 더 특이적이고 효과적일 수 있는데 바이러스 DNA의 존재를 측정하여 세포에서 바이러스 입자의 존재를 단지 검출하는것과 대조적으로 생산된 기능적 생산물을 기반으로 하기 때문이다.

제1 라운드 투여 후에, 바람직한 캡시드 변이체를 갖는 하나 이상의 조작된 AAV 바이러스 입자는 여과된 AAV 캡시드 라이브러리를 형성하는데 사용될 수 있다. 바람직한 AAV 바이러스 입자는 캡시드 변이체의 mRNA 발현을 측정하고, 비-바람직한 세포 유형(들)과 비교하여 어떠한 변이체가 바람직한 세포 유형(들)에서 고도로 발현되는지 결정하여 확인될 수 있다. 바람직한 세포, 조직, 및/또는 장기 유형에서 고도로 발현되는 것들은 바람직한 AAV 캡시드 변이체 입자이다. 일부 구현예에서, AAV 캡시드 변이체를 코딩하는 폴리뉴클레오티드는 바람직한 세포, 조직, 또는 장기에서 선택적 활성을 갖는 조직-특이적 프로모터의 제어 하에 있다.

제1 라운드로부터 확인된 조작된 AAV 캡시드 변이체 입자는 다양한 비-인간 동물에게 투여될 수 있다. 일부 구현예에서, 선택 및 확인의 제2 라운드에서 사용되는 동물은 제1 라운드의 선택 및 확인에서 사용된 동물과 동일하지 않다. 라운드 1과 유사하게, 투여 후, 바람직한 세포, 조직, 및/또는 장기 유형(들)에서 상위 발현 변이체는 세포에서 바이러스 mRNA 발현을 측정하여 확인할 수 있다. 라운드 2 이후에 확인된 상위 변이체는 임의로 바코드화될 수 있고 임의로 풀링될 수 있다. 일부 구현예에서, 제2 라운드의 상위 변이체는, 특히 상위 변이체에 대한 최종 용도가 인간인 경우, 상위 세포-특이적 변이체(들)를 확인하기 위해 비-인간 영장류에 투여될 수 있다. 각 라운드에서 투여는 전신일 수 있다.

일부 구현예에서, AAV 캡시드 변이체를 생성시키는 방법은 (a) 세포에서 조작된 AAV 캡시드 폴리뉴클레오티드를 함유하는 본 명세서에 기술된 벡터 시스템을 발현시켜서 조작된 AAV 바이러스 입자 캡시드 변이체를 생산하는 단계; (b) 단계 (a)에서 생산된 조작된 AAV 바이러스 입자 캡시드 변이체를 채취하는 단계; (c) 하나 이상의 제1 대상체에게 조작된 AAV 바이러스 입자 캡시드 변이체를 투여하는 단계로서, 조작된 AAV 바이러스 입자 캡시드 변이체는 세포에서 조작된 AAV 캡시드 변이체 벡터 또는 이의 시스템을 발현시키고 세포에 의해 생산된 조작된 AAV 바이러스 입자 캡시드 변이체를 생산하여서 생산되는 것인 단계; 및 (d) 하나 이상의 제1 대상체에서 하나 이상의 특이적 세포 또는 특이적 세포 유형에 의해 유의하게 높은 수준으로 생산되는 하나 이상의 조작된 AAV 캡시드 변이체를 확인하는 단계를 포함할 수 있다. 이러한 상황에서, "유의하게 높은"은 15 cm 디쉬 당 약 2 x10¹¹ 내지 약 6 x 10¹² 벡터 게놈 범위일 수 있는 적정가를 의미할 수 있다.

방법은 (e) 단계 (d)에서 확인된 일부 또는 모든 조작된 AAV 바이러스 입자 캡시드 변이체를 하나 이상의 제2 대상체에게 투여하는 단계; 및 (f) 하나 이상의 제2 대 상체에서 하나 이상의 특이적 세포 또는 특이적 세포 유형에서 유의하게 높은 수준으로 생산되는 하나 이상의 조작된 AAV 바이러스 입자 캡시드 변이체를 확인하는 단계를 더 포함할 수 있다. 단계 (a)의 세포는 원핵생물 세포 또는 진핵생물 세포일 수 있다. 일부 구현예에서, 단계 (c), 단계 (e), 또는 둘 모두에서 투여는 전신이다. 일부 구현예에서, 하나 이상의 제1 대상체, 하나 이상의 제2 대상체, 또는 둘 모두는 비-인간 포유동물이다. 일부 구현예에서, 하나 이상의 제1 대상체, 하나 이상의 제2 대상체, 또는 둘 모두는 각각이 야생형 비-인간 포유동물, 인간화된 비-인간 포유동물, 질환-특이적 비-인간 포유동물 모델, 및 비-인간 영장류로 이루어진 군으로부터 독립적으로 선택된다.

일부 구현예에서, 변이체 모티프의 추가 최적화를 수행할 수 있다. 일부 구현예에서, 제1 및/또는 제2 세대 모티프 (캡시드 RGD 함유 모티프 포함)는 예를 들어, 도 11, 및 추가로 논의되는 본 명세서의 작업예에 도시된 바와 같이 캡시드 변이체를 최적화하는데 더 사용될 수 있다.

본 명세서에 기술된 폴리뉴클레오티드 및 벡터 시스템은 또한 세포에 전달할 수 있는 카고 분자를 함유하도록 생성될 수 있는 바이러스 입자 및 다른 조성물을 생성시키는데 사용될 수 있다.

조작된 벡터 및 벡터 시스템

본 명세서는 또한 조작된 바이러스 폴리뉴클레오티드 (예를 들어, 조작된 AAV 폴리뉴클레오티드)를 포함하지만, 이에 제한되지 않는 본 발명의 n-량체 모티프 중 하나 이상을 코딩할 수 있는 본 명세서에 기술된 조작된 폴리뉴클레오티드 중 하나 이상을 함유할 수 있는 벡터 및 벡터 시스템을 제공한다. 일부 구현예에서, 본 발명의 n-량체 모티프를 코딩할 수 있는 폴리뉴클레오티드(들)는 표 2-3, 도 14에 기술된 바와 같고/같거나, 본 명세서의 다른 곳에 기술된 바와 같은 임의의 것일 수 있다. 일부 구현예에서, 폴리뉴클레오티드는 표 2-3, 도 14 중 어느 하나에 기재된 바와 같고/같거나, 본 명세서의 다른 곳에 기술된 바와 같이 임의의 n-량체 모티프를 코딩할 수 있다. 이러한 상황에서 사용되는, 조작된 바이러스 캡시드 폴리뉴클레오티드는 본 명세서의 다른 곳에 기술된 바와 같은 조작된 바이러스 캡시드를 코딩할 수 있는 본 명세서에 기술된 폴리뉴클레오티드 및/또는 본 명세서에 기술된 하나 이상의 조작된 바이러스 캡시드 단백질을 코딩할 수 있는 폴리뉴클레오티드(들) 중 어느 하나 이상을 의미한다. 또한, 벡터가 본 명세서에 기술된 조작된 바이러스 캡시드 폴리뉴클레오티드를 포함하는 경우에, 벡터는 또한 그와 같이 특별히 표시하지 않았지만 조작된 벡터 또는 이의 시세틈을 의미하고 그로 간주될 수 있다. 구현예에서, 벡터는 본 명세서에 기술된 조작된 바이러스 캡시드 중 하나 이상의 구성요소를 코딩하는 하나 이상의 폴리뉴클레오티드를 함유할 수 있다. 벡터 및 이의 시스템은 본 명세서에 기술된 조작된 바이러스 캡시드, 입자, 또는 다른 조성물 중 하나 이상의 성분을 발현할 수 있는 박테리아, 진균, 효모, 식물 세포, 동물 세포, 및 유전자이식 동물을 생산하는데 유용할 수 있다. 본 명세서에 기술된 폴리펩티드 서열 중 하나 이상을 함유하는 벡터는 본 개시의 범주 내에 있다. 본 명세서에 기술된 조작된 바이러스 캡시드 및 이의 시스템의 일부인 폴리뉴클레오티드 중 하나 이상은 벡터 또는 벡터 시스템에 포함될 수 있다.

일부 구현예에서, 벡터는 3' 폴리아데닐화 신호를 갖는 조작된 바이러스 (예를 들어, AAV) 캡시드 폴리뉴클레오티드를 포함할 수 있다. 일부 구현예에서, 3' 폴리아데닐화는 SV40 폴리아데닐화 신호이다. 일부 구현예에서 벡터는 스플라이스 조절 구성요소를 갖지 않는다. 일부 구현예에서, 벡터는 하나 이상의 최소 스플라이스 조절 구성요소를 포함한다. 일부 구현예에서, 벡터는 변형된 스플라이스 조절 구성요소를 더 포함할 수 있고, 변형은 스플라이스 조절 구성요소를 불활성화시킨다. 일부 구현예에서, 변형된 스플라이스 조절 구성요소는 rep 단백질 폴리뉴클레오티드 및 조작된 바이러스 (예를 들어, AAV) 캡시드 단백질 변이체 폴리뉴클레오티드 사이에서, 스플라이싱을 유도하기에 충분한 폴리뉴클레오티드 서열이다. 일부 구현예에서, 스플라이싱을 유도하기에 충분할 수 있는 폴리뉴클레오티드 서열은 스플라이스 억셉터 또는 스플라이스 공여자이다. 일부 구현예에서, 바이러스 (예를 들어, AAV) 캡시드 폴리뉴클레오티드는 본 명세서의 다른 곳에 기술된 바와 같은 조작된 바이러스 (예를 들어, AAV)이다. 일부 구현예에서, 벡터는 하나 이상의 최소 스플라이스 조절 구성요소, 변형된 스플라이스 조절제, 스플라이스 억셉터, 및/또는 스플라이스 공여자를 포함하지 않는다.

벡터 및/또는 벡터 시스템은 예를 들어, 본 명세서의 다른 곳에 기술된 본 발명의 n-량체 모티프를 함유하는 조작된 바이러스 (예를 들어, AAV) 캡시드 또는 다른 조성물을 함유하는 조작된 바이러스 (예를 들어, AAV) 입자 및/또는 다른 조성물 (예를 들어, 폴리펩티드, 입자 등)를 생산하기 위해서, 세포, 예컨대 생산자 세포에서 조작된 바이러스 (예를 들어, AAV) 캡시드 및/또는 다른 폴리뉴클레오티드 중 하나 이상을 발현하기 위해 사용될 수 있다. 본 명세서에 기술된 벡터 및 벡터 시스템에 대한 다른 용도가 또한 본 개시의 범주 내에 속한다. 일반적으로, 본 명세서 전반에서, 용어는 한 환경에서 다른 환경으로 독립체의 전달을 허용하거나 또는 촉진하는 도구이다. 당업자가 이해하게 되는 일부 상황에서, "벡터"는 연결된 다른 핵산을 수송할 수 있는 핵산 분자를 의미하는 당분야의 용어일 수 있다. 벡터는 다른 DNA 절편이 삽입되어서 삽입된 절편의 복제를 일으킬 수 있는, 레플리콘, 예컨대 플라스미드, 파지, 또는 코스미드일 수 있다. 일반적으로, 벡터는 적절한 조절 구성요소와 연관될 때 복제할 수 있다.

벡터는 제한 없이, 단일 가닥, 이중 가닥 또는 부분 이중 가닥인 핵산 분자; 하나 이상의 자유 말단을 포함하는, 자유 말단을 포함하지 않는 (예 : 환형) 핵산 분자; DNA, RNA 또는 둘 다를 포함하는 핵산 분자; 및 당업계에 공지된 다른 종류의 폴리뉴클레오티드를 포함한다. 한 유형의 벡터는 추가적인 DNA 세그먼트가, 예컨대, 표준 분자 클로닝 기법에 의해 삽입될 수 있는 원형 이중 가닥 DNA 루프를 지칭하는 "플라스미드"이다. 다른 유형의 벡터는 바이러스 벡터로서, 바이러스-유래 DNA 또는 RNA 서열이 바이러스 (예를 들어, 레트로바이러스, 복제 결함 레트로바이러스, 아데노바이러스, 복제 결함 아데노바이러스, 및 아데노-연관 바이러스 (AAV))에 패키징을 위해 벡터에 존재한다. 바이러스 벡터는 또한 숙주 세포 내로 형질감염을 위해 바이러스에 의해 수행되는 폴리뉴클레오티드를 포함한다. 소정의 벡터는 그들이 도입되는 숙주 세포에서 자가 복제할 수 있다 (예를 들어, 바이러스 복제 기원을 갖는 박테리아 벡터 및 에피솜 포유동물 벡터). 다른 벡터(예를 들어, 비-에피솜 포유동물 벡터)는 숙주 세포 내로 도입시 숙주 세포의 게놈에 통합되며, 이에 의해 숙주 게놈과 함께 복제된다. 더욱이, 특정 벡터는 그것이 작동가능하게 연결된 유전자의 발현을 지시할 수 있다. 이러한 벡터는 본 명세서에서 "발현 벡터"라고 한다. 재조합 DNA 기술에서 유용한 공통 발현 벡터는 종종 플라스미드의 형태로 존재한다.

재조합 발현 벡터는 숙주 세포에서 핵산의 발현에 적합한 형태로 본 발명의 핵산 (예를 들어, 폴리뉴클레오티드)를 구성할 수 있는데, 재조합 발현 벡터가 발현하려는 핵산 서열에 작동적으로 연결된, 발현에 사용하려는 숙주 세포를 기반으로 선택될 수 있는, 하나 이상의 조절 구성요소를 포함한다는 것을 의미한다. 재조합 발현 벡터 내에서, "작동적으로 연결된" 및 "작동적으로-연결된"은 본 명세서에서 상호교환적으로 사용되고 본 명세서의 다른 곳에서 더욱 개시된다. 벡터의 상황에서, 용어 "작동적으로 연결된"은 관심 뉴클레오티드 서열을 뉴클레오티드 서열의 발현을 허용하는 방식으로 (예를 들어, 시험관내 전사/번역 시스템 또는 베겉가 숙주 세포에 도입될 때 숙주 세포에서) 조절 구성요소(들)에 연결하는 것을 의미하고자 한다. 유리한 벡터는 아데노-연관 바이러스를 포함하고, 이러한 벡터의 유형은 또한 특정 유형의 세포를 표적화하기 위해 선택되는데, 예컨대 바람직한 세포-특이적 향성을 갖는 조작된 바이러스 (예를 들어, AAV) 캡시드 폴리뉴클레오티드를 함유하는 조작된 바이러스 (예를 들어, AAV) 벡터일 수 있다. 벡터 및 벡터 시스템의 이들 및 다른 구현예는 본 명세서의 다른 곳에 기술된다.

일부 구현예에서, 벡터는 바이시스트론 벡터일 수 있다. 일부 구현예에서, 바이시스트론 벡터는 조작된 바이러스 (예를 들어, AAV) 캡시드 시스템 중 하나 이상의 구성요소에 대해 사용될 수 있다. 일부 구현예에서, 본 명세서에 기술된 조작된 바이러스 (예를 들어, AAV) 캡시드 시스템의 구성요소의 발현은 적합한 항상성 또는 조직 특이적 프로모터에 의해 구동될 수 있다. 조작된 바이러스 (예를 들어, AAV) 캡시드 시스템의 구성요소가 RNA인 경우에, 이의 발현은 Pol III 프로모터, 예컨대 U6 프로모터에 의해 구동될 수 있다. 일부 구현예에서, 2개가 조합된다.

세포-기반 벡터 증폭 및 발현

벡터는 적합한 숙주 세포에서 본 명세서에 기술된 본 발명의 n-량체 모티프를 함유하는 조작된 바이러스 (예를 들어, AAV) 캡시드 시스템 또는 다른 조성물 중 하나 이상의 구성요소 (예를 들어, 핵산 전사물, 단백질, 효소, 및 이의 조합)의 발현을 위해 디자인될 수 있다. 일부 구현예에서, 적합한 숙주 세포는 원핵생물 세포이다. 적합한 숙주 세포는 박테리아 세포, 효모 세포, 곤충 세포, 및 포유동물 세포를 포함하지만, 이에 제한되지 않는다. 벡터는 바이러스-기반 또는 비-바이러스 기반일 수 있다. 일부 구현예에서, 적합한 숙주 세포는 진핵생물 세포이다. 일부 구현예에서, 적합한 숙주 세포는 적합한 박테리아 세포이다. 적합한 박테리아 세포는 에스케리치아 콜라이 (Escherichia coli) 종의 박테리아 유래의 박테리아 세포를 포함하지만, 이에 제한되지 않는다. 이. 콜라이의 많은 적합한 균주가 벡터의 발현을 위해 당분야에 공지되어 있다. 이들은 Pir1, Stbl2, Stbl3, Stbl4, TOP10, XL1 Blue, 및 XL10 Gold를 포함하지만, 이에 제한되지 않는다. 일부 구현예에서, 숙주 세포는 적합한 곤충 세포이다. 적합한 곤충 세포는 스포돕테라 프루기페르다 (Spodoptera frugiperda) 유래의 것을 포함한다. 에스. 프루기페르다 (S. frugiperda) 세포의 적합한 균주는 Sf9 및 Sf21을 포함하지만, 이에 제한되지 않는다. 일부 구현예에서, 숙주 세포는 적합한 효모 세포이다. 일부 구현예에서, 효모 세포는 사카로마이세스 세레비지아에 (Saccharomyces cerevisiae)일 수 있다. 일부 구현예에서, 숙주 세포는 적합한 포유동물 세포이다. 많은 유형의 포유동물 세포는 벡터를 발현시키기 위해 개발되었다. 적합한 포유동물 세포는 HEK293, 중국 햄스터 난소 세포 (CHOs), 마우스 골수종 세포, HeLa, U2OS, A549, HT1080, CAD, P19, NIH 3T3, L929, N2a, MCF-7, Y79, SO-Rb50, HepG G2, DIKX-X11, J558L, 베이비 햄스터 신장 세포 (BHK), 및 닭 배아 섬유아세포 (CEF)를 포함하지만, 이에 제한되지 않는다. 적합한 숙주 세포는 [Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990)]에서 더욱 논의된다.

일부 구현예에서, 벡터는 효모 발현 벡터일 수 있다. 효모 사카로마이세스 세레비지아에에서 발현을 위한 벡터의 예는 pYepSec1 (Baldari, et al., 1987. EMBO J. 6: 229-234), pMFa (Kuijan and Herskowitz, 1982. 세포 30: 933-943), pJRY88 (Schultz et al., 1987. Gene 54: 113-123), pYES2 (Invitrogen Corporation, San Diego, Calif.), 및 picZ (InVitrogen Corp, San Diego, Calif.)를 포함한다. 본 명세서에서 사용되는, "효모 발현 벡터"는 RNA 및/또는 폴리펩티드를 코딩하는 하나 이상의 서열을 함유하는 핵산을 의미하고, 핵산(들)의 발현을 제어하는 임의의 바람직한 구성요소를 비롯하여, 효모 세포 내부에서 발현 벡터의 복제 및 유지를 가능하게 하는 임의의 구성요소를 더 함유할 수 있다. 많은 적합한 효모 발현 벡터 및 이의 특성은 당분야에 공지되어 있고; 예를 들어, 다양한 벡터 및 기술은 [Yeast Protocols, 2nd edition, Xiao, W., ed. (Humana Press, New York, 2007)] 및 [Buckholz, R.G. and Gleeson, M.A. (1991) Biotechnology (NY) 9(11): 1067-72]에 예시된다. 효모 벡터는 제한 없이, 동원체 (CEN) 서열, 자율 증식 서열 (ARS), 프로모터, 예컨대, 관심 서열 또는 유전자에 작동 가능하게 연결된, RNA 폴리머라제 III 프로모터, RNA 폴라머라제 III 종결자와 같은 종결자, 복제 기원, 및 마커 유전자 (예를 들어, 영양요구성, 항생성, 또는 다른 선택가능한 마커)를 함유할 수 있다. 효모에서의 이용을 위한 발현 벡터의 예로는, 플라스미드, 효모 인공 염색체, 2μ 플라스미드, 효모 편입형 플라스미드, 효모 자가증식형 플라스미드, 셔틀 벡터, 및 에피솜 유사 플라스미드를 포함할 수 있다.

일부 구현예에서, 벡터는 배큘로바이러스 벡터 또는 발현 벡터이;고, 곤충 세포에서 폴리뉴클레오티드 및/또는 단백질의 발현에 적합할 수 있다. 배양된 곤충 세포 (예를 들어, SF9 세포)에서 단백질의 발현을 위해 이용가능한 배큘로바이러스 벡터는 pAc 시리즈 (Smith, et al., 1983. Mol. Cell. Biol. 3: 2156-2165) 및 pVL 시리즈 (Lucklow and Summers, 1989. Virology 170: 31-39)를 포함한다. rAAV (재조합 아데노-연관 바이러스) 벡터는 혈청-무함유 현탁 배양으로 성장된, 곤충 세포, 예를 들어, 스포돕테라 프루기페르다 Sf9 곤충 세포에서 생산된다. 혈청-무함유 곤충 세포는 상업적 공급자, 예를 들어, Sigma Aldrich (EX-세포 405)에서 구매할 수 있다.

일부 구현예에서, 벡터는 포유동물 발현 벡터이다. 일부 구현예에서, 포유동물 발현 벡터는 포유동물 세포에서 하나 이상의 폴리뉴클레오티드 및/또는 폴리펩티드를 발현할 수 있다. 포유동물 발현 벡터의 예는 pCDM8 (Seed, 1987. Nature 329: 840) 및 pMT2PC (Kaufman, et al., 1987. EMBO J. 6: 187-195)를 포함하지만, 이에 제한되지 않는다. 포유동물 발현 벡터는 포유동물 세포에서 하나 이상의 폴리뉴클레오티드 및/또는 단백질의 발현을 제어할 수 있는 하나 이상의 적합한 조절 구성요소를 포함할 수 있다. 예를 들어, 공통으로 사용되는 프로모터는 폴리오마, 아데노바이러스 2, 사이토메갈로바이러스, 원숭이 바이러스 40, 및 본 명세서에 개시되고 당분야에 공지된 다른 것들로부터 유래된다.

원핵생물 및 진핵생물 세포 둘 모두에 대한 다른 적합한 발현 벡터 및 벡터 시스템 경우에, 예를 들어, 하기 문헌을 참조한다: Chapters 16 and 17 of Sambrook, et al., MOLECULAR CLONING: A LABORATORY MANUAL. 2nd ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989.

일부 구현예에서, 재조합 포유동물 발현 벡터는 특정 세포 유형에서 우선적으로 핵산의 발현을 유도할 수 있다 (예를 들어, 조직-특이적 조절 구성요소는 핵산을 발현시키는데 사용됨). 조직-특이적 조절 구성요소는 당분야에 공지되어 있다. 적합한 조직-특이적 프로모터의 비제한적인 예는 알부민 프로모터 (간-특이적; Pinkert, et al., 1987. Genes Dev. 1: 268-277), 림프계-특이적 프로모터 (Calame and Eaton, 1988. Adv. Immunol. 43: 235-275), 특히 T 세포 수용체의 프로모터 (Winoto and Baltimore, 1989. EMBO J. 8: 729-733) 및 면역글로불린 (Baneiji, et al., 1983. 세포 33: 729-740; Queen and Baltimore, 1983. 세포 33: 741-748), 뉴런-특이적 프로모터 (예를 들어, 신경필라멘트 프로모터; Byrne and Ruddle, 1989. Proc. Natl. Acad. Sci. USA 86: 5473-5477), 췌장-특이적 프로모터 (Edlund, et al., 1985. Science 230: 912-916), 및 유선-특이적 프로모터 (예를 들어, 유장 프로모터; 미국 특허 제4,873,316호 및 유럽 특허 출원 공개 번호 제264,166호)를 포함한다. 발생-조절 프로모터, 예를 들어, 쥣과동물 hox 프로모터 (Kessel and Gruss, 1990. Science 249: 374-379) 및 α-태아단백질 프로모터 (Campes and Tilghman, 1989. Genes Dev. 3: 537-546)를 포괄한다. 이들 원핵생물 및 진핵생물 벡터와 관련하여, 미국 특허 제6,750,059호가 언급되며, 이의 내용은 그들 전문이 참조로 본 명세서에 편입된다. 다른 구현예는 바이러스 벡터를 이용할 수 있고, 이와 관련하여 미국 특허 출원 제13/092,085호가 언급되며, 이의 내용은 그들 전문이 참조로 본 명세서에 편입된다. 조직-특이적 조절 구성요소는 당분야에 공지되어 있고, 이와 관련하여 미국 특허 제7,776,321호가 언급되고, 이의 내용은 그들 전문이 참조로 본 명세서에 편입된다. 일부 구현예에서, 조절 구성요소는 본 명세서에 기술된 조작된 AAV 캡시드 시스템 중 하나 이상의 구성요소의 발현을 구동시키기 위해서 조작된 AAV 캡시드 시스템의 하나 이상의 구성요소에 작동적으로 연결될 수 있다.

벡터는 원핵생물 또는 원핵생물 세포에서 도입될 수 있고 증식될 수 있다. 일부 구현예에서, 원핵생물은 진핵생물 세포로 도입시키려는 벡터의 카피를 증폭시키거나 또는 진핵생물 세포로 도입시키려는 벡터의 생산에서 중간 벡터로서 사용된다 (예를 들어, 바이러스 벡터 패키징 시스템의 일부로서 플라스미드를 증폭). 일부 구현예에서, 원핵생물은 벡터의 카피를 증폭시키고, 하나 이상의 핵산을 발현시키기 위해서, 예컨대 숙주 세포 또는 숙주 유기체에게 전달을 위한 하나 이상의 단백질의 공급원을 제공하기 위해 사용된다.

일부 구현예에서, 벡터는 융합 벡터 또는 융합 발현 벡터일 수 있다. 일부 구현예에서, 융합 벡터는 그에서 코딩되는 단백질, 예컨대 재조합 단백질의 아미노 말단, 카르복시 말단, 또는 둘 모두에 다수의 아미노산을 첨가한다. 이러한 융합 벡터는 하나 이상의 목적, 예컨대: (i) 재조합 단백질의 발현을 증가시키고; (ii) 재조합 단백질의 가용성을 증가시키고; (iii) 친화성 정제에서 리간드로서 작용하여 재조합 단백질의 정제를 돕기 위해 제공된다. 일부 구현예에서, 원핵생물에서 폴리뉴클레오티드 (예컨대 비-코딩 폴리뉴클레오티드) 및 단백질의 발현은 융합 또는 비-융합 폴리뉴클레오티드 및/또는 단백질의 발현을 유도하는 항상성 또는 유도성 프로모터를 함유하는 벡터를 사용하여 에스케리치아 콜라이에서 수행될 수 있다. 일부 구현예에서, 융합 발현 벡터는 융합 폴리뉴클레오티드 단백질의 정제 이후에 융합 벡터 골격 또는 다른 융합 모이어티로부터 재조합 폴리뉴클레오티드 또는 단백질의 분리가 가능하도록 융합 벡터 골격 또는 다른 융합 모이어티 및 재조합 폴리뉴클레오티드 또는 단백질의 접합부에 도입될 수 있는, 단백질가수분해 절단 부위를 포함할 수 있다. 이러한 효소, 및 그들 동종 인식 서열은 인자 Xa, 트롬빈 및 엔테로키나제를 포함한다. 예시적인 융합 발현 벡터는 글루타티온 S-트랜스퍼라제 (GST), 말토스 E 결합 단백질, 또는 단백질 A을 각각, 표적 재조합 단백질에 융합시키는, pGEX (Pharmacia Biotech Inc; Smith and Johnson, 1988. Gene 67: 31-40), pMAL (New England Biolabs, Beverly, Mass.) 및 pRIT5 (Pharmacia, Piscataway, N.J.)를 포함한다. 적합한 유도성 비-융합 이. 콜라이 발현 벡터의 예는 pTrc (Amrann et al., (1988) Gene 69:301-315) and pET 11d (Studier et al., GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990) 60-89)를 포함한다.

일부 구현예에서, 본 명세서에 기술된 n-량체 모티프를 함유하는 조작된 바이러스 (예를 들어, AAV) 캡시드 시스템 또는 다른 조성물의 하나 이상의 구성요소의 발현을 구동하는 하나 이상의 벡터는 숙주 세포에 도입되어서 본 명세서에 기술된 조작된 전달 시스템의 구성요소의 발현은 본 명세서에 기술된 n-량체 모티프를 함유하는 조작된 바이러스 (예를 들어, AAV) 캡시드 시스템 또는 다른 조성물 (본 명세서의 다른 곳에 보다 상술되는, 조작된 유전자 전달제 입자를 포함하지만, 이에 제한되지 않음)의 형성을 유도한다. 예를 들어, 본 명세서에 기술된 n-량체 모티프를 함유하는 조작된 바이러스 (예를 들어, AAV) 캡시드 시스템 또는 다른 조성물의 상이한 구성요소는 각각이 별개 벡터 상에서 별개 조절 구성요소에 작동적으로 연결될 수 있다. 본 명세서에 기술된 조작된 전달 시스템의 상이한 구성요소의 RNA(들)는 동물 또는 포유동물 또는 이의 세포로 전달되어서 본 명세서에 기술된 n-량체 모티프를 함유하는 조작된 바이러스 (예를 들어, AAV) 캡시드 시스템 또는 다른 조성물의 하나 이상의 구성요소를 도입시키거나 또는 본 명세서에 기술된 n-량체 모티프를 함유하는 조작된 바이러스 (예를 들어, AAV) 캡시드 시스템 또는 다른 조성물의 하나 이상의 구성요소를 도입시키고/시키거나 발현하는 하나 이상의 세포를 함유하는 본 명세서에 기술된 n-량체 모티프를 함유하는 조작된 바이러스 (예를 들어, AAV) 캡시드 시스템 또는 다른 조성물의 상이한 구성요소를 항상적으로 또는 유도적으로 또는 조건적으로 발현하는 동물 또는 포유동물 또는 이의 세포를 생산할 수 있다.

일부 구현예에서, 동일하거나 또는 상이한 조절 구성요소(들)로부터 발현되는 구성요소 중 하나 이상은 단일 벡터로, 제1 벡터에 포함되지 않은 임의의 성분을 제공하는 하나 이상의 추가 벡터와 조합될 수 있다. 단일 벡터로 조합되는 본 발명의 조작된 폴리뉴클레오티드는 적합한 배향으로 배열될 수 있는데, 예컨대 하나의 구성요소는 제2 구성요소에 대해 이의 5' ("상류") 또는 3' ("하류")에 위치된다. 한 구성요소의 코딩 서열은 제2 구성요소의 코딩 서열의 동일하거나 또는 반대 가닥 상에 위치될 수 있고, 동일하거나 또는 반대의 방향으로 배향될 수 있다. 일부 구현예에서, 단일 프로모터는 하나 이상의 인트론 서열 내에 내포된, 본 명세서에 기술된 n-량체 모티프를 함유하는 하나 이상의 조작된 바이러스 (예를 들어, AAV) 캡시드 단백질 또는 다른 조성물을 코딩하는 전사물의 발현을 구동한다 (예를 들어, 상이한 인트론으로 각각, 적어도 하나의 인트론에 둘 이상, 또는 단일 인트론에 전부). 일부 구현예에서, 본 발명의 조작된 폴리뉴클레오티드 (조작된 바이러스 폴리뉴클레오티드를 포함하지만, 이에 제한되지 않음)는 동일한 프로모터에 작동적으로 연결되어 그로부터 발현될 수 있다.

벡터 특성

벡터는 전달하려는 벡터, 폴리뉴클레오티드, 그로부터 거기서 생산되는 바이러스 입자, 또는 이의 발현된 폴리펩티드에 하나 이상의 기능성을 부여할 수 있는 추가 특성을 포함할 수 있다. 이러한 특성은 조절 구성요소s, 선별 마커, 분자 식별자 (예를 들어, 분자 바코드), 안정화 구성요소 등을 포함하지만, 이에 제한되지 않는다. 포함되는 발현 벡터 및 추가 특성의 디자인은 형질전환시키려는 숙주 세포의 선택, 원하는 발현 수준 등과 같은 특성에 의존할 수 있다는 것을 당업자는 이해할 것이다.

조절 구성요소

구현예에서, 본 명세서에 기술된 폴리뉴클레오티드 및/또는 이의 벡터 (본 발명의 조작된 AAV 캡시드 폴리뉴클레오티드를 포함하지만, 이에 제한되지 않음)는 폴리뉴클레오티드에 작동적으로 연결될 수 있는 하나 이상의 조절 구성요소를 포함할 수 있다. 용어 "조절 구성요소"는 프로모터, 인핸서, 내부 리보솜 진입 부위 (IRES), 및 다른 발현 제어 구성요소 (예를 들어, 전사 종결 신호, 예컨대 폴리아데닐화 신호 및 폴리-U 서열)을 포함하고자 한다. 이러한 조절 구성요소는 예를 들어, 하기 문헌에 기술된다: Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990). 조절 구성요소는 많은 유형의 숙주 세포에서 뉴클레오티드 서열의 항상성 발현을 유도하는 것들 및 오직 일정 숙주 세포에서만 뉴클레오티드 서열 (예를 들어, 조직-특이적 조절 서열)의 발현을 유도하는 것들을 포함한다. 조직-특이적 프로모터는 목적하는 관심 조직, 예컨대, 근육, 뉴런, 뼈, 피부, 혈액, 특정 기관 (예를 들어, 간, 췌장) 또는 특정 세포 유형 (예를 들어, 림프구)에서 주로 발현을 유도할 수 있다. 조절 구성요소는 또한 조직 또는 세포 유형 특이적일 수도 있고 그렇지 않을 수도 있는, 일시적-의존적 방식으로, 예컨대, 세포-주기 의존적 또는 발생 단계-의존적 방식으로 발현을 지시할 수 있다. 일부 구현예에서, 벡터는 하나 이상의 pol III 프로모터 (예를 들어, 1, 2, 3, 4, 5 이상의 pol III 프로모터), 하나 이상의 pol II 프로모터 (예를 들어, 1, 2, 3, 4, 5 이상의 pol II 프로모터), 하나 이상의 pol I 프로모터 (예를 들어, 1, 2, 3, 4, 5 이상의 pol I 프로모터), 또는 이의 조합을 포함한다. pol III 프로모터의 예는 U6 및 H1 프로모터를 포함하지만, 이에 제한되지 않는다. pol II 프로모터의 예는 레트로바이러스 라우스 육종 바이러스 (RSV) LTR 프로모터 (임의로 RSV 인핸서 존재), 사이토메갈로바이러스 (CMV) 프로모터 (임의로 CMV 인핸서 존재) (참조: 예를 들어, Boshart et al, 세포, 41:521-530 (1985)), SV40 프로모터, 디히드로폴레이트 리덕타제 프로모터, β-액틴 프로모터, 포스포글리세롤 키나제 (PGK) 프로모터, 및 EF1α 프로모터를 포함한다. 용어 "조절 구성요소"는 인핸서 구성요소, 예컨대 WPRE; CMV 인핸서; HTLV-I의 LTR에 R-U5' 절편 (Mol. Cell. Biol., Vol. 8(1), p. 466-472, 1988); SV40 인핸서; 및 토끼 β-글로빈의 엑손 2 및 3 사이의 인트론 서열 (Proc. Natl. Acad. Sci. USA., Vol. 78(3), p. 1527-31, 1981)을 포괄한다.

일부 구현예에서, 조절 서열은 미국 특허 제7,776,321호, 미국 특허 출원 공개 번호 제2011/0027239호, 및 PCT 공개 번호 WO 2011/028929에 기술된 조절 서열일 수 있고, 이의 내용은 그들 전문이 참조로 본 명세서에 편입된다. 일부 구현예에서, 벡터는 최소 프로모터를 함유할 수 있다. 일부 구현예에서, 최소 프로모터는 Mecp2 프로모터, tRNA 프로모터, 또는 U6이다. 추가 구현예에서, 최소 프로모터는 조직 특이적이다. 일부 구현예에서, 벡터 폴리뉴클레오티드, 최소 프로모터 및 폴리뉴클레오티드 서열의 길이는 4.4Kb 미만이다.

폴리뉴클레오티드를 발현하기 위해서, 벡터는 하나 이상의 전사 및/또는 번역 개시 조절 서열, 예를 들어, 세포에서 유전자의 전사 및/또는 코딩된 단백질의 번역을 유도하는 프로모터를 포함할 수 있다. 일부 구현예에서 항상성 프로모터가 적용될 수 있다. 포유동물 세포에 적합한 항상성 프로모터는 일반적으로 당분야에 공지되어 있고, SV40, CAG, CMV, EF-1α, β-액틴, RSV, 및 PGK를 포함하지만, 이에 제한되지 않는다. 박테리아 세포, 효모 세포, 및 진균 세포에 적합한 항상성 프로모터, 예컨대 박테리아 발현을 위한 T-7 프로모터 및 효모에서 발현을 위한 알콜 데히드로게나제 프로모터는 일반적으로 당분야에 공지되어 있다.

일부 구현예에서, 조절 구성요소는 조절된 프로모터일 수 있다. "조절된 프로모터"는 항성성이 아니지만, 시간적으로 및/또는 공간적으로 조절된 방식으로 유전자 발현을 지시하는 프로모터를 지칭하고, 조직-특이적, 조직-선호성 및 유도성 프로모터를 포함한다. 일부 구현예에서, 조절된 프로모터는 본 명세서의 다른 곳에 이전에 논의된 바와 같은 조직 특이적 프로모터이다. 조절된 프로모터는 조건적 프로모터 및 유도적 프로모터를 포함한다. 일부 구현예에서, 조건적 프로모터는 일정 환경 조건 하, 및/또는 특별한 발생 단계 동안, 특정 세포 유형에서 폴리뉴클레오티드의 발현을 유도하는데 사용될 수 있다. 적합한 조직 특이적 프로모터는 간 특이적 프로모터 (예: APOA2, SERPIN A1 (hAAT), CYP3A4, 및 MIR122), 췌장 세포 프로모터 (예: INS, IRS2, Pdx1, Alx3, Ppy), 심장 특이적 프로모터 (예: Myh6 (알파 MHC), MYL2 (MLC-2v), TNI3 (cTnl), NPPA (ANF), Slc8a1 (Ncx1)), 중추 신경계 세포 프로모터 (SYN1, GFAP, INA, NES, MOBP, MBP, TH, FOXA2 (HNF3 베타)), 피부 세포 특이적 프로모터 (예: FLG, K14, TGM3), 면역 세포 특이적 프로모터, (예: ITGAM, CD43 프로모터, CD14 프로모터, CD45 프로모터, CD68 프로모터), 비뇨생식 세포 특이적 프로모터 (예: Pbsn, Upk2, Sbp, Fer1l4), 내피 세포 특이적 프로모터 (예: ENG), 만능 및 배아 생식층 세포 특이적 프로모터 (예: Oct4, NANOG, 합성 Oct4, T brachyury, NES, SOX17, FOXA2, MIR122), 및 근육 조직 특이적 프로모터 (예: 데스민)를 포함할 수 있지만, 이에 제한되지 않는다. 다른 조직 및/또는 세포 특이적 프로모터는 본 명세서의 다른 곳에서 논의되고 일반적으로 당분야에 공지되어 있고 본 개시의 범주 내에 속한다.

유도성/조건적 프로모터는 양성 유도성/조건적 프로모터 (예를 들어, 활성화된 활성인자, 또는 유도자 (화합물, 환경 조건, 또는 다른 자극)과 적절한 상호작용 시 폴리뉴클레오티드의 전사를 활성화시키는 프로모터) 또는 음성/조건적 유도성 프로모터 (예를 들어, 프로모터의 억제인자 조건이 제거될 때까지 (예를 들어, 유도자가 프로모터 환경으로부터 화학적 억제인자의 제거 또는 억제인자에 의한 프로모터의 방출을 자극하는 프로모터에 결합된 억제인자에 결합됨) (예를 들어, 억제인자가 결합됨) 억제되는 프로모터)일 수 있다. 유도자는 화합물, 환경 조건, 또는 다른 자극일 수 있다. 따라서, 유도성/조건적 프로모터는 임의의 적합한 자극, 예컨대, 화학제, 생물학적, 또는 다른 분자 작용제, 온도, 빛, 및/또는 pH에 반응성일 수 있다. 적합한 유도성/조건적 프로모터는 Tet-On, Tet-Off, Lac 프로모터, pBad, AlcA, LexA, Hsp70 프로모터, Hsp90 프로모터, pDawn, XVE/OlexA, GVG, 및 pOp/LhGR을 포함하지만, 이에 제한되지 않는다.

식물 세포에서 발현이 바람직한 경우에, 본 명세서에 기술된 조작된 AAV 캡시드 시스템의 성분은 전형적으로 식물 프로모터, 즉 식물 세포에서 작동가능한 프로모터 하에 위치된다. 상이한 유형의 프로모터의 사용이 고려된다. 일부 구현예에서, 식물에서 조작된 바이러스 (예를 들어, AAV) 캡시드 시스템 벡터의 포함은 바이러스 벡터 생산 목적을 위한 것일 수 있다.

항상성 식물 프로모터는, 오픈 리딩 프레임 (ORF)를 발현할 수 있는 프로모터로, 이는 식물의 모든 또는 거의 모든 발생 단계 동안, 모든 또는 거의 모든 식물 조직을 제어한다 ("항상성 발현"으로도 지칭됨). 항상성 프로모터의 한 가지 비제한적 예는 콜리플라워 모자이크 바이러스 35S 프로모터이다. 상이한 프로모터는 상이한 조직 또는 세포 유형에서, 또는 상이한 발생 단계에서, 또는 상이한 환경 조건에 반응하여 유전자의 발현을 유도할 수 있다. 특정 구현예에서, 하나 이상의 조작된 AAV 캡시드 시스템 성분은 항상성 프로모터의 제어 하에 발현되고, 예컨대 콜리플라워 모자이크 바이러스 35S 프로모터 이슈-선호된 프로모터는 특정 식물 조직 내 일정 세포 유형에서, 예를 들어 잎 또는 뿌리의 백관 세포 내에서 또는 종자의 특별한 세포 내에서 증강된 발현을 표적화하는데 이용될 수 있다. 본 발명의 조작된 AAV 캡시드 시스템 및 다른 조성물에서 사용을 위한 특정 프로모터의 예는 하기 문헌에서 확인된다: Kawamata et al., (1997) Plant Cell Physiol 38:792-803; Yamamoto et al., (1997) Plant J 12:255-65; Hire et al, (1992) Plant Mol Biol 20:207-18,Kuster et al, (1995) Plant Mol Biol 29:759-72, and Capana et al., (1994) Plant Mol Biol 25:681 -91.

유도성이며, 유전자 편집 또는 유전자 발현의 시공적 제어를 가능하게 하는 프로모터의 예는 에너지 형태를 사용할 수 있다. 에너지 형태는 소리 에너지, 전자기 복사, 화학적 에너지 및/또는 열 에너지를 포함할 수 있지만, 이들로 제한되지 않는다. 유도성 시스템의 예는 테트라사이클린 유도성 프로모터 (Tet-on 또는 Tet-off), 소형 분자 2-하이브리드 전사 활성화 시스템 (FKBP, ABA 등), 또는 광 유도성 시스템 (피토크롬, LOV 도메인 또는 크립토크롬), 예컨대, 서열-특이적 방식으로 전사 활성의 변화를 지시하는 광 유도성 전사 이펙터 (LITE)를 포함한다. 광 유도성 시스템의 성분은 본 명세서에 기술된 본 발명의 조작된 AAV 캡시드 시스템 또는 다른 조성물의 하나 이상의 구성요소, 광-반응성 시토크롬 이종이량체 (예를 들어, 아라비돕시스 탈리아나 (Arabidopsis thaliana) 유래), 및 전사 활성화/억제 도메인을 포함할 수 있다. 일부 구현예에서, 벡터는 PCT 공개번호 WO 2014/018423 및 US 특허 출원 공개 번호 제2015/0291966호, 제2017/0166903호, 제2019/0203212호에 제공된 유도성 DNA 결합 단백질의 하나 이상을 포함할 수 있고, 이들 문헌은 예를 들어, 유도성 DNA 결합 단백질 및 사용 방법의 구현예를 기술하고 본 발명에서 사용을 위해 적합화될 수 있다.

일부 구현예에서, 일시적 또는 유도성 발현은, 예를 들어, 화학적-조절 프로모터를 포함함으로써 달성될 수 있고, 즉, 이에 의해 외생성 화학물질의 적용은 유전자 발현을 유도한다. 유전자 발현의 조절은 또한 화학물질-억제성 프로모터에 의해 얻어질 수 있으며, 화학물질의 적용은 유전자 발현을 억제한다. 화학물-유도성 프로모터는 벤젠 술폰아미드 제초제 약해 경감제에 의해 활성화되는 옥수수 ln2-2 프로모터 (De Veylder et al., (1997) Plant Cell Physiol 38:568-77), 발아전 제초체로서 사용되는 소수성 친핵성 화합물에 의해 활성화되는 옥수수 GST 프로모터 (GST-ll-27, WO93/01294), 및 살리실산에 의해 활성화되는 담배 PR-1 a 프로모터 (Ono et al., (2004) Biosci Biotechnol Biochem 68:803-7)를 포함하지만, 이에 제한되지 않는다. 항생제에 의해 조절되는 프로모터, 예컨대 테트라사이클린-유도성 및 테트라사이클린-억제성 프로모터 (Gatz et al., (1991) Mol Gen Genet 227:229-37; 미국 특허 제5,814,618호 및 제5,789,156호)가 또한 본 명세서에서 사용될 수 있다.

일부 구현예에서, 벡터 또는 이의 시스템은 본 발명의 조작된 폴리뉴클레오티드 (예를 들어, 조작된 바이러스 (예를 들어, AAV) 캡시드 폴리뉴클레오티드)를 특별한 세포 성분 또는 소기관으로 전좌시킬 수 있고/있거나 그에서 발현시킬 수 있는 하나 이상의 구성요소를 포함할 수 있다. 이러한 소기관은 핵, 리보솜, 소포체, 골지체, 엽록체, 미토콘드리아, 액포, 리소솜, 세포골격, 원형질막, 세포벽, 퍼옥시솜, 중심소체 등을 포함할 수 있지만, 이에 제한되지 않는다.

선별가능 마커 및 태그

본 발명의 하나 이상의 조작된 폴리뉴클레오티드 (예를 들어, 조작된 바이러스 (예를 들어, AAV) 캡시드 폴리뉴클레오티드)는 폴리뉴클레오티드 또는 폴리펩티드일 수 있는, 선별가능 마커 또는 태그이거나 또는 그를 코딩하는 폴리뉴클레오티드에 작동적으로 연결될 수 있거나, 융합될 수 있거나, 또는 그를 포함하도록 변형될 수 있다. 일부 구현예에서, 폴리펩티드 선별가능 마커를 코딩하는 폴리펩티드는 본 발명의 조작된 폴리뉴클레오티드 (예를 들어, 조작된 바이러스 (예를 들어, AAV) 캡시드 폴리뉴클레오티드)에 도입되어서 번역될 때, 선별가능 마커 폴리펩티드는 조작된 폴리펩티드 (예를 들어, 조작된 AAV 캡시드 폴리펩티드)의 N-말단 및 C-말단 사이 2개 아미노산 사이에 또는 조작된 폴리펩티드 (예를 들어, 조작된 AAV 캡시드 폴리펩티드)의 N-말단 및/또는 C-말단에 삽입된다. 일부 구현예에서, 선별가능 마커 또는 태그는 폴리뉴클레오티드 바코드 또는 고유한 분자 식별자 (UMI)이다.

이러한 선별가능 마커 또는 태그를 코딩하는 폴리뉴클레오티드는 선별가능 마커 또는 태그의 발현을 허용하는 적절한 방식으로 본 명세서에 기술된 조작된 AAV 캡시드 시스템의 하나 이상의 성분을 코딩하는 폴리뉴클레오티드에 도입될 수 있다는 것을 이해할 것이다. 이러한 기술 및 방법은 본 명세서의 다른 곳에 기술되고 본 개시의 관점에서 당업자가 즉시 이해할 것이다. 많은 이러한 선별가능 마커 및 태그는 일반적으로 당업자에게 공지되어 있고 본 개시의 범주 내에 있고자 한다.

적합한 선별가능 마커 및 태그는 친화성 태그, 예컨대 키틴 결합 단백질 (CBP), 말토스 결합 단백질 (MBP), 글루타티온-S-트랜스퍼라제 (GST), 폴리(His) 태그; 가용화 태그 예컨대 티오레독신 (TRX) 및 폴리(NANP), MBP, 및 GST; 크로마토그래피 태그 예컨대 다가음이온 아미노산, 예컨대 FLAG-태그; 에피토프 태그 예컨대 V5-태그, Myc-태그, HA-태그 및 NE-태그로 이루어지는 것; 특이적 효소적 변형 (예컨대, 바이오틴 리가제에 의한 바이오틴화) 또는 화학적 변형 (예컨대, 형광 이미지화를 위한 FlAsH-EDT2와의 반응)을 허용할 수 있는 단백질 태그, DNA 및/또는 제한 효소 또는 다른 효소 절단 부위를 함유하는 RNA 절편; 항생제, 예컨대, 스펙티노마이신, 암피실린, 카나마이신, 테트라사이클린, 바스타, 네오마이신 포스포트랜스퍼라제 II (NEO), 하이그로마이신 포스포트랜스퍼라제 (HPT)) 등을 포함한 독성 화합물에 대한 내성을 제공하는 생산물을 코딩하는 DNA 절편; 수령자 세포에서 결여된 생산물을 코딩하는 DNA 및/또는 RNA 절편 (예를 들어, tRNA 유전자, 영양요구성 마커); 쉽게 확인할 수 있는 생산물을 코딩하는 DNA 및/또는 RNA 절편 (예를 들어, 표현형 마커 예컨대 베타-갈락토시다제, GUS; 형광성 단백질 예컨대 녹색 형광 단백질 (GFP), 청록색 (CFP), 노란색 (YFP), 적색 (RFP), 루시퍼라제, 및 세포 표면 단백질); PCR을 위한 하나 이상의 새로운 프라이머 부위를 생성시킬 수 있는 폴리뉴클레오티드 (예를 들어, 이전에 병치되지 않은 2개 DNA 서열의 병치), 제한 엔도뉴클레아제 또는 다른 DNA 변형 효소, 화학물 등에 의해 작용하거나 또는 작용하지 않는 DNA 서열; 에피토프 태그 (예: GFP, FLAG-태그 및 His-태그), 및, 분자 바코드 또는 고유한 분자 식별자 (UMI)를 만드는 DNA 서열, 이의 확인을 허용하는 특별한 변형 (예를 들어, 메틸화)에 필요한 DNA 서열을 포함하지만, 이에 제한되지 않는다. 다른 적합한 마커는 당업자가 이해할 것이다.

선별가능 마커 및 태그는 적합한 링커, 예컨대 GS 또는 GG 내지 (GGGGG)₃ (SEQ ID NO: 34) 또는 (GGGGS)₃(SEQ ID NO: 35) 만큼 짧은 글리신 또는 글리신 세린 링커를 통해서 본 명세서에 기술된 조작된 AAV 캡시드 시스템 또는 다른 조성물 및/또는 시스템의 하나 이상의 성분에 작동적으로 연결될 수 있다. 다른 적합한 링커는 본 명세서의 다른 곳에 기술된다.

벡터 또는 벡터 시스템은 하나 이상의 표적화 모이어티를 코딩하는 하나 이상의 폴리뉴클레오티드를 포함할 수 있다. 일부 구현예에서, 표적화 모이어티를 코딩하는 폴리뉴클레오티드는 벡터 또는 벡터 시스템, 예컨대 바이러스 벡터 시스템에 포함될 수 있어서, 그들은 생산된 바이러스 입자(들) 내 및/또는 그 위에서 발현되어 바이러스 입자가 특이적 세포, 조직, 장기 등에 표적화될 수 있다. 일부 구현예에서, 표적화 모이어티를 코딩하는 폴리뉴클레오티드는 벡터 또는 벡터 시스템에 포함될 수 있어서 본 발명의 조작된 폴리뉴클레오티드(들) (예를 들어, 조작된 바이러스 (예를 들어, AAV) 캡시드 폴리뉴클레오티드(들)) 및/또는 그로부터 발현된 생산물은 표적화 모이어티를 포함하고, 특이적 세포, 조직, 장기 등을 표적화할 수 있다. 일부 구현예에서, 예컨대 비-바이러스 담체같은, 표적화 모이어티는 담체 (예를 들어, 중합체, 지질, 무기 분자 등)에 부착될 수 있고, 담체 및 본 발명의 임의의 부착 또는 회합된 조작된 폴리뉴클레오티드(들), 조작된 폴리펩티드, 또는 본 명세서에 기술된 본 발명의 다른 조성물을 특이적 세포, 조직, 장기 등에 표적화할 수 있다. 일부 구현예에서, 특이적 세포는 근육 조직이다.

세포-무함유 벡터 및 폴리뉴클레오티드 발현

일부 구현예에서, 본 발명의 n-량체 모티프를 코딩하는 폴리뉴클레오티드(들)는 세포-무함유 시험관내 시스템에서 벡터 또는 적합한 폴리뉴클레오티드로부터 발현될 수 있다. 일부 구현예에서, 조작된 AAV 캡시드 시스템의 하나 이상의 특성을 코딩하는 폴리뉴클레오티드는 세포-무함유 시험관내 시스템에서 벡터 또는 적합한 폴리뉴클레오티드로부터 발현될 수 있다. 달리 말해서, 폴리뉴클레오티드는 전사될 수 있고 임의로 시험관내에서 번역될 수 있다. 시험관내 전사/번역 시스템 및 적절한 벡터는 일반적으로 당업자에게 공지되어 있고 상업적으로 입수가능하다. 일반적으로, 시험관내 전사 및 시험관내 번역 시스템은 RNA 및 단백질 합성의 과정을 각각 세포 환경의 밖에서 복제한다. 시험관내 전사를 위한 벡터 및 적합한 폴리뉴클레오티드는 폴리뉴클레오티드 또는 벡터를 전사하도록 적절한 폴리머라제가 인식할 수 있고 작용할 수 있는 T7, SP6, T3, 프로모터 조절 서열을 포함할 수 있다.

시험관내 번역은 독립형 (예를 들어, 정제된 폴리리보뉴클레오티드의 번역)일 수 있거나 또는 전사와 연결/커플링될 수 있다. 일부 구현예에서, 세포-무함유 (또는 시험관내) 번역 시스템은 토끼 망상적혈구, 밀 배아 및/또는 이. 콜라이로부터의 추출물을 포함할 수 있다. 추출물은 외생성 RNA의 번역에 필요한 다양한 거대분자 성분 (예를 들어, 70S 또는 80S 리보솜, tRNA, 아미노아실-tRNA, 신써타제, 개시, 연장 인자, 종결 인자 등)을 포함할 수 있다. 다른 성분은 아미노산, 에너지원 (ATP, GTP), 에너지 재생 시스템 (크레아틴 포스페이트 및 크레아틴 포스포키나제 (진핵생물 시스템)) (박테리아 시스템 경우 포스포에놀 피루베이트 및 피루베이트 키나제), 및 다른 보조인자 (Mg2+, K+ 등)를 포함하지만, 이에 제한되지 않는, 번역 반응 동안 포함될 수 있거나 또는 첨가될 수 있다. 이전에 언급된 바와 같이, 시험관내 번역은 RNA 또는 DNA 출발 물질을 기반으로 할 수 있다. 일부 번역 시스템는 출발 물질로서 RNA 주형 (예를 들어, 망상적혈구 용해물 및 밀 배아 추출물)을 이용할 수 있다. 일부 번역 시스템은 출발 물질로서 DNA 주형을 이용할 수 있다 (예를 들어, 이. 콜라이-기반 시스템). 이들 시스템에서 전사 및 번역은 커플링되고 DNA는 먼저 RNA로 전사되고, 이후 번역된다. 적합한 표준 및 커플링된 세포-무함유 번역 시스템은 일반적으로 당업자에게 공지되어 있고 상업적으로 입수가능하다.

벡터 폴리뉴클레오티드의 코돈 최적화

본 명세서의 다른 곳에 기술된 바와 같이, 본 발명의 n-량체 모티프를 코딩하는 폴리뉴클레오티드 및/또는 본 명세서에 기술된 다른 폴리뉴클레오티드는 코돈 최적화될 수 있다. 일부 구현예에서, 본 명세서에 기술된 조작된 AAV 캡시드 시스템의 폴리뉴클레오티드는 코돈 최적화될 수 있다. 일부 구현예에서, 제한없이, 본 명세서에 기술된 조작된 AAV 캡시드 시스템의 구현예를 포함하는, n-량체 모티프를 코딩하는 임의로 코돈 최적화된 폴리뉴클레오티드 이외에도 본 명세서에 기술된 벡터 ("벡터 폴리뉴클레오티드")에 함유된 하나 이상의 폴리뉴클레오티드는 코돈 최적화될 수 있다. 일반적으로, 코돈 최적화는 천연 서열의 적어도 하나의 코돈 (예를 들어, 약 1, 2, 3, 4, 5, 10, 15, 20, 25, 50개 이상의 코돈)을 해당 숙주 세포의 유전자에서 더 빈번하게 또는 가장 빈번하게 사용되는 코돈으로 대체함으로써 관심 숙주 세포에서 증강된 발현을 위한 핵산 서열을 변형시키는 한편, 천연 아미노산 서열을 유지시키는 과정을 의미한다. 다양한 종은 특정 아미노산의 특정 코돈에 대하여 특정 편향을 나타낸다. 코돈 편향 (유기체 간의 코돈 사용의 차이)은 종종 메신저 RNA(mRNA)의 번역의 효율과 상관관계가 있으며, 이는 결국, 특히, 번역되는 코돈의 특성 및 특정 운반 RNA(tRNA) 분자의 이용 가능성에 좌우되는 것으로 여겨진다. 세포에서의 선택된 tRNA의 우세는 일반적으로 펩티드 합성에 가장 빈번하게 사용되는 코돈을 반영하는 것이다. 따라서, 유전자는 코돈 최적화를 기반으로 하여 주어진 유기체에서의 최적의 유전자 발현을 위해 맞춤화될 수 있다. 코돈 용법표는 예를 들어, www.kazusa.orjp/codon/에서 입수가능한 "코돈 용법 데이터베이스"에서 쉽게 입수할 수 있고, 이들 표는 다수 방식으로 적합화될 수 있다 (참조: Nakamura, Y., et al. "Codon usage tabulated from the international DNA sequence databases: status for the year 2000" Nucl. Acids Res. 28:292 (2000)). 특정 숙주 세포에서의 발현을 위해 특정 서열을 코돈 최적화시키는 컴퓨터 알고리즘이 또한 이용 가능하며, 예를 들어 Gene Forge (Aptagen; Jacobus, PA) 이 또한 이용가능하다. 일부 구현예에서, DNA/RNA-표적화 Cas 단백질을 인코딩하는 서열 내의 하나 이상의 코돈 (예를 들어, 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 개 이상, 또는 모든 코돈)은 특정 아미노산에 대하여 가장 빈번하게 사용되는 코돈에 해당한다. 효모에서 코돈 용법과 관련하여, http://www.yeastgenome.org/community/codon_usage.shtml에서 입수가능한 온라인 효모 게놈 데이터베이스, 또는 [Codon selection in yeast, Bennetzen and Hall, J Biol Chem. 1982 Mar 25;257(6):3026-31]을 참조한다. 조류를 포함한 식물에서 코돈 용법과 관련하여, 고능 식물, 녹조류 및 시아노박테리아에서의 코돈 용법에 대해서 [Campbell and Gowri, Plant Physiol. 1990 Jan; 92(1): 1-11.]를 참조하고, 또한 식물 유전자에서 코돈 용법과 관련하여, [Murray et al, Nucleic Acids Res. 1989 Jan 25;17(2):477-98], 또는 [Selection on the codon bias of chloroplast and cyanelle genes in different plant and algal lineages, Morton BR, J Mol Evol. 1998 Apr;46(4):449-59]을 참조한다.

벡터 폴리뉴클레오티드는 특이적 세포-유형, 조직 유형, 장기 유형, 및/또는 대상체 유형에서 발현을 위해 코돈 최적화될 수 있다. 일부 구현예에서, 코돈 최적화된 서열은 본 명세서의 다른 곳에 기술된 바와 같이 진핵생물, 예를 들어, 인간 (즉, 인간 또는 인간 세포에서 발현을 위해 최적화), 또는 다른 진핵생물, 예컨대 다른 동물 (예를 들어, 포유동물 또는 조류)에서 발현을 위해 최적화된 서열이다. 이러한 코돈 최적화된 서열은 본 명세서의 관점에서 당업자의 영역 내에 있다. 일부 구현예에서, 폴리뉴클레오티드는 특이적 세포 유형에 대해 코돈 최적화된다. 이러한 세포 유형은 상피 세포 (피부 세포, 위장 내벽 세포, 다른 중공 장기 내벽 세포 포함), 신경 세포 (신경, 뇌 세포, 척추 세포, 신경 지지 세포 (예를 들어, 성상세포, 신경아교 세포, 슈반 세포 등) , 근육 조직 (예를 들어, 심장 근육, 평활 근육 조직, 및 골격 근육 조직), 결합 조직 세포 (지방 및 다른 연조직 패딩 세포, 뼈 세포, 힘줄 세포, 연골 세포), 혈액 세포, 줄기 세포 및 다른 전구체 세포, 면역계 세포, 생식 세포, 및 이의 조합을 포함하지만, 이에 제한되지 않는다. 이러한 코돈 최적화 서열은 본 설명의 관점에서 통상의 기술자의영역 내에 있다. 일부 구현예에서, 폴리뉴클레오티드는 특이적 조직 유형에 대해 코돈 최적화된다. 이러한 조직 유형은 근육 조직, 결합 조직, 결합 조직, 신경 조직, 및 상피 조직를 포함할 수 있지만, 이에 제한되지 않는다. 이러한 코돈 최적화된 서열은 본 발명의 설명의 관점에서 당업자의 영역 내에 있다. 일부 구현예에서, 폴리뉴클레오티드는 특이적 장기에 대해 코돈 최적화된다. 이러한 장기는 근육, 피부, 장, 간, 비장, 뇌, 폐, 위, 심장, 신장, 담낭, 췌장, 방광, 갑상선, 뼈, 혈관, 혈액, 및 이의 조합을 포함하지만, 이에 제한되지 않는다. 이러한 코돈 최적화된 서열은 본 명세서의 설명의 관점에서 당업자의 영역 내에 있다.

일부 구현예에서, 벡터 폴리뉴클레오티드는 특정 세포, 예컨대 원핵생물 또는 진핵생물 세포에서 발현을 위해 코돈 최적화된다. 진핵생물 세포는 본 명세서에서 논의된 바와 같이 인간, 또는 비-인간 진핵생물 또는 동물 또는 포유동물, 예를 들어, 마우스, 래트, 토끼, 개, 가축, 또는 비-인간 포유동물 또는 영장류를 포함하지만, 이에 제한되지 않는 특정 유기체, 예컨대 식물 또는 포유동물의 것일 수 있거나 또는 그로부터 유래될 수 있다.

비-바이러스 벡터 및 담체

일부 구현예에서, 벡터는 비-바이러스 벡터 또는 담체이다. 일부 구현예에서, 비-바이러스 벡터는 바이러스 벡터와 비교하여 감소된 독성 및/또는 면역원성 및/또는 증가된 생물-안전성의 장점(들)을 가질 수 있다. 당분야 및 본 명세서의 상황에서 사용되는 용어 "비-바이러스 벡터 및 담체"는 본 명세서에 기술된 본 발명의 조작된 캡시드 폴리뉴클레오티드 (예를 들어, 조작된 AAV 캡시드 폴리뉴클레오티드) 또는 다른 조성물에 부착, 도입, 커플링, 및/또는 상호작용할 수 있는 바이러스 또는 바이러스 게놈의 하나 이상의 성분 (비-바이러스 벡터에 의해 전달 및/또는 발현시키려는 임의 뉴클레오티드 배제)을 기반으로 하지 않고 세포에 폴리뉴클레오티드를 운반할 수 있고/있거나 폴리뉴클레오티드를 발현할 수 있는 분자 및/또는 조성물을 의미한다. 전달시키려는 바이러스-기반 폴리뉴클레오티드의 포함을 배제하지 않는다는 것을 이해할 것이다. 예를 들어, 전달하려는 gRNA가 바이러스 성분에 대해 유도되고 비-바이러스 벡터 또는 담체에 삽입 또는 커플링되면, 상기 벡터는 "바이러스 벡터"로 만들어지지 않는다. 비-바이러스 벡터 및 담체는 나형 폴리뉴클레오티드, 화학물-기반 담체, 폴리뉴클레오티드 (비-바이러스) 기반 벡터, 및 입자-기반 담체를 포함한다. 비-바이러스 벡터 및 담체의 상황에서 사용되는 용어 "벡터"는 폴리뉴클레오티드 벡터를 의미하고 이러한 상황에서 사용되는 "담체"는 전달하려는 폴리뉴클레오티드, 예컨대 본 발명의 조작된 AAV 캡시드 폴리뉴클레오티드에 부착 또는 상호작용하는 비-핵산 또는 폴리뉴클레오티드 분자 또는 조성물을 의미한다는 것을 이해할 것이다.

나형 폴리뉴클레오티드

일부 구현예에서 본 명세서의 다른 곳에 기술된 본 발명의 하나 이상의 조작된 AAV 캡시드 폴리뉴클레오티드 또는 다른 폴리뉴클레오티드는 나형 폴리뉴클레오티드에 포함될 수 있다. 본 명세서에서 사용되는 당분야의 용어 "나형 폴리뉴클레오티드"는 종종 환경 인자 및/또는 분자로부터 보호하도록 도울 수 있는 다른 분자 (예를 들어, 단백질, 지질, 및/또는 다른 분자)와 회합되지 않은 폴리뉴클레오티드를 의미한다. 본 명세서에서 사용되는, 회합된은 제한없이, 연결된, 점착된, 흡착된, 내포된, 안에 내포 그에 내포된, 혼합된 등을 포함한다. 본 명세서에 기술된 본 발명의 조작된 AAV 캡시드 폴리뉴클레오티드 또는 폴리뉴클레오티드 중 하나 이상을 포함하는 나형 폴리뉴클레오티드는 숙주 세포에 직접 전달될 수 있고 임의로 거기서 발현될 수 있다. 나형 폴리뉴클레오티드는 임의의 적합한 2차원 및 3차원 입체구성을 가질 수 있다. 비제한적인 예로서, 나형 폴리뉴클레오티드는 단일 가닥 분자, 이중 가닥 분자, 원형 분자 (예를 들어, 플라스미드 및 인공 염색체), 단일 가닥인 일부 및 이중 가닥인 일부를 함유하는 분자 (예를 들어, 리보자임) 등일 수 있다. 일부 구현예에서, 나형 폴리뉴클레오티드는 오직 본 발명의 조작된 AAV 캡시드 폴리뉴클레오티드(들) 또는 다른 폴리뉴클레오티드를 함유한다. 일부 구현예에서, 나형 폴리뉴클레오티드는 본 명세서의 다른 곳에 기술된 본 발명의 조작된 AAV 캡시드 폴리뉴클레오티드(들) 또는 다른 폴리뉴클레오티드 이외에도 다른 핵산 및/또는 폴리뉴클레오티드를 함유할 수 있다. 나형 폴리뉴클레오티드는 트랜스포존 시스템의 하나 이상의 구성요소를 포함할 수 있다. 트랜스포존 및 이의 시스템은 본 명세서의 다른 곳에 더욱 상세히 기술된다.

비-바이러스 폴리뉴클레오티드 벡터

일부 구현예에서, 본 명세서의 하나 이상의 조작된 AAV 캡시드 폴리뉴클레오티드 또는 다른 폴리뉴클레오티드는 비-바이러스 폴리뉴클레오티드 벡터에 포함될 수 있다. 적합한 비-바이러스 폴리뉴클레오티드 벡터는 트랜스포존 벡터 및 벡터 시스템, 플라스미드, 박테리아 인공 염색체, 효모 인공 염색체, AR(항생제 내성)-무함유 플라스미드 및 미니플라스미드, 원형 공유 밀폐형 벡터 (예를 들어, 미니서클, 미니벡터, 미니노트), 선형 공유 밀폐형 벡터 ("덤벨 형상"), MIDGE (최소 면역학적 정의된 유전자 발현) 벡터, MiLV (마이크로-선형 벡터) 벡터, 미니스트링, 미니-인트론 플라스미드, PSK 시스템 (분리 후 살해 시스템), ORT (오퍼레이터 억제인자 적정) 플라스미드를 포함하지만, 이에 제한되지 않는다. 예를 들어, [Hardee et al. 2017. Genes. 8(2):65]을 참조한다.

일부 구현예에서, 비-바이러스 폴리뉴클레오티드 벡터는 조건적 복제 기원을 가질 수 있다. 일부 구현예에서, 비-바이러스 폴리뉴클레오티드 벡터는 ORT 플라스미드일 수 있다. 일부 구현예에서, 비-바이러스 폴리뉴클레오티드 벡터는 최소 면역학적 정의된 유전자 발현일 수 있다. 일부 구현예에서, 비-바이러스 폴리뉴클레오티드 벡터는 하나 이상의 분리 후 살해 시스템 유전자를 가질 수 있다. 일부 구현예에서, 비-바이러스 폴리뉴클레오티드 벡터는 AR-무함유이다. 일부 구현예에서, 비-바이러스 폴리뉴클레오티드 벡터는 미니벡터이다. 일부 구현예에서, 비-바이러스 폴리뉴클레오티드 벡터는 핵 국재화 신호를 포함한다. 일부 구현예에서, 비-바이러스 폴리뉴클레오티드 벡터는 하나 이상의 CpG 모티프를 포함할 수 있다. 일부 구현예에서, 비-바이러스 폴리뉴클레오티드 벡터는 하나 이상의 스캐폴드/매트릭스 부착 영역 (S/MAR)을 포함할 수 있다. 예를 들어, [Mirkovitch et al. 1984. Cell. 39:223-232, Wong et al. 2015. Adv. Genet. 89:113-152]을 참조하고, 이의 기술 및 벡터는 본 발명에서 사용을 위해 적합화될 수 있다. S/MAR은 핵 매트릭스에 DNA 루프 염기 부착을 통해 염색체의 공간적 구성에서 역할을 하는 AT-풍부 서열이다. S/MAR은 종종 조절 구성요소 예컨대 프로모터, 인핸서, 및 DNA 복제 기원에 가깝게 발견된다. 하나 또는 S/MAR의 포함은 딸 세 포에서 에피솜으로서 비-바이러스 폴리뉴클레오티드 벡터를 유지시키도록 세포주기 당 1회 복제를 촉진할 수 있다. 구현예에서, S/MAR 서열은 비-바이러스 폴리뉴클레오티드 벡터에 포함된 활성적으로 전사된 폴리뉴클레오티드 (예를 들어, 본 발명의 하나 이상의 조작된 AAV 캡시드 폴리뉴클레오티드 또는 다른 폴리뉴클레오티드 또는 분자)의 하류에 위치된다. 일부 구현예에서, S/MAR은 베타-인터페론 유전자 클러스터로부터의 S/MAR일 수 있다. 하기 문헌들을 참조하고, 이의 기술 및 벡터는 본 발명에서 사용을 위해 적합화될 수 있다: Verghese et al. 2014. Nucleic Acid Res. 42:e53; Xu et al. 2016. Sci. China Life Sci. 59:1024-1033; Jin et al. 2016. 8:702-711; Koirala et al. 2014. Adv. Exp. Med. Biol. 801:703-709; and Nehlsen et al. 2006. Gene Ther. Mol. Biol. 10:233-244.

일부 구현예에서, 비-바이러스 벡터는 트랜스포존 벡터 또는 이의 시스템이다. 본 명세서에서 사용되는, "트랜스포존" (운반가능한 구성요소라고도 함)은 게놈에서의 위치를 다른 곳으로 이동시킬 수 있는 폴리뉴클레오티드 서열을 의미한다. 몇 클래스의 트랜스포존이 존재한다. 트랜스포존은 레트로트랜스포존 및 DNA 트랜스포존을 포함한다. 레트로트랜스포존은 새로운 게놈 또는 폴리뉴클레오티드로 폴리뉴클레오티드를 운반하기 위해서 이동 (또는 운반)되는 폴리뉴클레오티드의 전사를 요구한다. DNA 트랜스포존은 새로운 게놈 또는 폴리뉴클레오티드로 폴리뉴클레오티드를 운반하기 위해 이동 (또는 운반)되는 폴리뉴클레오티드의 역 전사를 요구하지 않는 것이다. 일부 구현예에서, 비-바이러스 폴리뉴클레오티드 벡터는 레트로트랜스포존 벡터일 수 있다. 일부 구현예에서, 레트로트랜스포존 벡터는 긴 말단 반복부를 포함한다. 일부 구현예에서, 레트로트랜스포존 벡터는 긴 말단 반복부를 포함하지 않는다. 일부 구현예에서, 비-바이러스 폴리뉴클레오티드 벡터는 DNA 트랜스포존 벡터일 수 있다. DNA 트랜스포존 벡터는 트랜스포사제를 코딩하는 폴리뉴클레오티드 서열을 포함할 수 있다. 일부 구현예에서, 트랜스포존 벡터는 비-자율 트랜스포존 벡터로서 구성되고, 전위가 그 자체로 자발적으로 일어나지 않는다는 것을 의미한다. 이들 구현예의 일부에서, 트랜스포존 벡터는 전위에 요구되는 단백질을 코딩하는 하나 이상의 폴리뉴클레오티드 서열이 결여된다. 일부 구현예에서, 비-자율 트랜스포존 벡터는 하나 이상의 Ac 구성요소가 결여된다.

일부 구현예에서 비-바이러스 폴리뉴클레오티드 트랜스포존 벡터 시스템은 트랜스포존 말단 반전 반복부 (TIR)가 5' 및 3' 말단 상에서 측접된 본 발명의 조작된 AAV 캡시드 폴리뉴클레오티드(들) 또는 다른 폴리뉴클레오티드, 또는 분자를 함유하는 제1 폴리뉴클레오티드 벡터, 및 트랜스포사제의 발현을 구동하도록 프로모터에 커플링된 트랜스포사제를 코딩할 수 있는 폴리뉴클레오티드를 포함하는 제2 폴리뉴클레오티드 벡터를 포함할 수 있다. 둘 모두 동일한 세포에서 발현될 때 트랜스포사제는 제2 벡터로부터 발현될 수 있고, 제1 벡터 상의 TIR 사이에서 물질 (예를 들어, 본 발명의 조작된 AAV 캡시드 폴리뉴클레오티드(들) 또는 다른 폴리뉴클레오티드 또는 분자)을 운반할 수 있고 숙주 세포 게놈 내 하나 이상의 위치에 통합된다. 일부 구현예에서 랜스포존 벡터 또는 이의 시스템은 유전자 트랩으로서 구성될 수 있다. 일부 구현예에서, 강력한 스플라이스 억셉터 부위가 측접하고 이어서 리포터 및/또는 다른 유전자 (예를 들어, 본 발명의 하나 이상의 조작된 AAV 캡시드 폴리뉴클레오티드(들) 또는 다른 폴리뉴클레오티드 또는 분자) 및 강력한 폴리 A 꼬리부가 후속되도록 구성될 수 있다. 이러한 벡터 또는 이의 시스템을 사용하면서 전위가 일어날 때, 트랜스포존은 유전자의 인트론에 삽입될 수 있고, 삽입된 리포터 또는 다른 유전자는 잘못된 스플라이싱 과정을 유발하여 그 결과로 트랩된 유전자를 활성화시킬 수 있다.

임의의 적합한 트랜스포존 시스템이 사용될 수 있다. 적합한 트랜스포존 및 이의 시스템은 슬리핑 뷰티 트랜스포존 시스템 (Tc1/mariner 수퍼패밀리) (참조: 예를 들어, Ivics et al. 1997. Cell. 91(4): 501-510), piggyBac (piggyBac 수퍼패밀리) (참조: 예를 들어, Li et al. 2013 110(25): E2279-E2287 and Yusa et al. 2011. PNAS. 108(4): 1531-1536), Tol2 (수퍼패밀리 hAT), Frog Prince (Tc1/mariner 수퍼패밀리) (참조: 예를 들어, Miskey et al. 2003 Nucleic Acid Res. 31(23):6873-6881) 및 이의 변이체를 포함할 수 있다.

화학적 담체

일부 구현예에서, 본 명세서에 기술된 본 발명의 조작된 AAV 캡시드 폴리뉴클레오티드(들) 또는 다른 폴리뉴클레오티드 또는 다른 분자는 화학적 담체에 커플링될 수 잇다. 폴리뉴클레오티드의 전달에 적합할 수 있는 화학 담체는 하기 클래스로 광범위하게 분류될 수 잇다: (i) 무기 입자, (ii) 지질-기반, (iii) 중합체-기반, 및 (iv) 펩티드 기반. 그들은 (1) 폴리뉴클레오티드 (예컨대 본 발명의 조작된 AAV 캡시드 폴리뉴클레오티드(들))와 축합 복합체를 형성할 수 있는 것, (2) 표적화 특이적 세포를 표적화할 수 있는 것, (3) 숙주 세포의 핵 또는 시토졸로 폴리뉴클레오티드 또는 다른 분자 (예컨대 본 발명의 조작된 AAV 캡시드 폴리뉴클레오티드(들))의 전달을 증가시킬 수 있는 것, (4) 숙주 세포의 시토졸에서 DNA/RNA로부터 분해될 수 있는 것, 및 (5) 지속 또는 제어 방출할 수 있는 것으로 분류될 수 있다. 임의의 하나의 소정 화학 담체는 다수 범주로부터의 특징으로 포함할 수 있다는 것을 이해할 것이다. 본 명세서에서 사용되는 용어 "입자"는 본 명세서에 기술된 본 발명의 조성물 (본 명세서에 기술된 입자, 폴리펩티드, 폴리뉴클레오티드, 및 다른 조성물 포함)의 전달을 위한 임의의 적합 크기의 입자를 의미한다. 적합한 크기는 마크로-, 마이크로-, 및 나노-크기 입자를 포함한다.

일부 구현예에서, 비-바이러스 담체는 무기 입자일 수 있다. 일부 구현예에서, 무기 입자는 나노입자일 수 있다. 무기 입자는 크기, 형상, 및/또는 다공성을 다양화하여 구성 및 최적화될 수 있다. 일부 구현예에서, 무기 입자는 세망 내피 시스템으로부터 탈출하도록 최적화될 수 있다. 일부 구현예에서, 무기 입자는 분해로부터 포획된 분자를 보호하기 위해 최적화될 수 있다. 이러한 상황에서 비-바이러스 담체로서 사용할 수 있는 적합한 무기 입자는 칼슘 포스페이트, 실리카, 금속 (예를 들어, 금, 플래티늄, 은, 팔라듐, 로듐, 오스뮴, 이리듐, 루데튬, 수은, 구리, 레늄, 티타늄, 니오븀 탄탈륨, 및 이의 조합), 자성 화합물, 입자, 및 물질 (예를 들어, 초성 철 산화물 및 자철광), 퀀텀 도트, 플러렌 (예를 들어, 탄소 나노입자, 나노튜브, 나노스트링 등), 및 이의 조합을 포함하지만, 이에 제한되지 않는다. 다른 적합한 무기 비-바이러스 담체가 본 명세서의 다른 곳에 논의된다.

일부 구현예에서, 비-바이러스 담체는 지질-기반일 수 있다. 적합한 지질-기반 담체는 또한 본 명세서에서 보다 상세히 기술된다. 일부 구현예에서, 지질-기반 담체는 전달하려는 폴리뉴클레오티드 (예를 들어, 예컨대 본 발명의 조작된 AAV 캡시드 폴리뉴클레오티드) 상의 음전하에 결합할 수 있거나 또는 상호작용할 수 있는 양이온 지질 또는 양쪽성 지질을 포함한다. 일부 구현예에서, 화확적 비-바이러스 담체 시스템은 폴리뉴클레오티드 (예컨대, 본 발명의 조작된 AAV 캡시드 폴리뉴클레오티드(들)) 또는 다른 조성물 또는 분자) 및 지질 (예컨대 양이온 지질)을 포함할 수 있다. 이들은 또한 당분야에서 리포플렉스라고 한다. 리포플렉스의 다른 구현예는 본 명세서의 다른 곳에 기술된다. 일부 구현예에서, 비-바이러스 지질-기반 담체는 지질 나노 에멀션일 수 있다. 지질 나노 에멀션은 다른 안정화된 유화제 중에 비혼화성 액체의 분산을 통해 형성될 수 있고 전달하려는 폴리뉴클레오티드 (예를 들어, 본 발명의 조작된 AAV 캡시드 폴리뉴클레오티드(들))를 함유할 수 있는 지질, 물, 및 계며활성제로 구성된 약 20 nm의 입자를 가질 수 있다. 일부 구현예에서, 지질-기반 비-바이러스 담체는 고형 지질 입자 또는 나노입자일 수 있다.

일부 구현예에서, 비-바이러스 담체는 펩티드-기반일 수 있다. 일부 구현예에서, 펩티드-기반 비-바이러스 담체는 하나 이상의 양이온 아미노산을 포함할 수 있다. 일부 구현예에서, 아미노산 중 35 내지 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 99 또는 100%는 양이온이다. 일부 구현예에서, 펩티드 담체는 다른 유형의 담체 (예를 들어, 이들 담체를 작용화하기 위한 중합체-기반 담체 및 지질-기반 담체)와 함께 사용될 수 있다. 일부 구현예에서, 작용화는 숙주 세포를 표적화한다. 중합체-기반 비-바이러스 담체에 포함될 수 있는 적합한 중합체는 폴리에틸렌이민 (PEI), 키토산, 폴리(DL-락티드) (PLA), 폴리 (DL-락티드-코-글리코시드) (PLGA), 덴드리머 (예를 들어, 미국 특허 출원 공개 번호 제2017/0079916호를 참조하고, 이의 기술 및 조성물은 본 발명의 조작된 AAV 캡시드 폴리뉴클레오티드에 사용을 위해 적합화됨), 폴리메타크릴레이트, 및 이의 조합를 포함할 수 있지만, 이에 제한되지 않는다.

일부 구현예에서, 비-바이러스 담체는 외부 자극, 예컨대 pH, 온도, 삼투압, 특별한 분자 또는 조성물 (예를 들어, 칼슘, NaCl 등)의 농도, 압력 등에 반응하여 비-바이러스 담체와 회합되거나 또는 그에 부착되는 조작된 전달 시스템 폴리뉴클레오티드를 방출하도록 구성될 수 있다. 일부 구현예에서, 비-바이러스 담체는 본 명세서에 기술된 본 발명의 조작된 AAV 캡시드 폴리뉴클레오티드 또는 다른 조성물 중 하나 이상 및 환경적 촉발제 반응 구성요소, 및 임의로 촉발제를 포함하도록 구성된 입자일 수 있다. 일부 구현예에서, 입자는 폴리메타크릴레이트 및 폴리아크릴레이트의 군으로부터 선택될 수 있는 중합체를 포함할 수 있다. 일부 구현예에서, 비-바이러스 입자는 미국 특허 출원 공개 번호 제20150232883호 및 제20050123596호에 기술된 조성물 마이크로입자의 하나 이사의 구현예를 포함할 수 있고, 이의 기술 및 조성물은 본 발명에서 사용을 위해 적합화될 수 있다.

일부 구현예에서, 비-바이러스 담체는 중합체-기반 담체일 수 있다. 일부 구현예에서, 중합체은 양이온이거나 또는 주로 양이온이어서 전달하려는 음으로 하전된 폴리뉴클레오티드 (예컨대 본 발명의 조작된 AAV 캡시드 폴리뉴클레오티드(들))와 전하-의존적 방식으로 상호작용할 수 있다. 중합체-기반 시스템은 본 명세서의 다른 곳에 더 상세히 기술된다.

바이러스 벡터

일부 구현예에서, 벡터는 바이러스 벡터이다. 이러한 상황에서 본 명세서에서 사용되는 용어 "바이러스 벡터"는 폴리뉴클레오티드, 예컨대 본 발명의 조작된 AAV 캡시드 폴리뉴클레오티드, 카고, 또는 다른 조성물 또는 분자를 바이러스 입자에서 발현할 수 있고 그에 패키징될 수 있으며 하나 이상의 다른 바이러스 벡터 (예컨대, 바이러스 벡터 시스템에서)과 함께 또는 단독으로 사용될 때 상기 바이러스 입자를 생산할 수 잇는 바이러스의 하나 이상의 구성요소를 기반으로 하거나 또는 그로부터의 하나 이상의 구성요소를 함유하는 폴리뉴클레오티드 기반 벡터를 의미한다. 바이러스 벡터 및 이의 시스템은 본 명세서에 기술된 본 발명의 하나 이상의 조성물 (제한없이, 임의의 바이러스 입자 및 회합된 카코 포함)의 절달 및/또는 발현 및/또는 생성을 위한 바이러스 입자를 생성시키는데 사용될 수 있다. 바이러스 벡터는 다수 벡터를 포함하는 바이러스 벡터 시스템의 일부일 수 있다. 일부 구현예에서, 다수 바이러스 벡터를 도입시키는 시스템은 이들 시스템의 안전성을 증가시킬 수 있다. 적합한 바이러스 벡터는 아데노바이러스-기반 벡터, 아데노 연관 벡터, 헬퍼-의존적 아데노바이러스 (HdAd) 벡터, 하이브리드 아데노바이러스 벡터 등을 포함할 수 있다. 그로부터 생산되는 바이러스 벡터 및 바이러스 입자의 다른 구현예는 본 명세서의 다른 곳에 기술된다. 일부 구현예에서, 바이러스 벡터는 이들 시스템의 개선된 안전성을 위해서 복제 불능 바이러스 입자를 생산하도록 구성된다.

아데노바이러스 벡터, 헬퍼-의존적 아데노바이러스 벡터, 및 하이브리드 아데노바이러스 벡터

일부 구현예에서, 벡터는 아데노바이러스 벡터일 수 있다. 일부 구현예에서, 아데노바이러스 벡터는 벡터 또는 이의 시스템을 사용해 생산된 바이러스 입자가 혈청형 2, 5, 또는 9일 수 있도록 구성요소를 포함할 수 있다. 일부 구현예에서, 아데노바이러스 입자를 통해서 전달하려는 폴리뉴클레오티드는 최대 약 8 kb일 수 있다. 따라서, 일부 구현예에서, 아데노바이러스 벡터는 약 0.001 kb 내지 약 8 kb 크기의 범위일 수 있는 전달하려는 DNA 폴리뉴클레오티드를 포함할 수 있다. 아데노바이러스 벡터는 몇몇 문헌에서 성공적으로 사용되었다 (참조: 예를 들어, Teramato et al. 2000. Lancet. 355:1911-1912; Lai et al. 2002. DNA Cell. Biol. 21:895-913; Flotte et al., 1996. Hum. Gene. Ther. 7:1145-1159; 및 Kay et al. 2000. Nat. Genet. 24:257-261). 조작된 AAV 캡시드는 상기 조작된 AAV 캡시드를 함유하는 아데노바이러스 입자를 생산하도록 아데노바이러스 벡터에 포함될 수 있다.

일부 구현예에서 벡터는 헬퍼-의존적 아데노바이러스 벡터 또는 이의 시스템일 수 있다. 이들은 또한 유전자 미함유 ("gutless" 또는 "gutted") 벡터로서 당분야에서 지칭되고, 아데노바이러스 벡터의 변형된 세대이다 (참조: 예를 들어, Thrasher et al. 2006. Nature. 443:E5-7). 헬퍼-의존적 아데노바이러스 벡터 시스템의 구현예에서, 하나의 벡터 (헬퍼)는 복제에 필요한 모든 바이러스 유전자를 함유할 수 있지만 패키징 도메인에서 조건적 유전자 결함을 함유한다. 시스템의 제2 벡터는 세포로부터 선택적 패키징된 방출을 허용할 수 있도록, 오직 바이러스 게놈, 하나 이상의 조작된 AAV 캡시드 폴리뉴클레오티드, 및 천연 패키징 인식 신호의 말단만을 함유할 수 있다 (참조: 예를 들어, Cideciyan et al. 2009. N Engl J Med. 361:725-727). 헬퍼-의존적 아데노바이러스 벡터 시스템은 몇몇 문헌에서 유전자 전달에 성공적이었다 (참조: 예를 들어, Simonelli et al. 2010. J Am Soc Gene Ther. 18:643-650; Cideciyan et al. 2009. N Engl J Med. 361:725-727; Crane et al. 2012. Gene Ther. 19(4):443-452; Alba et al. 2005. Gene Ther. 12:18-S27; Croyle et al. 2005. Gene Ther. 12:579-587; Amalfitano et al. 1998. J. Virol. 72:926-933; 및 Morral et al. 1999. PNAS. 96:12816-12821). 이들 공개물에서 기술되는 기술 및 벡터는 본 명세서에 기술된 조작된 AAV 캡시드 폴리뉴클레오티드의 포함 및 전달에 적합화될 수 있다. 일부 구현예에서, 헬퍼-의존적 아데노바이러스 벡터 또는 이의 시스템으로부터 생산된 바이러스 입자를 통해서 전달하려는 폴리뉴클레오티드는 최대 약 38 kb일 수 있다. 따라서, 일부 구현예에서, 아데노바이러스 벡터는 약 0.001 kb 내지 약 37 kb 크기 범위일 수 있는 전달하려는 DNA 폴리뉴클레오티드를 포함할 수 있다 (참조: 예를 들어, Rosewell et al. 2011. J. Genet. Syndr. Gene Ther. Suppl. 5:001).

일부 구현예에서, 벡터는 하이브리드-아데노바이러스 벡터 또는 이의 시스템이다. 하이브리드 아데노바이러스 벡터는 유전자-결실 아데노바이러스 벡터의 높은 형질도입 효율 및 아데노-연관, 레트로바이러스, 렌티바이러스, 및 트랜스포존 기반-유전자 전달의 장기간 게놈-통합 가능성으로 구성된다. 일부 구현예에서, 이러한 하이브리드 벡터 시스템은 안정한 형질도입 및 제한된 통합 부위를 일으킬 수 있다. 예를 들어, 하기 문헌을 참조하고, 이의 기술 및 본 명세서에 기술된 벡터는 본 발명의 조작된 AAV 캡시드 시스템에서 사용을 위해 변형 및 적합화될 수 있다: Balague et al. 2000. Blood. 95:820-828; Morral et al. 1998. Hum. Gene Ther. 9:2709-2716; Kubo and Mitani. 2003. J. Virol. 77(5): 2964-2971; Zhang et al. 2013. PloS One. 8(10) e76771; 및 Cooney et al. 2015. Mol. Ther. 23(4):667-674). 일부 구현예에서, 하이브리드-아데노바이러스 벡터는 레트로바이러스 및/또는 아데노-연관 바이러스의 하나 이상의 특성을 포함할 수 있다. 일부 구현예에서 하이브리드-아데노바이러스 벡터는 스푸마 레트로바이러스 또는 포미 바이러스 (FV)의 하나 이상의 특성을 포함할 수 있다. 예를 들어, 하기 문헌을 참조하고, 이의 기술 및 본 명세서에 기술된 벡터는 본 발명의 조작된 AAV 캡시드 시스템에서 사용을 위해 변형 및 적합화될 수 있다: 예를 들어, Ehrhardt et al. 2007. Mol. Ther. 15:146-156 및 Liu et al. 2007. Mol. Ther. 15:1834-1841. 하이브리드-아데노바이러스 벡터 또는 이의 시스템에서 FV로부터의 하나 이상의 특성을 사용하는 장점은 광범위 세포를 감염시키는 그로부터 생산된 바이러스 입자의 능력, 다른 레트로바이러스와 비교하여 큰 패키징 능력, 및 휴기 (비-분열) 세포에서 지속되는 능력을 포함할 수 있다. 또한, 하기 문헌을 참조하고, 그 기술 및 본 명세서에 기술된 벡터는 본 명세서의 조작된 AAV 캡시드 시스템에서 사용을 위해 변형 및 조작될 수 있다: Ehrhardt et al. 2007. Mol. Ther. 156:146-156 및 Shuji et al. 2011. Mol. Ther. 19:76-82.

아데노 연관 벡터

일 구현예에서, 조작된 벡터 또는 이의 시스템은 아데노-연관 벡터 (AAV)일 수 있다. 예를 들어, 하기 문헌을 참조한다: West et al., Virology 160:38-47 (1987); 미국 특허 제4,797,368호; WO 93/24641; Kotin, Human Gene Therapy 5:793-801 (1994); 및 Muzyczka, J. Clin. Invest. 94:1351 (1994). 그들 특성 중 일부가 아데노바이러스 벡터와 유사하지만, AAV는 그들 복제 및/또는 병원성에 일부 결함을 가져서, 아데노바이러스 벡터에 비해서 더 안전할 수 있다. 일부 구현예에서 AAV는 관찰가능한 부작용없이 인간 세포의 염색체 19 상의 특이적 부위에 통합될 수 있다. 일부 구현예에서, AAV 벡터, 이의 시스템, 및/또는 AAV 입자의 수용능은 최대 약 4.7 kb일 수 있다. AAV 벡터 또는 이의 시스템은 본 명세서에 기술된 하나 이상의 조작된 캡시드 폴리뉴클레오티드를 포함할 수 있다.

AAV 벡터 또는 이의 시스템은 하나 이상의 조절 분자를 포함할 수 있다. 일부 구현예에서 조절 분자는 프로모터, 인핸서, 억제인자 등일 수 있고, 본 명세서의 다른 곳에서 더 상세히 설명된다. 일부 구현예에서, AAV 벡터 또는 이의 시스템은 하나 이상의 조절 단백질을 코딩할 수 있는 하나 이상의 폴리뉴클레오티드를 포함할 수 있다. 일부 구현예에서, 하나 이상의 조절 단백질은 Rep78, Rep68, Rep52, Rep40, 이의 변이체, 및 이의 조합으로부터 선택될 수 있다. 일부 구현예에서, 프로모터는 이전에 논의된 조직 특이적 프로모터일 수 있다. 일부 구현예에서, 조직 특이적 프로모터는 본 명세서에 기술된 조작된 캡시드 AAV 캡시드 폴리뉴클레오티드의 발현을 구동할 수 있다.

AAV 벡터 또는 이의 시스템은 하나 이상의 캡시드 단백질, 예컨대 본 명세서의 다른 곳에 기술된 조작된 AAV 캡시드 단백질을 코딩할 수 있는 하나 이상의 폴리뉴클레오티드를 포함할 수 있다. 조작된 캡시드 단백질은 AAV 바이러스의 단백질 쉘 (조작된 캡시드)에 조립될 수 있다. 조작된 캡시드는 세포-, 조직-, 및/또는 장기-특이적 향성을 가질 수 있다.

일부 구현예에서, AAV 벡터 또는 이의 시스템은 하나 이상의 아데노바이러스 헬퍼 인자 또는 하나 이상의 아데노바이러스 헬퍼 인자를 코딩할 수 있는 폴리뉴클레오티드를 포함할 수 있다. 이러한 아데노바이러스 헬퍼 인자는 제한없이, E1A, E1B, E2A, E4ORF6, 및 VA RNA를 포함할 수 있다. 일부 구현예에서, 숙주 세포주의 생산은 아데노바이러스 헬퍼 인자 중 하나 이상을 발현한다.

AAV 벡터 또는 이의 시스템은 특이적 혈청형을 갖는 AAV 입자를 생산하도록 구성될 수 있다. 일부 구현예에서, 혈청형은 AAV-1, AAV-2, AAV-3, AAV-4, AAV-5, AAV-6, AAV-8, AAV-9 또는 이의 임의 조합일 수 있다. 일부 구현예에서, AAV는 AAV1, AAV-2, AAV-5, AAV-9 또는 이의 임의 조합일 수 있다. 표적화하려는 세포에 대해서 AAV 중 AAV를 선택할 수 있고, 예를 들어, 뇌 및/또는 뉴런 세포를 표적화하기 위해서 AAV 혈청형 1, 2, 5, 9 또는 하이브리드 캡시드 AAV-1, AAV-2, AAV-5, AAV-9 또는 이의 임의 조합을 선택할 수 있고; 심장 조직으리 표적화하기 위해 AAV-4를 선택할 수 있고; 간에 전달을 위해서 AAV-8을 선택할 수 있다. 따라서, 일부 구현예에서, 뇌 및/또는 뉴런 세포를 표적화할 수 있는 AAV 입자를 생산할 수 있는 AAV 벡터 또는 이의 시스템은 혈청형 1, 2, 5 또는 하이브리드 캡시드 AAV-1, AAV-2, AAV-5 또는 이의 임의 조합을 갖는 AAV 입자를 생성시키도록 구성될 수 있다. 일부 구현예에서, 심장 조직을 표적화할 수 있는 AAV 입자를 생산할 수 있는 AAV 벡터 또는 이의 시스템은 AAV-4 혈청형을 갖는 AAV 입자를 생성시키도록 구성될 수 있다. 일부 구현예에서, 간을 표적화할 수 있는 AAV 입자를 생산할 수 있는 AAV 벡터 또는 이의 시스템은 AAV-8 혈청형을 갖는 AAV를 생성시키도록 구성될 수 있다. 예를 들어, [Srivastava. 2017. Curr. Opin. Virol. 21:75-80]를 참조한다.

상이한 혈청형이 세포, 조직, 및/또는 장기 특이성의 일부 수준을 제공할 수 있지만, 각각의 혈청형은 여전히 다중-향성이고, 따라서 혈청형이 형질도입에서 효율이 적은 조직을 표적화하기 위해 그 혈청형을 사용하면 조직-독성을 일으킬 수 있다는 것을 이해할 것이다. 따라서, 특정 혈청형의 AAV 선택을 통해서 일부 조직 표적화 수용능이외에도, AAV 혈청형의 향성은 본 명세서에 기술된 조작된 AAV 캡시드에 의해 변형될 수 있다는 것을 이해할 것이다. 본 명세서의 다른 곳에 기술된 바와 같이, 임의 혈청형의 야생형 AAV의 변이체는 본 명세서에 기술된 방법을 통해서 생성될 수 있고 기준 야생형 AAV 혈청형의 것과 동일할 수 있거나 또는 상이할 수 있는, 특정 세포-특이적 향성을 갖는 것으로 결정될 수 있다. 일부 구현예에서, 야생형 혈청형의 세포, 조직, 및/또는 특이성은 증강될 수 있다 (예를 들어, 혈청형이 이미 편향된 특정 세포 유형에 더 선택적이거나 또는 특이적으로 만듬). 예를 들어, 야생형 AAV-9는 인간에서 근육 및 뇌에 편향된다 (참조: 예를 들어, Srivastava. 2017. Curr. Opin. Virol. 21:75-80). 본 명세서에 기술된 야생형 AAV-9의 조작된 AAV 캡시드 및/또는 캡시드 단백질 변이체를 포함하여서, 예를 들어, 뇌에 대한 편향성은 감소 또는 제거될 수 있고/있거나 근육 부패성이 증가되어서 뇌 특이성은 비교하여 감소되는 것으로 보이므로, 야생형 AAV-9와 비교하여 근육에 대한 특이성을 증강시킨다. 이전에 언급된 바와 같이, 야생형 AAV 혈청형의 조작된 캡시드 및/또는 캡시드 단백질 변이체의 포함은 야생형 기준 AAV 혈청형과 상이한 향성을 가질 수 있다. 예를 들어, AAV-9의 조작된 AAV 캡시드 및/또는 캡시드 단백질 변이체는 인간에서 근육 또는 뇌 이외의 조직에 대한 특이성을 가질 수 있다.

일부 구현예에서, AAV 벡터는 하이브리드 AAV 벡터 또는 이의 시스템이다. 하이브리드 AAV는 적어도 하나의 상이한 혈청형으로부터 유래된 캡시드에 패키징되는 하나의 혈청형으로부터의 구성요소와 게놈을 포함하는 AAV이다. 예를 들어, 생산하려는 것이 rAAV2/5이고, 생산 방법은 상기 논의된 헬퍼-무함유, 일시적 형질감염 방법을 기반으로 하면, 제1 플라스미드 및 제3 플라스미드 (아데노 헬퍼 플라스미드)는 rAAV2 생산에 대해 논의된 것과 동일할 것이다. 그러나, 제2 플라스미드, pRepCap는 상이할 것이다. pRep2/Cap5라고 하는, 이러한 플라스미드에서, Rep 유전자는 여전히 AAV2로부터 유래되는 한편, Cap 유전자는 AAV5로부터 유래된다. 생산 계획은 AAV2 생산을 위해 상기 언급된 접근법과 동일하다. 최종 rAAV는 rAAV2/5라고 하는데, 게놈이 재조합 AAV2를 기반으로 하는 한편, 캡시드는 AAV5를 기반으로 한다. 이러한 AAV2/5 하이브리드 바이러스에 의해 디스플레이되는 세포 또는 조직-향성은 AAV5의 것과 동일해야 한다고 가정된다. 야생형 하이브리드 AAV 입자는 이전에 논의된 비-하이브리드 야생형 혈청형과 동일한 특이성 문제를 겪는다는 것을 이해할 것이다.

야생형 기반 하이브리드 AAV 시스템에 의해 획득되는 장점은 조작된 AAV 캡시드로 획득될 수 있는 증가되고 맞춤화가능한 세포-특이성과 조합될 수 있고 본 명세서의 다른 곳에 기술된 조작된 AAV 캡시드를 포함할 수 있는 하이브리드 AAV를 생성시켜서 조합될 수 있다. 하이브리드 AAV는 조작된 AAV 캡시드가 그의 변이체인 기준 야생형 혈청형과 상이한 혈청형으로부터의 구성요소와 게놈을 함유하는 조작된 AAV 캡시드를 함유할 수 있다는 것을 이해할 것이다. 예를 들어, 하이브리드 AAV는 AAV-2 혈청형으로부터의 성분 (예를 들어, rep 구성요소)를 함유하는 게놈을 패키징하는데 사용되는 AAV-9 혈청형의 변이체인 조작된 AAV 캡시드를 포함하는 것이 생산될 수 있다. 이전에 논의된 야생형 기반 하이브리드 AAV와 마찬가지로, 최종 AAV 입자의 향성은 조작된 AAV 캡시드의 것일 것이다.

이들 세포에 대한 일정 야생형 AAV 혈청형의 표는 [Grimm, D. et al, J. Virol. 82: 5887-5911 (2008)]에서 확인할 수 있고 하기 표 1에 재현하였다. 추가 향성 상세 사항은 이전에 논의된 바와 같이 [Srivastava. 2017. Curr. Opin. Virol. 21:75-80]에서 확인할 수 있다.

일부 구현예에서, AAV 벡터 또는 이의 시스템은 AAV rh.74 또는 AAV rh.10이다.

일부 구현예에서, AAV 벡터 또는 이의 시스템은 레트로바이러스 벡터와 함께 기술된 것과 유사하게 "유전자 미함유 (gutless)" 벡터로서 구성된다. 일부 구현예에서, "유전자 미함유" AAV 벡터 또는 이의 시스템은 게놈 증폭 및 관심 이종성 서열 (예를 들어, 조작된 AAV 캡시드 폴리뉴클레오티드(들))과 연결한 패키징에 관여되는 시스-작용성 바이러스 DNA 구성요소를 가질 수 있다.

벡터 구축

본 명세서에 기술된 벡터는 임의의 적합한 과정 또는 기술을 사용하여 구축될 수 있다. 일부 구현예에서, 하나 이상의 적합한 재조합 및/또는 클로닝 방법 또는 기술이 본 명세서에 기술된 벡터(들)에 사용될 수 있다. 적합한 재조합 및/또는 클로닝 기술 및/또는 방법은 미국 특허 출원 공개 번호 제2004-0171156 A1호에 기술된 것을 포함할 수 있지만, 이에 제한되지 않는다. 다른 적합한 방법 및 기술은 본 명세서의 다른 곳에 기술된다.

재조합 AAV 벡터의 구축은 하기를 포함한, 다수의 공개물에 기술된다: 미국 특허 제5,173,414호; Tratschin et al., Mol. Cell. Biol. 5:3251-3260 (1985); Tratschin, et al., Mol. Cell. Biol. 4:2072-2081 (1984); Hermonat & Muzyczka, PNAS 81:6466-6470 (1984); 및 Samulski et al., J. Virol. 63:03822-3828 (1989). 임의의 기술 및/또는 방법은 본 명세서에 기술된 AAV 및/또는 다른 벡터를 구축하기 위해 사용 및/또는 적합화될 수 있다. AAV 벡터는 본 명세서의 다른 곳에 논의된다.

일부 구현예에서, 벡터는 하나 이상의 삽입 부위, 예컨대 제한 엔도뉴클레아제 인식 서열 (또한 "클로닝 부위"를 지칭함)을 가질 수 있다. 일부 구현예에서, 하나 이상의 삽입 부위 (예를 들어, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 이상의 삽입 부위)는 하나 이상의 벡터의 하나 이상의 서열 구성요소의 상류 및/또는 하류에 위치된다.

본 명세서에 기술된 조작된 AAV 캡시드 시스템의 하나 이상의 구성요소의 발현을 위한 전달 비히클, 벡터, 입자, 나노입자, 제제 및 이의 성분은 전술한 문헌, 예컨대 국제 특허 출원 공개 번호 WO 2014/093622 (PCT/US2013/074667)처럼 사용되고 본 명세서에 더 상세히 논의된다.

바이러스 벡터로부터 바이러스 입자 생산

AAV 입자 생산

아데노바이러스 헬퍼 인자가 제공되는 방법 (헬퍼 대 헬퍼 무함유)에 의존하여, 본 명세서에 기술된 것과 같은, AAV 벡터 및 이의 시스템으로부터 AAV 입자를 생산하기 위한 2개 주요 전략이 존재한다. 일부 구현예에서, AAV 벡터 및 이의 시스템으로부터 AAV 입자를 생산하는 방법은 최종 AAV 입자 (예를 들어, 조작된 AAV 캡시드 폴리뉴클레오티드(들))에 의해 패키징하여 전달하려는 폴리뉴클레오티드를 함유하는 AAV 벡터와 함께 AAV 복제 및 캡시드 코딩 폴리뉴클레오티드를 안정하게 보유하는 세포주로 아데노바이러스 감염을 포함할 수 있다. 일부 구현예에서, AAV 벡터 및 이의 시스템으로부터 AAV 입자를 생산하는 방법은 "헬퍼 무함유" 방법일 수 있는데, 3개 벡터 (예를 들어, 플라스미드 벡터)로 적절한 생산 세포주의 공-형질감염을 포함한다: (1) 2 ITR 사이에 관심 폴리뉴클레오티드 (예를 들어, 조작된 AAV 캡시드 폴리뉴클레오티드(들))를 함유하는 AAV 벡터; (2) AAV Rep-Cap을 코딩하는 폴리뉴클레오티드를 보유하는 벡터; 및 (3) 헬퍼 폴리뉴클레오티드. 당업자는 헬퍼 및 헬퍼-무함유인 다양한 방법 및 이의 별형을 비롯하여 각 시스템의 상이한 장점을 이해할 것이다.

본 명세서에 기술된 조작된 AAV 벡터 및 이의 시스템은 임의의 이들 방법으로 생산될 수 있다.

벡터 및 바이러스 입자 전달

본 명세서에 기술된 벡터 (비-바이러스 담체 포함)는 숙주 세포로 도입되어서 전사물, 본 명세서에 기술된 바와 같은 핵산에 의해 코딩되는 융합 단백질 또는 펩티드 (예를 들어, 조작된 AAV 캡시드 시스템 전사물, 단백질, 효소, 이의 돌연변이체 형태, 이의 융합 단백질 등)를 포함하는, 단백질, 또는 펩티드, 및 바이러스 입자 (예컨대, 바이러스 벡터 및 이의 시스템 유래)를 생산할 수 있다.

하나 이상의 조작된 AAV 캡시드 폴리뉴클레오티드는 이전에 기술된 바와 같은 아데노 연관 바이러스 (AAV), 아데노바이러스 또는 다른 플라스미드 또는 바이러스 벡터 유형을 사용하고, 특히 예를 들어, 미국 특허 제8,454,972호 (아데노바이러스용 제제, 용량), 제8,404,658호 (AAV용 제제, 용량) 및 제5,846,946호 (DNA 플라스미드용 제제, 용량) 및 임상 시험 및 렌티바이러스, AAV 및 아데노바이러스를 포함하는 임상 시험 및 그 임상 시험에 대한 공개물로부터의 제제 및 용량을 사용하여 전달될 수 있다. 예를 들어, AAV 경우, 투여 경로, 제제 및 용량은 미국 특허 제8,454,972호에 기술된 바와 같을 수 있고, AAV를 포함하는 임상 시험에서와 같을 수 있다. 아데노바이러스 경우, 투여 경로, 제제 및 용량은 미국 특허 제8,404,658호 및 아데노바이러스를 포함하는 임상 시험에서와 같을 수 있다.

플라스미드 전달을 위해서, 투여 경로, 제제, 및 용량은 미국 특허 제5,846,946호 및 플라스미드를 포함하는 임상 연구에서와 같을 수 있다. 일부 구현예에서, 용량은 평균 70 kg 개체(예를 들어, 남성 성인 인간)에 기반하거나 또는 이에 대해 추론될 수 있고, 상이한 체중 및 종의 환자, 대상체, 포유동물에 대해 조절될 수 있다. 투여 빈도는 환자 또는 대상체의 연령, 성별, 일반적 건강상태, 다른 병태 및 처리될 특정 병태 또는 증상을 비롯한 보통의 인자에 따라서, 의학적 또는 수의학적 실행자 (예를 들어, 의사, 수의사)의 영역 내이다. 바이러스 벡터는 관심 조직 또는 세포에 주사될 수 있거나 또는 전달될 수 있다.

생체내 전달과 관련하여, AAV는 몇몇 이유, 예컨대 낮은 독성 (이것은 면역 반응을 활성화시킬 수 있는 세포 입자의 초-원심분리를 요구하지 않는 정제 방법에 기인할 수 있음) 및 숙주 게놈으로 통합되지 않기 때문에 삽입 돌연변이유발을 초래할 낮은 가능성에 대해서 다른 바이러스 벡터보다 유리하다.

본 명세서에 기술된 벡터(들) 및 바이러스 입자는 시험관내, 생체내, 및 또는 생체외에서 숙주 세포에 전달될 수 있다. 전달은 제한없이, 물리적 방법, 화학적 방법, 및 생물학적 방법을 포함한 임의의 적합한 방법을 통해서 일어날 수 있다. 물리적 전달 방법은 벡터의 세포내 전달을 촉진하도록 세포의 막 장벽에 대항하기 위해 물리적 힘을 적용하는 방법이다. 적합한 물리적 방법은 제한없이 바늘 (예를 들어, 주사), 탄도 폴리뉴클레오티드 (예를 들어, 입자 충격, 미세 발사체 유전자 전달, 및 유전자 총), 전기천공, 초음파천공, 광천공, 자성감염, 유체천공, 및 기계적 마사지를 포함한다. 화학적 방법은 세포로 벡터의 진입을 촉진하기 위해서 세포막 투과성 또는 다른 특징(들)의 변화를 유발하도록 화학물을 적용하는 방법이다. 예를 들어, 환경 pH는 세포막의 투과성에 변화를 유발할 수 있도록 변경될 수 있다. 생물학적 방법은 세포로 벡터 (담체 존재 또는 부재로)의 수송을 촉진하기 위해서 숙주 세포의 생물학적 과정 또는 생물학적 특징에 의존하고 그를 이용하는 것이다. 예를 들어, 벡터 및/또는 이의 담체는 세포로 벡터의 흡수를 촉진하도록 세포내이입 또는 세포내 유사한 과정을 자극할 수 있다.

입자를 통한 세포로 조작된 AAV 캡시드 시스템 성분 (예를 들어, 조작된 AAV 캡시드 및/또는 캡시드 단백질을 코딩하는 폴리뉴클레오티드)의 전달. 본 명세서에서 사용되는 용어 "입자"는 본 명세서에 기술된 조작된 AAV 캡시드 시스템 성분의 전달을 위한 임의의 적합한 크기 입자를 의미한다. 적합한 크기는 마크로-, 마이크로- 및 나노-크기 입자를 포함한다. 일부 구현예에서, 임의의 조작된 AAV 캡시드 시스템 성분 (예를 들어, 본 명세서에 기술된 폴리펩티드, 폴리뉴클레오티드, 벡터 및 이의 조합)은 본 명세서에 기술된 바와 같은 하나 이상의 입자 또는 성분에 부착, 커플링, 그와 통합, 달리 회합될 수 있다. 본 명세서에 기술된 입자는 절절한 경로 및/또는 기술을 통해 세포 또는 유기체에 투여될 수 있다. 일부 구현예에서, 입자 전달은 폴리뉴클레오티드 또는 벡터 성분의 전달을 위해 선택될 수 있고 유리할 수 있다. 구현예에서, 입자 전달은 또한 본 명세서의 다른 곳에 기술된 다른 조작된 캡시드 시스템 분자 및 제제를 위해 유리할 수 있다는 것을 이해할 것이다.

조작된 바이러스 (예를 들어, AAV) 캡시드를 포함하는 조작된 바이러스 입자

본 명세서는 또한 본 명세서의 다른 곳에 상세히 기술된 바와 같이 조작된 바이러스 입자 (또한 여기 및 본 명세서의 다른 곳에서 조작된 바이러스 캡시드 (예를 들어, "조작된 AAV 입자"라고 하는 AAV 캡시드)를 함유할 수 있는 "조작된 바이러스 입자"라고 함)를 기술한다. 조작된 AAV 입자는 이전에 기술된 바와 같은 적어도 하나의 조작된 AAV 캡시드 단백질을 함유하는 아데노바이러스-기반 입자, 헬퍼 아데노바이러스-기반 입자, AAV-기반 입자, 또는 하이브리드 아데노바이러스-기반 입자일 수 있다는 것을 이해할 것이다. 조작된 AAV 캡시드는 본 명세서의 다른 곳에서 기술된 바와 같은 하나 이상의 조작된 AAV 캡시드 단백질을 함유하는 것이다. 일부 구현예에서, 조작된 AAV 입자는 본 명세서에 기술된 1-60종의 조작된 AAV 캡시드 단백질을 포함한다. 일부 구현예에서, 조작된 AAV 입자는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 또는 60종의 조작된 캡시드 단백질을 함유할 수 있다. 일부 구현예에서, 조작된 AAV 입자는 0-59종 야생형 AAV 캡시드 단백질을 함유할 수 있다. 일부 구현예에서, 조작된 AAV 입자는 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 또는 59종의 야생형 AAV 캡시드 단백질을 함유할 수 있다. 조작된 AAV 입자는 따라서 이전에 기술된 바와 같은 하나 이상의 n-량체 모티프를 포함할 수 있다.

조작된 AAV 입자는 하나 이상의 카고 폴리뉴클레오티드를 포함할 수 있다. 카고 폴리뉴클레오티드는 본 명세서의 다른 곳에서 더욱 상세히 논의된다. 바이러스 및 비-바이러스 벡터로부터 조작된 AAV 입자를 제조하는 방법은 본 명세서의 다른 곳에 기술된다. 조작된 바이러스 입자를 함유하는 제제는 본 명세서의 다른 곳에 기술된다.

카고 폴리뉴클레오티드

카고는 또한 본 명세서의 다른 곳에 기술된다. 일부 구현예에서, 카고는 조작된 바이러스 입자에 패키징되어 이후 세포에 전달될 수 있는 카고 폴리뉴클레오티드이다. 일부 구현예에서, 전달은 근육 특이적이다. 조작된 바이러스 (예를 들어, AAV) 캡시드 폴리뉴클레오티드, 다른 바이러스 (예를 들어, AAV) 폴리뉴클레오티드(들), 및/또는 벡터 폴리뉴클레오티드는 하나 이상의 카고 폴리뉴클레오티드를 함유할 수 있다. 일부 구현예에서, 하나 이상의 카고 폴리뉴클레오티드는 조작된 바이러스 (예를 들어, AAV) 캡시드 폴리뉴클레오티드(들)에 작동적으로 연결될 수 있고 본 발명의 바이러스 (예를 들어, AAV) 시스템의 조작된 바이러스 (예를 들어, AAV) 게놈의 일부일 수 있다. 카고 폴리뉴클레오티드는 예를 들어, 세포에 전달될 수 있는 조작된 바이러스 (예를 들어, AAV) 입자에 패키징될 수 있다. 일부 구현예에서, 카고 폴리뉴클레오티드는 전달하려는 세포의 폴리뉴클레오티드 (예를 들어, 유전자 또는 전사물)을 변형시킬 수 있다. 본 명세서에서 사용되는, "유전자"는 염색체 상의 특정 위를 점유하고 유기체에서 특징(들) 또는 형질(들)에 대한 유전적 지시를 함유하는 DNA의 서열에 상응하는 유전적 단위를 의미할 수 있다. 용어 유전자는 게놈의 번역 및/또는 비번역 영역을 의미할 수 있다. "유전자"는 tRNA, siRNA, piRNA, miRNA, 긴-비-코딩 RNA 및 shRNA를 포함하지만, 이에 제한되지 않는, 촉매성 RNA 분자 또는 폴리펩티드로 번역될 수 있는 RNA 전사물로 전사되는 DNA의 특별한 서열을 의미한다. 폴리뉴클레오티드, 유전자, 전사물 등 변형은 제한없이, 유전자 편집을 비롯하여, 통상의 재조합 유전자 변형 기술 (예를 들어, 전체 또는 부분 유전자 삽입, 결실, 및 돌연변이유발법 (예를 들어, 삽입 및 결실 돌연변이유발법) 기술을 포함한, 모든 유전자 조작 기술을 포함한다.

일부 구현예에서, 카고 분자는 백신이거나 또는 백신을 코딩할 수 있는 폴리뉴클레오티드이다. 일부 구현예에서, 백신은 암에 대해 면역 반응을 자극할 수 있다. 일부 구현예에서, 백신은 직결장암 또는 췌장암에 대해 면역 반응을 자극할 수 있다. 일부 구현예에서, 백신은 hCG-생산 세포, 예컨대 hCG 생산 암 세포에 대해 불안정한 환경을 생성시킬 수 있다.

유전자 변형 카고 폴리뉴클레오티드

일부 구현예에서, 카고 분자는 단독으로 또는 시스템의 일부로서 전달될 때, 시스템의 다른 성분과 함께 전달되는지 여부와 무관하게, 전달되는 세포의 게놈, 에피게놈, 및/또는 전사체를 변형시키도록 작동되는 폴리뉴클레오티드 또는 폴리펩티드일 수 있다. 이러한 시스템은 CRISPR-Cas 시스템을 포함하지만, 이에 제한되지 않는다. 다른 유전자 변형 시스템, 예를 들어, TALEN, 아연 핑커 뉴클레아제, Cre-Lox, 모르폴리노 등은 그의 하나 이상의 성분이 본 명세서에 기술된 조작된 바이러스 (예를 들어, AAV) 입자에 의해 전달될 수 있는 다른 비-제한적인 예의 유전자 변형 시스템이다.

일부 구현예에서, 카고 분자는 유전자 편집 시스템 또는 이의 성분이다. 일부 구현예에서, 카고 분자는 CRISPR-Cas 시스템 분자 또는 이의 성분이다. 일부 구현예에서, 카고 분자는 유전자 변형 시스템의 하나 이상의 성분 (예컨대 CRISPR-Cas 시스템)을 코딩하는 폴리뉴클레오티드이다. 일부 구현예에서 카고 분자는 gRNA이다.

일부 구현예에서, 카고 분자는 단독으로 또는 시스템의 일부로서 전달될 때, 시스템의 다른 성분과 전달되는지 여부와 무관하게, 전달되는 세포의 게놈, 에피게놈, 및/또는 전사체를 변형시키도록 작동되어서, 근육 또는 골격 장애, 신경학적 질환 또는 장애, 및/또는 바이러스 (예컨대 단일 가닥 RNA 바이러스)의 질환, 장애, 또는 이의 증상을 치료하거나 또는 예방하게 되는, 폴리뉴클레오티드 또는 폴리펩티드일 수 있다. 일부 구현예에서, 카고 분자는 시스템의 다른 성분과 전달되는지 여부와 무관하게, 전달되는 세포의 게놈, 에피게놈, 및/또는 전사체를 변형시키도록 작동되어서, 조로증 (예: 조로증 돌연변이), 글리코겐 저장병, 면역 장애 (예컨대, 자가면역 질환), 암, 뒤센 근이영양증 (DMD), 6 지대근 이영양증 질환 (LGMD), 샤르코-마리-투스 (CMT), MPS IIIA, 폼페병, 또는 다른 CNS-관련 질환, 예컨대 헌팅톤병 및 다른 확장된 반복 질환을 치료하거나 또는 예방한다.

일부 구현예에서, 카고 분자는, 시스템의 다른 성분과 전달되는지 여부와 무관하게, 전달되는 세포의 게놈, 에피게놈, 및/또는 전사체를 변형시키도록 작동되어서, GAA 유전자, 예컨대 미국 특허 출원 공개 번호 제20190284555호에 기술된 임의의 것을 변형시킬 수 있고, 이의 내용은 본 명세서에서 그들 전문에서 표시되는 바와 같이 참조로 편입되고 본 발명에서 사용을 위해 적합화될 수 있다.

일부 구현예에서, 카고 분자는 MHCK7, CK8, 또는 다른 근육 특이적 프로모터에 커플링되는 올리고뉴클레오티드를 포함한다.

일부 구현예에서, 카고 분자는 단백질 기능성을 위해 최적화된 디스트로핀 유전자의 선택된 영역만을 함유하는 마이크로-디스트로핀 올리고뉴클레오티드이다. 일부 구현예에서, 선택된 영역은 스펙트린-유사 반복부 1, 2, 3, 및 24를 포함한다. 예를 들어, [Harper SQ, Hauser MA, DelloRusso C, et al. Modular flexibility of dystrophin: implications for gene therapy of Duchenne muscular dystrophy. Nat Med. 2002;8(3):253-261]을 참조한다. 일부 구현예에서, 마이크로-디스트로핀 올리고뉴클레오티드는 임상 시험 NCT03375164 및 NCT03769116이 수행되고 있는, AAVrh74.MHCK7 마이크로디스트로핀 유전자 또는 SRP-9001로서 알려진 rAAV 제에 의해 전달되는 것이다. 이러한 마이크로디스트로핀 유전자 구성체는 NT-H1-R1-R2-R3-H2-R24-H4-CR-CT를 포함한다. 일부 구현예에서, 마이크로디스트로핀 유전자는 ABD-H1-R1-R2-R3-H2-R24-H4-CR-CT를 포함한다. 일부 구현예에서, 마이크로디스트로핀 유전자는 힌지 영역을 나타내는 H를 포함한다 (England SB, et al. Nature. 1990;343(6254):180-182; Wells DJ, et al. Hum Mol Genet. 1995;4(8):1245-1250, Salva MZ, et al. Mol Ther. 2007;15(2):320-329; Mendell JR, et al. Neurosci Lett. 2012;527(2):90-99; Rodino-Klapac LR, et al. Hum Mol Genet. 2013;22(24):4929-4937; Velazquez VM, et al. Mol Ther Methods Clin Dev. 2017;4:159-168; Harper SQ, et al. Nat Med. 2002;8(3):253-261; Nelson DM, et al. Hum Mol Genet. 2018;27(12):2090-2100). 일부 구현예에서, 선택된 영역은 적어도 스펙트린-유사 반복부 2 및 3을 포함한다. 일부 구현예에서, 마이크로-디스트로핀 유전자는 nNOS 도메인을 함유한다. 일부 구현예에서, nNOS 도메인은 스펙트린-유사 반복부 16 및/또는 17로 구성된다. 일부 구현예에서, 마이크로-디스트로핀 유전자는 스펙트린-유사 반복부 16 및 17을 포함한다. 일부 구현예에서, nNOS 도메인은 스펙트린-유사 반복부 R1, R16, R17, R23, 및 R24로 구성된다. 일부 구현예에서, 마이크로-디스트로핀 유전자은 근육 특이적 프로모터에 커플링된다. 일부 구현예에서, 마이크로-디스트로핀 올리고뉴클레오티드는 MHCK7, CK8, SNP18, SP0033, SP0051, SP0173, tmCK, 또는 다른 근육 특이적 프로모터에 커플링된다.

일부 구현예에서, 카고 마이크로-디스트로핀은 ABD (액틴 결합 도메인), 하나 이상의 힌지 영역 (예를 들어, H1, H2, H3, H4,), 및 하나 이상의 스펙트린-유사 반복부 (예: R1, R1' R2, R3, R16, R17, R20, R21, R22, R23, R24, R24' 및 임의로 디스트로글리칸 결합 도메인 (DBD)을 포함한다. 일부 구현예에서, 마이크로-디스트로핀은 ABD-H1-R1-R16-R17-R23-R24-H4-DBD로 구성된다. 일부 구현예에서, 마이크로-디스트로핀은 ABD-H1-R1-R2-R3-H2-R24-H4-CR로 구성된다. 일부 구현예에서, 마이크로-디스트로핀 유전자는 ABD- H1-R1-R2-R3-H2-R24-H4-CR-CT를 포함한다. 일부 구현예에서, 마이크로-디스트로핀 유전자는 ABD-H1-R1'-R24'-H4-CR-CT를 포함한다.

일부 구현예에서, 카고 분자는 마이크로-디스트로핀 유전자를 코딩할 수 있는 폴리뉴클레오티드이고, 마이크로-디스트로핀 유전자는 스펙트린-유사 반복부, R1, R16, R17, R23 및 R24를 함유한다. 일부 구현예에서, 마이크로-디스트로핀 유전자는 힌지 영역 (H) 4 및/또는 H1을 함유한다. 일부 구현예에서, 마이크로-디스트로핀 유전자는 N-말단 액틴 결합 도메인을 함유한다. 일부 구현예에서, 마이크로-디스트로핀 유전자는 인간 전체 길이 디스트로핀 단백질의 C-말단 디스트로글리칸 결합 도메인을 함유한다. 마이크로-디스트로핀 유전자는 nNOS 도메인을 함유할 수 있다. 일부 구현예에서, nNOS 도메인은 스펙트린-유사 반복부 16 및/또는 17로 구성된다. 일부 구현예에서, 마이크로-디스트로핀 유전자는 스펙트린-유사 반복부 16 및 17을 포함한다. 마이크로-디스트로핀 유전자는 본 명세서에서 그들 전문이 표시된 바와 같이 참조로 편입되고, WO2019118806A1 및 WO2016/115543에 기술된 바와 같을 수 있고, 본 발명에서 사용을 위해 적합화될 수 있다. 일부 구현예에서, 카고 폴리뉴클레오티드는 N-말단에서 C-말단으로, 인간 전체 길이 디스트로핀 단백질의 N-말단 액틴 결합 도메인, 힌지 영역 1 (Hl), 스펙트린-유사 반복부 Rl, R16, R17, R23, 및 R24, 힌지 영역 4 (H4), 및 C-말단 디스트로글리칸 결합 도메인을 함유하는 5-반복 마이크로-디스트로핀 단백질을 코딩할 수 있다. 이러한 5-반복 마이크로-디스트로핀 및 관련 디스트로핀 미니유전자의 단백질 서열은 WO2016/115543에 기술된다. 일부 구현예에서, 카고 폴리뉴클레오티드는 현재 식별 번호 NCT03368742를 갖는 임상 시험 중인 SGT001로서 알려진 작용제의 일부인 마이크로-디스트로핀 유전자에 상응할 수 있다.

일부 구현예에서, 카고 분자는 minidys 유전자 또는 벡터이다. 일부 구현예에서, minidys 유전자 또는 벡터는 ABD-H1-R1-R2-R3-R16-R17-H3-R20-R21; ABD-H1-R1-R2-R3-R16-R17-H3-R20-R21-R22-R23-R24-H4-CR; 또는 H3-R20-R21-R22-R23-R24-H4-CR-CT로 구성될 수 있다.

일부 구현예에서, 카고 분자는 SCGB cDNA이다. 일부 구현예에서, SGCB cDNA는 MHCK7, CK8 프로모터, SNP18 프로모터, SP0033 프로모터, SP0051, SP0173 프로모터, tmCK 프로모터 또는 다른 근육 특이적 프로모터에 커플링된다. 일부 구현예에서, 카고 분자는 베타-사르코글리칸 cDNA, 알파-사르코글리칸 cDNA, 디스페를린 cDNA, 감마-사르코글리칸 cDNA, 칼핀-3 cDNA, SGSH cDNA (예를 들어, LYS-SAF302), 뉴트로핀 3 cDNA, 아녹타민-5 cDNA, 또는 이의 임의 조합이다.

일부 구현예에서, 카고 분자는, 시스템의 다른 성분과 전달되는지 여부와 무관하게, 전달되는 세포로 게놈, 에피게놈, 및/또는 전사체를 변형시키도록 작동되어서, 확장된 반복 질환, 예컨대 헌팅톤병, 예컨대 미국 특허 출원 공개 번호 제20190100755호, 미국 특허 제10066228호에서 기술된 것들과 연관된 유전자 또는 유전자 생산물을 치료, 예방, 및/또는 변형시킨고, 이들 내용은 본 명세서에서 그들 전문이 표시된 바와 같이 참조로 편입되고, 본 발명에서 사용을 위해 적합화될 수 있다.

일부 구현예에서, 카고 분자는 미국 특허 출원 공개 번호 US20160251398, US20150267202, US20190015440, US20140287983, US20180216111, WO/2017/062835, US20190177723, US20170051278, US20180271893, WO/2016/14965, US Pat. 10076536, WO/2018/00580, WO/2018/11866, WO/2019/059973에 기술된 것들이고, 이들 내용은 그들 전문이 본 명세서에 표시된 바와 같이 참조로 편입되고, 본 발명에서 사용을 위해 적합화될 수 있다.

일부 구현예에서, 카고 분자, 시스템의 다른 성분과 전달되는지 여부와 무관하게, 전달되는 세포의 게놈, 에피게놈, 및/또는 전사체를 변형시키도록 작동되어서, 단일 가닥 RNA 바이러스, 예컨대 인플루엔자, 웨스트 나일 바이러스, SARS, C형 간염, 뎅기열, 에볼라, 마르부르그, 및/또는 칼리시바이러스를 치료하거나 또는 예방한다. 일부 구현예에서 카고 분자는 안티센스 항바이러스 화합물, 예컨대 US8703735B2에 기술된 것들일 수 있고, 이의 내용은 본 명세서에서 그들 전문이 표시된 바와 같이 참조로 편입되고, 본 발명에서 사용을 위해 적합화될 수 있다.

본 명세서에 기술된 카고에 의해서 변형될 수 있는 추가의, 예시적인 유전적 및 유전자 연관 질환 및 유전자는 본 명세서의 다른 곳에 열거되고, 예를 들어, 표 4-5를 참조한다.

일부 구현예에서, 카고 분자는 GALGT2 유전자를 첨가 또는 변형시킬 수 있다. 누락된 디스트로핀을 재공급하도록 작용하는 대신에, GALGT2 유전자 요법은 질환에서 돌연변이되지 않거나 또는 손실되지 않는 단백질의 발현을 증가시켜서, 디스트로핀의 부재를 보상하는 방식으로 근육의 구조적 무결성을 강화시킨다. GALGT2는 특별한 디스트로핀 돌연변이와 무관하게 DMD를 치료하는 가능성을 제공할 뿐만 아니라, 다른 근육 이영양증에도 유용성을 갖는다.

일부 구현예에서 카고 분자는 모르폴리노, 예컨대 미국 특허출원 공개 번호 US2018/0161359 및 US2019/0054113에 기술된 것들이고, 이의 내용은 본 명세서에서 그들 전문이 표시된 바와 같이 참조로 편입되고 본 발명과 사용을 위하 적합화될 수 있다. 일부 구현예에서, 모르폴리노는 모르폴리노 올리고머 (PMO) 또는 펩티드 연결된 모르폴리노 PPMO이다. PMO 기반 플랫폼은 mRNA 전사를 변경시켜서 유전 질환을 치료하는데 사용될 수 있다. PMO는 RNA의 천연 프레임워크 이후에 모델링된 합성 화학 구조이다. PMO가 RNA에서 발견되는 것과 동일한 핵산을 갖지만, 그들은 5-면 리보스 고리 대신에 6-면 모르폴린 고리에 결합된다. 또한, 모르폴린 고리는 RNA에서 발견되는 프소프디에스테르 결합 대신에 포스포로디아미데이트 결합을 통해서 서로 연결된다. PMO 및 PPMO는 엑손 스키핑 및 번역 억제에 사용될 수 있다.

일부 구현예에서, 카고 분자는 예를 들어, 국제 특허 출원 공개 번호 WO2017106304A1에 기술된 바와 같이, 펩티드-올리고머 접합체일 수 있고, 이의 내용은 본 명세서에서 그들 전문으로 표시되는 바와 같이 참조로 편입되고, 본 발명과 사용을 위해 적합화될 수 있다.

일부 구현예에서, 모르폴리노는 디스트로핀 mRNA의 엑손 51을 표적화하는데 효과적일 수 있는, 에테플러센에 발견되는 모르폴리노이다. 일부 구현예에서 카고 분자는 DMD 상황에서 엑손 스키핑, 예컨대 예를 들어, 미국 특허 출원 공개 번호 US2014/0315977A1 및 US2018/010581에 기술된 것들을 생성시킬 수 있고, 이의 내용은 본 명세서에서 그들 전문으로 표시된 바와 같이 참조로 편입되고, 본 발명과 사용을 위해 적합화될 수 있다.

엑손 스키핑

일부 구현예에서, 뉴클레오티드 서열은 엑손 스키핑을 유도할 수 있는 핵산을 코딩할 수 있다. 이러한 코딩된 핵산은 안티센스 올리고뉴클레오티드 또는 안티센스 뉴클레오티드 시스템일 수 있다. 본 명세서에서 사용되는 용어 "엑손 스키핑"은 하나 이상의 상보성　안티센스　올리고뉴클레오티드(들) (AON)를 사용한 프리-mRNA 내 스플라이스 공여자 및/또는 억셉터 부위의 표적화에 의한 프리-mRNA 스플라이싱의 변형을 의미한다. 하나 이상의 스플라이스 공여자 또는 억셉터 부위에 스플라이시오솜의 접근을 차단하여, AON은 스플라이싱 반응을 방지하여서 완전하게 프로세싱된 mRNA로부터 하나 이상의 엑손의 결실을 초래할 수 있다. 엑손 스키핑은 프리-mRNA의 성숙화 과정 동안 핵에서 획득될 수 있다. 일부 예에서, 엑손 스키핑은 프리-mRNA 내 스플라이스 공여자 서열에 상보적인 안티센스　올리고뉴클레오티드 (AON)를 사용하여 표적화된 엑손의 스플라이싱에 관여되는 핵심 서열의 차폐를 포함할 수 있다.

일부 구현예에서, 뉴클레오티드 서열은 디스트로핀 mRNA에서 엑손 스키핑을 유도할 수 있는 안티센스 올리고뉴클레오티드 또는 안티센스 뉴클레오티드 시스템을 코딩한다. 예를 들어, 디스트로핀 유전자의 엑손 x 내 넌-센스 또는 프레임시프트 돌연변이는 카르복시-말단 절두, 비-기능성 디스트로핀 단백질을 산출한다. 그 성숙한 mRNA 전사물의 발현은 엑손 x에 의해 코딩되는 아미노산에 결실되지만 결실된 아미노산에 대해 N-말단 및 C-말단 둘 모두에 디스트로핀 아미노산을 포함하는 기능성 디스트로핀 단백질을 산출할 수 있다.

뉴클레오티드 서열은 엑손 1, 2, 3, 4, 5, 6, 7, 8, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 45, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 또는 이의 임의 조합에서 엑손 스키핑을 유도할 수 있는 안티센스 올리고뉴클레오티드 또는 안티센스 뉴클레오티스 시스템을 코딩할 수 있다. 뉴클레오티드 서열은 엑손 43, 44, 50, 51, 52, 55, 또는 이의 임의 조합에서 엑손 스키핑을 유도할 수 있는 안티센스 올리고뉴클레오티드 또는 안티센스 뉴클레오티드 시스템을 코딩할 수 있다.

CRISPR-Cas 시스템 카고 분자

일부 구현예에서, 본 명세서에 기술된 조작된 바이러스 (예를 들어, AAV) 또는 다른 입자는 폴리뉴클레오티드 또는 폴리펩티드일 수 있는, 하나 이상의 CRISPR-Cas 시스템 분자를 포함할 수 있다. 일부 구현예에서, 폴리뉴클레오티드는 하나 이상의 CRISPR-Cas 시스템 분자를 코딩할 수 있다. 일부 구현예에서, 폴리뉴클레오티드는 Cas 단백질, CRISPR 캐스캐이드 단백질, gRNA, 또는 이의 조합을 코딩할 수 있다. 다른 CRISPR-Cas 시스템 분자는 본 명세서의 다른 곳에 논의되고 폴리펩티드 또는 폴리뉴클레오티드로서 전달될 수 있다.

일반적으로, 본 명세서, 및 문헌, 예컨대 WO 2014/093622 (PCT/US2013/074667)에서 사용되는 CRISPR-Cas 또는 CRISPR 시스템은 Cas 유전자를 코딩하는 서열, tracr (trans-activating CRISPR) 서열 (예를 들어, tracrRNA 또는 활성 부분 tracrRNA), tracr-메이트 서열 ("직접 반복부" 및 내생성 CRISPR 시스템의 경우에 tracrRNA-프로세싱된 부분 직접 반복부를 포괄), 가이드 서열 (또한 내생성 CRISPR 시스템의 경우에 "스페이서"라고 함), 또는 그 용어가 본 명세서에서 사용되는 바와 같은 "RNA(들)" (예를 들어, 가이드 Cas에 대한 RNA(들), 예컨대 Cas9, 예를 들어, CRISPR RNA 및 트랜스활성화 (tracr) RNA 또는 단일 가이드 RNA (sgRNA) (키메라 RNA)) 또는 다른 서열 및 CRISPR 유전자좌 유래의 전사물을 포함하는, CRISPR-연관된 ("Cas") 유전자의 활성을 유도하거나 또는 이의 발현에 관여하는 전사물 및 다른 구성요소들을 집합적으로 의미한다. 일반적으로, CRISPR 시스템은 표적 서열 (내생성 CRISPR 시스템의 경우 프로토스페이서로도 지칭) 의 위치에서 CRISPR 복합체의 형성을 촉진하는 요소를 특징으로 한다. 예를 들어, 다음을 참조한다: Shmakov et al. (2015) "Discovery and Functional Characterization of Diverse Class 2 CRISPR-Cas Systems", Molecular Cell, DOI: dx.doi.org/10.1016/j.molcel.2015.10.008.

일정 구현예에서, 프로토스페이서 인접 모티프 (PAM) 또는 PAM-유사 모티프는 관심 표적 유전자좌와 본 명세서에 개시된 바와 같은 이펙터 단백질 복합체의 결합을 유도한다. 일부 구현예에서, PAM 는 5' PAM (즉, 프로토스페이서의 5' 말단의 업스트림에 위치) 일 수 있다. 다른 구현예에서, PAM 는 3' PAM (즉, 프로토스페이서의 5' 말단의 다운스트림에 위치) 일 수 있다. 용어 "PAM" 은 용어 "PFS" 또는 "프로토스페이서 측접 위치" 또는 "프로토스페이서 측접 서열" 과 상호교환가능하게 사용될 수 있다.

바람직한 구현예에서, CRISPR 이펙터 단백질은 3' PAM 을 인식할 수 있다. 일정 구현예에서, CRISPR 이펙터 단백질은 5' H인 3' PAM을 인식할 수 있고, 여기서 H는 A, C 또는 U이다.

CRISPR 복합체 형성의 맥락에서, "표적 서열" 은 가이드 서열이 상보성을 갖도록 설계된 서열을 지칭하며, 여기서, 표적 서열과 가이드 서열 사이의 혼성화는 CRISPR 복합체의 형성을 촉진시킨다. 표적 서열은 RNA 폴리뉴클레오티드를 포함할 수 있다. 용어 "표적 RNA" 는 표적 서열이거나 그를 포함하는 RNA 폴리뉴클레오티드를 의미한다. 달리 말해서, 달리 말해서, 표적 RNA 는 gRNA, 즉 가이드 서열의 일부분이 상보성을 갖도록 설계되고 CRISPR 이펙터 단백질 및 gRNA 를 포함하는 복합체에 의해 매개되는 이펙터 기능이 유도되게 하는 RNA 폴리뉴클레오티드 또는 RNA 폴리뉴클레오티드의 일부분일 수 있다. 일부 구현예에서, 표적 서열은 세포의 핵 또는 세포질 내에 위치된다.

일정 예의 구현예에서, CRISPR 이펙터 단백질은 CRISPR 이펙터 단백질을 코딩하는 핵산 분자를 사용해 전달될 수 있다. CRISPR 이펙터 단백질을 코딩하는 핵산 분자는 유리하게 코돈 최적화된 CRISPR 이펙터 단백질일 수 있다. 코돈 최적화된 서열의 예는 이러한 예에서 진핵생물, 예를 들어 인간 (즉, 인간에서 발현을 위해 최적화됨), 또는 본 명세서에 논의된 바와 같은 다른 진핵생물, 동물, 또는 포유동물에서 발현을 위해 최적화된 서열이고, 예를 들어, 국제 특허 출원 공개 번호 WO 2014/093622 (PCT/US2013/074667)의 SaCas9 인간 최적화된 서열을 참조한다. 이것이 바람직하지만, 다른 예가 가능하고 인간 이외의 숙주종에 대한 코돈 최적화, 또는 특별한 장기에 대한 코돈 최적화가 공지되어 있다는 것을 이해하게 될 것이다. 일부 구현예에서, CRISPR 이펙터 단백질을 코딩하는 효소 코딩 서열은 특히 세포, 예컨대 진핵생물 세포에서의 발현을 위해 코돈 최적화된다. 진핵생물 세포는 제한없이, 인간, 또는 본 명세서에 기술된 바와 같은 인간이외의 진핵생물 또는 동물 또는 포유동물, 예를 들어 마우스, 래트, 토끼, 개, 가축 또는 인간이외의 포유동물 또는 영장류를 포함하여, 포유동물 또는 식물과 같은 특정한 유기체의 것일 수 있거나 또는 그로부터 유래될 수 있다. 일부 구현예에서, 인간의 배선 유전자 정체성 (identity)을 변형시키는 방법 및/또는 인간 또는 동물에게 임의의 실질적인 의학적 이득없이 고통을 야기시킬 수도 있는 동물의 유전자 정체성을 변형시키는 방법, 및 그러한 방법으로 얻어진 동물은 배제할 수 있다. 일반적으로, 코돈 최적화는 천연 서열의 적어도 하나의 코돈 (예를 들어, 약 1, 2, 3, 4, 5, 10, 15, 20, 25, 50개 이상의 코돈)을 해당 숙주 세포의 유전자에서 더 빈번하게 또는 가장 빈번하게 사용되는 코돈으로 대체함으로써 관심 숙주 세포에서 증강된 발현을 위한 핵산 서열을 변형시키는 한편, 천연 아미노산 서열을 유지시키는 과정을 의미한다. 다양한 종은 특정 아미노산의 특정 코돈에 대하여 특정 편향을 나타낸다. 코돈 편향 (유기체 간의 코돈 사용의 차이)은 종종 메신저 RNA(mRNA)의 번역의 효율과 상관관계가 있으며, 이는 결국, 특히, 번역되는 코돈의 특성 및 특정 운반 RNA (tRNA) 분자의 이용 가능성에 좌우되는 것으로 여겨진다. 세포에서의 선택된 tRNA 의 우세는 일반적으로 펩티드 합성에 가장 빈번하게 사용되는 코돈을 반영하는 것이다. 따라서, 유전자는 코돈 최적화를 기반으로 하여 주어진 유기체에서의 최적의 유전자 발현을 위해 맞춤화될 수 있다. 코돈 용법 표는 예를 들어 kazusa.orjp/codon/ 에서 입수가능한 "코돈 용법 데이타베이스" 에서 쉽게 이용가능하고, 이들 표는 다양한 방식으로 개조될 수 있다. 다음의 문헌을 참조한다: Nakamura, Y., et al. "Codon usage tabulated from the international DNA Sequence databases: status for the year 2000", Nucl. Acids Res. 28:292 (2000). 특정 숙주 세포에서의 발현을 위해 특정 서열을 코돈 최적화시키는 컴퓨터 알고리즘이 또한 이용 가능하며, 예를 들어 Gene Forge (Aptagen; Jacobus, PA) 이 또한 이용가능하다. 일부 구현예에서, Cas를 코딩하는 서열에서 하나 이상의 코돈 (예를 들어, 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 이상, 또는 모든 코돈)은 특정 아미노산에 대해 가장 빈번하게 사용되는 코돈에 상응한다.

일정 구현예에서, 본 명세서에 기술된 바와 같은 방법은 하나 이상의 가이드 RNA를 코딩하는 하나 이상의 핵산이 하나 이상의 관심 유전자의 프로모터를 포함하는 조절 구성요소와 세포에서 작동적으로 연결되어 도입되거나 또는 제공되는 Cas 유전자이식 세포를 제공하는 단계를 포함할 수 있다. 본 명세서에서 사용되는 용어 "Cas 유전자이식 세포"는 Cas 유전자가 게놈에 통합된 세포, 예컨대 진핵생물을 의미한다. 세포의 성질, 유형 또는 기원은 본 발명에 따라 특별히 제한되지 않는다. 또한, Cas 이식유전자가 세포에 도입되는 방식은 다양할 수 있고 당분야에 공지된 바와 같은 임의의 방법일 수 있다. 일정 구현예에서, Cas 유전자이식 세포는 단리된 세포에 Cas 이식유전자를 도입시켜서 수득된다. 일정 다른 구현예에서, Cas 유전자이식 세포는 Cas 유전자이식 유기체로부터 세포를 단리하여 수득된다. 예로서, 제한없이, 본 명세서에서 언급시 Cas 유전자이식 세포는 유전자이식 진핵생물, 예컨대 Cas 녹인 진핵생물로부터 유래될 수 있다. 본 명세서에 참조로 편입되는 국제 특허 출원 공개 번호 WO 2014/093622 (PCT/US13/74667)를 참조한다. Rosa 유전자좌의 표적화에 관한 Sangamo BioSciences, Inc.에게 양도된 미국 특허 공개 번호 제20120017290호 및 제20110265198호의 방법은 본 발명의 CRISPR Cas 시스템을 이용하도록 변형될 수 있다. 추가 예로서, 참조로 본 명세서에 편입되는, Cas9 녹-인 마우스를 기술하는 [Platt et. al. (세포; 159(2):440-455 (2014))]을 참조한다. Cas 이식유전자는 Lox-Stop-polyA-Lox(LSL) 카세트를 더 포함할 수 있어서 Cre 리콤비나제에 의해 Cas 발현을 유도시킬 수 있다. 대안적으로, Cas 유전자이식 세포는 단리된 세포에서 Cas 이식유전자를 도입하여 수득될 수 있다. 이식유전자를 위한 전달 시스템은 당분야에 잘 공지되어 있다. 예로서, Cas 이식유전자는 역시 본 명세서의 다른 곳에 기술된 바와 같이, 벡터 (예, AAV, 아데노바이러스, 렌티바이러스) 및/또는 입자 및/또는 나노입자 전달을 통해 예를 들어 진핵생물 세포로 전달될 수 있다. 렌티바이러스 및 레트로바이러스 시스템을 비롯하여, CRISPR-Cas 시스템 성분의 전달을 위한 비-바이러스 시스템은 당분야에서 일반적으로 공지되어 있다. CRISPR-Cas 시스템 성분을 위한 AAV 및 아데노바이러스-기반 시스템은 본 명세서에 기술되었을 뿐만 아니라 당분야에서 일반적으로 공지되어 있다 (예를 들어, 본 발명의 조작된 AAV).

본 명세서에서 언급시 세포, 예컨대 Cas 유전자이식 세포는 표적 유전자좌에 Cas를 가이드할 수 있는 RNA와 복합체형성시 Cas의 서열 특이적 작용으로 발생되는 돌연변이 또는 통합된 Cas 유전자를 갖는 것 이외의 게놈 변경을 더 포함할 수 있다는 것을 당업자는 이해할 것이다.

일정 구현예에서, 본 발명은 예를 들어 Cas를 표적 유전자좌로 가이드할 수 있는 Cas 및/또는 RNA (즉, 가이드 RNA)를 세포에 전달 또는 도입시킬뿐만 아니라, 또한 이들 성분을 (예를 들어, 원핵생물 세포에서) 증식시키기 위한 벡터를 포함한다. 이것은 본 명세서에 기술된 조작된 AAV 입자에 의해 이미 전달되지 않은 하나 이상의 CRISPR-Cas 성분 또는 다른 유전자 변형 시스템 성분의 전달 이외의 것일 수 있다. 본 명세서에서 사용되는 벡터는 한 환경에서 다른 환경으로 독립체의 전달을 허용하거나 또는 촉진하는 도구이다. 이것은 다른 DNA 절편에 삽입되어서 삽입된 절편의 복제를 일으키는 레플리콘, 예컨대 플라스미드, 파지, 또는 코스미드이다. 일반적으로, 벡터는 적절한 제어 구성요소와 회합될 때 복제될 수 있다. 일반적으로, 용어 "벡터"는 그것이 연결되어 있는 다른 핵산을 전달할 수 있는 핵산 분자를 지칭한다. 벡터는 제한 없이, 단일 가닥, 이중 가닥 또는 부분 이중 가닥인 핵산 분자; 하나 이상의 자유 말단을 포함하는, 자유 말단을 포함하지 않는 (예를 들어, 환형) 핵산 분자; DNA, RNA 또는 둘 다를 포함하는 핵산 분자; 및 당업계에 공지된 다른 종류의 폴리뉴클레오티드를 포함한다. 하나의 유형의 벡터는 "플라스미드"이며, 이는 추가의 DNA 절편이 예를 들어, 표준 분자 클로닝 기술에 의해 삽입될 수 있는 환형 이중 가닥 DNA 루프를 지칭한다. 다른 유형의 벡터는 바이러스 벡터로서, 바이러스-유래 DNA 또는 RNA 서열이 바이러스 (예를 들어, 레트로바이러스, 복제 결함성 레트로바이러스, 아데노바이러스, 복제 결함성 아데노바이러스, 및 아데노-연관 바이러스 (AAV))에 패키징을 위해 벡터에 존재한다. 바이러스 벡터는 또한 숙주 세포 내로 형질감염을 위해 바이러스에 의해 수행되는 폴리뉴클레오티드를 포함한다. 특정 벡터는 그것이 도입된 숙주 세포에서 자율적 복제가 가능하다 (예를 들어, 박테리아 복제 기원을 가진 박테리아 벡터 및 에피솜 포유류 벡터). 다른 벡터 (예를 들어, 비-에피솜 포유동물 벡터)는 숙주 세포 내로 도입시 숙주 세포의 게놈에 통합되며, 이에 의해 숙주 게놈과 함께 복제된다. 게다가, 일정 벡터는 그들이 작동 가능하게 연결된 유전자의 발현을 유도할 수 있다. 이러한 벡터는 본 명세서에서 "발현 벡터"라고 한다. 재조합 DNA 기술에 유용한 통상적인 발현 벡터는 종종 플라스미드의 형태로 존재한다.

재조합 발현 벡터는 숙주 세포에서 핵산의 발현에 적합한 형태로 본 발명의 핵산을 포함할 수 있는데, 이는 재조합 발현 벡터가 하나 이상의 조절 요소를 포함하는 것을 의미하며, 하나 이상의 조절 요소는 발현에 사용될 숙주 세포에 기반하여 선택될 수 있고, 발현될 핵산 서열에 작동가능하게 연결된다. 재조합 발현 벡터 내에서, "작동 가능하게 연결된"은 관심 뉴클레오티드 서열이 뉴클레오티드 서열의 발현을 허용하는 방식으로 (예를 들어, 시험관내 전사/번역 시스템에서 또는 벡터가 숙주 세포에 도입될 때 숙주 세포에서) 조절 구성요소(들)에 연결된다는 것을 의미한다. 재조합 및 클로닝 방법과 관련하여, 미국 특허 출원 공개 번호 제2004/0171156호를 참조하고, 그 내용이 그 전체로 참조로 본 명세서에 편입된다. 따라서, 본 명세서에서 개시하는 따라서, 본 명세서에 개시된 구현예는 또한 CRISPR 이펙터 시스템을 포함한 유전자이식 세포를 포함할 수 있다. 일정 예의 구현예에서, 유전자이식 세포는 개별 이산 부피로서 기능할 수 있다. 달리 말해서, 차폐성 구성체를 포함하는 샘플은, 예를 들어 적합한 전달 소포체로 세포로 전달 될 수 있고, 표적이 전달 소포체에 존재하면 CRISPR 이펙터가 활성화되고 검출가능한 신호가 생성된다.

벡터(들)는 조절 구성요소(들), 예를 들어, 프로모터(들)를 포함할 수 있다. 벡터(들)는 Cas 코딩 서열을 포함할 수 있고/있거나, 단독이지만, 가능하게 또한 적어도 3 또는 8 또는 16 또는 32 또는 48 또는 50 가이드 RNA(들) (예를 들어, sgRNA) 코딩 서열, 예컨대 1-2, 1-3, 1-4 1-5, 3-6, 3-7, 3-8, 3-9, 3-10, 3-8, 3-16, 3-30, 3-32, 3-48, 3-50 RNA(들) (예를 들어, sgRNA)를 포함할 수 있다. 각각의 RNA (예를 들어, sgRNA)에 대한 프로모터가 존재할 수 있는 단일 벡터에서, 유리하게 최대 약 16 RNA(들)가 존재할 때; 및 단일 벡터가 16 초과의 RNA(들)를 제공할 때, 하나 이상의 프로모터(들)는 하나 초과의 RNA(들)의 발현을 구동시킬 수 있고, 예를 들어, 32 RNA(들)가 존재할 때, 각각의 프로모터는 2 RNA(들)의 발현을 구동할 수 있고, 48 RNA(들)가 존재할 때, 각각의 프로모터는 3 RNA(들)의 발현을 구동할 수 있다. 단순 연산 및 충분히 확립된 클로닝 프로토콜 및 본 개시의 교시에 의해서 당업자는 적합한 예시적인 벡터 예컨대 AAV, 및 적합한 프로모터 예컨대 U6 프로모터를 위한 RNA(들)에 대해 본 발명을 쉽게 실시할 수 있다. 예를 들어, AAV의 패키징 한계는 ∼4.7 kb이다. 단일 U6-gRNA의 길이 (클로닝 제한 효소 부위 더함)는 361 bp이다. 그러므로, 당업자는 약 12-16, 예를 들어, 13 U6-gRNA 카세트를 단일 벡터에 쉽게 맞출 수 있다. 이것은 임의의 적합한 수단 예컨대 TALE 조립에 사용되는 골든 게이트 전략 (genome-engineering.org/taleffectors/)을 통해 조립될 수 있다. 당업자는 또한 U6-gRNA의 수를 대략 1.5배만큼 증가시키기 위해서, 예를 들어, 12-16, 예를 들어, 13 내지 대략 18-24, 예를 들어, 약 19 U6-gRNA로 증가시키기 위해서 탠덤 가이드 전략을 사용할 수 있다. 그러므로, 당업자는 단일 벡터, 예를 들어, AAV 벡터에서 대략 18-24, 예를 들어, 약 19 프로모터-RNA, 예를 들어, U6-gRNA에 쉽게 도달할 수 있다. 벡터에서 RNA 및 프로모터의 수를 증가시키기 위한 추가 수단은 절단가능한 서열만큼 이격된 RNA의 어레이를 발현시키기 위해 단일 프로모터 (예를 들어, U6)를 사용하는 것이다. 그리고 벡터에서 프로모터-RNA의 수를 증가시키기 위한 추가 수단은 또한 유전자 또는 코딩 서열의 인트론에서 절단가능한 서열만큼 이격된 프로모터-RNA의 어레이를 발현시키는 것이고; 이러한 예에서, 조직 특이적 방식으로 긴 RNA의 전사를 가능하게 하고 발현을 증가시킬 수 있는, 폴리머라제 II 프로모터를 사용하는 것이 유리하다 (참조: 예를 들어, nar.oxfordjournals.org/content/34/7/e53.short and nature.com/mt/journal/v16/n9/abs/mt2008144a.html). 유리한 구현예에서, AAV는 최대 약 50개 유전자를 표적화하는 U6 탠덤 gRNA를 패키징할 수 있다. 따라서, 당분야의 지식 및 본 개시의 교시로부터 당업자는 임의의 과도한 실험없이, 본 명세서에 기술된 RNA 또는 가이드의 수와 특히 관련하여, 하나 이상의 프로모터에 작동적으로 또는 기능적으로 연결되거나 또는 그 제어 하에서 다수의 RNA 또는 가이드를 발현하는, 벡터(들), 예를 들어 단일 벡터를 쉽게 만들고 이용할 수 있다.

가이드 RNA(들) 코딩 서열 및/또는 Cas 코딩 서열은 조절 구성요소(들)에 기능적으로 또는 작동적으로 연결될 수 있어서 조절 구성요소(들)가 발현을 구동한다. 프로모터(들)는 항상성 프로모터(들) 및/또는 조건적 프로모터(들) 및/또는 유도성 프로모터(들) 및/또는 조직 특이적 프로모터(들)일 수 있다. 프로모터는 RNA 폴리머라제, pol I, pol II, pol III, T7, U6, H1, 레트로바이러스 라우스 육종 바이러스 (RSV) LTR 프로모터, 사이토메갈로바이러스 (CMV) 프로모터, SV40 프로모터, 디히드로폴레이트 리덕타제 프로모터, β-액틴 프로모터, 포스포글리세롤 키나제 (PGK) 프로모터, 및 EF1α 프로모터로 이루어진 군으로부터 선택될 수 있다. 유리한 프로모터는 U6의 프로모터이다.

본 발명에 따라 사용을 위한 추가 이펙터는 예를 들어, 이에 제한하지 않으나, cas1 유전자의 출발점으로부터 20 kb 및 cas1 유전자의 종료점으로부터 20 kb 영역 내에서, cas1 유전자에 대한 그들 근접성으로 확인될 수 있다. 일정 구현예에서, 이펙터 단백질은 적어도 하나의 HEPN 도메인 및 적어도 500 아미노산을 포함하고, C2c2 이펙터 단백질은 Cas 유전자 또는 CRISPR 어레이의 20 kb 상류 또는 하류 내에 원핵생물 게놈에 천연적으로 존재한다. Cas 단백질의 비제한적인 예는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (Csn1 및 Csx12로도 알려짐), Cas10, Cas 12, Cas 12a, Cas 13a, Cas 13b, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, 이의 상동체 또는 이의 변형된 형태를 포함한다. 일정 예의 구현예에서, C2c2 이펙터 단백질은 Cas 1 유전자의 상류 또는 하류 20 kb 이내 원핵생물 게놈에 천연적으로 존재한다. 용어 "오솔로그" (orthologue 또는 ortholog라고도 함) 및 "상동체" (homologue 또는 homolog라고도 함)는 당분야에 충분히 공지되어 있다. 추가 지침에 의해서, 본 명세서에서 사용되는 단백질의 "상동체"는 상동성인 단백질과 동일하거나 또는 유사한 기능을 수행하는 동일 종의 단백질이다. 상동성 단백질은 구조적으로 관련될 필요가 없거나, 또는 오직 부분적으로 구조적으로 관련된다. 본 명세서에서 사용되는 단백질의 "오솔로그"는 오솔로그인 단백질과 동일하거나 또는 유사한 기능을 수행하는 상이한 종의 단백질이다. 오솔로그 단백질은 구조적으로 관련될 필요가 없거나, 또는 오직 부분적으로 구조적으로 관련된다.

일부 구현예에서, 핵산 표적화 시스템의 하나 이상의 구성요소는 내생성 CRISPR RNA-표적화 시스템을 포함하는 특정 유기체로부터 유래된다. 일정 구현예에서, CRISPR RNA-표적화 시스템은 유박테리움 (Eubacterium) 및 루미노코커스 (Ruminococcus)에서 발견된다. 일정 구현예에서, 이펙터 단백질은 표적화 및 부수적 ssRNA 절단 활성을 포함한다. 일정 구현예에서, 이펙터 단백질은 이중 HEPN 도메인을 포함한다. 일정 구현예에서, 이펙터 단백질은 Cas13a의 나선형-1 도메인에 대한 대응부가 결여된다. 일정 구현예에서, 이펙터 단백질은 928 aa의 중간 크기를 갖는 이전에 특징규명된 클래스 2 CRISPR 이펙터에 비해 작다. 이러한 중간 크기는 Cas13c의 것에 비해서 190 aa (17%) 미만이고, Cas13b 것에 비해 200 aa (18%) 초과로 더 작고, Cas13a의 것에 비해 300 aa (26%) 초과로 더 작다. 일정 구현예에서, 이펙터 단백질은 측접 서열 (예를 들어, PFS, PAM)을 요구하지 않는다.

일정 구현예에서, 이펙터 단백질 유전자좌 구조는 WYL 도메인 함유 보조 단백질을 포함한다 (이러한 도메인의 원래 확인된 그룹에 보존된 3개 아미노산 이후에 표시됨; 예를 들어, WYL 도메인 IPR026881 참조). 일정 구현예에서, WYL 도메인 보조 단백질은 하나 이상의 헬릭스-턴-헬릭스 (HTH) 또는 리본-헬릭스-헬릭스 (RHH) DNA-결합 도메인을 포함한다. 일정 구현예에서, WYL 도메인 함유 보조 단백질은 RNA-표적화 이펙터 단백질의 표적화 및 부수적 ssRNA 절단 활성 둘 모두를 증가시킨다. 일정 구현예에서, WYL 도메인 함유 보조 단백질은 N-말단 RHH 도메인 뿐만 아니라, 원래의 WYL 모티프에 상응하는 불변 티로신-류신 이중항을 포함하여, 주로 소수성 보존된 잔기의 패턴을 포함한다. 일정 구현예에서, WYL 도메인 함유 보조 단백질은 WYL1이다. WYL1은 루미노코커스와 주로 관련된 단일 WYL-도메인 단백질이다.

다른 예의 구현예에서, VI형 RNA-표적화 Cas 효소는 Cas 13d이다. 일정 구현예에서, Cas13d는 유박테리움 시라에움 (Eubacterium siraeum) DSM 15702 (EsCas13d) 또는 루미노코커스 (Ruminococcus) sp. N15.MGS-57 (RspCas13d)이다 (참조: 예를 들어, Yan et al., Cas13d Is a Compact RNA-Targeting Type VI CRISPR Effector Positively Modulated by a WYL-Domain-Containing Accessory Protein, Molecular Cell (2018), doi.org/10.1016/j.molcel.2018.02.028). RspCas13d 및 EsCas13d는 측접 서열 요건을 갖지 않는다 (예를 들어, PFS, PAM).

본 명세서에서 제공하는 방법, 시스템, 및 도구는 참조로 본 명세서에 그 전문이 편입되는, [Makarova et al., The CRISPR Journal, v. 1, n., 5 (2018); DOI: 10.1089/crispr.2018.0033]에 기술되고, 특히 도 1, p326에 기술된 I형, III형, 또는 IV형 Cas 단백질일 수 있는, 클래스 I CRISPR 단백질과 사용을 위해 디자인될 수 있다. 클래스 1 시스템은 전형적으로, 일부 구현예에서, 보조 단백질, 예컨대 항바이러스 방어를 위한 CRISPR-연관 복합체로서 알려진 복합체 중 하나 이상의 단백질 (캐스캐이드), 하나 이상의 적응 단백질 (예를 들어, Cas1, Cas2, RNA 뉴클레아제), 및/또는 하나 이상의 보조 단백질 (예를 들어, Cas 4, DNA 뉴클레아제), CRISPR 연관 로스만 폴드 (CARF) 도메인 함유 단백질, 및/또는 RNA 전사효소를 포함할 수 있는, 다수-단백질 이펙터를 사용한다. 클래스 1 시스템이 제한된 서열 유사성을 갖지만, 클래스 1 시스템 단백질은 하나 이상의 RAMP (Repeat Associated Mysterious Protein) 패밀리 서브유닛, 예를 들어, Cas 5, Cas6, Cas7을 포함한, 그들의 유사한 아키텍처로 확인될 수 있다. RAMP 단백질은 하나 이상의 RNA 인식 모티프 도메인을 갖는 것을 특징으로 한다. 대형 서브유닛 (예를 들어, cas8 또는 cas10) 및 소형 서브유닛 (예를 들어, cas11)은 또한 클래스 1 시스템의 전형이다. 예를 들어, 도 1 및 2를 참조한다. Koonin EV, Makarova KS. 2019 Origins and evolution of CRISPR-Cas Systems. Phil. Trans. R. Soc. B 374: 20180087, DOI: 10.1098/rstb.2018.0087. 일 구현예에서, I형 CRISPR 단백질은 하나 이상의 Cas5 서브유닛 및 둘 이상의 Cas7 서브유닛을 포함하는 이펙터 복합체를 포함한다. 특정 클래스 1 단백질의 캐스캐이드는 프리-crRNA에 결합하고 프리-crRNA의 프로세싱을 직접 담당하는 뉴클레아제인, 추가 Cas 단백질, 예를 들어, Cas6 또는 Cas5를 동원하는 다수 Cas 단백질의 전용 복합체를 포함할 수 있다. 일 구현예에서, I형 CRISPR 단백질은 하나 이상의 Cas5 서브유닛 및 둘 이상의 Cas7 서브유닛을 포함하는 이펙터 복합체를 포함한다. 클래스 1 아형은 I-A형, I-B형, I-C형, I-U형, I-D형, I-E형, 및 I-F형, IV-A형 및 IV-B형, III-A형, III-D형, III-C형, 및 III-B형을 포함한다. 클래스 1 시스템은 또한 Tn7-유사 트랜스포존의 거대 패밀리에 의해 코딩되는 아형 I-F 형태 및 유사하게 분해된 아형 I-B 시스템을 코딩하는 Tn7-유사 트랜스포존의 더 작은 그룹을 포함하는, 트랜스포존 및 플라스미드에 의해 운반되는 변이체를 포함할 수 있는, I-A형, I-B형, I-E형, I-F형 및 I-U형 변이체를 포함한, CRISPR-Cas 변이체를 포함한다. [Peters et al., PNAS 114 (35) (2017); DOI: 10.1073/pnas.1709035114; 또한, Makarova et al, the CRISPR Journal, v. 1, n5, 도 5].

Cas 분자

일부 구현예에서, 카고 분자는 Cas 폴리펩티드 또는 이의 단편을 코딩할 수 있는 Cas 폴리펩티드 및/또는 폴리뉴클레오티드일 수 있다. 임의의 Cas 분자는 카고 분자일 수 있다. 일부 구현예에서, 카고 분자는 클래스 I CRISPR-Cas 시스템 Cas 폴리펩티드이다. 일부 구현예에서, 카고 분자는 클래스 II CRISPR-Cas 시스템 Cas 폴리펩티드. 일부 구현예에서, Cas 폴리펩티드는 I형 Cas 폴리펩티드이다. 일부 구현예에서, Cas 폴리펩티드는 II형 Cas 폴리펩티드이다. 일부 구현예에서, Cas 폴리펩티드는 III형 Cas 폴리펩티드이다. 일부 구현예에서, Cas 폴리펩티드는 IV형 Cas 폴리펩티드이다. 일부 구현예에서, Cas 폴리펩티드는 V형 Cas 폴리펩티드이다. 일부 구현예에서, Cas 폴리펩티드는 VI형 Cas 폴리펩티드이다. 일부 구현예에서, Cas 폴리펩티드는 VII형 Cas 폴리펩티드이다. Cas 단백질의 비예시적인 예는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (Csn1 및 Csx12로도 알려짐), Cas10, Cas 12, Cas 12a, Cas 13a, Cas 13b, Cas 13c, Cas 13d, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, 이의 상동체, 또는 이의 변형된 형태를 포함한다.

가이드 서열

본 명세서에서 사용되는, CRISPR-Cas 시스템에서 용어 "가이드 서열" 및 "가이드 분자"는 표적 핵산 서열과 하이브리드하고 표적 핵산 서열과 핵산-표적화 복합체의 서열-특이적 결합을 유도하도록 표적 핵산 서열과 충분한 상보성을 갖는 임의의 폴리뉴클레오티드 서열을 포함한다. 본 명세서에 개시된 방법을 사용해 만들어진 가이드 서열은 전체 길이 가이드 서열, 절두된 가이드 서열, 전체 길이 sgRNA 서열, 절두된 sgRNA 서열, 또는 E+F sgRNA 서열일 수 있다. 각각의 gRNA는 동일하거나 상이한 어댑터 단백질에 특이적인 다수의 결합 인식 부위(예를 들어, 압타머)를 포함하도록 설계될 수 있다. 각각의 gRNA는 전사 시작 부위 (즉, TSS)의 상류에서 -1000 내지 +1 개 핵산, 바람직하게는 -200 개 핵산 영역에 결합하도록 설계될 수 있다. 이 위치화는 유전자 활성화(예를 들어, 전사 활성인자) 또는 유전자 저해(예를 들어, 전사 억제인자)에 영향을 미치는 기능성 도메인을 개선시킨다. 변형된 gRNA는 조성물을 구성하는 하나 이상의 표적 유전자좌(예를 들어, 1 이상의 gRNA, 2 이상의 gRNA, 5 이상의 gRNA, 10 이상의 gRNA, 20 이상의 gRNA, 30 이상의 gRNA, 50 이상의 gRNA에서)로 표적되는 하나 이상의 변형된 gRNA일 수 있다. 상기 다수의 gRNA 서열은 직렬 배열될 수 있고, 바람직하게는 직접 반복부에 의해 구분된다.

일부 구현예에서, 적합한 정렬 알고리즘을 사용해 최적으로 정렬했을 때, 소정 표적 서열에 대한 가이드 서열의 상보성 정도는 약 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99% 이상이다. 일정 예의 구현예에서, 가이드 분자는 가이드 서열 및 표적 서열 간 적어도 하나의 불일치를 갖도록 설계될 수 있는 가이드 서열을 포함하여서, 가이드 서열 및 표적 서열 간에 RNA 듀플렉스가 형성된다. 따라서, 상보성 정도는 바람직하게 99% 미만이다. 예를 들어, 가이드 서열이 24개 뉴클레오티드로 이루어지는 경우에, 상보성 정도는 보다 특히 약 96% 이하이다. 특정 구현예에서, 가이드 서열은 둘 이상의 인접한 불일치 뉴클레오티드의 스트레치를 갖도록 설계되어서, 전체 가이드 서열 상에서 상보성 정도는 더욱 감소된다. 예를 들어, 가이드 서열이 24개 뉴클레오티드로 이루어지는 경우에, 상보성 정도는 둘 이상의 불일치 뉴클레오티드의 스트레치가 2, 3, 4, 5, 6 또는 7 뉴클레오티드 등을 포함하는지 여부에 의존하여, 보다 특히 약 96% 이하, 보다 특히, 약 92% 이하, 보다 특히 약 88% 이하, 보다 특히 약 84% 이하, 보다 특히 약 80% 이하, 보다 특히 약 76% 이하, 보다 특히 약 72% 이하이다. 일부 구현예에서, 하나 이상의 불일치 뉴클레오티드의 스트레치이외에도, 적합한 정렬 알고리즘을 사용해 최적으로 정렬했을 때, 상보성 정도는 약 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99% 이상이다. 최적 정렬은 서열을 정렬하기 위한 임의의 적합한 알고리즘을 사용하여 결정할 수 있고, 이의 비제한적인 예는 스미스-워터만 (Smith-Waterman) 알고리즘, 니들만-분취 (Needleman-Wunsch) 알고리즘, 버로우스-윌러스 (Burrows-Wheeler) 전환 기반 알고리즘 (예를 들어, Burrows Wheeler Aligner), ClustalW, Clustal X, BLAT, Novoalign (Novocraft Technologies; www.novocraft.com에서 입수가능), ELAND (Illumina, San Diego, CA), SOAP (soap.genomics.org.cn에서 입수가능), 및 Maq (maq.sourceforge.net에서 입수가능)을 포함한다. 표적 핵산 서열과 핵산-표적화 복합체의 서열-특이적 결합을 유도하는 (핵산-표적화 가이드 RNA 내) 가이드 서열의 능력은 임의의 적합한 어세이를 통해 평가될 수 있다. 예를 들어, 시험하려는 가이드 서열을 포함하여, 핵산-표적화 복합체를 형성하기에 충분한 핵산-표적화 CRISPR 시스템의 성분은 예컨대 핵산-표적화 복합체의 성분을 코딩하는 벡터에 의한 형질감염에 의해서, 상응하는 표적 핵산 서열을 갖는 숙주 세포에게 제공될 수 있고, 이어서 예컨대 본 명세서에 기술된 바와 같은 Surveyor 어세이를 통해서, 표적 핵산 서열 내에서 우선적인 표적화 (예를 들어, 절단)의 평가를 후속할 수 있다. 유사하게, 표적 핵산 서열 (또는 이의 부근 서열)의 절단은 표적 핵산 서열, 시험하려는 가이드 서열을 포함하여, 핵산-표적화 복합체의 성분 및 시험 가이드 서열과 상이한 대조군 가이드 서열을 제공하고, 시험 및 대조군 가이드 서열 반응 간에 표적 서열 또는 그 부근에서의 결합 또는 절단율을 비교하여 시험관에서 평가될 수 있다. 다른 어세이가 가능하고, 당분야자에게 자명할 것이다. 가이드 서열, 및 따라서 핵산-표적화 가이드 RNA는 임의의 표적 핵산 서열을 표적화하도록 선택될 수 있다.

본 명세서에서 사용되는, V형 또는 VI형 CRISPR-Cas 유전자좌 이펙터 단백질의 "crRNA" 또는 "가이드 RNA" 또는 "단일 가이드 RNA" 또는 "sgRNA" 또는 "하나 이상의 핵산 성분"이라는 용어는 표적 핵산 서열과 혼성화하고 표적 핵산 서열에 대한 핵산-표적화 복합체의 서열-특이적 결합을 유도하기에 충분한 표적 핵산 서열과의 상보성을 갖는 임의의 폴리뉴클레오티드 서열을 포함한다. 일부 구현예에서, 적합한 정렬 알고리즘을 사용해 최적으로 정렬될 때, 상보성 정도는 약 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99% 이상이다. 최적 정렬은 서열을 정렬하기 위한 임의의 적합한 알고리즘을 사용하여 결정할 수 있고, 이의 비제한적인 예는 스미스-워터만 (Smith-Waterman) 알고리즘, 니들만-분취 (Needleman-Wunsch) 알고리즘, 버로우스-윌러스 (Burrows-Wheeler) 전환 기반 알고리즘 (예를 들어, Burrows Wheeler Aligner), ClustalW, Clustal X, BLAT, Novoalign (Novocraft Technologies; www.novocraft.com에서 입수가능), ELAND (Illumina, San Diego, CA), SOAP (soap.genomics.org.cn에서 입수가능), 및 Maq (maq.sourceforge.net에서 입수가능)을 포함한다. 표적 핵산 서열에 대한 핵산-표적화 복합체의 서열-특이적 결합을 유도하는 (핵산-표적화 가이드 RNA 내의) 가이드 서열의 능력은 임의의 적합한 어세이에 의해 평가될 수 있다. 예를 들어, 시험하려는 가이드 서열을 포함하여, 핵산-표적화 복합체를 형성하기 위해 충분한 핵산-표적화 CRISPR 시스템의 성분은 예컨대 핵산-표적화 복합체의 성분을 코딩하는 벡터에 의한 형질감염 이후, 예컨대 본 명세서에 기술된 바와 같은 Surveyor 어세이를 통하여, 표적 핵산 서열 내 선호 표적화 (예를 들어, 절단)를 평가하여, 상응하는 표적 핵산 서열을 갖는 숙주 세포에 제공될 수 있다. 유사하게는, 표적 핵산 서열의 절단은 시험될 가이드 서열 및 시험 가이드 서열과 상이한 대조군 가이드 서열을 비롯한, 핵산-표적화 복합체 성분인 표적 핵산 서열을 제공함으로써, 그리고 시험 가이드 서열과 대조군 가이드 서열 반응 사이의 표적 서열에서 결합 또는 절단 비율을 비교함으로써 시험 튜브에서 평가될 수 있다. 다른 어세이가 가능하고, 당업자에게 자명할 것이다. 임의의 표적 핵산 서열을 표적화하기 위해 가이드 서열, 및 그에 따른 핵산-표적화 가이드가 선택될 수 있다. 표적 서열은 DNA일 수 있다. 표적 서열은 임의의 RNA 서열일 수 있다. 일부 구현예에서, 표적 서열은 전령 RNA (mRNA), 프리-mRNA, 리보솜 RNA (rRNA), 운반 RNA (tRNA), 마이크로-RNA (miRNA), 소형 간섭 RNA (siRNA), 소형 핵 RNA (snRNA), 소형 핵소체 RNA (snoRNA), 이중 가닥 RNA (dsRNA), 비코딩 RNA (ncRNA), 장형 비코딩 RNA (lncRNA), 및 소형 세포질 RNA (scRNA)로 이루어진 군으로부터 선택되는 RNA 분자 내 서열일 수 있다. 일부 바람직한 구현예에서, 표적 서열은 mRNA, 프리-mRNA, 및 rRNA로 이루어진 군으로부터 선택되는 RNA 분자 내 서열일 수 있다. 일부 바람직한 구현예에서, 표적 서열은 ncRNA, 및 lncRNA로 이루어진 군으로부터 선택되는 RNA 분자 내 서열일 수 있다. 일부 보다 바람직한 구현예에서, 표적 서열은 mRNA 분자 또는 프리-mRNA 분자 내 서열일 수 있다.

일부 구현예에서, 핵산-표적화 가이드는 핵산-표적화 가이드에서 2차 구조 정도를 감소시키도록 선택된다. 일부 구현예에서, 핵산-표적화 가이드의 뉴클레오티드의 약 75%, 50%, 40%, 30%, 25%, 20%, 15%, 10%, 5%, 1% 이하가 최적으로 폴딩될 때 자기-상보성 염기 쌍형성에 참여한다. 최적의 폴딩은 임의의 적합한 폴리뉴클레오티드 폴딩 알고리즘에 의해 결정될 수 있다. 일부 프로그램은 깁스 (Gibbs) 자유 에너지의 계산을 기반으로 한다. 이러한 알고리즘의 일례는 mFold로서, Zuker and Stiegler (Nucleic Acids Res. 9 (1981), 133-148)에 기술된다. 또 다른 폴딩 알고리즘의 예는 중심 구조 예측 알고리즘을 사용하여, 비엔나 대학의 이론 화학 연구소 (Institute for Theoretical Chemistry at the University of Vienna) 에서 개발한 온라인 웹서버 RNAfold 이다 (참조: 예를 들어, A.R. Gruber et al., 2008, Cell 106(1): 23-24; 및 PA Carr and GM Church, 2009, Nature Biotechnology 27(12): 1151-62).

일정 구현예에서, 가이드 RNA 또는 crRNA 는 직접 반복 (DR) 서열 및 가이드 서열 또는 스페이서 서열을 포함할 수 있거나, 그로 본질적으로 이루어질 수 있거나, 그로 이루어질 수 있다. 일정 구현예에서, 가이드 RNA 또는 crRNA 는 가이드 서열 또는 스페이서 서열에 융합되거나 연결된 직접 반복 서열을 포함할 수 있거나, 본질적으로 그로 이루어질 수 있거나, 그로 이루어질 수 있다. 일정 구현예에서, 직접 반복부 서열은 가이드 서열 또는 스페이서 서열로부터 상류 (즉, 5') 에 위치될 수 있다. 다른 구현예에서, 직접 반복부 서열은 가이드 서열 또는 스페이서 서열로부터 하류 (즉, 3')에 위치될 수 있다.

일정 구현예에서, tcrRNA는 스템 루프, 바람직하게 단일 스템 루프를 포함한다. 일정 구현예에서, 직접 반복부 서열은 스템 루프, 바람직하게 단일 스템 루프를 형성한다.

일정 구현예에서, 가이드 RNA의 스페이서 길이는 15 내지 35 nt이다. 일정 구현예에서, 가이드 RNA의 스페이서 길이는 적어도 15 뉴클레오티드이다. 일정 구현예에서, 스페이서 길이는 15 내지 17 nt, 예를 들어, 15, 16, 또는 17 nt, 17 내지 20 nt, 예를 들어, 17, 18, 19, 또는 20 nt, 20 내지 24 nt, 예를 들어, 20, 21, 22, 23, 또는 24 nt, 23 내지 25 nt, 예를 들어, 23, 24, 또는 25 nt, 24 내지 27 nt, 예를 들어, 24, 25, 26, 또는 27 nt, 27-30 nt, 예를 들어, 27, 28, 29, 또는 30 nt, 30-35 nt, 예를 들어, 30, 31, 32, 33, 34, 또는 35 nt, 또는 35 nt 이상이다.

"tracrRNA" 서열 또는 유사한 용어는 혼성화하도록 cRNA 서열과 충분한 상동성을 갖는 임의의 폴리뉴클레오티드 서열을 포함한다. 일부 구현예에서, 최적으로 정렬될 때 둘 중 더 짧은 것의 길이를 따라서 tracrRNA 서열과 crRNA 서열 사이의 상보성 정도는 약 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97.5%, 99% 이상이다. 일부 구현예에서, tracr 서열은 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 40, 50 개 이상의 뉴클레오티드 길이이다. 일부 구현예에서, tracr 서열 및 crRNA 서열은, 둘 사이의 혼성화가 2차 구조, 예컨대 헤어핀을 갖는 전사물을 생성하도록 단일 전사물 내에 함유된다. 본 발명의 구현예에서, 전사물 또는 전사된 폴리뉴클레오티드 서열은 적어도 둘 이상의 헤어핀을 갖는다. 바람직한 구현예에서, 전사물은 2, 3, 4 또는 5 개의 헤어핀을 갖는다. 본 발명의 추가 구현예에서, 전사물은 최대 5 개의 헤어핀을 갖는다. 헤어핀 구조에서, 최종 "N"의 서열 5' 부분 및 루프의 상류는 tracr 메이트 서열에 대응하고, 루프의 서열 3'의 부분은 tracr 서열에 대응한다.

일반적으로, 상보성 정도는 두 서열 중 더 짧은 것의 길이를 따라서, sca 서열 및 tracr 서열의 최적의 정렬에 관한 것이다. 최적 정렬은 임의의 적합한 정렬 알고리즘에 의해 결정될 수 있고, 이차 구조, 예컨대 sca 서열 또는 tracr 서열 내 자가-상보성에 대해 더욱 설명될 수 있다. 일부 구현예에서, 최적으로 정렬될 때 둘 중 더 짧은 것의 길이를 따라서 tracr 서열과 sca 서열 사이의 상보성 정도는 약 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97.5%, 99% 이상이다.

일반적으로, CRISPR-Cas, CRISPR-Cas9 또는 CRISPR 시스템은 앞서 언급한 문헌, 예컨대 WO 2014/093622 (PCT/US2013/074667) 에서 사용되는 바와 같을 수 있고, Cas 유전자, CRISPR-Cas9 의 경우 특히 Cas9 유전자를 인코딩하는 서열, tracr (트랜스-활성화 CRISPR) 서열 (예를 들어, tracrRNA 또는 활성 부분 tracrRNA), tracr-메이트 서열 ("직접 반복부" 및 내생성 CRISPR 시스템과 관련하여 tracrRNA-가공 부분적 직접 반복부를 포괄), 가이드 서열 (또한 내생성 CRISPR 시스템과 관련하여 "스페이서" 로도 지칭), 또는 본원에서 사용되는 바와 같은 용어인 "RNA(들)" (예를 들어, 가이드 Cas9 에 대한 RNA(들), 예를 들어, CRISPR RNA 및 트랜스 활성화 (tracr) RNA 또는 단일 가이드 RNA (sgRNA) (키메라 RNA)), 또는 CRISPR 유전자좌로부터의 다른 서열 및 전사체를 비롯하여, CRISPR-연관 ("Cas") 유전자의 발현에 연루되거나 또는 이들 유전자의 활성을 유도하는 전사체 및 다른 구성요소를 총괄적으로 지칭한다. 일반적으로, CRISPR 시스템은 표적 서열 (내생성 CRISPR 시스템의 경우 프로토스페이서로도 지칭) 의 부위에서 CRISPR 복합체의 형성을 촉진하는 구성요소를 특징으로 한다. CRISPR 복합체 형성의 맥락에서, "표적 서열" 은 가이드 서열이 상보성을 갖도록 설계된 서열을 지칭하며, 여기서, 표적 서열과 가이드 서열 사이의 하이브리드화는 CRISPR 복합체의 형성을 촉진시킨다. 표적 서열에 대한 상보성이 절단 활성에 중요한 가이드 서열의 섹션은 본 명세서에서 종자 서열로서 지칭된다. 표적 서열은 임의의 폴리뉴클레오티드, 예컨대 DNA 또는 RNA 폴리뉴클레오티드를 포함할 수 있다. 일부 구현예에서, 표적 서열은 세포의 핵 또는 세포질에 위치되고, 세포 내에 존재하는 미토콘드리아, 세포소기관, 소포체, 리포솜 또는 입자 내 또는 그로부터의 핵산을 포함할 수 있다. 일부 구현예에서, 특히 비-핵 용도의 경우에, NLS는 바람직하지 않다. 일부 구현예에서, CRISPR 시스템은 하나 이상의 핵 유출 신호 (NES) 를 포함한다. 일부 구현예에서, CRISPR 시스템은 하나 이상의 NLS 및 하나 이상의 NES 를 포함한다. 일부 구현예에서, 직접 반복부는 임의의 또는 모든 하기 기준을 충족하는 반복 모티프를 검색하여 인 실리코에서 확인될 수 있다: 1. II형 CRISPR 유전자좌에 측접된 게놈 서열의 2 kb창에 존재; 2. 20 내지 50 bp 범위; 및 3. 20 내지 50 bp 간격. 일부 구현예에서, 이들 기준 중 2 가지, 예를 들어 1 및 2, 2 및 3, 또는 1 및 3이 사용될 수 있다. 일부 구현예에서, 3 가지 기준 모두가 사용될 수 있다.

본 발명의 구현예에서, 용어 가이드 서열 및 가이드 RNA, 즉, 표적 게놈 유전자좌에 Cas를 가이드할 수 있는 RNA는 이전에 인용된 문헌 예컨대 국제 특허 출원 공개 번호 WO 2014/093622 (PCT/US2013/074667)에서 처럼 상호교환적으로 사용된다. 일반적으로, 가이드 서열은 표적 서열과 하이브리드화하기 위해 표적 폴리뉴클레오티드 서열과 충분한 상보성 및 표적 서열에 대한 CRISPR 복합체의 직접 서열-특이적 결합을 갖는 임의의 폴리뉴클레오티드 서열이다. 일부 구현예에서, 가이드 서열과 그의 상응하는 표적 서열 간의 상보성의 정도는 적절한 정렬 알고리즘을 사용하여 최적으로 정렬되는 경우, 약 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99% 이상이다. 최적 정렬은 서열을 정렬하기 위한 임의의 적합한 알고리즘의 사용으로 결정될 수 있고, 이의 비제한적인 예는 스미스-워터만 (Smith-Waterman) 알고리즘, 니들만-분취 (Needleman-Wunsch) 알고리즘, 버로우스-윌러 (Burrows-Wheeler) 전환 기반 알고리즘 (예를 들어, 버로우 윌러 얼라이너), ClustalW, Clustal X, BLAT, Novoalign (Novocraft Technologies; novocraft.com에서 이용가능), ELAND (Illumina, San Diego, CA), SOAP (soap.genomics.org.cn에서 이용가능), 및 Maq (maq.sourceforge.net에서 이용가능)을 포함한다. 일부 구현예에서, 가이드 서열은 약 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75개 이상의 뉴클레오티드 길이, 또는 그 이상의 뉴클레오티드 길이이다. 일부 구현예에서, 가이드 서열은 약 75, 50, 45, 40, 35, 30, 25, 20, 15, 12개 미만의 뉴클레오티드 길이, 또는 그 이하의 뉴클레오티드 길이이다. 바람직하게, 가이드 서열은 10-30 뉴클레오티드 길이이다. 표적 서열에 대한 CRISPR 복합체의 서열-특이적 결합을 유도하는 가이드 서열의 능력은 임의의 적합한 어세이에 의해 평가될 수 있다. 예를 들어, 시험될 가이드 서열을 비롯하여 CRISPR 복합체를 형성하는 데 충분한 CRISPR 시스템의 성분은 대응하는 표적 서열을 갖는 숙주 세포에, 예컨대 CRISPR 서열의 성분을 암호화하는 벡터로 형질감염에 의해, 그 다음에 표적 서열 내의 우선적인 절단의 평가, 예컨대 본 명세서에 기재된 바와 같은 서베이어 (Surveyor) 분석에 의해 대응하는 표적 서열을 갖는 숙주 세포에 제공될 수 있다. 유사하게, 표적 폴리뉴클레오티드 서열의 절단은 표적 서열, 시험되는 가이드 서열 및 시험 가이드 서열과 상이한 대조군 가이드 서열을 포함하는 CRISPR 복합체의 성분을 제공하고, 표적 서열에서 시험 및 대조군 가이드 서열 반응 간의 결합 또는 절단 비율을 비교함으로써 시험관에서 평가될 수 있다. 다른 어세이가 가능하고, 당업자에게 존재할 수 있다.

CRISPR-Cas 시스템의 일부 구현예에서, 가이드 서열과 이에 상응하는 표적 서열 사이의 상보성 정도는 약 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99%, 또는 100% 이상일 수 있고; 가이드 또는 RNA 또는 sgRNA 는 약 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75 개 이상의 뉴클레오티드 길이일 수 있거나; 가이드 또는 RNA 또는 sgRNA 는 약 75, 50, 45, 40, 35, 30, 25, 20, 15, 12개 이하의 뉴클레오티드 길이일 수 있고; 유리하게는 tracr RNA 는 30 또는 50개 뉴클레오티드 길이이다. 그러나, 본 발명의 구현예는 오프-표적 상호작용을 감소시키는 것이고, 예를 들어 낮은 상보성을 갖는 표적 서열과 상호작용하는 가이드를 감소시키는 것이다. 실제로, 예에서, 80% 초과 내지 약 95% 상보성, 예를 들어, 83%- 84% 또는 88- 89% 또는 94- 95% 상보성을 갖는 오프-표적 서열과 표적 서열을 구별할 수 있는 CRISPR-Cas 시스템을 생성시키는 돌연변이를 포함한다는 것을 보여준다 (예를 들어, 18 개 뉴클레오티드를 갖는 표적과 1, 2 또는 3 개 미스매치를 갖는 18 개 뉴클레오티드의 오프-표적을 구별함). 따라서, 본 발명의 상황에서, 가이드 서열과 이의 상응하는 표적 서열 사이의 상보성 정도는 94.5% 또는 95% 또는 95.5% 또는 96% 또는 96.5% 또는 97% 또는 97.5% 또는 98% 또는 98.5% 또는 99% 또는 99.5% 또는 99.9%, 또는 100% 초과이다. 오프-표적은 서열과 가이드 사이에, 100% 또는 99.9% 또는 99.5% 또는 99% 또는 99% 또는 98.5% 또는 98% 또는 97.5% 또는 97% 또는 96.5% 또는 96% 또는 95.5% 또는 95% 또는 94.5% 또는 94% 또는 93% 또는 92% 또는 91% 또는 90% 또는 89% 또는 88% 또는 87% 또는 86% 또는 85% 또는 84% 또는 83% 또는 82% 또는 81% 또는 80% 미만의 상보성이며, 오프-표적이 서열과 가이드 사이에, 100% 또는 99.9% 또는 99.5% 또는 99% 또는 99% 또는 98.5% 또는 98% 또는 97.5% 또는 97% 또는 96.5% 또는 96% 또는 95.5% 또는 95% 또는 94.5% 의 상보성인 것이 유리하다.

본 발명에 따른 특히 바람직한 구현예에서, 가이드 RNA (Cas를 표적 유전자좌로 가이드할수 있음)는 (1) 진핵생물 세포에서 게놈 표적 유전자좌와 혼성화할 수 있는 가이드 서열; (2) tracr 서열; 및 (3) tracr 메이트 서열을 포함할 수 있다. (1) 내지 (3)의 전부는 단일 RNA, 즉 sgRNA (5' 내지 3' 배향으로 배열됨)에 존재할 수 있거나, 또는 tracr는 가이드 및 tracr 서열을 함유하는 RNA와 상이한 RNA일 수 있다. tracr은 tracr 메이트 서열과 혼성화하고 CRISPR/Cas 복합체를 표적 서열로 유도한다. tracr RNA가 가이드 및 tracr 서열을 함유하는 RNA와 상이한 RNA 상에 있는 경우에, 각각의 RNA의 길이는 그들의 각각의 천연 길이로부터 단축되어 최적화될 수 있고, 각각은 세포 RNase에 의한 분해로부터 보호하거나 또는 안정성을 증가시키도록 독립적으로 화학적으로 변형될 수 있다.

본 명세서에 기재된 바와 같은 본 발명에 따른 방법은 본 명세서에 논의되는 바와 같은 벡터에 세포를 전달하는 단계를 포함하는 본 명세서에 논의된 바와 같은 진핵 세포에서(시험관내, 즉, 단리된 진핵 세포에서) 하나 이상의 돌연변이를 유도하는 것이 이해된다. 돌연변이(들)는 가이드(들) RNA(들) 또는 sgRNA(들)을 통해 세포(들)의 각 표적 서열에서 하나 이상의 뉴클레오티드의 도입, 결실, 또는 치환을 포함할 수 있다. 돌연변이는 가이드(들) RNA(들) 또는 sgRNA(들)를 통해 상기 세포(들)의 각 표적 서열에 1 내지 75개 뉴클레오티드의 도입, 결실, 또는 치환을 포함할 수 있다. 돌연변이는 가이드(들) RNA(들) 또는 sgRNA(들)를 통해 상기 세포(들)의 각 표적 서열에 1, 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 또는 75개 뉴클레오티드의 도입, 결실, 또는 치환을 포함할 수 있다. 돌연변이는 가이드(들) RNA(들) 또는 sgRNA(들)를 통해 상기 세포(들)의 각 표적 서열에 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 또는 75개 뉴클레오티드의 도입, 결실 또는 치환을 포함할 수 있다. 돌연변이는 가이드(들) RNA(들) 또는 sgRNA(들)를 통해 상기 세포(들)의 각 표적 서열에 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 또는 75개 뉴클레오티드의 도입, 결실, 또는 치환을 포함할 수 있다. 돌연변이는 가이드(들) RNA(들) 또는 sgRNA(들)을 통해서 상기 세포(들)의 각 표?? 서열에 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 또는 75개 뉴클레오티드의 도입, 결실, 또는 치환을 포함할 수 있다. 돌연변이는 가이드(들) RNA(들) 또는 sgRNA(들)를 통해서 상기 세포(들)의 각 표적 서열에 40, 45, 50, 75, 100, 200, 300, 400 또는 500개 뉴클레오티드의 도입, 결실, 또는 치환을 포함할 수 있다.

독성 및 오프-표적 효과의 최소화를 위해, 전달된 Cas mRNA 및 가이드 RNA의 농도를 제어하는 것이 중요할 수 있다. Cas mRNA 및 가이드 RNA의 최적의 농도는 세포의 또는 비인간 진핵동물 모델에서 상이한 농도를 시험함으로써 그리고 잠재적 비표적 게놈 좌위에서 변형 정도를 분석하는 심층 서열분석을 이용함으로써 결정될 수 있다. 대안적으로, 독성 및 비표적 효과 수준을 최소화하기 위해, Cas 틈내기효소 mRNA (예를 들어, D10A 돌연변이를 갖는 에스. 피오게네스(S. pyogenes) Cas9)는 관심 대상 부위를 표적화하는 가이드 RNAn 쌍으로 전달될 수 있다. 독성 및 오프-표적 효과를 최소화하기 위한 가이드 서열 및 전력은 WO 2014/093622 (PCT/US2013/074667) 처럼; 또는 본 명세서처럼 돌연변이를 통할 수 있다.

전형적으로, 내생성 CRISPR 시스템과 관련하여, CRISPR 복합체(표적 서열에 혼성화되고 하나 이상의 Cas 단백질과 복합체화된 가이드 서열을 포함)의 형성은 표적 서열에서 또는 근처에서 (예를 들어, 표적 서열로부터 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 이상의 염기 내에서) 가닥 중 하나 또는 둘 다의 절단을 초래한다. 이론에 국한하려는 것은 아니나, 야생형 tracr 서열의 전부 또는 일부 (예를 들어, 야생형 tracr 서열의 약 20, 26, 32, 45, 48, 54, 63, 67, 85, 또는 그 이상의 뉴클레오티드 또는 이의 초과)를 포함할 수 있거나 또는 그로 이루어질 수 있는 tracr 서열 (적용가능하거나 또는 존재하면)은 예컨대 또한 tracr 서열의 적어도 일부분을 따라서 가이드 서열에 작동적으로 연결된 tracr 메이트 서열의 전부 또는 일부와 혼성화하여, CRISPR 복합체의 일부를 형성할 수 있다.

일정 구현예에서, 본 발명의 가이드는 비-천연 발생 핵산 및/또는 비-천연 발생 뉴클레오티드 및/또는 뉴클레오티드 유사체, 및/또는 화학적 변형을 포함한다. 비-천연 발생 핵산은 예를 들어 천연 및 비-천연 뉴클레오티드의 혼합물을 포함할 수 있다. 본 발명의 구현예에서, 가이드 핵산은 리보뉴클레오티드 및 비-리보뉴클레오티드를 포함한다. 이러한 일 구현예에서, 가이드는 하나 이상의 리보뉴클레오티드 및 하나 이상의 데옥시리보뉴클레오티드를 포함한다. 본 발명의 구현예에서, 가이드는 하나 이상의 비-천연 발생 뉴클레오티드 또는 뉴클레오티드 유사체 예컨대 포스포로티오에이트 연결, 보라노포스페이트 연결을 갖는 뉴클레오티드, 리보스 고리의 2' 및 4' 탄소 사이에 메틸렌 가교를 포함하는 잠김 핵산 (LNA) 뉴클레오티드, 펩티드 핵산 (PNA), 또는 가교된 핵산 (BNA)을 포함한다. 변형된 뉴클레오티드의 다른 예는 2'-O-메틸 유사체, 2'-데옥시 유사체, 2-티오우리딘 유사체, N6-메틸아데노신 유사체, 또는 2'-플루오로 유사체를 포함한다. 변형된 뉴클레오티드의 예는 펩티드, 핵 국재화 서열 (NLS), 펩티드 핵산 (PNA), 폴리에틸렌 글리콜 (PEG), 트리에틸렌 글리콜, 또는 테트라에틸렌글리콜 (TEG)을 포함하지만, 이에 제한되지 않는, 2' 위치에 화학적 모이어티의 연결을 포함한다. 변형된 염기의 추가 예는 2-아미노푸린, 5-브로모-우리딘, 슈도우리딘 (Ψ), N¹-메틸슈도우리딘 (me¹Ψ), 5-메톡시우리딘 (5moU), 이노신, 7-메틸구아노신을 포함하지만, 이에 제한되지 않는다. 가이드 RNA 화학 변형의 예는 제한없이, 하나 이상의 말단 뉴클레오티드에 2'-O-메틸 (M), 2'-O-메틸-3'-포스포로티오에이트 (MS), 포스포로티오에이트 (PS), S-제약된 에틸(cEt), 2'-O-메틸-3'-티오PACE (MSP), 또는 2'-O-메틸-3'-포스포노아세테이트 (MP)의 도입을 포함한다. 이러한 화학적으로 변형된 가이드는, 온-표적 대 오프-표적 특이성이 예측가능하지 않다고 해도, 비변형 가이드에 비해 증가된 안정성 및 증가된 활성을 포함할 수 있다 (참조: Hendel, 2015, Nat Biotechnol. 33(9):985-9, doi: 10.1038/nbt.3290, published online 29 June 2015; Ragdarm et al., 0215, PNAS, E7110-E7111; Allerson et al., J. Med. Chem. 2005, 48:901-904; Bramsen et al., Front. Genet., 2012, 3:154; Deng et al., PNAS, 2015, 112:11870-11875; Sharma et al., MedChemComm., 2014, 5:1454-1471; Hendel et al., Nat. Biotechnol. (2015) 33(9): 985-989; Li et al., Nature Biomedical Engineering, 2017, 1, 0066 DOI:10.1038/s41551-017-0066; Ryan et al., Nucleic Acids Res. (2018) 46(2): 792-803). 일부 구현예에서, 가이드 RNA 의 5' 및/또는 3' 말단은 형광 염료, 폴리에틸렌 글리콜, 콜레스테롤, 단백질 또는 검출 표지를 비롯한, 다양한 기능적 모이어티에 의해 변형된다 (참조: Kelly et al., 2016, J. Biotech. 233:74-83). 일정 구현예에서, 특정 구현예에서, 가이드는 표적 DNA에 결합하는 영역 내에 리보뉴클레오티드 및 Cas9, Cpf1, 또는 C2c1에 결합하는 영역 내에 하나 이상의 데옥시리보뉴클레오티드 및/또는 뉴클레오티드 유사체를 포함한다. 본 발명의 구현예에서, 데옥시리보뉴클레오티드 및/또는 뉴클레오티드 유사체는 조작된 가이드 구조, 예컨대, 제한없이, 5' 및/또는 3' 말단, 스템-루프 영역, 및 시드 영역에 도입된다. 일정 구현예에서, 변형은 스템-루프 영역의 5'-핸들에 존재하지 않는다. 가이드의 스템-루프 영역의 5'-핸들에서 화학적 변형은 이의 기능을 없앨 수 있다 (참조: Li, et al., Nature Biomedical Engineering, 2017, 1:0066). 일정 구현예에서, 가이드의 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 또는 75개 뉴클레오티드는 화학적으로 변형된다. 일부 구현예에서, 가이드의 3' 또는 5' 말단에서 3-5개 뉴클레오티드가 화학적으로 변형된다. 일부 구현예에서, 오직 소수 변형, 예컨대 2'-F 변형이 시드 영역에 도입된다. 일부 구현예에서, 2'-F 변형은 가이드의 3' 말단에 도입된다. 일정 구현예에서, 가이드의 5' 및/또는 3' 말단에 3 내지 5개 뉴클레오티드는 2'-O-메틸 (M), 2'-O-메틸-3'-포스포로티오에이트 (MS), S-제약된 에틸(cEt), 2'-O-메틸-3'-티오PACE (MSP), 또는 2'-O-메틸-3'-포스포노아세테이트 (MP)로 화학적으로 변형된다. 이러한 변형은 게놈 편집 효율을 증가시킬 수 있다 (참조: Hendel et al., Nat. Biotechnol. (2015) 33(9): 985-989; Ryan et al., Nucleic Acids Res. (2018) 46(2): 792-803). 일정 구현예에서, 가이드의 모든 포스포디에스테르 결합은 유전자 파괴 수준을 향상시키기 위해 포스포로티오에이트 (PS)로 치환된다. 일정 구현예에서, 이드의 5' 및/또는 3' 말단에서 5개 초과의 뉴클레오티드가 2'-O-Me, 2'-F 또는 S-구속형 에틸(cEt)로 화학적으로 치환된다. 이러한 화학적으로 변형된 가이드는 유전자 파괴의 증강된 수준을 매개할 수 있다 (참조: Ragdarm et al., 0215, PNAS, E7110-E7111). 본 발명의 구현예에서, 가이드는 이의 3' 및/또는 5' 말단에서 화학적 모이어티를 포함하도록 변형된다. 이러한 모이어티는 아민, 아자이드, 알카인, 티오, 다이벤조사이클로옥틴(DBCO), 로다민, 펩타이드, 핵 국소화 서열(NLS), 펩타이드 핵산(PNA), 폴리에틸렌 글리콜(PEG), 트라이에틸렌 글리콜 또는 테트라에틸렌글리콜(TEG)을 포함하지만, 이들로 제한되지 않는다. 일정 구현예에서, 화학적 모이어티는 링커, 예컨대, 알킬쇄에 의해 가이드에 접합된다. 일정 구현예에서, 변형된 가이드의 화학적 모이어티는 다른 분자, 예컨대, DNA, RNA, 단백질 또는 나노입자에 가이드를 부착시키는 데 사용될 수 있다. 이러한 화학적으로 변형된 가이드는 CRISPR 시스템에 의해 유전적으로 편집된 세포를 확인하거나 또는 농축시키는데 사용될 수 있다 (참조: Lee et al., eLife, 2017, 6:e25312, DOI:10.7554). 일부 구현예에서, 3' 및 5' 말단 각각에 3개 뉴클레오티드가 화학적으로 변형된다. 특정 구현예에서, 변형은 2'-O-메틸 또는 포스포로티오에이트 유사체를 포함한다. 특정 구현예에서, 테트라루프에서 12개의 뉴클레오타이드 및 스템-루프 영역에서 16개의 뉴클레오타이드는 2'-O-메틸 유사체로 치환된다. 이러한 화학적 변형은 생체내 편집 및 안정성을 개선시킨다 (참조: Finn et al., 세포 Reports (2018), 22: 2227-2235). 일부 구현예에서, 가이드의 60개 또는 70개 초과 뉴클레오티드는 화학적으로 변형된다. 일부 구현예에서, 이 변형은 2'-O-메틸 또는 2'-플루오로뉴클레오타이드 유사체 또는 포스포로티오에이트(PS) 변형을 갖는 뉴클레오타이드의 포스포로다이에스테르 결합으로의 치환을 포함한다. 일부 구현예에서, 화학적 변형은 CRISPR 복합체가 형성될 때 뉴클레아제 단백질 외부로 연장되는 가이드 뉴클레오티드의 2'-O-메틸 또는 2'-플루오로 변형 또는 가이드의 3'-말단의 20 내지 30개 이상의 뉴클레오티드의 PS 변형을 포함한다. 특정 구현예에서, 화학적 변형은 시드 및 꼬리부 영역에서 가이드 또는 2'-플루오로유사체의 5' 말단에서 2'-O-메틸 유사체를 추가로 포함한다. 이러한 화학적 변형은 뉴클레아제 분해에 대한 안정성을 개선시키고, 게놈-편집 활성 또는 효율을 유지하거나 향상시키지만, 모든 뉴클레아제의 변형은 가이드의 작용을 없앨 수 있다 (참조: Yin et al., Nat. Biotech. (2018), 35(12): 1179-1187). 이러한 화학적 변형은 제한된 수의 뉴클레아제 및 RNA 2'-OH 상호작용의 지식을 비롯한, CRISPR 복합체 구조의 지식에 의해 가이드될 수 있다 (참조: Yin et al., Nat. Biotech. (2018), 35(12): 1179-1187). 일부 구현예에서, 하나 이상의 가이드 RNA 뉴클레오티드는 DNA 뉴클레오티드로 치환될 수 있다. 일부 구현예에서, 5'-말단 꼬리부/시드 가이드 영역의 최대 2, 4, 6, 8, 10, 또는 12개 RNA 뉴클레오티드는 DNA 뉴클레오티드로 치환된다. 일정 구현예에서, 3' 말단에서 가이드 RNA 뉴클레오티드의 대부분은 DNA 뉴클레오티드로 치환된다. 특정 구현예에서, 3' 말단에서 16개 가이드 RNA 뉴클레오티드는 DNA 뉴클레오티드로 치환된다. 특정 구현예에서, 5'-말단 꼬리부/시드 영역에서 8개 가이드 RNA 뉴클레오티드 및 3' 말단에서 16개 RNA 뉴클레오티드는 DNA 뉴클레오티드로 치환된다. 특정 구현예에서, CRISPR 복합체가 형성될 때 뉴클레아제 단백질의 외부로 연장되는 가이드 RNA 뉴클레오티드는 DNA 뉴클레오티드로 치환된다. DNA 뉴클레오티드로 다수의 RNA 뉴클레오티드의 이러한 치환은 미변형된 가이드와 비교하여 감소한 오프-표적 활성이지만 유사한 온-표적 활성을 야기하지만; 3' 말단에서 모든 RNA 뉴클레오티드의 치환은 가이드의 기능을 없앨 수 있다 (see Yin et al., Nat. Chem. Biol. (2018) 14, 311-316). 이러한 변형은 제한된 수의 뉴클레아제 및 RNA 2'-OH 상호작용의 지식을 포함하여, CRISPR 복합체의 구조의 지식에 의해 가이드될 수 있다 (참조: Yin et al., Nat. Chem. Biol. (2018) 14, 311-316).

본 발명의 일 구현예에서, 가이드는 시드 영역 및 3'-말단을 더 포함하는 가이드 절편 및 5'-핸들을 갖는, Cpf1에 대한 변형된 crRNA를 포함한다. 일부 구현예에서, 일부 실시형태에서, 변형된 가이드는 아시다미노코커스 종 (Acidaminococcus sp.) BV3L6 Cpf1(AsCpf1); 프란시셀라 툴라렌시스 아종 노비시다 (Francisella tularensis subsp. Novicida) U112 Cpf1(FnCpf1); 엘. 박테리움 (L. bacterium) MC2017 Cpf1(Lb3Cpf1); 부티리비브리오 프로테오클라스티쿠스 (Butyrivibrio proteoclasticus) Cpf1(BpCpf1); 파르쿠박테리아 박테리움 (Parcubacteria bacterium) GWC2011_GWC2_44_17 Cpf1(PbCpf1); 프레그린박테리아 박테리움 (Peregrinibacteria bacterium) GW2011_GWA_33_10 Cpf1(PeCpf1); 렙토스피라 이나다이 Cpf1(LiCpf1); 스미텔라 종 (Smithella sp.) SC_K08D17 Cpf1(SsCpf1); 엘. 박테리움 MA2020 Cpf1(Lb2Cpf1); 포르피로모나스 크레비오리카니스(Porphyromonas crevioricanis) Cpf1(PcCpf1); 포르피로모나스 마카카 (Porphyromonas macacae) Cpf1(PmCpf1); 칸디다투스 메타노플라스마 터미툼 (Candidatus Methanoplasma termitum) Cpf1(CMtCpf1); 유박테리움 엘리겐스 (Eubacterium eligens) Cpf1(EeCpf1); 모락셀라 보보쿨리 (Moraxella bovoculi) 237 Cpf1(MbCpf1); 프레보텔라 디시엔스 (Prevotella disiens) Cpf1(PdCpf1); 또는 엘. 박테리움 ND2006 Cpf1(LbCpf1) 중 어느 하나의 Cpf1과 함께 사용될 수 있다.

일부 구현예에서, 가이드에 대한 변형은 화학적 변형, 삽입, 결실 또는 분할이다. 일부 구현예에서, 화학적 변형은 2'-O-메틸 (M) 유사체, 2'-데옥시 유사체, 2-티오우리딘 유사체, N6-메틸아데노신 유사체, 2'-플루오로 유사체, 2-아미노푸린, 5-브로모-우리딘, 슈도우리딘 (Ψ), N¹-메틸슈도우리딘 (me¹Ψ), 5-메톡시우리딘(5moU), 이노신, 7-메틸구아노신, 2'-O-메틸-3'-포스포로티오에이트 (MS), S-제약된 에틸(cEt), 포스포로티오에이트 (PS), 2'-O-메틸-3'-티오PACE (MSP), 또는 2'-O-메틸-3'-포스포노아세테이트 (MP)의 도입을 포함하지만, 이에 제한되지 않는다. 일부 구현예에서, 가이드는 하나 이상의 포스포로티오에이트 변형을 포함한다. 일정 구현예에서, 가이드의 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 또는 25개 뉴클레오티드는 화학적으로 변형된다. 일부 구현예에서, 모든 뉴클레오티드 화학적으로 변형된다. 일정 구현예에서, 시드 영역 내 하나 이상의 뉴클레오티드는 화학적으로 변형된다. 일정 구현예에서, 3'-말단의 하나 이상의 뉴클레오티드는 화학적으로 변형된다. 일정 구현예에서, 5'-핸들의 뉴클레오티드의 어떠한 것도 화학적으로 변형되지 않는다. 일부 구현예에서, 시드 영역의 화학적 변형은 소수 변형, 예컨대 2'-플루오로 유사체의 도입이다. 특정 구현예에서, 시드 영역 내 하나의 뉴클레오티드는 2'-플루오로 유사체러 치환된다. 일부 구현예에서, 3'-말단 내 5 또는 10개 뉴클레오티드는 화학적으로 변형된다. Cpf1 CrRNA의 3'-말단에서 이러한 화학적 변형은 유전자 절단 효율을 개선시킨다 (참조: Li, et al., Nature Biomedical Engineering, 2017, 1:0066). 특정 구현예에서, 3'-말단의 5개 뉴클레오티드는 2'-플루오로 유사체로 치환된다. 특정 구현예에서, 3'-말단의 10개 뉴클레오티드는 2'-플루오로 유사체로 치환된다. 특정 구현예에서, 3'-말단의 5개 뉴클레오티드는 2'-O-메틸 (M) 유사체로 치환된다. 일부 구현예에서, 3' 및 5' 말단의 각각에 3개 뉴클레오티드는 화학적으로 변형된다. 특정 구현예에서, 변형은 2'-O-메틸 또는 포스포로티오에이트 유사체를 포함한다. 특정 구현예에서, 테트라루프의 12개 뉴클레오티드 및 스템-루프 영역의 16개 뉴클레오티드는 2'-O-메틸 유사체로 치환된다. 이러한 화학적 변형은 생체내 편집 및 안정성을 개선시킨다 (참조: Finn et al., Cell Reports (2018), 22: 2227-2235).

일부 구현예에서, 가이드의 5'-핸들의 루프는 변형된다. 일부 구현예에서, 가이드의 5'-핸들의 루프는 변형되어서 결실, 삽입, 분할, 또는 화학적 변형을 갖는다. 일정 구현예에서, 루프는 3, 4, 또는 5개 뉴클레오티드를 포함한다. 일정 구현예에서, 루프는 UCUU, UUUU, UAUU, 또는 UGUU의 서열을 포함한다. 일부 구현예에서, 가이드 분자는 DNA 또는 RNA일 수 있는, 별개의 비-공유적으로 연결된 서열을 갖는 스템-루프를 형성한다.

합성적으로 연결된 가이드

일 구현예에서, 가이드는 비-포스포디에스테르 결합을 통해서 화학적으로 연결되거나 또는 접합되는 tracr 서열 및 tracr 메이트 서열을 포함한다. 일 구현예에서, 가이드는 비-뉴클레오티드 루프를 통해서 화학적으로 연결되거나 또는 접합된 tracr 서열 및 tracr 메이트 서열을 포함한다. 일부 구현예에서, tracr 및 tracr 메이트 서열는 비-포스포디에스테르 공유 링커를 통해서 연결된다. 공유 링커의 예는 카르바메이트, 에테르, 에스테르, 아미드, 이민, 아미드, 아미노트리진, 히드로존, 디설피드, 티오에테르, 티오에스테르, 포스포로티오에이트, 포스포로디티오에이트, 설폰아미드, 설포네이트, 풀폰, 설폭시드, 우레아, 티오우레아, 히드라지드, 옥심, 트리아졸, 광불안정성 결합, 딜스-알더 시클로-부가 쌍 또는 고리-폐쇄 복분해 쌍, 및 마이클 반응 쌍으로 이루어지는 군으로부터 선택되는 화학적 모이어티를 포함하지만, 이들로 제한되지 않는다.

일부 구현예에서, tracr 및 tracr 메이트 서열는 표준 포스포르아미다이트 합성 프로토콜을 사용해 먼저 합성된다 (Herdewijn, P., ed., Methods in Molecular Biology Col 288, Oligonucleotide Synthesis: Methods and Applications, Humana Press, New Jersey (2012)). 일부 구현예에서, tracr 또는 tracr 메이트 서열은 당분야에 공지된 표준 프로토콜을 사용한 결찰을 위해 적절한 작용기를 함유하도록 작용화될 수 있다 (Hermanson, G. T., Bioconjugate Techniques, Academic Press (2013)). 작용기의 예는 히드록실, 아민, 카르복실산, 카르복실산 할라이드, 카르복실산 활성 에스테르, 알데히드, 카르보닐, 클로로카르보닐, 이미다졸릴카르보닐, 히드로지드, 세미카르바지드, 티오 세미카르바지드, 티올, 말레이미드, 할로알킬, 수포닐, 알릴, 프로파르길, 디엔, 알킨 및 아지드를 포함하지만, 이에 제한되지 않는다. 일단 tracr 및 tracr 메이트 서열이 작용기화되면, 두 올리고뉴클레오티드 사이에 공유 화학 결합 또는 연결이 형성될 수 있다. 화학적 결합의 예는 카르바메이트, 에테르, 에스테르, 아미드, 이민, 아미드, 아미노트리진, 히드로존, 디설피드, 티오에테르, 티오에스테르, 포스포로티오에이트, 포스포로디티오에이트, 설폰아미드, 설포네이트, 풀폰, 설폭시드, 우레아, 티오우레아, 히드라지드, 옥심, 트리아졸, 광불안정성 결합, 딜스-알더 시클로-부가 쌍 또는 고리-폐쇄 복분해 쌍, 및 마이클 반응 쌍을 기반으로 하는 것을 포함하지만, 이에 제한되지 않는다.

일부 구현예에서, tracr 및 tracr 메이트 서열는 화학적으로 합성될 수 있다. 일부 구현예에서, 화학 합성은 2'-아세톡시에틸 오르토에스테르 (2'-ACE)를 사용한 자동화, 고체상 올리고뉴클레오티드 합성 기계 (Scaringe et al., J. Am. Chem. Soc. (1998) 120: 11820-11821; Scaringe, Methods Enzymol. (2000) 317: 3-18) 또는 2'-티오노카르바메이트 (2'-TC) 화학 (Dellinger et al., J. Am. Chem. Soc. (2011) 133: 11540-11546; Hendel et al., Nat. Biotechnol. (2015) 33:985-989) 을 사용한다.

일부 구현예에서, tracr 및 tracr 메이트 서열은 다양한 생물접합 반응, 루프, 가교, 및 당, 뉴클레오티드간 포스포디에스테르 결합, 푸린 및 피리미딘 잔기의 변형을 통한 비-뉴클레오티드 연결을 사용해 공유적으로 연결될 수 있다: Sletten et al., Angew. Chem. Int. Ed. (2009) 48:6974-6998; Manoharan, M. Curr. Opin. Chem. Biol. (2004) 8: 570-9; Behlke et al., Oligonucleotides (2008) 18: 305-19; Watts, et al., Drug. Discov. Today (2008) 13: 842-55; Shukla, et al., ChemMedChem (2010) 5: 328-49.

일부 구현예에서, tracr 및 tracr 메이트 서열은 클릭 화학을 사용해 공유적으로 연결될 수 있다. 일부 구현예에서, tracr 및 tracr 메이트 서열은 트리아졸 링커를 사용해 공유적으로 연결될 수 있다. 일부 구현예에서, tracr 및 tracr 메이트 서열은 고도로 안정한 트리아졸 링커를 산출하도록 알킨 및 아지드를 포함하는 후이스겐 1,3-쌍극자 고리첨가 반응을 사용해 공유적으로 연결될 수 있다 (He et al., ChemBioChem (2015) 17: 1809-1812; WO 2016/186745). 일부 구현예에서, tracr 및 tracr 메이트 서열는 5'-헥신 tracrRNA 및 3'-아지드 crRNA를 결찰시켜서 공유적으로 연결된다. 일부 구현예에서, 5'-헥신 tracrRNA 및 3'-아지드 crRNA 중 하나 또는 둘 모두는 2'-아세톡시에틸 오르토에스테르 (2'-ACE) 기에 의해 보호되어서, 이후에 Dharmacon 프로토콜을 사용해 제거될 수 있다 (Scaringe et al., J. Am. Chem. Soc. (1998) 120: 11820-11821; Scaringe, Methods Enzymol. (2000) 317: 3-18).

일부 구현예에서, tracr 및 tracr 메이트 서열는 모이어티 예컨대 스페이서, 부착, 생물접합, 발색단, 리포터 기, 염료 표지된 RNA, 및 비-천연 발생 뉴클레오티드 유사체를 포함한 링커 (예를 들어, 비-뉴클레오티드 루프)를 통해서 공유적으로 연결될 수 있다. 보다 특히, 본 발명의 목적에 적합한 스페이서는 제한 없이, 폴리에테르 (예를 들어, 폴리에틸렌 글리콜, 폴리알코올, 폴리프로필렌 글리콜 또는 에틸렌 및 프로필렌 글리콜의 혼합물), 폴리아민기 (예를 들어, 스펜닌, 스페르미딘 및 이의 중합체 유도체), 폴리에스테르 (예를 들어, 폴리(에틸 아크릴레이트)), 폴리포스포디에스테르, 알킬렌 및 이들의 조합을 포함한다. 적합한 부착물은, 예컨대 그러나 제한 없이 형광 표지와 같은 링커에 추가적인 특성을 추가하기 위해 링커에 첨가될 수 있는 임의의 모이어티를 포함할 수 있다. 적합한 생체접합체는 펩타이드, 글리코사이드, 지질, 콜레스테롤, 인지질, 다이아실 글리세롤 및 다이알킬 글리세롤, 지방산, 탄화수소, 효소 기질, 스테로이드, 바이오틴, 디곡시게닌, 탄수화물, 다당류를 포함하지만, 이들로 제한되지 않는다. 적합한 발색단, 리포터 기 및 염료 표지된 RNA는 형광 염료, 예컨대 플루오레세인 및 로다민, 화학발광, 전자화학발광 및 생체발광 마커 화합물을 포함하지만, 이들로 제한되지 않는다. 2개 RNA 성분을 접합시키는 예시적인 링커의 디자인은 국제 특허 출원 공개 번호 WO 2004/015075에 또한 기술된다.

링커 (예를 들어, 비-뉴클레오티드 루프)는 임의 길이일 수 있다. 일부 구현예에서, 링커는 약 0-16 뉴클레오티드와 동등한 길이를 갖는다. 일부 구현예에서, 링커는 약 0-8 뉴클레오티드와 동등한 길이를 갖는다. 일부 구현예에서, 링커는 약 0-4 뉴클레오티드와 동등한 길이를 갖는다. 일부 구현예에서, 링커는 약 2 뉴클레오티드와 동등한 길이를 갖는다. 예시적인 링커 디자인은 또한 국제 특허 출원 공개 번호 WO2011/008730에 기술된다.

전형적인 II Cas sgRNA는 (5'에서 3' 방향으로) 가이드 서열, 폴리 U 트랙, 제1 상보성 스트레치 ("반복부"), 루프 (테트라루프), 제2 상보성 스트레치 (반복부에 상보적인 "안티-반복부"), 스템 및 추가 스템 루프 및 스템 및 폴리 A (RNA 중 종종 폴리 U) 꼬리부 (종결자)를 포함한다. 바람직한 구현예에서, 가이드 아키텍처의 일정 구현예는 유지되고, 가이드 아키텍처의 일정 구현예는 예를 들어, 특성의 첨가, 차감, 또는 치환을 통해서 변형될 수 있는데 ;반해서, 가이드 아키텍처의 일정 다른 구현예는 유지된다. 삽입, 결실 및 치환을 포함하지만, 이들로 제한되지 않는 조작된 sgRNA 변형에 대한 바람직한 위치는 CRISPR 단백질 및/또는 표적, 예를 들어, 테트라루프 및/또는 루프 2의 스템 루프와 복합체를 형성할 때, 노출되는 sgRNA의 가이드 말단 및 영역을 포함한다.

일정 구현예에서, 본 발명의 가이드는 (예를 들어, 융합 단백질을 통해) 하나 이상의 기능성 도메인을 포함할 수 있는 어댑터 단백질에 대한 특정 결합 부위(예를 들어, 어댑터)를 포함한다. 이러한 가이드가 CRISPR 복합체(즉, 가이드 및 표적에 결합하는 CRISPR 효소)를 형성할 때, 어댑터 단백질이 결합하며, 어댑터 단백질과 결합된 기능성 도메인은 결과된 기능이 유효하게 되는데 유리한 공간적 배향으로 위치된다. 예를 들어, 기능적 도메인이 전사 활성인자 (예를 들어, VP64 또는 p65)인 경우, 전사 활성인자는, 표적의 전사에 작용하도록 하는 공간 배향으로 위치된다. 전사 억제인자는 유리하게는 표적의 전사에 영향을 미치도록 배치될 것이며, 뉴클레아제 (예를 들어, Fok1)는 유리하게는 표적을 절단하거나 부분적으로 절단하도록 배치될 것이다.

당업자는 어댑터 + 기능성 도메인의 결합을 가능하게 하는 가이드에 대한 변형을 이해할 것이지만, 어댑터 + 기능성 도메인의 적절하지 않은 위치화 (예를 들어, CRISPR 복합체의 3차원 구조 내의 입체장애에 기인)는 의도되지 않은 변형이다. 하나 이상의 변형된 가이드는 본 명세서에 기술된 바와 같이, 테트라 루프, 스템 루프 1, 스템 루프 2, 또는 스템 루프 3, 바람직하게 테트라 루프 또는 스템 루프 2에서, 가장 바람직하게 테트라 루프 및 스템 루프 2 둘 모두에서, 변형될 수 있다

반복부:안티 반복부 이중가닥은 sgRNA의 2차 구조로부터 분명하게 될 것이다. 이것은 전형적으로 폴리 U 트랙 이후 (5'에서 3' 방향) 및 테트라루프 이전에 제1 상보적 스트레치; 및 테트라루프 이후 (5'에서 3' 방향) 및 폴리 A 트랙 이전에 제2 상보 적 스트레치일 수 있다. 제1 상보성 스트레치 ("반복부")은 제2 상보성 스트레치 ("안티-반복부")에 상보적이다. 이와 같이, 그들은 서로에 대해 폴딩될 때 dsRNA의 이중가닥을 형성하는 왓슨-크릭 염기쌍이다. 이와 같이, A-U 또는 C-G 염기쌍에 관해서 뿐만 아니라, 안티-반복부가 테트라루프에 기인하는 역배향이라는 사실에 관해, 안티-반복부 서열은 반복부의 상보성 서열이다.

본 발명의 구현예에서, 가이드 아키텍처의 변형은 스템루프 2 내 염기의 치환을 포함한다. 예를 들어, 일부 구현예에서, 스템루프 2의 "actt" (RNA에서 "acuu") 및 "aagt" (RNA에서 "aagu") 염기는 "cgcc" 및 "gcgg"로 치환된다. 일부 구현예에서, 스템루프 2에서 "actt" 및 "aagt" 염기는 4개 뉴클레오타이드의 상보성 GC-풍부 영역으로 치환된다. 일부 구현예에서, 4개의 뉴클레오티드의 상보성 GC-풍부 영역은 "cgcc" 및 "gcgg" (둘 모두 5'에서 3' 방향으로)이다. 일부 구현예에서, 4개의 뉴클레오티드의 상보성 GC-풍부 영역은 "gcgg" 및 "cgcc" (둘 모두 5'에서 3' 방향으로)이다. 4 뉴클레오티드의 상보성 GC-풍부 영역 내 C 및 G의 다른 조합은 CCCC 및 GGGG를 포함한다는 것이 분명할 것이다.

일 구현예에서, 스템루프 2, 예를 들어, "ACTTgtttAAGT" (SEQ ID NO: 36)는 임의의 "XXXXgtttYYYY" (SEQ ID NO: 37)로 치환될 수 있고, 예를 들어, 여기서 XXXX 및 YYYY는 스템을 생성시키도록 서로 함께 쌍형성하게 되는 뉴클레오티드의 임의의 상보적 세트를 나타낸다.

일 구현예에서, 스템은 상보성 X 및 Y 서열을 포함하는 적어도 약 4 bp를 포함하지만, 더 많거나, 예를 들어, 5, 6, 7, 8, 9, 10, 11 또는 12개, 또는 더 적은, 예를 들어, 3, 2개 염기쌍의 스템이 또한 고려된다. 따라서, 예를 들어 X2-12 및 Y2-12 (여기서 X 및 Y는 뉴클레오티드의 임의의 상보성 세트를 나타냄)이 고려될 수 있다. 일 구현예에서, "gttt"와 함께, X 및 Y 뉴클레오티드로 만들어진 스템은 전체 2차 구조에서 완전한 헤어핀을 형성하게 될 것이고, 이것은 유리할 수 있으며, 염기쌍의 양은 완전한 헤어핀을 형성하는 임의의 양일 수 있다. 일 구현예에서, 전체 sgRNA의 2차 구조가 보존된다면, 임의의 상보성 X:Y 염기쌍 서열이 (예를 들어, 길이에 대해) 용인된다. 일 구현예에서, 스템은 DR:tracr 이중가닥, 및 3 스템루프를 가진다는 점에서 전체 sgRNA의 2차 구조를 방해하지 않는 X:Y 염기쌍의 형태일 수 있다. 일 구현예에서, ACTT 및 AAGT (또는 X:Y 염기쌍으로 만들어진 임의의 대체 스템)를 연결하는 "gttt" 테트라루프는 sgRNA의 전체 2차 구조를 파괴하지 않고 동일한 길이 (예를 들어, 4개 염기쌍) 또는 그 이상의 임의의 서열일 수 있다. 일 구현예에서, 스템루프는 스템루프2를 더 연장시킨 것일 수 있고, 예를 들어, MS2 압타머일 수 있다. 일 구현예에서, 스템루프3 "GGCACCGagtCGGTGC"(SEQ ID NO: 38)는 유사하게, "XXXXXXXagtYYYYYYY" (SEQ ID NO: 39) 형태를 취할 수 있고, 예를 들어, X7 및 Y7는 스템을 생성하도록 함께 서로 염기쌍을 형성하게 되는 뉴클레오티드의 임의의 상보적 세트를 나타낸다. 일 구현예에서, 스템은 상보적 X 및 Y 서열을 포함하는 약 7 bp를 포함하지만, 더 많거나 또는 더 적은 염기쌍의 스템이 또한 고려된다. 일 구현예에서, "agt"와 함께, X 및 Y 뉴클레오티드로 만들어진 스템은 전체 2차 구조에서 완전한 헤어핀을 형성하게 된다. 일 구현예에서, 임의의 상보적 X:Y 염기쌍 형성 서열은 전체 sgRNA의 2차 구조가 보존되는 한, 용인된다. 일 구현예에서, 스템은 DR:tracr 듀플렉스, 및 3 스템루프를 갖는 전체 sgRNA의 2차 구조를 파괴하지 않는 X;Y 염기쌍 형태일 수 있다. 일 구현예에서, 스템루프3의 ""agt" 서열은 압타머, 예를 들어, 일반적으로 스템루프3의 아키텍터를 보존한 MS2 압타머 또는 서열에 의해 연장될 수 있거나 또는 치환될 수 있다. 대안적인 스템루프 2 및/도는 3에 대한 일 구현예에서, 각각의 X 및 Y 쌍은 임의의 염기쌍을 의미할 수 있다. 일 구현예에서, 비-왓슨 크릭 염기상이 고려되고, 여기서 이러한 쌍형성은 달리 일반적으로 그 위치에 스템루프의 아키텍트를 보존한다.

일 구현예에서, DR:tracrRNA 듀플렉스는 형태: gYYYYag(N)NNNNxxxxNNNN(AAN)uuRRRRu (SEQ ID NO: 40) (뉴클레오티드에 대한 표준 IUPAC 명명법 사용)로 치환되고, 여기서 (N) 및 (AAN)은 듀플렉스의 벌지의 일부를 나타내고, "xxxx"는 링커 서열을 나타낸다. 직접 반복부 상의 NNNN은 tracrRNA의 상응하는 NNNN 부분과 염기쌍 형성되는 임의의 것일 수 있다. 일 구현예에서, DR:tracrRNA 듀플렉스는 전체 구조를 변경시키지 않는 한, 임의 길이의 링커 (xxxx...), 임의 염기 조성의 링커를 통해서 연결될 수 있다.

일 구현예에서, sgRNA 구조적 요건은 듀플렉스 및 3 스템루프를 갖는 것이다. 대부분의 구현예에서, 많은 특정 염기 요건에 대한 실제 서열 요건은 lax이고, 여기서 DR:tracrRNA 듀플렉스의 아키텍터는 보존되어야 하지만, 아키텍처, 즉, 스템, 루프, 벌지 등을 생성하는 서열은 변경될 수 있다.

압타머

제1 압타머/RNA-결합 단백질 쌍을 갖는 하나의 가이드는 활성인자에 연결 또는 융합될 수 있는 한편, 제2 압타머/RNA-결합 단백질 쌍을 갖는 제2 가이드는 억제인자에 연결 또는 융합될 수 있다. 가이드는 상이한 표적 (유전자좌)에 대한 것으로서, 이것은 한 유전자를 활성화시키고 하나는 억제시키게 된다. 예를 들어, 하기 개략도는 이러한 접근법을 보여준다:

가이드 1 - MS2 압타머------MS2 RNA-결합 단백질-------VP64 활성인자; 및

가이드 2 - PP7 압타머------PP7 RNA-결합 단백질-------SID4x 억제인자.

본 발명은 또한 직교 PP7/MS2 유전자 표적화에 관한 것이다. 이러한 예에서, 상이한 유전자좌를 표적화하는 sgRNA는 그들의 표적 유전자좌를 각각 활성화시키고 억제하는 MS2-VP64 또는 PP7-SID4X를 보충하기 위해 별개의 RNA 루프로 변형된다. PP7은 박테리오파지 슈도모나스 (Pseudomonas)의 RNA-결합 외피 단백질이다. MS2처럼, 이것은 특별한 RNA 서열 및 2차 구조에 결합된다. PP7 RNA-인식 모티프는 MS2의 것과 상이하다. 결론적으로, PP7 및 MS2는 동시에 상이한 게놈 유전자좌에서 별개 효과를 매개하도록 다중복합화될 수 있다. 예를 들어, sgRNA 표적화 유전자좌 A는 MS2 루프로 변형되어, MS2-VP64 활성체를 보충할 수 있는 반면, 다른 sgRNA 표적화 유전자좌 B는 PP7 루프로 변형되어, PP7-SID4X 리프레서 도메인을 보충할 수 있다. 동일한 세포에서, dCas9는 직교, 유전자좌-특이적 변형을 매개할 수 있다. 이 원칙은 다른 직교 RNA-결합 단백질, 예컨대 Q-베타를 혼입하도록 연장될 수 있다.

직교 억제를 위한 대안적인 선택은 (가이드 내에 통합된 MS2/PP7 루프와 유사한 위치에서 또는 가이드의 3' 말단에서) 가이드 내에 전사활성 억제 기능을 갖는 비코딩 RNA를 혼입시키는 것을 포함한다. 예를 들어, 가이드는 비-코딩 (그러나 억제성인 것으로 알려짐) RNA 루프 (예를 들어, 포유동물 세포에서 RNA 폴리머라제 II를 방해하는 (RNA에서의) Alu 억제인자를 이용)로 설계된다. Alu RNA 서열은 본 명세서에서 사용되는 MS2 RNA 서열 위치 (예를 들어, 테트라루프 및/또는 스템 루프 2)에서; 및/또는 가이드의 3' 말단에 위치되었다. 이것은 테트라루프 및/또는 스템루프 2 위치에서 MS2, PP7 또는 Alu의 가능한 조합을 비롯하여, 임의로, 가이드의 3' 말단에 Alu의 첨가 (링커 존재 또는 부재)를 제공한다.

두 상이한 압타머 (별개의 RNA)의 사용은 활성인자-어댑터 단백질 융합, 및 상이한 가이드를 갖는 사용될 억제인자-어댑터 단백질 융합을 가능하게 하여, 하나의 유전자의 발현을 활성화시키는 한편 다른 것은 억제한다. 상이한 가이드와 함께 그들은 다중복합 접근으로 함께 또는 실질적으로 함께 투여될 수 있다. 매우 다수의 이러한 변형된 가이드는 모두 동시에, 예를 들어, 10 또는 20 또는 30개 등이 사용될 수 있는 한편, 비교적 소수의 Cas9s가 매우 다수의 변형된 가이드와 함께 사용됨에 따라, Cas9s 중 하나만이 (또는 적어도 최소의 수) 전달된다. 어댑터 단백질은 하나 이상의 활성인자 또는 하나 이상의 억제인자와 연관 (바람직하게 연결 또는 융합)될 수 있다. 예를 들어, 어댑터 단백질은 제1 활성인자 및 제2 활성인자와 연관될 수 있다. 제1 및 제2 활성인자는 동일할 수 있지만, 그들은 바람직하게 상이한 활성인자이다. 예를 들어, 하나는 VP64일 수 있는 한편, 나머지는 p65일 수 있지만, 이들은 단지 예이고 다른 전사 활성인자가 고려된다. 3개 이상 또는 심지어 4개 이상의 활성인자 (또는 억제인자가 사용될 수 있지만, 패키지 크기는 5개의 상이한 기능성 도메인에 비해서 더 높게 수를 제한할 수 있다. 링커는 바람직하게 어댑터 단백질과 직접 결합 상에서 사용되고, 여기서 둘 이상의 기능성 도메인은 어댑터 단백질과 연관된다. 적합한 링커는 GlySer 링커를 포함할 수 있다.

또한, 효소-가이드 복합체는 전체로서 둘 이상의 기능성 도메인과 회합될 수 있다는 것을 고려한다. 예를 들어, 효소와 회합된 둘 이상의 기능성 도메인이 존재할 수 있거나, 또는 (하나 이상의 어댑터 단백질을 통해서) 가이드와 회합된 둘 이상의 기능성 도메인이 존재할 수 있거나, 또는 (하나 이상의 어댑터 단백질을 통해서) 가이드와 회합된 하나 이상의 기능성 도메인 및 효소와 회합된 하나 이상의 기능성 도메인이 존재할 수 있다.

어댑터 단백질과 활성인자 또는 억제제 간 융합은 링커를 포함할 수 있다. 예를 들어, GlySer 링커 GGGS가 사용될 수 있다. 그들은 필요하면, 적합한 길이를 제공하도록, 3 ((GGGGS)₃(SEQ ID NO: 35)) 또는 6, 9 또는 심지어 12 이상의 반복부에서 사용될 수 있다. 링커는 RNA-결합 단백질 및 기능성 도메인 (활성인자 또는 억제인자) 간에, 또는 CRISPR 효소 (Cas9) 및 기능성 도메인 (활성인자 or 억제인자) 간에 사용될 수 있다. 사용자를 링커를 적절한 양의 "기계적 가요성"으로 저작한다.

데드 가이드

일 구현예에서, 본 발명은 CRISPR 복합체의 형성 및 표적에 대한 성공적인 결합을 가능하게 하는 한편, 동시에 성공적인 뉴클레아제 활성을 가능하게 하지 않는 방식으로(즉, 뉴클레아제 활성 없이/삽입결실 활성 없이) 변형된 가이드 서열을 제공한다. 설명을 위하여, 이러한 변형된 가이드 서열은 "데드 가이드" 또는 "데드 가이드 서열"로 지칭된다. 이들 데드 가이드 또는 데드 가이드 서열은 뉴클레아제 활성화 관련하여 촉매적으로 불활성 또는 입체형태적으로 불활성이라고 여길 수 있다. 뉴클레아제 활성은 해당 분양에 흔히 사용되는 바와 같은 surveyor 분석 또는 심층 시퀀싱, 바람직하게는 surveyor 분석을 사용하여 측정될 수 있다. 유사하게, 데드 가이드 서열은 촉매 활성을 촉진시키는 능력 또는 온-표적 및 오프-표적 결합 활성을 구별하는 능력에 관하여 생성적 염기 쌍형성에서 충분히 관여하지 않을 수 있다. 간략하게, surveyor 어세이는 유전자에 대한 CRISPR 표적 부위를 정제하고, 증폭시키고, CRISPR 표적 부위를 증폭시키는 프라이머를 사용하여 헤테로듀플렉스를 형성하는 것을 포함한다. 재-어닐링 후에, 생성물을 제조처의 권고된 프로토콜에 따라 SURVEYOR 뉴클레아제 및 SURVEYOR 인핸서 S (Transgenomics)로 처리하고, 겔 상에서 분석하고, 상대적 밴드 세기에 기초하여 정량화시킨다.

따라서, 관련 구현예에서, 본 발명은 본 명세서에 기술된 기능성 Cas9, 및 가이드 RNA (gRNA)를 포함하는 비-천연 발생 또는 조작된 조성물 Cas9 CRISPR-Cas 시스템을 제공하고, gRNA는 데드 가이드 서열을 포함하여서, gRNA가 표적 서열과 혼성화할 수 있어 Cas9 CRISPR-Cas 시스템은 SURVEYOR 어세이에 의해 검출되는 시스템의 비-돌연변이체 Cas9 효소의 뉴클레아제 활성으로부터 검출가능한 indel 활성없이 세포에서 관심 게놈 유전자좌로 유도된다. 간략함의 목적을 위해, gRNA가 함으로써, Cas9 CRISPR-Cas 시스템이 SURVEYOR 분석에 의해 검출되는 바와 같은 시스템의 비돌연변이체 Cas9 효소의 뉴클레아제 활성으로부터 초래되는 검출 가능한 indel 활성 없이 세포에서 관심 대상의 게놈 유전자좌로 향하도록, gRNA가 표적 서열에 혼성화할 수 있는, 데드 가이드 서열을 포함하는 gRNA는 "데드 gRNA"로 지칭된다. 본 명세서의 다른 곳에 기재된 바와 같은 본 발명에 따른 임의의 gRNA가 본 명세서에서 이하에 기재되는 바와 같은 데드 gRNA/데드 가이드 서열을 포함하는 gRNA로서 사용될 있다는 것이 이해되어야 한다. 본 명세서의 다른 곳에 기재된 바와 같은 임의의 방법, 생성물, 조성물 및 용도는 이하에 추가로 상술하는 바와 같은 데드 gRNA/데드 가이드 서열을 포함하는 gRNA와 동일하게 적용 가능하다. 추가 가이드를 통해서, 하기 특정한 구현예 및 구현예들이 제공된다.

표적 서열에 대한 CRISPR 복합체의 서열-특이적 결합을 유도하는 가이드 서열의 능력은 임의의 적합한 어세이에 의해 평가될 수 있다. 예를 들어, 시험될 데드 가이드 서열을 포함하는, CRISPR 복합체를 형성하는 데 충분한 CRISPR 시스템의 성분은 대응하는 표적 서열을 갖는 숙주 세포에, 예컨대 CRISPR 서열 성분을 코딩하는 벡터에 의한 형질감염에 의해, 그 다음에 표적 서열 내의 우선적인 절단 평가, 예컨대 본 명세서에 기재된 바와 같은 Surveyor 분석에 의해 제공될 수 있다. 유사하게, 표적 폴리뉴클레오티드 서열의 절단은, 시험할 데드 가이드 서열 및 시험 데드 가이드 서열과 상이한 대조군 가이드 서열을 포함하는 CRISPR 복합체의 성분을 제공하고, 시험 및 대조군 가이드 서열 반응 간의 표적 서열에서의 결합 또는 절단율을 비교함으로써 시험관에서 평가될 수 있다. 다른 어세이가 가능하고, 당업자에게 존재할 수 있다. 데드 가이드 서열은 임의의 표적 서열을 표적화하도록 선택될 수 있다. 일부 구현예에서, 표적 서열은 세포의 게놈 내에 있는 서열이다.

본 명세서에 추가로 설명하는 바와 같이, 몇몇 구조적 매개변수는 이러한 데드 가이드에서 적절한 프레임워크가 도달하는 것을 가능하게 한다. 데드 가이드 서열은 활성 Cas9-특이적 삽입결실 형성을 초래하는 각각의 가이드 서열보다 더 짧다. 데드 가이드는 동일한 Cas9로 향하는 각각의 가이드보다 5%, 10%, 20%, 30%, 40%, 50% 더 짧아서 활성 Cas9-특이적 indel 형성을 야기한다.

하기에 설명되고, 해당 분야에 알려져 있는 바와 같이, gRNA - Cas9 특이성의 일 구현예는 직접 반복부 서열이며, 이는 적절하게 이러한 가이드에 연결될 것이다. 특히, 이것은 직접 반복부 서열이 Cas9의 기원에 의존하여 설계된다는 것을 암시한다. 따라서, 입증된 데드 가이드 서열에 대하여 이용 가능한 구조 데이터는 Cas9 특이적 등가물을 설계하기 위해 사용될 수 있다. 예를 들어, 둘 이상의 Cas9 이펙터 단백질의 오솔로그 뉴클레아제 도메인 RuvC의 구조적 유사성을 사용하여 등가의 설계 데드 가이드를 전달할 수 있다. 따라서, 본 명세서의 데드 가이드는 길이 및 서열을 적절하게 변형시켜, 이러한 Cas9 특이적 등가물을 반영하여, CRISPR 복합체의 형성 및 표적으로의 성공적인 결합을 가능하게 함과 동시에, 성공적인 뉴클레아제 활성을 허용하지 않을 수 있다.

본 명세서뿐만 아니라 당업계의 언급과 관련하여 데드 가이드의 사용은 시험관내, 생체외 및 생체내 적용에서 네트워크 생물학 및/또는 시스템 생물학을 위한 놀랍고도 예상되지 않은 플랫폼을 제공하여, 다중복합 유전자 표적화, 및 특히 양방향 다중복합 유전자 표적화를 가능하게 한다. 데드 가이드의 사용 전에, 예를 들어, 유전자 활성의 활성화, 억제 및/또는 침묵화를 위하여 다수의 표적을 다루는 것은 힘들고, 일부 경우에는 가능하지 않다. 데드 가이드의 사용으로, 다수 표적 및 따라서 다수 활성이 예를 들어 동일 세포, 동일 동물, 또는 동일 환자에서 처리될 수 있다. 이러한 다중화는 동시에 또는 바람직한 시기에 시차를 두고 일어날 수 있다.

예를 들어, 데드 가이드는 이제 처음으로 뉴클레아제 활성의 결과 없이 유전자 표적화를 위한 수단으로서 gRNA를 사용하게 함과 동시에, 활성화 또는 억제를 위해 유도된 수단을 제공한다. 데드 가이드를 포함하는 가이드 RNA는 유전자 활성의 활성화 또는 억제를 가능하게 하는 방식으로 구성요소, 특히 유전자 이펙터 (예를 들어, 유전자 활성의 활성인자 또는 억제인자)의 기능적 배치를 가능하게 하는 본 명세서의 다른 곳에 기재된 바와 같은 단백질 압타머 (예를 들어, 압타머)를 추가로 포함하도록 변형될 수 있다. 일례는 당분야 및 본 명세서에서 설명된 바와 같은 압타머의 포함이다. 단백질-상호작용 압타머 (Konermann et al., "Genome-scale transcription activation by an engineered CRISPR-Cas9 complex," doi:10.1038/nature14136, 참조로 본 명세서에 편입됨)를 도입시키기 위해 데드 가이드를 포함하는 gRNA를 조작하여, 다수의 별개의 이펙터 도메인으로 이루어진 합성 전사 활성화 복합체를 조립할 수 있다. 이렇게 해서 천연 전사 활성화 과정 이후에 모델화될 수 있다. 예를 들어, 이펙터 (예를 들어, 활성인자 또는 억제인자; 활성인자 또는 억제인자와 융합 단백질로서 이량체화된 MS2 박테리오파지 외피 단백질)에 선택적으로 결합하는 압타머, 또는 그 자체로 이펙터 (예를 들어, 활성제 또는 억제인자)에 결합하는 단백질은 데드 gRNA 테트라루프 및/또는 스템-루프 2에 부착될 수 있다. MS2의 경우에, 융합 단백질 MS2-VP64는 테트라루프 및/또는 줄기-루프 2에 결합하고, 결국, 예를 들어, Neurog2에 대해 전사 상향조절을 매개한다. 다른 전사 활성인자는 예를 들어, VP64. P65, HSF1, 및 MyoD1이다. 이 개념의 예로서, MS2 스템-루프의 PP7-상호작용 스템-루프로의 치환은 억제성 구성요소를 동원하는데 사용될 수 있다.

따라서, 일 구현예는 데드 가이드를 포함하는 본 발명의 gRNA이고, gRNA는 본 명세서에 기술된 바와 같이, 유전자 활성화 또는 억제를 제공하는 변형을 더 포함한다. 데드 gRNA는 하나 이상의 압타머를 포함할 수 있다. 압타머는 유전자 이펙터, 유전자 활성인자 또는 유전자 억제인자에 특이적일 수 있다. 대안적으로 압타머는 특이적 유전자 이펙터, 유전자 활성인자 또는 유전자 억제인자에 특이적이고 그를 동원/결합하게 되는 단백질에 특이적일 수 있다. 활성인자 또는 억제인자 동원을 위한 다수 부위가 존재하면, 부위가 활성인자 또는 억제인자에 특이적인 것이 바람직하다. 활성인자 또는 억제인자 결합을 위한 다수 부위가 존재하면, 부위는 동일 활성인자 또는 동일 억제인자에 특이적일 수 있다. 부위는 또한 상이한 활성인자 또는 상이한 억제인자에 특이적일 수 있다. 유전자 이펙터, 유전자 활성인자, 유전자 억제인자는 융합 단백질의 형태로 존재할 수 있다.

일 구현예에서, 본 명세서에 기술된 바와 같은 데드 gRNA 또는 본 명세서에 기술된 바와 같은 Cas9 CRISPR-Cas 복합체는 둘 이상의 어댑터 단백질을 포함하는 비-천연 발생 또는 조작된 조성물을 포함하고, 각각의 단백질은 하나 이상의 기능성 도메인과 회합되고, 어댑터 단백질은 데드 gRNA의 적어도 하나의 루프에 삽입된 별개 RNA 서열(들)에 결합한다.

그리하여, 일 구현예는 세포에서 관심 게놈 유전자좌 중 표적 서열에 혼성화할 수 있는 데드 가이드 서열을 포함하는 가이드 RNA (gRNA), 적어도 하나 이상의 핵 국재화 서열을 포함하는 Cas9를 포함하는 비-천연 발생 또는 조작된 조성물을 제공하고, 데드 가이드 서열은 본 명세서에 정의된 바와 같고, Cas9는 임의로 적어도 하나의 돌연변이를 포함하고, 데드 gRNA의 적어도 하나의 루프는 하나 이상의 어댑터 단백질에 결합하는 별개 RNA 서열(들)의 삽입에 의해 변형되고, 어댑터 단백질은 하나 이상의 기능성 도메인과 회합되거나; 또는 데드 gRNA는 적어도 하나의 비-코딩 기능성 루프를 갖도록 변형되고, 조성물은 둘 이상의 어댑터 단백질을 포함하고, 각각의 단백질은 하나 이상의 기능성 도메인과 회합된다.

일정 구현예에서, 어댑터 단백질은 기능성 도메인을 포함하는 융합 단백질이고, 융합 단백질은 임의로 어댑터 단백질 및 기능성 도메인 사이에 링커를 포함하고, 링커는 임의로 GlySer 링커를 포함한다.

일정 구현예에서, 데드 gRNA의 적어도 하나의 루프는 둘 이상의 어댑터 단백질에 결합된 별개 RNA 서열(들)의 삽입에 의해 변형되지 않는다.

일정 구현예에서, 어댑터 단백질과 회합된 하나 이상의 기능성 도메인은 전사 활성화 도메인이다.

일정 구현예에서, 어댑터 단백질과 회합된 하나 이상의 기능성 도메인은 VP64, p65, MyoD1, HSF1, RTA 또는 SET7/9를 포함하는 전사 활성화 도메인이다.

일정 구현예에서, 어댑터와 회합된 하나 이상의 기능성 도메인은 전사 억제인자 도메인이다.

일정 구현예에서, 전사 억제인자 도메인은 KRAB 도메인이다.

일정 구현예에서, 전사 억제인자 도메인은 NuE 도메인, NcoR 도메인, SID 도메인 또는 SID4X 도메인이다.

일정 구현예에서, 어댑터 단백질과 회합된 하나 이상의 기능성 도메인 중 적어도 하나는 메틸라제 활성, 데메틸라제 활성, 전사 활성화 활성, 전사 억제 활성, 전사 방출 인자 활성, 히스톤 변형 활성, DNA 통합 활성 RNA 절단 활성, DNA 절단 활성 또는 핵산 결합 활성을 포함하는 하나 이상의 활성을 갖는다.

일정 구현예에서, DNA 절단 활성은 Fok1 뉴클레아제에 기인한다.

일정 구현예에서, 데드 gRNA는 데드 gRNA가 어댑터 단백질에 결합 후에 Cas9 및 표적에 추가로 결합하고 나서, 기능성 도메인은 기능성 도메인이 이의 기여하는 기능을 기능할 수 있게 하는 공간 배향으로 존재하도록 변형된다.

일정 구현예에서, 데드 gRNA의 적어도 하나의 루프는 테트라 루프 및/또는 루프2이다. 일정 구현예에서, 데드 gRNA의 테트라 루프 및 루프 2는 별개 RNA 서열(들)의 삽입에 의해 변형된다.

일정 구현예에서, 하나 이상의 어댑터 단백질에 결합하는 별개 RNA 서열(들)의 삽입은 압타머 서열이다. 일정 구현예에서, 압타머 서열은 동일한 어댑터 단백질에 특이적인 둘 이상의 압타머 서열이다. 일정 구현예에서, 압타머 서열은 상이한 어댑터 단백질에 특이적인 둘 이상의 압타머 서열이다.

일정 구현예에서, 어댑터 단백질은 MS2, PP7, Qβ F2, GA, fr, JP501, M12, R17, BZ13, JP34, JP500, KU1, M11, MX1, TW18, VK, SP, FI, ID2, NL95, TW19, AP205, Cb5, φCb8r, φCb12r, φCb23r, 7s, RR1을 포함한다.

일정 구현예에서, 세포는 진핵생물 세포이다. 일정 구현예에서, 진핵생물 세포는 포유동물 세포, 임의로 마우스 세포이다. 일정 구현예에서, 포유동물 세포는 인간 세포이다.

일정 구현예에서, 제1 어댑터 단백질은 p65 도메인과 회합되고 제2 어댑터 단백질은 HSF1 도메인과 회합된다.

일정 구현예에서, 조성물은 적어도 3개 기능성 도메인을 갖는 Cas9 CRISPR-Cas 복합체를 포함하고, 이들 중 적어도 하나는 Cas9와 회합되고 이들 중 적어도 2개는 데드 gRNA와 회합된다.

일정 구현예에서, 조성물은 제2 gRNA를 포함하고, 제2 gRNA는 제2 Cas9 CRISPR-Cas 시스템이 시스템의 Cas9 효소의 뉴클레아제 활성으로 인해 제2 게놈 유전자좌에서 indel 활성에 의해서 세포 내 관심 제2 게놈 유전자좌로 유도되도록 제2 표적 서열과 혼성화할 수 있는 생 gRNA이다.

일정 구현예에서, 조성물은 다수의 데드 gRNAs 및/또는 다수의 생 gRNA를 포함한다.

본 발명의 일 구현예는 gRNA 스캐폴드의 모듈성 및 맞춤성을 이용하여, 직교 방식으로 별개의 유형의 이펙터를 동원하기 위한 상이한 결합 부위(특히 압타머)를 갖는 일련의 gRNA 스캐폴드를 확립하는 것이다. 다시, 더 넓은 개념의 예시 및 실례를 위하여, PP7-상호작용 스템-루프로의 MS2 스템-루프의 대체를 사용하여, 억제 요소를 결합/동원하여, 다중화된 양방향성 전사 제어를 가능하게 할 수 있다. 따라서, 일반적으로, 데드 가이드를 포함하는 gRNA는 다중복합 전사 제어 및 바람직한 양방향 전사 제어를 제공하는 데 사용될 수 있다. 이러한 전사 제어는 유전자에 가장 바람직하다. 예를 들어, 데드 가이드(들)를 포함하는 하나 이상의 gRNA는 하나 이상의 표적 유전자의 활성화를 표적화하는 데 사용될 수 있다. 동시에, 데드 가이드(들)를 포함하는 하나 이상의 gRNA는 하나 이상의 표적 유전자의 억제를 표적화하는 데 사용될 수 있다. 이러한 서열은 다양한 상이한 조합으로 적용될 수 있으며, 예를 들어, 표적 서열이 먼저 억제된 다음, 적절한 기간에 다른 표적이 활성화되거나, 선택된 유전자가 억제됨과 동시에 선택된 유전자가 활성화된 후, 추가의 활성화 및/또는 억제로 이어진다. 그 결과, 하나 이상의 생물학적 시스템의 다중 성분은 유리하게 함께 처리될 수 있다.

일 구현예에서, 본 발명은 본 명세서에 기술된 바와 같은 데드 gRNA 또는 Cas9 CRISPR-Cas 복합체 또는 조성물을 코딩하는 핵산 분자(들)를 제공한다.

일 구현예에서, 본 발명은 본 명세서에 정의된 바와 같은 데드 가이드 RNA를 코딩하는 핵산 분자를 포함하는 벡터 시스템을 제공한다. 일정 구현예에서, 벡터 시스템은 Cas9를 코딩하는 핵산 분자(들)를 더 포함한다. 일정 구현예에서, 벡터 시스템은 (생) gRNA를 코딩하는 핵산 분자(들)를 더 포함한다. 일정 구현예에서, 핵산 분자 또는 벡터는 가이드 서열 (gRNA)을 코딩하는 핵산 분자 및/또는 임의의 핵 국재화 서열(들)을 코딩하는 핵산 분자에 작동적으로 연결된 진핵생물 세포에서 작동가능한 조절 구성요소(들)를 더 포함한다.

다른 구현예에서, 또한, 구조적 분석을 사용하여 DNA 결합을 가능하게 하지만 DNA 절단을 가능하게 하지 않는 데드 가이드와 활성 Cas9 뉴클레아제 간의 상호작용을 연구할 수 있다. 이러한 방식으로 Cas9의 뉴클레아제 활성에 중요한 아미노산이 결정된다. 이러한 아미노산의 변형은 유전자 편집에 사용되는 개선된 Cas9 효소를 허용한다.

추가 구현예는 본 명세서에 설명될 뿐만 아니라 당업계에 공지된 바와 같은 CRISPR의 다른 적용과 본 명세서에 설명된 바와 같은 데드 가이드의 사용을 조합하는 것이다. 예를 들어, 표적화된 다중복합 유전자 활성화 또는 억제 또는 표적화된 다중복합 양방향 유전자 활성화/억제를 위해 데드 가이드(들)를 포함하는 gRNA는 본 명세서에 설명된 바와 같은 뉴클레아제 활성을 유지하는 가이드를 포함하는 gRNA와 조합될 수 있다. 뉴클레아제 활성을 유지하는 가이드를 포함하는 이러한 gRNA는 유전자 활성 (예를 들어, 압타머)의 억제를 가능하게 하는 변형을 추가로 포함할 수 있거나 또는 포함하지 않을 수도 있다. 뉴클레아제 활성을 유지하는 가이드를 포함하는 이러한 gRNA는 유전자 활성 (예를 들어, 압타머)의 활성화를 가능하게 하는 변형을 추가로 포함할 수 있거나 또는 포함하지 않을 수도 있다. 이러한 방식으로, 다중복합 유전자 제어를 위한 추가적인 수단이 도입된다 (예를 들어, 뉴클레아제 활성 없이/indel 활성 없이, 다중복합 유전자 표적화된 활성화는 뉴클레아제 활성에 의한 유전자 표적화된 억제와 동시에 또는 이와 조합하여 제공될 수 있다).

예를 들어, 1) 유전자 활성인자의 동원을 위한 적절한 압타머에 의해 더 변형되고 하나 이상의 유전자에 대해 표적화된 데드 가이드(들)를 포함하는 하나 이상의 gRNA (예: 1-50, 1-40, 1-30, 1-20, 바람직하게 1-10, 보다 바람직하게 1-5)를 사용; 2) 유전자 억제인자의 동원을 위한 적절한 압타머로 더욱 변형되고 하나 이상의 유전자에 표적화되는 데드 가이드(들)를 포함하는 하나 이상의 gRNA (예를 들어, 1-50, 1-40, 1-30, 1-20, 바람직하게 1-10, 보다 바람직하게 1-5)와 조합될 수 있다. 이어서 1) 및/또는 2)는 3) 하나 이상의 유전자에 표적화되는 하나 이상의 gRNA (예를 들어, 1-50, 1-40, 1-30, 1-20, 바람직하게 1-10, 보다 바람직하게 1-5)와 조합될 수 있다. 이러한 조합을 이후에 이어서 1) + 2) + 3)을 4) 유전자 활성인자의 동원에 적절한 압타머로 더욱 변형되고 하나 이상의 유전자에 표적화된 하나 이상의 gRNA (예를 들어, 1-50, 1-40, 1-30, 1-20, 바람직하게 1-10, 보다 바람직하게 1-5)와 함께 수행된다. 이러한 조합은 이후에 이어서 1) + 2) + 3) + 4)를 5) 유전자 억제인자의 동원에 적절한 압타머로 더욱 변형되고 하나 이상의 유전자에 표적화되는 하나 이상의 gRNA (예를 들어, 1-50, 1-40, 1-30, 1-20, 바람직하게 1-10, 보다 바람직하게 1-5)와 함께 수행될 수 있다. 그 겨과로서, 다양한 용도 및 조합이 본 발명에 포함된다. 예를 들어, 조합 1) + 2); 조합 1) + 3); 조합 2) + 3); 조합 1) + 2) + 3); 조합 1) + 2) +3) +4); 조합 1) + 3) + 4); 조합 2) + 3) +4); 조합 1) + 2) + 4); 조합 1) + 2) +3) +4) + 5); 조합 1) + 3) + 4) +5); 조합 2) + 3) +4) +5); 조합 1) + 2) + 4) +5); 조합 1) + 2) +3) + 5); 조합 1) + 3) +5); 조합 2) + 3) +5); 조합 1) + 2) +5).

일 구현예에서, 본 발명은 표적 유전자의 유전자좌에 Cas9 CRISPR-Cas 시스템을 가이드하기 위해 데드 가이드 RNA 표적화 서열(데드 가이드 서열)을 설계하거나, 평가하거나 또는 선택하기 위한 알고리즘을 제공한다. 특히, 데드 가이드 RNA 특이성은 i) GC 함량 및 ii) 표적화 서열 길이에 관한 것이며, 이들을 변화시킴으로써 최적화될 수 있다는 것이 결정되었다. 일 구현예에서, 본 발명은 데드 가이드 RNA의 오프-표적 결합 또는 상호작용을 최소화하는 데드 가이드 RNA 표적화 서열을 설계하거나 또는 평가하기 위한 알고리즘을 제공한다. 본 발명의 구현예에서, 유기체 내 유전자의 유전자좌로 CRISPR 시스템을 유도하기 위해 데드 가이드 RNA 표적화 서열을 선택하기 위한 알고리즘은 a) 유전자의 유전자좌에서 하나 이상의 CRISPR 모티프를 위치시키는 단계, i) 서열의 GC 함량을 결정하는 단계; 및 ii) 유기체의 게놈 내 CRISPR 모티프에 가장 가까운 15개 하류 뉴쿨레오티드의 오프-표적 일치가 존재하는지 여부를 결정하는 단계에 의해서 각각의 CRISPR 모티프의 하류에 20개 뉴클레오티드 (nt) 서열을 분석하는 단계, 및 c) 서열의 GC 함량이 70% 이하이고 오프-표적 일치가 확인되지 않으면 데드 가이드 RNA에서 사용을 위한 15개 뉴클레오티드 서열을 선택하는 것인 단계를 포함한다. 일 구현예에서, 서열은 GC 함량이 60% 이하이면 표적화 서열에 대해 선택된다. 일정 구현예에서, 서열은 GC 함량이 55% 이하, 50% 이하, 45% 이하, 40% 이하, 35% 이하 또는 30% 이하이면 표적화 서열에 대해 선택된다. 일 구현예에서, 유전자의 유전자좌의 둘 이상의 서열을 분석하고, 최저 GC 함량, 또는 다음 최저 GC 함량, 또는 다음 최저 GC 함량을 갖는 서열이 선택된다. 일 구현예에서, 서열은 오프-표적 일치가 유기체의 게놈에서 확인되지 않으면 표적화 서열에 대해 선택된다. 일 구현예에서, 표적화 서열은 오프-표적 일치가 게놈의 조절 서열에서 확인되지 않으면 선택된다.

일 구현예에서, 본 발명은 유기체에서 유전자의 유전자좌로 작용화된 CRISPR 시스템을 유도하기 위해 데드 가이드 RNA 표적화 서열을 선택하는 방법을 제공하고, 방법은 a) 유전자의 유전자좌에 하나 이상의 CRISPR 모티프를 위치시키는 단계; b) i) 서열의 GC 함량을 결정하는 단계; 및 ii) 유기체의 게놈 내 서열의 처음 15 nt의 오프-표적 일치가 존재하는 여부를 결정하는 단계에 의해서 각각의 CRISPR 모티프의 하류에 20 nt 서열을 분석하는 단계; c) 서열의 GC 함량가 70% 이하이고 오프-표적 일치가 확인되지 않으면 가이드 RNA에서 사용을 위한 서열을 선택하는 단계를 포함한다. 일 구현예에서, 서열은 GC 함량이 50% 이하이면 선택된다. 일 구현예에서, 서열은 GC 함량이 40% 이하이면 선택된다. 일 구현예에서, 서열은 GC 함량이 30% 이하이면 선택된다. 일 구현예에서, 둘 이상의 서열이 분석되고 최저 GC 함량을 갖는 서열이 선택된다. 일 구현예에서, 오프-표적 일치는 유기체의 조절 서열에서 결정된다. 일 구현예에서, 유전자의 유전자좌는 조절 영역이다. 구현예는 상기 언급된 방법에 따라서 선택되는 표적화 서열을 포함하는 데드 가이드 RNA를 제공한다.

일 구현예에서, 본 발명은 유기체에서 유전자의 유전자좌로 작용화된 CRISPR 시스템을 표적화하기 위한 데드 가이드 RNA을 제공한다. 본 발명의 구현예에서, 데드 가이드 RNA는 표적화 서열을 포함하고, 표적 서열의 CG 함량은 70% 이하이고, 표적화 서열의 처음 15 nt는 유기체의 다른 유전자의 유전자좌의 조절 서열에서 CRISPR 모티프의 하류에 오프-표적 서열에 일치하지 않는다. 일정 구현예에서, 표적화 서열의 GC 함량은 60% 이하, 55% 이하, 50% 이하, 45% 이하, 40% 이하, 35% 이하 또는 30% 이하이다. 일정 구현예에서, 표적화 서열의 GC 함량은 70% 내지 60% 또는 60% 내지 50% 또는 50% 내지 40% 또는 40% 내지 30%이다. 일 구현예에서, 표적화 서열은 유전자좌의 잠재적인 표적화 서열 중에 최저 CG 함량을 갖는다.

본 발명의 구현예에서, 데드 가이드의 처음 15 nt는 표적 서열과 일치한다. 다른 구현예에서, 데드 가이드의 처음 14 nt는 표적 서열과 일치한다. 다른 구현예에서, 데드 가이드의 처음 13 nt는 표적 서열과 일치한다. 다른 구현예에서 데드 가이드의 처음 12 nt는 표적 서열과 일치한다. 다른 구현예에서, 데드 가이드의 처음 11 nt는 표적 서열과 일치한다. 다른 구현예에서, 데드 가이드의 처음 10 nt는 표적 서열과 일치한다. 본 발명의 구현예에서 데드 가이드의 처음 15 nt는 다른 유전자의 유전자좌의 조절 영역 내 CRISPR 모티프로부터 하류에 오프-표적 서열과 일치하지 않는다. 다른 구현예에서, 데드 가이드의 처음 14 nt, 또는 처음 13 nt, 또는 가이드의 처음 12 nt, 또는 데드 가이드의 처음 11 nt, 또는 데드 가이드의 처음 10 nt는 다른 유전자의 유전자좌의 조절 유전자에서 CRISPR 모티프로부터 하류에 오프-표적 서열과 일치하지 않는다. 다른 구현예에서, 데드 가이드의 처음 15 nt, 또는 14 nt, 또는 13 nt, 또는 12 nt, 또는 11 nt는 게놈에서 CRISPR 모트피로부터 하류에 오프-표적과 일치하지 않는다.

일정 구현예에서, 데드 가이드 RNA는 표적 서열과 일치하지 않는 3'-말단에 추가 뉴클레오티드를 포함한다. 따라서, CRISPR 모티프 하류에 처음 15 nt, 또는 14 nt, 또는 13 nt, 또는 12 nt, 또는 11 nt를 포함하는 데드 가이드 RNA는 12 nt, 13 nt, 14 nt, 15 nt, 16 nt, 17 nt, 18 nt, 19 nt, 20 nt, 또는 그 이상까지 3' 말단에서 길이가 연장될 수 있다.

본 발명은 데드 Cas9 (dCas9) 또는 작용화된 Cas9 시스템(작용화된 Cas9 또는 작용화된 가이드를 포함할 수 있음)을 포함하지만, 이들로 제한되지 않는 Cas9 CRISPR-Cas 시스템을 유전자의 유전자좌로 유도하는 방법을 제공한다. 일 구현예에서, 본 발명은 데드 가이드 RNA 표적화 서열을 선택하고, 작용화된 CRISPR 시스템을 유기체에서 유전자의 유전자좌로 유도하기 위한 방법을 제공한다. 일 구현예에서, 본 발명은 데드 가이드 RNA 표적화 서열을 선택하고 작용화된 Cas9 CRISPR-Cas 시스템에 의해 표적 유전자의 유전자좌의 유전자 조절을 실행하는 방법을 제공한다. 일정 구현예에서, 방법은 오프-표적 효과를 최소화하면서 표적 유전자 조절을 실행하는데 사용된다. 일 구현예에서, 본 발명은 둘 이상의 데드 가이드 RNA 표적화 서열을 선택하고 작용화된 Cas9 CRISPR-Cas 시스템에 의해서 둘 이상의 표적 유전자의 유전자좌의 유전자 조절을 실행하는 방법을 제공한다. 일정 구현예에서, 방법은 오프-표적 효과를 최소화하면서 둘 이상의 표적 유전자의 유전자좌의 조절을 실행하는데 사용된다.

일 구현예에서, 본 발명은 유기체에서 유전자의 유전자좌로 작용화된 Cas9로 유도하기 위해 데드 가이드 RNA 표적화 서열을 선택하는 방법을 제공하고, 방법은 a) 유저자의 유전자좌에 하나 이상의 CRISPR 모티프를 위치시키는 단계; b) i) CRISPR 모티프에 인접한 10 내지 15 nt 선택하는 단계, ii) 서열의 GC 함량을 결정하는 단계를 통해서 각각의 CRISPR 모티프의 하류 서열을 분석하는 단계; 및 c) 서열의 GC 함량이 40% 이상이면 가이드 RNA에서 사용을 위한 표적화 서열로서 10 내지 15 nt 서열을 선택하는 단계를 포함한다. 일 구현예에서, 서열은 GC 함량이 50% 이상이면 선택된다. 일 구현예에서, 서열은 GC 함량이 60% 이상이면 선택된다. 일 구현예에서, 서열은 GC 함량이 70% 이상이면 선택된다. 일 구현예에서, 둘 이상 서열이 분석되고 최고 GC 함량을 갖는 서열이 선택된다. 일 구현예에서, 방법은 CRISPR 모티프의 하류 서열과 일치하지 않는 선택된 서열의 3' 말단에 뉴클레오티드를 첨가하는 단계를 더 포함한다. 구현예는 상기 언급된 방법에 따라서 선택되는 표적화 서열을 포함하는 데드 가이드 RNA를 제공한다.

일 구현예에서, 본 발명은 유기체에서 유전자의 유전자좌에 대해 작용화된 CRISPR 시스템을 유도하기 위한 데드 가이드 RNA를 제공하고, 데드 가이드 RNA의 표적화 서열은 유전자의 유전자좌의 CRISPR 모티프에 인접한 10 내지 15개 뉴클레오티드로 이루어지고, 표적 서열의 CG 함량은 50% 이상이다. 일정 구현예에서, 데드 가이드 RNA는 유전자의 유전자좌의 CRISPR 모티프 하류 서열과 일치하지 않는 표적화 서열의 3' 말단에 첨가되는 뉴클레오티드를 더 포함한다.

일 구현예에서, 본 발명은 하나 이상, 또는 둘 이상 유전자의 유전자좌로 유도하려는 단일 이펙터를 제공한다. 일정 구현예에서, 이펙터는 Cas9와 연관되고, 하나 이상, 또는 둘 이상의 선택된 데드 가이드 RNA는 Cas9-연관된 이펙터를 하나 이상, 또는 둘 이상의 선택된 표적 유전자의 유전자좌로 유도하는데 사용된다. 일정 구현예에서, 이펙터는 하나 이상, 또는 둘 이상의 선택된 데드 가이드 RNA와 연관되고, 각각의 선택된 데드 가이드 RNA는 Cas9 효소와 복합체 형성될 때, 이의 회합된 이펙터가 데드 가이드 RNA 표적에 국재화하도록 한다. 이러한 CRISPR 시스템의 하나의 비제한적인 예는 동일한 전사 인자에 의한 조절이 가해지게 하나 이상, 또는 둘 이상의 유전자의 유전자좌의 활성을 조절한다.

일 구현예에서, 본 발명은 하나 이상의 유전자의 유전자좌로 유도시키려는 둘 이상의 이펙터를 제공한다. 일정 구현예에서, 둘 이상의 데드 가이드 RNA가 적용되고, 각각의 둘 이상의 이펙터는 선택된 데드 가이드 RNA와 연관되고, 각각의 둘 이상의 이펙터는 이의 데드 가이드 RNA의 선택된 표적에 국재화된다. 이러한 CRISPR 시스템의 하나의 비제한적인 예는 상이한 전사 인자에 의한 조절이 수행되게 하나 이상, 또는 둘 이상의 유전자의 유전자좌의 활성을 조절한다. 따라서, 하나의 비제한적인 구현예에서, 둘 이상의 전사 인자는 단일 유전자의 상이한 조절 서열에 국재화된다. 다른 비제한적인 구현예에서, 둘 이상의 전사 인자는 상이한 유전자의 상이한 조절 서열에 국재화된다. 일정 구현예에서, 하나의 전사 인자는 활성인자이다. 일정 구현예에서, 하나의 전사 인자는 억제제이다. 일정 구현예에서, 하나의 전사 인자는 활성인자이고 다른 전사 인자는 억제제이다. 일정 구현예에서, 동일한 조절 경로의 상이한 성분을 발현하는 유전자의 유전자좌가 조절된다. 일정 구현예에서, 상이한 조절 경로의 성분을 발현하는 유전자의 유전자좌가 조절된다.

일 구현예에서, 본 발명은 또한 활성 Cas9 CRISPR-Cas 시스템에 의해 매개되는 표적 DNA 절단 또는 표적 결합 및 유전자 조절에 특이적인 데드 가이드 RNA를 설계하고 선택하기 위한 방법 및 알고리즘을 제공한다. 일정 구현예에서, Cas9 CRISPR-Cas 시스템은 동시에 다른 유전자의 유전자좌에 결합하여 그의 조절을 촉진하면서 하나의 유전자의 유전자좌에서 표적 DNA를 절단하는 활성 Cas9를 사용한 직교 유전자 제어를 제공한다.

일 구현예에서, 본 발명은 절단없이, 유기체에서 유전자의 유전자좌로 작용화된 Cas9를 유도하기 위한 데드 가이드 RNA 표적화 서열을 선택하는 방법을 제공하고, 방법은 a) 유전자의 유전자좌에 하나 이상의 CRISPR 모티프를 위치시키는 단계; b) i) CRISPR 모티프에 인접한 10 내지 15 nt를 선택하는 단계, ii) 서열의 GC 함량을 결정하는 단계에 의해서 각 CRISPR 모티프 하류 서열을 분석하는 단계, 및 c) 서열의 GC 함량이 30% 이상, 40% 이상이면 데드 가이드 RNA에서 사용을 위한 표적화 서열로서 10 내지 15 nt 서열을 선택하는 단계를 포함한다. 일정 구현예에서, 표적화 서열의 GC 함량은 35% 이상, 40% 이상, 45% 이상, 50% 이상, 55% 이상, 60% 이상, 65% 이상, 또는 70% 이상이다. 일정 구현예에서, 표적화 서열의 GC 함량은 30% 내지 40% 또는 40% 내지 50% 또는 50% 내지 60% 또는 60% 내지 70%이다. 본 발명의 구현예에서, 유전자의 유전자좌에서 둘 이상의 서열을 분석하고 최고 GC 함량을 갖는 서열을 선택한다.

본 발명의 구현예에서, GC 함량이 평가된 표적화 서열의 일부는 PAM에 가장 가까운 15 표적 뉴클레오티드 중 10 내지 15개의 인접한 뉴클레오티드이다. 본 발명의 구현예에서, GC 함량이 고려되는 가이드의 일부는 PAM에 가장 가까운 15개 뉴클레오티드 중 10 내지 11개 뉴클레오티드 또는 11 내지 12개 뉴클레오티드 또는 12 내지 13개 뉴클레오티드 또는 13, 또는 14, 또는 15개 인접한 뉴클레오티드이다.

일 구현예에서, 본 발명은 기능성 활성화 또는 억제를 피하면서 CRISPR 유전자의 유전자좌 절단을 촉진하는 데드 가이드 RNA를 확인하기 위한 알고리즘을 더 제공한다. 16 내지 20개의 뉴클레오타이드의 데드 가이드 RNA에서 증가된 GC 함량은 증가된 DNA 절단 및 감소된 기능성 활성화와 동시에 일어난다는 것이 관찰된다.

일부 구현예에서, 작용화된 Cas9의 효율은 CRISPR 모티프 하류에 표적 서열과 일치하지 않는 가이드 RNA의 3' 말단에 뉴클레오티드의 첨가에 의해 증가될 수 있다. 예를 들어, 데드 가이드 RNA 중에서 11 내지 15 nt 길이이고, 더 짧은 가이드는 아마도 표적 절단을 촉진할 가능성이 덜할 수 있지만 또는 CRISPR 시스템 결합 및 기능성 제어의 촉진에서 덜 효율적이다. 일정 구현예에서, 데드 가이드 RNA의 3' 말단에 표적 서열과 일치하지 않는 뉴클레오티드의 첨가는 원치 않는 표적 절단을 증가시키지 않으면서 활성화 효율을 증가시킨다. 일 구현예에서, 본 발명은 또한 DNA 절단을 촉진하지 않으면서 DNA 결합 및 유전자 조절에서 CRISPR 시스템 기능을 효과적을 촉진하는 개선된 데드 가이드 RNA를 확인하기 위한 방법 및 알고리즘을 제공한다. 따라서, 일정 구현예에서, 본 발명은 CRISPR 모티프의 하류에 처음 15 nt, 또는 14 nt, 또는 13 nt, 또는 12 nt, 또는 11 nt를 포함하고, 12 nt, 13 nt, 14 nt, 15 nt, 16 nt, 17 nt, 18 nt, 19 nt, 20 nt 이상까지 표적과 일치하지 않는 뉴클레오티드에 의해 3' 말단에서 길이가 증가된 데드 가이드 RNA를 제공한다.

일 구현예에서, 본 발명은 선택적 직교 유전자 제어를 달성하기 위한 방법을 제공한다. 본 명세서의 개시내용으로부터 인식될 바와 같이, 가이드 길이 및 GC 함량을 고려하는 본 발명에 따른 데드 가이드 선택은, 예를 들어, 활성화 또는 저해에 의해 유전자의 유전자좌의 전사를 조절하고 오프-표적 효과를 최소화하기 위해, 기능성 Cas9 CRISPR-Cas 시스템에 의한 효과적이고 선택적인 전사 제어를 제공한다. 따라서, 개별 표적 유전자좌의 효율적인 제어를 제공함으로써, 본 발명은 또한, 둘 이상의 표적 유전자좌의 효율적인 직교 제어를 제공한다.

일정 구현예에서, 직교 유전자 제어는 둘 이상의 표적 유전자좌의 활성화 또는 억제에 의한다. 일정 구현예에서, 직교 유전자 제어는 하나 이상의 표적 유전자좌의 활성화 또는 억제 및 하나 이상의 표적 유전자좌의 절단에 의한다.

일 구현예에서, 본 발명은 본 명세서에 기재된 방법 또는 알고리즘에 따라 개시되거나 또는 이루어진 하나 이상의 데드 가이드 RNA를 포함하는 비천연 유래Cas9 CRISPR-Cas 시스템을 포함하는 세포를 제공하고, 하나 이상의 유전자 생산물의 발현은 변경되었다. 본 발명의 구현예에서, 둘 이상의 유전자 생산물의 세포에서의 발현이 변경되었다. 본 발명은 또한 이러한 세포의 세포주를 제공한다.

일 구현예에서, 본 발명은 본 명세서에 기재된 방법 또는 알고리즘에 따라 개시되거나 또는 이루어진 하나 이상의 데드 가이드 RNA를 포함하는 비천연 유래 Cas9 CRISPR-Cas 시스템을 포함하는 하나 이상의 세포를 포함하는 다세포 유기체를 제공한다. 일 구현예에서, 본 발명은 본 명세서에 기재된 방법 또는 알고리즘에 따라 개시되거나 또는 이루어진 하나 이상의 데드 가이드 RNA를 포함하는 비천연 유래 Cas9 CRISPR-Cas 시스템을 포함하는 세포, 세포주 또는 다세포 유기체로부터의 산물을 제공한다.

본 발명의 추가 구현예는 Cas9의 과발현 또는 바람직하게 Cas9의 녹인을 위해 조작된, 시스템 예를 들어, 세포, 유전자이식 동물, 유전자이식 마우스, 유도성 유전자이식 동물, 유도성 유전자이식 마우스와 조합하여, 당분야 또는 본 명세서에 기술된 바와 같은 가이드(들)를 포함하는 gRNA와 임의로 조합하여, 본 명세서에 기술된 바와 같은 데드 가이드(들)를 포함하는 gRNA의 용도이다. 그 결과로서, 단일 시스템 (예를 들어, 유전자이식 동물, 세포)은 시스템/네트워크 생물학에서 다중 유전자 변형을 위한 기반으로서 작용한다. 데드 가이드 때문에, 이것은 이제 시험관내, 생체외, 및 생체내에서 가능하다.

예를 들어, 일단 Cas9가 제공되면, 하나 이상의 데드 gRNA는 다중복합 유전자 조절, 바람직하게는 다중복합 양방향 유전자 조절을 보내도록 제공될 수 있다. 필요하거나 요망된다면 하나 이상의 데드 gRNA는 공간적으로 그리고 일시적으로 적절한 방식(예를 들어, Cas9 발현의 조직 특이적 유도)으로 제공될 수 있다. 관심 대상의 세포, 조직, 동물에서 유전자이식/유도성 Cas9가 제공되기 때문에(예를 들어, 발현됨) 데드 가이드를 포함하는 gRNA와 가이드를 포함하는 gRNA는 동일하게 효과적이다. 동일한 방식으로, 본 발명의 추가 구현예는 녹아웃 Cas9 CRISPR-Cas를 위해 조작된 시스템 (예를 들어, 세포, 유전자이식 동물, 유전자이식 마우스, 유도성 유전자이식 동물, 유도성 유전자이식 마우스)과 조합하여, 최신 기술 또는 본 명세서에 기술된 바와 같은 가이드(들)를 포함하는 gRNA와 임의로 조합하여, 본 명세서에 기술된 바와 같은 데드 가이드(들)를 포함한 gRNA의 용도이다.

그 결과, 본 명세서에 기재된 CRISPR 적용 및 당업계에 공지된 CRISPR 적용과 함께 본 명세서에 기재된 바와 같은 데드 가이드의 조합은 시스템의 다중복합 선별을 위한 고도로 효율적이고 정확한 수단(예를 들어, 네트워크 생물학)을 초래한다. 이러한 스크리닝은 예를 들어 질환 (예를 들어, 온/오프 조합), 특히 유전자 관련 질병의 원인이 되는 유전자를 식별하기 위한 유전자 활성의 특정 조합의 식별을 허용한다. 이러한 스크리닝의 바람직한 적용은 암이다. 동일한 방식으로, 이러한 질환에 대한 치료를 위한 선별이 본 발명에 포함된다. 세포 또는 동물은 비정상 병태에 노출되어 질환 또는 질환 유사 효과를 초래할 수 있다. 후보 조성물이 제공될 수 있으며, 목적하는 다중복합 환경에서의 효과에 대해 스크리닝될 수 있다. 예를 들어, 환자의 암 세포는 요전자 조합이 그들을 사망에 이르게 하는 것을 스크리닝할 수 있고, 그 다음에 적절한 요법을 확립하기 위한 이러한 정보를 사용할 수 있다.

일 구현예에서, 본 발명은 본 명세서에 기술된 성분 중 하나 이상을 포함하는 키트를 제공한다. 키트는 본 명세서에 기술된 바와 같은 가이드 존재 또는 부재로 본 명세서에 기술된 바와 같은 데드 가이드를 포함할 수 있다.

본 명세서에 제공된 구조적 정보는 표적 DNA 및 Cas9와의 데드 gRNA 상호작용의 질의를 가능하게 하여, 전체 Cas9 CRISPR-Cas 시스템의 작용성을 최적화하도록 데드 gRNA 구조의 조작 또는 변경을 허용한다. 예를 들어, 데드 gRNA의 루프는 RNA에 결합할 수 있는 어댑터 단백질의 삽입에 의한 Cas9 단백질과의 충돌 없이 연장될 수 있다. 이들 어댑터 단백질은 하나 이상의 기능성 도메인을 포함하는 이펙터 단백질 또는 융합체를 추가로 동원할 수 있다.

일부 바람직한 구현예에서, 기능성 도메인은 전사 활성화 도메인, 바람직하게 VP64이다. 일부 구현예에서, 기능성 도메인은 전사 억제 도메인, 바람직하게 KRAB이다. 일부 구현예에서, 전사 억제 도메인은 SID, 또는 SID의 콘카타머 (예를 들어, SID4X)이다. 일부 구현예에서, 기능성 도메인은, 후생적 변형 효소가 제공되도록, 후생적 변형 도메인이다. 일부 구현예에서, 기능성 도메인은 활성화 도메인으로서, P65 활성화 도메인일 수 있다.

본 발명의 구현예는 상기 구성요소가 단일 조성물에 포함되거나 또는 개별 조성물에 포함된다는 것이다. 이들 조성물은 게놈 수준 상에서 기능적 효과를 유발하도록 숙주에게 유리하게 적용될 수 있다.

일반적으로, 데드 gRNA는 (예를 들어, 융합 단백질을 통해) 하나 이상의 기능성 도메인을 포함하는 어댑터 단백질이 결합하는 특정 결합 부위(예를 들어, , 앱타머)를 제공하는 방식으로 변형된다. 일단 데드 gRNA가 CRISPR 복합체(즉, 데드 gRNA 및 표적에 결합하는 Cas9)를 형성하도록 변형된 데드 gRNA는 변형되고, 어댑터 단백질이 결합하며, 어댑터 단백질 상의 기능성 도메인은 속성 작용이 유효하게 되는 것이 유리한 공간적 배향으로 위치된다. 예를 들어, 기능적 도메인이 전사 활성인자 (예를 들어, VP64 또는 p65)인 경우, 전사 활성인자는, 표적의 전사에 작용하도록 하는 공간 배향으로 위치된다. 유사하게, 전사 억제인자는 유리하게는 표적의 전사에 영향을 미치도록 배치될 것이며, 뉴클레아제 (예를 들어, Fok1)는 유리하게는 표적을 절단하거나 부분적으로 절단하도록 배치될 것이다.

당업자는 어댑터 + 기능성 도메인의 결합을 가능하게 하지만 어댑터 + 기능성 도메인의 적절한 위치화를 가능하게 하지 않는(예를 들어, CRISPR 복합체의 3차원 구조 내의 입체 장애에 기인) 데드 gRNA에 대한 변형은 의도되지 않은 변형이라는 것을 이해할 것이다. 하나 이상의 변형된 데드 gRNA는 본 명세서에 기술된 바와 같이, 테트라 루프, 스템 루프 1, 스템 루프 2, 또는 스템 루프 3에서, 바람직하게 테트라 루프 또는 스템 루프 2, 및 가장 바람직하게 테트라 루프 및 스템 루프 2 둘 모두에서 변형될 수 있다.

본 명세서에서 설명하는 바와 같이 기능성 도메인은 예를 들어, 메틸라제 활성, 데메틸라제 활성, 전사 활성화 활성, 전사 억제 활성, 전사 방출 인자 활성, 히스톤 변형 활성, RNA 절단 활성, DNA 절단 활성, 핵산 결합 활성, 및 분자 스위치 (예를 들어, 광 유도성)로 이루어진 군으로부터 선택되는 하나 이상의 도메인일 수 있다. 일부 경우에, 추가로 적어도 하나의 NLS이 제공되는 것이 유리하다. 일부 예에서, N 말단에서 NLS를 위치시키는 것이 유리하다. 하나 초과의 기능성 도메인이 포함될 때, 기능성 도메인은 동일할 수 있거나 또는 상이할 수 있다.

데드 gRNA는 동일하거나 또는 상이한 어댑터 단백질에 특이적인 다수 결합 인식 부위 (예를 들어, 압타머)를 포함하도록 설계될 수 있다. 데드 gRNA는 전사 출발 부위 (즉, TSS) 상류의프로모터 영역 -1000 - +1 핵산, 바람직하게 -200 핵산에 결합하도록 설계될 수 있다. 이러한 위치화는 유전자 활성화 (예를 들어, 전사 활성인자) 또는 유전자 억제 (예를 들어, 전사 억제인자)에 영향을 미치는 기능성 도메인을 개선시킨다. 변형된 데드 gRNA는 조성물에 포함되는 하나 이상의 표적 유전자좌 (예를 들어, 적어도 1 gRNA, 적어도 2 gRNA, 적어도 5 gRNA, 적어도 10 gRNA, 적어도 20 gRNA, 적어도 30 gRNA, 적어도 50 gRNA)에 표적화되는 하나 이상의 변형된 데드 gRNA일 수 있다.

어댑터 단백질은 변형된 데드 gRNA에 도입된 압타머 또는 인식 부위에 결합되고, 데드 gRNA가 CRISPR 복합체에 도입되면, 하나 이상의 기능성 도메인의 적절한 위치화가 기여된 기능으로 표적에 영향을 미치도록 허용하는 임의 수의 단백질일 수 있다. 본 출원에서 상세히 설명하는 바와 같이, 이것은 외피 단백질, 바람직하게 박테리오파지 외피 단백질일 수 있다. (예를 들어, 융합 단백질의 형태로) 이러한 어댑터 단백질과 회합된 기능성 도메인은 예를 들어, 메틸라제 활성, 데메틸라제 활성, 전사 활성화 활성, 전사 억제 활성, 전사 방출 인자 활성, 히스톤 변형 활성, RNA 절단 활성, DNA 절단 활성, 핵산 결합 활성, 및 분자 스위치 (예를 들어, 광 유도성)로 이루어진 군으로부터 선택되는 하나 이상의 도메인을 포함할 수 있다. 바람직한 도메인은 Fok1, VP64, P65, HSF1, MyoD1이다. 기능성 도메인이 전사 활성인자 또는 전사 억제인자인 사건에서, 추가로 적어도 NLS는 바람직하게 N 말단에 제공되는 것이 유리하다. 하나 초과의 기능성 도메인이 포함될 때, 기능성 도메인은 동일할 수 있거나 또는 상이할 수 있다. 어댑터 단백질은 이러한 기능성 도메인에 부착시키기 위해 알려진 링커를 이용할 수 있다.

따라서, 변형된 데드 gRNA, (불활성화된) Cas9 (기능성 도메인이 있거나 또는 없음), 및 하나 이상의 기능성 도메인을 갖는 결합 단백질은 각각 개개로 조성물에 포함될 수 있고, 숙주에 개개로 또는 총괄적으로 투여될 수 있다. 대안적으로 이들 성분은 숙주에 대한 투여를 위해 단일 조성물에서 제공될 수 있다. 숙주에 대한 투여는 숙주에 대한 전달을 위해 당업자에게 공지되거나 또는 본 명세서에 기재된 바이러스 벡터 (예를 들어, 렌티바이러스 벡터, 아데노바이러스 벡터, AAV 벡터)를 통해 수행될 수 있다. 본 명세서에서 설명하는 바와 같이, (예를 들어, 렌티바이러스 gRNA 선택을 위한) 상이한 선별 마커 및 gRNA의 농도(예를 들어, 다수의 gNRA가 사용되었는지의 여부에 따라)의 이용은 개선된 효과의 유도를 위해 유리할 수 있다.

이러한 개념에 기초하여, 몇몇 변화들은 게놈 유전자좌에서의 이벤트, 예를 들어 DNA 절단, 유전자 활성화, 또는 유전자 탈활성화를 유도하는데 적절하다. 제공된 조성물을 이용하여, 당업자는 하나 이상의 게놈 유전자좌 이벤트를 유도하기 위해 동일하거나 상이한 기능적 도메인을 갖는 단일 또는 다수의 유전자좌를 유리하게 특이적으로 표적화할 수 있다. 조성물은 세포 내 라이브러리에서의 선별 및 생체내 기능성 모델링을 위한 매우 다양한 방법에 적용될 수 있다 (예를 들어, lincRNA의 유전자 활성화 및 기능의 확인; 기능-획득 모델링; 기능-상실 모델링; 최적화 및 스크리닝 목적을 위해 세포주 및 유전자이식 동물을 확립하는 본 발명의 조성물의 용도).

본 발명은 본 발명 또는 적용 전에 믿어지지 않은 조건적 또는 유도성 CRISPR 유전자이식 세포/동물을 확립하고 이용하기 위한 본 발명의 조성물의 용도를 이해한다. 예를 들어, 표적 세포는 조건적으로 또는 유도적으로 (예를 들어, Cre 의존적 구성체 형태로) Cas9 및/또는 조건적으로 또는 유도적으로 어댑터 단백질을 포함하고, 표적 세포에 도입된 벡터의 발현에 대해, 벡터는 표적 세포에서 Cas9 발현 및/또는 어댑터 발현의 조건을 유도하거나 또는 일으키는 것을 발현시킨다. CRISPR 복합체를 생성하는 공지된 방법으로 본 발명의 교시 및 조성물을 적용함으로써, 기능성 도메인에 의해 영향받은 유도성 게놈 사건은 또한 본 발명의 양상이다. 이의 일례는 CRISPR 녹-인/조건적 유전자이식 동물 (예를 들어, Lox-Stop-polyA-Lox(LSL) 카세트를 포함하는 마우스)의 생성 및 본 명세서에 기술된 바와 같은 하나 이상의 변형된 데드 gRNA (예를 들어, 유전자 활성화 목적을 위해 관심 표적 유전자의 TSS에 대해 -200 뉴클레오티드) (예: 외피 단백질, 예를 들어, MS2에 의해 인식되는 하나 이상의 압타머에 의해 변형된 데드 gRNA), 본 명세서에 기술된 바와 같은 하나 이상의 어댑터 단백질 (하나 이상의 VP64에 연결된 MS2 결합 단백질) 및 조건적 동물 유도를 위한 수단 (예를 들어, Cas9 발현 유도 야기를 위한 Cre 리콤비나제)을 포함하는 하나 이상의 조성물의 후속 전달이다. 대안적으로 어댑터 단백질은 스크리닝 목적을 위한 유효 모델을 제공하기 위해 조건적 또는 유도성 Cas9를 갖는 조건적 또는 유도적 구성요소로서 제공될 수 있는데, 이는 유리하게는 단지 최소의 설계 및 다수의 적용을 위한 특정 데드 gRNA의 투여를 필요로 한다.

다른 구현예에서 데드 가이드는 특이성을 개선시키도록 더 변형된다. 보호된 데드 가이드가 합성될 수 있으며, 데드 가이드의 3' 단부에 2차 구조가 도입되어 그의 특이성을 개선시킨다. 보호된 가이드 RNA(pgRNA)는 세포 및 보호자 가닥 내 관심 대상의 게놈 유전자좌에서 표적 서열에 혼성화할 수 있는 가이드 서열을 포함하고, 보호자 가닥은 선택적으로 가이드 서열에 대해 상보성이고, 가이드 서열은 보호자 가닥에 일부분 혼성화가능할 수 있다. pgRNA는 임의로 연장 서열을 포함한다. pgRNA-표적 DNA 혼성화의 열역학은 가이드 RNA 및 표적 DNA 간 상보적인 다수 염기에 의해 결정된다. '열역학적 보호'를 사용함으로써, 데드 gRNA의 특이성은 보호자 서열을 첨가하여 개선될 수 있다. 예를 들어, 한 방법은 데더 gRNA 내 가이드 서열의 3' 말단에 다양한 길이의 상보적 보호자 가닥을 첨가한다. 그 결과로, 보호자 가닥은 데드 gRNA의 적어도 일부에 결합하고 보호된 gRNA (pgRNA)를 제공한다. 결국, 본 명세서의 데드 gRNA 기준은 기술된 구현예를 사용해 쉽게 보호할 수 있어서, pgRNA를 생성시킨다. 보호자 가닥은 별개 RNA 전사물 또는 가닥일 수 있거나 또는 데드 gRNA 가이드 서열의 3' 말단에 연결된 키메라 형태일 수 있다.

직렬 가이드 및 다중복합 (직력) 표적화 접근법에서 용도

본 발명자들은 본 명세서에서 정의된 바와 같은 CRISPR 효소가 활성을 잃지 않으면서 하나 초과의 RNA 가이드를 사용할 수 있음을 보여주었다. 이는 본 명세서에서 정의된 바와 같은 단일 효소, 시스템 또는 복합체를 이용하여 다수의 DNA 표적, 유전자 또는 유전자좌를 표적하기 위한 본 명세서에서 정의된 바와 같은 CRISPR 효소, 시스템 또는 복합체의 이용을 가능하게 한다. 가이드 RNA는 직렬로 배열되고, 선택적으로 뉴클레오티드 서열, 예컨대 본 명세서에 정의된 바와 같은 직접 반복부에 의해 분리될 수 있다. 상이한 가이드 RNA의 위치는 활성에 영향을 미치지 않는 직렬이다. 용어 "CRISPR-Cas 시스템, CRISP-Cas 복합체" "CRISPR 복합체" 및 "CRISPR 시스템"은 상호호환 가능하게 사용된다는 것이 주목된다. 또한, 용어 "CRISPR 효소, Cas 효소" 또는 "CRISPR-Cas 효소"는 상호교환가능하게 사용될 수 있다. 바람직한 구현예에서, 상기 CRISPR 효소, CRISP-Cas 효소 또는 Cas 효소는 Cas9, 또는 본 명세서의 다른 곳에 기술된 변형되거나 또는 돌연변이된 변이체의 어느 하나이다.

일 구현예에서, 본 발명은 직렬 또는 다중복합 표적화를 위해 사용되는, 비-천연 발생 또는 조작된 CRISPR 효소, 바람직하게 클래스 2 CRISPR 효소, 바람직하게 본 명세서에 기술된 바와 같은 V형 또는 VI형 CRISPR 효소, 예컨대 제한없이 본 명세서의 다른 곳에 기술된 바와 같은 Cas9를 제공한다. 본 명세서의 다른 곳에 기술된 바와 같이 본 발명에 따른 임의의 CRISPR (또는 CRISPR-Cas 또는 Cas) 효소, 복합체, 또는 시스템은 이러한 접근법에서 사용될 수 있다는 것을 이해한다. 본 명세서의 다른 곳에 기술된 바와 같은 임의의 방법, 생산물, 조성물, 및 용도는 추가로 하기에 상술되는 다중복합 또는 직렬 표적화 접근법으로 동등하게 적용가능하다. 추가 지침을 통해서, 하기 특정 구현예 및 구현예를 제공한다.

일 구현예에서, 본 발명은 다수 유전자의 유전자좌를 표적화하기 위한 본 명세서에 정의된 바와 같은 Cas9 효소, 복합체, 또는 시스템의 용도를 제공한다. 일 구현예에서, 이것은 다수 (직렬 또는 다중복합) 가이드 RNA (gRNA) 서열을 사용해 확립될 수 있다.

일 구현예에서, 본 발명은 직렬 또는 다중복합 표적화를 위해 본 명세서에 정의된 바와 같은 Cas9 효소, 복합체 또는 시스템의 하나 이상의 구성요소를 사용하는 방법을 제공하고, 상기 CRISP 시스템은 다수 가이드 RNA 서열을 포함한다. 바람직하게, 상기 gRNA 서열은 본 명세서의 다른 곳에 정의된 바와 같은 뉴클레오티드 서열, 예컨대 직접 반복부에 의해 분리된다.

본 명세서에 정의된 바와 같은 Cas9 효소, 시스템 또는 복합체는 다수 표적 폴리뉴클레오티드를 변형시키기 위한 효과적인 수단을 제공한다. 본 명세서에 정의된 바와 같은 Cas9 효소, 시스템 또는 복합체는 세포 유형의 다중도에서 하나 이상의 표적 폴리뉴클레오티드를 변형 (예를 들어, 결실, 삽입, 전좌, 불활성화, 활성화)하는 것을 포함한 다양한 유용성을 갖는다. 이와 같이 본 명세서에 정의된 바와 같은 Cas9 효소, 시스템 또는 복합체는 단일한 CRISPR 시스템 내에 다수 유전자의 유전자좌 표적화를 포함하여, 예를 들어, 유전자 요법, 약물 스크리닝, 질환 진단, 및 예후에서 광범위 적용을 갖는다.

일 구현예에서, 본 발명은 본 명세서에 정의된 바와 같은 Cas9 효소, 시스템 또는 복합체, 즉, 이와 연관된 적어도 하나의 탈안정화 도메인을 갖는 Cas9 단백질을 갖는 Cas9 CRISPR-Cas 복합체, 및 다중 핵산 분자, 예컨대 DNA 분자를 표적화하는 다중 가이드 RNA를 제공하고, 이에 의해 상기 다중 가이드 RNA의 각각은 그의 대응하는 핵산 분자, 예를 들어, DNA 분자를 특이적으로 표적화한다. 각각의 핵산 분자 표적, 예를 들어, DNA 분자는 유전자 생산물을 코딩할 수 있거나 또는 유전자의 유전자좌를 포괄할 수 있다. 따라서, 다수 가이드 RNA의 사용은 다수 유전자의 유전자좌 또는 다수 유전자의 표적화를 가능하게 한다. 일부 구현예에서 Cas9 효소는 유전자 생산물을 코딩하는 DNA 분자를 절단할 수 있다. 일부 구현예에서 유전자 생산물의 발현은 변경된다. Cas9 단백질 및 가이드 RNA은 천연적으로 함께 발생되지 않는다. 본 발명은 직렬로 배열된 가이드 서열을 포함하는 가이드 RNA를 이해한다. 본 발명은 진핵생물 세포에서 발현을 위해 코돈 최적화되는 Cas9 단백질에 대한 코딩 서열을 더욱 이해한다. 바람직한 구현예에서 진핵생물 세포는 포유동물 세포, 식물 세포 또는 효모 세포이고, 보다 바람직한 구현예에서, 포유동물 세포는 인간 세포이다. 유전자 생산물의 발현은 감소될 수 있다. Cas9 효소는 CRISPR 시스템 또는 복합체의 일부를 형성할 수 있고, 이것은 각각이 세포에서 관심 게놈 유전자좌의 표적 서열과 특이적으로 혼성화할 수 있는, 일련의 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 25, 25, 30, 또는 30 초과 가이드 서열을 포함하는 직렬로 배열된 가이드 RNA (gRNA)를 더 포함한다. 일부 구현예에서, 기능성 Cas9 CRISPR 시스템 또는 복합체는 다수 표적 서열에 결합한다. 일부 구현예에서, 기능성 CRISPR 시스템 또는 복합체는 다수 표적 서열을 편집할 수 있고, 예를 들어, 표적 서열은 게놈 유전자좌를 포함할 수 있고, 일부 구현예에서, 유전자 발현의 변경이 존재할 수 있다. 일부 구현예에서, 기능성 CRISPR 시스템 또는 복합체는 기능성 도메인을 더 포함할 수 있다. 일부 구현예에서, 본 발명은 다수 유전자 생산물의 발현을 변경시키거나 또는 변형시키기 위한 방법을 제공한다. 방법은 상기 표적 핵산, 예를 들어, DNA 분자를 포함하거나, 또는 표적 핵산, 예를 들어, DNA 분자를 함유하고 발현하는 세포에 도입시키는 단계를 포함할 수 있고, 예를 들어, 표적 핵산은 유전자 생산물을 코딩할 수 있거나 또는 유전자 생산물 (예를 들어, 조절 서열)의 발현을 제공할 수 있다.

바람직한 구현예에서 다중복합 표적화에 사용되는 CRISPR 효소는 Cas9이거나, 또는 CRISPR 시스템 또는 복합체는 Cas9를 포함한다. 일부 구현예에서, 다중복합 표적화에 사용되는 CRISPR 효소는 AsCas9이거나, 또는 다중복합 표적화에 사용되는 CRISPR 시스템 또는 복합체는 AsCas9를 포함한다. 일부 구현예에서, CRISPR 효소는 LbCas9이거나, 또는 CRISPR 시스템 또는 복합체는 LbCas9를 포함한다. 일부 구현예에서, 다중복합 표적화에 사용되는 Cas9 효소는 DNA의 양쪽 가닥을 절단하여 이중 가닥 파괴 (DSB)를 일으킨다. 일부 구현예에서, 다중복합 표저고하에 사용되는 CRISPR 효소는 닉카제이다. 일부 구현예에서, 다중복합 표적화에 사용되는 Cas9 효소는 이중 닉카제이다. 일부 구현예에서, 다중복합 표적화에 사용되는 Cas9 효소는 Cas9 효소 예컨대 본 명세서의 다른 곳에 정의된 바와 같은 DD Cas9 효소이다.

일부 일반적인 구현예에서, 다중복합 표적화에 사용되는 Cas9 효소는 하나 이상의 기능성 도메인과 연관된다. 일부 보다 특별한 구현예에서, 다중복합 표적화에 사용되는 CRISPR 효소는 본 명세서의 다른 곳에 정의된 바와 같은 deadCas9이다.

일 구현예에서, 본 발명은 본 명세서에 정의된 바와 같은 다중 표적화 또는 본 명세서에 정의된 폴리뉴클레오티드에서 사용하기 위한 Cas9 효소, 시스템 또는 복합체를 전달하기 위한 수단을 제공한다. 이러한 전달 수단의 비제한적 예는, 예를 들어, 복합체의 성분(들)을 전달하는 입자(들), 본 명세서에 논의된 폴리뉴클레오티드(들)를 포함하는 (예를 들어, CRISPR 효소를 암호화하고, CRISPR 복합체를 암호화하는 뉴클레오티드를 제공하는) 벡터(들)이다. 일부 구현예에서, 벡터는 플라스미드 또는 바이러스 벡터, 예컨대 AAV 또는 렌티바이러스일 수 있다. 예를 들어, HEK 세포로 플라스미드에 의한 일시적 형질감염은 특히 AAV의 크기 제한을 고려하면, 유리할 수 있고, Cas9가 AAV에 맞치만, 추가 가이드 RNA로 상한치에 도달할 수 있다.

또한 다중복합 표적화에서 사용하기 위한 본 명세서에 사용된 바와 같은 Cas9 효소, 복합체 또는 시스템을 구성적으로 발현시키는 모델이 제공된다. 유기체는 유전자이식일 수 있고, 본 벡터로 형질감염될 수 있거나 또는 이렇게 형질감염된 유기체의 자손일 수 있다. 추가 구현예에서, 본 발명은 본 명세서에 정의된 바와 같은 CRISPR 효소, 시스템 및 복합체 또는 본 명세서에 기재된 폴리뉴클레오타이드 또는 벡터를 포함하는 조성물을 제공한다. 도한 바람직하게 직렬로 배열된 형태로, 다수 가이드 RNA를 포함하는 복합체 또는 Cas9 CRISPR 시스템을 제공한다. 상기 상이한 가이드 RNA는 뉴클레오티드 서열 예컨대 직접 반복부에 의해 분리될 수 있다.

A대상체, 예를 들어 치료를 필요로 하는 대상체를 치료하는 방법으로서, 이는 대상체를 Cas9 CRISPR 시스템 또는 복합체를 코딩하는 폴리뉴클레오티드 또는 본 명세서에 설명된 임의의 폴리뉴클레오티드 또는 벡터로 형질전환시킴으로써 유전자 편집을 유도하고, 그를 대상체로 투여하는 것을 포함하는 방법이 또한 제공된다. 적합한 복구 주형은 또한 상기 복구 주형을 포함하는 벡터에 의해 제공, 예를 들어, 전달될 수 있다. 대상체, 예를 들어 치료를 필요로 하는 대상체를 치료하는 방법으로서, 대상체를 본 명세서에 설명된 바와 같은 폴리뉴클레오티드 또는 벡터로 형질전환시킴으로써 다수 표적 유전자좌의 전사 활성화 또는 억제를 유도하는 것을 포함하는 방법이 또한 제공되며, 여기서 상기 폴리뉴클레오티드 또는 벡터는 바람직하게는 직렬로 배열된 다수의 가이드 RNA를 포함하는 Cas9 효소, 복합체 또는 시스템을 코딩 또는 포함한다. 임의의 치료가 생체 외, 예를 들어 세포 배양물에서 일어나는 경우, 이는 용어 '대상체'가 '세포 또는 세포 배양물'이라는 구절로 대체될 수 있음을 이해해야 할 것이다.

본 명세서의 다른 곳에 정의된 바와 같은 치료 방법에서 사용하기 위한, 바람직하게는 직렬 배열된 다수 가이드 RNA를 포함하는 Cas9 효소, 복합체 또는 시스템을 포함하는 조성물, 또는 바람직하게는 직렬 배열된 다수 가이드 RNA를 포함하는 상기 Cas9 효소, 복합체 또는 시스템을 코딩하거나 또는 포함하는 폴리뉴클레오티드 또는 벡터가 또한 제공된다. 이러한 조성물을 포함하는 부분의 키트가 제공될 수 있다. 이러한 치료 방법을 위한 의약의 제조에서 상기 조성물의 용도가 또한 제공된다. 스크리닝에서의 Cas9 CRISPR 시스템의 이용 또한 본 발명에 의해 제공되고, 예를 들어 기능 획득을 스크리닝한다. 유전자를 과발현시키도록 인공적으로 힘이 가해진 세포는, 예를 들어, 음성 피드백 루프에 의해 시간에 따라 유전자를 하향조절할 수 있다 (평형상태 재확립). 스크린 시작 시간까지, 비조절된 유전자가 다시 감소될 수 있다. 유도성 Cas9 활성인자의 사용은 스크린 바로 직전에 전사를 유도할 수 있게 하고 그러므로 위음성 히트 기회를 최소화한다. 따라서, 스크리닝, 예를 들어, 기능 획득 스크리닝에서 본 발명의 사용을 통해서, 위음성 결과의 기회를 최소화할 수 있다.

일 구현예에서, 본 발명은 Cas9 단백질 및 각각이 세포에서 유전자 생산물을 코딩하는 DNA 분자를 특이적으로 표적화하는 다수 가이드 RNA를 포함하는 조작된, 비-천연 발생 CRISPR 시스템을 제공하고, 그리하여 다수 가이드 RNA는 각각이 유전자 생산물을 코딩하는 그들의 특이적 DNA 분자를 표적화하고 Cas9 단백질은 유전자 생산물을 코딩하는 표적 DNA 분자를 절단하여, 유전자 생산물의 발현이 변경되고, CRISPR 단백질 및 가이드 RNA는 함께 천연적으로 발생되지 않는다. 본 발명은 바람직하게 뉴클레오티드 서열 예컨대 직접 반복부에 의해 분리되고, 임의로 tracr 서열에 융합된, 다수 가이드 서열을 포함하는 다수 가이드 RNA를 이해한다. 본 발명의 구현예에서 CRISPR 단백질은 V형 또는 VI형 CRISPR-Cas 단백질이고, 보다 바람직한 구현예에서 CRISPR 단백질은 Cas9 단백질이다. 본 발명은 진핵생물 세포에서 발현을 위해 코돈 최적화된 Cas9 단백질을 더욱 이해한다. 바람직한 구현예에서 진핵생물 세포는 포유동물 세포이고, 보다 바람직한 구현예에서 포유동물 세포는 인간 세포이다. 본 발명의 추가 구현예에서, 유전자 생산물의 발현은 감소된다.

다른 구현예에서, 본 발명은 각각이 유전자 생산물을 코딩하는 DNA 분자를 특이적으로 표적화하는 다수 Cas9 CRISPR 시스템 가이드 RNA에 작동적으로 연결된 제1 조절 구성요소 및 CRISPR 단백질을 코딩하는 것에 작동적으로 연결된 제2 조절 구성요소를 포함하는 하나 이상의 벡터를 포함하는 조작된, 비-천연 발생 벡터 시스템을 제공한다. 양쪽 조절 구성요소는 시스템의 동일한 벡터 또는 상이한 벡터에 위치될 수 있다. 다수 가이드 RNA는 세포에서 다수 유전자 생산물을 코딩하는 다수 다수 DNA 분자를 표적화하고 CRISPR 단백질은 유전자 생산물을 코딩하는 다수 DNA 분자를 절단 (하나 또는 양쪽 가닥을 절단할 수 있거나 또는 실질적으로 뉴클레아제 활성을 갖지 않음)할 수 있어서, 다수 유전자 생산물의 발현이 변경되고; CRISPR 단백질 및 다수 가이드 RNA는 천연적으로 함께 발생되지 않는다. 바람직한 구현예에서 CRISPR 단백질은 Cas9 단백질로서, 임의로 진핵생물 세포에서 발현을 위해 코돈 최적화된다. 바람직한 구현예에서 진핵생물 세포는 포유동물 세포, 식물 세포 또는 효모 세포이고, 보다 바람직한 구현예에서 포유동물 세포는 인간 세포이다. 본 발명의 추가 구현예에서, 각각의 다수 유전자 생산물의 발현이 변경되고, 바람직하게 감소된다.

일 구현예에서, 본 발명은 하나 이상의 벡터를 포함하는 벡터 시스템을 제공한다. 일부 구현예에서, 시스템은 (a) 직접 반복부 서열 및 직접 반복부 서열의 상류 또는 하류 (어느쪽이든 적용가능)에 하나 이상의 가이드 서열의 삽입을 위한 하나 이상의 삽입 부위에 작동적으로 연결된 제1 조절 구성요소로서, 발현될 때, 하나 이상의 가이드 서열(들)은 진핵생물 세포 내 하나 이상의 표적 서열(들)로 CRISPR 복합체의 서열-특이적 결합을 유도시키고, CRISPR 복합체는 하나 이상의 표적 서열(들)과 혼성화하는 하나 이상의 가이드 서열(들)과 복합체 형성하는 Cas9 효소를 포함하는 것인 제1 조절 구성요소; 및 (b) 바람직하게 적어도 하나의 핵 국재화 서열 및/또는 적어도 하나의 NES를 포함하는 상기 Cas9 효소를 코딩하는 효소-코딩 서열에 작동적으로 연결된 제2 조절 구성요소를 포함하고, 성분 (a) 및 (b)는 시스템의 동일하거나 또는 상이한 벡터 상에 위치된다. 적용가능한 경우에, tracr 서열이 또한 제공될 수 있다. 일부 구현예에서, 성분 (a)는 제1 조절 구성요소에 작동적으로 연결된 둘 이상의 가이드 서열을 더 포함하고, 발현될 때, 둘 이상의 가이드 서열의 각각은 진핵생물 세포 내 상이한 표적 서열로 Cas9 CRISPR 복합체의 서열 특이적 결합을 유도시킨다. 일부 구현예에서, CRISPR 복합체는 진핵생물 세포의 핵 안과 밖에서 검출가능한 양으로 상기 Cas9 CRISPR 복합체의 축적을 구동시키기에 충분한 강도로 하나 이상의 핵 국재화 서열 및/또는 하나 이상의 NES를 포함한다. 일부 구현예에서, 제1 조절 구성요소는 폴리머라제 III 프로모터이다. 일부 구현예에서, 제2 조절 구성요소는 폴리머라제 II 프로모터이다. 일부 구현예에서, 가이드 서열의 각각은 적어도 16, 17, 18, 19, 20, 25 뉴클레오티드, 또는 16-30, 또는 16-25, 또는 16-20 뉴클레오티드 길이이다.

재조합 발현 벡터는 숙주 세포에서 핵산의 발현을 위한 적합한 형태로 본 명세서에 정의된 바와 같은 다수 표적화에서 사용을 위한 Cas9 효소, 시스템 또는 복합체를 코딩하는 폴리뉴클레오티드를 포함할 수 있는데, 재조합 발현 벡터가 발현시키려는 핵산 서열에 작동적으로 연결된, 발현에 사용하려는 숙주 세포를 기반으로 선택될 수 있는 하나 이상의 조절 구성요소를 포함한다는 것을 의미한다.

일부 구현예에서, 숙주 세포는 본 명세서에 정의된 바와 같은 다중 표적화에서 사용하기 위한 Cas9 효소, 시스템 또는 복합체를 암호화하는 폴리뉴클레오타이드를 포함하는 하나 이상의 벡터로 일시적으로 또는 비일시적으로 형질감염된다. 일부 구현예에서, 세포는 대상체에서 천연적으로 발생되는 바와 같이 형질감염된다. 일부 구현예에서, 형질감염된 세포를 대상체로부터 채취한다. 일부 구현예에서, 세포는 대상체로부터 채취된 세포로부터 유래되고, 예컨대 세포주이다. 조직 배양을 위한 광범위한 세포주는 본 명세서의 다른 곳에 예시되어 있고 당분야에 공지되어 있다. 세포주는 당업자에게 공지된 다양한 공급원으로부터 입수 가능하다 (예를 들어, American Type Culture Collection(ATCC) (Manassus, Va.)). 일부 구현예에서, 본 명세서에 정의된 바와 같은 다수 표적화에 사용을 위한 Cas9 효소, 시스템 또는 복합체를 코딩하는 폴리뉴클레오티드를 포함하는 하나 이상의 벡터로 형질감염된 세포는 하나 이상의 벡터-유래 서열을 포함하는 새로운 세포주를 확립하는데 사용된다. 일부 구현예에서, (예컨대, 하나 이상의 벡터의 일시적 형질감염, 또는 RNA 형질감염에 의해) 본 명세서에 기술된 바와 같은 다수 표적화에 사용을 위한 Cas9 CRISPR 시스템 또는 복합체의 성분으로 일시적으로 형질감염되고, Cas9 CRISPR 시스템 또는 복합체의 활성을 통해서 변형된 세포는 임의의 다른 외생성 서열이 결여되지만 변형을 함유하는 세포를 포함하는 새로운 세포주를 확립시키는데 사용된다. 일부 구현예에서, 본 명세서에 정의된 바와 같이 다수 표적화에 사용을 위한 Cas9 효소, 시스템 또는 복합체를 코딩하는 폴리뉴클레오티드를 포함하는 하나 이상의 벡터로 일시적으로 또는 비일시적으로 형질감염된 세포, 또는 이러한 세포로부터 유래된 세포주는 하나 이상의 시험 화합물의 평가에서 사용된다.

용어 "조절 구성요소"는 본 명세서의 다른 곳에서 정의된다.

유리한 벡터는 렌티바이러스 및 아데노-연관 바이러스를 포함하고, 이러한 벡터 유형은 또한 특정 유형의 세포를 표적화하는데 사용될 수 있다.

일 구현예에서, 본 발명은 (a) 직접 반복부 서열 및 직접 반복부 서열의 상류 또는 하류 (어느쪽이든 적용가능)에 하나 이상의 가이드 RNA 서열을 삽입하기 위한 하나 이상의 삽입 부위에 작동적으로 연결된 제1 조절 구성요소로서, 발현될 때, 가이드 서열(들)은 진핵생물 세포에서 각각의 표적 서열(들)에 Cas9 CRISPR 복합체의 서열-특이적 결합을 유도하고, Cas9 CRISPR 복합체는 각각의 표적 서열(들)과 혼성화하는 하나 이상의 가이드 서열(들)과 복합체 형성하는 Cas9 효소를 포함하는 것인 제1 조절 구성요소; 및/또는 (b) 바람직하게 적어도 하나의 핵 국재화 서열 및/또는 NES를 포함하는 상기 Cas9 효소를 코딩하는 효소-코징 서열에 작동적으로 연결된 제2 조절 구성요소를 포함하는 진핵생물 숙주 세포를 제공한다. 일부 구현예에서, 숙주 세포는 성분 (a) 및 (b)를 포함한다. 적용가능한 경우에, tracr 서열이 또한 제공될 수 있다. 일부 구현예에서, 성분 (a), 성분 (b), 또는 성분 (a) 및 (b)는 숙주 진핵생물 세포의 게놈으로 안정하게 통합된다. 일부 구현예에서, 성분 (a)는 제1 조절 구성요소에 작동적으로 연결되고, 임의로 직접 반복부에 의해 분리된 둘 이상의 가이드 서열을 더 포함하고, 발현될 때, 둘 이상의 가이드 서열의 각각은 진핵생물 세포에서 상이한 표적 서열과 Cas9 CRISPR 복합체의 서열 특이적 결합을 유도한다. 일부 구현예에서, Cas9 효소는 진핵생물 세포의 핵 안 및/또는 밝으로 검출가능한 양의 상기 CRISPR 효소의 축적을 구동시키기 충분한 강도의 하나 이상의 핵 국재화 서열 및/또는 핵 유출 서열 또는 NES를 포함한다.

일부 구현예에서, Cas9 효소는 V형 또는 VI형 CRISPR 시스템 효소이다. 일부 구현예에서, Cas9 효소는 Cas9 효소이다. 일부 구현예에서, Cas9 효소는 프란시셀라 툴라렌시스 (Francisella tularensis) 1, 프란시셀라 툴라렌시스 아종 노비시다, 프레보텔라 알벤시스 (Prevotella albensis), 라크노스피라세아에 박테리움 (Lachnospiraceae bacterium) MC2017 1, 부티리비브리오 프로테오클라스티쿠스 (Butyrivibrio proteoclasticus), 페레그리니박테리아 박테리움 (Peregrinibacteria bacterium) GW2011_GWA2_33_10, 파르쿠박테리아 박테리움 (Parcubacteria bacterium) GW2011_GWC2_44_17, 스미텔라 (Smithella) 종 SCADC, 아시다미노코커스 (Acidaminococcus) 종 BV3L6, 라크노스피라세아에 박테리움 MA2020, 칸디다투스 메타노플라즈마 테르미툼 (andidatus Methanoplasma termitum), 유박테리움 엘리겐스 (Eubacterium eligens), 모락셀라 보보쿨리 (Moraxella bovoculi) 237, 렙토스피라 이나다이 (Leptospira inadai), 라크노스피라세아에 박테리움 ND2006, 포르피로모나스 크레비오리카니스 (Porphyromonas crevioricanis) 3, 프레보텔라 디시엔스 (Prevotella disiens), 또는 포르피로모나스 마카카 (Porphyromonas macacae) Cas9로부터 유래되고, 본 명세서의 다른 곳에 정의된 바와 같은 Cas9의 추가적인 변경 또는 돌연변이를 포함할 수 있으며, 키메라 Cas9일 수 있다. 일부 구현예에서, Cas9 효소는 진핵생물 세포에서 발현을 위해 코돈-최적화된다. 일부 구현예에서, CRISPR 효소는 표적 서열의 위치에서 하나 또는 2개 가닥의 절단을 유도한다. 일부 구현예에서, 제1 조절 구성요소는 폴리머라제 III 프로모터이다. 일부 구현예에서, 제2 조절 구성요소는 폴리머라제 II 프로모터이다. 일부 구현예에서, 하나 이상의 가이드 서열(들)은 (각각) 적어도 16, 17, 18, 19, 20, 25 뉴클레오티드, 또는 16-30, 또는 16-25, 또는 16-20 뉴클레오티드 길이이다. 다수 가이드 RNA가 사용될 때, 그들은 바람직하게 직접 반복부 서열에 의해 분리된다.

일 구현예에서, 본 발명은 숙주 세포 예컨대 진핵생물 세포에서 다수 표적 폴리뉴클레오티드를 변형시키는 방법을 제공한다. 일부 구현예에서, 일부 구현예에서, 본 방법은 Cas9CRISPR 복합체가 다수의 표적 폴리뉴클레오티드에 결합하는 것을 가능하게 하여, 예를 들어 상기 다수의 표적 폴리뉴클레오티드를 절단시키고, 그에 의해 다수의 표적 폴리뉴클레오티드를 변형시키는 것을 포함하고, 여기서 Cas9CRISPR 복합체는, 그 각각이 상기 표적 폴리뉴클레오티드 내에서 특정 표적 서열에 혼성화되는 다수의 가이드 서열에 복합체 형성되는 Cas9 효소를 포함하며, 상기 다수의 가이드 서열은 직접 반복부 서열에 연결된다. 적용가능한 경우에, tracr 서열이 또한 제공될 수 있다 (예를 들어, 단일 가이드 RNA, sgRNA를 제공하기 위함). 일부 구현예에서, 상기 절단은 상기 Cas9 효소에 의한 표적 서열의 각각의 위치에서 하나 또는 두개 가닥의 절단을 포함한다. 일부 구현예에서, 상기 절단은 다수 표적 유전자의 감소된 전사를 야기시킨다. 일부 구현예에서, 방법은 외생성 주형 폴리뉴클레오티드와 상동성 재조합에 의해 상기 절단된 표적 폴리뉴클레오티드 중 하나 이상을 복구하는 단계를 더 포함하고, 상기 복구는 상기 표적 폴리뉴클레오티드 중 하나 이상의 하나 이상의 뉴클레오티드의 삽입, 결실 또는 치환을 포함하는 돌연변이를 야기한다. 일부 구현예에서, 상기 돌연변이는 하나 이상의 표적 서열(들)을 포함하는 유전자로부터 발현되는 단백질에 하나 이상의 아미노산 변화를 야기한다. 일부 구현예에서, 방법은 상기 진핵생물 세포에 하나 이상의 벡터를 전달하는 단계를 더 포함하고, 하나 이상의 벡터는 Cas9 효소 및 직접 반복부 서열에 연결된 다수 가이드 RNA 서열 중 하나 이상의 발현을 구동한다. 적용가능한 경우에, tracr 서열이 또한 제공될 수 있다. 일부 구현예에서, 상기 벡터는 대상체에서 진핵생물 세포에 전달된다. 일부 구현예에서, 상기 변형은 세포 배양되는 상기 진핵생물 세포에서 일어난다. 일부 구현예에서, 방법은 상기 변형 전에 대상체로부터 상기 진핵생물 세포를 단리하는 단계를 더 포함한다. 일부 구현예에서, 방법은 상기 대상체에게 상기 진핵생물 세포 및/또는 그로부터 유래된 세포를 복귀시키는 단계를 더 포함한다.

일 구현예에서, 본 발명은 진핵생물 세포에서 다수 폴리뉴클레오티드의 발현을 변형시키는 방법을 제공한다. 일부 구현예에서, 방법은 Cas9 CRISPR 복합체가 다수 폴리뉴클레오티드에 결합하도록 허용하여서 상기 결합이 상기 폴리뉴클레오티드의 증가되거나 또는 감소된 발현을 일으키게 하는 단계를 포함하고; Cas9 CRISPR 복합체는 각각이 상기 폴리뉴클레오티드 내 그 자신의 표적 서열에 특이적으로 혼성화하는 다수 가이드 서열과 복합체 형성하는 Cas9 효소를 포함하고, 상기 가이드 서열은 직접 반복부 서열에 연결된다. 적용가능한 경우, tracr 서열이 또한 제공될 수 있다. 일부 구현예에서, 방법은 상기 진핵생물 세포로 하나 이상의 벡터를 전달하는 단계를 더 포함하고, 하나 이상의 벡터는 Cas9 효소 및 직접 반복부 서열에 연결된 다수 가이드 서열 중 하나 이상의 발현을 구동한다. 적용가능한 경우tracr 서열이 또한 제공될 수 있다.

일 구현예에서, 본 발명은 직접 반복부 서열의 상류 또는 하류 (어디든 적용가능)에 다수 가이드 RNA 서열을 포함하는 재조합 폴리뉴클레오티드를 제공하고, 각각의 가이드 서열은 발현될 때 진핵생물 세포에 존재하는 이의 상응하는 표적 서열과 Cas9CRISPR 복합체의 서열-특이적 결합을 유도한다. 일부 구현예에서, 표적 서열은 진핵생물 세포에 존재하는 바이러스 서열이다. 적용가능한 경우, tracr 서열이 또한 제공될 수 있다. 일부 구현예에서, 표적 서열은 원종양유전자 또는 조양유전자이다.

본 발명의 구현예는 세포에서 관심 게놈 유전자좌의 표적 서열과 혼성화할 수 있는 가이드 서열을 포함하는 가이드 RNA (gRNA) 및 적어도 하나의 핵 국재화 서열을 포함할 수 있는 본 명세서에 정의된 바와 같은 Cas9 효소를 포함할 수 있는 비-천연 발생 또는 조작된 조성물을 포괄할 수 있다.

본 발명의 일 구현예는 본 명세서에 기술된 임의의 조성물을 세포에 도입시켜서 세포에서 유전자 발현을 변화시키도록 관심 게놈 유전자좌를 변형시키는 방법을 포괄한다.

본 발명의 일 구현예는 상기 구성요소들은 단일 조성물에 포함되거나 또는 개별 조성물에 포함된다. 이들 조성물은 게놈 수준에서 기능적 효과를 유발하도록 숙주에 유리하게 적용될 수 있다.

상기 조작된 AAV 캡시드를 발현하는 조작된 세포 및 유기체

본 명세서는 조작된 AAV 캡시드 폴리뉴클레오티드, 폴리펩티드, 벡터, 및/또는 벡터 시스템 중 하나 이상을 포함할 수 있는 조작된 세포를 기술한다. 일부 구현예에서, 하나 이상의 조작된 AAV 캡시드 폴리뉴클레오티드는 조작된 세포에서 발현될 수 있다. 일부 구현예에서, 조작된 세포는 본 명세서의 다른 곳이 기술된 조작된 AAV 캡시드 단백질 및/또는 조작된 AAV 캡시드 입자를 생산할 수 있다. 또한 본 명세서는 본 명세서에 기술된 하나 이상의 조작된 세포를 포함하는 변형되거나 또는 조작된 유기체를 기술한다. 조작된 세포는 본 명세서의 다른 곳에 기술된 바와 같은 조작된 AAV 캡시드 폴리뉴클레오티드와 독립적으로 또는 의존적으로 카고 분자 (예를 들어, 카고 폴리뉴클레오티드)를 발현하도록 조작될 수 있다.

광범위하게 다양한 동물, 식물, 조류, 진균, 효모 등, 및 동물, 식물, 조류, 진균, 효모 세포 또는 조직 시스템이 본 명세서의 다른 곳에 언급된 다양한 형질전환 방법을 사용해 본 명세서에 기술된 조작된 AAV 캡시드 시스템의 하나 이상의 핵산 구성체를 발현하도록 조작될 수 있다. 이것은 조작된 AAV 캡시드 입자를 생산할 수 있는 유기체, 예컨대 생산 목적을 위해서, 조작된 AAV 캡시드 설계 및/또는 생성, 및/또는 모델 유기체를 생산할 수 있다. 일부 구현예에서, 본 명세서에 기술된 조작된 AAV 캡시드 시스템 중 하나 이상의 성분을 코딩하는 폴리뉴클레오티드(들)는 식물, 동물, 조류, 진균, 및/또는 효모 또는 조직 시스템 중 하나 이상의 세포로 안정하게 또는 일시적으로 도입될 수 있다. 일부 구현예에서, 조작된 AAV 캡시드 시스템 폴리뉴클레오티드 중 하나 이상은 식물, 동물, 조류, 진균, 및/또는 효모 또는 조직 시스템의 하나 이상의 세포로 게놈에 도입된다. 변형된 유기체 및 시스템의 추가 구현예는 본 명세서의 다른 곳에 기술된다. 일부 구현예에서, 본 명세서에 기술된 조작된 AAV 캡시드 시스템의 하나 이상의 성분은 식물, 동물, 조류, 진균, 효모, 또는 조직 시스템의 하나 이상의 세포에서 발현된다.

조작된 세포

본 명세서는 본 명세서의 다른 곳에 기술된 작된 AAV 캡시드 시스템 폴리뉴클레오티드, 폴리펩티드, 벡터, 및/또는 벡터 시스템 중 하나 이상을 포함할 수 있는 조작된 세포의 다양한 구현예를 기술한다. 일부 구현예에서, 세포는 하나 이상의 조작된 AAV 캡시드 폴리뉴클레오티드를 발현할 수 있고, 하나 이상의 조작된 AAV 캡시드 입자를 생산할 수 있으며, 이것은 본 명세서에서 보다 상세히 기술된다. 이러한 세포는 또한 본 명세서에서 "생산자 세포"라고 한다. 그들이 세포가 조작된 AAV 캡시드 입자를 생산할 수 있게 만드는 본 명세서에 기술된 하나 이상의 조작된 AAV 캡시드 폴리뉴클레오티드, 조작된 AAV 캡시드 벡터 또는 다른 벡터를 포함하지 않으면, 변형된 세포가 반드시 생산자 세포 (즉, 그들은 조작된 GTA 전달 입자를 만들지 않음)는 아니라는 점에서, 이들 조작된 세포는 본 명세서의 다른 곳에 기술된 "변형된 세포"와 상이하다는 것을 이해할 것이다. 변형된 세포는 조작된 AAV 캡시드 입자의 수령자 세포일 수 있고, 일부 구현예에서, 수령자 세포에게 전달된 조작된 AAV 캡시드 입자(들) 및/또는 카고 폴리뉴클레오티드에 의해 변형될 수 있다. 변형된 세포는 본 명세서의 다른 곳에서 보다 상세히 논의된다. 용어 변형은 수령자 세포에 의존하지 않는 세포의 변형과 함께 사용될 수 있다. 예를 들어, 단리된 세포는 조작된 AAV 캡시드 분자를 수용하기 전에 변형될 수 있다.

일 구현예에서, 본 발명은 비-인간 진핵생물 유기체; 예를 들어, 임의의 기술된 구현예에 따라서 본 명세서에 기술된 조작된 전달 시스템의 하나 이상의 성분을 함유하는 진핵생물 숙주 세포를 포함하여, 다세포 진핵생물 유기체를 제공한다. 다른 구현예에서, 본 발명은 진핵생물 유기체; 바람직하게 임의의 기술된 구현예에 따른 본 명세서에 기술된 조작된 전달 시스템의 하나 이상의 성분을 함유하는 진핵생물 숙주 세포를 포함한, 다세포 진핵생물 유기체를 제공한다. 일부 구현예에서, 유기체는 AAV의 숙주이다.

특정 구현예에서, 얻어진 식물, 조류, 진균, 효모, 등, 세포 또는 일부는 세포의 전부 또는 일부의 게놈으로 도입된 외생성 DNA 서열을 포함하는, 유전자이식 식물이다.

조작된 세포는 원핵생물 세포일 수 있다. 원핵생물 세포는 박테리아 세포일 수 있다. 원핵생물 세포는 고세균 세포일 수 있다. 박테리아 세포는 임의의 적합한 박테리아 세포일 수 있다. 적합한 박테리아 세포는 에스케리치아 (Escherichia), 바실러스 (Bacillus), 락토바실러스 (Lactobacillus), 로도코쿠스 (Rhodococcus), 로도박터 (Rodhobacter), 시네코코쿠스 (Synechococcus), 시네코이스티스 (Synechoystis), 슈도모나스 (Pseudomonas), 프세도알테모나스 (Psedoaltermonas), 스테노트로파모나스 (Stenotrophamonas), 및 스트렙토마이세스 (Streptomyces)의 속으로부터 유래될 수 있다. 적합한 박테리아 세포는 에스케리치아 콜라이 (Escherichia coli) 세포, 카울로박터 크레센투스 (Caulobacter crescentus) 세포, 로도박터 스파에로이데스 (Rodhobacter sphaeroides) 세포, 프세도알테모나스 할로플란크티스 (Psedoaltermonas haloplanktis) 세포를 포함하지만, 이에 제한되지 않는다. 박테리아의 적합한 균주는 BL21(DE3), DL21(DE3)-pLysS, BL21 Star-pLysS, BL21-SI, BL21-AI, Tuner, Tuner pLysS, Origami, Origami B pLysS, Rosetta, Rosetta pLysS, Rosetta-gami-pLysS, BL21 CodonPlus, AD494, BL2trxB, HMS174, NovaBlue(DE3), BLR, C41(DE3), C43(DE3), Lemo21(DE3), Shuffle T7, ArcticExpress 및 ArticExpress (DE3)를 포함하지만, 이에 제한되지 않는다.

조작된 세포는 진핵생물 세포일 수 있다. 진핵생물 세포는 특정 유기체, 예컨대 식물 또는 인간, 또는 비-인간 진핵생물 또는 동물 또는 본 명세서에 논의되는 바와 같은 포유동물, 예를 들어, 마우스, 래트, 토끼, 개, 가축, 또는 비-인간 포유동물 또는 영장류를 포함하지만, 이에 제한되지 않는, 포유동물의 것일 수 있거나 또는 그로부터 유래될 수 있다. 일부 구현예에서 조작된 세포는 세포주일 수 있다. 세포주의 예는 C8161, CCRF-CEM, MOLT, mIMCD-3, NHDF, HeLa-S3, Huh1, Huh4, Huh7, HUVEC, HASMC, HEKn, HEKa, MiaPaCell, Panc1, PC-3, TF1, CTLL-2, C1R, Rat6, CV1, RPTE, A10, T24, J82, A375, ARH-77, Calu1, SW480, SW620, SKOV3, SK-UT, CaCo2, P388D1, SEM-K2, WEHI-231, HB56, TIB55, Jurkat, J45.01, LRMB, Bcl-1, BC-3, IC21, DLD2, Raw264.7, NRK, NRK-52E, MRC5, MEF, Hep G2, HeLa B, HeLa T4, COS, COS-1, COS-6, COS-M6A, BS-C-1 원숭이 신장 상피, BALB/ 3T3 마우스 배아 섬유아세포, 3T3 Swiss, 3T3-L1, 132-d5 인간 태아 섬유아세포; 10.1 마우스 섬유아세포, 293-T, 3T3, 721, 9L, A2780, A2780ADR, A2780cis, A172, A20, A253, A431, A-549, ALC, B16, B35, BCP-1 세포, BEAS-2B, bEnd.3, BHK-21, BR 293, BxPC3, C3H-10T1/2, C6/36, Cal-27, CHO, CHO-7, CHO-IR, CHO-K1, CHO-K2, CHO-T, CHO Dhfr -/-, COR-L23, COR-L23/CPR, COR-L23/5010, COR-L23/R23, COS-7, COV-434, CML T1, CMT, CT26, D17, DH82, DU145, DuCaP, EL4, EM2, EM3, EMT6/AR1, EMT6/AR10.0, FM3, H1299, H69, HB54, HB55, HCA2, HEK-293, HeLa, Hepa1c1c7, HL-60, HMEC, HT-29, Jurkat, JY 세포, K562 세포, Ku812, KCL22, KG1, KYO1, LNCap, Ma-Mel 1-48, MC-38, MCF-7, MCF-10A, MDA-MB-231, MDA-MB-468, MDA-MB-435, MDCK II, MDCK II, MOR/0.2R, MONO-MAC 6, MTD-1A, MyEnd, NCI-H69/CPR, NCI-H69/LX10, NCI-H69/LX20, NCI-H69/LX4, NIH-3T3, NALM-1, NW-145, OPCN / OPCT 세포주, Peer, PNT-1A / PNT 2, RenCa, RIN-5F, RMA/RMAS, Saos-2 세포, Sf-9, SkBr3, T2, T-47D, T84, THP1 세포주, U373, U87, U937, VCaP, Vero 세포, WM39, WT-49, X63, YAC-1, YAR, 및 이의 유전자이식 변이체를 포함하지만, 이에 제한되지 않는다. 세포주는 당업자에게 공지된 다양한 공급원으로부터 입수 가능하다 (참조: 예를 들어, American Type Culture Collection (ATCC) (Manassas, Va.)).

일부 구현예에서, 조작된 세포는 근육 조직 (예: 심장 근육, 골격 근육, 및/또는 평활 근육), 뼈 세포 , 혈액 세포, 면역 (B 세포, 마크로파지, T-세포, CAR-T 세포 등을 포함하지만, 이에 제한되지 않음), 신장 세포, 방광 세포, 폐 세포, 심장 세포, 간 세포, 뇌 세포, 뉴런, 피부 세포, 위 세포, 신경 지지 세포, 장 세포, 상피 세포, 내피 세포, 줄기 또는 다른 전구체 세포, 부신 세포, 연골 세포, 및 이의 조합이다.

일부 구현예에서, 조작된 세포는 진균 세포일 수 있다. 본 명세서에서 사용되는, "진균 세포"는 진균계 내 임의 유형의 진핵생물 세포를 의미한다. 진균계 내 문은 아스코마이코타 (Ascomycota), 바시디오마이코타 (Basidiomycota), 블라스토클라디오마이코타 (Blastocladiomycota), 키트리디오마이코타 (Chytridiomycota), 글로메로마이코타 (Glomeromycota), 마이크로스포리디아 (Microsporidia), 및 네오칼리마스티고마이코타 (Neocallimastigomycota)를 포함한다. 진균 세포는 효모, 곰팡이 및 사상성진균을 포함할 수 있다. 일부 구현예에서, 진균 세포는 효모 세포이다.

본 명세서에서 사용되는 용어 "효모 세포"는 아스코마이코타 및 바시디오마이코타 문 내 임의 진균 세포를 의미한다. 효모 세포는 출아 효모 세포, 분열 효모 세포, 및 곰팡이 세포를 포함할 수 있다. 이들 유기체로 제한되지 않지만, 실험실 및 산업 환경에서 사용되는 다수 유형의 효모는 아스코마이코타 문의 일부이다. 일부 구현예에서, 효모 세포는 에스. 세레비지아에 (S. cerervisiae), 클루이베로마이세스 마르시아누스 (Kluyveromyces marxianus), 또는 이사켄키아 오리엔탈리스 (Issatchenkia orientalis) 세포이다. 다른 효모 세포는 칸디다 종 (Candida spp.) (예를 들어, 칸디다 알비칸스 (Candida albicans)), 야로위아 종 (Yarrowia spp.) (예를 들어, 야로위아 리폴리티카 (Yarrowia lipolytica)), 피키아 종 (Pichia spp.) (예를 들어, 피키아 파스토리스), 클루이베로마이세스 종 (Kluyveromyces spp.) (예를 들어, 클루이베로마이세스 락티스 (Kluyveromyces lactis) 및 클루이베로마이세스 마르시아누스), 뉴로스포라 종 (Neurospora spp.) (예를 들어, 뉴로스포라 크라사 (Neurospora crassa)), 푸사리움 종 (Fusarium spp.) (예를 들어, 푸사리움 옥시스포룸(Fusarium oxysporum)), 및 이사켄키아 종 (Issatchenkia spp.) (예를 들어, 이사켄키아 오리엔탈리스 (Issatchenkia orientalis) (피키아 쿠드리아베제비 (Pichia kudriavzevii)라고도 함) 및 칸디다 아시도써모필룸 (Candida acidothermophilum))을 포함할 수 있지만, 이들로 제한되지 않는다. 일부 구현예에서, 진균 세포는 사상 진균 세포이다. 본 명세서에서 사용되는, 용어 "사상 진균 세포"은 필라멘트, 즉, 균사 또는 균사체로 성장하는 임의의 유형의 진균 세포를 지칭한다. 사상 진균 세포의 예는 아스퍼질러스 종 (Aspergillus spp.) (예를 들어, 아스퍼질러스 니거 (Aspergillus niger)), 트리코더마 종 (Trichoderma spp.) (예를 들어, 트리코더마 리세이 (Trichoderma reesei)), 리조푸스 종 (Rhizopus spp.) (예를 들어, 리조푸스 오리자에 (Rhizopus oryzae)), 및 모르티에렐라 종 (Mortierella spp.) (예를 들어, 모르티에렐라 이사벨리나 (Mortierella isabellina))을 포함할 수 있지만, 이들로 제한되지 않는다.

일부 구현예에서, 일부 실시형태에서, 진균 세포는 산업적 균주이다. 본 명세서에서 사용되는, "산업용 균주"는 산업적 공정, 예를 들어 상업적 또는 산업적 규모에서의 생성물의 생산으로부터 사용 또는 분리된 균주 세포의 임의의 균주를 지칭한다. 산업용 균주는 산업적 공정에서 통상적으로 사용되는 균류 종을 지칭할 수 있거나, 비-산업적 목적에도 사용될 수 있는(예를 들어, 실험실 연구) 균류 종의 분리물을 지칭할 수 있다. 산업적 공정의 예는 (예를 들어, 식품 또는 음료 제품의 생산에서) 발효, 증류, 생물연료 생산, 화합물의 생산 및 폴리펩티드의 생산을 포함할 수 있다. 산업적 균주의 예는 제한없이, JAY270 및 ATCC4124를 포함한다.

일부 구현예에서, 진균 세포는 배수체 세포이다. 본 명세서에서 사용되는, "배수체" 세포는 게놈이 하나 초과의 카피수로 존재하는 임의의 세포를 지칭할 수 있다. 배수체 세포는 배수체 상태에서 자연적으로 발견되는 세포 유형을 지칭할 수 있거나, 또는 배수체 상태에 (예를 들어, 특정 조절, 변경, 불활성화, 활성화 또는 감수분열, 세포질분열 또는 DNA 복제의 변형을 통해) 존재하도록 유도된 세포를 지칭할 수 있다. 배수체 세포는 그의 전체 게놈이 배수체인 세포를 지칭할 수 있거나, 특정한 관심 게놈 유전자좌 내 배수체인 세포를 지칭할 수 있다.

일부 구현예에서, 진균 세포는 이배체 세포이다. 본 명세서에서 사용되는, 진균 세포는 이배체 세포이다. 이배체 세포는 이배체 상태에서 자연적으로 발견되는 세포 유형을 지칭할 수 있거나, 또는 (예를 들어, 특정 조절, 변경, 불활성화, 활성화 또는 감수분열, 세포질분열 또는 DNA 복제의 변형을 통해) 이배체 상태로 존재하도록 유도된 세포를 지칭할 수 있다. 예를 들어, 에스. 세레비지아에 균주 S228C는 반수체 또는 이배체 상태로 유지될 수 있다. 이배체 세포는 전체 게놈이 이배체인 세포를 지칭할 수 있거나, 또는 관심 특정 게놈 유전자좌에서 이배체인 세포를 지칭할 수 있다. 일부 구현예에서, 진균 세포는 반수체 세포이다. 본 명세서에서 사용되는, "반수체" 세포는 하나의 카피수로 게놈이 존재하는 임의의 세포를 지칭할 수 있다. 반수체 세포는 반수체 상태에서 자연적으로 발견되는 세포 유형을 지칭할 수 있거나, 또는 (예를 들어, 특정 조절, 변경, 불활성화, 활성화 또는 감수분열, 세포질분열 또는 DNA 복제의 변형을 통해) 반수체 상태로 존재하도록 유도된 세포를 지칭할 수 있다. 예를 들어, 에스. 세레비지아에 균주 S228C는 반수체 또는 이배체 상태로 유지될 수 있다. 반수체 세포는 그의 전체 게놈이 반수체인 세포를 지칭할 수 있거나, 또는 특정한 관심 게놈 유전자좌에서 반수체인 세포를 지칭할 수 있다.

일부 구현예에서, 조작된 세포는 대상체로부터 수득되는 세포이다. 일부 구현예에서, 대상체는 건강하거나 또는 비-질환 대상체이다. 일부 구현예에서, 대상체는 원하는 생리적 및/또는 생물학적 특징을 갖는 대상체여서 조작된 AAV 캡시드 입자가 생산될 때 원하는 생리적 및/또는 생물학적 특징과 관련될 수 있고/있거나 원하는 생리적 및/또는 생물학적 특징을 변형시킬 수 있는 하나 이상의 카고 폴리뉴클레오티드를 패키징할 수 있다. 따라서, 생산된 조작된 AAV 캡시드 입자의 카고 폴리뉴클레오티드는 수령자 세포에게 바람직한 특징을 전달할 수 있다. 일부 구현예에서, 카고 폴리뉴클레오티드는 조작된 세포의 폴리뉴클레오티드를 변형시킬 수 있어서 조작된 세포는 원하는 생리적 및/또는 생물학적 특징을 갖는다.

일부 구현예에서, 본 명세서에 기술된 하나 이상의 벡터로 형질감염된 세포는 하나 이상의 벡터-유래 서열을 포함하는 새로운 세포주를 확립하기 위해 사용된다.

조작된 세포는 조작된 바이러스 (예를 들어, AAV) 캡시드 폴리뉴클레오티드, 벡터, 및/또는 입자를 생산하는데 사용될 수 있다. 일부 구현예에서, 조작된 바이러스 (예를 들어, AAV) 캡시드 폴리뉴클레오티드, 벡터, 및/또는 입자는 생산되고되거나, 채취되고/되거나, 이를 필요로 하는 대상체에게 전달된다. 일부 구현예에서, 조작된 세포는 대상체에게 전달된다. 조작된 세포에 대한 다른 용도는 본 명세서의 다른 곳에 기술된다. 일부 구현예에서, 조작된 세포는 본 명세서의 다른 곳에 기술된 제제 및/또는 키트에 포함될 수 있다.

조작된 세포는 이후에 사용을 위해 단기간 또는 장기간 저장될 수 있다. 적합한 저장 방법은 일반적으로 당분야에 공지되어 있다. 또한, 이후에 사용을 위해 저장된 세포를 복구하는 방법 (예컨대, 해동, 재구성, 및 달리 저장 이후 조작된 세포에서 물질대사의 자극)은 또한 일반적으로 당분야에 공지되어 있다.

제제

본 명세서에 기술된 조성물, 폴리뉴클레오티드, 폴리펩티드, 입자, 세포, 벡터 시스템 및 이의 조합은 제제, 예컨대 약학 제제에 함유될 수 있다. 일부 구현예에서, 제제는 본 명세서에 기술된 하나 이상의 근육-특이적 표적화 모이어티를 포함하는 폴리펩티드 및 다른 입자를 생성시키는데 사용될 수 있다. 일부 구현예에서, 제제는 이를 필요로 하는 대상체에게 전달될 수 있다. 일부 구현예에서, 본 명세서에 기술된 조작된 AAV 캡시드 시스템, 조작된 세포, 조작된 AAV 캡시드 입자, 및/또는 이의 조합의 성분(들)은 대상체 또는 세포에게 전달할 수 있는 제제에 포함될 수 있다. 일부 구현예에서, 제제는 약학 제제이다. 본 명세서에 기술된 폴리펩티드, 폴리뉴클레오티드, 벡터, 세포, 및 이의 조합 중 하나 이상은 이를 필요로 하는 대상체에게 또는 세포 단독으로 또는 활성 성분으로서, 예컨대 약학 제제로 제공될 수 있다. 이와 같이, 또한 본 명세서는 본 명세서에 기술된 폴리펩티드, 폴리뉴클레오티드, 벡터, 세포, 또는 이의 조합 중 하나 이상의 양을 함유하는 약학 제제를 기술한다. 일부 구현예에서, 약학 제제는 본 명세서에 기술된 하나 이상의 폴리펩티드, 폴리뉴클레오티드, 벡터, 세포, 및 이의 조합의 유효량을 함유할 수 있다. 본 명세서에 기술된 약학 제제는 이를 필요로 하는 대상체 또는 세포에 투여될 수 있다.

일부 구현예에서, 약학 제제에 함유되는 본 명세서에 기술된 폴리펩티드, 폴리뉴클레오티드, 벡터, 세포, 바이러스 입자, 나노입자, 다른 전달입자, 및 이의 조합 중 하나 이상의 양은 약학 제제가 투여되는 특정 환자 집단의 평균 체중 또는 이를 필요로 하는 대상체의 체중을 기반으로 약 1 pg/kg 내지 약 10 mg/kg 범위일 수 있다. 약학 제제 중 본 명세서에 기술된 폴리펩티드, 폴리뉴클레오티드, 벡터, 세포, 및 이의 조합 중 하나 이상의 양은 약 1 pg 내지 약 10 g, 약 10 nL 내지 약 10 mL 범위일 수 있다. 약학 제제가 하나 이상의 세포를 함유하는 구현예에서, 양은 약 1 세포 내지 1 x 10², 1 x 10³, 1 x 10⁴, 1 x 10⁵, 1 x 10⁶, 1 x 10⁷, 1 x 10⁸, 1 x 10⁹, 1 x 10¹⁰ 이상의 세포 범위일 수 있다. 약학 제제가 하나 이상의 세포를 함유하는 구현예에서, 양은 nL, μL, mL, 또는 L 당 약 1 세포 내지 1 x 10², 1 x 10³, 1 x 10⁴, 1 x 10⁵, 1 x 10⁶, 1 x 10⁷, 1 x 10⁸, 1 x 10⁹, 1 x 10¹⁰ 이상 세포 범위일 수 있다.

구현예에서, 조작된 AAV 캡시드 입자가 제제에 포함되고, 제제는 1 내지 1 x 10¹, 1 x 10², 1 x 10³, 1 x 10⁴, 1 x 10⁵, 1 x 10⁶, 1 x 10⁷, 1 x 10⁸, 1 x 10⁹, 1 x 10¹⁰, 1 x 10¹¹, 1 x 10¹², 1 x 10¹³, 1 x 10¹⁴, 1 x 10¹⁵, 1 x 10¹⁶, 1 x 10¹⁷, 1 x 10¹⁸, 1 x 10¹⁹, 또는 1 x 10²⁰ 형질도입 단위 (TU)/mL의 조작된 AAV 캡시드 입자를 함유할 수 있다. 일부 구현예에서, 제제는 0.1 내지 100 mL 부피일 수 있고, 1 내지 1 x 10¹, 1 x 10², 1 x 10³, 1 x 10⁴, 1 x 10⁵, 1 x 10⁶, 1 x 10⁷, 1 x 10⁸, 1 x 10⁹, 1 x 10¹⁰, 1 x 10¹¹, 1 x 10¹², 1 x 10¹³, 1 x 10¹⁴, 1 x 10¹⁵, 1 x 10¹⁶, 1 x 10¹⁷, 1 x 10¹⁸, 1 x 10¹⁹, 또는 1 x 10²⁰ 형질도입 단위 (TU)/mL의 조작된 AAV 캡시드 입자를 함유할 수 있다.

약학적으로 허용가능한 담체 및 보조 성분 및 보조제

구현예에서, 본 명세서에 기술된 하나 이상의 of the 폴리펩티드, 폴리뉴클레오티드, 벡터, 세포, 바이러스 입자, 나노입자, 다른 전달입자, 및 이의 조합 중 하나 이상의 양을 함유하는 약학 제제는 약학적으로 허용가능한 담체를 더 포함할 수 있다. 적합한 약학적으로 허용가능한 담체는 활성 조성물과 유해하게 반응하지 않는, 물, 염 용액, 알콜, 검 아라빅, 식물성유, 벤질 알콜, 폴리에틸렌 글리콜s, 젤라틴, 탄수화물 예컨대 락토스, 아밀로스 또는 전분, 마그네슘 스테아레이트, 탈크, 실리크산, 점성 파라핀, 항유, 지방산 에스테르, 히드록시 메틸셀룰로스, 및 폴리비닐 피롤리돈을 포함하지만, 이에 제한되지 않는다.

약학 제제는 멸균될 수 있고, 바람직하다면, 활성 조성물과 유해하게 반응하지 않는, 보조제, 예컨대 윤활제, 보존제, 안정화제, 습윤제, 유화제, 삼투압에 영향을 미치는 염, 완충제, 착색제, 풍미제 및/또는 방향족 물질과 혼합될 수 있다.

본 명세서에 기술된 폴리펩티드, 폴리뉴클레오티드, 벡터, 세포, 조작된 AAV 캡시드 입자, 나노입자, 다른 전달입자, 및 이의 조합 중 하나 이상의 양 이외에도, 약학 제제는 또한 폴리뉴클레오티드, 아미노산, 펩티드, 폴리펩티드, 항체, 압타머, 리보자임, 호르몬, 면역조절제, 해열제, 항불안제, 항정신병제, 진통제, 진경제, 항염증제, 항히스타민제, 항감염제, 화학요법제, 및 이의 조합을 포함하지만, 이에 제한되지 않는, 보조 활성제의 유효량을 포함할 수 있다.

적합한 호르몬은 아미노산 유래 호르몬 (예를 들어, 멜라토닌 및 티록신), 소형 펩티드 호르몬 및 단백질 호르몬 (예를 들어, 티로트로핀-방출 호르몬, 바소프레신, 인슐린, 성장 호르몬, 황체형성 호르몬, 난포-자극 호르몬, 및 갑상선-자극 호르몬), 아이코사노이드 (예를 들어, 아라키돈산, 리폭신, 및 프로스타글란딘), 및 스테로이드 호르몬 (예를 들어, 에스트라디올, 테스토스테론, 테트라하이드로 테스토스테론 코르티솔)을 포함하지만, 이에 제한되지 않는다. 적합한 면역조절제는 프레드니손, 아자티오프린, 6-MP, 사이클로스포린, 타크롤리무스, 메토트렉세이트, 인터루킨 (예를 들어, IL-2, IL-7, 및 IL-12), 사이토카인 (예를 들어, 인터페론 (예를 들어, IFN-α, IFN-β, IFN-ε, IFN-K, IFN-ω 및 IFN-γ, 과립구 콜로니-자극 인자, 및 이미퀴모드), 케모카인 (예를 들어, CCL3, CCL26 및 CXCL7), 시토신 포스페이트-구아노신, 올리고데옥시뉴클레오티드, 글루칸, 항체, 및 압타머)를 포함하지만, 이에 제한되지 않는다.

적합한 해열제는 비-스테로이드 항염증제 (예를 들어, 이부프로펜, 나프록센, 케토프로펜 및 니메술리드), 아스피린 및 관련 살리실레이트 (예를 들어, 콜린 살리실레이트, 마그네슘 살리실레이트 및 소듐 살리실레이트), 파라세타몰/아세트아미노펜, 메타미졸, 나부메톤, 페나존 및 퀴닌을 포함하지만, 이에 제한되지 않는다.　

적합한 항불안제는 벤조디아제핀 (예를 들어, 알프라졸람, 브로마제팜, 클로르디아제폭시드, 클로나제팜, 클로라제페이트, 디아제팜, 플루라제팜, 로라제팜, 옥사제팜, 테마제팜, 트리아졸람 및 토피소팜), 세로토닌성 항우울제 (예를 들어, 선택적 세로토닌 재흡수 억제제, 삼환계 항우울제 및 모노아민 옥시다제 억제제), 메비카, 파보모티졸, 셀란크, 브로만탄, 에목시핀, 아자피론, 바르비튜레이트, 히드록시진, 프레가발린, 발리돌 및 베타 차단제를 포함하지만, 이에 제한되지 않는다

적합한 항정신병제는 브로모페리돌, 드로페리돌, 할로페리돌, 모페론, 피팜페론, 티미페론, 플루스피릴렌, 펜플루리돌, 피모지드, 아세프로마진, 클로르프로마진, 시아메마진, 딕시라진, 플루페나진, 레보메프로마진, 메소리다진, 페라진, 페리시아진, 페르페나진, 피포티아진, 프로클로르페라진, 프로마진, 프로메타진, 프로티펜딜, 티오프로페라진, 티오리다진, 트리플루오페라진, 트리플루프로마진, 클로르프로틱센, 클로펜틱솔, 플루펜틱솔, 티오틱센, 주클로펜틱솔, 클로티아핀, 록사핀, 프로티펜딜, 카르피프라민, 클로카프라민, 몰린돈, 모사프라민, 술피리드, 베랄리프리드, 아미술프리드, 아목사핀, 아리피프라졸, 아세나핀, 클로자핀, 블로난세린, 일로페리돈, 루라시돈, 멜페론, 네모나프리드, 올란자핀, 팔리페리돈, 페로스피론, 퀘티아핀, 레목시프리드, 리스페리돈, 세르틴돌, 트리미프라민, 지프라시돈, 조테핀, 알스토니에, 비페프루녹스, 비토페르틴, 브렉스피프라졸, 칸나비디올, 카리프라진, 피마반세린, 포마글루메타드 메티오닐, 바비카세린, 사노멜린, 및 지크로나핀을 포함하지만, 이에 제한되지 않는다.

적합한 진통제는 파라세타몰/아세트아미노펜, 비스테로이드 항염증제 (예를 들어, 이부프로펜, 나프록센, 케토프로펜, 및 니메술리드), COX-2 억제제 (예를 들어, 로페콕십, 셀레콕십, 및 에토리콕십), 오피오이드 (예를 들어, 모르핀, 코데인, 옥시코돈, 히드로코돈, 디히드로모르핀, 페티딘, 부프레노르핀), 트라마돌, 노르에피네프린, 플루피르틴, 네포팜, 오르페나드린, 프레가발린, 가바펜틴, 시클로벤자프린, 스코폴라민, 메타돈, 케토베미돈, 피리트라미드 및 아스피린 및 관련 살리실레이트 (예를 들어, 콜린 살리실레이트, 마그네슘 살리실레이트, 및 소듐 살리실레이트)를 포함하지만, 이에 제한되지 않는다.

적합한 진경제는 메베베린, 파파베린, 시클로벤자프린, 카리소프로돌, 오르페나드린, 티자니딘, 메탁살론, 메토카르바몰, 클로르족사존, 바클로펜, 단트롤렌, 바클로펜, 티자니딘, 및 단트롤렌을 포함하지만, 이에 제한되지 않는다. 적합한 항염증제는 프레드니손, 비-스테로이드 항염증제 (예를 들어, 이부프로펜, 나프록센, 케토프로펜, 및 니메술리드), COX-2 억제제 (예를 들어, 로페콕십, 셀레콕십, 및 에토리콕십), 및 면역 선택적 항염증 유도체 (예를 들어, 턱밑샘 펩티드-T 및 이의 유도체)를 포함하지만, 이에 제한되지 않는다.

적합한 항히스타민제는 H1-수용체 길항제 (예를 들어, 아크리바스틴, 아젤라스틴, 빌라스틴, 브롬페니라민, 부클리진, 브로모디펜히드라민, 카르비녹사민, 세티리진, 클로르프로마진, 시클리진, 클로르페니라민, 클레마스틴, 시프로펩타딘, 데슬로라타딘, 덱스브롬페니라민, 덱스클로르페니라민, 디멘히드리네이트, 디메틴덴, 디펜히드라민, 독실라민, 에바스틴, 엠브라민, 펙소페나딘, 히드록시진, 레보세티리진, 로라타딘, 메클리진, 미르타자핀, 올로파타딘, 오르페나드린, 페닌다민, 페니라민, 페닐톨록사민, 프로메타진, 피릴라민, 케티아핀, 루파타딘, 트리펠렌나민, 및 트리프롤리딘), H2-수용체 길항제(예를 들어, 시메티딘, 파모티딘, 라푸티딘, 니자티딘, 니자티딘라니티딘, 및 록사티딘), 트리토쿠알린, 카테킨, 크로모글리케이트, 네도크로밀, 및 p2-아드레날린성 효현제를 포함하지만, 이에 제한되지 않는다.

적합한 항감염제는 항아메바제 (예를 들어, 니트라족사니드, 파로모마이신, 메트로니다졸, 티니다졸, 클로로퀸, 밀테포신, 암포테리신 b, 및 아이오도퀴놀), 아미노글리코시드 (예를 들어, 파로모마이신, 토브라마이신, 젠타미신, 아미카신, 카나마이신, 및 네오마이신), 구충제 (예를 들어, 피란텔, 메벤다졸, 이버멕틴, 프라지콴텔, 알벤다졸, 티아벤다졸, 옥삼니퀸), 항진균제 (예를 들어, 아졸 항진균제 (예를 들어, 이트라코나졸, 플루코나졸, 파르코나졸, 케토코나졸, 클로트리마졸e, 미코나졸, 및 보리코나졸), 에키노칸딘 (예를 들어, 카스포푼진, 아니둘라푼진, 및 미카푼진), 그리세오풀빈, 터비나핀, 플루시토신, 및 폴리엔 (예를 들어, 니스타틴, 및 암포테리신 b), 항말라리아제 (예를 들어, 피리메타민/술파독신, 아르테메테르/루메판트린, 아토바쿠온/프로구아닐, 퀴닌, 히드록시클로로퀸, 메플로퀸, 클로로퀸, 독시시클린, 피리메타민, 및 할로판트린), 항결핵제 (예를 들어, 아미노살리실레이트 (예를 들어, 아미노살리실산), 이소니아지드/리팜핀, 이소니아지드/피라진아미드/리팜핀, 베다퀼린, 이소니아지드, 에탐부톨, 리팜핀, 리파부틴, 리파펜틴, 카프레오마이신, 및 사이클로세린), 항바이러스제 (예를 들어, 아만타딘, 리만타딘, 아바카비르/라미부딘, 엠트리시타빈/테노포비르, 코비시스타트/엘비테그라비르/엠트리시타빈/테노포비르, 에파비렌즈/엠트리시타빈/테노포비르, 아바카비르/라미부딘/지도부딘, 라미부딘/지도부딘, 엠트리시타빈/테노포비르, 엠트리시타빈/로피나비르/리토나비르/테노포비르, 인터페론 알파-2v/리바비린, 페그인터페론 알파-2b, 마라비록, 랄테그라비르, 돌루테그라비르, 엔푸비르티드, 포스카르넷, 포미비르센, 오셀타미비르, 자나미비르, 네비라핀, 에파비렌즈, 에트라비린, 릴피비린, 델라비르딘, 네비라핀, 엔테카비르, 라미부딘, 아데포비르, 소포스부비르, 디다노신, 테노포비르, 아바카비르, 지도부딘, 스타부딘, 엠트리시타빈, 잘시타빈, 텔비부딘, 시메프레비르, 보세프레비르, 텔라프레비르, 로피나비르/리토나비르, 보세프레비르, 다루나비르, 리토나비르, 티프라나비르, 아타자나비르, 넬피나비르, 암프레나비르, 인디나비르, 사퀴나비르, 리바비린, 발라시클로비르, 아시클로비르, 팜시클로비르, 간시클로비르, 및 반간시클로비르), 카르바페넴 (예를 들어, 도리페넴, 메로페넴, 엘트라페넴, 및 실라스타틴/이미페넴), 세팔로스포린 (예를 들어, 세파드록실, 세프라딘, 세파졸린, 세팔렉신, 세페핌, 세파졸린, 로라카르베프, 세포테탄, 세풀록심, 세프프로질, 로라카르베프, 세폭시틴, 세파클로르, 세프티부텐, 세프트리악손, 세포탁심, 세프포독심, 세프디니르, 세픽심, 세프디토렌, 세프티족심, 및 세프타지딤), 글리코펩티드 항생제 (예를 들어, 반코마이신, 달바반신, 오리타반신, 및 텔라반신), 글리실시클린 (예를 들어, 티게시클린), 나병치료제 (예를 들어, 클로파지민 및 탈리도미드), 린코마이신 및 이의 유도체 (예를 들어, 클린다마이신 및 린코마이신), 마클로리드 및 이의 유도체 (예를 들어, 텔리트로마이신, 피닥소미신, 에리트로마이신, 아지트로마이신, 클라리트로마이신, 디리트로마이신, 및 트롤레안도마이신), 리네졸리드, 술파메톡사졸/트리메토프림, 리팍시민, 클로람페니콜, 포스포마이신, 메트로니다졸, 아즈트레오남, 바시트라신, 페니실린 (아목시실린, 암피실린, 바캄피실린, 카르베니실린, 피페라실린, 티카르실린, 아목시실린/클라불라네이트, 암피실린/술박탐, 피페라실린/타조박탐, 클라불라네이트/티카르실린, 페니실린, 프로카인 페니실린, 옥사실린, 디클록사실린, 및 나프실린), 퀴놀론 (예를 들어, 로메플록사신, 노르플록사신, 오플록사신, 가티플록사신, 목시플록사신, 시프로플록사신, 레보플록사신, 게미플록사신, 목시플록사신, 시녹사신, 날리딕스산, 에녹사신, 그레파플록사신, 가티플록사신, 트로바플록사신, 및 스파르플록사신), 술폰아미드 (예를 들어, 술파메톡사졸/트리메토프림, 술파살라진, 및 술피속사졸), 테트라사이클린 (예를 들어, 독시시클린, 데메클로사이클린, 미노사이클린, 독시시클린/살리실산, 독시시클린/오메가-3 다중불포화 지방산, 및 테트라사이클린), 및 요로 항감염제 (예를 들어, 니트로푸란토인, 메테나민, 포스포마이신, 시녹사신, 날리딕스산, 트리메토프림, 및 메틸렌 블루)를 포함하지만, 이에 제한되지 않는다.

적합한 화학요법제는 파클리탁셀, 브렌툭시맙 베도틴, 독소루비신, 5-FU (플루오로우라실), 에베롤리무스, 페메트렉세드, 멜팔란, 파미드로네이트, 아나스트로졸, 엑세메스탄, 네랄라빈, 오파투무맙, 베바시주맙, 벨리노스타트, 토시투모맙, 카르무스틴, 블레오마이신, 보수티닙, 부술판, 알렘투주맙, 이리노테칸, 반데타닙, 비칼루타미드, 로무스틴, 다우노루비신, 클로파라빈, 카보잔티닙, 닥티노마이신, 라무리루맙, 시타라빈, 시톡산, 시클로포스파미드, 데시타빈, 덱사메타손, 도세탁셀, 히드록시우레아, 다카르바진, 류프롤리드, 에피루비신, 옥살리플라틴, 아스파라기나제, 에스트라무스틴, 세툭시맙, 비스모데집, 아스파라기나제 어위니아 크리산테미, 아미포스틴, 에토포시드, 플루타미드, 토레미펜, 풀베스트란트, 레트로졸, 데가렐릭스, 프랄라트렉세이트, 메토트렉세이트, 플록수리딘, 오비누투주맙, 젬시타빈, 아파티닙, 이마티닙, 메실레이트, 카르무스틴, 에리불린, 트라스투주맙, 알트레타민, 토포테칸, 포나티닙, 이다루비신, 이포스파미드, 이브루티닙, 악시티닙, 인터페론 알파-2a, 제피티닙, 로미뎁신, 익사베필론, 룩솔리티닙, 카바지탁셀, 아도-트라스투주맙 엠탄신, 카르필조밉, 클로람부실, 사르그라모스팀, 클라드리빈, 미토탄, 빈크리스틴, 프로카르바진, 메제스트롤, 트라메티닙, 메스나, 스트론튬-89 클로라이드, 메클로레타민, 미토마이신, 부술판, 젬투주맙, 오조가미신, 비노렐빈, 필그라스팀, 페그필그라스팀, 소라페닙, 닐루타미드, 펜토스타틴, 타목시펜, 미톡산트론, 페가스파르가제, 데니류킨, 디프티톡스, 알리트레티노인, 카르보플라틴, 페르투주맙, 시스플라틴, 포말리도미드, 프레드니손, 알데스류킨, 머캅토푸린, 졸레드론산, 레날리도미드, 리툭시맙, 옥트레오티드, 다사티닙, 레고라페닙, 히스트렐린, 수니티닙, 실툭시맙, 오마세탁신, 씨오구아닌 (티오구아닌), 다프라페닙, 엘로티닙, 벡사로텐, 테모졸로미드, 티오테파, 탈리도미드, 바실러스 칼메트-게렝 (BCG), 템시롤리무스, 벤다무스틴 히드로클로라이드, 트립토렐린, 삼산화비소, 라파티닙, 발루비신, 파니투무맙, 빈블라스틴, 보르테조밉, 트레티노인, 아자시티딘, 파조파닙, 테니포시드, 류코보린, 크리조티닙, 카페시타빈, 엔잘루타미드, 이필리무맙, 고세렐린, 비리노스타트, 이델랄리십, 세리티닙, 아비라테론, 에포틸론, 타플루포시드, 아자티오프린, 독시플루리딘, 빈데신, 및 올-트랜스 레티노산을 포함하지만, 이에 제한되지 않는다.

약학 제제제에 보조 활성제가 함유되는 구현예에서, 본 명세서에 기술된 하나 이상의 폴리펩티드, 폴리뉴클레오티드, CRISPR-Cas 복합체, 벡터, 세포, 바이러스 입자, 나노입자, 다른 전달입자, 및 이의 조합이외에도, 보조 활성제의 양, 예컨대 유효량은 보조 활성제에 의존하여 가변적일 것이다. 일부 구현예에서, 보조 활성제의 양은 0.001 마이크로그램 내지 약 1 밀리그램 범위이다. 다른 구현예에서, 보조 활성제의 양은 약 0.01 IU 내지 약 1000 IU 범위이다. 추가 구현예에서, 보조 활성제의 양은 0.001 mL 내지 약 1 mL 범위이다. 또 다른 구현예에서, 보조 활성제의 양은 총 약학 제제의 약 1 % w/w 내지 약 50% w/w 범위이다. 추가 구현예에서, 보조 활성제의 양은 총 약학 제제의 약 1 % v/v 내지 약 50% v/v 범위이다. 여전히 다른 구현예에서, 보조 활성제의 양은 총 약학 제제의 약 1 % w/v 내지 약 50% w/v 범위이다.

제형

일부 구현예에서, 본 명세서에 기술된 약학 제제는 제형으로 존재할 수 있다. 제형은 임의의 적절한 경로로 투여를 위해 적합화될 수 있다. 적절한 경로는 경구 (구강 또는 설하 포함), 직장, 경막외, 두개내, 안구내, 흡입, 비내, 국소 (구강, 설파, 또는 경피 포함), 질, 요도내, 비경구, 두개내, 피하, 근육내, 정맥내, 복강내, 피내, 골내, 심장내, 관절내, 해면내, 척추강내, 유리체내, 뇌내, 치은, 치은연하, 뇌실내, 및 피내를 포함하지만, 이에 제한되지 않는다. 이러한 제제는 당분야에 공지된 임의 방법으로 제조될 수 있다.

경구 투여에 적합화된 제형은 별개 단위 제형 예컨대 캡슐, 펠렛 또는 정제, 분말 또는 과립, 용액제, 또는 수성 또는 비-수성 액체 중 현탁액; 식용 발포체 또는 휩, 또는 수중유 액상 에멀션 또는 유중수 액상 에멀션일 수 있다. 일부 구현예에서, 경구 투여에 적합화된 약학 제제는 또한 약학 제제에 풍미를 주거나, 보존하거나, 착색시키거나, 또는 분산을 돕는 하나 이상의 작용제를 포함한다. 경구 투여를 위해 제조된 제형은 또한 발포체, 스프레이, 또는 액상 용액으로서 전달될 수 있는 액상 용액의 형태일 수 있다. 경구 제형은 본 명세서에 기술된 하나 이상의 폴리펩티드, 폴리뉴클레오티드, 벡터, 세포, 및 이의 조합을 함유하는 표적화된 이펙터 융합 단백질 및/또는 이의 복합체 또는 조성물의 치료적 유효량 또는 적절한 이의 분획을 함유하는 약 1 ng 내지 1000 g의 약학 제제를 함유할 수 있다. 경구 제형은 이를 필요로 하는 대상체에게 투여될 수 있다.　

적절한 경우, 본 명세서에 기술된 제형은 미세캡슐화될 수 있다.

제형은 또한 임의 성분의 방출을 연장시키거나 또는 지속시키도록 제조될 수 있다. 일부 구현예에서, 본 명세서에 기술된 하나 이상의 폴리펩티드, 폴리뉴클레오티드, 벡터, 세포, 및 이의 조합은 그의 방출을 지연시키는 성분일 수 있다. 다른 구현예에서, 임의로 포함되는 보조 성분의 방출은 지연된다. 성분의 방출을 지연시키기 위한 적합한 방법은 중합체, 왁스, 겔 등의 물질에 성분을 코팅 또는 내포시키는 것을 포함하지만, 이에 제한되지 않는다. 지연 방출 투여 제형은 하기 표준 참조에 기술된 대로 제조될 수 있다: "Pharmaceutical dosage form tablets," eds. Liberman et. al. (New York, Marcel Dekker, Inc., 1989), "Remington - The science and practice of pharmacy", 20th ed., Lippincott Williams & Wilkins, Baltimore, MD, 2000, and "Pharmaceutical dosage forms and drug delivery systems", 6th Edition, Ansel et al., (Media, PA: Williams and Wilkins, 1995), 이들 참조는 정제 및 캡슐 및 정제 및 알약, 캡슐, 및 과립의 지연 방출 제형을 제조하기 위한 부형제, 재료, 장비, 및 공정에 대한 정보를 제공한다. 지연 방출은 약 1시간 내지 약 3개월 이상일 수 있다.

적합한 코팅재의 예는 셀룰로스 중합체 예컨대 셀룰로스 아세테이트 프탈레이트, 히드록시프로필 셀룰로스, 히드록시프로필 메틸셀룰로스, 히드록시프로필 메틸셀룰로스 프탈레이트, 및 히드록시프로필 메틸셀룰로스 아세테이트 숙시네이트; 폴리비닐 아세테이트 프탈레이트, 아크릴산 중합체 및 공중합체, 및 상표명 EUDRAGIT® (Roth Pharma, Westerstadt, Germany) 하에 상업적으로 입수가능한 메타크릴계 수지, 제인, 쉘락, 및 다당류를 포함하지만, 이에 제한되지 않는다.

코팅은 상이한 비율의 수용성 중합체, 수불용성 중합체, 및/또는 pH 의존적 중합체와 수불용성/수용성 비중합성 부형제 존재 또는 부재로 형성되어서, 바람직한 방출 프로파일을 제공할 수 있다. 코팅은 정제 (코팅 비드와 압착 또는 없이 압착), 캡슐 (코팅 비드 존재 또는 부재), 비드, 입자 조성물, 제한없이 현탁물 형태로서 제제화된 "성분 그자체"를 포함하는 제형에 대해, 또는 스파클링 제형으로서 수행된다.

국소 투여용으로 적합화된 제형은 연고, 크림, 현탁물, 로션, 분말, 용액제, 페이스트, 겔, 스프레이, 에어로졸, 또는 오일로서 제형화될 수 있다. 눈 또는 다른 외부 조직, 예를 들어 입 또는 피부의 치료를 위한 일부 구현예에서, 약학 제제는 국소 연고 또는 크림으로서 도포된다. 연고로 제형화될 때, 본 명세서에 기술된 하나 이상의 폴리펩티드, 폴리뉴클레오티드, 벡터, 세포, 및 이의 조합은 파라핀계 또는 수혼화성 연고 베이스와 함께 제형화될 수 있다. 일부 구현예에서, 활성 성분은 수중유 크림 베이스 또는 유중수 베이스로 제형화될 수 있다. 입에 국소 투여를 위해 적합화된 제형은 로젠지, 파스티유 및 구강 세정제를 포함한다.

코 또는 흡입 투여를 위해 적합화된 제형은 에어로졸, 용액제, 현탁 점적액, 겔, 또는 건조 분말을 포함한다. 일부 구현예에서, 본 명세서에 기술된 하나 이상의 폴리펩티드, 폴리뉴클레오티드, 벡터, 세포, 및 이의 조합은 흡입에 적합화된 제형에 함유되는데 미분화를 통해서 수득되거나 또는 수득가능한 입자-크기-감소된 형태이다. 일부 구현예에서, 크기 감소 (예를 들어, 미분화)된 화합물 또는 이의 염 또는 용매화물의 입자 크기는 당분야에 공지된 적절한 방법을 통해 특정하여 약 0.5 내지 약 10 미크론의 D50 값으로 정의된다. 흡입에 의한 투여에 적합화된 제형은 또한 입자 분진 또는 미스트를 포함한다. 적합한 제형은 담체 또는 부형제가 코 스프레이 또는 점적액으로서 투여를 위한 액체이고, 다양한 유형의 계량된 용량의 가압 에어로졸, 네뷸라이저, 또는 취입기를 통해서 생성될 수 있는 활성 성분 (예를 들어, 본 명세서에 기술된 하나 이상의 폴리펩티드, 폴리뉴클레오티드, 벡터, 세포, 및 이의 조합 및/또는 보조 활성제)의 수성 또는 유성 용액/현탁액을 포함한다.

일부 구현예에서, 제형은 흡입에 의한 투여에 적합한 에어로졸 제제일 수 있다. 이들 구현예의 일부에서, 에어로졸 제제는 본 명세서에 기술된 하나 이상의 폴리펩티드, 폴리뉴클레오티드, 벡터, 세포, 및 이의 조합 및 약학적으로 허용가능한 수성 또는 비-수성 용매의 용액 또는 미세 현탁액을 함유할 수 있다. 에어로졸 제제는 밀폐 용기 중에 멸균된 형태로 단일 또는 다수-용량 분량으로 존재할 수 있다. 이들 구현예의 일부 경우에, 밀봉된 용기는 용기의 내용물이 소진되면 폐기하고자 하는, 계량 밸브가 장착된 단일 용량 또는 다수-용량 코, 또는 에어로줄 분배기 (예를 들어, 계량 용량 흡입기)이다.

에어로졸 제형이 에어로졸 분배기에 함유된 경우, 분배기는 압력 하에 적합하나 추진제, 예컨대 압축 공기, 이산화탄소, 또는 제한없이 히드로플루오로카본을 포함한, 유기 추진제를 함유한다. 에어로졸 제제 제형은 다른 구현예에서 펌프-분무기에 함유된다. 가압 에어로졸 제제는 또한 본 명세서에 기술된 폴리펩티드, 폴리뉴클레오티드, 벡터, 세포, 및 이의 조합 중 하나 이상의 용액 또는 현탁액을 함유한다. 추가 구현예에서, 에어로졸 제제는 또한 제제의 안정성 및/또는 맛 및/또는 미세 입자 질량 특징 (양 및/또는 프로파일)을 개선시키도록 혼힙되는 공용매 및/또는 개질제를 함유할 수 있다. 에어로졸 제제의 투여는 1일 1회 또는 1일 수회, 예를 들어, 1일 2, 3, 4, 또는 8회로서, 1, 2, 또는 3회 용량이 각 시간에 전달된다.

흡입 투여에 적합하고/하거나 적합화된 일부 제형 경우에, 약학 제제는 건조 분말 흡입용 제제이다. 본 명세서에 기술된 하나 이상의 폴리펩티드, 폴리뉴클레오티드, 벡터, 세포, 및 이의 조합, 보조 활성 성분, 및/또는 이의 약학적으로 허용가능한 염 이외에도, 이러한 제형은 분말 베이스 예컨대 락토스, 글루코스, 트레할로스, 만니톨, 및/또는 전분을 함유할 수 있다. 이들 구현예의 일부에서, 본 명세서에 기술된 하나 이상의 폴리펩티드, 폴리뉴클레오티드, 벡터, 세포, 및 이의 조합은 입자-크기 감소된 형태이다. 추가 구현예에서, 성능 개질제, 예컨대 L-류신 또는 다른 아미노산, 셀로비오스 옥타아세테이트, 및/또는 스테아르산, 예컨대 마그네슘 또는 칼슘 스테아레이트의 금속 염.　

일부 구현예에서, 에어로졸 제형은 에어로졸의 각 계량된 용량은 활성 성분, 예컨대 본 명세서에 기술된 하나 이상의 폴리펩티드, 폴리뉴클레오티드, 벡터, 세포, 및 이의 조합 중 하나 이상의 사전결정된 양을 함유하도록 배열될 수 있다.　

질 투여에 적합화된 제형은 페서리, 탐폰, 크림, 겔, 페이스트, 발포체, 또는 스프레이 제제로서 존재할 수 있다. 직장 투여에 적합화된 제형은 좌제 또는 관장제를 포함한다.

비경구 투여를 위해 적합화되고/되거나 임의 유형의 주사 (예를 들어, 정맥내, 복강내, 피하, 근육내, 피내, 골내, 경막외, 심장내, 관절내, 해면내, 치은, 치은연하, 척추강내, 유리체내, 뇌내, 및 뇌실내)를 위해 적합화된 제형은 조성물을 대상체의 혈액과 등장성이게 하는 용질, 정균제, 완충제, 항-산화제를 함유할 수 있는 수성 및/또는 비-수성 멸균 주사 용액, 및 현탁제 및 증점제를 포함할 수 있는 수성 및 비-수성 멸균 현탁액을 포함할 수 있다. 비경구 투여에 적합화된 제형은 밀봉 앰풀 또는 바이알을 포함하지만, 이에 제한되지 않는 단일-단위 제형 또는 다수-단위 제형으로 존재할 수 있다. 용량은 동결건조되어서 투여 전에 용량을 재구성하기 위해 멸균 담체에 재구성될 수 있다. 즉석 주사 용액 및 현탁액은 일부 구현예에서, 멸균 분말, 과립 및 정제로부터 제조될 수 있다.

안구 투여에 적합화된 제형은 임의로 주사용으로 적합화될 수 있고, 임의로 항-산화제, 완충제, 정균제, 조성물을 대상체의 눈 주변 또는 그에 함유된 안구 또는 유체와 등장성이게 만드는 용질을 함유할 수 있는 수성 및/또는 비수성 멸균 용액, 및 현탁제 및 증점제를 포함할 수 있는 수성 및 비수성 멸균 현탁액을 포함할 수 있다.

일부 구현예 경우에, 제형은 단위 용량 당 본 명세서에 기술된 하나 이상의 폴리펩티드, 폴리뉴클레오티드, 벡터, 세포, 및 이의 조합의 사전결정된 양을 함유한다. 일부 구현예에서, 그러므로, 이러한 단위 용량의 사전결정된 양은 1일 1회 또는 1회 초과로 투여될 수 있다. 이러한 약학 제제는 당분야에 충분히 공지된 임의의 방법으로 제조될 수 있다.

키트

본 명세서는 또한 본 명세서에 기술된 하나 이상의 조성물, 폴리펩티드, 폴리뉴클레오티드, 벡터, 세포, 또는 다른 성분, 및 본 명세서에 기술된 약학 제제 중 하나 이상을 함유하는 키트를 기술한다. 구현예에서, 본 명세서에 기술된 하나 이상의 폴리펩티드, 폴리뉴클레오티드, 벡터, 세포, 및 이의 조합은 조합 키트로서 존재할 수 있다. 본 명세서에서 사용되는, 용어 "조합 키트" 또는 "부분의 키트"는 구성요소의 조합 또는 단일 구성요소, 예컨대 그 안에 함유된, 활성 성분을 패키징, 스크리닝, 시험, 판매, 거래, 전달, 및/또는 투여하는데 사용되는 화합물, 또는 제제 및 추가 성분을 의미한다. 이러한 추가 성분은 패키징, 시린지, 블리스터 패키지, 병 등을 포함하지만, 이에 제한되지 않는다. 조합 키트는 하나 이상의 성분 (예를 들어, 하나 이상의 폴리펩티드, 폴리뉴클레오티드, 벡터, 세포, 및 이의 조합 중 하나 이상)을 함유할 수 있거나 또는 이의 제제는 단일 제제 (예를 들어, 액체, 동결건조 분말 등) 또는 별개 제제로 제공될 수 있다. 별개 성분 또는 제제는 키트 내 단일 패키지 또는 별개 패키지에 함유될 수 있다. 키트는 또한 그에 함유된 성분 및/또는 제제의 함량에 관한 정보 및/또는 지시, 그 안에 함유된 성분(들) 및/또는 제제(들)의 함량에 관한 안전성 정보, 그 안에 함유된 성분(들) 및/도는 제제의 양, 용량, 사용을 위한 적응증, 스크리닝 방법, 성분 설계 권장 및/또는 정보, 권장 치료 용법(들)에 관한 정보를 함유하는 유형 표현 매체로 설명서를 포함할 수 있다. 본 명세서에서 사용되는, "유형 표현 매체"는 물리적으로 유형이거나 또는 접근가능하고 단순한 추상적 생각 또는 미기록 구어가 아닌 매치를 의미한다. "유형 표현 매체"는 셀룰로식 또는 플라스틱 물질 상의 단어, 또는 적합한 컴퓨터 판독가능 메모리 형태에 저장된 데이터를 포함하지만, 이에 제한되지 않는다. 데이터는 단위 장치, 예컨대 플래시 메모리 드라이브 또는 CD-ROM 또는 예를 들어, 웹 인터페이스를 통해서 사용자가 접근가능한 서버에 저장될 수 있다.

일 구현예에서, 본 발명은 본 명세서에 기술된 하나 이상의 성분을 포함하는 키트를 제공한다. 일부 구현예에서, 키트는 벡터 시스템 및 키트를 사용하기 위한 설명서를 포함한다. 일부 구현예에서, 벡터 시스템은 하나 이상의 조작된 폴리뉴클레오티드, 예컨대 본 명세서의 다른 곳에 기술된 바와 같이 근육-특이적 표적화 모이어티를 함유하는 것에 작동적으로 연결된 조절 구성요소, 및 임의로, 조절 구성요소에 작동적으로 연결될 수 있는 카고를 포함한다. 본 명세서의 다른 곳에 기술된 바와 같은, 하나 이상의 조작된 폴리뉴클레오티드 예컨대 근육-특이적 표적화 모이어티를 함유하는 것은 키트 내 카고 분자를 함유하는 구현예에서 카고 분자와 동일하거나 또는 상이한 벡터에 포함될 수 있다.

일부 구현예에서, 키트는 벡터 시스템 및 키트를 사용하기 위한 설명서를 포함한다. 일부 구현예에서, 벡터 시스템은 벡터 시스템은 (a) 직접 반복부 서열 및 직접 반복부 서열의 상류 또는 하류에(어느 쪽이든 적용 가능함) 하나 이상의 가이드 서열을 삽입하기 위한 하나 이상의 삽입 부위에 작동 가능하게 연결된 제1 조절 서열로서, 발현될 때, 가이드 서열이 진핵 세포에서 표적 서열에 대한 Cas9 CRISPR 복합체의 서열-특이적 결합을 유도하고, Cas9 CRISPR 복합체는 표적 서열에 혼성화된 하나 이상의 가이드 서열과 복합체 형성된 Cas9 효소를 포함하는 것인 제1 조절 요소; 및 (b) 핵 국재화 서열을 포함하는 상기 Cas9 효소를 코딩하는 효소-코딩 서열에 작동가능하게 연결된 제2 조절 구성요소를 포함한다. 일부 구현예에서, 성분 (a)는 제1 조절 구성요소에 작동적으로 연결된 둘 이상의 가이드 서열을 더 포함하고, 발현될 때, 둘 이상의 가이드 서열의 각각은 진핵생물 세포에서 상이한 표적 서열과 CRISPR 복합체의 서열 특이적 결합을 유도한다. 일부 구현예에서, Cas9 효소는 진핵생물 세포의 핵에서 검출가능한 양으로 상기 CRISPR 효소의 축적을 구동하기에 충분항 강도로 하나 이상의 핵 국재화 서열을 포함한다. 일부 구현예에서, CRISPR 효소는 V형 또는 VI형 CRISPR 시스템 효소이다. 일부 구현예에서, CRISPR 효소는 Cas9 효소이다. 일부 구현예에서, Cas9 효소는 프란시셀라 툴라렌시스 (Francisella tularensis) 1, 프란시셀라 툴라렌시스 아종 노비시다, 프레보텔라 알벤시스 (Prevotella albensis), 라크노스피라세아에 박테리움 (Lachnospiraceae bacterium) MC2017 1, 부티리비브리오 프로테오클라스티쿠스 (Butyrivibrio proteoclasticus), 페레그리니박테리아 박테리움 (Peregrinibacteria bacterium) GW2011_GWA2_33_10, 파르쿠박테리아 박테리움 (Parcubacteria bacterium) GW2011_GWC2_44_17, 스미텔라 (Smithella) 종 SCADC, 아시다미노코커스 (Acidaminococcus) 종 BV3L6, 라크노스피라세아에 박테리움 MA2020, 칸디다투스 메타노플라즈마 테르미툼 (andidatus Methanoplasma termitum), 유박테리움 엘리겐스 (Eubacterium eligens), 모락셀라 보보쿨리 (Moraxella bovoculi) 237, 렙토스피라 이나다이 (Leptospira inadai), 라크노스피라세세아에 박테리움 ND2006, 포르피로모나스 크레비오리카니스 (Porphyromonas crevioricanis) 3, 프레보텔라 디시엔스 (Prevotella disiens), 또는 포르피로모나스 마카카 (Porphyromonas macacae) Cas9로부터 유래되고, 본 명세서의 다른 곳에 정의된 바와 같은 Cas9의 추가적인 변경 또는 돌연변이를 포함할 수 있으며, 키메라 Cas9일 수 있다. 일부 구현예에서, the DD-CRISPR 효소는 진핵생물 세포에서 발현을 위해 코돈-최적화된다. 일부 구현예에서, DD-CRISPR 효소는 표적 서열의 위치에서 하나 또는 2개 가닥의 절단을 유도한다. 일부 구현예에서, DD-CRISPR 효소는 실질적으로 DNA 가닥 절단 활성이 결여된다 (예를 들어, 야생형 효소 또는 뉴클레아제 활성을 감소시키는 돌연변이 또는 변경을 갖지 않는 효소와 비교하여 5% 이하의 뉴클레아제 활성), 일부 구현예에서, 제1 조절 구성요소는 폴리머라제 III 프로모터이다. 일부 구현예에서, 제2 조절 구성요소는 폴리머라제 II 프로모터이다. 일부 구현예에서, 가이드 서열은 적어도 16, 17, 18, 19, 20, 25 뉴클레오티드, 또는 16-30, 또는 16-25, 또는 16-20 뉴클레오티드 길이이다.

사용 방법

일반 고찰

근육-특이적 표적화 모이어티 중 하나 이상, 조작된 AAV 캡시드 시스템 폴리뉴클레오티드, 폴리펩티드, 벡터(들), 조작된 세포, 조작된 AAV 캡시드 입자를 포함하는 조성물은 일반적으로 수령자 세포에 하나 이상의 카고를 패키징 및/또는 전달하는데 사용될 수 있다. 일부 구현예에서, 전달은 표적화 모이어티의 특이성을 기바으로 세포-특이적 방식으로 수행된다. 일부 구현예에서 이것은 본 명세서의 다른 곳에 기술된 하나 또는 n-량체 모티프의 포함에 의해서 적어도 부분적으로 영향받을 수 있는 조작된 AAV 캡시드의 향성을 통해 부여되는 것이다. 일부 구현예에서, 근육-특이적 표적화 모이어티 중 하나 이상, 조작된 AAV 캡시드 입자를 포함하는 조성물은 대상체 또는 세포, 조직, 및/또는 장기에 투여될 수 있고 수령자 세포의 카고의 전달 및/또는 통합을 촉진할 수 있다. 다른 구현예에서, 하나 이상의 근육-특이적 표적화 모이어티를 함유하는, 조성물, 예컨대 폴리펩티드 및 다른 입자 (예를 들어, 조작된 AAV 캡시드 및 바이러스 입자)를 생산할 수 있는 조작된 세포는 본 명세서에 기술된, 폴리뉴클레오티드, 벡터, 및 벡터 시스템 등으로부터 생성될 수 있다. 이것은 제한없이, 조작된 AAV 캡시드 시스템 분자 (예를 들어, 폴리뉴클레오티드, 벡터, 및 벡터 시스템 등)를 포함한다. 일부 구현예에서, 하나 이상의 근육-특이적 표적화 모이어티를 함유하는, 조성물, 예컨대 폴리펩티드 및 다른 입자 (예를 들어, 조작된 AAV 캡시드 및 바이러스 입자)를 생성할 수 있는, 본 명세서에 기술된, 폴리뉴클레오티드, 벡터, 및 벡터 시스템 등은 생체내, 생체외, 또는 시험관내에서 세포 또는 조직에 전달될 수 있다. 일부 구현예에서, 대상체에게 전달될 때, 조성물은 생체내, 또는 생체외에서 대상체의 세포를 형질전환시켜서, 조작된 세포로부터 방출되어 생체내에서 수령자 세포에게 카고 분자(들)를 전달할 수 있거나 또는 수령자 세포를 수득한 대상체로 재도입을 위한 개인맞춤형 조작된 조성물 (예를 들어, AAV 캡시드 입자)를 생산하는, 제한없이 조작된 AAV 캡시드 입자를 포함한, 본 명세서에 기술된 근육-특이적 표적화 모이어티 중 하나 이상을 함유하는 본 명세서에 기술된 조성물을 제조할 수 있는 조작된 세포를 생산할 수 있게 된다.

일부 구현예에서, 조작된 세포는 본 발명의 생산된 조성물 (제한없이, 조작된 AAV 캡시드 입자 포함)을 방출할 수 있는, 대상체에게 전달될 수 있어서 그들은 이후 카고 (예를 들어, 카고 폴리뉴클레오티드(들)) 수령자 세포에게 전달할 수 있다. 이들 일반 과정은 대상체에서 질환 또는 이의 증상을 치료 및/또는 예방하고, 모델 세포를 생성시키고, 변형된 유기체를 생성시키고, 생체 생산에서, 및 다른 다양한 적용에서, 세포 선택 및 스크리닝 어세이를 제공하도록 다양한 방식으로 사용될 수 있다.

일부 구현예에서, 근육-특이적 표적화 모이어티 중 하나 이상을 함유하는, 조성물, 예컨대 폴리펩티드 및 다른 입자 (예를 들어, 조작된 AAV 캡시드 및 바이러스 입자)는 대상체 또는 세포, 조직, 및/또는 장기에 전달될 수 있다. 그들이 임의 카고를 전달하기 위해 사용될 수 있는 방식으로, 그들은 근육 조직과 연관되거나 또는 함유할 수 있다.

일부 구현예에서, 조작된 AAV 캡시드 폴리뉴클레오티드, 벡터,및 이의 시스템은 원하는 세포-특이성을 갖는 변이체를 발굴할 수 있는 조작된 AAV 캡시드 변이체를 생성시키는데 사용될 수 있다. 다양한 실시예에 의해 뒷받침되는 본 명세서에 제공되는 설명은 원하는 세포-특이성을 염두에 둔 사람이 원하는 세포-특이성을 갖는 캡시드를 수득하기 위해 본 발명에 기술된 바와 같이 본 발명을 이용할 수 있다는 것을 입증할 수 있다.

대상 발명은 데이터 또는 결과를 전송하는 연구 프로그램의 일부로서 사용될 수 있다. 컴퓨터 시스템 (또는 디지탈 장치)은 결과를 수용, 전송, 디스플레이 및/또는 저장, 데이터 및/또는 결과를 분석, 및/또는 결과 및/또는 데이터 및/또는 분석의 기록을 생산하는데 사용될 수 있다. 컴퓨터 시스템은 임의로 고정 매체를 갖는 서버에 연결될 수 있는, 매체 (예를 들어, 소프트웨어) 및/또는 (예를 들어, 인터넷으로부터의) 네트워크 포트로부터의 명령을 판독할 수 있는 논리 장비로서 이해될 수 있다. 컴퓨터 시스템은CPU, 디스크 드라이브, 입력 장치, 예컨대 키보드 및/또는 마우스, 및 디스플레이 (예를 들어, 모니터) 중 하나 이상을 포함할 수 있다. 데이터 통신, 예컨대 명령 또는 보고서 전송은 로컬 또는 원격 위치에서 서버로 통신 매체를 통해서 달성될 수 있다. 통신 매체는 데이터 전송 및/또는 수진의 임의 수단을 포함할 수 있다. 예를 들어, 통신 매체는 네트워크 연결, 무선 연결, 또는 인터넷 연결일 수 있다. 이러한 연결은 월드 와이드 웹에서 통신을 제공할 수 있다. 본 발명과 관련된 데이터는 수산지 검토 및/또는 수신을 위해 이러한 네트워크 또는 연결 (또는 제한없이, 물리적 리포트의 메일링, 예컨대 인쇄물을 포함하는, 정보의 전송을 위한 임의의 다른 적합한 수단)에서 전송될 수 있다는 것을 고려한다. 수신자는 개인 또는 전자 시스템 예를 들어, 하나 이상의 컴퓨터 및/또는 하나 이상의 서버)일 수 있지만, 이에 제한되지 않는다. 일부 구현예에서, 컴퓨터 시스템은 하나 이상의 프로세서를 포함한다. 프로세서는 하나 이상의 제어기, 계산 단위, 및/또는 컴퓨터 시스템의 다른 단위와 연결될 수 있거나, 또는 원하면 펌웨어에 이식될 수 있다. 소프트웨어로 구현되면, 루틴은 임의의 컴퓨터 판독 메모리, 예컨대 RAM, ROM, 플래시 메모리, 자기 디스크, 레이저 디스크, 또는 다른 적합한 저장 매체에 저장될 수 있다. 유사하게, 이러한 소프트웨어는 예를 들어, 통신 채널, 예컨대 전화선, 인터넷, 무선 연결 등을 포함한, 임의의 기지 전달 방법을 통해서, 또는 휴대용 매체, 예컨대 컴퓨터 판독 디스크, 플래시 드라이브 등을 통해서 연산 장치에 전달될 수 있다. 다양한 단계가 다양한 블록, 작업, 도구, 모듈 및 기술로서 구현될 수 있고, 결국 하드웨어, 펌웨어, 수프트웨어, 또는 하드웨어, 펌워에, 및/또는 소프트웨어의 임의 조합으로 구현될 수 있다. 하드웨어에서 구현될 때, 블록, 작업, 기술 등의 일부 또는 전부는 예를 들어, 맞춤형 집적 회로 (IC), 주문형 집적 회로 (ASIC), 필드 프로그래밍가능 논리 어레이 (FPGA), 프로그래밍 가능 논리 어레이 (PLA), 등에서 구현될 수 있다. 클라이언트-서버, 관련 데이터베이스 아키텍처는 본 발명의 구현예에서 사용될 수 있다. 클라이언트-서버 아키텍처는 네트워크 상의 각각의 컴퓨터 또는 프로세스가 클라이언트 또는 서버인 네트워크 아키텍처이다. 서버 컴퓨터는 전형적으로 디스크 드라이브 (파일 서버), 프린터 (프린트 서버), 또는 네트워크 트래픽 (네트워크 서버)을 관리하는데 제공되는 강력한 컴퓨터이다. 클라이언트 컴퓨터는 사용자가 어플리케이션을 실행하는 PC (개인 컴퓨터) 또는 워크스테이션을 비롯하여 본 명세서에 개시된 바와 같은 출력 장치를 포함한다. 클라이언트 컴퓨터는 리소스, 예컨대 파일, 드라이브, 및 심지어 프로세싱 파워를 위한 서버 컴퓨터에 의존한다. 본 발명의 일부 구현예에서, 서버 컴퓨터는 모든 데이터베이스 기능을 처리한다. 클라이언트 컴퓨터는 모든 프론터-엔드 데이터 관리를 취급하거나 또는 사용자로부터 데이터 입력을 수신하는 소프트웨어를 구비할 수 있다. 컴퓨터-힐생가능 코드를 포함하는 기계 판독 가능 매체는 유형 저장 매체, 반송파 매체 또는 물리적 전송 매체, 비-휘발성 저장 매체를 포함할 수 있지만, 이에 제한되지 않는 많은 형태를 취할 수 있다. 비-휘발성 저장 매체는 예를 들어, 광학 또는 자성 디스크, 예컨대 임의 컴퓨터(들)의 임의 저장 장치를 포함할 수 있고, 예컨대 도면에 도시된 바와 같이, 데이터베이스등을 구현하는데 사용될 수 있다. 휘발성 저장 매체는 동적 메모리, 예컨대 이러한 컴퓨터 플랫폼의 주메모리를 포함한다. 유형 전송 매체는 컴퓨터 시스템 내 버스를 포함한 와이어를 포함하여, 동축 케이플, 구리 와이어 광섬유를 포함한다. 반송파 전송 매체는 전기 또는 전자기 신호, 또는 음향 또는 광파, 예컨대 무선 주파수 (RF) 및 적외선 (IR) 데이터 통신 동안 발생되는 것들의 형태를 취할 수 있다. 따라서, 컴퓨터-판독가능 매체의 일반 형태는 예를 들어, 플로피 디스크, 플레시블 디스크, 하드 디스크, 자기 테이프, 임의의 다른 자기 매체, CD-ROM, DVD 또는 DVD-ROM, 임의의 다른 광학 매체, 펀치 카드 페이퍼 테이프, 홀 패턴을 갖는 임의의 다른 물리적 저장 매체, RAM, ROM, PROM 및 EPROM, FLASH-EPROM, 임의의 다른 메모리 칩 또는 카트리지, 반송파 수송 데이터 또는 명령, 이러한 반송파를 수송하는 케이블 또는 링크, 또는 컴퓨터가 프로그래밍 코드 및/또는 데이터를 판독할 수 있는 임의의 다른 매체를 포함한다. 많은 이들 형태의 컴퓨터 판독 가능 매체는 실행을 위해 프로세서에 하나 이상의 명령의 하나 이상의 배열을 운반하는 것을 포함할 수 있다. 따라서, 본 발명은 본 명세서에 기술된 임의의 방법을 수행하고 그로부터의 데이터 및/또는 결과 및/도는 이의 분석을 저장 및/또는 전달하는 것을 비롯하여, 중간체를 포함하여 본 명세서에 논의된 임의 방법의 수행에 의한 생성물을 이해한다.

치료제

일부 구현예에서, 제한없이, 본 명세서에 기술된 조작된 AAV 캡시드 입자, 조작된 세포, 및/또는 이의 제제를 포함하는, 본 명세서에 기술된 근육-특이적 표적화 모이어티 중 하나 이상을 함유하는 조성물은 하나 이상의 질환에 대한 치료제로서 이를 필요로 하는 대상체에게 전달될 수 있다. 일부 구현예에서, 유전적 또는 후생유전 기반 질환이다. 일부 구현예에서, 치료하려는 질환은 유전적 또는 후생유전 기반 질환이 아니다. 일부 구현예에서, 제한없이, 본 명세서에 기술된 조작된 AAV 캡시드 입자, 조작된 세포, 및/또는 이의 제제를 포함하는, 본 명세서에 기술된 근육-특이적 표적화 모이어티 중 하나 이상을 포함하는 하나의 조성물은 질환의 치료 또는 예방으로서 (또는 치료 또는 예방의 일부로서) 이를 필요로 하는 대상체에게 전달될 수 있다. 본 발명의 조성물, 제제, 세포 등의 전달에 의해 치료 및/또는 예방하려는 특별한 질환은 본 발명의 조성물, 제제, 세포 등에 커플링, 부착, 그에 함유, 또는 회합된 카고에 의존적일 수 있다는 것을 이해할 것이다.

치료할 수 있는 유전 질환은 본 명세서의 다른 곳에 상세히 논의된다 (예를 들어, 하기 유전자-변형 기반 요법에서 논의), 다른 질환은 하기 중 어느 하나를 포함하지만, 이에 제한되지 않는다: 암, 아시네토박터 감염, 방선균증, 아프리카 수면병, AIDS/HIV, 아메바증, 아나플라즈마증, 혈관강화증, 아나사키아증, 탄저병, 아카노박테리움 해몰리티쿰 (Arcanobacterium haemolyticum) 감염, 아르헨티나 출혈열, 회충증, 아스페르길루스증, 아스트로바이러스 감염, 바베시아증, 세균성 뇌수막염, 세균성 폐렴, 세균성 질염, 박테로이데스 감염, 발란티디아 증, 바르토넬라증, 베일리사스카리스 (Baylisascaris) 감염 BK 바이러스 감염, 블랙 피에드라 포배구증, 분아균증, 볼리비아 출혈열, 보툴리누스 중독, 브라질 출혈열, 브루셀라증, 림프종 흑사병, 버크홀데리아 (Burkholderia) 감염, 부룰리 궤양, 칼리시바이러스 감염, 캄필로박테리아증, 칸디다증, 모세혈관증, 썩은고기병, 고양이-할퀴병, 연조직염, 샤카그병, 연성하감, 수두, 치쿤구니야, 클라미디아, 클라미디아 뉴모니아에, 콜레라, 색모세포균증, 집진균증, 간흡충증, 클로스트리듐 디피실 대장염, 콕시디오이드진균증, 콜로라도 진드기열, 리도바이러스/코로나바이러스 감염 (일반 감기), 크로이펠트-야콥병, 크림-콩고 출혈열, 크립토코쿠스증, 크립토스포리디움증, 피부 유충 이동 (CLM), 원포자충증, 낭미충증, 사이토메갈로바이러스 감염, 뎅기열, 데스모데스무스 (Desmodesmus) 감염, 디엔트아메바증, 디프테리아, 열두조충증, 메디나충증, 에볼라, 포충증, 엘리키아증, 요충증, 엔테로코쿠스 감염, 엔테로바이러스 감염, 발진 티푸스, 전염성 홍반, 돌발진, 간질증, 비대흡충증, 치명적 가족성 불면증, 필라리아증, 클로스트리듐 퍼프린젠스 (Clostridium perfringens) 감염, 푸소박테리움 (Fusobacterium) 감염, 가스 괴저병 (클로스트리듐 근괴사증), 지토충병, 게르스트만-스트라우슬러-샤인커 증후군, 편모충증, 마비저, 턱유충증, 임질, 서혜부 육아종, A군 스트렙토코커스 감염, B군 스트렙토코커스 감염, 해포필루스 인플루엔자에 (influenzae) 감염, 수족구병, 한타바이러스 폐 증후군, 하트랜드 바이러스 질환, 헬리코박터 파일로리 (helicobacter pylori) 감염, 신장 증후군 동반 출혈열, 헨드라 바이러스 감염, 간염 (모든 그룹 A, B, C, D, E), 헤르페스 심플렉스, 히스토플라즈마증, 십이지장충 감염, 인간 보카바이러스 감염, 인간 에를리키아증, 인간 과립구 아나플라스마증, 인간 메타뉴모바이러스 감염, 인간 단핵구 에를리키아증, 인간 파필로마 바이러스, 왜소조충증, 엡스테인-바 감염, 단핵구증, 인플루엔자, 동포자충증, 가와사키병, 킨겔라 킨가에 (Kingella kingae) 감염증, 쿠루, 라싸열, 레지오넬라증 (재향군이병 및 포토맥열), 리슈마니아증, 나병, 렙토스피라증, 리스테리아증, 라임병, 림프성 필라리아증, 림프구성 맥락수막염, 말라리아병, 마르부르그 출혈열, 홍역, 중동 호흡기 증후군, 멜리오양증, 뇌수막염, 수막구균성병, 대사충증, 미소포자충증, 전염성 물렁종, 원숭이폭스, 볼거리, 쥐 발진열, 마이코플라스마 폐렴, 마이코플라스마 제니탈리움 (Mycoplasma genitalium) 감염, 족균종, 승저증, 결막염, 니파 바이러스 감염, 노로바이러스, 변종 크로이펠츠-야콥병, 노카르디아증, 사상충증, 후편모충증, 파라콕시디오이데스진균증, 폐흡충증, 파스퇴렐라증, 두부소포염, 체부소포증, 치골소포증, 골반 염증 질환, 백일해, 흑사병, 폐렴구균 감염, 폐렴구균성 폐렴, 폐렴, 척수성 소아마비, 프레보텔라 감염, 원발성 아메바성 수막뇌염, 진행성 다발성 백질뇌증, 프시타코시스증, Q열, 공수병, 재발열, 호흡기 세포융합 바이러스 감염, 리노바이러스 감염, 리켓치아 감염, 리켓차두, 리프트 밸리열, 로키산 홍반열, 로타바이러스 감염, 풍진, 살모넬라증, SARS, 옴, 성홍열, 주혈흡충증, 패혈증, 세균성 이질, 대상포진, 천연두, 스포로트리쿰증, 스타필로코쿠스 감염 (MRSA 포함), 분선충증, 아급성 경화성 범뇌염, 매독, 대니아증, 파상풍, 트리코피톤 (Trichophyton) 종 감염, 톡소카리아증, 톡소플라즈마증, 트리코마, 선모충증, 선모충병, 결핵, 야토병, 장티푸스, 발신 티푸스, 유레아플라스미 유레알리티쿰 (Ureaplasma urealyticum) 감염, 계곡열, 베네수엘라 말 뇌염, 베네수엘라 출혈열, 비브리오종 감염, 바이러스 폐렴, 웨스트나일 열병, 백색사모, 여시니아 슈도튜버큘로시스 (Yersinia pseudotuberculosis), 여시니아증, 황열병, 제아스포라, 지카열, 접합진균증 및 이의 조합.

본 발명의 구현예을 사용해 치료할 수 있는 다른 질환 및 장애는 내분비질환 (예를 들어, I형 및 II형 당뇨병, 임신성 당뇨병, 저혈당증, 글루카곤종, 갑상선종, 감상선기능항진증, 갑상선기능 저하증, 갑상선염, 갑상선암, 갑상선 호르몬 저항증, 부갑상선 질환, 골다공증, 변형 골염, 구루병, 골연화증, 뇌하수체 기능저하증, 뇌하수체 종양 등), 감염 및 비-감염 기원의 피부 병태, 감염 또는 비-감염 기원의 눈 질환, 감염 또는 비-감염 기원 위장 장애, 감염 또는 비-감염 기원의 심혈관 질환, 감염 또는 비-감염 기원의 뇌 및 뉴런 질환, 감염 또는 비-감염 기원의 신경계 질환, 감염 또는 비-감염 기원의 근육 질환, 감염 또는 비-감염 기원의 뼈 질환, 감염 또는 비-감염 기원의 생식계 질환, 감염 또는 비-감염 기원의 신장계 질환, 감염 또는 비-감염 기원의 혈액 질환, 감염 또는 비-감염 기원의 림프계 질환, 감염 또는 비-감염 기원의 면역계 질환, 감염 또는 비-감염 기원의 정신 질환 등을 포함하지만, 이에 제한되지 않는다.

일부 구현예에서, 치료하려는 질환은 근육 또는 근육 관련 질환 또는 장애, 예컨대 유전적 근육 질환 또는 장애이다.

당업자는 다른 질환 및 장애를 이해할 것이다.

양자 세포 요법

일반적으로, 양자 세포 전달은 대상체에게 세포 (자가, 동종이계, 및/또는 이종이계)의 전달을 포함한다. 세포는 대상체에게 전달 전에 변형 및/또는 조작될 수 있거나 또는 그렇지 않을 수 있다.

일부 구현예에서, 본 명세서에 기술된 바와 같은 조작된 세포는 양자 세포 전달 요법에 포함될 수 있다. 일부 구현예에서, 본 명세서에 기술된 바와 같은 조작된 세포는 이를 필요로 하는 대상체에게 전달될 수 있다. 일부 구현예에서, 세포는 대상체로부터 단리되어, 시험관내에서 조작되어서, 본 명세서에 기술된 (조작된 AAV 캡시드 입자를 포함하지만, 이에 제한되지 않음) 본 명세서의 다른 곳에 기술된 근육-특이적 표적화 모이어티를 함유하는 본 발명의 조성물을 함유하고/하거나 생성시킬 수 있어서 조작된 세포를 생산하고 자가 방식으로 대상체에게 다시 또는 동종이계 또는 이종이계 방식으로 상이한 대상체에게 전달될 수 있다. 단리, 조작, 및/또는 전달된 세포는 진핵생물 세포일 수 있다. 단리, 조작, 및/또는 전달된 세포는 줄기 세포일 수 있다. 단리, 조작, 및/또는 전달된 세포는 분화된 세포일 수 있다. 단리, 조작, 및/또는 전달된 세포는 면역, 혈액 세포, 내분비 세포, 신장 세포, 외분비 세포, 신경계 세포, 혈관 세포, 근육 세포, 비뇨계 세포, 뼈 세포, 연조직 세포, 심장 세포, 뉴런, 또는 외피계 세포일 수 있다. 다른 특정 세포 유형은 당업자가 즉시 이해할 것이다.

일부 구현예에서, 단리된 세포는 조작되어서 본 명세서의 다른 곳에 기술된 바와 같은 조작된 세포가 된다 (예를 들어, 본 명세서의 다른 곳에 기술된 하나 이상의 조작된 전달 시스템 분자 또는 벡터를 함유하고/하거나 발현함). 이러한 조작된 세포를 제조하는 방법은 본 명세서의 다른 곳에 상세히 기술된다.

본 발명에 따른 세포 또는 세포 개체군의 투여는 에어로졸 흡입, 주사, 섭취, 수혈, 이식주입 또는 이식을 포함한, 임의의 편리한 방식으로 수행될 수 있다. 세포 또는 세포의 개체군은 환자에게 피하, 피내, 종양내, 낭내, 척수내, 근육내, 정맥내, 또는 림프내 주사 또는 복강내로 투여될 수 있다. 일 구현예에서, 본 발명의 세포 조성물은 바람직하게 정맥내 주사를 통해 투여된다.

세포 또는 세포 개체군의 투여는 그 범위 내 모든 정수값의 세포수를 포함하여, 체중 kg 당 10⁴-10⁹ 세포의 투여일 수 있거나 또는 그를 포함한다. 일부 구현예에서, 10⁵ 내지 10⁶ 세포/kg가 전달된다. 양자 세포 요법에서 투약은 예를 들어, 시클로포스파미드에 의한, 림프고갈 과정과 함께 또는 없이, 예를 들어, 10⁶ 내지 10⁹ 세포/kg의 투여를 포함할 수 있다. 세포 또는 세포 개체군은 하나 이상의 용량으로 투여될 수 있다. 다른 구현예에서, 세포의 유효량은 단일 용량으로 투여된다. 다른 구현예에서, 세포의 유효량은 시간 기간 동안 1회 초과 용량으로 투여된다. 투여 시점은 담당 의사의 판단 내에 있고, 환자의 임상적 상태에 의존적이다. 세포 또는 세포 개체군은 임의 출처, 예컨대 혈액 은행 또는 공여자로부터 수득될 수 있다. 개체 요구가 다양하지만, 특정 질환 또는 병태에 대한 소정 세포 유형의 유효량의 최적 범위의 결정은 당업자의 기술 내에 있다. 유효량은 치료적 또는 예방적 이득을 제공하는 양을 의미한다. 투여되는 용량은 수령자의 연령, 건강, 및 체중, 있다면, 동시 치료 종류, 치료 빈도 및 원하는 효과의 성질에 의존적일 것이다.

다른 구현예에서, 세포 또는 세포를 포함하는 조성물의 유효량은 비경구로 투여된다. 투여는 정맥내 투여일 수 있다. 투여는 조직 내에서 주사를 통해 직접 수행될 수 있다. 일부 구현예에서, 조직은 종양일 수 있다.

가능한 유해 반응에 대해 보호하기 위해, 조작된 세포는 특정 신호에 대한 노출에 취약한 세포를 제공하는 이식유전자의 형태로 유전자이식 안전성 스위치를 구비할 수 있다. 예를 들어, 헤르페스 심플렉스 바이러스 티미딘 키나제 (TK) 유전자는 예를 들어, [Greco, et al., Improving the safety of cell therapy with the TK-suicide gene, Front. Pharmacol. 2015; 6: 95]에 논의된 것과 유사하게 조작된 세포로 도입을 통해, 이러한 방식으로 사용될 수 있다. 이러한 세포에서, 뉴클레오시드 프로드러그, 예컨대 간시클로비르 또는 아시클로비르의 투여는 세포 사멸을 초래한다. 대안적인 안전성 스위치 구성체는 예를 들어, 2개의 비기능성 icasp9 분자가 활성 효소를 형성하도록 소형-분자 이량체화제의 투여에 의해 촉발되는, 유도성 캐스파제 9를 포함한다. 세포 증식 제어를 구현하기 위한 다양한 대안적인 접근법은 기술되어 있다 (참조: 미국 특허 출원 공개 번호 제20130071414호; PCT 공개 번호 WO2011146862; PCT 공개 번호 WO2014011987; PCT 공개 번호 WO2013040371; Zhou et al. BLOOD, 2014, 123/25:3895 - 3905; Di Stasi et al., The New England Journal of Medicine 2011; 365:1673-1683; Sadelain M, The New England Journal of Medicine 2011; 365:1735-173; Ramos et al., Stem Cells 28(6):1107-15 (2010)).

원하는 성질을 갖는 조작된 세포를 수득하기 위해 단리된 세포를 변형시키는 방법은 본 명세서의 다른 곳에 기술된다. 일부 구현예에서, 방법은 세포를 변형시키기 위해 CRISPR-Cas 시스템을 사용하는 게놈 편집을 포함한, 게놈 변형을 포함할 수 있지만, 이에 제한되지 않는다. 이것은 본 명세서의 다른 곳에 기술된 조작된 AAV 캡시드 시스템 분자의 도입에 더해질 수 있다.

동종이계 세포는 숙주 면역 시스템에 의해 빠르게 거부된다. 비-조사된 혈액 생산물에 존재하는 동종이계 백혈구는 5일 내지 6일 이하 동안 지속된다는 것이 입증되었다 (Boni, Muranski et al. 2008 Blood 1;112(12):4746-54). 따라서, 동종이계 세포의 거부를 방지하기 위해, 숙주의 면역계는 일반적으로 어느 정도까지는 억제되어야 한다. 그러나, 양자 세포 전달의 경우에, 면역억제 약물의 사용은 또한 도입되는 치료 세포, 본 명세서에 기술된 조작된 세포에 유해한 효과를 갖는다. 그러므로, 이들 조건에서 양자 면역요법 접근방식을 효과적으로 사용하기 위해, 도입된 세포는 면역억제 치료에 저항성일 필요가 있을 것이다. 따라서, 특정 구현예에서, 본 발명은 바람직하게 면역억제제를 코딩하는 적어도 하나의 유전자를 불활성화시켜서, 면역억제제에 내성이게 되도록 조작된 세포를 변형시키는 단계를 더 포함한다. 면역억제제는 몇몇 작용 기전 중 하나를 통해 면역 기능을 억제하는 작용제이다. 면역억제제는 칼시뉴린 억제제, 라파마이신의 표적, 인터류킨-2 수용체 α-쇄 차단제, 이노신 일인산 디히드로게나제의 억제제, 다이하이드로엽산 리덕타제의 억제제, 코티코스테로이드 또는 면역억제성 항대사물질일 수 있지만, 이들로 제한되지 않는다. 본 발명은 조작된 세포에서 면역억제제의 표적을 불활성화시켜서 양자 세포 요법을 위해 조작된 세포에 면역억제 내성을 부여하도록 허용한다. 비제한적인 예로서, 면역억제제에 대한 표적은 면역억제제에 대한 수용체 예컨대: CD52, 글루코코르티코이드 수용체 (GR), FKBP 패밀리 유전자 구성원 및 사이클로필린 패밀리 유전자 구성원일 수 있다.

면역 체크포인트는 면역 세포의 비제어된 활성으로부터 과도한 조직 손상을 예방하고 면역 반응을 둔화시키거나 중단시키는 억제성 경로이다. 일정 구현예에서, 표적화되는 면역 체크포인트는 프로그램된 사멸-1 (PD-1 또는 CD279) 유전자 (PDCD1)이다. 다른 구현예에서, 표적화된 면역 체크포인트는 세포독성 T-림프구-연관 항원 (CTLA-4)이다. 추가 구현예에서, 표적화된 면역 체크포인트는 CD28 및 CTLA4 Ig 수퍼패밀리의 다른 구성원 예컨대 BTLA, LAG3, ICOS, PDL1 또는 KIR이다. 더 추가의 구현예에서, 표적화된 면역 체크포인트는 TNFR 수퍼패밀리 예컨대 CD40, OX40, CD137, GITR, CD27 또는 TIM-3의 구성원이다.

추가 면역 체크포인트는 Src 상동성 2 도메인-함유 단백질 티로신 포스파타제 1 (SHP-1)를 포함한다 (Watson HA, et al., SHP-1: the next checkpoint target for cancer immunotherapy? Biochem Soc Trans. 2016 Apr 15;44(2):356-62). SHP-1은 광범위하게 발현되는 억제성 단백질 티로신 포스파타제 (PTP)이다. T-세포에서, 이것은 항원-의존적 활성화 및 증식의 음성 조절인자이다. 이것은 시토졸 단백질이고, 따라서 항체-매개 요법에 처리될 수 없지만, 활성화 및 증식에서 이의 역할은 양자 전달 전략, 예컨대 키메라 항원 수용체 (CAR) T 세포에서 유전자 조작을 위한 매력적인 표적이 되게 한다. 면역 체크포인트는 또한 Ig 및 ITIM 도메인 (TIGIT/Vstm3/WUCAM/VSIG9) 및 VISTA를 갖는 T 세포 면역수용체를 포함할 수도 있다 (Le Mercier I, et al., (2015) Beyond CTLA-4 and PD-1, the generation Z of negative checkpoint regulators. Front. Immunol. 6:418).

WO2014172606은 고갈된 CD8+ T-세포의 증식 및/또는 활성을 증가시키고 CD8+ T-세포 고갈을 감소 (예를 들어, 기능적으로 고갈되거나 또는 비반응성인 CD8+ 면역 세포 감소)시키기 위해서 MT1 및/또는 MT1 억제제의 사용에 관한 것이다. 일정 구현예에서, 메탈로티오네인은 양자 전달 T 세포에서 유전자 편집하여 표적화된다.

일정 구현예에서, 유전자 편집의 표적은 면역 체크포인트 단백질의 발현에 관여되는 적어도 하나의 표적화 유전자좌일 수 있다. 이러한 표적은 CTLA4, PPP2CA, PPP2CB, PTPN6, PTPN22, PDCD1, ICOS (CD278), PDL1, KIR, LAG3, HAVCR2, BTLA, CD160, TIGIT, CD96, CRTAM, LAIR1, SIGLEC7, SIGLEC9, CD244 (2B4), TNFRSF10B, TNFRSF10A, CASP8, CASP10, CASP3, CASP6, CASP7, FADD, FAS, TGFBRII, TGFRBRI, SMAD2, SMAD3, SMAD4, SMAD10, SKI, SKIL, TGIF1, IL10RA, IL10RB, HMOX2, IL6R, IL6ST, EIF2AK4, CSK, PAG1, SIT1, FOXP3, PRDM1, BATF, VISTA, GUCY1A2, GUCY1A3, GUCY1B2, GUCY1B3, MT1, MT2, CD40, OX40, CD137, GITR, CD27, SHP-1 또는 TIM-3을 포함할 수 있지만, 이에 제한되지 않는다. 일부 구현예에서, PD-1 또는 CTLA-4 유전자의 발현에 관여되는 유전자의 유전자좌가 표적화된다. 일부 구현예에서, 유전자의 조합, 예컨대 PD-1 및 TIGIT를 표적화하지만, 이에 제한되지 않는다.

일부 구현예에서, 적어도 2개 유전자가 편집된다. 유전자의 쌍은 PD1 및 TCRα, PD1 및 TCRβ, CTLA-4 및 TCRα, CTLA-4 및 TCRβ, LAG3 및 TCRα, LAG3 및 TCRβ, Tim3 및 TCRα, Tim3 및 TCRβ, BTLA 및 TCRα, BTLA 및 TCRβ, BY55 및 TCRα, BY55 및 TCRβ, TIGIT 및 TCRα, TIGIT 및 TCRβ, B7H5 및 TCRα, B7H5 및 TCRβ, LAIR1 및 TCRα, LAIR1 및 TCRβ, SIGLEC10 및 TCRα, SIGLEC10 및 TCRβ, 2B4 및 TCRα, 2B4 및 TCRβ를 포함할 수 있지만, 이에 제한되지 않는다.

조작된 세포 (예컨대 조작된 T 세포 (예를 들어, 단리된 세포는 T 세포임)의 유전자 또는 다른 변형 이전이건 또는 이후이건, 조작된 세포는 일반적으로 예를 들어, 하기 미국 특허에 기술된 바와 같이 활성화될 수 있고 확장될 수 있다: 미국 특허 제6,352,694호; 제6,534,055호; 제6,905,680호; 제5,858,358호; 제6,887,466호; 제6,905,681호; 제7,144,575호; 제7,232,566호; 제7,175,843호; 제5,883,223호; 제6,905,874호; 제6,797,514호; 제6,867,041호; 및 제7,572,631호. 조작된 세포는 시험관내 또는 생체내에서 확장될 수 있다.

일부 구현예에서, 방법은 동종이계 양자 전달을 허용하도록 잠재적 동종반응성 TCR 또는 다른 수용체를 제거하기 위해서 본 명세서의 다른 곳에 기술된 적합한 유전자 변형 (예를 들어, CRISPR-CaS 시스템을 통한 유전자 편집)을 통해서 새?z외에서 조작된 세포를 편집하는 단계를 포함한다. 일부 구현예에서, T 세포는 이식편 대 숙주 질환 (GVHD)을 피하기 위해서 TCR (예를 들어, αβTCR) 또는 다른 관련 수용체를 코딩하는 내생성 유전자를 녹-아웃 또는 녹-다운하도로고 CRISPR-CaS 시스템 또는 다른 적합한 게놈 변형 기술을 통해 생체외에서 편집된다. 일부 구현예에서, 조작된 세포가 T 세포인 경우, 조작된 세포는 TRAC 유전자좌를 돌연변이시키기 위해 CRISPR 또는 다른 적절한 유전자 변형을 통해 생체외에서 편집된다. 일부 구현예에서, T 세포는 TRAC의 처음 엑손을 표적화하는 하나 이상의 가이드 서열을 사용해 CRISPR-Cas 시스템을 통해 생체외에서 편집될 수 있다 (참조: Liu et al., Cell Research 27:154-157 (2017). 일부 구현예에서, TRAC의 처음 엑손은 다른 적절한 유전자 변형 방법을 사용해 변형된다. 일부 구현예에서, 방법은 내생성 TCR (예를 들어, CAR cDNA에 이어서 자가-절단 P2A 펩티드를 코딩하는 공여자 서열 가짐)을 동시에 녹-아웃시키면서, TRAC 유전자좌로 CAR 또는 TCR을 코딩하는 외생성 유전자를 녹-인시키기 위한 다른 적절한 방법 또는 CRISPR을 사용하는 단계를 포함한다 (참조: Eyquem et al., Nature 543:113-117 (2017)). 일부 구현예에서, 외생성 유전자는 내생성 TCR 프로모터의 하류에 작동적으로 삽입된 프로모터없는 CAR-코딩 또는 TCR-코딩 서열을 포함한다.

일부 구현예에서, 방법은 조작된 세포, 예를 들어, 조작된 T 세포를 생체외에서, CRISPR-Cas 시스템을 통해 편집하여, HLA-I 단백질을 코딩하는 내생성 유전자를 녹-다운시켜서 편집된 세포, 예를 들어, 조작된 T 세포의 면역원성을 최소화시키는 단계를 포함한다. 일부 구현예에서, 조작된 T 세포는 베타-2 마이크로글로불린 (B2M) 유전자좌를 돌연변이시키기 위해 생체외에서 CRISPR-Cas 시스템을 통해 편집될 수 있다. 일부 구현예에서, 조작된 세포, 예를 들어, 조작된 T 세포는 B2M의 제1 엑손을 표적화하는 하나 이상의 가이드 서열을 사용해, 생체외에서, CRISPR-Cas 시스템을 통해 편집된다. B2M의 제1 엑손은 다른 적절한 변형 방법을 사용해 변형될 수 있다 (참조: Liu et al., Cell Research 27:154-157 (2017)). B2M의 제1 엑손은 또한 당업자가 이해하는, 다른 적절한 변형 방법을 사용해 변형될 수 있다. 일부 구현예에서, 방법은 내생성 B2M (예를 들어, CAR cDNA에 이어서 자가 절단성 P2A 펩티드를 코딩하는 공여자 서열 가짐)을 동시에 녹-아웃하면서, B2M 유전자좌에 CAR 또는 TCR을 코딩하는 외생성 유전자를 녹-인하기 위해 CRISPR-CaS 시스템을 사용하는 단계를 포함한다 (참조: Eyquem et al., Nature 543:113-117 (2017)). 이것은 또는 당업자가 이해하게 되는, 다른 적절한 변형 방법을 사용해 수행될 수 있다. 일부 구현예에서, 외생성 유전자는 내생성 B2M 프로모터의 하류에 작동적으로 삽입되는 프로모터없는 CAR-코딩 또는 TCR-코딩 서열을 포함한다.

일부 구현예에서, 방법은 외생성 CAR 또는 TCR에 의해 표적화되는 항원을 코딩하는 내생성 유전자를 녹-아웃 또는 녹-다운시키기 위해 생체외에서, CRISPR-Cas 시스템을 통해 조작된 세포, 예를 들어, 조작된 T 세포를 편집하는 단계를 포함한다. 이것은 또한 당업자가 이해하게 되는, 다른 적절한 변형 방법을 사용해 수행될 수 있다. 일부 구현예에서, 조작된 세포, 예컨대 조작된 T 세포는 인간 텔로머라제 역전사효소 (hTERT), 서비빈, MDM2 (mouse double minute 2 homolog), 시토크롬 P450 1B 1 (CYP1B), HER2/neu, 빌름스 종양 유전자 1 (WT1), 리빈, 알파페토단백질 (AFP), 암배아 항원 (CEA), 뮤신, 16 (MUC16), MUC1, 전립선-특이적 막 항원 (PSMA), p53 또는 사이클린 (DI)으로부터 선택되는 종양 항원의 발현을 녹-아웃 또는 녹-다운 시키기 위해 CRISPR-CaS 시스템을 통해 생체외에서 편집된다 (참조: 예를 들어, 국제 특허 출원 공개 번호 WO2016/011210). 이것은 또한 당업자가 이해하게 되는, 다른 적절한 변형 방법을 사용해 수행될 수 있다. 일부 구현예에서, 조작된 세포, 예컨대 조작된 T 세포는 B 세포 성숙화 항원 (BCMA), 경막 활성인자 및 CAML 상호작용자 (TACI), 또는 B-세포 활성 인자 수용체 (BAFF-R), CD38, CD138, CS-1, CD33, CD26, CD30, CD53, CD92, CD100, CD148, CD150, CD200, CD261, CD262, 또는 CD362으로부터 선택되는 항원의 발현을 녹-아웃 또는 녹-다운시키기 위해 CRISPR-Cas 시스템을 통해 생체외에서 편집된다 (참조: 예를 들어, 국제 특허 출원 공개 번호 WO2017/011804). 이것은 또한 당업자가 이해하게 되는 적절한 변형 방법을 사용해 수행될 수 있다.

유전자 드라이브

본 발명은 또한 하나 이상의 카고 폴리뉴클레오티드의 전달 또는 유전자 드라이버를 생산할 수 있는 하나 이상의 카고 폴리뉴클레오티드와 본 명세서의 다른 곳에 기술된 근육-특이적 표적화 모이어티를 함유하는 조성물 (조작된 AAV 캡시드 입자를 포함하지만, 이에 제한되지 않음)의 생산을 통해 유전자 드라이브를 생성시키기 위한, 본 명세서의 다른 곳에 기술된, 근육-특이적 표적화 모이어티를 함유하는 조성물, 이의 제제, 이의 세포, 벡터 시스템 등의 용도를 고려한다. 일부 구현예에서, 유전자 드라이브는 예를 들어, 국제 특허 출원 공개 번호 WO 2015/105928에 기술된 유전자 드라이브와 유사한 시스템에서, RNA-가이드 유전자 드라이브를 제공하기 위한, Cas-매개 RNA-가이드 유전자 드라이브, 예를 들어, Cas-일 수 있다. 이러한 종류의 시스템은 예를 들어, RNA-가이드 DNA 뉴클레아제 및 하나 이상의 가이드 RNA를 코딩하는 핵산 서열을 배선 세포에 도입시켜서, 진핵생물 배선 세포를 변경시키기 위한 방법을 제공한다. 가이드 RNA는 배선 세포의 게놈 DNA 상에서 하나 이상의 표적 위치에 상보적이도록 설계될 수 있다. RNA 가이드 DNA 뉴클레아제를 코딩하는 핵산 서열 및 가이드 RNA를 코딩하는 핵산 서열은 배열된 프로모터와, 측접 서열 사이에서 구성체에 제공될 수 있어서 배선 세포가 RNA 가이드 DNA 뉴클레아제 및 가이드 RNA를 측접 서열 사이에 역시 위치된 임의의 원하는 카고-코딩 서열과 함께 발현할 수 있다. 측접 서열은 전형적으로 선택된 표적 염색체 상의 상응하는 서열과 동일한 서열을 포함하게 되어서, 측접 서열은 구성체에 의해 코딩되는 서열과 함께 작용하여 상동성 재조합같은 기전을 통해 표적 절단 부위에서 게놈 DNA로 외래 핵산 구성체 서열의 삽입을 촉진시켜서, 배선 세포를 외래 핵산 서열에 대해 동형접합이게 만든다. 이러한 방식으로, 유전자-드라이브 시스템은 번식 개체군 전반에서 원하는 카고 유전자를 이입할 수 있다 (참조: 예를 들어, Gantz et al., 2015, Highly efficient Cas9-mediated gene drive for population modification of the malaria vector mosquito Anopheles stephensi, PNAS 2015, published ahead of print November 23, 2015, doi:10.1073/pnas.1521077112; Esvelt et al., 2014, Concerning RNA-guided gene drives for the alteration of wild populations eLife 2014;3:e03401). 선택된 구현예에서, 표적 서열은 게놈 내 소수의 잠재적 오프-표적 부위를 갖는 것이 선택될 수 있다. 다수 가이드 RNA를 사용하여, 표적 유전자좌 내 다수 부위 표적화는 절단 빈도를 증가시킬 수 있고 드라이브 내성 대립유전자의 진화를 방해할 수 있다. 절두된 가이드 RNA는 오프-표적 절단을 감소시킬 수 있다. 쌍형성된 닉카제는 단일 뉴클레아제 대신 사용되어, 특이성을 더 증가시킬 수 있다. 유전자 드라이브 구성체 (예컨대 유전자 드라이브 조작된 전달 시스템 구성체)는 예를 들어, 상동성 재조합 유전자를 활성화시키고/시키거나 비-상동성 말단-연결을 억제하기 위해서, 전사 조절인자를 코딩하는 카고 서열을 포함할 수 있다. 표적 부위는 필수 유전자 내에서 선택될 수 있어서, 비-상동성 말단-연결 사건은 드라이브-내성 대립유전자 생성보다는 치사율을 초래할 수 있다. 유전자 드라이브 구성체는 광범위 온도에서 광범위 숙주에서 기능하도록 조작될 수 있다 (Cho et al. 2013, Rapid and Tunable Control of Protein Stability in Caenorhabditis elegans Using a Small Molecule, PLoS ONE 8(8): e72393. doi:10.1371/journal.pone.0072393).

이식 및 이종이식

본 명세서의 다른 곳에 기술된 근육-특이적 모이어티를 함유하는 조성물, 이의 제제, 이의 세포, 벡터 시스템 등은 2명의 상이한 사람 (이식) 또는 종 (이종이식) 간에 이식을 위해서 카고 폴리뉴클레오티드를 전달하는데 사용되고/되거나 달리 관여될 수 있다. 유전자이식 동물의 생성을 위한 이러한 기술은 본 명세서의 다른 곳에 기술된다. 종간 이식 기술은 일반적으로 당분야에 공지된다. 예를 들어, RNA-가이드 DNA 뉴클레아제는 본 명세서에 기술된 조작된 AAV 캡시드 폴리뉴클레오티드, 벡터, 조작된 세포, 및/또는 조작된 AAV 캡시드 입자를 통해 사용하여 전달될 수 있고 예를 들어 인간 면역계에 의해 인식되는 에피토프를 코딩하는 유전자, 즉 이종항원 유전자의 발현을 파괴하여서, 이식을 위한 장기에서 (예를 들어, 생체외 (예를 들어, 채취 이후이지만 이식 전) 또는 생체내 (공여자 또는 수령자 내)에서), 동물, 예컨대 유전자이식 돼지 (예컨대 인간 헴 옥시게나제-1 유전자이식 돼지 품종)에서 선택된 유전자를 녹아웃, 녹다운 또는 파괴하는데 사용될 수 있다. 파괴를 위한 후보 돼지 유전자는 예를 들어 α(1,3)-갈락토실트랜스퍼라제 및 시티딘 모노포스페이트-N-아세틸뉴라민산 히드록실라제 유전자를 포함한다 (PCT 공개 번호 WO 2014/066505 참조). 또한, 내생성 레트로바이러스를 코딩하는 유전자, 예를 들어, 모든 돼지 내생성 레트로바이러스를 코딩하는 유전자가 파괴될 수 있다 (참조: Yang et al., 2015, Genome-wide inactivation of porcine endogenous retroviruses (PERVs), Science 27 November 2015: Vol. 350 no. 6264 pp. 1101-1104). 또한, RNA-가이드 DNA 뉴클레아제는 초급성 거부에 대한 보호를 개선시키기 위해서 이종이식 공여자 동물에서 추가 유전자, 예컨대 인간 CD55 유전자의 통합을 위한 부위를 표적화하는데 사용될 수 있다.

종간 이식 (예컨대, 인간 대 인간)인 경우, 본 명세서의 다른 곳에 기술된 근육-특이적 표적화 모이어티를 함유하는 조성물 (예를 들어, 본 명세서에 기술된 조작된 AAV 캡시드 시스템 분자, 벡터, 조작된 세포, 및/또는 조작된 전달입자)은 카고 폴리뉴클레오티드를 전달하는데 사용될 수 있고/하거나 이식하려는 조직을 변형시키는데 관여될 수 있다. 일부 구현예에서, 변형은 하나 이상의 HLA 항원 또는 다른 조직 유형 결정자를 변형시키는 것을 포함할 수 있어서, 수령자에 의한 거부 발생을 감소시키도록 면역원성 프로파일이 공여자에 대한 수령자의 면역원성 프로파일과 더 유사하거나 또는 동일하다. 관련 조직 유형 결정자는 당분야에 공지되어 있고 (예컨대 장기 일치를 결정하는데 사용되는 것들), 면역원성 프로파일 (조직 유형 결정자의 발현 서명으로 구성)을 결정하기 위한 기술은 일반적으로 당분야에 공지되어 있다.

일부 구현예에서, 공여자 (예컨대, 채취 전) 또는 수령자 (이식 후)는 이식된 세포, 조직, 및/또는 장기의 면역원성 프로파일을 변형시킬 수 있는 본 명세서의 다른 곳에 기술된 근육-특이적 표적화 모이어티를 포함하는 조성물, 이의 제제, 이의 세포, 벡터 시스템, 본 명세서에 기술된 조작된 AAV 캡시드 시스템 분자, 벡터, 조작된 세포, 및/또는 조작된 전달 입자를 수용할 수 있다. 일부 구현예에서, 이식된 세포, 조직, 및/또는 장기는 공여자로부터 채취될 수 있고, 예를 들어, 수령자에게 이식될 때 일부 특별한 특징을 갖도록 변형되거나, 또는 덜 면역원성이게 채취된 세포, 조직 및/또는 장기를 변형시킬 수 있는, 본 명세서의 다른 곳에 기술된 근육-특이적 표적화 모이어티를 함유하는 조성물, 이의 제제, 이의 세포, 벡터 시스템, 본 명세서에 기술된 조작된 AAV 캡시드 시스템 분자, 벡터, 조작된 세포, 및/또는 조작된 전달 입자가 채취된 세포, 조직, 및/도는 장기로 생체외에서 전달될 수 있다. 전달 후, 세포, 조직, 및/또는 장기는 공여자에게 이식될 수 있다.

유전적 또는 후생유전적 측면을 갖는 질환의 유전자 변형 및 치료

근육-특이적 표적화 모이어티를 함유하는 본 명세서에 기술된 조작된 전달시스템 분자, 벡터, 조작된 세포, 및/또는 조작된 전달입자는 유전자 또는 다른 폴리뉴클레오티드를 변형시키고/시키거나 유저적 및/또는 후생유전적 측면을 갖는 질환을 치료하는데 사용될 수 있다. 본 명세서의 다른 곳에 기술된 바와 같이, 카고 분자는 세포로 전달될 수 있고, 일부 구현예에서, 세포의 게놈에 통합될 수 있는 폴리뉴클레오티드일 수 있다. 일부 구현예에서, 카고 분자(들)는 하나 이상의 CRISPR-Cas 시스템 성분일 수 있다. 일부 구현예에서, CRISPR-Cas 성분은, 본 발명의 조성물 또는 이의 제제, 예컨대 본 명세서에 기술된 조작된 AAV 캡시드에 의해 전달될 때, 임의로 수령자 세포에서 발현될 수 있고, 세포 특이적 방식으로 수령자 세포의 게놈을 변형시키도록 작용할 수 있다. 일부 구현예에서, 본 명세서에 기술된 조작된 AAV 캡시드 입자 또는 다른 입자 및/또는 조성물에 의해 패키징되고 전달될 수 있는 카고 분자는 CRISPR-Cas에 의존하지 않는 방법을 통해서 게놈 변형을 촉진/매개할 수 있다. 이러한 비-CRISPR-Cas 게놈 변형 시스템은 당업자가 즉시 이해할 것이고 또한, 적어도 부분적으로 본 명세서의 다른 곳에 기술된다. 일부 구현예에서, 변형은 특이적 표적 서열에 존재한다. 다른 구현예에서, 변형은 게놈 전반에서 무작위적으로 나타나는 위치에 존재한다.

질환-연관 유전자 및 폴리뉴클레오티드 및 질환 특이 정보의 예는 월드 와이의 웹 상에서 입수가능한, McKusick-Nathans Institute of Genetic Medicine, Johns Hopkins University (Baltimore, Md.) 및 National Center for Biotechnology Information, National Library of Medicine (Bethesda, Md.)에서 입수할 수 있다. 임의의 이들은 본 명세서에 기술된 하나 이상의 방법을 통해서 치료하는데 적절할 수 있다. 일부 구현예에서, 질환은 근육 질환 또는 장애, 신경근 질환 또는 장애, 또는 심근병증이다. 일부 구현예에서, 질환 또는 장애는 하기 중 어느 하나 이상으로부터 선택된다:

(a) 자가 면역 질환;

(b) 암;

(c) 근이영양증;

(d) 신경근 질환;

(e) 당 또는 글리코겐 저장 질환;

(f) 확장된 반복 질환;

(g) 우성 음성 질환;

(h) 심근병증;

(i) 바이러스 질환;

(j) 조로증; 또는

(k) 이의 임의 조합.

일부 구현예에서, 확장된 반복 질환은 헌팅톤병, 근긴장성 이영양증, 또는 안면견갑상완근 이영양증 (FSHD)이다. 일부 구현예에서, 근이영양증은 뒤쉔 근이영양증, 벡커 근이영양증, 지대근 이영양증, 에머리 드레이푸스 근이영양증, 근긴장성 이영양증, 또는 FSHD이다. 일부 구현예에서, 근긴장성 이영양증은 1형 또는 2형이다. 일부 구현예에서, 심근병증은 확장성 심근병증, 비후생 심근병증, DMD-연관 심근병증, 또는 다논병이다. 일부 구현예에서, 당 또는 글리코겐 저장병은 MPS III형 질환 또는 폼페병이다. 일부 구현예에서, MPS III형 질환은 MPS IIIA형, IIIB형, IIIC형, 또는 IIID형이다. 일부 구현예에서, 신경근 질환은 샤르코-마리-투스병 또는 프리드라이히 운동실조이다.

보다 특히, 이들 유전자 및 경로에서의 돌연변이는 기능에 영향을 미치는 부적절한 양의 단백질 또는 부적절한 단백질의 생산을 초래할 수 있다. 유전자, 질환, 및 단백질의 추가 예는 2012년 12월 12일 출원된 미국 가출원 제61/736,527호로부터 참조하여 편입된다. 이러한 유전자, 단백질 및 경로는 CRISPR 복합체 또는 본 발명의 유전자 변형의 다른 방법의 표적 폴리뉴클레오티드일 수 있다. 질환-연관 및/또는 세포 기능-연관 유전자 및 폴리뉴클레오티드의 예는 표 4 및 5에 열거된다. 추가 예는 본 명세서의 다른 곳에 논의된다.

따라서, 또한 본 명세서는 본 명세서에 기술된 바와 같은 벡터를 세포에 전달하는 단계를 포함하는 본 명세서에 논의된 바와 같이 진핵생물 또는 원핵생물 세포 (시험관내, 즉 단리된 진핵생물 세포)에 하나 이상의 돌연변이를 유도하는 방법을 기술한다. 돌연변이(들)는 세포(들)의 표적 서열에 하나 이상의 뉴클레오티드의 도입, 결실 또는 치환을 포함할 수 있다. 일부 구현예에서, 돌연변이는 상기 세포(들)의 각 표적 서열에 1-75개 뉴클레오티드의 도입, 결실, 또는 치환을 포함할 수 있다. 돌연변이는 각 표적 서열에 1, 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 또는 75개 뉴클레오티드의 도입, 결실, 또는 치환을 포함할 수 있다. 돌연변이는 상기 세포(들)의 각 표적 서열에 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 또는 75개 뉴클레오티드의 도입, 결실, 또는 치환을 포함할 수 있다. 돌연변이는 상기 세포(들)의 각 표적 서열에 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 또는 75개 뉴클레오티드의 도입, 결실, 또는 치환을 포함할 수 있다. 돌연변이는 상기 세포(들)의 각 표적 서열에 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 또는 75개 뉴클레오티드의 도입, 결실, 또는 치환을 포함할 수 있다. 돌연변이는 상기 세포(들)의 각 표적 서열에 40, 45, 50, 75, 100, 200, 300, 400 또는 500개 뉴클레오티드의 도입, 결실, 또는 치환을 포함할 수 있다. 돌연변이는 상기 세포(들)의 각 표적 서열에 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, 2000, 2100, 2200, 2300, 2400, 2500, 2600, 2700, 2800, 2900, 3000, 3100, 3200, 3300, 3400, 3500, 3600, 3700, 3800, 3900, 4000, 4100, 4200, 4300, 4400, 4500, 4600, 4700, 4800, 4900, 5000, 5100, 5200, 5300, 5400, 5500, 5600, 5700, 5800, 5900, 6000, 6100, 6200, 6300, 6400, 6500, 6600, 6700, 6800, 6900, 7000, 7100, 7200, 7300, 7400, 7500, 7600, 7700, 7800, 7900, 8000, 8100, 8200, 8300, 8400, 8500, 8600, 8700, 8800, 8900, 9000, 9100, 9200, 9300, 9400, 9500, 9600, 9700, 9800, 또는 9900 내지 10000 뉴클레오티드의 도입, 결실, 또는 치환을 포함할 수 있다.

일부 구현예에서, 변형은 핵산 성분 (예를 들어, 가이드(들) RNA(들) 또는 sgRNA(들)), 예컨대 CRISPR-Cas 시스템에 의해 매개되는 것을 통해서 상기 세포(들)의 각 표적 서열에 뉴클레오티드의 도입, 결실, 또는 치환을 포함할 수 있다.

일부 구현예에서, 변형은 비 CRISPR-Cas 시스템 또는 기술을 통해서 상기 세포(들)의 표적 또는 무작위 서열에 뉴클레오티드의 도입, 결실, 또는 치환을 포함할 수 있다. 이러한 기술은 본 명세서의 다른 곳에 논의되고, 예컨대 조작된 세포 및 조작된 세포 및 유기체의 생성 방법에서 논의된다.

CRISPR-Cas 시스템을 사용할 때 독성 및 오프-표적 효과의 최소화를 위해서, 전달되는 Cas mRNA 및 가이드 RNA의 농도를 제어하는 것이 중요할 수 있다. Cas mRNA 및 가이드 RNA의 최적 농도는 세포 또는 비-인간 진핵생물 동물 모델에서 상이한 농도를 시험하고 심층 시퀀싱을 사용해 잠재적 오프-표적 게놈 유전자좌에서 변형의 정도를 분석하여 결정될 수 있다. 대안적으로 독성 및 오프-표적 효과의 수준을 최소화하기 위해서, Cas 닉카제 mRNA (예를 들어, D10A 돌연변이를 갖는 에스. 피오게네스 (S. pyogenes) Cas9-유사)는 관심 부위를 표적화하는 가이드 RNA 쌍과 함께 전달될 수 있다. 독성 및 오프-표적 효과를 최소화하기 위한 가이드 서열 및 전략은 국제 특허 출원 공개 번호 WO 2014/093622 (PCT/US2013/074667)에서 처럼, 또는 본 명세서에서 처럼 돌연변이를 통할 수 있다.

전형적으로, 내생성 CRISPR 시스템의 상화에서, CRISPR 복합체 (표적 서열과 혼성화하고 하나 이상의 Cas 단백질과 복합체 형성하는 가이드 서열 포함)의 형성은 표적 서열 내 또는 근처 (예를 들어, 그로부터 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 이상의 염기쌍 내)에서 하나 또는 양쪽 가닥의 절단을 야기한다. 이론에 국한하고 싶지 않지만, 야생형 tracr 서열의 전부 또는 일부 (예를 들어, 야생형 tracr 서열의 약 20, 26, 32, 45, 48, 54, 63, 67, 85 이상의 뉴클레오티드)를 포함할 수 있거나 또는 그로 이루어질 수 있는 tracr 서열은 또한 가이드 서열에 작동적으로 연결된 tracr 메이트 서열의 전부 또는 일부에 tracr 서열의 적어도 일부를 따라서 혼성화하여서, CRISPR 복합체의 일부를 형성할 수 있다.

일 구현예에서, 본 발명은 진핵생물 세포에서 표적 폴리뉴클레오티드를 변형시키는 방법을 제공한다. 일부 구현예에서, 방법은 대상체 및/또는 세포에 카고 분자로서 CRISPR-CaS 분자를 갖는 명세서에 기술된 조작된 세포 및/또는 본 명세서에 기술된 조작된 AAV 캡시드 입자를 전달하는 단계를 포함한다. 전달되는0 CRISPR-Cas 시스템 분자(들)는 복합체를 형성하여 표적 폴리뉴클레오티드에 결합하여서, 예를 들어, 상기 표적 폴리뉴클레오티드의 절단을 실행하여, 표적 폴리뉴클레오티드를 변형시키고, CRISPR 복합체는 상기 표적 폴리뉴클레오티드 내 표적 서열과 혼성화하는 가이드 서열과 복합체 형성하는 CRISPR 효소를 포함하고, 상기 가이드 서열은 tracr 메이트 서열에 언결되어서 이후 tracr 서열과 혼성화할 수 있다. 일부 구현예에서, 상기 절단은 상기 CRISPR 효소에 의해 표적 서열의 위치에 하나 또는 2개 가닥을 절단하는 것을 포함한다. 일부 구현예에서, 상기 절단은 표적 유전자의 감소된 전사를 야기한다. 일부 구현예에서, 방법은 외생성 주형 폴리뉴클레오티드와 상동성 재조합을 통해 상기 절단된 표적 폴리뉴클레오티드를 복구하는 단계를 더 포함하고, 상기 복구는 하나 이상의 뉴클레오티드 of 상기 표적 폴리뉴클레오티드의 하나 이상의 뉴클레오티드의 삽입, 결실, 또는 치환을 포함하는 돌연변이를 야기한다. 일부 구현예에서, 상기 돌연변이는 표적 서열을 포함하는 유전자로부터 발현되는 단백질에 하나 이상의 아미노산 변화를 야기한다. 일부 구현예에서, 방법은 하나 이상의 벡터를 상기 진핵생물 세포에 전달하는 단계를 더 포함하고, 하나 이상의 벡터는 CRISPR 효소를 포함하고, 하나 이상의 벡터는 tracr 메이트 서열에 연결된 가이드 서열, 및 tracr 서열 중 하나 이상의 발현을 구동한다. 일부 구현예에서, 상기 CRISPR 효소는 tracr 메이트 서열에 연결된 가이드 서열, 및 tracr 서열 중 하나 이상의 발현을 구동한다. 일부 구현예에서 이러한 CRISPR 효소는 대상체에서 진핵생물 세포에 전달된다. 일부 구현예에서, 상기 변형은 세포 배양되는 상기 진핵생물 세포에서 일어난다. 일부 구현예에서, 방법은 상기 변형 이전에 대상체로부터 상기 진핵생물 세포를 단리하는 단계를 포함한다. 일부 구현예에서, 방법은 상기 진핵생물 세포 및/또는 그로부터 유래된 세포를 상기 대상체에게 반환하는 단계를 더 포함한다. 일부 구현예에서, 단리된 세포는 단리된 세포에 하나 이상의 조작된 AAV 캡시드 입자의 전달 이후 대상체에게 반환될 수 있다. 일부 구현예에서, 단리된 세포는 본 명세서에 기술된 조작된 전달 시스템이 하나 이상의 분자를 단리된 세포에 전달한 이후에 대상체에게 반환될 수 있고, 따라서 이전에 기술된 바와 같은 단리된 세포를 조작된 세포로 만들 수 있다.

스크리닝 및 세포 선택

본 명세서에 기술된 조작된 AAV 캡시드 시스템 벡터, 조작된 세포, 및/또는 조작된 AAV 캡시드 입자는 스크리닝 어세이 및/또는 세포 선택 어세이에서 사용될 수 있다. 조작된 전달 시스템 벡터, 조작된 세포, 및/또는 조작된 AAV 캡시드 입자는 대상체 및/또는 세포에 전달될 수 있다. 일부 구현예에서, 세포는 진핵생물 세포이다. 세포는 시험관내, 생체외, 제자리, 또는 생체내에 존재할 수 있다. 본 명세서에 기술된 조작된 AAV 캡시드 시스템 분자s, 벡터, 조작된 세포, 및/또는 조작된 AAV 캡시드 입자는 그들이 전달되는 대상체 또는 세포에 외생성 분자 또는 화합물을 도입시킬 수 있다. 외생성 분자 또는 화합물의 존재는 세포 및/또는 이의 속성의 확인을 허용할 수 있도록 검출될 수 있다. 일부 구현예에서, 전달된 분자 또는 입자는 유전자 또는 다른 뉴클레오티드 변형 (예를 들어, 돌연변이, 유전자 또는 폴리뉴클레오티드 삽입 및/또는 결실 등)을 부여할 수 있다. 일부 구현예에서 뉴클레오티드 변형은 시퀀싱을 통해 세포에서 검출될 수 있다. 일부 구현예에서, 뉴클레오티드 변형은 세포의 검출, 확인, 및/또는 선택을 허용할 수 있는, 검출가능한 표현형 변화를 세포에서 야기하는 세포에 대한 생리적 및/또는 생물학적 변형을 야기할 수 있다. 일부 구현예에서, 표현형 변화는 세포 사멸일 수 있고, 이러한 구현예에서 표적 뉴클레오티드에 CRISPR 복합체의 결합은 세포 사멸을 야기한다. 본 발명의 구현예는 역-선택 시스템을 포함할 수 있는 2-단계 과정 또는 선택 마커를 요구하지 않는 특이적 세포의 선택을 허용한다. 세포(들)는 원핵생물 또는 진핵생물 세포일 수 있다.

일 구현예에서 본 발명은 하나 이상의 세포(들)에서 유전자에 하나 이상의 돌연변이를 도입시켜서 하나 이상의 세포(들)를 선택하는 방법을 제공하고, 방법은 본 명세서의 다른 곳에 기술된 하나 이상의 조작된 전달시스템 분자 또는 벡터를 포함할 수 있는 하나 이상의 벡터를 세포(들)에 도입시키는 단계로서, 하나 이상의 벡터는 CRISPR 효소를 포함할 수 있고/있거나, tracr 메이트 서열에 연결된 가이드 서열, tracr 서열, 및 편집 주형; 또는 세포 및/또는 이의 게놈에 삽입시키려는 다른 폴리뉴클레오티드 중 하나 이상의 발현을 구동시키고, 예를 들어, CRISPR 효소 및/또는 포함된 경우, 편집 주형에 의해 생체내에서 발현되고 그 안에서 발현된 것은 CRISPR 효소 절단을 없애는 하나 이상의 돌연변이를 포함하는 것인 단계; 선택하려는 세포(들)에서 표적 폴리뉴클레오티드와 편집 주형의 상동성 재조합을 허용하는 단계; CRISPR 복합체가 표적 폴리뉴클레오티드에 결합하여 상기 유전자 내 표적 뉴클레오티드의 절단을 실시하게 하는 단계로서, CRISPR 복합체는 (1) 표적 폴리뉴클레오티드 내 표적 서열과 혼성화하는 가이드 서열, 및 (2) tracr 서열와 혼성화하는 tracr 메이트 서열과 복합체 형성하는 CRISPR 효소를 포함하고, 표적 폴리뉴클레오티드에 CRISPR 복합체의 결합은 세포 사멸을 유도하여서, 하나 이상의 돌연변이가 도입된 하나 이상의 세포(들)를 선택할 수 있게 하는 단계를 포함한다. 바람직한 구현예에서, CRISPR 효소는 Cas 단백질이다. 본 발명의 다른 구현예에서 선택하려는 세포는 진핵생물 세포일 수 있다.

하나 이상의 CRISPR-CaS 시스템 분자를 세포에 전달하는 것을 포함하지만, 이에 제한되지 않는 조작된 AAV 캡시드 시스템 분자, 벡터, 조작된 세포, 및/또는 조작된 AAV 캡시드 입자를 포함하는 스크리닝 방법은 형광 제자리 혼성화 (FISH) 같은 검출 방법에서 사용될 수 있다. 일부 구현예에서, 촉매적으로 불활성인 CaS 단백질을 포함하는 조작된 CRISPR-Cas 시스템의 하나 이상의 성분은 본 명세서에 기술된 조작된 AAV 캡시드 시스템 분자, 조작된 세포, 및/또는 조작된 AAV 캡시드 입자를 통해 세포로 전달될 수 있고, FISH 방법에서 사용될 수 있다. CRISPR-Cas 시스템은 불활성화된 Cas 단백질 (dCas) (예를 들어, dCas9)을 포함할 수 있는데, 이것은 DNA 이중 가닥 파괴를 생산하는 능력이 결어되어, 마커, 예컨대 형광 단백질, 예컨대 증강 녹색 형광 단백질 (eEGFP)와 융합될 수 있고, 소형 가이드 RNA와 함께 발현되어서, 생체내에서 협동원체, 동원체 및 텔로미어 반복부를 표적화할 수 있다. dCas 시스템은 인간 게놈에서 개별 유전자 및 반복 서열을 가시화하는데 사용될 수 있다. 표지된 dCas, dCas CRISPR-Cas 시스템, 조작된 AAV 캡시드 시스템 분자, 조작된 세포, 및/또는 조작된 AAV 캡시드 입자의 이러한 새로운 적용은 특히 작은 핵 부피 또는 복잡한 3-D 구조의 경우에, 기능성 핵 아키텍처를 연구하고 세포를 이미지화하는데 사용될 수 있다 (Chen B, Gilbert LA, Cimini BA, Schnitzbauer J, Zhang W, Li GW, Park J, Blackburn EH, Weissman JS, Qi LS, Huang B. 2013. Dynamic imaging of genomic loci in living Human Cell by an optimized CRISPR/Cas system. Cell 155(7):1479-91. doi: 10.1016/j.cell.2013.12.001., 이의 교시는 본 명세서에 기술된 CRISPR 시스템에 적용 및/또는 개조될 수 있음). 마커 (예를 들어, 형광 마커)에 융합된 폴리뉴클레오티드를 포함한 유사한 접근법은 본 명세서에 기술된 조작된 AAV 캡시드 시스템 분자, 벡터, 조작된 세포, 및/또는 조작된 AAV 캡시드 입자를 통해서 세포에 전달될 수 있고 세포의 게놈에 통합될 수 있고/있거나, 달리 FISH 분석을 위해 세포의 게놈 영역과 상호작용할 수 있다.

다른 세포 소기관 및 다른 세포 구조를 연구하기 위한 유사한 접근법이 세포에 (예를 들어, 본 명세서에 기술된 조작된 전달AAV 캡시드 분자, 조작된 세포, 및/또는 조작된 AAV 캡시드 입자를 통해) 마커 (예를 들어, 형광 마커)에 융합된 하나 이상의 분자를 전달하여 수행될 수 있고, 마커에 융합된 분자는 하나 이상의 세포 구조를 표적화할 수 있다. 마커의 존재를 분석하여, 특별한 세포 구조를 확인 및/또는 이미지화할 수 있다.

일부 구현예에서, 조작된 AAV 캡시드 시스템 분자 및/또는 조작된 AAV 캡시드 입자는 세포의 내부 또는 외부에서 스크리닝 어세이에 사용될 수 있다. 일부 구현예에서, 스크리닝 어세이는 CRISPR-Cas 카고 분자(들)를 조작된 AAV 캡시드 입자를 통해 전달하는 단계를 포함할 수 있다.

스크리닝에서 본 시스템의 사용은 또한, 본 발명, 예를 들어, 기능 획득 스크린에 의해 제공된다. 유전자를 과발현시키도록 인공적으로 가해진 세포는 예를 들어, 음성 피드백 루프를 통해서, 시간 경과 동안 유전자를 하향 조절할 수 있다 (평형상태 재확립). 스크린을 시작함에 따라서, 비조절 유전자는 다시 감소될 수 있다. 다른 스크리닝 어세이가 본 명세서의 다른 곳에 논의된다.

일 구현예에서, 본 발명은 시험관내 전달 방법으로부터 또는 그의 세포를 제공하고, 방법은 전달 시스템을 세포, 임의로 진핵생물 세포와 접촉시켜서, 전달 시스템의 성분을 세포로 전달하는 단계, 및 임의로 접촉으로부터의 데이터 또는 결과를 수득하는 단계, 및 데이터 또는 결과를 전송하는 단계를 포함한다.

일 구현예에서, 본 발명은 시험관내 전달 방법으로부터 또는 그의 세포를 제공하고, 방법은 전달 시스템을 세포, 임의로 진핵생물 세포와 접촉시켜서, 전달 시스템의 성분을 세포로 전달하는 단계, 및 임의로 접촉으로부터의 데이터 또는 결과를 수득하는 단계, 및 데이터 또는 결과를 전송하는 단계를 포함하고, 세포 생산물은 전달 시스템과 접촉되지 않은 세포와 비교해 변경되고, 예를 들어, 세포의 야생형이 아니라 접촉에 대해서 변경된다. 일 구현예에서, 세포 생산물은 비-인간 또는 동물이다. 일부 구현예에서, 세포 생산물은 인간이다.

일부 구현예에서, 숙주 세포는 본 명세서에 기술된 하나 이상의 벡터에 의해 일시적으로 또는 비-일시적으로 형질감염된다. 일부 구현예에서, 세포는 임의로 그에 재도입시키려는 대상체에서 천연적으로 일어나는 바와 같이 형질감염된다. 일부 구현예에서, 형질감염된 세포가 대상체로부터 채취된다. 일부 구현예에서, 세포는 대상체로부터 채취된 세포, 예컨대 세포주로부터 수득되거나 또는 그로부터 유래된다. 조작된 AAV 캡시드 시스템, 조작된 AAV 캡시드 입자의 전달 기전 및 기술은 본 명세서이 다른 곳에 기술된다.

일부 구현예에서 조작된 AAV 캡시드 시스템 분자(들) 및/또는 조작된 AAV 캡시드 입자(들)를 숙주 세포에 직접 도입하는 것을 고려한다. 예를 들어, 조작된 AAV 캡시드 시스템 분자(들)는 조작된 AAV 캡시드 입자에 패키징하려는 하나 이상의 카고 분자와 함께 전달될 수 있다.

일부 구현예에서, 본 발명은 본 명세서에 개시된 임의의 벡터 전달 시스템에 따른 벡터를 도입시키는 단계를 포함하는 세포에서 조작된 GTA 입자에 패키징하려는 조작된 전달 분자 및 카고 분자를 발현하는 방법을 제공한다.

본 발명은 하기 실시예에서 더욱 설명되지만, 청구항에 기술된 본 발명의 범주를 제한하는 것이 아니다.

실시예

실시예 1 - mRNA 기반 검출 방법은 AAV 변이체의 선택을 위해 더 엄격하다.

도 1은 mRNA 생산을 야기하는, 아데노-연관 바이러스 (AAV) 형질도입 기전을 입증한다. 도 1에서 입증된 바와 같이, AAV 입자에 의한 세포의 기능적 형질도입은 mRNA 가닥의 생산을 야기할 수 있다. 비-기능적 형질도입은 바이러스 게놈이 DNA-기반 어세이를 사용해 검출가능하더라도 이러한 생산물을 생산하지 않는다. 따라서, 예를 들어, AAV에 의한 형질도입을 검출하기 위한 mRNA-기반 검출 어세이는 더 엄격할 수 있고 세포를 기능적으로 형질도입시킬 수 있는 바이러스 입자의 기능성에 관한 피드백을 제공할 수 있다. 도 2는 AAV 변이체의 mRNA-기반 선택이 DNA-기반 선택보다 더 엄격할 수 있다는 것을 입증할 수 있는 그래프를 도시한다. 바이러스 라이브러리는 CMV 프로모터의 제어 하에서 발현되었다.

실시예 2 - mRNA 기반 검출 방법은 캡시드 변이체 라이브러리로부터 AAV 캡시드 변이체를 검출하는데 사용될 수 있다.

도 3A-3B는 간에서 바이러스 라이브러리 및 벡터 게놈 DNA (도 3A) 및 mRNA (도 3B) 간 상관성을 입증할 수 있는 그래프를 도시한다. 도 4A-4F는 캡시드 변이체가 상이한 조직에서 확인된 mRNA 수준에서 발현된다는 것을 입증할 수 있는 그래프를 도시한다.

실시예 3 - 캡시드 mRNA 발현은 조직 특이적 프로모터에 의해 구동될 수 있다

도 5A-5C는 세포-유형 특이적 프로모터 (x-축에 표시)의 제어 하에서 상이한 조직에서 캡시드 mRNA 발현을 입증할 수 있는 그래프를 도시한다. CMV는 예시적인 항상성 프로모터로서 포함되었다. CK8은 근육-특이적 프로모터이다. MHCK7은 근육-특이적 프로모터이다. hSyn은 뉴런 특이적 프로모터이다.

실시예 4 - 캡시드 변이체 라이브러리 생성, 변이체 스크리닝, 및 변이체 확인

일반적으로, AAV 캡시드 라이브러리는 적절한 AAV 생산자 세포주에서 이전에 기술된 조작된 AAV 캡시드 폴리뉴클레오티드를 각각이 함유하는 조작된 캡시드 벡터를 발현시켜서 생성될 수 있다. 예를 들어, 도 8을 참조한다. 이것은 하나 이상의 바람직한 세포-특이적 조작된 AAV 캡시드 변이체를 함유할 수 있는 AAV 캡시드 라이브러리를 생성시킬 수 있다. 도 7은 야생형 AAV, 예를 들어, 특히 AAV9로 AAV 캡시드 변이체 라이브러리를 생성시키는 구현예, 특히 야생형 AAV, 예를 들어, AAV9의 무작위 n-량체 (n=3-15 아미노산)의 삽입을 입증하는 개략도를 도시한다. 이러한 예에서, 무작위 7-량체는 AAV9 바이러스 단백질의 가변 영역 VIII의 aa 588 내지 589에 삽입되었고 벡터 당 하나의 변이체를 갖는 벡터를 함유하는 바이러스 게놈을 형성시키는데 사용되었다. 도 8에 도시된 바와 같이, 캡시드 변이체 벡터 라이브러리는 각각의 캡시드 변이체가 벡터 게놈으로서 이의 코딩 서열을 캡슐화한 AAV 입자를 생성시키는데 사용되었다. 도 9는 AAV 캡시드 변이체 라이브러리를 생성시키기 위해 AAV 벡터 시스템에서 사용될 수 있는 대표적인 AAV 캡시드 플라스미드 라이브러리 벡터의 벡터 맵을 도시한다 (참조: 예를 들어, 도 8). 라이브러리는 조직 특이적 프로모터 또는 항상성 프로모터의 제어 하에서 캡시드 변이체 폴리뉴클레오티드를 사용해 생성시킬 수 있다. 라이브러리는 또한 폴리아데닐화 신호를 포함하는 캡시드 변이체 폴리뉴클레오티드를 사용해 만들었다.

도 6에 도시된 바와 같이, AAV 캡시드 라이브러리는 mRNA-기반 선택의 제1 라운드 동안 다양한 비-인간 동물에게 투여될 수 있다. 도 1에 도시된 바와 같이, AAV 및 관련 벡터에 의한 형질도입 과정은 세포를 형질도입시키는 바이러스의 게놈을 반영하는 mRNA 분자의 생산을 야기시킬 수 있다. 적어도 본 명세서의 실시예에서 입증한 바와 같이, mRNA 기반-선택은 바이러스 DNA의 존재를 측정하여 단지 세포 내 바이러스 입자의 존재를 검출하는 것과 반대로 생산된 기능성 생산물을 기반으로 하기 때문에 세포를 기능적으로 형질도입시킬 수 있는 바이러스 입자를 결정하는데 보다 특이적이고 효과적일 수 있다.

제1-라운드 투여 이후에, 바람직한 캡시드 변이체를 갖는 하나 이상의 조작된 AAV 바이러스 입자는 이후 여과된 AAV 캡시드 라이브러리를 형성시키는데 사용될 수 있다. 바람직한 AAV 바이러스 입자는 캡시드 변이체의 mRNA 발현을 측정하고 비-바람직한 세포 유형(들)과 비교하여 바람직한 세포 유형(들)에서 어떠한 변이체가 고도로 발현되는가를 결정하여 확인할 수 있다. 바람직한 세포, 조직, 및/또는 장기 유형에서 고도로 발현되는 것들은 바람직한 AAV 캡시드 변이체 입자이다. 일부 구현예에서, AAV 캡시드 변이체를 코딩하는 폴리뉴클레오티드는 바람직한 세포, 조직, 또는 장기에서 선택적 활성을 갖는 조직-특이적 프로모터의 제어 하에 있다.

제1 라운드로부터 확인된 조작된 AAV 캡시드 변이체 입자는 이후 다양한 비-인간 동물에 투여될 수 있다. 일부 구현예에서, 제2 라운드의 선택 및 확인에서 사용된 동물은 제1 라운드의 선택 및 확인에서 사용된 동물과 동일하지 않다. 라운드 1과 유사하게, 투여 후, 바람직한 세포, 조직, 및/또는 장기 유형(들)에서 상위 발현 변이체는 세포에서 바이러스 mRNA를 측정하여 확인할 수 있다. 라운드 2 이후 확인된 상위 변이체는 이후 임으로 바코드화될 수 있고 임의로 풀링될 수 있다. 일부 구현예에서, 제2 라운드로부터의 상위 변이체는 이어서 비-인간 영장류에 투여되어서 특히 상위 변이체에 대한 최종 사용자가 인간인 경우에, 상위 세포-특이적 변이체(들)를 확인할 수 있다. 각 라운드에서 투여는 전신일 수 있다.

도 10은 상이한 프로모터를 사용해 생성된 라이브러리에 의해 생산되는 바이러스 적정가 (AAV9 벡터 게놈/15 cm 디쉬로 계산됨)를 입증할 수 있는 그래프를 도시한다. 도 10에 입증된 바와 같이, 바이러스 적정가는 상이한 프로모터의 사용에 유의하게 영향을 미치지 않았다.

실시예 5- 근육-향성 증강된 myoAAV 캡시드

제1 및 제2 세대 근육 특이적 AAV 캡시드는 근육 특이적 프로모터를 사용해 개발되었고 최종 라이브러리는 본 명세서의 다른 곳 및/또는 미국 가출원 제62/899,453호, 제62/916, 207호, 및 제63/018,454호에 기술된 바와 같이 마우스 및 비-인간 영장류에서 스크리닝되었다. 제1 및 제2 세대 myoAAV 캡시드는 증강된 myoAAV 캡시드를 생성시키기 위해 이전에 기술된 바와 같이 마우스 및 비-인간 영장류에서 더욱 최적화되었다 (참조: 예를 들어, 도 11). 표 2 및 3은 증강된 근육 특이적 n-량체 모티프의 상위 히트 및 각 표에서 순위별 그들 코딩 서열을 도시한다. 도 12는 증강된 MyoAAV (eMyoAAV) 캡시드 변이체가 전신 전달 이후에 제1 세대 MyoAAV와 비교하여 마우스 근육을 보다 효과적으로 형질도입시킬 수 있다는 것을 입증할 수 있다.

도 13은 제1 및 제2 세대 myoAAV 캡시드 변이체가 인간 초대 근관의 형질도입을 위해 αVβ6 인테그린 이종이량체에 의존적이라는 것을 입증할 수 있다.

실시예 6 - 조작된 AAV 캡시드 및 근육 캡시드 변이체의 유도 진화

재조합 아데노-연관 바이러스 (rAAV)는 전임상 및 임상 연구에서 유전자 편집 및 생체내 유전자 치환 요법에 가장 일반적으로 사용되는 비히클이지만, 전신 전달 후 특이적 조직의 선택적 형질도입은 여전히 도전적이다. 천연 발생 캡시드를 사용해 생성된 재조합 AAV는 전신 주사 이후 간에서 우선적으로 격리된다. 이러한 격리는 다른 장기에서 형질도입의 효율을 제한하고 (Gao et al., 2006; Murrey et al., 2014; Zincarelli et al., 2008), 골격 근육으로 유전자 전달에 대한 특정 도전이 된다. 근육은 전체 체질량의 최대 40%를 포함하기 때문에, 천연 캡시드 변이체를 사용해 근육에서 치료적 한계치를 획득하는 것은 매우 높은 바이러스 용량 (약 2E+14 vg/kg) (Duan, 2018a, b)을 요구하고, 이것은 벡터 제조에 상당한 장애를 일으키고 일부 최근 임상 시험에서 관찰된 바와 같이 요법-제한적 독성을 유발할 수 있다 (Morales et al., 2020).　

생체내 선택와 커플링된 AAV 캡시드 단백질 조작은 다양한 조직에 강력한 유전자 전달을 할 수 있는 유망한 접근법이다. AAV 캡시드는 전신 투여 후 조직 향성을 정의하는 복합 3D 구조를 형성하도록 연합된 5개 VP1, 5개 VP2, 및 50개 VP3 서브유닛으로부터 조립된다. 캡시드 표면에 위치된 VP3 서브유닛에서의 단일 아미노산 변화가 상이한 조직에 대한 향성을 변경시킬 수 있다 (Pulicherla et al., 2011; Wu et al., 2006). 그러므로, AAV 캡시드 조작 전략은 전형적으로 다양한 캡시드 라이브러리의 생성에 이어서, 동물 모델에서 바람직한 향성을 갖는 변이체의 선택을 포함한다. 이러한 접근법은 마우스 망막 (Dalkara et al., 2013) 및 중추 및 말초 신경계 (Chan et al., 2017; Deverman et al., 2016)를 포함한, 다수 조직으로의 전달을 위해 최적화된 벡터를 생성시켰다.　

그럼에도 불구하고, 현행 캡시드 조작 접근법은 그들 선택 방법, 그들이 사용되는 동물 모델, 및 그들을 스크리닝할 수 있는 라이브러리의 다양성 관점에서 핵심적인 제약을 갖는다. AAV 형질도입은 세포 표면 상의 수용체에 결합, 세포내 수송, 엔도솜 탈출, 핵 진입, 벡터 게놈 제2 가닥 DNA 합성, 및 이식유전자 발현을 포함한 다단계 과정 ((Berry and Asokan, 2016; Ding et al., 2005), 도 21A)이고, 임의의 이들 단계의 비효율성은 벡터 역가를 제한할 수 있다. 그러므로, 강력한 캡시드의 성공적인 확인은 형질도입의 모든 단계에 걸쳐서 효과적으로 진행되는 변이체의 선택을 요구한다. AAV 형질도입에 관여되는 유전자의 발현 및 코딩 서열에서의 종- 및 계통-특이적 차이는 또 다른 도전이 존재하는데, 특별한 마우스 품종에서 선택된 캡시드 변이체는 다른 계통 또는 다른 종에서 강력한 형질도입을 일으킬 수 없다기 때문이다 (Hordeaux et al., 2018). 따라서, 상이한 계통 및 종에 걸쳐서 강력한 캡시드 변이체의 선택을 가능하게 하는 조작 접근법이 매우 요망된다.

이 실시예는 이들 도전을 해결하기 위해 DELIVER (Directed Evolution of AAV capsids Leveraging In Vivo Expression of Transgene RNA) 전략을 기술한다. DELIVER는 다양한 캡시드 라이브러리 세대를 엄격한 전사물-기반 생체내 선택과 조합하고 유도 진화에 이어서 임의의 관심 조직 및 임의의 동물 모델에서 강력한 캡시드 변이체의 확인을 가능하게 한다. 여기서, 마우스에서 근육-향성 캡시드의 개발을 위한 DELIVER의 유용성을 입증하고 결과는 뒤센 근이영양증 (DMD)에 대한 유전자 치환 시험 (임상 시험.gov 식별자: NCT03362502 및 NCT03368742)에서 현재 임상적으로 사용되는 천연 발생 AAV 캡시드, AAV9에 대해 전반적으로 비교된다. 전반적으로, 근육-지정 벡터는 골격근 및 심장 조직 둘 모두의 형질도입에 대해서 우수한 역가 및 선택성을 입증하여, AAV9와 비교했을 때 실질적으로 감소된 용량에서, 마우스 및 인간 근육 조직 둘 모두에 대해 보존된 감염성으로, 치료적 효능을 제공한다. 근육-농축 변이체 캡시드 서열의 교차-비교는 또한 상위 변이체 간에 공통 RGD 모티프를 확인하였고, 추가 분석은 RGD-결합 인테그린 이종이량체의 표적 세포 발현과의 강력한 상호작용, 및 그에 대한 의존성을 밝혔다. 종합하면, 이 실시예는 특히, 대안적인 조직 향성을 갖는 AAV의 추가 패밀리의 향후 진화를 위한 실험적 뼈대를 비롯하여, 횡문근에서 치료제 개발 및 시험을 위한 특정 유용성을 갖는 새로운 클래스의 캡시드 변이체를 입증한다.

결과

DELIVER를 사용한 AAV9 캡시드의 생체내 진화는 근육-향성 변이체의 클래스를 확인한다

라이브러리 디자인은 임의의 스크리닝 캠페인에 대한 성공의 중요한 결정자이다. 이 연구를 위해 설계된 AAV9-기반 캡시드 라이브러리는 생체내 사용을 위해 높은 역가로 근육-지정 벡터의 확인을 촉진하도록 몇몇 핵심 특성을 포함하였다. 첫째, 각 변이체는 AAV9 캡시드의 초가변 영역 VIII의 아미노산 588 내지 589에 삽입된 무작위 7-량체 펩티드를 포함하였고, 캡시드 표면 상에 가변 펩티드 서열의 발현을 보장하는 디자인이다 ((DiMattia et al., 2012), 도 14A). 각각의 변이체는 또한 편재성 또는 세포 유형 특이적 포유동물 프로모터의 제어 하에서 그 자신의 캡시드 서열을 코딩하는 이식유전자를 캡슐화하였고, 이것은 바이러스 라이브러리 생산에 사용된 HE293 세포 (도 14B) 및 생체내 전달 후 바이러스가 형질도입된 동물 조직 (도 14C-14D)에서 이식유전자 (캡시드 변이체)의 발현을 허용하였다.

별개 마우스 조직에 기능적으로 형질도입된 캡시드 변이체를 선택하기 위한 DELIVER의 엄격성은 캡시드 변이체가 편재성 CMV 프로모터 하에서 발현된 바이러스 라이브러리를 사용해, C57BL/6J 마우스에서 평가되었다. 다양한 조직에서 DNA mRNA 수준에서 바이러스 라이브러리에 대해 농축된 변이체를 확인하였다. mRNA 발현을 기반으로 변이체의 선택은 벡터 게놈 DNA의 존재를 기반으로 하는 선택과 비교하여 선택된 소수의 기능성 캡시드를 산출하였고 (도 21B-21G), 표적 세포로 물리적으로 들어가는 캡시드 변이체의 오직 작은 분획만이 이들 세포를 기능적으로 형질도입시켜서 그들이 코딩된 이식유전자를 발현하는 것을 시사한다. 이러한 발견과 일치하게, 주사된 바이러스 라이브러리에서 더 높은 존재비를 갖는 캡시드 변이체가 벡터 게놈 DNA 수준에서 주사된 동물의 간에서 더 높게 존재하였지만, 간에서 동일 변이체로부터의 이식유전자 mRNA 수준 및 바이러스 라이브러리 내 각 변이체의 존재비간에 상관성은 거의 없었다 (도 21H-21I).

다음으로 강력한 근육-향성 캡시드 변이체의 선택을 증강시키기 위해 근육-특이적 프로모터 사용의 실현가능성을 평가하였다. 골격 및 심장 근육은 몇몇 상이한 세포 유형을 함유하지만, 2개 세포 유형, 특히 근육 섬유 및 심근세포에 이식유전자를 효과적으로 전달할 수 있는 AAV 캡시드는 유전적 근병증에 대한 치료적 유전자 전달에 가장 바람직하다. 이들 세포 유형에서 생체내에서 특이적으로 발현되는 변이체의 선택을 가능하게 하기 위해서, 캡시드 코딩 서열의 발현이 근육-특이적 CK8 또는 MHCK7 프로모터에 의해 제어된 ITR-함유 구성체를 사용하여 HEK293 세포에서 AAV 캡시드 라이브러리를 생성시켰다. 이들 구성체는 편재성 CMV 프로모터 하에서 캡시드를 발현하는 구성체를 사용해 생성된 것과 유사한 rAAV의 역가를 생산하였다 (도 14B). 더 나아가서, 주사된 마우스의 골격 및 심장 근육 내에서, CK8 또는 MHCK7 프로모터 하에 발현된 바이러스 라이브러리는 CMV 하에 발현된 것과 비교하여 더 높은 이식유전자 mRNA 발현을 산출하였고, 근육 섬유 및 심근세포에 형질도입되는 기능성 변이체의 확인을 훨씬 촉진시켰다 (도 14C-14D).

유도 진화에 의한 생체내 선택의 2개 라운드를 수행하였고 C57BL/6J 마우스의 다수 상이한 근육에서 MHCK7 프로모터로부터 발현된 변이체를 스크리닝하였다. 이들 과정은 5,000,000 초과의 캡시드 변이체의 다양한 라이브러리를 사용해 출발하였고 7개 근육 (사두근, 전경골근, 비복근, 삼두근, 복근, 횡격막, 및 심장)에서 고도로 발현된 상위 30,000 변이체를 선택하였다 (도 14A 및 14E). 생체내 선택의 제2 라운드 경우, 2개 대조군이 도입되었다. 첫번째는 1차 스크린으로부터 각각 선택된 변이체에 대해 확인된 동일한 7-량체 삽입된 펩티드가 동의 DNA 코돈을 사용해 코딩된 동의 코돈 대조군이었다. 두번째는 중복 바이러스 라이브러리가 2개 골격근특이적 프로모터, CK8 또는 MHCK7 중 하나 하에서 변이체를 발현하도록 생성된 발현 대조군이었다 (도 14A). 도 14F는 상위에서 7-량체 삽입의 서열이 전사물-기반 선택의 제2 라운드 이후 마우스 근육에서 캡시드 변이체를 고도로 발현하였음을 보여준다. 각 그룹에서 동일한 색상의 변이체는 동의 DNA 코돈에 의해 코딩된다.

놀랍게도, 선택의 제2 라운드에서, CK8 또는 MHCK7 라이브러리로부터 근육에서 고도로 발현된 상위 캡시드의 12개 모두는 7-량체 삽입부의 처음 3개 아미노산 위치에 동일한 아르기닌-글리신-아스파르트산 (RGD) 모티프를 함유하였다. 근육의 그들의 우수한 형질도입에서 이들 캡시드 변이체에 포함된 특별한 펩티드 서열을 더욱 암시하여, CK8 그룹에서 상위 12개 히트 중 10개 및 MHCK7 그룹에서 상위 12개 히트 중 8개가 동의 쌍 유래였다 (즉, 동의 DNA 코돈에 의해 코딩된 상응하는 변이체가 또한 상위 12개 근육-발현 변이체 내에 있었음) (도 14F).

상위 5개 고유한 RGD-함유 캡시드 변이체를 사용해 생산된 rAAV의 역가는 생체내 연구를 위해 이들 조작된 캡시드를 사용하는 실현가능성을 평가하기 위해 정량되었다. rAAV 역가의 비교는 상위 5개 RGD-함유 캡시드 변이체 및 부모 AAV9 캡시드 간에 유의한 차이를 보이지 않았다 (도 22E). RGDLTTP 펩티드 삽입을 함유하는 변이체가 선택되었는데, 이는 또한 상위 12개 RGD-함유 히트로부터 각 위치에서 공통 아미노산과 일치하고, 추가 특징규명을 위해서 이 변이체를 "MyoAAV"로 명명하였다.

MyoAAV는 전신 투여 이후에 전례없는 효율로 마우스 근육에 형질도입된다

전신 전달 이후 상이한 마우스 조직에서 MyoAAV를 사용해 생성된 rAAV의 형질도입 프로파일 및 생체분포를 조사하기 위해서, 성체 C57BL/6J 마우스는 1E+12 vg (∼4E+13 vg/kg) AAV9- 또는 MyoAAV-CMV-EGFP가 주사되었고, 주사 후 2주 동안 상인한 조직에서 이식유전자 발현 및 벡터 게놈 존재비를 분석하였다. 채취된 조직의 전체 고정 형광 이미지화는 AAV9-주사된 마우스와 비교하여 MyoAAV가 주사된 마우스의 근육에서 훨씬 큰 형광 강도를 밝혀주었다 (도 15A 및 22A). 중요하게, MyoAAV는 많은 유전적 근병증에서 핵심적으로 발병되는 장기인, 심장에 AAV9에 비해서 훨씬 효과적으로 형질도입되었다. MyoAAV 주사된 마우스의 근육 섬유 및 심근세포에서 강력한 이식유전자 발현은 면역형광 분석을 통해 더욱 확정되었다 (도 15B 및 22B). 현저하게, MyoAAV는 C57BL/6J 마우스에서 전신 전달 후 간의 상대적으로 감소된 형질도입을 보여서, AAV9와 비교하여 이 변이체에 대한 간-탈표적화 형질도입 프로파일을 시사한다 (도 15A-15C).

상이한 골격근에서 EGFP mRNA의 정량은 AAV9-주사된 마우스와 비교하여 MyoAAV-주사된 마우스의 근육에서 10배 내지 25배 더 높은 이식유전자 발현을 밝혀주었다 (도 15C). EGFP mRNA 발현은 MyoAAV 주사된 동물의 심장에서 6.3배 더 높았고 간에서 2.8배 더 낮았다 (도 15C). 특히, MyoAAV에 의한 개선된 형질도입 효율은 횡문근 조직에 제한되었고, 이러한 조작된 캡시드 변이체는 AAV9와 비교하여 유사하거나 더 낮은 효율로 주사된 동물의 폐, 신장, 비장, 및 뇌에 형질도입되었다 (도 15C 및 22C). 생체분포 분석은 복근 근육을 제외하고 C57BL/6J 마우스의 모든 근육에 MyoAAV 전달된 벡터 게놈이 AAV9에 비해 더 효율적이었고, 전신 투여 이후 간에서 훨씬 낮은 수의 벡터 게놈을 생성시켰다는 것을 입증하였다 (도 22D).

다음으로 인간 골격근 형질도입에서 MyoAAV의 효율이 분석되었다. 4마리 상이한 공여자 (2명 남성 및 2명 여성)로부터의 인간 초대 근관은 시험관내에서 AAV9- 또는 MyoAAV-CK8-나노루시퍼라제 (Nluc)가 형질도입되었다. MyoAAV는 상이한 공여자로부터의 근관을 AAV9에 비해서 35배 내지 52배 더 효과적으로 형질도입시켰다 (도 15D). MyoAAV는 또한 AAV9와 비교하여 23배 더 높은 효율로 C57BL/6J 마우스로부터의 마우스 초대 근관에 형질도입되었다 (도 15D).

추가로, MyoAAV에 의한 근육 줄기 세포 (위성 세포) 형질도입의 효율은 6개월령 mdx-Ai9 마우스에서 정맥내 투여 후 평가되었다. 이들 디스트로핀-결핍 바우스는 인간 MDM에 대한 유전 모델이고, 추가로 Cre-코딩 AAV에 의한 형질도입을 위한 리포터로서 제고오디는, Cre-활성화가능 tdTomato 이식유전자를 보유한다. AAV8-, AAV9- 또는 MyoAAV-CMV-Cre 가 주사된 마우스의 근육으로부터의 위성 세포의 형광 활성화 세포 분류 (FACS)는 MyoAAV를 받은 동물에서 위성 세포의 훨씬 큰 비율의 형질도입을 보여주었다 (도 22F-22I).

MyoAAV의 전신 전달 후 생체내 유전자 발현의 동역학을 조사하기 위해서, 성체 BALB/cJ 마우스에게 4E+11 vg (∼1.6E+13 vg/kg) AAV8-, AAV9-, 또는 MyoAAV-CMV-반딧불이 루시퍼라제 (Fluc)를 주사하였고, 주사 후 120일 동안 상이한 시점에 전신 생체발광 이미지화를 수행하였다. MyoAAV를 받은 마우스는 AAV8 또는 AAV9를 주사받은 마우스와 비교하여 그들 신체 전반 및 그들 다리에서 이식유전자 발현의 유의하게 훨씬 높은 전체 수준 및 더 빠른 동역학을 보였다 (도 16A-16B 및 23A). 주사 후 4개월에 채취된 마우스의 근육으로부터 전체 장기 생체발광 이미지화는 MyoAAV 주사된 동물의 근육에서 극적으로 더 높은 루시퍼라제 발현을 확정하였다 (도16C-16D 및 23B). C57BL/6J와 반대로 Balb/cJ에서 수득된 이들 데이터는 추가로 전신 전달 후 MyoAAV에 의한 강력한 근육 형질도입이 상이한 마우스 계통에 걸쳐서 보존된다는 것을 추가로 입증하였다.

MyoAAV를 사용한 치료적 이식유전자의 전신 투여는 DMD 및 XLMTM의 마우스 모델에서 기능적 개선을 유도한다

치료적 이식유전자의 생체내 전달을 위해 MyoAAV 사용의 실현가능성을 조사하기 위해서, 성체 mdx 마우스 (Dmd 엑손 23에 넌센스 돌연변이를 보유하는 DMD의 마우스 모델)는 mdx 돌연변이의 5' 및 3'을 표적화하는 가이드 RNA (gRNA)와 함께 SaCas9를 코딩하는 구성체를 보유하는 AAV9 또는 MyoAAV가 주사되었다 (도 24A-24B). 이러한 CRISPR-Cas9-매개 접근법이 mdx 세포의 게놈으로부터 엑손 23의 절제 및 근육에서 디스트로핀 단백질의 절두형이지만 여전히 기능성인 형태의 발현을 일으켰다는 것이 이전에 확인되었다 (Nelson et al., 2016; Tabebordbar et al., 2016). 절두된 변이체를 생산하지만, 이러한 인-프레임 결실은 여전기 기능성 단백질을 만들어서, MDM에서 치료적 혜택을 제공한다.

MyoAAV-Dmd CRISPR은 상이한 mdx 근육에서 전체 Dmd mRNA의 3.4% 내지 25% 범위의 효율로 엑손 23-결실 Dmd mRNA의 생산을 일으켰다. 대조적으로, 동일 용량의 AAV9-Dmd CRISPR가 주사된 mdx 마우스의 근육에서 엑손 23-결실 mRNA의 생산의 효율은 단지 1.3% 내지 8.7% 범위였다 (도 17C). SaCas9 및 gRNA 발현의 정량은 AAV9 주사된 동물과 비교하여 MyoAAV 주사된 마우스의 근육에서 6.7 내지 19배 더 높은 SaCas9 발현 및 3.5 내지 7.8배 더 높은 gRNA 발현을 의미한다 (도 24C-24D).

몇몇 발견은 AAV9-Dmd CRISPR와 비교하여 MyoAAV-Dmd CRISPR에 의한 디스트로핀 발현의 우수한 구제를 강조한다. 면역형광 및 웨스턴 블롯 분석은 AAV9-Dmd CRISPR과 비교하여 MyoAAV-Dmd CRISPR이 주사된 마우스의 근육에서 더 크고 더 광범위한 디스트로핀 복원을 확인하였다 (도 17A-17B). AAV-CRISPR 처리된 동물의 전경골근 (TA) 근육의 생리적 평가는 비히클 또는 AAV9-Dmd CRISPR 주사된 대조군과 비교했을 때 MyoAAV-Dmd CRISPR 주사된 mdx 마우스에서 유의하게 더 높은 비력 (도 17D) 및 편심성 수축 후 감소된 비력 저하율 (도 17E)을 입증하였다. 따라서, MyoAAV는 통상적으로 광범위하게 사용되는 AAV9와 비교하여 근육에 치료적 유전자 편집 복합체의 전달에 대해 현저하게 증가된 역가를 보인다.

저용량 전신 투여 후 유전자 치환을 위한 MyoAAV의 성능은 X-연관 근관 근병증 (XLMTM)의 마우스 모델에서 평가되었다. Mtm1 녹아웃 (KO) 마우스는 XLMTM의 우수한 유전적 및 표현형적 모델을 제공하고; 그들은 두드러진 근육 소모, 운동성 상실을 보이고, 극적으로 단축된 수명을 보인다. 4주령 Mtm1 KO 마우스는 MHCK7 프로모터의 제어 하에 발현되는 인간 MTM1 (hMTM1) (MHCK7-hMTM1)를 코딩하는 2E+12 vg/kg의 AAV9 또는 MyoAAV가 주사되었다. 7개월 동안 각 그룹에 대한 체중, 헹덩, 및 생존을 측정하였다 (도 17F 및 24E). 이 실험에서 사용된 바이러스의 용량은 XLMTM에 대해 진행중인 인간 임상 시험 (임상 시험.gov 식별자: NCT03199469)에서 사용되는 용량에 비해서 50-150배 낮았고 XLMTM 유전자 요법에 대한 이전에 공개된 전임상 연구 (Childers et al., 2014; Elverman et al., 2017; Mack et al., 2017)에서 사용된 용량보다 15-250배 더 낮았다.

MyoAAV-MHCK7-hMTM1 주사된 마우스는 기능 및 생존에서 현저한 개선을 보였다. 2E+12vg/kg의 AAV9-MHCK7-hMTM1 이 주사된 모든 마우스는 최소로 활동적이었고 주사 후 11주 내지 21주 사이에 인도적 안락사 종료점에 도달하였다. 대조적으로, 동일 용량의 MyoAAV-MHCK7-hMTM1 이 주사된 모든 마우스는 야생형 마우스와 유사한 궤적으로 생존하였고, 또한 체중이 증량되었고 연구 전반에서AAV9-주사된 마우스와 비교하여 특히 더 활동적이었다 (도 17G-17K).

MyoAAV는 마우스 및 인간 초대 근관에 형질도입되기 위해 인테그린 이종이량체에 의조적이다

우리의 선택으로부터의 모든 다른 상위 변이체 및 MyoAAV의 RGD 모티프의 존재를 고려하면, MyoAAV 형질도입에서 RGD-결합 인테그린 이종이량체의 역할을 평가하였다. RGD 모티프는 이의 수용체에 대한 결합을 촉진하는 피브로넥틴의 최소 서열로서 1984년에 처음 인식되었고, 이후에 인테그린 이종이량체 α5β로서 확인되었다 (Pierschbacher and Ruoslahti, 1984; Pytela et al., 1985). RGD는 몇개 상이한 인테그린 이종이량체에 대한 인식 모티프로서 이후 확인되었다: 특히 αIIbβ, α5β1, α8β1, αVβ1, αVβ3, αVβ5, αVβ6, 및 αVβ8 (Ruoslahti, 1996). AAV9- 및 MyoAAV-CMV-Nluc의 형질도입은 이들 8종 인간 RGD-결합 인테그린 이종이량체의 각각을 과발현하는 HEK293 세포에서 비교하였다 (도 255A-25I). αIIbβ, α5β1, α8β1, αVβ1, αVβ3, αVβ6, 및 αVβ8의 과발현은 pUC19-형질감염 대조군과 비교하여 형질감염된 HEK293 세포에서 MyoAAV의 형질도입 효율을 증가시켰는데 반해서, AAV9 형질도입은 임의의 이들 인테그린 이종이량체의 과발현에 의해 증강되지 않았다 (도 18A).

다음으로, 세포 표면에 대한 MyoAAV 및 AAV9의 결합 효율에 대한 상이한 인테그린 이종이량체의 효과는 과발현 실험을 통해 평가되었다. 8종 RGD-결합 인테그린 이종이량체의 각각 또는 PUC19 대조군 플라스미드가 형질감염된 HEK293 세포의 표면에 결합된 벡터 게놈을 정량하였고, α8β1, αVβ6 및 더 적은 정도로 αVβ1은 pUC19-형질감염된 대조군과 비교하여 인테그린-형질감염된 세포에 대한, MyoAAV의 결합을 증가시켰지만, AAV9는 그렇지 않았다 (도 18B). 초대 세포에서 MyoAAV 형질도입 효율에 대한 2종의 상이한 범-αV 인테그린 길항제 (CWHM-12 및 GLPG-0187)의 영향을 또한 조사하였다. 양쪽 억제제는 마우스 (도 18C 및 26A) 및 인간 (도 18D 및 26B-26H) 초대 골격근 근관에서 용량-의존적 방식으로 MyoAAV 형질도입을 방해하였지만, 어떠한 억제제도 AAV9 형질도입 효율에 대해 용량-의존적 효과를 갖지 않았다. 이들 결과는 αV-함유 인테그린 이종이량체의 억제는 마우스 및 인간 초대 근관 둘 모두에 형질도입되는 MyoAAV의 능력을 거의 완전하게 제거한다는 것을 입증한다.

MyoAAV의 결합 친화성에 대한 개별 αV-함유 인테그린 이종이량체의 영향을 더욱 해명하기 위해서, 인간 초대 근관은 αVβ1, αVβ3, αVβ6, 및 αVβ8, 또는 말토스 결합 단백질 (MBP) 재조합 단백질과 이들 바이러스의 사전 인큐베이션 후에 MyoAAV 또는 AAV9가 형질도입되었다. 현저하게, 증가된 농도의 αVβ6와 MyoAAV의 사전인큐베이션은 인간 초대 근관의 형질도입의 용량-의존적 억제를 일으켰지만, 시험된 다른 재조합 단백질은 어떠한 것도 MyoAAV 또는 AAV9에 의한 세포의 형질도입에 용량-의존적 효과를 갖지 않았다 (도 18E-18F). 반대로, 항-αVβ6 항체의 능가된 농도와 인간 근간의 사전-인큐베이션은 용량-의존적 방식으로 MyoAAV에 의한 형질도입 효율을 감소시켰고 AAV9에 의한 근관의 형질도입에 영향을 미치지 않았다 (도 18G). 이들 데이터는 MyoAAV 형질도입을 촉진하는 능력을 갖는 αV-함유 인테그린 이종이량체 중에서 αV가 이러한 캡시드 변이체에 대해 최고 친화성을 갖는다는 것을 시사한다. 추가로, αVβ6은 이러한 캡시드 변이체에 대해 결합하는 최고 친화성을 갖는다. 추가로, αVβ6은 MyoAAV에 의한 그들 최적 형질도입이 가능하도록 인간 근육 세포의 표면 상에서 이용가능해야 한다.

이전에 확인된 AAV 수용체 (AAVR)에 대한 MyoAAV 형질도입의 의존성을 평가하였다. 이전에 확인된 AAV 수용체는 AAV4 및 AAVrh32.33을 제외하고 가장 알려진 AAV 혈청형의 효과적인 형질도입에 필요한 신속하게 세포내이입되는 원형질막 단백질이다 (Dudek et al., 2018; Pillay et al., 2016). HEK293FT AAVR 녹아웃 (KO) 및 부모 HEK293FT 야생형 (WT) 세포에 AAV4-, AAV2-, AAV9-, 또는 MyoAAV-CMV-Nluc를 형질도입시켰고, AAV2 및 AAV9와 유사하게, MyoAAV 형질도입은 AAVR 발현을 요구한다는 것을 발견하였다 (도 18H).

인테그린 이종이량체 및 AAVR가 MyoAAV 형질도입에서 중복 역할을 하는지 여부를 시험하기 위해서, α8β1, αVβ1, αVβ3, αVβ6, 또는 αVβ88을 AAV 과발현의 존재 또는 부재 하에서 HEK293FT AAVR KO 세포에서 과발현시킨 다음에 세포에 MyoAAV-CMV-Nluc를 형질도입시켰다. 이들 결과는 인테그린 이종이량체의 과발현이 모의 형질감염 대조군과 비교하여 MyoAAV 형질도입 효율을 AAVR KO 세포에서 증가시키지만, 인테그린 과발현은 AAV 과발현 AAVR KO 세포 또는 WT HEK293FT 세포에서 관찰된 수준까지 형질도입을 구제하기에 충분하지 않았다는 것을 입증하였다 (도 26I). 이들 결과는 인테그린 이종이량체 및 AAVR이 별개 역할을 하고 아마도 MyoAAV 형질도입의 상이한 단계에서 이용되는 듯 하다.

DELIVER를 사용한 생체내 진화의 추가 라운드는 제2 세대 RGD-함유 근육-향성 변이체를 생성시킨다

MyoAAV에 의한 근관의 형질도입에 대한 인테그린 이종이량체와 RGD 모티프의 상호작용의 중요성을 고려하면, 이론에 국한하지 않고, 모티프에 인접한 변형된 아미노산이 이러한 상호작용을 개선시킬 수 있고, 훨씬 더 강력한 근육-향성 캡시드 변이체를 생성시키는 것으로 여겨진다. MyoAAV 초가변 영역 VIII 표면 루프에 대한 예측 구조를 기반으로, RGD 모티프의 상류 위치 586, 587, 및 588 및 하류 위치 592, 593, 594, 및 595의 아미노산은 MyoAAV의 표면 루프에 위치할 가능성이 있는 거으로 확인되었다 (도 19A). 캡시드의 다양한 라이브러리를 생성시켰고, 각각은 위치 589, 590, 및 591에 고정된 RGD 모티프를 갖고, 상기 언급된 측점 위치에 다양한 아미노산이 존재한다 (도 19B).

DELIVER를 사용한 근육-향성 변이체에 대한 생체내 선택의 2개 라운드가 C57BL/6J 및 mdx 마우스에서 수행되었다. 제2 라운드 바이러스 라이브러리는 상이한 2개 용량 (마우스 당 1E+12 vg 및 1E+11 vg)이 주사되어서 고용량 및 저용량 둘 모두에서 근육 조직에 효과적으로 형질도입되는 변이체를 확인하였다 (도 19B). 우리는 이들 선택으로부터 우리의 상위 히트 중에서, 글리신 및 알라닌이 위치 588에 농축되고 글루타민은 위치 592에 농축된 것을 확인하였다. GPGRGDQTTL (SEQ ID NO: 2) 서열을 함유하는 변이체는 제2 라운드 선택으로부터 1E+12 및 1E+11 용량에서 가장 고도로 선택된 근육-향성 캡시드로서 출현되었다 (도19B). 이러한 제2 세대 변이체는 "증강된 MyoAAV" (EMyoAAV)로 명며오디었고 추가 특징규명에 사용되었다.

EMyoAAV의 형질도입 효율은 AAV9 및 MyoAAV와 비교하여 저용량 바이러스의 전신 전달 후 상이한 마우스 조직에서 평가되었다. C57BL/6J 마우스는 2E+11 vg (∼8E+12 vg/kg)의 AAV9-, MyoAAV-, 또는 EMyoAAV-CMV-EGFP가 주사되었고 다양한 조직에서 이식유전자 발현 및 벡터 게놈 생체분포를 분석하였다. 전체 조직 형광 이미지화는 EMyoAAV에 의한 전신 유전자 전달이 상이한 골격근 전반에서 MyoAAV 또는 AAV9와 비교하여 더 높은 수준의 이식유전자 발현을 일으켰다는 것을 입증하였다 (도 19C-19D). EGFP mRNA의 정량은 AAV0에 비해서 EMyoAAV가 마우스 골격근을 10-80배 더 효과적으로, 심장을 17배 더 효과적으로 형질도입한다는 것을 밝혀주었다. 또한, 이식유전자 mRNA 발현는 AAV9-주사된 마우스와 비교하여 EMyoAAV-주사된 동물의 간에서 2.5배 더 낮았다 (도 19E). 유사하게, 벡터 게놈 생체분포 분석은 EMyoAAV-주사된 마우스가 골격근 및 심장에서 이배체 게놈 당 유의하게 더 높은 벡터 게놈을 가졌고, AAV9-주사된 동물과 비교하여 간에서 이배체 게놈 당 유의하게 더 낮은 벡터 게놈을 가졌다는 것을 보여주었다 (도 27A).

인간 초대 근관을 형질도입시키는 EMyoAAV의 효율 및 인테그린 의존성을 다음에 분석하였다. 현저하게, EMyoAAV는 인간 초대 근관을 AAV9와 비교하여 128배 더 효과적으로 형질도입시켰고, MyoAAV에 비해서 4.1배 더 높았다 (도 19F). 증가 농도의 범-αV 인테그린 길항제 GLPG-0187는 EMyoAAV의 형질도입 효율에서 용량-의존적 감소를 일으켜서 (도 19G), EMyoAAV 감염도는 표적 세포 상에서 발현되는 αV-함유 인테그린 이종이량체에 의존적인 채로 남는다는 것을 확인하였다.

상이한 개별 αV 인테그린 이종이량체에 대한 EMyoAAV에 대한 결합 친화성을 평가하기 위해서, EMyoAAV 또는 AAV9는 인간 초대 근관을 형질도입하기 전에 αVβ1, αVβ3, αVβ6, αVβ8, 또는 말토스 결합 단백질 (MBP) 재조합 단백질과 사전 인큐베이션되었다. 흥미롭게도, MyoAAV를 사용한 이들 동일 어세이에서 수득된 결과 (도 18E)와 대조적으로, 시험된 모든 4개 αV-함유 인테그린 이종이량체는 용량-의존적 방식으로 EMyoAAV에 의한 인간 근관의 형질도입을 억제하였지만 (도 19H-19I), AAV9 형질도입에 대한 용량-의존적 효과가 존재하지 않았다. 이 결과는 EMyoAAV에 포함된 아미노산 치환은 αVβ6에 주로 의존하는, MyoAAV와 비교했을 때, αV 인테그린 이종이량체의 더 광범위한 클래스에 더 높은 친화성 결합을 가능하게 한다는 것을 시사한다.

DELIVER를 사용해 진화된 상위 제1 세대 및 제2 세대 캡시드 변이체의 αVβ6 이종이량체에 대한 의존성을 평가하였다. 인간 초대 근관은 상위 제1 세대 (RGDLTTP (SEQ ID NO: 12), RGDLSTP (SEQ ID NO: 8), RGDLNQY (SEQ ID NO: 9), RGDATEL (SEQ ID NO: 10), RGDTMSK (SEQ ID NO: 11)) 및 제2 세대 (GPGRGDQTTL (SEQ ID NO: 2), AEGRGDQYTR (SEQ ID NO: 3), ATGRGDLGQA (SEQ ID NO: 4), AVARGDQGLI (SEQ ID NO: 5), NISRGDQGYQ (SEQ ID NO: 6), APARGDQGSQ (SEQ ID NO: 7)) 변이체가 세포에 형질도입되기 전에 항-αVβ6 항체와 사전-인큐베이션되었다. 항체 결합이 모든 이들 변이체에 의해 어느 정도까지 인간 근관의 형질도입을 억제하였지만, 제1 세대 캡시드는 근관 형질도입에 대해 αVβ6에 유의하게 더 의존적이었다 (도 27B).

EMyoAAV는 저용량 바이러스의 주사 후 큰 치료적 잠재성을 보인다

마지막으로, 인간 신경근육 질환에 대해 현재 임상 시험 중인 캡시드와 비교하여 EMyoAAV의 치료적 관련성을 조사하였다. 특히, DMD 경우, AAV9 및 AAVrh74 둘 모두는 진행중인 임상 시험에서 조사 중이다 (임상 시험.gov 식별자: NCT03362502, NCT03368742, 및 NCT03769116). 근육-특이적 MHCK7 프로모터로부터 발현되고, AAVrh74 벡터를 사용해 전달되는, 기능-상보적 디스트로핀 미니-유전자 (마이크로디스트로핀이라고 함)의 전신 투여는 4명 DMD 환자를 포함한 현재 보고된 인간 임상 시험에서 유망한 결과를 보였다. 이러한 시험에서, 2E+14 vg/kg의 고바이러스 용량의 투여는 근육에서 이식유전자 발현 및 질환 표현형에서 기능적 개선을 일으켰다 (Mendell et al., 2020).

EMyoAAV-매개 유전자 전달은 AAVrh74 및 AAV9 벡터 둘 모두의 것과 비교하였고, DMD의 DBA-mdx 마우스 모델에서 성증을 더 조사하였다. 종적 생체내 이미지화 실험에서, 우리는 성체 BABL/cJ 마우스에세 저용량 (2E+11 vg, ∼8E+12 vg/kg을 의미)의 CMV-Fluc 리포터 유전자를 코딩하는 AAVrh74, AAV9, 또는 EMyoAAV를 주사하였다. EMyoAAV-주사된 마우스는 분석된 모든 시점에서 AAVrh74 또는 AAV9를 받은 것과 비교하여 전신 및 다리에서 극적으로 더 높은 생물형광 신호를 입증하였다 (도 19J-19K). 다음으로 마이크로디스트로핀 이식유전자 (CK8-마이크로디스트로핀-FLAG)를 보유하는 EMyoAAV 또는 AAV9를 동등한, 저용량 (2E+13 vg/kg)의 각 AAV를 사용해 DMD의 DBA-mdx 마우스 모델에 전신 전달하여 시험하였다. EMyoAAV-주사된 동물은 AAV9-주사된 동물과 비교하여 다수 근육 그룹에서, 근초에 위치된, 마이크로디스트로핀의 상대적으로 더 크고 더 광범위한 발현을 입증하였다 (도 20A). 웨스턴 블롯은 AAV9 주사된 동물과 비교하여 EMyoAAV가 주사된 마우스의 근육에서 더 높은 수준의 마이크로디스트로핀 단백질을 확인하였다 (도 20B). 정량적 RT-PCR은 AAV9-CK8-마이크로디스트로핀-FLAG와 비교하여 EMyoAAV-CK8-마이크로디스트로핀-FLAG가 주사된 마우스의 골격근에서 .6-15배 더 높은 수준의 마이크로디스트로핀 mRNA를 의미하였다 (도 20C).

이후에, EMyoAAV-주사된 마우스에서 벡터 게놈의 존재비 및 근육 기능은 AAV9-주사된 동물과 비교하여 평가하였다. EMyoAAV는 AAV9와 비교하여, DBA-mdx 마우스의 골격근에서 12-46배 더 높은 수의 이배체 게놈 당 벡터 게놈 및 간에서 2.5배 더 낮은 이배체 게놈 당 벡터 게놈을 전달하였다 (도 20D). 놀랍게도, AAV9-주사된 동물은 그들 근육과 비교하여 그들 간에서 40배 초과로 더 높은 수의 이배체 게놈 당 벡터 게놈을 가졌지만, EMyoAAV-주사된 마우스는 그들 간 및 근육에서 유사한 수준을 가졌다. 편심 손상 후 근 비력 및 비력 저하율의 정량은 EMyoAAV 주사된 DBA-mdx 마우스의 TA 근육이 유의하게 큰 비력을 회복하였고 동일 용량의 AAV9를 받은 마우스 및 비히클-주사된 동물의 근육과 비교하여 손상으로부터 훨씬 더 보호되었다는 것을 입증하였다 (도 20E-20F).

방법 상세 설명

구성체

AAV-CMV-EGFP를 생성하기 위해 사용된 플라스미드는 사이토메갈로바이러스 (CMV) 프로모터, EGFP 코딩 시퀀싱, 및 소 성장 호르몬 폴리아데닐화 신호 (bGH pA)를 pZac2.1 AAV 플라스미드 골격에 깁슨 조립을 사용해 클로닝하여 생성되었다. AAV-CMV-Nluc 및 AAV-CMV-Fluc를 생성시키는데 사용된 구성체는 pZac2.1-CMV-EGFP-bGH pA의 EGFP 코딩 서열을 각각 Nluc 및 Fluc 코딩 서열로 치환시켜서 생성되었다. pZac2.1 구성체는 University of Pennsylvania vector core에서 구매하였다. AAV-CMV-Cre 및 AAV-CRISPR 바이러스를 생성시키는데 사용된 플라스미드는 이전에 기술되었다 (Goldstein et al., 2019; Tabebordbar et al., 2016). 플라스미드 라이브러리 수령 플라스미드는 CMV, MHCK7 (Salva et al., 2007), 또는 CK8 (Bengtsson et al., 2017) 프로모터, AAV2 rep의 스플라이싱 서열 (보존된 스플라이스 도너 (Farris and Pintel, 2008)를 포함하도록 (Deverman et al., 2016)에 기술된 서열로부터 변형됨), Q486 및 Q588 바로 뒤에 BsmBI 제한효소 부위를 함유하는 AAV9 캡시드 코딩 서열, 및 SV40 폴리아데닐화 신호를 깁슨 조립을 사용해 pZac2.1 골격에 클로닝하여 생성되었다. 인테그린 단백질 및 AAVR을 코딩하는 구성체를 생성시키기 위해서, αV, α5, α8, αIIb, β1, β3, β5, β6, β8, 및 AAVR의 코딩 서열은 인간 골격근 cDNA로부터 증폭시켰다. 앰플리콘을 인간 신장 인자 1 알파 (EF1α) 프로모터의 하류 및 SV40 후기 폴리아데닐화 신호 서열의 상류에서 pUC57 골격에 깁슨 조립을 사용해 삽입시켰다. AAV-MHCK7-인간 MTM1을 생성시키는데 사용되는 플라스미드는 MHCK7 프로모터, pCI-neo 포유동물 발현 벡터 (Promega)로부터의 키메라 인트론, 인간 MTM1 코딩 서열, 및 bGH pA into the pZac2.1 AAV 플라스미드 골격을 깁슨 조립을 사용해 클로닝하여 생성되었다. pZac2.1-CK8-마이크로디스트로핀-FLAG는 CK8 프로모터, 5 반복 마이크로디스트로핀의 코딩 서열 (Hakim et al., 2017), FLAG 태그, 및 합성 폴리아데닐화 신호 (Levitt et al., 1989)를 pZac2.1 골격의 ITR 사이에 도입시켜서 클로닝되었다.

캡시드 라이브러리 생성

제1 라운드 선택을 위한 캡시드 라이브러리를 제조하기 위해서, 우리는 CMV 또는 MHCK7 프로모터를 함유하는 AAV 라이브러리 수령 플라스미드를 BsmBI으로 분해하였다. 우리는 lib-F (5'-GCAACATGGCTGTCCAGGGAAGAAACTACATACCTG-3' (SEQ ID NO: 769)) 및 NNK-R (5'-GTTTTGAACCCAGCCGGTCTGCGCCTGTGCMNNMNNMNNMNNMNNMNNMNNTTGGGCACTCTGGTGGTTTGTGGCC-3' (SEQ ID NO: 770)) 프라이머를 사용하고, 주형으로서 AAV9 캡시드 코딩 서열을 사용하여 무작위 7-량체를 코딩하는 단편을 증폭하였고 깁슨 조립을 사용해 이 단편을 분해된 라이브러리 수령 플라스미드에 도입시켰다. 제2 라운드 플라스미드 라이브러리를 생성시키기 위해서, Agilent에 의해서 합성된, 동의 DNA 코돈 복제물을 비롯하여, 제1 라운드에서 선택된 변이체를 코딩하는 올리고뉴클레오티드의 풀을 사용하였다. 올리고뉴클레오티드 라이브러리 풀을 NNK-R 프라이머 대신 사용하여 분해된 라이브러리 수령 플라스미드로 깁슨 조깁에 대한 앱플리콘을 생성시켰다. HEK293 세포는 형질감염 전 1일에 2 x10⁷ 세포/디쉬의 밀도로 15 cm 디쉬에 파종하였다. 각 플레이트는 16 ㎍의 pALDX-80 헬퍼 플라스미드 (Aldevron), 8 ㎍의 Rep-AAP 플라스미드 (Ben Deverman의 선물 (Deverman et al., 2016)), 8 ㎍의 pUC19 및 10 ng의 플라스미드 라이브러리가 PEI MAX (Polysciences)를 사용해 형질감염되었다. 캡시드 라이브러리를 세포 및 배지로부터 채취하였고, 이전에 기술된 바와 같이 이오딕사놀 구배를 사용한 초원심분리로 정제하였다 (Rosemary C Challis, 2018).

재조합 AAV 생산 및 정제

HEK293 세포는 15 cm 디쉬에 2 x10⁷ 세포/디쉬의 밀도로 도말되었다. 다음 날에, 각 플레이트는 16 ㎍의 pALDX-80 헬퍼 플라스미드 (Aldevron), 8 ㎍의 Rep/Cap 플라스미드, 및 8 ㎍의 ITR-함유 플라스미드로 PEI MAX (Polysciences)를 사용해 형질감염되었다. 재조합 바이러스를 세포 및 배지로부터 채취하였고, 이전에 기술된 바와 같이 이오딕사놀 구배를 사용한 초원심분리로 정제하였다 (Rosemary C Challis, 2018). AAV 적정가는 taqman-기반 qPCR로 정량하였다.

생체내 선택

C57BL/6J 마우스는 1E+12 vg의 캡시드 라이브러리가 주사되었다. 주사 후 2주에, 마우스는 PBS로 관류되었고 다수 골격근 (전경골근, 사두근, 비복근, 삼두근, 복근, 및 횡격막) 및 심장이 채취되었다. 전체 RNA 및 DNA를 조직으로부터 TRIzol 시약 (Thermo Fisher)을 사용해 추출하였다. mRNA는 올리고 dT 비드 (NEB)를 사용해 전체 RNA 샘플로부터 농축하였고 cDNA 합성은 SuperScript IV 역전사효소 (Thermo Fisher) 및 캡시드-특이적 프라이머 (5'-GAAAGTTGCCGTCCGTGTGAGG-3' (SEQ ID NO: 771))를 사용해 수행되었다. 캡시드 변이체 DNA 및 발현된 mRNA는 Q5 High Fidelity 2x 마스터 믹스를 사용해 7-량체 삽입부의 상류 (5'-ACAAGTGGCCACAAACCACCA-3' (SEQ ID NO: 772)) 및 하류 (5'-GGTTTTGAACCCAGCCGGTC-3' (SEQ ID NO: 773))에 결합하는 프라이머와, 각각 DNA 및 cDNA 샘플로부터 증폭되었다. Illumina 어댑터 및 고유한 인덱스 (NEB E7600S)를 함유하는 앰플리콘을 qubit을 사용해 정량하고, 등몰 비율로 풀링하고 Nextseq에서 시퀀싱하였다.

차세대 시퀀싱 데이터 분석 및 바이러스 라이브러리 디자인

Illumina 시퀀싱은 판독은 bcl2fastq2-v2.17.1을 사용해 탈다중화하였다. 최종 FASTQ 서열은 21 bp 변이체가 추출된, 가변 영역 주변 상응하는 구성체 서열에 직접 일치하는 것들만을 유지하도록 필터링되었다. 쌍형성 말단 시퀀싱 실행을 위해서, 변이체는 전방향 및 역방향 판독에 일관되는 변이체만을 유지하도록 더 필터링되었다. 변이체를 각 샘플에 대해 계측하였고 백만당 판독치 (RPM)으로서 심층 시퀀싱을 통해 정규화하였다. 추가 정규화가 또한 필요하면 변이체의 RPM을 일치하는 바이러스 라이브러리 샘플 중 동일 변이체의 RPM으로 나눠서 수행하였다. 추가 분석을 단순화하기 위해서, 10 미만의 판독치를 갖는 샘플 변이체는 향후 분석을 위해 폐기시켰다. 변이체는 바이러스 라이브러리 RPM로 나눈 샘플 RPM의 RPM 비율을 사용해 등급매겼고, 최고 채점 변이체는 제2 선택 라운드에서 사용하도록 확인하였다. 각각의 선택된 아미노산 변이체 경우에, 동의 DNA 코돈과 동일한 아미노산을 코딩하는 변이체는 대조군으로서 제2 라운드 라이브러리의 디자인에 포함되었다. 동의 변이체를 갖는 변이체 경우에 이미 시퀀싱 샘플에서 관찰되었고, 최고 채점 동의 변이체는 제2 라운드 디자인에 포함되었다. 시퀀싱 샘플 중에 비동의 형태 변이체 경우에, 동의 변이체는 각각의 가능한 본래 아미노산 서열의 코돈을 상이한 코돈으로 임의 추출하여 컴퓨터로 생성시켰고, 가능하면, 따라서 본래 DNA 서열을 최적으로 스크램블링하였다. 추가로, 바이러스 라이브러리 생산 동안 교차-패키징을 위해 제어를 위한 중지 코돈을 함유하는 무작위 변이체로 올리고의 5%를 디자인하였다. 디자인된 변이체를 사용한 제2 라운드 선택으로부터의 시퀀싱 데이터는 올리고 디자인 풀에 맞지 않는 변이체를 필터링해 버리는 추가 제한으로, 상기와 같이 처리하고 계측하였다.

엑손 스키핑, 이식유전자 발현, 및 벡터 게놈 정량

AAV-CRISPR 및 AAV-CMV-EGFP 실험을 위해서, RNA는 TRIzol (Thermo Fisher)을 사용해 조직 샘플로부터 추출하였다. AAV-CRISPR 및 마이크로디스트로핀 실험으로부터의 샘플 경우, 추출된 RNA는 Turbo DNase (Thermo Fisher)로 처리하였고, cDNA는 SuperScript IV VILO 마스터 믹스 (Thermo Fisher)를 사용해 만들었다. 엑손 4-5 접합부에 대한 taqman 어세이는 전체 Dmd 전사물의 정량에 사용되었고, 엑손 22-24 접합부에 대한 다른 어세이는 엑손23-결실 전사물의 정량에 사용되었다. 엑손 4-5 및 엑손 22-24 앰플리콘 각각에 대해서, 표준 곡선은 각 실행에서 taqman 어세이 표적 서열을 함유하는 gblock을 증폭시켜서 생성시켰다. Dmd 전사물 및 엑손 23-결실 전사물의 총량은 표준 곡선을 기반으로 정량하였다. 이들 샘플 중 SaCas9 및 gRNA 발현은 taqman 어세이를 사용해 정량하였다. 마우스 GAPDH mRNA는 SaCas9 및 gRNA 발현의 정량을 위해 하우스키핑 대조군으로서 사용되었다. 예를 들어, AAV-CMV-EGFP 실험으로부터, 추출된 RNA는 Turbo DNase (Thermo Fisher)를 처리하였고, cDNA는 SuperScript IV 역전사효소 (Thermo Fisher)와 올리고 dT 프라이머를 사용해 생성되었다. 마우스 베타 액틴 mRNA는 마이크로디스트로핀 발현의 정량을 위한 하우스키핑 대조군으로서 사용되었다. 마우스 GAPDH 및 베타 액틴 mRNA (하우스키핑 대조군)은 사전 디자인된 taqman 어세이를 사용해 각각 IDT로부터, Mm.PT.39a.1 및 Mm.PT.39a.22214843.g를 정량하였다. 벡터 게놈 정량 실험을 위해서, 총 DNA는 신속 DNA 추출 용액 (Lucigen)을 사용해 조직 샘플로부터 추출되었다. 이배체 게놈 당 벡터 게놈의 수는이식유전자 (EGFP 또는 마이크로두스트로핀) 또는 마우스 GAPDH DNA를 증폭하기 위해서 설계된 taqman 어세이를 사용하는 qPCR을 기반으로 정량되었다. 각 샘플 중 이식유전자 및 GAPDH 분자의 절대수는 각 실행에서 taqman 어세이 표적 서열의 상이한 양을 증폭시켜서 생성된 표준 곡선을 사용해 정량되었다.

시험관내 AAV 형질도입 및 결합 실험

인간 및 마우스 초대 근관은 인간 근모세포 및 마우스 위성 세포로부터 각각 분화되었다. 초대 인간 골격근 근모세포 (Lonza)는 SkGM-2 배지 (Lonza)에서 37℃, 5% CO2에서 유지되었다. 초대 마우스 위성 세포는 이전에 기술된 대로 C57BL/6J 마우스에서 단리하였고 (Cerletti et al., 2008) 마우스 근육 줄기 세포 성장 배지 (1% Glutamax (LifeTech), 1% 페니실린-스트렙토마이신 (LifeTech), 및 5 ng/ml bFGF (Sigma)를 함유하는 F10 (Gibco) 중 20% 공여자 말 혈청 (Atlanta Biologics))에서 6일 동안 확장시켰다. 인간 및 마우스 근모세포는 15,000 세포/웰의 밀도로 콜라겐 및 라미닌 (Thermo Fisher)이 코팅된 96-웰 플레이트 (Corning)에 파종되었다. 도말 후 24시간에, 배지를 2% 말 혈청 (Gibco)을 함유하는 DMEM (Gibco)로 교체하였고, 근모세포는 5E+3 vg/세포로 AAV9-, 또는 MyoAAV-Ck8-Nluc가 형질도입되기 전 4-6일에 근관으로 분화되었다. 인테그린 과발현 실험을 위해서, HEK293 세포는 5% 태아 소 혈청 (Gibco)을 함유하는 DMEM (Gibco)의 96-웰 플레이트에서 35,000 세포/웰로 파종되었다. 인테그린 과발현 실험 경우, 세포는 총 100 ng 플라스미드/웰에서 PEI MAX (Polysciences)를 사용하여 다음 날에 상이한 쌍의 인테그린 구성체가 형질감염되었다. 형질감염 후 72시간에, 세포는 1E+4 vg/세포의 AAV9- 또는 MyoAAV-CMV-Nluc가 형질도입되었다. 인테그린 과발현 및 형질도입 분석 실험 경우, Nano-Glo 루시퍼라제 어세이 시약 (Promega)을 플레이트의 배지 부피와 동량으로 첨가하였고, 발광은 형질도입 후 24시간에 SpectraMax L 마이크로플레이트 판독기에서 측정되었다. 인테그린 과발현 및 결합 분석 실험 경우, 세포를 냉각시켜서 세포내이입을 억제하였고, AAV9-, 또는 MyoAAV-Nluc를 형질감염 후 72시간에 1E+4 vg/세포로 세포에 첨가하였다. 세포는 얼음에서 30분 동안 유지시켰고 신속 DNA 추출 용액 (Lucigen)에 용해시키기 전에 PBS로 3회 세척하였다. 벡터 게놈 및 이배체 게놈는 Nluc 코딩 서열 및 인간 GAPDH 게놈 유전자좌를 표적화하는 어세이를 사용하여 taqman qPCR을 통해 정량되었다. AAVR 의존성 실험 경우, HEK293FT AAVR KO, 및 HEK293FT AAVR WT 세포는 96 웰 플레이트 (Corning)에서 35,000 세포/웰로 파종되었다. 다음 날, 세포에 AAV2-, AAV4-, AAV9-, 또는 MyoAAV-CMV-NLuc를 1E+3 vg/세포로 형질도입시켰다. AAVR 구제 실험 경우, HEK293FT AAVR KO 및 HEK293FT WT 세포는 33.3 ng의 각각의 인테그린 구성체 또는 pUC19 및 33.3 ng의 AAVR 구성체 또는 pUC19가 형질감염되었다. 총 100 ng 플라스미드 DNA가 형질감염 당 사용되었다. 형질감염 후 24시간에, 세포에 MyoAAV-CMV-Nluc를 1E+3 vg/세포로 형질도입시켰다. Nano-Glo 루시퍼라제 어세이 시약 (Promega)은 플레이트의 배지 부피와 동등한 부피로 형질도입 후 24시간에 첨가되었고, SpectraMax L 마이크로플레이트 판독기를 사용해 측정되었다.

소형 분자 및 항체 억제 실험

범-알파 V 인테그린 길항제 CWHM-12 및 GLPG0187 (MedChem Express), 또는 항-αVβ6 항체 (ab77906, abcam)는 명시된 농도로 2% 말 혈청을 함유하는 DMEM에 희석되었다. 배지는 분화된 근관으로부터 제거되었고, 희석된 억제제로 대체되었고, 이후 근관은 얼음에서 30분 동안 인큐베이션하여 세포내 이입을 억제하였다. 이러한 인큐베이션 이후에, AAV9-, MyoAAV-, or EMyoAAV-CK8-Nluc는 세포에 5E+3 vg/세포로 첨가되었고, 플레이트는 다시 조직 배양 인큐베이터로 옮겨졌다. 형질도입 후 24시간에, 루시퍼라제 강도는 Nano-Glo 루시퍼라제 어세이 (Promega)를 사용해 측정되었다.

재조합 단백질 억제 실험

인간 초대 골격근 근모세포 (Lonza)는 콜라겐 및 라미닌이 추가로 코팅된 96-웰 폴리-D-리신 코팅된 플레이트 상에서 2% 말 혈청 (Gibco) 존재의 DMEM에서 근관으로 분화되었다. MyoAAV-, AAV9-, 또는 EMyoAAV-CMV-Nluc는 재조합 가용성 인간 인테그린 이종이량체 αVβ1, αVβ3, αVβ6, αVβ8 (R&D 시스템s), 또는 말토스-결합 단백질 (Novus Biologicals)과 37℃에서 30분 동안 사전 인큐베이션되었다. 바이러스 및 단백질을 세포에 1E+4 g/세포로 첨가하였다. 세포는 루시퍼라제 강도를 Nano-Glo 루시퍼라제 어세이 (Promega)를 사용해 측정하기 전에 24시간 동안 37℃로 복귀시켰다.

마우스 및 AAV 주사

모든 동물 관리 및 실험 절차는 Broad Institute Institutional Animal Care and Use Committee (IACUC)를 비롯하여, Harvard University 및 Boston Children's hospital IACUC에 따랐다. 하기의 마우스를 Jackson laboratories에서 구매하였다: mdx (JAX, #001801), C57BL/6J (JAX, #000664), DBA/2J (JAX, 000671), DBA/2J-mdx (JAX, 013141), 및 BALB/cJ 마우스 (JAX, #000651). AAV-CMV-EGFP 실험을 위해, 8 주령 C57BL/6J 마우스는 1E+12 vg의 AAV9- 또는 MyoAAV-CMV-EGFP, 또는 2E+11 vg의 AAV9-, MyoAAV-, 또는 EMyoAAV-CMV-EGFP가 주사되었다. AAV-CRISPR 실험 경우, 8 주령 mdx 마우스는 4.5E+12 vg의 AAV9- 또는 MyoAAV-CMV-SaCas9 및 9E+12 vg의 AAV9- 또는 MyoAAV-gRNA가 주사되었다. 생체내 이미지화 실험 경우, 8 주령 BALB/cJ 마우스에게 4E+11 vg의 AAV8-, AAV9-, 또는 MyoAAV-CMV-Fluc, 또는 2E+11 vg의 AAVrh74-, AAV9-, 또는 EMyoAAV-CMV-Fluc가 주사되었다. 위성 세포 형질도입 실험 경우, 6 개월령 mdx;Ai9 마우스는 4E+11 vg의 AAV8-, AAV9-, 또는 MyoAAV-CMV-Cre가 주사되었다. MTM1 KO 마우스는 2E+12 vg/kg의 AAV9-, 또는 MyoAAV-MHCK7-hMTM1이 주사되었다. DBA/2J-mdx 마우스는 2E+13 vg/kg의 AAV9-, 또는 EMyoAAV-CK8-마이크로디스트로핀-FLAG가 주사되었다. 모든 주사는 안와후방으로 수행되었다.

마우스 활성 측정

활동계 (Harvard Apparatus)를 사용하여 격주로 각 마우스에 대해서 탄색활성의 수를 측정하였다. 각 마우스는 5분 동안 활동계 케이티에 배치되었고, 탐색 활동 수는 Actitrack 소프트웨어를 사용해 그 기간 동안 정량되었다. 자발적인 러닝휠 회전을 측정하기 위해서, 마우스는 5주령에 개별적으로 사육되었고, 그들 생애 전반에서 저-프로파일 무선 러닝 휠이 구비된 케이지에서 사육되었다 (Med Associates). 동물은 그들 러닝휠에 자유롭게 접근하였고 자발적으로 달릴 수 있었다. 각 휠의 회전수는 계속적으로 기록하였고, 데이터는 러닝휠이 청소되고 절절한 작동이 조사되었을 대 1주 1회 다운로드되었다. 데이터를 정규화하기 위해서, 각 주의 전체 활동은 시간 당 총 휠 회전수 평균으로 표시되었다.

면역형광

AAV-CMV-EGFP가 주사된 C67BL/6J 마우스로부터 채취된 조직 경우, 샘플은 1시간 동안 실온 (RT)에서 4% 파라포름알데히드 (PFA)로 고정하였고, 3회 DPBS로 세척하였다. 고정된 조직은 함침까지 4℃에 30%에 함침시켰고, O.C.T 화합물 (Tissue-Tek)에 포매하였고, 액체 질소-냉동 이소펜탄에 냉동시켰다. AAV-CRIPSR이 주사된 mdx 마우스로부터 채취된 근육은 절개 직후 액체 질소-냉동 이소펜탄에 냉동되었다. 조직은 12 ㎛ 두께로 CM1860 cryostat (Leica Biosciences)를 사용해 절제되었다. 조직 절편의 라미닌 및 디스트로핀 면역 염색은 이전에 기술된 대로 수행되었다 (Tabebordbar et al., 2016). 마이크로디스트로핀-FLAG 면역염색, 조직 절편은 디스트로핀 면역염색과 동일한 프로토콜을 사용해 토끼 항-FLAG 항체 (Sigma)로 염색되었다. 간 샘플의 렉틴 염색을 위해서, 조직 절편은 3 x 5분 PBST (PBS + 0.1% Tween-20)로 세척되었고, 10 ㎍/mL에 10분 동안 RT에서 Dylight 594 (Vector laboratories)로 표지된 리코페르시콘 에스쿨렌툼 (Lycopersicon Esculentum) (Tomato) 렉틴과 인큐베이션되었고, 3 x 5분 PBST로 세척되었고, Hoechst 33342 (Thermo Fisher)가 10 ㎍/mL로 5분 동안 염색되었고, 2 x 5분 PBST로 세척하고 DAPI없는 Vectashield antifade 고정 매체 (Vector Laboratories)에 고정시켰다. 시험관내 분화된 근관은 이전에 기술된 대로 미오신 중쇄 (MHC)으로 면역염색되었다 (Tabebordbar et al., 2016).

웨스턴 블롯

디스트로핀 웨스턴 블롯을 위해서, 단백질은 RIPA 완충액 (Cell signaling)을 사용해 근육 샘플로부터 추출되었다. 총 단백질 (25 ㎍)은 Tris-아세테이트 3-8% 염색 무함유 폴리아크릴아미드 겔 (Bio-Rad)를 사용한 전기영동으로 분리시키고 폴리비닐리덴 디플루오라이드 (PVDF) 막 (Biorad)으로 옮겼다. 각 겔의 처음 3개 레인 경우, 상이한 비율의 야생형 근육 단백질은 동일한 근육 유형으로부터의 mdx 단백질에 희석하여서 모든 레인에 대한 총 단백질량은 동일하였다 (25 ㎍). 막은 TBST (TBS+ 0.1% Tween-20) 중 5% 탈지유 (Biorad)로 1시간 동안 RT에서 차단하였다. 디스트로핀 및 GAPDH (로딩 대조군)은 디스트로핀 (1:100, Abcam, ab15277) 및 GAPDH (1:25000, Santa-Cruz Biotechnology sc-32233)에 대한 1차 항체에 이어서 염소 항-토끼 IgG HRP-연결 (1:5000, abcam ab97051) 또는 말 항-마우스 IgG HRP-연결 (1:5000, Cell Signaling 7076P2) 2차 항체로 각각 검출하였다. 디스트로핀 및 GAPDH의 매우 큰 크기 차이 및 상이한 전기영동 시간에 대한 요구사항으로 인해서, 동일한 단백질 샘플은 디스트로핀 및 GAPDH 블롯을 생성시키기 위해 2개의 Tris-아세테이트 3-8%에서 실행되었다. FluorChem E imaging 시스템 (단백질 Simple)을 사용하여서 Supersignal west Dura ECL 키트 (Thermo Fisher) 후에 화학발광을 검출하였다. 총 단백질 중 디스트로핀의 상대적 존재비는 Image J룰 사용해 계산된 디스트로핀 및 GAPDH 신호의 비율을 통해서 반 정량적으로 평가하였고 임의 단위 (A.U.)로 표시된다. 마이크로디스트로핀-FLAG 웨스턴 블롯 경우, AAV9 및 EMyoAAV 주사된 마우스의 전경골근, 사두근, 삼두근 및 심장으로부터의 조직 용해물 중 단백질 함량은 Pierce 660 nm 단백질 어세이 시약 (Thermo Fisher)을 사용해 측정되었다. 각 샘플로부터 20 ㎍의 총 단백질은 4-20% Criterion TGX 겔 (Bio-Rad) 상에서 SDS-PAGE를 통해 분획화하였고 제조사 설명서 (Bio-Rad)에 따라서 습식 전달 탱크 중 PVDF 막으로 옮겼다. 막은 TBST (10 mM Tris, pH 8.0, 150 mM NaCl, 1% Tween-20) 중 5% w/v 탈지유에서 1시간 동안 차단시켰고, 3회 10분 간 각각 TBST로 세척하였고, FLAG 태그 (Millipore F7425, 1:400) 또는 GAPDH (Santa Cruz sc-32233, 1:25,000)에 대한 1차 항체와 4℃에서 16시간 동안 인큐베이션되었다. 막을 3회 10분 각각 TBST로 세척하였고, 홀스래디쉬 퍼옥시다제-접합된 항-토끼 (Abcam b97051, 1:5000) 또는 항-마우스 (Cell Signaling 7076P2, 1:5000) 2차 항체와 1시간 동안 실온에서 인큐베이션되었다. 블롯은 3회 TBST로 세척되었고, SuperSignal West Pico PLUS 화학발광 기질 (Thermo Fisher)로 발색시켰고, CCD 이미저로 이미지화하였다.

인테그린 α8 및 αIIb 웨스턴 블롯 경우, 전체 세포 추출물은 pUC19, α8, 또는 αIIb 인테그린 단쇄를 과발현하는 HEK293 세포로부터 NP-40 용해 완충액r (150 mM NaCl, 50 mM Tris-HCl pH 7.5, 1% NP-40) 중 완충액으로 용해시키고 원심분리하여 세포 찌꺼기를 제거하여 제조되었다. 각 샘플로부터 2 ㎍의 전체 단백질을 4-20% Mini-PROTEAN TGX 겔 (Bio-Rad) 상에서 전기영동하고 PVDF 막으로 옮겼다. 막은 1시간 동안 TBST 중 5% w/v 탈지유로 차단하였고, 4℃에서 16시간 동안 인테그린 α8 (1:1000, Invitrogen MA5-31449), 인테그린 αIIb (1:5000, abcam ab134131), 또는 α-튜불린 (1:5000, abcam ab7291)에 대한 1차 항체와 인큐베이션하였다. 막을 3회 10분 동안 각각 TBST로 세척하였고, 1시간 동안 실온에서 홀스래디쉬 퍼옥시다제-접합된 항-마우스 또는 항-토끼 2차 항체의 1:10,000 희석물과 인큐베이션하였다. 블롯을 3회 TBST로 세척하였고, SuperSignal West Pico PLUS 화학발광 기질 (Thermo Fisher)로 발색시켰다. α8 블롯은 20초 노출 시간 및 α-튜불린 및 αIIb 부분에 대해서 각각 15분 동안 X-선 필름 상에서 이미지화시켰고,

유세포측정

pUC19 또는 인테그린 단쇄를 과발현하는 HEK293 세포는 5 mM EDTA를 함유하는 PBS에 채취하였고 3회 염색 완충액 (PBS 중 2% FBS)으로 세척하였다. 다음으로 세포는 1시간 동안 4℃에서 염색 완충액에 희석된 1차 항체로 염색하였다. 세포는 3회 염색 완충액으로 세척하였다. 인테그린 β8 항체로 염색된 샘플 경우, 세포는 30분 동안 4℃에서 염색 완충액에 희석된 PE-접합된 염소 항-마우스 IgG 2차 항체 (Invitrogen, 12-4010-82)와 인큐베이션되었다. 세포는 3회 세척되었고, 염색 완충액에 재현탁되었고, CytoFLEX S 유세포측정계 (Beckman)를 사용해 분석되었다. 유세포측정 데이터는 Flow Jo를 사용해 분석되었다.

마우스 위성 세포 단리, 배양, 및 분화

AAV-CMV-Cre가 주사된 mdx-Ai9 마우스로부터 위성 세포 단리는 이전에 기술된 대로 수행되었다 (Goldstein et al., 2019). 주사된 동물로부터 단리된 위성 세포는 위성 세포 성장 배지 (1% Glutamax (LifeTech), 1% 페니실린-스트렙토마이신 (LifeTech), 및 5 ng/ml bFGF (Sigma)를 함유하는 F10 (Gibco) 중 20% 공여자 말 혈청 (Atlanta Biologics)) 중에 콜라겐/라미닌-코팅된 플레이트에 파종되었다. 성장 배지는 격일로 교체되었다. 6일 후에, 위성 세포를 채취하였고, 세포수를 계측하였으며, 세포를 분화를 위해서 10,000 세포/웰의 밀도로 96웰 플레이트의 다수 웰에 재도말하였다. 다음 날에, 성장 배지는 분화 배지 (2% 공여자 말 혈청 (Atlanta Biologics) 함유 DMEM (GIBCO))로 교체되었다. 근관은 분화 시작 후 60시간에 4% PFA로 고정시켰다.

근육 생리학 분석

마우스는 이전에 기술된 대로 전경골근의 제자리 평가를 위해 제조되었다 (Tabebordbar et al., 2016). 20 내지 200 Hz 범위의 9개 상이한 자극 주파수에서 비력을 기록하였다. 최종 데이터는 P = P_min + ((P_max - P_min) / (1 + (K/f)^H)) 형식의 시그모이드 곡선을 통해 피팅되었고, 여기서 P는 자극 주파수 f에서 비력이고, P_min 은 최소 비력이고, P_max 는 최대 비력이고, K는 곡선의 변곡점에서 자극 주파수이고, H는 힐 계수 또는 기울기이다 (Chan et al., 2007). 매개변수 K는 변곡점에서 비력을 계산하는데 사용되었고, 이것은 중간 비력 또는 P_int라고 한다. 다음으로 TA는 일련의 5 등척성-편심성 수축을 겪고 손상에 대한 이의 감수성을 평가하였다 (100 ms 고정-말단 수축에 이어서 즉시 4 섬유 길이/s에서 활성 연장부터 1.2 섬유 길이의 최종 길이까지). 시리즈는 등척성 수축으로 분류되어서 등척성 힘의 손실은 프로토콜 전 및 프로토콜 후 힘 간 상대적 차이로서 정량되었다. 섬유 길이 및 TA 단면적은 이전에 기술된 대로 계산되었다 (Tabebordbar et al., 2016).

생물발광 이미지화

마우스는 150 mg/kg의 D-루시페린 (Goldbio)이 주사되었고 이미지화 전에 이소플루란으로 마취시켰다. 생물발광 이미지는 25분 동안 2분 당 1개 이미지의 속도로 D-루시페린 주사 후 5분에 획득하였다. 전체 및 평균 광도는 Living Image 4.7.3 소프트웨어 (PerkinElmer)를 사용해 동일 크기의 관심 영역 (ROI)에서 측정하였다. 이미지화 시간 동안 최고 포착된 광도는 동역학 곡선의 피크로서 결정되었고 분석에 선택되었다. 해부된 근육으로부터 광도를 측정하기 위해서, 마우스는 D-루시페린 주사 이후 12분에 안락사되었다. 해부된 근육은 페트리 디쉬에 배치시킨 다음에 IVIS Spectrum을 사용해 생물발광 이미지화하였다.

참조문헌

실시예 7 - 종에 걸쳐서 강력한 근육-유도 유전자 전달을 할 수 있는 조작된 AAV 캡시드 변이체의 클래스의 유도 진화

재조합 아데노-연관 바이러스 (rAAV)는 전임상 및 임상 연구 중이 유전자 편집 및 생체내 유전자 치환 요법을 위해 가장 일반적으로 사용되는 비히클이지만, 전신 전달 후 특이적 조직의 선택적 형질도입은 여전히 도전으로 남아있다. 천연 발생 캡시드를 사용해 생성된 재조합 AAV는 전신 주사 후 간에 주로 격리된다. 이러한 격리는 다른 장기에서 형질도입의 효율을 제한하고 ((Gao et al., 2006; Murrey et al., 2014; Zincarelli et al., 2008), 골격 근육으로 유전자 전달에 특히 문제를 제기한다. 근육은 전체 체질량의 최대 40%를 포함하기 때문에 천연 캡시드 변이체로 근육에서 치료적 한계치를 달성하려면 극도로 높은 바이러스 용량 (∼2E+14 vg/kg) (Duan, 2018)을 요구하여서, 일부 최근 임상 시험에서 관찰된 바와 같이 치료 제한 독성을 유발할 수 있다 (Morales et al., 2020).　

생체내 선택과 결합된 AAV 캡시드 단백질 조작은 다양한 조직으로 강력한 유전자 전달을 가능하게 하는 유망한 접근법이다. AAV 캡시드 유도 진화 전략은 일반적으로 다양한 방법으로 다양한 캡시드 라이브러리를 생성한 다음 동물 모델에서 원하는 향성을 가진 변이체를 선택하는 것을 포함한다. 이 접근법은 여러 조직에 전달하기 위해 최적화된 벡터를 생성하였다 (Choudhury et al., 2016; Dalkara et al., 2013; Deverman et al., 2016; Korbelin et al., 2016; Li et al., 2016; Michelfelder et al., 2009; Tse et al., 2017; Yang et al., 2009; Yang and Xiao, 2013).

AAV 형질도입은 세포 표면 상의 수용체에 결합, 세포내 수송, 엔도솜 탈출, 핵 진입, 벡터 게놈 제2 가닥 DNA 합성, 및 이식유전자 발현을 포함한 다단계 과정 ((Berry and Asokan, 2016; Ding et al., 2005), 도 S1A)이고, 임의의 이들 단계의 비효율성은 벡터 역가를 제한할 수 있다. 그러므로, 강력한 캡시드의 성공적인 확인은 형질도입의 모든 단계에 걸쳐서 효과적으로 진행되는 변이체의 선택을 요구한다. 그러나, 생체내 캡시드 유도 진화 전략의 대부분은 관심 조직에서 이식유전자 mRNA가 아닌, 벡터 게놈 DNA의 존재를 기반으로 성공적인 캡시드 변이체를 선택한다 (Li and Samulski, 2020). AAV 형질도입에 관여되는 유전자의 발현 및 코딩 서열에서의 종- 및 계통-특이적 차이는 또 다른 도전이 존재하는데, 특별한 마우스 품종에서 선택된 캡시드 변이체는 다른 계통 또는 다른 종에서 강력한 형질도입을 일으킬 수 없다기 때문이다 (Hordeaux et al., 2018). 따라서, 상이한 계통 및 종에 걸쳐서 기능성 캡시드 변이체의 엄격한 선택을 가능하게 하는 유도 진화 접근법이 매우 적용가능하고 필요하다.

이 실시예는 다양한 캡시드 라이브러리 세대를 엄격한 전사물-기반 생체내 선택과 조합하고 유도 진화에 이어서 관심 임의 조직 및 임의 동물 모델에서 기능성 캡시드 변이체의 확인을 가능하게 하는 적어도 DELIVER (Directed Evolution of AAV capsids Leveraging In Vivo Expression of transgene RNA) 전략 전략을 기술하고 입증한다. 이 실시예는 마우스 및 비-인간 영장류에서 근육-향성 캡시드를 개발하기 위한 DELIVER의 유용성을 입증하고 뒤센 근이영양증 (DMD)에 대한 유전자 치환 시험 (임상 시험.gov 식별자: NCT03362502, NCT03368742, NCT03375164, 및 NCT03769116)에서 임상적으로 현재 사용되는, 천연-발생 AAV 캡시드, AAVrh74 및 AAV9에 대해 우리 결과를 비교한다. 전체적으로 이러한 근육-지정 벡터는 골격근과 심장 조직 모두의 형질도입에 대해 우수한 역가 및 선택성을 입증하여, AAV9와 비교할 때 실질적으로 감소된 용량에서 치료 효능을 제공하고, 마우스, NHP 및 인간 근육 세포에 걸쳐 보존된 형질도입 효능을 제공한다. 마우스 및 NHP에서 근육-농축 변이체 캡시드 서열의 교차-비교는 상위 변이체 중에서 공통 RGD 모티프를 확인하였고, 추가 분석은 RGD-결합 인테그린 이종이량체의 표적 세포 발현과 강력한 상호작용, 및 그에 대한 의존성을 밝혔다. 종합하면, 이 작업은 이 실시예는 특히, 대안적인 조직 향성을 갖는 AAV의 추가 패밀리의 향후 진화를 위한 실험적 뼈대를 비롯하여, 횡문근에서 치료제 개발 및 시험을 위한 특정 유용성을 갖는 새로운 클래스의 캡시드 변이체를 제공한다.

결과

DELIVER를 사용한 AAV9 캡시드의 생체내 진화는 근육-향성 변이체의 클래스를 확인한다

이 연구를 위해 설계된 AAV9-기반 캡시드 라이브러리는 생체내 사용을 위한 고역가의 근육-지정 벡터의 확인을 촉진하기 위해 몇개 핵심 특성을 포함하였다. 첫째로, 각각의 변이체는 AAV9 캡시드의 초가변 영역 VIII에 아미노산 588 내지 589 사이에 삽입된 무작위 7-량체 펩티드를 포함하였고, 캡시드 표면 상의 가변 펩티드 서열의 농출을 보장하는 디자인이다 ((Borner et al., 2020; DiMattia et al., 2012)), 도 14A). 각각의 변이체는 또한 바이러스 라이브러리 생산을 위해 사용되는 HEK293 세포 (도 14B) 및 생체내 전달 후 바이러스가 형질도입된 동물 조직 (도 14C-14D)에서 이식유전자 (캡시드 변이체)의 발현을 허용하는, 편재성 또는 세포 유형 특이적 포유동물 프로모터의 제어 하에서 그 자신의 캡시드 서열을 코딩하는 이식유전자를 캡슐화한다.

별개의 마우스 조직을 기능적으로 형질도입하는 캡시드 변이체를 선택하기 위한 DELIVER의 엄격성은 캡시드 변이체가 편재성 CMV 프로모터 하에서 발현되는 바이러스 라이브러리를 사용하여 C57BL/6J 마우스에서 초기에 평가되었다. 다양한 조직에서 DNA 및 mRNA 수준에서 바이러스 라이브러리에 비해 풍부한 변이체가 확인되었다. mRNA 발현 기반 변이체의 선택은 벡터 게놈 DNA의 존재에 기초한 선택과 비교하여 소수의 기능성 캡시드를 선택을 일으켜서 (도 21A-21G), 물리적으로 표적 세포에 들어가는 캡시드 변이체의 작은 분획만이 이들 세포에 기능적으로 형질도입되어서, 그들이 코딩하는 이식유전자를 발현할 수 있음을 시사한다. 이러한 발견과 일관되게, 조사된 바이러스 라이브러리에서 더 높은 존재비의 캡시드 라이브러리는 벡터 게놈 DNA 수준에서 주사된 동물의 간에서 보다 높게 존재하지만, 바이러스 라이브러리 내 각 변이체의 존재비 및 간에서 동일 변이체로부터의 이식유전자 mRNA 수준 간에 상관성은 거의 없었다 (도 21H-21I).

다음으로, 강력한 근육-향성 캡시드 변이체에 대한 선택을 증강시키기 위한 근육-특이적 프로모터 사용의 실현가능성을 평가하였다. 골격 및 심장 근육은 몇몇 상이한 세포 유형을 함유하지만, 2개 세포 유형, 특히 근육 섬유 및 심근세포로 효과적인 이식유전자 전달을 할 수 있는 AAV 캡시드는 유전적 근병증에 대한 치료적 유전자 전달에 가장 바람직하다. 이들 세포 유형에서 생체내에서 특이적으로 발현된 변이체를 선택할 수 있도록, 캡시드 코딩 서열의 발현이 근육-특이적 CK8 또는 MHCK7 프로모터에 의해 제어된 ITR-함유 구성체를 사용해 HEK293 세포에서 AAV 캡시드 라이브러리를 생성시켰다. 이들 구성체는 편재성 CMV 프로모터 하에서 캡시드를 발현하는 구성체를 사용해 생산된 것과 유사한 역가의 rAAV를 생산하였다 (도 14B). 더 나아가서, 주사된 마우스의 골격 및 심장 근육 내에서, CK8 또는 MHCK7 프로모터 하에서 발현된 바이러스 라이브러리는 CMV 하에서 발현된 것과 비교하여 유사하거나 또는 더 높은 이식유전자 mRNA 발현을 일으켜서, 근육 섬유 및 심장근세포에 형질도입되는 기능적 변이체의 확인을 촉진한다 (도 14C-14D).

이들 과정은 5,000,000 초과의 캡시드 변이체의 다양한 라이브러리를 사용해 출발하였고 7개 근육 (사두근, 전경골근, 비복근, 삼두근, 복근, 횡격막, 및 심장)에서 고도로 발현된 상위 30,000 변이체를 선택하였다 (도 14A 및 14E). 생체내 선택의 제2 라운드 경우, 2개 대조군이 도입되었다. 첫번째는 1차 스크린으로부터 각각 선택된 변이체에 대해 확인된 동일한 7-량체 삽입된 펩티드가 동의 DNA 코돈을 사용해 코딩된 동의 코돈 대조군이었다. 두번째는 중복 바이러스 라이브러리가 2개 골격근특이적 프로모터, CK8 또는 MHCK7 중 하나 하에서 변이체를 발현하도록 생성된 발현 대조군이었다 (도 14A). 도 14F는 상위에서 7-량체 삽입의 서열이 전사물-기반 선택의 제2 라운드 이후 마우스 근육에서 캡시드 변이체를 고도로 발현하였음을 보여준다. 각 그룹에서 동일한 색상의 변이체는 동의 DNA 코돈에 의해 코딩된다.

상위 5개 고유한 RGD-함유 캡시드 변이체를 사용해 생산된 rAAV의 역가는 생체내 연구를 위해 이들 조작된 캡시드를 사용하는 실현가능성을 평가하기 위해 정량되었다. rAAV 역가의 비교는 상위 5개 RGD-함유 캡시드 변이체 및 부모 AAV9 캡시드 간에 유의한 차이를 보이지 않았다 (도 22E). RGDLTTP 펩티드 삽입을 함유하는 변이체가 선택되었는데, 이는 또한 상위 12개 RGD-함유 히트로부터 각 위치에서 공통 아미노산과 일치하고, 추가 특징규명을 위해서 이 변이체를 "MyoAAV 1A" (본 명세서의 다른 곳에서 MyoAAV라고도 함)로 명명하였다.

MyoAAV 1A 는 전신 투여후 고효율로 마우스 근육에 형질도입된다

전신 전달 이후 상이한 마우스 조직에서 MyoAAV 1A를 사용해 생성된 rAAV의 형질도입 프로파일 및 생체분포를 조사하기 위해서, 성체 C57BL/6J 마우스는 1E+12 vg (∼4E+13 vg/kg) AAV9- 또는 MyoAAV-CMV-EGFP가 주사되었고, 주사 후 2주 동안 상인한 조직에서 이식유전자 발현 및 벡터 게놈 존재비를 분석하였다. 채취된 조직의 전체 고정 형광 이미지화는 AAV9-주사된 마우스와 비교하여 MyoAAV 1A가 주사된 마우스의 근육에서 훨씬 큰 형광 강도를 밝혀주었다 (도 15A 및 22A). 중요하게, MyoAAV 1A은 많은 유전적 근병증에서 핵심적으로 발병되는 장기인, 심장에 AAV9에 비해서 훨씬 효과적으로 형질도입되었다. MyoAAV 1A 주사된 마우스의 근육 섬유 및 심근세포에서 강력한 이식유전자 발현은 면역형광 분석을 통해 더욱 확정되었다 (도 15B 및 22B). 현저하게, MyoAAV 1A는 C57BL/6J 마우스에서 전신 전달 후 간의 상대적으로 감소된 형질도입을 보여서, AAV9와 비교하여 이 변이체에 대한 간-탈표적화 형질도입 프로파일을 시사한다 (도 15A-15C).

숫컷 및 암컷 C57BL/6J 마우스의 상이한 골격근에서 EGFP mRNA의 정량은 AAV9-주사된 마우스와 비교하여 MyoAAV 1A의 근육에서 10배 내지 29배 더 높은 이식유전자 발현을 밝혀주었다 (도 15C). EGFP mRNA 발현은 MyoAAV 1A 주사된 동물의 심장에서 6.3배 더 높았고 간에서 2.8배 더 낮았다 (도 15C). 특히, MyoAAV 1A에 의한 개선된 형질도입 효율은 횡문근 조직에 제한되었고, 이러한 조작된 캡시드 변이체는 AAV9와 비교하여 유사하거나 또는 더 낮은 효율로 주사된 농물의 폐, 신장, 비장 및 뇌를 형질도입시켰다 (도 15C 및 22C). 웨스턴 블롯 분석은 WAAV9 주사된 마우스와 비교하여 MyoAAV 1A 주사된 동물의 비복근 및 삼두근 근육에서 극적으로 더 높은 EGFP 단백질의 발현 및 간에서 더 낮은 EGFP 발현을 확인하였다 (도 22J). 생체분포 분석은 MyoAAV 1A는, 복근 근육을 제외하고, AA9에 비해서 더 효과적으로 C57BL/6J 마우스의 모든 근육에 벡터 게놈을 전달하는 것으로 입증하였고, 전신 투여 후 간에서 유의하게 더 낮은 수의 벡터 게놈을 생성시켰다 (도 22D).

상이한 마우스 계통에서 MyoAAV 1A의 전신 투여 후 근육 형질도입의 효율을 평가하기 위해서, BALB/cJ 및 DBA/2J 배경의 숫컷 및 암컷 마우스에게 1E+12 vg (∼4E+13 vg/kg)의 AAV9- 또는 MyoAAV 1A-CMV-EGFP를 주사하였고, 주사된 마우스의 상이한 조직에서 이식유전자 발현을 비교하였다. 전체 장기 이미지화 및 EGFP mRNA 정량은 MyoAAV 1A의 강력한 근육 형질도입 및 간 탈표적화 특징이 역시 BALB/cJ 및 DBA/2J 마우스까지 확대된다는 것을 보여주었다 (도 29A-29E).

AAV9와 비교하여 MyoAAV 1A의 근육내 전달 후 근육 형질도입의 효율을 또한 평가하였다. C57BL/6J 마우스DML TA 근육에 2E+10 vg의 AAV9- 또는 MyoAAV 1A-CMV-EGFP의 근육내 투여는 AAV9-주사된 마우스의 근육에 비해서 MyoAAV 1A 주사된 근육에서, 웨스턴 블롯 및 면역형광으로 분석하여, 14배 더 높은 EGFP mRNA 발현을 비롯하여, 극적으로 더 높은 EGFP 단백질 발현을 일으켰다 (도 22E-22F 및 22K).

전신 MyoAAV 1A 투여 후 간 손상 가능성을 조사하기 위해서, 비히클 (염수), 또는 1E+12 vg (∼4E+13vg/kg)의 AAV9-, 또는 MyoAAV 1A-CMV-EGFP 주사된 C57BL/6J 마우스의 혈청에서, 주사 전을 비롯하여, 주사 후 14일 및 28일에, 알라닌 아미노트랜스퍼라제 (ALT) 및 아스파테이트 아미노트랜스퍼라제 (AST) 효소의 수준을 측정하였다. AAV9 또는 MyoAAV 1A 주사된 마우스의 혈청에서 ALT 및 AST 효소의 수준은 비히클 주사된 동물과 비교하여 유의하게 상이하지 않아서, 주사된 용량에서 간 손상이 없다는 것을 시사한다 (도 22G, 22H). AAV9- 또는 MyoAAV 1A-EGFP가 주사된 마우스로부터 단리된 혈청에서 AAV9 및 MyoAAV 1A 형질도입의 억제 분석은 AAV9에 대해 생성된 항체가 MyoAAV 1A와 교차 반응하고 그 반대도 마찬가지라는 것을 입증한다 (도 29K-29L).

다음으로, 인간 골격근에 형질도입되는 MyoAAV 1A의 효율을 분석하였다. 4명 공여자 (2명 남성 및 2명 여성)의 인간 초대 근관에 시험관내에서 AAV9- 또는 MyoAAV 1A-CK8-나노루시퍼라제 (Nluc)를 형질도입시켰다. MyoAAV 1A은 AAV9에 비해서 상이한 공여자로부터의 근관에 35배 내지 52배 더 효과적으로 형질도입되었다 (도 15D). MyoAAV 1A는 또한 AAV9와 비교하여 23배 더 높은 효율로C57BL/6J 마우스 유래 마우스 초대 근관에 형질도입되었다 (도 15D).

추가로, 정맥내 투여 후 MyoAAV 1A에 의한 근육 줄기 세포 (위성 세포) 형질도입의 효과는 6개월령 mdx-Ai9 마우스에서 평가되었다. 이들 디스트로핀-결핍 마우스는 인간 DMD에 대한 유전자 모델로서, Cre-코딩 AAV에 의한 형질도입을 위해 리포터로 제공되는, Cre-활성화 가능 tdTomato 이식유전자를 추가로 보유한다. AAV8-, AAV9- 또는 MyoAAV 1A-CMV-Cre가 주사된 마우스의 근육으로부터의 위성 세포에 대한 형광 활성화 세포 분류 (FACS)는 MyoAAV 1A를 받은 동물에서 유의하게 더 큰 비율의 위성 세포의 형질도입을 보여주었다 (도 22I-22K).

MyoAAV 1A의 전신 전달 후 생체내 유전자 발현의 동역학을 조사하기 위해서, 성체 BALB/cJ 마우스는 4E+11 vg (∼1.6E+13 vg/kg) AAV8-, AAV9-, 또는 MyoAAV 1A-CMV-반딧불이 루시퍼라제 (Fluc)가 주사되었고, 전신 생물발광 이미지화가 주사 후 120일 동안 상이한 시점에 수행되었다. MyoAAV 1A를 받은 마우스는 AAV8 또는 AAV9가 주사된 바우스와 비교하여 그들 전신 및 그들 다리에서 더 빠른 동역학 및 이식유전자 발현의 유의하게 더 높은 전체 수준을 보였다 (도 16A-16B). 주사 후 4개월에 채취된 마우스의 근육으로부터의 전체 장기 생물발광 이미지화는 MyoAAV 1A 주사된 동물의 근육에서 극적으로 더 높은 루시퍼라제 발현을 확인하였다 (도 29M-29O).

MyoAAV 1A가 DBA/2J 및 BALB/cJ 배경 마우스에서 전신 투여 후 상이한 골격근을 효과적으로 형질도입시키고, 근육내 전달 후 근육 형질도입에서 고도로 강력하다는 것을 더 뒷받침하는 추가 결과는 도 29F-29L에 도시된다.

MyoAAV 1A를 사용한 치료적 이식유전자의 전신 투여는 DMD 및 X-연관 근관 근병증 (XLMTM)의 마우스 모델에서 기능적 개선을 유도시킨다

치료적 이식유전자의 생체내 전달을 위해 MyoAAV 1A를 사용하는 실현가능성을 조사하기 위해서, 성체 mdx 마우스 (Dmd 엑손 23에 넌센스 돌연변이를 보유하는 DMD의 마우스 모델)은 mdx 돌연변이의 5' 및 3'을 표적화하는 가이드 RNA (gRNA)와 함께 SaCas9를 코딩하는 구성체를 보유하는 AAV9 또는 MyoAAV 1A가 주사되었다 (도 24A-24B). 출원인은 이러한 CRISPR-Cas9-매개 접근법이 mdx 세포의 게놈으로부터 엑손 23의 절제를 일으키고 절두형이지만 기능성 형태의 디스트로핀 단백질의 근육에서의 발현이 일어난다는 것을 이전에 확인하였다 (Nelson et al., 2016; Tabebordbar et al., 2016). 절두된 변이체를 생산하지만, 이러한 인-프레임 결실은 여전히 기능성 단백질을 만들어서, DMD에 치료적 혜택을 제공한다.

MyoAAV 1A-Dmd CRISPR은 상이한 mdx 근육에서 총 Dmd mRNA의 3.4% 내지 25% 범위의 효율로 엑손 23-결실 Dmd mRNA의 생산을 일으켰다. 대조적으로, t동일 용량의 AAV9-Dmd CRISPR이 주사된 mdx 마우스의 근육에서 엑손 23-결실 mRNA의 생산의 효율은 단지 1.3% 내지 8.7% 범위였다 (도 4C). SaCas9 및 gRNA 발현의 정량은 AA9 주사된 동물과 비교하여 MyoAAV 1A 주사된 마우스의 근육에서 6.7 내지 19배 더 높은 SaCas9 발현 및 3.5 내지 7.8배 더 높은 gRNA 발현을 일으켰다 (도 24F, 24C).

몇몇 발견은 AAV9-Dmd CRISPR과 비교하여 MyoAAV 1A-Dmd CRISPR에 의한 디스트로핀 발현의 우수한 구제를 강조한다. 면역형광 및 웨스턴 블롯 어세이는 AAV9-Dmd CRISPR와 비교하여 MyoAAV 1A-Dmd CRISPR이 주사된 마우스의 근육에서 더 크고 더 광범위한 디스트로핀 복원을 확인하였다 (도 18I-18J 및 24F). AAV-CRISPR 처리된 동물의 전경골근 (TA) 근육의 생리적 평가는 비히클 또는 AAV9-Dmd CRISPR 주사된 대조군과 비교했을 때 MyoAAV 1A-Dmd CRISPR 주사된 mdx 마우스에서 유의하게 더 큰 비력 (도 4D) 및 편심성 수축 후 감소된 비력 저하율을 입증하였다 (도 18E). 따라서, MyoAAV 1A는 통상의 광범위하게 사용되는 AAV9와 비교하여 근육에 치료적 유전자 편집 복합체의 전달에 대해 두드러지게 증강된 역가를 나타낸다.

저용량 전신 투여 후 유전자 치환을 위한 MyoAAV 1A의 성능은 XLMTM의 마우스 모델에서 더욱 평가하였다. Mtm1 녹아웃 (KO) 마우스는XLMTM의 우수한 유전적 및 표현형적 모델을 제공하는데, 그들은 두드러진 근육 소모, 움직임 상실, 및 극적으로 단축된 수명을 보인다. 4 주령 Mtm1 KO 마우스는 MHCK7 프로모터의 제어 하에서 발현되는 인간 MTM1 (hMTM1)를 코딩하는 2E+12 vg/kg의 AAV9 또는 MyoAAV 1A가 주사되었다 (도 24E). 8개월 동안 각 그룹에 대해서 체중, 행동, 및 생존을 측정하였다 (도 18F). 이 실험에서 사용된 바이러스의 용량은 XLMTM에 대한 진행중인 인간 임상 시험 (임상 시험.gov 식별자: NCT03199469)에서 사용되는 것보다 50-150배 낮았고, XLMTM 유전자 요법에 대한 이전에 공개된 전임상 연구에서 사용된 것보다 15-250배 더 낮았다 (Childers et al., 2014; Elverman et al., 2017; Mack et al., 2017).

MyoAAV 1A-MHCK7-hMTM1 주사된 마우스는 기능 및 생존에서 현저한 개선을 보였다. 2E+12vg/kg의 AAV9-MHCK7-hMTM1 이 주사된 모든 마우스는 최소로 활동하였고 주사 후 11-21주에 인도적인 안락사 종료점에 도달하였다. 대조적으로, 동일 용량의 MyoAAV 1A-MHCK7-hMTM1 이 투여된 모든 마우스는 야생형 마우스와 유사한 궤적으로 생존하였고, 또한 체중이 증량되었고, 연구 전반에서 AAV9-주사된 마우스와 비교하여 두드러지게 더 활동적이었다 (도 29G-29J 및 24G). AAV 투여 후 4주에 주사된 마우스의 비복근, 사두근, 심장, 및 간에서 hMTM1 mRNA 발현의 정량 및 벡터 게놈 생체분포는 AAV9-MHCK7-hMTM1 주사된 동물과 비교하여 MyoAAV 1A-MHCK7-hMTM1 주사된 마우스의 근육에서 유의하게 더 높은 이식유전자 발현 및 vg/dg를 보인 한편, MyoAAV 1A-MHCK7-hMTM1 가 주사된 마우스의 간에서 hMTM1의 발현 및 vg/dg의 수는 AAV9-MHCK7-hMTM1 주사된 동물에서 더 낮았다 (도 17L 및 17M). 웨스턴 블롯 어세이는 MyoAAV 1A-MHCK7-hMTM1 주사된 마우스의 비복근 및 사두근에서 더 높은 hMTM1 단백질 발현을 확인하였고 (도 17N) 장지신근 (EDL) 근육의 생리적 분석은 비히클 또는 AAV9-MHCK7-hMTM1 주사된 대조군과 비교하여 MyoAAV 1A-MHCK7-hMTM1 주사된 마우스에서 유의하게 더 높은 비력을 입증하였다 (도 17O).　

각각 DMD 및 XLMTM의 마우스 모델에서 MyoAAV-Dmd CRISPR 및 MyoAAV-인간 MTM1 의 전신 투여의 추가 결과는 도 17A-17I 및 17K에 도시된다. MyoAAV 1A는 마우스 및 인간 초대 근관의 형질도입을 위해 인테그린 이종이량체에 의존적이다.

MyoAAV 및 선택으로부터의 모든 다른 상위 변이체에서 RGD 모티프의 존재를 고려하면, MyoAAV 1A 형질도입에서 RGD-결합 인테그린 이종이량체의 역할을 평가하였다.

RGD 모티프는 이의 수용체에 대한 결합을 촉진하는 피브로넥틴의 최소 서열로서 1984년에 처음 인식되었고, 이후에 인테그린 이종이량체 α5β로서 확인되었다 (Pierschbacher and Ruoslahti, 1984; Pytela et al., 1985). RGD는 몇개 상이한 인테그린 이종이량체에 대한 인식 모티프로서 이후 확인되었다: 특히 αIIbβ, α5β1, α8β1, αVβ1, αVβ3, αVβ5, αVβ6, 및 αVβ8 (Ruoslahti, 1996). 이들 8종 인간 RGD-결합 인테그린 이종이량체의 각각을 코딩하는 플라스미드 또는 대조군으로서 pUC19 플라스미드를 형질감염시킨 HEK293 세포에서 MyoAAV 1A-CMV-Nluc의 형질도입 효율을 비교하였다. α8β1, αVβ1, αVβ3, αVβ6, 및 αVβ8의 과발현은 pUC19-형질감염 대조군과 비교하여 형질감염된 HEK293 세포에서 MyoAAV 1A의 형질도입 효율을 증가시켰는다 (도 18I 및 25A-25K).

다음으로, 세포 표면에 대한 MyoAAV 1A의 결합 효율에 대한 상이한 인테그린 이종이량체의 효과를 과발현 실험을 통해 분석하였다. 8종 RGD-결합 인테그린 이종이량체의 각각 또는 pUC19 대조군 플라스미드가 형질감염된 HEK293 세포의 표면에 결합된 벡터 게놈을 정량하였고, αVβ6, 및 덜 한 정도로 α8β1, 및 αVβ1이 pUD15-형질감염된 대조군과 비교하여 인테그린-형질감염된 세포에 대한 MyoAAV 1A의 결합을 증가시켰다는 것을 확인하였다 (도 18J). 초대 세포에서 MyoAAV 1A 형질도입 효율에 대한 2종의 상이한 범-αV 인테그린 길항제 (CWHM-12 및 GLPG-0187)의 효과를 또한 조사하였다. 양쪽 억제제는 MyoAAV 1A 형질도입을 용량-의존적 방식으로 마우스 (도 26A 및 26J) 및 인간 (도 18K, 18D 및 26C-26H) 초대 골격근 근관에서 방해하였지만, 어떠한 억제제도 AAV9 형질도입 효율에 대해서 용량-의존적 효과를 갖지 않았다. 이들 결과는 αV-함유 인테그린 이종이량체가 마우스 및 인간 초대 근관을 형질도입하는 MyoAAV 1A의 능력을 거의 완전히 제거한다는 것을 입증한다.

개별 αV-함유 인테그린 이종이량체의 MyoAAV 1A 결합 친화성에 대한 영향을 더욱 밝히기 위해서, 우리는 αVβ1, αVβ3, αVβ6, αVβ8, 또는 말토스 결합 단백질 (MBP) 재조합 단백질과 이들 바이러스의 사전-인큐베이션 후에 MyoAAV 1A 또는 AAV9로 인간 초대 근관을 형질도입시켰다. 현저하게, 증가된 농도의 αVβ6,와 MyoAAV A1의 사전 인큐베이션은 인간 초대 근관의 형질도입을 용량-의존적 방식으로 억제하였지만, 시험된 다른 재조합 단백질은 MyoAAV 1A 또는 AAV9에 의한 세포의 형질도입에 용량-의존적 효과를 갖지 않았다 (도18E, 18F). 반대로, 증가된 용량의 항-αVβ6 항체와 인간 근관의 사전 인큐베이션은 MyoAAV 1A에 의한 형질도입을 용량 의존적 방식으로 감소시켰고, AAV9에 의한 근관의 형질도입에는 영향이 없었다 (도 18G, 18L). 이들 데이터는 MyoAAV 1A 형질도입을 촉진하는 능력을 갖는 αV-함유 인테그린 이종이량체 중에서, αVβ6가 이러한 캡시드 변이체에 대해 결합하는 최고 친화성을 갖는다는 것을 시사한다. 추가로, αVβ6은 MyoAAV A1에 의한 그들 최적 형질도입이 가능하도록 인간 근육 세포에서 이용가능해야 한다.

세포로 AAV9의 형질도입 및 그에 결합에 대한 말단 시알산을 갖는 글리간의 중요성을 고려하여 (Bell et al., 2011), 다음으로 MyoAAV 1A 형질도입 및 결합에 대한 글리칸 및 시알산의 역할을 평가하였다. 세포 표면 상에서 시알산 연결을 글리칸으로 절단하는 뉴라미니다제 (NA)로 HEK293 세포의 처리는 미처리 대조군과 비교하여 처리된 세포에 대한 MyoAAV 1A의 172배 더 높은 형질도입 및 4배 더 높은 효과적인 결합을 일으켰다 (도 26K, 26L). 말단 갈락토스가 MyoAAV 1A의 형질도입 및 결합에 중요한지 여부를 더욱 시험하였다. NA-처리된 HEK293 세포에, 세포 표면 상의 말단 갈락토스에 결합하는, 에리트리나 크리스타갈리 렉틴 (ECL)의 첨가는 AAV9 및 MyoAAV 1A에 의한 결합 및 형질도입을 유의하게 억제하였지만, AAV2 결합 및 형질도입에는 효과가 없었다 (도 26M, 26N). 이들 결과는 AAV9와 유사하게, 세포에 대한 MyoAAV 1A 형질도입 및 결합이 시알산의 제거 및 세포 표면 상의 갈락토스에 노출에 의해 증강된다는 것을 입증하였다.

이전에 확인된 AAV 수용체 (AAVR)에 대한 MyoAAV 1A 형질도입의 의존성을 평가하였다. AAVR은 AAV4 및 AAVrh32.33을 제외하고 가장 알려진 AAV 혈청형의 효과적인 형질도입에 필요한 신속하게 세포내이입되는 원형질막 단백질이다 (Dudek et al., 2018; Pillay et al., 2016). HEK293FT AAVR 녹아웃 (KO) 및 부모 HEK293FT 야생형 (WT) 세포에 AAV4-, AAV2-, AAV9-, 또는 MyoAAV 1A-CMV-Nluc를 형질도입시켰고, AAV2 및 AAV9와 유사하게, MyoAAV 형질도입은 AAVR 발현을 필요로 한다는 것을 발견하였다 (도 26O).

인테그린 이종이량체 및 AAVR이 MyoAAV 1A 형질도입에서 중복 역할을 하는지 여부를 조사하기 위해서, AAVR 과발현 존재 또는 부재 하에서 HEK293FT AAVR KO 세포에서 α8β1, αVβ1, αVβ3, αVβ6, 또는 αVβ8을 과발현시킨 다음에 세포에 MyoAAV A-CMV-Nluc를 형질도입시켰다. 이들 결과는 인테그린 이종이량체의 과발현이 모의 형질감염 대조군과 비교하여 AAVR KO 세포에서 MyoAAV 1A 형질도입 효율을 증가시키는 한편, 인테그린 과발현은 AAVR 과발현 AAVR KO 세포 또는 WT HEK293FT 세포에서 관찰된 수준까지 형질도입을 구제하기에 충분하지 않았다는 것을 입증하였다 (도 26I). 이러한 데이터는 인테그린 이종이량체 및 AAVR가 별개 역할을 하고 MyoAAV 1A 형질도입의 상이한 단계에서 이용될 가능성이 있다는 것을 시사한다.

DELIVER를 사용한 생체내 진화의 추가 라운드는 마우스에서 제2 세대 RGD-함유 근육-향성 변이체를 생성시킨다

MyoAAV 1A에 의한 근관 형질도입을 위해 인테그린 이종이량체와 RGD 모티프의 상호작용의 중요성을 고려하여, 모티프에 인접한 아미노산의 변형이 이러한 상호작용을 개선시킬 수 있고, 보다 더 강력한 근육-향성 캡시드 변이체를 생성시킬 수 있다고 가정하였다. MyoAAV 1A 초가변 영역 VIII 표면 루프의 예측 구조를 기반으로, RGD 모티프의 상류 위치 586, 587, 및 588, 및 하류 위치 592, 593, 594, 및 595가 MyoAAV 1A의 표면 루프에 위치할 가능성이 있다 (도 19A). 다양한 캡시드 라이브러리를 생성시켰고, 그 각각은 위치 589, 590, 및 591에 고정된 RGD 모티프 및 상기 언급된 측접 위치에 다양한 아미노산을 갖는다 (도 19B).

DELIVER를 사용한 근육-향성 변이체의 생체내 선택의 2 라운드를 C57BL/6J 및 mdx 마우스에서 수행하였다. 제2 라운드 RGD-고정된 바이러스 라이브러리는 상이한 2개 용량 (마우스 당 1E+12 vg 및 1E+11 vg)으로 주사되어서 고용량 및 저용량에서 근육 조직을 효과적으로 형질도입시키는 변이체를 확인하였다 (도 19B). 이들 선택으로부터 우리의 상위 히트 중에서, 글리신 및 알라닌이 위치 588에 농축되었고, 글루타민은 위치 592에 농축되었다는 것을 확인하였다. GPGRGDQTTL (SEQ ID NO: 2) 서열을 함유하는 변이체가 2회 선택 라운드로부터 1E+12 및 1E+11 용량에서 가장 고도로 선택된 근육-향성 캡시드로서 출현하였다 (도 19B). 이것을 제2 세대 변이체 MyoAAV 2A (본 문서에서 EMyoAAV 또는 증강된 MyoAAV라고함)라고 하였고, 추가 특징규명에 사용하였다.

상이한 마우스 조직에서 MyoAAV 2A의 형질도입 효율은 저용량의 바이러스의 전신 전달 후에 조사하였다. C57BL/6J 마우스는 2E+11 vg (∼8E+12 vg/kg)의 AAV9-, MyoAAV 1A-, 또는 MyoAAV 2A-CMV-EGFP를 주사하였고, 다양한 조직에서 이식유전자 발현 및 벡터 게놈 생체분포를 분석하였다. 전체 조직 형광 이미지화는 MyoAAV 2A에 의한 전신 유전자 전달이 상이한 골격근에 걸쳐서 MyoAAV 1A 또는 AAV9와 비교하여 더 높은 수준의 이식유전자 발현을 일으킨다는 것을 입증하였다 (도 19C-19D). EGFP mRNA의 정량은 MyoAAV 2A가 AAV9에 비해서 마우스 골격근을 10-80배 더 효과적으로, 심장을 17배 더 효과적으로 형질도입시킨다는 것을 밝혀주었다. 또한, 이식유전자 mRNA 발현은 AAV9-주사된 마우스와 비교하여 MyoAAV 2A-주사된 동물의 간에서 2.5배 더 낮았다 (도 19E). 유사하게, 벡터 게놈 생체분포 분석은MyoAAV 2A-주사된 마우스가 AAV9-주사된 동물과 비교하여 골격근 및 심장에서 유의하게 더 높은 vg/dg 및 간에서 유의하게 더 낮은 vg/dg를 갖는다는 것을 보여주었다 (도 19L).

다음으로, 인간 초대 근관을 형질도입시키기 위한 MyoAAV 2A의 효율 및 인테그린 의존성. 두드러지게, MyoAAV 2A는 AAV9와 비교하여 인간 초대 근관을 128배 더 효과적으로, MyoAAV 1A과 비교하여 4.1배 더 높게 형질도입시킨다 (도 19F). 범-αV 인테그린 길항제 GLPG-0187의 증가된 농도는 MyoAAV 2A의 형질도입 효율의 용량-의존적 감소를 일으켜서 (도 19G), MyoAAV 2A 감염도가 표적 세포에서 발현되는 αV-함유 인테그린 이종이량체에 의존적으로 남아있는다는 것을 확인하였다.

상이한 개별 αV 인테그린 이종이량체에 대한 MyoAAV 2A의 결합 친화성을 평가하기 위해서, 인간 초대 근관을 형질도입시키기 전에, MyoAAV 2A 또는 AAV9를 αVβ1, αVβ3, αVβ6, αVβ8, 또는 말토스 결합 단백질 (MBP) 재조합 단백질과 사전 인큐베이션하였다. 놀랍게도, MyoAAV 1A를 사용한 이들 동일 어세이에서 수득된 결과 (도 18E)와 대조적으로, 시험된 모든 4종의 αV-함유 인테그린 이종이량체는 MyoAAV 2A에 의한 인간 근관의 형질도입을 용량-의존적 방식으로 억제하였지만 (도 19H), AAV9 형질도입에 대해 용량-의존적 효과가 없었다 (도 19I). 이러한 결과는 MyoAAV 2A에 포함된 아미노산 치환이 αVβ6에 주로 의존하는 MyoAAV 1A과 비교했을 때 더 광범위한 클래스의 αV 인테그린 이종이량체에 대해 더 높은 친화성을 가능하게 한다는 것을 시사한다.

마우스에서 DELIVER를 사용해 진화된 상위 제1 세대 및 제2 세대 캡시드 변이체의 의존성을 αVβ6 이종이량체에 대해 조사하였다. 인간 초대 근관은 상위 제1 세대 (MyoAAV 1A, MyoAAV 1B, MyoAAV 1C, MyoAAV 1E, MyoAAV 1F) 및 제2 세대 (MyoAAV 2A, MyoAAV 2B, MyoAAV 2C, MyoAAV 2D, MyoAAV　 2E, MyoAAV 2F) 마우스 변이체를 세포에 형질도입하기 전에 항-αVβ6 항체와 사전 인큐베이션시켰다. 이들 모든 변이체에 의해서 어느 정도까지 인간 근관의 형질도입을 항체 결합이 억제하지만, 제1 세대 캡시드는 근관 형질도입에 대해 αVβ6에 유의하게 더 의존하였다 (도 19M).

MyoAAV 2A는 저용량 바이러스의 주사후 큰 치료적 잠재성을 보인다

인간 신경근육 질환에 대해 현재 임상 시험 중인 캡시드와 비교하여 MyoAAV 2A의 잠재적인 향후 치료적 관련성을 평가하기 위해서, MyoAAV 2A의 형질도입 효율을 DMD에 대해 진행중인 임상 시험 (임상 시험.gov 식별자: NCT03362502, NCT03368742, 및 NCT03769116)에서 조사 중인 AAV9 및 AAVrh74와 비교하였다. 근육-특이적 MHCK7 프로모터 로부터 발현되고, AAVrh74 벡터를 사용해 전달된 기능-상보적 디스트로핀 미니-유전자 (마이크로디스트로핀이라고 함)의 전신 투여는 4명 DMD 환자를 포함한 최근에 보고된 인간 임상 시험에서 유망한 결과를 보였다. 이러한 시험에서, 높은 바이러스 용량의 2E+14 vg/kg의 높은 바이러스 용량의 투여는 근육에서 이식유전자 발현 및 질환 표현형에서 기능적 개선을 일으켰다 (Mendell et al., 2020).

MyoAAV 2A-매개 유전자 전달은 AAVrh74 및 AAV9 벡터와 비교하였고, DMD의 DBA/2J-mdx 마우스 모델에서 성능을 더 조사하였다. 종적 생체내 이미지화 실험에서, 성체 BABL/cJ 마우스에게 CMV-Fluc 리포터 유전자를 코딩하는 저용량 (2E+11 vg, ∼8E+12 vg/kg을 의미함)의 AAVrh74, AAV9, 또는 MyoAAV 2A를 주사하였다. MyoAAV 2A-주사된 마우스는 AAVrh74 또는 AAV9를 받은 것과 비교하여 전신 및 다리에서 극적으로 더 높은 생물발광 신호를 입증하였다 (도 19J-19K). 동등한, 저용량 (2E+13 vg/kg)의 각각의 AAV를 사용하여 마이크로디스트로핀 이식유전자 (CK8-마이크로디스트로핀-FLAG)을 보유하는 MyoAAV 2A 또는 AAV9의 DMD의 DBA/2J-mdx 마우스 모델에 전신 전달을 시험하였다. MyoAAV 2A-주사된 동물은 AAV9-주사된 동물과 비교하여 다수 근육 그룹에서, 근초에 위치한 마이크로디스트로핀의 상대적으로 더 크고 더 광범위한 발현을 입증하였다 (도 20A). 웨스턴 블롯은 AAV9 주사된 동물과 비교하여, MyoAAV 2A가 주사된 마우스의 근육에서 마이크로디스트로핀 단백질의 더 높은 수준을 확인하였다 (도 20B). 정량적 RT-PCR은 AAV9-CK8-마이크로디스트로핀-FLAG과 비교하여 MyoAAV 2A-CK8-마이크로디스트로핀-FLAG 주사된 마우스의 골격근에서 마이크로디스트로핀 mRAN의 7.6-15배 더 높은 수준을 보여주었다 (도 20C).

마지막으로, AAV9-주사된 동물과 비교하여 MyoAAV 2A-주사된 마우스에서 근육 기능 및 벡터 게놈의 존재비를 평가하였다. MyoAAV 2A는 AVV9와 비교하여 DBA/2J-mdx 마우스의 골격근에서 12-46배 더 높은 vg/dg의 수 및 간에서 2.5배 더 낮은 vg/dg를 전달하였다 (도 20D). 놀랍게도, AAV9-주사된 동물은 그들 근육과 비교하여 그들 간에서 40배 초과로 더 높은 vg/dg의 수를 가졌는데 반해서, MyoAAV 2A-주사된 마우스는 그들 간 및 근육에서 유사한 수준을 가졌다. 편심성 손상 후 근 비력 및 비력 하락률의 정량은 MyoAAV 2A 주사된 DBA/2J-mdx 마우스의 TA 근육이 동일 용량의 AAV9를 받은 마우스 및 비히클-주사된 동물의 근유과 비교하여 손상으로부터 더 보호되었고 유의하게 더 큰 비력을 회복하였다는 것을 입증하였다 (도 20E-20F).

생체내 유도 진화는 사이노몰거스 마카크에서 상위 히트로서 캡시드 변이체의 MyoAAV를 확인한다

NHP에서 전신 투여 후 강력한 근육-지정 유전자 전달을 할 수 있는 캡시드 변이체를 확인하기 위해서, AAV9의 생체내 유도 진화를 사이노몰거스 마카크에서 DELIVER를 사용해 수행하였다. 588 부위에 무작위 7-량체 펩티드 삽입으로 출발하여 2 라운드의 생체내 선택은 상위 히트로서 RGD 모티프를 함유하는 6개 변이체를 확인하였다 (도 28A). 이들 결과는 전신 투여 후 영장류에서 MyoAAV 클래스 캡시드의 높은 근육 향성에 대한 증가를 제공하였다. 종에 걸쳐 강력한 근육 형질도입이 가능한 추가로 진화된 MyoAAV 클래스 변이체를 선택하기 위해서, 마우스에서 우리의 RGD-고정 선택의 제1 라운드에서 확인된 상위 120,000 변이체를 사용해 NHP에서 생체내 선택 라운드를 수행하였다 (도 28B). 흥미롭게도, NHP에서 확인된 상위 히트의 RGD 모티프 이후 첫번째 위치에서 티로신이 농축된 것이 확인되었다.

NHP에서 확인된 가장 높은 근육-향성 변이체 (MyoAAV 3A-F 및 MyoAAV 4A-E)를 비롯하여, 높은 효율로 인간 초대 근관을 형질도입하는 마우스에서 확인된 4개 근육-향성 변이체 (MyoAAV 1C, MyoAAV 1E, MyoAAV 2A, 및 MyoAAV 2E)의 형질도입 효율 (도 28C)은 마우스 및 NHP에서 AAVrh74 및 AAV9를 사용해 벤치마킹하였다. rAAV는 CBh 프로모터의 프로모터 제어 하에서 인간 프라탁신 (hFXN) 이식유전자를 코딩하도록 AAVrh74 및 AAV9를 비롯한, 각각의 캡시드 변이체를 사용해 생성되었다. 각 캡시드로 생산된 재조합 AAV는 이식 유전자의 3' 비번역된 영역 (3' UTR)에서 고유한 바코드 세트를 함유하였다 (도 28D). 모든 17 바이러스의 동등한 적정가를 함유하는 rAAV의 풀을 제조하였고, 이어서 이러한 풀을 사이노몰거스 마카크 및 마우스에 투여하였다. NHP의 상이한 조직에서 이식유전자 mRNA 발현의 정량은 마카크에서 AAVrh74 및 AAV9와 비교하여 상이한 골격근의 형질도입에서 가장 강력한 변이체로서 MyoAAV 4A, MyoAAV 4E, MyoAAV 3A, 및 MyoAAV 4C를 확인하였다 (도 28D-28E 및 30B). 이들 4개 변이체는 매우 효과적으로 상이한 마우스 골격근에 형질도입되고, 마우스 및 NHP 둘 모두에서 AAVrh74 및 AAV9와 비교하여 간에서 탈표적화된다 (도 30A 및 28E).　　

상위 4개 캡시드의 생산 수율을 평가하기 위해서, 6개 상이한 이식유전자를 사용해 AAVrh74 및 AAV9를 비롯해 상위 4개 변이체를 갖는 rAAV를 생산하였다. AAV9는 우리가 시험한 캡시드 중에서 최고 생산자였고, 모든 MyoAAV 변이체는 AAVrh74와 비교하여 유사하거나 더 높은 역가의 바이러스를 생산하였다 (도 28F).　

상위 4개 캡시드 변이체의 형질도입 의존성 및 친화성을 다음으로 αV 인테그린 이종이량체에서 평가하였다. 증가된 농도의 GLPG-0187은 인간 초대 근관에서 모든 4개 변이체의 형질도입에서 용량-의존적 감소를 일으켰다 (도 28G). αVβ1, αVβ3, αVβ6, αVβ8, 또는 MBP와 캡시드 변이체의 사전 인큐베이션은 αVβ6에 대해 최고 친화성을 가지고, 그 다음으로 αVβ8 및 αVβ83인 것을 입증하였다. 이들 결과와 일관되게, 증가 농도의 αVβ6 항체로 인간 초대 근관의 처리는 모든 4개 변이체에 대해 용량 의존적 형질도입 감소를 일으켰다 (도 28J). 또한, AAVR KO 및 야생형 세포에서 상위 4개 변이체의 형질도입 효율 분석은 이들 모든 변이체가 형질도입을 위해 AAVR에 의존적이라는 것을 밝혀주었다 (도 28K).

마지막으로, αVβ6에 대한 MyoAAV 클래스의 캡시드 변이체의 높은 의존성 및 친화성을 고려하여, 마우스, NHP, 및 인간 근육에서, 오직 αV와 이종이량체를 형성하는, 인테그린 β6의 발현을 분석하였다. 면역형광 분석은 모든 3종 유래 근육에서 인테그린 β6의 발현을 입증하였다 (도 30C).

고찰

이 실시예는 적어도 임의의 관심 조직 및/또는 세포 유형으로 강력한 유전자 전달을 위해 효과적인 AAV 캡시드 변이체를 조작하고 선택하기 위한 전략을 기술하고 입증한다. DELIVER는 엄격하고 광범위하게 적용가능한 AAV 캡시드 조작 전략에 필요한 3개 핵심 특성을 조합한다: (i) DELIVER는 생체내에서 세포에 물리적으로 결합하거나 또는 진입할 뿐만 아니라 조직을 기능적으로 형질도입시키고 그들 이식유전자를 특이적 세포 유형에서 발현시키는 캡시드 변이체의 선택을 가능하게 한다. (ii) DELIVER는 생체내 또는 시험관내에서, 임의의 포유동물 종에 적용할 수 있어서, 전임상 동물 모듈에서 인간 적용에 직접 번역될 수 있는 벡터 시스템의 확인을 가능하게 한다. (iii) DELIVER은 매우 다양한 캡시드 라이브러리의 스크리닝을 지원하고 유도 진화 접근법과 완전히 호환된다.

궁극적으로, DELIVER 시스템 개발의 관심은 보다 강력하고 선택적인 바이러스 벡터의 생성을 통한 게놈 의학을 진보시키는 이의 잠재적 혜택에 뿌리를 두었고, 이러한 연구에서 확인된 근육-지정 AAV 캡시드 변이체는 이러한 적용을 위한 중요한 개념 정의로서 제공된다. 그러나, 캡시드의 근육 역가를 증가시키기 위해 동일하게 중요한 것은 간의 감소된 형질도입을 보장하는 것이었다. 간은 천연 발생 AAV 캡시드에 의한 형질도입의 주요 부위이고 대형 동물 모델 (Hinderer et al., 2018) 및 인간 환자 (Morales et al., 2020)에서 AAV 벡터의 고용량 투여와 연관된 독성 표적이다. 특히, 2개 유전자 요법 시험 (임상 시험 식별자 NCT03368742 및 NCT03199469)은 간 독성과 연관된 중증 부작용으로 인해 FDA에 의해 임상이 보류되었다. 유전적 근병증에 대한 AAV-기반 유전자 요법의 임상 적용에서 이러한 최근의 좌절 (Morales et al., 2020)은 근육으로 전달에 대한 예외적 문제를 강조하였고 이 실시예에서 기술된 것과 같이 강력한-근육 지정 AAV 변이체에 대한 명확한 요구를 예시한다.

DELIVER는 전신으로 투여될 때, 임상 시험 및 전임상 발굴 노력에서 현재 사용되는 캡시드에 비해서 더 큰 효율 및 선택성, 및 잠재적으로 더 유리한 안전성 프로파일로 전신의 골격근에 유전적 카고를 수송할 수 있는 신규한 AAV 캡시드를 개발하는데 적용되었다. 2라운드의 엄격한, 전사물-기반 선택은 광범위하게 사용되는 캡시드에 비해서 10배 초과의 근육 형질도입 효율을 나타낸, MyoAAV 1A를 포함한, RGD-함유 캡시드 변이체의 신규 클래스를 발굴하였다. 더 나아가서, DELIVER를 사용해 선택된 근육-지정 AAV는 현저하게 감소된 간의 표적화를 보였다. 이들 2가지 속성은 이러한 신규 클래스의 AAV 캡시드가 표적 세포 형질도입의 치료적 수준을 획득하는데 필요한 바이러스의 용량을 감소시킬 수 있고 치료적 혜택에 필요하지 않는, 간 세포에서의 형질도입의 잠재적으로 유해한 결과를 완화시킬 수 있다고 시사한다.

DELIVER은 인테그린 이종이량체에 결합하는 것으로 알려진 핵심 RGD 모티프를 보유하는 수많은 변이체를 확인하였고, 추가 작업은 마우스 및 인간 초대 근관의 형질도입을 위한 이러한 모티프의 기능적 중요성을 시사하였다. 마우스 및 NHP에서 근육-표적화 캡시드의 스크린은 삽입된 7-량체 펩티드의 처음 3개 아미노산으로서 RGD를 함유하는 변이체의 놀라운 농축을 확인하였다. 생체내 선택으로부터 상위 변이체는 인테그린 이종이량체와 상호작용을 보였고 가용성 인테그린 이종이량체, 항-인테그린 항체, 및 소형 분자 길항제에 의해 표적 세포 형질도입을 차단할 수 있다. 이렇게 관찰된 인테그린 의존성은 마우스 및 인간 초대 근관에 걸쳐 보존되어서, MyoAAV 클래스 캡시드 형질도입에 대한 공통 작용 기전을 시사하였다. MyoAAV 클래스 캡시드의 인테그린과의 상호작용은 이들 변이체에 의한 표적 세포 형질도입에 역시 필요한, 이전에 확인된 AAV 결합 단백질 AAVR과 동시에 작용하는 것으로 보인다. RGD-결합 인테그린 이종이량체 중에서, αVβ6은 결합에 대해 최고 친화성을 보였고, 우리가 확인한 상위 변이체에 의한 그들 형질도입을 가능하도록 인간 근육 조직의 표면 상에서 특히 요구되었다. 이들 관찰은 RGD 모티프가 결여되었지만, 분명하게 관련된 NGR 모티프를 통해서, 바이러스 내재화를 위한 공-수용체로서 α5β1 및 αVβ5를 포함한, 인테그린 이종이량체를 여전히 이용하는, AAV2의 이전 연구의 관점에서 특히 흥미롭다 (Asokan et al., 2006; Summerford et al., 1999).

근육으로 AAV-매개 유전자 전달을 위한 RGD-인테그린 이종이량체 상호작용의 근간이 되는 분자 기초를 이해하기 위해 더 많은 작업이 필요하지만, 우리가 발굴한 클래스의 근육-지정 벡터에 대한 이의 중요성은 필수 RGD 모티프 주변 측접 잔기를 체계적으로 가변화시켜서 이들 캡시드를 더 진화시킬 수 있게 하였다. 제2 라운드의 진화는 MyoAAV 1A에 비해서 더 큰 친화성으로 인테그린 이종이량체의 더 넓은 서브세트에 결합할 수 있는 추가 변이체를 확인하였다. 마우스에서 상위 제2 세대 변이체, MyoAAV 2A는 낮은 간 형질도입을 유지하면서, 생체내 및 시험관내 어세이에서 근육 형질도입을 위해 극적으로 증가된 역가 (AAV9에 비해 최대 128배)를 보였고, 이의 성공은 다른 관심 표적 조직에 대한 초고 역가 벡터의 반복적 개발을 위한 뼈대를 제공한다.

게놈 의학 발적을 목표로, 인간 유전적 근병증에 대해 현재 개발 및 시험 중인 유전 편집 및 유전자 요법 접근법을 위한 전달 벡터로서 MyoAAV 1A 및 MyoAAV 2A를 적용하였다. 이들 연구는 DMD 및 XLMTM의 잘 확립된 마우스 모델을 적용하였는데, 여기서 표적화된 DNA 절제 및 전사물 "리-프레이밍" (Nelson et al., 2016; Tabebordbar et al., 2016) 또는 전체 길이 또는 소형 치료 이식유전자에 의한 유전적 보완 (Childers et al., 2014; Hakim et al., 2017)이 기능적 혜택을 이전에 보여주었다. 양쪽 모델에서, XLMTM의 경우에, 질환-표적화 단백질의 발현의 구제, 근육 강도 및 성능의 유의한 증가, 미처리 및 AAV9-처리된 대조군의 평균 수명을 초과하는 MyoAAV 1A-처리된 동물의 관찰 수명을 두드러지게 연장시킨 질환-유도 사망률로부터 현저한 구제를 포함한, 현저한 치료적 효과가 관찰되었다.

치료 결과는 동일 유전자 요법 접근법을 기반으로 이전에 공개된 전임상 연구 (Childers et al., 2014; Elverman et al., 2017; Hakim et al., 2017; Mack et al., 2017) 또는 현재 진행중인 인간 임상 시험 (임상 시험.gov 식별자: NCT03362502, NCT03368742, NCT03769116, and NCT03199469)에서 사용되는 것에 비해서 치료적 벡터의 10-250배 낮은 용량의 주사 후 획득되었다는 것을 고려하면 모두 더 주목할만하다. 이들 신규 AAV 변이체를 사용해 치료적 효능을 획득하기 위한 저용량 요건은 개선된 발현 및 안전성 프로파일 및 감소된 제조 비용을 포함하여, 임상 적용에서 실질적인 혜택을 가질 수 있다.

마지막으로, MyoAAV 클래스 캡시드의 변이체는 NHP에서 생체내 유도 진화 이후에 가장 높은 근육-향성 변이체로서 확인되었다. 이들 결과는 C57BL/6J, BALB/cJ, DBA/2J, mdx, 및 DBA/2J-mdx를 포함한, 다수 교배 마우스 품종을 비롯하여, 사이노몰거스 마카크, 및 다수 공여자로부터 수득된 인간 초대 근모세포의 배양물에서 근육 형질도입을 위해 광범위 활성을 보였으므로, 마우스, NHP, 및 인간에 걸쳐서 MyoAAV 클래스 캡시드 변이체의 직접 적용가능성을 시사한다. 또한, 마우스 및 인간 근육 조직에서 MyoAAV 클래스 캡시드의 감염도를 위해 인테그린 이종이량체의 필요성은 광범위 유전적 근병증에 대한 신규한 유전자 요법 접근법을 개발하고 구현하기 위한 타임라인을 가속화시킬 수 있는 마우스 및 인간 근육에서 형질도입의 보존된 방식을 강력하게 시사한다.

Weinmann 등 (Weinmann et al., 2020)의 최근 간행물은 마우스에서 전신 투여 후 183개 야생형 및 변형된 AAV 캡시의 형질도입 효율을 시험한 후 근육-향성 캡시드 변이체의 확인을 보고하였다. 흥미롭게도, Weinmann 등이 그들 스크린으로부터 확인한 근육-향성 변이체는 캡시드 표면 상에 존재하는 RGD 모티프를 함유하여, 우리 발견의 독립 검증으로서 제공될 수 있다. 그러나, 저자는 NHP 및 인간 세포에서 그들 변이체에 의한 형질도입 효율 및 형질도입 기전을 특징규명하지 못하였다. 마우스 및 NHP에서 캡시드의 생체내 유도 진화로부터 이러한 실시예에서의 발견은 삽입된 펩티드의 RGD 모티프 주변 아미노산 서열이 상이한 종에서 캡시드의 형질도입 효율을 한정하는데 중요한 역할을 한다는 것을 입증한다. 가장마우스 및 NHP에서 생체내 유도 진화로부터 확인된 가장 고도의 근육-향성 변이체가 모두 이 실시예에서 입증된 바와 같이, RGD 모티프를 함유하지만, 각 종에서 상위 히트로서 확인된 개별 변이체에 대한 모티프 주변 아미노산 서열은 상이하다. 예를 들어, MyoAAV 2A는 마우스에서 확인한 상위 제2 세대 변이체이고, 마우스 근육 형질도입에서 이것은 매우 강력하지만, 전신 투여 후 높은 효율로 NHP 근육을 형질도입시키지 않는다. 사실 본 명세서에서 이들 NHP 선택으로 확인된 모든 변이체는 NHP에서 재조합 AAV로서 전신 전달 후 근육 형질도입에 대해 시험했을 때 마우스에서 확인된 변이체보다 우수하였다. 다행스럽게도, 우리의 NHP 선택으로부터의 상위 캡시드 변이체는 마우스 근육 형질도입에서도 역시 매우 강력하여서, 치료제 개발에 매우 적용가능하다. 이들 결과는 영장류에서 가장 강력한 캡시드 변이체를 선택하기 위한 엄격한 선택 전략으로 생체내 유도 진화를 사용하는 것의 중요성을 강조한다.

요약하면, 이러한 실시예는 종에 걸쳐서 매우 강력한 근육-지정 AAV 캡시더 번이체 패밀리의 진화, 조작, 및 기계적 특징을 설명하고 입증한다. 또한 본 명세서는 유전적 근육 질환의 다수 마우스 모델에서, 저용량에서도, 이들 벡터의 치료적 효능을 입증하였다. 이들 벡터는 다수의 근골격 장애에 대한 근육-지정 치료 유전자 전달을 발전시킬 잠재성을 갖는다. 보다 광범위하게, 본 명세서에 기술된 DELIVER 시스템은 체내 임의 조직 또는 세포 유형에 대해 정확한 AAV 캡시드 변이체를 확인하기 위한 매우 적용가능한 플랫폼을 제공하고, 분야 및 부문에 걸쳐 이러한 벡터 시스템의 임상적 및 실험적 적용을 널리 확장시킬 수 있는 혁신이다. 추가적인 조직계 및 장기계에 DELIVER의 채택은 다양한 인간 질병에 대한 새로운 유전자 요법 및 기타 게놈 의학 접근 방식의 개발 및 번역을 가속화하는데 광범위한 영향을 미칠 것이다.

실시예 7의 참조

***

본 발명의 기재된 방법, 약학 조성물 및 키트의 다양한 변형 및 이형은 본 발명의 범주 및 취지를 벗어나지 않고 당업자에게 분명해질 것이다. 본 발명이 특별한 구현예와 함께 기재되어 있지만, 더욱 변형될 수 있고, 청구되는 본 발명이 이러한 특별한 구현예에 과도하게 제한되어서는 안된다는 것을 이해하게 될 것이다. 실제로, 당업자에게 자명한 본 발명을 수행하기 위해 기재된 방식의 다양한 변형은 본 발명의 범주 내에 포함되는 것으로 의도된다. 본 출원은 일반적으로 본 발명의 원리에 따른 본 발명의 임의의 변형, 용도, 또는 개조를 포괄하는 것으로 의도되고 본 개시물로부터의 이러한 이탈의 포함은 본 발명이 속하는 분야 내에서 공지의 통상적인 관례 내이며 이전에 기재된 본 명세서의 본질적인 특성에 적용될 수 있다.

SEQUENCE LISTING <110> The Broad Institute, Inc. Massachusetts Institute of Technology President and Fellows of Harvard College <120> Engineered Muscle Targeting Compositions <130> BROD-5215WP <150> 63/055,265 <151> 2020-07-22 <150> 63/107,394 <151> 2020-10-29 <150> 63/183,038 <151> 2021-05-02 <160> 773 <170> PatentIn version 3.5 <210> 1 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 1 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 2 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 2 Gly Pro Gly Arg Gly Asp Gln Thr Thr Leu 1 5 10 <210> 3 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 3 Ala Glu Gly Arg Gly Asp Gln Tyr Thr Arg 1 5 10 <210> 4 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 4 Ala Thr Gly Arg Gly Asp Leu Gly Gln Ala 1 5 10 <210> 5 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 5 Ala Val Ala Arg Gly Asp Gln Gly Leu Ile 1 5 10 <210> 6 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 6 Asn Ile Ser Arg Gly Asp Gln Gly Tyr Gln 1 5 10 <210> 7 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 7 Ala Pro Ala Arg Gly Asp Gln Gly Ser Gln 1 5 10 <210> 8 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 8 Arg Gly Asp Leu Ser Thr Pro 1 5 <210> 9 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 9 Arg Gly Asp Leu Asn Gln Tyr 1 5 <210> 10 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 10 Arg Gly Asp Ala Thr Glu Leu 1 5 <210> 11 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 11 Arg Gly Asp Thr Met Ser Lys 1 5 <210> 12 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 12 Arg Gly Asp Leu Thr Thr Pro 1 5 <210> 13 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (4)..(5) <223> n is a, t, c, or g <220> <221> misc_feature <222> (6)..(6) <223> n is g or t <220> <221> misc_feature <222> (7)..(8) <223> n is a, t, c, or g <220> <221> misc_feature <222> (9)..(9) <223> n is g or t <220> <221> misc_feature <222> (10)..(11) <223> n is a, t, c, or g <220> <221> misc_feature <222> (12)..(12) <223> n is g or t <220> <221> misc_feature <222> (13)..(14) <223> n is a, t, c, or g <220> <221> misc_feature <222> (15)..(15) <223> n is g or t <220> <221> misc_feature <222> (16)..(17) <223> n is a, t, c, or g <220> <221> misc_feature <222> (18)..(18) <223> n is g or t <220> <221> misc_feature <222> (19)..(20) <223> n is a, t, c, or g <220> <221> misc_feature <222> (21)..(21) <223> n is g or t <220> <221> misc_feature <222> (22)..(23) <223> n is a, t, c, or g <220> <221> misc_feature <222> (24)..(24) <223> n is g or t <400> 13 caannnnnnn nnnnnnnnnn nnnngca 27 <210> 14 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 14 Arg Gly Asp Gln Leu Tyr His 1 5 <210> 15 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 15 Arg Gly Asp Val Ala Ala Lys 1 5 <210> 16 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 16 Arg Gly Asp Met Ile Asn Thr 1 5 <210> 17 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 17 Arg Gly Asp Leu Asn Asp Ser 1 5 <210> 18 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 18 Arg Gly Asp Thr Met Asn Tyr 1 5 <210> 19 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (4)..(5) <223> n is a, t, c, or g <220> <221> misc_feature <222> (6)..(6) <223> n is g or t <220> <221> misc_feature <222> (7)..(8) <223> n is a, t, c, or g <220> <221> misc_feature <222> (9)..(9) <223> n is g or t <220> <221> misc_feature <222> (10)..(11) <223> n is a, t, c, or g <220> <221> misc_feature <222> (12)..(12) <223> n is g or t <220> <221> misc_feature <222> (22)..(23) <223> n is a, t, c, or g <220> <221> misc_feature <222> (24)..(24) <223> n is g or t <220> <221> misc_feature <222> (25)..(26) <223> n is a, t, c, or g <220> <221> misc_feature <222> (27)..(27) <223> n is g or t <220> <221> misc_feature <222> (28)..(29) <223> n is a, t, c, or g <220> <221> misc_feature <222> (30)..(30) <223> n is g or t <220> <221> misc_feature <222> (31)..(32) <223> n is a,, t, c, or g <220> <221> misc_feature <222> (33)..(33) <223> n is g or t <400> 19 cagnnnnnnn nnagaggaga cnnnnnnnnn nnngca 36 <210> 20 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 20 Ala Val Ser Arg Gly Asp Arg Met Glu Phe 1 5 10 <210> 21 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 21 Ser Pro Ser Arg Gly Asp Gln Gly Arg Thr 1 5 10 <210> 22 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 22 Arg Gly Asp Tyr Val Gly Leu 1 5 <210> 23 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 23 Arg Gly Asp Tyr Ser Gly Leu 1 5 <210> 24 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 24 Arg Gly Asp Tyr Ser Ser Val 1 5 <210> 25 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 25 Arg Gly Asp Tyr Arg Glu Leu 1 5 <210> 26 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 26 Arg Gly Asp His Gly Val Leu 1 5 <210> 27 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 27 Arg Gly Asp His Ala Ser Trp 1 5 <210> 28 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 28 Ser Asn Ser Arg Gly Asp Tyr Asn Ser Leu 1 5 10 <210> 29 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 29 Ser Thr Val Arg Gly Asp Tyr Thr Ser Met 1 5 10 <210> 30 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 30 Gln Glu Arg Arg Gly Asp Tyr Thr Ser Met 1 5 10 <210> 31 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 31 Ala Ser Thr Arg Gly Asp His Gly Val Leu 1 5 10 <210> 32 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 32 Glu Asn Arg Arg Gly Asp Phe Asn Asn Thr 1 5 10 <210> 33 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 33 Ser Ala Gln Arg Gly Asp Tyr Val Gly Leu 1 5 10 <210> 34 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 34 Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly 1 5 10 15 <210> 35 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 35 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 1 5 10 15 <210> 36 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 36 acttgtttaa gt 12 <210> 37 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (1)..(4) <223> n represents any set of nucleotides that are complementary to and together with base pair to nucleotides 9-12, where n is a, c, g, t, or u <220> <221> misc_feature <222> (9)..(12) <223> n represents any set of nucleotides that are complementary to and together with base pair to nucleotides 1-4, where n is a, c, g, t, or u <400> 37 nnnngtttnn nn 12 <210> 38 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 38 ggcaccgagt cggtgc 16 <210> 39 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (1)..(7) <223> n represents any set of nucleotides that are completementary to and together with base pair to nucleotides 11-17, where n is a, c, g, t, or u <220> <221> misc_feature <222> (11)..(17) <223> n represents any set of nucleotides that are completementary to and together with base pair to nucleotides 1-7, where n is a, c, g, t, or u <400> 39 nnnnnnnagt nnnnnnn 17 <210> 40 <211> 30 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (8)..(8) <223> n represents part of the bulge of the duplex, where n is a, c, g, t, or u <220> <221> misc_feature <222> (9)..(12) <223> n represents any set of nucelotides that are complementary to and together will base pair to nucleotides 17-20, where n is a, c, g, t, or u <220> <221> misc_feature <222> (13)..(16) <223> n represents a linker of any length and any base composition so long as it does not alter the overall structure of the duplex <220> <221> misc_feature <222> (17)..(220) <223> n represents any set of nucelotides that are complementary to and together will base pair to nucleotides 9-12, where n is a, c, g, t, or u <220> <221> misc_feature <222> (21)..(23) <223> part of the bulge in the duplex <400> 40 gyyyyagnnn nnnnnnnnnn aanuurrrru 30 <210> 41 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 41 gctgagggta gaggagacca gtatactcgt 30 <210> 42 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 42 gggccgggta gaggagacca gactacgttg 30 <210> 43 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 43 gcggaaggca gaggagacca atacacaagg 30 <210> 44 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 44 gcgactggta gaggagacct gggtcaggct 30 <210> 45 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 45 gcggtggcga gaggagacca gggtcttatt 30 <210> 46 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 46 aacatctcca gaggagacca aggttaccaa 30 <210> 47 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 47 gcgccggcta gaggagacca ggggagtcag 30 <210> 48 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 48 gccgttagca gaggagaccg gatggaattc 30 <210> 49 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 49 Gln Met Gly Arg Gly Asp Met Gly Ile Lys 1 5 10 <210> 50 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 50 cagatgggta gaggagacat ggggattaag 30 <210> 51 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 51 Glu Tyr Arg Arg Gly Asp Lys Ala Asp Ile 1 5 10 <210> 52 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 52 gagtatcgga gaggagacaa ggcggatatt 30 <210> 53 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 53 Glu Ser Arg Arg Gly Asp Lys Glu Pro Leu 1 5 10 <210> 54 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 54 gagagtcgga gaggagacaa ggagccgctg 30 <210> 55 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 55 Ala His Met Arg Gly Asp Leu Gly Gly Thr 1 5 10 <210> 56 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 56 gcacacatga gaggagacct aggcggcacg 30 <210> 57 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 57 Val Trp Gln Arg Gly Asp Lys Met Asp Met 1 5 10 <210> 58 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 58 gtgtggcaaa gaggagacaa aatggacatg 30 <210> 59 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 59 Ser Ile Gly Arg Gly Asp Thr Gly His Met 1 5 10 <210> 60 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 60 tctattggga gaggagacac gggtcatatg 30 <210> 61 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 61 Asn Ile Ala Arg Gly Asp Ala Gly Gln Tyr 1 5 10 <210> 62 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 62 aatattgcta gaggagacgc tggtcagtat 30 <210> 63 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 63 gcagtagcaa gaggagacca aggcttaatc 30 <210> 64 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 64 Ser Val Ser Arg Gly Asp Gln Gly Leu His 1 5 10 <210> 65 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 65 tcggtctcga gaggagacca aggattgcac 30 <210> 66 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 66 gaatacagga gaggagacaa agcagacatc 30 <210> 67 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 67 gcgcatatga gaggagactt gggggggact 30 <210> 68 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 68 Gln Ile Gly Arg Gly Asp Ile Thr His Gly 1 5 10 <210> 69 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 69 cagattggta gaggagacat tactcatggg 30 <210> 70 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 70 Glu Val Arg Arg Gly Asp Leu His Gly Thr 1 5 10 <210> 71 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 71 gaagtcagaa gaggagactt gcacgggaca 30 <210> 72 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 72 Ser Val Ser Arg Gly Asp Val His Thr Met 1 5 10 <210> 73 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 73 agtgtctcaa gaggagacgt gcacacgatg 30 <210> 74 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 74 Met Val Thr Arg Gly Asp Leu Gly Thr Arg 1 5 10 <210> 75 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 75 atggtgacta gaggagacct tggtacgcgg 30 <210> 76 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 76 Asn Gly Gly Arg Gly Asp Thr Thr His Phe 1 5 10 <210> 77 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 77 aacggcggga gaggagacac gacgcacttc 30 <210> 78 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 78 Thr Met Gly Arg Gly Asp Met Asn Ser Leu 1 5 10 <210> 79 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 79 acgatgggga gaggagacat gaattcgctt 30 <210> 80 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 80 Ala Ile Ser Arg Gly Asp Gln Gly Leu Ser 1 5 10 <210> 81 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 81 gcgattagta gaggagacca gggtctttct 30 <210> 82 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 82 Asn Asp Ala Arg Gly Asp Lys Ser Thr Tyr 1 5 10 <210> 83 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 83 aacgacgcaa gaggagacaa atccacatac 30 <210> 84 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 84 Val Gly Leu Arg Gly Asp Leu Thr Gly Ser 1 5 10 <210> 85 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 85 gtggggctga gaggagactt gacgggttcg 30 <210> 86 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 86 Glu Met Arg Arg Gly Asp Leu Gly Thr Ser 1 5 10 <210> 87 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 87 gagatgagga gaggagacct ggggacgagt 30 <210> 88 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 88 Ala Met Ser Arg Gly Asp Met Gly Met Ala 1 5 10 <210> 89 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 89 gcgatgagta gaggagacat ggggatggcg 30 <210> 90 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 90 gcaacgggca gaggagactt aggccaagca 30 <210> 91 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 91 Asn Val Ala Arg Gly Asp Gln Val Asn Tyr 1 5 10 <210> 92 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 92 aacgtagcaa gaggagacca agttaactac 30 <210> 93 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 93 agcatcggaa gaggagacac cggccacatg 30 <210> 94 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 94 Ala Ser Val Arg Gly Asp Leu Ser Gly Ser 1 5 10 <210> 95 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 95 gcatccgtaa gaggagacct atcaggctca 30 <210> 96 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 96 Ser Ala Ala Arg Gly Asp Thr Glu Arg Leu 1 5 10 <210> 97 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 97 agcgccgcga gaggagacac tgaacggcta 30 <210> 98 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 98 gccatgtcaa gaggagacat gggtatggct 30 <210> 99 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 99 agtccatcga gaggagacca aggacgcact 30 <210> 100 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 100 Val Pro Gly Arg Gly Asp Leu Asn Thr Met 1 5 10 <210> 101 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 101 gtgcctggga gaggagacct taatactatg 30 <210> 102 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 102 ggtcctggga gaggagacca aacgaccctt 30 <210> 103 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 103 Thr Ser Val Arg Gly Asp His Gly Thr Leu 1 5 10 <210> 104 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 104 acatcggtca gaggagacca cggaacattg 30 <210> 105 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 105 Thr Pro Ser Arg Gly Asp Leu Gly Gln Thr 1 5 10 <210> 106 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 106 acgccttcga gaggagacct tgggcagact 30 <210> 107 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 107 Ala Gly His Arg Gly Asp Thr Gly Val Ile 1 5 10 <210> 108 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 108 gctggacaca gaggagacac aggagtcatc 30 <210> 109 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 109 Ala Pro Ala Arg Gly Asp Gln Gly Ser Met 1 5 10 <210> 110 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 110 gcgccggcga gaggagacca gggtagtatg 30 <210> 111 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 111 Met Ser Leu Arg Gly Asp Leu Asn Gly Ser 1 5 10 <210> 112 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 112 atgtcgttga gaggagactt gaatgggtcg 30 <210> 113 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 113 Glu Ala Lys Arg Gly Asp Val His Ser Ile 1 5 10 <210> 114 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 114 gaggctaaga gaggagacgt gcattctatt 30 <210> 115 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 115 Ser Ala Gln Arg Gly Asp Val Gln Ala Val 1 5 10 <210> 116 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 116 agtgctcaga gaggagacgt gcaggcggtg 30 <210> 117 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 117 Ser Thr Ala Arg Gly Asp Gln Gly Asp Arg 1 5 10 <210> 118 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 118 agtacggcga gaggagacca gggggatagg 30 <210> 119 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 119 Gln Ile Ser Arg Gly Asp Leu Gly Ile Asn 1 5 10 <210> 120 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 120 cagattagta gaggagacct ggggattaat 30 <210> 121 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 121 Thr Phe Thr Arg Gly Asp Met Thr Met Asn 1 5 10 <210> 122 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 122 acgttcacaa gaggagacat gacgatgaac 30 <210> 123 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 123 Gln Glu Gly Arg Gly Asp Leu Asn Met Arg 1 5 10 <210> 124 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 124 caagaaggaa gaggagacct gaacatgagg 30 <210> 125 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 125 Ala His Ala Arg Gly Asp Thr Ser Ser Leu 1 5 10 <210> 126 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 126 gcacacgcaa gaggagacac cagctccctg 30 <210> 127 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 127 Thr Asn Gly Arg Gly Asp Ala Gly Thr Leu 1 5 10 <210> 128 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 128 acgaatggga gaggagacgc tgggactctg 30 <210> 129 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 129 Ala Phe Gly Arg Gly Asp Gln Gly Gln Leu 1 5 10 <210> 130 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 130 gctttcggca gaggagacca agggcaacta 30 <210> 131 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 131 Ala Asp Gly Arg Gly Asp Arg Ser Ser Leu 1 5 10 <210> 132 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 132 gctgatggga gaggagaccg ttcgtctctg 30 <210> 133 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 133 Asp Gly Arg Arg Gly Asp Gly His Ser Leu 1 5 10 <210> 134 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 134 gacggacgca gaggagacgg acacagcctt 30 <210> 135 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 135 Glu Lys Leu Arg Gly Asp Leu His Ser Thr 1 5 10 <210> 136 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 136 gagaagttga gaggagacct tcattcgact 30 <210> 137 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 137 Glu Ala Arg Arg Gly Asp Ala Ser Ala Met 1 5 10 <210> 138 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 138 gaggcgcgta gaggagacgc ttcggcgatg 30 <210> 139 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 139 Met Gly Thr Arg Gly Asp Lys Met Asp Phe 1 5 10 <210> 140 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 140 atgggaacga gaggagacaa aatggacttc 30 <210> 141 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 141 Ser Thr Ser Arg Gly Asp Arg Glu Ser Tyr 1 5 10 <210> 142 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 142 tcgacttcga gaggagaccg ggagtcgtat 30 <210> 143 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 143 Cys Gln Pro Arg Gly Asp Thr Thr Arg Cys 1 5 10 <210> 144 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 144 tgtcagccga gaggagacac gactcggtgt 30 <210> 145 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 145 Met His Thr Arg Gly Asp Lys Met Asp Phe 1 5 10 <210> 146 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 146 atgcacacga gaggagacaa aatggacttc 30 <210> 147 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 147 Tyr Ser Ala Arg Gly Asp Thr Ser Gly Leu 1 5 10 <210> 148 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 148 tacagtgcca gaggagacac aagtggcctg 30 <210> 149 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 149 Ser Thr Met Arg Gly Asp His Glu Lys Leu 1 5 10 <210> 150 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 150 tcgacgatga gaggagacca tgagaagttg 30 <210> 151 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 151 Thr Gln Met Arg Gly Asp Gly Val Thr Leu 1 5 10 <210> 152 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 152 acccaaatga gaggagacgg ggtcacacta 30 <210> 153 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 153 Thr Thr Arg Arg Gly Asp Met Gly Asp Asn 1 5 10 <210> 154 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 154 actactcgta gaggagacat gggggataat 30 <210> 155 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 155 Ala Asn Gly Arg Gly Asp Arg Leu Glu Leu 1 5 10 <210> 156 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 156 gcgaatggta gaggagacag gctggagttg 30 <210> 157 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 157 gctgtgtcta gaggagacag gatggagttt 30 <210> 158 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 158 Glu Asn Gln Arg Gly Asp Leu Ser Gly Arg 1 5 10 <210> 159 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 159 gagaatcaga gaggagactt gtcgggtcgg 30 <210> 160 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 160 Ser Thr Gly Arg Gly Asp Leu Gly Gln Ala 1 5 10 <210> 161 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 161 tcgactggta gaggagacct ggggcaggct 30 <210> 162 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 162 atgcatacta gaggagacaa gatggatttt 30 <210> 163 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 163 Ser Ser Ala Arg Gly Asp Tyr Ser Glu Val 1 5 10 <210> 164 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 164 agtagtgcga gaggagacta tagtgaggtg 30 <210> 165 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 165 gcgtttggga gaggagacca gggtcagctt 30 <210> 166 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 166 Ser Thr Ala Arg Gly Asp Ala Ala Thr Tyr 1 5 10 <210> 167 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 167 agtacggcga gaggagacgc ggcgacttat 30 <210> 168 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 168 Val Asn Thr Arg Gly Asp Thr Gln Lys Leu 1 5 10 <210> 169 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 169 gtcaacacaa gaggagacac tcaaaaactt 30 <210> 170 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 170 Ala Met Ser Arg Gly Asp His Ala Ser Leu 1 5 10 <210> 171 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 171 gcgatgagta gaggagacca tgcgtcgctt 30 <210> 172 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 172 Gln Ala Ala Arg Gly Asp Val Asn Lys Leu 1 5 10 <210> 173 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 173 caggctgcta gaggagacgt taataagctg 30 <210> 174 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 174 Arg Gly Thr Arg Gly Asp Thr Val Glu Leu 1 5 10 <210> 175 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 175 aggggtacga gaggagacac ggttgagttg 30 <210> 176 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 176 accacccgga gaggagacat gggagacaac 30 <210> 177 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 177 Ala Ser Thr Arg Gly Asp Tyr Ala Gly Val 1 5 10 <210> 178 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 178 gctagtacga gaggagacta tgcgggtgtt 30 <210> 179 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 179 Asp Asp Arg Arg Gly Asp Lys Leu Pro Leu 1 5 10 <210> 180 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 180 gacgacagga gaggagacaa actgcccctt 30 <210> 181 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 181 Ser Gly Ser Arg Gly Asp Leu Asn Ala Val 1 5 10 <210> 182 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 182 tcggggtcga gaggagacct gaatgcggtg 30 <210> 183 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 183 Glu Tyr Arg Arg Gly Asp Gln Gln Ile Gln 1 5 10 <210> 184 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 184 gagtatagga gaggagacca gcagattcag 30 <210> 185 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 185 Thr Tyr Val Arg Gly Asp Arg Ala Glu Val 1 5 10 <210> 186 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 186 acgtacgtca gaggagacag agcagaagtg 30 <210> 187 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 187 Gln Ser Leu Arg Gly Asp Leu Asn Gly Ser 1 5 10 <210> 188 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 188 caatcactaa gaggagactt gaacggatcc 30 <210> 189 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 189 Glu Gly Arg Arg Gly Asp Thr Thr Ser Leu 1 5 10 <210> 190 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 190 gagggtcgga gaggagacac gacgtcgttg 30 <210> 191 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 191 Ala Glu Asn Arg Gly Asp Arg Ser Ser Leu 1 5 10 <210> 192 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 192 gcggagaata gaggagaccg gtcgagtttg 30 <210> 193 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 193 Val Ala Gly Arg Gly Asp Arg Ser Glu Leu 1 5 10 <210> 194 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 194 gtggctggga gaggagaccg tagtgagctg 30 <210> 195 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 195 Asp Pro Ala Arg Gly Asp Ile Gly Ala Arg 1 5 10 <210> 196 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 196 gatccggcga gaggagacat tggtgcgcgt 30 <210> 197 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 197 gaaatgcgca gaggagactt gggaacttca 30 <210> 198 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 198 gtttggcaga gaggagacaa gatggatatg 30 <210> 199 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 199 Val Ile Gly Arg Gly Asp Lys Ala Leu Gln 1 5 10 <210> 200 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 200 gtgattggga gaggagacaa ggcgcttcag 30 <210> 201 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 201 Ser Phe Glu Arg Gly Asp Lys Asn Ser Leu 1 5 10 <210> 202 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 202 agcttcgaaa gaggagacaa aaactctctt 30 <210> 203 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 203 Gln Ile Ala Arg Gly Asp Ile Ala Ser Val 1 5 10 <210> 204 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 204 cagattgcta gaggagacat tgctagtgtg 30 <210> 205 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 205 Thr Ile Ser Arg Gly Asp Leu Gly Gly Ala 1 5 10 <210> 206 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 206 acgattagta gaggagacct gggtggggct 30 <210> 207 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 207 Ala Met Ile Arg Gly Asp Met Thr His Ser 1 5 10 <210> 208 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 208 gcgatgatta gaggagacat gacgcatagt 30 <210> 209 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 209 acgagtgtga gaggagacca tgggacgctg 30 <210> 210 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 210 Thr Met Arg Arg Gly Asp Leu Asn Asp Ser 1 5 10 <210> 211 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 211 acgatgcgga gaggagacct gaatgatagt 30 <210> 212 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 212 Ala Tyr Ser Arg Gly Asp Leu Gly Asn His 1 5 10 <210> 213 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 213 gcctactcca gaggagacct aggcaaccac 30 <210> 214 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 214 Glu Glu Arg Arg Gly Asp Thr His Arg Leu 1 5 10 <210> 215 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 215 gaggagcgga gaggagacac tcatcggctg 30 <210> 216 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 216 Ser Gln Leu Arg Gly Asp Ala Gly Thr Ile 1 5 10 <210> 217 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 217 tcacaactaa gaggagacgc ggggacaatc 30 <210> 218 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 218 Ala Met Val Arg Gly Asp Ala His Gln Leu 1 5 10 <210> 219 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 219 gcgatggtga gaggagacgc gcatcagctg 30 <210> 220 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 220 Thr Thr Ser Arg Gly Asp Leu Asn Ser Val 1 5 10 <210> 221 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 221 acgactagta gaggagactt gaattcggtt 30 <210> 222 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 222 Trp Glu Gln Arg Gly Asp Met Ile Gly Lys 1 5 10 <210> 223 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 223 tgggagcaga gaggagacat gattgggaag 30 <210> 224 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 224 Tyr Thr Thr Arg Gly Asp Leu Gln Ser Asn 1 5 10 <210> 225 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 225 tacaccacca gaggagacct ccaatcaaac 30 <210> 226 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 226 Met Ser Gln Arg Gly Asp Leu Ser His Gln 1 5 10 <210> 227 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 227 atgtcgcaga gaggagacct ttcgcatcag 30 <210> 228 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 228 Ala Ser Thr Arg Gly Asp Thr Thr His Met 1 5 10 <210> 229 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 229 gcgagtacta gaggagacac gacgcatatg 30 <210> 230 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 230 Ser Asp Thr Arg Gly Asp Thr His Arg Leu 1 5 10 <210> 231 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 231 tcagacacca gaggagacac ccacagactg 30 <210> 232 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 232 Thr Leu Gly Arg Gly Asp Gln Tyr Thr Ser 1 5 10 <210> 233 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 233 acgctgggta gaggagacca gtatacgagt 30 <210> 234 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 234 Ser Tyr Ala Arg Gly Asp Val Arg Glu Val 1 5 10 <210> 235 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 235 tcgtatgcga gaggagacgt tagggaggtt 30 <210> 236 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 236 Glu Thr Arg Arg Gly Asp Leu Ser Gln Asn 1 5 10 <210> 237 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 237 gagactcgta gaggagacct gagtcagaat 30 <210> 238 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 238 Thr Ile Gly Arg Gly Asp Leu Met Asp Lys 1 5 10 <210> 239 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 239 acaatcggga gaggagacct gatggacaaa 30 <210> 240 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 240 Ser Tyr Thr Arg Gly Asp Leu Ser Gln Asn 1 5 10 <210> 241 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 241 agttacacca gaggagacct tagccaaaac 30 <210> 242 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 242 Ser Lys Leu Arg Gly Asp Ala Ser Glu Ile 1 5 10 <210> 243 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 243 tcgaagctga gaggagacgc tagtgagatt 30 <210> 244 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 244 Ser Met Ala Arg Gly Asp Lys Ala Glu Ile 1 5 10 <210> 245 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 245 tcgatggcga gaggagacaa ggcggagatt 30 <210> 246 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 246 Gly Ala Val Arg Gly Asp His Ser Ser Leu 1 5 10 <210> 247 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 247 ggagccgtca gaggagacca ctcatcgtta 30 <210> 248 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 248 Met Glu Thr Arg Gly Asp Met Ser Asn Arg 1 5 10 <210> 249 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 249 atggagacga gaggagacat gagtaatcgt 30 <210> 250 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 250 Ala Tyr Thr Arg Gly Asp Lys Asp Ala Leu 1 5 10 <210> 251 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 251 gcgtacacaa gaggagacaa agacgcacta 30 <210> 252 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 252 Glu Asn Arg Arg Gly Asp Ile Thr Gln Ser 1 5 10 <210> 253 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 253 gagaatcgga gaggagacat tacgcagtcg 30 <210> 254 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 254 tccacgggca gaggagacct tggacaagca 30 <210> 255 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 255 ggtgctgtta gaggagacca tagtagtctt 30 <210> 256 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 256 tctcagctta gaggagacgc tggtacgatt 30 <210> 257 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 257 Met Leu Leu Arg Gly Asp Lys Asn Asp Phe 1 5 10 <210> 258 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 258 atgctcctaa gaggagacaa aaacgacttc 30 <210> 259 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 259 Lys Val Gln Arg Gly Asp Ala Ser Asp Trp 1 5 10 <210> 260 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 260 aaggtgcaga gaggagacgc gagtgattgg 30 <210> 261 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 261 Ala Phe Thr Arg Gly Asp Met Gln Thr Ala 1 5 10 <210> 262 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 262 gcgtttacga gaggagacat gcagactgct 30 <210> 263 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 263 Gln Pro Lys Arg Gly Asp Val Gln Ala Gln 1 5 10 <210> 264 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 264 cagcctaaga gaggagacgt tcaggctcag 30 <210> 265 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 265 Ala Ser Leu Arg Gly Asp Met Gly Val Ser 1 5 10 <210> 266 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 266 gctagtctga gaggagacat gggggtgagt 30 <210> 267 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 267 Ala Tyr Ser Arg Gly Asp Lys Glu Ser Phe 1 5 10 <210> 268 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 268 gcctactcca gaggagacaa agaatcgttc 30 <210> 269 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 269 Arg Phe Gln Arg Gly Asp Leu Thr Asp Ala 1 5 10 <210> 270 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 270 cggttccaaa gaggagactt gaccgacgct 30 <210> 271 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 271 Ser Asp Ala Arg Gly Asp Thr Met Lys Leu 1 5 10 <210> 272 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 272 tctgatgcta gaggagacac gatgaagctg 30 <210> 273 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 273 Ser Gly Ala Arg Gly Asp Thr Val Ser Leu 1 5 10 <210> 274 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 274 agcggggcca gaggagacac agtaagtctc 30 <210> 275 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 275 Asp Glu Lys Arg Gly Asp Gln Lys His Leu 1 5 10 <210> 276 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 276 gatgagaaga gaggagacca gaagcatctt 30 <210> 277 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 277 Asn Gly Val Arg Gly Asp Val Gln Asn Phe 1 5 10 <210> 278 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 278 aacggagtaa gaggagacgt ccaaaacttc 30 <210> 279 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 279 Met Thr Leu Arg Gly Asp Leu Gly Gly Ser 1 5 10 <210> 280 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 280 atgacgttga gaggagacct gggtgggtcg 30 <210> 281 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 281 gaggctagga gaggagacgc tagtgcgatg 30 <210> 282 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 282 Gly Gln Glu Arg Gly Asp Leu Gly Thr Arg 1 5 10 <210> 283 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 283 gggcaggaga gaggagacct ggggactcgg 30 <210> 284 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 284 Arg Gly Ala Arg Gly Asp Leu Val Asp Ala 1 5 10 <210> 285 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 285 agaggcgcca gaggagacct agtcgacgct 30 <210> 286 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 286 Gln Tyr Ser Arg Gly Asp His Thr Asp Leu 1 5 10 <210> 287 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 287 caatactcca gaggagacca caccgacctt 30 <210> 288 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 288 Met Asn Thr Arg Gly Asp Val His Ala Met 1 5 10 <210> 289 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 289 atgaacacca gaggagacgt gcacgctatg 30 <210> 290 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 290 Thr Val Arg Arg Gly Asp Leu Ala Thr Glu 1 5 10 <210> 291 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 291 acggtacgga gaggagacct agcaaccgaa 30 <210> 292 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 292 aatattgcga gaggagacgc tggtcagtat 30 <210> 293 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 293 Ser Val Gly Arg Gly Asp Lys Ala Asp Ile 1 5 10 <210> 294 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 294 tctgttggga gaggagacaa ggctgatatt 30 <210> 295 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 295 Ser His Asn Arg Gly Asp Thr Gly Thr Met 1 5 10 <210> 296 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 296 tcacacaaca gaggagacac cggaaccatg 30 <210> 297 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 297 Thr Asn Thr Arg Gly Asp Lys Glu Ser Val 1 5 10 <210> 298 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 298 acgaacacca gaggagacaa agaatcagta 30 <210> 299 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 299 Ser Ile Gly Arg Gly Asp Gln Tyr Thr Ile 1 5 10 <210> 300 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 300 tcgattggta gaggagacca gtatacgatt 30 <210> 301 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 301 Gln Thr Ser Arg Gly Asp Ala Gly Ser Trp 1 5 10 <210> 302 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 302 cagacgagta gaggagacgc ggggtcttgg 30 <210> 303 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 303 gctgaaaaca gaggagaccg aagcagccta 30 <210> 304 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 304 Ala Ile Ser Arg Gly Asp Val Gln Ser Leu 1 5 10 <210> 305 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 305 gcgatttcga gaggagacgt tcagtcgttg 30 <210> 306 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 306 Asn Ala Gln Arg Gly Asp His Gly Gln Leu 1 5 10 <210> 307 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 307 aacgcacaaa gaggagacca cgggcaactg 30 <210> 308 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 308 Leu Asn Ser Arg Gly Asp Gln Ala Ser Val 1 5 10 <210> 309 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 309 ctcaactcga gaggagacca agcctccgtc 30 <210> 310 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 310 Ser Gly Asn Arg Gly Asp Ile Gly Thr Phe 1 5 10 <210> 311 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 311 tcgggaaaca gaggagacat aggtacattc 30 <210> 312 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 312 Asn Val Gly Arg Gly Asp Gln Ala Thr Met 1 5 10 <210> 313 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 313 aacgtgggaa gaggagacca agccacaatg 30 <210> 314 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 314 Ser Tyr Ser Arg Gly Asp Thr Gly Arg Leu 1 5 10 <210> 315 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 315 tcgtattcta gaggagacac tggtcggctt 30 <210> 316 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 316 Ser His Leu Arg Gly Asp Gln Ala Leu Ala 1 5 10 <210> 317 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 317 agccacttaa gaggagacca agcgttggcc 30 <210> 318 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 318 Tyr Phe Ala Arg Gly Asp Met Thr Met Asn 1 5 10 <210> 319 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 319 tacttcgcca gaggagacat gactatgaac 30 <210> 320 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 320 Gln Ser Gln Arg Gly Asp Leu Asn Pro Met 1 5 10 <210> 321 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 321 cagtcgcaga gaggagacct taatcctatg 30 <210> 322 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 322 Glu Gln Arg Arg Gly Asp Lys Thr Glu Leu 1 5 10 <210> 323 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 323 gagcagagga gaggagacaa gacggagctg 30 <210> 324 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 324 Val Ser Ala Arg Gly Asp Ala Gly Gln Leu 1 5 10 <210> 325 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 325 gtgtctgcga gaggagacgc gggtcagttg 30 <210> 326 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 326 tctccgtcta gaggagacca ggggcggacg 30 <210> 327 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 327 Glu Ala Ser Arg Gly Asp Lys Gly Thr His 1 5 10 <210> 328 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 328 gaggctagta gaggagacaa gggtacgcat 30 <210> 329 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 329 Leu Ser Thr Arg Gly Asp Met Gly Met Gln 1 5 10 <210> 330 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 330 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Val Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Ala Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 331 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 331 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Val Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Ala Ser Thr Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 332 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 332 ctgtctacta gaggagacat gggtatgcag 30 <210> 333 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 333 Ala Asn Met Arg Gly Asp Gln Leu His Thr 1 5 10 <210> 334 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 334 gcgaatatga gaggagacca gctgcatact 30 <210> 335 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 335 Glu Asn Thr Arg Gly Asp Leu Thr His Ala 1 5 10 <210> 336 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 336 gagaatacga gaggagacct tactcatgcg 30 <210> 337 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 337 Ile Glu Arg Arg Gly Asp Ser Ala Gly Leu 1 5 10 <210> 338 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 338 attgagcgta gaggagactc ggcggggctg 30 <210> 339 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 339 Ser Ala Met Arg Gly Asp Gly Val Ser Leu 1 5 10 <210> 340 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 340 agtgcgatga gaggagacgg agtgagcttg 30 <210> 341 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 341 Thr Val Ser Arg Gly Asp Gln Gly Leu Ser 1 5 10 <210> 342 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 342 acggtttcga gaggagacca ggggttgtct 30 <210> 343 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 343 Ser Ile Val Arg Gly Asp Leu Asn Ser Thr 1 5 10 <210> 344 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 344 tcgatcgtca gaggagacct gaactccacg 30 <210> 345 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 345 Asp Val Ala Arg Gly Asp Lys Thr Asn Phe 1 5 10 <210> 346 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 346 gacgtagcga gaggagacaa aacaaacttc 30 <210> 347 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 347 Trp Ser Gln Arg Gly Asp Leu Ser Gly Thr 1 5 10 <210> 348 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 348 tggagccaaa gaggagacct gagtggaacc 30 <210> 349 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 349 Leu Asn Gln Arg Gly Asp Val Ser Asn Met 1 5 10 <210> 350 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 350 ctgaaccaaa gaggagacgt ttccaacatg 30 <210> 351 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 351 Ala Ala Leu Arg Gly Asp Leu Ser Gly Ser 1 5 10 <210> 352 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 352 gccgccctaa gaggagacct atccggctca 30 <210> 353 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 353 Arg Val Ala Arg Gly Asp Ile Thr Asp Ile 1 5 10 <210> 354 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 354 agggttgcga gaggagacat tacggatatt 30 <210> 355 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 355 Ser Thr Asn Arg Gly Asp Leu Asn Gln Val 1 5 10 <210> 356 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 356 tcgacgaaca gaggagacct caaccaagtt 30 <210> 357 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 357 Asp Ser Arg Arg Gly Asp Ser Val Ser Leu 1 5 10 <210> 358 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 358 gattcgcgga gaggagactc tgtgagtctt 30 <210> 359 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 359 Ser Val Gly Arg Gly Asp Gln Ser Gln Met 1 5 10 <210> 360 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 360 agtgttggga gaggagacca gtctcagatg 30 <210> 361 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 361 Ser Asn Thr Arg Gly Asp Thr Asn Ser Leu 1 5 10 <210> 362 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 362 tccaacacga gaggagacac aaactcccta 30 <210> 363 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 363 Asp Asn Arg Arg Gly Asp Gly Thr Thr Met 1 5 10 <210> 364 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 364 gataatcgga gaggagacgg tacgactatg 30 <210> 365 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 365 Thr Pro Ser Arg Gly Asp Gln Gly Arg Leu 1 5 10 <210> 366 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 366 acgccttcga gaggagacca aggaagacta 30 <210> 367 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 367 Asn Tyr Ser Arg Gly Asp Ser Met Thr Leu 1 5 10 <210> 368 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 368 aactacagca gaggagactc aatgacgctt 30 <210> 369 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 369 Met Gln Ala Arg Gly Asp Ala Gly Thr Leu 1 5 10 <210> 370 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 370 atgcaggcta gaggagacgc tgggactctg 30 <210> 371 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 371 Thr Gln Ser Arg Gly Asp Leu Ser Gly Ala 1 5 10 <210> 372 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 372 acgcagtcga gaggagactt gtctggtgcg 30 <210> 373 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 373 Phe Ala Gln Arg Gly Asp Leu Thr Gly Val 1 5 10 <210> 374 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 374 tttgcgcaga gaggagactt gactggggtt 30 <210> 375 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 375 Ala Pro Val Arg Gly Asp Leu Ile Gly Thr 1 5 10 <210> 376 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 376 gcgccggtga gaggagacct gattggtacg 30 <210> 377 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 377 tcgaatacta gaggagacac gaatagtttg 30 <210> 378 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 378 Glu Pro Lys Arg Gly Asp Leu Ser Asn Thr 1 5 10 <210> 379 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 379 gagccgaaga gaggagactt gagtaatacg 30 <210> 380 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 380 Ser Val Gly Arg Gly Asp Thr Tyr Pro Leu 1 5 10 <210> 381 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 381 tcggttggga gaggagacac ttatcctctg 30 <210> 382 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 382 Gln Thr Ala Arg Gly Asp Met Thr Gly His 1 5 10 <210> 383 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 383 caaacagcca gaggagacat gactggccac 30 <210> 384 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 384 Ala Gly Ala Arg Gly Asp Leu Glu Asn Arg 1 5 10 <210> 385 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 385 gctggtgcga gaggagactt ggagaatcgg 30 <210> 386 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 386 Met Ser Thr Arg Gly Asp Leu Asn Asn Val 1 5 10 <210> 387 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 387 atgagcacta gaggagacct aaacaacgtc 30 <210> 388 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 388 Glu Lys Gln Arg Gly Asp Leu Asn Ser Met 1 5 10 <210> 389 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 389 gaaaaacaaa gaggagacct caacagcatg 30 <210> 390 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 390 Ile Lys Thr Arg Gly Asp Leu Gly His Glu 1 5 10 <210> 391 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 391 attaagacga gaggagacct tggtcatgag 30 <210> 392 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 392 Ile Gly Arg Arg Gly Asp Met Glu Leu Ser 1 5 10 <210> 393 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 393 attgggagga gaggagacat ggagttgtct 30 <210> 394 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 394 Thr Thr Gly Arg Gly Asp Leu Lys Glu Val 1 5 10 <210> 395 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 395 actacgggta gaggagactt gaaggaggtt 30 <210> 396 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 396 Thr Asp Lys Arg Gly Asp Gln Asn Thr Val 1 5 10 <210> 397 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 397 acggataaga gaggagacca gaatactgtg 30 <210> 398 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 398 Ser Asn Val Arg Gly Asp Arg Glu Ala Val 1 5 10 <210> 399 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 399 tcgaatgtta gaggagaccg ggaggcggtt 30 <210> 400 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 400 tcagtcggca gaggagacca aagtcaaatg 30 <210> 401 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 401 Tyr Ala Asn Arg Gly Asp Leu Ser His Gln 1 5 10 <210> 402 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 402 tacgccaaca gaggagacct gagtcaccaa 30 <210> 403 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 403 caaatatcga gaggagacct aggtatcaac 30 <210> 404 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 404 Ser Met Met Arg Gly Asp Ala Gly Gln Leu 1 5 10 <210> 405 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 405 tcgatgatga gaggagacgc tgggcagttg 30 <210> 406 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 406 Glu Ala Arg Arg Gly Asp Ser Gln Gly Leu 1 5 10 <210> 407 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 407 gaggcgcgga gaggagacag tcaggggctg 30 <210> 408 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 408 Met Pro Thr Arg Gly Asp Gln Thr Lys Phe 1 5 10 <210> 409 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 409 atgcccacaa gaggagacca aaccaaattc 30 <210> 410 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 410 tcaaactcca gaggagacta caactccttg 30 <210> 411 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 411 Ser Ser Ala Arg Gly Asp Arg Asp Tyr Leu 1 5 10 <210> 412 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 412 tcgtcggcta gaggagaccg tgattatctg 30 <210> 413 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 413 Ser Thr Val Arg Gly Asp Tyr Thr Ser Val 1 5 10 <210> 414 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 414 agcacggtca gaggagacta cacgtccgtg 30 <210> 415 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 415 caggagcgga gaggagacta tacgagtatg 30 <210> 416 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 416 aacggcggga gaggagacac gacgcacttc 30 <210> 417 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 417 gcgagtacta gaggagacca tggtgtgttg 30 <210> 418 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 418 Ser Tyr Gln Arg Gly Asp Gln His Asn Met 1 5 10 <210> 419 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 419 tcgtaccaaa gaggagacca acacaacatg 30 <210> 420 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 420 Asn Asp Thr Arg Gly Asp Arg Ser Tyr Met 1 5 10 <210> 421 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 421 aacgacacaa gaggagaccg atcttacatg 30 <210> 422 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 422 gaaaacagga gaggagactt caacaacact 30 <210> 423 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 423 Ser Gly Ser Arg Gly Asp Leu Ser Gly His 1 5 10 <210> 424 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 424 tccggctcga gaggagactt gtcaggacac 30 <210> 425 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 425 gagaatcgga gaggagacat tacgcagtcg 30 <210> 426 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 426 Asp Lys Pro Arg Gly Asp Arg Gln Leu Leu 1 5 10 <210> 427 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 427 gataagccga gaggagaccg gcagttgttg 30 <210> 428 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 428 gaggagcgga gaggagacac tcatcggctg 30 <210> 429 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 429 gcgatgatta gaggagacat gacgcatagt 30 <210> 430 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 430 Ser Asn Asn Arg Gly Asp Tyr Thr Thr Met 1 5 10 <210> 431 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 431 tcaaacaaca gaggagacta cacgacaatg 30 <210> 432 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 432 Gln Gly Gly Arg Gly Asp Leu Ser Thr Leu 1 5 10 <210> 433 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 433 cagggtggga gaggagactt gtcgacgttg 30 <210> 434 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 434 Ser Lys Asp Arg Gly Asp Tyr Gln Thr Leu 1 5 10 <210> 435 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 435 tcgaaggata gaggagacta tcagactctt 30 <210> 436 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 436 Ala Thr Ala Arg Gly Asp Gln Met Lys Leu 1 5 10 <210> 437 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 437 gctacggcga gaggagacca gatgaagctg 30 <210> 438 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 438 Gln His Met Arg Gly Asp Leu Thr Gly Ala 1 5 10 <210> 439 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 439 cagcatatga gaggagactt gactggtgcg 30 <210> 440 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 440 Asp Gly Thr Arg Gly Asp Leu Gly Arg Tyr 1 5 10 <210> 441 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 441 gacggcacga gaggagacct tggaaggtac 30 <210> 442 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 442 Asp Ser Arg Arg Gly Asp Tyr Ala Asn Leu 1 5 10 <210> 443 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 443 gactctcgga gaggagacta cgcaaacctc 30 <210> 444 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 444 Ser Ala Met Arg Gly Asp Tyr Thr Ser Thr 1 5 10 <210> 445 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 445 tcggcgatga gaggagacta tactagtact 30 <210> 446 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 446 Glu Asn Arg Arg Gly Asp Ala Gln Leu Leu 1 5 10 <210> 447 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 447 gagaatcgga gaggagacgc gcagctgctg 30 <210> 448 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 448 Thr Thr Leu Arg Gly Asp His Ser Gln Leu 1 5 10 <210> 449 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 449 acgacgctga gaggagacca tagtcagctt 30 <210> 450 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 450 Asp Ala Gly Arg Gly Asp Met His Arg Met 1 5 10 <210> 451 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 451 gacgcaggga gaggagacat gcaccgtatg 30 <210> 452 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 452 Gln His Thr Arg Gly Asp Leu Ser Ser Thr 1 5 10 <210> 453 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 453 cagcatacga gaggagactt gagttctact 30 <210> 454 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 454 Gln Val Tyr Arg Gly Asp Arg Glu Ser Val 1 5 10 <210> 455 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 455 caagtttaca gaggagacag ggaatccgtg 30 <210> 456 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 456 Ser Ser Gln Arg Gly Asp Leu Ala Gly Thr 1 5 10 <210> 457 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 457 tcgagtcaga gaggagactt ggctggtact 30 <210> 458 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 458 Thr Asp Val Arg Gly Asp Arg Gly Thr Phe 1 5 10 <210> 459 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 459 acggatgtta gaggagacag ggggacgttt 30 <210> 460 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 460 Ser Ser Val Arg Gly Asp Arg Glu Val Thr 1 5 10 <210> 461 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 461 tcgtctgtga gaggagaccg ggaggtgacg 30 <210> 462 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 462 Glu Asn Arg Arg Gly Asp Leu Thr Asn Ala 1 5 10 <210> 463 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 463 gagaatagga gaggagacct gactaatgcg 30 <210> 464 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 464 Ser Tyr Ala Arg Gly Asp Val His Ser Ile 1 5 10 <210> 465 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 465 tcgtatgcga gaggagacgt tcattctatt 30 <210> 466 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 466 Asp Ser Ser Arg Gly Asp Leu Asn Leu Arg 1 5 10 <210> 467 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 467 gacagctcaa gaggagacct caacctccgg 30 <210> 468 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 468 Ser Asn Ala Arg Gly Asp Tyr Ser Asn Met 1 5 10 <210> 469 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 469 tcgaacgcga gaggagacta ctcaaacatg 30 <210> 470 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 470 Ser Ser Val Arg Gly Asp His Ser Val Leu 1 5 10 <210> 471 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 471 tcgtctgtga gaggagacca ttcggtgctt 30 <210> 472 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 472 Ser Ala Phe Arg Gly Asp Leu His Ala Thr 1 5 10 <210> 473 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 473 tcggctttta gaggagacct gcatgctact 30 <210> 474 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 474 tccgccatga gaggagacta cacaagcacg 30 <210> 475 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 475 aacgcacaaa gaggagacca cgggcaactg 30 <210> 476 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 476 Ser Asp Arg Arg Gly Asp Gln Leu Leu Tyr 1 5 10 <210> 477 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 477 tcggatcgga gaggagacca gctgttgtat 30 <210> 478 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 478 Ser Gly Val Arg Gly Asp Arg Leu Ala Val 1 5 10 <210> 479 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 479 agcggcgtaa gaggagaccg cctagccgta 30 <210> 480 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 480 Ala Ser Leu Arg Gly Asp Leu Ser Ser Thr 1 5 10 <210> 481 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 481 gccagcctaa gaggagacct cagctcaacg 30 <210> 482 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 482 Thr Asn Gly Arg Gly Asp Leu His Gly Met 1 5 10 <210> 483 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 483 acgaacggaa gaggagacct tcacggaatg 30 <210> 484 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 484 Thr Asn Thr Arg Gly Asp His Gly Met Leu 1 5 10 <210> 485 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 485 acgaatacga gaggagacca tgggatgctg 30 <210> 486 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 486 agttccgcca gaggagaccg ggactacctc 30 <210> 487 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 487 Glu Asp Arg Arg Gly Asp Leu Leu Arg Thr 1 5 10 <210> 488 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 488 gaggatcgga gaggagacct tttgaggact 30 <210> 489 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 489 Ser Ser Leu Arg Gly Asp Leu Leu His Ser 1 5 10 <210> 490 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 490 tcgtcgctga gaggagacct gttgcattct 30 <210> 491 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 491 gaaaaccgta gaggagacct cacgaacgct 30 <210> 492 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 492 Asp Gly Arg Arg Gly Asp Arg Glu Ser Ile 1 5 10 <210> 493 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 493 gacggcagga gaggagaccg ggaatcgatc 30 <210> 494 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 494 Thr Gly Thr Arg Gly Asp Thr Met Thr Trp 1 5 10 <210> 495 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 495 actggaacca gaggagacac aatgacatgg 30 <210> 496 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 496 tcgactgtta gaggagacta tacttctgtt 30 <210> 497 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 497 Ser Ala Thr Arg Gly Asp His Asn Val Leu 1 5 10 <210> 498 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 498 tcggcaacga gaggagacca caacgtactg 30 <210> 499 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 499 Thr Asp Arg Arg Gly Asp Ser Gly Thr Leu 1 5 10 <210> 500 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 500 acggatcgga gaggagacag tggtactctg 30 <210> 501 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 501 Thr Ser Ala Arg Gly Asp Leu Ile His Thr 1 5 10 <210> 502 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 502 acgagtgcta gaggagacct gattcatacg 30 <210> 503 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 503 agtggggtga gaggagaccg gctggcggtg 30 <210> 504 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 504 Ala Val Glu Arg Gly Asp Arg Leu Met Leu 1 5 10 <210> 505 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 505 gcggttgaga gaggagaccg tcttatgctg 30 <210> 506 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 506 Asp Arg Ser Arg Gly Asp Thr His Val Leu 1 5 10 <210> 507 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 507 gacaggtcga gaggagacac gcacgtactc 30 <210> 508 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 508 Glu Ser Thr Arg Gly Asp Leu Arg Val Val 1 5 10 <210> 509 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 509 gagtcgacga gaggagacct tcgtgttgtg 30 <210> 510 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 510 Thr Thr Ile Arg Gly Asp Tyr Arg Glu Leu 1 5 10 <210> 511 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 511 acgacgatta gaggagacta tcgtgagttg 30 <210> 512 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 512 Thr Phe Ile Arg Gly Asp Leu Ala Gly Ala 1 5 10 <210> 513 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 513 acgttcatca gaggagacct ggcaggtgcg 30 <210> 514 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 514 Met Thr Ser Arg Gly Asp Leu Thr Thr Tyr 1 5 10 <210> 515 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 515 atgacgagca gaggagactt gacaacatac 30 <210> 516 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 516 Ala Asp Arg Arg Gly Asp Gln Leu Tyr Ser 1 5 10 <210> 517 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 517 gcggatcgta gaggagacca gctttattcg 30 <210> 518 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 518 gcacacatga gaggagacct aggcggcacg 30 <210> 519 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 519 Gly Tyr Val Arg Gly Asp Leu Gly Gln His 1 5 10 <210> 520 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 520 gggtacgtca gaggagacct ggggcaacac 30 <210> 521 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 521 Asp Ala Ser Arg Gly Asp Arg Thr Ser Leu 1 5 10 <210> 522 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 522 gatgcgagta gaggagacag gactagtttg 30 <210> 523 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 523 Thr Glu Val Arg Gly Asp Arg Ser Gln Val 1 5 10 <210> 524 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 524 acggaggtga gaggagacag gtcgcaggtt 30 <210> 525 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 525 tcgcatctga gaggagacca ggctcttgcg 30 <210> 526 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 526 Ser Glu Val Arg Gly Asp Arg Leu Ser Ile 1 5 10 <210> 527 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 527 tcggaggtga gaggagaccg gttgagtatt 30 <210> 528 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 528 agcgccgcga gaggagacac tgaacggcta 30 <210> 529 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 529 Ser Asp Arg Arg Gly Asp Leu Ser Gly Ala 1 5 10 <210> 530 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 530 tcagaccgta gaggagacct gtcgggcgct 30 <210> 531 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 531 Ser Val Thr Arg Gly Asp Arg Val Val Ile 1 5 10 <210> 532 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 532 agcgtcacaa gaggagacag agtagtcatc 30 <210> 533 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 533 Ser Glu Gly Arg Gly Asp Arg Met Ala Leu 1 5 10 <210> 534 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 534 tcggagggga gaggagacag gatggctctt 30 <210> 535 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 535 Ser Ser Thr Arg Gly Asp His Leu Ser Leu 1 5 10 <210> 536 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 536 tcgtctacta gaggagacca tctttcgctg 30 <210> 537 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 537 gctatgatca gaggagacat gacccactcc 30 <210> 538 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 538 Ser Ser Thr Arg Gly Asp Gln Ile Tyr Val 1 5 10 <210> 539 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 539 tcgtcgacga gaggagacca gatttatgtg 30 <210> 540 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 540 gaggagcgga gaggagacac tcatcggttg 30 <210> 541 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 541 tcgaattcga gaggagacta taatagtctt 30 <210> 542 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 542 Ser Ala Gln Arg Asp Arg Met Gly Ser Pro 1 5 10 <210> 543 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 543 tccgcacaaa gggatcgtat gggttctccg 30 <210> 544 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 544 Thr Gly Thr Arg Gly Asp Ile Ala Thr Phe 1 5 10 <210> 545 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 545 acgggtacga gaggagacat tgcgactttt 30 <210> 546 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 546 Ser Met Gln Arg Gly Asp Leu Leu Ser Thr 1 5 10 <210> 547 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 547 tcgatgcaga gaggagacct gctttctact 30 <210> 548 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 548 Glu Asp Val Arg Gly Asp Arg Ser Lys Leu 1 5 10 <210> 549 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 549 gaggatgtga gaggagacag gagtaagctt 30 <210> 550 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 550 gcgcatatga gaggagactt gggggggact 30 <210> 551 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 551 Thr Ser Val Arg Gly Asp Gln Ser Gln Tyr 1 5 10 <210> 552 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 552 acgagtgtga gaggagacca gagtcagtat 30 <210> 553 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 553 Ala Asp Arg Arg Gly Asp Thr Gly Leu Phe 1 5 10 <210> 554 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 554 gcggatcgga gaggagacac ggggttgttt 30 <210> 555 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 555 Asn Thr Tyr Arg Gly Asp Arg Asp Ser Leu 1 5 10 <210> 556 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 556 aacacttaca gaggagaccg agacagcctg 30 <210> 557 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 557 acggatgtta gaggagaccg ggggacgttt 30 <210> 558 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 558 Ser Arg Gly Arg Gly Asp Leu Asn Asp Leu 1 5 10 <210> 559 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 559 tctcgtggga gaggagacct gaatgatttg 30 <210> 560 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 560 agcaacgtaa gaggagacag ggaagccgtc 30 <210> 561 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 561 Met Asp Arg Arg Gly Asp Ala Ser Ile Leu 1 5 10 <210> 562 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 562 atggacagga gaggagacgc ctccatactg 30 <210> 563 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 563 Ser Ile Trp Arg Gly Asp Arg Thr Glu Val 1 5 10 <210> 564 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 564 tcgatatgga gaggagaccg tacagaagtc 30 <210> 565 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 565 Asn Ser Gln Arg Gly Asp Tyr Ser Gly Met 1 5 10 <210> 566 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 566 aactcacaaa gaggagacta cagtggaatg 30 <210> 567 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 567 Ser Ser Val Arg Gly Asp Ile Gly Gly Ile 1 5 10 <210> 568 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 568 tctagcgtaa gaggagacat cggggggatc 30 <210> 569 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 569 gagaatcaga gaggagactt gtcgggtcgg 30 <210> 570 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 570 Glu Ile Arg Arg Gly Asp Leu Leu Ala Gln 1 5 10 <210> 571 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 571 gagattcgga gaggagacct tctggctcag 30 <210> 572 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 572 Ser Asn Ile Arg Gly Asp His Ala Val Met 1 5 10 <210> 573 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 573 tcgaacatca gaggagacca cgcagtcatg 30 <210> 574 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 574 Leu Asp Thr Arg Gly Asp Arg Ser Gln Val 1 5 10 <210> 575 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 575 ctggatacga gaggagaccg gagtcaggtt 30 <210> 576 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 576 Ala Asn Thr Arg Gly Asp His Gln Asn Phe 1 5 10 <210> 577 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 577 gcgaatacga gaggagacca tcagaatttt 30 <210> 578 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 578 caggtgtata gaggagaccg tgagtctgtt 30 <210> 579 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 579 Thr Ser Val Arg Gly Asp Leu Ser Met Asn 1 5 10 <210> 580 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 580 acgtcggtga gaggagacct ttcgatgaat 30 <210> 581 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 581 gcctcaacga gaggagacca cggagttctc 30 <210> 582 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 582 Thr Thr Thr Arg Gly Asp Tyr Leu Asn Thr 1 5 10 <210> 583 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 583 acgacgacga gaggagacta tcttaatacg 30 <210> 584 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 584 Ala Glu Arg Arg Gly Asp Ile Lys Glu Tyr 1 5 10 <210> 585 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 585 gcggagagga gaggagacat taaggagtat 30 <210> 586 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 586 Ser His Ala Arg Gly Asp Leu Gly Ser Thr 1 5 10 <210> 587 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 587 tcgcatgcta gaggagactt gggttcgact 30 <210> 588 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 588 Thr Ser Gln Arg Gly Asp Tyr Val Ser Leu 1 5 10 <210> 589 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 589 acgtctcaga gaggagacta tgtttctctt 30 <210> 590 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 590 gggccgggta gaggagacca gactacgttg 30 <210> 591 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 591 Val Asn Val Arg Gly Asp Arg Gly Glu Val 1 5 10 <210> 592 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 592 gtgaatgtga gaggagaccg tggtgaggtg 30 <210> 593 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 593 Ser Tyr Arg Arg Gly Asp His Asp Gln Leu 1 5 10 <210> 594 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 594 tcgtatcgta gaggagacca tgatcagctt 30 <210> 595 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 595 Ser Gly Thr Arg Gly Asp Arg Val Asp Leu 1 5 10 <210> 596 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 596 agcggcacaa gaggagacag ggtagacctc 30 <210> 597 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 597 Ser His Phe Arg Gly Asp Leu His Thr Ser 1 5 10 <210> 598 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 598 tcccacttca gaggagactt gcacacgtcc 30 <210> 599 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 599 Ser Asp Arg Arg Gly Asp Leu Ser Val Pro 1 5 10 <210> 600 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 600 tcggatcgta gaggagacct ttcggtgcct 30 <210> 601 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 601 Ser Gly Thr Arg Gly Asp Thr Leu Ile Leu 1 5 10 <210> 602 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 602 agcggcacca gaggagacac ccttatactc 30 <210> 603 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 603 Glu Asn Thr Arg Gly Asp Leu His Gly Lys 1 5 10 <210> 604 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 604 gaaaacacca gaggagacct ccacggcaaa 30 <210> 605 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 605 Asp Arg Ala Arg Gly Asp Thr His Val Leu 1 5 10 <210> 606 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 606 gatcgggcga gaggagacac gcatgtgctg 30 <210> 607 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 607 Ala Ser Gly Arg Gly Asp Ile Ala Gly Leu 1 5 10 <210> 608 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 608 gcgtctggta gaggagacat tgcggggctt 30 <210> 609 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 609 Glu Gly Arg Arg Gly Asp Leu Phe Gln Ala 1 5 10 <210> 610 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 610 gagggtcgta gaggagacct gtttcaggcg 30 <210> 611 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 611 Arg Ser Glu Arg Gly Asp Arg Leu Glu Ile 1 5 10 <210> 612 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 612 agatccgaaa gaggagacag gctagaaatc 30 <210> 613 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 613 Ala Ala Tyr Arg Gly Asp Ala His Val Leu 1 5 10 <210> 614 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 614 gcggcctaca gaggagacgc acacgtgctc 30 <210> 615 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 615 Asn Asp Ser Arg Gly Asp Gln His Arg Leu 1 5 10 <210> 616 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 616 aacgactcga gaggagacca acaccgattg 30 <210> 617 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 617 Ser Ser Ala Arg Gly Asp His Ser Gln Leu 1 5 10 <210> 618 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 618 tcatcggcaa gaggagacca ctctcaactg 30 <210> 619 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 619 Thr Asn Glu Arg Gly Asp Arg Leu Ser Ile 1 5 10 <210> 620 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 620 acgaatgaga gaggagaccg tctttcgatt 30 <210> 621 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 621 Ser Asn Ser Arg Gly Asp Tyr Thr Ser Val 1 5 10 <210> 622 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 622 agcaactcca gaggagacta caccagtgtc 30 <210> 623 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 623 Asn Val Thr Arg Gly Asp His Thr Val Met 1 5 10 <210> 624 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 624 aacgtcacaa gaggagacca caccgttatg 30 <210> 625 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 625 Thr Met Val Arg Gly Asp Val Lys Gly Leu 1 5 10 <210> 626 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 626 acgatggtga gaggagacgt taaggggctt 30 <210> 627 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 627 accgggacaa gaggagacat agccacgttc 30 <210> 628 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 628 Val Gln Leu Arg Gly Asp Leu Ala Ser Thr 1 5 10 <210> 629 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 629 gtgcagctga gaggagactt ggcttctact 30 <210> 630 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 630 Met Asn Arg Arg Gly Asp Tyr Ser Glu Gln 1 5 10 <210> 631 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 631 atgaaccgga gaggagacta ctcggaacaa 30 <210> 632 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 632 Ala Asn Thr Arg Gly Asp Leu Ser Pro Val 1 5 10 <210> 633 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 633 gcgaatacta gaggagacct gagtccggtt 30 <210> 634 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 634 Thr Gly Met Arg Gly Asp Ala Gly Ser Leu 1 5 10 <210> 635 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 635 acgggtatga gaggagacgc tgggagtctt 30 <210> 636 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 636 Leu Asp Arg Arg Gly Asp Phe Ser Ser Ala 1 5 10 <210> 637 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 637 ctagaccgca gaggagactt cagctccgcg 30 <210> 638 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 638 Met Tyr His Arg Gly Asp Met Thr Ser Val 1 5 10 <210> 639 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 639 atgtaccaca gaggagacat gacttcggtg 30 <210> 640 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 640 Gly Ser Met Arg Gly Asp Leu His Ser Thr 1 5 10 <210> 641 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 641 gggtcgatga gaggagactt gcattcgacg 30 <210> 642 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 642 Ser Ser Ser Arg Gly Asp Phe Ser Ser Val 1 5 10 <210> 643 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 643 tcgtcgtcca gaggagactt cagctctgtt 30 <210> 644 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 644 Thr Gly Thr Arg Gly Asp Leu His Thr Tyr 1 5 10 <210> 645 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 645 acgggtacga gaggagactt gcatacttat 30 <210> 646 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 646 Tyr Thr Gln Arg Gly Asp Leu Ala Thr Val 1 5 10 <210> 647 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 647 tacacccaaa gaggagacct tgccaccgtc 30 <210> 648 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 648 Thr Asp Val Arg Gly Asp Arg Met Tyr Val 1 5 10 <210> 649 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 649 acggatgtta gaggagaccg gatgtatgtg 30 <210> 650 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 650 acatcggtca gaggagacca cggaacattg 30 <210> 651 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 651 Ser Asn Ser Arg Gly Asp Leu Ser Val Asn 1 5 10 <210> 652 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 652 tcgaactcca gaggagacct atcggtaaac 30 <210> 653 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 653 Gln Ser Gly Arg Gly Asp Gln Met Thr Leu 1 5 10 <210> 654 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 654 cagtctggga gaggagacca gatgacgttg 30 <210> 655 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 655 Met Asn Thr Arg Gly Asp Leu Gln Gln Ser 1 5 10 <210> 656 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 656 atgaacacca gaggagactt gcaacaatcg 30 <210> 657 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 657 Ala Gly Ser Arg Gly Asp Leu Gln Thr Val 1 5 10 <210> 658 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 658 gcgggatcaa gaggagacct acaaacggtg 30 <210> 659 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 659 Ser Asn Met Arg Gly Asp Gln Thr Tyr Val 1 5 10 <210> 660 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 660 tcgaacatga gaggagacca aacttacgtc 30 <210> 661 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 661 Thr Pro Ser Arg Gly Asp Met Ser Asn Val 1 5 10 <210> 662 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 662 acgccaagta gaggagacat gtccaacgtc 30 <210> 663 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 663 Asn Ser Thr Arg Gly Asp Leu His Met Ala 1 5 10 <210> 664 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 664 aacagcacaa gaggagacct acacatggca 30 <210> 665 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 665 Ala Asn Thr Arg Gly Asp Leu Ser Val Ser 1 5 10 <210> 666 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 666 gctaacacca gaggagacct ctcagtcagt 30 <210> 667 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 667 Thr Asp Arg Arg Gly Asp Thr Gly Leu Leu 1 5 10 <210> 668 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 668 accgaccgaa gaggagacac cggcttactg 30 <210> 669 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 669 Asp Gly Val Arg Gly Asp Arg Ala Thr Trp 1 5 10 <210> 670 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 670 gacggcgtaa gaggagaccg tgcaacatgg 30 <210> 671 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 671 gagaatcgta gaggagactt taataatacg 30 <210> 672 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 672 Glu Pro Ser Arg Gly Asp Arg Met Val Leu 1 5 10 <210> 673 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 673 gagcctagta gaggagacag gatggtgttg 30 <210> 674 <211> 10 <212> PRT <213> artificial Sequence <220> <223> Synthetic: n-mer motif <400> 674 Ser Gly Val Arg Gly Asp Arg Ile Ile Ile 1 5 10 <210> 675 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 675 agcggcgtta gaggagaccg gatcataatc 30 <210> 676 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 676 Thr Ser Met Arg Gly Asp Tyr Thr His Val 1 5 10 <210> 677 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 677 acgtcgatga gaggagacta tacgcatgtt 30 <210> 678 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 678 Ala Ser Ser Arg Gly Asp Leu Thr Val Ile 1 5 10 <210> 679 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 679 gcgtcgagta gaggagactt gactgttatt 30 <210> 680 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 680 Glu Thr Arg Arg Gly Asp Leu Ser Leu Gln 1 5 10 <210> 681 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 681 gagacgcgta gaggagacct gtcgcttcag 30 <210> 682 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 682 Asn Asn Ala Arg Gly Asp Gln Ser Met His 1 5 10 <210> 683 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 683 aacaacgcaa gaggagacca atcaatgcac 30 <210> 684 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 684 Thr Asp Arg Arg Gly Asp Ser Ser Ala Leu 1 5 10 <210> 685 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 685 acggatagga gaggagactc tagtgcgctt 30 <210> 686 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 686 Ser Ser Gln Arg Gly Asp Leu Thr Gly Val 1 5 10 <210> 687 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 687 tcaagccaaa gaggagactt gacaggtgtg 30 <210> 688 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 688 Gln Thr Ala Arg Gly Asp Val Met Val His 1 5 10 <210> 689 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 689 cagacggcta gaggagacgt tatggttcat 30 <210> 690 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 690 Val Ser Gln Arg Gly Asp Leu Asn Ala Val 1 5 10 <210> 691 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 691 gtgtcgcaga gaggagacct gaatgctgtt 30 <210> 692 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 692 Thr Met Thr Arg Gly Asp Leu Ala Ala Asn 1 5 10 <210> 693 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 693 acgatgacca gaggagacct cgctgctaac 30 <210> 694 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 694 Asn Ala Ser Arg Gly Asp His Ser Ser Leu 1 5 10 <210> 695 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 695 aatgcttcga gaggagacca ttcgtcgttg 30 <210> 696 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 696 Ser Asn Thr Arg Gly Asp Met Gly Leu Thr 1 5 10 <210> 697 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 697 tcaaacacca gaggagacat gggcctcacg 30 <210> 698 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 698 Met Tyr Ser Arg Gly Asp Thr His Ser Leu 1 5 10 <210> 699 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 699 atgtattcga gaggagacac tcatagtctg 30 <210> 700 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 700 Ala Asp Gln Arg Gly Asp Arg Ala Pro Leu 1 5 10 <210> 701 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 701 gcggatcaga gaggagacag ggctccgctt 30 <210> 702 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 702 caagaaagga gaggagacta cacctctatg 30 <210> 703 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 703 Ser Gln Asn Arg Gly Asp Leu Ala Asn Thr 1 5 10 <210> 704 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 704 tcccaaaaca gaggagacct agccaacacg 30 <210> 705 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 705 gagaagttga gaggagacct tcattcgact 30 <210> 706 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 706 caaggcggaa gaggagacct gagtacactg 30 <210> 707 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 707 Ser Asn Arg Arg Gly Asp Thr Glu Met Gln 1 5 10 <210> 708 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 708 tcgaatagga gaggagacac tgagatgcag 30 <210> 709 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 709 Ser Gly Ser Arg Gly Asp Val Ser Ala Leu 1 5 10 <210> 710 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 710 tcgggtagta gaggagacgt gagtgctttg 30 <210> 711 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 711 Glu Ser Thr Arg Gly Asp Arg Gly Thr Leu 1 5 10 <210> 712 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 712 gagtcgacga gaggagaccg tggtacgctg 30 <210> 713 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 713 Ser Ala Val Arg Gly Asp Ala Ala Leu His 1 5 10 <210> 714 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 714 tcggcggtga gaggagacgc ggcgcttcat 30 <210> 715 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 715 Leu Ser Ser Arg Gly Asp Val Asn Arg Leu 1 5 10 <210> 716 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 716 ctgagcagca gaggagacgt taaccgcctt 30 <210> 717 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 717 Glu Gln Arg Arg Gly Asp Ile Gln Thr Ile 1 5 10 <210> 718 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 718 gagcagagga gaggagacat tcagactatt 30 <210> 719 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 719 gctgcgtata gaggagacgc gcatgttctt 30 <210> 720 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 720 Ser Pro Val Arg Gly Asp His Gly Ala Leu 1 5 10 <210> 721 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 721 tcgccggtga gaggagacca tggggctttg 30 <210> 722 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 722 gattcgagga gaggagacta tgcgaatctg 30 <210> 723 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 723 Leu Ser Arg Arg Gly Asp Tyr Gln Glu Leu 1 5 10 <210> 724 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 724 ttgagtcgga gaggagacta tcaggagttg 30 <210> 725 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 725 tcctacgcaa gaggagacgt ccactccatc 30 <210> 726 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 726 Asp Ser Arg Arg Gly Asp Ala Ser Tyr His 1 5 10 <210> 727 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 727 gactcacgca gaggagacgc gtcgtaccac 30 <210> 728 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 728 Asn His Gln Arg Gly Asp Leu Ser Ser Ser 1 5 10 <210> 729 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 729 aaccaccaaa gaggagacct gagctcgagt 30 <210> 730 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 730 tcctcaacga gaggagacca cctgtctttg 30 <210> 731 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 731 Ser Trp Asn Arg Gly Asp Ile Ser Gly Leu 1 5 10 <210> 732 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 732 tcgtggaaca gaggagacat atctggcctt 30 <210> 733 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 733 Thr Gly Thr Arg Gly Asp Leu Gly Thr Met 1 5 10 <210> 734 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 734 acgggtacta gaggagacct ggggacgatg 30 <210> 735 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 735 Gln Gln Leu Arg Gly Asp Thr His Thr Leu 1 5 10 <210> 736 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 736 cagcagctta gaggagacac gcatactctt 30 <210> 737 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 737 Ala Gly Leu Arg Gly Asp Arg Asp Ser Leu 1 5 10 <210> 738 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 738 gcggggttga gaggagaccg tgattcgctt 30 <210> 739 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 739 Gln Val Tyr Arg Gly Asp Arg Asp Gln Leu 1 5 10 <210> 740 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 740 caggtttata gaggagaccg ggatcagttg 30 <210> 741 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 741 Ala Gly Val Arg Gly Asp Arg Val Thr Ile 1 5 10 <210> 742 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 742 gcaggagtaa gaggagacag agtgaccatc 30 <210> 743 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 743 Asn Ser Ala Arg Gly Asp Leu Leu His Ser 1 5 10 <210> 744 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 744 aactcagcca gaggagacct tctgcactcc 30 <210> 745 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 745 Asn His Ser Arg Gly Asp Leu Thr Gly Val 1 5 10 <210> 746 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 746 aaccacagta gaggagacct gacaggcgtt 30 <210> 747 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 747 Asn Ala Tyr Arg Gly Asp Thr Ser Ala Phe 1 5 10 <210> 748 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 748 aacgcttaca gaggagacac atccgcgttc 30 <210> 749 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 749 Ser Ala Asn Arg Gly Asp Ile Met His Thr 1 5 10 <210> 750 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 750 tcggctaaca gaggagacat aatgcacacg 30 <210> 751 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 751 Gln Ser Ala Arg Gly Asp Leu Val Ser Tyr 1 5 10 <210> 752 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 752 caatccgcca gaggagacct cgtcagttac 30 <210> 753 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 753 gatagtagga gaggagacgc tagttatcat 30 <210> 754 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 754 Ser Phe Val Arg Gly Asp Val Arg Thr Leu 1 5 10 <210> 755 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 755 tcgtttgtga gaggagacgt tcgtacgctg 30 <210> 756 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 756 Ser Asp Met Arg Gly Asp Arg Ser Val Tyr 1 5 10 <210> 757 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 757 agcgacatga gaggagaccg atctgtgtac 30 <210> 758 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 758 Ser Gly Ile Arg Gly Asp Arg Tyr Pro Ile 1 5 10 <210> 759 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 759 tccggaatca gaggagaccg ctacccaata 30 <210> 760 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 760 Ser Asn Val Arg Gly Asp Met Ala His Ser 1 5 10 <210> 761 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 761 tccaacgtca gaggagacat ggctcacagc 30 <210> 762 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 762 actgaggtta gaggagaccg ttcgcaggtt 30 <210> 763 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 763 Ala Ser Ser Arg Gly Asp Leu Gln Gln Thr 1 5 10 <210> 764 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 764 gcgagcagca gaggagacct gcaacaaacg 30 <210> 765 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 765 cagtctgcta gaggagacct tgtgtcttat 30 <210> 766 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 766 gacgcatcta gaggagaccg aacatccctc 30 <210> 767 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic: n-mer motif <400> 767 Asn Ser Val Arg Gly Asp Leu Asn Gln Thr 1 5 10 <210> 768 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic: n-mer encoding polynucleotide <400> 768 aacagtgtca gaggagacct caaccaaact 30 <210> 769 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 769 gcaacatggc tgtccaggga agaaactaca tacctg 36 <210> 770 <211> 76 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (32)..(33) <223> n is a, c, g, or t <220> <221> misc_feature <222> (35)..(36) <223> n is a, c, g, or t <220> <221> misc_feature <222> (38)..(39) <223> n is a, c, g, or t <220> <221> misc_feature <222> (41)..(42) <223> n is a, c, g, or t <220> <221> misc_feature <222> (44)..(45) <223> n is a, c, g, or t <220> <221> misc_feature <222> (47)..(48) <223> n is a, c, g, or t <220> <221> misc_feature <222> (50)..(51) <223> n is a, c, g, or t <400> 770 gttttgaacc cagccggtct gcgcctgtgc mnnmnnmnnm nnmnnmnnmn nttgggcact 60 ctggtggttt gtggcc 76 <210> 771 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 771 gaaagttgcc gtccgtgtga gg 22 <210> 772 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 772 acaagtggcc acaaaccacc a 21 <210> 773 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 773 ggttttgaac ccagccggtc 20

Claims

근육 조직을 표적화하는데 효과적인 표적화 모이어티로서, 표적화 모이어티는 하나 이상의 n-량체 모티프를 포함하고, 하나 이상의 n-량체 모티프의 적어도 하나의 n-량체 모티프는 X_mRGDX_n (여기서, X_m 및 X_n 은 각각 독립적으로 임의의 아미노산으로부터 선택되고, n은 1, 2, 3, 4, 5, 6, 7, 8, 또는 9이고, m은 1-4임)을 포함하거나 또는 그로 이루어지는 것인 표적화 모이어티; 및
임의로 카고로서, 표적화 모이어티에 커플링되거나 또는 회합된 카고
를 포함하는 것인 조성물.
제1항에 있어서, 적어도 하나의 n-량체 모티프는 표 2 (SEQ ID NO: 2-7, 20-21, 41-409), 표 3 (SEQ ID NO: 2, 28, 30-32, 55, 76, 96, 103, 135, 158, 207, 214, 252, 306, 316, 398, 410-768), 도 14F (SEQ ID NO: 8-12, 14-18), 또는 이의 임의 조합 중 어느 하나의 것과 같은 것인 조성물.
제1항 또는 제2항에 있어서, 표적화 모이어티는 폴리펩티드, 폴리뉴클레오티드, 지질, 중합체, 당, 또는 이의 조합을 포함하는 것인 조성물.
제1항 내지 제3항 중 어느 하나의 항에 있어서, 표적화 모이어티는 바이러스 단백질을 포함하는 것인 조성물.
제4항에 있어서, 바이러스 단백질은 캡시드 단백질인 조성물.
제4항 또는 제5항에 있어서, 바이러스 단백질은 아데노 연관 바이러스 (AAV) 단백질인 조성물.
제5항 또는 제6항에 있어서, n-량체 모티프는 n-량체 모티프가 바이러스 캡시드의 외부에 있도록 바이러스 단백질의 2개 아미노산 사이에 위치되는 것인 조성물.
제6항 또는 제7항에 있어서, n-량체 모티프는 AAV9 캡시드 폴리펩티드의 아미노산 262-269, 327-332, 382-386, 452-460, 488-505, 527-539, 545-558, 581-593, 704-714, 또는 이의 임의 조합 사이의 임의의 2개의 인접한 아미노산 사이, 또는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV rh.74, AAV rh.10 캡시드 폴리펩티드의 유사한 위치에 삽입되는 것인 조성물.
제6항 내지 제8항 중 어느 하나의 항에 있어서, n-량체 모티프는 AAV9 캡시드 폴리펩티드의 아미노산 588 내지 589 사이 또는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV rh.74, AAV rh.10 캡시드 폴리펩티드의 유사한 위치에 삽입되는 것인 조성물.
제1항 내지 제9항 중 어느 하나의 항에 있어서, 조성물은 조작된 바이러스 입자인 조성물.
제10항에 있어서, 조작된 바이러스 입자는 조작된 AAV 바이러스 입자인 조성물.
제11항에 있어서, AAV 바이러스 입자는 조작된 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV rh.74, 또는 AAV rh.10 바이러스 입자인 조성물.
제1항 내지 제12항 중 어느 하나의 항에 있어서, n-량체 모티프는 3-15개 아미노산인 조성물.
제1항 내지 제13항 중 어느 하나의 항에 있어서, 조성물은 비-근육 세포에 대해 감소되거나 또는 제거된 특이성을 갖는 것인 조성물.
제14항에 있어서, 비-근육 세포는 간 세포인 조성물.
제5항 내지 제14항 중 어느 하나의 항에 있어서, 바이러스 캡시드는 상응하는 야생형 AAV 캡시드 폴리펩티드와 비교하여 비-근육 세포에서 감소되거나 또는 제거된 흡수성을 갖는 조작된 AAV 캡시드 단백질인 조성물.
제16항에 있어서, 야생형 캡시드 폴리펩티드는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV rh.74, 또는 AAV rh.10 캡시드 폴리펩티드인 조성물.
제16항 또는 제17항에 있어서, 조작된 AAV 캡시드 단백질은 비-근육 세포에서 감소되거나 또는 제거된 흡수성을 초래하는 하나 이상의 돌연변이를 포함하는 것인 조성물.
제18항에 있어서, 하나 이상의 돌연변이는
AAV9 캡시드 단백질 (SEQ ID NO: 1)의
a. 위치 267,
b. 위치 269,
c. 위치 504,
d. 위치 505,
e. 위치 590,
f. 또는 이의 임의 조합,
또는 비-AAV9 캡시드 폴리펩티드에서 이에 상응하는 하나 이상의 위치에 존재하는 것인 조성물.
제19항에 있어서, 비-AAV9 캡시드 단백질은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV rh.74, 또는 AAV rh.10 캡시드 폴리펩티드인 조성물.
제19항에 있어서, AAV9 캡시드 단백질 (SEQ ID NO: 1)의 위치 267 또는 비-AAV9 캡시드 폴리펩티드의 이에 상응하는 위치에서 돌연변이는 G 또는 X에서 A로의 돌연변이이고, X는 임의의 아미노산인 조성물.
제19항에 있어서, AAV9 캡시드 단백질 (SEQ ID NO: 1)의 위치 269 또는 비-AAV9 캡시드 폴리펩티드의 이에 상응하는 위치에서 돌연변이는 S 또는 X에서 T로의 돌연변이이고, X는 임의의 아미노산인 조성물.
제19항에 있어서, AAV9 캡시드 단백질 (SEQ ID NO: 1)의 위치 504 또는 비-AAV9 캡시드 폴리펩티드의 이에 상응하는 위치에서 돌연변이는 G 또는 X에서 A로의 돌연변이이고, X는 임의의 아미노산인 조성물.
제19항에 있어서, AAV9 캡시드 단백질 (SEQ ID NO: 1)의 위치 505 또는 비-AAV9 캡시드 폴리펩티드의 이에 상응하는 위치에서 돌연변이는 P 또는 X에서 A로의 돌연변이이고, X는 임의의 아미노산인 조성물.
제19항에 있어서, AAV9 캡시드 단백질 (SEQ ID NO: 1)의 위치 590 또는 비-AAV9 캡시드 폴리펩티드의 이에 상응하는 위치에서 돌연변이는 Q 또는 X에서 A로의 돌연변이이고, X는 임의의 아미노산인 조성물.
제18항에 있어서, 조작된 AAV 캡시드 단백질은 야생형 AAV9 캡시드 단백질 (SEQ ID NO: 1)의 위치 267, 위치 269 또는 둘 모두에 돌연변이를 포함하는 조작된 AAV9 캡시드 폴리펩티드이고, 위치 267의 돌연변이는 G에서 A로의 돌연변이이고, 위치 269의 돌연변이는 S에서 T로의 돌연변이인 조성물.
제18항에 있어서, 조작된 AAV 캡시드 단백질은 야생형 AAV9 캡시드 단백질 (SEQ ID NO: 1)의 위치 590에 돌연변이를 포함하는 조작된 AAV9 캡시드 폴리펩티드이고, 위치 509의 돌연변이는 Q에서 A로의 돌연변이인 조성물.
제18항에 있어서, 조작된 AAV 캡시드 단백질은 야생형 AAV9 캡시드 단백질 (SEQ ID NO: 1)의 위치 504, 위치 505, 또는 둘 모두에 돌연변이를 포함하는 조작된 AAV9 캡시드 폴리펩티드이고, 위치 504의 돌연변이는 G에서 A로의 돌연변이이고, 위치 505의 돌연변이는 P에서 A로의 돌연변이인 조성물.
제1항 내지 제28항 중 어느 하나의 항에 있어서, 임의적인 카고는 근육 질환 또는 장애를 치료할 수 있거나 또는 예방할 수 있는 것인 조성물.
제29항에 있어서, 근육 질환 또는 장애는
a. 자가 면역 질환;
b. 암;
c. 근이영양증;
d. 신경근 질환;
e. 당 또는 글리코겐 저장 질환;
f. 확장된 반복 질환;
g. 우성 음성 질환;
h. 심근병증;
i. 바이러스 질환;
j. 조로증; 또는
k. 이의 임의 조합인 조성물.
제1항 내지 제30항 중 어느 하나의 항에 있어서, 카고는 모르폴리노, 펩티드-연결된 모르폴리노, 안티센스 올리고뉴클레오티드, PMO, 치료적 이식유전자, 치료적 폴리펩티드 또는 펩티드를 코딩하는 폴리뉴클레오티드, PPMO, 하나 이상의 펩티드, CRISPR-Cas 단백질, 가이드 RNA 또는 둘 모두를 코딩하는 하나 이상의 폴리뉴클레오티드, 리보뉴클레오단백질로서, CRISPR-Cas 시스템 분자, 치료적 이식유전자 RNA, 또는 다른 유전자 변형 또는 치료적 RNA 및/또는 단백질을 포함하는 것인 리보뉴클레오단백질, 또는 이의 임의 조합인 조성물.
제1항 내지 제31항 중 어느 하나의 항에 있어서, 카고는 유전자에서 엑손 스키핑을 유도할 수 있는 것인 조성물.
제1항 내지 제32항 중 어느 하나의 항에 있어서, 카고는 디스트로핀 유전자에서 엑손 스키핑을 유도할 수 있는 것인 조성물.
제1항 내지 제33항 중 어느 하나의 항에 있어서, 카고는 미니-디스트로핀 또는 마이크로-디스트로핀 유전자인 조성물.
제34항에 있어서, 미니-디스트로핀 또는 마이크로-디스트로핀 유전자는 스펙트린-유사 반복부 1, 2, 3, 및 24, 및 임의로 nNOS 도메인을 포함하는 것인 조성물.
제29항 내지 제35항 중 어느 하나의 항에 있어서, 확장된 반복 질환은 헌팅톤병, 근긴장성 이영양증, 또는 안면견갑상완근 이영양증 (FSHD)인 조성물.
제29항 내지 제36항 중 어느 하나의 항에 있어서, 근이영양증은 뒤쉔 근이영양증, 벡커 근이영양증, 지대근 이영양증, 에머리 드레이푸스 근이영양증, 근긴장성 이영양증, 또는 FSHD인 조성물.
제36항에 있어서, 근긴장성 이영양증은 1형 또는 2형인 조성물.
제29항 내지 제38항 중 어느 하나의 항에 있어서, 심근병증은 확장성 심근병증, 비후생 심근병증, DMD-연관 심근병증, 또는 다논병인 조성물.
제29항 내지 제39항 중 어느 하나의 항에 있어서, 당 또는 글리코겐 저장병은 MPS III형 질환 또는 폼페병인 조성물.
제40항에 있어서, MPS III형 질환은 MPS IIIA형, IIIB형, IIIC형, 또는 IIID형인 조성물.
제29항 내지 제41항 중 어느 하나의 항에 있어서, 신경근 질환은 샤르코-마리-투스병 또는 프리드라이히 운동실조인 조성물.
제1항 내지 제42항 중 어느 하나의 항에 있어서, 조성물은 증가된 근육 세포 역가, 근육 세포 특이성, 감소된 면역원성, 또는 이의 임의 조합을 갖는 것인 조성물.
각각이 근육 조직을 표적화하는데 효과적인 하나 이상의 표적화 모이어티의 전부 또는 일부를 코딩하는 하나 이상의 폴리뉴클레오티드로서, 각각의 표적화 모이어티는 하나 이상의 n-량체 모티프를 포함하고, 하나 이상의 n-량체 모티프의 적어도 하나의 n-량체 모티프는 X_mRGDX_n (여기서, X_m및 X_n 은 각각 독립적으로 임의의 아미노산으로부터 선택되고, n은 1, 2, 3, 4, 5, 6, 7, 8, 또는 9이고, m은 1-4임)을 포함하거나 또는 그로 이루어지고, 하나 이상의 폴리뉴클레오티드 중 적어도 하나는 적어도 하나의 n-량체 모티프를 적어도 코딩하는 것인 하나 이상의 폴리뉴클레오티드; 및
임의로, 폴리뉴클레오티드(들) 중 하나 이상에 작동적으로 연결된 조절 구성요소
를 포함하는 벡터
를 포함하는 벡터 시스템.
제44항에 있어서, 적어도 하나의 n-량체 모티프는 표 2 (SEQ ID NO: 2-7, 20-21, 41-409), 표 3 (SEQ ID NO: 2, 28, 30-32, 55, 76, 96, 103, 135, 158, 207, 214, 252, 306, 316, 398, 410-768), 도 14F (SEQ ID NO: 8-12, 14-18), 또는 이의 임의 조합 중 어느 하나의 것과 같은 것인 벡터 시스템.
제44항 또는 제45항에 있어서, 카고를 더 포함하는 것인 벡터 시스템.
제46항에 있어서, 카고는 카고 폴리뉴클레오티드이고, 임의로 표적화 모이어티를 코딩하는 하나 이상의 폴리뉴클레오티드 중 하나 이상에 커플링되는 것인 벡터 시스템.
제46항 또는 제47항에 있어서, 카고 폴리뉴클레오티드는 표적화 모이어티를 코딩하는 하나 이상의 폴리뉴클레오티드와 동일한 벡터 또는 상이한 벡터에 존재하는 것인 벡터 시스템.
제44항 내지 제48항 중 어느 하나의 항에 있어서, 벡터 시스템은 존재할 때 카고를 함유하는 바이러스 입자를 생산할 수 있는 것인 벡터 시스템.
제44항 내지 제49항 중 어느 하나의 항에 있어서, 벡터 시스템은 표적화 모이어티 중 하나 이상을 포함하는 바이러스 폴리펩티드를 생산할 수 있는 것인 벡터 시스템.
제50항에 있어서, 바이러스 폴리펩티드는 캡시드 폴리펩티드인 벡터 시스템.
제51항에 있어서, 캡시드 폴리펩티드는 AAV 캡시드 폴리펩티드인 벡터 시스템.
제44항 내지 제51항 중 어느 하나의 항에 있어서, 벡터 시스템은 AAV 바이러스 입자를 생산할 수 있는 것인 벡터 시스템.
제53항에 있어서, AAV 바이러스 입자는 조작된 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV rh.74, 또는 AAV rh.10 바이러스 입자인 벡터 시스템.
제51항 내지 제54항 중 어느 하나의 항에 있어서, 캡시드 폴리펩티드는 조작된 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV rh.74, AAV rh.10 캡시드 폴리펩티드인 벡터 시스템.
제50항 내지 제55항 중 어느 하나의 항에 있어서, 하나의 n-량체 모티프를 코딩하는 하나 이상의 폴리뉴클레오티드는 n-량체 모티프(들)가 바이러스 캡시드의 외부에 있도록 바이러스 폴리펩티드의 2개 아미노산에 상응하는 2개 코돈 사이에 삽입되는 것인 벡터 시스템.
제56항에 있어서, 하나 이상의 n-량체 모티프를 코딩하는 하나 이상의 폴리뉴클레오티드는 AAV9 캡시드 폴리펩티드의 아미노산 262-269, 327-332, 382-386, 452-460, 488-505, 527-539, 545-558, 581-593, 704-714, 또는 이의 임의 조합 사이의 임의의 2개의 인접한 아미노산에 상응하는 2개 코돈 사이 또는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV rh.74, AAV rh.10 캡시드 폴리펩티드의 유사한 위치에 삽입되는 것인 벡터 시스템.
제57항에 있어서, 하나 이상의 n-량체 모티프를 코딩하는 하나 이상의 폴리뉴클레오티드는 AAV9 캡시드 폴리뉴클레오티드의 아미노산 588 내지 589에 상응하는 코돈 사이 또는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV rh.74, AAV rh.10 캡시드 폴리펩티드의 유사한 위치에 삽입되는 것인 벡터 시스템.
제51항 내지 제58항 중 어느 하나의 항에 있어서, 캡시드 단백질은 상응하는 야생형 AAV 캡시드 폴리펩티드와 비교하여 비-근육 세포에서 감소되거나 또는 제거된 흡수성을 갖는 조작된 AAV 캡시드 단백질인 벡터 시스템.
제59항에 있어서, 비-근육 세포는 간 세포인 벡터 시스템.
제59항 또는 제60항에 있어서, 야생형 캡시드 폴리펩티드는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV rh.74, 또는 AAV rh.10 캡시드 폴리펩티드인 벡터 시스템.
제59항 내지 제61항 중 어느 하나의 항에 있어서, 조작된 AAV 캡시드 단백질은 비-근육 세포에서 감소되거나 또는 제거된 흡수성을 초래하는 하나 이상의 돌연변이를 포함하는 것인 벡터 시스템.
제62항에 있어서, 하나 이상의 돌연변이는 AAV9 캡시드 단백질 (SEQ ID NO: 1)의
a. 위치 267,
b. 위치 269,
c. 위치 504,
d. 위치 505,
e. 위치 590,
f. 또는 이의 임의 조합, 또는
비-AAV9 캡시드 폴리펩티드의 이에 상응하는 하나 이상의 위치에 존재하는 것인 벡터 시스템.
제63항에 있어서, 비-AAV9 캡시드 단백질은 AAV1, AAV2, AAV3, AAV4, AAV5, AV6, AAV7, AAV8, AAV rh.74, 또는 AAV rh.10 캡시드 폴리펩티드인 벡터 시스템.
제63항에 있어서, AAV9 캡시드 단백질 (SEQ ID NO: 1)의 위치 267 또는 비-AAV9 캡시드 폴리펩티드의 이에 상응하는 위치의 돌연변이는 G 또는 X에서 A로의 돌연변이이고, X는 임의의 아미노산인 벡터 시스템.
제63항에 있어서, AAV9 캡시드 단백질 (SEQ ID NO: 1)의 위치 269 또는 비-AAV9 캡시드 폴리펩티드의 이에 상응하는 위치의 돌연변이는 S 또는 X에서 T로의 돌연변이이고, X는 임의의 아미노산인 벡터 시스템.
제63항에 있어서, AAV9 캡시드 단백질 (SEQ ID NO: 1)의 위치 504 또는 비-AAV9 캡시드 폴리펩티드의 이에 상응하는 위치의 돌연변이는 G 또는 X에서 A로의 돌연변이이고, X는 임의의 아미노산인 벡터 시스템.
제63항에 있어서, AAV9 캡시드 단백질 (SEQ ID NO: 1)의 위치 505 또는 비-AAV9 캡시드 폴리펩티드의 이에 상응하는 위치의 돌연변이는 P 또는 X에서 A로의 돌연변이이고, X는 임의의 아미노산인 벡터 시스템.
제63항에 있어서, AAV9 캡시드 단백질 (SEQ ID NO: 1)의 위치 590 또는 비-AAV9 캡시드 폴리펩티드의 이에 상응하는 위치의 돌연변이는 Q 또는 X에서 A로의 돌연변이이고, X는 임의의 아미노산인 벡터 시스템.
제62항에 있어서, 조작된 AAV 캡시드 단백질은 야생형 AAV9 캡시드 단백질 (SEQ ID NO: 1)의 위치 267, 위치 269 또는 둘 모두에 돌연변이를 포함하는 조작된 AAV9 캡시드 폴리펩티드이고, 위치 267의 돌연변이는 G에서 A로의 돌연변이이고, 위치 269의 돌연변이는 S에서 T로의 돌연변이인 벡터 시스템.
제62항에 있어서, 조작된 AAV 캡시드 단백질은 야생형 AAV9 캡시드 단백질 (SEQ ID NO: 1)의 위치 590에 돌연변이를 포함하는 조작된 AAV9 캡시드 폴리펩티드이고, 위치 509의 돌연변이는 Q에서 A로의 돌연변이인 벡터 시스템.
제62항에 있어서, 조작된 AAV 캡시드 단백질은 야생형 AAV9 캡시드 단백질 (SEQ ID NO: 1)의 위치 504, 위치 505, 또는 둘 모두에 돌연변이를 포함하는 조작된 AAV9 캡시드 폴리펩티드이고, 위치 504의 돌연변이는 G에서 A로의 돌연변이이고, 위치 505의 돌연변이는 P에서 A로의 돌연변이인 벡터 시스템.
제44항 내지 제72항 중 어느 하나의 항에 있어서, 각각이 하나 이상의 표적화 모이어티의 전부 또는 일부를 코딩하는 하나 이상의 폴리뉴클레오티드를 포함하는 벡터는 스플라이스 조절 구성요소를 포함하지 않는 것인 벡터 시스템.
제43항 내지 제73항 중 어느 하나의 항에 있어서, 바이러스 rep 단백질을 코딩하는 폴리뉴클레오티드를 더 포함하는 것인 벡터 시스템.
제74항에 있어서, 바이러스 rep 단백질을 코딩하는 폴리뉴클레오티드는 AAV rep 단백질을 코딩하는 폴리뉴클레오티드인 벡터 시스템.
제74항 또는 제75항에 있어서, 바이러스 rep 단백질을 코딩하는 폴리뉴클레오티드는 각각이 하나 이상의 표적화 모이어티의 전부 또는 일부를 코딩하는 하나 이상의 폴리뉴클레오티드와 동일한 벡터 또는 상이한 벡터에 존재하는 것인 벡터 시스템.
제74항 내지 제76항 중 어느 하나의 항에 있어서, 바이러스 rep 단백질은 조절 구성요소에 작동적으로 연결되는 것인 벡터 시스템.
제44항 내지 제77항 중 어느 하나의 항에 따른 벡터 시스템에 의해 코딩되고/되거나 생산되는 폴리펩티드.
제78항에 있어서, 폴리펩티드는 바이러스 폴리펩티드인 폴리펩티드.
제79항에 있어서, 바이러스 폴리펩티드는 AAV 폴리펩티드인 폴리펩티드.
제43항 내지 제77항 중 어느 하나의 항에 따른 벡터 시스템에 의해서 생산되고/되거나 제78항 또는 제79항에 따른 폴리펩티드를 포함하는 입자.
제81항에 있어서, 입자는 바이러스 입자인 입자.
제82항에 있어서, 바이러스 입자는 아데노-연관 바이러스 (AAV) 입자, 렌티바이러스 입자, 또는 레트로바이러스 입자인 입자.
제83항에 있어서, 바이러스 입자는 근육-특이적 향성을 갖는 것인 입자.
제46항 내지 제84항 중 어느 하나의 항에 있어서, 카고는 근육 질환 또는 장애를 치료할 수 있거나 또는 예방할 수 있는 것인 벡터 시스템, 폴리펩티드, 또는 입자.
제85항에 있어서, 근육 질환 또는 장애는
(a) 자가 면역 질환;
(b) 암;
(c) 근이영양증;
(d) 신경근 질환;
(e) 당 또는 글리코겐 저장 질환;
(f) 확장된 반복 질환;
(g) 우성 음성 질환;
(h) 심근병증;
(i) 바이러스 질환;
(j) 조로증; 또는
(k) 이의 임의 조합인, 벡터 시스템, 폴리펩티드, 또는 입자.
제85항 또는 제86항에 있어서, 카고는 모르폴리노, 펩티드-연결된 모르폴리노, 안티센스 올리고뉴클레오티드, PMO, 치료적 이식유전자, 치료적 폴리펩티드 또는 펩티드를 코딩하는 폴리뉴클레오티드, PPMO, 하나 이상의 펩티드, CRISPR-Cas 단백질, 가이드 RNA 또는 둘 모두를 코딩하는 하나 이상의 폴리뉴클레오티드, 리보뉴클레오단백질로서, CRISPR-Cas 시스템 분자, 치료적 이식유전자 RNA, 또는 다른 유전자 변형 또는 치료적 RNA 및/또는 단백질을 포함하는 것인 리보뉴클레오단백질, 또는 이의 임의 조합인 벡터 시스템, 폴리펩티드, 또는 입자.
제85항 내지 제87항 중 어느 하나의 항에 있어서, 카고는 유전자에서 엑손 스키핑을 유도할 수 있는 것인 벡터 시스템, 폴리펩티드, 또는 입자.
제85항 내지 제88항 중 어느 하나의 항에 있어서, 카고는 디스트로핀 유전자에서 엑손 스키핑을 유도할 수 있는 것인 벡터 시스템, 폴리펩티드, 또는 입자.
제85항 내지 제89항 중 어느 하나의 항에 있어서, 카고는 미니-디스트로핀 또는 마이크로-디스트로핀 유전자인 벡터 시스템, 폴리펩티드, 또는 입자.
제90항에 있어서, 미니-디스트로핀 또는 마이크로-디스트로핀 유전자는 스펙트린-유사 반복부 1, 2, 3, 및 24, 및 임의로 nNOS 도메인을 포함하는 것인 벡터 시스템, 폴리펩티드, 또는 입자.
제86항 내지 제91항 중 어느 하나의 항에 있어서, 확장된 반복 질환은 헌팅톤병, 근긴장성 이영양증, 또는 안면견갑상완근 이영양증 (FSHD)인 벡터 시스템, 폴리펩티드, 또는 입자.
제86항 내지 제92항 중 어느 하나의 항에 있어서, 근이영양증은 뒤쉔 근이영양증, 벡커 근이영양증, 지대근 이영양증, 에머리 드레이푸스 근이영양증, 근긴장성 이영양증, 또는 FSHD인 벡터 시스템, 폴리펩티드, 또는 입자.
제93항에 있어서, 근긴장성 이영양증은 1형 또는 2형인 벡터 시스템, 폴리펩티드, 또는 입자.
제85항 내지 제94항 중 어느 하나의 항에 있어서, 심근병증은 확장성 심근병증, 비후생 심근병증, DMD-연관 심근병증, 또는 다논병인 벡터 시스템, 폴리펩티드, 또는 입자.
제85항 내지 제95항 중 어느 하나의 항에 있어서, 당 또는 글리코겐 저장병은 MPS III형 질환 또는 폼페병인 벡터 시스템, 폴리펩티드, 또는 입자.
제96항에 있어서, MPS III형 질환은 MPS IIIA형, IIIB형, IIIC형, 또는 IIID형인 벡터 시스템, 폴리펩티드, 또는 입자.
제85항 내지 제97항 중 어느 하나의 항에 있어서, 신경근 질환은 샤르코-마리-투스병 또는 프리드라이히 운동실조인 벡터 시스템, 폴리펩티드, 또는 입자.
제78항 내지 제98항 중 어느 하나의 항에 있어서, 폴리펩티드, 입자, 또는 둘 모두는 증가된 근육 세포 역가, 근육 세포 특이성, 감소된 면역원성, 또는 이의 임의 조합을 갖는 것인 폴리펩티드, 또는 입자.
a. 제1항 내지 제43항 중 어느 하나의 항에 따른 조성물;
b. 제44항 내지 제77항 및 제85항 내지 제98항 중 어느 하나의 항에 따른 벡터 시스템;
c. 제81항 내지 제84항 및 제85항 내지 제99항 중 어느 하나의 항에 따른 폴리펩티드;
d. 제81항 내지 제99항 중 어느 하나의 항에 따른 입자; 또는
e. 이의 조합
을 포함하는 것인 세포.
제100항에 있어서, 세포는 원핵생물인 세포.
제100항에 있어서, 세포는 진핵생물인 세포.
a. 제1항 내지 제43항 중 어느 하나의 항에 따른 조성물;
b. 제44항 내지 제77항 및 제85항 내지 제98항 중 어느 하나의 항에 따른 벡터 시스템;
c. 제81항 내지 제84항 및 제85항 내지 제99항 중 어느 하나의 항에 따른 폴리펩티드;
d. 제81항 내지 제99항 중 어느 하나의 항에 따른 입자;
e. 제100항 내지 제102항 중 어느 하나의 항에 따른 세포; 또는
f. 이의 조합; 및
약학적으로 허용가능한 담체
를 포함하는 약학 제제.
이를 필요로 하는 대상체에게,
a. 제1항 내지 제43항 중 어느 하나의 항에 따른 조성물;
b. 제44항 내지 제77항 및 제85항 내지 제98항 중 어느 하나의 항에 따른 벡터 시스템;
c. 제81항 내지 제84항 및 제85항 내지 제99항 중 어느 하나의 항에 따른 폴리펩티드;
d. 제81항 내지 제99항 중 어느 하나의 항에 따른 입자;
e. 제100항 내지 제102항 중 어느 하나의 항에 따른 세포;
f. 제103항에 따른 약학 제제; 또는
g. 이의 조합
을 투여하는 단계를 포함하는 것인 방법.
제104항에 있어서, 대상체는 근육 질환 또는 장애를 갖는 것인 방법.
제105항에 있어서, 근육 질환 또는 장애는
a. 자가 면역 질환;
b. 암;
c. 근이영양증;
d. 신경근 질환;
e. 당 또는 글리코겐 저장 질환;
f. 확장된 반복 질환;
g. 우성 음성 질환;
h. 심근병증;
i. 바이러스 질환;
j. 조로증; 또는
k. 이의 임의 조합인, 방법.
제105항에 있어서, 확장된 반복 질환은 헌팅톤병, 근긴장성 이영양증, 또는 안면견갑상완근 이영양증 (FSHD)인 방법.
제105항 또는 제106항에 있어서, 근이영양증은 뒤쉔 근이영양증, 벡커 근이영양증, 지대근 이영양증, 에머리 드레이푸스 근이영양증, 근긴장성 이영양증, 또는 FSHD인 방법.
제107항에 있어서, 근긴장성 이영양증은 1형 또는 2형인 방법.
제105항 내지 제109항 중 어느 하나의 항에 있어서, 심근병증은 확장성 심근병증, 비후생 심근병증, DMD-연관 심근병증, 또는 다논병인 방법.
제105항 또는 제106항에 있어서, 당 또는 글리코겐 저장병은 MPS III형 질환 또는 폼페병인 방법.
제111항에 있어서, MPS III형 질환은 MPS IIIA형, IIIB형, IIIC형, 또는 IIID형인 방법.
제104항 내지 제112항 중 어느 하나의 항에 있어서, 신경근 질환은 샤르코-마리-투스병 또는 프리드라이히 운동실조인 방법.