KR20230142740A

KR20230142740A - Omni-103 crispr 뉴클레아제

Info

Publication number: KR20230142740A
Application number: KR1020237028527A
Authority: KR
Inventors: 리오르 이즈하르; 바르 나다브 마르바흐; 리앗 로카; 누릿 메론; 탈 오피르 아디브; 아리엘 기스판; 이디트 부흐; 니르 헥트
Original assignee: 에멘도바이오 인코포레이티드
Priority date: 2021-02-08
Filing date: 2022-02-07
Publication date: 2023-10-11
Also published as: JP2024506608A; WO2022170199A3; AU2022216642A9; IL305036A; CA3206576A1; EP4288085A2; WO2022170199A2; AU2022216642A1

Abstract

본 발명은 서열번호 1의 아미노산 서열과 적어도 95% 동일성을 갖는 서열을 포함하는 CRISPR 뉴클레아제, 또는 CRISPR 뉴클레아제를 인코딩하는 서열을 포함하는 핵산 분자를 포함하는 비-자연 발생 조성물을 제공한다.

Description

OMNI-103 CRISPR 뉴클레아제

본 출원은 2021년 12월 6일자로 출원된 미국 가출원 제63/286,855호, 2021년 6월 24일자로 출원된 미국 가출원 제63/214,506호, 및 2021년 2월 8일자로 출원된 미국 가출원 제63/147,166호의 이익을 주장하며, 이의 각각의 내용은 본 명세서에 참조에 의해 원용된다.

본 출원 전반에 걸쳐, 괄호 안에 언급된 것을 포함하여, 다양한 간행물이 언급된다. 본 출원에 전문이 언급된 모든 간행물의 개시내용은 본 발명이 속하는 기술 분야 및 본 발명과 함께 이용될 수 있는 당업계의 특징에 대한 추가적인 설명을 제공하기 위해 본 출원에 전문이 참조에 의해 본 명세서에 원용된다.

서열 목록에 대한 참조

본 출원은 파일의 크기가 86 킬로바이트이고, MS-윈도우와 운영 체제가 호환되는 IBM-PC 머신 형식으로 2022년 2월 6일자로 형성된, 명칭이 "220207_91677-A-PCT_Sequence_Listing_AWG.txt"인 파일에 존재하는 뉴클레오타이드 서열을 참조에 의해 원용하며, 이는 본 출원의 일부로 2022년 2월 7일자로 제출된 텍스트 파일에 포함되어 있다.

본 발명의 분야

본 발명은 특히 게놈 편집을 위한 조성물 및 방법에 관한 것이다.

박테리아 및 고세균 적응 면역의 일정한 간격을 두고 주기적으로 분포하는 짧은 회문 반복 서열(Clustered Regularly Interspaced Short Palindromic Repeat; CRISPR) 시스템은 단백질 조성 및 게놈 유전자좌 아키텍처의 매우 다양한 다양성을 나타낸다. CRISPR 시스템은 연구 및 게놈 조작을 위한 중요한 도구가 되었다. 그럼에도 불구하고, CRISPR 시스템의 많은 세부사항이 결정되지 않았으며, CRISPR 뉴클레아제의 적용 가능성은 서열 특이성 요건, 발현, 또는 전달 문제에 의해 제한될 수 있다. 상이한 CRISPR 뉴클레아제는 크기, PAM 부위, 표적내(on target) 활성, 특이성, 절단 패턴(예를 들어, 블런트(blunt), 엇갈린(staggered) 말단), 및 절단 후 삽입결실(indel) 형성의 두드러진 패턴과 같은 다양한 특성을 갖는다. 상이한 특성 세트가 상이한 적용에 유용할 수 있다. 예를 들어, 일부 CRISPR 뉴클레아제는 PAM 부위의 제한으로 인해 다른 CRISPR 뉴클레아제가 할 수 없는 특정 게놈 유전자좌를 표적화할 수 있다. 추가적으로, 현재 사용 중인 일부 CRISPR 뉴클레아제는 생체 내 적용 가능성을 제한할 수 있는 사전 면역(pre-immunity)을 나타낸다. 문헌[Charlesworth et al., Nature Medicine (2019) 및 Wagner et al., Nature Medicine (2019)]을 참조한다. 따라서, 신규 CRISPR 뉴클레아제의 발현, 조작 및 개선이 중요하다.

게놈 조작, 후생학적 조작, 게놈 표적화, 세포의 게놈 편집, 및/또는 시험관내 진단에 이용될 수 있는 조성물 및 방법이 본 명세서에 개시되어 있다.

개시된 조성물은 게놈 DNA 서열을 변형시키는 데 이용될 수 있다. 본 명세서에서 사용되는 바와 같이, 게놈 DNA는 관심이 있는 세포 또는 세포들에 존재하는 선형 및/또는 염색체 DNA 및/또는 플라스미드 또는 다른 염색체외 DNA 서열을 지칭한다. 일부 실시형태에서, 관심이 있는 세포는 진핵 세포이다. 일부 실시형태에서, 관심이 있는 세포는 원핵 세포이다. 일부 실시형태에서, 방법은 게놈 DNA 서열의 미리 결정된 표적 부위에서 이중-가닥 파손(DSB)을 생성하여, 게놈의 표적 부위(들)에서 DNA 서열의 돌연변이, 삽입, 및/또는 결실을 초래한다.

따라서, 일부 실시형태에서, 조성물은 일정한 간격을 두고 주기적으로 분포하는 짧은 회문 반복 서열(CRISPR) 뉴클레아제를 포함한다. 일부 실시형태에서, CRISPR 뉴클레아제는 CRISPR-연관 단백질이다.

OMNI-103 CRISPR 뉴클레아제

본 발명의 구현예는 표 1에 제공된 바와 같이 "OMNI-103" 뉴클레아제로 명명된 CRISPR 뉴클레아제를 제공한다.

본 발명은 (i) 서열번호 1의 아미노산 서열과 적어도 95% 동일성을 갖는 CRISPR 뉴클레아제 또는 서열이 서열번호 2 내지 3의 핵산 서열과 적어도 95% 동일성을 갖는 CRISPR 뉴클레아제를 인코딩하는 서열을 포함하는 핵산 분자를 포함하는 조성물 및 (ii) 표적 DNA의 서열에 상보적인 뉴클레오타이드 서열을 포함하는, DNA-표적화 RNA 분자, 또는 DNA-표적화 RNA 분자를 인코딩하는 DNA 폴리뉴클레오타이드를 세포에 도입하는 단계를 포함하는, 포유동물 세포의 게놈 내의 표적 부위에서 뉴클레오타이드 서열을 변형시키는 방법을 제공한다.

본 발명은 또한,

a) 직접 반복 서열에 연결된 가이드 서열 부분을 포함하는 하나 이상의 RNA 분자(여기서, 가이드 서열은 표적 서열열과 혼성화할 수 있음), 또는 하나 이상의 RNA 분자를 인코딩하는 하나 이상의 뉴클레오타이드 서열; 및

b) 서열번호 1의 아미노산 서열과 적어도 95% 동일성을 갖는 아미노산 서열을 포함하는 CRISPR 뉴클레아제 또는 CRISPR 뉴클레아제를 인코딩하는 서열을 포함하는 핵산 분자

를 포함하는 CRISPR 연관 시스템을 포함하는 비-자연 발생 조성물을 제공하며, 여기서 하나 이상의 RNA 분자는 표적 서열에 혼성화하고, 표적 서열은 프로토스페이서 인접 모티프(Protospacer Adjacent Motif: PAM)의 상보적 서열에 인접하며, 하나 이상의 RNA 분자는 RNA-가이드 뉴클레아제와 복합체를 형성한다.

본 발명은 또한

a) 서열번호 1의 아미노산 서열과 적어도 95% 동일성을 갖는 서열을 포함하는 CRISPR 뉴클레아제 또는 CRISPR 뉴클레아제를 인코딩하는 서열을 포함하는 핵산 분자; 및

b) i) CRISPR 뉴클레아제와 상호작용할 수 있는/CRISPR 뉴클레아제에 결합할 수 있는 뉴클레아제-결합 RNA 뉴클레오타이드 서열; 및

ii) 표적 DNA 서열의 서열에 상보적인 서열을 포함하는 DNA-표적화 RNA 뉴클레오타이드 서열

중 적어도 하나를 포함하는, 하나 이상의 RNA 분자, 또는 하나 이상의 RNA 분자를 인코딩하는 하나 이상의 DNA 폴리뉴클레오타이드

를 포함하는 비-자연 발생 조성물을 제공하며, 여기서 CRISPR 뉴클레아제는 하나 이상의 RNA 분자와 복합체화하여 표적 DNA 서열과 혼성화할 수 있는 복합체를 형성할 수 있다.

OMNI-103 CRISPR 뉴클레아제-RNA 복합체

본 발명은 또한 비-자연 발생 RNA 분자를 포함하는 조성물을 제공하며, RNA 분자는 crRNA 반복 서열 부분 및 가이드 서열 부분을 포함하되, RNA 분자는 tracrRNA 서열의 존재 하에 OMNI-103 뉴클레아제와 복합체를 형성하고 상기 뉴클레아제를 DNA 표적 부위에 대해 표적화하며, tracrRNA 서열은 RNA 분자의 tracrRNA 부분 또는 제2 RNA 분자의 tracrRNA 부분에 의해 인코딩된다.

본 발명은 또한 비-자연 발생 RNA 분자를 포함하는 조성물을 제공하며, RNA 분자는 RNA 스캐폴드 부분을 포함하고, RNA 스캐폴드 부분은 다음 구조를 가지며:

crRNA 반복 서열 부분 - tracrRNA 부분;

여기서 RNA 스캐폴드 부분은 OMNI-103 CRISPR 뉴클레아제와 복합체를 형성하고 상기 뉴클레아제를 RNA 분자의 가이드 서열 부분에 대해 상보성을 갖는 DNA 표적 부위에 대해 표적화한다.

OMNI-103 CRISPR 뉴클레아제 및 OMNI-103 CRISPR 뉴클레아제에 특이적으로 결합하고 이를 활성화시킬 수 있는 스캐폴드 부분을 포함하는 비-자연 발생 RNA를 사용하여 RNA 분자의 가이드 서열 부분(또한 RNA 스페이서 부분으로도 지칭됨)에 기반한 DNA 표적 부위를 표적화하는 게놈 조작, 후생학적 조작, 게놈 표적화, 세포의 게놈 편집, 및/또는 시험관내 진단에 이용될 수 있는 조성물 및 방법이 본 명세서에 개시되어 있다.

도 1a 내지 도 1b: OMNI-103과 호환되는 단일 가이드 RNA(sgRNA)(crRNA-tracrRNA)인 sgRNA12의 예측된 2차 구조. 도 1a: 언급된 sgRNA의 crRNA 및 tracrRNA 부분을 갖는 OMNI-103 V1(도 1a) 및 V2(도 1b)에 대한 crRNA-tracrRNA 이중나선(duplex)의 표시(표 2 참조).
도 2a 내지 도 2c: U2OS 세포에서 RNP로서 OMNI-103 활성 및 스페이서 최적화. OMNI-103 뉴클레아제를 과발현시키고 정제하였다. 정제된 단백질을 합성 sgRNA와 복합체화하여 RNP를 형성하였다. (도 2a) 시험관내 분석의 경우, 스페이서 길이가 20 내지 25 bp인 감소량의 RNP(4, 2, 1 및 0.5 pmol)(표 6에 열거됨)를 40 ng PDCD1 DNA 표적 주형과 함께 인큐베이션하였다. 선형 주형을 절단하는 능력에 의해 활성을 검증하였다. (도 2b 내지 도 2c) 시험관내 분석에서(도 2b) 스페이서 길이(20 내지 25개 뉴클레오타이드)의 PDCD1 S40을 갖는 RNP를 U2OS 세포주에 전기천공하고 편집 수준(삽입결실)을 NGS로 측정하였다. (도 2c) U2OS 세포에서 RNP로서 OMNI-103에 대한 활성 분석: PDCD1S40, TRACS35, TRACS33 및 B2M S12(22 bp 스페이서 길이, 표 6)를 갖는 RNP를 U2OS 세포주에 전기천공하고 편집 수준(삽입결실)을 차세대 염기서열 분석기법(next generation sequencing: NGS)으로 측정하였다.
도 3a 내지 도 3b. 비편향 생화학적 분석(가이드-seq)에 의한 OMNI-103 표적외 분석. PDCD1 S40 및 TRAC S35 가이드 분자를 갖는 RNP(표 6)를 dsODN과 혼합하고 U2OS 세포주에 전기천공하였다. (도 3a) 편집 수준(삽입결실) 및 dsODN 통합을 NGS로 측정하였다. (도 3b) 가이드 seq 분석은 PDCD1 S40 부위(서열번호 133) 또는 TRAC S35 부위(서열번호 134)에서 어떠한 비표적(off-target)도 나타내지 않았다.
도 4a 내지 도 4b: OMNI 뉴클레아제에 대한 시험관내 TXTL PAM 고갈 결과. PAM 로고는 고갈된 부위의 비율의 도식적 표현이다(상단 패널). PAM 플라스미드 라이브러리로부터 특정 PAM 서열(하단 패널, 좌측)의 고갈률(하단 패널, 우측)을 TXTL 반응의 NGS에 따라 계산하였다. 각각의 OMNI에 대한 계산은 PAM 라이브러리의 8 bp 서열에 따라 4N 창을 기반으로 한다. 반응 조건 하에서 테스트된 OMNI의 필요한 PAM 및 뉴클레아제 활성 수준은 고갈률로부터 유추된다. 다음에 대한 시험관내 PAM 고갈 결과: 도 4a: sgRNA 12를 갖는 OMNI-103. 도 4b: sgRNA 32를 갖는 OMNI-103.
도 5a 내지 도 5c: OMNI-103 sgRNA 버전은 HeLa 세포에서의 편집을 나타낸다. OMNI-103에 대한 sgRNA를 단축하기 위해, 스캐폴드의 4가지 상이한 버전을 테스트하였다. 이들 버전은 상부 줄기 및/또는 말단 헤어핀에서 결실을 포함하였다. 도 5a: OMNI-103용으로 설계된 상이한 sgRNA의 다중 서열 정렬. 구체적으로, OMNI-103 sgRNA v2 스캐폴드(107개 뉴클레오타이드, 서열번호 16으로 열거된 RNA)와 더 짧은 sgRNA 스캐폴드 버전 OMNI-103.1(101개 뉴클레오타이드, 서열번호 33으로 열거된 RNA), OMNI-103.2(85 뉴클레오타이드, 서열번호 34로 열거된 RNA), OMNI-103.3(79개 뉴클레오타이드, 서열번호 35로 열거된 RNA), 및 OMNI-103.4(95개 뉴클레오타이드, 서열번호 36으로 열거된 RNA)의 정렬. 도 5b: 더 짧은 버전을 형성하는 주형으로 사용된 sgRNA 103.v2의 예측된 구조(더 짧은 버전을 형성하는 데 사용된 결실이 표시되어 있음). 도 5c: 차세대 염기서열 분석기법(NGS)에 의해 결정된 바와 같이 상이한 스캐폴드를 갖는 OMNI-103 CRISPR 뉴클레아제의 편집 활성. 2개 부위는 테스트한 TRAC S91 및 PDCD S40이었다. 형질감염 효율을 플라스미드가 리포터 형광 단백질(mCherry)을 발현함에 따라 FACS에 의해 결정하였다.
도 6a 내지 도 6f. 표 3에 열거된 sgRNA의 예측된 2차 구조. 도 6a: 스캐폴드 V2. 도 6b: 스캐폴드 V2.1. 도 6c: 스캐폴드 V2.2. 도 6d: 스캐폴드 V2.3. 도 6e: 스캐폴드 V2.4. 도 6f: 스캐폴드 V2.5.
도 7. 상이한 sgRNA 스캐폴드를 갖는 HeLa 세포에서의 OMNI-103 편집 활성(표 3). HeLa 세포를 TRAC-S91 또는 PDCD-S40을 표적화하는 sgRNA 플라스미드 및 OMNI-103으로 형질감염시켰다. 편집 활성을 차세대 염기서열 분석기법 결과(막대)를 기반으로 계산하였고, 형질감염 효율을 mCherry 발현의 FACS 분석을 기반으로 하였다. 3개 기술 복제물의 평균 및 표준 편차가 제시되어 있다.
도 8. U2OS에서의 활성. U2OS 세포를 TRAC S35 및 B2M S12를 표적화하는 sgRNA(RNP) 및 OMNI-103으로 전기천공하였다. 편집 활성을 차세대 염기서열 분석기법(NGS) 결과를 기반으로 계산하였다. 3개 기술 복제물의 평균 및 표준 편차가 제시되어 있다.
도 9. 1차 T 세포에서의 활성. 1차 T 세포를 제조업체의 프로토콜에 따라 PBMC로부터 단리하고 활성화시켰다(Miltenyi #130-096-535, #130-091-441). 활성화된 T 세포를 TRAC-s35 및 B2M-s12를 표적화하는 sgRNA(RNP) 및 OMNI-103으로 전기천공하였다. 팔(8)일 후, 세포를 TCR 및 B2M 발현 수준에 대해 유세포 분석으로 측정하였다. 분석을 위해, 살아있는 세포 및 CD3-양성 세포만을 계수하였다. 제시된 결과는 대표적인 것이고 모두 유사한 결과를 나타낸 3개 T 세포 공여체 중 하나이다.
도 10. T 세포 활성화 분석. 절단 활성 분석에 사용된 공여체 샘플 세포를 72시간 동안 비드로 활성화시켰고, FACS로 측정된 바와 같이 85% 1차 T 세포 활성화를 나타내었다(CD3⁺CD25⁺ 세포).
도 11. RNA 스캐폴드의 대표적인 예. 예시적인 RNA 스캐폴드 부분은 테트라루프(tetraloop)에 의해 tracrRNA 부분에 연결된 crRNA 부분을 포함한다. crRNA 부분은 crRNA 반복 서열을 포함한다. tracrRNA 부분은 tracrRNA 항-반복 서열 및 추가적인 tracrRNA 절편을 포함한다. RNA 분자는, RNA 분자가 단일-가이드 RNA 분자로서 기능하도록, crRNA 반복 서열에 연결된 가이드 서열 부분(즉, RNA 스페이서)을 더 포함할 수 있다.

본 발명의 일부 양태에 따르면, 개시된 조성물은 일정한 간격을 두고 주기적으로 분포하는 짧은 회문 반복 서열(CRISPR) 뉴클레아제 및/또는 이를 인코딩하는 서열을 포함하는 핵산 분자를 포함한다.

표 1은 신규 CRISPR 뉴클레아제뿐만 아니라, 뉴클레아제를 닉카제(nickase) 또는 촉매적으로 사멸된(catalytically dead) 뉴클레아제로 전환시키는 각각의 뉴클레아제 내의 하나 이상의 위치에서의 치환을 열거한다.

표 2는 각각 열거된 CRISPR 뉴클레아제와 호환 가능한, crRNA, tracrRNA, 및 단일-가이드 RNA(sgRNA) 서열, 및 crRNA, tracrRNA, 및 sgRNA 서열의 부분을 제공한다. 따라서, crRNA:tracrRNA 복합체의 일부로서 표 2에 열거된 OMNI 뉴클레아제에 결합하고 이를 표적화할 수 있는 crRNA 분자는 표 2에 열거된 임의의 crRNA 서열을 포함할 수 있다. 유사하게, crRNA:tracrRNA 복합체의 일부로서 표 2에 열거된 OMNI 뉴클레아제에 결합하고 이를 표적화할 수 있는 tracrRNA 분자는 표 2에 열거된 임의의 tracrRNA 서열을 포함할 수 있다. 또한, 표 2에 열거된 OMNI 뉴클레아제에 결합하고 이를 표적화할 수 있는 단일-가이드 RNA 분자는 표 2에 열거된 임의의 서열을 포함할 수 있다.

예를 들어, OMNI-103 뉴클레아제의 crRNA 분자(서열번호 1)는 서열번호 4 내지 7 및 18 내지 21 중 어느 하나의 서열을 포함할 수 있고; OMNI-103 뉴클레아제의 tracrRNA 분자는 서열번호 8 내지 14, 17, 22 내지 28 및 32 중 어느 하나의 서열을 포함할 수 있으며; OMNI-103 뉴클레아제의 sgRNA 분자는 서열번호 4 내지 36 중 어느 하나의 서열을 포함할 수 있다. 각각의 OMNI 뉴클레아제에 대한 다른 crRNA 분자, tracrRNA 분자, 또는 sgRNA 분자는 동일한 방식으로 표 2에 열거된 서열로부터 유래될 수 있다.

본 발명은 서열번호 1의 아미노산 서열과 적어도 90% 동일성을 갖는 서열을 포함하는 CRISPR 뉴클레아제, 또는 CRISPR 뉴클레아제를 인코딩하는 서열을 포함하는 핵산 분자를 포함하는 비-자연 발생 조성물을 제공한다. 핵산 분자는, 예를 들어 DNA 분자 또는 RNA 분자일 수 있다.

일부 실시형태에서, CRISPR 뉴클레아제는 완전한 촉매 활성을 갖거나, 닉카제이거나, 촉매적으로 불활성이고, DNA-상호활성 또는 변형 단백질에 융합된다. 예를 들어, CRISPR 뉴클레아제는 염기 편집 방법에서 사용하기 위해 데아미나제 단백질에 융합될 수 있다. 또 다른 예에서, CRISPR 뉴클레아제는 프라임(prime) 편집 방법에서 사용하기 위해 역전사효소에 융합될 수 있다.

일부 실시형태에서, 조성물은 하나 이상의 RNA 분자, 또는 하나 이상의 RNA 분자 중 어느 하나를 인코딩하는 DNA 폴리뉴클레오타이드를 더 포함하며, 여기서 하나 이상의 RNA 분자 및 CRISPR 뉴클레아제는 자연적으로 함께 발생하지 않고 하나 이상의 RNA 분자는 CRISPR 뉴클레아제와 복합체를 형성하고/하거나 복합체를 표적 부위에 대해 표적화하도록 구성된다.

일부 실시형태에서, CRISPR 뉴클레아제는 서열번호 1에 제시된 아미노산 서열과 적어도 90% 동일성을 갖는 서열을 포함하고 적어도 하나의 RNA 분자는 서열번호 4 내지 36으로 이루어진 군으로부터 선택되는 서열을 포함한다.

일부 실시형태에서, CRISPR 뉴클레아제는 서열번호 1에 제시된 아미노산 서열과 적어도 90% 동일성을 갖는 서열을 포함하고 적어도 하나의 RNA 분자는 서열번호 4 내지 7 및 18 내지 21로 이루어진 군으로부터 선택되는 서열 및 가이드 서열 부분을 포함하는 CRISPR RNA(crRNA) 분자이다.

일부 실시형태에서, 조성물은 서열번호 8 내지 14, 17, 22 내지 28 및 32로 이루어진 군에 제시된 서열을 포함하는 전사활성화(transactivating) CRISPR RNA(tracrRNA) 분자를 더 포함한다.

일부 실시형태에서, CRISPR 뉴클레아제는 서열번호 1에 제시된 아미노산 서열과 적어도 90% 동일성을 갖는 서열을 포함하고 적어도 하나의 RNA 분자는 가이드 서열 부분 및 서열번호 4 내지 36으로 이루어진 군으로부터 선택되는 서열을 포함하는 단일-가이드 RNA(sgRNA) 분자이다.

일부 실시형태에서, CRISPR 뉴클레아제는 서열번호 1에 제시된 아미노산 서열과 적어도 90% 동일성을 갖는 서열을 포함하고 적어도 하나의 RNA 분자는 가이드 서열 부분 및 길이가 적어도 79개 뉴클레오타이드인 스캐폴드 부분을 포함하는 단일-가이드 RNA(sgRNA) 분자이다.

일부 실시형태에서, CRISPR 뉴클레아제는 표 1의 칼럼 5에서 CRISPR 뉴클레아제에 대해 제공된 위치에서 아미노산 치환에 의해 형성된 불활성화된 RuvC 도메인을 갖는 닉카제이다.

일부 실시형태에서, CRISPR 뉴클레아제는 표 1의 칼럼 6에서 CRISPR 뉴클레아제에 대해 제공된 위치에서 아미노산 치환에 의해 형성된 불활성화된 HNH 도메인을 갖는 닉카제이다.

일부 실시형태에서, CRISPR 뉴클레아제는 표 1의 칼럼 7에서 CRISPR 뉴클레아제에 대해 제공된 위치에서 치환에 의해 형성된 불활성화된 RuvC 도메인 및 불활성화된 HNH 도메인을 갖는 촉매적으로 사멸된 뉴클레아제이다.

예를 들어, OMNI-103의 아미노산 서열(서열번호 1)의 위치 12에서 아스파트산 잔기(D)를 또 다른 아미노산, 예를 들어 알라닌(A)으로 치환함으로써 RuvC 도메인을 불활성화시킴으로써 OMNI-103 뉴클레아제에 대한 닉카제가 생성될 수 있다. 아스파트산(D)에서 글루탐산(E) 또는 글루탐산(E) 또는 아스파트산(D)으로의 치환 이외의 임의의 치환이 불활성화를 초래하는 것을 나타내는 별표가 아미노산 위치에 있는 경우를 제외하고, 임의의 다른 아미노산으로의 치환은 표 1의 칼럼 5 내지 7에 표시된 아미노산 위치의 각각에 대해 허용 가능하다. 예를 들어, OMNI-103의 아미노산 서열(서열번호 1)의 위치 856에서 아스파트산(D)을 글루탐산 잔기(E) 이외의 아미노산, 예를 들어 알라닌(A)으로 치환함으로써 HNH 도메인을 불활성화시킴으로써 OMNI-103 뉴클레아제에 대한 닉카제가 생성될 수 있다. 다른 닉카제 또는 촉매적으로 사멸된 뉴클레아제는 표 1의 동일한 표기법을 사용하여 생성될 수 있다.

일부 실시형태에서, CRISPR 뉴클레아제는 위치 D12, E776, H988 또는 D991에서 아미노산 치환에 의해 형성되는 닉카제이다.

일부 실시형태에서, CRISPR 뉴클레아제는 위치 D856, H857 또는 N880에서 아미노산 치환에 의해 형성되는 닉카제이며, 여기서 위치 D856에서 아미노산 치환은 아스파트산(D) 이외의 글루탐산(E)으로의 치환이다.

일부 실시형태에서, CRISPR 뉴클레아제는 위치 D12, E776, H988 또는 D991 중 어느 하나에서의 아미노산 치환 및 D856, H857 또는 N880 중 어느 하나에서의 아미노산 치환에 의해 형성된 촉매적으로 사멸된 뉴클레아제이며, 여기서 위치 D856에서의 아미노산 치환은 아스파트산(D) 이외의 글루탐산(E)으로의 치환이다.

일부 실시형태에서, CRISPR 뉴클레아제는 표 3의 칼럼 2 또는 칼럼 3에서 CRISPR 뉴클레아제에 대해 제공된 프로토스페이서 인접 모티프(PAM) 서열을 이용한다.

본 발명은 또한 상기 기재된 조성물 중 어느 하나를 세포에 도입하는 단계를 포함하는, 무세포 시스템 또는 세포의 게놈 내 DNA 표적 부위에서 뉴클레오타이드 서열을 변형시키는 방법을 제공한다. 일부 실시형태에서, 조성물은 CRISPR 뉴클레아제 및 crRNA:tracrRNA 복합체 또는 sgRNA 분자를 포함한다.

일부 실시형태에서, CRISPR 뉴클레아제는 표 3의 칼럼 2 또는 칼럼 3에서 CRISPR 뉴클레아제에 대해 제공된 프로토스페이서 인접 모티프(PAM) 서열에 인접한 DNA 가닥에 DNA 파손을 초래하고, PAM 서열에 상보적인 서열에 인접한 DNA 가닥에 DNA 파손을 초래한다. 예를 들어, 적절한 표적화 sgRNA 또는 crRNA:tracrRNA 복합체를 갖는 OMNI-103 뉴클레아제는 NNRRHY, NNRACT, 또는 NNRVCT 서열에 인접한 가닥 및 NNRRHY, NNRACT, 또는 NNRVCT 서열에 상보적인 서열에 인접한 DNA 가닥에서 DNA 파손을 형성할 수 있다. 일부 실시형태에서, DNA 가닥은 세포의 핵 내에 있다.

일부 실시형태에서, CRISPR 뉴클레아제는 표 1의 칼럼 5에서 CRISPR 뉴클레아제에 대해 제공된 위치에서 아미노산 치환에 의해 형성된 불활성화된 RuvC 도메인을 갖는 닉카제이며, PAM 서열에 상보적인 서열에 인접한 DNA 가닥에서 DNA 파손을 초래한다.

일부 실시형태에서, CRISPR 뉴클레아제는 표 1의 칼럼 6에서 CRISPR 뉴클레아제에 대해 제공된 위치에서 아미노산 치환에 의해 형성된 불활성화된 HNH 도메인을 갖는 닉카제이며, PAM 서열에 인접한 DNA 가닥에서 DNA 파손을 초래한다.

일부 실시형태에서, CRISPR 뉴클레아제는 표 1의 칼럼 7에서 CRISPR 뉴클레아제에 대해 제공된 위치에서 치환에 의해 형성된 불활성화된 RuvC 도메인 및 불활성화된 HNH 도메인을 갖는 촉매적으로 사멸된 뉴클레아제이며, PAM 서열에 인접한 DNA 가닥에서 DNA 파손을 초래한다.

본 발명은 또한 본 명세서에서 제공된 조성물 중 어느 하나를 세포에 도입하는 단계를 포함하는, 무세포 시스템 또는 세포의 게놈 내 DNA 표적 부위에서 뉴클레오타이드 서열을 변형시키는 방법을 제공한다.

일부 실시형태에서, CRISPR 뉴클레아제는 서열번호 1에 제시된 아미노산 서열에 적어도 90% 동일성을 갖는 서열을 포함하며, 여기서 CRISPR 뉴클레아제는 NNRRHY, NNRACT, 또는 NNRVCT 프로토스페이서 인접 모티프(PAM) 서열에 인접한 DNA 가닥 파손을 초래하고/하거나 PAM 서열에 상보적인 서열에 인접한 DNA 가닥 파손을 초래한다.

일부 실시형태에서, CRISPR 뉴클레아제는 위치 D12, E776, H988 또는 D991에서 아미노산 치환에 의해 형성되는 닉카제이며, PAM 서열에 인접한 DNA 가닥 파손을 초래한다.

일부 실시형태에서, CRISPR 뉴클레아제는 위치 D856, H857 또는 N880에서 아미노산 치환에 의해 형성되는 닉카제이고, PAM 서열에 상보적인 서열에 인접한 DNA 가닥 파손을 초래하며, 위치 D856에서 아미노산 치환은 아스파트산(D) 이외의 글루탐산(E)으로의 치환이다.

일부 실시형태에서, 세포는 진핵 세포 또는 원핵 세포이다.

일부 실시형태에서, 세포는 포유동물 세포이다.

일부 실시형태에서, 세포는 인간 세포이다.

일부 실시형태에서, CRISPR 뉴클레아제는 서열번호 1인 CRISPR 뉴클레아제와 적어도 100%, 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91%, 90%, 89%, 88%, 87%, 86%, 85%, 84%, 83%, 또는 82% 아미노산 서열 동일성을 갖는 아미노산 서열을 포함한다. 일 실시형태에서, CRISPR 뉴클레아제를 인코딩하는 서열은 서열번호 2 내지 3으로 이루어진 군으로부터 선택되는 핵산 서열과 적어도 100%, 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91%, 90%, 89%, 88%, 87%, 86%, 85%, 84%, 83%, 또는 82% 동일성을 갖는다.

본 발명은 또한 CRISPR 뉴클레아제를 포함하는 비-자연 발생 조성물을 제공하며, 여기서 CRISPR 뉴클레아제는 서열번호 1의 도메인 A, 도메인 B, 도메인 C, 도메인 D, 도메인 E, 도메인 F, 도메인 G, 도메인 H, 도메인 I, 또는 도메인 J 중 적어도 하나의 아미노산 서열에 상응하는 아미노산 서열을 포함하고,

a) 도메인 A는 서열번호 1의 아미노산 1 내지 45와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함하고;

b) 도메인 B는 서열번호 1의 아미노산 46 내지 83과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함하고;

c) 도메인 C는 서열번호 1의 아미노산 84 내지 158과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함하고;

d) 도메인 D는 서열번호 1의 아미노산 159 내지 302와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함하고;

e) 도메인 E는 서열번호 1의 아미노산 303 내지 515와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함하고;

f) 도메인 F는 서열번호 1의 아미노산 516 내지 727과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함하고;

g) 도메인 G는 서열번호 1의 아미노산 728 내지 778과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함하고;

h) 도메인 H는 서열번호 1의 아미노산 779 내지 923과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함하고;

i) 도메인 I는 서열번호 1의 아미노산 924 내지 1068과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함하고;

j) 도메인 J는 서열번호 1의 아미노산 1069 내지 1348과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함한다.

본 발명의 일부 양태에 따르면, 개시된 조성물은 CRISPR 뉴클레아제 또는 변이체 CRISPR 뉴클레아제를 인코딩하는 뉴클레오타이드 서열을 포함하는 DNA 작제물 또는 벡터 시스템을 포함한다. 일부 실시형태에서, CRISPR 뉴클레아제 또는 변이체 CRISPR 뉴클레아제를 인코딩하는 뉴클레오타이드 서열은 관심이 있는 세포에서 작동 가능한 프로모터에 작동 가능하게 연결된다. 일부 실시형태에서, 관심이 있는 세포는 진핵 세포이다. 일부 실시형태에서, 관심이 있는 세포는 포유동물 세포이다. 일부 실시형태에서, 조작된 CRISPR 뉴클레아제를 인코딩하는 핵산 서열은 특정 유기체 유래의 세포에서 사용하기 위해 코돈 최적화된다. 일부 실시형태에서, 뉴클레아제를 인코딩하는 핵산 서열은 이. 콜라이(E. coli)에 대해 코돈 최적화된다. 일부 실시형태에서, 뉴클레아제를 인코딩하는 핵산 서열은 진핵 세포에 대해 코돈 최적화된다. 일부 실시형태에서, 뉴클레아제를 인코딩하는 핵산 서열은 포유동물 세포에 대해 코돈 최적화된다.

일부 실시형태에서, 조성물은 서열번호 1과 적어도 100%, 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91%, 90% 동일성을 갖는 CRISPR 효소를 인코딩하는 폴리뉴클레오타이드에 작동 가능하게 연결된 이종 프로모터를 포함하는, 재조합 핵산을 포함한다. 각각의 가능성은 별개의 실시형태를 나타낸다.

조성물의 일 실시형태에서, CRISPR 뉴클레아제는 서열번호 1에 제시된 아미노산 서열과 적어도 75%, 80%, 85, 90%, 95% 또는 97% 동일성을 갖거나 CRISPR 뉴클레아제를 인코딩하는 서열은 서열번호 2 및 3으로 이루어진 군으로부터 선택되는 뉴클레오타이드 서열과 적어도 75%, 80%, 85, 90%, 95% 또는 97% 서열 동일성을 갖는다.

일부 실시형태에 따르면, 서열번호 1의 아미노산 서열과 적어도 100%, 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91%, 90%, 85%, 80% 동일성을 갖는 서열을 포함하는 CRISPR 뉴클레아제 또는 CRISPR 뉴클레아제를 인코딩하는 서열을 포함하는 핵산 분자를 포함하는 조작되거나 비-자연 발생 조성물이 제공된다. 각각의 가능성은 별개의 실시형태를 나타낸다.

일 실시형태에서, CRISPR 뉴클레아제는 조작되거나 비-자연 발생인 것이다. CRISPR 뉴클레아제는 또한 재조합일 수 있다. 이러한 CRISPR 뉴클레아제는 실험실 방법(예를 들어, 분자 클로닝)을 사용하여 생산되어 다수 공급원 유래의 유전 물질을 합하여, 그렇지 않으면 생물학적 유기체에서 찾을 수 없는 서열을 형성한다.

일 실시형태에서, CRISPR 뉴클레아제는 DNA-표적화 RNA 분자(gRNA)와 상호작용할 수 있는 RNA-결합 부분 및 부위-지정 효소 활성을 나타내는 활성 부분을 더 포함한다.

일 실시형태에서, 조성물은 DNA-표적화 RNA 분자 또는 DNA-표적화 RNA 분자를 인코딩하는 DNA 폴리뉴클레오타이드를 더 포함하며, DNA-표적화 RNA 분자는 가이드 서열 부분, 즉 표적 영역에서 서열에 상보적인 뉴클레오타이드 서열을 포함하고, DNA-표적화 RNA 분자 및 CRISPR 뉴클레아제는 자연적으로 함께 발생하지 않는다.

일 실시형태에서, DNA-표적화 RNA 분자는 CRISPR 뉴클레아제와 복합체를 형성할 수 있는 뉴클레오타이드 서열을 더 포함한다.

본 발명은 또한,

를 포함하는 CRISPR 연관 시스템을 포함하는 비-자연 발생 조성물을 제공하며, 여기서 하나 이상의 RNA 분자는 표적 서열에 혼성화하고, 표적 서열은 프로토스페이서 인접 모티프(PAM)에 인접하며, 하나 이상의 RNA 분자는 RNA-가이드 뉴클레아제와 복합체를 형성한다.

일 실시형태에서, 조성물은 CRISPR 뉴클레아제와 복합체를 형성할 수 있는 뉴클레오타이드 서열을 포함하는 RNA 분자(예를 들어, tracrRNA 분자) 또는 CRISPR 뉴클레아제와 복합체를 형성할 수 있는 RNA 분자를 인코딩하는 서열을 포함하는 DNA 폴리뉴클레오타이드를 더 포함한다.

일 실시형태에서, 조성물은 상동성 지정 복구(homology directed repair; HDR)를 위한 공여체 주형을 더 포함한다.

일 실시형태에서, 조성물은 세포의 게놈에서 표적 영역을 편집할 수 있다.

일부 실시형태에 따르면,

(a) RNA-결합 부분; 및

부위-지정 효소 활성을 나타내는 활성 부분

을 포함하는, CRISPR 뉴클레아제, 또는 CRISPR 뉴클레아제를 인코딩하는 폴리뉴클레오타이드로서, CRISPR 뉴클레아제는 서열번호 1과 적어도 100%, 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91%, 90%, 85%, 80% 동일성을 갖는, CRISPR 뉴클레아제, 또는 CRISPR 뉴클레아제를 인코딩하는 폴리뉴클레오타이드; 및

(b) i) 표적 DNA 서열의 서열에 상보적인 뉴클레오타이드 서열을 포함하는 DNA-표적화 RNA 서열; 및

ii) CRISPR 뉴클레아제의 RNA-결합 부분과 상호작용할 수 있는 단백질-결합 RNA 서열

을 포함하는, 하나 이상의 RNA 분자, 또는 하나 이상의 RNA 분자를 인코딩하는 DNA 폴리뉴클레오타이드

를 포함하는 비-자연 발생 조성물이 제공되며, 여기서 DNA 표적화 RNA 서열 및 CRISPR 뉴클레아제는 자연적으로 함께 발생하지 않는다. 각각의 가능성은 별개의 실시형태를 나타낸다.

일부 실시형태에서, DNA-표적화 RNA 서열 및 단백질-결합 RNA 서열을 포함하는 단일 RNA 분자가 제공되며, 여기서 RNA 분자는 CRISPR 뉴클레아제와 복합체를 형성하고 DNA 표적화 모듈의 역할을 할 수 있다. 일부 실시형태에서, RNA 분자는 길이가 최대 1000개 염기, 900개 염기, 800개 염기, 700개 염기, 600개 염기, 500개 염기, 400개 염기, 300개 염기, 200개 염기, 100개 염기, 50개 염기이다. 각각의 가능성은 별개의 실시형태를 나타낸다. 일부 실시형태에서, DNA-표적화 RNA 서열을 포함하는 제1 RNA 분자 및 단백질-결합 RNA 서열을 포함하는 제2 RNA 분자는 염기쌍 형성에 의해 상호작용하거나 대안적으로 함께 융합되어 CRISPR 뉴클레아제와 복합체화하고 DNA 표적화 모듈의 역할을 하는 하나 이상의 RNA 분자를 형성한다.

본 발명은 또한

일 실시형태에서, CRISPR 뉴클레아제 및 하나 이상의 RNA 분자는 표적 DNA 서열에 결합할 수 있는 CRISPR 복합체를 형성하여 표적 DNA 서열의 절단을 초래한다.

일 실시형태에서, CRISPR 뉴클레아제 및 하나 이상의 RNA 분자 중 적어도 하나는 자연적으로 함께 발생하지 않는다.

일 실시형태에서:

a) CRISPR 뉴클레아제는 RNA-결합 부분 및 부위-지정 효소 활성을 나타내는 활성 부분을 포함하고;

b) DNA-표적화 RNA 뉴클레오타이드 서열은 표적 DNA 서열의 서열에 상보적인 뉴클레오타이드 서열을 포함하고;

c) 뉴클레아제-결합 RNA 뉴클레오타이드 서열은 CRISPR 뉴클레아제의 RNA-결합 부분과 상호작용하는 서열을 포함한다.

일 실시형태에서, 뉴클레아제-결합 RNA 뉴클레오타이드 서열 및 DNA-표적화 RNA 뉴클레오타이드 서열은 단일 가이드 RNA 분자(sgRNA) 상에 있으며, 여기서 sgRNA 분자는 CRISPR 뉴클레아제와 복합체를 형성하고 DNA 표적화 모듈의 역할을 할 수 있다.

일 실시형태에서, 뉴클레아제-결합 RNA 뉴클레오타이드 서열은 제1 RNA 분자 상에 있고 DNA-표적화 RNA 뉴클레오타이드 서열은 제2 RNA 분자 상에 있으며, 제1 및 제2 RNA 분자는 염기쌍 형성에 의해 상호작용하거나 함께 융합되어 CRISPR 뉴클레아제와 복합체를 형성하고 DNA 표적화 모듈의 역할을 하는 sgRNA 또는 RNA 복합체를 형성한다.

일 실시형태에서, sgRNA는 길이가 최대 1000개 염기, 900개 염기, 800개 염기, 700개 염기, 600개 염기, 500개 염기, 400개 염기, 300개 염기, 200개 염기, 100개 염기, 50개 염기이다.

일 실시형태에서, 조성물은 상동성 지정 복구(HDR)를 위한 공여체 주형을 더 포함한다.

일 실시형태에서, CRISPR 뉴클레아제는 비-자연 발생인 것이다.

일 실시형태에서, CRISPR 뉴클레아제는 조작되거나 비천연 또는 합성 아미노산을 포함한다.

일 실시형태에서, CRISPR 뉴클레아제는 조작되고 핵 국재화 서열(NLS), 세포 침투 펩타이드 서열, 및/또는 친화성 태그 중 하나 이상을 포함한다.

일 실시형태에서, CRISPR 뉴클레아제는 진핵 세포의 핵에서 검출 가능한 양으로 CRISPR 뉴클레아제를 포함하는 CRISPR 복합체의 축적을 구동하기에 충분한 강도의 하나 이상의 핵 국재화 서열을 포함한다.

본 발명은 또한 본 발명의 조성물 중 임의의 것을 세포에 도입하는 단계를 포함하는, 무세포 시스템 또는 세포의 게놈 내 표적 부위에서 뉴클레오타이드 서열을 변형시키는 방법을 제공한다.

일 실시형태에서, 세포는 진핵 세포이다.

또 다른 실시형태에서, 세포는 원핵 세포이다.

일부 실시형태에서, 하나 이상의 RNA 분자는 RNA 뉴클레아제(tracrRNA)와 복합체를 형성할 수 있는 뉴클레오타이드 분자를 포함하는 RNA 서열 또는 CRISPR 뉴클레아제와 복합체를 형성할 수 있는 뉴클레오타이드 서열을 포함하는 RNA 분자를 인코딩하는 DNA 폴리뉴클레오타이드를 더 포함한다.

일 실시형태에서, CRISPR 뉴클레아제는 아미노-말단에 또는 그 근처에 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개, 또는 그 이상의 NLS, 카복시-말단에 또는 그 근처에 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개, 또는 그 이상의 NLS, 또는 아미노-말단에 또는 그 근처에 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개, 또는 그 이상의 NLS와 카복시-말단에 또는 그 근처에 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개, 또는 그 이상의 NLS의 조합을 포함한다. 일 실시형태에서, 1 내지 4개 NLS는 CRISPR 뉴클레아제와 융합된다. 일 실시형태에서, NLS는 CRISPR 뉴클레아제의 오픈-리딩 프레임(ORF) 내에 위치한다.

아미노-말단에 또는 그 근처에, 카복시-말단에 또는 그 근처에, 또는 발현된 단백질의 ORF 내에 NLS를 융합시키는 방법은 당업계에 잘 알려져 있다. 일 예로서, CRISPR 뉴클레아제의 아미노-말단에 NLS를 융합시키기 위해, NLS의 핵산 서열은 NLS-융합 CRISPR 뉴클레아제를 인코딩하는 핵산 상에서 CRISPR 뉴클레아제의 시작 코돈 바로 뒤에 위치한다. 반대로, CRISPR 뉴클레아제의 카복시-말단에 NLS를 융합시키기 위해, NLS의 핵산 서열은 CRISPR 뉴클레아제의 마지막 아미노산을 인코딩하는 코돈 뒤와 정지 코돈 앞에 위치한다.

CRISPR 뉴클레아제의 ORF를 따라 임의의 위치에서 NLS, 세포 침투 펩타이드 서열, 및/또는 친화성 태그의 임의의 조합이 본 발명에서 고려된다.

본 명세서에서 제공되는 CRISPR 뉴클레아제의 아미노산 서열 및 핵산 서열은 CRISPR 뉴클레아제의 인접한 아미노산 또는 핵산 서열을 방해하도록 삽입된 NLS 및/또는 TAG를 포함할 수 있다.

일 실시형태에서, 하나 이상의 NLS는 탠덤 반복으로 존재한다.

일 실시형태에서, 하나 이상의 NLS는 NLS의 가장 가까운 아미노산이 N- 또는 C-말단으로부터 폴리펩타이드 사슬을 따라 약 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 40, 50개, 또는 그 이상의 아미노산 내에 있을 때 N- 또는 C-말단에 근접한 것으로 간주된다.

논의된 바와 같이, CRISPR 뉴클레아제는 핵 국재화 서열(NLS), 세포 침투 펩타이드 서열, 및/또는 친화성 태그 중 하나 이상을 포함하도록 조작될 수 있다.

일 실시형태에서, 조성물은 CRISPR 뉴클레아제를 인코딩하는 서열을 포함하는 뉴클레오타이드 산 분자에 작동 가능하게 연결된 이종 프로모터를 포함하는 재조합 핵산 분자를 더 포함한다.

일 실시형태에서, CRISPR 뉴클레아제 또는 CRISPR 뉴클레아제를 인코딩하는 서열을 포함하는 핵산 분자는 비-자연 발생이거나 조작된다.

본 발명은 또한 본 발명의 CRISPR 뉴클레아제 중 임의의 것을 인코딩하는 서열을 포함하는 핵산 분자를 포함하는 벡터 시스템을 포함하는 비-자연 발생 또는 조작된 조성물을 제공한다.

본 발명은 또한 대상체의 게놈내의 표적 부위에서 뉴클레오타이드 서열을 변형시키는 것을 포함하는, 게놈 돌연변이와 연관된 질환을 앓고 있는 대상체의 치료를 위한 본 발명의 조성물 중 임의의 것의 용도를 제공한다.

일부 실시형태에서, 방법은 생체외에서 수행된다. 일부 실시형태에서, 방법은 생체내에서 수행된다. 일부 실시형태에서, 본 방법의 일부 단계는 생체외에서 수행되고 일부 단계는 생체내에서 수행된다. 일부 실시형태에서, 포유동물 세포는 인간 세포이다.

일 실시형태에서, 방법은 세포에 (iii) tracrRNA 서열을 포함하는 RNA 분자 또는 tracrRNA 서열을 포함하는 RNA 분자를 인코딩하는 DNA 폴리뉴클레오타이드를 도입하는 단계를 더 포함한다.

일 실시형태에서, DNA-표적화 RNA 분자는 crRNA 반복 서열을 포함한다.

일 실시형태에서, tracrRNA 서열을 포함하는 RNA 분자는 DNA-표적화 RNA 분자에 결합할 수 있다.

일 실시형태에서, DNA-표적화 RNA 분자 및 tracrRNA 서열을 포함하는 RNA 분자는 상호작용하여 RNA 복합체를 형성하고, RNA 복합체는 CRISPR 뉴클레아제와 활성 복합체를 형성할 수 있다.

일 실시형태에서, DNA-표적화 RNA 분자 및 뉴클레아제-결합 RNA 서열을 포함하는 RNA 분자는 CRISPR 뉴클레아제와 활성 복합체를 형성하기에 적합한 단일 가이드 RNA 분자의 형태로 융합된다.

일 실시형태에서, 가이드 서열 부분은 프로토스페이서 서열에 상보적인 서열을 포함한다.

일 실시형태에서, CRISPR 뉴클레아제는 DNA-표적화 RNA 분자와 복합체를 형성하고 프로토스페이서 인접 모티프(PAM)의 3' 또는 5'인 영역에서 이중 가닥 파손을 초래한다.

본 명세서에 기재된 방법 중 임의의 것의 일 실시형태에서, 방법은 대상체의 게놈내의 표적 부위에서 뉴클레오타이드 서열을 변형시키는 것을 포함하는, 게놈 돌연변이와 연관된 질환을 앓고 있는 대상체를 치료하기 위한 것이다.

일 실시형태에서, 방법은 먼저 게놈 돌연변이와 연관된 질환을 앓고 있는 대상체를 선택하는 단계 및 대상체로부터 세포를 수득하는 단계를 포함한다.

본 발명은 또한 본 명세서에 기재된 방법 중 임의의 것에 의해 수득되는 변형된 세포 또는 세포들을 제공한다. 일 실시형태에서 이러한 변형된 세포 또는 세포들은 자손 세포를 발생시킬 수 있다. 일 실시형태에서 이러한 변형된 세포 또는 세포들은 생착 후 자손 세포를 발생시킬 수 있다.

본 발명은 또한 이러한 변형된 세포 및 약제학적으로 허용 가능한 담체를 포함하는 조성물을 제공한다. 또한 세포를 약제학적으로 허용 가능한 담체와 혼합하는 단계를 포함하는, 이를 제조하는 시험관내 또는 생체외 방법이 제공된다.

일부 실시형태에서, crRNA 반복 서열 부분은 길이가 최대 17개 뉴클레오타이드, 바람직하게는 길이가 14 내지 17개 뉴클레오타이드이다.

일부 실시형태에서, crRNA 반복 서열 부분은 서열번호 114 또는 115와 적어도 60 내지 70%, 71 내지 80%, 81 내지 90%, 91 내지 95%, 또는 96 내지 99% 서열 동일성을 갖는다.

일부 실시형태에서, crRNA 반복 서열 부분은 서열번호 114 또는 115 중 어느 하나와 적어도 95% 서열 동일성을 갖는다.

일부 실시형태에서, crRNA 반복 서열은 서열번호 115 이외의 것이다.

일부 실시형태에서, crRNA 반복 서열 부분 및 가이드 서열 부분을 포함하는 RNA 분자는 tracrRNA 부분을 더 포함한다.

일부 실시형태에서, crRNA 반복 서열 부분은 폴리뉴클레오타이드 링커 부분에 의해 tracrRNA 부분에 공유로 연결된다.

일부 실시형태에서, 조성물은 tracrRNA 부분을 포함하는 제2 RNA 분자를 포함한다.

일부 실시형태에서, OMNI-103 뉴클레아제는 서열번호 1의 아미노산 서열과 적어도 95% 서열 동일성을 갖는다.

일부 실시형태에서, 가이드 서열 부분은 길이가 17 내지 30개 뉴클레오타이드, 바람직하게는 길이가 22개 뉴클레오타이드이다.

본 발명은 또한 비-자연 발생 RNA 분자를 포함하는 조성물을 제공하되, RNA 분자는 tracrRNA 부분을 포함하며, 여기서 RNA 분자는 crRNA 반복 서열 부분 및 가이드 서열 부분의 존재 하에 OMNI-103 뉴클레아제와 복합체를 형성하고 상기 뉴클레아제를 DNA 표적 부위에 대해 표적화하고, crRNA 반복 서열 부분 및 가이드 서열 부분은 RNA 분자 및 제2 RNA 분자에 의해 인코딩된다.

일부 실시형태에서, tracrRNA 부분은 길이가 85개 미만의 뉴클레오타이드, 바람직하게는 길이가 84 내지 80, 79 내지 75, 74 내지 70, 69 내지 65, 또는 64 내지 60개 뉴클레오타이드이다.

일부 실시형태에서, tracrRNA 부분은 서열번호 109 내지 113 중 어느 하나의 tracrRNA 부분과 적어도 30 내지 40%, 41 내지 50%, 51 내지 60%, 61 내지 70%, 71 내지 80%, 81 내지 90%, 91 내지 95%, 또는 96 내지 99% 서열 동일성을 갖는다.

일부 실시형태에서, tracrRNA 부분은 서열번호 109 내지 113 중 어느 하나의 tracrRNA 부분과 적어도 95% 서열 동일성을 갖는다.

일부 실시형태에서, tracrRNA 부분은 서열번호 15 또는 16의 tracr 부분 이외의 것이다.

일부 실시형태에서, tracrRNA 부분은 길이가 최대 19개 뉴클레오타이드, 바람직하게는 길이가 16 내지 19개 뉴클레오타이드인 tracrRNA 항-반복 서열 부분을 포함한다.

일부 실시형태에서, tracrRNA 부분은 서열번호 116 또는 117 중 어느 하나와 적어도 60 내지 70%, 71 내지 80%, 81 내지 90%, 91 내지 95%, 또는 96 내지 99% 서열 동일성을 갖는 tracrRNA 항-반복 서열 부분을 포함한다.

일부 실시형태에서, tracrRNA 부분은 서열번호 116 또는 117 중 어느 하나와 적어도 95% 서열 동일성을 갖는 tracrRNA 항-반복 서열 부분을 포함한다.

일부 실시형태에서, tracrRNA 부분은 서열번호 117 이외의 서열을 갖는 tracrRNA 항-반복 서열 부분을 포함한다.

일부 실시형태에서, RNA 분자는 tracrRNA 부분을 포함하고 crRNA 반복 서열 부분 및 가이드 서열 부분을 더 포함한다.

일부 실시형태에서, tracrRNA 부분은 폴리뉴클레오타이드 링커 부분에 의해 crRNA 반복 서열에 공유로 연결된다.

일부 실시형태에서, 폴리뉴클레오타이드 링커 부분은 길이가 4 내지 10개 뉴클레오타이드이다.

일부 실시형태에서, 폴리뉴클레오타이드 링커는 GAAA의 서열을 갖는다.

일부 실시형태에서, 조성물은 crRNA 반복 서열 부분 및 가이드 서열 부분을 포함하는 제2 RNA 분자를 더 포함한다.

본 발명은 또한 비-자연 발생 RNA 분자를 포함하는 조성물을 제공하되, RNA 분자는 RNA 스캐폴드 부분을 포함하고, RNA 스캐폴드 부분은 다음 구조를 가지며:

crRNA 반복 서열 부분 - tracrRNA 부분;

일부 실시형태에서, RNA 스캐폴드 부분은 길이가 110 내지 105, 104 내지 100, 99 내지 95, 94 내지 90, 89 내지 85, 84 내지 80, 79 내지 75, 또는 74 내지 70개 뉴클레오타이드이다.

일부 실시형태에서, RNA 스캐폴드 부분은 길이가 107, 101, 95, 85, 또는 79개 뉴클레오타이드이다.

일부 실시형태에서, RNA 스캐폴드 부분은 서열번호 109 내지 113 중 어느 하나와 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 서열 동일성을 갖는다.

일부 실시형태에서, crRNA 반복 서열은 서열번호 23 이외의 것이다.

일부 실시형태에서, tracrRNA 부분은 서열번호 15 또는 16의 tracrRNA 부분 이외의 것이다.

일부 실시형태에서, RNA 스캐폴드 부분은 RNA 스캐폴드가 다음 구조를 갖도록 crRNA 반복 서열 부분과 tracrRNA 부분 사이에 링커 부분을 더 포함한다:

crRNA 반복 서열 부분 - 링커 부분 - tracrRNA 부분.

일부 실시형태에서, tracrRNA 부분은 tracrRNA 항-반복 서열 부분을 포함하며, 여기서 crRNA 반복 서열 및 tracrRNA 항-반복 서열 부분은 링커 부분에 의해 공유로 연결된다.

일부 실시형태에서, 링커 부분은 길이가 4 내지 10개 뉴클레오타이드인 폴리뉴클레오타이드 링커이다.

일부 실시형태에서, tracrRNA 항-반복 서열은 서열번호 117 이외의 것이다.

일부 실시형태에서, tracrRNA 부분은 tracrRNA 항-반복 부분에 연결된 뉴클레오타이드의 제1 절편을 포함하고, 뉴클레오타이드의 제1 절편은 서열번호 118 내지 120 중 어느 하나와 적어도 95% 서열 동일성을 갖는다.

일부 실시형태에서, tracrRNA 부분은 뉴클레오타이드의 제1 절편에 연결된 뉴클레오타이드의 제2 섹션을 포함하고, 뉴클레오타이드의 제2 섹션은 서열번호 121 내지 124 중 어느 하나와 적어도 95% 서열 동일성을 갖는다.

일부 실시형태에서, RNA 스캐폴드 부분은 서열번호 109 내지 113 중 어느 하나의 뉴클레오타이드 서열과 적어도 95% 동일성을 갖는다.

일부 실시형태에서, RNA 스캐폴드 부분은 V2, V2.1, V2.2, V2.3, V2.4 또는 V2.5 RNA 스캐폴드 중 어느 하나의 예측된 구조를 갖는다.

일부 실시형태에서, RNA 스캐폴드 부분은 서열번호 15 또는 16 이외의 서열을 갖는다.

일부 실시형태에서, 가이드 서열 부분은 RNA 분자의 crRNA 반복 서열 부분에 공유로 연결되어, 다음 구조를 갖는 단일-가이드 RNA 분자를 형성한다:

가이드 서열 부분 - crRNA 반복 서열 부분 - tracrRNA 부분.

일부 실시형태에서, 가이드 서열 부분은 길이가 17 내지 30개 뉴클레오타이드, 더 바람직하게는 20 내지 23개 뉴클레오타이드, 더 바람직하게는 22개 뉴클레오타이드이다.

일부 실시형태에서, 조성물은 OMNI-103 CRISPR 뉴클레아제를 더 포함하며, 여기서 OMNI-103 CRISPR 뉴클레아제는 서열번호 1의 아미노산 서열과 적어도 95% 동일성을 갖는다.

일부 실시형태에서, RNA 분자는 시험관내 전사(IVT) 또는 고상 인공 올리고뉴클레오타이드 합성에 의해 형성된다.

일부 실시형태에서, RNA 분자는 변형된 뉴클레오타이드를 포함한다.

본 발명은 또한 상기 실시형태 중 어느 하나의 RNA 분자를 인코딩하는 폴리뉴클레오타이드 분자를 제공한다.

본 발명은 또한 본 명세서에 제시된 RNA 분자 중 어느 하나 및 서열번호 1의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 CRISPR 뉴클레아제를 시스템 또는 세포에 도입하는 단계를 포함하는, 무세포 시스템 또는 세포의 게놈 내 DNA 표적 부위에서 뉴클레오타이드 서열을 변형시키는 방법을 제공한다.

일부 실시형태에서, 세포는 진핵 세포 또는 원핵 세포이다.

일부 실시형태에서, 진핵 세포는 인간 세포 또는 식물 세포이다.

본 발명은 또한 상기 실시형태 중 어느 하나의 조성물, 서열번호 1의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 CRISPR 뉴클레아제를 시스템 또는 세포에 도입하는 것, 및 RNA 분자 및 CRISPR 뉴클레아제를 세포에 전달하기 위한 지침을 포함하는, 무세포 시스템 또는 세포의 게놈 내 DNA 표적 부위에서 뉴클레오타이드 서열을 변형시키기 위한 키트를 제공한다.

본 발명의 실시형태에서, 비-자연 발생 RNA 분자는 "스페이서" 또는 "가이드 서열" 부분을 포함한다. RNA 분자의 "스페이서 부분" 또는 "가이드 서열 부분"은 특정 표적 DNA 서열에 혼성화할 수 있는 뉴클레오타이드 서열을 지칭하고, 예를 들어 가이드 서열 부분은 가이드 서열 부분의 길이에 따라 표적화되는 DNA 서열에 완전히 상보적인 뉴클레오타이드 서열을 갖는다. 일부 실시형태에서, 가이드 서열 부분은 길이가 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개 뉴클레오타이드, 또는 길이가 대략 17 내지 30, 17 내지 29, 17 내지 28, 17 내지 27, 17 내지 26, 17 내지 25, 17 내지 24, 18 내지 22, 19 내지 22, 18 내지 20, 17 내지 20, 또는 21 내지 22개 뉴클레오타이드이다. 바람직하게는, 가이드 서열 부분의 전체 길이는 가이드 서열 부분의 길이를 따라 표적화된 DNA 서열에 완전히 상보적이다. 가이드 서열 부분은 CRISPR 뉴클레아제와 복합체를 형성하고 CRISPR 뉴클레아제를 활성화시킬 수 있는 "스캐폴드 부분"을 갖는 RNA 분자의 일부일 수 있으며, RNA 분자의 가이드 서열 부분은 CRISPR 복합체의 DNA 표적화 부분의 역할을 한다. 스캐폴드 부분 및 가이드 서열 부분을 갖는 RNA 분자가 CRISPR 분자와 동시에 존재하는 경우, RNA 분자는 특정 표적 DNA 서열에 대해 CRISPR 뉴클레아제를 표적화할 수 있다. 각각의 가능성은 별개의 실시형태를 나타낸다. RNA 분자 스페이서 부분은 임의의 원하는 서열을 표적화하도록 맞춤 설계될 수 있다.

일 실시형태에서, 뉴클레아제-결합 RNA 뉴클레오타이드 서열 및 DNA-표적화 RNA 뉴클레오타이드 서열(예를 들어, 스페이서 또는 가이드 서열 부분)은 단일-가이드 RNA 분자(sgRNA) 상에 있으며, 여기서 sgRNA 분자는 OMNI-103 CRISPR 뉴클레아제와 복합체를 형성하고 DNA 표적화 모듈의 역할을 할 수 있다.

일 실시형태에서, 뉴클레아제-결합 RNA 뉴클레오타이드 서열은 제1 RNA 분자 상에 있고 DNA-표적화 RNA 뉴클레오타이드 서열은 제2 RNA 분자 상에 있으며, 제1 및 제2 RNA 분자는 염기쌍 형성에 의해 상호작용하거나 CRISPR 뉴클레아제와 복합체를 형성하고 표적화 모듈의 역할을 한다.

본 발명의 일부 양태에 따르면, 개시된 방법은 본 명세서에 기재된 실시형태 중 어느 하나의 조성물을 세포에 도입하는 단계를 포함하는, 무세포 시스템 또는 세포의 게놈 내 표적 부위에서 뉴클레오타이드 서열을 변형시키는 방법을 포함한다.

본 발명은 또한 세포의 DNA 표적 부위에서 뉴클레오타이드 서열을 변형시키기 위한 본 발명의 조성물 또는 방법 중 임의의 것의 용도를 제공한다.

본 발명은 진핵 세포의 게놈의 표적 부위에서 뉴클레오타이드 서열을 변형시키는 방법을 제공한다.

본 발명은 포유동물 세포의 게놈의 표적 부위에서 뉴클레오타이드 서열을 변형시키는 방법을 제공한다. 일부 실시형태에서, 포유동물 세포는 인간 세포이다.

본 발명은 식물 세포의 게놈의 표적 부위에서 뉴클레오타이드 서열을 변형시키는 방법을 제공한다.

본 발명은 또한 서열번호 1의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 CRISPR 뉴클레아제, CRISPR 뉴클레아제와 복합체를 형성하고/하거나 표적 부위에 대해 복합체를 표적화하도록 구성된 하나 이상의 RNA 분자를 시스템 또는 세포에 도입하는 것, 및 RNA 분자 및 CRISPR 뉴클레아제를 세포에 전달하기 위한 지침을 포함하는, 무세포 시스템 또는 세포의 게놈 내 DNA 표적 부위에서 뉴클레오타이드 서열을 변형시키기 위한 키트를 제공한다. 예를 들어, 키트는 세포 또는 시험관 내 뉴클레오타이드 분자에서 표적 부위(예를 들어, DNA 서열)의 존재를 검출하기 위한 진단 키트로서 사용될 수 있다.

DNA-표적화 RNA 분자

RNA 분자의 "가이드 서열 부분"은 특정 표적 DNA 서열에 혼성화할 수 있는 뉴클레오타이드 서열을 지칭하고, 예를 들어 가이드 서열 부분은 가이드 서열 부분의 길이에 따라 표적화되는 DNA 서열에 부분적으로 또는 완전히 상보적인 뉴클레오타이드 서열을 갖는다. 일부 실시형태에서, 가이드 서열 부분은 길이가 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 또는 50개 뉴클레오타이드, 또는 길이가 대략 17 내지 50, 17 내지 49, 17 내지 48, 17 내지 47, 17 내지 46, 17 내지 45, 17 내지 44, 17 내지 43, 17 내지 42, 17 내지 41, 17 내지 40, 17 내지 39, 17 내지 38, 17 내지 37, 17 내지 36, 17 내지 35, 17 내지 34, 17 내지 33, 17 내지 31, 17 내지 30, 17 내지 29, 17 내지 28, 17 내지 27, 17 내지 26, 17 내지 25, 17 내지 24, 17 내지 22, 17 내지 21, 18 내지 25, 18 내지 24, 18 내지 23, 18 내지 22, 18 내지 21, 19 내지 25, 19 내지 24, 19 내지 23, 19 내지 22, 19 내지 21, 19 내지 20, 20 내지 22, 18 내지 20, 20 내지 21, 21 내지 22, 또는 17 내지 20개 뉴클레오타이드이다. 가이드 서열 부분의 전체 길이는 가이드 서열 부분의 길이를 따라 표적화된 DNA 서열에 완전히 상보적이다. 가이드 서열 부분은 CRISPR 뉴클레아제와 복합체를 형성할 수 있는 RNA 분자의 일부일 수 있으며, 가이드 서열 부분은 CRISPR 복합체의 DNA 표적화 부분의 역할을 한다. 가이드 서열 부분을 갖는 DNA 분자가 CRISPR 분자와 동시에 존재하는 경우, RNA 분자는 특정 표적 DNA 서열에 대해 CRISPR 뉴클레아제를 표적화할 수 있다. 각각의 가능성은 별개의 실시형태를 나타낸다. RNA 분자는 임의의 원하는 서열을 표적화하도록 맞춤 설계될 수 있다. 따라서, "가이드 서열 부분"을 포함하는 분자는 표적화 분자의 한 유형이다. 본 출원 전체에 걸쳐, 용어 "가이드 분자", "RNA 가이드 분자", "가이드 RNA 분자", 및 "gRNA 분자"는 가이드 서열 부분을 포함하는 분자와 동의어이고, 용어 "스페이서"는 "가이드 서열 부분"과 동의어이다.

본 발명의 실시형태에서, CRISPR 뉴클레아제는 17, 18, 19 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개 뉴클레오타이드를 갖는 가이드 서열 부분을 포함하는 RNA 분자와 함께 사용될 때 가장 큰 절단 활성을 갖는다.

단일-가이드 RNA(sgRNA) 분자는 CRISPR 뉴클레아제를 원하는 표적 부위로 유도하는 데 사용될 수 있다. 단일-가이드 RNA는 가이드 서열 부분뿐만 아니라 스캐폴드 부분을 포함한다. 스캐폴드 부분은 CRISPR 뉴클레아제와 상호작용하고, 가이드 서열 부분과 함께 CRISPR 뉴클레아제를 활성화시키고 CRISPR 뉴클레아제를 원하는 표적 부위로 표적화한다. 스캐폴드 부분은, 예를 들어 감소된 크기를 갖도록, 추가로 조작될 수 있다. 예를 들어, OMNI-103 CRIPSR 뉴클레아제는 길이가 단지 79개 뉴클레오타이드인 조작된 스캐폴드 부분을 갖는 sgRNA 분자로 표적내 뉴클레아제 활성을 나타낸다.

일부 실시형태에서, 세포는 진핵 세포, 바람직하게는 포유동물 세포 또는 식물 세포이다.

본 발명의 일부 양태에 따르면, 개시된 방법은 대상체의 게놈내의 표적 부위에서 뉴클레오타이드 서열을 변형시키는 것을 포함하는, 게놈 돌연변이와 연관된 질환을 앓고 있는 대상체의 치료를 위한 본 명세서에 기재된 조성물 중 어느 하나의 용도를 포함한다.

본 발명의 일부 양태에 따르면, 개시된 방법은 본 명세서에 기재된 조성물 중 어느 하나를 돌연변이 장애와 연관된 대립유전자에 대해 표적화하는 단계를 포함하는, 돌연변이 장애를 갖는 대상체를 치료하는 방법을 포함한다.

일부 실시형태에서, 돌연변이 장애는 신생물, 연령-관련 황반 변성, 조현병, 신경학적, 신경변성, 또는 운동 장애, 취약 X 증후군, 세크레타제-관련 장애, 프리온-관련 장애, ALS, 중독, 자폐증, 알츠하이머병, 호중구감소증, 염증-관련 장애, 파킨슨병, 혈액 및 응고 질환 및 장애, 베타 지중해빈혈, 겸상 적혈구 빈혈, 세포 조절장애 및 종양학 질환과 장애, 염증 및 면역-관련 질환과 장애, 대사, 간, 신장 및 단백질 질환과 장애, 근육 및 골격 질환과 장애, 피부 질환과 장애, 신경학적 및 신경 질환과 장애, 및 안구 질환과 장애 중 임의의 것으로부터 선택되는 질환 또는 장애와 관련된다.

OMNI CRISPR 뉴클레아제 도메인

CRISPR 뉴클레아제의 특징적인 표적화 뉴클레아제 활성은 특정 도메인의 다양한 기능에 의해 부여된다. 본 출원에서, OMNI-103 CRISPR 뉴클레아제 도메인은 도메인 A, 도메인 B, 도메인 C, 도메인 D, 도메인 E, 도메인 F, 도메인 G, 도메인 H, 도메인 I, 및 도메인 J로 정의된다.

각각의 OMNI-103 CRISPR 뉴클레아제 도메인의 활성이 본 명세서에 기재되어 있으며, 각각의 도메인 활성은 뉴클레아제의 유리한 특징의 양태를 제공한다.

구체적으로, 도메인 A, 도메인 G, 및 도메인 I는 OMNI CRISPR 뉴클레아제의 구조 단위를 형성하며, 이는 DNA 가닥 절단에 참여하는 뉴클레아제 활성 부위를 포함한다. 도메인 A, 도메인 G, 및 도메인 I에 의해 형성되는 구조 단위는 이중-가닥 DNA 표적 부위에서 결합하는 가이드 RNA 분자에 의해 대체된 DNA 가닥을 절단한다.

도메인 B는 표적 DNA 부위에 대한 OMNI CRISPR 뉴클레아제의 결합 시 DNA 절단 활성을 개시하는 데 관여한다.

도메인 C, 도메인 D, 도메인 E, 및 도메인 F는 가이드 RNA 분자에 결합하고 표적 부위 인식을 위한 특이성을 제공하는 데 참여한다.

도메은 H는 DNA 가닥 절단에 참여하는 뉴클레아제 활성 부위를 포함한다. 도메인 H는 가이드 RNA 분자가 DNA 표적 부위에 결합하는 DNA 가닥을 절단한다.

도메인 J는 PAM 부위 조사 및 인식의 양태를 포함하여, OMNI CRISPR 뉴클레아제에 대한 PAM 부위 특이성을 제공하는 데 관여한다. 도메인 J는 또한 토포아이소머라제 활성을 수행한다.

다른 CRISPR 뉴클레아제 도메인 및 이들의 일반 기능에 대한 추가 설명은 특히 본 명세서에 참조에 의해 원용되는 문헌[Mir et al., ACS Chem. Biol. (2019), Palermo et al., Quarterly Reviews of Biophysics (2018), Jiang and Doudna, Annual Review of Biophysics (2017), Nishimasu et al., Cell (2014) 및 Nishimasu et al., Cell (2015)]에서 확인할 수 있다.

본 발명의 일 양태에서, OMNI CRISPR 뉴클레아제 도메인에 대한 유사성을 갖는 아미노산 서열은, 펩타이드가 OMNI CRISPR 뉴클레아제 도메인 활성의 유리한 특징을 나타내도록, 비-자연 발생 펩타이드, 예를 들어 CRISPR 뉴클레아제의 설계 및 제조에서 이용될 수 있다.

일 실시형태에서, 이러한 펩타이드, 예를 들어 CRISPR 뉴클레아제는 OMNI-103 CRISPR 뉴클레아제의 도메인 A, 도메인 B, 도메인 C, 도메인 D, 도메인 E, 도메인 F, 도메인 G, 도메인 H, 도메인 I, 또는 도메인 J 중 적어도 하나의 아미노산 서열과 적어도 100%, 99.5%, 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91%, 90%, 89%, 88%, 87%, 86%, 85%, 84%, 83%, 82%, 81%, 80%, 79%, 78%, 77%, 76%, 75%, 74%, 73%, 72%, 71%, 또는 70% 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에서, 펩타이드는 OMNI-103 CRISPR 뉴클레아제의 도메인 A, 도메인 B, 도메인 C, 도메인 D, 도메인 E, 도메인 F, 도메인 G, 도메인 H, 도메인 I, 및 도메인 J 중 아미노산 서열과 적어도 100%, 99.5%, 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91%, 90%, 89%, 88%, 87%, 86%, 85%, 84%, 83%, 82%, 81%, 80%, 79%, 78%, 77%, 76%, 75%, 74%, 73%, 72%, 71% 또는 70% 동일성을 갖는 아미노산 서열로부터 선택되는 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 또는 적어도 11개 아미노산 서열을 포함한다. 각각의 가능성은 별개의 실시형태를 나타낸다. 일 실시형태에서, 펩타이드는 OMNI-103 CRISPR 뉴클레아제의 도메인 A, 도메인 B, 도메인 C, 도메인 D, 도메인 E, 도메인 F, 도메인 G, 도메인 H, 도메인 I, 또는 도메인 J 중 적어도 하나의 아미노산 서열과 적어도 100%, 99.5%, 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91%, 90%, 89%, 88%, 87%, 86%, 85%, 84%, 83%, 82%, 81%, 80%, 79%, 78%, 77%, 76%, 75%, 74%, 73%, 72%, 71%, 또는 70% 동일성을 갖는 아미노산 서열 외부의 전장 OMNI-103 CRISPR 뉴클레아제 아미노산 서열에 비해 광범위한 아미노산 가변성을 나타낸다. 일 실시형태에서, 펩타이드는 2개 도메인 서열 사이에 개재 아미노산 서열을 포함한다. 일 실시형태에서, 개재 아미노산 서열은 길이가 1 내지 10, 10 내지 20, 20 내지 40, 40 내지 50, 50 내지 60, 80 내지 100, 100 내지 150, 150 내지 200, 200 내지 250, 최대 100, 최대 200 또는 최대 300개 아미노산이다. 각각의 가능성은 별개의 실시형태를 나타낸다. 일 실시형태에서, 개재 서열은 링커 서열이다. 일 실시형태에서, CRISPR 뉴클레아제는 OMNI CRISPR 뉴클레아제 유래의 다수 도메인을 포함하고, 도메인은 바람직하게는 CRISPR 뉴클레아제의 N-말단에서 C-말단으로 알파벳 순서로 구성된다. 예를 들어, OMNI-103의 도메인 A, 도메인 E, 및 도메인 I를 포함하는 CRISPR 뉴클레아제는 CRISPR 뉴클레아제 서열에서 해당 도메인의 순서가 도메인 A, 도메인 E, 및 마지막으로 도메인 I일 것이며, 각각의 도메인의 한쪽 말단 또는 양쪽 말단에서 개재 서열의 가능성이 있다.

본 발명의 일 양태에서, 본 명세서에 기재된 OMNI CRISPR 뉴클레아제의 도메인 중 어느 하나를 인코딩하는 아미노산 서열은 원래 OMNI CRISPR 뉴클레아제 도메인 서열에 비해 하나 이상의 아미노산 치환을 포함할 수 있다. 아미노산 치환은 보존적 치환, 즉 원래 아미노산과 유사한 화학적 특성을 갖는 아미노산에 대한 치환일 수 있다. 예를 들어, 양으로 하전된 아미노산은 대안적인 양으로 하전된 아미노산으로 치환될 수 있으며, 예를 들어 아르기닌 잔기는 라이신 잔기로 치환될 수 있거나, 극성 아미노산은 상이한 극성 아미노산으로 치환될 수 있다. 보존적 치환은 더 용인 가능하며, OMNI CRISPR 뉴클레아제의 도메인 중 어느 하나를 인코딩하는 아미노산 서열은 이러한 치환의 10% 정도만큼을 포함할 수 있다. 아미노산 치환은 라디칼 치환, 즉 원래 아미노산과 상이한 화학적 특성을 갖는 아미노산으로의 치환일 수 있다. 예를 들어, 양으로 하전된 아미노산은 음으로 하전된 아미노산으로 치환될 수 있으며, 예를 들어 아르기닌 잔기는 글루탐산 잔기로 치환될 수 있거나, 극성 아미노산은 비-극성 아미노산으로 치환될 수 있다. 아미노산 치환은 반-보존적 치환일 수 있거나, 아미노산 치환은 임의의 다른 아미노산으로의 것일 수 있다. 치환은 원래 OMNI CRISPR 뉴클레아제 도메인 기능에 대해 활성을 변경시킬 수 있고, 예를 들어 촉매 뉴클레아제 활성을 감소시킬 수 있다.

본 발명의 일부 양태에 따르면, 개시된 조성물은 CRISPR 뉴클레아제를 포함하는 비-자연 발생 조성물을 제공하며, 여기서 CRISPR 뉴클레아제는 OMNI-103 CRISPR 뉴클레아제의 도메인 A, 도메인 B, 도메인 C, 도메인 D, 도메인 E, 도메인 F, 도메인 G, 도메인 H, 도메인 I, 또는 도메인 J 중 적어도 하나의 아미노산 서열에 상응하는 아미노산 서열을 포함한다. 각각의 OMNI CRISPR 뉴클레아제 아미노산 서열 내 각각의 도메인의 아미노산 범위는 보충 표 1에 제공되어 있다. 본 발명의 일부 실시형태에서, CRISPR 뉴클레아제는 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 또는 적어도 5개 아미노산 서열을 포함하며, 각각의 아미노산 서열은 OMNI-103 CRISPR 뉴클레아제의 아미노산 서열 도메인 A, 도메인 B, 도메인 C, 도메인 D, 도메인 E, 도메인 F, 도메인 G, 도메인 H, 도메인 I, 또는 도메인 J 중 어느 하나에 상응한다. 따라서, CRISPR 뉴클레아제는 OMNI CRISPR 뉴클레아제의 도메인 A, 도메인 B, 도메인 C, 도메인 D, 도메인 E, 도메인 F, 도메인 G, 도메인 H, 도메인 I, 또는 도메인 J 중 임의의 것에 상응하는 아미노산 서열의 임의의 조합을 포함할 수 있다. 일부 실시형태에서, 아미노산 서열은 길이가 적어도 100 내지 250, 250 내지 500, 500 내지 1000, 1000 내지 1500, 1000 내지 1700, 또는 1000 내지 2000개 아미노산이다.

질환 및 치료법

본 발명의 특정 실시형태는 유전자 편집, 치료 방법, 또는 치료법의 형태로서 질환 또는 장애와 연관된 특정 유전자좌에 대해 뉴클레아제를 표적화한다. 예를 들어, 유전자의 편집 또는 녹아웃을 유도하기 위해, 본 명세서에 개시된 신규 뉴클레아제는 맞춤 설계된 가이드 RNA 분자를 사용하여 유전자의 병원성 돌연변이 대립유전자에 대해 특이적으로 표적화될 수 있다. 가이드 RNA 분자는 바람직하게는 먼저 뉴클레아제의 PAM 요건을 고려함으로써 설계되며, 이는 또한 본 명세서에 나타낸 바와 같이 유전자 편집이 수행되는 시스템에 따라 달라진다. 예를 들어, 표적 부위에 대해 OMNI-103 뉴클레아제를 표적화하도록 설계된 가이드 RNA 분자는 OMNI-103 PAM 서열, 예를 들어 "NNRRHY" 또는 "NNRACT' 또는 "NNRVCT"에 이웃하는 DNA 이중-가닥 영역의 DNA 가닥에 상보적인 스페이서 영역을 포함하도록 설계된다. 가이드 RNA 분자는 바람직하게는 뉴클레아제의 특정 활성을 증가시키고 표적외 효과를 감소시키기 위해 충분하고 바람직하게는 최적의 길이의 스페이서 영역(즉, 표적 유전자좌에 대해 상보성을 갖는 가이드 RNA 분자의 영역)을 포함하도록 추가로 설계된다.

비-제한적인 예로서, 가이드 RNA 분자는 뉴클레아제에 의해 유발되는 DNA 손상 시 비-상동성 말단 연결(non-homologous end joining; NHEJ) 경로가 유도되고 프레임시프트 돌연변이의 유도에 의해 돌연변이 대립유전자의 침묵을 야기하도록, 예를 들어 시작 코돈 근처에서, 돌연변이 대립유전자의 특정 영역에 대해 뉴클레아제를 표적화하도록 설계될 수 있다. 가이드 RNA 분자 설계에 대한 이러한 접근법은 우성 음성 돌연변이의 효과를 변경하고 이에 의해 대상체를 치료하는 데 특히 유용하다. 별개의 비-제한적 예로서, 가이드 RNA 분자는, 뉴클레아제에 의해 유발된 DNA 손상 시 상동성 지정 복구(HDR) 경로가 유도되고 돌연변이 대립유전자의 주형 매개 교정을 야기하도록, 돌연변이된 대립유전자의 특정 병원성 돌연변이를 표적화하도록 설계될 수 있다. 가이드 RNA 분자 설계에 대한 이러한 접근법은 돌연변이된 대립유전자의 반가불충분성(haploinsufficiency) 효과를 변경하고 이에 의해 대상체를 치료하는 데 특히 유용하다.

질환 또는 장애를 치료하기 위한 변경을 위해 표적화될 수 있는 특정 유전자의 비-제한적 예는 본 명세서에서 하기에 제시되어 있다. 돌연변이 장애를 유도하는 특정 질환-연관 유전자 및 돌연변이는 문헌에 기재되어 있다. 이러한 돌연변이는 질환 연관 유전자의 대립유전자에 대해 CRISPR 조성물을 표적화하기 위해 DNA-표적화 RNA 분자를 설계하는 데 사용될 수 있으며, 여기서 CRISPR 조성물은 DNA 손상을 유발하고 DNA 복구 경로를 유도하여 대립유전자를 변경하고 이에 의해 돌연변이 장애를 치료한다.

ELANE 유전자의 돌연변이는 호중구감소증과 연관된다. 따라서, 제한 없이, ELANE를 표적화하는 본 발명의 실시형태는 호중구감소증을 앓고 있는 대상체를 치료하는 방법에서 사용될 수 있다.

CXCR4는 인간 면역결핍 바이러스 1형(HIV-1) 감염에 대한 공동 수용체이다. 따라서, 제한 없이, CXCR4를 표적화하는 본 발명의 실시형태는 HIV-1를 앓고 있는 대상체를 치료하고 대상체에서 HIV-1 감염에 대한 저항성을 부여하는 방법에서 사용될 수 있다.

프로그래밍된 세포 사멸 단백질 1(PD-1) 파괴는 종양 세포의 CAR-T 세포 매개 사멸을 향상시키고 PD-1은 다른 암 치료법에서 표적일 수 있다. 따라서, 제한 없이, PD-1을 표적화하는 본 발명의 실시형태는 암을 앓고 있는 대상체를 치료하는 방법에서 사용될 수 있다. 일 실시형태에서, 치료는 PD-1 결핍이 되도록 본 발명에 따라 변형된 T 세포를 이용한 CAR-T 세포 요법이다.

추가적으로, BCL11A는 헤모글로빈 생산의 억제에서 역할을 하는 유전자이다. 글로빈 생산은 BCL11A를 억제함으로써 지중해빈혈 또는 겸상 적혈구 빈혈과 같은 질환을 치료하기 위해 증가될 수 있다. 예를 들어, PCT 국제 공개 WO 2017/077394A2; 미국 공개 제US2011/0182867A1호; 문헌[Humbert et al. Sci. Transl. Med. (2019); 및 Canver et al. Nature (2015)]을 참조한다. 따라서, 제한 없이, BCL11A의 인핸서를 표적화하는 본 발명의 실시형태는 베타 지중해빈혈 또는 겸상 적혈구 빈혈을 앓고 있는 대상체를 치료하는 방법에서 사용될 수 있다.

본 발명의 실시형태는 또한, 하기 표 A 또는 표 B에 열거된 질환 또는 장애 중 임의의 것을 연구, 변경, 또는 치료하기 위해 임의의 질환-연관 유전자를 표적화하는 데 사용될 수 있다. 실제로, 유전자좌와 연관된 임의의 질환은 본 명세서에 개시된 뉴클레아제를 사용하여 적절한 질환-연관 유전자, 예를 들어 미국 공개 제2018/0282762A1호 및 유럽 특허 제EP3079726B1호에 열거된 것을 표적화함으로써 연구, 변경, 또는 치료될 수 있다.

표 A - 질환, 장애 및 이의 연관 유전자

표 B - 질환, 장애 및 이의 연관 유전자

달리 정의되지 않는 한, 본 명세서에 사용되는 모든 기술 및/또는 과학 용어는 본 발명이 속하는 업계의 당업자에 의해 일반적으로 이해되는 바와 동일한 의미를 갖는다. 본 명세서에 기재된 것과 유사하거나 동등한 방법 및 물질이 본 발명의 실시형태의 실시 또는 테스트에 사용될 수 있지만, 예시적인 방법 및/또는 물질이 본 명세서 하기에 기재되어 있다. 상충하는 경우, 정의를 포함하여 본 명세서가 우선할 것이다. 추가적으로, 물질, 방법 및 실시예는 단지 예시적인 것일 뿐이며, 반드시 제한하려는 것이 아니다.

본 논의에서 달리 언급되지 않는 한, 본 발명의 실시형태의 특징 또는 특징들의 특징적인 조건 또는 관계를 수식하는 "실질적으로" 및 "약"과 같은 형용사는 조건 또는 특성이 의도된 적용에 대한 실시형태의 작동에 허용 가능한 허용 오차 내에서 정의됨을 의미하는 것으로 이해된다. 달리 나타내지 않는 한, 명세서 및 청구범위에서 단어 "또는"은 배타적인 "또는"이 아닌 포괄적인 "또는"인 것으로 간주되며, 결합하는 항목 중 적어도 하나 및 임의의 조합을 나타낸다.

본 명세서에서 상기 및 다른 곳에 사용되는 바와 같이 용어 "하나("a" 및 "an")"는 열거된 구성요소 중 "하나 이상"을 지칭하는 것으로 이해되어야 한다. 구체적으로 달리 언급되지 않는 한, 단수의 사용은 복수를 포함한다는 것이 당업자에게 명백할 것이다. 따라서, 용어 "하나" 및 "적어도 하나"는 본 출원에서 호환 가능하게 사용된다.

달리 나타내지 않는 한, 본 교시를 더 잘 이해하기 위한 목적 및 교시의 범주를 제한하지 않는 목적으로, 양, 백분율 또는 비율을 표현하는 모든 숫자, 및 본 명세서 및 청구범위에서 사용되는 다른 수치는 모든 경우에 용어 "약"으로 수식되는 것으로 이해되어야 한다. 따라서, 반대로 표시되지 않는 한, 이하 명세서 및 첨부된 청구범위에 제시된 수치 매개변수는 얻고자 하는 원하는 특성에 따라 변할 수 있는 근사치이다. 적어도, 각각의 수치 매개변수는 적어도 보고된 유효 숫자의 수에 비추어 그리고 반올림 기법을 적용하여 해석되어야 한다.

본 명세서에서 수치 범위가 인용되는 경우, 달리 언급되지 않는 한, 본 발명은 상한과 하한을 포함하여 이들 사이의 각각의 정수를 고려하는 것으로 이해된다.

본 출원의 설명 및 청구범위에서, 동사 "포함하다(comprise)", "포함하다(include)" 및 "갖다" 각각 및 이들의 활용어는 동사의 목적어 또는 목적어들이 반드시 동사의 주어 또는 주어들의 구성요소, 요소 또는 부분의 완전한 열거일 필요가 없음을 나타내는 데 사용된다. 본 명세서에서 사용되는 바와 같이 다른 용어는 당업계에 잘 알려진 의미로 정의되는 것을 의미한다.

용어 "폴리뉴클레오타이드", "뉴클레오타이드", "뉴클레오타이드 서열", "핵산" 및 "올리고뉴클레오타이드"는 호환 가능하게 사용된다. 이들 용어는 데옥시리보뉴클레오타이드 또는 리보뉴클레오타이드 중 어느 하나, 또는 이의 유사체인 임의의 길이의 뉴클레오타이드의 중합체 형태를 지칭한다. 폴리뉴클레오타이드는 임의의 3차원 구조를 가질 수 있고, 알려지거나 알려지지 않은 임의의 기능을 수행할 수 있다. 폴리뉴클레오타이드의 비-제한적인 예로는 유전자 또는 유전자 단편의 코딩 또는 비-코딩 영역, 연결 분석으로부터 정의된 유전자좌, 엑손, 인트론, 전령 RNA(mRNA), 전달 RNA, 리보솜 RNA, 작은 간섭 RNA(siRNA), 작은-헤어핀 RNA(shRNA), 마이크로-RNA(miRNA), 리보자임, cDNA, 재조합 폴리뉴클레오타이드, 분지형 폴리뉴클레오타이드, 플라스미드, 벡터, 임의의 서열의 단리된 DNA, 임의의 서열의 단리된 RNA, 핵산 프로브, 및 프라이머가 있다. 폴리뉴클레오타이드는 하나 이상의 변형된 뉴클레오타이드, 예컨대, 메틸화된 뉴클레오타이드 및 뉴클레오타이드 유사체를 포함할 수 있다. 존재하는 경우, 뉴클레오타이드 구조에 대한 변형은 중합체의 회합 전 또는 후에 부여될 수 있다. 뉴클레오타이드 서열은 비-뉴클레오타이드 구성요소에 의해 중단될 수 있다. 폴리뉴클레오타이드는 중합 후에, 예컨대, 표지화 구성요소와의 접합에 의해 추가로 변형될 수 있다.

용어 "뉴클레오타이드 유사체" 또는 "변형된 뉴클레오타이드"는 뉴클레오사이드의 질소 함유 염기(예를 들어, 사이토신(C), 티민(T) 또는 우라실(U), 아데닌(A) 또는 구아닌(G))에 또는 그 상에, 뉴클레오사이드의 당 모이어티(예를 들어, 리보스, 데옥시리보스, 변형된 리보스, 변형된 데옥시리보스, 6원 당 유사체, 또는 개방 사슬 당 유사체)에 또는 그 상에, 또는 인산염에 하나 이상의 화학적 변형(예를 들어, 치환)을 포함하는 뉴클레오타이드를 지칭한다. 본 명세서에 기재된 RNA 서열 각각은 하나 이상의 뉴클레오타이드 유사체를 포함할 수 있다.

본 명세서에서 사용되는 바와 같이, 다음 뉴클레오타이드 식별자가 언급된 뉴클레오타이드 염기(들)를 나타내는 데 사용된다:

본 명세서에서 사용되는 바와 같이, 용어 "표적화 서열" 또는 "표적화 분자"는 특정 표적 서열에 혼성화할 수 있는 뉴클레오타이드 서열을 포함하는 뉴클레오타이드 서열 또는 분자를 지칭하고, 예를 들어 표적화 서열은 표적화 서열의 길이에 따라 표적화되는 서열에 적어도 부분적으로 상보적인 뉴클레오타이드 서열을 갖는다. 표적화 서열 또는 표적화 분자는 CRISPR 뉴클레아제와 복합체를 형성할 수 있는 표적화 RNA 분자의 일부일 수 있으며, 표적화 서열은 CRISPR 복합체의 표적화 부분의 역할을 한다. 표적화 서열을 갖는 분자가 CRISPR 분자와 동시에 존재하는 경우, RNA 분자는 특정 표적 서열에 대해 CRISPR 뉴클레아제를 표적화할 수 있다. 각각의 가능성은 별개의 실시형태를 나타낸다. 표적화 RNA 분자는 임의의 원하는 서열을 표적화하도록 맞춤 설계될 수 있다.

본 명세서에서 사용되는 바와 같이 용어 "표적화"는 표적화된 뉴클레오타이드 서열을 갖는 핵산에 대한 표적화 서열 또는 표적화 분자의 우선적인 혼성화를 지칭한다. 용어 "표적화"는 표적화된 뉴클레오타이드 서열을 갖는 핵산의 우선적인 표적화가 존재하지만, 표적내 혼성화에 추가적으로 의도하지 않은 표적외 혼성화가 또한 일어날 수 있도록, 가변 혼성화 효율을 포함하는 것으로 이해된다. RNA 분자가 서열을 표적화하는 경우, RNA 분자 및 CRISPR 뉴클레아제 분자의 복합체는 뉴클레아제 활성을 위해 서열을 표적화하는 것으로 이해된다.

복수의 세포에 존재하는 DNA 서열을 표적화하는 맥락에서, 표적화는 하나 이상의 세포에서 RNA 분자의 가이드 서열 부분과 서열의 혼성화를 포함하고, 또한 복수의 세포에서 모든 세포보다 적은 수의 세포에서 RNA 분자와 표적 서열의 혼성화를 포함하는 것으로 이해된다. 따라서, RNA 분자가 복수의 세포에서 서열을 표적화하는 경우, RNA 분자와 CRISPR 뉴클레아제의 복합체는 하나 이상의 세포에서 표적 서열과 혼성화하는 것으로 이해되고, 또한 모든 세포보다 적은 수의 세포에서 표적 서열과 혼성화할 수 있는 것으로 이해된다. 따라서, RNA 분자와 CRISPR 뉴클레아제의 복합체는 하나 이상의 세포에서 표적 서열과의 혼성화와 관련하여 이중 가닥 파손을 도입하고 또한 모든 세포보다 적은 수의 세포에서 표적 서열과의 혼성화와 관련하여 이중 가닥 파손을 도입할 수 있는 것으로 이해된다. 본 명세서에서 사용되는 바와 같이, 용어 "변형된 세포"는 이중 가닥 파손이 표적 서열과의 혼성화, 즉 표적내 혼성화의 결과로서 RNA 분자와 CRISPR 뉴클레아제의 복합체에 의해 영향을 받는 세포를 지칭한다.

본 명세서에서 사용되는 바와 같이, 용어 "야생형"은 당업자에 의해 이해되는 당업계의 용어이며 돌연변이체 또는 변이체 형태와 구별되는 자연에서 발생하는 유기체, 균주, 유전자 또는 특징의 전형적인 형태를 의미한다. 따라서, 본 명세서에서 사용되는 바와 같이, 아미노산 또는 뉴클레오타이드의 서열이 야생형 서열을 지칭하는 경우, 변이체는, 예를 들어 치환, 결실, 삽입을 포함하는, 해당 서열의 변이체를 지칭한다, 본 발명의 실시형태에서, 조작된 CRISPR 뉴클레아제는 표 1에 표시된 CRISPR 뉴클레아제 중 임의의 것의 CRISPR 뉴클레아제와 비교하여 적어도 하나의 아미노산 변형(예를 들어, 치환, 결실, 및/또는 삽입)을 포함하는 변이체 CRISPR 뉴클레아제이다.

용어 "비-자연 발생" 또는 "조작된"은 호환 가능하게 사용되며 인간 조작을 나타낸다. 핵산 분자 또는 폴리펩타이드를 지칭할 때 상기 용어는 핵산 분자 또는 폴리펩타이드에는 자연에서 자연적으로 회합되고 자연에서 발견되는 바와 같은 적어도 하나의 다른 구성요소가 적어도 실질적으로 없다는 것을 의미할 수 있다.

본 명세서에서 사용되는 바와 같이 용어 "아미노산"은 글리신 및 D 또는 I를 둘 다 포함하는 천연 및/또는 비천연 또는 합성 아미노산, 광학 이성질체, 및 아미노산 유사체 및 펩타이드유사체(peptidomimetic)를 포함한다.

본 명세서에서 사용되는 바와 같이, "게놈 DNA"는 관심이 있는 세포 또는 세포들에 존재하는 선형 및/또는 염색체 DNA 및/또는 플라스미드 또는 다른 염색체외 DNA 서열을 지칭한다. 일부 실시형태에서, 관심이 있는 세포는 진핵 세포이다. 일부 실시형태에서, 관심이 있는 세포는 원핵 세포이다. 일부 실시형태에서, 방법은 게놈 DNA 서열의 미리 결정된 표적 부위에서 이중-가닥 파손(DSB)을 생성하여, 게놈의 표적 부위(들)에서 DNA 서열의 돌연변이, 삽입, 및/또는 결실을 초래한다.

"진핵" 세포는 진균 세포(예컨대, 효모), 식물 세포, 동물 세포, 포유동물 세포 및 인간 세포를 포함하지만 이에 제한되지 않는다.

본 명세서에서 사용되는 바와 같이 용어 "뉴클레아제"는 핵산의 뉴클레오타이드 서브유닛 사이에서 포스포다이에스터 결합을 절단할 수 있는 효소를 지칭한다. 뉴클레아제는 천연 공급원으로부터 단리되거나 유래될 수 있다. 천연 공급원은 임의의 살아있는 유기체일 수 있다. 대안적으로, 뉴클레아제는 포스포다이에스터 결합 절단 활성을 유지하는 변형된 또는 합성 단백질일 수 있다.

본 명세서에서 사용되는 바와 같이 용어 "PAM"은 표적화된 DNA 서열에 근접하게 위치하고 CRISPR 뉴클레아제에 의해 인식되는 표적 DNA의 뉴클레오타이드 서열을 지칭한다. PAM 서열은 뉴클레아제 동일성에 따라 다를 수 있다.

본 명세서에서 사용되는 바와 같이 용어 "돌연변이 장애" 또는 "돌연변이 질환"은 돌연변이에 의해 유발된 유전자의 기능장애와 관련된 임의의 장애 또는 질환을 지칭한다. 돌연변이 장애로서 나타나는 기능장애 유전자는 이의 대립유전자의 적어도 하나에 돌연변이를 포함하고 "질환-연관 유전자"로 지칭된다. 돌연변이는 질환-연관 유전자의 임의의 부분에, 예를 들어 조절, 코딩, 또는 비-코딩 부분에 있을 수 있다. 돌연변이는 돌연변이의 임의의 부류, 예컨대, 치환, 삽입, 또는 결실일 수 있다. 질환-연관 유전자의 돌연변이는 임의의 유형의 돌연변이, 예컨대, 열성, 우성 음성, 기능 획득, 기능 손실, 또는 유전자 산물의 반가불충분성을 야기하는 돌연변이의 메커니즘에 따라 장애 또는 질환으로 나타날 수 있다.

숙련된 기술자는 본 발명의 실시형태가, 예컨대, 프로토스페이서 인접 모티프(PAM) 옆에 관심이 있는 표적 게놈 DNA 서열과 회합하도록, 뉴클레아제, 예를 들어 CRISPR 뉴클레아제와 복합체화할 수 있는 RNA 분자를 개시한다는 것을 인식할 것이다. 그 다음 뉴클레아제는 표적 DNA의 절단을 매개하여 프로토스페이서 내에서 이중-가닥 파손을 형성한다.

본 발명의 실시형태에서, CRISPR 뉴클레아제 및 표적화 분자는 표적 DNA 서열에 결합하여 표적 DNA 서열의 절단을 초래하는 CRISPR 복합체를 형성한다. CRISPR 뉴클레아제는 추가적인 별개의 tracrRNA 분자 없이 CRISPR 뉴클레아제 및 RNA 분자를 포함하는 CRISPR 복합체를 형성할 수 있다. 대안적으로, CRISPR 뉴클레아제는 CRISPR 뉴클레아제, RNA 분자, 및 tracrRNA 분자 사이에 CRISPR 복합체를 형성할 수 있다.

용어 "단백질 결합 서열" 또는 "뉴클레아제 결합 서열"은 CRISPR 뉴클레아제와 결합하여 CRISPR 복합체를 형성할 수 있는 서열을 지칭한다. 숙련된 기술자는 CRISPR 뉴클레아제와 결합하여 CRISPR 복합체를 형성할 수 있는 tracrRNA는 단백질 또는 뉴클레아제 결합 서열을 포함한다는 것을 이해할 것이다.

CRISPR 뉴클레아제의 "RNA 결합 부분"은 RNA 분자에 결합하여 CRISPR 복합체를 형성할 수 있는 CRISPR 뉴클레아제의 부분, 예를 들어 tracrRNA 분자의 뉴클레아제 결합 서열을 지칭한다. CRISPR 뉴클레아제의 "활성 부분" 또는 "활성적인 부분"은, 예를 들어 DNA-표적화 RNA 분자와 복합체를 형성할 때, DNA 분자에서 이중 가닥 파손을 초래하는 CRISPR 뉴클레아제의 부분을 지칭한다.

RNA 분자는 염기쌍 형성을 통해 tracrRNA에 혼성화하고 CRISPR 복합체의 형성을 촉진시키기 위해 tracrRNA 분자에 충분히 상보적인 서열을 포함할 수 있다. (미국 특허 제8,906,616호 참조). 본 발명의 실시형태에서, RNA 분자는 tracr 메이트(mate) 서열을 갖는 부분을 더 포함할 수 있다.

본 발명의 실시형태에서, 표적화 분자는 tracrRNA 분자의 서열을 더 포함할 수 있다. 이러한 실시형태는 함께 단일 가이드 RNA(sgRNA)를 형성하는, RNA 분자의 가이드 부분(gRNA 또는 crRNA) 및 전사활성화 crRNA(tracrRNA)의 합성 융합체로서 설계될 수 있다. (문헌[Jinek et al., Science (2012)] 참조). 본 발명의 실시형태는 또한 별개의 tracrRNA 분자 및 가이드 서열 부분을 포함하는 별개의 RNA 분자를 이용하는 CRISPR 복합체를 형성할 수 있다. 이러한 실시형태에서, tracrRNA 분자는 염기 쌍형성을 통해 RNA 분자와 혼성화할 수 있고 본 명세서에 기재된 본 발명의 특정 적용에서 유리할 수 있다.

본 발명의 실시형태에서, RNA 분자는 RNA 분자의 구조를 추가로 한정할 수 있는 "넥서스(nexus)" 영역 및/또는 "헤어핀" 영역을 포함할 수 있다. (문헌[Briner et al., Molecular Cell (2014)] 참조).

본 명세서에서 사용되는 바와 같이, 용어 "직접 반복 서열"은 뉴클레오타이드 서열의 특정 아미노산 서열의 2개 이상의 반복부를 지칭한다.

본 명세서에서 사용되는 바와 같이, CRISPR 뉴클레아제와 "상호작용"하거나 CRISPR 뉴클레아제와 "결합"할 수 있는 RNA 서열 또는 분자는 CRISPR 뉴클레아제와 CRISPR 복합체를 형성하는 RNA 서열 또는 분자 능력을 지칭한다.

본 명세서에서 사용되는 바와 같이, 용어 "작동 가능하게 연결된"은 의도된 방식으로 기능할 수 있게 하는 2개의 서열 또는 분자 사이의 관계(즉, 융합, 혼성화)를 지칭한다. 본 발명의 실시형태에서, RNA 분자가 프로모터에 작동 가능하게 연결될 때, RNA 분자 및 프로모터는 둘 다 의도된 방식으로 기능하도록 허용된다.

본 명세서에서 사용되는 바와 같이, 용어 "이종 프로모터"는 촉진되는 분자 또는 경로와 함께 자연적으로 발생하지 않는 프로모터를 지칭한다.

본 명세서에서 사용되는 바와 같이, 서열 또는 분자는 분자의 서열 사이의 염기 또는 아미노산의 X%가 동일하고 동일한 상대 위치에 있는 경우 또 다른 서열 또는 분자에 대해 X% "서열 동일성"을 갖는다. 예를 들어, 제2 뉴클레오타이드 서열과 적어도 95% 서열 동일성을 갖는 제1 뉴클레오타이드 서열은 동일한 상대 위치에서 다른 서열과 동일한, 적어도 95%의 염기를 가질 것이다.

핵 국재화 서열

용어 "핵 국재화 서열" 및 "NLS"는 핵 외피 장벽을 가로질러 세포의 세포질로부터 연관된 단백질의 수송을 지시하는 아미노산 서열/펩타이드를 나타내기 위해 호환 가능하게 사용된다. 용어 "NLS"는 특정 펩타이드의 핵 국재화 서열뿐만 아니라 핵 외피 장벽을 가로질러 세포질 폴리펩타이드의 전좌를 지시할 수 있는 이의 유도체를 포함하는 것으로 의도된다. NLS는 폴리펩타이드의 N-말단, C-말단, 또는 N-말단과 C-말단 둘 다에 부착될 때 폴리펩타이드의 핵 전좌를 지시할 수 있다. 추가적으로, N-말단 또는 C-말단에 의해 폴리펩타이드의 아미노산 서열을 따라 무작위로 위치한 아미노산 측쇄에 대해 커플링된 NLS를 갖는 폴리펩타이드는 전좌될 것이다. 전형적으로, NLS는 단백질 표면에 노출된 양으로 하전된 라이신 또는 아르기닌의 하나 이상의 짧은 서열로 이루어지지만, 다른 유형의 NLS가 알려져 있다. NLS의 비-제한적인 예는 SV40 바이러스 거대 T-항원, 뉴클레오플라스민, c-myc, hRNPAl M9 NLS, 임포틴-알파 유래 IBB, 근종 T 단백질, 인간 p53, 마우스 c-abl IV, 인플루엔자 바이러스 NS1, 간염 바이러스 델타 항원, 마우스 Mx1 단백질, 인간 폴리(ADP-리보스) 중합효소, 및 스테로이드 호르몬 수용체(인간) 글루코코르티코이드로부터 유래된 NLS 서열을 포함한다.

전달

본 명세서에 기재된 CRISPR 뉴클레아제 또는 CRISPR 조성물은 단백질, DNA 분자, RNA 분자, 리보핵단백질(RNP), 핵산 벡터, 또는 이들의 임의의 조합으로서 전달될 수 있다. 일부 실시형태에서, RNA 분자는 화학적 변형을 포함한다. 적합한 화학적 변형의 비-제한적인 예는 2'-0-메틸(M), 2'-0-메틸, 3'포스포로티오에이트(MS) 또는 2'-0-메틸, 3'티오PACE(MSP), 슈도우리딘, 및 1-메틸 슈도-우리딘을 포함한다. 각각의 가능성은 본 발명의 별개의 실시형태를 나타낸다.

본 명세서에 기재된 CRISPR 뉴클레아제 및/또는 이를 인코딩하는 폴리뉴클레오타이드, 및 선택적으로 추가적인 단백질(예를 들어, ZFP, TALEN, 전사 인자, 제한 효소) 및/또는 가이드 RNA와 같은 뉴클레오타이드 분자는 임의의 적합한 수단에 의해 표적 세포로 전달될 수 있다. 표적 서열은 임의의 환경에서, 예를 들어 단리되거나 단리되지 않은, 배양물, 시험관내, 생체외, 생체내 또는 식물내에서 유지되는, 임의의 유형의 세포, 예를 들어 진핵 또는 원핵 세포일 수 있다.

일부 실시형태에서, 전달될 조성물은 뉴클레아제의 mRNA 및 가이드의 RNA를 포함한다. 일부 실시형태에서, 전달될 조성물은 뉴클레아제의 mRNA, 가이드의 RNA 및 공여체 주형을 포함한다. 일부 실시형태에서, 전달될 조성물은 CRISPR 뉴클레아제 및 가이드 RNA를 포함한다. 일부 실시형태에서, 전달될 조성물은 CRISPR 뉴클레아제, 가이드 RNA, 그리고, 예를 들어 상동성 지정 복구를 통해 유전자 편집을 위한 공여체 주형을 포함한다. 일부 실시형태에서, 전달될 조성물은 뉴클레아제의 mRNA, DNA-표적화 RNA 및 tracrRNA를 포함한다. 일부 실시형태에서, 전달될 조성물은 뉴클레아제의 mRNA, DNA-표적화 RNA 및 tracrRNA 및 공여체 주형을 포함한다. 일부 실시형태에서, 전달될 조성물은 CRISPR 뉴클레아제, DNA-표적화 RNA 및 tracrRNA를 포함한다. 일부 실시형태에서, 전달될 조성물은 CRISPR 뉴클레아제, DNA-표적화 RNA 및 tracrRNA, 그리고, 예를 들어 상동성 지정 복구를 통해 유전자 편집을 위한 공여체 주형을 포함한다.

임의의 적합한 바이러스 벡터 시스템이 RNA 조성물을 전달하는 데 사용될 수 있다. 통상적인 바이러스 및 비-바이러스 기반 유전자 전달 방법이 세포(예를 들어, 포유동물 세포, 식물 세포 등) 및 표적 조직에서 핵산 및/또는 CRISPR 뉴클레아제를 도입하는 데 사용될 수 있다. 이러한 방법은 또한 CRISPR 뉴클레아제 단백질을 인코딩하는 핵산 및/또는 CRISPR 뉴클레아제 단백질을 시험관내에서 세포에 투여하는 데 사용될 수 있다. 특정 실시형태에서, 핵산 및/또는 CRISPR 뉴클레아제는 생체내 또는 생체외 유전자 치료법 용도를 위해 투여된다. 비-바이러스 벡터 전달 시스템은 네이키드(naked) 핵산, 및 리포솜 또는 폴록사머와 같은 전달 비히클과 복합체화된 핵산을 포함한다. 유전자 치료법 절차에 대한 검토를 위해, 문헌[Anderson, Science (1992); Nabel and Felgner, TIBTECH (1993); Mitani and Caskey, TIBTECH (1993); Dillon, TIBTECH (1993); Miller, Nature (1992); Van Brunt, Biotechnology (1988); Vigne et al., Restorative Neurology and Neuroscience 8:35-36 (1995); Kremer and Perricaudet, British Medical Bulletin (1995); Haddada et al., Current Topics in Microbiology and Immunology (1995); 및 Yu et al., Gene Therapy 1:13-26 (1994)]을 참조한다.

핵산 및/또는 단백질의 비-바이러스 전달의 방법은 전기천공, 리포펙션, 미세주사, 바이오리스틱(biolistic), 입자 총 가속화, 바이로좀, 리포솜, 면역리포솜, 지질 나노입자(LNP), 다중양이온 또는 지질:핵산 접합체, 인공비리온, 및 핵산의 작용체-증강 흡수를 포함하거나 박테리아 또는 바이러스(예를 들어, 아그로박테리움(Agrobacterium), 리조비움 종 NGR234(Rhizobium sp. NGR234), 시노리조보이움멜리로티(Sinorhizoboiummeliloti), 메조리조비움 로티(Mesorhizobium loti), 담배 모자이크 바이러스, 감자 바이러스 X, 컬리플라워 모자이크 바이러스 및 카싸바 베인 모자이크 바이러스에 의해 식물 세포로 전달될 수 있다. 예를 들어, 문헌[Chung et al. Trends Plant Sci. (2006)]을 참조한다. 예를 들어, Sonitron 2000 시스템(Rich-Mar)을 사용하는 초음파천공(sonoporation)이 또한 핵산의 전달에 사용될 수 있다. 단백질 및/또는 핵산의 양이온성-지질 매개 전달이 또한 생체내, 생체외, 또는 시험관내 전달 방법으로서 고려된다. 문헌[Zuris et al., Nat. Biotechnol. (2015), Coelho et al., N. Engl. J. Med. (2013); Judge et al., Mol. Ther. (2006); 및 Basha et al., Mol. Ther. (2011)]을 참조한다.

비-바이러스 벡터, 예컨대, 트랜스포존-기반 시스템, 예를 들어 재조합 Sleeping Beauty 트랜스포존 시스템 또는 재조합 PiggyBac 트랜스포좀 시스템은 또한 표적 세포로 전달될 수 있고 표적 세포에서 조성물의 분자의 폴리뉴클레오타이드 서열 또는 조성물의 분자를 인코딩하는 폴리뉴클레오타이드 서열의 전위에 이용될 수 있다.

추가적인 예시적 핵산 전달 시스템은 Amaxa® Biosystems(독일 쾰른 소재), Maxcyte, Inc.(미국 메릴랜드주 록빌 소재), BTX Molecular Delivery Systems(미국 매사추세츠주 홀리스턴 소재) 및 Copernicus Therapeutics Inc.,(예를 들어, 미국 특허 제6,008,336호 참조)에 의해 제공되는 것을 포함한다. 리포펙션은, 예를 들어 미국 특허 제5,049,386호, 미국 특허 제4,946,787호; 및 미국 특허 제4,897,355호에 기재되어 있으며 리포펙션 시약은 상업적으로 판매된다(예를 들어, Transfectam.TM., Lipofectin.TM. 및 Lipofectamine.TM. RNAiMAX). 폴리뉴클레오타이드의 효율적인 수용체-인식 리포펙션에 적합한 양이온성 및 중성 지질은 PCT 국제 공개 WO/1991/017424 및 WO/1991/016024에 개시된 것을 포함한다. 전달은 세포(생체외 투여) 또는 표적 조직(생체내 투여)에 대한 것일 수 있다.

면역지질 복합체와 같은 표적화된 리포솜을 포함하는, 지질:핵산 복합체의 제조는 당업자에게 잘 알려져 있다(예를 들어, 문헌[Crystal, Science (1995); Blaese et al., Cancer Gene Ther. (1995); Behr et al., Bioconjugate Chem. (1994); Remy et al., Bioconjugate Chem. (1994); Gao and Huang, Gene Therapy (1995); Ahmad and Allen, Cancer Res., (1992)]; 미국 특허 제4,186,183호; 제4,217,344호; 제4,235,871호; 제4,261,975호; 제4,485,054호; 제4,501,728호; 제4,774,085호; 제4,837,028호; 및 제4,946,787호 참조).

추가적인 전달 방법은 EnGeneIC 전달 비히클(EDV) 내로 전달될 핵산 패키징의 사용을 포함한다. 이들 EDV는 이중특이적 항체를 사용하여 표적 조직으로 특이적으로 전달되며, 여기서 항체의 하나의 아암(arm)은 표적 조직에 대한 특이성을 가지고 다른 아암은 EDV에 대한 특이성을 갖는다. 항체는 EDV를 표적 세포 표면으로 가져간 다음, EDV가 엔도시토시스에 의해 세포 내로 들어간다. 일단 세포 안에 들어가면, 내용물이 방출된다(문헌[MacDiamid et al., Nature Biotechnology (2009)] 참조).

전달 비히클은, 예를 들어 "유전자총"을 통해 세포 내로 발사되는 금 입자에 대한 조성물의 부착, 당업계에 알려진 다른 전달 비히클 중에서, 렌티바이러스, AAV, 및 레트로바이러스를 포함하지만 이에 제한되지 않는 바이러스 비히클, 바이러스-유사 입자(VLP), 대형 VLP(LVLP), 렌티바이러스-유사 입자, 트랜스포존, 바이러스 벡터, 네이키드 벡터, DNA, 또는 RNA에 의해, 박테리아, 바람직하게는 비-병원성, 비히클, 나노입자, 엑소좀, 미세소포, 유전자총 전달을 포함하지만 이에 제한되지 않는다.

CRISPR 뉴클레아제 및/또는 CRISPR 뉴클레아제를 인코딩하는 폴리뉴클레오타이드, 및 선택적으로 추가적인 뉴클레오타이드 분자 및/또는 추가적인 단백질 또는 펩타이드의 전달은 단일 전달 비히클 또는 방법 또는 상이한 전달 비히클 또는 방법의 조합을 이용함으로써 수행될 수 있다. 예를 들어, CRISPR 뉴클레아제는 LNP를 이용하여 세포에 전달될 수 있고, crRNA 분자 및 tracrRNA 분자는 AAV를 이용하여 세포에 전달될 수 있다. 대안적으로, CRISPR 뉴클레아제는 AAV 입자를 이용하여 세포에 전달될 수 있고, crRNA 분자 및 tracrRNA 분자는 별개의 AAV 입자를 이용하여 세포에 전달될 수 있으며, 이는 크기 제한으로 인해 유리할 수 있다.

핵산의 전달을 위한 RNA 또는 DNA 바이러스 기반 시스템의 사용은 신체의 특정 세포에 바이러스를 표적화하고 바이러스 페이로드를 핵으로 수송하기 위한 고도로 진화된 공정을 이용한다. 바이러스 벡터는 환자에게 직접 투여될 수 있거나(생체내) 시험관내에서 세포를 치료하는 데 사용될 수 있고 변형된 세포는 환자에게 투여된다(생체외). 핵산의 전달을 위한 종래 바이러스 기반 시스템은 유전자 전달을 위한 재조합 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관, 백시니아 및 단순 헤르페스 바이러스 벡터를 포함하지만 이에 제한되지 않는다. 그러나, 본 명세서에 기재된 RNA 조성물의 전달을 위해서는 RNA 바이러스가 바람직하다. 추가적으로, 높은 형질도입 효율이 많은 다양한 세포 유형 및 표적 조직에서 관찰되었다. 본 발명의 핵산은 비-통합 렌티바이러스에 의해 전달될 수 있다. 선택적으로, 렌티바이러스를 이용한 RNA 전달이 사용된다. 선택적으로 렌티바이러스는 뉴클레아제의 mRNA, 가이드의 RNA를 포함한다. 선택적으로 렌티바이러스는 뉴클레아제의 mRNA, 가이드의 RNA 및 공여체 주형을 포함한다. 선택적으로, 렌티바이러스는 뉴클레아제 단백질, 가이드 RNA를 포함한다. 선택적으로, 렌티바이러스는 뉴클레아제 단백질, 가이드 RNA 및/또는, 예를 들어 상동성 지정 복구를 통해 유전자 편집을 위한 공여체 주형을 포함한다. 선택적으로, 렌티바이러스는 뉴클레아제의 mRNA, DNA-표적화 RNA 및 tracrRNA를 포함한다. 선택적으로, 렌티바이러스는 뉴클레아제의 mRNA, DNA-표적화 RNA 및 tracrRNA, 및 공여체 주형을 포함한다. 선택적으로, 렌티바이러스는 뉴클레아제 단백질, DNA-표적화 RNA 및 tracrRNA를 포함한다. 선택적으로, 렌티바이러스는 뉴클레아제 단백질, DNA-표적화 RNA, 및 tracrRNA, 및, 예를 들어 상동성 지정 복구를 통해 유전자 편집을 위한 공여체 주형을 포함한다.

상기 언급된 바와 같이, 본 명세서에 기재된 조성물은 비-통합 렌티바이러스 입자 방법, 예를 들어 LentiFlash®시스템을 사용하여 표적 세포로 전달될 수 있다. 이러한 방법은 표적 세포로의 RNA의 전달이 표적 세포 내부에서 본 명세서에 기재된 조성물의 회합을 초래하도록, 표적 세포 내로 mRNA 또는 다른 유형의 RNA를 전달하는 데 사용될 수 있다. 또한 PCT 국제 공개 번호 WO2013/014537, WO2014/016690, WO2016185125, WO2017194902, 및 WO2017194903을 참조한다.

레트로바이러스의 향성은 외래 외피 단백질을 포함시킴으로써 변경되어, 표적 세포의 잠재적 표적 집단을 확장시킬 수 있다. 렌티바이러스 벡터는 비-분열 세포를 형질도입하거나 감염시킬 수 있는 레트로바이러스 벡터이고 전형적으로 높은 바이러스 역가를 생산한다. 레트로바이러스 유전자 전달 시스템의 선택은 표적 조직에 따라 다르다. 레트로바이러스 벡터는 최대 6 내지 10 kb의 외래 서열에 대한 패키징 능력을 갖는 시스-작용 장형 말단 반복부로 구성된다. 최소 시스-작용 LTR이 벡터의 복제 및 패키징에 충분하며, 그 다음 이는 표적 세포 내로 치료용 유전자를 통합시켜 영구적인 이식유전자 발현을 제공하기 위해 사용된다. 널리 사용되는 레트로바이러스 벡터는 뮤린 백혈병 바이러스(MuLV), 긴팔 원숭이 백혈병 바이러스(GaLV), 유인원 면역결핍 바이러스(SIV), 인간 면역결핍 바이러스(HIV), 및 이의 조합에 기반한 것을 포함된다(예를 들어, 문헌[Buchscher Panganiban, J. Virol. (1992); Johann et al., J. Virol. (1992); Sommerfelt et al., Virol. (1990); Wilson et al., J. Virol. (1989); Miller et al., J. Virol. (1991)]; PCT 국제 공개 WO/1994/026877A1 참조).

적어도 6개의 바이러스 벡터 접근법이 현재 임상 시험에서 유전자 전달을 위해 이용 가능하며, 이는 형질도입 작용제를 생성하기 위해 헬퍼 세포주 내로 삽입된 유전자에 의한 결함 벡터의 보완이 연루되는 접근법을 이용한다.

pLASN 및 MFG-S는 임상 시험에서 사용된 레트로바이러스 벡터의 예이다(Dunbar et al., Blood (1995); Kohn et al., Nat. Med. (1995); Malech et al., PNAS (1997)). PA317/pLASN은 유전자 치료법 시험에서 사용된 최초의 치료용 벡터이었다. (Blaese et al., Science (1995)). 50% 이상의 형질도입 효율이 MFG-S 패키징된 벡터에서 관찰되었다. (Ellem et al., Immunol Immunother. (1997); Dranoff et al., Hum. Gene Ther. (1997)).

패키징 세포는 숙주 세포를 감염시킬 수 있는 바이러스 입자를 형성하는 데 사용된다. 이러한 세포는 아데노바이러스, AAV를 패키징하는 293 세포, 및 레트로바이러스를 패키징하는 psi.2 세포 또는 PA317 세포를 포함한다. 유전자 치료법에서 사용되는 바이러스 벡터는 보통 바이러스 입자 내로 핵산 벡터를 패키징하는 생산체 세포주에 의해 생성된다. 벡터는 전형적으로 패키징 및 숙주 내로의 후속 통합(적용 가능한 경우)을 위해 요구되는 최소 바이러스 서열을 포함하며, 다른 바이러스 서열은 발현될 단백질을 인코딩하는 발현 카세트에 의해 대체된다. 누락된 바이러스 기능은 패키징 세포주에 의해 트랜스로 공급된다. 예를 들어, 유전자 치료법에서 사용되는 AAV 벡터는 전형적으로 패키징 및 숙주 게놈 내로의 통합을 위해 요구되는 AAV 게놈으로부터의 역방위 말단 반복부(ITR) 서열만을 보유한다. 바이러스 DNA는 세포주에서 패키징되며, 이는 다른 AAV 유전자, 즉 rep 및 cap을 인코딩하지만, ITR 서열은 없는 헬퍼 플라스미드를 함유한다. 세포주는 또한 헬퍼로서 아데노바이러스로 감염된다. 헬퍼 바이러스는 헬퍼 플라스미드로부터 AAV 벡터의 복제 및 AAV 유전자의 발현을 촉진시킨다. 헬퍼 플라스미드는 ITR 서열의 부재로 인해 유의한 양으로 패키징되지 않는다. 아데노바이러스로의 오염은, 예를 들어 아데노바이러스가 AAV보다 더 민감한 열 처리에 의해 감소될 수 있다. 추가적으로, AAV는 배큘로바이러스 시스템을 사용하여 임상 규모로 생산될 수 있다(미국 특허 번호 제7,479,554호 참조).

여러 유전자 치료법 적용에서, 유전자 치료법 벡터는 특정 조직 유형으로 높은 정도의 특이성을 가지고 전달되는 것이 바람직하다. 따라서, 바이러스 벡터는 리간드를 바이러스의 외부 표면 상의 바이러스 코트 단백질과의 융합 단백질로서 발현시킴으로써 주어진 세포 유형에 대해 특이성을 갖도록 변형될 수 있다. 리간드는 관심이 있는 세포 유형의 세포 상에 존재하는 것으로 알려진 수용체에 대해 친화도를 갖도록 선택된다. 예를 들어, 문헌[Han et al., Proc. Natl. Acad. Sci. USA (1995)]은 몰로니 뮤린 백혈병 바이러스가 gp70에 융합된 인간 헤레귤린(heregulin)을 발현하도록 변형될 수 있고, 재조합 바이러스가 인간 표피 성장 인자 수용체를 발현하는 특정 인간 유방암 세포를 감염시킨다는 것을 보고하였다. 상기 원리는 다른 바이러스-표적 세포 쌍으로 연장될 수 있고, 여기서 표적 세포는 수용체를 발현하고 바이러스는 세포-표면 수용체에 대한 리간드를 포함하는 융합 단백질을 발현한다. 예를 들어, 필라멘트성 파지는 실질적으로 임의의 선택된 세포성 수용체에 대해 특이적 결합 친화도를 갖는 항체 단편(예를 들어, FAB 또는 Fv)을 나타내도록 조작될 수 있다. 상기 기재는 주로 바이러스 벡터에 적용되지만, 동일한 원리가 비-바이러스 벡터에 적용될 수 있다. 이러한 벡터는 특정 표적 세포에 의한 섭취를 선호하는 특정 섭취 서열을 포함하도록 조작될 수 있다.

유전자 치료법 벡터는 하기 기재된 바와 같이, 전형적으로 전신 투여(예를 들어, 정맥내, 복강내, 근육내, 진피하, 또는 두개내 주입) 또는 국소 적용에 의해, 개별 환자에 대한 투여에 의해 생체내 전달될 수 있다. 대안적으로, 벡터는 개별 환자로부터 외식된 세포(예를 들어, 림프구, 골수 흡입물, 조직 생검)와 같은 생체외 세포 또는 범용 공여체 조혈 줄기 세포로 전달된 후, 보통 벡터를 포함한 세포에 대한 선택 후에, 환자 내로의 세포의 재이식이 이어질 수 있다. 일부 실시형태에서, 생체내 및 생체외 mRNA의 전달, 및 RNP 전달이 이용될 수 있다.

진단, 연구, 또는 유전자 치료법을 위한 생체외 세포 형질감염(예를 들어, 숙주 유기체 내로의 형질감염된 세포의 재주입을 통한)은 당업자에게 잘 알려져 있다. 바람직한 구현예에서, 세포는 대상 유기체로부터 단리되고, RNA 조성물로 형질감염되며, 대상 유기체(예를 들어, 환자) 내로 다시 재주입된다. 생체외 형질감염에 적합한 다양한 세포 유형은 당업자에게 잘 알려져 있다(예를 들어, 환자로부터 세포를 어떻게 단리하고 배양하는지의 논의에 대해, 문헌[Freshney, "Culture of Animal Cells, A Manual of Basic Technique and Specialized Applications (6th edition, 2010)] 및 여기서 인용된 참조문헌 참조).

적합한 세포는 진핵 및 원핵 세포 및/또는 세포주를 포함하지만 이에 제한되지 않는다. 이러한 세포 또는 이러한 세포로부터 생성된 세포주의 비-제한적 예는 COS, CHO(예를 들어, CHO--S, CHO-K1, CHO-DG44, CHO-DUXB11, CHO-DUKX, CHOK1SV), VERO, MDCK, WI38, V79, B14AF28-G3, BHK, HaK, NSO, SP2/0-Ag14, HeLa, HEK293(예를 들어, HEK293-F, HEK293-H, HEK293-T), 및 perC6 세포, 임의의 식물 세포(분화 또는 미분화)뿐만 아니라, 곤충 세포, 예컨대, 스포돕테라푸기페르다(Spodopterafugiperda(Sf)), 또는 진균 세포, 예컨대, 사카로마이세스(Saccharomyces), 피치아(Pichia) 및 스키조사카로마이세스(Schizosaccharomyces)를 포함한다. 특정 실시형태에서, 세포주는 CHO-K1, MDCK 또는 HEK293 세포주이다. 추가적으로, 1차 세포가 단리되고 뉴클레아제(예를 들어, ZFN 또는 TALEN) 또는 뉴클레아제 시스템(예를 들어, CRISPR)으로의 처리 후 치료받을 대상체 내로의 재도입을 위해 생체외에서 사용될 수 있다. 적합한 1차 세포는 말초혈 단핵 세포(PBMC), 및 CD4+ T 세포 또는 CD8+ T 세포와 같은 다른 혈액 세포 하위세트(이에 제한되지 않음)를 포함한다. 적합한 세포는 또한 예로서, 배아 줄기 세포, 유도된 다능성 줄기 세포, 조혈 줄기 세포(CD34+), 신경 줄기 세포 및 중간엽 줄기 세포와 같은 줄기 세포를 포함한다.

일 실시형태에서, 줄기 세포는 세포 형질감염 및 유전자 치료법을 위한 생체외 절차에서 사용된다. 줄기 세포를 사용하는 장점은 줄기 세포가 시험관내에서 다른 세포 유형으로 분화될 수 있거나 골수에 생착될 포유동물(예컨대, 세포의 공여체) 내로 도입될 수 있다는 것이다. 시험관내 CD34+ 세포를 GM-CSF, IFN-감마 및 TNF-알파와 같은 사이토카인을 사용하여 임상적으로 중요한 면역 세포 유형으로 분화시키는 방법이 알려져 있다(비제한적인 예로서, 문헌[Inaba et al., J. Exp. Med. (1992)] 참조).

줄기 세포는 알려진 방법을 사용하여 형질도입 및 분화를 위해 단리된다. 예를 들어, 줄기 세포는 원치 않는 세포, 예컨대, CD4+ 및 CD8+(T 세포), CD45+(범 B 세포), GR-1(과립구), 및 Iad(분화 항원 제시 세포)에 결합하는 항체로 골수 세포를 패닝(panning)함으로써 골수 세포로부터 단리된다(비제한적 예로서, 문헌[Inaba et al., J. Exp. Med. (1992)] 참조). 변형된 줄기 세포가 또한 일부 실시형태에서 사용될 수 있다.

특히, 본 명세서에 기재된 CRISPR 뉴클레아제 중 임의의 하나는 유사분열-후 세포 또는 활발히 분열 중이 아닌 임의의 세포, 예를 들어 정지된 세포에서 게놈 편집에 적합할 수 있다. 본 발명의 CRISPR 뉴클레아제를 사용하여 편집될 수 있는 유사분열-후 세포의 예는 근육세포, 심근세포, 간세포, 골세포 및 신경세포를 포함하지만 이에 제한되지 않는다.

치료 RNA 조성물을 포함하는 벡터(예를 들어, 레트로바이러스, 리포솜 등)가 또한 생체내에서 세포의 형질도입을 위해 유기체에 직접 투여될 수 있다. 대안적으로, 네이키드 RNA 또는 mRNA가 투여될 수 있다. 투여는 주사, 주입, 국소 적용 및 전기천공을 포함하지만 이에 제한되지 않는, 분자를 혈액 또는 조직 세포와의 궁극적 접촉으로 도입하기 위해 보통 사용되는 임의의 경로에 의한다. 이러한 핵산을 투여하는 적합한 방법이 이용 가능하고 당업자에게 잘 알려져 있으며, 하나 초과의 경로가 특정 조성물을 투여하는 데 사용될 수 있지만, 특정 경로가 종종 또 다른 경로보다 더 즉각적이고 더 효과적인 반응을 제공할 수 있다.

면역 세포(예를 들어, T-세포) 내로의 이식유전자의 도입에 적합한 벡터는 비-통합 렌티바이러스 벡터를 포함한다. 예를 들어, 미국 특허 공개 제2009/0117617호를 참조한다.

약제학적으로 허용 가능한 담체는 부분적으로 투여되는 특정 조성물뿐만 아니라 조성물을 투여하는 데 사용되는 특정 방법에 의해 결정된다. 따라서, 하기 기재된 바와 같이, 약제학적 조성물의 매우 다양한 적합한 제형물이 이용 가능하다(예를 들어, 문헌[Remington's Pharmaceutical Sciences, 17th ed., 1989] 참조).

상동 재조합에 의한 DNA 복구

용어 "상동성 지정 복구" 또는 "HDR"은, 예를 들어 DNA에서 이중-가닥 및 단일-가닥 파손의 복구 동안, 세포 내에서 DNA 손상을 복구하기 위한 메커니즘을 지칭한다. HDR은 뉴클레오타이드 서열 상동성을 필요로 하며 이중-가닥 또는 단일 파손이 일어난 서열(예를 들어, DNA 표적 서열)을 복구하기 위해 "핵산 주형"(핵산 주형 또는 공여체 주형은 본 명세서에서 호환 가능하게 사용됨)을 사용한다. 이는, 예를 들어 핵산 주형으로부터 DNA 표적 서열로 유전 정보의 전달을 초래한다. HDR은 핵산 주형 서열이 DNA 표적 서열과 상이하고 핵산 주형 폴리뉴클레오타이드 또는 올리고뉴클레오타이드의 일부 또는 전부가 DNA 표적 서열 내로 포함되는 경우, DNA 표적 서열의 변경(예를 들어, 삽입, 결실, 돌연변이)을 초래할 수 있다. 일부 실시형태에서, 전체 핵산 주형 폴리뉴클레오타이드, 핵산 주형 폴리뉴클레오타이드의 일부, 또는 핵산 주형의 카피가 DNA 표적 서열 부위에서 통합된다.

용어 "핵산 주형" 및 "공여체"는 게놈 내로 삽입되거나 카피되는 뉴클레오타이드 서열을 지칭한다. 핵산 주형은, 예를 들어 하나 이상의 뉴클레오타이드의, 뉴클레오타이드 서열을 포함하며, 이는 표적 핵산에서 주형에 부가될 것이거나 변화의 주형이 될 것이거나 표적 서열을 변형하기 위해 사용될 수 있다. 핵산 주형 서열은 임의의 길이, 예를 들어 2 내지 10,000개 뉴클레오타이드 길이(또는 그 사이 또는 초과의 임의의 정수 값), 바람직하게는 약 100 내지 1,000개 뉴클레오타이드 길이(또는 그 사이의 임의의 정수), 더 바람직하게는 약 200 내지 500개 뉴클레오타이드 길이일 수 있다. 핵산 주형은 단일 가닥 핵산, 이중 가닥 핵산일 수 있다. 일부 실시형태에서, 핵산 주형은, 예를 들어 하나 이상의 뉴클레오타이드의, 뉴클레오타이드 서열을 포함하며, 이는, 예를 들어 표적 위치의, 표적 핵산의 야생형 서열에 상응한다. 일부 실시형태에서, 핵산 주형은, 예를 들어 하나 이상의 리보뉴클레오타이드의, 리보뉴클레오타이드 서열을 포함하며, 이는, 예를 들어 표적 위치의, 표적 핵산의 야생형 서열에 상응한다. 일부 실시형태에서, 핵산 주형은 변형된 리보뉴클레오타이드를 포함한다.

예를 들어, 돌연변이체 유전자의 교정을 위한 또는 야생형 유전자의 증가된 발현을 위한, 외인성 서열(또한 "공여체 서열", "공여체 주형" 또는 "공여체"로도 불림)의 삽입이 또한 수행될 수 있다. 공여체 서열은 전형적으로 이것이 배치되는 게놈 서열과 동일하지 않음은 용이하게 명백할 것이다. 공여체 서열은 관심이 있는 위치에서 효율적인 HDR을 가능하게 하기 위해 상동성인 2개 영역에 측접하는 비-상동성 영역을 포함할 수 있다. 추가적으로, 공여체 서열은 세포 염색질 내 관심이 있는 영역과 상동성이 아닌 서열을 포함하는 벡터 분자를 포함할 수 있다. 공여체 분자는 세포 염색질과 상동성인 몇몇, 불연속 영역을 포함할 수 있다. 예를 들어, 보통 관심이 있는 영역에 존재하지 않는 서열의 표적화된 삽입을 위해, 상기 서열은 공여체 핵산 분자에 존재하고 관심이 있는 영역 내 서열과 상동성인 영역에 측접할 수 있다.

공여체 폴리뉴클레오타이드는 DNA 또는 RNA, 단일-가닥 및/또는 이중-가닥일 수 있고 선형 또는 원형 형태로 세포 내에 도입될 수 있다. 예를 들어, 미국 특허 공개 제2010/0047805호; 제2011/0281361호; 제2011/0207221호; 및 제2019/0330620호를 참조한다. 선형 형태로 도입되는 경우, 공여체 서열의 말단은 당업자에게 알려진 방법에 의해 (예를 들어, 핵산말단 분해로부터) 보호될 수 있다. 예를 들어, 하나 이상의 디데옥시뉴클레오타이드 잔기는 선형 분자의 3' 말단에 부가되고/되거나 자가-상보성 올리고뉴클레오타이드가 한쪽 또는 양쪽 말단에 결찰된다. 예를 들어, 문헌[Chang and Wilson, Proc. Natl. Acad. Sci. USA (1987); Nehls et al., Science (1996)]을 참조한다. 분해로부터 외인성 폴리뉴클레오타이드를 보호하기 위한 추가적인 방법은 말단 아미노기(들)의 부가 및, 예를 들어 포스포로티오에이트, 포스포르아미데이트, 및 O-메틸 리보스 또는 데옥시리보스 잔기와 같은 변형된 뉴클레오타이드간 연결의 사용을 포함하지만 이에 제한되지 않는다.

따라서, 복구를 위해 공여체 주형을 사용하는 본 발명의 실시형태는 선형 또는 원형 형태로 세포 내에 도입될 수 있는 DNA 또는 RNA, 단일-가닥 및/또는 이중-가닥 공여체 주형을 사용할 수 있다. 본 발명의 실시형태에서 유전자-편집 조성물은 (1) 복구 전에 유전자에서 이중 가닥 파손에 영향을 미치는 가이드 서열을 포함하는 RNA 분자 및 (2) 복구를 위한 공여체 RNA 주형을 포함하며, 가이드 서열을 포함하는 RNA 분자는 제1 RNA 분자이고 공여체 RNA 주형은 제2 RNA 분자이다. 일부 실시형태예에서, 가이드 RNA 분자 및 주형 RNA 분자는 단일 분자의 일부로서 연결된다.

공여체 서열은 또한 올리고뉴클레오타이드일 수 있고 내인성 서열의 유전자 교정 또는 표적화된 변경에 사용될 수 있다. 올리고뉴클레오타이드는 벡터 상에서 세포로 도입될 수 있거나, 세포 내에 전기천공될 수 있거나, 당업계에 알려진 다른 방법을 통해 도입될 수 있다. 올리고뉴클레오타이드는 내인성 유전자 내의 돌연변이된 서열(예를 들어, 베타 글로빈 내 겸상(sickle) 돌연변이)을 '교정'하는 데 사용될 수 있거나, 내인성 유전자좌 내로 원하는 목적을 갖는 서열을 삽입하는 데 사용될 수 있다.

폴리뉴클레오타이드는, 예를 들어 복제 기원, 프로모터 및 항생제 내성을 인코딩하는 유전자와 같은 추가적인 서열을 갖는 벡터 분자의 일부로서 세포 내로 도입될 수 있다. 더욱이, 공여체 폴리뉴클레오타이드는 네이키드 핵산으로서, 리포솜 또는 폴록사머와 같은 작용제와 복합체화된 핵산으로서 도입될 수 있거나, 재조합 바이러스(예를 들어, 아데노바이러스, AAV, 헤르페스바이러스, 레트로바이러스, 렌티바이러스 및 인테그라제 결함 렌티바이러스(IDLV))에 의해 전달될 수 있다.

공여체는 일반적으로 그 발현이 통합 부위에서 내인성 프로모터, 즉 공여체가 삽입되는 내인성 유전자의 발현을 구동하는 프로모터에 의해 구동되도록 삽입된다. 그러나, 공여체가 프로모터 및/또는 인핸서, 예를 들어 구성적 프로모터 또는 유도성 또는 조직 특이적 프로모터를 포함할 수 있음이 명백할 것이다.

공여체 분자는 내인성 유전자의 전부, 일부가 발현되거나 전혀 발현되지 않도록 내인성 유전자 내로 삽입될 수 있다. 예를 들어, 본 명세서에 기재된 바와 같은 이식유전자는, 예를 들어 이식유전자와의 융합체로서, 내인성 서열의 일부(이식유전자에 대해 N-말단 및/또는 C-말단)가 발현되거나 전혀 발현되지 않도록, 내인성 유전자좌 내로 삽입될 수 있다. 다른 실시형태에서, 이식유전자(예를 들어, 내인성 유전자와 같은 추가적인 코딩 서열을 갖거나 갖지 않음)는 임의의 내인성 유전자좌, 예를 들어 세이프-하버(safe-harbor) 유전자좌, 예를 들어 CCR5 유전자, CXCR4 유전자, PPP1R12c(또한 AAVS1로도 알려짐) 유전자, 알부민 유전자 또는 Rosa 유전자 내로 통합된다. 예를 들어, 미국 특허 제7,951,925호 및 제8,110,379호; 미국 공개 제2008/0159996호; 제20100/0218264호; 제2010/0291048호; 제2012/0017290호; 제2011/0265198호; 제2013/0137104호; 제2013/0122591호; 제2013/0177983호 및 제2013/0177960호 및 미국 가출원 제61/823,689호를 참조한다.

내인성 서열(내인성 또는 이식유전자의 일부)이 이식유전자와 함께 발현되는 경우, 내인성 서열은 전장 서열(야생형 또는 돌연변이체) 또는 부분적 서열일 수 있다. 바람직하게는 내인성 서열은 기능적이다. 이들 전장 또는 부분적 서열의 기능의 비-제한적 예는 이식유전자(예를 들어, 치료용 유전자)에 의해 발현되는 폴리펩타이드의 혈청 반감기 증가 및/또는 담체로서의 작용을 포함한다.

또한, 발현을 위해 요구되지는 않지만, 외인성 서열은 또한 전사 또는 번역 조절 서열, 예를 들어 프로모터, 인핸서, 인슐레이터(insulator), 내부 리보솜 진입 부위, 2A 펩타이드를 인코딩하는 서열 및/또는 폴리아데닐화 신호를 포함할 수 있다.

특정 실시형태에서, 공여체 분자는 단백질을 인코딩하는 유전자(예를 들어, 세포에 또는 개체에 부재하는 단백질을 인코딩하는 코딩 서열 또는 단백질을 인코딩하는 유전자의 대안적 버전), 조절 서열 및/또는 마이크로RNA 또는 siRNA와 같은 구조적 핵산을 인코딩하는 서열로 이루어진 군으로부터 선택되는 서열을 포함한다.

상기 실시형태에 있어서, 본 명세서에 개시된 각각의 실시형태는 각각의 다른 개시된 실시형태에 적용 가능한 것으로 고려된다. 예를 들어, 본 발명의 임의의 RNA 분자 또는 조성물이 본 발명의 임의의 방법에서 이용될 수 있음이 이해된다.

본 명세서에서 사용되는 바와 같이, 모든 제목은 단순히 구성을 위한 것이며 어떠한 방식으로든 본 개시내용을 제한하는 것으로 의도되지 않는다. 임의의 개별 섹션의 내용은 모든 섹션에 동일하게 적용 가능할 수 있다.

본 발명의 추가적인 목적, 장점, 및 신규한 특징은 하기 실시예의 조사 시 당업자에게 명백해질 것이며, 이는 제한하는 것으로 의도되지 않는다. 추가적으로, 본 명세서의 위에서 상세히 기술된 바와 같으며 하기 청구범위 섹션에서 청구된 바와 같은 본 발명의 각각의 다양한 실시형태 및 양태는 하기 실시예에서 실험적 뒷받침이 확인된다.

명확성을 위해 별도 실시형태의 맥락에서 기재되는, 본 발명의 특정 특징이 또한 단일 실시형태에서 조합되어 제공될 수 있음이 이해된다. 반대로, 간결성을 위해, 단일 실시형태의 맥락에서 기재되는 본 발명의 다양한 특징은 또한 별도로 또는 임의의 적합한 하위-조합으로 또는 본 발명의 임의의 다른 기재된 실시형태에서 적합한 바와 같이 제공될 수 있다. 다양한 실시형태의 맥락에서 기재되는 특정 특징은 실시형태가 이들 요소 없이 작동되지 않는 경우가 아닌 한, 이들 실시형태의 필수적 특징으로 간주되어서는 안 된다.

일반적으로, 본 명세서에서 사용되는 명명법, 및 본 발명에서 이용되는 실험실 절차는 분자, 생화학, 미생물학 및 재조합 DNA 기법을 포함한다. 이러한 기법은 문헌에서 철저하게 설명되어 있다. 예를 들어, 문헌[Sambrook et al., "Molecular Cloning: A laboratory Manual" (1989); Ausubel, R. M. (Ed.), "Current Protocols in Molecular Biology" Volumes I-III (1994); Ausubel et al., "Current Protocols in Molecular Biology", John Wiley and Sons, Baltimore, Maryland (1989); Perbal, "A Practical Guide to Molecular Cloning", John Wiley & Sons, New York (1988); Watson et al., "Recombinant DNA", Scientific American Books, New York; Birren et al. (Eds.), "Genome Analysis: A Laboratory Manual Series", Vols. 1-4, Cold Spring Harbor Laboratory Press, New York (1998); 미국 특허 제4,666,828호; 제4,683,202호; 제4,801,531호; 제5,192,659호 및 제5,272,057호에 제시된 바와 같은 방법론; Cellis, J. E. (Ed.), "Cell Biology: A Laboratory Handbook", Volumes I-III (1994); Freshney, "Culture of Animal Cells - A Manual of Basic Technique" Third Edition, Wiley-Liss, N. Y. (1994); Coligan J. E. (Ed.), "Current Protocols in Immunology" Volumes I-III (1994); Stites et al. (Eds.), "Basic and Clinical Immunology" (8th Edition), Appleton & Lange, Norwalk, CT (1994); Mishell and Shiigi (Eds.), "Strategies for Protein Purification and Characterization - A Laboratory Course Manual" CSHL Press (1996); Clokie and Kropinski (Eds.), "Bacteriophage Methods and Protocols", Volume 1: Isolation, Characterization, and Interactions (2009)]을 참조하며, 이들 모두 참조에 의해 원용된다. 다른 일반 참조문헌이 본 문헌 전체를 통해 제공된다.

본 발명의 보다 완전한 이해를 촉진하기 위해 실시예가 하기에 제공된다. 하기 실시예는 본 발명의 제조 및 실시의 예시적 방식을 예시한다. 그러나, 본 발명의 범주는 이들 실시예에 개시된 특정 실시형태에 제한되지 않으며, 이는 단지 예시 목적을 위한 것이다.

실험 상세사항

본 발명의 보다 완전한 이해를 촉진하기 위해 실시예가 하기에 제공된다. 하기 실시예는 본 발명의 제조 및 실시의 예시적 방식을 설명한다. 그러나, 본 발명의 범주는 이들 실시예에 개시된 특정 실시형태에 제한되지 않으며, 이는 단지 예시 목적을 위한 것이다.

실시예 1: OMNI-103 CRISPR 뉴클레아제

CRISPR 반복부(crRNA), 전사활성화 RNA(tracrRNA), 뉴클레아제 폴리펩타이드(OMNI), 및 프로토스페이서 인접 모티프(PAM) 서열을 환경 샘플의 상이한 메타게놈 서열 데이터베이스로부터 예측하였다.

OMNI 뉴클레아제 폴리펩타이드의 작제

신규 뉴클레아제 폴리펩타이드(OMNI)의 작제를 위해, 여러 가지 확인된 OMNI의 오픈 리딩 프레임을 인간 세포주 발현을 위해 코돈 최적화하였다. ORF를 박테리아 발현 플라스미드 pET9a 내로 및 포유동물 발현 플라스미드 pmOMNI 내로 클로닝하였다(표 4).

sgRNA의 예측 및 작제

각각의 OMNI에 있어서, 단일 가이드 RNA(sgRNA)를 각각의 박테리아 게놈 내 CRISPR 반복부 어레이 서열 및 tracrRNA의 검출에 의해 예측하였다. 천연 성숙-전 crRNA 및 tracrRNA 서열을 인실리코로(in silico) 테트라-루프 'gaaa' 서열과 연결하고 이중나선의 2차 구조 요소를 RNA 2차 구조 예측 도구를 사용함으로써 예측하였다.

전체 이중나선 RNA 요소(crRNA-tracrRNA 키메라)의 예측된 2차 구조를 sgRNA의 설계를 위한 가능한 tracrRNA 서열의 확인을 위해 사용하였다. 상이한 위치에서 상부 줄기에서의 이중나선을 단축시킴으로써 여러 가능한 sgRNA 스캐폴드 버전을 작제하였다(OMNI-103 sgRNA 설계는 표 2에 열거되어 있음). 추가적으로, 잠재적인 전사 및 구조적 제약을 극복하고 인간 세포 환경 맥락에서 sgRNA 스캐폴드의 가소성을 평가하기 위해, 일부 경우에서 가능한 sgRNA의 뉴클레오타이드 서열의 작은 변화를 만들었다(도 1, 표 2). 마지막으로, 각각의 OMNI에 대해 가능한 설계된 스캐폴드의 최대 3가지 버전을 합성하고 22-뉴클레오타이드 범용 고유 스페이서 서열(T2, 서열번호 135)의 하류에 연결한 다음, 포유동물 발현에 대한 U6 프로모터와 조합된 유도성 T7 프로모터 하에 박테리아 발현 플라스미드 내로 클로닝하였다(pShuttleGuide, 표 4).

T2 - GGAAGAGCAGAGCCTTGGTCTC (서열번호 135)

TXTL에 의한 시험관내 결실 분석

시험관내 PAM 서열의 결실을 문헌[Maxwell et al, Methods. 2018]에 기재된 바에 따라 수행하였다. 간략하게, T7 프로모터 하에 OMNI 뉴클레아제 및 sgRNA를 발현하는 선형 DNA를 T7 중합효소를 발현하는 선형 작제물과 함께 무세포 전사-번역 시험관내 시스템(TXTL 혼합물, Arbor Bioscience)에 첨가하였다. TXTL 혼합물에 의한 RNA 발현 및 단백질 번역은 리보핵단백질(RNP) 복합체의 형성을 초래한다. 선형 DNA를 사용하였으므로, Chi6 DNA 서열을 TXTL 반응 혼합물에 첨가하여 RecBCD의 엑소뉴클레아제 활성을 저해하고, 이에 의해 선형 DNA를 분해로부터 보호하였다. sgRNA 스페이서를 잠재적 PAM 서열의 8N 무작위화 세트가 측접된 표적 프로토스페이서를 포함하는 플라스미드 라이브러리(pbPOS T2 라이브러리, 표 4)를 표적화하도록 설계한다. 절단된 라이브러리 및 비-표적화 gRNA를 발현하는 대조군 라이브러리 둘 다에 대해 필요한 어댑터 및 지표를 부가하기 위해 PCR을 사용하여 고속대량(high-throughput) 서열분석에 의해 라이브러리로부터의 PAM 서열의 결실을 측정하였다. 심층 서열분석 후, 대조군에서의 발생 대비 동일한 PAM 서열을 갖는 결실된 서열의 분율에 의해 시험관내 활성을 확인하였으며, 이는 OMNI 뉴클레아제에 의한 기능적 DNA 절단을 나타낸다(도 4a 내지 도 4b 및 표 3).

내인성 게놈 표적에 대한 인간 세포에서의 활성

OMNI-103을 인간 세포 내 특정 게놈 위치 상에서 편집을 촉진시키는 능력에 대해 분석하였다. OMNI-103의 인간 게놈 표적에 대한 편집 활성을 OMNI-103 뉴클레아제 및 각각 상이한 게놈 위치를 표적화하도록 설계된 고유 sgRNA 분자의 패널로 공동 형질감염된 HeLa 세포에 대한 NGS 절단 분석으로 평가하였다. 이를 위해, 인간 최적화된 OMNI-103 뉴클레아제를 인-프레임(in-frame)-P2A-mCherry 발현 벡터(pmOMNI, 표 4) 내로 클로닝하고 OMNI-103 sgRNA 분자 서열 각각을 셔틀-가이드(shuttle-guide) 벡터(pShuttle Guide, 표 4) 내로 클로닝하였다. sgRNA 분자를 상응하는 OMNI-103 PAM 선호도에 따라 인간 게놈의 특정 위치를 표적화하는 22-뉴클레오타이드 가이드 서열 부분(표 5)에 이어서 TXTL에 의해 발견된 바와 같은 sgRNA 스캐폴드 서열(표 3)을 포함하도록 설계하였다. 형질감염 72시간 후, 세포를 수확하였다. 마커로서 mCherry 형광을 사용하여 FACS에 의한 OMNI-103 뉴클레아제 발현의 정량화에 수확된 세포의 절반을 사용하였다. 세포의 나머지를 용해시키고, 이의 게놈 DNA 내용물을 추출하여 상응하는 게놈 표적의 PCR 증폭을 위한 주형으로서 사용하였다. 앰플리콘에 차세대 염기서열 분석기법(NGS)을 수행한 다음 생성 판독물을 사용하여 각각의 표적 부위에서 편집 사건의 백분율을 계산하였다. 절단 부위 주위의 짧은 삽입 또는 결실(삽입결실)은 뉴클레아제-유도 DNA 절단 후 DNA 말단 복구의 전형적인 결과이다. 편집%의 계산을 각각의 앰플리콘 내 총 정렬된 판독물 대비 삽입결실 판독물의 분율로부터 추정하였다. 표 5(칼럼 5, "편집%")에서 알 수 있는 바와 같이, OMNI-103 뉴클레아제는 대부분의 게놈 부위에서 높고 유의한 편집 수준을 나타내었다.

OMNI-103 뉴클레아제의 단백질 정제

RNP 회합에서 사용하기 위한 뉴클레아제 단백질 생산 및 합성 가이드 생산을 위한 발현 방법은 미국 가출원 제63/286,855호에 기재되었다. 간략하게, OMNI-103 뉴클레아제 오픈 리딩 프레임을 박테리아에 대해 코돈 최적화하고(표 1), SV40 NLS - 박테리아 최적화된 OMNI-103 ORF(2번째 아미노산으로부터) - HA 태그 - SV40 NLS - 8 His-태그의 요소와 함께 변형된 pET9a 플라스미드 내로 클로닝하였다(표 4). KRX 세포(PROMEGA)에서 OMNI-103 작제물을 발현시켰다. 6.66mM 람노스(0.5M 스톡, 26.4 ㎖), 및 0.05% 글루코스(0.5M, 2 ㎖)를 첨가한 TB + 0.4% 글리세롤에서 세포를 성장시키고, 온도를 20℃까지 낮추고 4시간 동안 중간 대수기에서 발현시켰다. 화학적 용해를 사용하여 세포를 용해시키고 정화시킨 용해물을 Ni-NTA 수지 상에서 정제하였다. Ni-NTA 용리 분획을 CEX(SO3 fractogel) 수지 상에서 정제한 후, Superdex^® 200 Increase 10/300 GL, AKTA Pure(GE Healthcare Life Sciences) 상에서 SEC 정제를 수행하였다. OMNI-103 단백질을 포함하는 분획을 풀링하고 30 ㎎/㎖ 스톡으로 농축시킨 다음 액체 질소에서 급속 동결하고 -80℃에서 보관하였다.

시험관내에서 RNP의 OMNI-103 절단 활성

OMNI-103의 합성 sgRNA를 3' 및 5' 말단에서 3개의 2'-O-메틸 3'-포스포로티오에이트와 함께 합성하였다(Agilent).

가이드 PDCD1 S40과 동일한 표적 부위를 표적화하는 상이한 스페이서 길이(20 내지 25개 뉴클레오타이드)를 갖는 가이드 분자를 이용하여 OMNI-103 RNP의 활성을 시험관내에서 분석하였다(표 6, 도 2a). 간략하게, 10 pmol의 OMNI-103 뉴클레아제를 20 pmol의 합성 가이드와 혼합하였다. 실온에서 10분 인큐베이션 후, RNP 복합체를 4, 2, 1, 0.5 pmol로 연속 희석하고, 추출된 게놈 DNA로부터 PDCD1 S40 표적 부위의 증폭에 의해 제조된 선형 DNA 주형 40 ng과 반응시켰다. 모든 스페이서 길이(20 내지 25개 뉴클레오타이드)는 모든 RNP 농도에서 PDCD1 주형의 전체 절단을 나타내었으며, 이는 높은 절단 활성을 나타낸다(도 2a).

U2OS 세포에서 RNP의 편집 활성을 측정함으로써 OMNI-103 뉴클레아제에 대한 가이드 최적화

스페이서 길이 최적화를 또한 포유동물 세포 맥락에서 테스트하였다. 100 uM OMNI-103 뉴클레아제를 상이한 스페이서 길이(20 내지 25 뉴클레오타이드, 표 6)의 120 uM의 합성 가이드 및 100 uM Cas9 전기천공 인핸서(IDT)와 혼합함으로써 RNP를 회합하였다. 실온에서 10분 인큐베이션 후, RNP 복합체를 200,000 사전-세척 U2OS 세포와 혼합하고 제조업체의 프로토콜에 따라, DN100과 함께 Lonza SE Cell Line 4D-NucleofectorTM X 키트를 사용하여 전기천공하였다. 72시간 전기천공 후, 세포를 용해시키고, 이의 게놈 DNA 내용물을 추출하였다. 그 다음 PCR에 의해 상응하는 게놈 표적 부위를 증폭시켰다. 앰플리콘에 NGS를 수행하고 생성 서열을 사용하여 편집 사건의 백분율을 계산하였다. 도 2b 및 표 7에서 알 수 있는 바와 같이, 22개 뉴클레오타이드의 스페이서 길이는 가장 높은 편집 수준을 나타내었다.

인간 세포에서 OMNI-103 RNP 편집 활성

포유동물 세포에서 RNP로서 OMNI-103 단백질의 활성이 U2OS에서 관찰되었고(표 7, 도 2c) 비슷한 활성이 또한 T 세포에서 관찰되었다(표 8). 100 uM 뉴클레아제를 120 uM의 합성 가이드(표 6) 및 100 uM Cas9 전기천공 인핸서(IDT)와 혼합함으로써 RNP를 회합하였다. 실온에서 10분 인큐베이션 후, RNP 복합체를 200,000 U2OS 세포와 혼합하고 제조업체의 프로토콜에 따라, DN100과 함께 Lonza SE Cell Line 4D-NucleofectorTM X 키트를 사용하여 전기천공하였다. 72시간 전기천공 후, 세포를 용해시키고, 이의 게놈 DNA 내용물을 추출하였다. 그 다음 PCR에 의해 상응하는 게놈 표적 부위를 증폭시켰다. 앰플리콘에 NGS를 수행하고 생성 서열을 사용하여 편집 사건의 백분율을 계산하였다. PDCD1 S40, TRAC S35, TRAC S36 및 B2M S12 가이드를 이용하여 OMNI-103 RNP를 테스트하였다. 테스트한 네(4) 가지 가이드 모두 70 내지 90% 편집 수준을 나타내었다(도 2c).

가이드-seq 비편향 분석 방법을 사용한 표적외 효과의 평가

가이드-seq는 살아있는 세포에서 CRISPR 뉴클레아제에 의해 유발된 표적외 게놈 편집 사건의 비편향 시험관내 검출을 가능하게 한다. 살아있는 인간 세포의 게놈에서 블런트-말단 CRISPR RNA-가이드 뉴클레아제(RGN) 유도 DSB는 NHEJ와 일치하는 말단-연결 공정을 통해 이들 파손에서 블런트 이중-가닥 올리고데옥시뉴클레오타이드(dsODN)의 통합에 의해 태깅된다. 게놈 DNA에서 dsODN 통합 부위를 비편향 증폭 및 심층 NGS를 사용하여 뉴클레오타이드 수준에서 정확하게 맵핑한다. 게놈 DNA 초음파 처리 및 일련의 어댑터 결찰 후, 올리고뉴클레오타이드-포함 라이브러리에 고속대량 DNA 서열분석을 수행하고 출력물을 디폴트 가이드-seq 소프트웨어로 처리하여 올리고뉴클레오타이드 캡처 부위를 확인한다.

OMNI-103 뉴클레아제의 특이성을 평가하기 위해, PDCD1 S40 및 TRAC S35 부위를 사용하여 인간 U2OS 세포의 게놈에 걸쳐 표적외 절단의 비편향 조사를 생성하기 위해 가이드-seq를 사용하였다(표 6).

100 uM 뉴클레아제를 120 uM의 합성 가이드 및 100 uM Cas9 전기천공 인핸서(IDT)와 혼합함으로써 RNP를 회합하였다. 실온에서 10분 인큐베이션 후, RNP 복합체를 100 uM dsODN 및 200,000 사전-세척 U2OS 세포와 혼합하였다. 세포를 제조업체의 프로토콜에 따라, DN100과 함께 Lonza SE Cell Line 4D-NucleofectorTM X 키트를 사용하여 전기천공하였다. 72시간 전기천공 후, 세포를 용해시키고, 이의 게놈 DNA 내용물을 추출하였다. 그 다음 PCR에 의해 상응하는 게놈 표적 부위를 증폭시켰다. 앰플리콘에 NGS를 수행한 다음 생성 서열을 사용하여 편집 사건 및 dsODN 통합의 백분율을 계산하였다(도 3a). OMNI-103은 PDCD1 S40 및 TRAC S35 부위에서 어떠한 표적외 효과도 나타내지 않았다(도 3b).

표 1. OMNI 뉴클레아제 서열: 표 1은 OMNI 명칭, 이의 상응하는 뉴클레아제 단백질 서열, 이의 DNA 서열, 이의 인간 최적화된 DNA 서열, 불활성화된 RuvC 도메인을 갖는 닉카제를 생성하기 위해 치환될 대안적인 위치, 불활성화된 HNH 도메인을 갖는 닉카제를 생성하기 위해 치환될 대안적인 위치, 및 불활성화된 RuvC 및 NHN 도메인을 갖는 촉매적으로 사멸된 뉴클레아제를 생성하기 위해 치환될 대안적인 위치를 열거한다. 아스파트산(D)에서 글루탐산(E) 또는 글루탐산(E)에서 아스파트산(D)으로의 치환 이외의 임의의 치환이 불활성화를 초래하는 것을 나타내는 별표가 있는 경우를 제외하고, 임의의 다른 아미노산으로의 치환은 칼럼 5 내지 7에 표시된 아미노산 위치의 각각에 대해 허용 가능하다.

보충 표 1 - OMNI-103 도메인

보충 표 1. OMNI 도메인: 보충 표 1은 OMNI CRISPR 뉴클레아제에 대해 확인된 각각의 도메인의 아미노산 범위를 열거한다. 예를 들어, OMNI-103의 도메인 G는 서열번호 1의 아미노산 728 내지 778에 의해 확인된다. 열거된 아미노산 범위는 스미스-워터맨(Smith-Waterman) 알고리즘을 사용하여 생성된 국소 정렬의 바람직한 분석을 기반으로 하지만, 각각의 도메인 범위의 시작 또는 끝은 최대 5개의 아미노산까지 증가하거나 감소할 수 있다.

표 2(계속) - OMNI 가이드 RNA 및 스캐폴드 RNA 서열

표 4 부록 - 작제물 요소의 상세사항

표 5. 포유동물 세포의 내인성 맥락에서 뉴클레아제 활성: sgRNA 발현 플라스미드와 함께 DNA 형질감염에 의해 포유동물 세포 시스템(HeLa)에서 OMNI-103 뉴클레아제를 발현시켰다. 부위 특이적 게놈 DNA 증폭 및 NGS에 세포 용해물을 사용하였다. 삽입결실의 백분율을 측정하고 분석하여 편집 수준을 결정하였다.

표 7. OMNI-103 RNP를 합성 sgRNA(Agilent)와 회합하고 U2OS 세포에 전기청공하였다. NGS로 측정되는 편집 수준(삽입결실%) 다음에 유전자 명칭, 스페이서 서열, 및 스페이서 길이가 나타나 있다.

표 8. TRAC 또는 B2M을 표적화하는 특정 합성 sgRNA 분자(Agilent)로 OMNI-103을 전기천공한 3일 후, 1차 T 세포에서 TCR 및 B2M의 단백질 발현 수준.

실시예 2: 대안적인 OMNI-103 CRISPR 뉴클레아제-RNA 복합체

방법

OMNI-103 단백질 발현

간략하게, 그리고 상기 기재된 단백질 발현 방법과 유사하게, 뉴클레아제 오픈 리딩 프레임을 인간 세포에 대해 코돈 최적화하고, SV40 NLS - OMNI-103 ORF(인간 최적화된 2번째 아미노산으로부터) - HA 태그 - SV40 NLS - 8 His-태그의 요소와 함께 변형된 pET9a 플라스미드 내로 클로닝하였다. 이 서열은 표 4에서 확인할 수 있다. KRX 세포(Promega)에서 OMNI-103 작제물을 발현시켰다. 6.66mM 람노스(0.5M 스톡, 26.4 ㎖), 및 0.05% 글루코스(0.5M, 2 ㎖)를 첨가한 TB + 0.4% 글리세롤에서 세포를 성장시켰다. 온도를 20℃까지 낮추고 4시간 동안 중간 대수기에서 단백질을 발현시켰다. 화학적 용해를 사용하여 세포를 용해시키고 정화시킨 용해물을 Ni-NTA 수지 상에서 정제하였다. Ni-NTA 용리 분획을 CEX(SO3 fractogel) 수지 상에서 정제한 후, Superdex 200 Increase 10/300 GL, AKTA Pure(GE Healthcare Life Sciences) 상에서 SEC 정제를 수행하였다. OMNI-103 단백질을 포함하는 분획을 풀링하고 30 ㎎/㎖ 스톡으로 농축시킨 다음 액체 질소에서 급속 동결하고 -80℃에서 보관하였다.

사용된 합성 sgRNA

OMNI-103의 모든 합성 sgRNA를 3' 및 5' 말단에서 3개의 2'-O-메틸 3'-포스포로티오에이트와 함께 합성하였다(Agilent 또는 Synthego).

포유동물 세포주에서의 활성

더 짧은 sgRNA 버전으로 편집을 촉진시키는 OMNI-103의 능력을 인간 세포에서 특정 게놈 위치에서 테스트하였다(표 10). HeLa 세포의 경우, OMNI-103-P2A-mCherry 발현 벡터(pmOMNI, 표 4)를 sgRNA(pShuttle 가이드 - 표 4, 스페이서 서열 - 표 10)와 함께 형질감염시켰다.

U2OS 세포의 경우, 100 uM 뉴클레아제를 120 uM의 합성 가이드 및 100 uM Cas9 전기천공 인핸서(IDT)와 혼합함으로써 RNP를 회합하였다. 실온에서 10분 인큐베이션 후, RNP 복합체를 200,000 사전-세척 U2OS 세포와 혼합하고 제조업체의 프로토콜에 따라, DN100 프로그램과 함께 Lonza SE Cell Line 4D-Nucleofector™ X 키트를 사용하여 전기천공하였다. 72시간째에 세포를 용해시키고, 이의 게놈 DNA 내용물을 상응하는 추정 게놈 표적을 증폭시키는 PCR 반응에서 사용하였다. 앰플리콘에 NGS를 수행한 다음 생성 서열을 사용하여 편집 사건의 백분율을 계산하였다.

T 세포의 경우, 113 uM 뉴클레아제 및 160 uM의 합성 가이드를 혼합하고 실온에서 10분 동안 인큐베이션함으로써 RNP를 회합하고, RNP 복합체를 200,000 1차 활성화 T 세포와 혼합한 다음, EH-115 펄스 코드로 P3 Primary Cell 4D-Nucleofector TM X 키트를 사용하여 전기천공하였다. 삼(3)일 및 팔(8)일 후 세포를 수집하고, CD3 및 편집된 단백질 발현을 유세포 분석으로 측정하였다.

결과

게놈 부위 및 세포 유형에 걸친 짧은 가이드의 활성

더 짧은 sgRNA 스캐폴드와 함께 사용하기 위해 OMNI-103 뉴클레아제 활성을 최적화하였다. 테트라 루프 "GAAA" 및 종결자 영역 주위에 최대 4개의 결실을 포함하는 'V2' 이중나선 버전에 기반하여 다섯(5) 개 짧은 sgRNA 스캐폴드를 설계하였다(표 9, 도 6a 내지 도 6f). 설계된 V2 스패폴드로 표시되는 OMNI-103의 활성 수준을 테스트하기 위해, "TRAC-s91" 또는 "PDCD-s40"의 가이드 서열 부분을 갖는 sgRNA를 HeLa 세포로 형질감염시켰다. 편집 활성을 NGS 결과를 기반으로 계산하였다(도 7). 모든 경우에, 설계된 sgRNA는 편집 활성을 가능하게 하였다. 다음 단계는 U2OS 및 1차 T 세포에서 RNP로서 OMNI-103 활성을 테스트하는 것이었다. OMNI-103을 V2, V2.2 또는 V2.3 스캐폴드를 갖고 "TRAC-s35" 또는 "B2M-s12"의 가이드 서열 부분을 갖는 sgRNA로 전기천공하였다. 편집 활성을 NGS 결과를 기반으로 계산하였고, 입증된 바와 같이 OMNI-103 활성 수준은 스캐폴드 변이체 중 임의의 것과 함께 사용될 때 손상되지 않았다(도 8). 1차 T 세포에서, 짧은 스캐폴드 변이체를 이용할 때, 개선된 활성이 입증되었다.

표 9(계속) - OMNI-103 설계 스캐폴드 서열

참고문헌

SEQUENCE LISTING <110> EmendoBio Inc. <120> OMNI-103 CRISPR NUCLEASE <130> 91677-A-PCT/GJG/AWG <150> 63/286,855 <151> 2021-12-09 <150> 63/214,506 <151> 2021-06-24 <150> 63/147,166 <151> 2021-02-08 <160> 135 <170> PatentIn version 3.5 <210> 1 <211> 1348 <212> PRT <213> Unknown <220> <223> OMNI-103 <400> 1 Met Ser Ile Lys Ser Asp Tyr Phe Leu Gly Leu Asp Ile Gly Thr Asp 1 5 10 15 Ser Ile Gly Trp Ala Val Thr Asp Pro Glu Tyr His Ile Leu Arg Arg 20 25 30 Lys Gly Lys Ala Leu Trp Gly Ile Arg Leu Phe Asp Ala Ala Asn Thr 35 40 45 Ala Ala Glu Arg Arg Thr Phe Arg Thr Ser Arg Arg Arg Ile Gln Arg 50 55 60 Arg Arg Gln Arg Ile Arg Leu Leu Gln Glu Leu Phe Ala Glu Glu Met 65 70 75 80 Val Lys Leu Asp Pro Gly Phe Phe Gln Arg Leu Ser Asp Ser Ala Phe 85 90 95 Trp Gln Glu Asp Lys Gln Glu Gln Gln Ile Tyr Ser Leu Phe Thr Cys 100 105 110 Glu Asn Tyr Thr Asp Val Asp Tyr Tyr Arg Glu Tyr Pro Thr Ile Tyr 115 120 125 His Leu Arg Ser Ala Leu Ile Gln Glu Lys Lys Glu Phe Asp Leu Arg 130 135 140 Leu Leu Tyr Leu Ala Leu His His Leu Met Lys His Arg Gly His Phe 145 150 155 160 Leu Phe Asn Gly Ser Ile Asn Asn Val Thr Ser Phe His Thr Thr Phe 165 170 175 Gln Thr Phe Ala Asp Cys Leu Tyr Asp Glu Phe Asp Ile Glu Leu Glu 180 185 190 Cys Asp Ser Glu Asp Arg Phe Ala Glu Ile Leu Lys Asp Lys His Ala 195 200 205 Arg Lys Thr Gly Lys Cys Ser Glu Leu Glu Ile Ile Cys His Ile Glu 210 215 220 Lys Ser Asn Lys Gln Leu Lys Glu Leu Phe Lys Leu Ile Thr Gly Met 225 230 235 240 Lys Ala Ser Leu Ser Val Val Phe Gly Asp Asp Glu Leu Ala Glu Ile 245 250 255 Glu His Asn Lys Ile Ser Phe Ser Glu Ser Ser Tyr Asp Glu Val Arg 260 265 270 Leu Ala Leu Glu Asp Glu Ile Gln Glu Arg Thr Gly Ile Leu Asp Ile 275 280 285 Phe His Ala Val Tyr Ser Trp Ala Ile Leu Ala Asp Ile Leu Glu Gly 290 295 300 Gly Glu Tyr Glu Gly Asn Ser Tyr Leu Ser Val Ala Lys Val Ser Thr 305 310 315 320 Tyr Lys Lys His Gly Asp Asp Leu Arg Leu Leu Arg Thr Leu Val Arg 325 330 335 Glu Tyr Cys Pro Asp His Tyr Lys Ser Phe Phe Ser Val Ser Gly Lys 340 345 350 Glu Asn Tyr Cys Ala Tyr Ala Gly Thr Leu Lys Lys Asn Gly Lys Lys 355 360 365 Gln Pro Ile Lys Arg Cys Ser Gln Glu Asp Phe Tyr Lys Ala Leu Lys 370 375 380 Lys Leu Leu Asn Gln Met Pro Thr Glu Gln Pro Glu Val Lys Asp Ile 385 390 395 400 Phe Ile Glu Ile Glu Asn Gly Thr Phe Leu Pro Leu Gln Val Ser Lys 405 410 415 Asp Asn Gly Val Ile Pro Tyr Gln Val Asn Lys Met Glu Leu Glu Lys 420 425 430 Ile Leu Gln Asn Ala Glu Glu Tyr Leu Pro Phe Leu Lys Asn Ile Asp 435 440 445 Glu Glu Cys Gly Lys Thr Val Ser Lys Lys Ile Ile Asp Leu Phe Glu 450 455 460 Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Asn Thr Ala Lys Gly Glu 465 470 475 480 Asn Cys Trp Met Val Arg Lys Glu Ala Gly Arg Ile Tyr Pro Trp Asn 485 490 495 Phe Asp Glu Lys Val Asp Arg Asp Gln Ser Ala Glu Lys Phe Ile Arg 500 505 510 Arg Met Thr Asn Gln Cys Thr Tyr Leu Ile His Glu Asp Val Val Pro 515 520 525 Lys Asn Ser Leu Leu Tyr Ser Glu Phe Met Val Leu Asn Glu Leu Asn 530 535 540 Asn Val Lys Ile Arg Ser Glu Lys Leu Pro Val Glu Leu Lys Gln Ala 545 550 555 560 Ile Val Leu Asp Leu Phe Lys Lys Gln Lys Gln Ile Thr Gly Lys Lys 565 570 575 Leu Leu Asn Tyr Leu Asn Ala Asn Gly Tyr Asp Val Lys Lys Glu Asp 580 585 590 Leu Ser Gly Phe Asp Gly Asn Phe Lys Ser Ser Leu Ser Ser Tyr Leu 595 600 605 Thr Leu Lys Lys Val Phe Gly Glu Glu Leu Asp Lys Tyr Ser Val Gln 610 615 620 Gln Met Ala Glu Asp Ile Ile Leu Trp Ile Thr Leu Tyr Gly Asp Asp 625 630 635 640 Gln Lys Met Leu Arg Arg Val Ile Arg Lys His Tyr Glu Gln Gln Leu 645 650 655 Ser Glu Glu Gln Ile Leu Ser Leu Ser Lys Leu Lys Phe Gln Gly Trp 660 665 670 Gly Arg Leu Ser Arg Arg Leu Leu Ser Glu Met Glu Gly Val Asp Cys 675 680 685 Glu Thr Gly Glu Cys Met Thr Val Met Gln Gly Leu Arg Asn Thr Gln 690 695 700 Asn Asn Leu Met Gln Leu Leu Ser Gln Gln Phe Ser Phe Met Glu Leu 705 710 715 720 Ile Glu Glu Glu Asn Gly Asn Tyr Tyr Val Asp Glu Ile Thr Tyr Asp 725 730 735 Asn Leu Val Lys Asp Met Val Ile Ser Pro Ser Val Lys Arg Ala Val 740 745 750 Trp Gln Thr Val Gln Ile Val Glu Glu Ile Lys Gly Val Met Gly Cys 755 760 765 Gln Pro Lys Lys Ile Phe Val Glu Met Ala Arg Ser Asp Glu Glu Lys 770 775 780 Lys Arg Thr Val Ser Arg Lys Asp Arg Leu Leu Glu Ala Tyr Asp Ala 785 790 795 800 Ile Lys Asp Glu Ala Arg Gln Trp Gln Glu Glu Leu Gln Lys Tyr Ser 805 810 815 Asp Gly Asp Phe Lys Ala Ile Lys Leu Tyr Leu Tyr Tyr Thr Gln Met 820 825 830 Gly Gln Cys Met Tyr Thr Gly Arg Lys Ile Asp Leu Ser Gln Leu Asn 835 840 845 Asp Ala Thr Val Trp Asp Arg Asp His Ile Tyr Pro Gln Ser Lys Thr 850 855 860 Lys Asp Asp Ser Leu Asp Asn Leu Val Leu Val Asp Arg Ser Val Asn 865 870 875 880 Ala Lys Lys Ser Asp Gly Met Leu Ser Pro Glu Ile Gln Gln Arg Met 885 890 895 Arg Ala Thr Trp Lys Tyr Leu Lys Glu Lys Lys Leu Ile Ser Glu Lys 900 905 910 Lys Tyr Glu Arg Leu Thr Arg Val Ser Pro Leu Thr Asp Glu Glu Leu 915 920 925 Ala Gly Phe Ile Asn Arg Gln Leu Val Glu Thr Arg Gln Ser Ser Lys 930 935 940 Ala Val Ala Thr Leu Leu Lys Arg Val Tyr Asp Glu Ala Glu Ile Val 945 950 955 960 Tyr Val Lys Ala Glu Ala Val Ser Asn Phe Arg Arg Asp Asn Leu Asp 965 970 975 Tyr Ile Lys Val Arg Asp Leu Asn Asp Tyr His His Ala Lys Asp Ala 980 985 990 Tyr Gln Asn Ile Val Val Gly Asn Val Phe His Glu Lys Phe Thr Ser 995 1000 1005 Asn Pro Leu Arg Trp Leu Lys Asn Asn Pro Asn Thr Lys Tyr Ser 1010 1015 1020 Leu Asn Gln Met Phe Asn Phe Asp Leu Glu Lys Asn Gly Val Val 1025 1030 1035 Ile Trp Lys Arg Gly Lys Ala Gly Ser Ile Lys Cys Val Glu Glu 1040 1045 1050 Thr Leu Lys Arg Asn Asp Ile Leu Phe Thr Arg Tyr Ala Phe Cys 1055 1060 1065 Asn Lys Gly Gly Phe Phe Asn Gln Met Leu Thr Ala Ala Pro Glu 1070 1075 1080 Asp Lys Thr Lys Ala Lys Gly Leu Val Pro Ile Lys Lys Gly Met 1085 1090 1095 Glu Thr Trp Lys Tyr Gly Gly Tyr Thr Ser Val Thr Pro Ser His 1100 1105 1110 Phe Met Leu Val Ala Ser Lys Asp Lys Lys Gly Lys Glu Ile Arg 1115 1120 1125 Thr Ile Glu Thr Val Pro Leu Tyr Arg Trp Lys Glu Phe Lys Glu 1130 1135 1140 Asn Pro Asp Ala Leu Leu Gln Tyr Cys Arg Glu Phe Tyr Gly Leu 1145 1150 1155 Lys Glu Pro Lys Val Leu Ile Pro Cys Ile Lys Lys Asn Ala Arg 1160 1165 1170 Leu Val Val Asn Gly Phe Pro Met His Leu Lys Gly Ser Thr Gly 1175 1180 1185 Lys Gln Leu Ile Leu Gln Gly Ala Val Gln Leu Cys Leu Asn Asn 1190 1195 1200 Glu Asn Ile Lys Tyr Leu Lys Lys Val Thr Lys Tyr Leu Glu Tyr 1205 1210 1215 Asn Ala Gln Arg Arg Asp Lys Arg Thr Leu Leu Glu Val Arg Glu 1220 1225 1230 Val Thr Gly Ile Asn Lys Glu Glu Asn Ile Gln Leu Tyr Asp Val 1235 1240 1245 Phe Val Asp Lys Leu Ser Asn Thr Ile Tyr Gln Tyr Arg Pro Ala 1250 1255 1260 Asn Pro Lys Asp Asn Leu Ile Lys Gly Arg Glu Lys Phe Ile Glu 1265 1270 1275 Leu Gly Leu Ala Glu Gln Cys Val Val Leu Gly Glu Val Leu His 1280 1285 1290 Leu Phe Gln Cys Lys Pro Leu Thr Ser Asp Leu Thr Leu Ile Gly 1295 1300 1305 Gly Ser Pro Asn Thr Gly Thr Ile Lys Ile Thr Lys Thr Ile Ser 1310 1315 1320 Asn Cys Asn Val Val Lys Leu Leu Ser Gln Ser Ile Ala Gly Val 1325 1330 1335 Lys Val Arg Glu Ile Asn Leu Leu Ile Ile 1340 1345 <210> 2 <211> 4047 <212> DNA <213> Unknown <220> <223> OMNI-103 <400> 2 atgagcataa aaagtgatta ttttttagga cttgatattg gtacggattc tattggatgg 60 gcggtaaccg acccagaata tcacatattg agacgaaaag gtaaagcatt atggggaata 120 agattatttg atgcggccaa tacagcggca gaacggcgaa catttaggac aagccgaaga 180 aggattcaga gaagacgaca gagaattcgg ttattgcaag aattatttgc agaagaaatg 240 gtaaaattag acccaggatt ttttcagagg ttgtcagaca gcgcattttg gcaggaggat 300 aagcaagagc agcaaattta ttcacttttt acttgtgaaa attatacaga tgttgattat 360 tacagagaat atcctactat ttatcatttg agaagtgcat tgattcagga aaagaaggaa 420 tttgatcttc gtcttctata tcttgctctt caccatttga tgaagcacag gggacatttc 480 ctgtttaatg ggagtattaa taatgtgacg tcatttcata cgacgtttca gacgtttgca 540 gattgtcttt atgatgagtt tgatatagaa ctggaatgtg attccgaaga tagatttgca 600 gaaattttaa aggataaaca tgccagaaaa acaggaaaat gttctgaatt agagataatc 660 tgtcatatag aaaaatcaaa taagcagcta aaagaacttt ttaaattaat tacaggaatg 720 aaagctagtt tgagtgttgt gtttggtgat gatgagttag cggaaataga acataataag 780 attagttttt cagagagtag ttatgatgaa gtacgtcttg cattggagga tgagattcag 840 gagaggactg gtatactgga tatctttcat gcagtttata gttgggcgat tctcgcggat 900 attttagaag gcggagaata tgaggggaat tcttatctaa gcgttgcgaa ggtaagcact 960 tataaaaagc atggtgatga tttgcggttg ctaagaacac tggttcggga atattgtcct 1020 gatcattaca aatctttctt ttccgtatca gggaaggaga attattgtgc atatgcgggt 1080 actttaaaaa agaatggaaa aaaacagccg attaaacgtt gcagccagga agatttttat 1140 aaagcgttaa agaaattgct gaatcagatg ccgacagaac aaccagaagt gaaagacatc 1200 ttcatcgaaa ttgaaaatgg tacttttttg ccgttgcagg taagtaagga taatggagtg 1260 ataccttatc aggtaaataa gatggaatta gaaaaaatcc tgcagaatgc agaggaatat 1320 ttgccatttc taaaaaatat agatgaagaa tgtggaaaaa cggttagtaa gaagattata 1380 gatctctttg agtttagaat accatattat gtagggccgc ttaataccgc taaaggagaa 1440 aactgttgga tggtcagaaa agaagcgggg agaatatatc cgtggaattt tgatgaaaag 1500 gtagacagag atcaatcagc agaaaaattt atccgtagaa tgacgaatca gtgtacatat 1560 ttaatacatg aggatgttgt acctaaaaat tctttgcttt attcggagtt tatggtgctt 1620 aatgaattaa ataatgtaaa gatccggtct gagaagctgc cggtggagtt aaaacaggca 1680 atagtattgg atttgtttaa gaaacaaaag cagataacag gaaaaaaact tcttaattac 1740 ttgaatgcaa atggatatga tgtaaaaaaa gaagatttgt cagggtttga cggaaacttt 1800 aaatcatctc tgtcatcata tcttactttg aaaaaagtat ttggtgaaga attagataaa 1860 tatagtgtgc agcagatggc agaggatatt atcttgtgga tcactctgta tggagatgat 1920 cagaagatgt tgcgcagggt aattcgaaaa cattatgaac agcaattgag tgaagaacag 1980 attctttcct tatcgaaatt gaaattccaa ggctggggaa gattatccag acgacttttg 2040 agtgaaatgg aaggcgttga ttgtgagact ggtgagtgta tgacggtcat gcaaggactt 2100 cgtaatactc agaataatct gatgcagctt ctaagtcagc agttttcatt tatggaattg 2160 attgaggaag aaaatgggaa ttattatgta gatgagatta catacgataa tcttgtgaaa 2220 gatatggtta tatctccgtc agtgaagaga gcagtctggc agacagttca gattgtggag 2280 gagattaagg gggtaatggg ctgtcagcct aagaagatat ttgtcgagat ggcgcgaagc 2340 gatgaagaga aaaagcgtac tgtatctagg aaagacaggt tattagaagc atatgatgcg 2400 atcaaggatg aggctcgtca atggcaggaa gagttgcaaa agtattcaga tggtgatttt 2460 aaggctatta aactttatct gtattatacg cagatggggc aatgtatgta tactggaaga 2520 aagatagatc tgtcacaatt aaatgatgcg acggtatggg acagagatca tatatatcca 2580 cagtccaaaa caaaagatga tagtctggat aatctggtat tggtagaccg gagcgtgaac 2640 gctaagaaaa gtgatgggat gctatcacct gagattcagc agagaatgcg ggctacttgg 2700 aaatacttaa aagagaaaaa gttgatttca gagaagaaat atgagcgttt gactagggtc 2760 tcaccactta cagatgagga attggcaggt tttattaatc gacagttagt tgaaacacgt 2820 cagtcttcga aagcagtagc aacacttttg aaacgagtat atgatgaagc ggagattgtc 2880 tatgtaaaag cggaagctgt ttcaaatttt agaagagata atttggatta tattaaggtg 2940 cgtgatctga atgattatca tcatgctaaa gatgcatatc agaatattgt agtggggaat 3000 gtttttcatg agaaatttac cagcaatccg cttcgttggc tgaaaaacaa tcctaatacg 3060 aaatatagtt taaatcagat gtttaacttt gatttagaga aaaatggggt ggtaatatgg 3120 aaaaggggga aggctggaag tattaaatgt gttgaagaaa cattgaaaag aaatgatatt 3180 ctttttacac gatatgcttt ttgtaataaa ggtggttttt ttaaccagat gttaacggca 3240 gctccagaag ataaaacgaa agcaaaggga cttgtaccaa taaaaaaagg tatggaaaca 3300 tggaaatacg ggggatatac atcagtaact ccgtcacatt ttatgttggt tgcttcgaaa 3360 gataagaaag gaaaggagat aagaacgatt gagacagttc cgttgtatag gtggaaagag 3420 ttcaaagaaa atccagatgc attactccaa tattgtagag agttctatgg tttgaaagag 3480 cccaaggtgt tgataccatg catcaagaag aatgccagat tagtcgttaa tggatttcca 3540 atgcatttga aagggagtac aggaaaacaa ttgattttgc agggagcggt tcaattatgt 3600 ctgaataatg aaaatataaa gtatttgaaa aaagtcacaa aatatttgga atataatgca 3660 cagagaagag ataaaagaac actgctggaa gtaagagagg ttacaggaat taacaaagag 3720 gaaaatatac agttatatga tgtgtttgtt gataaattga gtaacacaat atatcagtat 3780 cgtccggcca atccaaagga caatcttata aaaggaagag agaagtttat agaattaggg 3840 ttggcagaac aatgtgttgt gttaggtgaa gtattgcatt tgttccaatg taaaccactc 3900 acgtctgatt tgactttgat tggaggttca ccgaatacag ggacaataaa aataacaaag 3960 acaattagta attgtaatgt tgtaaagttg ttaagccaat ctattgcagg tgttaaagtg 4020 agagaaatta atttgttaat aatatga 4047 <210> 3 <211> 4047 <212> DNA <213> Artificial Sequence <220> <223> OMNI-103 human optimized DNA sequence <400> 3 atgtctatca agagcgacta cttcctgggc ctcgacatcg gcacagattc tatcggatgg 60 gccgtgacag accccgagta ccacatcctg agaagaaagg gcaaagccct gtggggcatc 120 agactgttcg atgccgccaa tactgccgcc gagagaagaa ccttccggac cagcagaaga 180 agaatccagc ggcggagaca gcggatcaga ctgctgcaag agctgttcgc cgaggaaatg 240 gttaagctgg accccggctt cttccagaga ctgagcgata gcgccttctg gcaagaggac 300 aagcaagagc agcagatcta cagcctgttt acctgcgaga actacaccga cgtggactac 360 tacagagagt accccaccat ctaccacctg agaagcgccc tgatccaaga gaaaaaagag 420 ttcgacctgc ggctgctgta tctggccctg caccatctga tgaagcaccg gggccacttt 480 ctgttcaacg gcagcatcaa caacgtgacc agcttccaca ccaccttcca gaccttcgcc 540 gactgcctgt acgacgagtt cgacatcgag ctggaatgcg acagcgagga cagattcgcc 600 gagatcctga aggataagca cgccagaaag accggcaagt gctctgagct ggaaatcatc 660 tgccacatcg agaagtccaa caagcagctg aaagaactgt tcaagctgat caccggcatg 720 aaggccagcc tgagcgtggt gtttggagat gatgagctgg ccgagatcga gcacaacaag 780 atcagcttca gcgagagcag ctacgacgaa gtgcggctgg ccctggaaga tgagattcaa 840 gagagaaccg gcatcctgga catcttccac gccgtgtatt cttgggccat cctggccgat 900 attctggaag gcggcgagta cgagggcaac agctatctgt ctgtggccaa ggtgtccacc 960 tacaagaagc acggcgacga cctgagactg ctgagaacac tcgtgcgcga gtactgcccc 1020 gaccactaca agagcttttt cagcgtgtcc ggcaaagaga actactgcgc ctacgccggc 1080 acactgaaga agaacggcaa gaagcagccc atcaagcggt gcagccaaga ggacttctac 1140 aaggccctga agaaactgct gaaccagatg cctaccgagc agcccgaagt gaaggatatc 1200 ttcatcgaga ttgagaacgg caccttcctg cctctgcaag tgtccaagga caacggcgtg 1260 atcccctacc aagtgaacaa gatggaactc gagaagatcc tgcagaacgc cgaagagtac 1320 ctgcctttcc tgaagaacat cgacgaggaa tgcggcaaga ccgtgtccaa gaagatcatc 1380 gacctgttcg agttcagaat cccctactac gtgggccctc tgaataccgc caagggcgag 1440 aattgctgga tggttcgaaa agaggccggc agaatctacc cctggaactt cgatgagaag 1500 gtggacagag atcagagcgc cgagaagttc atcagacgga tgaccaacca gtgcacctac 1560 ctgatccacg aggacgtggt gcctaagaac agcctgctgt actccgagtt catggtgctg 1620 aacgagctga acaatgtgaa gattcggagc gagaagctgc ccgtggaact gaagcaggcc 1680 atcgtgctgg acctgtttaa gaagcagaag cagatcacag ggaagaagct gctcaactac 1740 ctgaacgcca acggctacga cgtgaagaaa gaggacctga gcggcttcga cggcaacttc 1800 aagtccagcc tgtccagcta cctgactctg aagaaggtgt tcggagagga actggacaag 1860 tacagcgtgc agcagatggc cgaggacatc atcctgtgga tcaccctgta tggcgacgat 1920 cagaaaatgc tgcggagagt gatccggaag cactacgagc agcagctgtc tgaggaacag 1980 atcctgagcc tgagcaagct gaagttccaa ggctggggca gactgtctag acggctgctc 2040 tctgaaatgg aaggcgtgga ctgtgaaacc ggcgagtgca tgacagtgat gcagggcctg 2100 agaaacaccc agaacaacct gatgcagctg ctgagccagc agttcagctt catggaactg 2160 atcgaggaag agaacgggaa ctactacgtc gacgagatca cctacgacaa cctggtcaag 2220 gacatggtca tcagccctag cgtgaaaagg gccgtgtggc agacagtgca gatcgtggaa 2280 gaaatcaagg gcgtgatggg atgccagcct aagaaaatct tcgtggaaat ggcccgcagc 2340 gacgaagaga agaaacggac cgtgtctcgg aaggatcggc tgctggaagc ctacgacgcc 2400 atcaaggatg aggcccggca atggcaagaa gaactgcaga aatactccga cggcgatttc 2460 aaggccatca agctgtacct gtactacacc cagatgggcc agtgcatgta caccggcaga 2520 aaaatcgatc tgtcccagct gaacgacgcc accgtgtggg atagagatca catctaccct 2580 cagagcaaga ccaaggacga cagcctggac aatctggtgc tggtggatag atccgtgaat 2640 gccaagaaaa gcgacggcat gctgagcccc gagatccagc agagaatgag agccacctgg 2700 aagtacctga aagaaaagaa gctcatcagc gagaagaagt acgagcggct gaccagagtg 2760 tcccctctga cagatgaaga actggccggc ttcatcaacc ggcagctggt ggaaacaaga 2820 cagagcagca aagccgtggc cacactgctg aagagggtgt acgatgaggc cgagattgtg 2880 tatgtgaagg ccgaggccgt gtctaacttc cggcgggata acctggacta catcaaagtg 2940 cgggacctga acgactacca ccacgccaag gacgcctacc agaacatcgt cgtgggcaac 3000 gtgttccacg agaagtttac cagcaatccc ctgcggtggc tgaaaaacaa ccccaacacc 3060 aagtactccc tcaaccagat gttcaacttc gacctggaaa agaacggcgt ggtcatctgg 3120 aagagaggca aggccggctc cattaagtgt gtggaagaga cactgaagcg gaacgacatc 3180 ctgttcacca gatacgcttt ctgcaacaaa ggcggcttct ttaatcagat gctgaccgcc 3240 gctccagagg ataagacaaa ggccaaaggc ctggtgccta tcaagaaagg catggaaacc 3300 tggaaatacg gcggctacac cagcgtgacc cctagccact ttatgctggt ggccagcaag 3360 gacaagaagg gaaaagagat ccggaccatc gagacagtgc ccctgtaccg gtggaaagag 3420 ttcaaagaga atcccgacgc tctgctccag tactgcagag agttctacgg cctgaaagag 3480 cccaaggttc tgatcccttg catcaagaag aatgcccggc tggtcgtgaa cggcttccct 3540 atgcacctga agggcagcac cggaaaacag ctgattctgc agggtgccgt gcagctgtgc 3600 ctgaacaacg agaacatcaa gtacctcaag aaagtgacga agtacctcga gtacaacgcc 3660 cagcggagag acaagagaac cctgctcgaa gttcgggaag tgaccggaat caacaaagag 3720 gaaaacatcc agctgtacga tgtgttcgtg gacaagctga gcaacacaat ctaccagtac 3780 agacccgcca atcctaagga caacctcatc aagggccgcg agaaattcat cgagcttggc 3840 ctggctgagc agtgcgtggt gctgggagaa gtgctgcatc tgttccagtg caagcccctg 3900 accagcgatc tgacactgat cggcggaagc cctaacaccg gcaccatcaa gatcaccaag 3960 accatcagca actgcaacgt ggtcaagctg ctgtcccagt ctatcgccgg cgtgaaagtc 4020 cgcgagatca acctgctgat catctga 4047 <210> 4 <211> 17 <212> RNA <213> Artificial Sequence <220> <223> sgRNA 12 crRNA repeat <400> 4 guuugagagu aguguaa 17 <210> 5 <211> 15 <212> RNA <213> Artificial Sequence <220> <223> sgRNA 12 Partial crRNA 1 <400> 5 guuugagagu agugu 15 <210> 6 <211> 12 <212> RNA <213> Artificial Sequence <220> <223> sgRNA 12 Partial crRNA 2 <400> 6 guuugagagu ag 12 <210> 7 <211> 10 <212> RNA <213> Artificial Sequence <220> <223> sgRNA 12 Partial crRNA 3 <400> 7 guuugagagu 10 <210> 8 <211> 19 <212> RNA <213> Artificial Sequence <220> <223> sgRNA 12 tracrRNA antirepeat <400> 8 uuacacuaca aguucaaau 19 <210> 9 <211> 17 <212> RNA <213> Artificial Sequence <220> <223> sgRNA 12 partial tracrRNA 1 <400> 9 acacuacaag uucaaau 17 <210> 10 <211> 14 <212> RNA <213> Artificial Sequence <220> <223> sgRNA 12 partial tracrRNA 2 <400> 10 cuacaaguuc aaau 14 <210> 11 <211> 12 <212> RNA <213> Artificial Sequence <220> <223> sgRNA 12 partial tracrRNA 3 <400> 11 acaaguucaa au 12 <210> 12 <211> 41 <212> RNA <213> Artificial Sequence <220> <223> sgRNA 12 tracrRNA portion 1 <400> 12 aaaaauuuau ucaaauccuu uugcuacauu guguagaauu u 41 <210> 13 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> sgRNA 12 tracrRNA portion 2 <400> 13 aaagaucugg caacagaucu uuuuuu 26 <210> 14 <211> 19 <212> RNA <213> Artificial Sequence <220> <223> sgRNA 12 tracrRNA portion 2 polyT <400> 14 aaagaucugg caacagauc 19 <210> 15 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> sgRNA 12 V1 <400> 15 guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccuu 60 uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuuu 107 <210> 16 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> sgRNA 12 V2 <400> 16 guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60 uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuuu 107 <210> 17 <211> 41 <212> RNA <213> Artificial Sequence <220> <223> sgRNA 12 V2 Modified tracrRNA <400> 17 aaaaauuuau ucaaauccau uugcuacauu guguagaauu u 41 <210> 18 <211> 17 <212> RNA <213> Artificial Sequence <220> <223> sgRNA 32 crRNA repeat <400> 18 guuugagagu aguguaa 17 <210> 19 <211> 15 <212> RNA <213> Artificial Sequence <220> <223> sgRNA 32 Partial crRNA 1 <400> 19 guuugagagu agugu 15 <210> 20 <211> 12 <212> RNA <213> Artificial Sequence <220> <223> sgRNA 32 Partial crRNA 2 <400> 20 guuugagagu ag 12 <210> 21 <211> 10 <212> RNA <213> Artificial Sequence <220> <223> sgRNA 32 Partial crRNA 3 <400> 21 guuugagagu 10 <210> 22 <211> 19 <212> RNA <213> Artificial Sequence <220> <223> sgRNA 32 tracrRNA antirepeat <400> 22 uuacacuaca aguucaaau 19 <210> 23 <211> 17 <212> RNA <213> Artificial Sequence <220> <223> sgRNA 32 Partial tracrRNA 1 <400> 23 acacuacaag uucaaau 17 <210> 24 <211> 14 <212> RNA <213> Artificial Sequence <220> <223> sgRNA 32 Partial tracrRNA 2 <400> 24 cuacaaguuc aaau 14 <210> 25 <211> 12 <212> RNA <213> Artificial Sequence <220> <223> sgRNA 32 Partial tracrRNA 3 <400> 25 acaaguucaa au 12 <210> 26 <211> 41 <212> RNA <213> Artificial Sequence <220> <223> sgRNA 32 tracrRNA portion 1 <400> 26 aaaaauuuau ucaaauccuu uugcuacauu guguagaauu u 41 <210> 27 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> sgRNA 32 tracrRNA portion 2 <400> 27 aaagaucugg caacagaucu uuuuuauuuu uu 32 <210> 28 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> sgRNA 32 tracrRNA portion 2 polyT <400> 28 aaagaucugg caacagaucu uuuuua 26 <210> 29 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> sgRNA 32 V1 <400> 29 guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccuu 60 uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuuauuu uuu 113 <210> 30 <211> 106 <212> RNA <213> Artificial Sequence <220> <223> sgRNA 32 V2 <400> 30 guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccuu 60 uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuu 106 <210> 31 <211> 106 <212> RNA <213> Artificial Sequence <220> <223> sgRNA 32 V3 <400> 31 guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60 uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuu 106 <210> 32 <211> 41 <212> RNA <213> Artificial Sequence <220> <223> sgRNA 32 V3 modified tracrRNA <400> 32 aaaaauuuau ucaaauccau uugcuacauu guguagaauu u 41 <210> 33 <211> 101 <212> RNA <213> Artificial Sequence <220> <223> V2.1 <400> 33 guuugagagu aguggaaaca cuacaaguuc aaauaaaaau uuauucaaau ccauuugcua 60 cauuguguag aauuuaaaga ucuggcaaca gaucuuuuuu u 101 <210> 34 <211> 85 <212> RNA <213> Artificial Sequence <220> <223> V2.2 <400> 34 guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60 uugcuacauu guguagaauu uuuuu 85 <210> 35 <211> 79 <212> RNA <213> Artificial Sequence <220> <223> V2.3 <400> 35 guuugagagu aguggaaaca cuacaaguuc aaauaaaaau uuauucaaau ccauuugcua 60 cauuguguag aauuuuuuu 79 <210> 36 <211> 95 <212> RNA <213> Artificial Sequence <220> <223> V2.4 <400> 36 guuugagagu aguggaaaca cuacaaguuc aaauaaaaau uuauucaaau ccauuugcua 60 cauuguguag aauuuaaaga ugcaaaucuu uuuuu 95 <210> 37 <211> 6373 <212> DNA <213> Artificial Sequence <220> <223> pET9a OMNI-103 <400> 37 taatacgact cactataggg agaccacaac ggtttccctc tagagagaca ataaccctga 60 taatgcttca ataatattga aaaaggaaga gtatgcctaa gaagaagaga aaggtgggta 120 cctctatcaa gagcgactac ttcctgggcc tcgacatcgg cacagattct atcggatggg 180 ccgtgacaga ccccgagtac cacatcctga gaagaaaggg caaagccctg tggggcatca 240 gactgttcga tgccgccaat actgccgccg agagaagaac cttccggacc agcagaagaa 300 gaatccagcg gcggagacag cggatcagac tgctgcaaga gctgttcgcc gaggaaatgg 360 ttaagctgga ccccggcttc ttccagagac tgagcgatag cgccttctgg caagaggaca 420 agcaagagca gcagatctac agcctgttta cctgcgagaa ctacaccgac gtggactact 480 acagagagta ccccaccatc taccacctga gaagcgccct gatccaagag aaaaaagagt 540 tcgacctgcg gctgctgtat ctggccctgc accatctgat gaagcaccgg ggccactttc 600 tgttcaacgg cagcatcaac aacgtgacca gcttccacac caccttccag accttcgccg 660 actgcctgta cgacgagttc gacatcgagc tggaatgcga cagcgaggac agattcgccg 720 agatcctgaa ggataagcac gccagaaaga ccggcaagtg ctctgagctg gaaatcatct 780 gccacatcga gaagtccaac aagcagctga aagaactgtt caagctgatc accggcatga 840 aggccagcct gagcgtggtg tttggagatg atgagctggc cgagatcgag cacaacaaga 900 tcagcttcag cgagagcagc tacgacgaag tgcggctggc cctggaagat gagattcaag 960 agagaaccgg catcctggac atcttccacg ccgtgtattc ttgggccatc ctggccgata 1020 ttctggaagg cggcgagtac gagggcaaca gctatctgtc tgtggccaag gtgtccacct 1080 acaagaagca cggcgacgac ctgagactgc tgagaacact cgtgcgcgag tactgccccg 1140 accactacaa gagctttttc agcgtgtccg gcaaagagaa ctactgcgcc tacgccggca 1200 cactgaagaa gaacggcaag aagcagccca tcaagcggtg cagccaagag gacttctaca 1260 aggccctgaa gaaactgctg aaccagatgc ctaccgagca gcccgaagtg aaggatatct 1320 tcatcgagat tgagaacggc accttcctgc ctctgcaagt gtccaaggac aacggcgtga 1380 tcccctacca agtgaacaag atggaactcg agaagatcct gcagaacgcc gaagagtacc 1440 tgcctttcct gaagaacatc gacgaggaat gcggcaagac cgtgtccaag aagatcatcg 1500 acctgttcga gttcagaatc ccctactacg tgggccctct gaataccgcc aagggcgaga 1560 attgctggat ggttcgaaaa gaggccggca gaatctaccc ctggaacttc gatgagaagg 1620 tggacagaga tcagagcgcc gagaagttca tcagacggat gaccaaccag tgcacctacc 1680 tgatccacga ggacgtggtg cctaagaaca gcctgctgta ctccgagttc atggtgctga 1740 acgagctgaa caatgtgaag attcggagcg agaagctgcc cgtggaactg aagcaggcca 1800 tcgtgctgga cctgtttaag aagcagaagc agatcacagg gaagaagctg ctcaactacc 1860 tgaacgccaa cggctacgac gtgaagaaag aggacctgag cggcttcgac ggcaacttca 1920 agtccagcct gtccagctac ctgactctga agaaggtgtt cggagaggaa ctggacaagt 1980 acagcgtgca gcagatggcc gaggacatca tcctgtggat caccctgtat ggcgacgatc 2040 agaaaatgct gcggagagtg atccggaagc actacgagca gcagctgtct gaggaacaga 2100 tcctgagcct gagcaagctg aagttccaag gctggggcag actgtctaga cggctgctct 2160 ctgaaatgga aggcgtggac tgtgaaaccg gcgagtgcat gacagtgatg cagggcctga 2220 gaaacaccca gaacaacctg atgcagctgc tgagccagca gttcagcttc atggaactga 2280 tcgaggaaga gaacgggaac tactacgtcg acgagatcac ctacgacaac ctggtcaagg 2340 acatggtcat cagccctagc gtgaaaaggg ccgtgtggca gacagtgcag atcgtggaag 2400 aaatcaaggg cgtgatggga tgccagccta agaaaatctt cgtggaaatg gcccgcagcg 2460 acgaagagaa gaaacggacc gtgtctcgga aggatcggct gctggaagcc tacgacgcca 2520 tcaaggatga ggcccggcaa tggcaagaag aactgcagaa atactccgac ggcgatttca 2580 aggccatcaa gctgtacctg tactacaccc agatgggcca gtgcatgtac accggcagaa 2640 aaatcgatct gtcccagctg aacgacgcca ccgtgtggga tagagatcac atctaccctc 2700 agagcaagac caaggacgac agcctggaca atctggtgct ggtggataga tccgtgaatg 2760 ccaagaaaag cgacggcatg ctgagccccg agatccagca gagaatgaga gccacctgga 2820 agtacctgaa agaaaagaag ctcatcagcg agaagaagta cgagcggctg accagagtgt 2880 cccctctgac agatgaagaa ctggccggct tcatcaaccg gcagctggtg gaaacaagac 2940 agagcagcaa agccgtggcc acactgctga agagggtgta cgatgaggcc gagattgtgt 3000 atgtgaaggc cgaggccgtg tctaacttcc ggcgggataa cctggactac atcaaagtgc 3060 gggacctgaa cgactaccac cacgccaagg acgcctacca gaacatcgtc gtgggcaacg 3120 tgttccacga gaagtttacc agcaatcccc tgcggtggct gaaaaacaac cccaacacca 3180 agtactccct caaccagatg ttcaacttcg acctggaaaa gaacggcgtg gtcatctgga 3240 agagaggcaa ggccggctcc attaagtgtg tggaagagac actgaagcgg aacgacatcc 3300 tgttcaccag atacgctttc tgcaacaaag gcggcttctt taatcagatg ctgaccgccg 3360 ctccagagga taagacaaag gccaaaggcc tggtgcctat caagaaaggc atggaaacct 3420 ggaaatacgg cggctacacc agcgtgaccc ctagccactt tatgctggtg gccagcaagg 3480 acaagaaggg aaaagagatc cggaccatcg agacagtgcc cctgtaccgg tggaaagagt 3540 tcaaagagaa tcccgacgct ctgctccagt actgcagaga gttctacggc ctgaaagagc 3600 ccaaggttct gatcccttgc atcaagaaga atgcccggct ggtcgtgaac ggcttcccta 3660 tgcacctgaa gggcagcacc ggaaaacagc tgattctgca gggtgccgtg cagctgtgcc 3720 tgaacaacga gaacatcaag tacctcaaga aagtgacgaa gtacctcgag tacaacgccc 3780 agcggagaga caagagaacc ctgctcgaag ttcgggaagt gaccggaatc aacaaagagg 3840 aaaacatcca gctgtacgat gtgttcgtgg acaagctgag caacacaatc taccagtaca 3900 gacccgccaa tcctaaggac aacctcatca agggccgcga gaaattcatc gagcttggcc 3960 tggctgagca gtgcgtggtg ctgggagaag tgctgcatct gttccagtgc aagcccctga 4020 ccagcgatct gacactgatc ggcggaagcc ctaacaccgg caccatcaag atcaccaaga 4080 ccatcagcaa ctgcaacgtg gtcaagctgc tgtcccagtc tatcgccggc gtgaaagtcc 4140 gcgagatcaa cctgctgatc atcggatcct acccatacga tgttccagat tacgcggccg 4200 ctccaaaaaa gaaaagaaaa gttgcggcta gccatcatca ccatcaccat catcattaag 4260 gctgctaaca aagcccgaaa ggaagctgag ttggctgctg ccaccgctga gcaataacta 4320 gcataacccc ttggggcctc taaacgggtc ttgaggggtt ttttgctgaa aggaggaact 4380 atatccggat atccacagga cgggtgtggt cgccatgatc gcgtagtcga tagtggctcc 4440 aagtagcgaa gcgagcagga ctgggcggcg gccaaagcgg tcggacagtg ctccgagaac 4500 gggtgcgcat agaaattgca tcaacgcata tagcgctagc agcacgccat agtgactggc 4560 gatgctgtcg gaatggacga tatcccgcaa gaggcccggc agtaccggca taaccaagcc 4620 tatgcctaca gcatccaggg tgacggtgcc gaggatgacg atgagcgcat tgttagattt 4680 catacacggt gcctgactgc gttagcaatt taactgtgat aaactaccgc attaaagctt 4740 atcgatgata agctgtcaaa catgagaatt cttagaaaaa ctcatcgagc atcaaatgaa 4800 actgcaattt attcatatca ggattatcaa taccatattt ttgaaaaagc cgtttctgta 4860 atgaaggaga aaactcaccg aggcagttcc ataggatggc aagatcctgg tatcggtctg 4920 cgattccgac tcgtccaaca tcaatacaac ctattaattt cccctcgtca aaaataaggt 4980 tatcaagtga gaaatcacca tgagtgacga ctgaatccgg tgagaatggc aaaagcttat 5040 gcatttcttt ccagacttgt tcaacaggcc agccattacg ctcgtcatca aaatcactcg 5100 catcaaccaa accgttattc attcgtgatt gcgcctgagc gagacgaaat acgcgatcgc 5160 tgttaaaagg acaattacaa acaggaatcg aatgcaaccg gcgcaggaac actgccagcg 5220 catcaacaat attttcacct gaatcaggat attcttctaa tacctggaat gctgttttcc 5280 cggggatcgc agtggtgagt aaccatgcat catcaggagt acggataaaa tgcttgatgg 5340 tcggaagagg cataaattcc gtcagccagt ttagtctgac catctcatct gtaacatcat 5400 tggcaacgct acctttgcca tgtttcagaa acaactctgg cgcatcgggc ttcccataca 5460 atcgatagat tgtcgcacct gattgcccga cattatcgcg agcccattta tacccatata 5520 aatcagcatc catgttggaa tttaatcgcg gcctcgagca agacgtttcc cgttgaatat 5580 ggctcataac accccttgta ttactgttta tgtaagcaga cagttttatt gttcatgacc 5640 aaaatccctt aacgtgagtt ttcgttccac tgagcgtcag accccgtaga aaagatcaaa 5700 ggatcttctt gagatccttt ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca 5760 ccgctaccag cggtggtttg tttgccggat caagagctac caactctttt tccgaaggta 5820 actggcttca gcagagcgca gataccaaat actgtccttc tagtgtagcc gtagttaggc 5880 caccacttca agaactctgt agcaccgcct acatacctcg ctctgctaat cctgttacca 5940 gtggctgctg ccagtggcga taagtcgtgt cttaccgggt tggactcaag acgatagtta 6000 ccggataagg cgcagcggtc gggctgaacg gggggttcgt gcacacagcc cagcttggag 6060 cgaacgacct acaccgaact gagataccta cagcgtgagc tatgagaaag cgccacgctt 6120 cccgaaggga gaaaggcgga caggtatccg gtaagcggca gggtcggaac aggagagcgc 6180 acgagggagc ttccaggggg aaacgcctgg tatctttata gtcctgtcgg gtttcgccac 6240 ctctgacttg agcgtcgatt tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac 6300 gccagcaacg cggccttttt acggttcctg gccttttgct ggccttttgc tcacatgttc 6360 gatcccgcga aat 6373 <210> 38 <211> 2783 <212> DNA <213> Artificial Sequence <220> <223> pShuttle Guide OMNI-103 V2 <400> 38 tacacggtgc ctgactgcgt tagcaattta actgtgataa actaccgcat taaagcttat 60 cgatgataag ctgtcaacac atttccccga aaagtgccac ctgacgtcct cgagtcccgc 120 ataatcgaaa tgagggccta tttcccatga ttccttcata tttgcatata cgatacaagg 180 ctgttagaga gataattaga attaatttga ctgtaaacac aaagatatta gtacaaaata 240 cgtgacgtag aaagtaataa tttcttgggt agtttgcagt tttaaaatta tgttttaaaa 300 tggactatca tatgcttacc gtaacttgaa agtatttcga tttcttggct ttatatatct 360 tgctaatacg actcactata ggaagagcag agccttggtc tcgtttgaga gtagtgtaag 420 aaattacact acaagttcaa ataaaaattt attcaaatcc atttgctaca ttgtgtagaa 480 tttaaagatc tggcaacaga tctttttttg aattctctag cataacccct tggggcctct 540 aaacgggtct tgaggggttt tttgacctag gctaggggat atattccggg taccccgctt 600 cctcgctcac tgactcgcta cgctcggtcg ttcgactgcg gcgagcggaa atggcttacg 660 aacggggcgg agatttcctg gaagatgcca ggaagatact taacagggaa gtgagagggc 720 cgcggcaaag ccgtttttcc ataggctccg cccccctgac aagcatcacg aaatctgacg 780 ctcaaatcag tggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg 840 cggctccctc gtgcgctctc ctgttcctgc ctttcggttt accggtgtca ttccgctgtt 900 atggccgcgt ttgtctcatt ccacgcctga cactcagttc cgggtaggca gttcgctcca 960 agctggactg tatgcacgaa ccccccgttc agtccgaccg ctgcgcctta tccggtaact 1020 atcgtcttga gtccaacccg gaaagacatg caaaagcacc actggcagca gccactggta 1080 attgatttag aggagttagt cttgaagtca tgcgccggtt aaggctaaac tgaaaggaca 1140 agttttggtg actgcgctcc tccaagccag ttacctcggt tcaaagagtt ggtagctcag 1200 agaaccttcg aaaaaccgcc ctgcaaggcg gttttttcgt tttcagagca agagattacg 1260 cgcagaccaa aacgatctca agaagatcat cttattaatc agataaaata tttctagatt 1320 tcagtgcaat ttatctcttc aaatgtagca cctgaagtca gccccatacg atataagttg 1380 ttactagtgc ttggattctc accaataaaa aacgcccggc ggcaaccgag cgttctgaac 1440 aaatccagat ggagttctga ggtcattact ggatctatca acaggagtcc aagcgagaag 1500 ggttggtttg cgcattcaca gttctccgca agaattgatt ggctccaatt cttggagtgg 1560 tgaatccgtt agcgaggtgc cgccggcttc cattcaggtc gaggtggccc ggctccatgc 1620 accgcgacgc aacgcgggga ggcagacaag gtatagggcg gcgcctacaa tccatgccaa 1680 cccgttccat gtgctcgccg aggcggcata aatcgccgtg acgatcagcg gtccaatgat 1740 cgaagttagg ctggtaagag ccgcgagcga tccttgaagc tgtccctgat ggtcgtcatc 1800 tacctgcctg gacagcatgg cctgcaacgc gggcatcccg atgccgccgg aagcgagaag 1860 aatcataatg gggaaggcca tccagcctcg cgtcgcgaac gccagcaaga cgtagcccag 1920 cgcgtcggcc gccatgccgg cgataatggc ctgcttctcg ccgaaacgtt tggtggcggg 1980 accagtgacg aaggcttgag cgagggcgtg caagattccg aataccgcaa gcgacaggcc 2040 gatcatcgtc gcgctccagc gaaagcggtc ctcgccgaaa atgacccaga gcgctgccgg 2100 cacctgtcct acgagttgca tgataaagaa gacagtcata agtgcggcga cgatagtcat 2160 gccccgcgcc caccggaagg agctgactgg gttgaaggct ctcaagggca tcggtcgacg 2220 ctctccctta tgcgactcct gcattaggaa gcagcccagt agtaggttga ggccgttgag 2280 caccgccgcc gcaaggaatg gtgcatgcaa ggagatggcg cccaacagtc ccccggccac 2340 ggggcctgcc accataccca cgccgaaaca agcgctcatg agcccgaagt ggcgagcccg 2400 atcttcccca tcggtgatgt cggcgatata ggcgccagca accgcacctg tggcgccggt 2460 gatgccggcc acgatgcgtc cggcgtagag gatccacagg acgggtgtgg tcgccatgat 2520 cgcgtagtcg atagtggctc caagtagcga agcgagcagg actgggcggc ggccaaagcg 2580 gtcggacagt gctccgagaa cgggtgcgca tagaaattgc atcaacgcat atagcgctag 2640 cagcacgcca tagtgactgg cgatgctgtc ggaatggacg atatcccgca agaggcccgg 2700 cagtaccggc ataaccaagc ctatgcctac agcatccagg gtgacggtgc cgaggatgac 2760 gatgagcgca ttgttagatt tca 2783 <210> 39 <211> 5009 <212> DNA <213> Artificial Sequence <220> <223> pbPOS T2 library <220> <221> misc_feature <222> (3040)..(3047) <223> n is a, c, g, or t <400> 39 tcgagtcttt acactttatg cttccggctc gtatgttgtg tggaattgtg agcggataac 60 aatttcacac atgattacgg attcaacgtc gtgactggta aaacccgggc gttacccaac 120 ttaatcgcct tgcagcacat ccccctttcg ccagcaggcg taataaggaa aggattcatg 180 tactatttga aaaacacaaa cttttggatg ttcggtttat tctttttctt ttactttttt 240 atcatgggag cctacttccc gtttttcccg atttggctac atgatatcaa ccatatcagc 300 aaaagtgata cgggtattat ttttgccgct atttctctgt tctcgctatt attccaaccg 360 ctgtttggtc tgctttctga caaactcggt ctacgcaaat acctgctgtg gattattacc 420 ggcatgttag tgatgtttgc gccgttcttt atttttatct tcgggccact gctgcagtac 480 aacattttag tagggtcgat tgttggtggt atttatctag gctttagttt taacgccggt 540 gcgccagcag tagaggcatt tattgagaaa gtcagccggc gcagtaattt cgaatttggt 600 cgcgcgcgga tgtttggcag tgttggctgg gcgctggttg cctcgattgt cgggatcatg 660 ttcaccatta ataatcagtt tgttttctgg ctgggctctg gcagttgtct catcctcgcc 720 gttttactct ttttcgccaa aacggacgcg ccctcaagtg ccacggttgc caatgcggta 780 ggtgccaacc attcggcatt tagccttaag ctggcactgg aactgttcag acagccaaaa 840 ctgtggtttt tgtcactgta tgttattggc gtttcctcca cctacgatgt ttttgaccaa 900 cagtttgcta atttctttac ttcgttcttt gctaccggtg aacagggtac ccgcgtattt 960 ggctacgtaa cgacaatggg cgaattactt aacgcctcga ttatgttctt tgcgccactg 1020 atcattaatc gcatcggtgg gaagaatgcc ctgctgctgg ctggcactat tatgtctgta 1080 cgtattattg gctcatcgtt cgccacctca gcgctggaag tggttattct gaaaacgctg 1140 catatgtttg aagtaccgtt cctgctggtg ggctccttta aatatattac tagtcagttt 1200 gaagtgcgtt tttcagcgac gatttatctg gtcagtttca gcttctttaa gcaactggcg 1260 atgattttta tgtctgtact ggcgggcaat atgtatgaaa gcataggttt ccaaggcgct 1320 tatctggtgc tgggtctggt ggcgctgggc ttcaccttaa tttccgtgtt cacgcttagc 1380 ggcccgggcc cgctttccct gctgcgtcgt caggtgaatg aagtcgctta aaggcctcga 1440 tgcagctagc atgctaatct gattcgttac caattatgac aacttgacgg ctacatcatt 1500 cactttttct tcacaaccgg cacggaactc gctcgggctg gccccggtgc attttttaaa 1560 tacccgcgag aaatagagtt gatcgtcaaa accaacattg cgaccgacgg tggcgatagg 1620 catccgggtg gtgctcaaaa gcagcttcgc ctggctgata cgttggtcct cgcgccagct 1680 taagacgcta atccctaact gctggcggaa aagatgtgac agacgcgacg gcgacaagca 1740 aacatgctgt gcgacgctgg cgatatcaaa attgctgtct gccaggtgat cgctgatgta 1800 ctgacaagcc tcgcgtaccc gattatccat cggtggatgg agcgactcgt taatcgcttc 1860 catgcgccgc agtaacaatt gctcaagcag atttatcgcc agcagctccg aatagcgccc 1920 ttccccttgc ccggcgttaa tgatttgccc aaacaggtcg ctgaaatgcg gctggtgcgc 1980 ttcatccggg cgaaagaacc ccgtattggc aaatattgac ggccagttaa gccattcatg 2040 ccagtaggcg cgcggacgaa agtaaaccca ctggtgatac cattcgcgag cctccggatg 2100 acgaccgtag tgatgaatct ctcctggcgg gaacagcaaa atatcacccg gtcggcaaac 2160 aaattctcgt ccctgatttt tcaccacccc ctgaccgcga atggtgagat tgagaatata 2220 acctttcatt cccagcggtc ggtcgataaa aaaatcgaga taaccgttgg cctcaatcgg 2280 cgttaaaccc gccaccagat gggcattaaa cgagtatccc ggcagcaggg gatcattttg 2340 cgcttcagcc atacttttca tactcccgcc attcagagaa gaaaccaatt gtccatattg 2400 catcagacat tgccgtcact gcgtctttta ctggctcttc tcgctaacca aaccggtaac 2460 cccgcttatt aaaagcattc tgtaacaaag cgggaccaaa gccatgacaa aaacgcgtaa 2520 caaaagtgtc tataatcacg gcagaaaagt ccacattgat tatttgcacg gcgtcacact 2580 ttgctatgcc atagcatttt tatccataag attagcggat cctacctgac gctttttatc 2640 gcaactctct actgtttctc catacccgtt tttttggggt agcgattgaa aacgatgcag 2700 tttaaggttt acacctataa aagagagagc cgttatcgtc tgtttgtgga tgtacagagt 2760 gatattattg acacgcccgg gcgacggatg gtgatccccc tggccagtgc acgtctgctg 2820 tcagataaag tctcccgtga actttacccg gtggtgcata tcggggatga aagctggcgc 2880 atgatgacca ccgatatggc cagtgtgccg gtctccgtta tcggggaaga agtggctgat 2940 ctcagccacc gcgaaaatga catcaaaaac gccattaacc tgatgttttg gggaatataa 3000 tcttctagac atacaatgga agagcagagc cttggtctcn nnnnnnnaag cttgatatcg 3060 aattcctgca gcccggggga tcccatggta cgcgtgctag aggcatcaaa taaaacgaaa 3120 ggctcagtcg aaagactggg cctttcgttt tatctgttgt ttgtcggtga acgctctcct 3180 gagtaggaca aatccgccgc cctagaccta ggcgttcggc tgcggcgagc ggtatcagct 3240 cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 3300 tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 3360 cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 3420 aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 3480 cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 3540 gcgctttctc aatgctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 3600 ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 3660 cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 3720 aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 3780 tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc 3840 ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 3900 tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 3960 ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 4020 actagtgctt ggattctcac caataaaaaa cgcccggcgg caaccgagcg ttctgaacaa 4080 atccagatgg agttctgagg tcattactgg atctatcaac aggagtccaa gcgagctcga 4140 tatcaaatta cgccccgccc tgccactcat cgcagtactg ttgtaattca ttaagcattc 4200 tgccgacatg gaagccatca cagacggcat gatgaacctg aatcgccagc ggcatcagca 4260 ccttgtcgcc ttgcgtataa tatttgccca tggtgaaaac gggggcgaag aagttgtcca 4320 tattggccac gtttaaatca aaactggtga aactcaccca gggattggct gagacgaaaa 4380 acatattctc aataaaccct ttagggaaat aggccaggtt ttcaccgtaa cacgccacat 4440 cttgcgaata tatgtgtaga aactgccgga aatcgtcgtg gtattcactc cagagcgatg 4500 aaaacgtttc agtttgctca tggaaaacgg tgtaacaagg gtgaacacta tcccatatca 4560 ccagctcacc gtctttcatt gccatacgga attccggatg agcattcatc aggcgggcaa 4620 gaatgtgaat aaaggccgga taaaacttgt gcttattttt ctttacggtc tttaaaaagg 4680 ccgtaatatc cagctgaacg gtctggttat aggtacattg agcaactgac tgaaatgcct 4740 caaaatgttc tttacgatgc cattgggata tatcaacggt ggtatatcca gtgatttttt 4800 tctccatttt agcttcctta gctcctgaaa atctcgataa ctcaaaaaat acgcccggta 4860 gtgatcttat ttcattatgg tgaaagttgg aacctcttac gtgccgatca acgtctcatt 4920 ttcgccagat atcgacgtct aagaaaccat tattatcatg acattaacct ataaaaatag 4980 gcgtatcacg aggccctttc gtcttcacc 5009 <210> 40 <211> 10286 <212> DNA <213> Artificial Sequence <220> <223> pmOMNI OMNI-103 <400> 40 gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gctggctagc 900 gtttaaactt aagcttgcca ccatgcctaa gaagaagaga aaggtgggta cctctatcaa 960 gagcgactac ttcctgggcc tcgacatcgg cacagattct atcggatggg ccgtgacaga 1020 ccccgagtac cacatcctga gaagaaaggg caaagccctg tggggcatca gactgttcga 1080 tgccgccaat actgccgccg agagaagaac cttccggacc agcagaagaa gaatccagcg 1140 gcggagacag cggatcagac tgctgcaaga gctgttcgcc gaggaaatgg ttaagctgga 1200 ccccggcttc ttccagagac tgagcgatag cgccttctgg caagaggaca agcaagagca 1260 gcagatctac agcctgttta cctgcgagaa ctacaccgac gtggactact acagagagta 1320 ccccaccatc taccacctga gaagcgccct gatccaagag aaaaaagagt tcgacctgcg 1380 gctgctgtat ctggccctgc accatctgat gaagcaccgg ggccactttc tgttcaacgg 1440 cagcatcaac aacgtgacca gcttccacac caccttccag accttcgccg actgcctgta 1500 cgacgagttc gacatcgagc tggaatgcga cagcgaggac agattcgccg agatcctgaa 1560 ggataagcac gccagaaaga ccggcaagtg ctctgagctg gaaatcatct gccacatcga 1620 gaagtccaac aagcagctga aagaactgtt caagctgatc accggcatga aggccagcct 1680 gagcgtggtg tttggagatg atgagctggc cgagatcgag cacaacaaga tcagcttcag 1740 cgagagcagc tacgacgaag tgcggctggc cctggaagat gagattcaag agagaaccgg 1800 catcctggac atcttccacg ccgtgtattc ttgggccatc ctggccgata ttctggaagg 1860 cggcgagtac gagggcaaca gctatctgtc tgtggccaag gtgtccacct acaagaagca 1920 cggcgacgac ctgagactgc tgagaacact cgtgcgcgag tactgccccg accactacaa 1980 gagctttttc agcgtgtccg gcaaagagaa ctactgcgcc tacgccggca cactgaagaa 2040 gaacggcaag aagcagccca tcaagcggtg cagccaagag gacttctaca aggccctgaa 2100 gaaactgctg aaccagatgc ctaccgagca gcccgaagtg aaggatatct tcatcgagat 2160 tgagaacggc accttcctgc ctctgcaagt gtccaaggac aacggcgtga tcccctacca 2220 agtgaacaag atggaactcg agaagatcct gcagaacgcc gaagagtacc tgcctttcct 2280 gaagaacatc gacgaggaat gcggcaagac cgtgtccaag aagatcatcg acctgttcga 2340 gttcagaatc ccctactacg tgggccctct gaataccgcc aagggcgaga attgctggat 2400 ggttcgaaaa gaggccggca gaatctaccc ctggaacttc gatgagaagg tggacagaga 2460 tcagagcgcc gagaagttca tcagacggat gaccaaccag tgcacctacc tgatccacga 2520 ggacgtggtg cctaagaaca gcctgctgta ctccgagttc atggtgctga acgagctgaa 2580 caatgtgaag attcggagcg agaagctgcc cgtggaactg aagcaggcca tcgtgctgga 2640 cctgtttaag aagcagaagc agatcacagg gaagaagctg ctcaactacc tgaacgccaa 2700 cggctacgac gtgaagaaag aggacctgag cggcttcgac ggcaacttca agtccagcct 2760 gtccagctac ctgactctga agaaggtgtt cggagaggaa ctggacaagt acagcgtgca 2820 gcagatggcc gaggacatca tcctgtggat caccctgtat ggcgacgatc agaaaatgct 2880 gcggagagtg atccggaagc actacgagca gcagctgtct gaggaacaga tcctgagcct 2940 gagcaagctg aagttccaag gctggggcag actgtctaga cggctgctct ctgaaatgga 3000 aggcgtggac tgtgaaaccg gcgagtgcat gacagtgatg cagggcctga gaaacaccca 3060 gaacaacctg atgcagctgc tgagccagca gttcagcttc atggaactga tcgaggaaga 3120 gaacgggaac tactacgtcg acgagatcac ctacgacaac ctggtcaagg acatggtcat 3180 cagccctagc gtgaaaaggg ccgtgtggca gacagtgcag atcgtggaag aaatcaaggg 3240 cgtgatggga tgccagccta agaaaatctt cgtggaaatg gcccgcagcg acgaagagaa 3300 gaaacggacc gtgtctcgga aggatcggct gctggaagcc tacgacgcca tcaaggatga 3360 ggcccggcaa tggcaagaag aactgcagaa atactccgac ggcgatttca aggccatcaa 3420 gctgtacctg tactacaccc agatgggcca gtgcatgtac accggcagaa aaatcgatct 3480 gtcccagctg aacgacgcca ccgtgtggga tagagatcac atctaccctc agagcaagac 3540 caaggacgac agcctggaca atctggtgct ggtggataga tccgtgaatg ccaagaaaag 3600 cgacggcatg ctgagccccg agatccagca gagaatgaga gccacctgga agtacctgaa 3660 agaaaagaag ctcatcagcg agaagaagta cgagcggctg accagagtgt cccctctgac 3720 agatgaagaa ctggccggct tcatcaaccg gcagctggtg gaaacaagac agagcagcaa 3780 agccgtggcc acactgctga agagggtgta cgatgaggcc gagattgtgt atgtgaaggc 3840 cgaggccgtg tctaacttcc ggcgggataa cctggactac atcaaagtgc gggacctgaa 3900 cgactaccac cacgccaagg acgcctacca gaacatcgtc gtgggcaacg tgttccacga 3960 gaagtttacc agcaatcccc tgcggtggct gaaaaacaac cccaacacca agtactccct 4020 caaccagatg ttcaacttcg acctggaaaa gaacggcgtg gtcatctgga agagaggcaa 4080 ggccggctcc attaagtgtg tggaagagac actgaagcgg aacgacatcc tgttcaccag 4140 atacgctttc tgcaacaaag gcggcttctt taatcagatg ctgaccgccg ctccagagga 4200 taagacaaag gccaaaggcc tggtgcctat caagaaaggc atggaaacct ggaaatacgg 4260 cggctacacc agcgtgaccc ctagccactt tatgctggtg gccagcaagg acaagaaggg 4320 aaaagagatc cggaccatcg agacagtgcc cctgtaccgg tggaaagagt tcaaagagaa 4380 tcccgacgct ctgctccagt actgcagaga gttctacggc ctgaaagagc ccaaggttct 4440 gatcccttgc atcaagaaga atgcccggct ggtcgtgaac ggcttcccta tgcacctgaa 4500 gggcagcacc ggaaaacagc tgattctgca gggtgccgtg cagctgtgcc tgaacaacga 4560 gaacatcaag tacctcaaga aagtgacgaa gtacctcgag tacaacgccc agcggagaga 4620 caagagaacc ctgctcgaag ttcgggaagt gaccggaatc aacaaagagg aaaacatcca 4680 gctgtacgat gtgttcgtgg acaagctgag caacacaatc taccagtaca gacccgccaa 4740 tcctaaggac aacctcatca agggccgcga gaaattcatc gagcttggcc tggctgagca 4800 gtgcgtggtg ctgggagaag tgctgcatct gttccagtgc aagcccctga ccagcgatct 4860 gacactgatc ggcggaagcc ctaacaccgg caccatcaag atcaccaaga ccatcagcaa 4920 ctgcaacgtg gtcaagctgc tgtcccagtc tatcgccggc gtgaaagtcc gcgagatcaa 4980 cctgctgatc atcggatcct acccatacga tgttccagat tacgcggccg ctccaaaaaa 5040 gaaaagaaaa gttgaattcg gcggcagcgg cgccaccaac ttcagcctgc tgaagcaggc 5100 cggcgacgtg gaggagaacc ccggccccat ggtgagcaag ggcgaggagg ataacatggc 5160 catcatcaag gagttcatgc gcttcaaggt gcacatggag ggctccgtga acggccacga 5220 gttcgagatc gagggcgagg gcgagggccg cccctacgag ggcacccaga ccgccaagct 5280 gaaggtgacc aagggtggcc ccctgccctt cgcctgggac atcctgtccc ctcagttcat 5340 gtacggctcc aaggcctacg tgaagcaccc cgccgacatc cccgactact tgaagctgtc 5400 cttccccgag ggcttcaagt gggagcgcgt gatgaacttc gaggacggcg gcgtggtgac 5460 cgtgacccag gactcctccc tgcaggacgg cgagttcatc tacaaggtga agctgcgcgg 5520 caccaacttc ccctccgacg gccccgtaat gcagaagaag accatgggct gggaggcctc 5580 ctccgagcgg atgtaccccg aggacggcgc cctgaagggc gagatcaagc agaggctgaa 5640 gctgaaggac ggcggccact acgacgctga ggtcaagacc acctacaagg ccaagaagcc 5700 cgtgcagctg cccggcgcct acaacgtcaa catcaagttg gacatcacct cccacaacga 5760 ggactacacc atcgtggaac agtacgaacg cgccgagggc cgccactcca ccggcggcat 5820 ggacgagctg tacaagtagc tcgagtctag agggcccgtt taaacccgct gatcagcctc 5880 gactgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac 5940 cctggaaggt gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg 6000 tctgagtagg tgtcattcta ttctgggggg tggggtgggg caggacagca agggggagga 6060 ttgggaagac aatagcaggc atgctgggga tgcggtgggc tctatggctt ctgaggcgga 6120 aagaaccagc tggggctcta gggggtatcc ccacgcgccc tgtagcggcg cattaagcgc 6180 ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt gccagcgccc tagcgcccgc 6240 tcctttcgct ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct 6300 aaatcggggg ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa 6360 acttgattag ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc 6420 tttgacgttg gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact 6480 caaccctatc tcggtctatt cttttgattt ataagggatt ttgccgattt cggcctattg 6540 gttaaaaaat gagctgattt aacaaaaatt taacgcgaat taattctgtg gaatgtgtgt 6600 cagttagggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat 6660 ctcaattagt cagcaaccag gtgtggaaag tccccaggct ccccagcagg cagaagtatg 6720 caaagcatgc atctcaatta gtcagcaacc atagtcccgc ccctaactcc gcccatcccg 6780 cccctaactc cgcccagttc cgcccattct ccgccccatg gctgactaat tttttttatt 6840 tatgcagagg ccgaggccgc ctctgcctct gagctattcc agaagtagtg aggaggcttt 6900 tttggaggcc taggcttttg caaaaagctc ccgggagctt gtatatccat tttcggatct 6960 gatcaagaga caggatgagg atcgtttcgc atgattgaac aagatggatt gcacgcaggt 7020 tctccggccg cttgggtgga gaggctattc ggctatgact gggcacaaca gacaatcggc 7080 tgctctgatg ccgccgtgtt ccggctgtca gcgcaggggc gcccggttct ttttgtcaag 7140 accgacctgt ccggtgccct gaatgaactg caggacgagg cagcgcggct atcgtggctg 7200 gccacgacgg gcgttccttg cgcagctgtg ctcgacgttg tcactgaagc gggaagggac 7260 tggctgctat tgggcgaagt gccggggcag gatctcctgt catctcacct tgctcctgcc 7320 gagaaagtat ccatcatggc tgatgcaatg cggcggctgc atacgcttga tccggctacc 7380 tgcccattcg accaccaagc gaaacatcgc atcgagcgag cacgtactcg gatggaagcc 7440 ggtcttgtcg atcaggatga tctggacgaa gagcatcagg ggctcgcgcc agccgaactg 7500 ttcgccaggc tcaaggcgcg catgcccgac ggcgaggatc tcgtcgtgac ccatggcgat 7560 gcctgcttgc cgaatatcat ggtggaaaat ggccgctttt ctggattcat cgactgtggc 7620 cggctgggtg tggcggaccg ctatcaggac atagcgttgg ctacccgtga tattgctgaa 7680 gagcttggcg gcgaatgggc tgaccgcttc ctcgtgcttt acggtatcgc cgctcccgat 7740 tcgcagcgca tcgccttcta tcgccttctt gacgagttct tctgagcggg actctggggt 7800 tcgaaatgac cgaccaagcg acgcccaacc tgccatcacg agatttcgat tccaccgccg 7860 ccttctatga aaggttgggc ttcggaatcg ttttccggga cgccggctgg atgatcctcc 7920 agcgcgggga tctcatgctg gagttcttcg cccaccccaa cttgtttatt gcagcttata 7980 atggttacaa ataaagcaat agcatcacaa atttcacaaa taaagcattt ttttcactgc 8040 attctagttg tggtttgtcc aaactcatca atgtatctta tcatgtctgt ataccgtcga 8100 cctctagcta gagcttggcg taatcatggt catagctgtt tcctgtgtga aattgttatc 8160 cgctcacaat tccacacaac atacgagccg gaagcataaa gtgtaaagcc tggggtgcct 8220 aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 8280 acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 8340 ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 8400 gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 8460 caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 8520 tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 8580 gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 8640 ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 8700 cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 8760 tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 8820 tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 8880 cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 8940 agtggtggcc taactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga 9000 agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 9060 gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 9120 aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 9180 ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 9240 gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 9300 taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 9360 tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 9420 tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 9480 gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 9540 gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 9600 ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 9660 cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 9720 tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 9780 cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 9840 agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 9900 cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 9960 aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 10020 aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 10080 gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 10140 gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 10200 tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 10260 ttccccgaaa agtgccacct gacgtc 10286 <210> 41 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> HA Tag amino acid sequence <400> 41 Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 1 5 <210> 42 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> SV40 NLS amino acid sequence <400> 42 Pro Lys Lys Lys Arg Lys Val 1 5 <210> 43 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> P2A amino acid sequence <400> 43 Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn 1 5 10 15 Pro Gly Pro <210> 44 <211> 236 <212> PRT <213> Artificial Sequence <220> <223> mCherry amino acid sequence <400> 44 Met Val Ser Lys Gly Glu Glu Asp Asn Met Ala Ile Ile Lys Glu Phe 1 5 10 15 Met Arg Phe Lys Val His Met Glu Gly Ser Val Asn Gly His Glu Phe 20 25 30 Glu Ile Glu Gly Glu Gly Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr 35 40 45 Ala Lys Leu Lys Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp 50 55 60 Ile Leu Ser Pro Gln Phe Met Tyr Gly Ser Lys Ala Tyr Val Lys His 65 70 75 80 Pro Ala Asp Ile Pro Asp Tyr Leu Lys Leu Ser Phe Pro Glu Gly Phe 85 90 95 Lys Trp Glu Arg Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val 100 105 110 Thr Gln Asp Ser Ser Leu Gln Asp Gly Glu Phe Ile Tyr Lys Val Lys 115 120 125 Leu Arg Gly Thr Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys 130 135 140 Thr Met Gly Trp Glu Ala Ser Ser Glu Arg Met Tyr Pro Glu Asp Gly 145 150 155 160 Ala Leu Lys Gly Glu Ile Lys Gln Arg Leu Lys Leu Lys Asp Gly Gly 165 170 175 His Tyr Asp Ala Glu Val Lys Thr Thr Tyr Lys Ala Lys Lys Pro Val 180 185 190 Gln Leu Pro Gly Ala Tyr Asn Val Asn Ile Lys Leu Asp Ile Thr Ser 195 200 205 His Asn Glu Asp Tyr Thr Ile Val Glu Gln Tyr Glu Arg Ala Glu Gly 210 215 220 Arg His Ser Thr Gly Gly Met Asp Glu Leu Tyr Lys 225 230 235 <210> 45 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> HA Tag DNA sequence <400> 45 tacccatacg atgttccaga ttacgct 27 <210> 46 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> SV40 NLS DNA sequence <400> 46 ccaaaaaaga aaagaaaagt t 21 <210> 47 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> P2A DNA sequence <400> 47 gccaccaact tcagcctgct gaagcaggcc ggcgacgtgg aggagaaccc cggcccc 57 <210> 48 <211> 711 <212> DNA <213> Artificial Sequence <220> <223> mCherry DNA sequence <400> 48 atggtgagca agggcgagga ggataacatg gccatcatca aggagttcat gcgcttcaag 60 gtgcacatgg agggctccgt gaacggccac gagttcgaga tcgagggcga gggcgagggc 120 cgcccctacg agggcaccca gaccgccaag ctgaaggtga ccaagggtgg ccccctgccc 180 ttcgcctggg acatcctgtc ccctcagttc atgtacggct ccaaggccta cgtgaagcac 240 cccgccgaca tccccgacta cttgaagctg tccttccccg agggcttcaa gtgggagcgc 300 gtgatgaact tcgaggacgg cggcgtggtg accgtgaccc aggactcctc cctgcaggac 360 ggcgagttca tctacaaggt gaagctgcgc ggcaccaact tcccctccga cggccccgta 420 atgcagaaga agaccatggg ctgggaggcc tcctccgagc ggatgtaccc cgaggacggc 480 gccctgaagg gcgagatcaa gcagaggctg aagctgaagg acggcggcca ctacgacgct 540 gaggtcaaga ccacctacaa ggccaagaag cccgtgcagc tgcccggcgc ctacaacgtc 600 aacatcaagt tggacatcac ctcccacaac gaggactaca ccatcgtgga acagtacgaa 660 cgcgccgagg gccgccactc caccggcggc atggacgagc tgtacaagta g 711 <210> 49 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_B2M_s11-ref <400> 49 ggaccagagc gggaggguag ga 22 <210> 50 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_B2M_s12-ref <400> 50 guaugccugc cgugugaacc au 22 <210> 51 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_B2M_S26 -ref <400> 51 ucucucucca uucuucagua ag 22 <210> 52 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_B2M_S27 -ref <400> 52 agaauugaaa aaguggagca uu 22 <210> 53 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_B2M_S40 -ref <400> 53 aagaauguaa gacuuacccc ac 22 <210> 54 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_B2M_S41 -ref <400> 54 ucagcagcuu acaaaagaau gu 22 <210> 55 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_B2M_S48 -ref <400> 55 cgucgcgcug gcgggcauuc cu 22 <210> 56 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_B2M_S49 -ref <400> 56 agacaucucg gcccgaaugc ug 22 <210> 57 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_CXCR4_S35-ref <400> 57 cuggagugaa aacuugaaga cu 22 <210> 58 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_CXCR4_s93-ref <400> 58 gggguucaga caacagugga ag 22 <210> 59 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_ELANE_g114-ref <400> 59 gguguuaugg ucacagcggg ug 22 <210> 60 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_ELANE_g115-alt <400> 60 ugggaauccc auucccgcag cu 22 <210> 61 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_ELANE_g128-ref <400> 61 ugcuccccac ccgcucccag cc 22 <210> 62 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_PDCD1_S40-ref <400> 62 aacacaucgg agagcuucgu gc 22 <210> 63 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_PDCD1_S92-ref <400> 63 gaggaccgca gccagcccgg cc 22 <210> 64 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_SAMD9_g34-ref <400> 64 gccaagaccc uuuaaacaga cc 22 <210> 65 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_SAMD9_g36-ref <400> 65 guaauaccag agugaagauu au 22 <210> 66 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_SAMD9L_g133-alt <400> 66 aggaacaaag agccuuuggu gc 22 <210> 67 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_SAMD9L_g79-alt <400> 67 ugacuucugu cuacgcuaca ga 22 <210> 68 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_SAMD9L_g80-alt <400> 68 gcauucuaga gccuggaauu ua 22 <210> 69 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_SARM1_g42-ref <400> 69 cgcgcggccu gcacacgcgu cu 22 <210> 70 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_SARM1_g43-ref <400> 70 cgccacugcg cgcuggcgcu gg 22 <210> 71 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_SARM1_g44-ref <400> 71 gugucugagc agcagcugcu gg 22 <210> 72 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_SARM1_g45-ref <400> 72 gaugucuuca ucagcuaccg cc 22 <210> 73 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_TRAC_S124 -ref <400> 73 ucucgaccag cuugacauca ca 22 <210> 74 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_TRAC_S141 -ref <400> 74 cuugguuuua cagauacgaa cc 22 <210> 75 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_TRAC_S142 -ref <400> 75 cgucaugagc agauuaaacc cg 22 <210> 76 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_TRAC_S24-ref <400> 76 acugugcuag acaugagguc ua 22 <210> 77 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_TRAC_S35-ref <400> 77 gacccugccg uguaccagcu ga 22 <210> 78 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_TRAC_S36-ref <400> 78 ucaaaaucgg ugaauaggca ga 22 <210> 79 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_TRAC_S58-ref <400> 79 agaacccuga cccugccgug ua 22 <210> 80 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_TRAC_s90-ref <400> 80 uucugaugug uauaucacag ac 22 <210> 81 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_TRAC_S91-ref <400> 81 gcuguggccu ggagcaacaa au 22 <210> 82 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_B2M_S12 spacer <400> 82 guaugccugc cgugugaacc au 22 <210> 83 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_TRAC_S36 spacer <400> 83 ucaaaaucgg ugaauaggca ga 22 <210> 84 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_TRAC_S35 spacer <400> 84 gacccugccg uguaccagcu ga 22 <210> 85 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_PDCD1_S40 25nt spacer <400> 85 uccaacacau cggagagcuu cgugc 25 <210> 86 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_PDCD1_S40 24nt spacer <400> 86 ccaacacauc ggagagcuuc gugc 24 <210> 87 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_PDCD1_S40 23nt spacer <400> 87 caacacaucg gagagcuucg ugc 23 <210> 88 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_PDCD1_S40 22nt spacer <400> 88 aacacaucgg agagcuucgu gc 22 <210> 89 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_PDCD1_S40 21nt spacer <400> 89 acacaucgga gagcuucgug c 21 <210> 90 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_PDCD1_S40 20nt spacer <400> 90 cacaucggag agcuucgugc 20 <210> 91 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_B2M_S12 with sgRNA 12 V2 scaffold <400> 91 guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60 uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuuu 107 <210> 92 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_TRAC_S36 with sgRNA 12 V2 scaffold <400> 92 guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60 uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuuu 107 <210> 93 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_TRAC_S35 with sgRNA 12 V2 scaffold <400> 93 guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60 uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuuu 107 <210> 94 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_PDCD1_S40 25nt with sgRNA 12 V2 scaffold <400> 94 guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60 uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuuu 107 <210> 95 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_PDCD1_S40 24nt with sgRNA 12 V2 scaffold <400> 95 guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60 uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuuu 107 <210> 96 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_PDCD1_S40 23nt with sgRNA 12 V2 scaffold <400> 96 guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60 uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuuu 107 <210> 97 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_PDCD1_S40 22nt with sgRNA 12 V2 scaffold <400> 97 guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60 uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuuu 107 <210> 98 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_PDCD1_S40 21nt with sgRNA 12 V2 scaffold <400> 98 guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60 uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuuu 107 <210> 99 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_PDCD1_S40 20nt with sgRNA 12 V2 scaffold <400> 99 guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60 uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuuu 107 <210> 100 <211> 129 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_B2M_S12 full sgRNA <400> 100 guaugccugc cgugugaacc auguuugaga guaguguaag aaauuacacu acaaguucaa 60 auaaaaauuu auucaaaucc auuugcuaca uuguguagaa uuuaaagauc uggcaacaga 120 ucuuuuuuu 129 <210> 101 <211> 129 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_TRAC_S36 full sgRNA <400> 101 ucaaaaucgg ugaauaggca gaguuugaga guaguguaag aaauuacacu acaaguucaa 60 auaaaaauuu auucaaaucc auuugcuaca uuguguagaa uuuaaagauc uggcaacaga 120 ucuuuuuuu 129 <210> 102 <211> 129 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_TRAC_S35 full sgRNA <400> 102 gacccugccg uguaccagcu gaguuugaga guaguguaag aaauuacacu acaaguucaa 60 auaaaaauuu auucaaaucc auuugcuaca uuguguagaa uuuaaagauc uggcaacaga 120 ucuuuuuuu 129 <210> 103 <211> 132 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_PDCD1_S40 25nt full sgRNA <400> 103 uccaacacau cggagagcuu cgugcguuug agaguagugu aagaaauuac acuacaaguu 60 caaauaaaaa uuuauucaaa uccauuugcu acauugugua gaauuuaaag aucuggcaac 120 agaucuuuuu uu 132 <210> 104 <211> 131 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_PDCD1_S40 24nt full sgRNA <400> 104 ccaacacauc ggagagcuuc gugcguuuga gaguagugua agaaauuaca cuacaaguuc 60 aaauaaaaau uuauucaaau ccauuugcua cauuguguag aauuuaaaga ucuggcaaca 120 gaucuuuuuu u 131 <210> 105 <211> 130 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_PDCD1_S40 23nt full sgRNA <400> 105 caacacaucg gagagcuucg ugcguuugag aguaguguaa gaaauuacac uacaaguuca 60 aauaaaaauu uauucaaauc cauuugcuac auuguguaga auuuaaagau cuggcaacag 120 aucuuuuuuu 130 <210> 106 <211> 129 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_PDCD1_S40 22nt full sgRNA <400> 106 aacacaucgg agagcuucgu gcguuugaga guaguguaag aaauuacacu acaaguucaa 60 auaaaaauuu auucaaaucc auuugcuaca uuguguagaa uuuaaagauc uggcaacaga 120 ucuuuuuuu 129 <210> 107 <211> 128 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_PDCD1_S40 21nt full sgRNA <400> 107 acacaucgga gagcuucgug cguuugagag uaguguaaga aauuacacua caaguucaaa 60 uaaaaauuua uucaaaucca uuugcuacau uguguagaau uuaaagaucu ggcaacagau 120 cuuuuuuu 128 <210> 108 <211> 127 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103_PDCD1_S40 20nt full sgRNA <400> 108 cacaucggag agcuucgugc guuugagagu aguguaagaa auuacacuac aaguucaaau 60 aaaaauuuau ucaaauccau uugcuacauu guguagaauu uaaagaucug gcaacagauc 120 uuuuuuu 127 <210> 109 <211> 101 <212> RNA <213> Artificial Sequence <220> <223> V2.1 scaffold <400> 109 guuugagagu aguggaaaca cuacaaguuc aaauaaaaau uuauucaaau ccauuugcua 60 cauuguguag aauuuaaaga ucuggcaaca gaucuuuuuu u 101 <210> 110 <211> 85 <212> RNA <213> Artificial Sequence <220> <223> V2.2 scaffold <400> 110 guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60 uugcuacauu guguagaauu uuuuu 85 <210> 111 <211> 79 <212> RNA <213> Artificial Sequence <220> <223> V2.3 scaffold <400> 111 guuugagagu aguggaaaca cuacaaguuc aaauaaaaau uuauucaaau ccauuugcua 60 cauuguguag aauuuuuuu 79 <210> 112 <211> 95 <212> RNA <213> Artificial Sequence <220> <223> V2.4 scaffold <400> 112 guuugagagu aguggaaaca cuacaaguuc aaauaaaaau uuauucaaau ccauuugcua 60 cauuguguag aauuuaaaga ugcaaaucuu uuuuu 95 <210> 113 <211> 101 <212> RNA <213> Artificial Sequence <220> <223> V2.5 scaffold <400> 113 guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60 uugcuacauu guguagaauu uaaagaugca aaucuuuuuu u 101 <210> 114 <211> 14 <212> RNA <213> Artificial Sequence <220> <223> crRNA Repeat sequence A <400> 114 guuugagagu agug 14 <210> 115 <211> 17 <212> RNA <213> Artificial Sequence <220> <223> crRNA Repeat sequence B <400> 115 guuugagagu aguguaa 17 <210> 116 <211> 16 <212> RNA <213> Artificial Sequence <220> <223> tracrRNA antiepeat sequence A <400> 116 cacuacaagu ucaaau 16 <210> 117 <211> 19 <212> RNA <213> Artificial Sequence <220> <223> tracrRNA antiepeat sequence B <400> 117 uuacacuaca aguucaaau 19 <210> 118 <211> 41 <212> RNA <213> Artificial Sequence <220> <223> tracrRNA Portion 1 sequence A <400> 118 aaaaauuuau ucaaauccau uugcuacauu guguagaauu u 41 <210> 119 <211> 45 <212> RNA <213> Artificial Sequence <220> <223> tracrRNA Portion 1 sequence B <400> 119 aaaaauuuau ucaaauccau uugcuacauu guguagaauu uuuuu 45 <210> 120 <211> 38 <212> RNA <213> Artificial Sequence <220> <223> tracrRNA Portion 1 partial sequence <400> 120 aaaaauuuau ucaaauccau uugcuacauu guguagaa 38 <210> 121 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> tracrRNA Portion 2 sequence A <400> 121 aaagaucugg caacagaucu uuuuuu 26 <210> 122 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> tracrRNA Portion 2 sequence B <400> 122 aaagaugcaa aucuuuuuuu 20 <210> 123 <211> 17 <212> RNA <213> Artificial Sequence <220> <223> tracrRNA Portion 2 - partial sequence A <400> 123 aaagaucugg caacaga 17 <210> 124 <211> 13 <212> RNA <213> Artificial Sequence <220> <223> tracrRNA Portion 2 - partial sequence B <400> 124 aaagaugcaa auc 13 <210> 125 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> TRAC s91 spacer <400> 125 gcuguggccu ggagcaacaa au 22 <210> 126 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> PDCD1 s40 spacer <400> 126 aacacaucgg agagcuucgu gc 22 <210> 127 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> B2M s12 spacer <400> 127 guaugccugc cgugugaacc au 22 <210> 128 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> TRAC s35 spacer <400> 128 gacccugccg uguaccagcu ga 22 <210> 129 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103 v2.2 TRAC S35 sgRNA <400> 129 gacccugccg uguaccagcu gaguuugaga guaguguaag aaauuacacu acaaguucaa 60 auaaaaauuu auucaaaucc auuugcuaca uuguguagaa uuuuuuu 107 <210> 130 <211> 101 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103 v2.3 TRAC S35 sgRNA <400> 130 gacccugccg uguaccagcu gaguuugaga guaguggaaa cacuacaagu ucaaauaaaa 60 auuuauucaa auccauuugc uacauugugu agaauuuuuu u 101 <210> 131 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103 v2.2 B2M S12 sgRNA <400> 131 guaugccugc cgugugaacc auguuugaga guaguguaag aaauuacacu acaaguucaa 60 auaaaaauuu auucaaaucc auuugcuaca uuguguagaa uuuuuuu 107 <210> 132 <211> 101 <212> RNA <213> Artificial Sequence <220> <223> OMNI-103 v2.3 B2M S12 sgRNA <400> 132 guaugccugc cgugugaacc auguuugaga guaguggaaa cacuacaagu ucaaauaaaa 60 auuuauucaa auccauuugc uacauugugu agaauuuuuu u 101 <210> 133 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> PDCD1 S40 site <220> <221> misc_feature <222> (23)..(24) <223> n is a, c, g, or t <400> 133 gaccctgccg tgtaccagct gannract 28 <210> 134 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> TRAC S35 site <220> <221> misc_feature <222> (23)..(24) <223> n is a, c, g, or t <400> 134 aacacatcgg agagcttcgt gcnnract 28 <210> 135 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> T2 sequence <400> 135 ggaagagcag agccttggtc tc 22

Claims

서열번호 1의 아미노산 서열과 적어도 90% 동일성을 갖는 서열을 포함하는 CRISPR 뉴클레아제, 또는 CRISPR 뉴클레아제를 인코딩하는 서열을 포함하는 핵산 분자를 포함하는, 비-자연 발생 조성물.
제1항에 있어서, 하나 이상의 RNA 분자, 또는 하나 이상의 RNA 분자 중 어느 하나를 인코딩하는 DNA 폴리뉴클레오타이드를 더 포함하되, 상기 하나 이상의 RNA 분자 및 상기 CRISPR 뉴클레아제는 자연적으로 함께 발생하지 않고, 상기 하나 이상의 RNA 분자는 상기 CRISPR 뉴클레아제와 복합체를 형성하고/하거나 상기 복합체를 표적 부위에 표적화하도록 구성되는, 조성물.
제2항에 있어서, 상기 CRISPR 뉴클레아제는 서열번호 1에 제시된 아미노산 서열과 적어도 90% 동일성을 갖는 서열을 포함하고, 적어도 하나의 RNA 분자는 서열번호 4 내지 36으로 이루어진 군으로부터 선택되는 서열을 포함하는, 조성물.
제3항에 있어서, 상기 CRISPR 뉴클레아제는 서열번호 1에 제시된 아미노산 서열과 적어도 90% 동일성을 갖는 서열을 포함하고, 적어도 하나의 RNA 분자는 서열번호 4 내지 7 및 18 내지 21로 이루어진 군으로부터 선택되는 서열 및 가이드 서열 부분을 포함하는 CRISPR RNA(crRNA) 분자인, 조성물.
제4항에 있어서, 서열번호 8 내지 14, 17, 22 내지 28 및 32로 이루어진 군에 제시된 서열을 포함하는 전사활성화(transactivating) CRISPR RNA(tracrRNA) 분자를 더 포함하는, 조성물.
제2항에 있어서, 상기 CRISPR 뉴클레아제는 서열번호 1에 제시된 아미노산 서열과 적어도 90% 동일성을 갖는 서열을 포함하고, 적어도 하나의 RNA 분자는 서열번호 4 내지 36으로 이루어진 군으로부터 선택되는 서열 및 가이드 서열 부분을 포함하는 단일-가이드 RNA(sgRNA) 분자인, 조성물.
제2항에 있어서, 상기 CRISPR 뉴클레아제는 서열번호 1에 제시된 아미노산 서열과 적어도 90% 동일성을 갖는 서열을 포함하고, 적어도 하나의 RNA 분자는 가이드 서열 부분 및 길이가 적어도 79개 뉴클레오타이드인 스캐폴드 부분을 포함하는 단일-가이드 RNA(sgRNA) 분자인, 조성물.
제1항 내지 제7항 중 어느 한 항에 있어서, 상기 CRISPR 뉴클레아제는 위치 D12, E776, H988 또는 D991에서 아미노산 치환에 의해 형성되는 닉카제(nickase)인, 조성물.
제1항 내지 제7항 중 어느 한 항에 있어서, 상기 CRISPR 뉴클레아제는 위치 D856, H857 또는 N880에서 아미노산 치환에 의해 형성되는 닉카제이며, 위치 D856에서 아미노산 치환은 아스파트산(D) 이외의 글루탐산(E)으로의 치환인, 조성물.
제1항 내지 제7항 중 어느 한 항에 있어서, 상기 CRISPR 뉴클레아제는 위치 D12, E776, H988 또는 D991 중 어느 하나에서의 아미노산 치환 및 D856, H857 또는 N880 중 어느 하나에서의 아미노산 치환에 의해 형성된 촉매적으로 사멸된 뉴클레아제이되, 위치 D856에서의 아미노산 치환은 아스파트산(D) 이외의 글루탐산(E)으로의 치환인, 조성물.
CRISPR 뉴클레아제를 포함하는 비-자연 발생 조성물로서, 상기 CRISPR 뉴클레아제는 서열번호 1의 도메인 A, 도메인 B, 도메인 C, 도메인 D, 도메인 E, 도메인 F, 도메인 G, 도메인 H, 도메인 I, 또는 도메인 J 중 적어도 하나의 아미노산 서열에 상응하는 아미노산 서열을 포함하고,
a) 도메인 A는 서열번호 1의 아미노산 1 내지 45와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함하고;
b) 도메인 B는 서열번호 1의 아미노산 46 내지 83과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함하고;
c) 도메인 C는 서열번호 1의 아미노산 84 내지 158과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함하고;
d) 도메인 D는 서열번호 1의 아미노산 159 내지 302와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함하고;
e) 도메인 E는 서열번호 1의 아미노산 303 내지 515와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함하고;
f) 도메인 F는 서열번호 1의 아미노산 516 내지 727과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함하고;
g) 도메인 G는 서열번호 1의 아미노산 728 내지 778과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함하고;
h) 도메인 H는 서열번호 1의 아미노산 779 내지 923과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함하고;
i) 도메인 I는 서열번호 1의 아미노산 924 내지 1068과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함하고;
j) 도메인 J는 서열번호 1의 아미노산 1069 내지 1348과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함하는, 조성물.
무세포 시스템 또는 세포의 게놈 내 DNA 표적 부위에서 뉴클레오타이드 서열을 변형시키는 방법으로서, 제1항 내지 제11항 중 어느 한 항의 조성물을 상기 세포에 도입하는 단계를 포함하는, 방법.
제12항에 있어서, 상기 CRISPR 뉴클레아제는 서열번호 1에 제시된 아미노산 서열에 적어도 90% 동일성을 갖는 서열을 포함하되, 상기 CRISPR 뉴클레아제는 NNRRHY, NNRACT, 또는 NNRVCT 프로토스페이서 인접 모티프(PAM) 서열에 인접한 DNA 가닥 파손을 초래하고/하거나 PAM 서열에 상보적인 서열에 인접한 DNA 가닥 파손을 초래하는, 방법.
제12항에 있어서, 상기 CRISPR 뉴클레아제는 위치 D12, E776, H988 또는 D991에서 아미노산 치환에 의해 형성되는 닉카제이며, 상기 PAM 서열에 인접한 DNA 가닥 파손을 초래하는, 방법.
제12항에 있어서, 상기 CRISPR 뉴클레아제는 위치 D856, H857 또는 N880에서 아미노산 치환에 의해 형성되는 닉카제이고, 상기 PAM 서열에 상보적인 서열에 인접한 DNA 가닥 파손을 초래하며, 위치 D856에서 아미노산 치환은 아스파트산(D) 이외의 글루탐산(E)으로의 치환인, 방법.
제12항 내지 제15항 중 어느 한 항에 있어서, 상기 세포는 진핵 세포 또는 원핵 세포인, 방법.
제16항에 있어서, 상기 세포는 포유동물 세포인, 방법.
제17항에 있어서, 상기 세포는 인간 세포인, 방법.
비-자연 발생 RNA 분자를 포함하는 조성물로서, 상기 RNA 분자는 crRNA 반복 서열 부분 및 가이드 서열 부분을 포함하고, 상기 RNA 분자는 tracrRNA 서열의 존재 하에 OMNI-103 뉴클레아제와 복합체를 형성하고 상기 뉴클레아제를 DNA 표적 부위에 대해 표적화하고, 상기 tracrRNA 서열은 상기 RNA 분자의 tracrRNA 부분 또는 제2 RNA 분자의 tracrRNA 부분에 의해 인코딩되는, 조성물.
제19항에 있어서, 상기 crRNA 반복 서열 부분은 길이가 최대 17개 뉴클레오타이드, 바람직하게는 길이가 14 내지 17개 뉴클레오타이드인, 조성물.
제19항 또는 제20항에 있어서, 상기 crRNA 반복 서열 부분은 서열번호 114 또는 115와 적어도 60 내지 70%, 71 내지 80%, 81 내지 90%, 91 내지 95%, 또는 96 내지 99% 서열 동일성을 갖는, 조성물.
제19항 내지 제21항 중 어느 한 항에 있어서, 상기 crRNA 반복 서열 부분은 서열번호 114 또는 115 중 어느 하나와 적어도 95% 서열 동일성을 갖는, 조성물.
제19항 내지 제22항 중 어느 한 항에 있어서, 상기 crRNA 반복 서열은 서열번호 115 이외의 것인, 조성물.
제19항 내지 제23항 중 어느 한 항에 있어서, 상기 crRNA 반복 서열 부분 및 상기 가이드 서열 부분을 포함하는 상기 RNA 분자는 tracrRNA 부분을 더 포함하는, 조성물.
제24항에 있어서, 상기 crRNA 반복 서열 부분은 폴리뉴클레오타이드 링커 부분에 의해 상기 tracrRNA 부분에 공유로 연결되는, 조성물.
제19항 내지 제23항 중 어느 한 항에 있어서, 상기 조성물은 상기 tracrRNA 부분을 포함하는 제2 RNA 분자를 포함하는, 조성물.
제19항 내지 제26항 중 어느 한 항에 있어서, 상기 OMNI-103 뉴클레아제는 서열번호 1의 아미노산 서열과 적어도 95% 서열 동일성을 갖는, 조성물.
제19항 내지 제27항 중 어느 한 항에 있어서, 상기 가이드 서열 부분은 길이가 17 내지 30개 뉴클레오타이드, 바람직하게는 길이가 22개 뉴클레오타이드인, 조성물.
비-자연 발생 RNA 분자를 포함하는 조성물로서, 상기 RNA 분자는 tracrRNA 부분을 포함하고, 상기 RNA 분자는 crRNA 반복 서열 및 가이드 서열 부분의 존재 하에 OMNI-103 뉴클레아제와 복합체를 형성하고 상기 뉴클레아제를 DNA 표적 부위에 대해 표적화하고, 상기 crRNA 반복 서열 부분 및 상기 가이드 서열 부분은 상기 RNA 분자 및 제2 RNA 분자에 의해 인코딩되는, 조성물.
제29항에 있어서, 상기 tracrRNA 부분은 길이가 85개 미만의 뉴클레오타이드, 바람직하게는 길이가 84 내지 80, 79 내지 75, 74 내지 70, 69 내지 65, 또는 64 내지 60개 뉴클레오타이드인, 조성물.
제29항 또는 제30항에 있어서, 상기 tracrRNA 부분은 서열번호 109 내지 113 중 어느 하나의 tracrRNA 부분과 적어도 30 내지 40%, 41 내지 50%, 51 내지 60%, 61 내지 70%, 71 내지 80%, 81 내지 90%, 91 내지 95%, 또는 96 내지 99% 서열 동일성을 갖는, 조성물.
제29항 내지 제31항 중 어느 한 항에 있어서, 상기 tracrRNA 부분은 서열번호 109 내지 113 중 어느 하나의 tracrRNA 부분과 적어도 95% 서열 동일성을 갖는, 조성물.
제29항 내지 제32항 중 어느 한 항에 있어서, 상기 tracrRNA 부분은 서열번호 15 또는 16의 tracr 부분 이외의 것인, 조성물.
제29항 내지 제33항 중 어느 한 항에 있어서, 상기 tracrRNA 부분은 길이가 최대 19개 뉴클레오타이드, 바람직하게는 길이가 16 내지 19개 뉴클레오타이드인 tracrRNA 항-반복 서열 부분을 포함하는, 조성물.
제29항 내지 제34항 중 어느 한 항에 있어서, 상기 tracrRNA 부분은 서열번호 116 또는 117 중 어느 하나와 적어도 60 내지 70%, 71 내지 80%, 81 내지 90%, 91 내지 95%, 또는 96 내지 99% 서열 동일성을 갖는 tracrRNA 항-반복 서열 부분을 포함하는, 조성물.
제29항 내지 제35항 중 어느 한 항에 있어서, 상기 tracrRNA 부분은 서열번호 116 또는 117 중 어느 하나와 적어도 95% 서열 동일성을 갖는 tracrRNA 항-반복 서열 부분을 포함하는, 조성물.
제29항 내지 제36항 중 어느 한 항에 있어서, 상기 tracrRNA 부분은 서열번호 117 이외의 서열을 갖는 tracrRNA 항-반복 서열 부분을 포함하는, 조성물.
제29항 내지 제37항 중 어느 한 항에 있어서, 상기 RNA 분자는 tracrRNA 부분을 포함하고 crRNA 반복 서열 부분 및 가이드 서열 부분을 더 포함하는, 조성물.
제29항 내지 제38항 중 어느 한 항에 있어서, 상기 tracrRNA 부분은 폴리뉴클레오타이드 링커 부분에 의해 crRNA 반복 서열에 공유로 연결되는, 조성물.
제39항에 있어서, 상기 폴리뉴클레오타이드 링커 부분은 길이가 4 내지 10개 뉴클레오타이드인, 조성물.
제40항에 있어서, 상기 폴리뉴클레오타이드 링커는 GAAA의 서열을 갖는, 조성물.
제29항 내지 제37항 중 어느 한 항에 있어서, 상기 조성물은 crRNA 반복 서열 부분 및 가이드 서열 부분을 포함하는 제2 RNA 분자를 더 포함하는, 조성물.
제29항 내지 제42항 중 어느 한 항에 있어서, 상기 OMNI-103 뉴클레아제는 서열번호 1의 아미노산 서열과 적어도 95% 서열 동일성을 갖는, 조성물.
제29항 내지 제43항 중 어느 한 항에 있어서, 상기 가이드 서열 부분은 길이가 17 내지 30개 뉴클레오타이드, 바람직하게는 길이가 22개 뉴클레오타이드인, 조성물.
비-자연 발생 RNA 분자를 포함하는 조성물로서, 상기 RNA 분자는 RNA 스캐폴드 부분을 포함하고, 상기 RNA 스캐폴드 부분은 다음 구조:
crRNA 반복 서열 부분 - tracrRNA 부분
를 갖되, 상기 RNA 스캐폴드 부분은 OMNI-103 CRISPR 뉴클레아제와 복합체를 형성하고 상기 뉴클레아제를 상기 RNA 분자의 가이드 서열 부분에 대해 상보성을 갖는 DNA 표적 부위에 대해 표적화하는, 조성물.
제45항에 있어서, 상기 OMNI-103 뉴클레아제는 서열번호 1의 아미노산 서열과 적어도 95% 서열 동일성을 갖는, 조성물.
제45항 또는 제46항에 있어서, 상기 RNA 스캐폴드 부분은 길이가 110 내지 105, 104 내지 100, 99 내지 95, 94 내지 90, 89 내지 85, 84 내지 80, 79 내지 75, 또는 74 내지 70개 뉴클레오타이드인, 조성물.
제45항 내지 제47항 중 어느 한 항에 있어서, 상기 RNA 스캐폴드 부분은 길이가 107, 101, 95, 85, 또는 79개 뉴클레오타이드인, 조성물.
제45항 내지 제48항 중 어느 한 항에 있어서, 상기 RNA 스캐폴드 부분은 서열번호 109 내지 113 중 어느 하나와 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 서열 동일성을 갖는, 조성물.
제45항 내지 제49항 중 어느 한 항에 있어서, 상기 crRNA 반복 서열 부분은 길이가 최대 17개 뉴클레오타이드, 바람직하게는 길이가 14 내지 17개 뉴클레오타이드인, 조성물.
제45항 내지 제50항 중 어느 한 항에 있어서, 상기 crRNA 반복 서열 부분은 서열번호 114 또는 115와 적어도 60 내지 70%, 71 내지 80%, 81 내지 90%, 91 내지 95%, 또는 96 내지 99% 서열 동일성을 갖는, 조성물.
제45항 내지 제51항 중 어느 한 항에 있어서, 상기 crRNA 반복 서열 부분은 서열번호 114 또는 115 중 어느 하나와 적어도 95% 서열 동일성을 갖는, 조성물.
제45항 내지 제52항 중 어느 한 항에 있어서, 상기 crRNA 반복 서열은 서열번호 115 이외의 것인, 조성물.
제45항 내지 제53항 중 어느 한 항에 있어서, 상기 tracrRNA 부분은 길이가 85개 미만의 뉴클레오타이드, 바람직하게는 길이가 84 내지 80, 79 내지 75, 74 내지 70, 69 내지 65, 또는 64 내지 60개 뉴클레오타이드인, 조성물.
제45항 내지 제54항 중 어느 한 항에 있어서, 상기 tracrRNA 부분은 서열번호 109 내지 113 중 어느 하나의 tracrRNA 부분과 적어도 30 내지 40%, 41 내지 50%, 51 내지 60%, 61 내지 70%, 71 내지 80%, 81 내지 90%, 91 내지 95%, 또는 96 내지 99% 서열 동일성을 갖는, 조성물.
제45항 내지 제55항 중 어느 한 항에 있어서, 상기 tracrRNA 부분은 서열번호 109 내지 113 중 어느 하나의 tracrRNA 부분과 적어도 95% 서열 동일성을 갖는, 조성물.
제45항 내지 제56항 중 어느 한 항에 있어서, 상기 tracrRNA 부분은 서열번호 15 또는 16의 tracrRNA 부분 이외의 것인, 조성물.
제45항 내지 제57항 중 어느 한 항에 있어서, 상기 RNA 스캐폴드 부분은 RNA 스캐폴드가 다음 구조를 갖도록 상기 crRNA 반복 서열 부분과 상기 tracrRNA 부분 사이에 링커 부분을 더 포함하는, 조성물:
crRNA 반복 서열 부분 - 링커 부분 - tracrRNA 부분.
제45항 내지 제58항 중 어느 한 항에 있어서, 상기 tracrRNA 부분은 tracrRNA 항-반복 서열 부분을 포함하고, 상기 crRNA 반복 서열과 상기 tracrRNA 항-반복 서열 부분은 링커 부분에 의해 공유로 연결되는, 조성물.
제59항에 있어서, 상기 링커 부분은 길이가 4 내지 10개 뉴클레오타이드인 폴리뉴클레오타이드 링커인, 조성물.
제60항에 있어서, 상기 폴리뉴클레오타이드 링커는 GAAA의 서열을 갖는, 조성물.
제45항 내지 제61항 중 어느 한 항에 있어서, 상기 tracrRNA 부분은 길이가 최대 19개 뉴클레오타이드, 바람직하게는 길이가 16 내지 19개 뉴클레오타이드인 tracrRNA 항-반복 서열 부분을 포함하는, 조성물.
제45항 내지 제62항 중 어느 한 항에 있어서, 상기 tracrRNA 부분은 서열번호 116 또는 117 중 어느 하나와 적어도 60 내지 70%, 71 내지 80%, 81 내지 90%, 91 내지 95%, 또는 96 내지 99% 서열 동일성을 갖는 tracrRNA 항-반복 서열 부분을 포함하는, 조성물.
제45항 내지 제63항 중 어느 한 항에 있어서, 상기 tracrRNA 부분은 서열번호 116 또는 117 중 어느 하나와 적어도 95% 서열 동일성을 갖는 tracrRNA 항-반복 서열 부분을 포함하는, 조성물.
제45항 내지 제64항 중 어느 한 항에 있어서, 상기 tracrRNA 항-반복 서열은 서열번호 117 이외의 것인, 조성물.
제45항 내지 제65항 중 어느 한 항에 있어서, 상기 tracrRNA 부분은 tracrRNA 항-반복 부분에 연결된 뉴클레오타이드의 제1 절편을 포함하고, 뉴클레오타이드의 제1 절편은 서열번호 118 내지 120 중 어느 하나와 적어도 95% 서열 동일성을 갖는, 조성물.
제45항 내지 제66항 중 어느 한 항에 있어서, 상기 tracrRNA 부분은 뉴클레오타이드의 제1 절편에 연결된 뉴클레오타이드의 제2 섹션을 포함하고, 상기 뉴클레오타이드의 제2 섹션은 서열번호 121 내지 124 중 어느 하나와 적어도 95% 서열 동일성을 갖는, 조성물.
제45항 내지 제67항 중 어느 한 항에 있어서, 상기 RNA 스캐폴드 부분은 서열번호 109 내지 113 중 어느 하나의 뉴클레오타이드 서열과 적어도 95% 동일성을 갖는, 조성물.
제45항 내지 제68항 중 어느 한 항에 있어서, 상기 RNA 스캐폴드 부분은 V2, V2.1, V2.2, V2.3, V2.4 또는 V2.5 RNA 스캐폴드 중 어느 하나의 예측된 구조를 갖는, 조성물.
제45항 내지 제69항 중 어느 한 항에 있어서, 상기 RNA 스캐폴드 부분은 서열번호 15 또는 16 이외의 서열을 갖는, 조성물.
제45항 내지 제70항 중 어느 한 항에 있어서, 가이드 서열 부분이 상기 RNA 분자의 상기 crRNA 반복 서열 부분에 공유로 연결되어, 다음 구조를 갖는 단일-가이드 RNA 분자를 형성하는, 조성물:
가이드 서열 부분 - crRNA 반복 서열 부분 - tracrRNA 부분.
제45항 내지 제71항 중 어느 한 항에 있어서, 상기 가이드 서열 부분은 길이가 17 내지 30개 뉴클레오타이드, 더 바람직하게는 20 내지 23개 뉴클레오타이드, 더 바람직하게는 22개 뉴클레오타이드인, 조성물.
제45항 내지 제72항 중 어느 한 항에 있어서, OMNI-103 CRISPR 뉴클레아제를 더 포함하되, 상기 OMNI-103 CRISPR 뉴클레아제는 서열번호 1의 아미노산 서열과 적어도 95% 동일성을 갖는, 조성물.
제1항 내지 제73항 중 어느 한 항에 있어서, 상기 RNA 분자는 시험관내 전사(IVT) 또는 고상 인공 올리고뉴클레오타이드 합성에 의해 형성되는, 조성물.
제74항에 있어서, 상기 RNA 분자는 변형된 뉴클레오타이드를 포함하는, 조성물.
제1항 내지 제75항 중 어느 한 항의 RNA 분자를 인코딩하는 폴리뉴클레오타이드 분자.
무세포 시스템 또는 세포의 게놈 내 DNA 표적 부위에서 뉴클레오타이드 서열을 변형시키는 방법으로서, 제1항 내지 제75항 중 어느 한 항의 조성물을 상기 시스템 또는 상기 세포에 도입하는 단계를 포함하는, 방법.
제77항에 있어서, 상기 세포는 진핵 세포 또는 원핵 세포인, 방법.
제78항에 있어서, 상기 진핵 세포는 인간 세포 또는 식물 세포인, 방법.
무세포 시스템 또는 세포의 게놈 내 DNA 표적 부위에서 뉴클레오타이드 서열을 변형시키기 위한 키트로서, 제2항 내지 제75항 중 어느 한 항의 조성물, 서열번호 1의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 CRISPR 뉴클레아제를 상기 시스템 또는 상기 세포에 도입하는 것, 및 상기 RNA 분자 및 상기 CRISPR 뉴클레아제를 상기 세포에 전달하기 위한 지침을 포함하는, 키트.
본 출원에 개시된 하나 이상의 요소를 특징으로 하는 조성물, 방법, 제품, 과정, 시스템, 키트 또는 용도.