KR20180037139A

KR20180037139A - Ｃａｓ9 분자/가이드 ｒｎａ 분자 복합체의 평가

Info

Publication number: KR20180037139A
Application number: KR1020177034040A
Authority: KR
Inventors: 하리하란 자야람; 윌리엄 주니어 셀렉크
Original assignee: 에디타스 메디신, 인코포레이티드
Priority date: 2015-04-24
Filing date: 2016-04-25
Publication date: 2018-04-11
Also published as: KR102535217B1; EP3286571B1; CA2982966A1; US20220325326A1; EP4019975A1; ZA201707018B; IL255125A0; JP2018522249A; AU2016253150A1; EP3286571A1; CN107690480A; AU2016253150B2; CN107690480B; US11180793B2; WO2016172727A1; US20180135109A1; CA2982966C; SG11201708653RA

Abstract

Cas9 분자/gRNA 분자 복합체의 평가, 선택, 최적화 및 설계 방법이 본 명세서에 개시된다.

Description

ＣＡＳ9 분자/가이드 ＲＮＡ 분자 복합체의 평가

관련 출원

본 출원은 2015년 4월 24일자로 출원된 미국 가출원 제62/152,473호에 대한 우선권을 주장한다.

기술분야

본 발명(들)은 Cas9 분자/가이드 RNA(gRNA) 분자 복합체의 평가, 선택 및 설계에 관한 것이다.

Cas9 리보핵단백질(RNP) 복합체의 직접적인 전달은 세포에서의 Cas9 단백질의 신속한 전환 때문에 표적-외 활성을 최소화시키면서 효율적인 유전자-교정(editing)을 가능하게 한다. 유전자 교정은 시험관내 전사되거나 화학적으로 합성된 가이드 RNA(gRNA)와 복합체화된 정제된 Cas9 단백질의 양이온성 지질 전달에 의해 다양한 포유동물 세포에서 달성될 수 있다. RNP 전달에 의해 매개되는 유전자 교정의 효율은 유전자좌에 의해 달라지며, gRNA의 길이, 및 전달되는 Cas9 단백질 및 gRNA의 양과 비에 따라 달라진다. RNP 복합체의 2-성분 성질을 고려해 볼 때, Cas9 단백질과 gRNA 간의 완전하고 생산적인 복합체 형성을 얻는데 정밀한 조건이 필요하다. 단백질 및 RNA의 양이 염료-결합 분석, 예를 들어, 브래드포드(Bradford) 염료 결합 분석 또는 리보퀀트(riboquant) RNA 분석에 의해 정량화될 수 있지만, 이들 기법은 유전자 교정 활성을 위해 필요한 생산적인 RNP 복합체의 정량화를 제공하지 않는다.

Cas9/gRNA 복합체의 구조적 및 생물물리학적 특성화에 의해, 큰 접촉 면적 및 높은 친화성이 드러났다. 열 용융 곡선은 단백질-리간드 복합체의 안정성 및 결합을 특성화하는데 유용한 특성이다. 시차 주사 형광측정법(DSF)은 소분자 염료, 예를 들어, SYPRO® 오렌지(orange)의 형광의 변화를 사용하여 단백질의 열 변성을 모니터링하고, 그의 열 용융 온도를 결정하는 생물물리학적 기법이다(). 단백질로의 리간드의 결합은 단백질을 상이한 정도로 안정화시키고, 그의 T_m을 변경시키는 경향이 있다. 상이한 리간드 농도에서의 단백질의 T_m의 측정에 의해, 상기 리간드에 대한 단백질의 친화성의 측정이 가능해질 수 있다. 광범위한 열 용융 특징을 사용하여 높은 신호 대 잡음 비와 함께 높은 처리효율로 RNP 복합체의 질을 신속하게 분석할 수 있다.

따라서, Cas9 분자/gRNA 분자 복합체의 질을 평가하기 위해, 예를 들어, RNP 매개의 유전자 교정을 위한 전제조건인 생산적인 복합체 형성을 정량화하기 위해 사용될 수 있는 DSF와 같은 분석을 개발하는 것이 여전히 필요하다.

요약

(a) 복수의 시료를 생성하는 단계로서, 각 시료가 Cas9 분자와, 복수의 gRNA 분자 중 하나를 조합함으로써 생성되는 Cas9 분자/gRNA 분자 복합체를 포함하는 단계; (b) 복수의 시료의 각각에서 Cas9 분자/gRNA 분자 복합체의 용융 온도(T_m) 값을 검출하는 단계; 및 (c) (i) 기준 Cas9 분자/gRNA 분자 복합체의 T_m 값 또는 미리 결정된 역치 T_m 값과 복수의 시료에서의 T_m 값의 비교, 또는 (ii) 복수의 시료의 T_m 값의 상대적 순서화 중 하나 이상을 기반으로 하여 복수의 시료로부터 적어도 하나의 시료를 선택하는 단계를 포함하는 대상체로의 투여를 위한 Cas9 분자/gRNA 분자 복합체에 대한 스크리닝 방법이 본 명세서에 제공된다. 특정 구현예에서, 복수의 시료의 각 시료에서 Cas9 분자/gRNA 분자 복합체의 T_m 값을 검출하는 단계는 시차 주사 형광측정법(DSF)에 의해 복수의 시료에서 각 시료를 평가하는 것을 포함할 수 있다. 특정 구현예에서, gRNA는 키메라 gRNA일 수 있다. 특정 구현예에서, gRNA는 모듈(modular) gRNA일 수 있다. 특정 구현예에서, 시료는 첨가제, 소분자, 안정화 시약, 완충제, pH, 염 농도, 글리세롤 농도 또는 기타 완충제 구성성분을 포함하는 구성성분을 포함할 수 있다. 특정 구현예에서, gRNA 분자 부재의 Cas9 분자의 T_m 값보다 적어도 8℃ 더 큰 T_m을 갖는 Cas9 분자/gRNA 분자 복합체를 포함하는 시료가 선택될 수 있다.

특정 구현예에서, 본 명세서에 제공되는 방법에 따라 선택되는 gRNA 분자 부재의 Cas9 분자의 T_m 값보다 적어도 8℃ 더 큰 T_m을 갖는 Cas9 분자 및 gRNA 분자의 분리된 복합체가 본 명세서에 제공된다.

특정 구현예에서, 본 명세서에 제공되는 방법에 따라 선택되는 gRNA 분자 부재의 Cas9 분자의 T_m보다 적어도 8℃ 더 큰 T_m을 갖는 Cas9 분자 및 gRNA 분자의 분리된 복합체를 포함하는 조성물이 본 명세서에 제공된다. 특정 구현예에서, Cas9 분자 및 gRNA 분자의 비-자연 발생 복합체의 T_m과 gRNA 분자 부재의 Cas9 분자의 T_m의 차이는 DSF에 의해 평가될 수 있다. 특정 구현예에서, gRNA는 키메라 또는 모듈 gRNA일 수 있다.

특정 구현예에서, (a) 복수의 Cas9 분자/gRNA 분자 복합체를 생성하는 단계로서, 각각이 Cas9 분자와, 복수의 gRNA 분자 중 하나를 조합함으로써 생성되는 Cas9 분자/gRNA 분자 복합체를 포함하는 단계; (b) 복수의 Cas9 분자/gRNA 분자 복합체의 각 Cas9 분자/gRNA 분자 복합체의 T_m 값을 검출하는 단계; 및 (c) Cas9 분자/gRNA 분자 복합체의 T_m 값이 기준 분자의 T_m 값 또는 T_m 기준 값보다 더 크면, 복수의 Cas9 분자/gRNA 분자 복합체 중 하나 이상이 안정한 것을 결정하는 단계를 포함하는 Cas9 분자/gRNA 분자 복합체의 안정성의 결정 방법이 본 명세서에 제공된다.

본 명세서의 방법의 특정 구현예에서, 복수의 gRNA 분자는 후보 gRNA 분자의 라이브러리일 수 있다. 특정 구현예에서, 후보 gRNA 분자의 라이브러리는 tracrRNA 분자 또는 서열의 라이브러리를 포함할 수 있다. 특정 구현예에서, tracrRNA 분자 또는 서열의 라이브러리는 상이한 길이의 것일 수 있다.

특정 구현예에서, (a) 시료에서 Cas9 분자와 gRNA 분자를 조합하여, Cas9 분자/gRNA 분자 복합체를 형성하는 단계; (b) Cas9 분자/gRNA 분자 복합체의 T_m 값을 검출하는 단계; 및 (c) Cas9 분자/gRNA 분자 복합체의 T_m 값이 기준 분자의 T_m 값 또는 T_m 기준 값보다 더 크면, Cas9 분자/gRNA 분자 복합체가 안정한 것을 결정하는 단계를 포함하는 안정한 Cas9 분자/gRNA 분자 복합체의 촉진하는 조건의 결정 방법이 본 명세서에 제공된다.

특정 구현예에서, (a) DSF를 통해 Cas9 분자/gRNA 분자 복합체의 T_m 값을 검출하는 단계; 및 (b) Cas9 분자/gRNA 분자 복합체의 T_m 값이 기준 분자의 T_m 값 또는 T_m 기준 값보다 더 크면, Cas9 분자/gRNA 분자 복합체가 안정한 것을 결정하는 단계를 포함하는 안정한 Cas9 분자/gRNA 분자 복합체에 대한 스크리닝 방법이 본 명세서에 제공된다.

특정 구현예에서, (a) 시료에서 Cas9 분자와 gRNA 분자를 조합하여, Cas9 분자/gRNA 분자 복합체를 형성하는 단계; (b) Cas9 분자/gRNA 분자 복합체의 T_m 값을 검출하는 단계; 및 (c) Cas9 분자/gRNA 분자 복합체의 T_m 값이 기준 분자의 T_m 값 또는 T_m 기준 값보다 적어도 8℃ 더 크면, Cas9 분자/gRNA 분자 복합체가 안정한 것을 결정하는 단계를 포함하는 안정한 Cas9 분자/gRNA 분자 복합체를 형성하기 위한 최적의 gRNA의 확인 방법이 본 명세서에 제공된다.

특정 구현예에서, (a) 시료에서 Cas9 분자와 gRNA 분자를 조합하여, Cas9 분자/gRNA 분자 복합체를 형성하는 단계; (b) Cas9 분자/gRNA 분자 복합체의 T_m 값을 검출하는 단계; (c) Cas9 분자/gRNA 분자 복합체의 활성 값을 측정하는 단계; 및 (d) (i) Cas9 분자/gRNA 분자 복합체의 T_m 값이 기준 분자의 T_m 값 또는 T_m 기준 값보다 더 크고, (ii) Cas9 분자/gRNA 분자 복합체의 활성 값이 기준 분자의 활성 값 또는 활성 기준 값보다 더 크면, Cas9 분자/gRNA 분자 복합체가 안정한 것을 결정하는 단계를 포함하는 Cas9 분자/gRNA 분자 복합체의 안정성의 결정 방법이 본 명세서에 제공된다.

특정 구현예에서, (a) 시료에서 Cas9 분자와 gRNA 분자를 조합하여, Cas9 분자/gRNA 분자 복합체를 형성하는 단계; (b) Cas9 분자/gRNA 분자 복합체의 T_m 값을 검출하는 단계; (c) Cas9 분자/gRNA 분자 복합체의 T_m 값과 기준 분자의 T_m 값 또는 T_m 기준 값 사이의 델타 값을 결정하는 단계; 및 (d) 델타 값이 적어도 8℃이고, Cas9 분자/gRNA 분자 복합체의 T_m 값이 기준 분자의 T_m 값 또는 T_m 기준 값보다 더 크면, Cas9 분자/gRNA 분자 복합체가 안정한 것을 결정하는 단계를 포함하는 안정한 Cas9 분자/gRNA 분자 복합체를 형성하기 위한 Cas9 분자로의 gRNA 분자의 결합의 최적화 방법이 본 명세서에 제공된다.

특정 구현예에서, (a) 기준 분자의 열안정성 값을 검출하는 단계; (b) 시료에서 Cas9 분자와 gRNA 분자를 조합하여, Cas9 분자/gRNA 분자 복합체를 형성하는 단계; (c) Cas9 분자/gRNA 분자 복합체의 열안정성 값을 측정하는 단계; 및 (d) Cas9 분자/gRNA 분자 복합체의 열안정성 값이 기준 분자의 열안정성 값보다 더 크면, Cas9 분자/gRNA 분자 복합체가 안정한 것을 결정하는 단계를 포함하는 안정한 Cas9 분자/gRNA 분자 복합체의 검출 방법이 본 명세서에 제공된다.

본 명세서의 방법의 특정 구현예에서, 열안정성 값은 변성 온도 값일 수 있으며, 열안정성 기준 값은 변성 온도 기준 값일 수 있다. 본 명세서의 방법의 특정 구현예에서, 열안정성 값은 T_m 값일 수 있으며, 열안정성 기준 값은 T_m 기준 값일 수 있다.

본 명세서의 방법의 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 T_m 값이 기준 분자의 T_m 값 또는 T_m 기준 값보다 적어도 1℃, 적어도 2℃, 적어도 3℃, 적어도 4℃, 적어도 5℃, 적어도 6℃, 적어도 7℃, 적어도 8℃, 적어도 9℃, 적어도 10℃, 적어도 11℃, 적어도 12℃, 적어도 13℃, 적어도 14℃, 적어도 15℃, 적어도 16℃, 적어도 17℃, 적어도 18℃, 적어도 19℃ 또는 적어도 20℃ 더 크면, Cas9 분자/gRNA 분자 복합체는 안정할 수 있다. 예를 들어, 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 T_m 값이 기준 분자의 T_m 값 또는 T_m 기준 값보다 적어도 8℃ 더 크면, Cas9 분자/gRNA 분자 복합체는 안정하다.

본 명세서의 방법의 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 T_m 값이 기준 분자의 T_m 값 또는 T_m 기준 값보다 약 1℃, 약 2℃, 약 3℃, 약 4℃, 약 5℃, 약 6℃, 약 7℃, 약 8℃, 약 9℃, 약 10℃, 약 11℃, 약 12℃, 약 13℃, 약 14℃, 약 15℃, 약 16℃, 약 17℃, 약 18℃, 약 19℃ 또는 약 20℃ 더 크면, Cas9 분자/gRNA 분자 복합체는 안정할 수 있다. 예를 들어, 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 T_m 값이 기준 분자의 T_m 값 또는 T_m 기준 값보다 약 8℃ 더 크면, Cas9 분자/gRNA 분자 복합체는 안정하다.

본 명세서의 방법의 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 T_m 값이 기준 분자의 T_m 값 또는 T_m 기준 값보다 약 1℃ 내지 5℃, 약 6℃ 내지 10℃, 약 11℃ 내지 15℃ 또는 약 16℃ 내지 20℃ 더 크면, Cas9 분자/gRNA 분자 복합체는 안정할 수 있다. 예를 들어, 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 T_m 값이 기준 분자의 T_m 값 또는 T_m 기준 값보다 약 6℃ 내지 10℃ 더 크면, Cas9 분자/gRNA 분자 복합체는 안정하다.

본 명세서의 방법의 특정 구현예에서, T_m 값은 열 변화 분석을 사용하여 검출될 수 있다. 특정 구현예에서, 열 변화 분석은 DSF, 시차 주사 열량계(DSC) 또는 등온 적정 열량계(ITC)로부터 선택될 수 있다.

본 명세서의 방법의 특정 구현예에서, gRNA 분자는 키메라 gRNA 분자를 포함할 수 있다. 특정 구현예에서, gRNA 분자는 모듈 gRNA 분자를 포함할 수 있다.

본 명세서의 방법의 특정 구현예에서, Cas9 분자는 본 명세서에 개시된 Cas9 분자 중 임의의 것일 수 있다. 예를 들어, Cas9 분자는 표 1로부터 선택되는 Cas9 분자일 수 있다. 특정 구현예에서, Cas9 분자는 키메라 Cas9 분자, 또는 합성 또는 조작된(engineered) Cas9 분자일 수 있다. 예를 들어, Cas9 분자는 부분 또는 부분들이 결실된 Cas9 분자일 수 있다. 특정 구현예에서, Cas9 분자는 스트렙토코커스 피오게네스(S. pyogenes) 또는 스타필로코커스 아우레우스(S. aureus) Cas9 분자를 포함할 수 있다.

본 명세서의 방법의 특정 구현예에서, 기준 분자는 (a) gRNA 분자의 부재 하의 기준 Cas9 분자; (b) 제2 gRNA 분자(즉, 평가 중인 복합체에서의 것 이외의 gRNA)와 복합체화된 기준 Cas9 분자(예를 들어, 평가 중인 복합체에서의 Cas9 분자와 동일한 Cas9 분자); 및 (c) 기준 Cas9 분자/gRNA 분자 복합체로부터 선택될 수 있으며, 기준 Cas9 분자/gRNA 분자는 상이한 조건 하에, 예를 들어, Cas9 분자/gRNA 분자 복합체와 상이한 비의 Cas9 분자 및 gRNA 분자로 형성되거나, 상이한 완충제에서 형성되었다. 특정 구현예에서, 기준 Cas9 분자는 평가 중인 복합체의 Cas9 분자와 동일할 수 있다. 특정 구현예에서, 기준 Cas9 분자는 평가 중인 복합체의 Cas9 분자와 상이할 수 있다. 특정 구현예에서, 기준 Cas9 분자는 일차 서열이 평가 중인 복합체의 Cas9 분자와 상이할 수 있다. 특정 구현예에서, 기준 Cas9 분자/gRNA 분자 복합체의 gRNA 분자는 평가 중인 복합체의 gRNA 분자와 동일할 수 있다. 특정 구현예에서, 기준 Cas9 분자/gRNA 분자 복합체의 gRNA 분자는 평가 중인 복합체의 gRNA 분자와 상이할 수 있다. 특정 구현예에서, 기준 Cas9 분자/gRNA 분자 복합체의 gRNA 분자는 평가 중인 복합체의 gRNA 분자와 서열이 상이할 수 있거나, 변형에 의해 상이하다.

본 명세서의 방법의 특정 구현예에서, T_m 기준 값은 T_m에 대한 미리 선택된 수치를 포함할 수 있다. 특정 구현예에서, T_m 기준 값은 본 명세서에 기재된 기준 분자 중 임의의 것의 T_m과 상호연관된 값을 포함할 수 있다.

특정 구현예에서, 본 명세서에 개시된 방법은 Cas9 분자/gRNA 분자 복합체의 활성을 검출하는 단계; Cas9 분자/gRNA 분자 복합체의 활성 값을 측정하는 단계; 및 Cas9 분자/gRNA 분자 복합체의 활성 값이 기준 분자의 활성 값 또는 활성 기준 값보다 더 크면, Cas9 분자/gRNA 분자 복합체가 안정한 것을 결정하는 단계를 추가로 포함할 수 있다. 특정 구현예에서, 활성은 삽입결실(indel)을 유도하는 능력; 표적 DNA를 변형시키는 능력; 미리 선택된 수선 방법의 경향; DNA 표적에 계속 혼성화되는 gRNA 분자의 능력; 및 Cas9 분자/gRNA 분자 복합체의 Cas9 분자에 결합하는 gRNA 분자의 능력 중 하나 이상을 포함할 수 있다. 특정 구현예에서, 활성 값은 결합 값일 수 있으며, 활성은 Cas9 분자에 결합하는 gRNA 분자의 능력일 수 있으며, (a) 시료에서 gRNA 분자와 Cas9 분자를 조합하여, Cas9 분자/gRNA 분자 복합체를 형성하는 단계; (b) Cas9 분자/gRNA 분자 복합체의 결합 값을 측정하는 단계; 및 (c) Cas9 분자/gRNA 분자 복합체의 결합 값이 기준 분자의 결합 값 또는 결합 기준 값보다 더 크면, Cas9 분자/gRNA 분자 복합체가 안정한 것을 결정하는 단계를 포함한다. 특정 구현예에서, 결합 값은 반응속도론(kinetics) 분석을 사용하여 측정될 수 있다. 특정 구현예에서, 반응속도론 분석은 표면 플라스몬 공명(SPR) 분석, 바이오-층 간섭(BLI) 분석 또는 겔 밴드 변화 분석으로부터 선택될 수 있다. 특정 구현예에서, 미리 선택된 수선 방법의 경향은 HDR 또는 NHEJ일 수 있다. 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 활성을 시험관내 시스템; 생체외 시스템; 생체내 시스템; 세포 분석; 또는 동물 모델을 사용하여 시험할 수 있다.

특정 구현예에서, 기준 분자는 본 명세서에 제공되는 기준 분자 중 임의의 것으로부터 선택된다. 특정 구현예에서, 기준 Cas9 분자/gRNA 분자 복합체는 Cas9 분자/gRNA 분자 복합체와 상이한 비의 Cas9 분자 및 gRNA 분자로 형성되거나, Cas9 분자/gRNA 분자 복합체와 상이한 완충제에서 형성된다.

특정 구현예에서, 본 명세서에 기재되는 방법 중 임의의 것을 사용하여 생성되는 합성 Cas9 분자/gRNA 분자 복합체가 본 명세서에 제공된다.

특정 구현예에서, 본 명세서에 기재되는 방법 중 임의의 것을 사용하여 생성되는 Cas9 분자/gRNA 분자 복합체를 포함하는 조성물이 본 명세서에 제공된다.

특정 구현예에서, 본 명세서에 기재되는 방법 중 임의의 것을 사용하여 생성되는 하나 이상의 Cas9 분자/gRNA 분자 복합체를 인코딩하는 핵산을 포함하는 벡터계가 본 명세서에 제공된다.

특정 구현예에서, 본 명세서에 기재된 Cas9 분자/gRNA 분자 복합체 중 임의의 것을 표적 세포로 전달하는 단계를 포함하는 표적 세포로의 Cas9 분자/gRNA 분자 복합체의 전달 방법이 본 명세서에 제공된다. 특정 구현예에서, Cas9 분자/gRNA 분자 복합체는 RNP 양이온성 지질 트랜스펙션, 바이러스 벡터 또는 RNA 트랜스펙션에 의해 세포로 전달될 수 있다. 특정 구현예에서, 바이러스 벡터는 AAV 벡터일 수 있다.

특정 구현예에서, 본 명세서에 제공되는 방법, 조성물 또는 제형에서 gRNA 분자는 단분자 또는 키메라 gRNA일 수 있다. 다른 구현예에서, gRNA 분자는 모듈 gRNA일 수 있다.

특정 구현예에서, 본 명세서에 제공되는 방법, 조성물 또는 제형에서 Cas9 분자는 스트렙토코커스 피오게네스, 스타필로코커스 아우레우스 또는 스트렙토코커스 써모필러스(S. thermophilus) Cas9 분자, 또는 스트렙토코커스 피오게네스, 스타필로코커스 아우레우스 또는 스트렙토코커스 써모필러스 Cas9 분자로부터 유래된 Cas9 분자일 수 있다. 특정 구현예에서, Cas9 분자는 표지될 수 있으며, 이들 중 특정 구현예에서, 표지는 형광 염료일 수 있다.

본 발명의 다른 특징 및 이점은 상세한 설명, 도면으로부터 그리고 특허청구범위로부터 명확하게 될 것이다.

도 1a 내지 도 1i는 몇몇의 예시적인 gRNA의 표현이다.
도 1a는 듀플렉스 구조로서 스트렙토코커스 피오게네스로부터 부분적으로 유래된(또는 부분적으로 서열 상에서 모델링된) 모듈 gRNA 분자를 도시하며(출현 순서대로 각각 서열번호 39 및 40);
도 1b는 듀플렉스 구조로서 스트렙토코커스 피오게네스로부터 부분적으로 유래된 단분자 gRNA 분자를 도시하며(서열번호 41);
도 1c는 듀플렉스 구조로서 스트렙토코커스 피오게네스로부터 부분적으로 유래된 단분자 gRNA 분자를 도시하며(서열번호 42);
도 1d는 듀플렉스 구조로서 스트렙토코커스 피오게네스로부터 부분적으로 유래된 단분자 gRNA 분자를 도시하며(서열번호 43);
도 1e는 듀플렉스 구조로서 스트렙토코커스 피오게네스로부터 부분적으로 유래된 단분자 gRNA 분자를 도시하며(서열번호 44);
도 1f는 듀플렉스 구조로서 스트렙토코커스 써모필러스로부터 부분적으로 유래된 모듈 gRNA 분자를 도시하며(출현 순서로 각각 서열번호 45 및 46);
도 1g는 스트렙토코커스 피오게네스 및 스트렙토코커스 써모필러스의 모듈 gRNA 분자의 정렬을 도시한다(출현 순서로 각각 서열번호 39, 45, 47 및 46).
도 1h 내지 도 1i는 단분자 gRNA 분자의 추가의 예시적인 구조를 도시한다.
도 1h는 듀플렉스 구조로서 스트렙토코커스 피오게네스로부터 부분적으로 유래된 단분자 gRNA 분자의 예시적인 구조를 보여준다(서열번호 42).
도 1i는 듀플렉스 구조로서 스타필로코커스 아우레우스로부터 부분적으로 유래된 단분자 gRNA 분자의 예시적인 구조를 보여준다(서열번호 38).
도 2a 내지 도 2g는 Cas9 서열의 정렬을 도시한다(문헌[Chylinski 2013]). N-말단 RuvC-유사 도메인은 네모 안에 있으며, "Y"로 표시되어 있다. 다른 2개의 RuvC-유사 도메인은 네모 안에 있으며, "B"로 표시되어 있다. HNH-유사 도메인은 네모 안에 있으며, "G"로 표시되어 있다. Sm: 스트렙토코커스 뮤탄스(S. mutans)(서열번호 1); Sp: 스트렙토코커스 피오게네스(서열번호 2); St: 스트렙토코커스 써모필러스(서열번호 4); 및 Li: 리스테리아 이노쿠아(L. innocua)(서열번호 5). "모티프"(서열번호 14)는 4개의 서열을 기반으로 한 공통 서열이다. 4개 모두의 서열에서 보존된 잔기는 단일 문자 아미노산 약어로 표시되어 있고; "*"는 4개 서열 중 임의의 것의 상응하는 위치에서 발견되는 임의의 아미노산을 표시하며; "-"는 부재함을 표시한다.
도 3a 및 도 3b는 문헌[Chylinski 2013]에 개시된 Cas9 분자 유래의 N-말단 RuvC-유사 도메인의 정렬을 보여준다(서열번호 52 내지 95, 120 내지 123). 도 3b의 마지막 줄은 4개의 고도로 보존된 잔기를 나타낸다.
도 4a 및 도 4b는 서열 이상점(outlier)이 제거된 문헌[Chylinski 2013]에 개시된 Cas9 분자 유래의 N-말단 RuvC-유사 도메인의 정렬을 보여준다(서열번호 52 내지 123). 도 4b의 마지막 선은 3개의 고도로 보존된 잔기를 나타낸다.
도 5a 내지 도 5c는 문헌[Chylinski 2013]에 개시된 Cas9 분자 유래의 HNH-유사 도메인의 정렬을 보여준다(서열번호 124 내지 198). 도 5c의 마지막 선은 보존된 잔기를 나타낸다.
도 6a 및 도 6b는 서열 이상점이 제거된 문헌[Chylinski 2013]에 개시된 Cas9 분자 유래의 HNH-유사 도메인의 정렬을 보여준다(서열번호 124 내지 141, 148, 149, 151 내지 153, 162, 163, 166 내지 174, 177 내지 187, 194 내지 198). 도 6b의 마지막 선은 3개의 고도로 보존된 잔기를 나타낸다.
도 7은 예시적인 gRNA 서열(서열번호 42)을 사용한 gRNA 도메인 명명법을 예시한 것이다.
도 8a 및 도 8b는 스트렙토코커스 피오게네스 Cas9의 도메인 구성의 개략적 표현을 제공한다. 도 8a는 Cas9의 2개의 엽(인식(REC) 및 뉴클레아제(NUC) 엽)과 관련하여, 아미노산 위치를 포함한 Cas9 도메인의 구성을 보여준다. 도 8b는 83개의 Cas9 오솔로그(ortholog)에 걸친 각 도메인의 상동성 백분율을 보여준다.
도 9a는 DSF에 의해 결정시 gRNA의 부재 하의 스타필로코커스 아우레우스 Cas9의 열 안정성을 도시한다.
도 9b는 DSF에 의해 결정시 gRNA의 부재 하의 스트렙토코커스 피오게네스 Cas9의 열 안정성을 도시한다.
도 10은 DSF에 의해 결정시, (1) 스트렙토코커스 피오게네스 Cas9, (2) 스트렙토코커스 피오게네스 gRNA의 존재 하의 스트렙토코커스 피오게네스 Cas9, 및 (3) 스타필로코커스 아우레우스 gRNA의 존재 하의 스트렙토코커스 피오게네스 Cas9의 열 안정성을 도시한다.
도 11a는 DSF에 의해 결정시, (1) 스타필로코커스 아우레우스 Cas9 및 (2) CD3을 표적화하는 gRNA와 함께 스타필로코커스 아우레우스 Cas9의 열 안정성을 도시한다.
도 11b는 Jurkat T 세포로의 스타필로코커스 아우레우스 Cas9 및 CD3을 표적화하는 gRNA의 전달 후의 생성 CD3 음성 집단을 보여주는 예시적인 FACS 분석을 도시한다.

상세한 설명

정의

달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술 및 과학 용어는 본 발명이 속하는 해당 분야의 숙련자에 의해 통상적으로 이해되는 것과 동일한 의미를 가진다. 본 명세서에 기재된 것과 유사하거나 동등한 방법 및 물질이 본 발명의 실시 또는 시험에서 사용될 수 있지만, 적합한 방법 및 물질이 이하에 기재된다. 본 명세서에 언급된 모든 간행물, 특허 출원, 특허 및 다른 참고문헌은 그들의 전문이 참고로 포함된다. 추가로, 물질, 방법 및 실시예는 단지 예시적이며, 제한하는 것으로 의도되지 않는다.

본 명세서에 사용되는 "Alt-HDR", "대안적인 상동성-유도 수선" 또는 "대안적인 HDR"은 상동성 핵산(예를 들어, 내인성 상동성 서열, 예를 들어, 자매 염색분체 또는 외인성 핵산, 예를 들어, 주형 핵산)을 사용한 DNA 손상의 수선 과정을 지칭한다. Alt-HDR은 과정에서 정규 HDR과 상이한 경로를 사용하며, 정규 HDR 매개체, RAD51 및 BRCA2에 의해 억제될 수 있다는 점에서 정규 HDR과 구별된다. 또한, alt-HDR은 파단부의 수선을 위하여 단일-가닥 또는 닉이 있는 상동성 핵산을 사용한다.

본 명세서에 사용되는 "정규 HDR" 또는 정규 상동성-유도 수선은 상동성 핵산(예를 들어, 내인성 상동성 서열, 예를 들어, 자매 염색분체 또는 외인성 핵산, 예를 들어, 주형 핵산)을 사용한 DNA 손상의 수선 과정을 지칭한다. 정규 HDR은 전형적으로 이중 가닥 파단부에 유의미한 절제가 존재하여, DNA의 적어도 하나의 단일 가닥 부분을 형성하는 경우에 작용한다. 정상 세포에서, HDR은 전형적으로, 일련의 단계, 예를 들어, 파단부의 인식, 파단부의 안정화, 절제, 단일 가닥 DNA의 안정화, DNA 교차 중간체의 형성, 교차 중간체의 분리(resolution) 및 라이게이션을 수반한다. 상기 과정은 RAD51 및 BRCA2를 필요로 하며, 상동성 핵산은 전형적으로 이중-가닥이다.

달리 표시되지 않는 한, 본 명세서에 사용되는 용어 "HDR"은 정규 HDR 및 alt-HDR 둘 모두를 포함한다.

본 명세서에 사용되는 "비-상동성 말단 연결" 또는 "NHEJ"는 정규 NHEJ(cNHEJ), 대안적인 NHEJ(altNHEJ), 마이크로상동성-매개의 말단 연결(MMEJ), 단일-가닥 어닐링(SSA) 및 합성-의존성 마이크로상동성-매개의 말단 연결(SD-MMEJ)을 포함하는 라이게이션 매개의 수선 및/또는 비-주형 매개의 수선을 지칭한다.

"획득하다" 또는 "획득하는"은 이 용어가 본 명세서에 사용되는 바와 같이, 물리적 엔티티(entity) 또는 값을 "직접적으로 획득하는" 또는 "간접적으로 획득하는" 또는 값의 경우에 "계산에 의해 획득하는" 것 중 하나 이상 또는 이의 전부에 의한, 물리적 엔티티 또는 값, 예를 들어, 수치의 보유를 얻는 것을 지칭한다.

"직접적으로 획득하는"은 물리적 엔티티 또는 값을 수득하기 위한 과정을 수행하는 것(예를 들어, 합성 또는 분석 방법을 수행하는 것)을 의미한다. 물리적 엔티티를 "직접적으로 획득하는"은 물리적 물질, 예를 들어, 출발 물질의 물리적 변화를 포함하는 과정을 수행하는 것을 포함한다. 예시적인 변화는 둘 이상의 출발 물질로부터 물리적 엔티티의 제조, 물질의 전단 또는 단편화, 물질의 분리 또는 정제, 혼합물 내로 둘 이상의 개별 엔티티의 조합, 공유 또는 비공유 결합의 파단 또는 형성을 포함하는 화학 반응의 수행을 포함한다. 값을 직접적으로 획득하는 것은 시료 또는 다른 물질의 물리적 변화를 포함하는 과정의 수행, 예를 들어, 물질, 예를 들어, 시료, 피분석물 또는 시약의 물리적 변화를 포함하는 분석 과정(때때로, 본 명세서에 "물리적 분석"으로 지칭)의 수행, 분석 방법, 예를 들어, 다음 중 하나 이상을 포함하는 방법의 수행을 포함한다: 물질, 예를 들어, 피분석물, 또는 이의 단편 또는 다른 유도체를 또 다른 물질로부터 분리 또는 정제; 피분석물, 또는 이의 단편 또는 다른 유도체와, 또 다른 물질, 예를 들어, 완충제, 용매, 또는 반응물질의 조합; 또는 예를 들어, 피분석물의 제1 및 제2 원자 사이의 공유 또는 비공유 결합의 파단 또는 형성에 의한 피분석물, 또는 이의 단편 또는 다른 유도체의 구조의 변경; 또는 예를 들어, 시약의 제1 및 제2 원자 사이의 공유 또는 비공유 결합의 파단 또는 형성에 의한 시약, 또는 이의 단편 또는 다른 유도체 구조의 변경.

"간접적으로 획득하는"은 또 다른 사람 또는 공급처(예를 들어, 물리적 엔티티 또는 값을 직접적으로 획득하는 제3자 실험실)로부터 물리적 엔티티 또는 값을 받는 것을 지칭한다. 예를 들어, 당사자는 제2자로부터 값을 획득할 수 있으며(간접적으로 획득), 상기 제2자는 직접적으로 획득하거나, 또는 계산에 의해 획득한다.

"계산에 의해 획득하는"은 예를 들어, 기계, 예를 들어, 컴퓨터에서 수행되는 바와 같은 계산 또는 산정에 의해 값을 획득하는 것을 지칭한다.

본 명세서에서 사용되는 "도메인"은 단백질 또는 핵산의 세그먼트를 기재하기 위해 사용된다. 달리 표시되지 않는 한, 도메인은 임의의 특정 기능적 특성을 가질 필요는 없다.

두 서열 간의 상동성 또는 서열 동일성(상기 용어는 본 명세서에서 상호호환적으로 사용됨)의 계산은 다음과 같이 수행된다. 서열을 최적의 비교 목적을 위해 정렬한다(예를 들어, 갭은 최적의 정렬을 위해 제1 및 제2 아미노산 또는 핵산 서열 중 하나 또는 둘 모두에 도입될 수 있고, 비교 목적을 위해 비-상동성 서열은 무시될 수 있다). 최적의 정렬은 갭 페널티 12, 갭 확장 페널티 4, 및 프레임 이동 갭 페널티 5를 이용한 Blossum 62 점수화 매트릭스를 이용하는 GCG 소프트웨어 패키지의 GAP 프로그램을 이용한 최상의 점수로서 결정된다. 이어서, 상응하는 아미노산 위치 또는 뉴클레오타이드 위치에서 아미노산 잔기 또는 뉴클레오타이드를 비교한다. 제1 서열 내 위치가 제2 서열 내의 상응하는 위치와 동일한 아미노산 잔기 또는 뉴클레오타이드에 의해 점유되면, 분자는 상기 위치에서 동일하다. 두 서열 간의 동일성 백분율은 서열에 의해 공유되는 동일한 위치 수의 함수이다.

본 명세서에 사용되는 "폴리펩타이드"는 100개 미만의 아미노산 잔기를 갖는 아미노산의 폴리머를 지칭한다. 특정 구현예에서, 그것은 50, 20 또는 10개 미만의 아미노산 잔기를 갖는다.

본 명세서에 사용되는 "기준 분자"는 변형된 분자 또는 후보 분자가 비교되는 분자를 지칭한다. 예를 들어, 기준 Cas9 분자는 변형된 Cas9 분자 또는 후보 Cas9 분자가 비교되는 Cas9 분자를 지칭한다. 마찬가지로, 기준 gRNA는 변형된 gRNA 분자 또는 후보 gRNA 분자가 비교되는 gRNA 분자를 지칭한다. 추가로, 기준 Cas9 분자/gRNA 분자 복합체는 Cas9 분자/gRNA 분자 복합체가 비교되는 Cas9 분자/gRNA 분자 복합체를 지칭한다. 변형된 분자 또는 후보 분자는 서열(예를 들어, 변형된 분자 또는 후보 분자는 기준 분자와 X%의 서열 동일성 또는 상동성을 가질 수 있음), 열안정성 또는 활성(예를 들어, 변형된 분자 또는 후보 분자는 X%의 기준 분자의 활성을 가질 수 있음)을 기반으로 하여 기준 분자와 비교될 수 있다. 예를 들어, 기준 분자가 Cas9 분자인 경우, 변형된 분자 또는 후보 분자는 10% 이하의 기준 Cas9 분자의 뉴클레아제 활성을 갖는 것을 특징으로 할 수 있다. 기준 Cas9 분자의 예에는 자연 발생 비변형 Cas9 분자, 예를 들어, 스트렙토코커스 피오게네스, 스타필로코커스 아우레우스, 스트렙토코커스 써모필러스 또는 나이세리아 메닌지티디스(N. meningitidis)로부터의 자연 발생 Cas9 분자가 포함된다. 특정 구현예에서, 기준 Cas9 분자는 그것이 비교되는 변형된 Cas9 분자 또는 후보 Cas9 분자와 가장 가까운 서열 동일성 또는 상동성을 갖는 자연 발생 Cas9 분자이다. 특정 구현예에서, 기준 Cas9 분자는 돌연변이가 변형된 Cas9 분자 또는 후보 Cas9 분자에 도달하도록 이루어지는 자연 발생 서열 또는 공지된 서열을 갖는 모 분자이다.

본 명세서에 사용되는 "기준 값"은 미리 선택된 수치인 기준 값을 지칭한다. 미리 선택된 수치는 단일의 수 또는 범위일 수 있다. 특정 구현예에서, 기준 값은 기준 분자의 값과 상호연관된 값을 포함할 수 있다. 특정 구현예에서, 기준 값은 열안정성 기준 값일 수 있다. 특정 구현예에서, 열안정성 기준 값은 열안정성에 대한 미리 선택된 수치이다. 특정 구현예에서, 열안정성 기준 값은 기준 분자의 열안정성 값과 상호연관된 값을 포함할 수 있다. 특정 구현예에서, 열안정성 기준 값은 열안정성과 상호연관된 파라미터를 포함할 수 있다. 특정 구현예에서, 열안정성 기준 값은 변성 온도 기준 값 또는 용융 온도(T_m) 기준 값일 수 있다. 특정 구현예에서, 변성 온도 기준 값은 변성에 대한 미리 선택된 수치이다. 특정 구현예에서, 변성 온도 기준 값은 기준 분자의 변성 온도 값과 상호연관된 값을 포함할 수 있다. 특정 구현예에서, 변성 온도 기준 값은 변성과 상호연관된 파라미터를 포함할 수 있다. 특정 구현예에서, T_m 기준 값은 T_m에 대한 미리 선택된 수치일 수 있다. 특정 구현예에서, T_m 기준 값은 미리 결정된 역치 T_m일 수 있다. 특정 구현예에서, T_m 기준 값은 기준 분자의 T_m 값과 상호연관된 값을 포함할 수 있다. 특정 구현예에서, T_m 기준 값은 T_m과 상호연관된 파라미터를 포함할 수 있다. 특정 구현예에서, 기준 값은 활성 기준 값일 수 있다. 특정 구현예에서, 활성 기준 값은 기준 분자의 활성 값과 상호연관된 값을 포함할 수 있다. 특정 구현예에서, 활성 기준 값은 활성과 상호연관된 파라미터를 포함할 수 있다. 특정 구현예에서, 활성 기준 값은 절단 기준 값 또는 결합 기준 값일 수 있다. 특정 구현예에서, 절단 기준 값은 핵산의 절단에 대한 미리 선택된 수치일 수 있다. 특정 구현예에서, 결합 기준 값은 2개 이상의 분자의 결합에 대한 미리 선택된 수치일 수 있다. 특정 구현예에서, 기준 값은 델타 기준 값일 수 있다. 특정 구현예에서, 델타 기준 값은 델타 값에 대한 미리 선택된 수치일 수 있다.

본 명세서에 사용되는 "델타 값"은 2개의 값 사이의 차이 또는 변화를 나타내는 값이다. 예를 들어, 특정 구현예에서, 델타 값은 평가 중인 Cas9 분자/gRNA 분자 복합체의 열안정성 값과, 기준 분자의 열안정성 값 또는 열안정성 기준 값 사이의 차이를 나타내는 값일 수 있다. 특정 구현예에서, 델타 값은 평가 중인 Cas9 분자/gRNA 분자 복합체의 활성 값과, 기준 분자의 활성 값 또는 활성 기준 값 사이의 차이를 나타내는 값일 수 있다.

분자의 변형과 관련하여 본 명세서에 사용되는 "대체", 또는 "대체되는"은 처리 제한을 필요로 하지 않고, 단지 대체 엔티티가 존재하는 것만을 나타낸다.

본 명세서에 사용되는 "대상체"는 인간 또는 비-인간 동물 중 어느 하나를 의미할 수 있다. 상기 용어는 포유동물(예를 들어, 인간, 다른 영장류, 돼지, 설치류(예를 들어, 마우스 및 랫트 또는 햄스터), 토끼, 기니피그, 소, 말, 고양이, 개, 양 및 염소)을 포함하지만, 이들로 제한되지 않는다. 특정 구현예에서, 대상체는 인간이다. 또 다른 구현예에서, 대상체는 가금류이다. 특정 구현예에서, 대상체는 인간이며, 이들 중 특정 구현예에서, 인간은 유아, 소아, 청소년 또는 성인이다.

아미노산 서열의 맥락에서, 본 명세서에 사용되는 "X"는 다르게 특정되지 않는 한 임의의 아미노산(예를 들어, 20가지의 천연 아미노산 중 임의의 것)을 지칭한다.

본 명세서에 사용되는 "약"은 명시된 값 또는 값의 범위의 10% 이내를 의미한다.

본 명세서에 사용되는 "Cas9 분자" 또는 "Cas9 폴리펩타이드"는 각각 gRNA 분자와 상호작용하고, gRNA 분자와 협력하여 표적 도메인 및 특정 구현예에서, PAM 서열을 포함하는 부위에 국소화할 수 있는 분자 또는 폴리펩타이드를 지칭한다. Cas9 분자 및 Cas9 폴리펩타이드는 자연 발생 Cas9 분자 및 Cas9 폴리펩타이드, 및 기준 서열, 예를 들어, 가장 유사한 자연 발생 Cas9 분자와 예를 들어, 적어도 하나의 아미노산 잔기가 상이한 조작되거나, 변경되거나, 또는 변형된 Cas9 분자 또는 Cas9 폴리펩타이드 둘 모두를 포함한다.

개요

본 발명자들은 DSF에 의해 결정시 Cas9 분자/gRNA 분자 복합체의 안정성이 Cas9 분자/gRNA 분자 복합체의 다양한 특성과 상호연관되는 것을 발견하였다. 이와 같이, 안정성의 결정을 사용하여 다양한 특성, 예를 들어, 표적을 절단하는 능력, 특정 경로, 예를 들어, HDR 또는 NHEJ에 의해 결정될 Cas9 분자/gRNA 분자 복합체에 의해 매개되는 절단 사건의 경향, 표적을 조절하는 능력 또는 미리 선택된 전달 방법에 대한 적합성에 대하여 Cas9 분자/gRNA 분자 복합체(또는 이의 구성성분)를 평가할 수 있다. 또한, 안정성의 결정을 사용하여, 예를 들어, Cas9 분자/gRNA 분자 복합체의 효능 또는 강건성에 대하여, 그리고 일반적으로 Cas9 분자/gRNA 분자 복합체 내의 포함에 대하여 Cas9 분자, gRNA 분자, 복합체의 제조 방법(예를 들어, 구성성분의 비 또는 화학량론) 또는 추가의 구성성분의 첨가를 평가할 수 있다.

개시된 실험 결과에 기반하여, Cas9/분자 gRNA 분자 복합체의 열안정성을 측정하는 단계를 포함하는 방법이 본 명세서에 제공된다. 단백질의 열안정성은 유리한 조건, 예를 들어, 결합 RNA 분자, 예를 들어, gRNA의 첨가 하에 증가할 수 있다. 따라서, Cas9/gRNA 복합체의 열안정성에 관한 정보는 복합체가 안정한지 여부의 결정에 유용하다. Cas9/분자 gRNA 분자 복합체의 열안정성을 측정하는 단계를 포함할 수 있는 방법은 제한 없이, Cas9 분자/gRNA 분자 복합체의 안정성의 결정 방법, 안정한 Cas9 분자/gRNA 분자 복합체를 촉진시키는 조건의 결정 방법, 안정한 Cas9 분자/gRNA 분자 복합체에 대한 스크리닝 방법, 안정한 Cas9 분자/gRNA 분자 복합체를 형성하기 위한 최적의 gRNA의 확인 방법, 대상체로의 투여를 위한 Cas9/gRNA 복합체에 대한 스크리닝 방법 및 대상체로의 투여를 위한 Cas9/gRNA 복합체의 선택 방법을 포함한다. 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 열안정성 값을 측정할 수 있다. 추가로, 특정 구현예에서, 기준 분자의 열안정성 값도 또한 측정할 수 있다. 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 열안정성 값이 기준 분자의 열안정성 값 또는 본 명세서에 기재된 바와 같은 열안정성 기준 값보다 더 크면, Cas9 분자/gRNA 분자 복합체는 안정한 것으로 결정될 수 있다. 특정 구현예에서, 기준 분자는 gRNA 분자 부재의 Cas9 분자일 수 있다. 특정 구현예에서, 측정되는 열안정성 값은 변성 온도 값일 수 있다. 이들 구현예에서, 열안정성 기준 값은 변성 온도 기준 값이다. 특정 구현예에서, 측정되는 열안정성 값은 T_m 값일 수 있다. 이들 구현예에서, 열안정성 기준 값은 T_m 기준 값일 수 있다. 특정 구현예에서, 열안정성 값은 열 변화 분석을 사용하여 측정될 수 있다. 본 명세서에 개시된 바와 같이, DSF는 단백질의 열안정성을 측정하는데 사용될 수 있는 기법이다. 특정 구현예에서, 열안정성을 측정하는데 사용되는 열 변화 분석은 DSF, 시차 주사 열량계(DSC) 또는 등온 적정 열량계(ITC)일 수 있다. 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 열안정성 값이 기준 분자의 열안정성 값 또는 열안정성 기준 값보다 더 크면, Cas9 분자/gRNA 분자 복합체는 안정한 것으로 결정될 수 있다. 예를 들어, 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 열안정성 값이 기준 분자의 열안정성 값 또는 열안정성 기준 값보다 적어도 8℃ 더 크면, Cas9 분자/gRNA 분자 복합체는 안정한 것으로 결정될 수 있다. 특정 구현예에서, 기준 분자는 gRNA 분자의 부재 하의 기준 Cas9 분자일 수 있다. 특정 구현예에서, 열안정성 값을 측정하는 단계를 포함하는 방법은 본 명세서에 기재된 바와 같은 Cas9 분자/gRNA 분자 복합체의 활성 값을 측정하는 것을 포함하는 단계를 추가로 포함할 수 있다.

또한, 개시된 실험 결과에 기반하여, 복합체의 안정성의 결정에도 유용할 수 있는 Cas9/분자 gRNA 분자 복합체의 활성을 측정하는 단계를 포함하는 방법이 본 명세서에 제공된다. Cas9/분자 gRNA 분자 복합체의 활성을 측정하는 단계를 포함할 수 있는 방법은 제한 없이, Cas9 분자/gRNA 분자 복합체의 안정성의 결정 방법, 안정한 Cas9 분자/gRNA 분자 복합체를 촉진시키는 조건의 결정 방법, 안정한 Cas9 분자/gRNA 분자 복합체에 대한 스크리닝 방법, 안정한 Cas9 분자/gRNA 분자 복합체를 형성하기 위한 최적의 gRNA의 확인 방법, 대상체로의 투여를 위한 Cas9 분자/gRNA 분자 복합체에 대한 스크리닝 방법 및 대상체로의 투여를 위한 Cas9 분자/gRNA 분자 복합체의 선택 방법을 포함한다. 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 활성 값을 검출할 수 있다. 추가로, 특정 구현예에서, 기준 분자의 활성 값을 검출할 수 있다. 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 활성 값이 기준 분자의 활성 값 또는 활성 기준 값보다 더 크면, Cas9 분자/gRNA 분자 복합체는 안정한 것으로 결정될 수 있다. 특정 구현예에서, 검출 중인 활성은 결합 활성일 수 있다. 특정 구현예에서, 결합 활성은 제한 없이, DNA 표적에 계속 혼성화되는 gRNA 분자의 능력, Cas9 분자/gRNA 분자 복합체의 Cas9 분자에 결합하는 gRNA 분자의 능력, 또는 Cas9 분자/gRNA 분자 복합체의 Cas9 분자에 결합하는 gRNA 분자의 능력을 포함할 수 있다. 특정 구현예에서, 분자의 결합 값을 측정할 수 있다. 특정 구현예에서, 평가 중인 분자의 결합 값이 기준 분자의 결합 값 또는 결합 기준 값보다 더 크면, Cas9 분자/gRNA 분자 복합체는 선택되거나, 안정한 것으로 결정될 수 있다. 특정 구현예에서, 활성은 절단 활성이다. 절단 활성의 일부 예는 제한 없이, 표적을 절단하는 Cas9 분자/gRNA 분자 복합체의 능력, 특정 경로, 예를 들어, HDR 또는 NHEJ에 의해 결정될 Cas9 분자/gRNA 분자 복합체에 의해 매개되는 절단 사건의 경향, 표적을 조절하는 Cas9 분자/gRNA 분자 복합체의 능력 중 임의의 하나 이상을 포함할 수 있다. 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 절단 값을 측정할 수 있다. 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 절단 값이 기준 분자의 절단 값 또는 절단 기준 값보다 더 크면, Cas9 분자/gRNA 분자 복합체는 선택되거나, 안정한 것으로 결정될 수 있다.

본 명세서에 개시된 방법은 복수의 시료에서 수행될 수 있다. 예를 들어, 특정 구현예에서, 상기 방법은 복수의 시료를 생성하는 단계를 포함할 수 있으며, 각 시료는 Cas9 분자와, 복수의 gRNA 분자 중 하나를 조합함으로써 생성되는 Cas9 분자/gRNA 분자 복합체를 포함한다. 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 열안정성 값 및/또는 활성 값을 복수의 시료의 각각에서 검출할 수 있다. 특정 구현예에서, Cas9 분자/gRNA 분자 복합체를 포함하는 적어도 하나의 시료는 복수의 시료로부터 선택될 수 있다. 특정 구현예에서, Cas9 분자/gRNA 분자 복합체를 포함하는 시료는 (i) 기준 복합체의 T_m 또는 미리 결정된 역치 T_m과 복수의 시료의 T_m의 비교, 또는 (ii) 복수의 시료의 T_m 값의 상대적 순서화 중 하나 이상에 기반하여 선택될 수 있다.

특정 구현예에서, 상기 방법은 복수의 Cas9 분자/gRNA 분자 복합체를 생성하는 단계를 포함할 수 있으며, 각각은 Cas9 분자와, 복수의 gRNA 분자 중 하나를 조합함으로써 생성되는 Cas9 분자/gRNA 분자 복합체를 포함한다. 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 열안정성 값을 복수의 Cas9 분자/gRNA 분자 복합체의 각각에 대하여 검출할 수 있다. 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 열안정성 값이 기준 분자의 열안정성 값 또는 열안정성 기준 값보다 더 크면, Cas9 분자/gRNA 분자 복합체는 안정한 것으로 결정될 수 있다. 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 활성 값을 복수의 Cas9 분자/gRNA 분자 복합체의 각각에 대하여 검출할 수 있다. 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 활성 값이 기준 분자의 활성 값 또는 활성 기준 값보다 더 크면, Cas9 분자/gRNA 분자 복합체는 안정한 것으로 결정될 수 있다.

또한, 본 명세서에 개시되는 방법 중 임의의 것을 사용하여 생성되는 비-자연 발생 Cas9 분자/gRNA 분자 복합체가 본 명세서에 제공된다.

본 명세서에 기재된 방법을 사용하여 생성되는 Cas9 분자/gRNA 분자 복합체 중 임의의 것을 포함할 수 있는 조성물이 본 명세서에 제공된다. 예를 들어, 본 명세서에서 조성물은 본 명세서에 제공되는 방법에 따라 선택되는 기준 분자의 T_m 또는 T_m 기준 값보다 적어도 8℃ 더 큰 T_m을 갖는 Cas9 분자 및 gRNA 분자의 분리된 복합체를 포함할 수 있다.

또한, 본 명세서에 기재된 방법 중 임의의 것을 사용하여 생성되는 Cas9 분자/gRNA 분자 복합체를 인코딩(encoding)하는 핵산을 포함하는 벡터계가 본 명세서에 제공된다.

본 명세서에 기재된 방법 중 임의의 것을 사용하여 생성되는 Cas9 분자/gRNA 분자 복합체를 전달하는 단계를 포함하는 표적 세포로의 Cas9 분자/gRNA 분자 복합체의 전달 방법이 본 명세서에 제공된다.

개시된 실험 결과에 기반한, Cas9 분자/gRNA 분자 복합체 또는 이의 구성성분의 평가, 선택, 최적화 또는 설계 방법이 본 명세서에 제공된다. 특정 구현예에서, 이들 방법은 Cas9 분자/gRNA 분자 복합체 또는 이의 제제에서 Cas9 분자의 안정성 값(즉, 안정성과 상호연관되는 값(예를 들어, 열안정성 값 또는 활성 값))을 획득하거나 결정하는 단계를 포함한다. 특정 구현예에서, 안정성 값은 Cas9 분자/gRNA 분자 복합체 또는 이의 제제에서의 Cas9 분자의 열안정성 값 또는 활성 값일 수 있다. 특정 구현예에서, 열안정성 값은 T_m 값 또는 변성 온도 값일 수 있으며, 특정 구현예에서, 열안정성 값은 DSF를 사용하여 획득되거나 결정된다. 특정 구현예에서, 안정성 값을 gRNA 분자와 복합체화된 Cas9 분자에 대하여 획득한다. 다른 구현예에서, 안정성 값을 gRNA 분자의 존재 하의 Cas9 분자에 대하여 획득한다. 특정 구현예에서, 안정성 값을 열안정성 기준 값(즉, 열안정성과 상호연관되는 파라미터), 예를 들어, T_m 기준 값 또는 활성 기준 값(즉, 활성과 상호연관되는 파라미터), 예를 들어, 절단 활성, 예를 들어, 표적 DNA를 절단하는 능력과 비교한다. 예를 들어, 안정성 값은 T_m 값이며, T_m 값을 T_m 기준 값과 비교하여, T_m 값이 T_m 기준 값과 동일한지, 그보다 큰지, 또는 그보다 낮은지 여부를 결정할 수 있다.

특정 구현예에서, 본 명세서에 개시되는 방법을 사용하여, 최적의 Cas9 분자/gRNA 쌍형성, 예를 들어, 최대 안정성 또는 요망되는 표적 범위에 포함되는 안정성으로의 쌍형성을 선택하거나 설계한다. 특정 구현예에서, 상기 방법을 사용하여, 특정 Cas9 분자와의 쌍형성을 위한 하나 이상의 gRNA를 선택하거나 설계하여, 예를 들어, 안정성이 가장 크게, 특정 Cas9 분자와 복합체화하는 gRNA 분자를 확인한다. 다른 구현예에서, 상기 방법을 사용하여, 특정 gRNA 또는 gRNA의 세트와의 쌍형성을 위한 Cas9 분자를 선택하여, 예를 들어, 안정성이 가장 크게, 특정 gRNA(들)와 복합체화하는 Cas9 분자를 확인한다. 또 다른 구현예에서, 상기 방법을 사용하여, Cas9 분자/gRNA 분자 복합체에서의 쌍형성을 위한 Cas9 분자 및 gRNA 또는 gRNA의 세트 둘 모두를 선택한다.

특정 구현예에서, 복합체에서 Cas9 분자의 안정성과 상호연관되는 요망되는 값을 나타내는 Cas9 분자/gRNA 복합체 또는 이의 구성성분, 및 이들 복합체 또는 이의 구성성분을 포함하는 조성물 및 약제학적 제형이 본 명세서에 제공된다. 특정 구현예에서, 이러한 값은 T_m 또는 변성 온도일 수 있으며, 특정 구현예에서, 값은 DSF를 사용하여 획득되거나 결정된다. 이들 중 특정 구현예에서, 본 명세서에 제공되는 방법을 사용하여 복합체가 생성된다.

특정 구현예에서, 열안정성 값을 비교하는 단계를 포함하는 방법이 본 명세서에 제공된다. 특정 구현예에서, 상기 방법은 열안정성 값을 열안정성 기준 값과 비교하는 단계를 포함한다. 특정 구현예에서, 열안정성 기준 값은 미리 선택된 수치(여기서, 값은 단일의 수 또는 범위일 수 있음), 예를 들어, 열안정성에 대한 미리 선택된 수치, 예를 들어, T_m 값을 포함한다. 특정 구현예에서, 열안정성 기준 값은 a) 기준 Cas9 분자, 예를 들어, gRNA 분자의 부재 하의, 평가 중인 복합체에서의 Cas9 분자와 동일한 Cas9 분자(또는 상이한 Cas9 분자); b) 제2 gRNA 분자(즉, 평가 중인 복합체의 gRNA 이외의 gRNA)와 복합체화되는 기준 Cas9 분자(예를 들어, 평가 중인 복합체에서의 Cas9 분자와 동일한 Cas9 분자); 또는 c) 기준 Cas9 분자/gRNA 분자 복합체로서, 기준 Cas9 분자/gRNA 분자가 Cas9 분자/gRNA 분자 복합체와 상이한 조건 하에, 예를 들어, 상이한 비의 Cas9 분자 및 gRNA 분자로 형성되거나, 상이한 완충제에서 형성되는 기준 Cas9 분자/gRNA 분자 복합체의 열안정성과 상호연관되는 값일 수 있다.

특정 구현예에서, 기준 Cas9 분자가 본 명세서에 제공된다. 특정 구현예에서, 기준 Cas9 분자는 평가 중인 복합체의 Cas9 분자와 동일할 수 있다. 특정 구현예에서, 기준 Cas9 분자는 평가 중인 복합체의 Cas9 분자와 상이할 수 있으며, 예를 들어, 이와 일차 서열이 상이하다. 특정 구현예에서, 기준 Cas9 분자/gRNA 분자 복합체의 gRNA 분자는 평가 중인 복합체의 gRNA 분자와 동일할 수 있다. 특정 구현예에서, 기준 Cas9 분자/gRNA 분자 복합체의 gRNA 분자는 gRNA 분자와 상이할 수 있으며, 예를 들어, 서열이 상이하거나, 변형에 의해 상이하다.

본 명세서에 제공되는 특정 구현예에서, 델타 값(예를 들어, 델타 값은 2개의 값 간의 차이 또는 변화임)을 획득, 예를 들어, 결정할 수 있다. 특정 구현예에서, 델타 값은 평가 중인 Cas9 분자/gRNA 분자 복합체의 안정성과 기준 값의 차이와 상호연관된 값을 포함할 수 있다. 특정 구현예에서, 델타 값은 평가 중인 Cas9 분자/gRNA 분자 복합체의 안정성, 예를 들어, 변성 온도 또는 T_m과; 기준 값, 예를 들어, 기준 Cas9 분자/gRNA 분자 복합체에 대한 값의 안정성, 예를 들어, 변성 온도 또는 T_m 사이의 차이와 상호연관된 값을 포함할 수 있다.

본 명세서에 제공되는 특정 구현예에서, 상기 방법은 델타 값을 델타 기준 값(예를 들어, 델타 값에 대한 기준 값)과 비교하는 단계를 포함할 수 있다. 특정 구현예에서, 이는 델타 값이 델타 기준 값 이하인지; 델타 기준 값 이상인지; 또는 미리 결정된 범위의 델타 기준 값 이내인지를 평가하는 것을 포함할 수 있다.

본 명세서에 제공되는 특정 구현예에서, 상기 방법은 Cas9 분자/gRNA 분자 복합체(또는 이의 구성성분)를 선택하는 단계를 포함할 수 있다. 특정 구현예에서, 상기 방법은 Cas9 분자/gRNA 분자 복합체의 값(예를 들어, 열안정성 값(예를 들어, T_m 값), 활성 값 또는 델타 값을 포함하지만 이들로 제한되지 않음)과 기준 값의 비교에 기반하여, Cas9 분자/gRNA 분자 복합체(또는 이의 구성성분)를 선택하는 단계를 포함할 수 있다. 특정 구현예에서, 기준 값은 미리 결정된 역치, 상한 값, 표적 값을 포함하지만, 이들로 제한되지 않을 수 있다. 특정 구현예에서, 값은 델타 값일 수 있다. 특정 구현예에서, 기준 값은 델타 기준 값일 수 있다.

특정 구현예에서, 상기 방법은 델타 값이 델타 기준 값 이하인지; 델타 기준 값 이상인지; 미리 결정된 델타 기준 값의 범위 이내인지를 평가하는 단계를 포함할 수 있다.

특정 구현예에서, 상기 방법은 또한 선택된 Cas9 분자/gRNA 분자 복합체(또는 이의 구성성분)의 활성 또는 특성을 평가하거나 측정하는 단계를 포함할 수 있다. 특정 구현예에서, 활성은 절단 활성, 예를 들어, 절단 능력일 수 있다. 특정 구현예에서, 활성은 성공적으로 전달되는 능력일 수 있다. 특정 구현예에서, 활성은 결합 활성, 예를 들어, DNA 표적에 계속 혼성화되는 gRNA 분자의 능력일 수 있다.

특정 구현예에서, 평가 단계는 시스템, 예를 들어, 시험관내 시스템, 생체외 시스템 또는 생체내 시스템 및 분석, 예를 들어, 세포 분석 또는 모델, 예를 들어, 세포 또는 동물 모델에서 선택된 Cas9 분자/gRNA 분자 복합체(또는 이의 구성성분)의 활성을 평가하거나 측정하는 것을 포함할 수 있다.

특정 구현예에서, 평가 단계는 선택된 Cas9 분자/gRNA 분자 복합체(또는 이의 구성성분)의 활성을 평가하거나 측정하는 것을 포함할 수 있다. 특정 구현예에서, 활성은 절단 활성, 예를 들어, 삽입결실을 유도하는 능력, 표적 DNA를 변형시키는 능력, Cas9 분자/gRNA 분자 복합체에 의해 촉매작용되는 절단 사건을 매개하는 미리 선택된 수선 방법, 예를 들어, 본 명세서에 기재되는 경로, 예를 들어, HDR 또는 NHEJ의 경향일 수 있다. 특정 구현예에서, 활성은 결합 활성, 예를 들어, DNA 표적에 계속 혼성화되는 gRNA 분자의 능력일 수 있다.

특정 구현예에서, 상기 방법은 활성을 위하여 Cas9 분자/gRNA 분자 복합체(또는 이의 구성성분)를 선택하는 단계를 포함할 수 있다. 예를 들어, 활성은 절단 활성, 예를 들어, 삽입결실을 유도하는 능력; 표적 DNA를 변형시키는 능력; Cas9 분자/gRNA 분자 복합체에 의해 촉매작용되는 절단 사건을 매개하는 미리 선택된 수선 방법, 예를 들어, 본 명세서에 기재되는 경로, 예를 들어, HDR 또는 NHEJ의 경향일 수 있다. 특정 구현예에서, 활성은 결합 활성, 예를 들어, DNA 표적에 계속 혼성화되는 gRNA 분자의 능력일 수 있다.

특정 구현예에서, 상기 방법은 활성을 위하여 Cas9 분자/gRNA 분자 복합체(또는 이의 구성성분)를 설계하거나 최적화시키는 단계를 포함할 수 있다. 예를 들어, 활성은 절단 활성, 예를 들어, 삽입결실을 유도하는 능력; 표적 DNA를 변형시키는 능력; Cas9 분자/gRNA 분자 복합체에 의해 촉매작용되는 절단 사건을 매개하는 미리 선택된 수선 방법, 예를 들어, 본 명세서에 기재되는 경로, 예를 들어, HDR 또는 NHEJ의 경향일 수 있다. 특정 구현예에서, 활성은 결합 활성, 예를 들어, DNA 표적에 계속 혼성화되는 gRNA 분자의 능력일 수 있다.

특정 구현예에서, 상기 방법은 적어도 X가지의 Cas9 분자/gRNA 분자 복합체의 Cas9 분자의 안정성을 결정하는 단계를 포함할 수 있다. 특정 구현예에서, X는 2, 3, 4, 5, 10, 20, 30, 40, 50, 100, 500 또는 1,000일 수 있다. 특정 구현예에서, 안정성을 결정하는 단계는 Cas9 분자의 안정성 값을 측정하는 것을 포함할 수 있다. 특정 구현예에서, 안정성 값은 열안정성 값일 수 있다. 특정 구현예에서, 열안정성 값은 T_m 값일 수 있다. 특정 구현예에서, T_m 값은 DSF에 의해 결정될 수 있다.

특정 구현예에서, 안정성을 결정하는 단계는 Cas9 분자/gRNA 분자 복합체의 Cas9 분자가 변성하는 온도를 결정하는 것, 예를 들어, T_m 값을 결정하는 것을 포함할 수 있다. 특정 구현예에서, T_m 값은 DSF에 의해 결정될 수 있다.

특정 구현예에서, 상기 방법은 Cas9 분자/gRNA 분자 복합체의 Cas9 분자가 변성하는 온도를 DSF에 의해 결정하는 단계, 예를 들어, 제1 Cas9 분자/gRNA 분자 복합체 및 제2 Cas9 분자/gRNA 분자 복합체에 대한 T_m 값을 결정하는 단계를 포함할 수 있다.

특정 구현예에서, 적어도 X가지의 Cas9 분자/gRNA 분자 복합체 중 제1 Cas9 분자/gRNA 분자 복합체 및 제2 Cas9 분자/gRNA 분자 복합체는 상이한 서열의 Cas9 분자를 갖는 것, 서열이 상이하거나 변형에 의해, 캡핑(capping) 또는 테일링(tailing)에 의해 상이한 gRNA 분자를 갖는 것, 상이한 조건, 예를 들어, 상이한 화학량론 하에 형성되는 것이 상이하다.

특정 구현예에서, 안정성의 결정에 대응하여, 최적화된 또는 미리 선택된 전달 특징을 위해 Cas9 분자/gRNA 분자 복합체(또는 이의 구성성분)를 선택할 수 있으며, 예를 들어, 전달은 RNP 양이온성 지질 트랜스펙션, 바이러스 벡터(예를 들어, AAV) 또는 RNA 트랜스펙션에 의한 전달을 포함한다.

특정 구현예에서, 안정성의 결정에 대응하여, 품질 제어 표준과의 최적화된 또는 미리 선택된 관계를 위해 Cas9 분자/gRNA 분자 복합체(또는 이의 구성성분)가 선택된다.

특정 구현예에서, 안정성의 결정에 대응하여, Cas9 분자/gRNA 분자 복합체(또는 이의 구성성분)는 품질 제어 또는 방출 표준을 만족시키는 것으로서 선택될 수 있다.

특정 구현예에서, 본 명세서의 방법은 열안정성 값, 예를 들어, T_m 값 또는 변성 온도 값 또는 델타 값이 기준 값 또는 델타 기준 값과 미리 선택된 관계를 가지면, Cas9 분자/gRNA 분자 복합체(또는 이의 구성성분)를 선택하는 단계를 포함할 수 있다.

특정 구현예에서, 안정성의 결정에 대응하여, 최적화된 또는 미리 선택된 특징, 예를 들어, 절단 특징을 위해 Cas9 분자/gRNA 분자 복합체(또는 이의 구성성분)가 선택된다.

특정 구현예에서, Cas9 분자/gRNA 분자 복합체에 대한 열안정성 값과 기준 분자, 예를 들어, gRNA 분자의 부재 하의 Cas9 분자의 열안정성 값 사이의 델타 값의 평가에 대응하여, Cas9 분자/gRNA 분자 복합체(또는 이의 구성성분)가 선택된다.

특정 구현예에서, Cas9 분자/gRNA 분자 복합체에 대한 활성 값과, 기준 분자, 예를 들어, gRNA 분자의 부재 하의 Cas9 분자의 활성 값 사이의 델타 값의 평가에 대응하여, Cas9 분자/gRNA 분자 복합체(또는 이의 구성성분)가 선택된다.

특정 구현예에서, 본 명세서의 방법은 후보 gRNA 분자의 라이브러리(또는 단일의 분자), 예를 들어, Cas9 분자와 복합체화된 tracrRNA 분자 또는 서열의 라이브러리를 평가하는 단계 및 Cas9 분자/후보 gRNA 분자 복합체의 안정성의 결정에 대응하여, 후보 gRNA 분자 또는 서열, 예를 들어, 후보 tracr gRNA 분자 또는 서열을 선택하는 단계를 포함할 수 있다.

특정 구현예에서, 라이브러리는 상이한 구조, 예를 들어, 상이한 길이, 상이한 서열의, 또는 상이한 변형을 갖는, 예를 들어, 추가의 포스페이트 기 또는 대안적인 5' 캡 구조를 갖는 tracr RNA 분자 또는 서열을 포함할 수 있다.

특정 구현예에서, tracr RNA 분자 또는 서열은 키메라 gRNA 상에 배치될 수 있다.

특정 구현예에서, 본 명세서의 방법은 구성성분을 포함하는 제제에서 Cas9 분자/gRNA 분자 복합체의 Cas9 분자의 안정성을 평가하는 것을 포함하여, Cas9 분자/gRNA 분자 제제에의 포함을 위해 구성성분을 평가하는 단계를 포함할 수 있다. 특정 구현예에서, 구성성분은 첨가제, 소분자, 안정화 시약, 완충제, pH, 염 농도, 글리세롤 농도 또는 다른 완충제 구성성분을 포함할 수 있다.

특정 구현예에서, 본 명세서의 방법은 Cas9 분자/gRNA 분자 복합체의 Cas9 분자의 안정성을 평가하는 것을 포함하여, Cas9 분자/gRNA 분자 복합체에의 포함을 위하여 후보 Cas9 분자를 평가하는 단계를 포함할 수 있다. 특정 구현예에서, 후보 Cas9 분자는 키메라 Cas9 분자, 또는 합성 또는 조작된 Cas9 분자, 예를 들어, 부분 또는 부분들이 결실된 Cas9 분자를 포함할 수 있다.

특정 구현예에서, 안정성을 결정하는 단계는 Cas9 분자/gRNA 분자 복합체의 Cas9 분자가 변성되는 온도, 예를 들어, Cas9 분자의 T_m을 시차 주사 형광측정법(DSF)에 의해 결정하는 것을 포함할 수 있다.

반응 혼합물이 본 명세서에 제공된다. 반응 혼합물은 Cas9 분자/gRNA 분자 복합체, 예를 들어, 본 명세서에 기재된 Cas9 분자/gRNA 분자 복합체; 및 신호 방출 화합물, 예를 들어, 염료를 포함할 수 있으며, 신호 방출은 Cas9 분자의 변성과 상호연관된다.

그 안에 Cas9 분자/gRNA 분자 복합체; 및 신호 방출 화합물, 예를 들어, 염료가 배치된 시차 주사 형광측정계(DSF)가 본 명세서에 제공되며, 신호 방출은 Cas9 분자의 변성과 상호연관된다.

본 명세서에 기재된 방법에 의해 평가되거나, 선택되거나, 최적화되거나, 선택되는 Cas9 분자/gRNA 분자 복합체가 본 명세서에 제공된다.

본 명세서에 기재된 방법에 의해 선택되거나 설계된 Cas9 분자/gRNA 분자 복합체를 포함하는 조성물이 본 명세서에 제공된다. 특정 구현예에서, 조성물은 약제학적 조성물일 수 있다. 특정 구현예에서, Cas9 분자/gRNA 분자 복합체는 약제학적으로 허용되는 담체에서 제형화될 수 있다.

본 명세서에 논의된 바와 같이, 본 명세서에 개시된 방법을 사용하여 제형 또는 전달을 위해 최적화된 복합체를 평가하거나, 선택하거나, 설계할 수 있다. 예를 들어, 본 명세서에 기재된 방법은 임의의 전달 방법, 예를 들어, 비제한적으로, RNP 양이온성 지질 트랜스펙션, 바이러스 벡터(예를 들어, AAV) 또는 RNA 트랜스펙션을 사용하여 키메라 gRNA 또는 tracrRNA와 Cas9 분자(예를 들어, Cas9 단백질)의 복합체 형성을 개선시키기 위해 다수의 방식으로 사용될 수 있다.

본 명세서에 논의된 방법은 품질 제어를 위해 또는 방출 표준이 단백질 및 RNA 구성성분 둘 모두에 대하여 충족되는지를 결정하기 위해 사용될 수 있다. 예를 들어, 열 변화에 대한 표준이 충족되지 않는다면, 예를 들어, Cas9 단백질을 RNA와 인큐베이션시키는 경우 열 변화가 존재하지 않는 경우, 불충분한 품질의 Cas9 분자 또는 gRNA 분자를 나타낸다. 일 구현예에서, 상기 방법은 예를 들어, 불순물의 검출 및 제거에 의하여 이러한 문제를 해결하기 위한 지침 또는 공정 제어로 사용된다.

본 명세서에 기재된 방법은 Cas9/gRNA 복합체에 사용하기 위하여 후보 Cas9 분자 또는 후보 gRNA 분자의 라이브러리를 평가하기 위해 사용될 수 있다. 일 구현예에서, 상기 방법에 의해 최적화된 결합을 위한 구성성분이 확인된다. 이는 최적화된 표적 절단 또는 기타 특성에 대한 후보의 스크리닝을 가능하게 할 수 있다. 또한, 본 명세서에 기재된 방법을 사용하여, gRNA의 길이 및 조성의 변형을 평가할 수 있다. 예를 들어, 돌연변이 Cas9 단백질을 정제한 후에, gRNA 분자(예를 들어, tracrRNA 분자) 또는 서열의 라이브러리를 미리 선택된 비로, 예를 들어, 최소 1:1의 RNA:단백질 비로 단백질과 인큐베이션시킬 수 있다. gRNA 분자의 부재 하의 Cas9 단백질과 비교하는 경우 관찰되는 열 변화의 출현은 효율적인 gRNA 분자, 예를 들어, 시험관내, 생체외 또는 생체내에서 하나 이상의 CRISPR/Cas-관련 활성을 매개할 수 있는 gRNA 분자를 나타낸다.

본 명세서에 기재된 방법을 사용하여 상이한 길이의 tracr-영역을 갖는 gRNA 분자(예를 들어, tracrRNA 분자) 또는 서열의 라이브러리를 스크리닝하고, 상이한 링커 서열과 융합된 동족 가이드 서열과 조합하고, DSF를 사용하여 결합에 대하여 분석할 수 있다. 잘 결합된 복합체를 시험관내에서 절단 활성에 대하여 스크리닝할 수 있다. 본 명세서에 기재된 방법은 절단, 전달을 위한 적합성 또는 본 명세서에 논의된 기타 특징에서의 효과에 대한, RNA, 추가의 포스페이트 기 또는 대안적인 5' 캡 구조의 화학적 변형의 평가를 가능하게 한다.

본 명세서에 기재된 방법을 사용하여 Cas9 분자 및 gRNA 분자의 상호작용을 안정화하기 위해 구성성분, 예를 들어, 첨가제, 소분자 안정화 시약, 완충제, 염, 예를 들어, 염 몰농도, 글리세롤 농도 및 기타 완충제 구성성분의 라이브러리를 스크리닝할 수 있다.

본 명세서에 기재된 방법을 사용하여 Cas9 분자와 gRNA 분자의 상호작용을 안정화시키기 위하여 키메라, 조작된 또는 합성 Cas9 분자, 예를 들어, 키메라 또는 조작된 Cas9 분자의 라이브러리를 스크리닝할 수 있다. 불충분한 열 변화는 RNA 결합이 준최적이거나 파괴되는 것을 나타낸다. 부분적인 열 변화는 RNA가 생산적으로 결합함을 암시할 것이다. DSF T_m을 갖지 않는 키메라 또는 조작된 Cas9 분자에 있어서, DSF에 의해 측정시 결합의 복구에 대하여 gRNA 분자(예를 들어, tracrRNA 분자) 또는 서열의 라이브러리를 스크리닝할 수 있다.

비활성으로 인지되는 Cas9 분자는 핵산 분자 라이브러리, 예를 들어, 무작위화 핵산 라이브러리에 대한 열안정성 분석에 사용될 수 있다. 이것은 tracrRNA의 역할을 충족시킬 수 있는 신규한 분자에 대한 스크리닝을 가능하게 할 것이다. 이러한 새로 발견된 핵산 분자(예를 들어, tracrRNA 분자)를 사용하여, 게놈 DNA, 생체내 RNA 및/또는 침입성 유기체 및 바이러스로부터의 유전 물질을 표적화하는 새로운 gRNA를 개발할 수 있다.

본 명세서에 기재된 방법은 임의의 돌연변이 및 키메라 형태의 Cas9 분자에 적용될 수 있다. 또한, 본 명세서에 기재된 방법이 다른 Cas 분자, 예를 들어, 본 명세서에 기재된 다른 Cas 분자에 적용될 수 있는 것이 이해된다.

가이드 RNA(gRNA) 분자

gRNA 분자는 상기 용어가 본 명세서에 사용되는 바와 같이, 표적 핵산에 대한 gRNA 분자/Cas9 분자 복합체의 특이적 표적화 또는 귀소(homing)를 촉진시키는 핵산을 지칭한다. gRNA 분자는 본 명세서에서 때때로 "키메라" gRNA 또는 모듈(하나 초과, 전형적으로 2개의 개별 RNA 분자 포함)로서 지칭되는 단분자(단일 RNA 분자를 가짐)일 수 있다. 본 명세서에 제공되는 gRNA 분자는 표적 핵산 서열에 완전히 또는 부분적으로 상보적인 핵산 서열을 포함하거나, 이로 이루어지거나, 본질적으로 이로 이루어진 표적화 도메인을 포함한다. 특정 구현예에서, gRNA 분자는 예를 들어, 제1 상보성 도메인, 연결 도메인, 제2 상보성 도메인, 근위 도메인, 꼬리 도메인 및/또는 5' 연장 도메인을 포함하는 하나 이상의 추가의 도메인을 추가로 포함한다. 이들 도메인의 각각은 하기에 상세히 논의된다. 특정 구현예에서, gRNA 분자에서 도메인 중 하나 이상은 예를 들어, 스트렙토코커스 피오게네스, 스타필로코커스 아우레우스 또는 스트렙토코커스 써모필러스로부터의 자연 발생 서열과 동일하거나, 또는 이와 서열 상동성을 공유하는 아미노산 서열을 포함한다.

몇몇의 예시적인 gRNA 구조는 도 1a 내지 도 1i에 제공되어 있다. gRNA의 3차원 형태, 또는 활성 형태의 가닥내(intra-strand) 또는 가닥간(inter-strand) 상호작용과 관련하여, 높은 상보성의 영역은 때때로 도 1a 내지 도 1i 및 본 명세서에 제공되는 다른 묘사에 듀플렉스로 나타낸다. 도 7은 tracrRNA-유래 영역 내에 하나의 헤어핀 루프를 함유하는 서열번호 42의 gRNA 서열을 사용한 gRNA 도메인 명명법을 예시한 것이다. 특정 구현예에서, gRNA는 이러한 영역에 1개 초과의(예를 들어, 2개, 3개 이상의) 헤어핀 루프를 함유할 수 있다(예를 들어, 도 1h 내지 도 1i 참조).

특정 구현예에서, 단분자, 또는 키메라, gRNA는 바람직하게는 5'에서 3'으로:

표적 핵산 서열에 완전히 또는 부분적으로 상보적인 핵산 서열을 포함하거나, 이로 이루어지거나, 본질적으로 이로 이루어진 표적화 도메인;

제1 상보성 도메인;

연결 도메인;

제2 상보성 도메인(제1 상보성 도메인에 상보적임);

근위 도메인; 및

선택적으로, 꼬리 도메인을 포함한다.

특정 구현예에서, 모듈 gRNA는:

바람직하게는 5'에서 3'으로,

표적 핵산 서열에 완전히 또는 부분적으로 상보적인 핵산 서열을 포함하거나, 이로 이루어지거나, 본질적으로 이로 이루어진 표적화 도메인; 및

제1 상보성 도메인을 포함하는 제1 가닥; 및

바람직하게는 5'에서 3'으로,

선택적으로, 5' 연장 도메인;

제2 상보성 도메인;

근위 도메인; 및

선택적으로, 꼬리 도메인을 포함하는 제2 가닥을 포함한다.

표적화 도메인

표적화 도메인(때때로 대안적으로 가이드 서열 또는 상보성 영역으로서 지칭됨)은 표적 핵산에 상보적이거나 부분적으로 상보적인 핵산 서열을 포함하거나, 이로 이루어지거나, 본질적으로 이로 이루어진다. 표적화 도메인의 전부 또는 일부가 상보적이거나, 부분적으로 상보적인 핵산 서열은 본 명세서에 표적 도메인으로 지칭된다. 표적화 도메인의 선택 방법은 해당 분야에 알려져 있다(예를 들어, 문헌[Fu 2014]; 문헌[Sternberg 2014] 참조).

표적 도메인을 포함하는 표적 핵산의 가닥은 그것이 표적화 도메인 서열에 상보적이기 때문에, 본 명세서에서 상보적 가닥으로 지칭된다. 표적화 도메인이 gRNA 분자의 부분이기 때문에, 그것은 티민(T)보다는 염기 우라실(U)을 포함하며; 역으로, gRNA 분자를 인코딩하는 임의의 DNA 분자는 우라실보다는 티민을 포함할 것이다. 표적화 도메인/표적 도메인 쌍에서, 표적화 도메인 내의 우라실 염기는 표적 도메인 내의 아데닌 염기와 쌍을 형성할 것이다. 특정 구현예에서, 표적화 도메인과 표적 도메인 간의 상보성 정도는 표적 핵산으로의 gRNA 분자/Cas9 분자 복합체의 표적화를 가능하게 하기에 충분하다.

특정 구현예에서, 표적화 도메인은 코어 도메인 및 선택적인 2차 도메인을 포함한다. 이들 중 특정 구현예에서, 코어 도메인은 2차 도메인에 대하여 3'에 위치하며, 이들 중 특정 구현예에서, 코어 도메인은 표적화 도메인의 3' 말단에 또는 그 근처에 위치한다. 이들 중 특정 구현예에서, 코어 도메인은 표적화 도메인의 3' 말단에서 약 8개 내지 약 13개의 뉴클레오타이드로 이루어지거나, 본질적으로 이로 이루어진다. 특정 구현예에서, 오직 코어 도메인만이 표적 도메인의 상응하는 부분에 상보적이거나 부분적으로 상보적이며, 이들 중 특정 구현예에서, 코어 도메인은 표적 도메인의 상응하는 부분에 완전히 상보적이다. 다른 구현예에서, 2차 도메인은 또한, 표적 도메인의 일부에 상보적이거나 부분적으로 상보적이다. 특정 구현예에서, 코어 도메인은 표적 도메인 내의 코어 도메인 표적에 상보적이거나 부분적으로 상보적인 한편, 2차 도메인은 표적 도메인 내의 2차 도메인 표적에 상보적이거나 부분적으로 상보적이다. 특정 구현예에서, 코어 도메인 및 2차 도메인은 표적 도메인의 그들의 각각의 상응하는 부분과 동일한 상보성 정도를 갖는다. 다른 구현예에서, 코어 도메인과 그의 표적 간의 상보성 정도 및 2차 도메인과 그의 표적 간의 상보성 정도는 상이할 수 있다. 이들 중 특정 구현예에서, 코어 도메인은 그의 표적에 대하여 2차 도메인보다 더 큰 상보성 정도를 가질 수 있는 한편, 다른 구현예에서, 2차 도메인은 코어 도메인보다 더 높은 상보성 정도를 가질 수 있다.

특정 구현예에서, 표적화 도메인 및/또는 표적화 도메인 내의 코어 도메인은 3개 내지 100개, 5개 내지 100개, 10개 내지 100개, 또는 20개 내지 100개 뉴클레오타이드 길이이며, 이들 중 특정 구현예에서, 표적화 도메인 또는 코어 도메인은 3개 내지 15개, 3개 내지 20개, 5개 내지 20개, 10개 내지 20개, 15개 내지 20개, 5개 내지 50개, 10개 내지 50개, 또는 20개 내지 50개의 뉴클레오타이드 길이이다. 특정 구현예에서, 표적화 도메인 및/또는 표적화 도메인 내의 코어 도메인은 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개 또는 26개의 뉴클레오타이드 길이이다. 특정 구현예에서, 표적화 도메인 및/또는 표적화 도메인 내의 코어 도메인은 6+/-2개, 7+/-2개, 8+/-2개, 9+/-2개, 10+/-2개, 10+/-4개, 10 +/-5개, 11+/-2개, 12+/-2개, 13+/-2개, 14+/-2개, 15+/-2개, 또는 16+-2개, 20+/-5개, 30+/-5개, 40+/-5개, 50+/-5개, 60+/-5개, 70+/-5개, 80+/-5개, 90+/-5개, 또는 100+/-5개의 뉴클레오타이드 길이이다.

표적화 도메인이 코어 도메인을 포함하는 특정 구현예에서, 코어 도메인은 3개 내지 20개의 뉴클레오타이드 길이이며, 이들 중 특정 구현예에서, 코어 도메인은 5개 내지 15개 또는 8개 내지 13개의 뉴클레오타이드 길이이다. 표적화 도메인이 2차 도메인을 포함하는 특정 구현예에서, 2차 도메인은 0개, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개 또는 15개의 뉴클레오타이드 길이이다. 표적화 도메인이 8개 내지 13개의 뉴클레오타이드 길이인 코어 도메인을 포함하는 특정 구현예에서, 각각 표적화 도메인은 26개, 25개, 24개, 23개, 22개, 21개, 20개, 19개, 18개, 17개 또는 16개의 뉴클레오타이드 길이이며, 2차 도메인은 13개 내지 18개, 12개 내지 17개, 11개 내지 16개, 10개 내지 15개, 9개 내지 14개, 8개 내지 13개, 7개 내지 12개, 6개 내지 11개, 5개 내지 10개, 4개 내지 9개, 또는 3개 내지 8개의 뉴클레오타이드 길이이다.

특정 구현예에서, 표적화 도메인은 표적 도메인에 완전히 상보적이다. 이와 같이, 표적화 도메인은 코어 도메인 및/또는 2차 도메인을 포함하며, 특정 구현예에서, 코어 도메인 및 2차 도메인 중 하나 또는 둘 모두는 표적 도메인의 상응하는 부분에 완전히 상보적이다. 다른 구현예에서, 표적화 도메인은 표적 도메인에 부분적으로 상보적이며, 표적화 도메인이 코어 도메인 및/또는 2차 도메인을 포함하는 이들 중 특정 구현예에서, 코어 도메인 및 2차 도메인 중 하나 또는 둘 모두는 표적 도메인의 상응하는 부분에 부분적으로 상보적이다. 이들 중 특정 구현예에서, 표적화 도메인 또는, 표적화 도메인 내의 코어 도메인 또는 표적화 도메인의 핵산 서열은 표적 도메인에 또는 표적 도메인의 상응하는 부분에 적어도 80%, 85%, 90% 또는 95% 상보적이다. 특정 구현예에서, 표적화 도메인 및/또는 표적화 도메인 내의 코어 또는 2차 도메인은 표적 도메인 또는 이의 부분과 상보적이지 않은 하나 이상의 뉴클레오타이드를 포함하며, 이들 중 특정 구현예에서, 표적화 도메인 및/또는 표적화 도메인 내의 코어 또는 2차 도메인은 표적 도메인과 상보적이지 않은 1개, 2개, 3개, 4개, 5개, 6개, 7개 또는 8개의 뉴클레오타이드를 포함한다. 특정 구현예에서, 코어 도메인은 표적 도메인의 상응하는 부분과 상보적이지 않은 1개, 2개, 3개, 4개 또는 5개의 뉴클레오타이드를 포함한다. 표적화 도메인이 표적 도메인과 상보적이지 않은 하나 이상의 뉴클레오타이드를 포함하는 특정 구현예에서, 상기 비-상보적 뉴클레오타이드 중 하나 이상은 표적화 도메인의 5' 또는 3' 말단의 5개 뉴클레오타이드 이내에 위치한다. 이들 중 특정 구현예에서, 표적화 도메인은 그의 5' 말단, 3' 말단 또는 그의 5' 및 3' 말단 둘 모두의 5개 뉴클레오타이드 이내에 표적 도메인에 상보적이지 않은 1개, 2개, 3개, 4개 또는 5개의 뉴클레오타이드를 포함한다. 표적화 도메인이 표적 도메인에 상보적이지 않은 2개 이상의 뉴클레오타이드를 포함하는 특정 구현예에서, 상기 비-상보적 뉴클레오타이드 중 2개 이상은 서로 인접하며, 이들 중 특정 구현예에서, 2개 이상의 연속 비-상보적 뉴클레오타이드는 표적화 도메인의 5' 또는 3' 말단의 5개 뉴클레오타이드 내에 위치한다. 다른 구현예에서, 2개 이상의 연속 비-상보적 뉴클레오타이드는 둘 모두 표적화 도메인의 5' 및 3' 말단으로부터 5개 초과의 뉴클레오타이드에 위치한다.

특정 구현예에서, 표적화 도메인, 코어 도메인 및/또는 2차 도메인은 임의의 변형을 포함하지 않는다. 다른 구현예에서, 표적화 도메인, 코어 도메인 및/또는 2차 도메인, 또는 그 안의 하나 이상의 뉴클레오타이드는 하기 기재된 변형을 포함하나 이로 한정되지 않는 변형을 갖는다. 특정 구현예에서, 표적화 도메인, 코어 도메인 및/또는 2차 도메인의 하나 이상의 뉴클레오타이드는 2' 변형(예를 들어, 리보스 상의 2' 위치에서의 변형), 예를 들어, 2-아세틸화, 예를 들어, 2' 메틸화를 포함할 수 있다. 특정 구현예에서, 표적화 도메인의 백본은 포스포로티오에이트로 변형될 수 있다. 특정 구현예에서, 표적화 도메인, 코어 도메인 및/또는 2차 도메인의 하나 이상의 뉴클레오타이드에 대한 변형은 표적화 도메인 및/또는 표적화 도메인을 포함하는 gRNA를 분해에 대한 감수성이 더 낮거나 더욱 생체-적합성이게, 예를 들어, 면역원성이 더 낮게 만든다. 특정 구현예에서, 표적화 도메인 및/또는 코어 또는 2차 도메인은 1개, 2개, 3개, 4개, 5개, 6개, 7개 또는 8개 이상의 변형을 포함하며, 이들 중 특정 구현예에서, 표적화 도메인 및/또는 코어 또는 2차 도메인은 그들의 각각의 5' 말단의 5개의 뉴클레오타이드 내의 1개, 2개, 3개 또는 4개의 변형 및/또는 그들의 각각의 3' 말단의 5개의 뉴클레오타이드 내의 1개, 2개, 3개 또는 4개의 변형을 포함한다. 특정 구현예에서, 표적화 도메인 및/또는 코어 또는 2차 도메인은 2개 이상의 연속 뉴클레오타이드에서 변형을 포함한다.

표적화 도메인이 코어 및 2차 도메인을 포함하는 특정 구현예에서, 코어 및 2차 도메인은 동일한 수의 변형을 함유한다. 이들 중 특정 구현예에서, 둘 모두의 도메인에는 변형이 없다. 다른 구현예에서, 코어 도메인은 2차 도메인보다 더 많은 변형을 포함하거나 또는 그 반대이다.

특정 구현예에서, 코어 또는 2차 도메인을 포함하는 표적화 도메인에서의 하나 이상의 뉴클레오타이드에 대한 변형은 표적화 효능을 간섭하지 않도록 선택되며, 표적화 효능은 하기에 기재된 시스템을 사용하여 후보 변형을 시험함으로써 평가될 수 있다. 선택된 길이, 서열, 상보성 정도 또는 변형 정도를 갖는, 후보 표적화 도메인을 갖는 gRNA는 하기 기재된 시스템을 사용하여 평가될 수 있다. 후보 표적화 도메인은 선택된 표적과 기능성인 것으로 알려져 있는 gRNA 분자/Cas9 분자 시스템 내에 단독으로 또는 하나 이상의 다른 후보 변화와 함께 배치되고 평가될 수 있다.

특정 구현예에서, 변형된 뉴클레오타이드의 전부는 표적 도메인에 존재하는 상응하는 뉴클레오타이드에 상보적이며, 이에 혼성화할 수 있다. 또 다른 구현예에서, 1개, 2개, 3개, 4개, 5개, 6개, 7개 또는 8개 이상의 변형된 뉴클레오타이드는 표적 도메인에 존재하는 상응하는 뉴클레오타이드에 상보적이지 않거나 이에 혼성화할 수 없다.

도 1a 내지 도 1i는 gRNA 분자 내의 표적화 도메인의 배치의 예를 제공한다.

제1 및 제2 상보성 도메인

제1 및 제2 상보성(때때로 대안적으로 각각 crRNA-유래 헤어핀 서열 및 tracrRNA-유래 헤어핀 서열로 지칭) 도메인은 서로 완전히 또는 부분적으로 상보적이다. 특정 구현예에서, 상보성 정도는 적어도 일부의 생리학적 조건 하에서 2개의 도메인이 듀플렉스 영역을 형성하기에 충분하다. 모듈 gRNA 분자에서, 2개의 분자는 상보성 도메인의 혼성화 때문에 회합된다(예를 들어, 도 1a 참조). 특정 구현예에서, gRNA의 다른 특성과 함께 제1 및 제2 상보성 도메인 간의 상보성의 정도는 Cas9 분자의 표적화가 핵산을 표적화하기에 충분하다. 제1 및 제2 상보성 도메인의 예는 도 1a 내지 도 1g에 나타나 있다.

특정 구현예(예를 들어, 도 1a 및 도 1b 참조)에서, 제1 및/또는 제2 상보성 도메인은 상응하는 상보성 도메인과의 상보성이 결여된 하나 이상의 뉴클레오타이드를 포함한다. 특정 구현예에서, 제1 및/또는 제2 상보성 도메인은 상응하는 상보성 도메인과 상보적이지 않은 1개, 2개, 3개, 4개, 5개 또는 6개의 뉴클레오타이드를 포함한다. 예를 들어, 제2 상보성 도메인은 제1 상보성 도메인 내의 상응하는 뉴클레오타이드와 쌍을 형성하지 않는 1개, 2개, 3개, 4개, 5개 또는 6개의 뉴클레오타이드를 함유할 수 있다. 특정 구현예에서, 상응하는 상보성 도메인과 상보적이지 않은 제1 또는 제2 상보성 도메인 상의 뉴클레오타이드는 제1 및 제2 상보성 도메인 사이에 형성된 듀플렉스로부터 루프-아웃(loop-out)된다. 이들 중 특정 구현예에서, 쌍을 형성하지 않는 루프-아웃은 제2 상보성 도메인 상에 위치하며, 이들 중 특정 구현예에서, 쌍을 형성하지 않는 영역은 제2 상보성 도메인의 5' 말단으로부터 1개, 2개, 3개, 4개, 5개 또는 6개의 뉴클레오타이드에서 시작한다.

특정 구현예에서, 제1 상보성 도메인은 5개 내지 30개, 5개 내지 25개, 7개 내지 25개, 5개 내지 24개, 5개 내지 23개, 7개 내지 22개, 5개 내지 22개, 5개 내지 21개, 5개 내지 20개, 7개 내지 18개, 7개 내지 15개, 9개 내지 16개 또는 10개 내지 14개의 뉴클레오타이드 길이이며, 이들 중 특정 구현예에서, 제1 상보성 도메인은 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개 또는 25개의 뉴클레오타이드 길이이다. 특정 구현예에서, 제2 상보성 도메인은 5개 내지 27개, 7개 내지 27개, 7개 내지 25개, 5개 내지 24개, 5개 내지 23개, 5개 내지 22개, 5개 내지 21개, 7개 내지 20개, 5개 내지 20개, 7개 내지 18개, 7개 내지 17개, 9개 내지 16개 또는 10개 내지 14개의 뉴클레오타이드 길이이며, 이들 중 특정 구현예에서, 제2 상보성 도메인은 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개 또는 26개의 뉴클레오타이드 길이이다. 특정 구현예에서, 제1 및 제2 상보성 도메인은 각각 독립적으로 6+/-2개, 7+/-2개, 8+/-2개, 9+/-2개, 10+/-2개, 11+/-2개, 12+/-2개, 13+/-2개, 14+/-2개, 15+/-2개, 16+/-2개, 17+/-2개, 18+/-2개, 19+/-2개 또는 20+/-2개, 21+/-2개, 22+/-2개, 23+/-2개 또는 24+/-2개의 뉴클레오타이드 길이이다. 특정 구현예에서, 제2 상보성 도메인은 제1 상보성 도메인보다 더 길며, 예를 들어, 2개, 3개, 4개, 5개 또는 6개 뉴클레오타이드가 더 길다.

특정 구현예에서, 제1 및/또는 제2 상보성 도메인은 각각 독립적으로 3개의 서브도메인을 포함하며, 5'에서 3' 방향으로, 5' 서브도메인, 중앙 서브도메인 및 3' 서브도메인이다. 특정 구현예에서, 제1 상보성 도메인의 5' 서브도메인 및 3' 서브도메인은 제2 상보성 도메인의 각각 3' 서브도메인 및 5' 서브도메인에 완전히 또는 부분적으로 상보적이다.

특정 구현예에서, 제1 상보성 도메인의 5' 서브도메인은 4개 내지 9개의 뉴클레오타이드 길이이며, 이들 중 특정 구현예에서, 5' 도메인은 4개, 5개, 6개, 7개, 8개 또는 9개의 뉴클레오타이드 길이이다. 특정 구현예에서, 제2 상보성 도메인의 5' 서브도메인은 3개 내지 25개, 4개 내지 22개, 4개 내지 18개 또는 4개 내지 10개의 뉴클레오타이드 길이이며, 이들 중 특정 구현예에서, 5' 도메인은 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개 또는 25개의 뉴클레오타이드 길이이다. 특정 구현예에서, 제1 상보성 도메인의 중앙 서브도메인은 1개, 2개 또는 3개의 뉴클레오타이드 길이이다. 특정 구현예에서, 제2 상보성 도메인의 중앙 서브도메인은 1개, 2개, 3개, 4개 또는 5개의 뉴클레오타이드 길이이다. 특정 구현예에서, 제1 상보성 도메인의 3' 서브도메인은 3개 내지 25개, 4개 내지 22개, 4개 내지 18개 또는 4개 내지 10개의 뉴클레오타이드 길이이며, 이들 중 특정 구현예에서, 3' 서브도메인은 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개 또는 25개의 뉴클레오타이드 길이이다. 특정 구현예에서, 제2 상보성 도메인의 3' 서브도메인은 4개 내지 9개, 예를 들어, 4개, 5개, 6개, 7개, 8개 또는 9개의 뉴클레오타이드 길이이다.

제1 및/또는 제2 상보성 도메인은 자연 발생 또는 기준 제1 및/또는 제2 상보성 도메인과 상동성을 공유하거나, 그로부터 유래될 수 있다. 이들 중 특정 구현예에서, 제1 및/또는 제2 상보성 도메인은 자연 발생 또는 기준 제1 및/또는 제2 상보성 도메인과 적어도 50%, 60%, 70%, 80%, 85%, 90% 또는 95%의 상동성을 갖거나, 그와 1개, 2개, 3개, 4개, 5개 또는 6개 이하의 뉴클레오타이드가 상이하다. 이들 중 특정 구현예에서, 제1 및/또는 제2 상보성 도메인은 스트렙토코커스 피오게네스 또는 스타필로코커스 아우레우스로부터의 제1 및/또는 제2 상보성 도메인과 적어도 50%, 60%, 70%, 80%, 85%, 90% 또는 95%의 상동성을 가질 수 있다.

특정 구현예에서, 제1 및/또는 제2 상보성 도메인은 임의의 변형을 포함하지 않는다. 다른 구현예에서, 제1 및/또는 제2 상보성 도메인 또는 그 안의 하나 이상의 뉴클레오타이드는 하기 기재된 변형을 포함하나 이로 한정되지 않는 변형을 갖는다. 특정 구현예에서, 제1 및/또는 제2 상보성 도메인의 하나 이상의 뉴클레오타이드는 2' 변형(예를 들어, 리보스 상의 2' 위치에서의 변형), 예를 들어, 2-아세틸화, 예를 들어, 2' 메틸화를 포함할 수 있다. 특정 구현예에서, 표적화 도메인의 백본은 포스포로티오에이트로 변형될 수 있다. 특정 구현예에서, 제1 및/또는 제2 상보성 도메인의 하나 이상의 뉴클레오타이드에 대한 변형은 제1 및/또는 제2 상보성 도메인 및/또는 제1 및/또는 제2 상보성 도메인을 포함하는 gRNA를 분해에 대한 감수성이 더 낮거나 더욱 생체-적합성이게, 예를 들어, 면역원성이 더 낮게 만든다. 특정 구현예에서, 제1 및/또는 제2 상보성 도메인은 각각 독립적으로 1개, 2개, 3개, 4개, 5개, 6개, 7개 또는 8개 이상의 변형을 포함하며, 이들 중 특정 구현예에서, 제1 및/또는 제2 상보성 도메인은 각각 독립적으로, 그들의 각각의 5' 말단, 3' 말단 또는 그들의 5' 및 3' 말단 둘 모두의 5개의 뉴클레오타이드 내에 1개, 2개, 3개 또는 4개의 변형을 포함한다. 다른 구현예에서, 제1 및/또는 제2 상보성 도메인은 각각 독립적으로, 그들의 각각의 5' 말단, 3' 말단 또는 그들의 5' 및 3' 말단 둘 모두의 5개의 뉴클레오타이드 내에 변형을 함유하지 않는다. 특정 구현예에서, 제1 및 제2 상보성 도메인 중 하나 또는 둘 모두는 2개 이상의 연속 뉴클레오타이드에서 변형을 포함한다.

특정 구현예에서, 제1 및/또는 제2 상보성 도메인 내의 하나 이상의 뉴클레오타이드에 대한 변형은 표적화 효능을 간섭하지 않도록 선택되며, 표적화 효능은 하기에 기재된 시스템에서 후보 변형을 시험함으로써 평가될 수 있다. 선택된 길이, 서열, 상보성 정도 또는 변형 정도를 갖는, 후보 제1 또는 제2 상보성 도메인을 갖는 gRNA는 하기 기재된 시스템을 사용하여 평가될 수 있다. 후보 상보성 도메인은 선택된 표적과 기능성인 것으로 알려져 있는 gRNA 분자/Cas9 분자 시스템 내에 단독으로 또는 하나 이상의 다른 후보 변화와 함께 배치되고 평가될 수 있다.

특정 구현예에서, 제1 및 제2 상보성 도메인에 의해 형성되는 듀플렉스 영역은 예를 들어, 임의의 루프 아웃된 또는 쌍을 형성하지 않은 뉴클레오타이드를 배제하여, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 또는 22 bp 길이이다.

특정 구현예에서, 제1 및 제2 상보성 도메인은 듀플렉스인 경우, 11개의 쌍을 형성하는 뉴클레오타이드를 포함한다(예를 들어, 서열번호 48의 gRNA 참조). 특정 구현예에서, 제1 및 제2 상보성 도메인은 듀플렉스인 경우, 15개의 쌍을 형성하는 뉴클레오타이드를 포함한다(예를 들어, 서열번호 50의 gRNA 참조). 특정 구현예에서, 제1 및 제2 상보성 도메인은 듀플렉스인 경우, 16개의 쌍을 형성하는 뉴클레오타이드를 포함한다(예를 들어, 서열번호 51의 gRNA 참조). 특정 구현예에서, 제1 및 제2 상보성 도메인은 듀플렉스인 경우, 21개의 쌍을 형성하는 뉴클레오타이드를 포함한다(예를 들어, 서열번호 29의 gRNA 참조).

특정 구현예에서, 제1 및 제2 상보성 도메인 사이에서 하나 이상의 뉴클레오타이드를 교환하여, 폴리-U 트랙트(trat)를 제거한다. 예를 들어, 서열번호 48의 gRNA의 뉴클레오타이드 23 및 48 또는 뉴클레오타이드 26 및 45를 교환하여, 각각 서열번호 49 또는 31의 gRNA를 생성할 수 있다. 유사하게, 서열번호 29의 gRNA의 뉴클레오타이드 23 및 39를 뉴클레오타이드 50 및 68과 교환하여, 서열번호 30의 gRNA를 생성할 수 있다.

연결 도메인

연결 도메인은 단분자 또는 키메라 gRNA 내의 제1 및 제2 상보성 도메인 사이에 배치되며, 이들을 연결시키는 역할을 한다. 도 1b 내지 도 1e는 연결 도메인의 예를 제공한다. 특정 구현예에서, 연결 도메인의 부분은 crRNA-유래 영역으로부터의 것이며, 다른 부분은 tracrRNA-유래 영역으로부터의 것이다.

특정 구현예에서, 연결 도메인은 제1 및 제2 상보성 도메인을 공유적으로 연결시킨다. 이들 중 특정 구현예에서, 연결 도메인은 공유 결합으로 이루어지거나, 이를 포함한다. 다른 구현예에서, 연결 도메인은 제1 및 제2 상보성 도메인을 비공유적으로 연결시킨다. 특정 구현예에서, 연결 도메인은 10개 이하의 뉴클레오타이드 길이, 예를 들어, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개의 뉴클레오타이드이다. 다른 구현예에서, 연결 도메인은 10개 초과의 길이, 예를 들어, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개 또는 25개 이상의 뉴클레오타이드이다. 특정 구현예에서, 연결 도메인은 2개 내지 50개, 2개 내지 40개, 2개 내지 30개, 2개 내지 20개, 2개 내지 10개, 2개 내지 5개, 10개 내지 100개, 10개 내지 90개, 10개 내지 80개, 10개 내지 70개, 10개 내지 60개, 10개 내지 50개, 10개 내지 40개, 10개 내지 30개, 10개 내지 20개, 10개 내지 15개, 20개 내지 100개, 20개 내지 90개, 20개 내지 80개, 20개 내지 70개, 20개 내지 60개, 20개 내지 50개, 20개 내지 40개, 20개 내지 30개 또는 20개 내지 25개의 뉴클레오타이드 길이이다. 특정 구현예에서, 연결 도메인은 10+/-5개, 20+/-5개, 20+/-10개, 30+/-5개, 30+/-10개, 40+/-5개, 40+/-10개, 50+/-5개, 50+/-10개, 60+/-5개, 60+/-10개, 70+/-5개, 70+/-10개, 80+/-5개, 80+/-10개, 90+/-5개, 90+/-10개, 100+/-5개 또는 100+/-10개의 뉴클레오타이드 길이이다.

특정 구현예에서, 연결 도메인은 자연 발생 서열, 예를 들어, 제2 상보성 도메인에 대해 5'의 tracrRNA의 서열과 상동성을 공유하거나 그로부터 유래된다. 특정 구현예에서, 연결 도메인은 본 명세서에 개시된 연결 도메인, 예를 들어, 도 1b 내지 도 1e의 연결 도메인과 적어도 50%, 60%, 70%, 80%, 90% 또는 95%의 상동성을 갖거나, 1개, 2개, 3개, 4개, 5개 또는 6개 이하의 뉴클레오타이드가 상이하다.

특정 구현예에서, 연결 도메인은 임의의 변형을 포함하지 않는다. 다른 구현예에서, 연결 도메인 또는 그 안의 하나 이상의 뉴클레오타이드는 하기 기재된 변형을 포함하나 이에 한정되지 않는 변형을 갖는다. 특정 구현예에서, 연결 도메인의 하나 이상의 뉴클레오타이드는 2' 변형(예를 들어, 리보스 상의 2' 위치에서의 변형), 예를 들어, 2-아세틸화, 예를 들어, 2' 메틸화를 포함할 수 있다. 특정 구현예에서, 연결 도메인의 백본은 포스포로티오에이트로 변형될 수 있다. 특정 구현예에서, 연결 도메인의 하나 이상의 뉴클레오타이드에 대한 변형은 연결 도메인 및/또는 연결 도메인을 포함하는 gRNA를 분해에 대한 감수성이 더 낮거나 더욱 생체-적합성이게, 예를 들어, 면역원성이 더 낮게 만든다. 특정 구현예에서, 연결 도메인은 1개, 2개, 3개, 4개, 5개, 6개, 7개 또는 8개 이상의 변형을 포함하며, 이들 중 특정 구현예에서, 연결 도메인은 그의 5' 말단 및/또는 3' 말단의 5개의 뉴클레오타이드 내에 1개, 2개, 3개 또는 4개의 변형을 포함한다. 특정 구현예에서, 연결 도메인은 2개 이상의 연속 뉴클레오타이드에서 변형을 포함한다.

특정 구현예에서, 연결 도메인에서의 하나 이상의 뉴클레오타이드에 대한 변형은 표적화 효능을 간섭하지 않도록 선택되며, 표적화 효능은 하기에 기재된 시스템을 사용하여 후보 변형을 시험함으로써 평가될 수 있다. 선택된 길이, 서열, 상보성 정도 또는 변형 정도를 갖는 후보 연결 도메인을 갖는 gRNA는 하기 기재된 시스템에서 평가될 수 있다. 후보 연결 도메인은 선택된 표적과 기능성인 것으로 알려져 있는 gRNA 분자/Cas9 분자 시스템 내에 단독으로 또는 하나 이상의 다른 후보 변화와 함께 배치되고 평가될 수 있다.

특정 구현예에서, 연결 도메인은 전형적으로, 제1 상보성 도메인의 3' 말단 및/또는 제2 상보성 도메인의 5' 말단의 1개, 2개 또는 3개 뉴클레오타이드에 인접한, 또는 그 내의 듀플렉스 영역을 포함한다. 이들 중 특정 구현예에서, 연결 영역의 듀플렉스 영역은 10+/-5, 15+/-5, 20+/-5, 20+/-10 또는 30+/-5 bp 길이이다. 특정 구현예에서, 연결 도메인의 듀플렉스 영역은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15 bp 길이이다. 특정 구현예에서, 연결 도메인의 듀플렉스 영역을 형성하는 서열은 완전히 상보적이다. 다른 구현예에서, 듀플렉스 영역을 형성하는 서열 중 하나 또는 둘 모두는 다른 듀플렉스 서열과 상보적이지 않은 하나 이상의 뉴클레오타이드(예를 들어, 1개, 2개, 3개, 4개, 5개, 6개, 7개 또는 8개의 뉴클레오타이드)를 함유한다.

5' 연장 도메인

특정 구현예에서, 본 명세서에 개시된 모듈 gRNA는 제2 상보성 도메인에 대해 5'에 5' 연장 도메인, 즉, 하나 이상의 추가의 뉴클레오타이드를 포함한다(예를 들어, 도 1a 참조). 특정 구현예에서, 5' 연장 도메인은 2개 내지 10개 이상, 2개 내지 9개, 2개 내지 8개, 2개 내지 7개, 2개 내지 6개, 2개 내지 5개, 또는 2개 내지 4개의 뉴클레오타이드 길이이며, 이들 중 특정 구현예에서, 5' 연장 도메인은 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개 이상의 뉴클레오타이드 길이이다.

특정 구현예에서, 5' 연장 도메인 뉴클레오타이드는 변형, 예를 들어, 하기에 제공되는 유형의 변형을 포함하지 않는다. 그러나, 특정 구현예에서, 5' 연장 도메인은 하나 이상의 변형, 예를 들어, 그것을 분해에 대한 감수성이 더 낮거나 더욱 생체-적합성이게, 예를 들어, 면역원성이 더 낮게 만드는 변형을 포함한다. 예로서, 5' 연장 도메인의 백본은 포스포로티오에이트 또는 하기 기재된 다른 변형(들)으로 변형될 수 있다. 특정 구현예에서, 5' 연장 도메인의 뉴클레오타이드는 2' 변형(예를 들어, 리보스 상의 2' 위치에서의 변형), 예를 들어, 2-아세틸화, 예를 들어, 2' 메틸화 또는 하기 기재된 다른 변형(들)을 포함할 수 있다.

특정 구현예에서, 5' 연장 도메인은 1개, 2개, 3개, 4개, 5개, 6개, 7개 또는 8개만큼 많은 변형을 포함할 수 있다. 특정 구현예에서, 5' 연장 도메인은 예를 들어, 모듈 gRNA 분자에서, 그의 5' 말단의 5개 뉴클레오타이드 내에 1개, 2개, 3개 또는 4개만큼 많은 변형을 포함한다. 특정 구현예에서, 5' 연장 도메인은, 예를 들어, 모듈 gRNA 분자에서, 그의 3' 말단의 5개 뉴클레오타이드 내에 1개, 2개, 3개 또는 4개만큼 많은 변형을 포함한다.

특정 구현예에서, 5' 연장 도메인은 2개의 연속 뉴클레오타이드, 예를 들어, 5' 연장 도메인의 5' 말단의 5개 뉴클레오타이드 내에 있거나, 5' 연장 도메인의 3' 말단의 5개 뉴클레오타이드 내에 있거나, 또는 5' 연장 도메인의 말단 중 하나 또는 둘 다로부터 5개 초과의 뉴클레오타이드만큼 떨어진 2개의 연속 뉴클레오타이드에서 변형을 포함한다. 특정 구현예에서, 2개의 연속 뉴클레오타이드는 5' 연장 도메인의 5' 말단의 5개 뉴클레오타이드 내에서, 5' 연장 도메인의 3' 말단의 5개 뉴클레오타이드 내에서, 또는 5' 연장 도메인의 말단 중 하나 또는 둘 다로부터 5개 초과의 뉴클레오타이드만큼 떨어진 영역 내에서 변형되지 않는다. 특정 구현예에서, 뉴클레오타이드는 5' 연장 도메인의 5' 말단의 5개 뉴클레오타이드 내에서, 5' 연장 도메인의 3' 말단의 5개 뉴클레오타이드 내에서, 또는 5' 연장 도메인의 말단 중 하나 또는 둘 다로부터 5개 초과의 뉴클레오타이드만큼 떨어진 영역 내에서 변형되지 않는다.

5' 연장 도메인 내의 변형은 하기에 기재된 시스템에서 후보 변형을 시험함으로써 평가될 수 있는 gRNA 분자 효능을 방해하지 않도록 선택될 수 있다. 선택된 길이, 서열, 상보성 정도 또는 변형 정도를 갖는 후보 5' 연장 도메인을 갖는 gRNA는 하기에 기재된 시스템에서 평가될 수 있다. 후보 5' 연장 도메인은 선택된 표적과 기능성인 것으로 알려진 gRNA 분자/Cas9 분자 시스템에서 단독으로, 또는 하나 이상의 다른 후보 변화와 함께 배치하고, 평가할 수 있다.

특정 구현예에서, 5' 연장 도메인은 기준 5' 연장 도메인, 예를 들어, 자연 발생, 예를 들어, 스트렙토코커스 피오게네스, 스타필로코커스 아우레우스 또는 스트렙토코커스 써모필러스, 5' 연장 도메인, 또는 본 명세서에 기재된 5' 연장 도메인과, 예를 들어, 도 1a 내지 도 1g와 적어도 60%, 70%, 80%, 85%, 90% 또는 95%의 상동성을 가지거나, 또는 1개, 2개, 3개, 4개, 5개 또는 6개 이하의 뉴클레오타이드가 상이하다.

근위 도메인

도 1a 내지 도 1g는 근위 도메인의 예를 제공한다.

특정 구현예에서, 근위 도메인은 5개 내지 20개 이상의 뉴클레오타이드 길이, 예를 들어, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개 또는 26개의 뉴클레오타이드 길이이다. 이들 중 특정 구현예에서, 근위 도메인은 6+/-2개, 7+/-2개, 8+/-2개, 9+/-2개, 10+/-2개, 11+/-2개, 12+/-2개, 13+/-2개, 14+/-2개, 14+/-2개, 16+/-2개, 17+/-2개, 18+/-2개, 19+/-2개 또는 20+/-2개의 뉴클레오타이드 길이이다. 특정 구현예에서, 근위 도메인은 5개 내지 20개, 7개 내지 18개, 9개 내지 16개 또는 10개 내지 14개의 뉴클레오타이드 길이이다.

특정 구현예에서, 근위 도메인은 자연 발생 근위 도메인과 상동성을 공유하거나, 그로부터 유래될 수 이다. 이들 중 특정 구현예에서, 근위 도메인은 본 명세서에 개시된 근위 도메인, 예를 들어, 도 1a 내지 도 1g에 기재된 것들을 포함하는 스트렙토코커스 피오게네스, 스타필로코커스 아우레우스 또는 스트렙토코커스 써모필러스 근위 도메인과 적어도 50%, 60%, 70%, 80%, 85%, 90% 또는 95%의 상동성을 갖거나, 1개, 2개, 3개, 4개, 5개 또는 6개 이하의 뉴클레오타이드가 상이하다.

특정 구현예에서, 근위 도메인은 임의의 변형을 포함하지 않는다. 다른 구현예에서, 근위 도메인 또는 그 안의 하나 이상의 뉴클레오타이드는 본 명세서에서 기재된 변형을 포함하나 이로 한정되지 않는 변형을 갖는다. 특정 구현예에서, 근위 도메인의 하나 이상의 뉴클레오타이드는 2' 변형(예를 들어, 리보스 상의 2' 위치에서의 변형), 예를 들어, 2-아세틸화, 예를 들어, 2' 메틸화를 포함할 수 있다. 특정 구현예에서, 근위 도메인의 백본은 포스포로티오에이트로 변형될 수 있다. 특정 구현예에서, 근위 도메인의 하나 이상의 뉴클레오타이드에 대한 변형은 근위 도메인 및/또는 근위 도메인을 포함하는 gRNA를 분해에 대한 감수성이 더 낮거나 더욱 생체-적합성이게, 예를 들어, 면역원성이 더 낮게 만든다. 특정 구현예에서, 근위 도메인은 1개, 2개, 3개, 4개, 5개, 6개, 7개 또는 8개 이상의 변형을 포함하며, 이들 중 특정 구현예에서, 근위 도메인은 그의 5' 말단 및/또는 3' 말단의 5개의 뉴클레오타이드 내에 1개, 2개, 3개 또는 4개의 변형을 포함한다. 특정 구현예에서, 근위 도메인은 2개 이상의 연속 뉴클레오타이드에서 변형을 포함한다.

특정 구현예에서, 근위 도메인에서의 하나 이상의 뉴클레오타이드에 대한 변형은 표적화 효능을 간섭하지 않도록 선택되며, 표적화 효능은 하기에 기재된 시스템에서 후보 변형을 시험함으로써 평가될 수 있다. 선택된 길이, 서열, 상보성 정도 또는 변형 정도를 갖는, 후보 근위 도메인을 갖는 gRNA는 하기 기재된 시스템에서 평가될 수 있다. 후보 근위 도메인은 선택된 표적과 기능성인 것으로 알려져 있는 gRNA 분자/Cas9 분자 시스템 내에 단독으로 또는 하나 이상의 다른 후보 변화와 함께 배치되고 평가될 수 있다.

꼬리 도메인

넓은 스펙트럼의 꼬리 도메인은 본 명세서에 개시된 gRNA 분자에 사용하기에 적합하다. 도 1a 및 도 1c 내지 도 1g는 이러한 꼬리 도메인의 예를 제공한다.

특정 구현예에서, 꼬리 도메인은 부재이다. 다른 구현예에서, 꼬리 도메인은 1개 내지 100개 이상의 뉴클레오타이드 길이, 예를 들어, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 20개, 30개, 40개, 50개, 60개, 70개, 80개, 90개 또는 100개의 뉴클레오타이드 길이이다. 특정 구현예에서, 꼬리 도메인은 1개 내지 5개, 1개 내지 10개, 1개 내지 15개, 1개 내지 20개, 1개 내지 50개, 10개 내지 100개, 20개 내지 100개, 10개 내지 90개, 20개 내지 90개, 10개 내지 80개, 20개 내지 80개, 10개 내지 70개, 20개 내지 70개, 10개 내지 60개, 20개 내지 60개, 10개 내지 50개, 20개 내지 50개, 10개 내지 40개, 20개 내지 40개, 10개 내지 30개, 20개 내지 30개, 20개 내지 25개, 10개 내지 20개 또는 10개 내지 15개의 뉴클레오타이드 길이이다. 특정 구현예에서, 꼬리 도메인은 5+/-5개, 10 +/-5개, 20+/-10개, 20+/-5개, 25+/-10개, 30+/-10개, 30+/-5개, 40+/-10개, 40+/-5개, 50+/-10개, 50+/-5개, 60+/-10개, 60+/-5개, 70+/-10개, 70+/-5개, 80+/-10개, 80+/-5개, 90+/-10개, 90+/-5개, 100+/-10개 또는 100+/-5개의 뉴클레오타이드 길이이다.

특정 구현예에서, 꼬리 도메인은 자연 발생 꼬리 도메인 또는 자연 발생 꼬리 도메인의 5' 말단과 상동성을 공유하거나, 그로부터 유래될 수 있다. 이들 중 특정 구현예에서, 근위 도메인은 본 명세서에 개시된 자연 발생 꼬리 도메인, 예를 들어, 도 1a 및 도 1c 내지 도 1g에 기재되는 것들을 포함하는 스트렙토코커스 피오게네스, 스타필로코커스 아우레우스 또는 스트렙토코커스 써모필러스 꼬리 도메인과 적어도 50%, 60%, 70%, 80%, 85%, 90% 또는 95%의 상동성을 갖거나, 1개, 2개, 3개, 4개, 5개 또는 6개 이하의 뉴클레오타이드가 상이하다.

특정 구현예에서, 꼬리 도메인은 서로 상보적이며, 적어도 일부 생리학적 조건 하에 듀플렉스 영역을 형성하는 서열을 포함한다. 이들 중 특정 구현예에서, 꼬리 도메인은 꼬리 듀플렉스 영역을 형성할 수 있는 꼬리 듀플렉스 도메인을 포함한다. 특정 구현예에서, 꼬리 듀플렉스 영역은 3, 4, 5, 6, 7, 8, 9, 10, 11 또는 12 bp 길이이다. 특정 구현예에서, 꼬리 도메인은 듀플렉스를 형성하지 않는 꼬리 듀플렉스 도메인에 대해 3'에 단일 가닥 도메인을 포함한다. 이들 중 특정 구현예에서, 단일 가닥 도메인은 3개 내지 10개 뉴클레오타이드 길이, 예를 들어, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 또는 4개 내지 6개의 뉴클레오타이드 길이이다.

특정 구현예에서, 꼬리 도메인은 임의의 변형을 포함하지 않는다. 다른 구현예에서, 꼬리 도메인 또는 그 안의 하나 이상의 뉴클레오타이드는 본 명세서에 기재된 변형을 포함하나 이로 한정되지 않는 변형을 갖는다. 특정 구현예에서, 꼬리 도메인의 하나 이상의 뉴클레오타이드는 2' 변형(예를 들어, 리보스 상의 2' 위치에서의 변형), 예를 들어, 2-아세틸화, 예를 들어, 2' 메틸화를 포함할 수 있다. 특정 구현예에서, 꼬리 도메인의 백본은 포스포로티오에이트로 변형될 수 있다. 특정 구현예에서, 꼬리 도메인의 하나 이상의 뉴클레오타이드에 대한 변형은 꼬리 도메인 및/또는 꼬리 도메인을 포함하는 gRNA를 분해에 대한 감수성이 더 낮거나 더욱 생체-적합성이게, 예를 들어, 면역원성이 더 낮게 만든다. 특정 구현예에서, 꼬리 도메인은 1개, 2개, 3개, 4개, 5개, 6개, 7개 또는 8개 이상의 변형을 포함하며, 이들 중 특정 구현예에서, 꼬리 도메인은 그의 5' 말단 및/또는 3' 말단의 5개의 뉴클레오타이드 내에 1개, 2개, 3개 또는 4개의 변형을 포함한다. 특정 구현예에서, 꼬리 도메인은 2개 이상의 연속 뉴클레오타이드에서 변형을 포함한다.

특정 구현예에서, 꼬리 도메인에서의 하나 이상의 뉴클레오타이드에 대한 변형은 표적화 효능을 간섭하지 않도록 선택되며, 표적화 효능은 하기에 기재된 바와 같이 후보 변형을 시험함으로써 평가될 수 있다. 선택된 길이, 서열, 상보성 정도 또는 변형 정도를 갖는 후보 꼬리 도메인을 갖는 gRNA는 하기 기재된 시스템을 사용하여 평가될 수 있다. 후보 꼬리 도메인은 선택된 표적과 기능성인 것으로 알려져 있는 gRNA 분자/Cas9 분자 시스템 내에 단독으로 또는 하나 이상의 다른 후보 변화와 함께 배치되고 평가될 수 있다.

특정 구현예에서, 꼬리 도메인은 3' 말단에 시험관내 또는 생체내 전사 방법과 관련된 뉴클레오타이드를 포함한다. T7 프로모터가 gRNA의 시험관내 전사를 위해 사용되는 경우, 이들 뉴클레오타이드는 DNA 주형의 3' 말단 전에 존재하는 임의의 뉴클레오타이드일 수 있다. U6 프로모터가 생체내 전사를 위해 사용되는 경우, 이들 뉴클레오타이드는 서열 UUUUUU일 수 있다. H1 프로모터가 전사를 위해 사용되는 경우, 이들 뉴클레오타이드는 서열 UUUU일 수 있다. 대안적인 pol-III 프로모터가 사용되는 경우, 이들 뉴클레오타이드는 예를 들어, pol-III 프로모터의 종결 신호에 따라 다양한 수의 우라실 염기일 수 있거나, 그들은 대체 염기를 포함할 수 있다.

특정 구현예에서, 근위 및 꼬리 도메인은 함께 취하는 경우, 서열번호 32, 33, 34, 35, 36 또는 37에 기재된 서열을 포함하거나, 이로 이루어지거나, 본질적으로 이로 이루어진다.

예시적인 단분자/키메라 gRNA

특정 구현예에서, 본 명세서에 개시된 단분자 또는 키메라 gRNA는 하기의 구조를 갖는다: 5' [표적화 도메인]-[제1 상보성 도메인]-[연결 도메인]-[제2 상보성 도메인]-[근위 도메인]-[꼬리 도메인]-3', 여기서:

표적화 도메인은 코어 도메인 및 선택적으로 2차 도메인을 포함하며, 10개 내지 50개의 뉴클레오타이드 길이이며;

제1 상보성 도메인은 5개 내지 25개의 뉴클레오타이드 길이이며, 특정 구현예에서, 본 명세서에 개시된 기준 제1 상보성 도메인과 적어도 50%, 60%, 70%, 80%, 85%, 90% 또는 95%의 상동성을 가지며;

연결 도메인은 1개 내지 5개의 뉴클레오타이드 길이이며;

제2 상보성 도메인은 5개 내지 27개의 뉴클레오타이드 길이이며, 특정 구현예에서, 본 명세서에 개시된 기준 제2 상보성 도메인과 적어도 50%, 60%, 70%, 80%, 85%, 90% 또는 95%의 상동성을 가지며;

근위 도메인은 5개 내지 20개의 뉴클레오타이드 길이이며, 특정 구현예에서, 본 명세서에 개시된 기준 근위 도메인과 적어도 50%, 60%, 70%, 80%, 85%, 90% 또는 95%의 상동성을 가지며;

꼬리 도메인은 부재이거나, 뉴클레오타이드 서열은 1개 내지 50개의 뉴클레오타이드 길이이며, 특정 구현예에서, 본 명세서에 개시된 기준 꼬리 고메인과 적어도 50%, 60%, 70%, 80%, 85%, 90% 또는 95%의 상동성을 갖는다.

특정 구현예에서, 본 명세서에 개시된 단분자 gRNA는 바람직하게는 5'에서 3'으로:

예를 들어, 10개 내지 50개의 뉴클레오타이드를 포함하는 표적화 도메인;

예를 들어, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개 또는 26개의 뉴클레오타이드를 포함하는 제1 상보성 도메인;

연결 도메인;

제2 상보성 도메인;

근위 도메인; 및

꼬리 도메인을 포함하며,

(a) 근위 및 꼬리 도메인은 함께 취하는 경우, 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드를 포함하거나;

(b) 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드가 존재하거나; 또는

(c) 제1 상보성 도메인의 그의 상응하는 뉴클레오타이드에 상보적인 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 16개, 19개, 21개, 26개, 31개, 32개, 36개, 41개, 46개, 50개, 51개 또는 54개의 뉴클레오타이드가 존재한다.

특정 구현예에서, (a), (b) 및/또는 (c)로부터의 서열은 자연 발생 gRNA의 상응하는 서열 또는 본 명세서에 기재된 gRNA와 적어도 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95% 또는 99%의 상동성을 갖는다.

특정 구현예에서, 근위 및 꼬리 도메인은 함께 취하는 경우, 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드를 포함한다.

특정 구현예에서, 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드가 존재한다.

특정 구현예에서, 제1 상보성 도메인의 상응하는 뉴클레오타이드에 상보적인 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 16개, 19개, 21개, 26개, 31개, 32개, 36개, 41개, 46개, 50개, 51개 또는 54개의 뉴클레오타이드가 존재한다.

특정 구현예에서, 표적화 도메인은 표적 도메인 또는 그의 부분에 상보적인 또는 부분적으로 상보적인 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개 또는 26개의 뉴클레오타이드(예를 들어, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개 또는 26개의 연속 뉴클레오타이드)로 이루어지거나, 본질적으로 이로 이루어지거나, 이를 포함하며, 예를 들어, 표적화 도메인은 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개 또는 26개의 뉴클레오타이드 길이이다. 이들 중 특정 구현예에서, 표적화 도메인은 표적화 도메인의 전체 길이, 표적 도메인의 전체 길이 또는 둘 모두에 걸쳐 표적 도메인에 상보적이다.

특정 구현예에서, 본 명세서에 개시된 단분자 또는 키메라 gRNA 분자(표적화 도메인, 제1 상보성 도메인, 연결 도메인, 제2 상보성 도메인, 근위 도메인 및 선택적으로 꼬리 도메인 포함)는 서열번호 42에 기재된 아미노산 서열을 포함하며, 표적화 도메인은 20개의 뉴클레오타이드(잔기 1 내지 20)로 열거되어 있지만, 길이가 16개 내지 26개의 뉴클레오타이드 범위일 수 있으며, 최종 6개의 잔기(잔기 97 내지 102)는 U6 프로모터에 대한 종결 신호를 나타내지만, 부재이거나, 수가 더 적을 수 있다. 특정 구현예에서, 단분자 또는 키메라 gRNA 분자는 스트렙토코커스 피오게네스 gRNA 분자이다.

특정 구현예에서, 본 명세서에 개시된 단분자 또는 키메라 gRNA 분자(표적화 도메인, 제1 상보성 도메인, 연결 도메인, 제2 상보성 도메인, 근위 도메인 및 선택적으로 꼬리 도메인 포함)는 서열번호 38에 기재된 아미노산 서열을 포함하며, 표적화 도메인은 20개의 뉴클레오타이드(잔기 1 내지 20)로 열거되어 있지만, 길이가 16개 내지 26개의 뉴클레오타이드 범위일 수 있으며, 최종 6개의 잔기(잔기 97 내지 102)는 U6 프로모터에 대한 종결 신호를 나타내지만, 부재이거나, 수가 적을 수 있다. 특정 구현예에서, 단분자 또는 키메라 gRNA 분자는 스타필로코커스 아우레우스 gRNA 분자이다.

예시적인 키메라 gRNA의 서열 및 구조는 도 1h 내지 도 1i에도 나타나 있다.

예시적인 모듈 gRNA

특정 구현예에서, 본 명세서에 개시된 모듈 gRNA는:

바람직하게는 5'에서 3'으로,

예를 들어, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개 또는 26개의 뉴클레오타이드를 포함하는 표적화 도메인;

제1 상보성 도메인을 포함하는 제1 가닥; 및

바람직하게는 5'에서 3'으로,

선택적으로 5' 연장 도메인;

제2 상보성 도메인;

근위 도메인; 및

꼬리 도메인을 포함하는 제2 가닥을 포함하며;

(b) 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드가 존재하거나;

(c) 제1 상보성 도메인의 그의 상응하는 뉴클레오타이드에 대하여 상보적인 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 16개, 19개, 21개, 26개, 31개, 32개, 36개, 41개, 46개, 50개, 51개 또는 54개의 뉴클레오타이드가 존재한다.

특정 구현예에서, (a), (b) 또는 (c)로부터의 서열은 자연 발생 gRNA의 상응하는 서열 또는 본 명세서에 기재된 gRNA와 적어도 60%, 75%, 80%, 85%, 90%, 95% 또는 99%의 상동성을 갖는다.

특정 구현예에서, 제1 상보성 도메인의 그의 상응하는 뉴클레오타이드에 상보적인 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 16개, 19개, 21개, 26개, 31개, 32개, 36개, 41개, 46개, 50개, 51개 또는 54개의 뉴클레오타이드가 존재한다. 특정 구현예에서, 표적화 도메인은 표적 도메인과 상보성을 갖는 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개 또는 26개의 뉴클레오타이드(예를 들어, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개 또는 26개의 연속 뉴클레오타이드)를 포함하거나, 이를 갖거나, 이로 이루어지며, 예를 들어, 표적화 도메인은 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개 또는 26개의 뉴클레오타이드 길이이다.

특정 구현예에서, 표적화 도메인은 표적 도메인 또는 그의 부분과 상보적인 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개 또는 26개의 뉴클레오타이드(예를 들어, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개 또는 26개의 연속 뉴클레오타이드)로 이루어지거나, 본질적으로 이로 이루어지거나, 이를 포함한다. 이들 중 특정 구현예에서, 표적화 도메인은 표적화 도메인의 전체 길이, 표적 도메인의 전체 길이 또는 둘 모두에 걸쳐 표적 도메인에 상보적이다.

특정 구현예에서, 표적화 도메인은 표적 도메인과 상보성을 갖는 16개의 뉴클레오타이드(예를 들어, 16개의 연속 뉴클레오타이드)를 포함하거나, 이로 이루어지거나, 본질적으로 이로 이루어지며, 예를 들어, 표적화 도메인은 16개의 뉴클레오타이드 길이이다. 이들 구현예 중 특정 구현예에서, (a) 근위 및 꼬리 도메인은 함께 취하는 경우, 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드를 포함하고/거나; (b) 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드가 존재하고/거나 (c) 제1 상보성 도메인의 그의 상응하는 뉴클레오타이드에 대하여 상보적인 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 16개, 19개, 21개, 26개, 31개, 32개, 36개, 41개, 46개, 50개, 51개 또는 54개의 뉴클레오타이드가 존재한다.

특정 구현예에서, 표적화 도메인은 표적 도메인과 상보성을 갖는 17개의 뉴클레오타이드(예를 들어, 17개의 연속 뉴클레오타이드)를 포함하거나, 이로 이루어지거나, 본질적으로 이로 이루어지며, 예를 들어, 표적화 도메인은 17개의 뉴클레오타이드 길이이다. 이들 중 특정 구현예에서, (a) 근위 및 꼬리 도메인은 함께 취하는 경우, 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드를 포함하고/거나; (b) 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드가 존재하고/거나; (c) 제1 상보성 도메인의 그의 상응하는 뉴클레오타이드에 상보적인 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 16개, 19개, 21개, 26개, 31개, 32개, 36개, 41개, 46개, 50개, 51개 또는 54개의 뉴클레오타이드가 존재한다.

특정 구현예에서, 표적화 도메인은 표적 도메인과 상보성을 갖는 18개의 뉴클레오타이드(예를 들어, 18개의 연속 뉴클레오타이드)를 포함하거나, 이로 이루어지거나, 본질적으로 이로 이루어지며, 예를 들어, 표적화 도메인은 18개의 뉴클레오타이드 길이이다. 이들 중 특정 구현예에서, (a) 근위 및 꼬리 도메인은 함께 취하는 경우, 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드를 포함하고/거나; (b) 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드가 존재하고/거나; (c) 제1 상보성 도메인의 그의 상응하는 뉴클레오타이드에 상보적인 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 16개, 19개, 21개, 26개, 31개, 32개, 36개, 41개, 46개, 50개, 51개 또는 54개의 뉴클레오타이드가 존재한다.

특정 구현예에서, 표적화 도메인은 표적 도메인과 상보성을 갖는 19개의 뉴클레오타이드(예를 들어, 19개의 연속 뉴클레오타이드)를 포함하거나, 이로 이루어지거나, 본질적으로 이로 이루어지며, 예를 들어, 표적화 도메인은 19개의 뉴클레오타이드 길이이다. 이들 중 특정 구현예에서, (a) 근위 및 꼬리 도메인은 함께 취하는 경우, 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드를 포함하고/거나; (b) 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드가 존재하고/거나; (c) 제1 상보성 도메인의 그의 상응하는 뉴클레오타이드에 상보적인 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 16개, 19개, 21개, 26개, 31개, 32개, 36개, 41개, 46개, 50개, 51개 또는 54개의 뉴클레오타이드가 존재한다.

특정 구현예에서, 표적화 도메인은 표적 도메인과 상보성을 갖는 20개의 뉴클레오타이드(예를 들어, 20개의 연속 뉴클레오타이드)를 포함하거나, 이로 이루어지거나, 본질적으로 이로 이루어지며, 예를 들어, 표적화 도메인은 20개의 뉴클레오타이드 길이이다. 이들 중 특정 구현예에서, (a) 근위 및 꼬리 도메인은 함께 취하는 경우, 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드를 포함하고/거나; (b) 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드가 존재하고/거나; (c) 제1 상보성 도메인의 그의 상응하는 뉴클레오타이드에 상보적인 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 16개, 19개, 21개, 26개, 31개, 32개, 36개, 41개, 46개, 50개, 51개 또는 54개의 뉴클레오타이드가 존재한다.

특정 구현예에서, 표적화 도메인은 표적 도메인과 상보성을 갖는 21개의 뉴클레오타이드(예를 들어, 21개의 연속 뉴클레오타이드)를 포함하거나, 이로 이루어지거나, 본질적으로 이로 이루어지며, 예를 들어, 표적화 도메인은 21개의 뉴클레오타이드 길이이다. 이들 중 특정 구현예에서, (a) 근위 및 꼬리 도메인은 함께 취하는 경우, 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드를 포함하고/거나; (b) 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드가 존재하고/거나; (c) 제1 상보성 도메인의 그의 상응하는 뉴클레오타이드에 상보적인 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 16개, 19개, 21개, 26개, 31개, 32개, 36개, 41개, 46개, 50개, 51개 또는 54개의 뉴클레오타이드가 존재한다.

특정 구현예에서, 표적화 도메인은 표적 도메인과 상보성을 갖는 22개의 뉴클레오타이드(예를 들어, 22개의 연속 뉴클레오타이드)를 포함하거나, 이로 이루어지거나, 본질적으로 이로 이루어지며, 예를 들어, 표적화 도메인은 22개의 뉴클레오타이드 길이이다. 이들 중 특정 구현예에서, (a) 근위 및 꼬리 도메인은 함께 취하는 경우, 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드를 포함하고/거나; (b) 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드가 존재하고/거나; (c) 제1 상보성 도메인의 그의 상응하는 뉴클레오타이드에 상보적인 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 16개, 19개, 21개, 26개, 31개, 32개, 36개, 41개, 46개, 50개, 51개 또는 54개의 뉴클레오타이드가 존재한다.

특정 구현예에서, 표적화 도메인은 표적 도메인과 상보성을 갖는 23개의 뉴클레오타이드(예를 들어, 23개의 연속 뉴클레오타이드)를 포함하거나, 이로 이루어지거나, 본질적으로 이로 이루어지며, 예를 들어, 표적화 도메인은 23개의 뉴클레오타이드 길이이다. 이들 중 특정 구현예에서, (a) 근위 및 꼬리 도메인은 함께 취하는 경우, 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드를 포함하고/거나; (b) 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드가 존재하고/거나; (c) 제1 상보성 도메인의 그의 상응하는 뉴클레오타이드와 상보적인 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 16개, 19개, 21개, 26개, 31개, 32개, 36개, 41개, 46개, 50개, 51개 또는 54개의 뉴클레오타이드가 존재한다.

특정 구현예에서, 표적화 도메인은 표적 도메인과 상보성을 갖는 24개의 뉴클레오타이드(예를 들어, 24개의 연속 뉴클레오타이드)를 포함하거나, 이로 이루어지거나, 본질적으로 이로 이루어지며, 예를 들어, 표적화 도메인은 24개의 뉴클레오타이드 길이이다. 이들 중 특정 구현예에서, (a) 근위 및 꼬리 도메인은 함께 취하는 경우, 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드를 포함하고/거나; (b) 제2 상보성 도메인의 마지막 뉴클레오타이드에 대하여 3'에 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드가 존재하고/거나; (c) 제1 상보성 도메인의 그의 상응하는 뉴클레오타이드에 상보적인 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 16개, 19개, 21개, 26개, 31개, 32개, 36개, 41개, 46개, 50개, 51개 또는 54개의 뉴클레오타이드가 존재한다.

특정 구현예에서, 표적화 도메인은 표적 도메인과 상보성을 갖는 25개의 뉴클레오타이드(예를 들어, 25개의 연속 뉴클레오타이드)를 포함하거나, 이로 이루어지거나, 본질적으로 이로 이루어지며, 예를 들어, 표적화 도메인은 25개의 뉴클레오타이드 길이이다. 이들 중 특정 구현예에서, (a) 근위 및 꼬리 도메인은 함께 취하는 경우, 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드를 포함하고/거나; (b) 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드가 존재하고/거나; (c) 제1 상보성 도메인의 그의 상응하는 뉴클레오타이드에 상보적인 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 16개, 19개, 21개, 26개, 31개, 32개, 36개, 41개, 46개, 50개, 51개 또는 54개의 뉴클레오타이드가 존재한다.

특정 구현예에서, 표적화 도메인은 표적 도메인과 상보성을 갖는 26개의 뉴클레오타이드(예를 들어, 26개의 연속 뉴클레오타이드)를 포함하거나, 이로 이루어지거나, 본질적으로 이로 이루어지며, 예를 들어, 표적화 도메인은 26개의 뉴클레오타이드 길이이다. 이들 중 특정 구현예에서, (a) 근위 및 꼬리 도메인은 함께 취하는 경우, 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드를 포함하고/거나; (b) 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드가 존재하고/거나; 제1 상보성 도메인의 그의 상응하는 뉴클레오타이드에 상보적인 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 16개, 19개, 21개, 26개, 31개, 32개, 36개, 41개, 46개, 50개, 51개 또는 54개의 뉴클레오타이드가 존재한다.

gRNA의 설계 방법

본 명세서에 기재된 gRNA에 사용하기 위한 표적화 도메인의 선택, 설계 및 확인 방법을 포함하는 gRNA의 설계 방법이 본 명세서에 기재된다. gRNA로의 혼입을 위한 예시적인 표적화 도메인도 또한 본 명세서에 제공된다. 특정 구현예에서, 표적화 도메인이 상보적 염기 쌍형성을 통해 표적 도메인에 혼성화하는 것이 본 명세서에서 고려된다.

표적 서열의 선택 및 확인 방법뿐만 아니라 표적-외 분석이 이전에 기재되어 있다(예를 들어, 문헌[Mali 2013]; 문헌[Hsu 2013]; 문헌[Fu 2014]; 문헌[Heigwer 2014]; 문헌[Bae 2014]; 문헌[Xiao 2014] 참조). 예를 들어, 소프트웨어 툴을 사용하여, 사용자의 표적 서열에 상응하는 가능한 표적화 도메인의 선택을 최적화하고, 예를 들어, 게놈에 걸쳐 전체 표적-외 활성을 최소화할 수 있다. 표적-외 활성은 절단 이외의 것일 수 있다. 스트렙토코커스 피오게네스 Cas9를 이용하는 각각의 가능한 표적화 도메인 선택에 있어서, 툴은 게놈에 걸쳐 모든 표적-외 서열(예를 들어, NAG 또는 NGG PAM 중 어느 하나의 앞)을 동정할 수 있으며, 이는 특정 수(예를 들어, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개)까지의 불일치된 염기쌍을 함유한다. 각각의 표적-외 서열에서 절단 효능은, 예를 들어, 실험으로 유도된 가중치 계획을 이용하여 예측될 수 있다. 이어서, 각각의 가능한 표적화 도메인은 그의 예측된 전체 표적-외 절단에 따라 순위를 정하고; 상위-순위의 표적화 도메인은 가장 큰 표적-상의 절단 및 최소의 표적-외 절단을 가질 가능성이 있는 것을 나타낸다. 다른 기능, 예를 들어, CRISPR 작제를 위한 자동화된 시약 설계, 표적 상의 서베이어(Surveyor) 분석을 위한 프라이머 설계 및 높은 처리효율의 검출을 위한 프라이머 설계 및 차세대 시퀀싱(next-gen sequencing)을 통한 표적-외 절단의 정량화가 또한 툴에 포함될 수 있다. 후보 표적화 도메인 및 이들 표적화 도메인을 포함하는 gRNA를 해당 분야에 공지된 방법을 사용하여 및/또는 본 명세서에 기재된 바와 같이, 기능적으로 평가할 수 있다.

비제한적인 예로서, 스트렙토코커스 피오게네스 및 스타필로코커스 아우레우스 Cas9와 사용하기 위한 gRNA에서 사용하기 위한 표적화 도메인을 DNA 서열 검색 알고리즘을 사용하여 동정하였다. gRNA 설계를 공개 툴 cas-offinder(문헌[Bae 2014])에 기반한 맞춤(custom) gRNA 설계 소프트웨어를 사용하여 수행하였다. 이러한 소프트웨어는 그들의 게놈-와이드 표적-외 경향을 계산한 후에 가이드를 점수화한다. 전형적으로, 완벽한 일치로부터 7개의 불일치까지의 범위의 일치가 17개 내지 24개 길이의 범위의 가이드에 대하여 고려된다. 일단 표적-외 부위가 계산에 의해 결정되면, 각 가이드에 대하여 총 점수를 계산하고, 웹-인터페이스를 사용하여 표 출력물에 요약한다. PAM 서열에 인접한 가능한 표적 부위의 동정에 더하여, 소프트웨어에 의해, 선택된 표적 부위와 1개, 2개, 3개 또는 3개 초과의 뉴클레오타이드가 상이한 모든 PAM 인접 서열도 또한 동정된다. 각 유전자에 대한 게놈 DNA 서열을 UCSC 게놈 브라우저로부터 수득하였으며, 서열을 공개 이용가능한 RepeaT_masker 프로그램을 사용하여 반복 요소에 대하여 스크리닝하였다. RepeaT_masker는 반복 요소 및 저 복잡성 영역에 대하여 입력 DNA 서열을 검색한다. 출력은 주어진 질의 서열에 존재하는 반복부의 상세한 주석이다.

동정 후에, 표적화 도메인을 그들의 직교성(orthogonality) 및 5' G의 존재에 기반하여(관련 PAM, 예를 들어, 스트렙토코커스 피오게네스에 있어서 NGG PAM 또는 스타필로코커스 아우레우스에 있어서 NNGRRT(서열번호 204) 또는 NNGRRV(서열번호 205) PAM을 함유하는 인간 게놈에서 가까운 일치의 동정에 기반하여) 계층(tier)으로 순위를 정하였다. 직교성은 표적 서열에 대하여 최소의 수의 불일치를 함유하는 인간 게놈 내의 서열의 수를 말한다. "높은 수준의 직교성" 또는 "우수한 직교성"은 예를 들어, 의도된 표적 외에 인간 게놈 내에 동일한 서열을 갖지 않고, 표적 서열 내에 1개 또는 2개의 불일치를 함유하는 임의의 서열도 갖지 않는 20-mer 표적화 도메인을 지칭할 수 있다. 우수한 직교성을 갖는 표적화 도메인을 선택하여, 표적-외 DNA 절단을 최소화한다.

단일-gRNA 뉴클레아제 절단 및 이중-gRNA 쌍형성 "틈내기효소(nickase)" 전략 둘 모두를 위하여 표적화 도메인을 동정하였다. 표적화 도메인의 선택 및 어떤 표적화 도메인이 이중-gRNA 쌍형성 "틈내기효소" 전략을 위해 사용될 수 있는지의 결정을 위한 기준은 2가지 고려사항을 기반으로 한다:

(1) 표적화 도메인 쌍은 PAM이 외측을 향하도록 DNA 상에 지향되어야 하며, D10A Cas9 틈내기효소로의 절단이 5' 오버행을 초래할 것임; 및

(2) 이중 틈내기효소 쌍으로의 절단이 타당한 빈도로 전체 개재 서열의 결실을 초래할 것이라는 추정. 그러나, 이중 틈내기효소 쌍으로의 절단은 또한 gRNA 중 오직 하나의 부위에서 삽입결실 돌연변이를 초래할 수 있다. 하나의 표적화 도메인의 표적 부위에서 삽입결실 돌연변이를 야기하는 것에 비해 그들이 전체 서열을 얼마나 효율적으로 제거하지에 대하여 후보 쌍 구성원을 시험할 수 있다.

Cas9 분자

다양한 종의 Cas9 분자를 본 명세서에 기재된 방법 및 조성물에 사용할 수 있다. 스트렙토코커스 피오게네스, 스타필로코커스 아우레우스 및 스트렙토코커스 써모필러스 Cas9 분자가 본 명세서에서 많은 개시내용의 대상이지만, 본 명세서에 열거된 다른 종의 Cas9 단백질의, 그로부터 유래된, 또는 그에 기반한 Cas9 분자도 또한 사용될 수 있다. 이들은 예를 들어, 아시도보락스 아베나에(Acidovorax avenae), 악티노바실러스 플뢰로뉴모니애(Actinobacillus pleuropneumoniae), 악티노바실러스 숙시노게네스(Actinobacillus succinogenes), 악티노바실러스 수이스(Actinobacillus suis), 악티노마이세스 종(Actinomyces sp.), 사이클리필러스 데니트리피칸스(Cycliphilus denitrificans), 아미노모나스 파우시보란스(Aminomonas paucivorans), 바실러스 세레우스(Bacillus cereus), 바실러스 스미티(Bacillus smithii), 바실러스 투린기엔시스(Bacillus thuringiensis), 박테로이데스 종(Bacteroides sp.), 블라스토피레룰라 마리나(Blastopirellula marina), 브라디리조븀 종(Bradyrhizobium sp.), 브레비바실러스 라테로스포러스(Brevibacillus laterosporus), 캄필로박터 콜라이(Campylobacter coli), 캄필로박터 제주니(Campylobacter jejuni), 캄필로박터 라리(Campylobacter lari), 칸디다투스 푸니세이스피릴룸(Candidatus puniceispirillum), 클로스트리디움 셀룰로리티쿰(Clostridium cellulolyticum), 클로스트리디움 페르프린겐스(Clostridium perfringens), 코리네박테리움 악콜렌스(Corynebacterium accolens), 코리네박테리움 디프테리아(Corynebacterium diphtheria), 코리네박테리움 마트루코티(Corynebacterium matruchotii), 디노로세오박터 쉬배(Dinoroseobacter shibae), 유박테리움 돌리춤(Eubacterium dolichum), 감마 프로테오박테리움(Gamma proteobacterium), 글루코나세토박터 디아조트로피쿠스(Gluconacetobacter diazotrophicus), 헤모필루스 파라인플루엔자(Haemophilus parainfluenzae), 헤모필루스 스푸토룸(Haemophilus sputorum), 헬리코박터 카나덴시스(Helicobacter canadensis), 헬리코박터 시나에디(Helicobacter cinaedi), 헬리코박터 무스텔라(Helicobacter mustelae), 일리오박터 폴리트로푸스(Ilyobacter polytropus), 킨겔라 킨가에(Kingella kingae), 락토바실러스 크리스파투스(Lactobacillus crispatus), 리스테리아 이바노비(Listeria ivanovii), 리스테리아 모노사이토게네스(Listeria monocytogenes), 리스테리아세 박테리움(Listeriaceae bacterium), 메틸로시스티스 종(Methylocystis sp.), 메틸로시너스 트리코스포리움(Methylosinus trichosporium), 모빌룬커스 물리에리스(Mobiluncus mulieris), 네이세리아 바실리포르미스(Neisseria bacilliformis), 네이세리아 시네레아(Neisseria cinerea), 네이세리아 플라베센스(Neisseria flavescens), 네이세리아 락타미카(Neisseria lactamica), 네이세리아 종(Neisseria sp.), 네이세리아 와드워티(Neisseria wadsworthii), 니트로소모나스 종(Nitrosomonas sp.), 파르비바쿨룸 라바멘티보란스(Parvibaculum lavamentivorans), 파스테우렐라 물토시다(Pasteurella multocida), 파스콜락토박테리움 숙시나투텐스(Phascolarctobacterium succinatutens), 랄스토니아 시지기(Ralstonia syzygii), 로도슈도모나스 팔루스트리스(Rhodopseudomonas palustris), 로도불룸 종(Rhodovulum sp.), 시몬시엘라 무엘레리(Simonsiella muelleri), 스핑고모나스 종(Sphingomonas sp.), 스포로락토바실러스 비니애(Sporolactobacillus vineae), 스타필로코커스 루그두넨시스(Staphylococcus lugdunensis), 스트렙토코커스 종(Streptococcus sp.), 서브돌리그라눌룸 종(Subdoligranulum sp.), 티스트렐라 모빌리스(Tistrella mobilis), 트레포네마 종(Treponema sp.) 또는 베르미네프로박터 에이세니아(Verminephrobacter eiseniae)로부터의 Cas9 분자를 포함한다.

Cas9 도메인

2가지의 상이한 자연 발생 박테리아 Cas9 분자(문헌[Jinek 2014]) 및 가이드 RNA(예를 들어, crRNA 및 tracrRNA의 합성 융합체)와 함께 스트렙토코커스 피오게네스 Cas9에 대한 결정 구조를 결정하였다(문헌[Nishimasu 2014]; 문헌[Anders 2014]).

자연 발생 Cas9 분자는 2개의 엽: 인식(REC) 엽 및 뉴클레아제(NUC) 엽을 포함하며; 이의 각각은 본 명세서에 기재된 도메인을 추가로 포함한다. 도 8a 및 도 8b는 일차 구조에서의 중요한 Cas9 도메인의 구성의 개략도를 제공한다. 본 개시내용에 사용되는 도메인 명명법 및 각 도메인에 의해 포함되는 아미노산 잔기의 넘버링은 이전에 기재된 바와 같다(문헌[Nishimasu 2014]). 아미노산 잔기의 넘버링은 스트렙토코커스 피오게네스로부터의 Cas9와 관련하여 이루어진다.

REC 엽은 아르기닌-풍부 가교 헬릭스(BH), REC1 도메인 및 REC2 도메인을 포함한다. REC 엽은 다른 알려져 있는 단백질과 구조적 유사성을 공유하지 않으며, 이는 그것이 Cas9-특이적 기능성 도메인임을 나타낸다. BH 도메인은 긴 α 헬릭스 및 아르기닌 풍부 영역이며, 스트렙토코커스 피오게네스 Cas9(서열번호 2)의 아미노산 60 내지 93을 포함한다. REC1 도메인은 예를 들어, gRNA 또는 tracrRNA의 반복부:역-반복부 듀플렉스의 인식에 중요하며, 이에 따라 표적 서열의 인식에 의한 Cas9 활성에 중요하다. REC1 도메인은 스트렙토코커스 피오게네스 Cas9(서열번호 2)의 아미노산 94 내지 179 및 308 내지 717에 2개의 REC1 모티프를 포함한다. 이들 2개의 REC1 도메인은 선형 일차 서열에서 REC2 도메인에 의해 분리되어 있지만, 3차 구조에서 조립되어 REC1 도메인을 형성한다. REC2 도메인 또는 그의 부분은 또한 반복부:역-반복부 듀플렉스의 인식에서 역할을 수행할 수 있다. REC2 도메인은 스트렙토코커스 피오게네스 Cas9(서열번호 2)의 아미노산 180 내지 307을 포함한다.

NUC 엽은 RuvC 도메인, HNH 도메인 및 PAM-상호작용(PI) 도메인을 포함한다. RuvC 도메인은 레트로바이러스 인테그라제 상과 구성원과 구조적 유사성을 공유하며, 단일의 가닥, 예를 들어, 표적 핵산 분자의 비상보적 가닥을 절단한다. RuvC 도메인은 스트렙토코커스 피오게네스 Cas9(서열번호 2)의 각각 아미노산 1 내지 59, 718 내지 769 및 909 내지 1098에서 3개의 분할 RuvC 모티프(각각 RuvCI 도메인 또는 N-말단 RuvC 도메인, RuvCII 도메인 및 RuvCIII 도메인으로 해당 분야에서 종종 통상적으로 지칭되는 RuvCI, RuvCII 및 RuvCIII)로부터 조립된다. 3개의 RuvC 모티프는 REC1 도메인과 유사하게, 선형으로 일차 구조에서 다른 도메인에서 의해 분리된다. 그러나, 3차 구조에서, 3개의 RuvC 모티프는 조립되고, RuvC 도메인을 형성한다. HNH 도메인은 HNH 엔도뉴클레아제와 구조적 유사성을 공유하며, 단일 가닥, 예를 들어, 표적 핵산 분자의 상보적 가닥을 절단한다. HNH 도메인은 RuvC II와 III 모티프 사이에 존재하며, 스트렙토코커스 피오게네스 Cas9(서열번호 2)의 아미노산 775 내지 908을 포함한다. PI 도메인은 표적 핵산 분자의 PAM과 상호작용하며, 스트렙토코커스 피오게네스 Cas9(서열번호 2)의 아미노산 1099 내지 1368을 포함한다.

RuvC-유사 도메인 및 HNH-유사 도메인

특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 HNH-유사 도메인 및 RuvC-유사 도메인을 포함하며, 이들 중 특정 구현예에서, 절단 활성은 RuvC-유사 도메인 및 HNH-유사 도메인에 따라 달라진다. Cas9 분자 또는 Cas9 폴리펩타이드는 RuvC-유사 도메인 및 HNH-유사 도메인 중 하나 이상을 포함할 수 있다. 특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 RuvC-유사 도메인, 예를 들어, 하기 기재된 RuvC-유사 도메인 및/또는 HNH-유사 도메인, 예를 들어, 하기 기재된 HNH-유사 도메인을 포함한다.

RuvC-유사 도메인

특정 구현예에서, RuvC-유사 도메인은 단일 가닥, 예를 들어, 표적 핵산 분자의 비상보적 가닥을 절단한다. Cas9 분자 또는 Cas9 폴리펩타이드는 1개 초과의 RuvC-유사 도메인(예를 들어, 1개, 2개, 3개 이상의 RuvC-유사 도메인)을 포함할 수 있다. 특정 구현예에서, RuvC-유사 도메인은 적어도 5개, 6개, 7개, 8개의 아미노산 길이이나, 20개, 19개, 18개, 17개, 16개 또는 15개 이하의 아미노산 길이이다. 특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 약 10개 내지 20개의 아미노산, 예를 들어, 약 15개의 아미노산 길이의 N-말단 RuvC-유사 도메인을 포함한다.

N-말단 RuvC-유사 도메인

일부 자연 발생 Cas9 분자는 1개 초과의 RuvC-유사 도메인을 포함하며, 절단은 N-말단 RuvC-유사 도메인에 따라 달라진다. 따라서, Cas9 분자 또는 Cas9 폴리펩타이드는 N-말단 RuvC-유사 도메인을 포함할 수 있다. 예시적인 N-말단 RuvC-유사 도메인은 하기에 기재된다.

특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 식 I의 아미노산 서열을 포함하는 N-말단 RuvC-유사 도메인을 포함한다:

D-X₁-G-X₂-X₃-X₄-X₅-G-X₆-X₇-X₈-X₉(서열번호 20),

상기 식에서,

X₁은 I, V, M, L 및 T로부터 선택되며(예를 들어, I, V 및 L로부터 선택되며);

X₂는 T, I, V, S, N, Y, E 및 L로부터 선택되며(예를 들어, T, V 및 I로부터 선택되며);

X₃은 N, S, G, A, D, T, R, M 및 F로부터 선택되며(예를 들어, A 또는 N);

X₄는 S, Y, N 및 F로부터 선택되며(예를 들어, S);

X₅는 V, I, L, C, T 및 F로부터 선택되며(예를 들어, V, I 및 L로부터 선택되며);

X₆은 W, F, V, Y, S 및 L로부터 선택되며(예를 들어, W);

X₇은 A, S, C, V 및 G로부터 선택되며(예를 들어, A 및 S로부터 선택되며);

X₈은 V, I, L, A, M 및 H로부터 선택되며(예를 들어, V, I, M 및 L로부터 선택되며);

X₉는 임의의 아미노산으로부터 선택되거나 부재이다(예를 들어, T, V, I, L, Δ, F, S, A, Y, M 및 R로부터 선택되며, 예를 들어, T, V, I, L 및 Δ로부터 선택된다).

특정 구현예에서, N-말단 RuvC-유사 도메인은 서열번호 20의 서열과 1개 만큼 많은(그러나 2개, 3개, 4개 또는 5개 이하의) 잔기가 상이하다.

특정 구현예에서, N-말단 RuvC-유사 도메인은 절단 적격(competent)이다. 다른 구현예에서, N-말단 RuvC-유사 도메인은 절단 부적격이다.

특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 식 II의 아미노산 서열을 포함하는 N-말단 RuvC-유사 도메인을 포함한다:

D-X₁-G-X₂-X₃-S-X₅-G-X₆-X₇-X₈-X₉(서열번호 21),

상기 식에서,

X₆은 W, F, V, Y, S 및 L로부터 선택되며(예를 들어, W);

X₉는 임의의 아미노산으로부터 선택되거나 부재이다(예를 들어, T, V, I, L, Δ, F, S, A, Y, M 및 R로부터 선택되거나, 예를 들어, T, V, I, L 및 Δ로부터 선택된다).

특정 구현예에서, N-말단 RuvC-유사 도메인은 서열번호 21의 서열과 1개 만큼 많은(그러나 2개, 3개, 4개 또는 5개 이하의) 잔기가 상이하다.

특정 구현예에서, N-말단 RuvC-유사 도메인은 식 III의 아미노산 서열을 포함한다:

D-I-G-X₂-X₃-S-V-G-W-A-X₈-X₉(서열번호 22),

상기 식에서,

특정 구현예에서, N-말단 RuvC-유사 도메인은 서열번호 22의 서열과 1개 만큼 많은(그러나 2개, 3개, 4개 또는 5개 이하의) 잔기가 상이하다.

특정 구현예에서, N-말단 RuvC-유사 도메인은 식 IV의 아미노산 서열을 포함한다:

D-I-G-T-N-S-V-G-W-A-V-X(서열번호 23),

상기 식에서,

X는 비극성 알킬 아미노산 또는 하이드록실 아미노산이며, 예를 들어, X는 V, I, L 및 T로부터 선택된다(예를 들어, Cas9 분자는 도 2a 내지 도 2g에 나타낸(Y로 도시) N-말단 RuvC-유사 도메인을 포함할 수 있다).

특정 구현예에서, N-말단 RuvC-유사 도메인은 서열번호 23의 서열과 1개 만큼 많은(그러나 2개, 3개, 4개 또는 5개 이하의) 잔기가 상이하다.

특정 구현예에서, N-말단 RuvC-유사 도메인은 본 명세서에, 예를 들어, 도 3a 및 도 3b에 개시된 N-말단 RuvC 유사 도메인의 서열과 1개 만큼 많은(그러나 2개, 3개, 4개 또는 5개 이하의) 잔기가 상이하다. 일 구현예에서, 도 3a 및 도 3b에서 동정된 고도로 보존된 잔기 중 1개, 2개, 3개 또는 전부가 존재한다.

특정 구현예에서, N-말단 RuvC-유사 도메인은 본 명세서에, 예를 들어, 도 4a 및 도 4b에 개시된 N-말단 RuvC-유사 도메인의 서열과 1개 만큼 많은(그러나 2개, 3개, 4개 또는 5개 이하의) 잔기가 상이하다. 일 구현예에서, 도 4a 및 도 4b에서 동정된 고도로 보존된 잔기 중 1개, 2개 또는 전부가 존재한다.

추가의 RuvC-유사 도메인

N-말단 RuvC-유사 도메인에 더하여, Cas9 분자 또는 Cas9 폴리펩타이드는 하나 이상의 추가의 RuvC-유사 도메인을 포함할 수 있다. 특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 2개의 추가의 RuvC-유사 도메인을 포함할 수 있다. 바람직하게는 추가의 RuvC-유사 도메인은 적어도 5개의 아미노산 갈이이며, 예를 들어, 15개 미만의 아미노산 길이, 예를 들어, 5개 내지 10개의 아미노산 길이, 예를 들어, 8개의 아미노산 길이이다.

추가의 RuvC-유사 도메인은 식 V의 아미노산 서열을 포함할 수 있다:

I-X₁-X₂-E-X₃-A-R-E(서열번호 15),

상기 식에서,

X₁은 V 또는 H이며;

X₂는 I, L 또는 V(예를 들어, I 또는 V)이며;

X₃은 M 또는 T이다.

특정 구현예에서, 추가의 RuvC-유사 도메인은 식 VI의 아미노산 서열을 포함한다:

I-V-X₂-E-M-A-R-E(서열번호 16),

상기 식에서,

X₂는 I, L 또는 V(예를 들어, I 또는 V)이다(예를 들어, Cas9 분자 또는 Cas9 폴리펩타이드는 도 2a 내지 도 2g에 나타낸(B로서 도시된) 추가의 RuvC-유사 도메인을 포함할 수 있다).

추가의 RuvC-유사 도메인은 식 VII의 아미노산 서열을 포함할 수 있다:

H-H-A-X₁-D-A-X₂-X₃(서열번호 17),

상기 식에서,

X₁은 H 또는 L이며;

X₂는 R 또는 V이며;

X₃은 E 또는 V이다.

특정 구현예에서, 추가의 RuvC-유사 도메인은 아미노산 서열: H-H-A-H-D-A-Y-L(서열번호 18)을 포함한다.

특정 구현예에서, 추가의 RuvC-유사 도메인은 서열번호 15 내지 18의 서열과 1개 만큼 많은(그러나 2개, 3개, 4개 또는 5개 이하의) 잔기가 상이하다.

특정 구현예에서, N-말단 RuvC-유사 도메인의 측부배치(flanking) 서열은 식 VIII의 아미노산 서열을 갖는다:

K-X₁'-Y-X₂'-X₃'-X₄'-Z-T-D-X₉'-Y(서열번호 19),

상기 식에서,

X₁'는 K 및 P로부터 선택되며;

X₂'는 V, L, I 및 F로부터 선택되며(예를 들어, V, I 및 L);

X₃'는 G, A 및 S로부터 선택되며(예를 들어, G);

X₄'는 L, I, V 및 F로부터 선택되며(예를 들어, L);

X₉'는 D, E, N 및 Q로부터 선택되며;

Z는 예를 들어, 상기 기재된 바와 같은 N-말단 RuvC-유사 도메인이다.

HNH-유사 도메인

특정 구현예에서, HNH-유사 도메인은 단일 가닥 상보성 도메인, 예를 들어, 이중 가닥 핵산 분자의 상보성 가닥을 절단한다. 특정 구현예에서, HNH-유사 도메인은 적어도 15개, 20개 또는 25개의 아미노산 길이이나, 40개, 35개 또는 30개 이하의 아미노산 길이이며, 예를 들어, 20개 내지 35개의 아미노산 길이, 예를 들어, 25개 내지 30개의 아미노산 길이이다. 예시적인 HNH-유사 도메인은 하기 기재되어 있다.

일 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 식 IX의 아미노산 서열을 갖는 HNH-유사 도메인을 포함한다:

X₁-X₂-X₃-H-X₄-X₅-P-X₆-X₇-X₈-X⁹-X¹⁰-X¹¹-X¹²-X¹³-X¹⁴-X¹⁵-N-X¹⁶-X¹⁷-X¹⁸-X¹⁹-X₂₀-X₂₁-X₂₂-X₂₃-N(서열번호 25),

상기 식에서,

X₁은 D, E, Q 및 N으로부터 선택되며(예를 들어, D 및 E);

X²는 L, I, R, Q, V, M 및 K로부터 선택되며;

X₃은 D 및 E로부터 선택되며;

X₄는 I, V, T, A 및 L로부터 선택되며(예를 들어, A, I 및 V);

X₅는 V, Y, I, L, F 및 W로부터 선택되며(예를 들어, V, I 및 L);

X₆은 Q, H, R, K, Y, I, L, F 및 W로부터 선택되며;

X₇은 S, A, D, T 및 K로부터 선택되며(예를 들어, S 및 A);

X₈은 F, L, V, K, Y, M, I, R, A, E, D 및 Q로부터 선택되며(예를 들어, F);

X₉는 L, R, T, I, V, S, C, Y, K, F 및 G로부터 선택되며;

X₁₀은 K, Q, Y, T, F, L, W, M, A, E, G 및 S로부터 선택되며;

X₁₁은 D, S, N, R, L 및 T로부터 선택되며(예를 들어, D);

X₁₂는 D, N 및 S로부터 선택되며;

X₁₃은 S, A, T, G 및 R로부터 선택되며(예를 들어, S);

X₁₄는 I, L, F, S, R, Y, Q, W, D, K 및 H로부터 선택되며(예를 들어, I, L 및 F);

X₁₅는 D, S, I, N, E, A, H, F, L, Q, M, G, Y 및 V로부터 선택되며;

X₁₆은 K, L, R, M, T 및 F로부터 선택되며(예를 들어, L, R 및 K);

X₁₇은 V, L, I, A 및 T로부터 선택되며;

X₁₈은 L, I, V 및 A로부터 선택되며(예를 들어, L 및 I);

X₁₉는 T, V, C, E, S 및 A로부터 선택되며(예를 들어, T 및 V);

X₂₀은 R, F, T, W, E, L, N, C, K, V, S, Q, I, Y, H 및 A로부터 선택되며;

X₂₁은 S, P, R, K, N, A, H, Q, G 및 L로부터 선택되며;

X₂₂는 D, G, T, N, S, K, A, I, E, L, Q, R 및 Y로부터 선택되며;

X₂₃은 K, V, A, E, Y, I, C, L, S, T, G, K, M, D 및 F로부터 선택된다.

특정 구현예에서, HNH-유사 도메인은 서열번호 25의 서열과 적어도 1개가 상이하나, 2개, 3개, 4개 또는 5개 이하의 잔기가 상이하다.

특정 구현예에서, HNH-유사 도메인은 절단 적격이다. 다른 구현예에서, HNH-유사 도메인은 절단 부적격이다.

특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 식 X의 아미노산 서열을 포함하는 HNH-유사 도메인을 포함한다:

X₁-X₂-X₃-H-X₄-X₅-P-X₆-S-X₈-X₉-X₁₀-D-D-S-X₁₄-X₁₅-N-K-V-L-X₁₉-X₂₀-X₂₁-X₂₂-X₂₃-N(서열번호 26),

상기 식에서,

X₁은 D 및 E로부터 선택되며;

X₂는 L, I, R, Q, V, M 및 K로부터 선택되며;

X₃은 D 및 E로부터 선택되며;

X₄는 I, V, T, A 및 L로부터 선택되며(예를 들어, A, I 및 V);

X₅는 V, Y, I, L, F 및 W로부터 선택되며(예를 들어, V, I 및 L);

X₆은 Q, H, R, K, Y, I, L, F 및 W로부터 선택되며;

X₉는 L, R, T, I, V, S, C, Y, K, F 및 G로부터 선택되며;

X₁₀은 K, Q, Y, T, F, L, W, M, A, E, G 및 S로부터 선택되며;

X₁₅는 D, S, I, N, E, A, H, F, L, Q, M, G, Y 및 V로부터 선택되며;

X₁₉는 T, V, C, E, S 및 A로부터 선택되며(예를 들어, T 및 V);

X₂₁은 S, P, R, K, N, A, H, Q, G 및 L로부터 선택되며;

X₂₂는 D, G, T, N, S, K, A, I, E, L, Q, R 및 Y로부터 선택되며;

특정 구현예에서, HNH-유사 도메인은 서열번호 26의 서열과 1개, 2개, 3개, 4개 또는 5개의 잔기가 상이하다.

특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 식 XI의 아미노산 서열을 포함하는 HNH-유사 도메인을 포함한다:

X₁-V-X₃-H-I-V-P-X₆-S-X₈-X₉-X₁₀-D-D-S-X₁₄-X₁₅-N-K-V-L-T-X₂₀-X₂₁-X₂₂-X₂₃-N(서열번호 27),

상기 식에서,

X₁은 D 및 E로부터 선택되며;

X₃은 D 및 E로부터 선택되며;

X₆은 Q, H, R, K, Y, I, L 및 W로부터 선택되며;

X₉는 L, R, T, I, V, S, C, Y, K, F 및 G로부터 선택되며;

X₁₀은 K, Q, Y, T, F, L, W, M, A, E, G 및 S로부터 선택되며;

X₁₅는 D, S, I, N, E, A, H, F, L, Q, M, G, Y 및 V로부터 선택되며;

X₂₁은 S, P, R, K, N, A, H, Q, G 및 L로부터 선택되며;

X₂₂는 D, G, T, N, S, K, A, I, E, L, Q, R 및 Y로부터 선택되며;

특정 구현예에서, HNH-유사 도메인은 서열번호 27의 서열과 1개, 2개, 3개, 4개 또는 5개의 잔기가 상이하다.

특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 식 XII의 아미노산 서열을 갖는 HNH-유사 도메인을 포함한다:

D-X₂-D-H-I-X₅-P-Q-X₇-F-X₉-X₁₀-D-X₁₂-S-I-D-N-X₁₆-V-L-X₁₉-X₂₀-S-X₂₂-X₂₃-N(서열번호 28),

상기 식에서,

X₂는 I 및 V로부터 선택되며;

X₅는 I 및 V로부터 선택되며;

X₇은 A 및 S로부터 선택되며;

X₉는 I 및 L로부터 선택되며;

X₁₀은 K 및 T로부터 선택되며;

X₁₂는 D 및 N으로부터 선택되며;

X₁₆은 R, K 및 L로부터 선택되며;

X₁₉는 T 및 V로부터 선택되며;

X₂₀은 S 및 R로부터 선택되며;

X₂₂는 K, D 및 A로부터 선택되며;

X₂₃은 E, K, G 및 N으로부터 선택된다(예를 들어, Cas9 분자 또는 Cas9 폴리펩타이드는 본 명세서에 기재된 바와 같은 HNH-유사 도메인을 포함할 수 있다).

일 구현예에서, HNH-유사 도메인은 서열번호 28의 서열과 1개 만큼 많은(그러나 2개, 3개, 4개 또는 5개 이하의) 잔기가 상이하다.

특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 식 XIII의 아미노산 서열을 포함한다:

L-Y-Y-L-Q-N-G-X₁'-D-M-Y-X₂'-X₃'-X₄'-X₅'-L-D-I-X₆'-X₇'-L-S-X₈'-Y-Z-N-R-X₉'-K-X₁₀'-D-X₁₁'-V-P(서열번호 24),

상기 식에서,

X₁'는 K 및 R로부터 선택되며;

X₂'는 V 및 T로부터 선택되며;

X₃'는 G 및 D로부터 선택되며;

X₄'는 E, Q 및 D로부터 선택되며;

X₅'는 E 및 D로부터 선택되며;

X₆'는 D, N 및 H로부터 선택되며;

X₇'는 Y, R 및 N으로부터 선택되며;

X₈'는 Q, D 및 N으로부터 선택되며;

X₉'는 G 및 E로부터 선택되며;

X₁₀'는 S 및 G로부터 선택되며;

X₁₁'는 D 및 N으로부터 선택되며;

Z는 예를 들어, 상기 기재된 바와 같은 HNH-유사 도메인이다.

특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 서열번호 24의 서열과 1개 만큼 많은(그러나 2개, 3개, 4개 또는 5개 이하의) 잔기가 상이한 아미노산 서열을 포함한다.

특정 구현예에서, HNH-유사 도메인은 본 명세서에, 예를 들어, 도 5a 내지 도 5c에 개시된 HNH-유사 도메인의 서열과 1개 만큼 많은(그러나 2개, 3개, 4개 또는 5개 이하의) 잔기가 상이하다. 특정 구현예에서, 도 5a 내지 도 5c에서 동정된 고도로 보존된 잔기 중 1개 또는 둘 모두가 존재한다.

특정 구현예에서, HNH-유사 도메인은 본 명세서에, 예를 들어, 도 6a 및 도 6b에 개시된 HNH-유사 도메인의 서열과 1개 만큼 많은(그러나 2개, 3개, 4개 또는 5개 이하의) 잔기가 상이하다. 일 구현예에서, 도 6a 및 도 6b에서 동정된 고도로 보존된 잔기 중 1개, 2개 또는 3개 모두가 존재한다.

Cas9 활성

특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 표적 핵산 분자를 절단할 수 있다. 전형적으로, 야생형 Cas9 분자는 표적 핵산 분자의 둘 모두의 가닥을 절단한다. Cas9 분자 및 Cas9 폴리펩타이드를 조작하여, 뉴클레아제 절단(또는 다른 특성)을 변경시킬 수 있으며, 예를 들어, 틈내기효소이거나, 또는 표적 핵산을 절단하는 능력이 결여된 Cas9 분자 또는 Cas9 폴리펩타이드를 제공할 수 있다. 표적 핵산 분자를 절단할 수 있는 Cas9 분자 또는 Cas9 폴리펩타이드는 본 명세서에 eaCas9(효소적 활성 Cas9) 분자 또는 eaCas9 폴리펩타이드로 지칭된다.

특정 구현예에서, eaCas9 분자 또는 eaCas9 폴리펩타이드는 하기의 효소 활성 중 하나 이상을 포함한다:

(1) 틈내기효소 활성, 즉, 핵산 분자의 단일 가닥, 예를 들어, 비상보성 가닥 또는 상보성 가닥을 절단하는 능력;

(2) 이중 가닥 뉴클레아제 활성, 즉, 이중 가닥 핵산의 둘 모두의 가닥을 절단하고 이중 가닥 파단부를 생성하는 능력, 일 구현예에서, 2개의 틈내기효소 활성의 존재임;

(3) 엔도뉴클레아제 활성;

(4) 엑소뉴클레아제 활성; 및

(5) 헬리카제 활성, 즉, 이중 가닥 핵산의 나선 구조를 푸는 능력.

특정 구현예에서, eaCas9 분자 또는 eaCas9 폴리펩타이드는 둘 모두의 DNA 가닥을 절단하며, 이중 가닥 파단부를 초래한다. 특정 구현예에서, eaCas9 분자 또는 eaCas9 폴리펩타이드는 단지 하나의 가닥, 예를 들어, gRNA가 혼성화하는 가닥, 또는 gRNA와 혼성화하는 가닥에 상보적인 가닥을 절단한다. 일 구현예에서, eaCas9 분자 또는 eaCas9 폴리펩타이드는 HNH 도메인과 관련된 절단 활성을 포함한다. 일 구현예에서, eaCas9 분자 또는 eaCas9 폴리펩타이드는 RuvC 도메인과 관련된 절단 활성을 포함한다. 일 구현예에서, eaCas9 분자 또는 eaCas9 폴리펩타이드는 HNH 도메인과 관련된 절단 활성 및 RuvC 도메인과 관련된 절단 활성을 포함한다. 일 구현예에서, eaCas9 분자 또는 eaCas9 폴리펩타이드는 활성, 또는 절단 적격, HNH 도메인 및 비활성, 또는 절단 부적격, RuvC 도메인을 포함한다. 일 구현예에서, eaCas9 분자 또는 eaCas9 폴리펩타이드는 비활성, 또는 절단 부적격, HNH 도메인 및 활성, 또는 절단 적격, RuvC 도메인을 포함한다.

일부 Cas9 분자 또는 Cas9 폴리펩티드는 gRNA 분자와 상호작용하는 능력을 갖고, gRNA 분자와 함께 코어 표적 도메인에 국소화되지만, 표적 핵산을 절단할 수 없거나 또는 효율적인 속도로 절단할 수 없다. 절단 활성이 없거나 또는 이것이 실질적으로 없는 Cas9 분자는 본 명세서에서 eiCas9 분자 또는 eiCas9 폴리펩타이드로서 지칭된다. 예를 들어, eiCas9 분자 또는 eiCas9 폴리펩타이드는 본 명세서에 기재된 분석에 의해 측정시 절단 활성이 결여되거나 또는 기준 Cas9 분자 또는 eiCas9 폴리펩타이드의 절단 활성보다 실질적으로 낮을 수 있고, 예를 들어, 이의 20%, 10%, 5%, 1% 또는 0.1% 미만일 수 있다.

표적화 및 PAM

Cas9 분자 또는 Cas9 폴리펩타이드는 gRNA 분자와 상호작용하며, gRNA 분자와 협력하여, 표적 도메인, 특정 구현예에서, PAM 서열을 포함하는 부위에 국소화된다.

특정 구현예에서, 표적 핵산과 상호작용하고, 이를 절단하는 eaCas9 분자 또는 eaCas9 폴리펩타이드의 능력은 PAM 서열 의존적이다. PAM 서열은 표적 핵산 내의 서열이다. 일 구현예에서, 표적 핵산의 절단은 PAM 서열로부터 상류에서 발생한다. 상이한 박테리아 종으로부터의 EaCas9 분자는 상이한 서열 모티프(예를 들어, PAM 서열)를 인식할 수 있다. 일 구현예에서, 스트렙토코커스 피오게네스의 eaCas9 분자는 서열 모티프 NGG를 인식하며, 해당 서열로부터 1 내지 10, 예를 들어, 3 내지 5 bp 상류의 표적 핵산 서열의 절단을 지시한다(예를 들어, 문헌[Mali 2013] 참조). 일 구현예에서, 스트렙토코커스 써모필러스의 eaCas9 분자는 서열 모티프 NGGNG(서열번호 199) 및/또는 NNAGAAW(W = A 또는 T)(서열번호 200)를 인식하며, 이들 서열로부터 1 내지 10, 예를 들어, 3 내지 5 bp 상류의 표적 핵산 서열의 절단을 지시한다(예를 들어, 문헌[Horvath 2010]; 문헌[Deveau 2008] 참조). 일 구현예에서, 스트렙토코커스 뮤탄스의 eaCas9 분자는 서열 모티프 NGG 및/또는 NAAR(R = A 또는 G)(서열번호 201)을 인식하며, 이들 서열로부터 1 내지 10, 예를 들어, 3 내지 5 bp 상류의 표적 핵산 서열의 절단을 지시한다(예를 들어, 문헌[Deveau 2008] 참조). 일 구현예에서, 스타필로코커스 아우레우스의 eaCas9 분자는 서열 모티프 NNGRR(R = A 또는 G)(서열번호 202)을 인식하며, 해당 서열로부터 1 내지 10, 예를 들어, 3 내지 5 bp 상류의 표적 핵산 서열의 절단을 지시한다. 일 구현예에서, 스타필로코커스 아우레우스의 eaCas9 분자는 서열 모티프 NNGRRN(R = A 또는 G)(서열번호 203)을 인식하며, 해당 서열로부터 1 내지 10, 예를 들어, 3 내지 5 bp 상류의 표적 핵산 서열의 절단을 지시한다. 일 구현예에서, 스타필로코커스 아우레우스의 eaCas9 분자는 서열 모티프 NNGRRT(R = A 또는 G)(서열번호 204)를 인식하며, 해당 서열로부터 1 내지 10, 예를 들어, 3 내지 5 bp 상류의 표적 핵산 서열의 절단을 지시한다. 일 구현예에서, 스타필로코커스 아우레우스의 eaCas9 분자는 서열 모티프 NNGRRV(R = A 또는 G, V = A, G 또는 C)(서열번호 205)를 인식하며, 해당 서열로부터 1 내지 10, 예를 들어, 3 내지 5 bp 상류의 표적 핵산 서열의 절단을 지시한다. PAM 서열을 인식하는 Cas9 분자의 능력은 예를 들어, 이전에 기재된 바와 같은 형질전환 분석을 사용하여 결정될 수 있다(문헌[Jinek 2012]). 상기 언급된 구현예의 각각(즉, 서열번호 199 내지 205)에서, N은 임의의 뉴클레오타이드 잔기, 예를 들어, A, G, C 또는 T 중 임의의 것일 수 있다.

본 명세서에 논의된 바와 같이, Cas9 분자를 조작하여, Cas9 분자의 PAM 특이성을 변경시킬 수 있다.

예시적인 자연 발생 Cas9 분자가 이전에 기재되어 있다(예를 들어, 문헌[Chylinski 2013] 참조). 이러한 Cas9 분자는 클러스터 1 박테리아과, 클러스터 2 박테리아과, 클러스터 3 박테리아과, 클러스터 4 박테리아과, 클러스터 5 박테리아과, 클러스터 6 박테리아과, 클러스터 7 박테리아과, 클러스터 8 박테리아과, 클러스터 9 박테리아과, 클러스터 10 박테리아과, 클러스터 11 박테리아과, 클러스터 12 박테리아과, 클러스터 13 박테리아과, 클러스터 14 박테리아과, 클러스터 15 박테리아과, 클러스터 16 박테리아과, 클러스터 17 박테리아과, 클러스터 18 박테리아과, 클러스터 19 박테리아과, 클러스터 20 박테리아과, 클러스터 21 박테리아과, 클러스터 22 박테리아과, 클러스터 23 박테리아과, 클러스터 24 박테리아과, 클러스터 25 박테리아과, 클러스터 26 박테리아과, 클러스터 27 박테리아과, 클러스터 28 박테리아과, 클러스터 29 박테리아과, 클러스터 30 박테리아과, 클러스터 31 박테리아과, 클러스터 32 박테리아과, 클러스터 33 박테리아과, 클러스터 34 박테리아과, 클러스터 35 박테리아과, 클러스터 36 박테리아과, 클러스터 37 박테리아과, 클러스터 38 박테리아과, 클러스터 39 박테리아과, 클러스터 40 박테리아과, 클러스터 41 박테리아과, 클러스터 42 박테리아과, 클러스터 43 박테리아과, 클러스터 44 박테리아과, 클러스터 45 박테리아과, 클러스터 46 박테리아과, 클러스터 47 박테리아과, 클러스터 48 박테리아과, 클러스터 49 박테리아과, 클러스터 50 박테리아과, 클러스터 51 박테리아과, 클러스터 52 박테리아과, 클러스터 53 박테리아과, 클러스터 54 박테리아과, 클러스터 55 박테리아과, 클러스터 56 박테리아과, 클러스터 57 박테리아과, 클러스터 58 박테리아과, 클러스터 59 박테리아과, 클러스터 60 박테리아과, 클러스터 61 박테리아과, 클러스터 62 박테리아과, 클러스터 63 박테리아과, 클러스터 64 박테리아과, 클러스터 65 박테리아과, 클러스터 66 박테리아과, 클러스터 67 박테리아과, 클러스터 68 박테리아과, 클러스터 69 박테리아과, 클러스터 70 박테리아과, 클러스터 71 박테리아과, 클러스터 72 박테리아과, 클러스터 73 박테리아과, 클러스터 74 박테리아과, 클러스터 75 박테리아과, 클러스터 76 박테리아과, 클러스터 77 박테리아과, 또는 클러스터 78 박테리아과의 Cas9 분자를 포함한다.

예시적인 자연 발생 Cas9 분자는 클러스터 1 박테리아과의 Cas9 분자를 포함한다. 예는 스타필로코커스 아우레우스, 스트렙토코커스 피오게네스(예를 들어, 균주 SF370, MGAS10270, MGAS10750, MGAS2096, MGAS315, MGAS5005, MGAS6180, MGAS9429, NZ131, SSI-1), 스트렙토코커스 써모필러스(예를 들어, 균주 LMD-9), 스트렙토코커스 수도포르시누스(S. pseudoporcinus)(예를 들어, 균주 SPIN 20026), 스트렙토코커스 뮤탄스(예를 들어, 균주 UA159, NN2025), 스트렙토코커스 마카카에(S. macacae)(예를 들어, 균주 NCTC11558), 스트렙토코커스 갈로리티쿠스(S. gallolyticus)(예를 들어, 균주 UCN34, ATCC BAA-2069), 스트렙토코커스 에쿠이네스(S. equines)(예를 들어, 균주 ATCC 9812, MGCS 124), 스트렙토코커스 디스달락티애(S. dysdalactiae)(예를 들어, 균주 GGS 124), 스트렙토코커스 보비스(S. bovis)(예를 들어, 균주 ATCC 700338), 스트렙토코커스 안기노서스(S. anginosus)(예를 들어, 균주 F0211), 스트렙토코커스 아갈락티애(S. agalactiae)(예를 들어, 균주 NEM316, A909), 리스테리아 모노사이토게네스(예를 들어, 균주 F6854), 리스테리아 이노쿠아(리스테리아 이노쿠아, 예를 들어, 균주 Clip11262), 엔테로코커스 이탈리쿠스(Enterococcus italicus)(예를 들어, 균주 DSM 15952) 또는 엔테로코커스 파에시움(Enterococcus faecium)(예를 들어, 균주 1,231,408)의 Cas9 분자를 포함한다.

특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는

본 명세서에 기재된 임의의 Cas9 분자 서열 또는 자연 발생 Cas9 분자 서열, 예를 들어, 본 명세서에 열거되거나(예를 들어, 서열번호 1, 2, 4 내지 6 또는 12) 또는 문헌[Chylinski 2013]에 기재된 종으로부터의 Cas9 분자와,

60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%의 상동성을 갖거나;

이와 비교하는 경우 아미노산 잔기의 2%, 5%, 10%, 15%, 20%, 30% 또는 40% 이하가 상이하거나;

이와 적어도 1개, 2개, 5개, 10개 또는 20개의(그러나 100개, 80개, 70개, 60개, 50개, 40개 또는 30개 이하의) 아미노산이 상이하거나; 또는

이와 동일한 아미노산 서열을 포함한다. 일 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 다음의 활성 중 하나 이상을 포함한다: 틈내기효소 활성; 이중 가닥 절단 활성(예를 들어, 엔도뉴클레아제 및/또는 엑소뉴클레아제 활성); 헬리카제 활성; 또는 gRNA 분자와 함께 표적 핵산에 국소화하는 능력.

특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 도 2a 내지 도 2g의 공통 서열의 아미노산 서열 중 임의의 것을 포함하며, "*"는 스트렙토코커스 피오게네스, 스트렙토코커스 써모필러스, 스트렙토코커스 뮤탄스 또는 리스테리아 이노쿠아의 Cas9 분자의 아미노산 서열 내의 상응하는 위치에서 발견되는 임의의 아미노산을 나타내고, "-"는 부재임을 나타낸다. 일 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 도 2a 내지 도 2g에 개시된 공통 서열의 서열과 적어도 1개의(그러나 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개 이하의) 아미노산 잔기가 상이하다. 특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 서열번호 2의 아미노산 서열을 포함한다. 다른 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 서열번호 2의 서열과 적어도 1개의(그러나 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개 이하의) 아미노산 잔기가 상이하다.

다수의 Cas9 분자의 서열 비교는, 특정 영역이 보존되는 것을 나타낸다. 이들은 이하에

영역 1(잔기 1 내지 180, 또는 영역 1'의 경우에 잔기 120 내지 180)

영역 2(잔기 360 내지 480);

영역 3(잔기 660 내지 720);

영역 4(잔기 817 내지 900); 및

영역 5(잔기 900 내지 960)로서 확인된다.

특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 생물학적으로 활성인 분자, 예를 들어, 본 명세서에 기재된 적어도 하나의 활성을 갖는 Cas9 분자를 제공하기 위해 충분한 추가적인 Cas9 분자 서열과 함께 영역 1 내지 5를 포함한다. 특정 구현예에서, 영역 1 내지 5는 각각 독립적으로 본 명세서에 기재된 Cas9 분자 또는 Cas9 폴리펩타이드의 상응하는 잔기, 예를 들어, 도 2a 내지 도 2g로부터의 서열(서열번호 1, 2, 4, 5, 14)과 50%, 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%의 상동성을 가진다.

특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 영역 1로서 지칭되는 아미노산 서열을 포함하며, 이는:

스트렙토코커스 피오게네스의 Cas9의 아미노산 서열(서열번호 2)의 아미노산 1 내지 180(넘버링은 도 2에서 모티프 서열에 따르며; 도 2a 내지 도 2g의 4개의 Cas9 서열 내 잔기의 52%는 보존됨)과 50%, 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%의 상동성을 갖거나;

스트렙토코커스 피오게네스, 스트렙토코커스 써모필러스, 스트렙토코커스 뮤탄스 또는 리스테리아 이노쿠아의 아미노산 서열(각각 서열번호 2, 4, 1 및 5)의 아미노산 1 내지 180과 적어도 1개, 2개, 5개, 10개 또는 20개의(그러나 90개, 80개, 70개, 60개, 50개, 40개 또는 30개 이하의) 아미노산이 상이하거나; 또는

스트렙토코커스 피오게네스, 스트렙토코커스 써모필러스, 스트렙토코커스 뮤탄스 또는 리스테리아 이노쿠아의 Cas9의 아미노산 서열(각각 서열번호 2, 4, 1 및 5)의 아미노산 1 내지 180과 동일하다.

특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 영역 1'로서 지칭되는 아미노산 서열을 포함하며, 이는:

스트렙토코커스 피오게네스, 스트렙토코커스 써모필러스, 스트렙토코커스 뮤탄스 또는 리스테리아 이노쿠아의 Cas9의 아미노산 서열(각각 서열번호 2, 4, 1 및 5)의 아미노산 120 내지 180(도 2에서 4가지 Cas9 서열에서 잔기의 55%가 보존됨)과 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%의 상동성을 갖거나;

스트렙토코커스 피오게네스, 스트렙토코커스 써모필러스, 스트렙토코커스 뮤탄스 또는 리스테리아 이노쿠아의 Cas9의 아미노산 서열(각각 서열번호 2, 4, 1 및 5)의 아미노산 120 내지 180과 적어도 1개, 2개 또는 5개의(그러나 35개, 30개, 25개, 20개 또는 10개 이하의) 아미노산이 상이하거나; 또는

스트렙토코커스 피오게네스, 스트렙토코커스 써모필러스, 스트렙토코커스 뮤탄스 또는 리스테리아 이노쿠아의 Cas9의 아미노산 서열(각각 서열번호 2, 4, 1 및 5)의 아미노산 120 내지 180과 동일하다.

특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 영역 2로서 지칭되는 아미노산 서열을 포함하며, 이는:

스트렙토코커스 피오게네스, 스트렙토코커스 써모필러스, 스트렙토코커스 뮤탄스 또는 리스테리아 이노쿠아의 Cas9의 아미노산 서열(각각 서열번호 2, 4, 1 및 5)의 아미노산 360 내지 480(도 2에서 4가지 Cas9 서열에서 잔기의 52%가 보존됨)과 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%의 상동성을 갖거나;

스트렙토코커스 피오게네스, 스트렙토코커스 써모필러스, 스트렙토코커스 뮤탄스 또는 리스테리아 이노쿠아의 Cas9의 아미노산 서열(각각 서열번호 2, 4, 1 및 5)의 아미노산 360 내지 480과 적어도 1개, 2개 또는 5개의(그러나 35개, 30개, 25개, 20개 또는 10개 이하의) 아미노산이 상이하거나; 또는

스트렙토코커스 피오게네스, 스트렙토코커스 써모필러스, 스트렙토코커스 뮤탄스 또는 리스테리아 이노쿠아의 Cas9의 아미노산 서열(각각 서열번호 2, 4, 1 및 5)의 아미노산 360 내지 480과 동일하다.

특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 영역 3으로서 지칭되는 아미노산 서열을 포함하며, 이는:

스트렙토코커스 피오게네스, 스트렙토코커스 써모필러스, 스트렙토코커스 뮤탄스 또는 리스테리아 이노쿠아의 Cas9의 아미노산 서열(각각 서열번호 2, 4, 1 및 5)의 아미노산 660 내지 720(도 2에서 4가지 Cas9 서열에서 잔기의 56%가 보존됨)과 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%의 상동성을 갖거나;

스트렙토코커스 피오게네스, 스트렙토코커스 써모필러스, 스트렙토코커스 뮤탄스 또는 리스테리아 이노쿠아의 Cas9의 아미노산 서열(각각 서열번호 2, 4, 1 및 5)의 아미노산 660 내지 720과 적어도 1개, 2개 또는 5개의(그러나 35개, 30개, 25개, 20개 또는 10개 이하의) 아미노산이 상이하거나; 또는

스트렙토코커스 피오게네스, 스트렙토코커스 써모필러스, 스트렙토코커스 뮤탄스 또는 리스테리아 이노쿠아의 Cas9의 아미노산 서열(각각 서열번호 2, 4, 1 및 5)의 아미노산 660 내지 720과 동일하다.

특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 영역 4로서 지칭되는 아미노산 서열을 포함하며, 이는:

스트렙토코커스 피오게네스, 스트렙토코커스 써모필러스, 스트렙토코커스 뮤탄스 또는 리스테리아 이노쿠아의 Cas9의 아미노산 서열(각각 서열번호 2, 4, 1 및 5)의 아미노산 817 내지 900(도 2a 내지 도 2g에서 4가지 Cas9 서열에서 잔기의 55%가 보존됨)과 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%의 상동성을 갖거나;

스트렙토코커스 피오게네스, 스트렙토코커스 써모필러스, 스트렙토코커스 뮤탄스 또는 리스테리아 이노쿠아의 Cas9의 아미노산 서열(각각 서열번호 2, 4, 1 및 5)의 아미노산 817 내지 900과 적어도 1개, 2개 또는 5개의(그러나 35개, 30개, 25개, 20개 또는 10개 이하의) 아미노산이 상이하거나; 또는

스트렙토코커스 피오게네스, 스트렙토코커스 써모필러스, 스트렙토코커스 뮤탄스 또는 리스테리아 이노쿠아의 Cas9의 아미노산 서열(각각 서열번호 2, 4, 1 및 5)의 아미노산 817 내지 900과 동일하다.

특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 영역 5로서 지칭되는 아미노산 서열을 포함하며, 이는:

스트렙토코커스 피오게네스, 스트렙토코커스 써모필러스, 스트렙토코커스 뮤탄스 또는 리스테리아 이노쿠아의 Cas9의 아미노산 서열(각각 서열번호 2, 4, 1 및 5)의 아미노산 900 내지 960(도 2a 내지 도 2g에서 4가지 Cas9 서열에서 잔기의 60%가 보존됨)과 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%의 상동성을 갖거나;

스트렙토코커스 피오게네스, 스트렙토코커스 써모필러스, 스트렙토코커스 뮤탄스 또는 리스테리아 이노쿠아의 Cas9의 아미노산 서열(각각 서열번호 2, 4, 1 및 5)의 아미노산 900 내지 960과 적어도 1개, 2개 또는 5개의(그러나 35개, 30개, 25개, 20개 또는 10개 이하의) 아미노산이 상이하거나; 또는

스트렙토코커스 피오게네스, 스트렙토코커스 써모필러스, 스트렙토코커스 뮤탄스 또는 리스테리아 이노쿠아의 Cas9의 아미노산 서열(각각 서열번호 2, 4, 1 및 5)의 아미노산 900 내지 960과 동일하다.

조작된 또는 변경된 Cas9

본 명세서에 기재된 Cas9 분자 및 Cas9 폴리펩타이드는 뉴클레아제 활성(예를 들어, 엔도뉴클레아제 및/또는 엑소뉴클레아제 활성); 헬리카제 활성; gRNA 분자와 기능적으로 회합하는 능력; 및 핵산 상의 부위를 표적화하는(예를 들어, 이에 국소화하는) 능력(예를 들어, PAM 인식 및 특이성)을 포함하는 다수의 특성 중 임의의 것을 지닐 수 있다. 특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 이들 특성의 모두 또는 하위세트를 포함할 수 있다. 전형적인 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 gRNA 분자와 상호작용하고, gRNA 분자와 협력하여, 핵산 내 부위에 국소화하는 능력을 가진다. 다른 활성, 예를 들어, PAM 특이성, 절단 활성 또는 헬리카제 활성은 Cas9 분자 및 Cas9 폴리펩타이드에서 더욱 광범위하게 변할 수 있다.

Cas9 분자는 조작된 Cas9 분자 및 조작된 Cas9 폴리펩타이드를 포함한다(이러한 맥락에서 사용되는 조작된은 단지 Cas9 분자 또는 Cas9 폴리펩타이드가 기준 서열과 상이함을 의미하며, 과정 또는 기원 제한을 암시하지 않는다). 조작된 Cas9 분자 또는 Cas9 폴리펩타이드는 (자연 발생 또는 기타 기준 Cas9 분자와 비교하여) 변경된 효소 특성, 예를 들어, 변경된 뉴클레아제 활성 또는 변경된 헬리카제 활성을 포함할 수 있다. 본 명세서에 논의된 바와 같이, 조작된 Cas9 분자 또는 Cas9 폴리펩타이드는 (이중 가닥 뉴클레아제 활성과 대조적인) 틈내기효소 활성을 가질 수 있다. 특정 구현예에서, 조작된 Cas9 분자 또는 Cas9 폴리펩타이드는 예를 들어, 하나 이상의 Cas9 활성에 대한 유의미한 영향 없이, 그의 크기를 변경시키는 변경, 예를 들어, 그의 크기를 감소시키는 아미노산 서열의 결실을 가질 수 있다. 특정 구현예에서, 조작된 Cas9 분자 또는 Cas9 폴리펩타이드는 PAM 인식에 영향을 미치는 변경을 포함할 수 있드며, 예를 들어, 조작된 Cas9 분자는 내인성 야생형 PI 도메인에 의해 인식되는 것 이외의 PAM 서열을 인식하도록 변경될 수 있다. 특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 자연 발생 Cas9 분자와 서열이 상이할 수 있지만, 하나 이상의 Cas9 활성의 유의미한 변경을 갖지 않는다.

원하는 특성을 갖는 Cas9 분자 또는 Cas9 폴리펩타이드는 다수의 방식으로, 예를 들어, 모체, 예를 들어, 자연 발생 Cas9 분자 또는 Cas9 폴리펩타이드의 변경에 의해 원하는 특성을 갖는 변경된 Cas9 분자 또는 Cas9 폴리펩타이드를 제공하도록 제조될 수 있다. 예를 들어, 모체 Cas9 분자, 예를 들어, 자연 발생 또는 조작된 Cas9 분자에 비한 하나 이상의 돌연변이 또는 차이가 도입될 수 있다. 이러한 돌연변이 및 차이는 치환(예를 들어, 보존적 치환 또는 비필수 아미노산의 치환); 삽입; 또는 결실을 포함한다. 일 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 기준, 예를 들어, 모체 Cas9 분자에 비하여, 하나 이상의 돌연변이 또는 차이, 예를 들어, 적어도 1개, 2개, 3개, 4개, 5개, 10개, 15개, 20개, 30개, 40개 또는 50개의 돌연변이를 포함할 수 있지만, 200개, 100개 또는 80개 미만의 돌연변이를 포함할 수 있다.

특정 구현예에서, 돌연변이 또는 돌연변이들은 Cas9 활성, 예를 들어, 본 명세서에 기재된 Cas9 활성에 상당한 영향을 가질 수 있다. 다른 구현예에서, 돌연변이 또는 돌연변이들은 Cas9 활성, 예를 들어, 본 명세서에 기재된 Cas9 활성에 상당한 영향을 갖는다.

비-절단 및 변형된-절단 Cas9

일 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 자연 발생 Cas9 분자와 상이한, 예를 들어, 가장 근접한 상동성을 갖는 자연 발생 Cas9 분자와 상이한 절단 특성을 포함한다. 예를 들어, Cas9 분자 또는 Cas9 폴리펩타이드는 하기와 같이 자연 발생 Cas9 분자, 예를 들어, 스트렙토코커스 피오게네스의 Cas9 분자와 상이할 수 있다: 예를 들어, 자연 발생 Cas9 분자(예를 들어, 스트렙토코커스 피오게네스의 Cas9 분자)와 비교시, 이중 가닥 핵산의 절단(엔도뉴클레아제 및/또는 엑소뉴클레아제 활성)을 조절, 예를 들어, 감소 또는 증가시키는 그의 능력; 예를 들어, 자연 발생 Cas9 분자(예를 들어, 스트렙토코커스 피오게네스의 Cas9 분자)와 비교시, 핵산의 단일 가닥, 예를 들어, 핵산 분자의 비-상보성 가닥 또는 핵산 분자의 상보성 가닥의 절단(틈내기효소 활성)을 조절, 예를 들어, 감소 또는 증가시키는 그의 능력; 또는 핵산 분자, 예를 들어, 이중 가닥 또는 단일 가닥 핵산 분자를 절단하는 능력이 제거될 수 있음.

특정 구현예에서, eaCas9 분자 또는 eaCas9 폴리펩타이드는 하기의 활성 중 하나 이상을 포함한다: N-말단 RuvC-유사 도메인과 관련된 절단 활성; HNH-유사 도메인과 관련된 절단 활성; HNH-유사 도메인과 관련된 절단 활성 및 N-말단 RuvC-유사 도메인과 관련된 절단 활성.

특정 구현예에서, eaCas9 분자 또는 eaCas9 폴리펩타이드는 활성, 또는 절단 적격, HNH-유사 도메인(예를 들어, 본 명세서, 예를 들어, 서열번호 24 내지 28에 기재된 HNH-유사 도메인) 및 비활성, 또는 절단 부적격, N-말단 RuvC-유사 도메인을 포함한다. 예시적인 비활성, 또는 절단 부적격 N-말단 RuvC-유사 도메인은 N-말단 RuvC-유사 도메인의 아스파르트산, 예를 들어, 도 2a 내지 도 2g에 개시된 공통 서열의 위치 9에서 아스파르트산 또는 서열번호 2의 위치 10에서 아스파르트산의 돌연변이를 가질 수 있고, 예를 들어, 알라닌으로 치환될 수 있다. 일 구현예에서, eaCas9 분자 또는 eaCas9 폴리펩타이드는 N-말단 RuvC-유사 도메인이 야생형과 상이하며, 예를 들어, 본 명세서에 기재된 분석에 의해 측정시, 표적 핵산을 절단하지 않거나, 또는 기준 Cas9 분자의 절단 활성보다 상당히 더 적은 효율로, 예를 들어, 20%, 10%, 5%, 1% 또는 0.1% 미만으로 절단한다. 기준 Cas9 분자는 자연 발생 비변형 Cas9 분자, 예를 들어, 자연 발생 Cas9 분자, 예컨대 스트렙토코커스 피오게네스 또는 스트렙토코커스 써모필러스의 Cas9 분자일 수 있다. 일 구현예에서, 기준 Cas9 분자는 가장 가까운 서열 동일성 또는 상동성을 갖는 자연 발생 Cas9 분자이다.

일 구현예에서, eaCas9 분자 또는 eaCas9 폴리펩타이드는 비활성, 또는 절단 부적격, HNH 도메인 및 활성, 또는 절단 적격, N-말단 RuvC-유사 도메인(예를 들어, 본 명세서, 예를 들어, 서열번호 15 내지 23에 기재된 RuvC-유사 도메인)을 포함한다. 예시적인 비활성, 또는 절단 부적격 HNH-유사 도메인은 예를 들어, 알라닌으로 치환될 수 있는, HNH-유사 도메인 내의 히스티딘, 예를 들어, 도 2a 내지 도 2g에 개시된 공통 서열의 위치 856에 나타난 히스티딘; 및 예를 들어, 알라닌으로 치환될 수 있는, HNH-유사 도메인 내의 하나 이상의 아스파라긴, 예를 들어, 도 2a 내지 도 2g에 개시된 공통 서열의 위치 870에 및/또는 도 2a 내지 도 2g에 개시된 공통 서열의 위치 879에 나타난 아스파라긴 중 하나 이상에서 돌연변이를 가질 수 있다. 일 구현예에서, eaCas9는 HNH-유사 도메인이 야생형과 상이하고, 예를 들어, 본 명세서에 기재된 분석에 의해 측정시, 표적 핵산을 절단하지 않거나, 또는 기준 Cas9 분자의 절단 활성보다 상당히 더 적은 효율, 예를 들어, 20%, 10%, 5%, 1% 또는 0.1% 미만으로 절단한다. 기준 Cas9 분자는 자연 발생 비변형 Cas9 분자, 예를 들어, 자연 발생 Cas9 분자, 예컨대 스트렙토코커스 피오게네스 또는 스트렙토코커스 써모필러스의 Cas9 분자일 수 있다. 일 구현예에서, 기준 Cas9 분자는 가장 가까운 서열 동일성 또는 상동성을 갖는 자연 발생 Cas9 분자이다.

특정 구현예에서, 예시적인 Cas9 활성은 PAM 특이성, 절단 활성 및 헬리카제 활성 중 하나 이상을 포함한다. 돌연변이(들)는 예를 들어, 하나 이상의 RuvC 도메인, 예를 들어, N-말단 RuvC 도메인; HNH 도메인; RuvC 도메인 및 HNH 도메인 외측의 영역에 존재할 수 있다. 일 구현예에서, 돌연변이(들)는 RuvC 도메인에 존재한다. 일 구현예에서, 돌연변이(들)는 HNH 도메인에 존재한다. 일 구현예에서, 돌연변이는 RuvC 도메인 및 HNH 도메인 둘 모두에 존재한다.

스트렙토코커스 피오게네스 서열과 관련하여 RuvC 도메인 또는 HNH 도메인에서 이루어질 수 있는 예시적인 돌연변이는 D10A, E762A, H840A, N854A, N863A 및/또는 D986A를 포함한다.

특정 구현예에서, Cas9 분자는 기준 Cas9 분자와 비교시, RuvC 도메인 및/또는 HNH 도메인의 하나 이상의 차이를 포함하는 eiCas9 분자일 수 있으며, eiCas9 분자는 예를 들어, 본 명세서에 기재된 절단 분석에서, 핵산을 절단하지 않거나, 기준 Cas9 분자보다 유의미하게 더 낮은 효율로 절단하고, 예를 들어, eiCas9 분자는 기준 Cas9 분자, 예를 들어, 상응하는 야생형 Cas9 분자보다 50%, 25%, 10% 또는 1% 더 낮은 효율로 절단한다.

특정 서열, 예를 들어, 치환이 하나 이상의 활성, 예컨대 표적화 활성, 절단 활성 등에 영향을 미칠 수 있는지 여부는, 예를 들어, 돌연변이가 보존적인지의 여부를 평가함으로써 평가 또는 예측될 수 있다. 일 구현예에서, Cas9 분자와 관련하여 사용된 바와 같은 "비필수" 아미노산 잔기는 Cas9 활성(예를 들어, 절단 활성)을 없애지 않고, 또는 더욱 바람직하게는 실질적으로 변경시키지 않고, Cas9 분자, 예를 들어, 자연 발생 Cas9 분자, 예를 들어, eaCas9 분자의 야생형 서열로부터 변경될 수 있는 잔기인 반면, "필수" 아미노산 잔기를 바꾸는 것은 활성(예를 들어, 절단 활성)의 상당한 소실을 초래한다.

일 구현예에서, Cas9 분자는 자연 발생 Cas9 분자와 상이한, 예를 들어, 가장 가까운 상동성을 갖는 자연 발생 Cas9 분자와 상이한 절단 특성을 포함한다. 예를 들어, Cas9 분자는 하기와 같이, 자연 발생 Cas9 분자, 예를 들어, 스타필로코커스 아우레우스, 스트렙토코커스 피오게네스 또는 캄필로박터 제주니의 Cas9 분자와 상이할 수 있다: 예를 들어, 자연 발생 Cas9 분자(예를 들어, 스타필로코커스 아우레우스, 스트렙토코커스 피오게네스 또는 캄필로박터 제주니의 Cas9 분자)와 비교시, 이중 가닥 파단의 절단(엔도뉴클레아제 및/또는 엑소뉴클레아제 활성)을 조절, 예를 들어, 감소 또는 증가시키는 그의 능력; 예를 들어, 자연 발생 Cas9 분자(예를 들어, 스타필로코커스 아우레우스, 스트렙토코커스 피오게네스 또는 캄필로박터 제주니의 Cas9 분자)와 비교시, 핵산의 단일 가닥, 예를 들어, 핵산 분자의 비-상보성 가닥 또는 핵산 분자의 상보성 가닥의 절단(틈내기효소 활성)을 조절, 예를 들어, 감소 또는 증가시키는 그의 능력; 또는 핵산 분자, 예를 들어, 이중 가닥 또는 단일 가닥 핵산 분자를 절단하는 능력이 제거될 수 있음.

일 구현예에서, 변경된 Cas9 분자는 하기의 활성 중 하나 이상을 포함하는 eaCas9 분자이다: RuvC 도메인과 관련된 절단 활성; HNH 도메인과 관련된 절단 활성; HNH 도메인과 관련된 절단 활성 및 RuvC 도메인과 관련된 절단 활성.

특정 구현예에서, 변경된 Cas9 분자는 예를 들어, 본 명세서에 기재된 분석에 의해 측정시, 핵산 분자(이중-가닥 또는 단일-가닥 핵산 분자)를 절단하지 않거나, 또는 기준 Cas9 분자의 절단 활성보다 상당히 더 적은 효율로, 예를 들어, 20%, 10%, 5%, 1% 또는 0.1% 미만으로 핵산 분자를 절단하는 eiCas9 분자이다. 기준 Cas9 분자는 자연 발생 비변형 Cas9 분자, 예를 들어, 자연 발생 Cas9 분자, 예컨대 스트렙토코커스 피오게네스, 스트렙토코커스 써모필러스, 스타필로코커스 아우레우스, 캄필로박터 제주니 또는 나이세리아 메닌지티디스의 Cas9 분자일 수 있다. 특정 구현예에서, 기준 Cas9 분자는 가장 가까운 서열 동일성 또는 상동성을 갖는 자연 발생 Cas9 분자이다. 특정 구현예에서, eiCas9 분자는 RuvC 도메인과 관련된 상당한 절단 활성 및/또는 HNH 도메인과 관련된 절단 활성이 결여되어 있다.

특정 구현예에서, 변경된 Cas9 분자 또는 Cas9 폴리펩타이드는 소정의 서열을 가지며:

도 2a 내지 도 2g에 개시된 공통 서열의 고정 서열에 상응하는 서열은 도 2a 내지 도 2g에 개시된 공통 서열 내의 고정 잔기의 1%, 2%, 3%, 4%, 5%, 10%, 15% 또는 20% 이하가 상이하고;

도 2a 내지 도 2g에 개시된 공통 서열에서 "*"로 확인된 서열에 상응하는 서열은 자연 발생 Cas9 분자, 예를 들어, 스트렙토코커스 써모필러스, 스트렙토코커스 뮤탄스, 스트렙토코커스 피오게네스 또는 리스테리아 이노쿠아 Cas9 분자의 상응하는 서열과, "*" 잔기의 1%, 2%, 3%, 4%, 5%, 10%, 15%, 20%, 25%, 30%, 35% 또는 40% 이하가 상이하다.

일 구현예에서, 변경된 Cas9 분자 또는 Cas9 폴리펩타이드는 도 2a 내지 도 2g에 개시된 공통 서열(서열번호 14)에서 "*"로 나타낸 하나 이상의 잔기(예를 들어, 2개, 3개, 5개, 10개, 15개, 20개, 30개, 50개, 70개, 80개, 90개, 100개 또는 200개의 아미노산 잔기)에서 스트렙토코커스 써모필러스의 서열과 상이한 하나 이상의 아미노산을 갖는(예를 들어, 치환) 도 2a 내지 도 2g에 개시된 스트렙토코커스 써모필러스 Cas9의 아미노산 서열(서열번호 4)을 포함하는 eaCas9 분자 또는 eaCas9 폴리펩타이드이다.

일 구현예에서, 변경된 Cas9 분자 또는 Cas9 폴리펩타이드는 도 2a 내지 도 2g에 개시된 공통 서열(서열번호 14)에서 "*"로 나타낸 하나 이상의 잔기(예를 들어, 2개, 3개, 5개, 10개, 15개, 20개, 30개, 50개, 70개, 80개, 90개, 100개 또는 200개의 아미노산 잔기)에서 스트렙토코커스 뮤탄스의 서열과 상이한 하나 이상의 아미노산을 갖는(예를 들어, 치환) 도 2a 내지 도 2g에 개시된 스트렙토코커스 뮤탄스 Cas9의 아미노산 서열(서열번호 1)을 포함하는 eaCas9 분자 또는 eaCas9 폴리펩타이드이다.

일 구현예에서, 변경된 Cas9 분자 또는 Cas9 폴리펩타이드는 도 2a 내지 도 2g에 개시된 공통 서열(서열번호 14)에서 "*"로 나타낸 하나 이상의 잔기(예를 들어, 2개, 3개, 5개, 10개, 15개, 20개, 30개, 50개, 70개, 80개, 90개, 100개 또는 200개의 아미노산 잔기)에서 스트렙토코커스 피오게네스의 서열과 상이한 하나 이상의 아미노산을 갖는(예를 들어, 치환) 도 2a 내지 도 2g에 개시된 스트렙토코커스 피오게네스 Cas9의 아미노산 서열(서열번호 2)을 포함하는 eaCas9 분자 또는 eaCas9 폴리펩타이드이다.

일 구현예에서, 변경된 Cas9 분자 또는 Cas9 폴리펩타이드는 도 2a 내지 도 2g에 개시된 공통 서열(서열번호 14)에서 "*"로 나타낸 하나 이상의 잔기(예를 들어, 2개, 3개, 5개, 10개, 15개, 20개, 30개, 50개, 70개, 80개, 90개, 100개 또는 200개의 아미노산 잔기)에서 리스테리아 이노쿠아의 서열과 상이한 하나 이상의 아미노산을 갖는(예를 들어, 치환) 도 2a 내지 도 2g에 개시된 리스테리아 이노쿠아 Cas9의 아미노산 서열(서열번호 5)을 포함하는 eaCas9 분자 또는 eaCas9 폴리펩타이드이다.

특정 구현예에서, 변경된 Cas9 분자 또는 Cas9 폴리펩타이드, 예를 들어, eaCas9 분자 또는 eaCas9 폴리펩타이드는 예를 들어, 둘 이상의 상이한 Cas9 분자의, 예를 들어, 상이한 종의 둘 이상의 자연 발생 Cas9 분자의 융합체일 수 있다. 예를 들어, 하나의 종의 자연 발생 Cas9 분자의 단편은 제2 종의 Cas9 분자의 단편에 융합될 수 있다. 일 예로서, N-말단 RuvC-유사 도메인을 포함하는 스트렙토코커스 피오게네스의 Cas9 분자의 단편은 HNH-유사 도메인을 포함하는 스트렙토코커스 피오게네스(예를 들어, 스트렙토코커스 써모필러스) 이외의 종의 Cas9 분자의 단편에 융합될 수 있다.

변경된 PAM 인식을 갖거나 PAM 인식을 갖지 않는 Cas9

자연 발생 Cas9 분자는 특이적 PAM 서열, 예를 들어, 스트렙토코커스 피오게네스, 스트렙토코커스 써모필러스, 스트렙토코커스 뮤탄스 및 스타필로코커스 아우레우스에 대하여 상기 기재된 PAM 인식 서열을 인식할 수 있다.

특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 자연 발생 Cas9 분자와 동일한 PAM 특이성을 갖는다. 다른 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 자연 발생 Cas9 분자와 관련되지 않은 PAM 특이성, 또는 그것이 가장 가까운 서열 상동성을 갖는 자연 발생 Cas9 분자와 관련되지 않은 PAM 특이성을 갖는다. 예를 들어, 자연 발생 Cas9 분자는 예를 들어, PAM 인식을 변경하도록, 예를 들어, 표적-외 부위를 감소시키고/거나 특이성을 개선하거나; PAM 인식 요건을 제거하기 위하여 Cas9 분자 또는 Cas9 폴리펩타이드가 인식하는 PAM 서열을 변경하도록 변경될 수 있다. 특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 예를 들어, PAM 인식 서열의 길이를 증가시키고/거나 높은 수준의 동일성(예를 들어, gRNA와 PAM 서열 간의 98%, 99% 또는 100% 일치)까지 Cas9 특이성을 개선시키기 위해, 예를 들어, 표적-외 부위를 감소시키고/거나 특이성을 증가시키기 위해 변경될 수 있다. 특정 구현예에서, PAM 인식 서열의 길이는 적어도 4개, 5개, 6개, 7개, 8개, 9개, 10개 또는 15개의 아미노산 길이이다. 일 구현예에서, Cas9 특이성은 gRNA와 PAM 서열 간의 적어도 90%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 상동성을 필요로 한다. 상이한 PAM 서열을 인식하고/거나 감소된 표적-외 활성을 갖는 Cas9 분자 또는 Cas9 폴리펩타이드를 유도 진화를 사용하여 생성할 수 있다. Cas9 분자의 유도 진화를 위해 사용될 수 있는 예시적인 방법 및 시스템이 기재되어 있다(예를 들어, 문헌[Esvelt 2011] 참조). 후보 Cas9 분자를 예를 들어, 본 명세서에 기재된 방법에 의해 평가할 수 있다.

크기-최적화 Cas9

본 명세서에 기재된 조작된 Cas9 분자 및 조작된 Cas9 폴리펩타이드는 원하는 Cas9 특성, 예를 들어, 본질적으로 고유의 입체구조, Cas9 뉴클레아제 활성 및/또는 표적 핵산 분자 인식을 계속 유지하면서 분자의 크기를 감소시키는 결실을 포함하는 Cas9 분자 또는 Cas9 폴리펩타이드를 포함한다. 하나 이상의 결실 및 선택적으로 하나 이상의 링커를 포함하는 Cas9 분자 또는 Cas9 폴리펩타이드가 본 명세서에 제공되며, 링커는 결실부의 측부 배치된 아미노산 잔기 사이에 배치된다. 기준 Cas9 분자에서의 적합한 결실의 동정 방법, 결실 및 링커를 사용한 Cas9 분자의 생성 방법 및 이러한 Cas9 분자의 이용 방법은 본 명세서의 검토시 해당 분야의 숙련자에게 명백해질 것이다.

Cas9 분자, 예를 들어, 결실을 갖는 스트렙토코커스 아우레우스, 스트렙토코커스 피오게네스 또는 캄필로박터 제주니, Cas9 분자는 상응하는 자연-발생 Cas9 분자보다 더 작으며, 예를 들어, 감소된 수의 아미노산을 갖는다. 더 작은 크기의 Cas9 분자는 전달 방법에 대한 유연성의 증가를 가능하게 하며, 이에 의해, 게놈-교정을 위한 유용성을 증가시킨다. Cas9 분자는 본 명세서에 기재된 초래되는 Cas9 분자의 활성에 실질적으로 영향을 미치거나 이를 감소시키지 않는 하나 이상의 결실을 포함할 수 있다. 본 명세서에 기재된 바와 같은 결실을 포함하는 Cas9 분자에서 보유되는 활성은 다음 중 하나 이상을 포함한다:

틈내기효소 활성, 즉, 핵산 분자의 단일 가닥, 예를 들어, 비상보성 가닥 또는 상보성 가닥을 절단하는 능력; 이중 가닥 뉴클레아제 활성, 즉, 이중 가닥 핵산의 둘 모두의 가닥을 절단하고 이중 가닥 파단부를 생성하는 능력, 일 구현예에서, 2개의 틈내기효소 활성의 존재임;

엔도뉴클레아제 활성;

엑소뉴클레아제 활성;

헬리카제 활성, 즉, 이중 가닥 핵산의 나선 구조를 푸는 능력; 및

핵산 분자, 예를 들어, 표적 핵산 또는 gRNA의 인식 활성.

본 명세서에 기재된 Cas9 분자의 활성을 본 명세서에 또는 해당 분야에 기재된 활성 분석을 사용하여 평가할 수 있다.

결실에 적합한 영역의 동정

결실에 적합한 Cas9 분자의 영역을 다양한 방법에 의해 동정할 수 있다. 다양한 박테리아 종으로부터의 자연-발생 이종상동성 Cas9 분자, 예를 들어, 표 1에 열거된 것들 중 임의의 것을 스트렙토코커스 피오게네스 Cas9의 결정 구조(문헌[Nishimasu 2014]) 상으로 모델링하여, 단백질의 3차원 입체구조에 관하여 선택된 Cas9 오솔로그에 걸친 보존 수준을 시험할 수 있다. Cas9 활성에 연루되는 영역으로부터 공간적으로 원위에 위치한, 예를 들어, 표적 핵산 분자 및/또는 gRNA를 간섭하는 더 낮게 보존되거나, 보존되지 않는 영역은 상기 영역 또는 도메인이 Cas9 활성에 실질적으로 영향을 미치거나 이를 감소시키지 않는, 결실을 위한 후보임을 나타낸다.

Cas9 분자를 인코딩하는 핵산

Cas9 분자 또는 Cas9 폴리펩타이드, 예를 들어, eaCas9 분자 또는 eaCas9 폴리펩타이드를 인코딩하는 핵산이 본 명세서에 제공된다. Cas9 분자 또는 Cas9 폴리펩타이드를 인코딩하는 예시적인 핵산이 이전에 기재되어 있다(예를 들어, 문헌[Cong 2013]; 문헌[Wang 2013]; 문헌[Mali 2013]; 문헌[Jinek 2012] 참조).

일 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드를 인코딩하는 핵산은 합성 핵산 서열일 수 있다. 예를 들어, 합성 핵산 분자는 예를 들어, 본 명세서에 기재된 바와 같이 화학적으로 변형될 수 있다. 일 구현예에서, Cas9 mRNA는 하기의 특성 중 하나 이상, 예를 들어, 전부를 갖는다: 그것이 캡핑되는 특성, 폴리아데닐화되는 특성, 5-메틸시티딘 및/또는 슈도우리딘으로 치환되는 특성.

또한, 또는 대안적으로, 합성 핵산 서열은 코돈 최적화될 수 있으며, 예를 들어, 적어도 하나의 비-통상적인 코돈 또는 덜-통상적인 코돈은 통상적인 코돈에 의해 대체된다. 예를 들어, 합성 핵산은 최적화된 메신저 mRNA의 합성을 지시할 수 있으며, 예를 들어, 본 명세서에 기재된 포유동물 발현 시스템에서의 발현을 위해 예를 들어, 최적화된다.

또한, 또는 대안적으로, Cas9 분자 또는 Cas9 폴리펩타이드를 인코딩하는 핵산은 핵 국소화 서열(NLS)을 포함할 수 있다. 핵 국소화 서열은 해당 분야에 알려져 있다.

스트렙토코커스 피오게네스의 Cas9 분자를 인코딩하는 예시적인 코돈 최적화된 핵산 서열은 서열번호 3에 기재되어 있다. 스트렙토코커스 피오게네스 Cas9 분자의 상응하는 아미노산 서열은 서열번호 2에 기재되어 있다.

스타필로코커스 아우레우스의 Cas9 분자를 인코딩하는 예시적인 코돈 최적화된 핵산 서열은 서열번호 7에 기재되어 있다. 스타필로코커스 아우레우스 Cas9 분자의 아미노산 서열은 서열번호 6에 기재되어 있다.

스타필로코커스 아우레우스 Cas9의 Cas9 분자를 인코딩하는 예시적인 코돈 최적화된 핵산 서열이 하기에 제공된다.

상기 Cas9 서열 중 임의의 것이 C-말단에서 펩타이드 또는 폴리펩타이드와 융합된다면, 중단 코돈이 제거될 것이 이해된다.

기타 Cas 분자 및 Cas 폴리펩타이드

다양한 유형의 Cas 분자 또는 Cas 폴리펩타이드가 본 명세서에 개시된 본 발명을 실시하는데 사용될 수 있다. 일부 구현예에서, II형 Cas 시스템의 Cas 분자가 사용된다. 다른 구현예에서, 다른 Cas 시스템의 Cas 분자가 사용된다. 예를 들어, I형 또는 III형 Cas 분자가 사용될 수 있다. 예시적인 Cas 분자(및 Cas 시스템)는 이전에 기재되어 있다(예를 들어, 문헌[Haft 2005] 및 문헌[Makarova 2011] 참조). 예시적인 Cas 분자(및 Cas 시스템)는 또한 표 2에 나타나 있다.

후보 분자의 기능적 분석

후보 Cas9 분자, 후보 gRNA 분자 및 후보 Cas9 분자/gRNA 분자 복합체를 해당 분야에 알려져 있는 기법에 의해 또는 본 명세서에 기재된 바와 같이 평가할 수 있다. 본 명세서에 기재된 각각의 기법을 단독으로 또는 하나 이상의 기법과 함께 사용하여 후보 분자를 평가할 수 있다. 본 명세서에 개시된 기법을 제한 없이, Cas9 분자/gRNA 분자 복합체의 안정성의 결정 방법, 안정한 Cas9 분자/gRNA 분자 복합체를 촉진시키는 조건의 결정 방법, 안정한 Cas9 분자/gRNA 분자 복합체에 대한 스크리닝 방법, 최적의 gRNA를 동정하여, 안정한 Cas9 분자/gRNA 분자 복합체를 형성하는 방법, 대상체로의 투여를 위한 Cas9 분자/gRNA 분자 복합체에 대한 스크리닝 방법, 및 대상체로의 투여를 위한 Cas9 분자/gRNA 분자 복합체의 선택 방법을 포함하는 다양한 방법을 위해 사용할 수 있다.

Cas9/gRNA 복합체의 열안정성의 측정 기법

Cas9-gRNA 리보핵단백질(RNP) 복합체의 열안정성을 시차 주사 형광측정계(DSF) 및 기타 기법에 의해 검출할 수 있다. 단백질의 열안정성은 유리한 조건, 예를 들어, 결합 RNA 분자, 예를 들어, gRNA의 부가 하에 증가할 수 있다. 따라서, Cas9/gRNA 복합체의 열안정성에 관한 정보는 복합체가 안정한지 여부의 결정에 유용하다.

시차 주사 형광측정계(DSF)

DSF는 단백질의 열안정성을 측정하기 위해 사용될 수 있는 기법이다. 분석은 다수의 방식으로 적용될 수 있다. 예시적인 프로토콜은 RNP 형성을 위해 원하는 용액 조건을 결정하기 위한 프로토콜(분석 1, 하기 참조), gRNA:Cas9 단백질의 원하는 화학량론적 비를 시험하기 위한 프로토콜(분석 2, 하기 참조), Cas9 분자, 예를 들어, 야생형 또는 돌연변이 Cas9 분자에 효율적인 gRNA 분자를 스크리닝하기 위한 프로토콜(분석 3, 하기 참조) 및 표적 DNA의 존재하의 RNP 형성을 시험하기 위한 프로토콜(분석 4)을 포함하나 이에 한정되지 않는다.

분석 1

RNP 복합체를 형성하기 위해 요망되는 용액을 결정하기 위하여, Cas9의 2 μM 용액을 10x SYPRO 오렌지®(라이프 테크놀로지즈(Life Technologies) 카탈로그 번호 S-6650)를 사용하여 수 중에 제조하고, 384 웰 플레이트 내로 분배한다. 그 다음, 다양한 pH 및 염이 있는 용액에 희석된 등몰량의 gRNA를 첨가한다. 실온에서 10분 간의 인큐베이션 및 임의의 거품을 제거하기 위한 2000 rpm에서의 원심분리 후에, 바이오-래드(Bio-Rad) CFX 매니저(Manager) 소프트웨어와 함께 바이오-래드 CFX384™ 리얼-타임 시스템 C1000 터치(Touch)™ 써멀 사이클러(Thermal Cycler)를 사용하여, 10초마다 1℃의 온도 증가와 함께 20℃로부터 90℃까지의 기울기를 전개시킨다.

분석 2

제2 분석은 다양한 농도의 gRNA 분자를 상기 분석 1로부터의 완충제에서 2 μM의 Cas9와 혼합하고, 384 웰 플레이트에서 실온에서 10분 동안 인큐베이션시키는 것을 포함한다. 10x SYPRO 오렌지®(라이프 테크놀로지즈 카탈로그 번호 S-6650)가 있는 동일한 부피의 최적의 완충제를 첨가하고, 플레이트를 마이크로실(Microseal)® B 접착제(MSB-1001)로 밀봉한다. 임의의 거품을 제거하기 위한 2000 rpm에서의 원심분리 후에, 바이오-래드 CFX 매니저 소프트웨어와 함께 바이오-래드 CFX384™ 리얼-타임 시스템 C1000 터치™ 써멀 사이클러를 사용하여 10초마다 1℃의 온도 증가와 함께 20℃로부터 90℃까지의 기울기를 전개시킨다.

분석 3

제3 분석에서, 관심 Cas9 분자(예를 들어, Cas9 단백질, 예를 들어, Cas9 변이체 단백질)를 정제한다. 변이체 gRNA 분자의 라이브러리를 합성하고, 20 μM의 농도로 재현탁화시킨다. Cas9 분자를 5x SYPRO 오렌지®(라이프 테크놀로지즈 카탈로그 번호 S-6650)의 존재하에 미리 결정된 완충제에 각각 1 μM의 최종 농도로 gRNA 분자와 인큐베이션시킨다. 실온에서의 10분 동안의 인큐베이션 및 임의의 거품을 제거하기 위한 2000 rpm에서의 2분 동안의 원심분리 후에, 바이오-래드 CFX 매니저 소프트웨어와 함께 바이오-래드 CFX384™ 리얼-타임 시스템 C1000 터치™ 써멀 사이클러를 사용하여 10초마다 1℃의 온도 증가와 함께 20℃로부터 90℃까지의 기울기를 전개시킨다.

분석 4

제4 분석에서, 하기의 시료를 사용하여 DSF 실험을 수행한다: Cas9 단백질 단독, gRNA와 함께 Cas9 단백질, gRNA 및 표적 DNA와 함께 Cas9 단백질, 및 표적 DNA와 함께 Cas9 단백질. 구성성분의 혼합 순서는 다음과 같다: 반응 용액, Cas9 단백질, gRNA, DNA 및 SYPRO 오렌지. 반응 용액은 MgCl₂의 부재 또는 존재 하에 10 mM HEPES pH 7.5, 100 mM NaCl을 함유한다. 임의의 거품을 제거하기 위한 2000 rpm에서의 2분 동안의 원심분리 후에, 바이오-래드 CFX 매니저 소프트웨어와 함께 바이오-래드 CFX384™ 리얼-타임 시스템 C1000 터치™ 써멀 사이클러를 사용하여 10초마다 1℃의 온도 증가와 함께 20℃로부터 90℃까지의 기울기를 전개시킨다.

본 명세서에 기재된 바와 같은 실시예 1 및 2에는 Cas9 분자 및 Cas9/gRNA 복합체의 안정성을 평가하고 결정하기 위해 DSF를 사용한 예시적인 결과가 개시되어 있다. 본 명세서에 나타낸 바와 같이, gRNA 분자의 부재하의 Cas9 분자의 T_m 값에 비하여 더 높은 Cas9/gRNA 복합체의 T_m 값은 Cas9와 gRNA 간의 더욱 단단한 복합체를 나타낸다. 따라서, Cas9 분자 및 Cas9/gRNA 복합체의 T_m에 관한 정보는 Cas9/gRNA 복합체가 안정한지 여부를 결정하는데 유용하다.

DSF에 더하여, Cas9 분자/gRNA 분자 복합체 또는 그의 제제에서 Cas9 분자의 안정성을 결정하기 위해 사용될 수 있는 해당 분야에 알려져 있는 수많은 추가의 기법이 존재한다. 이들은 시차 주사 열량계(DSC) 및 등열 적정 열량계(ITC)를 포함하나 이들에 한정되지 않는 열안정성을 측정하는 DSF에 대한 대안적인 방법을 포함한다.

DSC

DSC는 상이한 완충제 및 아포(apo) 대 복합체 중에서 물질의 열안정성을 측정하는데 매우 정밀한 기법이다. DSC의 이점은 그것이 또한 시료 간의 전이의 엔탈피의 차이를 제공할 수 있다는 점이다. 그러나, DSC는 수행하는데 DSF보다 더 많은 양의 물질을 필요로 한다(50배 초과). DSC는 한번에 단일의 시료만을 수행할 수 있기 때문에, 처리효율이 더 낮다.

ITC

ITC는 2개의 분자의 열안정성 및 상호작용의 운동 속도 둘 모두를 측정할 수 있다. 다른 기법에 비한 ITC의 이점은 그것이 더욱 정밀한 측정 및 운동 정보를 제공한다는 점이다. 그러나, 그것은 더 낮은 처리효율 및 더 많은 양의 물질을 필요로 한다.

본 명세서에 개시된 열안정성 기법을 사용하여, 분자(예를 들어, Cas9 분자)의 열안정성을 측정할 수 있으며, 이는 유리한 조건, 예를 들어, 결합 RNA 분자의 부가 하에서 증가할 수 있다. 또한, 분자의 열안정성은 유리한 조건, 예를 들어, 구성성분의 존재 하에서 증가할 수 있다. 특정 구현예에서, 구성성분은 첨가제, 소분자, 안정화 시약, 완충제, pH, 염 농도, 글리세롤 농도 또는 다른 완충제 구성성분을 포함할 수 있다.

특정 구현예에서, 분자(예를 들어, Cas9/gRNA 복합체)의 열안정성 값이 기준 분자의 열안정성 값 또는 열안정성 기준 값보다 더 크면, 분자를 선택하거나, 안정한 것으로 결정할 수 있다. 특정 구현예에서, 측정 중인 열안정성 값은 분자의 변성 온도 값이다. 예를 들어, 특정 구현예에서, 분자(예를 들어, Cas9/gRNA 복합체)의 변성 온도 값이 기준 분자의 변성 온도 값 또는 변성 온도 기준 값보다 더 크면, 분자를 선택하거나, 안정한 것으로 결정할 수 있다. 특정 구현예에서, 측정 중인 열안정성 값은 분자의 T_m 값이다. 예를 들어, 특정 구현예에서, 분자(예를 들어, Cas9/gRNA 복합체)의 T_m 값이 기준 분자의 T_m 값 또는 T_m 기준 값보다 더 크면, 분자를 선택하거나, 안정한 것으로 결정할 수 있다. 특정 구현예에서, 기준 분자는 gRNA 분자의 부재 하의 Cas9 분자일 수 있다.

특정 구현예에서, 분자의 T_m 값이 기준 분자의 T_m 값 또는 T_m 기준 값보다 적어도 1℃, 적어도 2℃, 적어도 3℃, 적어도 4℃, 적어도 5℃, 적어도 6℃, 적어도 7℃, 적어도 8℃, 적어도 9℃, 적어도 10℃, 적어도 11℃, 적어도 12℃, 적어도 13℃, 적어도 14℃, 적어도 15℃, 적어도 16℃, 적어도 17℃, 적어도 18℃, 적어도 19℃, 적어도 20℃, 적어도 21℃, 적어도 22℃, 적어도 23℃, 적어도 24℃, 적어도 25℃, 적어도 26℃, 적어도 27℃, 적어도 28℃, 적어도 29℃, 적어도 30℃, 적어도 31℃, 적어도 32℃, 적어도 33℃, 적어도 34℃, 적어도 35℃, 적어도 36℃, 적어도 37℃, 적어도 38℃, 적어도 39℃, 적어도 40℃, 적어도 41℃, 적어도 42℃, 적어도 43℃, 적어도 44℃, 적어도 45℃, 적어도 46℃, 적어도 47℃, 적어도 48℃, 적어도 49℃ 또는 적어도 50℃ 더 크면, 평가 중인 분자를 선택하거나, 안정한 것으로 결정할 수 있다. 예를 들어, 분자의 T_m 값이 기준 분자 또는 T_m 기준 값보다 적어도 8℃ 더 크면, 평가 중인 분자를 선택하거나, 안정한 것으로 결정할 수 있다.

특정 구현예에서, 분자의 T_m 값이 기준 분자의 T_m 값 또는 T_m 기준 값보다 약 1℃, 약 2℃, 약 3℃, 약 4℃, 약 5℃, 약 6℃, 약 7℃, 약 8℃, 약 9℃, 약 10℃, 약 11℃, 약 12℃, 약 13℃, 약 14℃, 약 15℃, 약 16℃, 약 17℃, 약 18℃, 약 19℃, 약 20℃, 약 21℃, 약 22℃, 약 23℃, 약 24℃, 약 25℃, 약 26℃, 약 27℃, 약 28℃, 약 29℃, 약 30℃, 약 31℃, 약 32℃, 약 33℃, 약 34℃, 약 35℃, 약 36℃, 약 37℃, 약 38℃, 약 39℃, 약 40℃, 약 41℃, 약 42℃, 약 43℃, 약 44℃, 약 45℃, 약 46℃, 약 47℃, 약 48℃, 약 49℃ 또는 약 50℃ 더 크면, 평가 중인 분자를 선택하거나, 안정한 것으로 결정할 수 있다. 예를 들어, 분자의 T_m 값이 기준 분자 또는 T_m 기준 값보다 약 8℃ 더 크면, 평가 중인 분자를 선택하거나, 안정한 것으로 결정할 수 있다.

특정 구현예에서, 분자의 T_m 값이 기준 분자의 T_m 값 또는 T_m 기준 값보다 약 약 1℃ 내지 약 5℃, 약 6℃ 내지 약 10℃, 약 11℃ 내지 약 15℃, 약 16℃ 내지 약 20℃, 약 21℃ 내지 약 25℃, 약 26℃ 내지 약 30℃, 약 31℃ 내지 약 35℃, 약 36℃ 내지 약 40℃, 약 41℃ 내지 약 45℃, 약 46℃ 내지 약 50℃ 더 크면, 평가 중인 분자를 선택하거나, 안정한 것으로 결정할 수 있다. 예를 들어, 분자의 T_m 값이 기준 분자 또는 T_m 기준 값보다 약 6℃ 내지 약 10℃ 더 크면, 평가 중인 분자를 선택하거나, 안정한 것으로 결정할 수 있다. 특정 구현예에서, 분자의 T_m 값이 기준 분자 또는 T_m 기준 값보다 약 8℃ 내지 약 9℃ 더 크면, 평가 중인 분자를 선택하거나, 안정한 것으로 결정할 수 있다.

본 명세서에 제공되는 특정 구현예에서, 본 명세서의 방법은 Cas9 분자/gRNA 분자 복합체의 T_m 값을 검출하는 단계, Cas9 분자/gRNA 분자 복합체의 T_m 값과 기준 분자의 T_m 값 또는 T_m 기준 값 사이의 델타 값을 결정하는 단계, 및 델타 값이 적어도 8℃이며, Cas9 분자/gRNA 분자 복합체의 T_m 값이 기준 분자의 T_m 값 또는 T_m 기준 값보다 더 크면, Cas9 분자/gRNA 분자 복합체가 안정한 것을 결정하는 단계를 포함할 수 있다. 특정 구현예에서, 기준 분자는 gRNA 분자 부재의 Cas9 분자일 수 있다.

특정 구현예에서, 평가 중인 분자의 T_m 값과 기준 분자의 T_m 값 또는 T_m 기준 값 사이의 델타 값이 적어도 1℃, 적어도 2℃, 적어도 3℃, 적어도 4℃, 적어도 5℃, 적어도 6℃, 적어도 7℃, 적어도 8℃, 적어도 9℃, 적어도 10℃, 적어도 11℃, 적어도 12℃, 적어도 13℃, 적어도 14℃, 적어도 15℃, 적어도 16℃, 적어도 17℃, 적어도 18℃, 적어도 19℃, 적어도 20℃, 적어도 21℃, 적어도 22℃, 적어도 23℃, 적어도 24℃, 적어도 25℃, 적어도 26℃, 적어도 27℃, 적어도 28℃, 적어도 29℃, 적어도 30℃, 적어도 31℃, 적어도 32℃, 적어도 33℃, 적어도 34℃, 적어도 35℃, 적어도 36℃, 적어도 37℃, 적어도 38℃, 적어도 39℃, 적어도 40℃, 적어도 41℃, 적어도 42℃, 적어도 43℃, 적어도 44℃, 적어도 45℃, 적어도 46℃, 적어도 47℃, 적어도 48℃, 적어도 49℃ 또는 적어도 50℃이고, 평가 중인 분자의 T_m 값이 기준 분자의 T_m 값 또는 T_m 기준 값보다 더 크면, 평가 중인 분자를 선택하거나, 안정한 것으로 결정할 수 있다. 특정 구현예에서, 평가 중인 분자는 CA9 분자/gRNA 분자 복합체일 수 있으며, 기준 분자는 gRNA 분자 부재의 Cas9 분자일 수 있다.

특정 구현예에서, 평가 중인 분자의 T_m 값과 기준 분자의 T_m 값 또는 T_m 기준 값 사이의 델타 값이 약 1℃, 약 2℃, 약 3℃, 약 4℃, 약 5℃, 약 6℃, 약 7℃, 약 8℃, 약 9℃, 약 10℃, 약 11℃, 약 12℃, 약 13℃, 약 14℃, 약 15℃, 약 16℃, 약 17℃, 약 18℃, 약 19℃, 약 20℃, 약 21℃, 약 22℃, 약 23℃, 약 24℃, 약 25℃, 약 26℃, 약 27℃, 약 28℃, 약 29℃, 약 30℃, 약 31℃, 약 32℃, 약 33℃, 약 34℃, 약 35℃, 약 36℃, 약 37℃, 약 38℃, 약 39℃, 약 40℃, 약 41℃, 약 42℃, 약 43℃, 약 44℃, 약 45℃, 약 46℃, 약 47℃, 약 48℃, 약 49℃ 또는 약 50℃이고, 평가 중인 분자의 T_m 값이 기준 분자의 T_m 값 또는 T_m 기준 값보다 더 크면, 평가 중인 분자를 선택하거나, 안정한 것으로 결정할 수 있다. 예를 들어, 델타 값이 약 8℃이고, Cas9 분자/gRNA 분자 복합체의 T_m 값이 기준 분자의 T_m 값 또는 T_m기준 값보다 더 크면, Cas9 분자/gRNA 분자 복합체를 선택하거나, 안정한 것으로 결정할 수 있다. 특정 구현예에서, 기준 분자는 gRNA 분자 부재의 Cas9 분자일 수 있다.

특정 구현예에서, 평가 중인 분자의 T_m 값과 기준 분자의 T_m 값 또는 T_m 기준 값 사이의 델타 값이 약 1℃ 내지 약 5℃, 약 6℃ 내지 약 10℃, 약 11℃ 내지 약 15℃, 약 16℃ 내지 약 20℃, 약 21℃ 내지 약 25℃, 약 26℃ 내지 약 30℃, 약 31℃ 내지 약 35℃, 약 36℃ 내지 약 40℃, 약 41℃ 내지 약 45℃, 약 46℃ 내지 약 50℃이고, 평가 중인 분자의 T_m 값이 기준 분자의 T_m 값 또는 T_m기준 값보다 더 크면, 평가 중인 분자를 선택하거나, 안정한 것으로 결정할 수 있다. 예를 들어, 델타 값이 약 6℃ 내지 약 10℃이고, Cas9 분자/gRNA 분자 복합체의 T_m 값이 기준 분자의 T_m 값 또는 T_m 기준 값보다 더 크면, Cas9 분자/gRNA 분자 복합체를 선택하거나, 안정한 것으로 결정할 수 있다. 특정 구현예에서, 기준 분자는 gRNA 분자 부재의 Cas9 분자일 수 있다.

특정 구현예에서, 본 명세서에 사용되는 방법을 사용하여, Cas9 분자와 복합체화된 상이한 길이를 갖는 복수의 gRNA를 평가하여, 어떤 Cas9/gRNA 복합체가 안정한 Cas9/gRNA 복합체를 형성하는지를 결정할 수 있다. 또한, 이들 방법을 사용하여, Cas9 분자 및 gRNA 분자의 상이한 화학량론을 평가하여, 어떤 Cas9/gRNA 복합체가 안정한 Cas9/gRNA 복합체를 형성하는지를 결정할 수 있다.

특정 구현예에서, Cas9 분자와, 복수의 gRNA 분자 중 하나를 조합함으로써 복수의 시료를 생성할 수 있으며, 각각의 시료는 Cas9/gRNA 복합체를 포함한다. 특정 구현예에서, Cas9/gRNA 복합체의 T_m 값을 복수의 시료의 각각에서 검출할 수 있다. 특정 구현예에서, (i) 기준 Cas9/gRNA 복합체의 T_m 값 또는 미리 결정된 역치 T_m 값과 복수의 시료에서의 T_m 값의 비교, 또는 (ii) 복수의 시료의 T_m 값의 상대적 순서화 중 하나 이상에 기반하여, 복수의 시료로부터 적어도 하나의 시료를 선택할 수 있다. 특정 구현예에서, T_m 값은 DSF에 의해 검출될 수 있다. 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 T_m 값이 gRNA 분자 부재의 Cas9 분자의 T_m 값보다 적어도 8℃ 더 크면, 적어도 하나의 시료를 선택할 수 있다.

Cas9 및 Cas9/gRNA 복합체의 활성을 측정하기 위한 기법

열안정성 기법에 더하여, 본 명세서의 방법과 함께 사용될 수 있는 해당 분야에 알려져 있는 다양한 다른 기법이 존재한다. 예를 들어, Cas9 분자/gRNA 분자 복합체 또는 그의 분자의 특정 활성을 측정하여, Cas9 분자/gRNA 분자 복합체 또는 그의 분자가 안정한지 여부를 결정하거나 선택할 수 있다. 이들 기법을 단독으로 또는 본 명세서에 기재된 열안정성 기법과 함께 사용하여, Cas9 분자/gRNA 분자 복합체 또는 그의 분자가 안정한지 여부를 결정할 수 있다. 본 명세서에 개시된 기법을 사용하여 평가 중인 분자의 활성을 검출할 수 있다(예를 들어, Cas9 분자/gRNA 분자 복합체 내의 Cas9 분자, Cas9 분자/gRNA 분자 복합체 내의 gRNA 분자, 또는 Cas9 분자/gRNA 분자 복합체 또는 그의 제제). 특정 구현예에서, 평가 중인 분자의 활성 값을 측정할 수 있다. 특정 구현예에서, 평가 중인 분자의 활성 값이 기준 분자의 활성 값 또는 활성 기준 값보다 더 크면, 평가 중인 분자를 선택하거나, 안정한 것으로 결정할 수 있다.

검출될 수 있는 평가될 분자의 다양한 활성은 분자의 결합 활성 및 절단 활성을 포함한다. 평가될 분자의 결합 활성 및 절단 활성을 본 명세서에 기재된 기법을 사용하여 검출할 수 있다.

분자의 결합 활성의 일부 예는 제한 없이, DNA 표적에 계속 혼성화되는 gRNA 분자의 능력, Cas9 분자/gRNA 분자 복합체의 Cas9 분자에 결합하는 gRNA 분자의 능력 또는 Cas9 분자/gRNA 분자 복합체의 Cas9 분자에 결합하는 gRNA 분자의 능력을 포함한다. 특정 구현예에서, 분자의 결합 활성이 검출 중인 경우, 결합 값을 측정할 수 있다. 특정 구현예에서, 평가 중인 분자의 결합 값이 기준 분자의 결합 값 또는 결합 기준 값보다 더 크면, 평가 중인 분자를 선택하거나 안정한 것으로 결정할 수 있다.

절단 활성의 일부 예는 제한 없이, 삽입결실을 유도하는 능력, 표적 DNA를 변형시키는 능력 및 미리 선택된 수선 방법의 경향을 포함한다. 특정 구현예에서, 절단 활성이 검출 중인 경우, 절단 값을 측정할 수 있다. 특정 구현예에서, 평가 중인 분자의 절단 값이 기준 분자의 절단 값 또는 절단 기준 값보다 더 크면, 평가 중인 분자를 선택하거나 안정한 것으로 결정할 수 있다.

Cas9 및 Cas9/gRNA 복합체의 결합 활성(반응속도론)을 측정하기 위한 기법

평가 중인 분자(예를 들어, Cas9 분자/gRNA 분자 복합체 내의 Cas9 분자, Cas9 분자/gRNA 분자 복합체 내의 gRNA 분자, 또는 Cas9 분자/gRNA 분자 복합체 또는 그의 제제)의 결합 활성을 다양한 기법을 사용하여 검출할 수 있다. 2개의 분자 간의 결합 반응속도론은 특정 조건, 예를 들어, 구성성분의 존재하에서 더욱 유리할 수 있다. 특정 구현예에서, 구성성분은 첨가제, 소분자, 안정화 시약, 완충제, pH, 염 농도, 글리세롤 농도 또는 다른 완충제 구성성분 또는 특성 구성성분의 첨가를 포함할 수 있다.

Cas9/gRNA 복합체의 결합 활성을 검출하는 것을 포함하는 방법은 제한 없이, Cas9 분자/gRNA 분자 복합체의 Cas9 분자에 결합하는 gRNA 분자의 능력을 검출하는 것 및 표적 DNA에 결합하는 Cas9 분자 및 Cas9/gRNA 복합체의 능력을 검출하는 것을 포함한다. 이들 방법은 기법, 예를 들어, 평가 중인 분자의 결합에 대한 생물물리학적 정보를 제공하는 반응속도론 분석을 사용하여, 수행될 수 있다. 사용될 수 있는 반응속도론 분석의 일부 예에는 제한 없이, 하기에 기재된 바와 같은 표면 플라스몬 공명(SPR), 바이오층 간섭법(BLI) 및 겔 밴드 변화 분석이 있다.

SPR

SPR은 비아코어(BiaCore) 또는 프로테온(ProteOn) XPR 시스템 중 어느 하나의 이용을 필요로 한다. 이러한 기법에서, 하나의 분자는 공유적으로 또는 친화성 방법을 통하여 칩의 표면에 부착된다. 제2 분자를 유세포 내로 주입하고, 완충제를 통과하도록 추진한다. 반사광의 각의 변화는 플라스몬 공명의 양의 변화를 야기한다. 이로부터, 운동 회합 및 해리를 측정할 수 있다.

BLI

BLI는 포르테바이오(forteBio)에 의해 옥테트(Octet)로 지칭되는 기기를 필요로 한다. SPR과 유사하게, BLI는 2개의 분자 사이의 상호작용의 운동 속도를 결정할 수 있다.

겔 밴드 변화 분석

겔 밴드 변화 분석(예를 들어, 전기영동 이동성 변화 분석)은 2개의 상호작용 분자의 K_D를 결정하기 위한 또 다른 방법이다. 이러한 결정은 다른 이용가능한 기법보다 더욱 조잡하지만 상대적으로 저렴한 시약으로 수행될 수 있다는 이점을 갖는다.

결합 분석: 표적 DNA로의 Cas9 분자 및 Cas9/gRNA 복합체의 결합의 시험

표적 DNA로의 Cas9 분자의 결합을 평가하기 위한 예시적인 방법이 이전에 기재되어 있다(문헌[Jinek 2012]). 본 명세서에 기재된 기법, 예를 들어, SPR, BLI 및 겔 밴드 변화 분석을 사용하여, 예를 들어, Cas9 분자/gRNA 분자 복합체의 Cas9 분자에 결합하는 gRNA 분자의 능력 또는 표적 DNA에 결합하는 Cas9 분자 및 Cas9/gRNA 복합체의 능력을 측정할 수 있다.

예를 들어, 전기영동 이동성 변화 분석에서, 표적 DNA 듀플렉스는 탈이온수 중에 각각의 가닥(10 nmol)을 혼합하고, 95℃로 3분 동안 가열하고 실온으로 서서히 냉각시킴으로써 형성된다. 모든 DNA를 1X TBE를 함유하는 8% 고유 겔 상에서 정제한다. DNA 밴드를 UV 투영법에 의해 가시화한 다음, 절개하고, DEPC-처리 H₂O 중에 겔 조각을 침지시킴으로써 용리시킨다. 용리된 DNA를 에탄올 침전시키고, DEPC-처리된 H₂O 중에 용해시킨다. DNA 시료를 37℃에서 30분 동안 T4 폴리뉴클레오타이드 키나제를 이용하여 [γ-³²P]-ATP로 5' 말단 표지한다. 폴리뉴클레오타이드 키나제를 65℃에서 20분 동안 열 변성시키고, 컬럼을 이용하여 비혼입 방사성 표지를 제거한다. 총 부피 10 ㎕에 20 mM HEPES pH 7.5, 100 mM KCl, 5 mM MgCl₂, 1 mM DTT 및 10% 글리세롤을 함유하는 완충제 중에서 결합 분석을 수행한다. Cas9 단백질 분자를 등몰량의 미리 어닐링된 gRNA 분자에 의해 프로그래밍시키고, 100 pM로부터 1 μM까지 적정한다. 방사성 표지된 DNA를 최종 농도 20 pM로 첨가한다. 시료를 1 시간 동안 37℃에서 인큐베이션시키고, 4℃에서 1X TBE 및 5 mM MgCl₂를 함유하는 8% 고유 폴리아크릴아미드 겔 상에서 분리한다. 겔을 건조시키고, DNA를 인광 영상화에 의해 가시화시킨다.

Cas9/gRNA 복합체의 절단 활성을 측정하기 위한 기법

본 명세서에 기재된 방법은 Cas9/gRNA 복합체의 절단 활성을 검출하는 것을 포함할 수 있다. 이것은 표적 DNA를 변형시키는 Cas9/gRNA 복합체의 능력, 예를 들어, 표적 핵산을 절단하는 Cas9/gRNA 복합체의 능력을 검출하는 것을 포함할 수 있다. Cas9/gRNA 복합체의 절단 활성을 검출하기 위해 사용될 수 있는 기법의 일부 예는 본 명세서에 기재된다.

절단 분석: Cas9 분자/gRNA 분자 복합체의 엔도뉴클레아제 활성의 시험

Cas9/gRNA 복합체의 안정성을 결정하기 위해 시험될 수 있는 추가의 활성은 표적 DNA를 변형시키는 Cas9/gRNA 복합체의 능력, 예를 들어, 표적 핵산을 절단하는 Cas9/gRNA 복합체의 능력을 포함한다. Cas9/gRNA 복합체의 엔도뉴클레아제 활성을 본 명세서에 개시된 바와 같이 측정할 수 있다. 예를 들어, Cas9 분자의 엔도뉴클레아제 활성을 평가하기 위한 예시적인 방법이 이전에 기재되어 있다(문헌[Jinek 2012]).

표적 핵산에 결합하고, 이를 절단하는 Cas9 분자/gRNA 분자 복합체의 능력을 플라스미드 절단 분석에서 평가할 수 있다. 이러한 분석에서, 합성 또는 시험관내-전사된 gRNA 분자를 95℃로 가열시키고, 실온으로 서서히 냉각시킴에 의해 반응 이전에 미리 어닐링시킨다. 고유 또는 제한 분해-선형화된 플라스미드 DNA(300 ng(약 8 nM))를 37℃에서 60분 동안 10 mM MgCl₂가 존재하거나, 이것이 존재하지 않는 Cas9 플라스미드 절단 완충제(20 mM HEPES pH 7.5, 150 mM KCl, 0.5 mM DTT, 0.1 mM EDTA)에서, 정제된 Cas9 단백질 분자(50 내지 500 nM) 및 gRNA(50 내지 500 nM, 1:1)와 인큐베이션시킨다. 반응을 5X DNA 로딩 완충제(30% 글리세롤, 1.2% SDS, 250 mM EDTA)로 중단시키고, 0.8% 또는 1% 아가로스 겔 전기영동에 의해 분리하고, 에티듐 브로마이드 염색에 의해 가시화시킨다. 초래되는 절단 산물은 Cas9 분자가 둘 모두의 DNA 가닥을 절단하는지, 2개 중 오직 1개의 가닥만을 절단하는지를 나타낸다. 예를 들어, 선형 DNA 산물은 둘 모두의 DNA 가닥의 절단을 나타내는 한편, 닉이 있는 열린 원형 산물은 2개의 가닥 중 오직 1개 만이 절단된 것을 나타낸다.

대안적으로, 표적 핵산에 결합하고, 이를 절단하는 Cas9 분자/gRNA 분자 복합체의 능력을 올리고뉴클레오타이드 DNA 절단 분석에서 평가할 수 있다. 이러한 분석에서, DNA 올리고뉴클레오타이드(10 pmol)를 50 ㎕ 반응물 중에서 37℃에서 30분 동안 1X T4 폴리뉴클레오타이드 키나제 반응 완충제 중 5 유닛의 T4 폴리뉴클레오타이드 키나제 및 약 3 pmol 내지 6 pmol(약 20 mCi 내지 40 mCi)[γ-³²P]-ATP와 함께 인큐베이션시킴으로써 방사성 표지한다. 열 불활성화 후에(65℃에서 20분 동안), 혼입되지 않은 표지를 제거하기 위해 칼럼을 통해 반응물을 정제한다. 95℃에서 3분 동안 등몰량의 비표지 상보성 올리고뉴클레오타이드를 이용하여 표지된 올리고뉴클레오타이드를 어닐링한 후에, 실온으로 서서히 냉각시킴으로써 듀플렉스 기질(100 nM)을 생성한다. 절단 분석을 위해, gRNA 분자를 95℃로 30초 동안 가열한 후에 실온으로 서서히 냉각함으로써 어닐링시킨다. Cas9(500 nM 최종 농도)는 총 부피 9 ㎕ 중에서 절단 분석 완충제(20 mM HEPES pH 7.5, 100 mM KCl, 5 mM MgCl₂, 1 mM DTT, 5% 글리세롤) 중에서 어닐링된 gRNA 분자(500 nM)와 함께 미리 인큐베이션시킨다. 1 ㎕의 표적 DNA(10 nM)의 첨가에 의해 반응을 개시하고, 37℃에서 1시간 동안 인큐베이션시킨다. 20 ㎕의 로딩 염료(5 mM EDTA, 0.025% SDS, 포름아미드 중 5% 글리세롤)의 첨가에 의해 반응을 퀀칭시키고, 95℃로 5분 동안 가열하였다. 7M 우레아를 함유하는 12% 변성 폴리아크릴아미드 겔 상에서 절단 산물을 분리하고, 인광 영상화에 의해 가시화시킨다. 얻어진 절단 산물은 상보성 가닥, 비상보성 가닥 또는 둘 모두가 절단되는지의 여부를 나타낸다.

이들 분석 중 하나 또는 둘 모두는 Cas9/gRNA 복합체의 안정성을 결정하고, 후보 gRNA 분자 또는 후보 Cas9 분자의 적합성을 평가하기 위해 사용될 수 있다.

게놈 교정 방법

본 명세서에 기재된 방법은 Cas9 분자/gRNA 분자 복합체를 평가하기 위해 사용될 수 있다. 이들 Cas9 분자/gRNA 분자 복합체는 본 명세서에 논의된 방법 또는 경로 중 하나 이상을 사용하여 유전자를 표적화하기 위해 사용될 수 있다. 특정 구현예에서, 표적 유전자의 돌연변이는 외인적으로 제공되는 주형 핵산을 사용하여 HDR에 의해 보정된다. 다른 구현예에서, 표적 유전자의 돌연변이는 외인적으로 제공되는 주형 핵산을 사용하지 않고, HDR에 의해 보정된다. 특정 구현예에서, 표적 유전자의 하나 또는 둘 모두의 대립유전자를 NHEJ를 사용하여 낙 아웃시킨다. 특정 구현예에서, 표적 유전자의 발현을 낙 다운시킨다. 본 명세서에 기재된 방법을 사용하여 Cas9 분자/gRNA 분자 복합체가 본 명세서에 논의된 방법 또는 경로 중 하나 이상에 바람직한지 여부를 평가할 수 있다.

HDR 수선 및 주형 핵산

본 명세서에 기재된 바와 같이, 뉴클레아제-유도된 HDR을 사용하여, 표적 서열 내의 표적 위치를 변경(예를 들어, 게놈 내의 돌연변이를 보정, 예를 들어, 수선 또는 교정)시킬 수 있다.

특정 구현예에서, 표적 위치를 변경시키기 위한 HDR-기반의 방법은 외인적으로 제공되는 주형 핵산(본 명세서에서 공여자 작제물 또는 공여자 주형으로도 지칭)을 사용한다. 이론에 의해 구속되지 않고, 표적 위치의 변경은 외인적으로 제공되는 공여자 주형 또는 주형 핵산에 의한 HDR에 의해 일어나는 것으로 여겨진다. 플라스미드 공여자 주형이 상동성 재조합을 위한 주형으로서 사용될 수 있는 것이 고려된다. 추가로, 단일 가닥 공여자 주형이 표적 서열과 공여자 주형 사이의 HDR(예를 들어, 단일 가닥 어닐링)의 대안의 방법에 의해 표적 위치의 변경을 위한 주형으로서 사용될 수 있는 것이 고려된다. 표적 위치의 공여자 주형-영향 변경은 Cas9 분자에 의한 절단에 좌우된다. Cas9에 의한 절단은 이중 가닥 파단 또는 2개의 단일 가닥 파단을 포함할 수 있다.

다른 구현예에서, 표적 위치를 변경시키기 위한 HDR-기반의 방법은 외인적으로 제공되는 주형 핵산을 사용하지 않는다. 이론에 의해 구속되지 않고, 표적 위치의 변경은 내인성 게놈 공여자 서열에 의한 HDR에 의해 일어나는 것으로 여겨진다. 특정 구현예에서, 내인성 게놈 공여자 서열은 표적 위치와 동일한 염색체 상에 위치한다. 다른 구현예에서, 내인성 게놈 공여자 서열은 표적 서열과 상이한 염색체 상에 위치한다. 내인성 게놈 공여자 서열에 의한 표적 위치의 변경은 Cas9 분자에 의한 절단에 좌우된다. Cas9에 의한 절단은 이중 가닥 파단 또는 2개의 단일 가닥 파단을 포함할 수 있다.

주형 핵산을 사용하여 또는 내인성 게놈 공여자 서열을 사용하여 HDR에 의해 보정될 수 있는 돌연변이는 점 돌연변이를 포함한다. 특정 구현예에서, 점 돌연변이는 하나의 이중-가닥 파단 또는 2개의 단일-가닥 파단 중 어느 하나를 사용하여 보정될 수 있다. 특정 구현예에서, 점 돌연변이는 (1) 하나의 이중-가닥 파단, (2) 2개의 단일 가닥 파단, (3) 파단이 표적 위치의 각각의 측 상에서 일어나는 2개의 이중 가닥 파단, (4) 이중 가닥 파단 및 2개의 단일 가닥 파단이 표적 위치의 각각의 측 상에서 일어나는 하나의 이중 가닥 파단 및 2개의 단일 가닥 파단, (5) 단일 가닥 파단의 쌍이 표적 위치의 각각의 측 상에서 일어나는 4개의 단일 가닥 파단, 또는 (6) 하나의 단일-가닥 파단에 의해 보정될 수 있다.

단일 가닥 주형 핵산이 사용되는 특정 구현예에서, 표적 위치는 대안적인 HDR에 의해 변경될 수 있다.

표적 위치의 공여자 주형-영향 변경은 Cas9 분자에 의한 절단에 좌우된다. Cas9에 의한 절단은 닉, 이중 가닥 파단 또는 예를 들어, 표적 핵산의 각 가닥 상에 있는 2개의 단일 가닥 파단을 포함할 수 있다. 표적 핵산 상의 파단의 도입 후에, 파단 말단에 절제가 일어나서, 단일 가닥 오버행 DNA 영역이 초래된다.

정규 HDR에서, 표적 핵산 내로 직접 혼입되거나, 표적 핵산의 서열을 보정하기 위한 주형으로 사용될 표적 핵산에 대한 상동성 서열을 포함하는 이중 가닥 공여자 주형을 도입한다. 파단부에서의 절제 후에, 상이한 경로에 의해, 예를 들어, 이중 홀리데이(Holliday) 접합 모델(또는 이중 가닥 파단 수선, DSBR, 경로) 또는 합성-의존성 가닥 어닐링(SDSA) 경로에 의해 수선이 진행될 수 있다. 이중 홀리데이 접합 모델에서, 공여자 주형 내의 상동성 서열로의 표적 핵산의 2개의 단일 가닥 오버행에 의한 가닥 침입이 발생하여, 2개의 홀리데이 접합부가 있는 중간체의 형성을 초래한다. 새로운 DNA가 침입하는 가닥의 말단으로부터 합성되어 절제로부터 초래되는 갭을 채우는 동안, 접합부가 이동한다. 새로 합성된 DNA의 말단은 절제된 말단에 라이게이션되며, 접합부는 분리되어, 표적 핵산의 보정, 예를 들어, 상응하는 표적 위치에서의 공여자 주형의 보정 서열의 혼입을 초래한다. 접합부의 분리시에 공여자 주형과의 교차가 발생할 수 있다. SDSA 경로에서, 오직 하나의 단일 가닥 오버행이 공여자 주형을 침입하며, 신규한 DNA가 침입 가닥의 말단으로부터 합성되어 절제로부터 초래되는 갭을 채운다. 그 다음, 새로 합성된 DNA는 남아 있는 단일 가닥 오버행에 어닐링되며, 새로운 DNA가 합성되어, 갭을 채우고, 가닥은 라이게이션되어, 보정된 DNA 듀플렉스를 생성한다.

대안적 HDR에서, 단일 가닥 공여자 주형, 예를 들어, 주형 핵산이 도입된다. 원하는 A1AT 표적 위치를 변경하기 위한 표적 핵산에서의 닉, 단일-가닥 파단 또는 이중-가닥 파단은 예를 들어, 본 명세서에 기재된 Cas9 분자에 의해 매개되며, 파단부에서의 절제가 발생하여, 단일 가닥 오버행이 드러난다. 표적 핵산의 표적 위치를 보정하거나 변경시키기 위한 주형 핵산의 서열의 혼입은 전형적으로 상기 기재된 바와 같이 SDSA 경로에 의해 일어난다.

주형 핵산에 대한 추가의 상세사항은 국제 출원 제PCT/US2014/057905호에 제목이 "Template nucleic acids"인 섹션 IV에 제공되어 있다.

유전자 표적화를 위한 NHEJ 방법

본 명세서에 기재된 바와 같이, 뉴클레아제-유도 NHEJ는 유전자-특이적 넉아웃(knockout)을 표적화하고 관심 대상의 유전자에서 서열을 제거하기 위해(예를 들어, 결실시키기 위해) 사용될 수 있다.

이론에 의해 구속되지 않고, 특정 구현예에서, 본 명세서에 기재된 방법과 관련된 게놈 변경은 뉴클레아제-유도 NHEJ 및 NHEJ 수선 경로의 오류 유발 성질에 의존하는 것으로 여겨진다. NHEJ는 2개의 말단을 함께 연결함으로써 DNA 내 이중 가닥 파단을 수선하지만; 일반적으로, 원래의 서열은 두 적합성 말단이 그들이 정확히 이중 가닥 파단에 의해 형성되어서, 완벽하게 라이게이션되는 경우에만 수선된다. 이중 가닥 파단부의 DNA 말단은 빈번하게는 효소적 가공 대상이며, 이는 말단의 재연결 이전에 하나 또는 둘 모두의 가닥에서 뉴클레오타이드의 첨가 또는 제거를 초래한다. 이는 NHEJ 수선 부위에서 DNA 서열 내의 삽입 및/또는 결실(삽입결실) 돌연변이의 존재를 초래한다. 통상적으로 이들 돌연변이 중 2/3는 리딩 프레임을 변경시키며, 따라서, 비기능성 단백질을 생성한다. 추가적으로, 리딩 프레임을 유지하지만, 상당한 양의 서열을 삽입 또는 결실시키는 돌연변이는 단백질의 기능성을 파괴할 수 있다. 이는 중요한 기능적 도메인의 돌연변이가 단백질의 결정적이지 않은 영역에서의 돌연변이보다 덜 용인될 가능성이 있기 때문에 유전자좌 의존적이다.

NHEJ에 의해 생성된 삽입결실 돌연변이는 성질이 예측불가능하지만; 그러나, 주어진 파단 부위에서 특정 삽입결실 서열이 선호되며, 집단에서 과다 표현되는데, 이는 작은 영역의 마이크로상동성 때문일 가능성이 있다. 결실의 길이는 광범위하게 달라질 수 있으며; 그들은 가장 통상적으로는 1 bp 내지 50 bp 범위이지만, 그들은 100 bp 내지 200 bp 초과에 도달할 수 있다. 삽입은 더 짧게 되는 경향이 있으며, 종종 파단 부위를 바로 둘러싸는 서열의 짧은 중복을 포함한다. 그러나, 큰 삽입을 얻을 수 있고, 이들 경우에 삽입된 서열을 종종 게놈의 다른 영역에 대해 또는 세포 내에 존재하는 플라스미드 DNA에 대해 추적하였다.

NHEJ는 돌연변이유발 과정이기 때문에, 이는 또한 특이적 최종 서열의 생성이 필요하지 않는 한, 작은 서열 모티프(예를 들어, 50개 이하의 뉴클레오타이드 길이의 모티프)를 결실시키는데 사용될 수 있다. 이중 가닥 파단부가 표적 서열 근처에서 표적화된다면, NHEJ 수선에 의해 야기되는 결실 돌연변이는 종종 걸쳐서 이어지고, 따라서 원치않는 뉴클레오타이드를 제거한다. 더 큰 DNA 세그먼트의 결실을 위해, 서열의 각각의 측면 상에서 하나씩 두 이중-가닥 파단을 도입시키는 것은 전체 개재 서열의 제거에 의해 말단들 사이에 NHEJ를 초래할 수 있다. 이러한 방식으로, 수백 킬로베이스만큼 큰 DNA 세그먼트가 결실될 수 있다. 이들 방법 중 둘 모두는 특이적 DNA 서열을 결실시키기 위해 사용될 수 있지만; NHEJ의 오류-유발 성질은 여전히 수선 부위에서 삽입결실 돌연변이를 생성할 수 있다.

둘 모두의 이중 가닥 절단 eaCas9 분자 및 단일 가닥 또는 틈내기효소, eaCas9 분자는 NHEJ-매개 삽입결실을 생성하기 위해 본 명세서에 기재된 방법 및 조성물에서 사용될 수 있다. 유전자, 예를 들어, 코딩 영역, 예를 들어, 관심 대상 유전자의 초기 코딩 영역에 표적화된 NHEJ-매개 삽입결실은 관심 대상의 유전자를 넉아웃시키기 위해(즉, 유전자의 발현을 제거하기 위해) 사용될 수 있다. 예를 들어, 관심 대상의 유전자의 초기 코딩 영역은 출발 코돈의 직후의, 코딩 서열의 제1 엑손 내의, 또는 출발 코돈의 500 bp(예를 들어, 500 bp, 450 bp, 400 bp, 350 bp, 300 bp, 250 bp, 200 bp, 150 bp, 100 bp 또는 50 bp 미만) 내의 서열을 포함한다.

표적화된 넉다운

DNA 수준에서 유전자를 돌연변이시킴으로써 발현을 영구적으로 제거하는 CRISPR/Cas-매개 유전자 넉아웃과 달리, CRISPR/Cas 넉아웃은 인공 전사 인자의 사용을 통해 유전자 발현이 일시적으로 감소되게 한다. Cas9 단백질의 DNA 절단 도메인 둘 다에서 중요한 잔기의 돌연변이(예를 들어, D10A 및 H840A 돌연변이)는 효소적 불활성 Cas9(사멸 Cas9 또는 dCas9로서도 알려진 eiCas9) 분자의 생성을 초래한다. eiCas9 분자는 gRNA와 복합체화하고, gRNA의 표적화 도메인에 의해 구체화되는 DNA 서열에 국소화되지만, 표적 DNA를 절단하지 않는다. 효과기(effector) 도메인, 예를 들어, 전사 억제 도메인으로의 eiCas9의 융합은 gRNA에 의해 구체화된 임의의 DNA 부위로의 효과기의 동원을 가능하게 한다. eiCas9 분자 그 자체는 코딩 서열 내 초기 영역에 동원되는 경우 전사를 차단할 수 있지만, 더욱 강력한 억제는 전사 억제 도메인(예를 들어, KRAB, SID 또는 ERD)을 eiCas9에 융합시키고 그것을 표적 넉다운 위치에, 예를 들어, 출발 코돈에 대하여 3'의 서열의 1000 bp 이내에 또는 유전자 출발 코돈에 대하여 5'의 프로모터 영역의 500 bp 이내에 동원함으로써 달성될 수 있다. 프로모터의 DNAse I 과민성 부위(DHS)를 표적화하는 것은 이들 영역이 Cas9 단백질에 접근가능하게 될 가능성이 더 많고 또한 내인성 전사 인자에 대한 부위를 보유할 가능성이 더 많기 때문에 더 효율적인 유전자 억제 또는 활성화를 수득할 수 있는 가능성이 있다. 특히 유전자 억제를 위해, 본 명세서에서 내인성 전사 인자의 결합 부위를 차단하는 것은 유전자 발현을 하향조절하는데 도움을 줄 것으로 고려된다. 특정 구현예에서, 하나 이상의 eiCas9 분자를 사용하여, 하나 이상의 내인성 전사 인자의 결합을 차단할 수 있다. 다른 구현예에서, eiCas9 분자는 염색질 변형 단백질에 융합될 수 있다. 염색질 상태를 변경시키는 것은 표적 유전자의 감소된 발현을 초래할 수 있다. 하나 이상의 염색질 변형 단백질에 융합된 하나 이상의 eiCas9 분자는 염색질 상태를 변경시키기 위해 사용될 수 있다.

특정 구현예에서, gRNA 분자는 공지된 전사 반응 요소(예를 들어, 프로모터, 인핸서 등), 공지된 상류 활성화 서열(UAS) 및/또는 표적 DNA의 발현을 제어할 수 있는 것으로 의심되는 알려지지 않은 또는 알려진 기능의 서열에 표적화될 수 있다.

CRISPR/Cas-매개 유전자 넉다운은 원치않는 대립유전자 또는 전사물의 발현을 감소시키기 위해 사용될 수 있다. 본 명세서에서 유전자의 영구적인 파괴가 이상적이지 않은 시나리오가 고려된다. 이들 시나리오에서, 부위-특이적 억제는 발현을 일시적으로 감소시키거나 또는 제거하기 위해 사용될 수 있다. 또한 본 명세서에서 Cas-억제제의 표적-외 효과는 뉴클레아제가 임의의 DNA 서열을 절단하고 돌연변이를 야기할 수 있기 때문에 Cas-뉴클레아제보다 덜 심각할 수 있는 반면, Cas-억제제는 단지 그것이 활성적으로 전사된 유전자의 프로모터 영역을 표적화하는 경우에만 효과를 가질 수 있는 것으로 고려된다. 그러나, 뉴클레아제-매개 넉아웃은 영구적이지만, Cas-억제제가 세포 내에 존재하는 한 억제는 단지 지속될 수 있다. 일단 억제제가 더 이상 존재하지 않는다면, 내인성 전사 인자 및 유전자 조절 요소는 발현을 그의 천연 상태로 회복시킬 가능성이 있다.

단일-가닥 어닐링

단일 가닥 어닐링(SSA)은 표적 핵산에 존재하는 2개의 반복 서열 사이의 이중-가닥 파단부를 수선하는 또 다른 DNA 수선 과정이다. SSA 경로에 의해 사용되는 반복 서열은 일반적으로 30개 초과의 뉴클레오타이드 길이이다. 파단 말단에서 절제가 발생하여, 표적 핵산의 둘 모두의 가닥 상에 반복 서열이 드러난다. 절제 후에, 반복 서열을 함유하는 단일 가닥 오버행은 RPA 단백질로 코팅되어, 반복 서열이 예를 들어, 그들 자체에 부적절하게 어닐링되는 것을 방지한다. RAD52는 오버행 상의 반복 서열의 각각에 결합하며, 서열을 정렬시켜, 상보적 반복 서열의 어닐링을 가능하게 한다. 어닐링 후에, 오버행의 단일-가닥 플랩(flap)이 절단된다. 새로운 DNA 합성은 임의의 갭을 채우고, 라이게이션에 의해 DNA 듀플렉스가 회복된다. 가공의 결과로서, 2개의 반복부 사이의 DNA 서열은 결실된다. 결실 길이는 사용되는 2개의 반복부의 위치 및 절제의 경로 또는 진행성을 포함하는 많은 인자에 따라 달라질 수 있다.

HDR 경로와 대조적으로, SSA는 표적 핵산 서열을 변경시키거나 보정하기 위하여 주형 핵산을 필요로 하지 않는다. 대신에, 상보적 반복 서열이 이용된다.

다른 DNA 수선 경로

SSBR(단일 가닥 파단부 수선)

게놈 내의 단일-가닥 파단부(SSB)는 SSBR 경로에 의해 수선되며, 이는 상기 논의된 DSB 수선 메커니즘과 별개의 메커니즘이다. SSBR 경로는 4개의 주요 단계를 갖는다: SSB 검출, DNA 말단 가공, DNA 갭 채움 및 DNA 라이게이션. 더욱 상세한 설명은 문헌[Caldecott 2008]에 제공되어 있으며, 요약이 본 명세서에 제공되어 있다.

제1 단계에서, SSB가 형성되는 경우, PARP1 및/또는 PARP2는 파단부를 인식하고, 수선 기구를 동원한다. DNA 파단부에서의 PARP1의 결합 및 활성은 일시적이며, 병변에서 SSBR 단백질 복합체의 국소 축적 또는 안정성을 촉진시킴으로써 SSBR를 가속화시키는 것으로 보여진다. 거의 틀림 없이, 이들 SSBR 단백질 중 가장 중요한 것은 XRCC1이며, 이는 DNA 3' 및 5' 말단의 정리(cleaning)를 담당하는 단백질을 포함하는 SSBR 과정의 다수의 효소 구성성분과 상호작용하고, 이를 안정화시키고, 이를 자극하는 분자 스캐폴드로서 기능한다. 예를 들어, XRCC1은 말단 가공을 촉진시키는 몇몇의 단백질(DNA 중합효소 베타, PNK 및 3가지 뉴클레아제, APE1, APTX 및 APLF)과 상호작용한다. APE1은 엔도뉴클레아제 활성을 갖는다. APLF는 엔도뉴클레아제 및 3'에서 5'의 엑소뉴클레아제 활성을 나타낸다. APTX는 엔도뉴클레아제 및 3'에서 5'의 엑소뉴클레아제 활성을 갖는다.

전부는 아닐지라도 SSB의 대부분의 3'- 및/또는 5'-말단이 '손상'되기 때문에, 이러한 말단 가공은 SSBR의 중요한 단계이다. 각각의 가공은 일반적으로 손상된 3'-말단을 하이드록실화된 상태로 및/또는 손상된 5' 말단을 포스페이트 모이어티로 회복하여, 말단이 라이게이션-적격이 되게 하는 것을 수반한다. 손상된 3' 말단을 처리할 수 있는 효소는 PNKP, APE1 및 TDP1을 포함한다. 손상된 5' 말단을 처리할 수 있는 효소는 PNKP, DNA 중합효소 베타 및 APTX를 포함한다. LIG3(DNA 리가제 III)은 또한 말단 가공에 참여할 수 있다. 일단 말단이 정리되면, 갭 채움이 발생할 수 있다.

DNA 갭 채움 단계에서, 전형적으로 존재하는 단백질은 PARP1, DNA 중합효소 베타, XRCC1, FEN1(플랩 엔도뉴클레아제 1), DNA 중합효소 델타/엡실론, PCNA 및 LIG1이다. 2가지 경로의 갭 채움, 짧은 패치 수선 및 긴 패치 수선이 존재한다. 짧은 패치 수선은 소실 중인 단일의 뉴클레오타이드의 삽입을 포함한다. 일부 SSB에서, "갭 채움"은 2개 이상의 뉴클레오타이드를 계속 대체할 수 있다(12개까지의 염기의 대체가 보고됨). FEN1은 대체된 5'-잔기를 제거하는 엔도뉴클레아제이다. Polβ를 포함하는 다수의 DNA 중합효소는 SSB의 수선에 연루되며, DNA 중합효소의 선택은 SSB의 공급원 및 유형에 의해 영향을 받는다.

제4 단계에서, DNA 리가제, 예를 들어, LIG1(리가제 I) 또는 LIG3(리가제 III)은 말단의 연결을 촉매작용시킨다. 짧은 패치 수선은 리가제 III를 이용하고, 긴 패치 수선은 리가제 I을 이용한다.

때때로, SSBR은 복제-결합된다. 이러한 경로는 CtIP, MRN, ERCC1 및 FEN1 중 하나 이상을 수반할 수 있다. SSBR을 촉진할 수 있는 추가의 인자는 aPARP, PARP1, PARP2, PARG, XRCC1, DNA 중합효소 b, DNA 중합효소 d, DNA 중합효소 e, PCNA, LIG1, PNK, PNKP, APE1, APTX, APLF, TDP1, LIG3, FEN1, CtIP, MRN 및 ERCC1을 포함한다.

MMR(불일치 수선)

세포는 3가지의 절제 수선 경로를 함유한다: MMR, BER 및 NER. 절제 수선 경로는 그들이 전형적으로 DNA의 한 가닥 상의 병변을 인식하고, 이어서 엑소/엔도뉴클레아제가 병변을 제거하며, 1개 내지 30개의 뉴클레오타이드 갭을 남기며, 이것이 이후에 DNA 중합효소에 의해 채워지고, 최종적으로 리가제로 밀봉된다는 공통의 특징을 갖는다. 더욱 완벽한 그림은 문헌[Li 2008]에 제공되어 있으며, 요약은 본 명세서에 제공된다.

불일치 수선(MMR)은 잘못된 쌍의 DNA 염기에 작용한다.

MSH2/6 또는 MSH2/3 복합체는 둘 모두 불일치 인식 및 수선의 개시에 중요한 역할을 수행하는 ATPase 활성을 갖는다. MSH2/6은 염기-염기 불일치를 우선적으로 인식하며, 1개 또는 2개의 뉴클레오타이드의 불일치를 확인하는 한편, MSH2/3은 우선적으로 더 큰 ID 잘못된 쌍을 인식한다.

hMLH1은 hPMS2와 이종이량체화하여, ATPase 활성을 지니며, MMR의 다수의 단계에 중요한 hMutLα를 형성한다. 그것은 EXO1(EXO1은 HR 및 MMR 둘 모두에서의 참가제이다)을 수반하는 3' 닉-유도 MMR에서 중요한 역할을 수행하는 PCNA/복제 인자 C (RFC)-의존성 엔도뉴클레아제 활성을 지닌다. 그것은 불일치-유발 절제의 종결을 조절한다. 리가제 I은 이러한 경로에 대한 관련 리가제이다. MMR을 촉진시킬 수 있는 추가의 인자는 EXO1, MSH2, MSH3, MSH6, MLH1, PMS2, MLH3, DNA Pol d, RPA, HMGB1, RFC 및 DNA 리가제 I을 포함한다.

염기 절제 수선(BER)

염기 절제 수선(BER) 경로는 세포 주기 내내 활성이며; 주로 게놈으로부터 작은, 비-나선-왜곡 염기 병변의 제거를 담당한다. 대조적으로, 관련 뉴클레오타이드 절제 수선 경로(다음 섹션에 논의)는 부피가 큰 나선-왜곡 병변을 수선한다. 더욱 상세한 설명은 문헌[Caldecott 2008]에 제공되어 있으며, 요약이 본 명세서에 제공된다.

DNA 염기 손상시에, 염기 절제 수선(BER)이 개시되며, 과정은 5가지 주요 단계로 단순화될 수 있다: (a) 손상된 DNA 염기의 제거; (b) 이후의 기본 부위의 절개; (c) DNA 말단의 정리; (d) 수선 갭으로의 보정 뉴클레오타이드의 삽입; 및 (e) DNA 백본에 남아 있는 닉의 라이게이션. 이들 마지막 단계는 SSBR과 유사하다.

제1 단계에서, 손상-특이적 DNA 글리코실라제는 염기를 당 포스페이트 백본에 연결시키는 N-글리코시드 결합의 절단을 통해 손상된 염기를 절제한다. 그 다음, 관련 리아제 활성을 갖는 AP 엔도뉴클레아제-1(APE1) 또는 이중작용성 DNA 글리코실라제는 포스포디에스테르 백본을 절개하여, DNA 단일 가닥 파단부(SSB)를 생성한다. BER의 제3 단계는 DNA 말단의 정리를 수반한다. BER에서 제4 단계는 새로운 상보적 뉴클레오타이드를 수선 갭 내로 첨가하는 Polβ에 의해 행해지며, 최종 단계에서, XRCC1/리가제 III은 DNA 백본에 남아 있는 닉을 밀봉한다. 이에 의해, 짧은 패치 BER 경로가 완료되며, 여기서, 손상된 DNA 염기의 대다수(약 80%)가 수선된다. 그러나, 단계 3에서 5'-말단이 Pol β에 의한 하나의 뉴클레오타이드 삽입 후에, 말단 가공 활성에 저항성이 있다면, 복제성 DNA 중합효소, Pol δ/ε로의 중합효소 전환이 존재하며, 이는 이어서, 약 2개 내지 8개 이상의 뉴클레오타이드를 DNA 수선 갭에 부가한다. 이에 의해, 5' 플랩 구조가 생성되며, 이는 진행성 인자 증식 세포 핵 항원(PCNA)과 회합된 플랩 엔도뉴클레아제-1(FEN-1)에 의해 인식되고 절제된다. 그 다음, DNA 리가제 I은 DNA 백본에서 남아 있는 닉을 밀봉하고, 긴-패치 BER을 완료한다. BER 경로를 촉진시킬 수 있는 추가의 인자는 DNA 글리코실라제, APE1, Polb, Pold, Pole, XRCC1, 리가제 III, FEN-1, PCNA, RECQL4, WRN, MYH, PNKP 및 APTX를 포함한다.

뉴클레오타이드 절제 수선(NER)

뉴클레오타이드 절제 수선(NER)은 부피가 큰 나선-왜곡 병변을 DNA로부터 제거하는 중요한 절제 메커니즘이다. NER에 관한 추가의 상세사항은 문헌[Marteijn 2014]에 제공되어 있으며, 요약이 본 명세서에 제공된다. NER은 2가지 더 작은 경로: 전체 게놈 NER(GG-NER) 및 전사 결합된 수선 NER(TC-NER)을 포함하는 넓은 경로이다. GG-NER 및 TC-NER은 DNA 손상을 인식하기 위하여 상이한 인자를 이용한다. 그러나 그들은 병변 절개, 수선 및 라이게이션을 위하여 동일한 기구를 이용한다.

일단 손상이 인식되면, 세포는 병변을 함유하는 짧은 단일-가닥 DNA 세그먼트를 제거한다. 엔도뉴클레아제 XPF/ERCC1 및 XPG(ERCC5에 의해 인코딩)는 병변의 어느 하나의 측 상의 손상된 가닥을 절단함으로써 병변을 제거하여, 22개 내지 30개 뉴클레오타이드의 단일-가닥 갭을 초래한다. 다음으로, 세포는 DNA 갭을 채우는 합성 및 라이게이션을 수행한다. 이러한 과정에는 PCNA, RFC, DNA Pol δ, DNA Pol ε 또는 DNA Pol κ 및 DNA 리가제 I 또는 XRCC1/리가제 III가 수반된다. 라이게이션 단계를 수행하기 위하여 복제성 세포는 DNA pol ε 및 DNA 리가제 I을 이용하는 경향이 있는 한편, 비-복제성 세포는 DNA Pol δ, DNA Pol κ 및 XRCC1/리가제 III 복합체를 이용하는 경향이 있다.

NER은 하기의 인자를 수반할 수 있다: XPA-G, POLH, XPF, ERCC1, XPA-G 및 LIG1. 전사-결합 NER(TC-NER)는 하기의 인자를 수반할 수 있다: CSA, CSB, XPB, XPD, XPG, ERCC1 및 TTDA. NER 수선 경로를 촉진시킬 수 있는 추가의 인자는 XPA-G, POLH, XPF, ERCC1, XPA-G, LIG1, CSA, CSB, XPA, XPB, XPC, XPD, XPF, XPG, TTDA, UVSSA, USP7, CETN2, RAD23B, UV-DDB, CAK 하위복합체, RPA 및 PCNA를 포함한다.

사슬간 교차결합(ICL)

ICL 수선 경로로 지칭되는 전용 경로는 사슬간 교차결합을 수선한다. 상이한 DNA 가닥에서 염기 사이의 사슬간 교차결합 또는 공유적 교차결합은 복제 또는 전사 동안 발생할 수 있다. ICL 수선은 다수의 수선 과정, 특히 핵산 분해 활성, 병변통과(translesion) 합성 및 HDR의 협동을 수반한다. 뉴클레아제는 교차결합된 염기의 어느 하나의 측 상의 ICL을 절제하기 위해 동원되는 한편, TLS 및 HDR은 절단된 가닥을 수선하기 위하여 협동한다. ICL 수선은 하기의 인자를 수반할 수 있다: 엔도뉴클레아제, 예를 들어, XPF 및 RAD51C, 엔도뉴클레아제, 예를 들어, RAD51, 병변통과 중합효소, 예를 들어, DNA 중합효소 제타 및 Rev1), 및 판코니 빈혈(FA) 단백질, 예를 들어, FancJ.

기타 경로

포유동물에 몇몇의 다른 DNA 수선 경로가 존재한다.

병변통과 합성(TLS)은 결함이 있는 복제 사건 후에 남겨진 단일 가닥 파단부를 수선하기 위한 경로이며, 병변통과 중합효소, 예를 들어, DNA polβ 및 Rev1을 수반한다.

오류-유발 복제후 수선(PRR)은 결함이 있는 복제 사건 후에 남겨진 단일 가닥 파단부를 수선하기 위한 또 다른 경로이다.

표적 세포

Cas9 분자 및 gRNA 분자, 예를 들어, Cas9 분자/gRNA 분자 복합체를 사용하여 매우 다양한 세포에서 표적 핵산을 변경(예를 들어, 그 내에 돌연변이를 도입)시킬 수 있다. 이러한 변경을 시험관내, 생체외 또는 생체내에서 수행될 수 있다. 특정 구현예에서, 이러한 변경은 유전자 발현의 조절을 초래한다.

본 명세서에 기재된 Cas9 및 gRNA 분자를 표적 세포로 전달할 수 있다. 예시적인 표적 세포는 혈액 세포, 신경 세포, 면역 세포, 근육 세포, 신장 세포, 유방 세포, GI 관 세포, 혈관 세포, 폐 세포, 골 세포, 췌장 세포, 피부 세포, 지방세포, 호르몬 분비 세포, 간 세포, 상피 세포 및 섬유아세포를 포함하나 이들에 한정되지 않는다. 특정 구현예에서, 표적 세포는 정상 세포이다. 다른 구현예에서, 표적 세포는 이환 세포이다. 이들 중 특정 구현예에서, 표적 세포는 암 세포이다.

적합한 세포는 줄기 세포, 예를 들어, 배아 줄기 세포, 유도된 만능 줄기 세포, 조혈 줄기 세포, 뉴런 줄기 세포 또는 중간엽 줄기 세포를 포함할 수 있다. 특정 구현예에서, 세포는 유도된 만능 줄기(iPS) 세포 또는 iPS 세포로부터 유래된 세포, 예를 들어, 대상체로부터 생성된, 돌연변이를 보정하기 위하여 변형된, 및 임상적 관련 세포, 예를 들어, 간세포, 대식세포, 단핵 식세포, 폐포 대식세포, 골수 전구 세포, 폐 상피 세포 또는 조혈 줄기 세포로 분화된 iPS 세포이다. 특정 구현예에서, AAV는 표적 세포를 형질도입시키기 위해 사용된다.

본 명세서에 기재된 방법에 의해 생성되는 세포를 바로 사용할 수 있다. 대안적으로, 세포를 동결시키고(예를 들어, 액체 질소에서), 이후의 이용을 위해 보관할 수 있다. 세포를 통상 이러한 동결 온도에서 세포를 보존하기 위하여 해당 분야에 통상적으로 사용되는 바와 같이 10% 디메틸설폭시드(DMSO), 50% 혈청, 40% 완충 매질 또는 몇몇의 다른 이러한 용액에서 동결시키고, 동결된 배양 세포를 해동시키기 위하여 해당 분야에 통상적으로 알려져 있는 방식으로 해동시킬 것이다.

전달, 제형 및 투여 경로

Cas 시스템 구성성분, 예를 들어, Cas9 분자, gRNA 분자(예를 들어, Cas9 분자/gRNA 분자 복합체), 공여자 주형 핵산 또는 3가지 모두가 다양한 형태로 전달되거나, 제형화되거나, 투여될 수 있으며, 예를 들어, 표 3 및 표 4를 참조한다. 표 3은 구성성분이 제형화되거나, 전달되거나, 투여될 수 있는 방법의 예를 제공한다. 표 4에는 본 명세서에 기재된 바와 같이, Cas 시스템의 구성성분, 예를 들어, Cas9 분자 구성성분 및 gRNA 분자 구성성분을 위한 다양한 전달 방법이 요약되어 있다.

Cas9, gRNA 및/또는 공여자 주형의 DNA-기반의 전달

Cas9 분자(예를 들어, eaCas9 분자) 또는 gRNA 분자를 인코딩하는 DNA, 공여자 주형 또는 이들의 임의의 조합(예를 들어, 둘 또는 전부)을 해당 분야에 알려진 방법에 의해 또는 본 명세서에 기재된 바와 같이 대상체에게 투여하거나 세포 내로 전달할 수 있다. 예를 들어, Cas9 및/또는 gRNA를 인코딩하는 DNA 및 공여자 주형을 예를 들어, 벡터(예를 들어, 바이러스 또는 비-바이러스 벡터), 비-벡터 기반의 방법(예를 들어, 네이키드 DNA 또는 DNA 복합체를 이용), 또는 이의 조합에 의해 전달할 수 있다. 유사하게, 공여자 주형을 예를 들어, 벡터(예를 들어, 바이러스 또는 비-바이러스 벡터), 비-벡터 기반의 방법(예를 들어, 네이키드 DNA 또는 DNA 복합체를 이용), 또는 이의 조합에 의해 전달할 수 있다.

Cas9 분자(예를 들어, eaCas9 분자) 및/또는 gRNA 분자를 인코딩하는 DNA를 표적 세포(예를 들어, 본 명세서에 기재된 표적 세포)에 의한 흡수를 촉진시키는 분자(예를 들어, N-아세틸갈락토사민)에 컨쥬게이트시킬 수 있다. 이와 같이, 공여자 주형을 표적 세포(예를 들어, 본 명세서에 기재된 표적 세포)에 의한 흡수를 촉진시키는 분자(예를 들어, N-아세틸갈락토사민)에 컨쥬게이트시킬 수 있다.

특정 구현예에서, Cas9 및/또는 gRNA를 인코딩하는 DNA를 벡터(예를 들어, 바이러스 벡터/바이러스 또는 플라스미드)에 의해 전달한다.

특정 구현예에서, 벡터는 Cas9 분자 및/또는 gRNA 분자를 인코딩하는 DNA 서열을 포함할 수 있다. 특정 구현예에서, 벡터는 표적화되는 영역(예를 들어, 표적 서열)에 높은 상동성을 갖는 공여자 주형을 포함할 수 있다. 이들 중 특정 구현예에서, 공여자 주형은 표적 서열의 전부 또는 일부를 포함한다. 예시적인 공여자 주형은 수선 주형, 예를 들어, 유전자 보정 주형 또는 유전자 돌연변이 주형, 예를 들어, 점 돌연변이(예를 들어, 단일 뉴클레오타이드(nt) 치환) 주형이다.

특정 구현예에서, 벡터는 예를 들어, Cas9 분자 서열에 융합된 (예를 들어, 핵 국소화, 인 국소화 또는 미토콘드리아 국소화를 위해) 신호 펩타이드를 인코딩하는 서열을 포함할 수 있다. 특정 구현예에서, 벡터는 하나 이상의 조절/제어 요소, 예를 들어, 프로모터, 인핸서, 인트론, 폴리아데닐화 신호, 코작(Kozak) 공통 서열, 내부 리보솜 유입 부위(IRES), 2A 서열, 및/또는 스플라이스 수용자 또는 공여자를 포함할 수 있다. 벡터가 프로모터를 포함하는 이들 중 특정 구현예에서, 프로모터는 RNA 중합효소 II(예를 들어, CMV 프로모터)에 의해 인식된다. 다른 구현예에서, 프로모터는 RNA 중합효소 III(예를 들어, U6 프로모터)에 의해 인식된다.

특정 구현예에서, 벡터는 (예를 들어, 재조합 바이러스의 생성을 위한) 바이러스 벡터이다. 이들 중 특정 구현예에서, 바이러스는 DNA 바이러스(예를 들어, dsDNA 또는 ssDNA 바이러스)이다. 다른 구현예에서, 바이러스는 RNA 바이러스(예를 들어, ssRNA 바이러스)이다. 예시적인 바이러스 벡터/바이러스는, 예를 들어, 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스(AAV), 백시니아 바이러스, 폭스바이러스 및 단순 포진 바이러스를 포함한다. 특정 구현예에서, Cas9 및/또는 gRNA를 인코딩하는 DNA는 재조합 AAV에 의해 전달된다. 특정 구현예에서, 공여자 주형 핵산은 재조합 AAV에 의해 전달된다. 특정 구현예에서, 바이러스 벡터는 세포 유형 및/또는 조직 유형을 인식할 수 있다. 특정 구현예에서, 바이러스 벡터는 세포 유형-특이적 발현을 달성한다. 특정 구현예에서, 바이러스 벡터는 바이러스 벡터와 표적 세포 막의 융합의 효율을 증가시킨다.

특정 구현예에서, Cas9 및/또는 gRNA를 인코딩하는 DNA는 (예를 들어, 네이키드 DNA 또는 DNA 복합체를 사용하는) 비-벡터 기반의 방법에 의해 전달된다. 예를 들어, DNA는 예를 들어, 유기적으로 변형된 실리카 또는 실리케이트(오르모실(Ormosil)), 전기천공법, 일시적 세포 압축 또는 압착(예를 들어, 문헌[Lee 2012] 참조), 유전자총, 초음파천공법, 자성주입법(magnetofection), 지질-매개 트랜스펙션, 덴드리머, 무기 나노입자, 인산칼슘, 또는 이들의 조합에 의해 전달될 수 있다.

특정 구현예에서, Cas9 및/또는 gRNA를 인코딩하는 DNA는 벡터 및 비-벡터 기반의 방법의 조합에 의해 전달된다. 특정 구현예에서, 공여자 주형은 벡터 및 비-벡터 기반의 방법의 조합에 의해 전달된다.

유전자 전달을 위한 예시적인 지질은 하기 표 1에 나타나 있다. 유전자 전달을 위한 예시적인 중합체는 하기 표 5에 나타나 있다.

특정 구현예에서, 비-벡터 전달 비히클은 나노입자 및 리포좀의 표적 세포 갱신을 증가시키기 위한 표적화 변형, 예를 들어 세포 특이적 항원, 모노클로널 항체, 단쇄 항체, 압타머, 중합체, 당(예를 들어, N-아세틸갈락토사민(GalNAc)) 및 세포 투과 펩타이드를 가진다. 특정 구현예에서, 비히클은 융합생성 및 엔도좀-탈안정화 펩타이드/중합체를 이용한다. 특정 구현예에서, 비히클은 (예를 들어, 카고(cargo)의 엔도좀 탈출을 가속화시키도록) 산-촉발 입체형태적 변화를 겪는다. 특정 구현예에서, 자극-절단성 중합체는, 예를 들어 세포 구획에서의 방출을 위해 사용된다. 특정 구현예에서, 전달 비히클은 생물학적 비-바이러스 전달 비히클이다.

특정 구현예에서, Cas 시스템의 구성성분 이외의 하나 이상의 핵산 분자(예를 들어, DNA 분자)(즉, Cas9 분자 및/또는 gRNA 분자를 인코딩하는 DNA 또는 공여자 주형 이외의 것)가 전달된다. 이들 중 특정 구현예에서, 이들 다른 핵산 분자는 Cas 시스템의 구성성분 중 하나 이상과 동시에 전달된다. 다른 구현예에서, 이들 다른 핵산 분자는 Cas 시스템의 구성성분 중 하나 이상 (예를 들어, 약 30분, 1시간, 2시간, 3시간, 6시간, 9시간, 12시간, 1일, 2일, 3일, 1주, 2주 또는 4주 미만) 전에 또는 후에 전달된다. 특정 구현예에서, 이들 다른 핵산 분자는 Cas 시스템의 구성성분 중 하나 이상과 상이한 수단에 의해 전달된다. 다른 핵산 분자는 본 명세서에 기재된 임의의 전달 방법에 의해 전달될 수 있다.

Cas9 및/또는 gRNA의 RNA-기반의 전달

gRNA 분자 및/또는 Cas9 분자를 인코딩하는 RNA 분자는 해당 분야에 알려져 있는 방법에 의해, 또는 본 명세서에 기재된 바와 같이, 세포, 예를 들어, 본 명세서에 기재된 표적 세포 내로 전달될 수 있다. 예를 들어, gRNA 분자 및/또는 Cas9 분자를 인코딩하는 RNA 분자는 예를 들어, 마이크로주입, 전기천공법, 일시적 세포 압축 또는 압착(예를 들어, 문헌[Lee 2012] 참조), 지질-매개 트랜스펙션, 펩타이드-매개 전달 또는 이들의 조합에 의해 전달될 수 있다. gRNA 분자 및/또는 Cas9 분자를 인코딩하는 RNA 분자는 표적 세포(예를 들어, 본 명세서에 기재된 표적 세포)에 의한 흡수를 촉진시키는 분자에 컨쥬게이트될 수 있다.

특정 구현예에서, 전기천공법을 통한 전달은 세포를 카트리지, 챔버 또는 큐벳 내에서 공여자 주형 핵산 분자와 함께 또는 이것 없이 gRNA 분자 및/또는 Cas9 분자를 인코딩하는 RNA 분자와 혼합하고, 정해진 기간 및 진폭의 하나 이상의 전기적 임펄스를 적용하는 것을 포함한다. 특정 구현예에서, 전기천공법을 통한 전달은 혼합물을 카트리지, 챔버 또는 큐벳 내로 공급하는 장치(예를 들어, 펌프)와 연결된 용기에서 세포를 공여자 주형 핵산 분자와 함께 또는 이것 없이, gRNA 분자 및/또는 Cas9 분자를 인코딩하는 RNA 분자와 혼합하는 시스템을 사용하여 수행되며, 여기서, 정해진 기간 및 진폭의 하나 이상의 전기적 임펄스를 적용하고, 그 후에, 세포를 제2 용기에 전달한다. gRNA 분자 및/또는 Cas9 분자를 인코딩하는 RNA 분자는 표적 세포(예를 들어, 본 명세서에 기재된 표적 세포)에 의한 흡수를 촉진시키기 위해 분자에 컨쥬게이트된다.

Cas9 분자의 전달

Cas9 분자는 해당 분야에 알려져 있는 방법에 의해 또는 본 명세서에 기재된 바와 같이 세포 내로 전달될 수 있다. 예를 들어, Cas9 단백질 분자는 예를 들어, 마이크로주입, 전기천공법, 일시적 세포 압축 또는 압착(예를 들어, 문헌[Lee 2012] 참조), 지질-매개 트랜스펙션, 펩타이드-매개 전달 또는 이들의 조합에 의해 전달될 수 있다. 전달은 gRNA를 인코딩하는 DNA에 의해 또는 gRNA에 의해 달성될 수 있다. Cas9 단백질은 표적 세포(예를 들어, 본 명세서에 기재된 표적 세포)에 의한 흡수를 촉진시키는 분자에 컨쥬게이트될 수 있다.

특정 구현예에서, Cas9 단백질을 gRNA 분자와 조합하여, 해당 분야에 알려져 있는 방법에 의해 또는 본 명세서에 기재된 바와 같이 대상체로 투여하거나, 세포 내로 전달될 리보핵단백질(RNP) 복합체를 형성할 수 있다. 세포로의 Cas9/gRNA RNP 복합체의 직접적인 전달은 핵산으로부터 발현될 필요를 없앤다(예를 들어, Cas9 및 gRNA를 인코딩하는 플라스미드의 트랜스펙션). 그것은 또한, 핵산 전달로부터 유래되는 DNA 세그먼트의 원치않는 통합(예를 들어, Cas9 및 gRNA를 인코딩하는 플라스미드의 트랜스펙션)을 없앤다. 따라서, 그것은 신속한 작용, 신속한 전환, 높은 비의 표적-상의 변형, 감소된 표적-외 효과 및 세포에 대한 더 낮은 독성을 제공하는 대안적인 전달 방법이다. 또한, 그것은 트랜스펙션시키기 어려운 세포(예를 들어, 트랜스펙션시키기 어려운 일차 및 만능 줄기 세포)로 Cas9/gRNA 복합체를 전달하기 위해 이용될 수 있다. 특정 구현예에서, Cas9/gRNA RNP 복합체는 투여 이전에 형성(미리 형성)될 수 있다. 특정 구현예에서, 다수의(예를 들어, 1개 초과의) Cas9/gRNA RNP 복합체가 동시에 또는 순차적으로 전달(예를 들어, 투여)될 수 있다. 특정 구현예에서, Cas9/gRNA RNP 복합체는 전기천공법에 의해 세포로 전달될 수 있다.

특정 구현예에서, 전기천공법을 통한 전달은 카트리지, 챔버 또는 큐벳에서 세포를 gRNA 분자 및/또는 공여자 주형 핵산과 함께 또는 이것 없이, Cas9 분자와 혼합하고, 정해진 기간 및 진폭의 하나 이상의 전기적 임펄스를 적용하는 것을 포함한다. 특정 구현예에서, 전기천공법을 통한 전달은 혼합물을 카트리지, 챔버 또는 큐벳 내로 공급하는 장치(예를 들어, 펌프)와 연결된 용기에서 세포를 gRNA 및/또는 공여자 주형 핵산과 함께 또는 이것 없이, Cas9 분자와 혼합하는 시스템을 이용하여 수행되며, 여기서, 정해진 기간 및 진폭의 하나 이상의 전기적 임펄스를 적용하고, 그 후에 세포를 제2 용기로 전달한다.

Cas 시스템 구성성분의 투여 경로

전신 투여 방식은 경구 및 비경구 경로를 포함한다. 비경구 경로는, 예로서 정맥내, 동맥내, 근육내, 진피내, 피하, 비강내 및 복막내 경로를 포함한다. 전신으로 투여되는 구성성분은 혈액 및 골수의 세포에 구성성분을 표적화하도록 변형 또는 제형화될 수 있다.

국소 투여 방식은, 예로서 골수내, 척추강내 및 뇌실내 경로를 포함한다. 특정 구현예에서, (전신 방법에 비해) 상당히 더 적은 양의 구성성분이 전신으로(예를 들어, 정맥내로) 투여되는 경우에 비해 국소로 투여되는 경우에 효과를 발휘할 수 있다. 국소 투여 방식은 치료적 유효량의 구성성분이 전신으로 투여되는 경우 발생할 수 있는 잠재적 독성 부작용의 발생을 감소 또는 제거할 수 있다.

또한, 구성성분은 연장된 기간에 걸쳐 방출을 가능하게 하도록 제형화될 수 있다.

Cas 시스템 구성성분의 생체외 전달

특정 구현예에서, 표 3에 기재된 Cas 시스템 구성성분을 세포 내로 도입하고, 이를 이어서 대상체 내로 도입하며, 예를 들어, 세포를 대상체로부터 제거하고, 생체 외에서 조작하고, 대상체 내로 재도입한다. 구성성분의 도입 방법은 예를 들어, 표 4에 기재된 전달 방법 중 임의의 것을 포함할 수 있다.

변형된 뉴클레오사이드, 뉴클레오타이드 및 핵산

변형된 뉴클레오사이드 및 변형된 뉴클레오타이드는 핵산, 예를 들어, 특히 gRNA뿐만 아니라 RNA의 다른 형태, 예를 들어, mRNA, RNAi, 또는 siRNA에 존재할 수 있다. 본 명세서에서 기재된 바와 같이, "뉴클레오사이드"는 5탄당 분자(펜토스 또는 리보스) 또는 이의 유도체, 및 유기 염기, 퓨린 또는 피리미딘, 또는 이의 유도체를 함유하는 화합물로서 정의된다. 본 명세서에서 기재된 바와 같이, "뉴클레오타이드"는 포스페이트기를 추가로 포함하는 뉴클레오사이드로서 정의된다.

변형된 뉴클레오사이드 및 뉴클레오타이드는 다음 중 하나 이상을 포함할 수 있다:

(i) 포스포디에스테르 백본 결합에서 비결합 포스페이트 산소 중 하나 또는 둘 다 및/또는 결합 포스페이트 산소 중 하나 이상의 변경, 예를 들어, 대체;

(ii) 리보스 당의 구성요소, 예를 들어, 리보스 당에서의 2' 하이드록실의 변경, 예를 들어, 대체;

(iii) "데포스포" 링커로의 포스페이트 모이어티의 대규모 대체;

(iv) 자연 발생 핵염기의 변형 또는 대체;

(v) 리보스-포스페이트 백본의 대체 또는 변형;

(vi) 올리고뉴클레오타이드의 3' 말단 또는 5' 말단의 변형, 예를 들어, 말단 포스페이트 기의 제거, 변형 또는 대체, 또는 모이어티의 컨쥬게이션; 및

(vii) 당의 변형.

상기 열거된 변형을 조합하여, 2개, 3개, 4개 이상의 변형을 가질 수 있는 변형된 뉴클레오사이드 및 뉴클레오타이드를 제공할 수 있다. 예를 들어, 변형된 뉴클레오사이드 또는 뉴클레오타이드는 변형된 당 및 변형된 핵염기를 가질 수 있다. 일 구현예에서, gRNA의 모든 염기는 변형되어 있으며, 예를 들어, 모든 염기는 변형된 포스페이트기를 가지고, 예를 들어, 모든 변형된 포스페이트기는 포스포로티오에이트기이다. 일 구현예에서, 단분자 또는 모듈 gRNA 분자의 포스페이트기의 전부, 또는 실질적으로 전부는 포스포로티오에이트기로 대체된다.

일 구현예에서, 변형된 뉴클레오타이드, 예를 들어, 본 명세서에 기재된 바와 같은 변형을 가지는 뉴클레오타이드는, 핵산, 예를 들어, "변형된 핵산" 내로 혼입될 수 있다. 일 구현예에서, 변형된 핵산은 1개, 2개, 3 이상의 변형된 뉴클레오타이드를 포함한다. 일 구현예에서, 변형된 핵산에서 위치의 적어도 5%(예를 들어, 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 또는 약 100%)가 변형된 뉴클레오타이드이다.

변형되지 않은 핵산은, 예를 들어, 세포 뉴클레아제에 의해 분해되는 경향이 있을 수 있다. 예를 들어, 뉴클레아제는 핵산 포스포디에스테르 결합을 가수분해할 수 있다. 따라서, 일 양태에서, 본 명세서에 기재된 변형된 핵산은 하나 이상의 변형된 뉴클레오사이드 또는 뉴클레오타이드를 포함하여, 예를 들어, 뉴클레아제에 대하여 안정성을 도입할 수 있다.

일 구현예에서, 본 명세서에 기재된 변형된 뉴클레오사이드, 변형된 뉴클레오타이드, 및 변형된 핵산은, 생체내 및 생체외 둘 다에서, 세포의 집단으로 도입될 때, 감소된 선천성 면역 반응을 나타낼 수 있다. 용어 "선천성 면역 반응"은, 일반적으로 바이러스 또는 박테리아 기원의 단일 가닥 핵산을 포함하는 외인성 핵산에 대한 세포 반응을 포함하며, 이는 사이토카인 발현 및 방출, 특히 인터페론의 도입, 및 세포 사멸을 수반한다. 일 구현예에서, 본 명세서에 기재된 변형된 뉴클레오사이드, 변형된 뉴클레오타이드, 및 변형된 핵산은 파트너와 핵산이 상호작용하는 주홈의 결합을 파괴할 수 있다. 일 구현예에서, 본 명세서에 기재된 변형된 뉴클레오사이드, 변형된 뉴클레오타이드, 및 변형된 핵산은, 생체내 및 생체외 둘 다에서, 세포의 집단으로 도입될 때, 감소된 선천성 면역 반응을 나타낼 수 있으며, 또한 파트너와 핵산이 상호작용하는 주홈의 결합을 방해할 수 있다.

화학적 기의 정의

본 명세서에서 사용되는 "알킬"은 직쇄 또는 분지형인 포화 탄화수소기를 말하는 것으로 의미된다. 알킬기의 예는 메틸(Me), 에틸(Et), 프로필(예를 들어, n-프로필 및 이소프로필), 부틸(예를 들어, n-부틸, 이소부틸, t-부틸), 펜틸(예를 들어, n-펜틸, 이소펜틸, 네오펜틸) 등을 포함한다. 알킬기는 1개 내지 약 20개, 2개 내지 약 20개, 1개 내지 약 12개, 1개 내지 약 8개, 1개 내지 약 6개, 1개 내지 약 4개, 또는 1개 내지 약 3개의 탄소 원자를 포함할 수 있다.

본 명세서에서 사용되는 "아릴"은 모노사이클릭 또는 폴리사이클릭(예를 들어, 2개, 3개 또는 4개의 융합된 고리를 가짐) 방향족 탄화수소, 예를 들어, 페닐, 나프틸, 안트라세닐, 페난트레닐, 인다닐, 인데닐 등을 말한다. 일 구현예에서, 아릴기는 6개 내지 약 20개의 탄소 원자를 가진다.

본 명세서에서 사용되는 "알케닐"은 적어도 1개의 이중 결합을 포함하는 지방족 기를 말한다.

본 명세서에서 사용되는 "알키닐"은 2개 내지 12개의 탄소 원자를 포함하고, 하나 이상의 삼중 결합을 가지는 것을 특징으로 하는 직선 또는 분지형 탄화수소 사슬을 말한다. 알키닐기의 예는 에티닐, 프로파르길, 및 3-헥시닐을 포함하지만, 이로 제한되는 것은 아니다.

본 명세서에서 사용되는 "아릴알킬" 또는 "아르알킬"은 알킬 수소 원자가 아릴기로 대체된 알킬 모이어티를 말한다. 아르알킬은 하나 초과의 수소 원자가 아릴기로 대체된 기를 포함한다. "아릴알킬" 또는 "아르알킬"의 예는 벤질, 2-페닐에틸, 3-페닐프로필, 9-플루오레닐, 벤즈하이드릴, 및 트리틸기를 포함한다.

본 명세서에서 사용되는 "사이클로알킬"은 3개 내지 12개의 탄소를 가지는 사이클릭, 비사이클릭, 트리사이클릭, 또는 폴리사이클릭 비방향족 탄화수소기를 말한다. 사이클로알킬 모이어티의 예는 사이클로프로필, 사이클로펜틸, 및 사이클로헥실을 포함하지만, 이로 제한되는 것은 아니다.

본 명세서에서 사용되는 "헤테로사이클릴"은 헤테로사이클릭 고리계의 1가 라디칼을 말한다. 대표적인 헤테로사이클릴은 제한없이, 테트라하이드로푸라닐, 테트라하이드로티에닐, 피롤리디닐, 피롤리도닐, 피페리디닐, 피롤리닐, 피페라지닐, 디옥사닐, 디옥솔라닐, 디아제피닐, 옥사제피닐, 티아제피닐, 및 모르폴리닐을 포함한다.

본 명세서에서 사용되는 "헤테로아릴"은 헤테로방향족 고리계의 1가 라디칼을 말한다. 헤테로아릴 모이어티의 예는 이미다졸릴, 옥사졸릴, 티아졸릴, 트리아졸릴, 피롤릴, 푸라닐, 인돌릴, 티오페닐 피라졸릴, 피리디닐, 피라지닐, 피리다지닐, 피리미디닐, 인돌리지닐, 퓨리닐, 나프티리디닐, 퀴놀릴, 및 프테리디닐을 포함하지만, 이로 제한되는 것은 아니다.

포스페이트 백본 변형

포스페이트기

일 구현예에서, 변형된 뉴클레오타이드의 포스페이트기는 하나 이상의 산소를 상이한 치환기로 대체함으로써 변형될 수 있다. 추가로, 변형된 뉴클레오타이드, 예를 들어, 변형된 핵산에 존재하는 변형된 뉴클레오타이드는, 본 명세서에 기재된 바와 같은 변형된 포스페이트로 비변형 포스페이트 모이어티를 대량 대체하는 것을 포함할 수 있다. 일 구현예에서, 포스페이트 백본의 변형은 비하전된 링커 또는 하전된 링커 중 어느 하나가 비대칭 전하 분포를 갖도록 하는 변경을 포함할 수 있다.

변형된 포스페이트기의 예는 포스포로티오에이트, 포스포로셀레네이트, 보라노 포스페이트, 보라노 포스페이트 에스테르, 하이드로겐 포스포네이트, 포스포로아미데이트, 알킬 또는 아릴 포스포네이트 및 포스포트리에스테르를 포함한다. 일 구현예에서, 포스페이트 백본 모이어티에서 비가교 포스페이트 산소 원자 중 하나는 다음의 기 중 임의의 것으로 대체될 수 있다: 황(S), 셀레늄(Se), BR₃(여기서, R은 예를 들어, 수소, 알킬, 또는 아릴일 수 있음), C(예를 들어, 알킬기, 아릴기 등), H, NR₂(여기서, R은 예를 들어, 수소, 알킬, 또는 아릴일 수 있음), 또는 OR(여기서, R은 예를 들어, 알킬 또는 아릴일 수 있음). 비변형 포스페이트기에서 인 원자는 아키랄이다. 그러나, 상기 원자 또는 원자 그룹 중 하나로 비가교 산소 중 하나를 대체하는 것은 인 원자를 키랄로 만들 수 있으며; 다시 말하면 이러한 방식으로 변형된 포스페이트기에서 인 원자가 입체 중심이다. 입체 인 원자는 "R" 입체구조(본 명세서에서는 Rp) 또는 "S" 입체구조(본 명세서에서는 Sp)를 가질 수 있다.

포스포로디티오에이트는 비가교 산소 둘 다 황으로 대체된다. 포스포로디티오에이트에서 인 중심은 올리고리보뉴클레오타이드 부분입체이성질체의 형성을 불가능하게 하는 아키랄이다. 일 구현예에서, 비가교 산소 하나 또는 둘 다의 변형은 또한 S, Se, B, C, H, N, 및 OR(R은 예를 들어, 알킬 또는 아릴일 수 있음)로부터 독립적으로 선택되는 기로 비가교 산소를 대체하는 것을 포함할 수 있다.

포스페이트 링커는 또한 질소(가교 포스포로아미데이트), 황(가교 포스포로티오에이트) 및 탄소(가교 메틸렌포스포네이트)로 가교 산소(즉, 뉴클레오사이드에 포스페이트를 연결하는 산소)를 대체함으로써 변형될 수 있다. 대체는 연결 산소 중 어느 하나 또는 연결 산소의 둘 다에서 일어날 수 있다.

포스페이트기의 대체

포스페이트기는 비-인 함유 연결기(non-phosphrous containing connector)에 의해 대체될 수 있다. 구현예에서, 하전 포스페이트기는 중성 모이어티로 대체될 수 있다.

포스페이트기를 대체할 수 있는 모이어티의 예는, 예를 들어, 메틸 포스포네이트, 하이드록실아미노, 실록산, 카르보네이트, 카르복시메틸, 카르바메이트, 아미드, 티오에테르, 에틸렌 옥사이드 링커, 설포네이트, 설폰아미드, 티오포름아세탈, 포름아세탈, 옥심, 메틸렌이미노, 메틸렌메틸이미노, 메틸렌하이드라조, 메틸렌디메틸하이드라조 및 메틸렌옥시메틸이미노를 포함할 수 있지만, 이로 제한되는 것은 아니다.

리보포스페이트 백본의 대체

포스페이트 링커 및 리보스 당이 뉴클레아제 내성 뉴클레오사이드 또는 뉴클레오타이드 대용물로 대체되는, 핵산을 모방할 수 있는 스캐폴드가 또한 작제될 수 있다. 일 구현예에서, 핵염기는 대용물 백본에 의해 테터링될 수 있다. 예는, 제한없이, 모르폴리노, 사이클로부틸, 피롤리딘 및 펩타이드 핵산(PNA) 뉴클레오사이드 대용물을 포함할 수 있다.

당 변형

변형된 뉴클레오사이드 및 변형된 뉴클레오타이드는 당기에 대한 하나 이상의 변형을 포함할 수 있다. 예를 들어, 2' 하이드록실기(OH)는 다수의 상이한 "옥시" 또는 "데옥시" 치환기로 대체되거나 변형될 수 있다. 일 구현예에서, 2' 하이드록실기에 대한 변형은, 하이드록실이 더 이상 탈양자화되어 2'-알콕사이드 이온을 형성할 수 없으므로, 핵산의 안정성을 향상시킬 수 있다. 2'-알콕사이드는 링커 인 원자 상에서 분자내 친핵성 공격에 의한 분해를 촉진시킬 수 있다.

"옥시"-2' 하이드록실기 변형의 예는 알콕시 또는 아릴옥시(OR, 여기서 "R"은, 예를 들어, 알킬, 사이클로알킬, 아릴, 아르알킬, 헤테로아릴 또는 당일 수 있음); 폴리에틸렌글리콜(PEG), O(CH₂CH₂O)_nCH₂CH₂OR(여기서, R은 예를 들어, H 또는 선택적으로 치환된 알킬일 수 있고, n은 0 내지 20(예를 들어, 0 내지 4, 0 내지 8, 0 내지 10, 0 내지 16, 1 내지 4, 1 내지 8, 1 내지 10, 1 내지 16, 1 내지 20, 2 내지 4, 2 내지 8, 2 내지 10, 2 내지 16, 2 내지 20, 4 내지 8, 4 내지 10, 4 내지 16, 및 4 내지 20)의 정수일 수 있음)을 포함할 수 있다. 구현예에서, "옥시"-2' 하이드록실기 변형은 "잠금(locked)" 핵산(LAN)을 포함할 수 있으며, 여기서 2' 하이드록실은, 예를 들어, C_1-6 알킬렌 또는 C_1-6 헤테로알킬렌 가교에 의해, 동일한 리보스 당의 4' 탄소에 연결될 수 있으며, 여기서 예시적인 가교는 메틸렌, 프로필렌, 에테르, 또는 아미노 가교; O-아미노(여기서, 아미노는 예를 들어, NH₂; 알킬아미노, 디알킬아미노, 헤테로사이클릴, 아릴아미노, 디아릴아미노, 헤테로아릴아미노, 또는 디헤테로아릴아미노, 에틸렌디아민, 또는 폴리아미노) 및 아미노알콕시, O(CH₂)_n-아미노(여기서, 아미노는, 예를 들어, NH₂; 알킬아미노, 디알킬아미노, 헤테로사이클릴, 아릴아미노, 디아릴아미노, 헤테로아릴아미노, 또는 디헤테로아릴아미노, 에틸렌디아민, 또는 폴리아미노)를 포함할 수 있다. 일 구현예에서, "옥시"-2' 하이드록실기 변형은 메톡시에틸기(MOE)(OCH₂CH₂OCH₃, 예를 들어, PEG 유도체)를 포함할 수 있다.

"데옥시" 변형은 수소(즉, 데옥시리보스 당, 예를 들어, 부분적으로 ds RNA의 오버행 부분에서); 할로(예를 들어, 브로모, 클로로, 플루오로, 또는 요오도); 아미노(여기서, 아미노는, 예를 들어, NH₂; 알킬아미노, 디아킬아미노, 헤테로사이클릴, 아릴아미노, 디아릴아미노, 헤테로아릴아미노, 디헤테로아릴아미노, 또는 아미노산일 수 있음); NH(CH₂CH₂NH)_nCH₂CH₂-아미노(여기서, 아미노는, 예를 들어, 본 명세서에 기재된 바와 같을 수 있음), -NHC(O)R(여기서, R은, 예를 들어, 알킬, 사이클로알킬, 아릴, 아르알킬, 헤테로아릴 또는 당일 수 있음), 시아노; 메르캅토; 알킬-티오-알킬; 티오알콕시; 및 알킬, 사이클로알킬, 아릴, 알케닐 및 알키닐을 포함할 수 있으며, 이는 예를 들어, 본 명세서에 기재된 아미노로 선택적으로 치환될 수 있다.

당기는 또한 리보스 중 상응하는 탄소와 반대의 위치화학 입체구조를 가지는 하나 이상의 탄소를 포함할 수 있다. 따라서, 변형된 핵산은, 당으로서 예를 들어, 아라비노스를 포함하는 뉴클레오타이드를 포함할 수 있다. 뉴클레오타이드 "단량체"는 당의 1' 위치에서 알파 연결, 예를 들어, 알파-뉴클레오사이드를 가질 수 있다. 변형된 핵산은 또한 "비염기성" 당을 포함할 수 있으며, 상기 비염기성 당은 C-1'에서 핵염기가 없다. 이러한 비염기성 당은 또한 구성하는 당 원자 중 하나 이상에서 추가로 변형될 수 있다. 변형된 핵산은 또한 L 형태인 하나 이상의 당, 예를 들어, L-뉴클레오사이드를 포함할 수 있다.

일반적으로, RNA는 당기 리보스를 포함하며, 당기 리보스는 산소를 가지는 5-원 고리이다. 예시적인 변형된 뉴클레오사이드 및 변형된 뉴클레오타이드는 제한없이 리보스 중 산소의 (예를 들어, 황(S), 셀레늄(Se), 또는 알킬렌, 예를 들어, 메틸렌 또는 에틸렌으로의) 대체; 이중 결합의 첨가(예를 들어, 리보스를 사이클로펜테닐 또는 사이클로헥세닐로 대체); 리보스의 고리 축소(예를 들어, 사이클로부탄 또는 옥세탄의 4-원 고리 형성); 리보스의 고리 확장(예를 들어, 추가적인 탄소 또는 헤테로원자를 가지는 6-원 또는 7-원 고리, 예를 들어, 안하이드로헥시톨, 알트리톨, 만니톨, 사이클로헥사닐, 사이클로헥세닐, 및 모르폴리노(이는 또한 포스포르아미데이트 백본을 가짐) 형성)을 포함할 수 있다. 일 구현예에서, 변형된 뉴클레오타이드는 멀티사이클릭 형태(예를 들어, 트리사이클로); 및 "비잠금(unlocked)" 형태, 예컨대 글리콜 핵산(GNA)(예를 들어, R-GNA 또는 S-GNA, 여기서 리보스는 포스포디에스테르 결합에 부착된 글리콜 단위에 의해 대체됨), 트레오스 핵산(TNA, 여기서 리보스는 α-L-트레오푸르노실-(3'→2')로 대체됨)을 포함할 수 있다.

핵염기 상의 변형

변형된 핵산으로 혼입될 수 있는, 본 명세서에 기재된 변형된 뉴클레오사이드 및 변형된 뉴클레오타이드는, 변형된 핵염기를 포함할 수 있다. 핵염기의 예는 아데신(A), 구아닌(G), 시토신(C), 및 우라실(U)을 포함하지만, 이로 제한되는 것은 아니다. 이들 핵염기는 변형되거나 완전히 대체되어 변형된 핵산에 혼입될 수 있는 변형된 뉴클로오타이드 및 변형된 뉴클레오사이드를 제공할 수 있다. 뉴클레오타이드의 핵염기는 퓨린, 피리미딘, 퓨린 또는 피리미딘 유사체로부터 독립적으로 선택될 수 있다. 일 구현예에서, 핵염기는, 예를 들어 염기의 자연-발생 및 합성 유도체를 포함할 수 있다.

우라실

일 구현예에서, 변형된 핵염기는 변형된 우라실이다. 변형된 우라실을 가지는 예시적인 뉴클레오사이드 및 핵염기는 제한 없이, 슈도우리딘(Ψ), 피리딘-4-온 리보뉴클레오사이드, 5-아자-우리딘, 6-아자-우리딘, 2-티오-5-아자-우리딘, 2-티오-우리딘(s2U), 4-티오-우리딘(s4U), 4-티오-슈도우리딘, 2-티오-슈도우리딘, 5-하이드록시-우리딘(ho⁵U), 5-아미노알릴-우리딘, 5-할로-우리딘(예를 들어, 5-요오도-우리딘 또는 5-브로모-우리딘), 3-메틸-우리딘(m³U), 5-메톡시-우리딘(mo⁵U), 우리딘 5-옥시아세트산(cmo⁵U), 우리딘 5-옥시아세트산 메틸 에스테르(mcmo⁵U), 5-카르복시메틸-우리딘(cm⁵U), 1-카르복시메틸-슈도우리딘, 5-카르복시하이드록시메틸-우리딘(chm⁵U), 5-카르복시하이드록시메틸-우리딘 메틸 에스테르(mchm⁵U), 5-메톡시카르보닐메틸-우리딘(mcm⁵U), 5-메톡시카르보닐메틸-2-티오-우리딘(mcm⁵s2U), 5-아미노메틸-2-티오-우리딘(nm⁵s2U), 5-메틸아미노메틸-우리딘(mnm⁵U), 5-메틸아미노메틸-2-티오-우리딘(mnm⁵s2U), 5-메틸아미노메틸-2-셀레노-우리딘(mnm⁵se²U), 5-카르바모일메틸-우리딘(ncm⁵U), 5-카르복시메틸아미노메틸-우리딘(cmnm⁵U), 5-카르복시메틸아미노메틸-2-티오-우리딘(cmnm⁵s2U), 5-프로피닐-우리딘, 1-프로피닐-슈도우리딘, 5-타우리노메틸-우리딘(τcm⁵U), 1-타우리노메틸-슈도우리딘, 5-타우리노메틸-2-티오-우리딘(τm⁵s2U), 1-타우리노메틸-4-티오-슈도우리딘, 5-메틸-우리딘(m⁵U, 즉 핵염기 데옥시티민을 가짐), 1-메틸-슈도우리딘(m¹ψ), 5-메틸-2-티오-우리딘(m⁵s2U), 1-메틸-4-티오-슈도우리딘(m¹s⁴ψ), 4-티오-1-메틸-슈도우리딘, 3-메틸-슈도우리딘(m³ψ), 2-티오-1-메틸-슈도우리딘, 1-메틸-1-데아자-슈도우리딘, 2-티오-1-메틸-1-데아자-슈도우리딘, 디하이드로우리딘(D), 디하이드로슈도우리딘, 5,6-디하이드로우리딘, 5-메틸-디하이드로우리딘(m⁵D), 2-티오-디하이드로우리딘, 2-티오-디하이드로슈도우리딘, 2-메톡시-우리딘, 2-메톡시-4-티오-우리딘, 4-메톡시-슈도우리딘, 4-메톡시-2-티오-슈도우리딘, N1-메틸-슈도우리딘, 3-(3-아미노-3-카르복시프로필)우리딘(acp³U), 1-메틸-3-(3-아미노-3-카르복시프로필)슈도우리딘(acp³ψ), 5-(이소펜테닐아미노메틸)우리딘(inm⁵U), 5-(이소펜테닐아미노메틸)-2-티오-우리딘(inm⁵s2U), α-티오-우리딘, 2'-O-메틸-우리딘(Um), 5,2'-O-디메틸-우리딘(m⁵Um), 2'-O-메틸-슈도우리딘(ψm), 2-티오-2'-O-메틸-우리딘(s2Um), 5-메톡시카르보닐메틸-2'-O-메틸-우리딘(mcm⁵Um), 5-카르바모일메틸-2'-O-메틸-우리딘(ncm⁵Um), 5-카르복시메틸아미노메틸-2'-O-메틸-우리딘(cmnm⁵Um), 3,2'-O-디메틸-우리딘(m³Um), 5-(이소펜테닐아미노메틸)-2'-O-메틸-우리딘(inm⁵Um), 1-티오-우리딘, 데옥시티미딘, 2'-F-아라-우리딘, 2'-F-우리딘, 2'-OH-아라-우리딘, 5-(2-카르보메톡시비닐) 우리딘, 5-[3-(1-E-프로페닐아미노)우리딘, 피라졸로[3,4-d]피리미딘, 잔틴, 및 하이포잔틴을 포함한다.

시토신

일 구현예에서, 변형된 핵염기는 변형된 시토신이다. 변형된 시토신을 가지는 예시적인 뉴클레오사이드 및 핵염기는 제한 없이, 5-아자-시티딘, 6-아자-시티딘, 슈도이소시티딘, 3-메틸-시티딘(m³C), N4-아세틸-시티딘(act), 5-포르밀-시티딘(f⁵C), N4-메틸-시티딘(m⁴C), 5-메틸-시티딘(m⁵C), 5-할로-시티딘(예를 들어, 5-요오도-시티딘), 5-하이드록시메틸-시티딘(hm⁵C), 1-메틸-슈도이소시티딘, 피롤로-시티딘, 피롤로-슈도이소시티딘, 2-티오-시티딘(s2C), 2-티오-5-메틸-시티딘, 4-티오-슈도이소시티딘, 4-티오-1-메틸-슈도이소시티딘, 4-티오-1-메틸-1-데아자-슈도이소시티딘, 1-메틸-1-데아자-슈도이소시티딘, 제부라린, 5-아자-제부라린, 5-메틸-제부라린, 5-아자-2-티오-제부라린, 2-티오-제부라린, 2-메톡시-시티딘, 2-메톡시-5-메틸-시티딘, 4-메톡시-슈도이소시티딘, 4-메톡시-1-메틸-슈도이소시티딘, 라이시딘(k²C), α-티오-시티딘, 2'-O-메틸-시티딘(Cm), 5,2'-O-디메틸-시티딘(m⁵Cm), N4-아세틸-2'-O-메틸-시티딘(ac⁴Cm), N4,2'-O-디메틸-시티딘(m⁴Cm), 5-포르밀-2'-O-메틸-시티딘(f⁵Cm), N4,N4,2'-O-트리메틸-시티딘(m⁴ ₂Cm), 1-티오-시티딘, 2'-F-아라-시티딘, 2'-F-시티딘, 및 2'-OH-아라-시티딘을 포함한다.

아데닌

일 구현예에서, 변형된 핵염기는 변형된 아데닌이다. 변형된 아데닌을 가지는 예시적인 뉴클레오사이드 및 핵염기는, 제한 없이, 2-아미노-퓨린, 2,6-디아미노퓨린, 2-아미노-6-할로-퓨린(예를 들어, 2-아미노-6-클로로-퓨린), 6-할로-퓨린(예를 들어, 6-클로로-퓨린), 2-아미노-6-메틸-퓨린, 8-아지도-아데노신, 7-데아자-아데노신, 7-데아자-8-아자-아데노신, 7-데아자-2-아미노-퓨린, 7-데아자-8-아자-2-아미노-퓨린, 7-데아자-2,6-디아미노퓨린, 7-데아자-8-아자-2,6-디아미노퓨린, 1-메틸-아데노신(m¹A), 2-메틸-아데노신(m²A), N6-메틸-아데노신(m⁶A), 2-메틸티오-N6-메틸-아데노신(ms2m⁶A), N6-이소펜테닐-아데노신(i⁶A), 2-메틸티오-N6-이소펜테닐-아데노신(ms²i⁶A), N6-(cis-하이드록시이소펜테닐)아데노신(io⁶A), 2-메틸티오-N6-(cis-하이드록시이소펜테닐)아데노신(ms2io⁶A), N6-글리시닐카르바모일-아데노신(g⁶A), N6-트레오닐카르바모일-아데노신(t⁶A), N6-메틸-N6-트레오닐카르바모일-아데노신(m⁶t⁶A), 2-메틸티오-N6-트레오닐카르바모일-아데노신(ms²g⁶A), N6,N6-디메틸-아데노신(m⁶ ₂A), N6-하이드록시노르발릴카르바모일-아데노신(hn⁶A), 2-메틸티오-N6-하이드록시노르발릴카르바모일-아데노신(ms2hn⁶A), N6-아세틸-아데노신(ac⁶A), 7-메틸-아데노신, 2-메틸티오-아데노신, 2-메톡시-아데노신, α-티오-아데노신, 2'-O-메틸-아데노신(Am), N⁶,2'-O-디메틸-아데노신(m⁶Am), N⁶-메틸-2'-데옥시아데노신, N6,N6,2'-O-트리메틸-아데노신(m⁶ ₂Am), 1,2'-O-디메틸-아데노신(m¹Am), 2'-O-리보실아데노신(포스페이트)(Ar(p)), 2-아미노-N6-메틸-퓨린, 1-티오-아데노신, 8-아지도-아데노신, 2'-F-아라-아데노신, 2'-F-아데노신, 2'-OH-아라-아데노신, 및 N6-(19-아미노-펜타옥사논아데실)-아데노신을 포함한다.

구아닌

일 구현예에서, 변형된 핵염기는 변형된 구아닌이다. 변형된 구아닌을 가지는 예시적인 뉴클레오사이드 및 핵염기는 제한 없이, 이노신(I), 1-메틸-이노신(m¹I), 와이오신(imG), 메틸와이오신(mimG), 4-데메틸-와이오신(imG-14), 이소와이오신(imG2), 와이부토신(yW), 퍼옥시와이부토신(o₂yW), 하이드록시와이부토신(OHyW), 저변형 하이드록시와이부토신(OHyW^*), 7-데아자-구아노신, 케오신(Q), 에폭시케오신(oQ), 갈락토실-케오신(galQ), 만노실-케오신(manQ), 7-시아노-7-데아자-구아노신(preQ₀), 7-아미노메틸-7-데아자-구아노신(preQ₁), 아케오신(G⁺), 7-데아자-8-아자-구아노신, 6-티오-구아노신, 6-티오-7-데아자-구아노신, 6-티오-7-데아자-8-아자-구아노신, 7-메틸-구아노신(m⁷G), 6-티오-7-메틸-구아노신, 7-메틸-이노신, 6-메톡시-구아노신, 1-메틸-구아노신(m'G), N2-메틸-구아노신(m²G), N2,N2-디메틸-구아노신(m² ₂G), N2,7-디메틸-구아노신(m²,7G), N2, N2,7-디메틸-구아노신(m²,2,7G), 8-옥소-구아노신, 7-메틸-8-옥소-구아노신, 1-메틸-6-티오-구아노신, N2-메틸-6-티오-구아노신, N2,N2-디메틸-6-티오-구아노신, α-티오-구아노신, 2'-O-메틸-구아노신(Gm), N2-메틸-2'-O-메틸-구아노신(m²Gm), N2,N2-디메틸-2'-O-메틸-구아노신(m² ₂Gm), 1-메틸-2'-O-메틸-구아노신(m'Gm), N2,7-디메틸-2'-O-메틸-구아노신(m²,7Gm), 2'-O-메틸-이노신(Im), 1,2'-O-디메틸-이노신(m'Im), O⁶-페닐-2'-디옥시이노신, 2'-O-리보실구아노신(포스페이트)(Gr(p)), 1-티오-구아노신, O⁶-메틸-구아노신, O⁶-메틸-2'-데옥시구아노신, 2'-F-아라-구아노신, 및 2'-F-구아노신을 포함한다.

예시적인 변형된 gRNA

특정 구현예에서, 본 명세서에 기재된 바와 같은 변형된 핵산은 변형된 gRNA일 수 있다. 본 명세서에 기재된 gRNA 중 임의의 것이 본 명세서에 기재된 바와 같이 변형될 수 있음을 이해해야 한다.

실험(결과 미도시)을 통하여, gRNA가 5' 말단에서 또는 그 근처에서 변형되는 경우(예를 들어, gRNA의 5' 말단이 진핵 mRNA 캡 구조 또는 캡 유사체의 포함에 의해 변형되는 경우) CRISPR/Cas 시스템의 gRNA 구성성분이 T 세포에서의 유전자의 교정에 더욱 효율적인 것이 밝혀졌다. 이론에 구속되지 않고, 본 명세서에 기재된 이들 및 다른 변형된 gRNA가 특정 순환 세포 유형(예를 들어, T 세포)로부터 감소된 고유 면역 반응을 야기하며, 이러한 감소된 반응이 관찰되는 개선의 원인인 수 있는 것으로 여겨진다. 본 발명은 gRNA에 대한 순환 세포(예를 들어, T 세포)의 고유 면역 반응을 최소화시키는 것이 순환하는 세포(생체외이든 생체내이든)를 교정하기 위하여 gRNA를 사용하는 경우에 유리할 수 있으며, 비-순환 세포를 교정하기 위하여 gRNA를 사용하는 경우, 예를 들어, gRNA가 생체내 유전자 교정 목적을 위하여 전신으로 또는 국소로 투여되는 경우에도 또한 유리할 수 있다는 인식을 포함한다. 또한, 본 발명은 5' 캡핑 gRNA로 관찰되는 개선이 (예를 들어, 변형된 뉴클레오사이드 또는 뉴클레오타이드의 포함에 의해 또는 시험관내 전사된 gRNA가 포스파타제, 예를 들어, 송아지 장 알칼리성 포스파타제로 처리하여, 5' 트리포스페이트기를 제거함으로써 변형되는 경우) 동일한 유형의 구조적 또는 기능적 결과를 달성하기 위하여 다른 방식으로 변형될 수 있는 gRNA로 연장될 수 있다는 인식을 포함한다. 이론에 구속되지 않고, 특정 구현예에서, 본 명세서에 기재된 변형된 gRNA는 (예를 들어, 변형된 뉴클레오사이드 또는 뉴클레오타이드 및/또는 3' 폴리A 트랙트의 포함에 의해) 뉴클레아제에 대한 안정성을 도입하는 하나 이상의 변형(예를 들어, 변형된 뉴클레오사이드 또는 뉴클레오타이드)을 함유할 수 있다.

따라서, 특정 구현예에서, 본 명세서에 제공된 조성물 및 방법은 본 명세서에 기재된 바와 같은 하나 이상의 변형된 뉴클레오사이드 또는 뉴클레오타이드를 포함하는 gRNA를 사용한다. 이들 중 특정 구현예에서, 하나 이상의 변형된 뉴클레오사이드 또는 뉴클레오타이드의 포함은 gRNA가 다르게 비변형된 gRNA에 비하여 특정 순환 세포 유형(예를 들어, T 세포, 대식세포, 수지상 세포 및/또는 B 세포)에서 감소된 선천 면역 반응을 유도하게 한다.

특정 구현예에서, 본 명세서에 제공되는 조성물 및 방법에 사용하기 위한 gRNA는 그의 5' 말단에서 또는 그 근처에서(예를 들어, 그의 5' 말단의 1개 내지 10개, 1개 내지 5개 또는 1개 내지 2개 뉴클레오타이드 이내) 변형된다. 특정 구현예에서, gRNA는 진핵 mRNA 캡 구조 또는 캡 유사체(예를 들어, G(5')ppp(5')G 캡 유사체, m7G(5')ppp(5')G 캡 유사체 또는 3'-O-Me-m7G(5')ppp(5')G 안티 리버스 캡 유사체(ARCA))의 포함에 의해 변형된다. 캡 또는 캡 유사체는 gRNA의 화학적 합성 또는 시험관내 전사 동안 혼입될 수 있다. 특정 구현예에서, 시험관내 전사된 gRNA를 포스파타제(예를 들어, 송아지 장 알칼리성 포스파타제)로의 처리에 의해 변형시켜, 5' 트리포스페이트기를 제거한다.

특정 구현예에서, 본 명세서에 제공되는 조성물 및 방법에 사용하기 위한 gRNA는 그의 3' 말단에서 또는 그 근처에서(예를 들어, 그의 3' 말단의 1개 내지 10개, 1개 내지 5개 또는 1개 내지 2개 뉴클레오타이드 이내) 변형된다.

일 구현예에서, gRNA의 3' 말단은 하나 이상의(예를 들어, 25개 내지 200개의) 아데닌(A) 잔기의 부가에 의해 변형된다. 폴리A 트랙트는 gRNA를 인코딩하는 핵산(예를 들어, 플라스미드, PCR 산물, 바이러스 게놈)에 함유되거나, 화학적 합성 동안 또는 폴리아데노신 중합효소(예를 들어, 에스케리키아 콜라이(E. coli) 폴리(A) 중합효소)를 사용한 시험관내 전사 후에 gRNA에 부가될 수 있다.

특정 구현예에서, 본 명세서에 제공되는 조성물 및 방법에 사용하기 위한 gRNA는 그의 5' 말단에서의 또는 그 근처에서의 변형 및 그의 3' 말단에서의 또는 그 근처에서의 변형 둘 모두를 포함한다.

특정 구현예에서, 시험관내 전사되는 gRNA는 5' 캡 구조 또는 캡 유사체 및 3' 폴리A 트랙트를 함유한다. 일 구현예에서, 시험관내 전사된 gRNA를 포스파타제(예를 들어, 송아지 장 알칼리성 포스파타제)로 처리함으로써 변형시켜, 5' 트리포스페이트기를 제거하며, 3' 폴리A 트랙트를 포함한다.

일부 구현예에서, gRNA는 3' 말단 U 리보스에서 변형될 수 있다. 예를 들어, U 리보스의 2개의 말단 하이드록실기는 알데하이드기로 산화되고 리보스 고리의 부수적인 개환이 일어나 하기에 나타낸 바와 같은 변형된 뉴클레오사이드를 제공할 수 있다:

상기 식에서, "U"는 비변형 또는 변형된 우리딘일 수 있다.

또 다른 구현예에서, 3' 말단 U는 하기에 나타낸 바와 같은 2'3' 사이클릭 포스페이트로 변형될 수 있다:

상기 식에서, "U"는 비변형 또는 변형된 우리딘일 수 있다.

일부 구현예에서, gRNA 분자는, 예를 들어, 본 명세서에 기재된 변형된 뉴클레오타이드 중 하나 이상을 혼입함으로써, 분해에 대하여 안정화될 수 있는 3' 뉴클레오타이드를 포함할 수 있다. 이 구현예에서, 예를 들어, 우리딘은 변형된 우리딘, 예를 들어, 5-(2-아미노)프로필 우리딘, 및 5-브로모 우리딘으로, 또는 본 명세서에 기재된 변형된 우리딘 중 임의의 것으로 대체될 수 있으며; 아데노신 및 구아노신은 변형된 아데노신 및 구아노신으로, 예를 들어, 8-위치에서의 변형, 예를 들어, 8-브로모 구아노신으로, 또는 본 명세서에 기재된 변형된 아데노신 또는 구아노신 중 임의의 것으로 대체될 수 있다.

일부 구현예에서, 당-변형된 리보뉴클레오타이드는 gRNA 내로 혼입될 수 있으며, 예를 들어, 2' OH-기는 H, -OR, -R(여기서, R은 예를 들어, 알킬, 사이클로알킬, 아릴, 아르알킬, 헤테로아릴 또는 당일 수 있음), 할로, -SH, -SR(여기서, R은 예를 들어, 알킬, 사이클로알킬, 아릴, 아르알킬, 헤테로아릴 또는 당일 수 있음), 아미노(여기서, 아미노는 예를 들어, NH₂; 알킬아미노, 디알킬아미노, 헤테로사이클릴, 아릴아미노, 디아릴아미노, 헤테로아릴아미노, 디헤테로아릴아미노 또는 아미노산일 수 있음); 또는 시아노(-CN)로부터 선택되는 기로 대체된다. 일부 구현예에서, 포스페이트 백본은 본 명세서에 기재된 바와 같이, 예를 들어, 포스포티오에이트기로 변형될 수 있다. 일부 구현예에서, gRNA의 뉴클레오타이드 중 하나 이상은 각각 독립적으로 변형된 2'-당, 예를 들어, 변형된 2'-O-메틸, 2'-O-메톡시에틸 또는 2'-플루오로, 예를 들어, 2'-F 또는 2'-O-메틸, 아데노신(A), 2'-F 또는 2'-O-메틸, 시티딘(C), 2'-F 또는 2'-O-메틸, 우리딘(U), 2'-F 또는 2'-O-메틸, 티미딘(T), 2'-F 또는 2'-O-메틸, 구아노신(G), 2'-O-메톡시에틸-5-메틸우리딘(Teo), 2'-O-메톡시에틸아데노신(Aeo), 2'-O-메톡시에틸-5-메틸시티딘(m5Ceo) 및 이들의 임의의 조합을 포함하나 이들에 한정되지 않는 변형된 또는 비변형 뉴클레오타이드일 수 있다.

일부 구현예에서, gRNA는 "잠금" 핵산(LNA)을 포함할 수 있으며, 여기서 2' OH-기는, 예를 들어, C1-6 알킬렌 또는 C1-6 헤테로알킬렌 가교에 의해, 동일한 리보스 당의 4' 탄소에 연결될 수 있으며, 여기서 예시적인 가교는 메틸렌, 프로필렌, 에테르, 또는 아미노 가교; O-아미노(여기서, 아미노는 예를 들어, NH₂; 알킬아미노, 디알킬아미노, 헤테로사이클릴, 아릴아미노, 디아릴아미노, 헤테로아릴아미노, 또는 디헤테로아릴아미노, 에틸렌디아민, 또는 폴리아미노일 수 있음) 및 아미노알콕시, O(CH₂)_n-아미노(여기서, 아미노는, 예를 들어, NH₂; 알킬아미노, 디알킬아미노, 헤테로사이클릴, 아릴아미노, 디아릴아미노, 헤테로아릴아미노, 또는 디헤테로아릴아미노, 에틸렌디아민, 또는 폴리아미노일 수 있음)를 포함할 수 있다.

일부 구현예에서, gRNA는 멀티사이클릭(예를 들어, 트리사이클로); 및 "비잠금" 형태, 예컨대 글리콜 핵산(GNA)(예를 들어, R-GNA 또는 S-GNA, 여기서 리보스는 포스포디에스테르 결합에 부착된 글리콜 단위에 의해 대체됨) 또는 트레오스 핵산(TNA, 여기서 리보스는 α-L-트레오푸라노실-(3'→2')로 대체됨)인 변형된 뉴클레오티드를 포함할 수 있다.

일반적으로, gRNA 분자는 산소를 갖는 5-원 고리인 당기 리보스를 포함한다. 예시적인 변형된 gRNA는 제한 없이 리보스에서의 (예를 들어, 황(S), 셀레늄(Se) 또는 알킬렌, 예를 들어, 메틸렌 또는 에틸렌으로의) 산소의 대체; 이중 결합의 부가(예를 들어, 리보스를 사이클로펜테닐 또는 사이클로헥세닐로 대체); 리보스의 고리 축소(예를 들어, 사이클로부탄 또는 옥세탄의 4-원 고리를 형성); 리보스의 고리 확장(예를 들어, 추가적인 탄소 또는 헤테로원자를 가지는 6-원 또는 7-원 고리, 예를 들어, 안하이드로헥시톨, 알트리톨, 만니톨, 사이클로헥사닐, 사이클로헥세닐, 및 모르폴리노(이는 또한 포스포르아미데이트 백본을 가짐)를 형성)을 포함할 수 있다. 당 유사체 변경의 대다수가 2' 위치에 국소화되지만, 4' 위치를 포함하는 다른 부위는 변형되기 쉽다. 일 구현예에서, gRNA는 4'-S, 4'-Se 또는 4'-C-아미노메틸-2'-O-Me 변형을 포함한다.

일부 구현예에서, 데아자 뉴클레오타이드, 예를 들어, 7-데아자-아데노신은 gRNA 내로 혼입될 수 있다. 일부 구현예에서, O- 및 N-알킬화 뉴클레오타이드, 예를 들어, N6-메틸 아데노신은 gRNA 내로 혼입될 수 있다. 일부 구현예에서, gRNA 분자 내의 하나 이상의 또는 모든 뉴클레오타이드는 데옥시뉴클레오타이드이다.

miRNA 결합 부위

마이크로RNA(또는 miRNA)는 자연 발생 세포 19개 내지 25개 뉴클레오타이드 길이의 비코딩 RNA이다. 그들은 예를 들어, mRNA의 3' UTR에 적절한 miRNA 결합 부위를 갖는 핵산 분자에 결합하며, 유전자 발현을 하향 조절한다. 이론에 구속되지 않고, 핵산 분자 안정성을 감소시키거나 번역을 억제함으로써 이러한 하향 조절이 발생하는 것으로 여겨진다. 본 명세서에 개시된 RNA 종, 예를 들어, Cas9를 인코딩하는 mRNA는 예를 들어, 그의 3'UTR에 miRNA 결합 부위를 포함할 수 있다. miRNA 결합 부위는 선택된 세포 유형에서 발현의 하향 조절을 촉진시키도록 선택될 수 있다.

실시예

하기 실시예는 단지 예시하는 것이고, 본 발명의 범주 또는 내용을 어떠한 방식으로든 제한하는 것으로 의도되지 않는다.

실시예 1: Cas9 리보핵단백질 복합체의 생물물리학적 특성화 및 직접적인 전달

Cas9 리보핵단백질(RNP) 복합체의 직접적인 전달을 효율적인 유전자 교정을 가능하게 하면서, 세포에서 Cas9 단백질의 신속한 전환으로 인해 표적외 활성을 최소화시킨다. RNP 전달에 의해 매개되는 유전자 교정의 효율은 유전자좌마다 달라지며, gRNA의 길이 및 전달되는 Cas9 단백질 및 gRNA의 양과 비에 좌우된다.

gRNA와 함께 Cas9 복합체의 구조적 및 생물물리학적 특성화에 의해, 큰 접촉 영역 및 높은 친화성이 드러났다. 열 용융 곡선은 복합체의 결합 및 안정성을 검출하는데 유용한 특성이다. 아포-Cas9 분자(즉, gRNA 분자의 부재 하의 Cas9 분자)로부터 gRNA와 복합체화된 Cas9 분자까지의 용융 온도의 큰 증가를 사용하여, gRNA에 대한 Cas9의 친화성을 특성화하였다. 상이한 길이의 다수의 gRNA를 상이한 화학량론에서 Cas9와 복합체화시키고, 열 변화(예를 들어, 용융 온도의 변화)를 사용하여 상호작용을 측정하였다. 그 다음, 이들 생물물리학적으로 특성화된 복합체를 293T 세포 내로 트랜스펙션시키고, 생성된 삽입결실의 효율을 측정하였다. gRNA 길이 및 염기 조성의 미묘한 차이가 RNP 복합체의 결합 및 형성에 영향을 미치는 것으로 나타났다. 결합 친화성과 게놈 교정의 효율의 상관관계는 예를 들어, 양이온성 지질 매개 직접 전달을 위한 최적의 조성의 RNP의 설계를 가능하게 한다.

DSF에 의한 Cas9 분자 및 Cas9 분자/gRNA 분자 복합체의 평가

스타필로코커스 아우레우스 및 스트렙토코커스 피오게네스 Cas9 분자를 재조합에 의해 발현시키고, Ni 친화성 크로마토그래피, SP 세파로스 및 슈퍼덱스(Superdex) 200을 사용하여 정제하였다.

DSF를 사용하여, gRNA 분자의 부재 하의, 정제된 스타필로코커스 아우레우스 및 스트렙토코커스 피오게네스 Cas9 분자의 안정성을 시험하였다. 반응 혼합물은 10 ㎕ 부피에 5 μM Cas9 분자 및 5x SYPRO 오렌지®(라이프 테크놀로지즈 카탈로그 번호 S-6650)를 함유하였다. 기울기를 1분 동안 20℃에 이어서, 10초마다 1℃ 증분식으로 20℃에서 95℃까지 전개시켰다. 형광 신호의 도함수를 온도에 대하여 플롯팅하고, 비폴딩 전이(T_m)에 대한 온도 중간점을 결정하였다. 도 9a 및 도 9b에 나타낸 바와 같이, 스타필로코커스 아우레우스 Cas9 분자(T_m = 36℃)는 스트렙토코커스 피오게네스 Cas9 분자(T_m = 40℃)보다 덜 안정적이었다.

또한, DSF를 사용하여 Cas9 분자/gRNA 분자 복합체를 시험하였다. 단독의 스트렙토코커스 피오게네스 Cas9, 1 μM 스트렙토코커스 피오게네스 gRNA와 함께 스트렙토코커스 피오게네스 Cas9 및 1 μM 스타필로코커스 아우레우스 gRNA와 함께 스트렙토코커스 피오게네스 Cas9를 H150(10 mM Hepes pH 7.5, 150 mM NaCl)에서 시험하였다. 이들 실험에 사용되는 gRNA 분자를 인코딩하는 DNA 서열은 하기와 같았다:

스트렙토코커스 피오게네스 gRNA:

GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTT(서열번호 206); 및

스타필로코커스 아우레우스 gRNA:

GTTTTAGTACTCTGGAAACAGAATCTACTAAAACAAGGCAAAATGCCGTGTTTATCTCGTCAACTTGTTGGCGAGATTTT(서열번호 207).

도 10에 나타낸 바와 같이, 스트렙토코커스 피오게네스 Cas9의 열 변성은 42℃였으며, 50℃로의 열 변화가 공존 gRNA 분자의 존재 하에 관찰되었다. 그러나, 스트렙토코커스 피오게네스 Cas9를 맞지 않는 gRNA 분자와 인큐베이션시키는 경우 변화가 관찰되지 않았다. 이들 결과에 의해, Cas9 분자/gRNA 분자 복합체 형성이 열 변화와 상호연관이 있을 수 있음이 뒷받침된다.

Jurkat T 세포로의 Cas9 분자/gRNA 분자 복합체의 전달

Cas9 및 gRNA는 1:25 비로 존재하였다. gRNA 작제물을 PCR 프로토콜을 사용하여 생성하였다. gRNA를 시험관내 전사하고 캡핑하고(예를 들어, 5' 안티-리버스 캡 유사체(ARCA) 캡) 및 테일링시켰다(예를 들어, 3' 폴리A 테일). 도 11a에 나타낸 바와 같이, gRNA 결합은 32℃로부터 46℃까지의 T_m 변화를 유도하였다. Cas9/gRNA 복합체를 Jurkat T 세포에 전달하였다. 도 11b는 세포의 약 20%가 CD3 마커를 소실한 것을 나타낸다.

실시예 2: 시험관내 전사 또는 화학적 합성으로부터의 gRNA 분자의 비교

DSF를 사용하여, Cas9 분자/gRNA 분자 복합체의 성공적인 형성을 분석하고, 3가지 방법 또는 공급처로부터 수득되는 gRNA 분자의 질과 무결성을 비교하였다.

표 6의 것들에 상응하는 서열을 갖는 gRNA 분자를 15 내지 50 ㎍ 규모로 수득하였다.

4 μM에서 정제된 Cas9 단백질을 H150 완충제(10 mM Hepes pH 7.5, 150 mM NaCl) 중에 실온에서 등몰량의 gRNA와 복합체화하였다. 그 다음, Cas9 분자/gRNA 분자 복합체(RNP)를 함유하는 이러한 반응물의 일부를 리포펙타민-2000 트랜스펙션 시약을 사용하여 HEK293FT 세포 내로 트랜스펙션시켰다. 100 nM의 RNP를 모든 경우에 가이드 공급처와 무관하게 사용하였다. 각각의 경우에, RNP의 나머지를 H150 완충제에 1 μM로 희석하고, SYPRO 오렌지를 5000X 원액으로부터 5X의 최종 농도로 첨가하고, DSF 분석을 본 명세서에 기재된 분석 1에 따라 수행하였다. 삽입결실 정량화를 본 명세서에 기재된 프로토콜에 따라 수행하였다.

실험의 결과는 표 6에 요약되어 있다. 델타 T_m을 42℃에서 용융하는 Cas9 단백질과 비교하였다. 결과에 의해, 8℃ 내지 9℃의 델타 T_m에 의해 입증되는 바와 같이 완전한 RNP 복합체 형성을 나타내는 시료가 모두 HEK293FT 세포에서 우수한 NHEJ 활성을 보이는 것으로 나타났다.

회사 2로부터의 화학적으로 합성된 gRNA는 미소한 델타 T_m 및 보다 낮은 NHEJ 활성(11% 삽입결실)과 함께 부적당한 것으로 관찰되었다.

MEGAshortscript T7 키트에 의해 시험관내 전사된 gRNA 및 회사 1로부터 구매한 gRNA는 7℃ 내지 8℃의 T_m 및 22 내지 27℃ 범위에서의 NHEJ 활성에 의해 입증되는 바와 같이 충분한 질 및 무결성의 것이었다.

실시예 3: gRNA의 클로닝 및 초기 스크리닝

본 실시예에는 키메라 gRNA를 평가하기 위한 방법이 개시되어 있다. 또한, 동일한 방법을 사용하여 모듈 gRNA를 평가할 수 있다.

벡터 내로의 gRNA의 클로닝

각각의 gRNA에 있어서, 중첩 올리고뉴클레오타이드의 쌍을 설계하고 수득한다. 올리고뉴클레오타이드를 어닐링하고, 상류 U6 프로모터 및 긴 키메라 gRNA의 나머지 서열을 함유하는 분해된 벡터 백본 내로 라이게이션시켰다. 플라스미드를 서열-확인하고, 충분한 양의 트랜스펙션-품질의 DNA를 생성하기 위해 제조한다. 특정 구현예에서, U6 프로모터를 대안적 프로모터로 대체하여, 생체내 전사(예를 들어, H1 프로모터) 또는 시험관내 전사(예를 들어, T7 프로모터)를 추진할 수 있다.

선형 dsDNA 분자 내로의 gRNA의 클로닝(STITCHR)

단일의 올리고뉴클레오타이드를 설계하고, 각각의 gRNA에 대하여 수득한다. U6 프로모터 및 gRNA 스캐폴드(예를 들어, crRNA 및 tracrRNA로부터 유래되는 서열을 포함하는, 예를 들어, 제1 상보성 도메인; 연결 도메인; 제2 상보성 도메인; 근위 도메인; 및 꼬리 도메인을 포함하는 표적화 도메인을 제외한 모든 것 포함)를 개별적으로 PCR 증폭시키고, dsDNA 분자로서 정제한다. gRNA-특이적 올리고뉴클레오타이드를 PCR 반응에서 사용하여, 올리고뉴클레오타이드에서 특정된 표적화 도메인에 의해 연결되는 U6 및 gRNA 스캐폴드를 연결한다. 생성된 dsDNA 분자(STITCHR 산물)를 트랜스펙션을 위해 정제한다. 임의의 gRNA 스캐폴드를 사용하여 임의의 박테리아 종으로부터의 Cas9와 양립가능한 gRNA를 생성할 수 있다. 특정 구현예에서, U6 프로모터를 대안적 프로모터로 교체하여, 생체내 전사(예를 들어, H1 프로모터) 또는 시험관내 전사(예를 들어, T7 프로모터)를 추진할 수 있다.

초기 gRNA 스크린

시험할 각각의 gRNA를 Cas9를 발현하는 플라스미드 및 소량의 GFP-발현 플라스미드와 함께 인간 세포 내로 트랜스펙션시킨다. 예비 실험에서, 이들 세포는 불멸화된 인간 세포주, 예를 들어, 293T, K562 또는 U2OS일 수 있다. 대안적으로, 일차 인간 세포가 사용될 수 있다. 스크리닝을 위해 사용되는 세포는 궁극적인 치료적 세포 표적(예를 들어, 적혈구 세포)와 관련될 수 있다. 잠재적인 치료 표적 세포 집단과 유사한 일차 세포의 이용은 내인성 염색질 및 유전자 발현의 맥락에서 유전자 표적화 비에 대한 중요한 정보를 제공할 수 있다.

지질 트랜스펙션(예를 들어, 리포펙타민 또는 Fugene)을 사용하여 또는 전기천공법(예를 들어, 론자 뉴클레오펙션(Lonza Nucleofection))에 의해 트랜스펙션을 수행할 수 있다. 트랜스펙션 후에, 형광 현미경에 의해 또는 유세포분석에 의해 GFP 발현을 결정하여, 일관된 높은 수준의 트랜스펙션을 확인할 수 있다. 예비 트랜스펙션은 어떤 gRNA/gRNA의 조합이 가장 큰 활성을 제공하는지를 결정하기 위하여 상이한 gRNA 및 상이한 표적화 방법(예를 들어, 17-mer, 20-mer, 뉴클레아제, 이중-틈내기효소 등)을 포함할 수 있다.

T7E1 엔도뉴클레아제 분석에 의해 표적 유전자좌에서 NHEJ-유도된 삽입결실 형성을 측정함으로써 각 gRNA를 사용한 절단의 효율을 평가할 수 있다. 이러한 분석을 위하여, PCR 앰플리콘은 대략 500 내지 700 bp이며, 의도되는 절단 부위는 앰플리콘 내에 비대칭적으로 배치된다. 증폭, 정제 및 PCR 산물의 크기-입증 후에, 95℃로 가열시킨 다음 서서히 냉각시킴으로써 DNA를 변성시키고, 재혼성화시킨다. 그 다음, 혼성화된 PCR 산물을 완벽하게 일치되지 않는 DNA를 인식하고 이를 절단하는 T7 엔도뉴클레아제 I(또는 다른 불일치-감수성 효소)으로 분해한다. 삽입결실이 원래의 주형 DNA에 존재한다면, 앰플리콘의 변성 및 재-어닐링은 상이한 삽입결실을 지니는 DNA 가닥의 혼성화를 초래하며, 이는 완벽하게 일치되지 않는 이중-가닥 DNA를 야기한다. 분해 산물을 겔 전기영동 또는 모세관 전기영동에 의해 가시화시킬 수 있다. 절단된 DNA의 분율(절단 및 비절단된 밀도로 나눈 절단 산물의 밀도)을 사용하여, 하기의 식을 사용하여 NHEJ 백분율을 추정할 수 있다: NHEJ% = (1-(1-절단 분율)^½). T7E1 분석은 약 2 내지 5% NHEJ에 이르기까지 감수성이다.

특정 구현예에서, 예를 들어, 시퀀싱 및 불일치-감수성 효소, 예를 들어, 세포/서베이어(Surveyor) 뉴클레아제의 이용을 포함하는 다른 방법을 사용하여 절단 효율을 평가할 수 있다. 생거 시퀀싱을 위하여, 정제된 PCR 앰플리콘을 플라스미드 백본 내로 클로닝하고, 형질전환시키고, 소규모 제조하고, 단일의 프라이머로 시퀀싱한다. NHEJ 비를 T7E1에 의해 결정한 후에, 삽입결실의 정확한 성질을 결정하기 위하여 생거 시퀀싱을 사용할 수 있다. 차세대 시퀀싱을 위하여, 앰플리콘은 300 내지 500 bp일 수 있으며, 의도되는 절단 부위는 비대칭적으로 배치된다. PCR 후에, 차세대 시퀀싱 어댑터 및 바코드(예를 들어, 일루미나 멀티플렉스 어댑터 및 인덱스)를 예를 들어, (예를 들어, 일루미나 MiSeq에서의) 높은 처리효율의 시퀀싱에 사용하기 위하여 앰플리콘의 말단에 부가할 수 있다. 이러한 방법은 매우 낮은 NHEJ 비의 검출을 가능하게 한다.

실시예 4: NHEJ에 의한 유전자 표적화의 평가

초기 시험에서 가장 큰 수준의 NHEJ를 유도하는 gRNA를 유전자 표적화 효율의 추가의 평가를 위해 선택할 수 있다. 이러한 경우에, 세포는 이환 대상체로부터 유래되며, 이에 따라 관련 돌연변이를 지닌다.

트랜스펙션 후에(통상 트랜스펙션 후 2일 내지 3일), 게놈 DNA를 부피가 큰 트랜스펙션된 세포의 집단으로부터 분리할 수 있으며, PCR을 사용하여 표적 영역을 증폭시킬 수 있다. PCR 후에, 요망되는 돌연변이(표적 유전자의 넉아웃 또는 표적 서열 모티프의 제거 중 어느 하나)를 생성하기 위한 유전자 표적화 효율을 시퀀싱에 의해 결정할 수 있다. 생거 시퀀싱을 위하여, PCR 앰플리콘은 500 내지 700 bp 길이일 수 있다. 차세대 시퀀싱을 위하여, PCR 앰플리콘은 300 내지 500 bp 길이일 수 있다. 목적이 유전자 기능을 넉아웃시키는 것이면, 시퀀싱을 사용하여 몇 퍼센트의 대립유전자가 유전자 기능을 파괴하는 것으로 예상되는 프레임시프트 또는 대형 결실 또는 삽입를 초래하는 NHEJ-유도되는 삽입결실을 겪는지를 평가할 수 있다. 목적이 특정 서열 모티프를 제거하는 것이면, 시퀀싱을 사용하여 몇 퍼센트의 대립유전자가 이러한 서열에 걸쳐 있는 NHEJ-유도된 결실을 겪는지를 평가할 수 있다.

실시예 5: HDR에 의한 유전자 표적화의 평가

트랜스펙션 후에(통상 트랜스펙션 후 2일 내지 3일), 게놈 DNA를 부피가 큰 트랜스펙션된 세포의 집단으로부터 분리할 수 있으며, PCR을 사용하여 표적 영역을 증폭시킬 수 있다. PCR 후에, 유전자 표적화 효율을 몇몇의 방법에 의해 결정할 수 있다.

유전자 표적화 빈도의 결정은 외인적으로 제공되는 공여자 주형 또는 내인성 게놈 공여자 서열과 상동성 유도 수선(HDR)을 겪고, 이에 따라, 요망되는 보정이 혼입된 대립유전자의 백분율을 측정하는 것을 수반한다. 요망되는 HDR 사건이 제한 효소 부위를 생성하거나 파괴하면, 유전자 표적화의 빈도를 RFLP 분석에 의해 결정할 수 있다. 제한 효소가 생성되거나 파괴되지 않는다면, 시퀀싱을 사용하여 유전자 표적화 빈도를 결정할 수 있다. RFLP 분석이 사용된다면, 여전히 시퀀싱을 사용하여 요망되는 HDR 사건을 확인하고, 다른 돌연변이가 존재하지 않음을 보장할 수 있다. 외인적으로 제공되는 공여자 주형이 사용된다면, 프라이머 중 적어도 하나는 여전히 세포에 존재하는 공여자 주형의 증폭을 방해하는 상동성 아암(arm)에 포함되는 영역의 외측의 내인성 유전자 서열에 배치된다. 따라서, 공여자 주형에 존재하는 상동성 아암의 길이는 PCR 앰플리콘의 길이에 영향을 미칠 수 있다. PCR 앰플리콘은 전체 공여자 영역에 걸쳐 있을 수 있거나(두 프라이머 모두는 상동성 아암의 외측에 배치됨), 그들은 오직 공여자 영역의 일부 및 공여자와 내인성 DNA 사이의 단일의 접합부에 걸쳐 있을 수 있다(하나는 내측, 하나는 외측 프라이머). 앰플리콘이 전체 공여자 영역 미만의 영역에 걸쳐 있다면, 2가지의 상이한 PCR을 사용하여 5' 및 3' 접합부 둘 모두에서 서열을 증폭시켜야 한다.

PCR 앰플리콘이 짧으면(600 bp 미만), 차세대 시퀀싱을 사용할 수 있다. PCR 후에, 차세대 시퀀싱 어댑터 및 바코드(예를 들어, 일루미나 멀티플렉스 어댑터 및 인덱스)를 예를 들어, (예를 들어, 일루미나 MiSeq에서의) 높은 처리효율의 시퀀싱에 사용하기 위하여 앰플리콘의 말단에 부가할 수 있다. 이러한 방법은 매우 낮은 유전자 표적화 비의 검출을 가능하게 한다.

차세대 시퀀싱을 위해 PCR 앰플리콘이 너무 길면, 생거 시퀀싱을 수행할 수 있다. 생거 시퀀싱을 위하여, 정제된 PCR 앰플리콘을 플라스미드 백본(예를 들어, 라이프테크 제로 블런트(LifeTech Zero Blunt)^® TOPO^® 클로닝 키트를 사용하여 클로닝된 TOPO) 내로 클로닝하고, 형질전환시키고, 소규모 제조하고, 시퀀싱할 것이다.

상기 기재된 것과 동일하거나 유사한 분석을 사용하여 내인성 게놈 공여자 서열과 HDR을 겪고, 이에 따라 요망되는 보정이 혼입된 대립유전자의 백분율을 측정할 수 있다.

참고문헌의 포함

본 명세서에서 언급된 모든 간행물, 특허, 및 특허 출원은, 각각의 개별적인 간행물, 특허 또는 특허 출원이 구체적으로 그리고 개별적으로 참고로 포함되어 있는 것처럼 전체가 참고로 본 명세서에 포함되어 있다. 상충하는 경우, 본 명세서의 임의의 정의를 포함하여, 본 출원이 우선할 것이다.

균등물

당업자는 단지 일상적인 실험을 이용하여 본 명세서에 기재된 발명의 구체적인 구현예에 대한 많은 균등물을 인식하거나 알아낼 수 있을 것이다. 이러한 균등물은 하기 청구범위에 포함되는 것으로 의도된다.

참고문헌

Anders et al. Nature 513(7519):569-573 (2014)

Bae et al. Bioinformatics 30(10):1473-1475 (2014)

Caldecott Nat Rev Genet 9(8):619-631 (2008)

Chylinski et al. RNA Biol 10(5):726?737 (2013)

Cong et al. Science 399(6121):819-823 (2013)

Deveau et al. J Bacterial 190(4):1390-1400 (2008)

Esvelt et al. Nature 472(7344):499-503 (2011)

Fu et al. Nat Biotechnol 32:279-284 (2014)

Haft PLoS Comput Biol 1(6):e60 (2005)

Heigwer Nat Methods 11(2):122-123 (2014)

Horvath & Barrangou Science 327(5962):167-170 (2010)

Hsu et al. Nat Biotechnol 31(9):827-832 (2013)

Jinek et al. Science 337(6096):816-821 (2012)

Jinek et al. Science 343(6176):1247997 (2014)

Lee et al. Nano Lett 12(12):6322-6327 (2012)

Li Cell Res 18(1):85-98 (2008)

Makarova et al. Nat Rev Microbiol 9(6):467-477 (2011)

Mali et al. Science 339(6121):823-826 (2013)

Marteijn et al. Nat Rev Mol Cell Biol 15(7):465-481 (2014)

Nishimasu et al. Cell 156(5):935-949 (2014)

Sternberg et al. Nature 507(7490):62-67 (2014)

Wang et al. Cell 153(4):910-918 (2013)

Xiao et al. "CasOT: a genome-wide Cas9/gRNA off-target searching tool." Bioinformatics (epub Jan. 21, 2014)

SEQUENCE LISTING <110> Editas Medicine Jayaram, Hari Selleck, William Jr. <120> Evaluation of Cas9 molecule/guide RNA molecule complexes <130> 118945.8008.WO00 (EM050PCT) <150> US 62/152,473 <151> 2015-04-24 <160> 210 <170> PatentIn version 3.5 <210> 1 <211> 1345 <212> PRT <213> Streptococcus mutans <220> <221> misc_feature <222> (10)..(21) <223> N-terminal RuvC-like domain <220> <221> misc_feature <222> (759)..(766) <223> RuvC-like domain <220> <221> misc_feature <222> (837)..(863) <223> HNH-like domain <220> <221> misc_feature <222> (982)..(989) <223> RuvC-like domain <400> 1 Met Lys Lys Pro Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Val Thr Asp Asp Tyr Lys Val Pro Ala Lys Lys Met 20 25 30 Lys Val Leu Gly Asn Thr Asp Lys Ser His Ile Glu Lys Asn Leu Leu 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Asn Thr Ala Glu Asp Arg Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Arg Asn Arg Ile Leu 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Glu Glu Met Gly Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Asp Ser Phe Leu Val Thr Glu Asp Lys Arg 100 105 110 Gly Glu Arg His Pro Ile Phe Gly Asn Leu Glu Glu Glu Val Lys Tyr 115 120 125 His Glu Asn Phe Pro Thr Ile Tyr His Leu Arg Gln Tyr Leu Ala Asp 130 135 140 Asn Pro Glu Lys Val Asp Leu Arg Leu Val Tyr Leu Ala Leu Ala His 145 150 155 160 Ile Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Lys Phe Asp Thr 165 170 175 Arg Asn Asn Asp Val Gln Arg Leu Phe Gln Glu Phe Leu Ala Val Tyr 180 185 190 Asp Asn Thr Phe Glu Asn Ser Ser Leu Gln Glu Gln Asn Val Gln Val 195 200 205 Glu Glu Ile Leu Thr Asp Lys Ile Ser Lys Ser Ala Lys Lys Asp Arg 210 215 220 Val Leu Lys Leu Phe Pro Asn Glu Lys Ser Asn Gly Arg Phe Ala Glu 225 230 235 240 Phe Leu Lys Leu Ile Val Gly Asn Gln Ala Asp Phe Lys Lys His Phe 245 250 255 Glu Leu Glu Glu Lys Ala Pro Leu Gln Phe Ser Lys Asp Thr Tyr Glu 260 265 270 Glu Glu Leu Glu Val Leu Leu Ala Gln Ile Gly Asp Asn Tyr Ala Glu 275 280 285 Leu Phe Leu Ser Ala Lys Lys Leu Tyr Asp Ser Ile Leu Leu Ser Gly 290 295 300 Ile Leu Thr Val Thr Asp Val Gly Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Gln Arg Tyr Asn Glu His Gln Met Asp Leu Ala Gln Leu Lys 325 330 335 Gln Phe Ile Arg Gln Lys Leu Ser Asp Lys Tyr Asn Glu Val Phe Ser 340 345 350 Asp Val Ser Lys Asp Gly Tyr Ala Gly Tyr Ile Asp Gly Lys Thr Asn 355 360 365 Gln Glu Ala Phe Tyr Lys Tyr Leu Lys Gly Leu Leu Asn Lys Ile Glu 370 375 380 Gly Ser Gly Tyr Phe Leu Asp Lys Ile Glu Arg Glu Asp Phe Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gln Glu Met Arg Ala Ile Ile Arg Arg Gln Ala Glu Phe Tyr Pro Phe 420 425 430 Leu Ala Asp Asn Gln Asp Arg Ile Glu Lys Leu Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Lys Ser Asp Phe Ala Trp 450 455 460 Leu Ser Arg Lys Ser Ala Asp Lys Ile Thr Pro Trp Asn Phe Asp Glu 465 470 475 480 Ile Val Asp Lys Glu Ser Ser Ala Glu Ala Phe Ile Asn Arg Met Thr 485 490 495 Asn Tyr Asp Leu Tyr Leu Pro Asn Gln Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Lys Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Lys Thr Glu Gln Gly Lys Thr Ala Phe Phe Asp Ala Asn Met Lys 530 535 540 Gln Glu Ile Phe Asp Gly Val Phe Lys Val Tyr Arg Lys Val Thr Lys 545 550 555 560 Asp Lys Leu Met Asp Phe Leu Glu Lys Glu Phe Asp Glu Phe Arg Ile 565 570 575 Val Asp Leu Thr Gly Leu Asp Lys Glu Asn Lys Val Phe Asn Ala Ser 580 585 590 Tyr Gly Thr Tyr His Asp Leu Cys Lys Ile Leu Asp Lys Asp Phe Leu 595 600 605 Asp Asn Ser Lys Asn Glu Lys Ile Leu Glu Asp Ile Val Leu Thr Leu 610 615 620 Thr Leu Phe Glu Asp Arg Glu Met Ile Arg Lys Arg Leu Glu Asn Tyr 625 630 635 640 Ser Asp Leu Leu Thr Lys Glu Gln Val Lys Lys Leu Glu Arg Arg His 645 650 655 Tyr Thr Gly Trp Gly Arg Leu Ser Ala Glu Leu Ile His Gly Ile Arg 660 665 670 Asn Lys Glu Ser Arg Lys Thr Ile Leu Asp Tyr Leu Ile Asp Asp Gly 675 680 685 Asn Ser Asn Arg Asn Phe Met Gln Leu Ile Asn Asp Asp Ala Leu Ser 690 695 700 Phe Lys Glu Glu Ile Ala Lys Ala Gln Val Ile Gly Glu Thr Asp Asn 705 710 715 720 Leu Asn Gln Val Val Ser Asp Ile Ala Gly Ser Pro Ala Ile Lys Lys 725 730 735 Gly Ile Leu Gln Ser Leu Lys Ile Val Asp Glu Leu Val Lys Ile Met 740 745 750 Gly His Gln Pro Glu Asn Ile Val Val Glu Met Ala Arg Glu Asn Gln 755 760 765 Phe Thr Asn Gln Gly Arg Arg Asn Ser Gln Gln Arg Leu Lys Gly Leu 770 775 780 Thr Asp Ser Ile Lys Glu Phe Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Ser Gln Leu Gln Asn Asp Arg Leu Phe Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Thr Gly Glu Glu Leu Asp Ile Asp Tyr 820 825 830 Leu Ser Gln Tyr Asp Ile Asp His Ile Ile Pro Gln Ala Phe Ile Lys 835 840 845 Asp Asn Ser Ile Asp Asn Arg Val Leu Thr Ser Ser Lys Glu Asn Arg 850 855 860 Gly Lys Ser Asp Asp Val Pro Ser Lys Asp Val Val Arg Lys Met Lys 865 870 875 880 Ser Tyr Trp Ser Lys Leu Leu Ser Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Thr Asp Asp Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Arg Ile Leu Asp Glu Arg Phe Asn Thr Glu Thr Asp 930 935 940 Glu Asn Asn Lys Lys Ile Arg Gln Val Lys Ile Val Thr Leu Lys Ser 945 950 955 960 Asn Leu Val Ser Asn Phe Arg Lys Glu Phe Glu Leu Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asp Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Ile Gly Lys Ala Leu Leu Gly Val Tyr Pro Gln Leu Glu Pro Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Pro His Phe His Gly His Lys Glu Asn Lys 1010 1015 1020 Ala Thr Ala Lys Lys Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe 1025 1030 1035 Lys Lys Asp Asp Val Arg Thr Asp Lys Asn Gly Glu Ile Ile Trp 1040 1045 1050 Lys Lys Asp Glu His Ile Ser Asn Ile Lys Lys Val Leu Ser Tyr 1055 1060 1065 Pro Gln Val Asn Ile Val Lys Lys Val Glu Glu Gln Thr Gly Gly 1070 1075 1080 Phe Ser Lys Glu Ser Ile Leu Pro Lys Gly Asn Ser Asp Lys Leu 1085 1090 1095 Ile Pro Arg Lys Thr Lys Lys Phe Tyr Trp Asp Thr Lys Lys Tyr 1100 1105 1110 Gly Gly Phe Asp Ser Pro Ile Val Ala Tyr Ser Ile Leu Val Ile 1115 1120 1125 Ala Asp Ile Glu Lys Gly Lys Ser Lys Lys Leu Lys Thr Val Lys 1130 1135 1140 Ala Leu Val Gly Val Thr Ile Met Glu Lys Met Thr Phe Glu Arg 1145 1150 1155 Asp Pro Val Ala Phe Leu Glu Arg Lys Gly Tyr Arg Asn Val Gln 1160 1165 1170 Glu Glu Asn Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Lys Leu 1175 1180 1185 Glu Asn Gly Arg Lys Arg Leu Leu Ala Ser Ala Arg Glu Leu Gln 1190 1195 1200 Lys Gly Asn Glu Ile Val Leu Pro Asn His Leu Gly Thr Leu Leu 1205 1210 1215 Tyr His Ala Lys Asn Ile His Lys Val Asp Glu Pro Lys His Leu 1220 1225 1230 Asp Tyr Val Asp Lys His Lys Asp Glu Phe Lys Glu Leu Leu Asp 1235 1240 1245 Val Val Ser Asn Phe Ser Lys Lys Tyr Thr Leu Ala Glu Gly Asn 1250 1255 1260 Leu Glu Lys Ile Lys Glu Leu Tyr Ala Gln Asn Asn Gly Glu Asp 1265 1270 1275 Leu Lys Glu Leu Ala Ser Ser Phe Ile Asn Leu Leu Thr Phe Thr 1280 1285 1290 Ala Ile Gly Ala Pro Ala Thr Phe Lys Phe Phe Asp Lys Asn Ile 1295 1300 1305 Asp Arg Lys Arg Tyr Thr Ser Thr Thr Glu Ile Leu Asn Ala Thr 1310 1315 1320 Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp 1325 1330 1335 Leu Asn Lys Leu Gly Gly Asp 1340 1345 <210> 2 <211> 1368 <212> PRT <213> Streptococcus pyogenes <220> <221> misc_feature <222> (10)..(21) <223> N-terminal RuvC-like domain <220> <221> misc_feature <222> (759)..(766) <223> RuvC-like domain <220> <221> misc_feature <222> (837)..(863) <223> HNH-like domain <220> <221> misc_feature <222> (982)..(989) <223> RuvC-like domain <400> 2 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 3 <211> 4107 <212> DNA <213> Streptococcus pyogenes <400> 3 atggataaaa agtacagcat cgggctggac atcggtacaa actcagtggg gtgggccgtg 60 attacggacg agtacaaggt accctccaaa aaatttaaag tgctgggtaa cacggacaga 120 cactctataa agaaaaatct tattggagcc ttgctgttcg actcaggcga gacagccgaa 180 gccacaaggt tgaagcggac cgccaggagg cggtatacca ggagaaagaa ccgcatatgc 240 tacctgcaag aaatcttcag taacgagatg gcaaaggttg acgatagctt tttccatcgc 300 ctggaagaat cctttcttgt tgaggaagac aagaagcacg aacggcaccc catctttggc 360 aatattgtcg acgaagtggc atatcacgaa aagtacccga ctatctacca cctcaggaag 420 aagctggtgg actctaccga taaggcggac ctcagactta tttatttggc actcgcccac 480 atgattaaat ttagaggaca tttcttgatc gagggcgacc tgaacccgga caacagtgac 540 gtcgataagc tgttcatcca acttgtgcag acctacaatc aactgttcga agaaaaccct 600 ataaatgctt caggagtcga cgctaaagca atcctgtccg cgcgcctctc aaaatctaga 660 agacttgaga atctgattgc tcagttgccc ggggaaaaga aaaatggatt gtttggcaac 720 ctgatcgccc tcagtctcgg actgacccca aatttcaaaa gtaacttcga cctggccgaa 780 gacgctaagc tccagctgtc caaggacaca tacgatgacg acctcgacaa tctgctggcc 840 cagattgggg atcagtacgc cgatctcttt ttggcagcaa agaacctgtc cgacgccatc 900 ctgttgagcg atatcttgag agtgaacacc gaaattacta aagcacccct tagcgcatct 960 atgatcaagc ggtacgacga gcatcatcag gatctgaccc tgctgaaggc tcttgtgagg 1020 caacagctcc ccgaaaaata caaggaaatc ttctttgacc agagcaaaaa cggctacgct 1080 ggctatatag atggtggggc cagtcaggag gaattctata aattcatcaa gcccattctc 1140 gagaaaatgg acggcacaga ggagttgctg gtcaaactta acagggagga cctgctgcgg 1200 aagcagcgga cctttgacaa cgggtctatc ccccaccaga ttcatctggg cgaactgcac 1260 gcaatcctga ggaggcagga ggatttttat ccttttctta aagataaccg cgagaaaata 1320 gaaaagattc ttacattcag gatcccgtac tacgtgggac ctctcgcccg gggcaattca 1380 cggtttgcct ggatgacaag gaagtcagag gagactatta caccttggaa cttcgaagaa 1440 gtggtggaca agggtgcatc tgcccagtct ttcatcgagc ggatgacaaa ttttgacaag 1500 aacctcccta atgagaaggt gctgcccaaa cattctctgc tctacgagta ctttaccgtc 1560 tacaatgaac tgactaaagt caagtacgtc accgagggaa tgaggaagcc ggcattcctt 1620 agtggagaac agaagaaggc gattgtagac ctgttgttca agaccaacag gaaggtgact 1680 gtgaagcaac ttaaagaaga ctactttaag aagatcgaat gttttgacag tgtggaaatt 1740 tcaggggttg aagaccgctt caatgcgtca ttggggactt accatgatct tctcaagatc 1800 ataaaggaca aagacttcct ggacaacgaa gaaaatgagg atattctcga agacatcgtc 1860 ctcaccctga ccctgttcga agacagggaa atgatagaag agcgcttgaa aacctatgcc 1920 cacctcttcg acgataaagt tatgaagcag ctgaagcgca ggagatacac aggatgggga 1980 agattgtcaa ggaagctgat caatggaatt agggataaac agagtggcaa gaccatactg 2040 gatttcctca aatctgatgg cttcgccaat aggaacttca tgcaactgat tcacgatgac 2100 tctcttacct tcaaggagga cattcaaaag gctcaggtga gcgggcaggg agactccctt 2160 catgaacaca tcgcgaattt ggcaggttcc cccgctatta aaaagggcat ccttcaaact 2220 gtcaaggtgg tggatgaatt ggtcaaggta atgggcagac ataagccaga aaatattgtg 2280 atcgagatgg cccgcgaaaa ccagaccaca cagaagggcc agaaaaatag tagagagcgg 2340 atgaagagga tcgaggaggg catcaaagag ctgggatctc agattctcaa agaacacccc 2400 gtagaaaaca cacagctgca gaacgaaaaa ttgtacttgt actatctgca gaacggcaga 2460 gacatgtacg tcgaccaaga acttgatatt aatagactgt ccgactatga cgtagaccat 2520 atcgtgcccc agtccttcct gaaggacgac tccattgata acaaagtctt gacaagaagc 2580 gacaagaaca ggggtaaaag tgataatgtg cctagcgagg aggtggtgaa aaaaatgaag 2640 aactactggc gacagctgct taatgcaaag ctcattacac aacggaagtt cgataatctg 2700 acgaaagcag agagaggtgg cttgtctgag ttggacaagg cagggtttat taagcggcag 2760 ctggtggaaa ctaggcagat cacaaagcac gtggcgcaga ttttggacag ccggatgaac 2820 acaaaatacg acgaaaatga taaactgata cgagaggtca aagttatcac gctgaaaagc 2880 aagctggtgt ccgattttcg gaaagacttc cagttctaca aagttcgcga gattaataac 2940 taccatcatg ctcacgatgc gtacctgaac gctgttgtcg ggaccgcctt gataaagaag 3000 tacccaaagc tggaatccga gttcgtatac ggggattaca aagtgtacga tgtgaggaaa 3060 atgatagcca agtccgagca ggagattgga aaggccacag ctaagtactt cttttattct 3120 aacatcatga atttttttaa gacggaaatt accctggcca acggagagat cagaaagcgg 3180 ccccttatag agacaaatgg tgaaacaggt gaaatcgtct gggataaggg cagggatttc 3240 gctactgtga ggaaggtgct gagtatgcca caggtaaata tcgtgaaaaa aaccgaagta 3300 cagaccggag gattttccaa ggaaagcatt ttgcctaaaa gaaactcaga caagctcatc 3360 gcccgcaaga aagattggga ccctaagaaa tacgggggat ttgactcacc caccgtagcc 3420 tattctgtgc tggtggtagc taaggtggaa aaaggaaagt ctaagaagct gaagtccgtg 3480 aaggaactct tgggaatcac tatcatggaa agatcatcct ttgaaaagaa ccctatcgat 3540 ttcctggagg ctaagggtta caaggaggtc aagaaagacc tcatcattaa actgccaaaa 3600 tactctctct tcgagctgga aaatggcagg aagagaatgt tggccagcgc cggagagctg 3660 caaaagggaa acgagcttgc tctgccctcc aaatatgtta attttctcta tctcgcttcc 3720 cactatgaaa agctgaaagg gtctcccgaa gataacgagc agaagcagct gttcgtcgaa 3780 cagcacaagc actatctgga tgaaataatc gaacaaataa gcgagttcag caaaagggtt 3840 atcctggcgg atgctaattt ggacaaagta ctgtctgctt ataacaagca ccgggataag 3900 cctattaggg aacaagccga gaatataatt cacctcttta cactcacgaa tctcggagcc 3960 cccgccgcct tcaaatactt tgatacgact atcgaccgga aacggtatac cagtaccaaa 4020 gaggtcctcg atgccaccct catccaccag tcaattactg gcctgtacga aacacggatc 4080 gacctctctc aactgggcgg cgactag 4107 <210> 4 <211> 1388 <212> PRT <213> Streptococcus thermophilus <220> <221> misc_feature <222> (10)..(21) <223> N-terminal RuvC-like domain <220> <221> misc_feature <222> (760)..(767) <223> RuvC-like domain <220> <221> misc_feature <222> (844)..(870) <223> HNH-like domain <220> <221> misc_feature <222> (989)..(996) <223> RuvC-like domain <400> 4 Met Thr Lys Pro Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Thr Thr Asp Asn Tyr Lys Val Pro Ser Lys Lys Met 20 25 30 Lys Val Leu Gly Asn Thr Ser Lys Lys Tyr Ile Lys Lys Asn Leu Leu 35 40 45 Gly Val Leu Leu Phe Asp Ser Gly Ile Thr Ala Glu Gly Arg Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Arg Asn Arg Ile Leu 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Thr Glu Met Ala Thr Leu Asp Asp Ala 85 90 95 Phe Phe Gln Arg Leu Asp Asp Ser Phe Leu Val Pro Asp Asp Lys Arg 100 105 110 Asp Ser Lys Tyr Pro Ile Phe Gly Asn Leu Val Glu Glu Lys Ala Tyr 115 120 125 His Asp Glu Phe Pro Thr Ile Tyr His Leu Arg Lys Tyr Leu Ala Asp 130 135 140 Ser Thr Lys Lys Ala Asp Leu Arg Leu Val Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Tyr Arg Gly His Phe Leu Ile Glu Gly Glu Phe Asn Ser 165 170 175 Lys Asn Asn Asp Ile Gln Lys Asn Phe Gln Asp Phe Leu Asp Thr Tyr 180 185 190 Asn Ala Ile Phe Glu Ser Asp Leu Ser Leu Glu Asn Ser Lys Gln Leu 195 200 205 Glu Glu Ile Val Lys Asp Lys Ile Ser Lys Leu Glu Lys Lys Asp Arg 210 215 220 Ile Leu Lys Leu Phe Pro Gly Glu Lys Asn Ser Gly Ile Phe Ser Glu 225 230 235 240 Phe Leu Lys Leu Ile Val Gly Asn Gln Ala Asp Phe Arg Lys Cys Phe 245 250 255 Asn Leu Asp Glu Lys Ala Ser Leu His Phe Ser Lys Glu Ser Tyr Asp 260 265 270 Glu Asp Leu Glu Thr Leu Leu Gly Tyr Ile Gly Asp Asp Tyr Ser Asp 275 280 285 Val Phe Leu Lys Ala Lys Lys Leu Tyr Asp Ala Ile Leu Leu Ser Gly 290 295 300 Phe Leu Thr Val Thr Asp Asn Glu Thr Glu Ala Pro Leu Ser Ser Ala 305 310 315 320 Met Ile Lys Arg Tyr Asn Glu His Lys Glu Asp Leu Ala Leu Leu Lys 325 330 335 Glu Tyr Ile Arg Asn Ile Ser Leu Lys Thr Tyr Asn Glu Val Phe Lys 340 345 350 Asp Asp Thr Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Lys Thr Asn 355 360 365 Gln Glu Asp Phe Tyr Val Tyr Leu Lys Lys Leu Leu Ala Glu Phe Glu 370 375 380 Gly Ala Asp Tyr Phe Leu Glu Lys Ile Asp Arg Glu Asp Phe Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro Tyr Gln Ile His Leu 405 410 415 Gln Glu Met Arg Ala Ile Leu Asp Lys Gln Ala Lys Phe Tyr Pro Phe 420 425 430 Leu Ala Lys Asn Lys Glu Arg Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Asp Phe Ala Trp 450 455 460 Ser Ile Arg Lys Arg Asn Glu Lys Ile Thr Pro Trp Asn Phe Glu Asp 465 470 475 480 Val Ile Asp Lys Glu Ser Ser Ala Glu Ala Phe Ile Asn Arg Met Thr 485 490 495 Ser Phe Asp Leu Tyr Leu Pro Glu Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Thr Phe Asn Val Tyr Asn Glu Leu Thr Lys Val Arg 515 520 525 Phe Ile Ala Glu Ser Met Arg Asp Tyr Gln Phe Leu Asp Ser Lys Gln 530 535 540 Lys Lys Asp Ile Val Arg Leu Tyr Phe Lys Asp Lys Arg Lys Val Thr 545 550 555 560 Asp Lys Asp Ile Ile Glu Tyr Leu His Ala Ile Tyr Gly Tyr Asp Gly 565 570 575 Ile Glu Leu Lys Gly Ile Glu Lys Gln Phe Asn Ser Ser Leu Ser Thr 580 585 590 Tyr His Asp Leu Leu Asn Ile Ile Asn Asp Lys Glu Phe Leu Asp Asp 595 600 605 Ser Ser Asn Glu Ala Ile Ile Glu Glu Ile Ile His Thr Leu Thr Ile 610 615 620 Phe Glu Asp Arg Glu Met Ile Lys Gln Arg Leu Ser Lys Phe Glu Asn 625 630 635 640 Ile Phe Asp Lys Ser Val Leu Lys Lys Leu Ser Arg Arg His Tyr Thr 645 650 655 Gly Trp Gly Lys Leu Ser Ala Lys Leu Ile Asn Gly Ile Arg Asp Glu 660 665 670 Lys Ser Gly Asn Thr Ile Leu Asp Tyr Leu Ile Asp Asp Gly Ile Ser 675 680 685 Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ala Leu Ser Phe Lys 690 695 700 Lys Lys Ile Gln Lys Ala Gln Ile Ile Gly Asp Glu Asp Lys Gly Asn 705 710 715 720 Ile Lys Glu Val Val Lys Ser Leu Pro Gly Ser Pro Ala Ile Lys Lys 725 730 735 Gly Ile Leu Gln Ser Ile Lys Ile Val Asp Glu Leu Val Lys Val Met 740 745 750 Gly Gly Arg Lys Pro Glu Ser Ile Val Val Glu Met Ala Arg Glu Asn 755 760 765 Gln Tyr Thr Asn Gln Gly Lys Ser Asn Ser Gln Gln Arg Leu Lys Arg 770 775 780 Leu Glu Lys Ser Leu Lys Glu Leu Gly Ser Lys Ile Leu Lys Glu Asn 785 790 795 800 Ile Pro Ala Lys Leu Ser Lys Ile Asp Asn Asn Ala Leu Gln Asn Asp 805 810 815 Arg Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Lys Asp Met Tyr Thr Gly 820 825 830 Asp Asp Leu Asp Ile Asp Arg Leu Ser Asn Tyr Asp Ile Asp His Ile 835 840 845 Ile Pro Gln Ala Phe Leu Lys Asp Asn Ser Ile Asp Asn Lys Val Leu 850 855 860 Val Ser Ser Ala Ser Asn Arg Gly Lys Ser Asp Asp Val Pro Ser Leu 865 870 875 880 Glu Val Val Lys Lys Arg Lys Thr Phe Trp Tyr Gln Leu Leu Lys Ser 885 890 895 Lys Leu Ile Ser Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg 900 905 910 Gly Gly Leu Ser Pro Glu Asp Lys Ala Gly Phe Ile Gln Arg Gln Leu 915 920 925 Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Arg Leu Leu Asp Glu 930 935 940 Lys Phe Asn Asn Lys Lys Asp Glu Asn Asn Arg Ala Val Arg Thr Val 945 950 955 960 Lys Ile Ile Thr Leu Lys Ser Thr Leu Val Ser Gln Phe Arg Lys Asp 965 970 975 Phe Glu Leu Tyr Lys Val Arg Glu Ile Asn Asp Phe His His Ala His 980 985 990 Asp Ala Tyr Leu Asn Ala Val Val Ala Ser Ala Leu Leu Lys Lys Tyr 995 1000 1005 Pro Lys Leu Glu Pro Glu Phe Val Tyr Gly Asp Tyr Pro Lys Tyr 1010 1015 1020 Asn Ser Phe Arg Glu Arg Lys Ser Ala Thr Glu Lys Val Tyr Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Ile Phe Lys Lys Ser Ile Ser Leu Ala 1040 1045 1050 Asp Gly Arg Val Ile Glu Arg Pro Leu Ile Glu Val Asn Glu Glu 1055 1060 1065 Thr Gly Glu Ser Val Trp Asn Lys Glu Ser Asp Leu Ala Thr Val 1070 1075 1080 Arg Arg Val Leu Ser Tyr Pro Gln Val Asn Val Val Lys Lys Val 1085 1090 1095 Glu Glu Gln Asn His Gly Leu Asp Arg Gly Lys Pro Lys Gly Leu 1100 1105 1110 Phe Asn Ala Asn Leu Ser Ser Lys Pro Lys Pro Asn Ser Asn Glu 1115 1120 1125 Asn Leu Val Gly Ala Lys Glu Tyr Leu Asp Pro Lys Lys Tyr Gly 1130 1135 1140 Gly Tyr Ala Gly Ile Ser Asn Ser Phe Thr Val Leu Val Lys Gly 1145 1150 1155 Thr Ile Glu Lys Gly Ala Lys Lys Lys Ile Thr Asn Val Leu Glu 1160 1165 1170 Phe Gln Gly Ile Ser Ile Leu Asp Arg Ile Asn Tyr Arg Lys Asp 1175 1180 1185 Lys Leu Asn Phe Leu Leu Glu Lys Gly Tyr Lys Asp Ile Glu Leu 1190 1195 1200 Ile Ile Glu Leu Pro Lys Tyr Ser Leu Phe Glu Leu Ser Asp Gly 1205 1210 1215 Ser Arg Arg Met Leu Ala Ser Ile Leu Ser Thr Asn Asn Lys Arg 1220 1225 1230 Gly Glu Ile His Lys Gly Asn Gln Ile Phe Leu Ser Gln Lys Phe 1235 1240 1245 Val Lys Leu Leu Tyr His Ala Lys Arg Ile Ser Asn Thr Ile Asn 1250 1255 1260 Glu Asn His Arg Lys Tyr Val Glu Asn His Lys Lys Glu Phe Glu 1265 1270 1275 Glu Leu Phe Tyr Tyr Ile Leu Glu Phe Asn Glu Asn Tyr Val Gly 1280 1285 1290 Ala Lys Lys Asn Gly Lys Leu Leu Asn Ser Ala Phe Gln Ser Trp 1295 1300 1305 Gln Asn His Ser Ile Asp Glu Leu Cys Ser Ser Phe Ile Gly Pro 1310 1315 1320 Thr Gly Ser Glu Arg Lys Gly Leu Phe Glu Leu Thr Ser Arg Gly 1325 1330 1335 Ser Ala Ala Asp Phe Glu Phe Leu Gly Val Lys Ile Pro Arg Tyr 1340 1345 1350 Arg Asp Tyr Thr Pro Ser Ser Leu Leu Lys Asp Ala Thr Leu Ile 1355 1360 1365 His Gln Ser Val Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ala 1370 1375 1380 Lys Leu Gly Glu Gly 1385 <210> 5 <211> 1334 <212> PRT <213> Listeria innocua <220> <221> misc_feature <222> (10)..(21) <223> N-terminal RuvC-like domain <220> <221> misc_feature <222> (762)..(769) <223> RuvC-like domain <220> <221> misc_feature <222> (840)..(866) <223> HNH-like domain <220> <221> misc_feature <222> (985)..(992) <223> RuvC-like domain <400> 5 Met Lys Lys Pro Tyr Thr Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Leu Thr Asp Gln Tyr Asp Leu Val Lys Arg Lys Met 20 25 30 Lys Ile Ala Gly Asp Ser Glu Lys Lys Gln Ile Lys Lys Asn Phe Trp 35 40 45 Gly Val Arg Leu Phe Asp Glu Gly Gln Thr Ala Ala Asp Arg Arg Met 50 55 60 Ala Arg Thr Ala Arg Arg Arg Ile Glu Arg Arg Arg Asn Arg Ile Ser 65 70 75 80 Tyr Leu Gln Gly Ile Phe Ala Glu Glu Met Ser Lys Thr Asp Ala Asn 85 90 95 Phe Phe Cys Arg Leu Ser Asp Ser Phe Tyr Val Asp Asn Glu Lys Arg 100 105 110 Asn Ser Arg His Pro Phe Phe Ala Thr Ile Glu Glu Glu Val Glu Tyr 115 120 125 His Lys Asn Tyr Pro Thr Ile Tyr His Leu Arg Glu Glu Leu Val Asn 130 135 140 Ser Ser Glu Lys Ala Asp Leu Arg Leu Val Tyr Leu Ala Leu Ala His 145 150 155 160 Ile Ile Lys Tyr Arg Gly Asn Phe Leu Ile Glu Gly Ala Leu Asp Thr 165 170 175 Gln Asn Thr Ser Val Asp Gly Ile Tyr Lys Gln Phe Ile Gln Thr Tyr 180 185 190 Asn Gln Val Phe Ala Ser Gly Ile Glu Asp Gly Ser Leu Lys Lys Leu 195 200 205 Glu Asp Asn Lys Asp Val Ala Lys Ile Leu Val Glu Lys Val Thr Arg 210 215 220 Lys Glu Lys Leu Glu Arg Ile Leu Lys Leu Tyr Pro Gly Glu Lys Ser 225 230 235 240 Ala Gly Met Phe Ala Gln Phe Ile Ser Leu Ile Val Gly Ser Lys Gly 245 250 255 Asn Phe Gln Lys Pro Phe Asp Leu Ile Glu Lys Ser Asp Ile Glu Cys 260 265 270 Ala Lys Asp Ser Tyr Glu Glu Asp Leu Glu Ser Leu Leu Ala Leu Ile 275 280 285 Gly Asp Glu Tyr Ala Glu Leu Phe Val Ala Ala Lys Asn Ala Tyr Ser 290 295 300 Ala Val Val Leu Ser Ser Ile Ile Thr Val Ala Glu Thr Glu Thr Asn 305 310 315 320 Ala Lys Leu Ser Ala Ser Met Ile Glu Arg Phe Asp Thr His Glu Glu 325 330 335 Asp Leu Gly Glu Leu Lys Ala Phe Ile Lys Leu His Leu Pro Lys His 340 345 350 Tyr Glu Glu Ile Phe Ser Asn Thr Glu Lys His Gly Tyr Ala Gly Tyr 355 360 365 Ile Asp Gly Lys Thr Lys Gln Ala Asp Phe Tyr Lys Tyr Met Lys Met 370 375 380 Thr Leu Glu Asn Ile Glu Gly Ala Asp Tyr Phe Ile Ala Lys Ile Glu 385 390 395 400 Lys Glu Asn Phe Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ala Ile 405 410 415 Pro His Gln Leu His Leu Glu Glu Leu Glu Ala Ile Leu His Gln Gln 420 425 430 Ala Lys Tyr Tyr Pro Phe Leu Lys Glu Asn Tyr Asp Lys Ile Lys Ser 435 440 445 Leu Val Thr Phe Arg Ile Pro Tyr Phe Val Gly Pro Leu Ala Asn Gly 450 455 460 Gln Ser Glu Phe Ala Trp Leu Thr Arg Lys Ala Asp Gly Glu Ile Arg 465 470 475 480 Pro Trp Asn Ile Glu Glu Lys Val Asp Phe Gly Lys Ser Ala Val Asp 485 490 495 Phe Ile Glu Lys Met Thr Asn Lys Asp Thr Tyr Leu Pro Lys Glu Asn 500 505 510 Val Leu Pro Lys His Ser Leu Cys Tyr Gln Lys Tyr Leu Val Tyr Asn 515 520 525 Glu Leu Thr Lys Val Arg Tyr Ile Asn Asp Gln Gly Lys Thr Ser Tyr 530 535 540 Phe Ser Gly Gln Glu Lys Glu Gln Ile Phe Asn Asp Leu Phe Lys Gln 545 550 555 560 Lys Arg Lys Val Lys Lys Lys Asp Leu Glu Leu Phe Leu Arg Asn Met 565 570 575 Ser His Val Glu Ser Pro Thr Ile Glu Gly Leu Glu Asp Ser Phe Asn 580 585 590 Ser Ser Tyr Ser Thr Tyr His Asp Leu Leu Lys Val Gly Ile Lys Gln 595 600 605 Glu Ile Leu Asp Asn Pro Val Asn Thr Glu Met Leu Glu Asn Ile Val 610 615 620 Lys Ile Leu Thr Val Phe Glu Asp Lys Arg Met Ile Lys Glu Gln Leu 625 630 635 640 Gln Gln Phe Ser Asp Val Leu Asp Gly Val Val Leu Lys Lys Leu Glu 645 650 655 Arg Arg His Tyr Thr Gly Trp Gly Arg Leu Ser Ala Lys Leu Leu Met 660 665 670 Gly Ile Arg Asp Lys Gln Ser His Leu Thr Ile Leu Asp Tyr Leu Met 675 680 685 Asn Asp Asp Gly Leu Asn Arg Asn Leu Met Gln Leu Ile Asn Asp Ser 690 695 700 Asn Leu Ser Phe Lys Ser Ile Ile Glu Lys Glu Gln Val Thr Thr Ala 705 710 715 720 Asp Lys Asp Ile Gln Ser Ile Val Ala Asp Leu Ala Gly Ser Pro Ala 725 730 735 Ile Lys Lys Gly Ile Leu Gln Ser Leu Lys Ile Val Asp Glu Leu Val 740 745 750 Ser Val Met Gly Tyr Pro Pro Gln Thr Ile Val Val Glu Met Ala Arg 755 760 765 Glu Asn Gln Thr Thr Gly Lys Gly Lys Asn Asn Ser Arg Pro Arg Tyr 770 775 780 Lys Ser Leu Glu Lys Ala Ile Lys Glu Phe Gly Ser Gln Ile Leu Lys 785 790 795 800 Glu His Pro Thr Asp Asn Gln Glu Leu Arg Asn Asn Arg Leu Tyr Leu 805 810 815 Tyr Tyr Leu Gln Asn Gly Lys Asp Met Tyr Thr Gly Gln Asp Leu Asp 820 825 830 Ile His Asn Leu Ser Asn Tyr Asp Ile Asp His Ile Val Pro Gln Ser 835 840 845 Phe Ile Thr Asp Asn Ser Ile Asp Asn Leu Val Leu Thr Ser Ser Ala 850 855 860 Gly Asn Arg Glu Lys Gly Asp Asp Val Pro Pro Leu Glu Ile Val Arg 865 870 875 880 Lys Arg Lys Val Phe Trp Glu Lys Leu Tyr Gln Gly Asn Leu Met Ser 885 890 895 Lys Arg Lys Phe Asp Tyr Leu Thr Lys Ala Glu Arg Gly Gly Leu Thr 900 905 910 Glu Ala Asp Lys Ala Arg Phe Ile His Arg Gln Leu Val Glu Thr Arg 915 920 925 Gln Ile Thr Lys Asn Val Ala Asn Ile Leu His Gln Arg Phe Asn Tyr 930 935 940 Glu Lys Asp Asp His Gly Asn Thr Met Lys Gln Val Arg Ile Val Thr 945 950 955 960 Leu Lys Ser Ala Leu Val Ser Gln Phe Arg Lys Gln Phe Gln Leu Tyr 965 970 975 Lys Val Arg Asp Val Asn Asp Tyr His His Ala His Asp Ala Tyr Leu 980 985 990 Asn Gly Val Val Ala Asn Thr Leu Leu Lys Val Tyr Pro Gln Leu Glu 995 1000 1005 Pro Glu Phe Val Tyr Gly Asp Tyr His Gln Phe Asp Trp Phe Lys 1010 1015 1020 Ala Asn Lys Ala Thr Ala Lys Lys Gln Phe Tyr Thr Asn Ile Met 1025 1030 1035 Leu Phe Phe Ala Gln Lys Asp Arg Ile Ile Asp Glu Asn Gly Glu 1040 1045 1050 Ile Leu Trp Asp Lys Lys Tyr Leu Asp Thr Val Lys Lys Val Met 1055 1060 1065 Ser Tyr Arg Gln Met Asn Ile Val Lys Lys Thr Glu Ile Gln Lys 1070 1075 1080 Gly Glu Phe Ser Lys Ala Thr Ile Lys Pro Lys Gly Asn Ser Ser 1085 1090 1095 Lys Leu Ile Pro Arg Lys Thr Asn Trp Asp Pro Met Lys Tyr Gly 1100 1105 1110 Gly Leu Asp Ser Pro Asn Met Ala Tyr Ala Val Val Ile Glu Tyr 1115 1120 1125 Ala Lys Gly Lys Asn Lys Leu Val Phe Glu Lys Lys Ile Ile Arg 1130 1135 1140 Val Thr Ile Met Glu Arg Lys Ala Phe Glu Lys Asp Glu Lys Ala 1145 1150 1155 Phe Leu Glu Glu Gln Gly Tyr Arg Gln Pro Lys Val Leu Ala Lys 1160 1165 1170 Leu Pro Lys Tyr Thr Leu Tyr Glu Cys Glu Glu Gly Arg Arg Arg 1175 1180 1185 Met Leu Ala Ser Ala Asn Glu Ala Gln Lys Gly Asn Gln Gln Val 1190 1195 1200 Leu Pro Asn His Leu Val Thr Leu Leu His His Ala Ala Asn Cys 1205 1210 1215 Glu Val Ser Asp Gly Lys Ser Leu Asp Tyr Ile Glu Ser Asn Arg 1220 1225 1230 Glu Met Phe Ala Glu Leu Leu Ala His Val Ser Glu Phe Ala Lys 1235 1240 1245 Arg Tyr Thr Leu Ala Glu Ala Asn Leu Asn Lys Ile Asn Gln Leu 1250 1255 1260 Phe Glu Gln Asn Lys Glu Gly Asp Ile Lys Ala Ile Ala Gln Ser 1265 1270 1275 Phe Val Asp Leu Met Ala Phe Asn Ala Met Gly Ala Pro Ala Ser 1280 1285 1290 Phe Lys Phe Phe Glu Thr Thr Ile Glu Arg Lys Arg Tyr Asn Asn 1295 1300 1305 Leu Lys Glu Leu Leu Asn Ser Thr Ile Ile Tyr Gln Ser Ile Thr 1310 1315 1320 Gly Leu Tyr Glu Ser Arg Lys Arg Leu Asp Asp 1325 1330 <210> 6 <211> 1053 <212> PRT <213> Staphylococcus aureus <400> 6 Met Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile Thr Ser Val 1 5 10 15 Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly 20 25 30 Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg 35 40 45 Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile 50 55 60 Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His 65 70 75 80 Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu 85 90 95 Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu 100 105 110 Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr 115 120 125 Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala 130 135 140 Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys 145 150 155 160 Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr 165 170 175 Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln 180 185 190 Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg 195 200 205 Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys 210 215 220 Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe 225 230 235 240 Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr 245 250 255 Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn 260 265 270 Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe 275 280 285 Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu 290 295 300 Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys 305 310 315 320 Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr 325 330 335 Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala 340 345 350 Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu 355 360 365 Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser 370 375 380 Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile 385 390 395 400 Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala 405 410 415 Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln 420 425 430 Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro 435 440 445 Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile 450 455 460 Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg 465 470 475 480 Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys 485 490 495 Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr 500 505 510 Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp 515 520 525 Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu 530 535 540 Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro 545 550 555 560 Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys 565 570 575 Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu 580 585 590 Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile 595 600 605 Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu 610 615 620 Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp 625 630 635 640 Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu 645 650 655 Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys 660 665 670 Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp 675 680 685 Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp 690 695 700 Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys 705 710 715 720 Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys 725 730 735 Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu 740 745 750 Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp 755 760 765 Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile 770 775 780 Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu 785 790 795 800 Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu 805 810 815 Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His 820 825 830 Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly 835 840 845 Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr 850 855 860 Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile 865 870 875 880 Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp 885 890 895 Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr 900 905 910 Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val 915 920 925 Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser 930 935 940 Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala 945 950 955 960 Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly 965 970 975 Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile 980 985 990 Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met 995 1000 1005 Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys 1010 1015 1020 Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu 1025 1030 1035 Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly 1040 1045 1050 <210> 7 <211> 3159 <212> DNA <213> Staphylococcus aureus <400> 7 atgaaaagga actacattct ggggctggac atcgggatta caagcgtggg gtatgggatt 60 attgactatg aaacaaggga cgtgatcgac gcaggcgtca gactgttcaa ggaggccaac 120 gtggaaaaca atgagggacg gagaagcaag aggggagcca ggcgcctgaa acgacggaga 180 aggcacagaa tccagagggt gaagaaactg ctgttcgatt acaacctgct gaccgaccat 240 tctgagctga gtggaattaa tccttatgaa gccagggtga aaggcctgag tcagaagctg 300 tcagaggaag agttttccgc agctctgctg cacctggcta agcgccgagg agtgcataac 360 gtcaatgagg tggaagagga caccggcaac gagctgtcta caaaggaaca gatctcacgc 420 aatagcaaag ctctggaaga gaagtatgtc gcagagctgc agctggaacg gctgaagaaa 480 gatggcgagg tgagagggtc aattaatagg ttcaagacaa gcgactacgt caaagaagcc 540 aagcagctgc tgaaagtgca gaaggcttac caccagctgg atcagagctt catcgatact 600 tatatcgacc tgctggagac tcggagaacc tactatgagg gaccaggaga agggagcccc 660 ttcggatgga aagacatcaa ggaatggtac gagatgctga tgggacattg cacctatttt 720 ccagaagagc tgagaagcgt caagtacgct tataacgcag atctgtacaa cgccctgaat 780 gacctgaaca acctggtcat caccagggat gaaaacgaga aactggaata ctatgagaag 840 ttccagatca tcgaaaacgt gtttaagcag aagaaaaagc ctacactgaa acagattgct 900 aaggagatcc tggtcaacga agaggacatc aagggctacc gggtgacaag cactggaaaa 960 ccagagttca ccaatctgaa agtgtatcac gatattaagg acatcacagc acggaaagaa 1020 atcattgaga acgccgaact gctggatcag attgctaaga tcctgactat ctaccagagc 1080 tccgaggaca tccaggaaga gctgactaac ctgaacagcg agctgaccca ggaagagatc 1140 gaacagatta gtaatctgaa ggggtacacc ggaacacaca acctgtccct gaaagctatc 1200 aatctgattc tggatgagct gtggcataca aacgacaatc agattgcaat ctttaaccgg 1260 ctgaagctgg tcccaaaaaa ggtggacctg agtcagcaga aagagatccc aaccacactg 1320 gtggacgatt tcattctgtc acccgtggtc aagcggagct tcatccagag catcaaagtg 1380 atcaacgcca tcatcaagaa gtacggcctg cccaatgata tcattatcga gctggctagg 1440 gagaagaaca gcaaggacgc acagaagatg atcaatgaga tgcagaaacg aaaccggcag 1500 accaatgaac gcattgaaga gattatccga actaccggga aagagaacgc aaagtacctg 1560 attgaaaaaa tcaagctgca cgatatgcag gagggaaagt gtctgtattc tctggaggcc 1620 atccccctgg aggacctgct gaacaatcca ttcaactacg aggtcgatca tattatcccc 1680 agaagcgtgt ccttcgacaa ttcctttaac aacaaggtgc tggtcaagca ggaagagaac 1740 tctaaaaagg gcaataggac tcctttccag tacctgtcta gttcagattc caagatctct 1800 tacgaaacct ttaaaaagca cattctgaat ctggccaaag gaaagggccg catcagcaag 1860 accaaaaagg agtacctgct ggaagagcgg gacatcaaca gattctccgt ccagaaggat 1920 tttattaacc ggaatctggt ggacacaaga tacgctactc gcggcctgat gaatctgctg 1980 cgatcctatt tccgggtgaa caatctggat gtgaaagtca agtccatcaa cggcgggttc 2040 acatcttttc tgaggcgcaa atggaagttt aaaaaggagc gcaacaaagg gtacaagcac 2100 catgccgaag atgctctgat tatcgcaaat gccgacttca tctttaagga gtggaaaaag 2160 ctggacaaag ccaagaaagt gatggagaac cagatgttcg aagagaagca ggccgaatct 2220 atgcccgaaa tcgagacaga acaggagtac aaggagattt tcatcactcc tcaccagatc 2280 aagcatatca aggatttcaa ggactacaag tactctcacc gggtggataa aaagcccaac 2340 agagagctga tcaatgacac cctgtatagt acaagaaaag acgataaggg gaataccctg 2400 attgtgaaca atctgaacgg actgtacgac aaagataatg acaagctgaa aaagctgatc 2460 aacaaaagtc ccgagaagct gctgatgtac caccatgatc ctcagacata tcagaaactg 2520 aagctgatta tggagcagta cggcgacgag aagaacccac tgtataagta ctatgaagag 2580 actgggaact acctgaccaa gtatagcaaa aaggataatg gccccgtgat caagaagatc 2640 aagtactatg ggaacaagct gaatgcccat ctggacatca cagacgatta ccctaacagt 2700 cgcaacaagg tggtcaagct gtcactgaag ccatacagat tcgatgtcta tctggacaac 2760 ggcgtgtata aatttgtgac tgtcaagaat ctggatgtca tcaaaaagga gaactactat 2820 gaagtgaata gcaagtgcta cgaagaggct aaaaagctga aaaagattag caaccaggca 2880 gagttcatcg cctcctttta caacaacgac ctgattaaga tcaatggcga actgtatagg 2940 gtcatcgggg tgaacaatga tctgctgaac cgcattgaag tgaatatgat tgacatcact 3000 taccgagagt atctggaaaa catgaatgat aagcgccccc ctcgaattat caaaacaatt 3060 gcctctaaga ctcagagtat caaaaagtac tcaaccgaca ttctgggaaa cctgtatgag 3120 gtgaagagca aaaagcaccc tcagattatc aaaaagggc 3159 <210> 8 <211> 3159 <212> DNA <213> Staphylococcus aureus <400> 8 atgaagcgga actacatcct gggcctggac atcggcatca ccagcgtggg ctacggcatc 60 atcgactacg agacacggga cgtgatcgat gccggcgtgc ggctgttcaa agaggccaac 120 gtggaaaaca acgagggcag gcggagcaag agaggcgcca gaaggctgaa gcggcggagg 180 cggcatagaa tccagagagt gaagaagctg ctgttcgact acaacctgct gaccgaccac 240 agcgagctga gcggcatcaa cccctacgag gccagagtga agggcctgag ccagaagctg 300 agcgaggaag agttctctgc cgccctgctg cacctggcca agagaagagg cgtgcacaac 360 gtgaacgagg tggaagagga caccggcaac gagctgtcca ccaaagagca gatcagccgg 420 aacagcaagg ccctggaaga gaaatacgtg gccgaactgc agctggaacg gctgaagaaa 480 gacggcgaag tgcggggcag catcaacaga ttcaagacca gcgactacgt gaaagaagcc 540 aaacagctgc tgaaggtgca gaaggcctac caccagctgg accagagctt catcgacacc 600 tacatcgacc tgctggaaac ccggcggacc tactatgagg gacctggcga gggcagcccc 660 ttcggctgga aggacatcaa agaatggtac gagatgctga tgggccactg cacctacttc 720 cccgaggaac tgcggagcgt gaagtacgcc tacaacgccg acctgtacaa cgccctgaac 780 gacctgaaca atctcgtgat caccagggac gagaacgaga agctggaata ttacgagaag 840 ttccagatca tcgagaacgt gttcaagcag aagaagaagc ccaccctgaa gcagatcgcc 900 aaagaaatcc tcgtgaacga agaggatatt aagggctaca gagtgaccag caccggcaag 960 cccgagttca ccaacctgaa ggtgtaccac gacatcaagg acattaccgc ccggaaagag 1020 attattgaga acgccgagct gctggatcag attgccaaga tcctgaccat ctaccagagc 1080 agcgaggaca tccaggaaga actgaccaat ctgaactccg agctgaccca ggaagagatc 1140 gagcagatct ctaatctgaa gggctatacc ggcacccaca acctgagcct gaaggccatc 1200 aacctgatcc tggacgagct gtggcacacc aacgacaacc agatcgctat cttcaaccgg 1260 ctgaagctgg tgcccaagaa ggtggacctg tcccagcaga aagagatccc caccaccctg 1320 gtggacgact tcatcctgag ccccgtcgtg aagagaagct tcatccagag catcaaagtg 1380 atcaacgcca tcatcaagaa gtacggcctg cccaacgaca tcattatcga gctggcccgc 1440 gagaagaact ccaaggacgc ccagaaaatg atcaacgaga tgcagaagcg gaaccggcag 1500 accaacgagc ggatcgagga aatcatccgg accaccggca aagagaacgc caagtacctg 1560 atcgagaaga tcaagctgca cgacatgcag gaaggcaagt gcctgtacag cctggaagcc 1620 atccctctgg aagatctgct gaacaacccc ttcaactatg aggtggacca catcatcccc 1680 agaagcgtgt ccttcgacaa cagcttcaac aacaaggtgc tcgtgaagca ggaagaaaac 1740 agcaagaagg gcaaccggac cccattccag tacctgagca gcagcgacag caagatcagc 1800 tacgaaacct tcaagaagca catcctgaat ctggccaagg gcaagggcag aatcagcaag 1860 accaagaaag agtatctgct ggaagaacgg gacatcaaca ggttctccgt gcagaaagac 1920 ttcatcaacc ggaacctggt ggataccaga tacgccacca gaggcctgat gaacctgctg 1980 cggagctact tcagagtgaa caacctggac gtgaaagtga agtccatcaa tggcggcttc 2040 accagctttc tgcggcggaa gtggaagttt aagaaagagc ggaacaaggg gtacaagcac 2100 cacgccgagg acgccctgat cattgccaac gccgatttca tcttcaaaga gtggaagaaa 2160 ctggacaagg ccaaaaaagt gatggaaaac cagatgttcg aggaaaagca ggccgagagc 2220 atgcccgaga tcgaaaccga gcaggagtac aaagagatct tcatcacccc ccaccagatc 2280 aagcacatta aggacttcaa ggactacaag tacagccacc gggtggacaa gaagcctaat 2340 agagagctga ttaacgacac cctgtactcc acccggaagg acgacaaggg caacaccctg 2400 atcgtgaaca atctgaacgg cctgtacgac aaggacaatg acaagctgaa aaagctgatc 2460 aacaagagcc ccgaaaagct gctgatgtac caccacgacc cccagaccta ccagaaactg 2520 aagctgatta tggaacagta cggcgacgag aagaatcccc tgtacaagta ctacgaggaa 2580 accgggaact acctgaccaa gtactccaaa aaggacaacg gccccgtgat caagaagatt 2640 aagtattacg gcaacaaact gaacgcccat ctggacatca ccgacgacta ccccaacagc 2700 agaaacaagg tcgtgaagct gtccctgaag ccctacagat tcgacgtgta cctggacaat 2760 ggcgtgtaca agttcgtgac cgtgaagaat ctggatgtga tcaaaaaaga aaactactac 2820 gaagtgaata gcaagtgcta tgaggaagct aagaagctga agaagatcag caaccaggcc 2880 gagtttatcg cctccttcta caacaacgat ctgatcaaga tcaacggcga gctgtataga 2940 gtgatcggcg tgaacaacga cctgctgaac cggatcgaag tgaacatgat cgacatcacc 3000 taccgcgagt acctggaaaa catgaacgac aagaggcccc ccaggatcat taagacaatc 3060 gcctccaaga cccagagcat taagaagtac agcacagaca ttctgggcaa cctgtatgaa 3120 gtgaaatcta agaagcaccc tcagatcatc aaaaagggc 3159 <210> 9 <211> 3159 <212> DNA <213> Staphylococcus aureus <400> 9 atgaagcgca actacatcct cggactggac atcggcatta cctccgtggg atacggcatc 60 atcgattacg aaactaggga tgtgatcgac gctggagtca ggctgttcaa agaggcgaac 120 gtggagaaca acgaggggcg gcgctcaaag aggggggccc gccggctgaa gcgccgccgc 180 agacatagaa tccagcgcgt gaagaagctg ctgttcgact acaaccttct gaccgaccac 240 tccgaacttt ccggcatcaa cccatatgag gctagagtga agggattgtc ccaaaagctg 300 tccgaggaag agttctccgc cgcgttgctc cacctcgcca agcgcagggg agtgcacaat 360 gtgaacgaag tggaagaaga taccggaaac gagctgtcca ccaaggagca gatcagccgg 420 aactccaagg ccctggaaga gaaatacgtg gcggaactgc aactggagcg gctgaagaaa 480 gacggagaag tgcgcggctc gatcaaccgc ttcaagacct cggactacgt gaaggaggcc 540 aagcagctcc tgaaagtgca aaaggcctat caccaacttg accagtcctt tatcgatacc 600 tacatcgatc tgctcgagac tcggcggact tactacgagg gtccagggga gggctcccca 660 tttggttgga aggatattaa ggagtggtac gaaatgctga tgggacactg cacatacttc 720 cctgaggagc tgcggagcgt gaaatacgca tacaacgcag acctgtacaa cgcgctgaac 780 gacctgaaca atctcgtgat cacccgggac gagaacgaaa agctcgagta ttacgaaaag 840 ttccagatta ttgagaacgt gttcaaacag aagaagaagc cgacactgaa gcagattgcc 900 aaggaaatcc tcgtgaacga agaggacatc aagggctatc gagtgacctc aacgggaaag 960 ccggagttca ccaatctgaa ggtctaccac gacatcaaag acattaccgc ccggaaggag 1020 atcattgaga acgcggagct gttggaccag attgcgaaga ttctgaccat ctaccaatcc 1080 tccgaggata ttcaggaaga actcaccaac ctcaacagcg aactgaccca ggaggagata 1140 gagcaaatct ccaacctgaa gggctacacc ggaactcata acctgagcct gaaggccatc 1200 aacttgatcc tggacgagct gtggcacacc aacgataacc agatcgctat tttcaatcgg 1260 ctgaagctgg tccccaagaa agtggacctc tcacaacaaa aggagatccc tactaccctt 1320 gtggacgatt tcattctgtc ccccgtggtc aagagaagct tcatacagtc aatcaaagtg 1380 atcaatgcca ttatcaagaa atacggtctg cccaacgaca ttatcattga gctcgcccgc 1440 gagaagaact cgaaggacgc ccagaagatg attaacgaaa tgcagaagag gaaccgacag 1500 actaacgaac ggatcgaaga aatcatccgg accaccggga aggaaaacgc gaagtacctg 1560 atcgaaaaga tcaagctcca tgacatgcag gaaggaaagt gtctgtactc gctggaggcc 1620 attccgctgg aggacttgct gaacaaccct tttaactacg aagtggatca tatcattccg 1680 aggagcgtgt cattcgacaa ttccttcaac aacaaggtcc tcgtgaagca ggaggaaaac 1740 tcgaagaagg gaaaccgcac gccgttccag tacctgagca gcagcgactc caagatttcc 1800 tacgaaacct tcaagaagca catcctcaac ctggcaaagg ggaagggtcg catctccaag 1860 accaagaagg aatatctgct ggaagaaaga gacatcaaca gattctccgt gcaaaaggac 1920 ttcatcaacc gcaacctcgt ggatactaga tacgctactc ggggtctgat gaacctcctg 1980 agaagctact ttagagtgaa caatctggac gtgaaggtca agtcgattaa cggaggtttc 2040 acctccttcc tgcggcgcaa gtggaagttc aagaaggaac ggaacaaggg ctacaagcac 2100 cacgccgagg acgccctgat cattgccaac gccgacttca tcttcaaaga atggaagaaa 2160 cttgacaagg ctaagaaggt catggaaaac cagatgttcg aagaaaagca ggccgagtct 2220 atgcctgaaa tcgagactga acaggagtac aaggaaatct ttattacgcc acaccagatc 2280 aaacacatca aggatttcaa ggattacaag tactcacatc gcgtggacaa aaagccgaac 2340 agggaactga tcaacgacac cctctactcc acccggaagg atgacaaagg gaataccctc 2400 atcgtcaaca accttaacgg cctgtacgac aaggacaacg ataagctgaa gaagctcatt 2460 aacaagtcgc ccgaaaagtt gctgatgtac caccacgacc ctcagactta ccagaagctc 2520 aagctgatca tggagcagta tggggacgag aaaaacccgt tgtacaagta ctacgaagaa 2580 actgggaatt atctgactaa gtactccaag aaagataacg gccccgtgat taagaagatt 2640 aagtactacg gcaacaagct gaacgcccat ctggacatca ccgatgacta ccctaattcc 2700 cgcaacaagg tcgtcaagct gagcctcaag ccctaccggt ttgatgtgta ccttgacaat 2760 ggagtgtaca agttcgtgac tgtgaagaac cttgacgtga tcaagaagga gaactactac 2820 gaagtcaact ccaagtgcta cgaggaagca aagaagttga agaagatctc gaaccaggcc 2880 gagttcattg cctccttcta taacaacgac ctgattaaga tcaacggcga actgtaccgc 2940 gtcattggcg tgaacaacga tctcctgaac cgcatcgaag tgaacatgat cgacatcact 3000 taccgggaat acctggagaa tatgaacgac aagcgcccgc cccggatcat taagactatc 3060 gcctcaaaga cccagtcgat caagaagtac agcaccgaca tcctgggcaa cctgtacgag 3120 gtcaaatcga agaagcaccc ccagatcatc aagaaggga 3159 <210> 10 <211> 3159 <212> DNA <213> Staphylococcus aureus <400> 10 atgaaaagga actacattct ggggctggcc atcgggatta caagcgtggg gtatgggatt 60 attgactatg aaacaaggga cgtgatcgac gcaggcgtca gactgttcaa ggaggccaac 120 gtggaaaaca atgagggacg gagaagcaag aggggagcca ggcgcctgaa acgacggaga 180 aggcacagaa tccagagggt gaagaaactg ctgttcgatt acaacctgct gaccgaccat 240 tctgagctga gtggaattaa tccttatgaa gccagggtga aaggcctgag tcagaagctg 300 tcagaggaag agttttccgc agctctgctg cacctggcta agcgccgagg agtgcataac 360 gtcaatgagg tggaagagga caccggcaac gagctgtcta caaaggaaca gatctcacgc 420 aatagcaaag ctctggaaga gaagtatgtc gcagagctgc agctggaacg gctgaagaaa 480 gatggcgagg tgagagggtc aattaatagg ttcaagacaa gcgactacgt caaagaagcc 540 aagcagctgc tgaaagtgca gaaggcttac caccagctgg atcagagctt catcgatact 600 tatatcgacc tgctggagac tcggagaacc tactatgagg gaccaggaga agggagcccc 660 ttcggatgga aagacatcaa ggaatggtac gagatgctga tgggacattg cacctatttt 720 ccagaagagc tgagaagcgt caagtacgct tataacgcag atctgtacaa cgccctgaat 780 gacctgaaca acctggtcat caccagggat gaaaacgaga aactggaata ctatgagaag 840 ttccagatca tcgaaaacgt gtttaagcag aagaaaaagc ctacactgaa acagattgct 900 aaggagatcc tggtcaacga agaggacatc aagggctacc gggtgacaag cactggaaaa 960 ccagagttca ccaatctgaa agtgtatcac gatattaagg acatcacagc acggaaagaa 1020 atcattgaga acgccgaact gctggatcag attgctaaga tcctgactat ctaccagagc 1080 tccgaggaca tccaggaaga gctgactaac ctgaacagcg agctgaccca ggaagagatc 1140 gaacagatta gtaatctgaa ggggtacacc ggaacacaca acctgtccct gaaagctatc 1200 aatctgattc tggatgagct gtggcataca aacgacaatc agattgcaat ctttaaccgg 1260 ctgaagctgg tcccaaaaaa ggtggacctg agtcagcaga aagagatccc aaccacactg 1320 gtggacgatt tcattctgtc acccgtggtc aagcggagct tcatccagag catcaaagtg 1380 atcaacgcca tcatcaagaa gtacggcctg cccaatgata tcattatcga gctggctagg 1440 gagaagaaca gcaaggacgc acagaagatg atcaatgaga tgcagaaacg aaaccggcag 1500 accaatgaac gcattgaaga gattatccga actaccggga aagagaacgc aaagtacctg 1560 attgaaaaaa tcaagctgca cgatatgcag gagggaaagt gtctgtattc tctggaggcc 1620 atccccctgg aggacctgct gaacaatcca ttcaactacg aggtcgatca tattatcccc 1680 agaagcgtgt ccttcgacaa ttcctttaac aacaaggtgc tggtcaagca ggaagagaac 1740 tctaaaaagg gcaataggac tcctttccag tacctgtcta gttcagattc caagatctct 1800 tacgaaacct ttaaaaagca cattctgaat ctggccaaag gaaagggccg catcagcaag 1860 accaaaaagg agtacctgct ggaagagcgg gacatcaaca gattctccgt ccagaaggat 1920 tttattaacc ggaatctggt ggacacaaga tacgctactc gcggcctgat gaatctgctg 1980 cgatcctatt tccgggtgaa caatctggat gtgaaagtca agtccatcaa cggcgggttc 2040 acatcttttc tgaggcgcaa atggaagttt aaaaaggagc gcaacaaagg gtacaagcac 2100 catgccgaag atgctctgat tatcgcaaat gccgacttca tctttaagga gtggaaaaag 2160 ctggacaaag ccaagaaagt gatggagaac cagatgttcg aagagaagca ggccgaatct 2220 atgcccgaaa tcgagacaga acaggagtac aaggagattt tcatcactcc tcaccagatc 2280 aagcatatca aggatttcaa ggactacaag tactctcacc gggtggataa aaagcccaac 2340 agagagctga tcaatgacac cctgtatagt acaagaaaag acgataaggg gaataccctg 2400 attgtgaaca atctgaacgg actgtacgac aaagataatg acaagctgaa aaagctgatc 2460 aacaaaagtc ccgagaagct gctgatgtac caccatgatc ctcagacata tcagaaactg 2520 aagctgatta tggagcagta cggcgacgag aagaacccac tgtataagta ctatgaagag 2580 actgggaact acctgaccaa gtatagcaaa aaggataatg gccccgtgat caagaagatc 2640 aagtactatg ggaacaagct gaatgcccat ctggacatca cagacgatta ccctaacagt 2700 cgcaacaagg tggtcaagct gtcactgaag ccatacagat tcgatgtcta tctggacaac 2760 ggcgtgtata aatttgtgac tgtcaagaat ctggatgtca tcaaaaagga gaactactat 2820 gaagtgaata gcaagtgcta cgaagaggct aaaaagctga aaaagattag caaccaggca 2880 gagttcatcg cctcctttta caacaacgac ctgattaaga tcaatggcga actgtatagg 2940 gtcatcgggg tgaacaatga tctgctgaac cgcattgaag tgaatatgat tgacatcact 3000 taccgagagt atctggaaaa catgaatgat aagcgccccc ctcgaattat caaaacaatt 3060 gcctctaaga ctcagagtat caaaaagtac tcaaccgaca ttctgggaaa cctgtatgag 3120 gtgaagagca aaaagcaccc tcagattatc aaaaagggc 3159 <210> 11 <211> 3159 <212> DNA <213> Staphylococcus aureus <400> 11 atgaaaagga actacattct ggggctggac atcgggatta caagcgtggg gtatgggatt 60 attgactatg aaacaaggga cgtgatcgac gcaggcgtca gactgttcaa ggaggccaac 120 gtggaaaaca atgagggacg gagaagcaag aggggagcca ggcgcctgaa acgacggaga 180 aggcacagaa tccagagggt gaagaaactg ctgttcgatt acaacctgct gaccgaccat 240 tctgagctga gtggaattaa tccttatgaa gccagggtga aaggcctgag tcagaagctg 300 tcagaggaag agttttccgc agctctgctg cacctggcta agcgccgagg agtgcataac 360 gtcaatgagg tggaagagga caccggcaac gagctgtcta caaaggaaca gatctcacgc 420 aatagcaaag ctctggaaga gaagtatgtc gcagagctgc agctggaacg gctgaagaaa 480 gatggcgagg tgagagggtc aattaatagg ttcaagacaa gcgactacgt caaagaagcc 540 aagcagctgc tgaaagtgca gaaggcttac caccagctgg atcagagctt catcgatact 600 tatatcgacc tgctggagac tcggagaacc tactatgagg gaccaggaga agggagcccc 660 ttcggatgga aagacatcaa ggaatggtac gagatgctga tgggacattg cacctatttt 720 ccagaagagc tgagaagcgt caagtacgct tataacgcag atctgtacaa cgccctgaat 780 gacctgaaca acctggtcat caccagggat gaaaacgaga aactggaata ctatgagaag 840 ttccagatca tcgaaaacgt gtttaagcag aagaaaaagc ctacactgaa acagattgct 900 aaggagatcc tggtcaacga agaggacatc aagggctacc gggtgacaag cactggaaaa 960 ccagagttca ccaatctgaa agtgtatcac gatattaagg acatcacagc acggaaagaa 1020 atcattgaga acgccgaact gctggatcag attgctaaga tcctgactat ctaccagagc 1080 tccgaggaca tccaggaaga gctgactaac ctgaacagcg agctgaccca ggaagagatc 1140 gaacagatta gtaatctgaa ggggtacacc ggaacacaca acctgtccct gaaagctatc 1200 aatctgattc tggatgagct gtggcataca aacgacaatc agattgcaat ctttaaccgg 1260 ctgaagctgg tcccaaaaaa ggtggacctg agtcagcaga aagagatccc aaccacactg 1320 gtggacgatt tcattctgtc acccgtggtc aagcggagct tcatccagag catcaaagtg 1380 atcaacgcca tcatcaagaa gtacggcctg cccaatgata tcattatcga gctggctagg 1440 gagaagaaca gcaaggacgc acagaagatg atcaatgaga tgcagaaacg aaaccggcag 1500 accaatgaac gcattgaaga gattatccga actaccggga aagagaacgc aaagtacctg 1560 attgaaaaaa tcaagctgca cgatatgcag gagggaaagt gtctgtattc tctggaggcc 1620 atccccctgg aggacctgct gaacaatcca ttcaactacg aggtcgatca tattatcccc 1680 agaagcgtgt ccttcgacaa ttcctttaac aacaaggtgc tggtcaagca ggaagaggcc 1740 tctaaaaagg gcaataggac tcctttccag tacctgtcta gttcagattc caagatctct 1800 tacgaaacct ttaaaaagca cattctgaat ctggccaaag gaaagggccg catcagcaag 1860 accaaaaagg agtacctgct ggaagagcgg gacatcaaca gattctccgt ccagaaggat 1920 tttattaacc ggaatctggt ggacacaaga tacgctactc gcggcctgat gaatctgctg 1980 cgatcctatt tccgggtgaa caatctggat gtgaaagtca agtccatcaa cggcgggttc 2040 acatcttttc tgaggcgcaa atggaagttt aaaaaggagc gcaacaaagg gtacaagcac 2100 catgccgaag atgctctgat tatcgcaaat gccgacttca tctttaagga gtggaaaaag 2160 ctggacaaag ccaagaaagt gatggagaac cagatgttcg aagagaagca ggccgaatct 2220 atgcccgaaa tcgagacaga acaggagtac aaggagattt tcatcactcc tcaccagatc 2280 aagcatatca aggatttcaa ggactacaag tactctcacc gggtggataa aaagcccaac 2340 agagagctga tcaatgacac cctgtatagt acaagaaaag acgataaggg gaataccctg 2400 attgtgaaca atctgaacgg actgtacgac aaagataatg acaagctgaa aaagctgatc 2460 aacaaaagtc ccgagaagct gctgatgtac caccatgatc ctcagacata tcagaaactg 2520 aagctgatta tggagcagta cggcgacgag aagaacccac tgtataagta ctatgaagag 2580 actgggaact acctgaccaa gtatagcaaa aaggataatg gccccgtgat caagaagatc 2640 aagtactatg ggaacaagct gaatgcccat ctggacatca cagacgatta ccctaacagt 2700 cgcaacaagg tggtcaagct gtcactgaag ccatacagat tcgatgtcta tctggacaac 2760 ggcgtgtata aatttgtgac tgtcaagaat ctggatgtca tcaaaaagga gaactactat 2820 gaagtgaata gcaagtgcta cgaagaggct aaaaagctga aaaagattag caaccaggca 2880 gagttcatcg cctcctttta caacaacgac ctgattaaga tcaatggcga actgtatagg 2940 gtcatcgggg tgaacaatga tctgctgaac cgcattgaag tgaatatgat tgacatcact 3000 taccgagagt atctggaaaa catgaatgat aagcgccccc ctcgaattat caaaacaatt 3060 gcctctaaga ctcagagtat caaaaagtac tcaaccgaca ttctgggaaa cctgtatgag 3120 gtgaagagca aaaagcaccc tcagattatc aaaaagggc 3159 <210> 12 <211> 1082 <212> PRT <213> Neisseria meningitidis <400> 12 Met Ala Ala Phe Lys Pro Asn Pro Ile Asn Tyr Ile Leu Gly Leu Asp 1 5 10 15 Ile Gly Ile Ala Ser Val Gly Trp Ala Met Val Glu Ile Asp Glu Asp 20 25 30 Glu Asn Pro Ile Cys Leu Ile Asp Leu Gly Val Arg Val Phe Glu Arg 35 40 45 Ala Glu Val Pro Lys Thr Gly Asp Ser Leu Ala Met Ala Arg Arg Leu 50 55 60 Ala Arg Ser Val Arg Arg Leu Thr Arg Arg Arg Ala His Arg Leu Leu 65 70 75 80 Arg Ala Arg Arg Leu Leu Lys Arg Glu Gly Val Leu Gln Ala Ala Asp 85 90 95 Phe Asp Glu Asn Gly Leu Ile Lys Ser Leu Pro Asn Thr Pro Trp Gln 100 105 110 Leu Arg Ala Ala Ala Leu Asp Arg Lys Leu Thr Pro Leu Glu Trp Ser 115 120 125 Ala Val Leu Leu His Leu Ile Lys His Arg Gly Tyr Leu Ser Gln Arg 130 135 140 Lys Asn Glu Gly Glu Thr Ala Asp Lys Glu Leu Gly Ala Leu Leu Lys 145 150 155 160 Gly Val Ala Asp Asn Ala His Ala Leu Gln Thr Gly Asp Phe Arg Thr 165 170 175 Pro Ala Glu Leu Ala Leu Asn Lys Phe Glu Lys Glu Ser Gly His Ile 180 185 190 Arg Asn Gln Arg Gly Asp Tyr Ser His Thr Phe Ser Arg Lys Asp Leu 195 200 205 Gln Ala Glu Leu Ile Leu Leu Phe Glu Lys Gln Lys Glu Phe Gly Asn 210 215 220 Pro His Val Ser Gly Gly Leu Lys Glu Gly Ile Glu Thr Leu Leu Met 225 230 235 240 Thr Gln Arg Pro Ala Leu Ser Gly Asp Ala Val Gln Lys Met Leu Gly 245 250 255 His Cys Thr Phe Glu Pro Ala Glu Pro Lys Ala Ala Lys Asn Thr Tyr 260 265 270 Thr Ala Glu Arg Phe Ile Trp Leu Thr Lys Leu Asn Asn Leu Arg Ile 275 280 285 Leu Glu Gln Gly Ser Glu Arg Pro Leu Thr Asp Thr Glu Arg Ala Thr 290 295 300 Leu Met Asp Glu Pro Tyr Arg Lys Ser Lys Leu Thr Tyr Ala Gln Ala 305 310 315 320 Arg Lys Leu Leu Gly Leu Glu Asp Thr Ala Phe Phe Lys Gly Leu Arg 325 330 335 Tyr Gly Lys Asp Asn Ala Glu Ala Ser Thr Leu Met Glu Met Lys Ala 340 345 350 Tyr His Ala Ile Ser Arg Ala Leu Glu Lys Glu Gly Leu Lys Asp Lys 355 360 365 Lys Ser Pro Leu Asn Leu Ser Pro Glu Leu Gln Asp Glu Ile Gly Thr 370 375 380 Ala Phe Ser Leu Phe Lys Thr Asp Glu Asp Ile Thr Gly Arg Leu Lys 385 390 395 400 Asp Arg Ile Gln Pro Glu Ile Leu Glu Ala Leu Leu Lys His Ile Ser 405 410 415 Phe Asp Lys Phe Val Gln Ile Ser Leu Lys Ala Leu Arg Arg Ile Val 420 425 430 Pro Leu Met Glu Gln Gly Lys Arg Tyr Asp Glu Ala Cys Ala Glu Ile 435 440 445 Tyr Gly Asp His Tyr Gly Lys Lys Asn Thr Glu Glu Lys Ile Tyr Leu 450 455 460 Pro Pro Ile Pro Ala Asp Glu Ile Arg Asn Pro Val Val Leu Arg Ala 465 470 475 480 Leu Ser Gln Ala Arg Lys Val Ile Asn Gly Val Val Arg Arg Tyr Gly 485 490 495 Ser Pro Ala Arg Ile His Ile Glu Thr Ala Arg Glu Val Gly Lys Ser 500 505 510 Phe Lys Asp Arg Lys Glu Ile Glu Lys Arg Gln Glu Glu Asn Arg Lys 515 520 525 Asp Arg Glu Lys Ala Ala Ala Lys Phe Arg Glu Tyr Phe Pro Asn Phe 530 535 540 Val Gly Glu Pro Lys Ser Lys Asp Ile Leu Lys Leu Arg Leu Tyr Glu 545 550 555 560 Gln Gln His Gly Lys Cys Leu Tyr Ser Gly Lys Glu Ile Asn Leu Gly 565 570 575 Arg Leu Asn Glu Lys Gly Tyr Val Glu Ile Asp His Ala Leu Pro Phe 580 585 590 Ser Arg Thr Trp Asp Asp Ser Phe Asn Asn Lys Val Leu Val Leu Gly 595 600 605 Ser Glu Asn Gln Asn Lys Gly Asn Gln Thr Pro Tyr Glu Tyr Phe Asn 610 615 620 Gly Lys Asp Asn Ser Arg Glu Trp Gln Glu Phe Lys Ala Arg Val Glu 625 630 635 640 Thr Ser Arg Phe Pro Arg Ser Lys Lys Gln Arg Ile Leu Leu Gln Lys 645 650 655 Phe Asp Glu Asp Gly Phe Lys Glu Arg Asn Leu Asn Asp Thr Arg Tyr 660 665 670 Val Asn Arg Phe Leu Cys Gln Phe Val Ala Asp Arg Met Arg Leu Thr 675 680 685 Gly Lys Gly Lys Lys Arg Val Phe Ala Ser Asn Gly Gln Ile Thr Asn 690 695 700 Leu Leu Arg Gly Phe Trp Gly Leu Arg Lys Val Arg Ala Glu Asn Asp 705 710 715 720 Arg His His Ala Leu Asp Ala Val Val Val Ala Cys Ser Thr Val Ala 725 730 735 Met Gln Gln Lys Ile Thr Arg Phe Val Arg Tyr Lys Glu Met Asn Ala 740 745 750 Phe Asp Gly Lys Thr Ile Asp Lys Glu Thr Gly Glu Val Leu His Gln 755 760 765 Lys Thr His Phe Pro Gln Pro Trp Glu Phe Phe Ala Gln Glu Val Met 770 775 780 Ile Arg Val Phe Gly Lys Pro Asp Gly Lys Pro Glu Phe Glu Glu Ala 785 790 795 800 Asp Thr Pro Glu Lys Leu Arg Thr Leu Leu Ala Glu Lys Leu Ser Ser 805 810 815 Arg Pro Glu Ala Val His Glu Tyr Val Thr Pro Leu Phe Val Ser Arg 820 825 830 Ala Pro Asn Arg Lys Met Ser Gly Gln Gly His Met Glu Thr Val Lys 835 840 845 Ser Ala Lys Arg Leu Asp Glu Gly Val Ser Val Leu Arg Val Pro Leu 850 855 860 Thr Gln Leu Lys Leu Lys Asp Leu Glu Lys Met Val Asn Arg Glu Arg 865 870 875 880 Glu Pro Lys Leu Tyr Glu Ala Leu Lys Ala Arg Leu Glu Ala His Lys 885 890 895 Asp Asp Pro Ala Lys Ala Phe Ala Glu Pro Phe Tyr Lys Tyr Asp Lys 900 905 910 Ala Gly Asn Arg Thr Gln Gln Val Lys Ala Val Arg Val Glu Gln Val 915 920 925 Gln Lys Thr Gly Val Trp Val Arg Asn His Asn Gly Ile Ala Asp Asn 930 935 940 Ala Thr Met Val Arg Val Asp Val Phe Glu Lys Gly Asp Lys Tyr Tyr 945 950 955 960 Leu Val Pro Ile Tyr Ser Trp Gln Val Ala Lys Gly Ile Leu Pro Asp 965 970 975 Arg Ala Val Val Gln Gly Lys Asp Glu Glu Asp Trp Gln Leu Ile Asp 980 985 990 Asp Ser Phe Asn Phe Lys Phe Ser Leu His Pro Asn Asp Leu Val Glu 995 1000 1005 Val Ile Thr Lys Lys Ala Arg Met Phe Gly Tyr Phe Ala Ser Cys 1010 1015 1020 His Arg Gly Thr Gly Asn Ile Asn Ile Arg Ile His Asp Leu Asp 1025 1030 1035 His Lys Ile Gly Lys Asn Gly Ile Leu Glu Gly Ile Gly Val Lys 1040 1045 1050 Thr Ala Leu Ser Phe Gln Lys Tyr Gln Ile Asp Glu Leu Gly Lys 1055 1060 1065 Glu Ile Arg Pro Cys Arg Leu Lys Lys Arg Pro Pro Val Arg 1070 1075 1080 <210> 13 <211> 3249 <212> DNA <213> Neisseria meningitidis <220> <221> misc_feature <222> (1)..(3249) <223> Exemplary codon optimized Cas9 <400> 13 atggccgcct tcaagcccaa ccccatcaac tacatcctgg gcctggacat cggcatcgcc 60 agcgtgggct gggccatggt ggagatcgac gaggacgaga accccatctg cctgatcgac 120 ctgggtgtgc gcgtgttcga gcgcgctgag gtgcccaaga ctggtgacag tctggctatg 180 gctcgccggc ttgctcgctc tgttcggcgc cttactcgcc ggcgcgctca ccgccttctg 240 cgcgctcgcc gcctgctgaa gcgcgagggt gtgctgcagg ctgccgactt cgacgagaac 300 ggcctgatca agagcctgcc caacactcct tggcagctgc gcgctgccgc tctggaccgc 360 aagctgactc ctctggagtg gagcgccgtg ctgctgcacc tgatcaagca ccgcggctac 420 ctgagccagc gcaagaacga gggcgagacc gccgacaagg agctgggtgc tctgctgaag 480 ggcgtggccg acaacgccca cgccctgcag actggtgact tccgcactcc tgctgagctg 540 gccctgaaca agttcgagaa ggagagcggc cacatccgca accagcgcgg cgactacagc 600 cacaccttca gccgcaagga cctgcaggcc gagctgatcc tgctgttcga gaagcagaag 660 gagttcggca acccccacgt gagcggcggc ctgaaggagg gcatcgagac cctgctgatg 720 acccagcgcc ccgccctgag cggcgacgcc gtgcagaaga tgctgggcca ctgcaccttc 780 gagccagccg agcccaaggc cgccaagaac acctacaccg ccgagcgctt catctggctg 840 accaagctga acaacctgcg catcctggag cagggcagcg agcgccccct gaccgacacc 900 gagcgcgcca ccctgatgga cgagccctac cgcaagagca agctgaccta cgcccaggcc 960 cgcaagctgc tgggtctgga ggacaccgcc ttcttcaagg gcctgcgcta cggcaaggac 1020 aacgccgagg ccagcaccct gatggagatg aaggcctacc acgccatcag ccgcgccctg 1080 gagaaggagg gcctgaagga caagaagagt cctctgaacc tgagccccga gctgcaggac 1140 gagatcggca ccgccttcag cctgttcaag accgacgagg acatcaccgg ccgcctgaag 1200 gaccgcatcc agcccgagat cctggaggcc ctgctgaagc acatcagctt cgacaagttc 1260 gtgcagatca gcctgaaggc cctgcgccgc atcgtgcccc tgatggagca gggcaagcgc 1320 tacgacgagg cctgcgccga gatctacggc gaccactacg gcaagaagaa caccgaggag 1380 aagatctacc tgcctcctat ccccgccgac gagatccgca accccgtggt gctgcgcgcc 1440 ctgagccagg cccgcaaggt gatcaacggc gtggtgcgcc gctacggcag ccccgcccgc 1500 atccacatcg agaccgcccg cgaggtgggc aagagcttca aggaccgcaa ggagatcgag 1560 aagcgccagg aggagaaccg caaggaccgc gagaaggccg ccgccaagtt ccgcgagtac 1620 ttccccaact tcgtgggcga gcccaagagc aaggacatcc tgaagctgcg cctgtacgag 1680 cagcagcacg gcaagtgcct gtacagcggc aaggagatca acctgggccg cctgaacgag 1740 aagggctacg tggagatcga ccacgccctg cccttcagcc gcacctggga cgacagcttc 1800 aacaacaagg tgctggtgct gggcagcgag aaccagaaca agggcaacca gaccccctac 1860 gagtacttca acggcaagga caacagccgc gagtggcagg agttcaaggc ccgcgtggag 1920 accagccgct tcccccgcag caagaagcag cgcatcctgc tgcagaagtt cgacgaggac 1980 ggcttcaagg agcgcaacct gaacgacacc cgctacgtga accgcttcct gtgccagttc 2040 gtggccgacc gcatgcgcct gaccggcaag ggcaagaagc gcgtgttcgc cagcaacggc 2100 cagatcacca acctgctgcg cggcttctgg ggcctgcgca aggtgcgcgc cgagaacgac 2160 cgccaccacg ccctggacgc cgtggtggtg gcctgcagca ccgtggccat gcagcagaag 2220 atcacccgct tcgtgcgcta caaggagatg aacgccttcg acggtaaaac catcgacaag 2280 gagaccggcg aggtgctgca ccagaagacc cacttccccc agccctggga gttcttcgcc 2340 caggaggtga tgatccgcgt gttcggcaag cccgacggca agcccgagtt cgaggaggcc 2400 gacacccccg agaagctgcg caccctgctg gccgagaagc tgagcagccg ccctgaggcc 2460 gtgcacgagt acgtgactcc tctgttcgtg agccgcgccc ccaaccgcaa gatgagcggt 2520 cagggtcaca tggagaccgt gaagagcgcc aagcgcctgg acgagggcgt gagcgtgctg 2580 cgcgtgcccc tgacccagct gaagctgaag gacctggaga agatggtgaa ccgcgagcgc 2640 gagcccaagc tgtacgaggc cctgaaggcc cgcctggagg cccacaagga cgaccccgcc 2700 aaggccttcg ccgagccctt ctacaagtac gacaaggccg gcaaccgcac ccagcaggtg 2760 aaggccgtgc gcgtggagca ggtgcagaag accggcgtgt gggtgcgcaa ccacaacggc 2820 atcgccgaca acgccaccat ggtgcgcgtg gacgtgttcg agaagggcga caagtactac 2880 ctggtgccca tctacagctg gcaggtggcc aagggcatcc tgcccgaccg cgccgtggtg 2940 cagggcaagg acgaggagga ctggcagctg atcgacgaca gcttcaactt caagttcagc 3000 ctgcacccca acgacctggt ggaggtgatc accaagaagg cccgcatgtt cggctacttc 3060 gccagctgcc accgcggcac cggcaacatc aacatccgca tccacgacct ggaccacaag 3120 atcggcaaga acggcatcct ggagggcatc ggcgtgaaga ccgccctgag cttccagaag 3180 taccagatcg acgagctggg caaggagatc cgcccctgcc gcctgaagaa gcgccctcct 3240 gtgcgctaa 3249 <210> 14 <211> 859 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Cas9 consensus sequence derived from Sm, Sp, St, and Li Cas9 sequences <220> <221> misc_feature <222> (4)..(4) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (8)..(18) <223> N-terminal RuvC-like domain <220> <221> misc_feature <222> (21)..(21) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (23)..(23) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (24)..(24) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (26)..(26) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (29)..(31) <223> Each Xaa can independently be any naturally occurring amino acid <220> <221> misc_feature <222> (33)..(33) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (36)..(36) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (45)..(45) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (54)..(54) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (63)..(63) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (71)..(71) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (75)..(75) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (76)..(76) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (78)..(80) <223> Each Xaa can independently be any naturally occurring amino acid <220> <221> misc_feature <222> (82)..(82) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (84)..(84) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (85)..(85) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (89)..(89) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (90)..(90) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (98)..(98) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (100)..(100) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (106)..(106) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (113)..(113) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (116)..(116) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (125)..(125) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (126)..(126) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (128)..(133) <223> Each Xaa can independently be any naturally occurring amino acid <220> <221> misc_feature <222> (135)..(135) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (137)..(137) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (139)..(147) <223> Each Xaa can independently be any naturally occurring amino acid <220> <221> misc_feature <222> (153)..(155) <223> Each Xaa can independently be any naturally occurring amino acid <220> <221> misc_feature <222> (157)..(157) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (159)..(159) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (161)..(161) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (163)..(163) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (166)..(168) <223> Each Xaa can independently be any naturally occurring amino acid <220> <221> misc_feature <222> (170)..(170) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (171)..(171) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (173)..(175) <223> Each Xaa can independently be any naturally occurring amino acid <220> <221> misc_feature <222> (177)..(177) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (183)..(183) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (185)..(187) <223> Each Xaa can independently be any naturally occurring amino acid <220> <221> misc_feature <222> (189)..(189) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (192)..(195) <223> Each Xaa can independently be any naturally occurring amino acid <220> <221> misc_feature <222> (198)..(198) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (199)..(199) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (202)..(202) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (206)..(206) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (207)..(207) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (210)..(210) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (212)..(212) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (213)..(213) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (219)..(219) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (220)..(220) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (222)..(222) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (224)..(224) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (226)..(226) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (236)..(236) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (240)..(240) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (241)..(241) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (244)..(246) <223> Each Xaa can independently be any naturally occurring amino acid <220> <221> misc_feature <222> (248)..(248) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (249)..(249) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (250)..(250) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (252)..(254) <223> Each Xaa can independently be any naturally occurring amino acid <220> <221> misc_feature <222> (256)..(256) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (257)..(257) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (268)..(268) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (271)..(271) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (273)..(273) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (277)..(277) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (280)..(280) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (281)..(281) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (283)..(283) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (289)..(289) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (290)..(290) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (292)..(294) <223> Each Xaa can independently be any naturally occurring amino acid <220> <221> misc_feature <222> (301)..(301) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (308)..(308) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (319)..(322) <223> Each Xaa can independently be any naturally occurring amino acid <220> <221> misc_feature <222> (328)..(328) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (329)..(329) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (335)..(337) <223> Each Xaa can independently be any naturally occurring amino acid <220> <221> misc_feature <222> (346)..(346) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (347)..(347) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (356)..(361) <223> Each Xaa can independently be any naturally occurring amino acid <220> <221> misc_feature <222> (363)..(363) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (370)..(373) <223> Each Xaa can independently be any naturally occurring amino acid <220> <221> misc_feature <222> (375)..(375) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (376)..(376) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (379)..(379) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (386)..(390) <223> Each Xaa can independently be any naturally occurring amino acid <220> <221> misc_feature <222> (393)..(393) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (395)..(395) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (396)..(396) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (398)..(398) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (400)..(400) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (403)..(403) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (407)..(407) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (410)..(410) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (411)..(411) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (413)..(416) <223> Each Xaa can independently be any naturally occurring amino acid <220> <221> misc_feature <222> (418)..(418) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (422)..(422) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (428)..(428) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (431)..(431) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (433)..(433) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (437)..(439) <223> Each Xaa can independently be any naturally occurring amino acid <220> <221> misc_feature <222> (445)..(445) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (451)..(451) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (456)..(456) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (459)..(459) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (465)..(469) <223> Each Xaa can independently be any naturally occurring amino acid <220> <221> misc_feature <222> (481)..(481) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (482)..(482) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (484)..(484) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (490)..(490) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (494)..(494) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (495)..(502) <223> RuvC-like domain <220> <221> misc_feature <222> (497)..(497) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (506)..(506) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (510)..(510) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (513)..(513) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (514)..(514) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (517)..(517) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (520)..(520) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (525)..(525) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (526)..(526) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (529)..(529) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (531)..(531) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (532)..(532) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (534)..(534) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (542)..(542) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (546)..(546) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (547)..(547) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (553)..(553) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (555)..(575) <223> HNH-like domain <220> <221> misc_feature <222> (556)..(556) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (560)..(560) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (563)..(563) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (565)..(565) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (567)..(567) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (579)..(579) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (582)..(582) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (583)..(583) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (585)..(585) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (588)..(588) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (590)..(590) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (592)..(592) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (594)..(596) <223> Each Xaa can independently be any naturally occurring amino acid <220> <221> misc_feature <222> (610)..(610) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (616)..(616) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (628)..(628) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (631)..(631) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (633)..(633) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (634)..(634) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (636)..(636) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (638)..(641) <223> Each Xaa can independently be any naturally occurring amino acid <220> <221> misc_feature <222> (643)..(645) <223> Each Xaa can independently be any naturally occurring amino acid <220> <221> misc_feature <222> (653)..(653) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (657)..(657) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (659)..(659) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (660)..(660) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (665)..(665) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (666)..(666) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (668)..(668) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (669)..(669) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (670)..(677) <223> RuvC-like domain <220> <221> misc_feature <222> (680)..(680) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (681)..(681) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (683)..(683) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (686)..(686) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (696)..(696) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (697)..(697) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (704)..(704) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (708)..(708) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (710)..(710) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (711)..(711) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (714)..(714) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (717)..(720) <223> Each Xaa can independently be any naturally occurring amino acid <220> <221> misc_feature <222> (722)..(722) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (725)..(725) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (727)..(727) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (733)..(735) <223> Each Xaa can independently be any naturally occurring amino acid <220> <221> misc_feature <222> (740)..(740) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (742)..(742) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (749)..(754) <223> Each Xaa can independently be any naturally occurring amino acid <220> <221> misc_feature <222> (758)..(761) <223> Each Xaa can independently be any naturally occurring amino acid <220> <221> misc_feature <222> (763)..(768) <223> Each Xaa can independently be any naturally occurring amino acid <220> <221> misc_feature <222> (771)..(771) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (774)..(777) <223> Each Xaa can independently be any naturally occurring amino acid <220> <221> misc_feature <222> (782)..(782) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (784)..(786) <223> Each Xaa can independently be any naturally occurring amino acid <220> <221> misc_feature <222> (788)..(788) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (790)..(790) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (795)..(795) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (799)..(799) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (801)..(801) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (802)..(802) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (804)..(804) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (806)..(813) <223> Each Xaa can independently be any naturally occurring amino acid <220> <221> misc_feature <222> (815)..(818) <223> Each Xaa can independently be any naturally occurring amino acid <220> <221> misc_feature <222> (820)..(820) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (823)..(827) <223> Each Xaa can independently be any naturally occurring amino acid <220> <221> misc_feature <222> (829)..(829) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (830)..(830) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (832)..(832) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (835)..(837) <223> Each Xaa can independently be any naturally occurring amino acid <220> <221> misc_feature <222> (842)..(844) <223> Each Xaa can independently be any naturally occurring amino acid <220> <221> misc_feature <222> (846)..(846) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (848)..(848) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (851)..(851) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (857)..(857) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (857)..(857) <223> Xaa can be any naturally occurring amino acid <400> 14 Met Lys Tyr Xaa Ile Gly Leu Asp Ile Gly Thr Asn Ser Val Gly Trp 1 5 10 15 Ala Val Thr Asp Xaa Tyr Xaa Xaa Lys Xaa Lys Gly Xaa Xaa Xaa Ile 20 25 30 Xaa Lys Asn Xaa Gly Leu Phe Asp Gly Thr Ala Arg Xaa Arg Thr Ala 35 40 45 Arg Arg Arg Arg Arg Xaa Asn Arg Ile Tyr Leu Gln Ile Phe Xaa Glu 50 55 60 Met Asp Phe Phe Arg Leu Xaa Ser Phe Val Xaa Xaa Lys Xaa Xaa Xaa 65 70 75 80 Pro Xaa Phe Xaa Xaa Glu Tyr His Xaa Xaa Pro Thr Ile Tyr His Leu 85 90 95 Arg Xaa Leu Xaa Lys Asp Leu Arg Leu Xaa Tyr Leu Ala Leu Ala His 100 105 110 Xaa Ile Lys Xaa Arg Gly Asn Phe Leu Ile Glu Gly Xaa Xaa Asn Xaa 115 120 125 Xaa Xaa Xaa Xaa Xaa Tyr Xaa Phe Xaa Ile Xaa Xaa Xaa Xaa Xaa Xaa 130 135 140 Xaa Xaa Xaa Pro Glu Lys Gly Phe Xaa Xaa Xaa Leu Xaa Gly Xaa Phe 145 150 155 160 Xaa Phe Xaa Leu Glu Xaa Xaa Xaa Lys Xaa Xaa Tyr Xaa Xaa Xaa Leu 165 170 175 Xaa Leu Leu Ile Gly Asp Xaa Tyr Xaa Xaa Xaa Phe Xaa Ala Lys Xaa 180 185 190 Xaa Xaa Xaa Leu Ser Xaa Xaa Val Thr Xaa Ala Leu Ser Xaa Xaa Met 195 200 205 Ile Xaa Arg Xaa Xaa His Asp Leu Leu Lys Xaa Xaa Tyr Xaa Glu Xaa 210 215 220 Phe Xaa Lys Gly Tyr Ala Gly Tyr Ile Asp Gly Xaa Gln Phe Tyr Xaa 225 230 235 240 Xaa Lys Leu Xaa Xaa Xaa Gly Xaa Xaa Xaa Lys Xaa Xaa Xaa Glu Xaa 245 250 255 Xaa Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Xaa Ile Pro Xaa Gln 260 265 270 Xaa His Leu Glu Xaa Ala Ile Xaa Xaa Gln Xaa Tyr Pro Phe Leu Asn 275 280 285 Xaa Xaa Ile Xaa Xaa Xaa Thr Phe Arg Ile Pro Tyr Xaa Val Gly Pro 290 295 300 Leu Ala Gly Xaa Ser Phe Ala Trp Arg Lys Ile Pro Trp Asn Xaa Xaa 305 310 315 320 Xaa Xaa Asp Ser Ala Phe Ile Xaa Xaa Met Thr Asp Leu Pro Xaa Xaa 325 330 335 Xaa Val Leu Pro Lys His Ser Leu Tyr Xaa Xaa Val Tyr Asn Glu Leu 340 345 350 Thr Lys Val Xaa Xaa Xaa Xaa Xaa Xaa Lys Xaa Ile Phe Lys Arg Lys 355 360 365 Val Xaa Xaa Xaa Xaa Gly Xaa Xaa Phe Asn Xaa Ser Thr Tyr His Asp 370 375 380 Leu Xaa Xaa Xaa Xaa Xaa Leu Asp Xaa Asn Xaa Xaa Glu Xaa Ile Xaa 385 390 395 400 Leu Thr Xaa Phe Glu Asp Xaa Met Ile Xaa Xaa Leu Xaa Xaa Xaa Xaa 405 410 415 Lys Xaa Leu Arg Arg Xaa Tyr Thr Gly Trp Gly Xaa Leu Ser Xaa Leu 420 425 430 Xaa Gly Ile Arg Xaa Xaa Xaa Ser Thr Ile Leu Asp Xaa Leu Asp Asn 435 440 445 Arg Asn Xaa Met Gln Leu Ile Xaa Asp Leu Xaa Phe Lys Ile Lys Gln 450 455 460 Xaa Xaa Xaa Xaa Xaa Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln 465 470 475 480 Xaa Xaa Lys Xaa Val Asp Glu Leu Val Xaa Met Gly Pro Xaa Ile Val 485 490 495 Xaa Glu Met Ala Arg Glu Asn Gln Thr Xaa Gly Asn Ser Xaa Arg Lys 500 505 510 Xaa Xaa Lys Glu Xaa Gly Ser Xaa Ile Leu Lys Glu Xaa Xaa Asn Leu 515 520 525 Xaa Asn Xaa Xaa Leu Xaa Leu Tyr Tyr Leu Gln Asn Gly Xaa Asp Met 530 535 540 Tyr Xaa Xaa Leu Asp Ile Leu Ser Xaa Tyr Asp Xaa Asp His Ile Xaa 545 550 555 560 Pro Gln Xaa Phe Xaa Asp Xaa Ser Ile Asp Asn Val Leu Ser Asn Arg 565 570 575 Lys Asp Xaa Val Pro Xaa Xaa Val Xaa Lys Lys Xaa Trp Xaa Leu Xaa 580 585 590 Leu Xaa Xaa Xaa Arg Lys Phe Asp Leu Thr Lys Ala Glu Arg Gly Gly 595 600 605 Leu Xaa Asp Lys Ala Phe Ile Xaa Arg Gln Leu Val Glu Thr Arg Gln 610 615 620 Ile Thr Lys Xaa Val Ala Xaa Leu Xaa Xaa Asn Xaa Asp Xaa Xaa Xaa 625 630 635 640 Xaa Val Xaa Xaa Xaa Thr Leu Lys Ser Leu Val Ser Xaa Phe Arg Lys 645 650 655 Xaa Phe Xaa Xaa Leu Tyr Lys Val Xaa Xaa Asn Xaa Xaa His His Ala 660 665 670 His Asp Ala Tyr Leu Asn Val Xaa Xaa Leu Xaa Tyr Pro Xaa Leu Glu 675 680 685 Glu Phe Val Tyr Gly Asp Tyr Xaa Xaa Lys Ala Thr Lys Phe Tyr Xaa 690 695 700 Asn Ile Met Xaa Phe Xaa Xaa Gly Glu Xaa Trp Lys Xaa Xaa Xaa Xaa 705 710 715 720 Val Xaa Met Gln Xaa Asn Xaa Val Lys Lys Glu Gln Xaa Xaa Xaa Pro 725 730 735 Lys Asn Ser Xaa Leu Xaa Lys Asp Lys Tyr Gly Gly Xaa Xaa Xaa Xaa 740 745 750 Xaa Xaa Lys Gly Lys Xaa Xaa Xaa Xaa Ile Xaa Xaa Xaa Xaa Xaa Xaa 755 760 765 Phe Leu Xaa Gly Tyr Xaa Xaa Xaa Xaa Leu Pro Lys Tyr Xaa Leu Xaa 770 775 780 Xaa Xaa Gly Xaa Arg Xaa Leu Ala Ser Glu Xaa Lys Gly Asn Xaa Leu 785 790 795 800 Xaa Xaa Leu Xaa Ala Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Glu Xaa Xaa 805 810 815 Xaa Xaa Phe Xaa Ala Asn Xaa Xaa Xaa Xaa Xaa Leu Xaa Xaa Gly Xaa 820 825 830 Ala Phe Xaa Xaa Xaa Ile Arg Arg Tyr Xaa Xaa Xaa Thr Xaa Ile Xaa 835 840 845 Gln Ser Xaa Thr Gly Leu Tyr Glu Xaa Arg Leu 850 855 <210> 15 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> RuvC-like domain <220> <221> VARIANT <222> (2)..(2) <223> Xaa is Val or His <220> <221> VARIANT <222> (3)..(3) <223> Xaa is Ile, Leu, or Val <220> <221> VARIANT <222> (5)..(5) <223> Xaa is Met or Thr <400> 15 Ile Xaa Xaa Glu Xaa Ala Arg Glu 1 5 <210> 16 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> RuvC-like domain <220> <221> VARIANT <222> (3)..(3) <223> Xaa is Ile, Leu, or Val <400> 16 Ile Val Xaa Glu Met Ala Arg Glu 1 5 <210> 17 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> RuvC-like domain <220> <221> VARIANT <222> (4)..(4) <223> Xaa is His or Leu <220> <221> VARIANT <222> (7)..(7) <223> Xaa is Arg or Val <220> <221> VARIANT <222> (8)..(8) <223> Xaa is Glu or Val <400> 17 His His Ala Xaa Asp Ala Xaa Xaa 1 5 <210> 18 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> RuvC-like domain <400> 18 His His Ala His Asp Ala Tyr Leu 1 5 <210> 19 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> N-terminal RuvC-like domain <220> <221> VARIANT <222> (2)..(2) <223> Xaa is Lys or Pro <220> <221> VARIANT <222> (4)..(4) <223> Xaa is Val, Leu, Ile, or Phe <220> <221> VARIANT <222> (5)..(5) <223> Xaa is Gly, Ala, or Ser <220> <221> VARIANT <222> (6)..(6) <223> Xaa is Leu, Ile, Val, or Phe <220> <221> MOD_RES <222> (7)..(26) <223> N-terminal RuvC-like domain, each Xaa can be any amino acid or absent, region may encompass 5-20 residues <220> <221> VARIANT <222> (29)..(29) <223> Xaa is Asp, Glu, Asn, or Gln <400> 19 Lys Xaa Tyr Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 15 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Thr Asp Xaa Tyr 20 25 30 <210> 20 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> N-terminal RuvC-like domain <220> <221> VARIANT <222> (2)..(2) <223> Xaa is Ile, Val, Met, Leu, or Thr <220> <221> VARIANT <222> (4)..(4) <223> Xaa is Thr, Ile, Val, Ser, Asn, Tyr, Glu, or Leu <220> <221> VARIANT <222> (5)..(5) <223> Xaa is Asn, Ser, Gly, Ala, Asp, Thr, Arg, Met, or Phe <220> <221> VARIANT <222> (6)..(6) <223> Xaa is Ser, Tyr, Asn, or Phe <220> <221> VARIANT <222> (7)..(7) <223> Xaa is Val, Ile, Leu, Cys, Thr, or Phe <220> <221> VARIANT <222> (9)..(9) <223> Xaa is Trp, Phe, Val, Tyr, Ser, or Leu <220> <221> VARIANT <222> (10)..(10) <223> Xaa is Ala, Ser, Cys, Val, or Gly <220> <221> VARIANT <222> (11)..(11) <223> Xaa is Val, Ile, Leu, Ala, Met, or His <220> <221> VARIANT <222> (12)..(12) <223> Any amino acid or absent <400> 20 Asp Xaa Gly Xaa Xaa Xaa Xaa Gly Xaa Xaa Xaa Xaa 1 5 10 <210> 21 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> N-terminal RuvC-like domain <220> <221> VARIANT <222> (2)..(2) <223> Xaa is Ile, Val, Met, Leu, or Thr <220> <221> VARIANT <222> (4)..(4) <223> Xaa is Thr, Ile, Val, Ser, Asn, Tyr, Glu, or Leu <220> <221> VARIANT <222> (5)..(5) <223> Xaa is Asn, Ser, Gly, Ala, Asp, Thr, Arg, Met, or Phe <220> <221> VARIANT <222> (7)..(7) <223> Xaa is Val, Ile, Leu, Cys, Thr, or Phe <220> <221> VARIANT <222> (9)..(9) <223> Xaa is Trp, Phe, Val, Tyr, Ser, or Leu <220> <221> VARIANT <222> (10)..(10) <223> Xaa is Ala, Ser, Cys, Val, or Gly <220> <221> VARIANT <222> (11)..(11) <223> Xaa is Val, Ile, Leu, Ala, Met, or His <220> <221> VARIANT <222> (12)..(12) <223> Any amino acid or absent <400> 21 Asp Xaa Gly Xaa Xaa Ser Xaa Gly Xaa Xaa Xaa Xaa 1 5 10 <210> 22 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> N-terminal RuvC-like domain <220> <221> VARIANT <222> (4)..(4) <223> Xaa is Thr, Ile, Val, Ser, Asn, Tyr, Glu, or Leu <220> <221> VARIANT <222> (5)..(5) <223> Xaa is Asn, Ser, Gly, Ala, Asp, Thr, Arg, Met, or Phe <220> <221> VARIANT <222> (11)..(11) <223> Xaa is Val, Ile, Leu, Ala, Met, or His <220> <221> VARIANT <222> (12)..(12) <223> Any amino acid or absent <400> 22 Asp Ile Gly Xaa Xaa Ser Val Gly Trp Ala Xaa Xaa 1 5 10 <210> 23 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> N-terminal RuvC-like domain <220> <221> MOD_RES <222> (12)..(12) <223> Any non-polar alkyl amino acid or a hydroxyl amino acid <400> 23 Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Xaa 1 5 10 <210> 24 <211> 73 <212> PRT <213> Artificial Sequence <220> <223> HNH-like domain <220> <221> VARIANT <222> (8)..(8) <223> Xaa is Lys or Arg <220> <221> VARIANT <222> (12)..(12) <223> Xaa is Val or Thr <220> <221> VARIANT <222> (13)..(13) <223> Xaa is Gly or Asp <220> <221> VARIANT <222> (14)..(14) <223> Xaa is Glu, Gln, or Asp <220> <221> VARIANT <222> (15)..(15) <223> Xaa is Glu or Asp <220> <221> VARIANT <222> (19)..(19) <223> Xaa is Asp, Asn, or His <220> <221> VARIANT <222> (20)..(20) <223> Xaa is Tyr, Arg, or Asn <220> <221> VARIANT <222> (23)..(23) <223> Xaa is Gln, Asp, or Asn <220> <221> MOD_RES <222> (25)..(64) <223> HNH-like domain, each Xaa can be any amino acid or absent, region may encompass 15-40 residues <220> <221> VARIANT <222> (67)..(67) <223> Xaa is Gly or Glu <220> <221> VARIANT <222> (69)..(69) <223> Xaa is Ser or Gly <220> <221> VARIANT <222> (71)..(71) <223> Xaa is Asp or Asn <400> 24 Leu Tyr Tyr Leu Gln Asn Gly Xaa Asp Met Tyr Xaa Xaa Xaa Xaa Leu 1 5 10 15 Asp Ile Xaa Xaa Leu Ser Xaa Tyr Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 20 25 30 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 35 40 45 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 50 55 60 Asn Arg Xaa Lys Xaa Asp Xaa Val Pro 65 70 <210> 25 <211> 27 <212> PRT <213> Artificial Sequence <220> <223> HNH-like domain <220> <221> VARIANT <222> (1)..(1) <223> Xaa is Asp, Glu, Gln, or Asn <220> <221> VARIANT <222> (2)..(2) <223> Xaa is Leu, Ile, Arg, Gln, Val, Met, or Lys <220> <221> VARIANT <222> (3)..(3) <223> Xaa is Asp or Glu <220> <221> VARIANT <222> (5)..(5) <223> Xaa is Ile, Val, Thr, Ala, or Leu <220> <221> VARIANT <222> (6)..(6) <223> Xaa is Val, Tyr, Ile, Leu, Phe, or Trp <220> <221> VARIANT <222> (8)..(8) <223> Xaa is Gln, His, Arg, Lys, Tyr, Ile, Leu, Phe, or Trp <220> <221> VARIANT <222> (9)..(9) <223> Xaa is Ser, Ala, Asp, Thr, or Lys <220> <221> VARIANT <222> (10)..(10) <223> Xaa is Phe, Leu, Val, Lys, Tyr, Met, Ile, Arg, Ala, Glu, Asp, or Gln <220> <221> VARIANT <222> (11)..(11) <223> Xaa is Leu, Arg, Thr, Ile, Val, Ser, Cys, Tyr, Lys, Phe, or Gly <220> <221> VARIANT <222> (12)..(12) <223> Xaa is Lys, Gln, Tyr, Thr, Phe, Leu, Trp, Met, Ala, Glu, Gly, or Ser <220> <221> VARIANT <222> (13)..(13) <223> Xaa is Asp, Ser, Asn, Arg, Leu, or Thr <220> <221> VARIANT <222> (14)..(14) <223> Xaa is Asp, Asn, or Ser <220> <221> VARIANT <222> (15)..(15) <223> Xaa is Ser, Ala, Thr, Gly, or Arg <220> <221> VARIANT <222> (16)..(16) <223> Xaa is Ile, Leu, Phe, Ser, Arg, Tyr, Gln, Trp, Asp, Lys, or His <220> <221> VARIANT <222> (17)..(17) <223> Xaa is Asp, Ser, Ile, Asn, Glu, Ala, His, Phe, Leu, Gln, Met, Gly, Tyr, or Val <220> <221> VARIANT <222> (19)..(19) <223> Xaa is Lys, Leu, Arg, Met, Thr, or Phe <220> <221> VARIANT <222> (20)..(20) <223> Xaa is Val, Leu, Ile, Ala, or Thr <220> <221> VARIANT <222> (21)..(21) <223> Xaa is Leu, Ile, Val, or Ala <220> <221> VARIANT <222> (22)..(22) <223> Xaa is Thr, Val, Cys, Glu, Ser, or Ala <220> <221> VARIANT <222> (23)..(23) <223> Xaa is Arg, Phe, Thr, Trp, Glu, Leu, Asn, Cys, Lys, Val, Ser, Gln, Ile, Tyr, His, or Ala <220> <221> VARIANT <222> (24)..(24) <223> Xaa is Ser, Pro, Arg, Lys, Asn, Ala, His, Gln, Gly, or Leu <220> <221> VARIANT <222> (25)..(25) <223> Xaa is Asp, Gly, Thr, Asn, Ser, Lys, Ala, Ile, Glu, Leu, Gln, Arg, or Tyr <220> <221> VARIANT <222> (26)..(26) <223> Xaa is Lys, Val, Ala, Glu, Tyr, Ile, Cys, Leu, Ser, Thr, Gly, Lys, Met, Asp, or Phe <400> 25 Xaa Xaa Xaa His Xaa Xaa Pro Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 15 Xaa Asn Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Asn 20 25 <210> 26 <211> 27 <212> PRT <213> Artificial Sequence <220> <223> HNH-like domain <220> <221> VARIANT <222> (1)..(1) <223> Xaa is Asp or Glu <220> <221> VARIANT <222> (2)..(2) <223> Xaa is Leu, Ile, Arg, Gln, Val, Met, or Lys <220> <221> VARIANT <222> (3)..(3) <223> Xaa is Asp or Glu <220> <221> VARIANT <222> (5)..(5) <223> Xaa is Ile, Val, Thr, Ala, or Leu <220> <221> VARIANT <222> (6)..(6) <223> Xaa is Val, Tyr, Ile, Leu, Phe, or Trp <220> <221> VARIANT <222> (8)..(8) <223> Xaa is Gln, His, Arg, Lys, Tyr, Ile, Leu, Phe, or Trp <220> <221> VARIANT <222> (10)..(10) <223> Xaa is Phe, Leu, Val, Lys, Tyr, Met, Ile, Arg, Ala, Glu, Asp, or Gln <220> <221> VARIANT <222> (11)..(11) <223> Xaa is Leu, Arg, Thr, Ile, Val, Ser, Cys, Tyr, Lys, Phe, or Gly <220> <221> VARIANT <222> (12)..(12) <223> Xaa is Lys, Gln, Tyr, Thr, Phe, Leu, Trp, Met, Ala, Glu, Gly, or Ser <220> <221> VARIANT <222> (16)..(16) <223> Xaa is Ile, Leu, Phe, Ser, Arg, Tyr, Gln, Trp, Asp, Lys, or His <220> <221> VARIANT <222> (17)..(17) <223> Xaa is Asp, Ser, Ile, Asn, Glu, Ala, His, Phe, Leu, Gln, Met, Gly, Tyr, or Val <220> <221> VARIANT <222> (22)..(22) <223> Xaa is Thr, Val, Cys, Glu, Ser, or Ala <220> <221> VARIANT <222> (23)..(23) <223> Xaa is Arg, Phe, Thr, Trp, Glu, Leu, Asn, Cys, Lys, Val, Ser, Gln, Ile, Tyr, His, or Ala <220> <221> VARIANT <222> (24)..(24) <223> Xaa is Ser, Pro, Arg, Lys, Asn, Ala, His, Gln, Gly, or Leu <220> <221> VARIANT <222> (25)..(25) <223> Xaa is Asp, Gly, Thr, Asn, Ser, Lys, Ala, Ile, Glu, Leu, Gln, Arg, or Tyr <220> <221> VARIANT <222> (26)..(26) <223> Xaa is Lys, Val, Ala, Glu, Tyr, Ile, Cys, Leu, Ser, Thr, Gly, Lys, Met, Asp, or Phe <400> 26 Xaa Xaa Xaa His Xaa Xaa Pro Xaa Ser Xaa Xaa Xaa Asp Asp Ser Xaa 1 5 10 15 Xaa Asn Lys Val Leu Xaa Xaa Xaa Xaa Xaa Asn 20 25 <210> 27 <211> 27 <212> PRT <213> Artificial Sequence <220> <223> HNH-like domain <220> <221> VARIANT <222> (1)..(1) <223> Xaa is Asp or Glu <220> <221> VARIANT <222> (3)..(3) <223> Xaa is Asp or Glu <220> <221> VARIANT <222> (8)..(8) <223> Xaa is Gln, His, Arg, Lys, Tyr, Ile, Leu, or Trp <220> <221> VARIANT <222> (10)..(10) <223> Xaa is Phe, Leu, Val, Lys, Tyr, Met, Ile, Arg, Ala, Glu, Asp, or Gln <220> <221> VARIANT <222> (11)..(11) <223> Xaa is Leu, Arg, Thr, Ile, Val, Ser, Cys, Tyr, Lys, Phe, or Gly <220> <221> VARIANT <222> (12)..(12) <223> Xaa is Lys, Gln, Tyr, Thr, Phe, Leu, Trp, Met, Ala, Glu, Gly, or Ser <220> <221> VARIANT <222> (16)..(16) <223> Xaa is Ile, Leu, Phe, Ser, Arg, Tyr, Gln, Trp, Asp, Lys, or His <220> <221> VARIANT <222> (17)..(17) <223> Xaa is Asp, Ser, Ile, Asn, Glu, Ala, His, Phe, Leu, Gln, Met, Gly, Tyr, or Val <220> <221> VARIANT <222> (23)..(23) <223> Xaa is Arg, Phe, Thr, Trp, Glu, Leu, Asn, Cys, Lys, Val, Ser, Gln, Ile, Tyr, His, or Ala <220> <221> VARIANT <222> (24)..(24) <223> Xaa is Ser, Pro, Arg, Lys, Asn, Ala, His, Gln, Gly, or Leu <220> <221> VARIANT <222> (25)..(25) <223> Xaa is Asp, Gly, Thr, Asn, Ser, Lys, Ala, Ile, Glu, Leu, Gln, Arg, or Tyr <220> <221> VARIANT <222> (26)..(26) <223> Xaa is Lys, Val, Ala, Glu, Tyr, Ile, Cys, Leu, Ser, Thr, Gly, Lys, Met, Asp, or Phe <400> 27 Xaa Val Xaa His Ile Val Pro Xaa Ser Xaa Xaa Xaa Asp Asp Ser Xaa 1 5 10 15 Xaa Asn Lys Val Leu Thr Xaa Xaa Xaa Xaa Asn 20 25 <210> 28 <211> 27 <212> PRT <213> Artificial Sequence <220> <223> HNH-like domain <220> <221> VARIANT <222> (2)..(2) <223> Xaa is Ile or Val <220> <221> VARIANT <222> (6)..(6) <223> Xaa is Ile or Val <220> <221> VARIANT <222> (9)..(9) <223> Xaa is Ala or Ser <220> <221> VARIANT <222> (11)..(11) <223> Xaa is Ile or Leu <220> <221> VARIANT <222> (12)..(12) <223> Xaa is Lys or Thr <220> <221> VARIANT <222> (14)..(14) <223> Xaa is Asp or Asn <220> <221> VARIANT <222> (19)..(19) <223> Xaa is Arg, Lys, or Leu <220> <221> VARIANT <222> (22)..(22) <223> Xaa is Thr or Val <220> <221> VARIANT <222> (23)..(23) <223> Xaa is Ser or Arg <220> <221> VARIANT <222> (25)..(25) <223> Xaa is Lys, Asp, or Ala <220> <221> VARIANT <222> (26)..(26) <223> Xaa is Glu, Lys, Gly, or Asn <400> 28 Asp Xaa Asp His Ile Xaa Pro Gln Xaa Phe Xaa Xaa Asp Xaa Ser Ile 1 5 10 15 Asp Asn Xaa Val Leu Xaa Xaa Ser Xaa Xaa Asn 20 25 <210> 29 <211> 116 <212> RNA <213> Artificial Sequence <220> <223> gRNA <220> <221> misc_feature <222> (1)..(20) <223> a, c, u, g, unknown or other <220> <221> misc_feature <222> (1)..(20) <223> targeting region <220> <221> misc_feature <222> (21)..(42) <223> first complementarity domain <220> <221> misc_feature <222> (43)..(46) <223> linking domain <220> <221> misc_feature <222> (47)..(70) <223> second complementarity domain <400> 29 nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcuguuu uggaaacaaa acagcauagc 60 aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugc 116 <210> 30 <211> 116 <212> RNA <213> Artificial Sequence <220> <223> gRNA <220> <221> misc_feature <222> (1)..(20) <223> a, c, u, g, unknown or other <220> <221> misc_feature <222> (1)..(20) <223> targeting region <220> <221> misc_feature <222> (21)..(42) <223> first complementarity domain <220> <221> misc_feature <222> (43)..(46) <223> linking domain <220> <221> misc_feature <222> (47)..(70) <223> second complementarity domain <400> 30 nnnnnnnnnn nnnnnnnnnn guauuagagc uaugcuguau uggaaacaau acagcauagc 60 aaguuaauau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugc 116 <210> 31 <211> 96 <212> RNA <213> Artificial Sequence <220> <223> gRNA <220> <221> misc_feature <222> (1)..(20) <223> a, c, u, g, unknown or other <220> <221> misc_feature <222> (1)..(20) <223> targeting domain <220> <221> misc_feature <222> (21)..(32) <223> first complementarity domain <220> <221> misc_feature <222> (33)..(36) <223> linking domain <220> <221> misc_feature <222> (37)..(50) <223> second complementarity domain <220> <221> misc_feature <222> (51)..(62) <223> proximal domain <400> 31 nnnnnnnnnn nnnnnnnnnn guuuaagagc uagaaauagc aaguuuaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugc 96 <210> 32 <211> 47 <212> RNA <213> Artificial Sequence <220> <223> gRNA proximal and tail domains derived from S. pyogenes <400> 32 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcu 47 <210> 33 <211> 49 <212> RNA <213> Artificial Sequence <220> <223> gRNA proximal and tail domains <400> 33 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cgguggugc 49 <210> 34 <211> 51 <212> RNA <213> Artificial Sequence <220> <223> gRNA proximal and tail domains <400> 34 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcggau c 51 <210> 35 <211> 31 <212> RNA <213> Artificial Sequence <220> <223> gRNA proximal and tail domains <400> 35 aaggcuaguc cguuaucaac uugaaaaagu g 31 <210> 36 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> gRNA proximal and tail domains <400> 36 aaggcuaguc cguuauca 18 <210> 37 <211> 12 <212> RNA <213> Artificial Sequence <220> <223> gRNA proximal and tail domains <400> 37 aaggcuaguc cg 12 <210> 38 <211> 102 <212> RNA <213> Artificial Sequence <220> <223> Unimolecular gRNA derived from S. aureus <220> <221> misc_feature <222> (1)..(20) <223> n is a, c, g, or u <220> <221> misc_feature <222> (1)..(20) <223> Targeting domain <400> 38 nnnnnnnnnn nnnnnnnnnn guuuuaguac ucuggaaaca gaaucuacua aaacaaggca 60 aaaugccgug uuuaucucgu caacuuguug gcgagauuuu uu 102 <210> 39 <211> 42 <212> RNA <213> Artificial <220> <223> Modular gRNA derived from S. pyogenes <220> <221> misc_feature <222> (1)..(20) <223> a, c, u, g, unknown or other <220> <221> misc_feature <222> (1)..(20) <223> Targeting domain <220> <221> misc_feature <222> (21)..(42) <223> First complementarity domain <400> 39 nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcuguuu ug 42 <210> 40 <211> 85 <212> RNA <213> Artificial Sequence <220> <223> Modular gRNA derived from S. pyogenes <220> <221> misc_feature <222> (1)..(9) <223> 5' extension domain <220> <221> misc_feature <222> (10)..(33) <223> Second complementarity domain <220> <221> misc_feature <222> (34)..(45) <223> Proximal domain <220> <221> misc_feature <222> (46)..(85) <223> Tail domain <400> 40 ggaaccauuc aaaacagcau agcaaguuaa aauaaggcua guccguuauc aacuugaaaa 60 aguggcaccg agucggugcu uuuuu 85 <210> 41 <211> 62 <212> RNA <213> Artificial Sequence <220> <223> Unimolecular gRNA derived from S. pyogenes <220> <221> misc_feature <222> (1)..(20) <223> a, c, u, g, unknown or other <220> <221> misc_feature <222> (1)..(20) <223> Targeting domain <220> <221> misc_feature <222> (21)..(32) <223> First complementarity domain <220> <221> misc_feature <222> (33)..(36) <223> Linking domain <220> <221> misc_feature <222> (37)..(50) <223> Second complementarity domain <220> <221> misc_feature <222> (51)..(62) <223> Proximal domain <400> 41 nnnnnnnnnn nnnnnnnnnn guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cg 62 <210> 42 <211> 102 <212> RNA <213> Artificial Sequence <220> <223> Unimolecular gRNA derived from S. pyogenes <220> <221> misc_feature <222> (1)..(20) <223> a, c, u, g, unknown or other <220> <221> misc_feature <222> (1)..(20) <223> Targeting domain <220> <221> misc_feature <222> (21)..(32) <223> First complementarity domain <220> <221> misc_feature <222> (33)..(36) <223> Linking domain <220> <221> misc_feature <222> (37)..(50) <223> Second complementarity domain <220> <221> misc_feature <222> (51)..(62) <223> Proximal domain <220> <221> misc_feature <222> (63)..(102) <223> Tail domain <400> 42 nnnnnnnnnn nnnnnnnnnn guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102 <210> 43 <211> 75 <212> RNA <213> Artificial Sequence <220> <223> Unimolecular gRNA derived from S. pyogenes <220> <221> misc_feature <222> (1)..(20) <223> Targeting domain <220> <221> misc_feature <222> (1)..(20) <223> a, c, u, g, unknown or other <220> <221> misc_feature <222> (21)..(36) <223> First complementarity domain <220> <221> misc_feature <222> (37)..(40) <223> Linking domain <220> <221> misc_feature <222> (41)..(58) <223> Second complementarity domain <220> <221> misc_feature <222> (59)..(70) <223> Proximal domain <220> <221> misc_feature <222> (71)..(75) <223> Tail domain <400> 43 nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcugaaa agcauagcaa guuaaaauaa 60 ggcuaguccg uuauc 75 <210> 44 <211> 87 <212> RNA <213> Artificial Sequence <220> <223> Unimolecular gRNA derived from S. pyogenes <220> <221> misc_feature <222> (1)..(20) <223> a, c, u, g, unknown or other <220> <221> misc_feature <222> (1)..(20) <223> Targeting domain <220> <221> misc_feature <222> (21)..(32) <223> First complementarity domain <220> <221> misc_feature <222> (43)..(46) <223> Linking domain <220> <221> misc_feature <222> (57)..(70) <223> Second complementarity domain <220> <221> misc_feature <222> (71)..(82) <223> Proximal domain <220> <221> misc_feature <222> (83)..(87) <223> Tail domain <400> 44 nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcuguuu uggaaacaaa acagcauagc 60 aaguuaaaau aaggcuaguc cguuauc 87 <210> 45 <211> 42 <212> RNA <213> Artificial Sequence <220> <223> Modular gRNA derived from S. thermophilus <220> <221> misc_feature <222> (1)..(20) <223> a, c, u, g, unknown or other <220> <221> misc_feature <222> (1)..(20) <223> Targeting domain <220> <221> misc_feature <222> (21)..(42) <223> First complementarity domain <400> 45 nnnnnnnnnn nnnnnnnnnn guuuuagagc uguguuguuu cg 42 <210> 46 <211> 78 <212> RNA <213> Artificial Sequence <220> <223> Modular gRNA derived from S. thermophilus <220> <221> misc_feature <222> (1)..(3) <223> 5' extension domain <220> <221> misc_feature <222> (4)..(27) <223> Second complementarity domain <220> <221> misc_feature <222> (28)..(40) <223> Proximal domain <220> <221> misc_feature <222> (41)..(78) <223> Tail domain <400> 46 gggcgaaaca acacagcgag uuaaaauaag gcuuaguccg uacucaacuu gaaaaggugg 60 caccgauucg guguuuuu 78 <210> 47 <211> 85 <212> RNA <213> Artificial Sequence <220> <223> Modular gRNA derived from S. pyogenes <400> 47 gaaccauuca aaacagcaua gcaaguuaaa auaaggcuag uccguuauca acuugaaaaa 60 guggcaccga gucggugcuu uuuuu 85 <210> 48 <211> 96 <212> RNA <213> Artificial Sequence <220> <223> gRNA from S. pyogenes <220> <221> misc_feature <222> (1)..(20) <223> n is a, c, g, or u <220> <221> misc_feature <222> (1)..(20) <223> Targeting domain <400> 48 nnnnnnnnnn nnnnnnnnnn guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugc 96 <210> 49 <211> 96 <212> RNA <213> Artificial Sequence <220> <223> gRNA <220> <221> misc_feature <222> (1)..(20) <223> n is a, c, g, or u <220> <221> misc_feature <222> (1)..(20) <223> Targeting domain <220> <221> misc_feature <222> (21)..(32) <223> First complementarity domain <220> <221> misc_feature <222> (33)..(36) <223> Linking domain <220> <221> misc_feature <222> (37)..(50) <223> Second complementarity domain <220> <221> misc_feature <222> (51)..(62) <223> Proximal domain <400> 49 nnnnnnnnnn nnnnnnnnnn guauuagagc uagaaauagc aaguuaauau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugc 96 <210> 50 <211> 104 <212> RNA <213> Artificial Sequence <220> <223> gRNA <220> <221> misc_feature <222> (1)..(20) <223> n is a, c, g, or u <220> <221> misc_feature <222> (1)..(20) <223> Targeting domain <220> <221> misc_feature <222> (21)..(36) <223> First complementarity domain <220> <221> misc_feature <222> (37)..(40) <223> Linking domain <220> <221> misc_feature <222> (41)..(58) <223> Second complementarity domain <400> 50 nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcugaaa agcauagcaa guuaaaauaa 60 ggcuaguccg uuaucaacuu gaaaaagugg caccgagucg gugc 104 <210> 51 <211> 106 <212> RNA <213> Artificial Sequence <220> <223> gRNA <220> <221> misc_feature <222> (1)..(20) <223> n is a, c, g, or u <220> <221> misc_feature <222> (1)..(20) <223> Targeting domain <220> <221> misc_feature <222> (21)..(37) <223> First complementarity domain <220> <221> misc_feature <222> (38)..(41) <223> Linking domain <220> <221> misc_feature <222> (42)..(60) <223> Second complementarity domain <400> 51 nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcuggaa acagcauagc aaguuaaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugc 106 <210> 52 <211> 12 <212> PRT <213> Peptoniphilus duerdenii <400> 52 Asp Ile Gly Thr Ala Ser Val Gly Trp Ala Val Thr 1 5 10 <210> 53 <211> 12 <212> PRT <213> Treponema denticola <400> 53 Asp Val Gly Thr Gly Ser Val Gly Trp Ala Val Thr 1 5 10 <210> 54 <211> 12 <212> PRT <213> S. mutans <400> 54 Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Val 1 5 10 <210> 55 <211> 12 <212> PRT <213> S. pyogenes <400> 55 Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile 1 5 10 <210> 56 <211> 12 <212> PRT <213> L. innocua <400> 56 Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Leu 1 5 10 <210> 57 <211> 12 <212> PRT <213> Flavobacterium branchiophilum FL-15 <400> 57 Asp Leu Gly Thr Asn Ser Ile Gly Trp Ala Val Val 1 5 10 <210> 58 <211> 11 <212> PRT <213> Pedobacter glucosidilyticus <400> 58 Asp Leu Gly Thr Asn Ser Ile Gly Trp Ala Ile 1 5 10 <210> 59 <211> 12 <212> PRT <213> Bacteroides fragilis, NCTC 9343 <400> 59 Asp Leu Gly Thr Asn Ser Ile Gly Trp Ala Leu Val 1 5 10 <210> 60 <211> 12 <212> PRT <213> Fusobacterium nucleatum <400> 60 Asp Ile Gly Thr Asn Ser Val Gly Trp Cys Val Thr 1 5 10 <210> 61 <211> 12 <212> PRT <213> Acidaminococcus sp. D21 <400> 61 Asp Ile Gly Thr Asn Ser Val Gly Tyr Ala Val Thr 1 5 10 <210> 62 <211> 12 <212> PRT <213> Coprococcus catus GD-7 <400> 62 Asp Met Gly Thr Gly Ser Leu Gly Trp Ala Val Thr 1 5 10 <210> 63 <211> 12 <212> PRT <213> Oenococcus kitaharae DSM 17330 <400> 63 Asp Ile Gly Thr Ser Ser Val Gly Trp Ala Ala Ile 1 5 10 <210> 64 <211> 12 <212> PRT <213> Catenibacterium mitsuokai DSM 15897 <400> 64 Asp Leu Gly Thr Gly Ser Val Gly Trp Ala Val Val 1 5 10 <210> 65 <211> 12 <212> PRT <213> Mycoplasma gallisepticum str. F <400> 65 Asp Leu Gly Val Gly Ser Val Gly Trp Ala Ile Val 1 5 10 <210> 66 <211> 12 <212> PRT <213> Mycoplasma ovipneumoniae SC01 <400> 66 Asp Leu Gly Ile Ala Ser Ile Gly Trp Ala Ile Ile 1 5 10 <210> 67 <211> 12 <212> PRT <213> Mycoplasma canis PG 14 <400> 67 Asp Leu Gly Ile Ala Ser Val Gly Trp Ala Ile Val 1 5 10 <210> 68 <211> 12 <212> PRT <213> Mycoplasma synoviae 53 <400> 68 Asp Leu Gly Val Ala Ser Val Gly Trp Ser Ile Val 1 5 10 <210> 69 <211> 12 <212> PRT <213> Eubacterium rectale <400> 69 Asp Ile Gly Ile Ala Ser Val Gly Trp Ala Ile Leu 1 5 10 <210> 70 <211> 12 <212> PRT <213> Enterococcus faecalis TX0012 <400> 70 Asp Leu Gly Ile Ser Ser Val Gly Trp Ser Val Ile 1 5 10 <210> 71 <211> 12 <212> PRT <213> Ilyobacter polytropus DSM 2926 <400> 71 Asp Ile Gly Ile Ala Ser Val Gly Trp Ser Val Ile 1 5 10 <210> 72 <211> 12 <212> PRT <213> Ruminococcus albus 8 <400> 72 Asp Val Gly Ile Gly Ser Ile Gly Trp Ala Val Ile 1 5 10 <210> 73 <211> 12 <212> PRT <213> Elusimicrobium minutum Pei191 <400> 73 Asp Leu Gly Val Gly Ser Ile Gly Phe Ala Ile Val 1 5 10 <210> 74 <211> 12 <212> PRT <213> Akkermansia muciniphila <400> 74 Asp Ile Gly Tyr Ala Ser Ile Gly Trp Ala Val Ile 1 5 10 <210> 75 <211> 12 <212> PRT <213> Prevotella ruminicola <400> 75 Asp Thr Gly Thr Asn Ser Leu Gly Trp Ala Ile Val 1 5 10 <210> 76 <211> 12 <212> PRT <213> Cand. Puniceispirillum marinum <400> 76 Asp Leu Gly Thr Asn Ser Ile Gly Trp Cys Leu Leu 1 5 10 <210> 77 <211> 12 <212> PRT <213> Rhodospirillum rubrum <400> 77 Asp Ile Gly Thr Asp Ser Leu Gly Trp Ala Val Phe 1 5 10 <210> 78 <211> 12 <212> PRT <213> Lactobacillus rhamnosus GG <400> 78 Asp Ile Gly Ser Asn Ser Ile Gly Phe Ala Val Val 1 5 10 <210> 79 <211> 12 <212> PRT <213> Sphaerochaeta globus str. Buddy <400> 79 Asp Leu Gly Val Gly Ser Ile Gly Val Ala Val Ala 1 5 10 <210> 80 <211> 12 <212> PRT <213> Rhodopseudomonas palustris <400> 80 Asp Leu Gly Ile Ala Ser Cys Gly Trp Gly Val Val 1 5 10 <210> 81 <211> 12 <212> PRT <213> Mycoplasma mobile 163K <400> 81 Asp Leu Gly Ile Ala Ser Val Gly Trp Cys Leu Thr 1 5 10 <210> 82 <211> 12 <212> PRT <213> Streptococcus thermophilus LMD-9 <400> 82 Asp Ile Gly Ile Gly Ser Val Gly Val Gly Ile Leu 1 5 10 <210> 83 <211> 12 <212> PRT <213> Staphylococcus lugdunensis M23590 <400> 83 Asp Ile Gly Ile Thr Ser Val Gly Tyr Gly Leu Ile 1 5 10 <210> 84 <211> 12 <212> PRT <213> Eubacterium dolichum DSM 3991 <400> 84 Asp Ile Gly Ile Thr Ser Val Gly Phe Gly Ile Ile 1 5 10 <210> 85 <211> 12 <212> PRT <213> Lactobacillus coryniformis KCTC 3535 <400> 85 Asp Val Gly Ile Thr Ser Thr Gly Tyr Ala Val Leu 1 5 10 <210> 86 <211> 12 <212> PRT <213> Nitratifractor salsuginis DSM 16511 <400> 86 Asp Leu Gly Ile Thr Ser Phe Gly Tyr Ala Ile Leu 1 5 10 <210> 87 <211> 12 <212> PRT <213> Bifidobacterium bifidum S17 <400> 87 Asp Ile Gly Asn Ala Ser Val Gly Trp Ser Ala Phe 1 5 10 <210> 88 <211> 12 <212> PRT <213> Lactobacillus gasseri <400> 88 Asp Val Gly Thr Asn Ser Cys Gly Trp Val Ala Met 1 5 10 <210> 89 <211> 12 <212> PRT <213> Acidothermus cellulolyticus 11B <400> 89 Asp Val Gly Glu Arg Ser Ile Gly Leu Ala Ala Val 1 5 10 <210> 90 <211> 12 <212> PRT <213> Bifidobacterium longum DJO10A <400> 90 Asp Val Gly Leu Asn Ser Val Gly Leu Ala Ala Val 1 5 10 <210> 91 <211> 12 <212> PRT <213> Bifidobacterium dentium <400> 91 Asp Val Gly Leu Met Ser Val Gly Leu Ala Ala Ile 1 5 10 <210> 92 <211> 12 <212> PRT <213> Corynebacterium diphtheriae <400> 92 Asp Val Gly Thr Phe Ser Val Gly Leu Ala Ala Ile 1 5 10 <210> 93 <211> 12 <212> PRT <213> Staphylococcus pseudintermedius ED99 <400> 93 Asp Ile Gly Thr Gly Ser Val Gly Tyr Ala Cys Met 1 5 10 <210> 94 <211> 12 <212> PRT <213> Capnocytophaga ochracea <400> 94 Asp Leu Gly Thr Thr Ser Ile Gly Phe Ala His Ile 1 5 10 <210> 95 <211> 12 <212> PRT <213> Prevotella denticola <400> 95 Asp Leu Gly Thr Asn Ser Ile Gly Ser Ser Val Arg 1 5 10 <210> 96 <211> 12 <212> PRT <213> Ralstonia solanacearum <400> 96 Asp Ile Gly Thr Asn Ser Ile Gly Trp Ala Val Ile 1 5 10 <210> 97 <211> 12 <212> PRT <213> Pasteurella multocida str. Pm70 <400> 97 Asp Leu Gly Ile Ala Ser Val Gly Trp Ala Val Val 1 5 10 <210> 98 <211> 12 <212> PRT <213> Comamonas granuli <400> 98 Asp Ile Gly Ile Ala Ser Val Gly Trp Ala Val Leu 1 5 10 <210> 99 <211> 12 <212> PRT <213> Helicobacter mustelae 12198 <400> 99 Asp Ile Gly Ile Ala Ser Ile Gly Trp Ala Val Ile 1 5 10 <210> 100 <211> 12 <212> PRT <213> Agathobacter rectalis <400> 100 Asp Ile Gly Ile Ala Ser Val Gly Trp Ala Ile Ile 1 5 10 <210> 101 <211> 12 <212> PRT <213> Clostridium cellulolyticum H10 <400> 101 Asp Val Gly Ile Ala Ser Val Gly Trp Ala Val Ile 1 5 10 <210> 102 <211> 11 <212> PRT <213> Methylophilus sp. OH31 <400> 102 Asp Ile Gly Ile Ala Ser Val Gly Trp Ala Leu 1 5 10 <210> 103 <211> 12 <212> PRT <213> Neisseria meningitidis <400> 103 Asp Ile Gly Ile Ala Ser Val Gly Trp Ala Met Val 1 5 10 <210> 104 <211> 12 <212> PRT <213> Clostridium perfringens <400> 104 Asp Ile Gly Ile Thr Ser Val Gly Trp Ala Val Ile 1 5 10 <210> 105 <211> 12 <212> PRT <213> Wolinella succinogenes DSM 1740 <400> 105 Asp Leu Gly Ile Ser Ser Leu Gly Trp Ala Ile Val 1 5 10 <210> 106 <211> 12 <212> PRT <213> Azospirillum sp. B510 <400> 106 Asp Leu Gly Thr Asn Ser Ile Gly Trp Gly Leu Leu 1 5 10 <210> 107 <211> 12 <212> PRT <213> Verminephrobacter eiseniae <400> 107 Asp Leu Gly Ser Thr Ser Leu Gly Trp Ala Ile Phe 1 5 10 <210> 108 <211> 12 <212> PRT <213> Campylobacter jejuni, NCTC 11168 <400> 108 Asp Ile Gly Ile Ser Ser Ile Gly Trp Ala Phe Ser 1 5 10 <210> 109 <211> 12 <212> PRT <213> Parvibaculum lavamentivorans DS-1 <400> 109 Asp Ile Gly Thr Thr Ser Ile Gly Phe Ser Val Ile 1 5 10 <210> 110 <211> 12 <212> PRT <213> Dinoroseobacter shibae DFL 12 <400> 110 Asp Ile Gly Thr Ser Ser Ile Gly Trp Trp Leu Tyr 1 5 10 <210> 111 <211> 12 <212> PRT <213> Nitrobacter hamburgensis X14 <400> 111 Asp Leu Gly Ser Asn Ser Leu Gly Trp Phe Val Thr 1 5 10 <210> 112 <211> 12 <212> PRT <213> Bradyrhizobium sp. BTAi1 <400> 112 Asp Leu Gly Ala Asn Ser Leu Gly Trp Phe Val Val 1 5 10 <210> 113 <211> 15 <212> PRT <213> Bacillus cereus <400> 113 Asp Ile Gly Leu Arg Ile Gly Ile Thr Ser Cys Gly Trp Ser Ile 1 5 10 15 <210> 114 <211> 12 <212> PRT <213> Sutterella wadsworthensis <400> 114 Asp Met Gly Ala Lys Tyr Thr Gly Val Phe Tyr Ala 1 5 10 <210> 115 <211> 12 <212> PRT <213> Wolinella succinogenes DSM 1740 <400> 115 Asp Leu Gly Gly Lys Asn Thr Gly Phe Phe Ser Phe 1 5 10 <210> 116 <211> 12 <212> PRT <213> Francisella tularensis <400> 116 Asp Leu Gly Val Lys Asn Thr Gly Val Phe Ser Ala 1 5 10 <210> 117 <211> 12 <212> PRT <213> Gamma proteobacterium HTCC5015 <400> 117 Asp Leu Gly Ala Lys Phe Thr Gly Val Ala Leu Tyr 1 5 10 <210> 118 <211> 12 <212> PRT <213> Legionella pneumophila str. Paris <400> 118 Asp Leu Gly Gly Lys Phe Thr Gly Val Cys Leu Ser 1 5 10 <210> 119 <211> 12 <212> PRT <213> Parasutterella excrementihominis <400> 119 Asp Leu Gly Gly Thr Tyr Thr Gly Thr Phe Ile Thr 1 5 10 <210> 120 <211> 12 <212> PRT <213> S. thermophilus <400> 120 Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Thr 1 5 10 <210> 121 <211> 12 <212> PRT <213> Eubacterium yurii <400> 121 Asp Val Gly Thr Asn Ser Val Gly Trp Ala Val Thr 1 5 10 <210> 122 <211> 12 <212> PRT <213> Butyrivibrio hungatei <400> 122 Asp Met Gly Thr Asn Ser Val Gly Trp Ala Val Thr 1 5 10 <210> 123 <211> 12 <212> PRT <213> Solobacterium moorei F0204 <400> 123 Asp Val Gly Thr Ser Ser Val Gly Trp Ala Val Thr 1 5 10 <210> 124 <211> 27 <212> PRT <213> Treponema denticola <400> 124 Asp Ile Asp His Ile Tyr Pro Gln Ser Lys Ile Lys Asp Asp Ser Ile 1 5 10 15 Ser Asn Arg Val Leu Val Cys Ser Ser Cys Asn 20 25 <210> 125 <211> 27 <212> PRT <213> Coprococcus catus GD-7 <400> 125 Asp Ile Asp His Ile Tyr Pro Gln Ser Lys Thr Met Asp Asp Ser Leu 1 5 10 15 Asn Asn Arg Val Leu Val Lys Lys Asn Tyr Asn 20 25 <210> 126 <211> 27 <212> PRT <213> Peptoniphilus duerdenii <400> 126 Asp Gln Asp His Ile Tyr Pro Lys Ser Lys Ile Tyr Asp Asp Ser Leu 1 5 10 15 Glu Asn Arg Val Leu Val Lys Lys Asn Leu Asn 20 25 <210> 127 <211> 27 <212> PRT <213> Catenibacterium mitsuokai DSM 15897 <400> 127 Gln Ile Asp His Ile Val Pro Gln Ser Leu Val Lys Asp Asp Ser Phe 1 5 10 15 Asp Asn Arg Val Leu Val Val Pro Ser Glu Asn 20 25 <210> 128 <211> 27 <212> PRT <213> S. mutans <400> 128 Asp Ile Asp His Ile Ile Pro Gln Ala Phe Ile Lys Asp Asn Ser Ile 1 5 10 15 Asp Asn Arg Val Leu Thr Ser Ser Lys Glu Asn 20 25 <210> 129 <211> 27 <212> PRT <213> S. thermophilus <400> 129 Asp Ile Asp His Ile Ile Pro Gln Ala Phe Leu Lys Asp Asn Ser Ile 1 5 10 15 Asp Asn Lys Val Leu Val Ser Ser Ala Ser Asn 20 25 <210> 130 <211> 27 <212> PRT <213> Oenococcus kitaharae DSM 17330 <400> 130 Asp Ile Asp His Ile Ile Pro Gln Ala Tyr Thr Lys Asp Asn Ser Leu 1 5 10 15 Asp Asn Arg Val Leu Val Ser Asn Ile Thr Asn 20 25 <210> 131 <211> 27 <212> PRT <213> L. inocua <400> 131 Asp Ile Asp His Ile Val Pro Gln Ser Phe Ile Thr Asp Asn Ser Ile 1 5 10 15 Asp Asn Leu Val Leu Thr Ser Ser Ala Gly Asn 20 25 <210> 132 <211> 27 <212> PRT <213> S. pyogenes <400> 132 Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile 1 5 10 15 Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn 20 25 <210> 133 <211> 27 <212> PRT <213> Acidaminococcus sp. D21 <400> 133 Asn Ile Asp His Ile Tyr Pro Gln Ser Met Val Lys Asp Asp Ser Leu 1 5 10 15 Asp Asn Lys Val Leu Val Gln Ser Glu Ile Asn 20 25 <210> 134 <211> 27 <212> PRT <213> Lactobacillus rhamnosus GG <400> 134 Asp Ile Asp His Ile Leu Pro Gln Ser Leu Ile Lys Asp Asp Ser Leu 1 5 10 15 Asp Asn Arg Val Leu Val Asn Ala Thr Ile Asn 20 25 <210> 135 <211> 27 <212> PRT <213> Lactobacillus gasseri <400> 135 Asp Ile Asp His Ile Leu Pro Gln Ser Phe Ile Lys Asp Asp Ser Leu 1 5 10 15 Glu Asn Arg Val Leu Val Lys Lys Ala Val Asn 20 25 <210> 136 <211> 27 <212> PRT <213> Staphylococcus pseudintermedius ED99 <400> 136 Glu Val Asp His Ile Phe Pro Arg Ser Phe Ile Lys Asp Asp Ser Ile 1 5 10 15 Asp Asn Lys Val Leu Val Ile Lys Lys Met Asn 20 25 <210> 137 <211> 27 <212> PRT <213> Olsenella uli <400> 137 Glu Val Asp His Ile Ile Pro Arg Ser Tyr Ile Lys Asp Asp Ser Phe 1 5 10 15 Glu Asn Lys Val Leu Val Tyr Arg Glu Glu Asn 20 25 <210> 138 <211> 27 <212> PRT <213> Bifidobacterium bifidum S17 <400> 138 Asp Ile Asp His Ile Ile Pro Gln Ala Val Thr Gln Asn Asp Ser Ile 1 5 10 15 Asp Asn Arg Val Leu Val Ala Arg Ala Glu Asn 20 25 <210> 139 <211> 27 <212> PRT <213> Mycoplasma gallisepticum str. F <400> 139 Glu Ile Asp His Ile Ile Pro Tyr Ser Ile Ser Phe Asp Asp Ser Ser 1 5 10 15 Ser Asn Lys Leu Leu Val Leu Ala Glu Ser Asn 20 25 <210> 140 <211> 27 <212> PRT <213> Mycoplasma canis PG 14 <400> 140 Glu Ile Asp His Ile Ile Pro Tyr Ser Leu Cys Phe Asp Asp Ser Ser 1 5 10 15 Ala Asn Lys Val Leu Val His Lys Gln Ser Asn 20 25 <210> 141 <211> 27 <212> PRT <213> Ilyobacter polytropus DSM 2926 <400> 141 Asp Ile Asp His Ile Ile Pro Tyr Ser Arg Ser Met Asp Asp Ser Tyr 1 5 10 15 Ser Asn Lys Val Leu Val Leu Ser Gly Glu Asn 20 25 <210> 142 <211> 27 <212> PRT <213> Uncultured Termite group 1 bacterium <400> 142 Asp Ile Asp His Ile Ile Pro Tyr Ser Lys Ser Met Asp Asp Ser Phe 1 5 10 15 Asn Asn Lys Val Leu Cys Leu Ala Glu Glu Asn 20 25 <210> 143 <211> 27 <212> PRT <213> Campylobacter jejuni <400> 143 Glu Ile Asp His Ile Tyr Pro Tyr Ser Arg Ser Phe Asp Asp Ser Tyr 1 5 10 15 Met Asn Lys Val Leu Val Phe Thr Lys Gln Asn 20 25 <210> 144 <211> 27 <212> PRT <213> Clostridium cellulolyticum H10 <400> 144 Gln Ile Asp His Ile Tyr Pro Tyr Ser Arg Ser Met Asp Asp Ser Tyr 1 5 10 15 Met Asn Lys Val Leu Val Leu Thr Asp Glu Asn 20 25 <210> 145 <211> 27 <212> PRT <213> Clostridium perfringens <400> 145 Glu Ile Asp His Ile Ile Pro Phe Ser Arg Ser Phe Asp Asp Ser Leu 1 5 10 15 Ser Asn Lys Ile Leu Val Leu Gly Ser Glu Asn 20 25 <210> 146 <211> 27 <212> PRT <213> N. meningitides <400> 146 Glu Ile Asp His Ala Leu Pro Phe Ser Arg Thr Trp Asp Asp Ser Phe 1 5 10 15 Asn Asn Lys Val Leu Val Leu Gly Ser Glu Asn 20 25 <210> 147 <211> 27 <212> PRT <213> Pasteurella multocida str. Pm70 <400> 147 Glu Ile Asp His Ala Leu Pro Phe Ser Arg Thr Trp Asp Asp Ser Phe 1 5 10 15 Asn Asn Lys Val Leu Val Leu Ala Ser Glu Asn 20 25 <210> 148 <211> 27 <212> PRT <213> Enterococcus faecalis TX0012 <400> 148 Glu Ile Asp His Ile Ile Pro Ile Ser Ile Ser Leu Asp Asp Ser Ile 1 5 10 15 Asn Asn Lys Val Leu Val Leu Ser Lys Ala Asn 20 25 <210> 149 <211> 27 <212> PRT <213> Eubacterium dolichum DSM 3991 <400> 149 Glu Val Asp His Ile Ile Pro Ile Ser Ile Ser Leu Asp Asp Ser Ile 1 5 10 15 Thr Asn Lys Val Leu Val Thr His Arg Glu Asn 20 25 <210> 150 <211> 27 <212> PRT <213> Acidovorax ebreus <400> 150 Gln Val Asp His Ala Leu Pro Tyr Ser Arg Ser Tyr Asp Asp Ser Lys 1 5 10 15 Asn Asn Lys Val Leu Val Leu Thr His Glu Asn 20 25 <210> 151 <211> 27 <212> PRT <213> Streptococcus thermophilus LMD-9 <400> 151 Glu Val Asp His Ile Leu Pro Leu Ser Ile Thr Phe Asp Asp Ser Leu 1 5 10 15 Ala Asn Lys Val Leu Val Tyr Ala Thr Ala Asn 20 25 <210> 152 <211> 27 <212> PRT <213> Eubacterium rectale <400> 152 Glu Ile Asp His Ile Ile Pro Arg Ser Ile Ser Phe Asp Asp Ala Arg 1 5 10 15 Ser Asn Lys Val Leu Val Tyr Arg Ser Glu Asn 20 25 <210> 153 <211> 27 <212> PRT <213> Staphylococcus lugdunensis M23590 <400> 153 Glu Val Asp His Ile Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Tyr 1 5 10 15 His Asn Lys Val Leu Val Lys Gln Ser Glu Asn 20 25 <210> 154 <211> 27 <212> PRT <213> Roseburia intestinalis <400> 154 Asp Ile Asp His Ile Leu Pro Tyr Ser Ile Thr Phe Asp Asp Ser Phe 1 5 10 15 Arg Asn Lys Val Leu Val Thr Ser Gln Glu Asn 20 25 <210> 155 <211> 27 <212> PRT <213> Wolinella succinogenes DSM 1740 <400> 155 Glu Ile Asp His Ile Leu Pro Arg Ser Arg Ser Ala Asp Asp Ser Phe 1 5 10 15 Ala Asn Lys Val Leu Cys Leu Ala Arg Ala Asn 20 25 <210> 156 <211> 27 <212> PRT <213> Cand. Puniceispirillum marinum <400> 156 Glu Ile Glu His Leu Leu Pro Phe Ser Leu Thr Leu Asp Asp Ser Met 1 5 10 15 Ala Asn Lys Thr Val Cys Phe Arg Gln Ala Asn 20 25 <210> 157 <211> 27 <212> PRT <213> Azospirillum sp. B510 <400> 157 Asp Ile Asp His Ile Leu Pro Phe Ser Val Ser Leu Asp Asp Ser Ala 1 5 10 15 Ala Asn Lys Val Val Cys Leu Arg Glu Ala Asn 20 25 <210> 158 <211> 27 <212> PRT <213> Bradyrhizobium sp. BTAi1 <400> 158 Asp Ile Asp His Leu Ile Pro Phe Ser Ile Ser Trp Asp Asp Ser Ala 1 5 10 15 Ala Asn Lys Val Val Cys Met Arg Tyr Ala Asn 20 25 <210> 159 <211> 27 <212> PRT <213> Nitrobacter hamburgensis X14 <400> 159 Asp Ile Asp His Ile Leu Pro Val Ala Met Thr Leu Asp Asp Ser Pro 1 5 10 15 Ala Asn Lys Ile Ile Cys Met Arg Tyr Ala Asn 20 25 <210> 160 <211> 27 <212> PRT <213> Dinoroseobacter shibae <400> 160 Asp Val Asp His Ile Leu Pro Tyr Ser Arg Thr Leu Asp Asp Ser Phe 1 5 10 15 Pro Asn Arg Thr Leu Cys Leu Arg Glu Ala Asn 20 25 <210> 161 <211> 27 <212> PRT <213> Verminephrobacter eiseniae <400> 161 Glu Ile Glu His Ile Leu Pro Phe Ser Arg Thr Leu Asp Asp Ser Leu 1 5 10 15 Asn Asn Arg Thr Val Ala Met Arg Arg Ala Asn 20 25 <210> 162 <211> 27 <212> PRT <213> Lactobacillus coryniformis KCTC 3535 <400> 162 Glu Val Asp His Ile Ile Pro Tyr Ser Ile Ser Trp Asp Asp Ser Tyr 1 5 10 15 Thr Asn Lys Val Leu Thr Ser Ala Lys Cys Asn 20 25 <210> 163 <211> 27 <212> PRT <213> Rhodopseudomonas palustris <400> 163 Gln Val Asp His Ile Leu Pro Trp Ser Arg Phe Gly Asp Asp Ser Tyr 1 5 10 15 Leu Asn Lys Thr Leu Cys Thr Ala Arg Ser Asn 20 25 <210> 164 <211> 27 <212> PRT <213> Ralstonia syzygii R24 <400> 164 Gln Val Asp His Ile Leu Pro Phe Ser Lys Thr Leu Asp Asp Ser Phe 1 5 10 15 Ala Asn Lys Val Leu Ala Gln His Asp Ala Asn 20 25 <210> 165 <211> 27 <212> PRT <213> Helicobacter mustelae 12198 <400> 165 Gln Ile Asp His Ala Phe Pro Leu Ser Arg Ser Leu Asp Asp Ser Gln 1 5 10 15 Ser Asn Lys Val Leu Cys Leu Thr Ser Ser Asn 20 25 <210> 166 <211> 27 <212> PRT <213> Mycoplasma mobile 163K <400> 166 Asp Ile Asp His Ile Val Pro Arg Ser Ile Ser Phe Asp Asp Ser Phe 1 5 10 15 Ser Asn Leu Val Ile Val Asn Lys Leu Asp Asn 20 25 <210> 167 <211> 27 <212> PRT <213> Mycoplasma ovipneumoniae SC01 <400> 167 Glu Ile Glu His Ile Ile Pro Tyr Ser Met Ser Tyr Asp Asn Ser Gln 1 5 10 15 Ala Asn Lys Ile Leu Thr Glu Lys Ala Glu Asn 20 25 <210> 168 <211> 27 <212> PRT <213> Mycoplasma synoviae 53 <400> 168 Glu Ile Asp His Val Ile Pro Tyr Ser Lys Ser Ala Asp Asp Ser Trp 1 5 10 15 Phe Asn Lys Leu Leu Val Lys Lys Ser Thr Asn 20 25 <210> 169 <211> 27 <212> PRT <213> Aminomonas paucivorans DSM 12260 <400> 169 Glu Met Asp His Ile Leu Pro Tyr Ser Arg Ser Leu Asp Asn Gly Trp 1 5 10 15 His Asn Arg Val Leu Val His Gly Lys Asp Asn 20 25 <210> 170 <211> 27 <212> PRT <213> Ruminococcus albus 8 <400> 170 Glu Val Asp His Ile Val Pro Tyr Ser Leu Ile Leu Asp Asn Thr Ile 1 5 10 15 Asn Asn Lys Ala Leu Val Tyr Ala Glu Glu Asn 20 25 <210> 171 <211> 27 <212> PRT <213> Fibrobacter succinogenes <400> 171 Glu Ile Glu His Val Ile Pro Gln Ser Leu Tyr Phe Asp Asp Ser Phe 1 5 10 15 Ser Asn Lys Val Ile Cys Glu Ala Glu Val Asn 20 25 <210> 172 <211> 27 <212> PRT <213> Bacteroides fragilis, NCTC 9343 <400> 172 Asp Ile Glu His Ile Ile Pro Gln Ala Arg Leu Phe Asp Asp Ser Phe 1 5 10 15 Ser Asn Lys Thr Leu Glu Ala Arg Ser Val Asn 20 25 <210> 173 <211> 27 <212> PRT <213> Capnocytophaga sputigena <400> 173 Glu Ile Glu His Ile Val Pro Lys Ala Arg Val Phe Asp Asp Ser Phe 1 5 10 15 Ser Asn Lys Thr Leu Thr Phe His Arg Ile Asn 20 25 <210> 174 <211> 28 <212> PRT <213> Finegoldia magna <400> 174 Asp Lys Asp His Ile Ile Pro Gln Ser Met Lys Lys Asp Asp Ser Ile 1 5 10 15 Ile Asn Asn Leu Val Leu Val Asn Lys Asn Ala Asn 20 25 <210> 175 <211> 27 <212> PRT <213> Parvibaculum lavamentivorans DS-1 <400> 175 Glu Val Glu His Ile Trp Pro Arg Ser Arg Ser Phe Asp Asn Ser Pro 1 5 10 15 Arg Asn Lys Thr Leu Cys Arg Lys Asp Val Asn 20 25 <210> 176 <211> 27 <212> PRT <213> Bacillus cereus <400> 176 Ile Val Asn His Ile Ile Pro Tyr Asn Arg Ser Phe Asp Asp Thr Tyr 1 5 10 15 His Asn Arg Val Leu Thr Leu Thr Glu Thr Lys 20 25 <210> 177 <211> 27 <212> PRT <213> Prevotella micans <400> 177 Asp Met Glu His Thr Ile Pro Lys Ser Ile Ser Phe Asp Asn Ser Asp 1 5 10 15 Gln Asn Leu Thr Leu Cys Glu Ser Tyr Tyr Asn 20 25 <210> 178 <211> 27 <212> PRT <213> Prevotella ruminicola <400> 178 Asp Ile Glu His Thr Ile Pro Arg Ser Ala Gly Gly Asp Ser Thr Lys 1 5 10 15 Met Asn Leu Thr Leu Cys Ser Ser Arg Phe Asn 20 25 <210> 179 <211> 27 <212> PRT <213> Flavobacterium columnare <400> 179 Asp Ile Glu His Thr Ile Pro Arg Ser Ile Ser Gln Asp Asn Ser Gln 1 5 10 15 Met Asn Lys Thr Leu Cys Ser Leu Lys Phe Asn 20 25 <210> 180 <211> 27 <212> PRT <213> Rhodospirillum rubrum <400> 180 Asp Ile Asp His Val Ile Pro Leu Ala Arg Gly Gly Arg Asp Ser Leu 1 5 10 15 Asp Asn Met Val Leu Cys Gln Ser Asp Ala Asn 20 25 <210> 181 <211> 27 <212> PRT <213> Elusimicrobium minutum Pei191 <400> 181 Asp Ile Glu His Leu Phe Pro Ile Ala Glu Ser Glu Asp Asn Gly Arg 1 5 10 15 Asn Asn Leu Val Ile Ser His Ser Ala Cys Asn 20 25 <210> 182 <211> 27 <212> PRT <213> Sphaerochaeta globus str. Buddy <400> 182 Asp Val Asp His Ile Phe Pro Arg Asp Asp Thr Ala Asp Asn Ser Tyr 1 5 10 15 Gly Asn Lys Val Val Ala His Arg Gln Cys Asn 20 25 <210> 183 <211> 27 <212> PRT <213> Nitratifractor salsuginis DSM 16511 <400> 183 Asp Ile Glu His Ile Val Pro Gln Ser Leu Gly Gly Leu Ser Thr Asp 1 5 10 15 Tyr Asn Thr Ile Val Thr Leu Lys Ser Val Asn 20 25 <210> 184 <211> 27 <212> PRT <213> Acidothermus cellulolyticus 11B <400> 184 Glu Leu Asp His Ile Val Pro Arg Thr Asp Gly Gly Ser Asn Arg His 1 5 10 15 Glu Asn Leu Ala Ile Thr Cys Gly Ala Cys Asn 20 25 <210> 185 <211> 28 <212> PRT <213> Bifidobacterium longum DJO10A <400> 185 Glu Met Asp His Ile Val Pro Arg Lys Gly Val Gly Ser Thr Asn Thr 1 5 10 15 Arg Thr Asn Phe Ala Ala Val Cys Ala Glu Cys Asn 20 25 <210> 186 <211> 28 <212> PRT <213> Bifidobacterium dentium <400> 186 Glu Met Asp His Ile Val Pro Arg Lys Gly Val Gly Ser Thr Asn Thr 1 5 10 15 Arg Val Asn Leu Ala Ala Ala Cys Ala Ala Cys Asn 20 25 <210> 187 <211> 28 <212> PRT <213> Corynebacterium diphtheria <400> 187 Glu Met Asp His Ile Val Pro Arg Ala Gly Gln Gly Ser Thr Asn Thr 1 5 10 15 Arg Glu Asn Leu Val Ala Val Cys His Arg Cys Asn 20 25 <210> 188 <211> 33 <212> PRT <213> Sutterella wadsworthensis <400> 188 Glu Ile Asp His Ile Leu Pro Arg Ser Leu Ile Lys Asp Ala Arg Gly 1 5 10 15 Ile Val Phe Asn Ala Glu Pro Asn Leu Ile Tyr Ala Ser Ser Arg Gly 20 25 30 Asn <210> 189 <211> 33 <212> PRT <213> Gamma proteobacterium HTCC5015 <400> 189 Glu Ile Asp His Ile Ile Pro Arg Ser Leu Thr Gly Arg Thr Lys Lys 1 5 10 15 Thr Val Phe Asn Ser Glu Ala Asn Leu Ile Tyr Cys Ser Ser Lys Gly 20 25 30 Asn <210> 190 <211> 33 <212> PRT <213> Parasutterella excrementihominis <400> 190 Glu Ile Asp His Ile Ile Pro Arg Ser Leu Thr Leu Lys Lys Ser Glu 1 5 10 15 Ser Ile Tyr Asn Ser Glu Val Asn Leu Ile Phe Val Ser Ala Gln Gly 20 25 30 Asn <210> 191 <211> 33 <212> PRT <213> Legionella pneumophila str. Paris <400> 191 Glu Ile Asp His Ile Tyr Pro Arg Ser Leu Ser Lys Lys His Phe Gly 1 5 10 15 Val Ile Phe Asn Ser Glu Val Asn Leu Ile Tyr Cys Ser Ser Gln Gly 20 25 30 Asn <210> 192 <211> 33 <212> PRT <213> Wolinella succinogenes DSM 1740 <400> 192 Glu Ile Asp His Ile Leu Pro Arg Ser His Thr Leu Lys Ile Tyr Gly 1 5 10 15 Thr Val Phe Asn Pro Glu Gly Asn Leu Ile Tyr Val His Gln Lys Cys 20 25 30 Asn <210> 193 <211> 30 <212> PRT <213> Francisella tularensis <400> 193 Glu Leu Asp His Ile Ile Pro Arg Ser His Lys Lys Tyr Gly Thr Leu 1 5 10 15 Asn Asp Glu Ala Asn Leu Ile Cys Val Thr Arg Gly Asp Asn 20 25 30 <210> 194 <211> 27 <212> PRT <213> Akkermansia muciniphila <400> 194 Glu Leu Glu His Ile Val Pro His Ser Phe Arg Gln Ser Asn Ala Leu 1 5 10 15 Ser Ser Leu Val Leu Thr Trp Pro Gly Val Asn 20 25 <210> 195 <211> 27 <212> PRT <213> Solobacterium moorei F0204 <400> 195 Asp Ile Asp His Ile Tyr Pro Arg Ser Lys Ile Lys Asp Asp Ser Ile 1 5 10 15 Thr Asn Arg Val Leu Val Glu Lys Asp Ile Asn 20 25 <210> 196 <211> 28 <212> PRT <213> Veillonella atypica ACS-134-V-Col7a <400> 196 Tyr Asp Ile Asp His Ile Tyr Pro Arg Ser Leu Thr Lys Asp Asp Ser 1 5 10 15 Phe Asp Asn Leu Val Leu Cys Glu Arg Thr Ala Asn 20 25 <210> 197 <211> 28 <212> PRT <213> Fusobacterium nucleatum <400> 197 Asp Ile Asp His Ile Tyr Pro Arg Ser Lys Val Ile Lys Asp Asp Ser 1 5 10 15 Phe Asp Asn Leu Val Leu Val Leu Lys Asn Glu Asn 20 25 <210> 198 <211> 27 <212> PRT <213> Filifactor alocis <400> 198 Asp Arg Asp His Ile Tyr Pro Gln Ser Lys Ile Lys Asp Asp Ser Ile 1 5 10 15 Asp Asn Leu Val Leu Val Asn Lys Thr Tyr Asn 20 25 <210> 199 <211> 5 <212> DNA <213> Streptococcus thermophilus <220> <221> misc_feature <222> (1)..(1) <223> Any nucleotide (e.g., A, G, C, or T) <220> <221> misc_feature <222> (4)..(4) <223> Any nucleotide (e.g., A, G, C, or T) <400> 199 nggng 5 <210> 200 <211> 7 <212> DNA <213> Streptococcus thermophilus <220> <221> misc_feature <222> (1)..(1) <223> Any nucleotide (e.g., A, G, C, or T) <220> <221> misc_feature <222> (2)..(2) <223> Any nucleotide (e.g., A, G, C, or T) <220> <221> misc_feature <222> (7)..(7) <223> A or T <400> 200 nnagaaw 7 <210> 201 <211> 4 <212> DNA <213> Streptococcus mutans <220> <221> misc_feature <222> (1)..(1) <223> Any nucleotide (e.g., A, G, C, or T) <220> <221> misc_feature <222> (4)..(4) <223> A or G <400> 201 naar 4 <210> 202 <211> 5 <212> DNA <213> Staphylococcus aureus <220> <221> misc_feature <222> (1)..(1) <223> Any nucleotide (e.g., A, G, C, or T) <220> <221> misc_feature <222> (2)..(2) <223> Any nucleotide (e.g., A, G, C, or T) <220> <221> misc_feature <222> (4)..(4) <223> A or G <220> <221> misc_feature <222> (5)..(5) <223> A or G <400> 202 nngrr 5 <210> 203 <211> 6 <212> DNA <213> Staphylococcus aureus <220> <221> misc_feature <222> (1)..(1) <223> Any nucleotide (e.g., A, G, C, or T) <220> <221> misc_feature <222> (2)..(2) <223> Any nucleotide (e.g., A, G, C, or T) <220> <221> misc_feature <222> (4)..(4) <223> A or G <220> <221> misc_feature <222> (5)..(5) <223> A or G <220> <221> misc_feature <222> (6)..(6) <223> Any nucleotide (e.g., A, G, C, or T) <400> 203 nngrrn 6 <210> 204 <211> 6 <212> DNA <213> Staphylococcus aureus <220> <221> misc_feature <222> (1)..(1) <223> Any nucleotide (e.g., A, G, C, or T) <220> <221> misc_feature <222> (2)..(2) <223> Any nucleotide (e.g., A, G, C, or T) <220> <221> misc_feature <222> (4)..(4) <223> A or G <220> <221> misc_feature <222> (5)..(5) <223> A or G <400> 204 nngrrt 6 <210> 205 <211> 6 <212> DNA <213> Staphylococcus aureus <220> <221> misc_feature <222> (1)..(1) <223> Any nucleotide (e.g., A, G, C, or T) <220> <221> misc_feature <222> (2)..(2) <223> Any nucleotide (e.g., A, G, C, or T) <220> <221> misc_feature <222> (4)..(4) <223> A or G <220> <221> misc_feature <222> (5)..(5) <223> A or G <220> <221> misc_feature <222> (6)..(6) <223> A, G, or C <400> 205 nngrrv 6 <210> 206 <211> 80 <212> DNA <213> Streptococcus pyogenes <400> 206 gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60 ggcaccgagt cggtgctttt 80 <210> 207 <211> 80 <212> DNA <213> Staphylococcus aureus <400> 207 gttttagtac tctggaaaca gaatctacta aaacaaggca aaatgccgtg tttatctcgt 60 caacttgttg gcgagatttt 80 <210> 208 <211> 100 <212> RNA <213> Artificial Sequence <220> <223> gRNA molecule <400> 208 guaacggcag acuucuccuc guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 209 <211> 101 <212> RNA <213> Artificial Sequence <220> <223> gRNA molecule <400> 209 gguaacggca gacuucuccu cguuuuagag cuagaaauag caaguuaaaa uaaggcuagu 60 ccguuaucaa cuugaaaaag uggcaccgag ucggugcuuu u 101 <210> 210 <211> 102 <212> RNA <213> Artificial Sequence <220> <223> gRNA molecule <400> 210 ggguaacggc agacuucucc ucguuuuaga gcuagaaaua gcaaguuaaa auaaggcuag 60 uccguuauca acuugaaaaa guggcaccga gucggugcuu uu 102

Claims

대상체로의 투여를 위한 Cas9 분자/gRNA 분자 복합체에 대한 스크리닝 방법으로서, 상기 방법이
(a) 복수의 시료를 생성하는 단계로서, 각 시료가 Cas9 분자와, 복수의 gRNA 분자 중 하나를 조합함으로써 생성되는 Cas9 분자/gRNA 분자 복합체를 포함하는, 단계;
(b) 상기 복수의 시료의 각각에서 상기 Cas9 분자/gRNA 분자 복합체의 용융 온도(T_m) 값을 검출하는 단계; 및
(c) (i) 기준 Cas9 분자/gRNA 분자 복합체의 T_m 값 또는 미리 결정된 역치 T_m 값과 상기 복수의 시료에서의 T_m 값의 비교, 또는 (ii) 상기 복수의 시료의 T_m 값의 상대적 순서화 중 하나 이상에 기반하여, 복수의 시료로부터 적어도 하나의 시료를 선택하는 단계를 포함하는 방법.
제1항에 있어서, 상기 복수의 시료의 각 시료에서 상기 Cas9 분자/gRNA 분자 복합체의 T_m 값을 검출하는 단계가 시차 주사 형광측정법(DSF)에 의해 상기 복수의 시료에서 각 시료를 평가하는 것을 포함하는 방법.
제1항에 있어서, 상기 gRNA가 키메라 gRNA인 방법.
제1항에 있어서, 상기 gRNA가 모듈 gRNA인 방법.
제1항 및 제2항 중 어느 한 항의 방법에 따라 선택되는 gRNA 분자의 부재 하의 Cas9 분자의 T_m 값보다 적어도 8℃ 더 큰 용융 온도(T_m)를 갖는 Cas9 분자 및 gRNA 분자의 분리된 복합체.
제1항 및 제2항 중 어느 한 항의 방법에 따라 선택되는 gRNA 분자의 부재 하의 Cas9 분자의 T_m 값보다 적어도 8℃ 더 큰 용융 온도(T_m)를 갖는 Cas9 분자 및 gRNA 분자의 분리된 복합체를 포함하는 조성물.
제6항에 있어서, 상기 Cas9 분자 및 gRNA 분자의 비-자연 발생 복합체의 용융 온도(T_m)와, gRNA 분자의 부재 하의 Cas9 분자의 용융 온도(T_m)의 차이가 시차 주사 형광측정법(DSF)에 의해 평가되는 조성물.
제6항에 있어서, 상기 gRNA가 키메라 또는 모듈 gRNA인 조성물.
Cas9 분자/gRNA 분자 복합체의 안정성의 결정 방법으로서, 상기 방법이
(a) 복수의 Cas9 분자/gRNA 분자 복합체를 생성하는 단계로서, 각각이 Cas9 분자와, 복수의 gRNA 분자 중 하나를 조합함으로써 생성되는 Cas9 분자/gRNA 분자 복합체를 포함하는 단계;
(b) 상기 복수의 Cas9 분자/gRNA 분자 복합체의 각각의 Cas9 분자/gRNA 분자 복합체의 용융 온도(T_m) 값을 검출하는 단계; 및
(c) 상기 Cas9 분자/gRNA 분자 복합체의 T_m 값이 기준 분자의 T_m 값 또는 T_m 기준 값보다 더 크면, 상기 복수의 Cas9 분자/gRNA 분자 복합체 중 하나 이상이 안정한 것을 결정하는 단계를 포함하는 방법.
안정한 Cas9 분자/gRNA 분자 복합체를 촉진시키는 조건의 결정 방법으로서, 상기 방법이
(a) 시료에서 Cas9 분자와 gRNA 분자를 조합하여, Cas9 분자/gRNA 분자 복합체를 형성하는 단계;
(b) 상기 Cas9 분자/gRNA 분자 복합체의 용융 온도(T_m) 값을 검출하는 단계; 및
(c) 상기 Cas9 분자/gRNA 분자 복합체의 T_m 값이 기준 분자의 T_m 값 또는 T_m 기준 값보다 더 크면, 상기 Cas9 분자/gRNA 분자 복합체가 안정한 것을 결정하는 단계를 포함하는 방법.
안정한 Cas9 분자/gRNA 분자 복합체에 대한 스크리닝 방법으로서, 상기 방법이
(a) 시차 주사 형광측정법(DSF)에 의해 Cas9 분자/gRNA 분자 복합체의 용융 온도(T_m) 값을 검출하는 단계; 및
(b) 상기 Cas9 분자/gRNA 분자 복합체의 T_m 값이 기준 분자의 T_m 값 또는 T_m 기준 값보다 더 크면, 상기 Cas9 분자/gRNA 분자 복합체가 안정한 것을 결정하는 단계를 포함하는 방법.
안정한 Cas9 분자/gRNA 분자 복합체를 형성하기 위한 최적의 gRNA의 확인 방법으로서, 상기 방법이
(a) 시료에서 Cas9 분자와 gRNA 분자를 조합하여, Cas9 분자/gRNA 분자 복합체를 형성하는 단계;
(b) 상기 Cas9 분자/gRNA 분자 복합체의 용융 온도(T_m) 값을 검출하는 단계; 및
(c) 상기 Cas9 분자/gRNA 분자 복합체의 T_m 값이 기준 분자의 T_m 값 또는 T_m 기준 값보다 적어도 8℃ 더 크면, 상기 Cas9 분자/gRNA 분자 복합체가 안정한 것을 결정하는 단계를 포함하는 방법.
Cas9 분자/gRNA 분자 복합체의 안정성의 결정 방법으로서, 상기 방법이
(a) 시료에서 Cas9 분자와 gRNA 분자를 조합하여, Cas9 분자/gRNA 분자 복합체를 형성하는 단계;
(b) 상기 Cas9 분자/gRNA 분자 복합체의 용융 온도(T_m) 값을 검출하는 단계;
(c) 상기 Cas9 분자/gRNA 분자 복합체의 활성 값을 측정하는 단계; 및
(d) (i) 상기 Cas9 분자/gRNA 분자 복합체의 T_m 값이 기준 분자의 T_m 값 또는 T_m 기준 값보다 더 크고, (ii) 상기 Cas9 분자/gRNA 분자 복합체의 활성 값이 기준 분자의 활성 값 또는 활성 기준 값보다 더 크면, 상기 Cas9 분자/gRNA 분자 복합체가 안정한 것을 결정하는 단계를 포함하는 방법.
안정한 Cas9 분자/gRNA 분자 복합체를 형성하기 위한 Cas9 분자로의 gRNA 분자의 결합의 최적화 방법으로서, 상기 방법이
(a) 시료에서 Cas9 분자와 gRNA 분자를 조합하여, Cas9 분자/gRNA 분자 복합체를 형성하는 단계;
(b) 상기 Cas9 분자/gRNA 분자 복합체의 용융 온도(T_m)를 검출하는 단계;
(c) 상기 Cas9 분자/gRNA 분자 복합체의 T_m 값과 기준 분자의 T_m 값 또는 T_m 기준 값 사이의 델타 값을 결정하는 단계; 및
(d) 상기 델타 값이 적어도 8℃이며, 상기 Cas9 분자/gRNA 분자 복합체의 T_m 값이 상기 기준 분자의 T_m 값 또는 상기 T_m 기준 값보다 더 크면, 상기 Cas9 분자/gRNA 분자 복합체가 안정한 것을 결정하는 단계를 포함하는 방법.
안정한 Cas9 분자/gRNA 분자 복합체의 검출 방법으로서, 상기 방법이
(a) 기준 분자의 열안정성 값을 검출하는 단계;
(b) 시료에서 Cas9 분자와 gRNA 분자를 조합하여, Cas9 분자/gRNA 분자 복합체를 형성하는 단계;
(c) 상기 Cas9 분자/gRNA 분자 복합체의 열안정성 값을 측정하는 단계; 및
(d) 상기 Cas9 분자/gRNA 분자 복합체의 열안정성 값이 상기 기준 분자의 열안정성 값보다 더 크면, 상기 Cas9 분자/gRNA 분자 복합체가 안정한 것을 결정하는 단계를 포함하는 방법.
제15항에 있어서, 상기 열안정성 값이 변성 온도 값이며, 상기 열안정성 기준 값이 변성 온도 기준 값인, 방법.
제15항에 있어서, 상기 열안정성 값이 용융 온도(T_m) 값이며, 상기 열안정성 기준 값이 T_m 기준 값인, 방법.
제9항 내지 제11항, 제13항 및 제17항 중 어느 한 항에 있어서, 상기 Cas9 분자/gRNA 분자 복합체의 T_m 값이 상기 기준 분자의 T_m 값 또는 T_m 기준 값보다 적어도 1℃, 적어도 2℃, 적어도 3℃, 적어도 4℃, 적어도 5℃, 적어도 6℃, 적어도 7℃, 적어도 8℃, 적어도 9℃, 적어도 10℃, 적어도 11℃, 적어도 12℃, 적어도 13℃, 적어도 14℃, 적어도 15℃, 적어도 16℃, 적어도 17℃, 적어도 18℃, 적어도 19℃ 또는 적어도 20℃ 더 크면, 상기 Cas9 분자/gRNA 분자 복합체가 안정한, 방법.
제18항에 있어서, 상기 Cas9 분자/gRNA 분자 복합체의 T_m이 상기 기준 분자의 T_m 값 또는 T_m 기준 값보다 적어도 8℃ 더 크면, 상기 Cas9 분자/gRNA 분자 복합체가 안정한, 방법.
제9항 내지 제11항, 제13항 및 제17항 중 어느 한 항에 있어서, 상기 Cas9 분자/gRNA 분자 복합체의 T_m 값이 상기 기준 분자의 T_m 값 또는 T_m 기준 값보다 약 1℃, 약 2℃, 약 3℃, 약 4℃, 약 5℃, 약 6℃, 약 7℃, 약 8℃, 약 9℃, 약 10℃, 약 11℃, 약 12℃, 약 13℃, 약 14℃, 약 15℃, 약 16℃, 약 17℃, 약 18℃, 약 19℃ 또는 약 20℃ 더 크면, 상기 Cas9 분자/gRNA 분자 복합체가 안정한, 방법.
제9항 내지 제11항, 제13항 및 제17항 중 어느 한 항에 있어서, 상기 Cas9 분자/gRNA 분자 복합체의 T_m 값이 상기 기준 분자의 T_m 값 또는 T_m 기준 값보다 약 1℃ 내지 5℃, 약 6℃ 내지 10℃, 약 11℃ 내지 15℃ 또는 약 16℃ 내지 20℃ 더 크면, 상기 Cas9 분자/gRNA 분자 복합체가 안정한, 방법.
제21항에 있어서, 상기 Cas9 분자/gRNA 분자 복합체의 T_m 값이 상기 기준 분자의 T_m 값 또는 T_m 기준 값보다 약 6℃ 내지 10℃ 더 크면, 상기 Cas9 분자/gRNA 분자 복합체가 안정한, 방법.
제9항, 제10항, 제12항 내지 제14항 및 제17항 내지 제22항 중 어느 한 항에 있어서, 상기 T_m 값이 열 변화 분석을 사용하여 검출되는, 방법.
제23항에 있어서, 상기 열 변화 분석이 시차 주사 형광측정법(DSF), 시차 주사 열량계(DSC) 또는 등온 적정 열량계(ITC)로부터 선택되는, 방법.
제9항 내지 제24항 중 어느 한 항에 있어서, 상기 gRNA 분자가 키메라 gRNA 분자를 포함하는, 방법.
제9항 내지 제24항 중 어느 한 항에 있어서, 상기 gRNA 분자가 모듈 gRNA 분자를 포함하는, 방법.
제1항 내지 제4항 및 제9항 내지 제26항 중 어느 한 항에 있어서, 상기 Cas9 분자가 표 1로부터 선택되는 Cas9 분자인, 방법.
제1항 내지 제4항 및 제9항 내지 제26항 중 어느 한 항에 있어서, 상기 Cas9 분자가 키메라 Cas9 분자, 또는 합성 또는 조작된 Cas9 분자, 예를 들어, 부분 또는 부분들이 결실된 Cas9 분자인, 방법.
제1항 내지 제4항 및 제9항 내지 제26항 중 어느 한 항에 있어서, 상기 Cas9 분자가 스트렙토코커스 피오게네스(S. pyogenes) 또는 스타필로코커스 아우레우스(S. aureus) Cas9 분자를 포함하는, 방법.
제9항 내지 제29항 중 어느 한 항에 있어서, 상기 기준 분자가
(a) gRNA 분자의 부재 하의 기준 Cas9 분자;
(b) 제2 gRNA 분자(즉, 평가 중인 복합체에서의 gRNA 이외의 gRNA)와 복합체화된 기준 Cas9 분자(예를 들어, 평가 중인 복합체에서의 Cas9 분자와 동일한 Cas9 분자); 및
(c) 기준 Cas9 분자/gRNA 분자 복합체로서, 상기 기준 Cas9 분자/gRNA 분자가 상이한 조건 하에, 예를 들어, 상기 Cas9 분자/gRNA 분자 복합체와 상이한 비의 Cas9 분자 및 gRNA 분자로 형성되거나, 상이한 완충제에서 형성된 기준 Cas9 분자/gRNA 분자 복합체로부터 선택되는, 방법.
제30항에 있어서, 상기 기준 Cas9 분자가 상기 평가 중인 복합체의 Cas9 분자와 동일한, 방법.
제30항에 있어서, 상기 기준 Cas9 분자가 상기 평가 중인 복합체의 Cas9 분자와 상이한, 방법.
제32항에 있어서, 상기 기준 Cas9 분자는 일차 서열이 상기 평가 중인 복합체의 Cas9 분자와 상이한, 방법.
제30항 내지 제33항 중 어느 한 항에 있어서, 상기 기준 Cas9 분자/gRNA 분자 복합체의 gRNA 분자가 상기 평가 중인 복합체의 gRNA 분자와 동일한, 방법.
제30항 내지 제33항 중 어느 한 항에 있어서, 상기 기준 Cas9 분자/gRNA 분자 복합체의 gRNA 분자가 상기 평가 중인 복합체의 gRNA 분자와 상이한, 방법.
제35항에 있어서, 상기 기준 Cas9 분자/gRNA 분자 복합체의 gRNA 분자가 상기 평가 중인 복합체의 gRNA 분자와 서열이 상이하거나, 변형에 의해 상이한, 방법.
제9항 내지 제14항 및 제17항 내지 제36항 중 어느 한 항에 있어서, 상기 T_m 기준 값이 T_m에 대한 미리 선택된 수치를 포함하는, 방법.
제9항 내지 제14항 및 제17항 내지 제36항 중 어느 한 항에 있어서, 상기 T_m 기준 값이 제22항 내지 제27항 중 어느 한 항의 기준 분자 중 임의의 것의 T_m과 상호연관되는 값을 포함하는, 방법.
제1항 내지 제4항, 제9항 내지 제12항 및 제14항 내지 제38항 중 어느 한 항에 있어서,
상기 Cas9 분자/gRNA 분자 복합체의 활성을 검출하는 단계;
상기 Cas9 분자/gRNA 분자 복합체의 활성 값을 측정하는 단계; 및
상기 Cas9 분자/gRNA 분자 복합체의 활성 값이 기준 분자의 활성 값 또는 활성 기준 값보다 더 크면, 상기 Cas9 분자/gRNA 분자 복합체가 안정한 것을 결정하는 단계를 추가로 포함하는, 방법.
제13항 및 제39항 중 어느 한 항에 있어서, 상기 활성이
삽입결실을 유도하는 능력;
표적 DNA를 변형시키는 능력;
미리 선택된 수선 방법의 경향;
DNA 표적에 계속 혼성화되는 상기 gRNA 분자의 능력; 및
상기 Cas9 분자/gRNA 분자 복합체의 Cas9 분자에 결합하는 상기 gRNA 분자의 능력 중 하나 이상을 포함하는, 방법.
제40항에 있어서,
상기 활성 값이 결합 값이며, 상기 활성이 상기 Cas9 분자에 결합하는 상기 gRNA 분자의 능력이며,
시료에서 상기 gRNA 분자와 상기 Cas9 분자를 조합하여, 상기 Cas9 분자/gRNA 분자 복합체를 형성하는 단계;
상기 Cas9 분자/gRNA 분자 복합체의 결합 값을 측정하는 단계; 및
상기 Cas9 분자/gRNA 분자 복합체의 결합 값이 기준 분자의 결합 값 또는 결합 기준 값보다 더 크면, 상기 Cas9 분자/gRNA 분자 복합체가 안정한 것을 결정하는 단계를 포함하는, 방법.
제41항에 있어서, 상기 결합 값이 반응속도론(kinetics) 분석을 사용하여 측정되는, 방법.
제42항에 있어서, 상기 반응속도론 분석이 표면 플라스몬 공명(SPR) 분석, 바이오층 간섭법(BLI) 분석 또는 겔 밴드 변화 분석으로부터 선택되는, 방법.
제40항에 있어서, 상기 미리 선택된 수선 방법의 경향이 HDR 또는 NHEJ인, 방법.
제13항 및 제39항 내지 제44항 중 어느 한 항에 있어서, 상기 Cas9 분자/gRNA 분자 복합체의 활성이
시험관내 시스템;
생체외 시스템;
생체내 시스템;
세포 분석; 또는
동물 모델을 사용하여 시험되는, 방법.
제41항 내지 제45항 중 어느 한 항에 있어서, 상기 기준 분자가 제30항 내지 제33항 중 어느 한 항의 기준 분자 중 어느 하나로부터 선택되는, 방법.
제41항 내지 제45항 중 어느 한 항에 있어서, 상기 기준 Cas9 분자/gRNA 분자 복합체가 상기 Cas9 분자/gRNA 분자 복합체와 상이한 비의 Cas9 분자 및 gRNA 분자로 형성되거나, 상기 Cas9 분자/gRNA 분자 복합체와 상이한 완충제에서 형성되는, 방법.
제10항에 있어서, 상기 시료가 첨가제, 소분자, 안정화 시약, 완충제, pH, 염농도, 글리세롤 농도 또는 다른 완충제 구성성분을 포함하는 구성성분을 포함하는, 방법.
제1항 내지 제4항 및 제9항 내지 제48항 중 어느 한 항의 방법을 이용하여 생성되는 합성 Cas9 분자/gRNA 분자 복합체.
제1항 내지 제3항 및 제9항 내지 제48항 중 어느 한 항의 방법을 이용하여 생성되는 안정한 Cas9 분자/gRNA 분자 복합체를 포함하는 조성물.
제1항 내지 제4항 및 제9항 내지 제48항 중 어느 한 항의 방법을 사용하여 생성되는 안정한 Cas9 분자/gRNA 분자 복합체를 인코딩(encoding)하는 핵산을 포함하는 벡터계(vector system).
제9항 내지 제48항 중 어느 한 항의 안정한 Cas9 분자/gRNA 분자 복합체를 표적 세포로 전달하는 단계를 포함하는 표적 세포로의 Cas9 분자/gRNA 분자 복합체의 전달 방법.
제52항에 있어서, 상기 안정한 Cas9 분자/gRNA 분자 복합체가 RNP 양이온성 지질 트랜스펙션(transfection), 바이러스 벡터 또는 RNA 트랜스펙션에 의해 상기 세포로 전달되는, 방법.
제53항에 있어서, 상기 바이러스 벡터가 AAV 벡터인, 방법.
제1항 및 제9항 중 어느 한 항에 있어서, 상기 복수의 gRNA 분자가 후보 gRNA 분자의 라이브러리인, 방법.
제55항에 있어서, 상기 후보 gRNA 분자의 라이브러리가 tracrRNA 분자 또는 서열의 라이브러리를 포함하는, 방법.
제56항에 있어서, 상기 tracrRNA 분자 또는 서열의 라이브러리가 상이한 길이의 것인, 방법.