KR20180085795A

KR20180085795A - 조작된 핵산 표적화 핵산

Info

Publication number: KR20180085795A
Application number: KR1020187019090A
Authority: KR
Inventors: 폴 다니엘 도노호외; 앤드류 폴 메이
Original assignee: 카리부 바이오사이언시스 인코포레이티드
Priority date: 2015-12-04
Filing date: 2016-12-02
Publication date: 2018-07-27
Also published as: EP3564371A1; US20170159073A1; HK1252755B; CA3004757C; AU2016363024B2; US9970029B1; IL259148B; US20180251788A1; CN108473981B; MX2018005392A; CA3004757A1; SG11201803593QA; CN108473981A; ES2735773T3; RU2018117360A3; EP3564371B1; NZ756843A; HK1252755A1; US9771600B2; JP2019500867A

Abstract

본 개시내용은 스캐폴드를 형성하는 조작된 폴리뉴클레오티드 서열, 및 이러한 스캐폴드를 형성하는 조작된 폴리뉴클레오티드 서열 및 핵산 결합 단백질을 포함하는 핵단백질 복합체를 제공한다. 스캐폴드를 형성하는 조작된 폴리뉴클레오티드 서열을 코딩하는 핵산 서열, 뿐만 아니라 이러한 폴리뉴클레오티드 서열을 포함하는 발현 카세트, 벡터 및 세포가 기재된다. 스캐폴드를 형성하는 조작된 폴리뉴클레오티드 서열을 제조 및 사용하는 다양한 방법이 또한 개시된다.

Description

조작된 핵산 표적화 핵산

관련 출원에 대한 상호 참조

본 출원은 2015년 12월 4일에 출원되고 현재 계류중인 미국 특허 가출원 일련 번호 62/263,232 (그 전문이 본원에 참조로 포함됨)를 우선권 주장한다.

연방 후원 연구 또는 개발에 관한 진술

적용가능하지 않음

서열 목록

본 출원은 ASCII 포맷으로 전자 제출되었으며 그 전문이 본원에 참조로 포함된 서열 목록을 함유한다. 2016년 12월 2일에 생성된 ASCII 카피는 CBI020-30_ST25.txt로 명명되고, 156 KB 크기이다.

기술 분야

본 개시내용은 일반적으로 스캐폴드를 형성하는 조작된 폴리뉴클레오티드 서열, 및 이러한 스캐폴드 및 핵산 결합 단백질을 포함하는 핵단백질 복합체에 관한 것이다. 스캐폴드 폴리뉴클레오티드 성분을 코딩하는 핵산 서열, 뿐만 아니라 폴리뉴클레오티드 성분을 포함하는 발현 카세트, 벡터 및 세포가 기재된다. 본 개시내용은 또한 본 발명의 스캐폴드를 형성하는 조작된 핵산 서열 및 핵단백질 복합체를 제조 및 사용하는 방법에 관한 것이다.

클러스터링된 규칙적 간격의 짧은 회문식 반복부 (CRISPR) 및 CRISPR-회합된 단백질 (Cas)은 CRISPR-Cas 시스템을 구성한다. CRISPR-Cas 시스템은 박테리아에서 외래 DNA에 대한 적응 면역을 제공한다 (예를 들어, 문헌 [Barrangou, R., et al., Science 315:1709-1712 (2007); Makarova, K. S., et al., Nature Reviews Microbiology 9:467-477 (2011); Garneau, J. E., et al., Nature 468:67-71 (2010); Sapranauskas, R., et al., Nucleic Acids Research 39:9275-9282 (2011)] 참조).

CRISPR-Cas 시스템은 최근에 5종의 유형 및 16종의 하위유형을 포함하는 2종의 부류로 재분류되었다 (문헌 [Makarova, K., et al., Nature Reviews Microbiology 13:1-15 (2015)] 참조). 이러한 분류는 CRISPR-Cas 유전자좌에서 모든 Cas 유전자를 확인하고 각각의 CRISPR-Cas 유전자좌에서 서명 유전자를 결정하여, 궁극적으로 이펙터 모듈, 즉, 간섭 단계에 수반되는 단백질을 코딩하는 유전자에 기초하여 CRISPR-Cas 시스템을 부류 1 또는 부류 2에 배치하는 것에 기초한다. 최근에 제6 CRISPR-Cas 시스템 (제VI형)이 확인되었다 (문헌 [Abudayyeh O., et al., Science 353(6299):aaf5573 (2016)] 참조). 특정 박테리아는 1종 초과 유형의 CRISPR-Cas 시스템을 보유한다.

부류 1 시스템은 다중-서브유닛 crRNA-이펙터 복합체를 갖는 반면, 부류 2 시스템은 단일 단백질, 예컨대 Cas9, Cpf1, C2c1, C2c2, C2c3 또는 crRNA-이펙터 복합체를 갖는다. 부류 1 시스템은 제I형, 제III형 및 제IV형 시스템을 포함한다. 부류 2 시스템은 제II형, 제V형 및 제VI형 시스템을 포함한다.

제II형 시스템은 cas1, cas2 및 cas9 유전자를 갖는다. cas9 유전자는 crRNA-이펙터 복합체의 기능을 DNA 표적 서열 절단과 조합하는 다중-도메인 단백질을 코딩한다. 제II형 시스템은 추가로 3종의 하위유형, 하위유형 II-A, II-B 및 II-C로 분류된다. 하위유형 II-A는 추가의 유전자 csn2를 함유한다. 하위유형 II-A 시스템을 갖는 유기체의 예는 스트렙토코쿠스 피오게네스(Streptococcus pyogenes), 스트렙토코쿠스 써모필루스(Streptococcus thermophilus) 및 스타필로코쿠스 아우레우스(Staphylococcus aureu)를 포함하나 이에 제한되지는 않는다. 하위유형 II-B는 csn2 단백질이 결여되나, cas4 단백질을 갖는다. 하위유형 II-B 시스템을 갖는 유기체의 예는 레지오넬라 뉴모필라(Legionella pneumophila)이다. 하위유형 II-C는 박테리아에서 발견되는 가장 흔한 제II형 시스템이고, 오직 3종의 단백질, Cas1, Cas2 및 Cas9를 갖는다. 하위유형 II-C 시스템을 갖는 유기체의 예는 네이세리아 락타미카(Neisseria lactamica)이다.

제V형 시스템은 cpf1 유전자 및 cas1 및 cas2 유전자를 갖는다 (문헌 [Zetsche, B., et al., Cell 163:1-13 (2015)] 참조). cpf1 유전자는, Cas9의 각각의 도메인에 상동인 RuvC-유사 뉴클레아제 도메인을 갖지만 Cas9 단백질에 존재하는 HNH 뉴클레아제 도메인이 결여된 단백질 Cpf1을 코딩한다. 제V형 시스템은 파르쿠박테리아 박테리움(Parcubacteria bacterium), 라크노스피라세아에 박테리움(Lachnospiraceae bacterium), 부티리비브리오 프로테오클라스티쿠스(Butyrivibrio proteoclasticus), 페레그리니박테리아 박테리움(Peregrinibacteria bacterium), 아시다미노코쿠스(Acidaminococcus) 종, 포르피로모나스 마카카에(Porphyromonas macacae), 포르피로모나스 크레비오리카니스(Porphyromonas crevioricanis), 프레보텔라 디시엔스(Prevotella disiens), 모락셀라 보보쿨리(Moraxella bovoculi), 스미텔라(Smithella) 종, 렙토스피라 이나다이(Leptospira inadai), 프란시셀라 툴라렌시스(Franciscella tularensis), 프란시셀라 노비시다(Franciscella novicida), 칸디다투스 메타노플라스마 테르미툼(Candidatus methanoplasma termitum) 및 유박테리움 엘리겐스(Eubacterium eligens)를 포함하나 이에 제한되지는 않는 여러 박테리아에서 확인되었다. 최근에 Cpf1이 또한 RNase 활성을 갖고 프리-crRNA 프로세싱을 담당하는 것으로 입증되었다 (문헌 [Fonfara, I., et al., Nature 532(7600):517-521 (2016)] 참조).

부류 2 시스템에서, crRNA는 단일 단백질과 회합되고, RNA-결합 도메인에 의한 뉴클레아제 활성 및 crRNA와 핵산 표적 서열 사이의 염기 쌍 형성을 조합함으로써 간섭을 달성한다.

제II형 시스템에서, 핵산 표적 서열 결합은 Cas9 및 crRNA를 수반하며, 핵산 표적 서열 절단도 마찬가지이다. 제II형 시스템에서, Cas9의 RuvC-유사 뉴클레아제 (RNase H 폴드) 도메인 및 HNH (McrA-유사) 뉴클레아제 도메인은 각각 이중-가닥 핵산 표적 서열의 가닥 중 1개를 절단한다. 제II형 시스템의 Cas9 절단 활성은 또한 Cas9 단백질에 의한 crRNA 및 핵산 표적 서열 결합을 용이하게 하는 듀플렉스를 형성하기 위해 crRNA의 tracrRNA로의 혼성화를 필요로 한다.

제V형 시스템에서, 핵산 표적 서열 결합은 Cpf1 및 crRNA를 수반하며, 핵산 표적 서열 절단도 마찬가지이다. 제V형 시스템에서, Cpf1의 RuvC-유사 뉴클레아제 도메인은 이중-가닥 핵산 표적 서열의 1개의 가닥을 절단하고, 추정 뉴클레아제 도메인은 Cas9 절단에 의해 생성되는 평활 말단과는 대조적으로, 이중-가닥 핵산 표적 서열의 다른 가닥을 엇갈린 형태로 절단하여 5' 오버행을 생성한다.

제V형 시스템의 Cpf1 절단 활성은 듀플렉스를 형성하기 위해 crRNA의 tracrRNA로의 혼성화를 필요로 하지 않고, 오히려 제V형 시스템의 crRNA는 내부 듀플렉스를 형성하는 스템-루프 구조를 갖는 단일 crRNA를 사용한다. Cpf1은 스템 루프 및 스템 루프에 인접한 서열, 가장 두드러지게는 핵산 표적 서열에 혼성화하는 스페이서 서열의 5'의 뉴클레오티드를 인식하는 crRNA에 서열 및 구조 특이적 방식으로 결합한다. 이 스템-루프 구조는 전형적으로 15 내지 19개 뉴클레오티드 범위의 길이이다. 이 스템-루프 듀플렉스를 파괴하는 치환은 절단 활성을 폐지하는 반면, 스템-루프 듀플렉스를 파괴하지 않는 다른 치환은 절단 활성을 폐지하지 않는다. 스템 루프의 5'의 뉴클레오티드는 비-정규 왓슨-크릭(Watson-Crick) 염기 쌍형성, 트리플렉스 상호작용, 및 역 후그스틴(Hoogsteen) 염기 쌍형성을 사용하여 스템-루프 구조를 추가로 안정화시키는 슈도-노트(pseudo-knot) 구조를 채택한다 (문헌 [Yamano, T., et al., Cell 165(4):949-962 (2016)] 참조). 제V형 시스템에서, crRNA는 5' 말단에서 스템-루프 구조를 형성하고, 3' 말단에서의 서열은 핵산 표적 서열에서의 서열에 상보적이다.

제V형 crRNA 및 핵산 표적 서열 결합 및 절단과 연관된 다른 단백질은 부류 2 후보 1 (C2c1) 및 부류 2 후보 3 (C2c3)을 포함한다. C2c1 및 C2c3 단백질은 대략 1,100개 아미노산 내지 대략 1,500개 아미노산 범위로, Cas9 및 Cpf1 단백질과 길이에서 유사하다. C2c1 및 C2c3 단백질은 또한 RuvC-유사 뉴클레아제 도메인을 함유하고, Cpf1과 유사한 아키텍처를 갖는다. C2c1 단백질은 핵산 표적 서열 결합 및 절단을 위해 crRNA 및 tracrRNA를 필요로 한다는 점에서 Cas9 단백질과 유사하나, 50℃의 최적 절단 온도를 갖는다. C2c1 단백질은 핵산 표적 서열의 5'인 AT-풍부 프로토스페이서 인접 모티프 (PAM) (Cpf1의 PAM과 유사함)를 표적화한다 (예를 들어, 문헌 [Shmakov, S., et al., Molecular Cell 60(3):385-397 (2015)] 참조).

부류 2 후보 2 (C2c2)는 다른 CRISPR 이펙터 단백질과 서열 유사성을 공유하지 않고, 최근에 제VI형 시스템으로 확인되었다 (문헌 [Abudayyeh, O., et al., Science 353(6299):aaf5573 (2016)] 참조). C2c2 단백질은 2개의 HEPN 도메인을 갖고, 단일-가닥 RNA 절단 활성을 나타낸다. C2c2 단백질은 핵산 표적 서열 결합 및 절단을 위해 tracrRNA는 필요로 하지 않지만 crRNA를 필요로 한다는 점에서 Cpf1 단백질과 유사하다. 또한, Cpf1과 유사하게, C2c2 단백질을 위한 crRNA는 C2c2 단백질과의 회합을 보조하는 안정한 헤어핀 또는 스템-루프 구조를 형성한다. 제VI형 시스템은 부위-특이적 절단을 지시하는 데 단일 crRNA를 이용하는 단일 폴리펩티드 RNA 엔도뉴클레아제를 갖는다. 추가적으로, 스페이서에 상보적인 표적 RNA에 혼성화한 후에, C2c2는 임의의 단일-가닥 RNA에 대해 서열 비의존성 방식으로 비-특이적 엔도뉴클레아제 활성을 나타내는 무차별 RNA 엔도뉴클레아제가 된다 (문헌 [East-Seletsky, A., et al., Nature 538(7624):270-273 (2016)] 참조).

부류 2 제II형 CRISPR-Cas 시스템에 관해, 다수의 Cas9 오르토로그뿐만 아니라 그의 회합된 폴리뉴클레오티드 성분 (tracrRNA 및 crRNA)이 관련 기술분야에 공지되어 있다 (예를 들어, 문헌 [Fonfara, I., et al., Nucleic Acids Research 42(4):2577-2590 (2014), 모든 보충 데이터 포함; Chylinski K., et al., Nucleic Acids Research 42(10):6091-6105 (2014), 모든 보충 데이터 포함] 참조). 또한, Cas9-유사 합성 단백질이 관련 기술분야에 공지되어 있다 (2014년 10월 23일에 공개된 미국 공개 특허 출원 번호 2014-0315985 참조).

Cas9는 예시적인 제II형 CRISPR Cas 단백질이다. Cas9는 2개의 별개의 엔도뉴클레아제 도메인 (HNH 및 RuvC/RNase H-유사 도메인)을 사용하여 DNA 표적 서열을 부위-특이적 방식으로 절단하도록 tracrRNA/crRNA에 의해 프로그램화될 수 있는 엔도뉴클레아제이다 (2014년 3월 6일에 공개된 미국 공개 특허 출원 번호 2014-0068797 참조; 또한 문헌 [Jinek, M., et al., Science 337:816-821 (2012)] 참조).

전형적으로, 각각의 야생형 CRISPR-Cas9 시스템은 crRNA 및 tracrRNA를 포함한다. crRNA는 전형적으로 적어도 1개의 스템 구조를 형성하기 위해, 잠재적 DNA 표적 서열에 대한 상보성의 영역, 및 tracrRNA와의 염기-쌍 수소 결합을 형성하여 2차 구조를 형성하는 제2 영역을 갖는다. DNA 표적 서열에 대한 상보성의 영역은 스페이서이다. tracrRNA 및 crRNA는 다수의 염기-쌍 수소 결합을 통해 상호작용하여 2차 RNA 구조를 형성한다. tracrRNA/crRNA와 Cas9 단백질 사이의 복합체 형성은 Cas9 단백질의 입체형태적 변화를 일으키며, 이는 DNA에 대한 결합, Cas9 단백질의 엔도뉴클레아제 활성, 및 엔도뉴클레아제 Cas9에 의한 crRNA-가이드된 부위-특이적 DNA 절단을 용이하게 한다. Cas9 단백질/tracrRNA/crRNA 복합체가 이중-가닥 DNA 표적 서열을 절단하기 위해, DNA 표적 서열은 동족 PAM에 인접한다. 적절한 스페이서 서열을 갖도록 crRNA를 조작함으로써, 복합체는 관심 유전자좌, 예를 들어 서열 변형이 바람직한 유전자좌에서 절단하도록 표적화될 수 있다.

다양한 제II형 CRISPR-Cas 시스템 crRNA 및 tracrRNA 서열, 뿐만 아니라 예측된 2차 구조가 관련 기술분야에 공지되어 있다 (예를 들어, 문헌 [Ran, F.A., et al., Nature 520(7546):186-191 (2015), 모든 보충 데이터, 특히 확장된 데이터 도 1 포함; Fonfara, I., et al., Nucleic Acids Research 42(4):2577-2590 (2014), 모든 보충 데이터, 특히 보충 도 S11 포함] 참조). 예측된 tracrRNA 2차 구조는 콘스트레인트 제너레이션(Constraint Generation) RNA 폴딩 모델 (Zuker, M., Nucleic Acids Research 31:3406-3415 (2003))에 기초하였다. RNA 듀플렉스 2차 구조는 비엔나(Vienna) RNA 패키지의 RNA코폴드 (Bernhart, S.H., et al., Algorithms for Molecular Biology 1(1):3 (2006); Hofacker, I.L., et al., Journal of Molecular Biology 319:1059-1066 (2002)) 및 RNA하이브리드 (bibiserv.techfak.uni-bielefeld.de/rnahybrid/)를 사용하여 예측되었다. 구조 예측은 바르나(VARNA) (Darty, K., et al., Bioinformatics 25:1974-1975 (2009))를 사용하여 가시화되었다. 폰파라, 아이.(Fonfara, I.) 등은 캄필로박터 제주니(Campylobacter jejuni)에 대한 crRNA/tracrRNA 복합체가 벌지 영역을 갖지 않지만; 복합체가 스페이서의 3'에 위치한 스템 구조를 보유하며, 이는 3' 방향으로 또 다른 스템 구조로 이어진다는 것을 보여준다.

부류 2 CRISPR-Cas 시스템의 스페이서는 사용될 Cas 단백질에 따라, PAM의 5' 또는 3'에 위치한 핵산 표적 서열에 혼성화할 수 있다. PAM은 사용될 Cas 폴리펩티드에 따라 달라질 수 있다. 예를 들어, 에스. 피오게네스로부터의 Cas9가 사용되는 경우, PAM은 서열 5'-NRR-3'를 포함하는 핵산 표적 서열 내의 서열일 수 있으며, 여기서 R은 A 또는 G일 수 있고, N은 임의의 뉴클레오티드이고, N은 핵산 표적 결합 서열에 의해 표적화된 핵산 표적 서열의 바로 3'이다. Cas 단백질은 PAM이 비변형된 Cas 단백질에 대한 PAM에 비해 상이할 수 있도록 변형될 수 있다. 예를 들어, 에스. 피오게네스로부터의 Cas9가 사용되는 경우, Cas9 단백질은 PAM이 더 이상 서열 5'-NRR-3'를 포함하지 않고, 대신에 서열 5'-NNR-3'를 포함하도록 변형될 수 있으며, 여기서 R은 A 또는 G일 수 있고, N은 임의의 뉴클레오티드이고, N은 핵산 표적 서열에 의해 표적화된 핵산 표적 서열의 바로 3'이다.

다른 Cas 단백질은 다른 PAM을 인식하고, 관련 기술분야의 통상의 기술자는 임의의 특정한 Cas 단백질에 대한 PAM을 결정할 수 있다. 예를 들어, Cpf1은 예를 들어 TTTN 서열을 표적화하는 티민-풍부 PAM 부위를 갖는다 (문헌 [Fagerlund, R., et al., Genome Biology 16:251 (2015)] 참조).

RNA-가이드된 Cas9 엔도뉴클레아제는 다양한 유기체 및 모델 시스템에서의 프로그램화가능한 게놈 편집에 광범위하게 사용되었다 (예를 들어, 문헌 [Jinek M., et al., Science 337:816-821 (2012); Jinek M., et al., eLife 2:e00471. doi: 10.7554/eLife.00471 (2013)]; 2014년 3월 6일에 공개된 미국 공개 특허 출원 번호 2014-0068797 참조).

게놈 조작은 특정한 핵산 서열의 결실, 삽입, 돌연변이 또는 치환에 의해 게놈을 변경하는 것을 포함한다. 변경은 유전자- 또는 위치-특이적일 수 있다. 게놈 조작은 부위-지정 뉴클레아제, 예컨대 Cas 단백질 및 그의 동족 폴리뉴클레오티드를 사용하여 DNA를 절단하고, 그에 의해 변경 부위를 생성할 수 있다. 특정 경우에서, 절단은 DNA 표적 서열에 이중-가닥 손상부 (DSB)를 도입할 수 있다. DSB는 예를 들어 비-상동 말단 연결 (NHEJ), 미세상동성-매개 말단 연결 (MMEJ) 또는 상동성-지정 복구 (HDR)에 의해 복구될 수 있다. HDR은 복구를 위한 주형의 존재에 의존한다. 게놈 조작의 일부 예에서, 공여자 폴리뉴클레오티드 또는 그의 부분은 손상부 내에 삽입될 수 있다.

본 발명은 일반적으로 핵산 결합 단백질에 결합할 수 있는, 스캐폴드를 형성하는 폴리뉴클레오티드 복합체를 포함하는 핵산 폴리뉴클레오티드 조성물에 관한 것이다. 전형적으로, NASC 폴리뉴클레오티드 조성물은 반복 요소 1, 반복 요소 2, 핵산 결합 단백질 결합 요소 1, 핵산 결합 단백질 결합 요소 2, 스페이서 요소 1 (예를 들어, 핵산 표적 결합 서열 포함) 및 스페이서 요소 2 (예를 들어, 핵산 표적 결합 서열 2 포함)를 포함하는, 스캐폴드를 형성하는 2종 이상의 조작된 핵산 서열의 복합체이다. NASC 폴리뉴클레오티드 조성물은 핵산 결합 단백질과 회합할 수 있다.

한 측면에서, 본 발명은 제1 조작된 핵산 "NASC-PC1" 및 제2 조작된 핵산 성분 ("NASC-PC2")을 포함하는, 스캐폴드를 형성하는 2종 이상의 조작된 핵산 서열 ("NASC")의 조성물에 관한 것이다. NASC-P1은 5'에서 3' 방향으로, 핵산 표적 결합 서열 1을 포함하는 스페이서 요소 1, 반복 핵산 서열 1을 포함하는 반복 요소 1, 및 핵산 결합 단백질 결합 요소 1을 포함하며, 여기서 스페이서 요소 1은 반복 요소 1과 공유 연결되고, 반복 요소 1은 핵산 결합 단백질 결합 서열 1을 포함하는 핵산 결합 단백질 결합 요소 1과 공유 연결된다. 제2 조작된 핵산 성분 ("NASC-PC2")은 5'에서 3' 방향으로, 핵산 표적 결합 서열 2를 포함하는 스페이서 요소 2, 반복 핵산 서열 2를 포함하는 반복 요소 2, 및 핵산 결합 단백질 결합 서열 2를 포함하는 핵산 결합 단백질 결합 요소 2를 포함하며, 여기서 스페이서 요소 2는 반복 요소 2와 공유 연결되고, 반복 요소 2는 핵산 결합 단백질 결합 요소 2와 공유 연결된다. 본 발명의 일부 실시양태에서, 핵산 결합 단백질 결합 서열 1은 이중-가닥 핵산 결합 단백질 결합 서열 1을 포함하고, 핵산 결합 단백질 결합 서열 2는 이중-가닥 핵산 결합 단백질 결합 서열 2를 포함한다. 반복 핵산 서열 1 및 반복 핵산 서열 2는 수소-결합된 염기 쌍을 통해 연결되고, 연결은 NASC 조성물을 형성한다. NASC 조성물은 제1 핵산 결합 단백질 (예를 들어, 제1 이중-가닥 핵산 결합 단백질) 및 제2 핵산 결합 단백질 (예를 들어, 제2 이중-가닥 핵산 결합 단백질)에 결합할 수 있다.

NASC 조성물의 실시양태는 부류 2 CRISPR 단백질인 제1 이중-가닥 핵산 결합 단백질 및 부류 2 CRISPR 단백질인 제2 이중-가닥 핵산 결합 단백질을 포함하나 이에 제한되지는 않는다. 바람직한 실시양태에서, 제1 이중-가닥 핵산 결합 단백질은 부류 2 제II형 CRISPR-Cas9 단백질이고, 제2 이중-가닥 핵산 결합 단백질은 부류 2 제II형 CRISPR-Cas9 단백질이다. 다른 실시양태는 제1 이중-가닥 핵산 결합 단백질이 부류 2 제V형 CRISPR-Cpf1 단백질이고, 제2 이중-가닥 핵산 결합 단백질이 부류 2 제V형 CRISPR-Cpf1 단백질인 경우를 포함한다. 추가 실시양태에서, 제1 이중-가닥 핵산 결합 단백질은 부류 2 제II형 CRISPR-Cas9 단백질이고, 제2 이중-가닥 핵산 결합 단백질은 부류 2 제V형 CRISPR-Cpf1 단백질이다.

일부 실시양태에서, 스페이서 요소 1 및 스페이서 요소 2는 추가의 핵산 서열을 포함한다. 예를 들어, 스페이서 요소 1은 핵산 표적 결합 서열 1의 3' 및 반복 요소 1의 5'의 링커 요소 핵산 서열을 추가로 포함할 수 있다. 스페이서 요소 2는 핵산 표적 결합 서열 1의 3' 및 반복 요소 1의 5'의 링커 요소 핵산 서열을 추가로 포함할 수 있다.

추가 실시양태에서, 반복 요소 1 및 반복 요소 2는 하기와 같이 추가의 서열을 포함한다. 반복 요소 1은 5'에서 3' 방향으로 반복 핵산 서열 1b, 링커 요소 핵산 서열 1, 및 반복 핵산 서열 1a를 추가로 포함한다. 반복 요소 2는 5'에서 3' 방향으로 반복 핵산 서열 1aC, 링커 요소 핵산 서열 2, 및 반복 핵산 서열 1bC를 추가로 포함한다. 반복 핵산 서열 1b 및 반복 핵산 서열 1bC는 수소-결합된 염기 쌍을 통해 연결되고, 반복 핵산 서열 1a 및 반복 핵산 서열 1aC는 수소-결합된 염기 쌍을 통해 연결된다.

추가의 실시양태에서, 반복 핵산 서열 1b 및 반복 서열 1a는 하기와 같이 추가의 성분을 포함한다. 반복 핵산 서열 1b는 5'에서 3' 방향으로 반복 핵산 서열 1b2, 벌지 핵산 서열 1b1, 및 반복 핵산 서열 1b1을 추가로 포함할 수 있다. 반복 핵산 서열 1a는 5'에서 3' 방향으로 반복 핵산 서열 1a2, 벌지 핵산 서열 1a1, 및 반복 핵산 서열 1a1을 추가로 포함할 수 있다. 반복 핵산 서열 1aC는 5'에서 3' 방향으로 반복 핵산 서열 1a1C, 벌지 핵산 서열 2a2, 및 반복 핵산 서열 1a2C를 추가로 포함할 수 있다. 반복 핵산 서열 1bC는 5'에서 3' 방향으로 반복 핵산 서열 1b1C, 벌지 핵산 서열 2b2, 및 반복 핵산 서열 1b2C를 추가로 포함할 수 있다. 반복 핵산 서열 1a1 및 반복 핵산 서열 1a1C는 수소-결합된 염기 쌍을 통해 연결되고, 반복 핵산 서열 1a2 및 반복 핵산 서열 1a2C는 수소-결합된 염기 쌍을 통해 연결되고, 반복 핵산 서열 1b1 및 반복 핵산 서열 1b1C는 수소-결합된 염기 쌍을 통해 연결되고, 반복 핵산 서열 1b2 및 반복 핵산 서열 1b2C는 수소-결합된 염기 쌍을 통해 연결된다.

추가의 실시양태에서, 링커 요소 핵산 서열 1-2 및 링커 요소 뉴클레오티드 서열 2-2는 부가된 핵산 서열을 포함한다. 링커 요소 1-1은 5'에서 3' 방향으로 링커 요소 핵산 서열 1-2-2, 반복 핵산 서열 1-2a, 및 링커 요소 핵산 서열 1-2-1을 추가로 포함할 수 있다. 링커 요소 핵산 서열 2-2는 5'에서 3' 방향으로 링커 요소 핵산 서열 2-2-1, 반복 핵산 서열 1-2aC, 및 링커 요소 핵산 서열 2-2-2를 추가로 포함할 수 있다. 반복 핵산 서열 1-2a 및 반복 핵산 서열 1-2aC는 수소-결합된 염기 쌍을 통해 연결되고, 이중-가닥 핵산 영역 1-2를 형성한다. 일부 실시양태에서, 이중-가닥 핵산 영역 1-2는 이펙터 단백질 결합 부위 1을 추가로 포함한다. 반복 핵산 서열 1-2a는 이펙터 단백질 결합 부위 핵산 서열 1-2a를 추가로 포함한다. 반복 핵산 서열 2는 이펙터 단백질 결합 부위 핵산 서열 1-2aC를 추가로 포함한다. 이펙터 결합 부위는 이펙터 단백질 결합 부위 핵산 서열 1-2a와 이펙터 단백질 결합 부위 핵산 서열 1-2aC 사이의 수소 염기 쌍 결합에 의해 형성된다. Csy4 단백질 결합 부위는 이펙터 단백질 결합 부위의 예이다. Csy4 단백질 또는 효소적으로 불활성인 Csy4 단백질은 이펙터 결합 부위에 결합할 수 있다.

추가 실시양태에서, 반복 핵산 서열 1은 친화성 태그 1을 추가로 포함하고, 반복 핵산 서열 2는 친화성 태그 2를 추가로 포함하고, 친화성 태그 1은 친화성 태그 2와 연결된다.

NASC 조성물은 예를 들어 RNA, DNA, 또는 RNA 및 DNA를 포함할 수 있다. 일부 실시양태에서, NASC-PC1, NASC-PC2, 또는 NASC-PC1 및 NASC-PC2는 RNA, DNA, 또는 RNA 및 DNA를 포함한다.

또 다른 측면에서, 본 발명은 NASC 조성물 및 1종 이상의 핵산 결합 단백질을 포함하는 핵산/단백질 조성물을 포함한다. 한 실시양태에서, 핵산 단백질은 제1 Cas9 단백질 및 제2 Cas9 단백질일 수 있다. 예를 들어, 제1 Cas9 단백질은 제2 Cas9 단백질과 동일하고, 제1 Cas9 단백질 및 제2 Cas9 단백질은 에스. 피오게네스 Cas9 단백질, 에스. 써모필루스 Cas9 단백질, 에스. 아우레우스 Cas9 단백질 및 씨. 제주니 Cas9 단백질로 이루어진 군으로부터 선택된다. 다른 실시양태에서, 제1 Cas9 단백질은 제2 Cas9 단백질과 상이하고, 제1 Cas9 단백질 및 제2 Cas9 단백질은 에스. 피오게네스 Cas9 단백질, 에스. 써모필루스 Cas9 단백질, 에스. 아우레우스 Cas9 단백질 및 씨. 제주니 Cas9 단백질로 이루어진 군으로부터 선택된다. 추가적으로, 제1 Cas9 단백질 및 제2 Cas9 단백질은 각각 Cas9 단백질/Cas9 단백질, Cas9 단백질/dCas9 단백질, dCas9 단백질/Cas9 단백질 및 dCas9 단백질/dCas9 단백질로 이루어진 군으로부터 선택될 수 있다.

추가 측면에서, 본 발명은 NASC 조성물의 1종 이상의 성분을 포함하는 키트에 관한 것이다. 일부 실시양태에서, NASC 조성물은 NASC-PC1 및 NASC-PC2, 또는 NASC-PC1 및 NASC-PC2를 코딩하는 1종 이상의 핵산 서열, 및 완충제를 포함한다. 키트는 1종 이상의 Cas9 단백질, 또는 1종 이상의 Cas9 단백질을 코딩하는 1종 이상의 핵산 서열을 추가로 포함할 수 있다. 추가 실시양태에서, 키트는 NASC 조성물 및 1종 이상의 Cas9 단백질을 포함하는 핵단백질 복합체를 포함할 수 있다.

추가의 측면에서, 본 발명은 NASC 조성물의 1종 이상의 성분을 코딩하는 1종 이상의 핵산 서열을 포함하는 발현 벡터에 관한 것이다.

또 다른 측면에서, 본 발명은 NASC 조성물의 1종 이상의 성분을 코딩하는 1종 이상의 핵산 서열을 포함하는 재조합 세포에 관한 것이다.

본 발명의 추가 측면은 본원에 기재된 바와 같이, NASC 조성물을 사용하는 방법을 포함한다. 1가지 방법은 DNA에 결합하는 방법이다. 방법은 DNA 폴리뉴클레오티드 내의 제1 DNA 표적 서열 및 DNA 폴리뉴클레오티드 내의 제2 DNA 표적 서열을, NASC 조성물 및 핵산 결합 단백질 (예를 들어, Cas9 단백질 및/또는 Cpf1 단백질)을 포함하는 핵산/단백질 조성물과 접촉시켜, 그에 의해 DNA 내의 제1 DNA 표적 서열 및 DNA 내의 제2 DNA 표적 서열에 대한 핵산/단백질 조성물의 결합을 용이하게 하는 것을 포함한다. NASC 조성물의 NASC-PC1 스페이서 요소는 제1 DNA 표적 서열에 상보적일 수 있고, NASC 조성물의 NASC-PC2 스페이서는 제2 DNA 표적 서열에 상보적일 수 있다.

본 발명의 또 다른 방법은 DNA를 절단하는 방법이다. 방법은 DNA 폴리뉴클레오티드 내의 제1 DNA 표적 서열 및 DNA 폴리뉴클레오티드 내의 제2 DNA 표적 서열을, NASC 조성물 및 핵산 결합 단백질 (예를 들어, Cas9 단백질 및/또는 Cpf1 단백질)을 포함하는 핵산/단백질 조성물과 접촉시켜, 그에 의해 제1 DNA 표적 서열 및 제2 DNA 표적 서열에 대한 핵산/단백질 조성물의 결합을 용이하게 하는 것을 포함한다. 결합은 제1 DNA 표적 서열 및 제2 DNA 표적 서열의 절단을 일으킨다. NASC 조성물의 NASC-PC1 스페이서 요소는 제1 DNA 표적 서열에 상보적일 수 있고, NASC 조성물의 NASC-PC2 스페이서는 제2 DNA 표적 서열에 상보적일 수 있다.

본 발명의 NASC 조성물, 및 NASC 조성물을 포함하는 핵단백질 입자를 사용하는 본 발명의 이들 측면 및 다른 실시양태는 본원의 개시내용을 고려하여 관련 기술분야의 통상의 기술자에게 용이하게 명백할 것이다.

도면은 비례적으로 렌더링되지 않으며, 도면을 스케일링하지도 않았다. 식별자의 위치는 대략적이다.
도 1a, 도 1b, 도 1c 및 도 1d는 이중-가이드 부류 2 제II형 CRISPR-회합된 가이드 RNA의 예를 제시한다.
도 2a, 도 2b 및 도 2c는 단일-가이드 부류 2 제II형 CRISPR-회합된 가이드 RNA의 예를 제시한다.
도 3a 및 도 3b는 부류 2 제V형 crRNA 가이드 RNA의 예를 제시한다.
도 4a, 도 4b, 도 4c, 도 4d, 도 4e, 도 4f, 도 4g, 도 4h, 도 4i, 도 4j, 도 4k, 도 4l, 도 4m, 도 4n 및 도 4o (이 가장 마지막 도면은 도 4 "o"이고 도 4 "0"이 아님)는 본 발명의 조작된 핵산 스캐폴드 폴리뉴클레오티드 조성물의 일반적 배열의 예를 도시한다. 도시된 서열은 5'에서 3' 또는 3'에서 5' 배향으로 렌더링되지 않고, 극성을 갖지 않는다.
도 5a, 도 5b, 도 5c, 도 5d, 도 5e, 도 5f, 도 5g, 도 5h 및 도 5i는 본 발명의 조작된 핵산 스캐폴드 폴리뉴클레오티드 조성물의 예 및 요소를 도시한다.
도 6a, 도 6b, 도 6c, 도 6d, 도 6e, 도 6f, 도 6g, 도 6h, 도 6i, 도 6j, 도 6k, 도 6l 및 도 6m은 본 발명의 조작된 핵산 스캐폴드 폴리뉴클레오티드 조성물의 예 및 요소를 도시한다.
도 7a, 도 7b, 도 7c, 도 7d, 도 7e, 도 7f, 도 7g, 도 7h 및 도 7i는 본 발명의 조작된 연쇄된 핵산 스캐폴드 폴리뉴클레오티드 조성물의 예 및 요소를 도시한다.
도 8a, 도 8b, 도 8c, 도 8d, 도 8e, 도 8f, 도 8g, 도 8h, 도 8i, 도 8j, 도 8k, 도 8l, 도 8m 및 도 8n은 본 발명의 조작된 연쇄된 스플릿-넥서스 핵산 스캐폴드 폴리뉴클레오티드 조성물의 예 및 요소를 도시한다.
도 9a 및 도 9b는 본 발명의 조작된 핵산 스캐폴드 폴리뉴클레오티드 조성물의 예 및 요소를 도시한다.
도 10은 본 발명의 조작된 핵산 스캐폴드 폴리뉴클레오티드 조성물의 예 및 요소를 도시한다.
도 11은 본 발명의 조작된 핵산 스캐폴드 폴리뉴클레오티드 조성물을 포함하는 핵단백질 복합체, 핵단백질 복합체의 형성, 및 2종의 핵산 표적 서열에 결합하는 핵단백질 복합체를 도시한다.
도 12는 제1 핵산 표적 서열에 결합하고, 복합체의 뉴클레아제에 의해 절단된 제2 핵산 표적 서열에 결합하는 본 발명의 조작된 핵산 스캐폴드 폴리뉴클레오티드 조성물을 포함하는 핵단백질 복합체를 도시한다.
도 13은 폴리뉴클레오티드 내의 3종의 핵산 표적 서열에 결합하는 본 발명의 조작된 핵산 스캐폴드 폴리뉴클레오티드 조성물을 포함하는 핵단백질 복합체를 도시한다.
도 14는 제1 폴리뉴클레오티드 내의 제1 핵산 표적 서열에 결합하고, 제2 폴리뉴클레오티드 내의 제2 핵산 표적 서열 및 제3 핵산 표적 서열에 결합하는 본 발명의 조작된 핵산 스캐폴드 폴리뉴클레오티드 조성물을 포함하는 핵단백질 복합체를 도시하며, 여기서 제2 및 제3 핵산 표적 서열은 복합체의 뉴클레아제에 의해 절단된다.
도 15는 제1 폴리뉴클레오티드 내의 제1 핵산 표적 서열에 결합하고, 제2 폴리뉴클레오티드 내의 제2 핵산 표적 서열에 결합하고, 제3 폴리뉴클레오티드 내의 제3 핵산 표적 서열에 결합하는 본 발명의 조작된 핵산 스캐폴드 폴리뉴클레오티드 조성물을 포함하는 핵단백질 복합체를 도시하며, 여기서 제2 및 제3 핵산 표적 서열은 복합체의 뉴클레아제에 의해 절단된다.
도 16a, 도 16b 및 도 16c는 2종의 상이한 단백질과 핵단백질 복합체를 형성하고, 제1 폴리뉴클레오티드 내의 제1 핵산 표적 서열 및 제2 폴리뉴클레오티드 내의 제2 핵산 서열에 결합하는 본 발명의 조작된 핵산 스캐폴드 폴리뉴클레오티드 조성물을 도시한다. 결합 및 절단 결과의 3가지 조합이 도시된다.

참조로 포함

본 명세서에 인용된 모든 특허, 공개 및 특허 출원은 각각의 개별 특허, 공개 또는 특허 출원이 모든 목적을 위해 그 전문이 참조로 포함되는 것을 구체적으로 및 개별적으로 나타낸 경우와 같이 본원에 참조로 포함된다.

발명의 상세한 설명

본원에 사용된 용어는 단지 특정한 실시양태를 기재하는 목적을 위한 것이고, 제한하는 것으로 의도되지 않음이 이해되어야 한다. 본 명세서 및 첨부된 청구범위에 사용된 바와 같이, 단수 형태는 문맥이 달리 명백하게 지시하지 않는 한 복수 지시대상을 포함한다. 따라서, 예를 들어, "폴리뉴클레오티드"에 대한 언급은 1종 이상의 폴리뉴클레오티드를 포함하고, "벡터"에 대한 언급은 1종 이상의 벡터를 포함한다.

달리 정의되지 않는한, 본원에 사용된 모든 기술 과학 용어는 본 발명이 속하는 관련 기술분야의 통상의 기술자에 의해 통상적으로 이해되는 바와 동일한 의미를 갖는다. 본원에 기재된 것들과 유사하거나 동등한 다른 방법 및 물질이 본 발명에 유용할 수 있으나, 바람직한 물질 및 방법이 본원에 기재된다.

본 명세서의 교시를 고려하여, 관련 기술분야의 통상의 기술자는, 예를 들어 하기 표준 참고서에 의해 교시된 바와 같이, 면역학, 생화학, 화학, 분자 생물학, 미생물학, 세포 생물학, 유전체학 및 재조합 폴리뉴클레오티드의 통상적인 기술을 사용할 수 있다: Antibodies: A Laboratory Manual, Second edition, E. A. Greenfield, Cold Spring Harbor Laboratory Press, ISBN 978-1-936113-81-1 (2014); Culture of Animal Cells: A Manual of Basic Technique and Specialized Applications, 6th Edition, R. I. Freshney, Wiley-Blackwell, ISBN 978-0-470-52812-9 (2010); Transgenic Animal Technology, Third Edition: A Laboratory Handbook, C. A. Pinkert, Elsevier, ISBN 978-0124104907 (2014); The Laboratory Mouse, Second Edition, H. Hedrich, Academic Press, ISBN 978-0123820082 (2012); Manipulating the Mouse Embryo: A Laboratory Manual, R. Behringer, et al., Cold Spring Harbor Laboratory Press, ISBN 978-1936113019 (2013); PCR 2: A Practical Approach, M. J. McPherson, et al., IRL Press, ISBN 978-0199634248 (1995); Methods in Molecular Biology (Series), J.M. Walker, ISSN 1064-3745, Humana Press; RNA: A Laboratory Manual, D. C. Rio , et al., Cold Spring Harbor Laboratory Press, ISBN 978-0879698911 (2010); Methods in Enzymology (Series), Academic Press; Molecular Cloning: A Laboratory Manual (Fourth Edition), M. R. Green, et al., Cold Spring Harbor Laboratory Press, ISBN 978-1605500560 (2012); Bioconjugate Techniques, Third Edition, G. T. Hermanson, Academic Press, ISBN 978-0123822390 (2013); Methods in Plant Biochemistry and Molecular Biology, W. V. Dashek, CRC Press, ISBN 978-0849394805 (1997); Plant Cell Culture Protocols (Methods in Molecular Biology), V. M. Loyola-Vargas, et al., Humana Press, ISBN 978-1617798177 (2012); Plant Transformation Technologies, C. N. Stewart, et al., Wiley-Blackwell, ISBN 978-0813821955 (2011); Recombinant Proteins from Plants (Methods in Biotechnology), C. Cunningham, et al., Humana Press, ISBN 978-1617370212 (2010); Plant Genomics: Methods and Protocols (Methods in Molecular Biology), D. J. Somers, et al., Humana Press, ISBN 978-1588299970 (2009); Plant Biotechnology: Methods in Tissue Culture and Gene Transfer, R. Keshavachandran, et al., Orient Blackswan, ISBN 978-8173716164 (2008).

클러스터링된 규칙적 간격의 짧은 회문식 반복부 (CRISPR) 및 관련 CRISPR-회합된 단백질 (Cas 단백질)은 CRISPR-Cas 시스템을 구성한다 (예를 들어, 문헌 [Barrangou, R., et al., Science 315:1709-1712 (2007)] 참조).

본원에 사용된 "Cas 단백질" 및 "CRISPR-Cas 단백질"은 부류 1 제I형 Cas 단백질, 부류 1 제III형 Cas 단백질, 부류 1 제IV형 Cas 단백질, 부류 2 제II형 Cas 단백질, 부류 2 제V형 Cas 단백질 및 부류 2 제VI형 Cas 단백질을 포함하나 이에 제한되지는 않는 Cas 단백질을 지칭한다. 부류 2 Cas 단백질은 Cas9 단백질, Cas9 오르토로그에 의해 코딩된 Cas9-유사 단백질, Cas9-유사 합성 단백질, Cpf1 단백질, Cpf1 오르토로그에 의해 코딩된 단백질, Cpf1-유사 합성 단백질, C2c1 단백질, C2c2 단백질, C2c3 단백질, 및 변이체 및 그의 변형을 포함한다. 일부 실시양태에서, Cas 단백질은 부류 2 Cas 단백질, 예를 들어 1종 이상의 부류 2 제II형 Cas 단백질, 예컨대 Cas9, 1종 이상의 부류 2 제V형 Cas 단백질, 예컨대 Cpf1, 또는 1종 이상의 부류 2 제VI형 Cas 단백질, 예컨대 C2c2이다. 바람직한 실시양태에서, Cas 단백질은 1종 이상의 부류 2 제II형 Cas 단백질, 예컨대 Cas9, 및 1종 이상의 부류 2 제V형 Cas 단백질, 예컨대 Cpf1이다. 전형적으로, 본 발명의 측면에 사용하기 위해, Cas 단백질은 1종 이상의 동족 폴리뉴클레오티드 (가장 전형적으로, RNA)와 상호작용하여 핵단백질 복합체 (가장 전형적으로, 리보핵단백질 복합체)를 형성할 수 있다.

본원에 사용된 "Cas9 단백질"은 부류 2 제II형 CRISPR-Cas9 시스템으로부터 유래된 Cas9 야생형 단백질, Cas9 단백질의 변형, Cas9 단백질의 변이체, Cas9 오르토로그 및 그의 조합을 지칭한다. Cas9 단백질은 스트렙토코쿠스 피오게네스 (유니프롯KB(UniProtKB) - Q99ZW2 (CAS9_STRP1)), 스트렙토코쿠스 써모필루스 (유니프롯KB - G3ECR1 (CAS9_STRTR)) 및 스타필로코쿠스 아우레우스 (유니프롯KB - J7RUA5 (CAS9_STAAU))로부터의 Cas9를 포함하나 이에 제한되지는 않는다. Cas9 상동체는 관련 기술분야의 통상의 기술자에게 공지된 서열 유사성 검색 방법을 사용하여 확인될 수 있다. 본원에 사용된 "dCas9"는 뉴클레아제-비활성화된 Cas9 단백질이며, 또한 "촉매적으로 불활성인 Cas9 단백질", "효소적으로 불활성인 Cas9", "촉매적으로 기능상실된 Cas9" 또는 "기능상실된 Cas9"로도 지칭되는 Cas9 단백질의 변이체를 지칭한다. 이러한 분자는 엔도뉴클레아제 활성의 모두 또는 일부가 결여되고, 따라서 RNA-가이드된 방식으로 유전자를 조절하는 데 사용될 수 있다 (문헌 [Jinek M., et al., Science 337:816-821 (2012)] 참조). 이는 Cas9 뉴클레아제 기능을 불활성화시키는 촉매 잔기에 대한 돌연변이, 예컨대 RuvC-1 도메인에서의 D10A 및 HNH 도메인에서의 H840A (에스. 피오게네스 Cas9 단백질에 대해 넘버링됨)를 도입함으로써 달성된다. 뉴클레아제 도메인 중 하나 또는 둘 다의 활성을 감소시키기 위한 다른 촉매 잔기의 돌연변이가 또한 관련 기술분야의 통상의 기술자에 의해 수행될 수 있음이 이해된다. 생성된 dCas9는 이중-가닥 DNA를 절단할 수 없지만, 가이드 핵산과 복합체화하고 DNA 표적 서열에 결합하는 능력을 보유한다. 아미노산 위치에서의 변화 D10A 및 H840A를 갖는 Cas9 이중 돌연변이체는 뉴클레아제 및 니카제 활성 둘 다를 불활성화시킨다. 표적화 특이성은 PAM 서열에 결합하는 Cas9 단백질에 의해, 및 게놈 유전자좌에 대한 가이드 RNA (전형적으로, 단일-가이드 RNA)의 상보적 염기 쌍형성에 의해 결정된다. Cas9는 부류 2 제II형 CRISPR 시스템에 특징적인 서명 단백질이다.

본원에 사용된 "Cpf1 단백질"은 부류 2 제V형 CRISPR-Cpf1 시스템으로부터 유래된 Cpf1 야생형 단백질, Cpf1 단백질의 변형, Cpf1 단백질의 변이체, Cpf1 오르토로그 및 그의 조합을 지칭한다. 본원에 사용된 "dCpf1"은 뉴클레아제-비활성화된 Cpf1 단백질이며, 또한 "촉매적으로 불활성인 Cpf1 단백질" 또는 "효소적으로 불활성인 Cpf1"로도 지칭되는 Cpf1 단백질의 변이체를 지칭한다. Cpf1 단백질은 프란시셀라 노비시다 (유니프롯KB - A0Q7Q2 (CPF1_FRATN)), 라크노스피라세아에 박테리움 (유니프롯KB - A0A182DWE3 (A0A182DWE3_9FIRM)) 및 아시다미노코쿠스 종 (유니프롯KB - U2UMQ6 (CPF1_ACISB))을 포함하나 이에 제한되지는 않는다. Cpf1은 부류 2 제V형 CRISPR 시스템에 특징적인 서명 단백질이다. Cpf1 상동체는 관련 기술분야의 통상의 기술자에게 공지된 서열 유사성 검색 방법을 사용하여 확인될 수 있다.

본원에 사용된 "핵산 표적화 핵산" (NATNA)은 (핵산 표적 서열을 포함하지 않는 폴리뉴클레오티드에 비해) 폴리뉴클레오티드 내의 핵산 표적 서열에 우선적으로 결합하도록 단백질, 예컨대 Cas 단백질 (예를 들어, Cas9 단백질 또는 Cpf1 단백질)을 가이드하는 1종 이상의 폴리뉴클레오티드를 지칭한다. NATNA는 예를 들어 본원에 기재된 바와 같이, 리보뉴클레오티드 염기 (예를 들어, RNA), 데옥시리보뉴클레오티드 염기 (예를 들어, DNA), 리보뉴클레오티드 염기 및 데옥시리보뉴클레오티드 염기의 조합 (예를 들어, RNA/DNA), 뉴클레오티드, 뉴클레오티드 유사체, 변형된 뉴클레오티드 등, 뿐만 아니라 합성, 자연 발생, 및 비-자연 발생 변형된 백본 잔기 또는 연결을 포함할 수 있다. 핵산 표적화 핵산의 예는 Cas9-crRNA/tracrRNA 분자 (예를 들어, 도 1a, 도 1b, 도 1c 및 도 1d 참조), Cas9-sgRNA (예를 들어, 도 2a 및 도 2b 참조), 및 Cpf1-crRNA (예를 들어, 도 3a 및 도 3b 참조)를 포함하나 이에 제한되지는 않는다.

본원에 사용된 "이중-가이드 RNA" 및 "Cas9-이중-가이드 RNA"는 전형적으로 동족 Cas9 단백질과 회합될 수 있는 폴리뉴클레오티드 성분에 대한 2-성분 RNA 시스템을 지칭한다. 도 1a 및 도 1b는 부류 2 제II형 CRISPR-Cas9-회합된 이중-가이드 RNA의 예를 도시한다. 도 1a는 Cas9-crRNA (도 1a, (101)) 및 Cas9-tracrRNA (도 1a, (102))를 포함하는 제II형 CRISPR-Cas9 시스템 2-성분 RNA를 도시한다. 도 1b는 2차 구조를 형성하기 위한 Cas9-crRNA와 Cas9-tracrRNA 사이의 염기-쌍 수소 결합의 형성을 도시한다 (예를 들어, 2014년 3월 6일에 공개된 미국 공개 특허 출원 번호 2014-0068797 참조; 또한 문헌 [Jinek M., et al., Science 337:816-21 (2012)] 참조). 도 1b는 하기를 포함하여, 에스. 피오게네스 Cas9의 Cas9-crRNA 및 Cas9-tracrRNA의 2차 구조적 요소의 개관 및 그에 대한 명명법을 제시한다: 스페이서 서열 (또한 본원에서 핵산 표적 결합 서열로도 지칭됨)을 포함하는 스페이서 요소 (도 1b, (103)); 하부 스템 요소 (도 1b, (104)), 쌍형성되지 않은 뉴클레오티드를 포함하는 벌지 요소 (도 1b, (105)), 및 상부 스템 요소 (도 1b, (106))를 포함하는 제1 스템 요소 (도 1b, (104), (105), (106)); 제2 스템 요소를 포함하는 넥서스 요소 (도 1b, (107)); 제3 스템 요소를 포함하는 제1 3' 헤어핀 요소 (도 1b, (108)); 및 제4 스템 요소를 포함하는 제2 3' 헤어핀 요소 (도 1b, (109)). 일부 부류 2 제II형 CRISPR-Cas9 시스템에서, 제1 스템 요소는 벌지 요소를 갖지 않는다 (예를 들어, 씨. 제주니). 도 1c는 Cas9-crRNA (도 1c, (101)) 및 Cas9-tracrRNA (도 1c, (102))를 포함하는 제II형 CRISPR-Cas9 2-RNA 성분 시스템을 도시한다. 도 1d는 2차 구조를 형성하기 위한 Cas9-crRNA와 Cas9-tracrRNA 사이의 염기-쌍 수소 결합의 형성을 도시한다. 도 1d는 하기의 개관 및 그에 대한 명명법을 제시한다: 스페이서 요소 (도 1d, (103)); 제1 스템 요소 (도 1d, (110)); 제2 스템 요소를 포함하는 넥서스 요소 (도 1d, (107)); 제3 스템 요소를 포함하는 제1 3' 헤어핀 요소 (도 1d, (108)); 및 제4 스템 요소를 포함하는 제2 3' 헤어핀 요소 (도 1d, (109)). Cas9-이중-가이드 RNA는 동족 Cas9 단백질과 핵단백질 복합체를 형성할 수 있으며, 여기서 복합체는 스페이서 서열에 상보적인 핵산 표적 서열을 표적화할 수 있다. 1개 이상의 3' 헤어핀 요소 (도 1b, (108), (109); 도 1d, (108), (109))의 결실, 제1 스템 요소 (도 1b, (104), (105), (106); 도 1d (110))의 변형, 및 상부 스템, 벌지 및 하부 스템 (각각 도 1b, (106), (105), (104))의 변형을 포함한 Cas9-이중-가이드의 변형은 관련 기술분야에 공지되어 있다 (예를 들어, 2014년 10월 23일에 공개된 미국 특허 출원 번호 2014-0315985; 2015년 12월 31일에 공개된 미국 특허 출원 번호 2015-0376586 참조). 본원에 사용된 "이중-가이드 Cas9 폴리뉴클레오티드"는 crRNA (도 1a, (101))와 동일한 구조적 요소를 갖는 폴리뉴클레오티드 및 tracrRNA (도 1a (102))와 동일한 구조적 요소를 갖는 폴리뉴클레오티드를 갖는 2-성분 시스템을 지칭한다. 이중-가이드 Cas9 폴리뉴클레오티드 시스템은 동족 Cas9 단백질과 회합할 수 있다.

본원에 사용된 "단일-가이드 RNA" (sgRNA) 및 "Cas9-sgRNA"는 전형적으로 본원에 추가로 기재된 바와 같은 1-성분 RNA 시스템을 지칭하며, 여기서 시스템은 동족 Cas9 단백질과 회합할 수 있다.

도 2a, 도 2b 및 도 2c는 부류 2 제II형 CRISPR-Cas9-회합된 RNA의 예를 보여준다. 이들 도면은 Cas9 단일-가이드 RNA (Cas9-sgRNA)를 도시하며, 여기서 Cas9-crRNA는 종종 테트라루프를 통해 Cas9-tracrRNA에 공유 연결되고, 염기-쌍 수소 결합을 통해 RNA 폴리뉴클레오티드 2차 구조를 형성한다 (예를 들어, 2014년 3월 6일에 공개된 미국 공개 특허 출원 번호 2014-0068797 참조). 도 2a는 하기를 포함하여, 에스. 피오게네스에 대한 Cas9-sgRNA의 2차 구조적 요소의 개관 및 그에 대한 명명법을 제시한다: 스페이서 서열 (또한 본원에서 핵산 표적화 핵산 서열로도 지칭됨)을 포함하는 스페이서 요소 (도 2a, (201)); 하부 스템 요소 (도 2a, (202)), 쌍형성되지 않은 뉴클레오티드를 포함하는 벌지 요소 (도 2a, (205)), 및 상부 스템 요소 (도 2a, (203)), 및 쌍형성되지 않은 뉴클레오티드를 포함하는 루프 요소 (도 2a, (204))를 포함하는 제1 스템-루프 요소 (도 2a, (202), (205), (203), (204)); 제2 스템-루프 요소를 포함하는 넥서스 요소 (도 2a, (206)); 제3 스템-루프 요소를 포함하는 제1 3' 헤어핀 요소 (도 2a, (207)); 및 제4 스템-루프 요소를 포함하는 제3 스템 요소를 포함하는 제2 3' 헤어핀 요소 (도 2a, (208)). (예를 들어, 문헌 [Briner, A. E., et al., Molecular Cell 56(2):333-339 (2014)]의 도 1 및 3 참조).

도 2b는 하기를 포함하여, 씨. 제주니에 대한 Cas9-sgRNA의 2차 구조적 요소의 개관 및 그에 대한 명명법을 제시한다: 스페이서 요소 (도 2b, (201)); 제1 스템 요소 (도 2b, (209)) 및 쌍형성되지 않은 뉴클레오티드를 포함하는 루프 요소 (도 2b, (204)) (즉, 제1 스템-루프 요소가 제1 스템 요소 및 루프 요소를 포함함); 제2 스템-루프 요소를 포함하는 넥서스 요소 (도 2b, (206)); 제3 스템-루프 요소를 포함하는 제1 3' 헤어핀 요소 (도 2b, (207)); 및 제4 스템-루프 요소를 포함하는 제3 스템 요소를 포함하는 제2 3' 헤어핀 요소 (도 2b, (208)). Cas9-sgRNA는 동족 Cas9 단백질과 핵단백질 복합체를 형성할 수 있으며, 여기서 복합체는 스페이서 서열에 상보적인 핵산 서열을 표적화할 수 있다.

1개 이상의 3' 헤어핀 요소 (도 2, (207), (208))의 결실, 제1 스템 요소 (도 1b, (104), (105), (106); 도 1d (110))의 변형, 및 상부 스템, 벌지 및 하부 스템 (도 1b, 각각 (106), (105), (104))의 변형을 포함하나 이에 제한되지는 않는 Cas9 단일-가이드의 변형이 관련 기술분야에 공지되어 있다 (예를 들어, 2014년 10월 23일에 공개된 미국 특허 출원 번호 2014-0315985; 2015년 12월 31일에 공개된 미국 특허 출원 번호 2015-0376586 참조).

본원에 사용된 "Cas9 단일-가이드 폴리뉴클레오티드"는 sgRNA와 동일한 구조적 요소를 갖는 1-성분 시스템을 지칭한다 (도 2). 단일-가이드 Cas9 폴리뉴클레오티드 시스템은 동족 Cas9 단백질과 회합할 수 있다.

도 2c는 도 2a의 보다 상세한 도시를 제시한다. 표 1은 부류 2 제II형 CRISPR-Cas9 sgRNA와 회합된 핵산 서열의 영역을 도시하는 데 사용되는 일련의 수치 식별자를 제시한다. 표 1에서, " : "는 용어 "포함하는"과 동등하다.

표 1

sgRNA에서의 핵산 서열의 영역을 도시하는 데 사용되는 수치 식별자

본원에 사용된 "부류 2 제V형 가이드 crRNA" 및 "Cpf1-crRNA"는 전형적으로 동족 Cpf1 단백질과 회합할 수 있는 폴리뉴클레오티드 성분에 대한 1-성분 RNA 시스템을 지칭한다 (예를 들어, 문헌 [Zetsche, B., et al., Cell 163:1-13 (2015)] 참조). 도 3a는 제V형 CRISPR-Cpf1-회합된 RNA (Cpf1-crRNA)의 예, 뿐만 아니라 하기와 같은 Cpf1-crRNA의 2차 구조적 요소의 개관 및 그에 대한 명명법을 제시한다: 스템-루프 요소 (도 3a, (301)) 및 핵산 표적 결합 서열을 포함하는 스페이서 요소 (도 3a, (302)). 스템-루프 요소는 5'에서 3' 방향으로 Cpf1-스템 RNA 서열 1C (도 3a, (303)), 루프 요소 (도 3a, (304)), 및 상보적 Cpf1-스템 RNA 서열 1C (도 3a, (305))를 포함하며, 여기서 Cpf1-스템 RNA 서열 1 및 상보적 Cpf1-스템 RNA 서열 1C는 듀플렉스를 형성한다. 도 3b는 Cpf1-crRNA의 변형을 제시하며, 여기서 루프 요소는 도 3a의 스템-루프 요소로부터 제거된다. 도 3b는 5'에서 3' 방향으로 Cpf1-스템 핵산 서열 1 (도 3b, (303)); 상보적 Cpf1-스템 핵산 서열 1C (도 3b, (305)) (여기서 Cpf1-스템 핵산 서열 1 및 상보적 Cpf1-스템 핵산 서열 1C는 듀플렉스를 형성함)를 포함하는 스템 요소 (도 3b, (301)); 및 핵산 표적 결합 서열을 포함하는 스페이서 요소 (도 3a, (302))를 도시한다. 가이드 crRNA는 동족 Cpf1 단백질과 핵단백질 복합체를 형성할 수 있으며, 여기서 복합체는 핵산 표적 결합 서열에 상보적인 핵산 표적 서열을 표적화할 수 있다.

본원에 사용된 "핵산 표적 결합 서열" 및 "스페이서 핵산 서열"은 폴리뉴클레오티드 내의 핵산 표적 서열에 혼성화할 수 있는 핵산 서열을 지칭한다. "스페이서 요소"는 핵산 표적 결합 서열을 포함한다.

본원에 사용된 "핵산 스캐폴드", "NASC", "NASC 폴리뉴클레오티드 조성물", "NASC 조성물" 및 "NASC 폴리뉴클레오티드 조성물"은 모두 스캐폴드를 형성하는 폴리뉴클레오티드 복합체를 지칭한다. 바람직한 실시양태에서, 스캐폴드는 핵산 결합 단백질에 결합할 수 있다. 전형적으로, NASC 폴리뉴클레오티드 조성물은 하기를 포함하는, 스캐폴드를 형성하는 2종 이상의 조작된 핵산 서열의 복합체이다: (i) 반복 요소 1 (예를 들어, 반복 핵산 서열 1 포함) 및 반복 요소 2 (예를 들어, 반복 핵산 서열 2 포함); (ii) 핵산 결합 단백질 결합 요소 1 (예를 들어, 핵산 결합 단백질 결합 서열 1 포함) 및 핵산 결합 단백질 결합 요소 2 (예를 들어, 핵산 결합 단백질 결합 서열 2 포함); 및 (iii) 스페이서 요소 1 (예를 들어, 핵산 표적 결합 서열 1 포함) 및 스페이서 요소 2 (예를 들어, 핵산 표적 결합 서열 2 포함). NASC 폴리뉴클레오티드 조성물에서, 반복 요소 1은 반복 요소 2와 연결된다.

NASC 폴리뉴클레오티드 조성물은 핵산 결합 단백질과 회합할 수 있다. 일부 실시양태에서, NASC 폴리뉴클레오티드 조성물은 핵단백질 복합체를 형성하기 위해 2종 이상의 핵산 결합 단백질 (예를 들어, 유사한 구조적 모티프 및 기능적 모티프를 갖는 핵산 결합 단백질)과 회합할 수 있다. 핵산 결합 단백질의 예는 하기 본원에서 논의된다.

NASC 폴리뉴클레오티드 조성물의 일부 실시양태에서, 각각의 제1 NASC 폴리뉴클레오티드 성분 (예를 들어, 반복 요소 1, 핵산 결합 단백질 결합 요소 1, 및 스페이서 요소 1을 포함하는 NASC-PC1) 및 제2 NASC 폴리뉴클레오티드 성분 (예를 들어, 반복 요소 2, 핵산 결합 단백질 결합 요소 2, 및 스페이서 요소 2를 포함하는 NASC-PC2)은 핵단백질 복합체를 형성하기 위해 동일한 종류의 핵산 결합 단백질 (예를 들어, 유사한 구조적 모티프 및 기능적 모티프를 갖는 핵산 결합 단백질)과 회합할 수 있다.

NASC 폴리펩티드 조성물의 다른 실시양태에서, 핵단백질 복합체는 핵산 표적 결합 서열 1, 반복 핵산 서열 1, 반복 핵산 서열 2 및 핵산 표적 결합 서열 1을 포함하는 거대분자에 결합하는 핵산 결합 단백질에 의해 형성될 수 있다.

NASC 폴리뉴클레오티드 조성물/핵산 결합 단백질 1/핵산 결합 단백질 2 복합체는 (핵산 표적 서열을 포함하지 않은 폴리뉴클레오티드에 비해) 폴리뉴클레오티드 내의 핵산 표적 서열에 우선적으로 결합할 수 있다.

다중 스페이서 요소를 포함하는 NASC 폴리뉴클레오티드 (NASC-PC)는 일반적으로 본원에서 "NASC-PC-MTS"로 지칭되고, 구체적으로 스페이서 요소의 수와 관련하여 "NASC-PC-(스페이서 요소의 수)TS"로 지칭된다 (예를 들어, 2개의 스페이서 요소의 경우, 사용되는 명칭은 NASC-PC-2TS임).

다중 폴리뉴클레오티드를 포함하는 NASC-PC의 성분은 본원에서 폴리뉴클레오티드의 수와 관련하여 "NASC-PC-(폴리뉴클레오티드의 수)"로 지칭된다 (예를 들어, 2종의 폴리뉴클레오티드의 경우, 사용되는 명칭은 NASC-PC1-1 및 NASC-PC1-2임).

연쇄된 요소를 포함하는 NASC-PC 폴리뉴클레오티드 성분은 본원에서 "NASC-PC-CE"로 지칭된다. 스플릿-넥서스 폴리뉴클레오티드를 포함하는 특정한 실시양태에서, 연쇄된 스플릿-넥서스 요소를 포함하는 NASC 폴리뉴클레오티드 성분은 본원에서 "NASC-PC-SCE"로 지칭된다.

본원에 사용된 "핵산 브레이스(brace) 서열"은 적어도 2종의 별개의 핵산 표적 서열: 제1 NASC 폴리뉴클레오티드 조성물의 핵산 표적 결합 서열 1에 상보적인 핵산 표적 서열 1, 및 제2 NASC 폴리뉴클레오티드 조성물의 핵산 표적 결합 서열 2에 상보적인 핵산 표적 서열 2를 포함하는 핵산 서열이다. 핵산 브레이스 서열의 예는 DNA 브레이스 서열이다.

본원에 사용된 "NASC-케이지 조성물 (NASC-CC)"은 전형적으로 패키징 분자를 위한 내부 공간을 갖는 케이지-유사 구조를 형성하기 위해, 핵산 브레이스 서열에 의해 제2 NASC 폴리뉴클레오티드 조성물에 연결된 적어도 제1 NASC 폴리뉴클레오티드 조성물을 포함한다.

본원에 사용된 용어 "동족"은 전형적으로 Cas 단백질 (예를 들어, Cas9 단백질 또는 Cpf1 단백질) 및 1종 이상의 Cas 폴리뉴클레오티드 중 1종에 존재하는 핵산 표적 결합 서열에 상보적인 핵산 표적 서열에 부위-지정 결합할 수 있는 핵단백질 복합체를 형성할 수 있는 1종 이상의 Cas 폴리뉴클레오티드 (예를 들어, 각각 부류 2 제II형 CRISPR-Cas9-회합된 NATNA 또는 부류 2 제V형 CRISPR-Cpf1-회합된 NATNA)를 지칭한다.

용어 "야생형", "자연 발생" 및 "비변형된"은 자연에 존재하는 전형적인 (또는 가장 흔한) 형태, 외관, 표현형 또는 계통; 예를 들어, 세포, 유기체, 특징체, 폴리뉴클레오티드, 단백질, 거대분자 복합체, 유전자, RNA, DNA 또는 게놈이 자연의 공급원에서 발생하고, 그로부터 단리될 수 있는 그들의 전형적인 형태를 의미하는 것으로 본원에 사용된다. 야생형 형태, 외관, 표현형 또는 계통은 의도적 변형 전의 본래 모체로서의 역할을 한다. 따라서, 돌연변이체, 변이체, 조작된, 재조합 및 변형된 형태는 야생형 형태가 아니다.

본원에 사용된 용어 "조작된", "유전자 조작된", "재조합", "변형된", "비-자연 발생", "비-자연" 및 "비-천연"은 상호교환가능하고, 의도적 인간 조작을 나타낸다.

본원에 사용된 "개재된", "손상된" 및 "불연속적인"은, 예를 들어 폴리뉴클레오티드 백본의 공유 결합에서 연속성의 손상을 의미하는 것으로 상호교환가능하게 사용된다. 예를 들어, 불연속적인 제1 폴리뉴클레오티드 및 제2 폴리뉴클레오티드는 각각 5' 말단 및 3' 말단 (5' 말단-제1 폴리뉴클레오티드-3' 말단 및 5' 말단-제2 폴리뉴클레오티드-3' 말단)을 갖는다. 예를 들어, DNA 또는 RNA 분자의 5' 말단은 전형적으로 당 고리 내의 제5 탄소이고, 3' 말단은 전형적으로 당 고리 내의 제3 탄소 상의 히드록실 기이다. 각각 5' 말단 및 3' 말단을 갖는 2종의 폴리뉴클레오티드는 단일 폴리뉴클레오티드의 백본이 한 부위에서 손상된 경우에 형성된다. 5' 및/또는 3' 말단은, 예를 들어 모이어티 (예를 들어, 엑소뉴클레아제의 분해 효과에 대한 저항성을 제공하는 모이어티)의 추가에 의해 공유 변형될 수 있다.

"공유 결합", "공유 부착된", "공유 결합된", "공유 연결된", "공유 연결되는" 및 "분자 결합"은 본원에서 상호교환가능하게 사용되고, 원자 사이의 전자 쌍의 공유를 수반하는 화학 결합을 지칭한다. 공유 결합의 예는 포스포디에스테르 결합 및 포스포로티오에이트 결합을 포함하나 이에 제한되지는 않는다.

"비-공유 결합", "비-공유 부착된", "비-공유 결합된", "비-공유 연결된", "비-공유 상호작용" 및 "비-공유 연결되는"은 본원에서 상호교환가능하게 사용되고, 전자 쌍의 공유를 수반하지 않는 임의의 비교적 약한 화학 결합을 지칭한다. 다중 비-공유 결합은 종종 거대분자의 입체형태를 안정화시키고, 분자 사이의 특정 상호작용을 매개한다. 비-공유 결합의 예는 수소 결합, 이온 상호작용 (예를 들어, Na⁺Cl^-), 반 데르 발스 상호작용 및 소수성 결합을 포함하나 이에 제한되지는 않는다.

본원에 사용된 "수소 결합", "수소 염기 쌍형성", "수소 결합 염기 쌍형성", "수소 결합된" 및 "수소-결합된 염기 쌍"은 상호교환가능하게 사용되고, "왓슨-크릭-수소-결합된 염기 쌍" (W-C-수소-결합된 염기 쌍 또는 W-C 수소 결합); "후그스틴-수소-결합된 염기 쌍" (후그스틴 수소 결합); 및 "워블(wobble)-수소-결합된 염기 쌍" (워블 수소 결합)을 포함하나 이에 제한되지는 않는 정규 수소 결합 및 비-정규 수소 결합을 지칭한다. W-C 수소 결합 (역 W-C 수소 결합 포함)은 퓨린-피리미딘 염기 쌍형성, 즉 아데닌:티민, 구아닌:시토신, 및 우라실:아데닌을 지칭한다. 후그스틴 수소 결합 (역 후그스틴 수소 결합 포함)은 핵산에서의 염기 쌍형성의 변화를 지칭하며, 여기서 각 가닥 상에 하나씩 있는 2개의 핵염기는 주요 홈에서 수소 결합에 의해 함께 유지된다. 이러한 비-W-C 수소 결합은 제3 가닥이 듀플렉스 주위를 감고 삼중-가닥 나선을 형성하게 할 수 있다. 워블 수소 결합 (역 워블 수소 결합 포함)은 왓슨-크릭 염기 쌍 규칙을 따르지 않는 RNA 분자에서의 2개의 뉴클레오티드 사이의 쌍형성을 지칭한다. 4개의 주요 워블 염기 쌍이 존재한다: 구아닌:우라실, 이노신 (하이포크산틴):우라실, 이노신-아데닌, 및 이노신-시토신. 정규 수소 결합 및 비-정규 수소 결합에 대한 규칙은 관련 기술분야의 통상의 기술자에게 공지되어 있다 (예를 들어, 문헌 [The RNA World, Third Edition (Cold Spring Harbor Monograph Series), R. F. Gesteland, Cold Spring Harbor Laboratory Press, ISBN 978-0879697396 (2005); The RNA World, Second Edition (Cold Spring Harbor Monograph Series), R. F. Gesteland, et al., Cold Spring Harbor Laboratory Press, ISBN 978-0879695613 (1999); The RNA World (Cold Spring Harbor Monograph Series), R. F. Gesteland, et al., Cold Spring Harbor Laboratory Press, ISBN 978-0879694562 (1993) (예를 들어, 문헌 [Appendix 1: Structures of Base Pairs Involving at Least Two Hydrogen Bonds, I. Tinoco] 참조); Principles of Nucleic Acid Structure, W. Saenger, Springer International Publishing AG, ISBN 978-0-387-90761-1 (1988); Principles of Nucleic Acid Structure, First Edition, S. Neidle, Academic Press, ISBN 978-01236950791 (2007)] 참조)

"연결하다", "연결된" 및 "연결하는"은 본원에서 상호교환가능하게 사용되고, 2종의 거대분자 (예를 들어, 폴리뉴클레오티드, 단백질 등) 사이의 공유 결합 또는 비-공유 결합을 지칭한다.

본원에 사용된 "상보성"은 (예를 들어, 정규 왓슨-크릭 염기 쌍형성을 통해) 또 다른 핵산 서열과 수소 결합(들)을 형성하는 핵산 서열의 능력을 지칭한다. 퍼센트 상보성은 제2 핵산 서열과 수소 결합을 형성할 수 있는 핵산 분자 내의 잔기의 백분율을 나타낸다. 2종의 폴리뉴클레오티드 서열이 100% 상보성을 갖는 경우에, 2종의 서열은 완전히 상보적이며, 즉, 제1 폴리뉴클레오티드의 모든 인접한 잔기가 제2 폴리뉴클레오티드 내의 동일한 수의 인접한 잔기와 수소 결합한다.

본원에 사용된 "결합"은 거대분자 사이 (예를 들어, 단백질과 폴리뉴클레오티드 사이, 폴리뉴클레오티드와 폴리뉴클레오티드 사이, 또는 단백질과 단백질 사이 등)의 비-공유 상호작용을 지칭한다. 이러한 비-공유 상호작용은 또한 "회합하는" 또는 "상호작용하는" (예를 들어, 제1 거대분자가 제2 거대분자와 상호작용하는 경우, 제1 거대분자는 제2 거대분자에 비-공유 방식으로 결합함)으로도 지칭된다. 결합 상호작용의 일부 부분은 서열-특이적일 수 있다. 본원에 사용된 "서열-특이적 결합"은 전형적으로 1종 이상의 NASC 폴리펩티드 조성물이 1종 이상의 단백질 (예를 들어, Cas9 단백질 및/또는 Cpf1 단백질)과 복합체를 형성하여 단백질이 핵산 표적 결합 서열 (예를 들어, DNA 표적 결합 서열)을 갖지 않는 제2 핵산 서열 (예를 들어, 제2 DNA 서열)에 비해 우선적으로 핵산 표적 서열 (예를 들어, DNA 표적 서열)을 포함하는 핵산 서열 (예를 들어, DNA 서열)에 결합하게 할 수 있는 것을 지칭한다. 결합 상호작용의 모든 성분이, DNA 백본 내의 포스페이트 잔기와의 단백질 결합과 같이, 서열-특이적일 필요는 없다. 결합 상호작용은 해리 상수 (Kd)를 특징으로 할 수 있다. "결합 친화도"는 결합 상호작용의 강도를 지칭한다. 증가된 결합 친화도는 보다 낮은 Kd와 상관관계가 있다.

본원에 사용된 Cas 단백질 (예를 들어, Cas9 단백질)은 Cas 단백질을 포함하는 부위-지정 핵단백질 복합체가 폴리뉴클레오티드 내의 핵산 표적 서열에서의 폴리뉴클레오티드에 결합하거나 그를 절단하는 경우에, 폴리뉴클레오티드를 "표적화한다"고 한다.

본원에 사용된 "이중-가닥 손상부" (DSB)는 제공되는 DNA의 이중-가닥 절편의 가닥 둘 다를 지칭한다. 일부 경우에, 이러한 손상부가 발생하는 경우, 1개의 가닥은 뉴클레오티드가 노출되고 다른 가닥 상의 뉴클레오티드에 수소 결합되지 않은 "점착성 말단"을 갖는다고 할 수 있다. 다른 경우에서, 가닥 둘 다가 서로 완전히 염기 쌍형성된 채로 있는 "평활 말단"이 발생할 수 있다.

"공여자 폴리뉴클레오티드", "공여자 올리고뉴클레오티드" 및 "공여자 주형"은 본원에서 상호교환가능하게 사용되고, 이중-가닥 폴리뉴클레오티드 (예를 들어, 이중-가닥 DNA), 단일-가닥 폴리뉴클레오티드 (예를 들어, 단일-가닥 DNA), 또는 그의 조합일 수 있다. 공여자 폴리뉴클레오티드는 삽입 서열 (예를 들어, DNA 내의 DSB)에 플랭킹하는 상동성 아암을 포함한다. 각 측면 상의 상동성 아암은 길이가 다양할 수 있다. 공여자 폴리뉴클레오티드의 설계 및 구축에 대한 파라미터는 관련 기술분야에 널리 공지되어 있다 (예를 들어, 문헌 [Ran, F., et al., Nature Protocols 8(11):2281-2308 (2013); Smithies, O., et al., Nature 317:230-234 (1985); Thomas, K., et al., Cell 44:419-428 (1986); Wu, S., et al., Nature Protocols 3:1056-1076 (2008); Singer, B., et al., Cell 31:25-33 (1982); Shen, P., et al., Genetics 112:441-457 (1986); Watt, V., et al., Proceedings of the National Academy of Sciences of the United States of America 82:4768-4772 (1985); Sugawara, N., et al., Journal of Molecular Cell Biology 12(2):563-575 (1992); Rubnitz, J., et al., Journal of Molecular Cell Biology 4(11):2253-2258 (1984); Ayares, D., et al., Proceedings of the National Academy of Sciences of the United States of America 83(14):5199-5203 (1986); Liskay, R, et al., Genetics 115(1):161-167 (1987)] 참조).

본원에 사용된 "상동성-지정 복구" (HDR)는, 예를 들어 DNA 내의 DSB의 복구 동안 세포에서 일어나는 DNA 복구를 지칭한다. HDR은 뉴클레오티드 서열 상동성을 필요로 하고, 공여자 폴리뉴클레오티드를 DSB (예를 들어, DNA 표적 서열 내의)가 발생한 서열을 복구하는 데 사용한다. 공여자 폴리뉴클레오티드는 일반적으로 DSB에 플랭킹하는 서열에 필요한 서열 상동성을 가짐으로써 공여자 폴리뉴클레오티드가 복구에 적합한 주형으로서의 역할을 할 수 있게 한다. HDR은, 예를 들어 공여자 폴리뉴클레오티드로부터 DNA 표적 서열로의 유전자 정보의 전달을 일으킨다. HDR은 공여자 폴리뉴클레오티드 서열이 DNA 표적 서열과 상이하고 공여자 폴리뉴클레오티드의 일부 또는 모두가 DNA 표적 서열 내에 혼입된 경우에, DNA 표적 서열의 변경 (예를 들어, 삽입, 결실 또는 돌연변이)을 일으킬 수 있다. 일부 실시양태에서, 전체 공여자 폴리뉴클레오티드, 공여자 뉴클레오티드의 일부, 또는 공여자 뉴클레오티드의 카피는 DNA 표적 서열의 부위에 통합된다. 예를 들어, 공여자 폴리뉴클레오티드는 DNA 표적 서열 내 손상부의 복구에 사용될 수 있으며, 여기서 복구는 DNA 내의 손상부의 부위 또는 그에 근접한 공여자 폴리뉴클레오티드로부터 유전자 정보 (즉, 폴리뉴클레오티드 서열)의 전달을 일으킨다. 따라서, 새로운 유전자 정보 (즉, 폴리뉴클레오티드 서열)는 DNA 표적 서열에서 삽입 또는 카피될 수 있다.

"게놈 영역"은 핵산 표적 서열 부위의 어느 한 측면에 존재하거나, 또는 대안적으로, 또한 핵산 표적 서열 부위의 일부를 포함하는, 숙주 세포의 게놈 내의 염색체의 절편이다. 공여자 폴리뉴클레오티드의 상동성 아암은 상응하는 게놈 영역과 상동 재조합을 거치기에 충분한 상동성을 갖는다. 일부 실시양태에서, 공여자 폴리뉴클레오티드의 상동성 아암은 핵산 표적 서열 부위에 바로 플랭킹하는 게놈 영역에 대한 유의한 서열 상동성을 공유하며; 상동성 아암이 핵산 표적 서열 부위로부터 더 먼 게놈 영역에 대한 충분한 상동성을 갖도록 설계될 수 있음이 인식된다.

본원에 사용된 "비-상동 말단 연결" (NHEJ)은 공여자 폴리뉴클레오티드를 필요로 하지 않는 손상부의 한 말단의 손상부의 다른 말단에 대한 직접적 라이게이션에 의한, DNA 내의 DSB의 복구를 지칭한다. NHEJ는 세포가 복구 주형을 사용하지 않고 DNA를 복구하는 데 이용가능한 DNA 복구 경로이다. 공여자 폴리뉴클레오티드의 부재 하의 NHEJ는 종종 DSB의 부위에서 무작위로 삽입 또는 결실된 뉴클레오티드를 생성한다.

"미세상동성-매개 말단 연결" (MMEJ)은 DNA 내의 DSB를 복구하기 위한 경로이다. MMEJ는 연결 전에 DSB에 플랭킹하는 결실 및 손상된 말단 내부의 미세상동 서열의 정렬을 수반한다. MMEJ는 유전학적으로 정의되고, 예를 들어 CtIP, 폴리(ADP-리보스) 폴리머라제 1 (PARP1), DNA 폴리머라제 세타 (Pol θ), DNA 리가제 1 (Lig 1), 또는 DNA 리가제 3 (Lig 3)의 활성을 필요로 한다. 추가의 유전 성분은 관련 기술분야에 공지되어 있다 (예를 들어, 문헌 [Sfeir, A., et al., Trends in Biochemical Sciences 40:701-714 (2015)] 참조).

본원에 사용된 "DNA 복구"는 세포 기구가 세포 내에 함유된 DNA 분자에 대한 손상을 복구하는 임의의 과정을 포괄한다. 복구되는 손상은 단일-가닥 손상부 또는 이중-가닥 손상부를 포함할 수 있다. 적어도 3가지 메카니즘이 DSB를 복구하기 위해 존재한다: HDR, NHEJ 및 MMEJ. "DNA 복구"는 또한 인간 조작으로부터 발생한 DNA 복구를 지칭하도록 본원에 사용되며, 여기서 표적 유전자좌는 예를 들어 뉴클레오티드를 삽입, 결실 또는 치환 (모두 게놈 편집의 형태를 나타냄)함으로써 변형된다.

본원에 사용된 "재조합"은 2종의 폴리뉴클레오티드 사이의 유전자 정보의 교환 과정을 지칭한다.

본원에 사용된 용어 "조절 서열", "조절 요소" 및 "제어 요소"는 상호교환가능하고, 발현될 폴리뉴클레오티드 표적의 상류 (5' 비-코딩 서열), 내부, 또는 하류 (3' 비-번역 서열)에 있는 폴리뉴클레오티드 서열을 지칭한다. 조절 서열은 예를 들어 전사의 타이밍, 전사의 양 또는 수준, RNA 프로세싱 또는 안정성, 및/또는 관련 구조적 뉴클레오티드 서열의 번역에 영향을 미친다. 조절 서열은 활성화제 결합 서열, 인핸서, 인트론, 폴리아데닐화 인식 서열, 프로모터, 전사 개시 부위, 리프레서 결합 서열, 스템-루프 구조, 번역 개시 서열, 내부 리보솜 진입 부위 (IRES), 번역 리더 서열, 전사 종결 서열 (예를 들어, 폴리아데닐화 신호 및 폴리-U 서열), 번역 종결 서열, 프라이머 결합 부위 등을 포함할 수 있다.

조절 요소는 많은 유형의 숙주 세포에서 뉴클레오티드 서열의 구성적, 유도성 및 억제성 발현을 지시하는 것 및 오직 특정 숙주 세포에서만 뉴클레오티드 서열의 발현을 지시하는 것 (예를 들어, 조직-특이적 조절 서열)을 포함한다. 일부 실시양태에서, 벡터는 1종 이상의 pol III 프로모터, 1종 이상의 pol II 프로모터, 1종 이상의 pol I 프로모터 또는 그의 조합을 포함한다. pol III 프로모터의 예는 U6 및 H1 프로모터를 포함하나 이에 제한되지는 않는다. pol II 프로모터의 예는 레트로바이러스 라우스 육종 바이러스 (RSV) LTR 프로모터 (임의로 RSV 인핸서와 함께), 시토메갈로바이러스 (CMV) 프로모터 (임의로 CMV 인핸서와 함께; 예를 들어, 문헌 [Boshart, M., et al., Cell 41:521-530 (1985)] 참조), SV40 프로모터, 디히드로폴레이트 리덕타제 프로모터, β-액틴 프로모터, 포스포글리세롤 키나제 (PGK) 프로모터 및 EF1α 프로모터를 포함하나 이에 제한되지는 않는다. 발현 벡터의 설계가 형질전환될 숙주 세포의 선택, 목적하는 발현 수준 등과 같은 인자에 따라 달라질 수 있음이 관련 기술분야의 통상의 기술자에 의해 인지될 것이다. 벡터는 숙주 세포 내에 도입되어 그에 의해 본원에 기재된 바와 같은 핵산에 의해 코딩되는 전사체, 단백질 또는 펩티드 (융합 단백질 또는 펩티드 포함)를 생산할 수 있다.

본원에 사용된 "유전자"는 엑손(들) 및 관련 조절 서열을 포함하는 폴리뉴클레오티드 서열을 지칭한다. 유전자는 인트론(들) 및/또는 비번역된 영역(들) (UTR(들))을 추가로 포함할 수 있다.

본원에 사용된 용어 "작동가능하게 연결된"은 폴리뉴클레오티드 서열 또는 아미노산 서열이 서로 기능적 관계로 배치된 것을 지칭한다. 예를 들어, 조절 서열 (예를 들어, 프로모터 또는 인핸서)은 조절 서열이 폴리뉴클레오티드의 전사를 조절하거나 그의 조정에 기여하는 경우에 유전자 산물을 코딩하는 폴리뉴클레오티드에 "작동가능하게 연결된"다. 작동가능하게 연결된 조절 요소는 전형적으로 코딩 서열과 인접하다. 그러나, 인핸서는 프로모터로부터 수킬로염기 또는 그 초과까지만큼 분리된 경우에도 기능할 수 있다. 따라서, 일부 조절 요소는 폴리뉴클레오티드 서열에 작동가능하게 연결되지만 폴리뉴클레오티드 서열과 인접하지는 않을 수 있다. 유사하게, 번역 조절 요소는 폴리뉴클레오티드로부터의 단백질 발현의 조정에 기여한다.

본원에 사용된 "발현"은 예를 들어, 메신저 RNA (mRNA) 또는 다른 RNA 전사체 (예를 들어, 비-코딩, 예컨대 구조적 또는 스캐폴딩 RNA)를 생성하는 DNA 주형으로부터의 폴리뉴클레오티드의 전사를 지칭한다. 용어는 전사된 mRNA가 펩티드, 폴리펩티드 또는 단백질로 번역되는 과정을 추가로 지칭한다. 전사체 및 코딩된 폴리펩티드는 집합적으로 "유전자 산물(들)"로 지칭될 수 있다. 발현은 폴리뉴클레오티드가 게놈 DNA (gDNA)로부터 유래되는 경우에, 진핵 세포에서 mRNA를 스플라이싱하는 것을 포함할 수 있다.

본원에 사용된 용어 "조정하다"는 기능의 분량, 정도 또는 양의 변화를 지칭한다. 예를 들어, 본원에 개시된 바와 같은 NASC 폴리뉴클레오티드 조성물/제1 핵산 결합 단백질/제2 핵산 결합 단백질 (예를 들어, 부류 2 CRISPR-Cas 단백질) 복합체는 프로모터에서의 또는 그 근처의 2종 이상의 핵산 표적 서열에 결합함으로써 프로모터 서열의 활성을 조정할 수 있다. 결합 후에 발생하는 작용에 따라, NASC 폴리뉴클레오티드 조성물/제1 핵산 결합 단백질/제2 핵산 결합 단백질 복합체는 프로모터 서열에 작동가능하게 연결된 유전자의 전사를 유도, 증진, 저해 또는 억제할 수 있다. 따라서, 유전자 발현의 "조정"은 유전자 활성화 또는 유전자 억제 둘 다를 포함한다.

조정은 표적 유전자의 발현에 의해 직접적으로 또는 간접적으로 영향을 받는 임의의 특징을 결정함으로써 검정될 수 있다. 이러한 특징은 예를 들어 RNA 또는 단백질 수준, 단백질 활성, 산물 수준, 유전자의 발현, 또는 리포터 유전자의 활성 수준에서의 변화를 포함한다. 따라서, 용어 유전자의 "발현을 조정하는", "발현을 억제하는" 및 "발현을 활성화시키는"은 유전자의 전사를 변화, 활성화 또는 억제하는 NASC 폴리펩티드 조성물/핵산 결합 단백질(들) 복합체의 능력을 지칭할 수 있다.

본원에 사용된 "벡터" 및 "플라스미드"는 유전 물질을 세포 내에 도입시키는 폴리뉴클레오티드 비히클을 지칭한다. 벡터는 선형 또는 원형일 수 있다. 벡터는 적합한 숙주 세포에서 벡터의 복제를 실시할 수 있는 복제 서열 (즉, 복제 기점)을 함유할 수 있다. 적합한 숙주의 형질전환 시에, 벡터는 숙주 게놈에 독립적으로 복제 및 기능하거나, 또는 숙주 세포 내에 통합될 수 있다. 벡터 설계는 다른 것들 보다도, 의도된 용도 및 벡터에 대한 숙주 세포에 따라 달라지고, 특정한 용도 및 숙주 세포에 대한 본 발명의 벡터의 설계는 관련 기술분야의 기술자의 수준 내에 있다. 벡터의 4개의 주요 유형은 플라스미드, 바이러스 벡터, 코스미드 및 인공 염색체이다. 전형적으로, 벡터는 복제 기점, 다중클로닝 부위 및/또는 선택 마커를 포함한다. 발현 벡터는 전형적으로 발현 카세트를 포함한다.

본원에 사용된 "발현 카세트"는 재조합 방법을 사용하거나 또는 합성 수단에 의해 생성되고, 숙주 세포 내의 선택된 폴리뉴클레오티드의 발현을 용이하게 하도록 선택된 폴리뉴클레오티드에 작동가능하게 연결된 조절 서열을 포함하는 폴리뉴클레오티드 구축물을 지칭한다. 예를 들어, 조절 서열은 숙주 세포 내의 선택된 폴리뉴클레오티드의 전사, 또는 숙주 세포 내의 선택된 폴리뉴클레오티드의 전사 및 번역을 용이하게 할 수 있다. 발현 카세트는 예를 들어 숙주 세포의 게놈 내에 통합되거나 또는 발현 벡터를 형성하도록 벡터 내에 존재할 수 있다.

본원에 사용된 "표적화 벡터"는 전형적으로 표적 유전자 또는 핵산 표적 서열 (예를 들어, DSB)의 요소에 플랭킹하는, gDNA에 상동인 맞춤 DNA 아암을 포함하는 재조합 DNA 구축물이다. 표적화 벡터는 공여자 폴리뉴클레오티드를 포함할 수 있다. 표적 유전자의 요소는 결실 및/또는 삽입을 포함한 다수의 방식으로 변형될 수 있다. 결함있는 표적 유전자는 기능적 표적 유전자로 대체될 수 있거나, 또는 대안적으로 기능적 유전자는 녹 아웃될 수 있다. 임의로, 표적화 벡터의 공여자 폴리뉴클레오티드는 표적 유전자 내에 도입되는 선택 마커를 포함하는 선택 카세트를 포함한다. 표적 유전자에 인접한 또는 그 내의 표적화 영역 (즉, 핵산 표적 서열)은 유전자 발현의 조절에 영향을 미치는 데 사용될 수 있다.

본원에 사용된 용어 "핵산", "핵산 서열", "뉴클레오티드 서열", "올리고뉴클레오티드" 및 "폴리뉴클레오티드"는 상호교환가능하고, 뉴클레오티드의 중합체 형태를 지칭한다. 뉴클레오티드는 데옥시리보뉴클레오티드 (DNA), 리보뉴클레오티드 (RNA), 그의 유사체, 또는 그의 조합일 수 있고, 임의의 길이를 가질 수 있다. 폴리뉴클레오티드는 임의의 기능을 수행할 수 있고, 임의의 2차 및 3차 구조를 가질 수 있다. 용어는 천연 뉴클레오티드의 기지의 유사체, 및 염기, 당 및/또는 포스페이트 모이어티에서 변형된 뉴클레오티드를 포괄한다. 특정한 뉴클레오티드의 유사체는 동일한 염기-쌍형성 특이성을 갖는다 (예를 들어, A가 T와 염기 쌍형성한 유사체). 폴리뉴클레오티드는 1개의 변형된 뉴클레오티드 또는 다중 변형된 뉴클레오티드를 포함할 수 있다. 변형된 뉴클레오티드의 예는 플루오린화된 뉴클레오티드, 메틸화된 뉴클레오티드 및 뉴클레오티드 유사체를 포함한다. 뉴클레오티드 구조는 폴리머가 조립되기 전 또는 후에 변형될 수 있다. 중합 후에, 폴리뉴클레오티드는 예를 들어 표지 성분 또는 표적 결합 성분과의 접합을 통해 추가적으로 변형될 수 있다. 뉴클레오티드 서열은 비-뉴클레오티드 성분이 혼입될 수 있다. 용어는 또한 합성, 자연 발생, 및 비-자연 발생이며 참조 폴리뉴클레오티드 (예를 들어, DNA 또는 RNA)와 유사한 결합 특성을 갖는, 변형된 백본 잔기 또는 연결을 포함하는 핵산을 포괄한다. 이러한 유사체의 예는 포스포로티오에이트, 포스포르아미데이트, 메틸 포스포네이트, 키랄-메틸 포스포네이트, 2-O-메틸 리보뉴클레오티드, 펩티드-핵산 (PNA), 잠금 핵산 (LNA™) (엑시콘, 인크.(Exiqon, Inc.), 매사추세츠주 워번) 뉴클레오시드, 글리콜 핵산, 가교 핵산 및 모르폴리노 구조를 포함하나 이에 제한되지는 않는다.

펩티드-핵산 (PNA)은 폴리뉴클레오티드 포스페이트-당 백본이 가요성 슈도-펩티드 중합체로 대체된, 핵산의 합성 상동체이다. 핵염기는 중합체에 연결된다. PNA는 고친화도 및 고특이성으로 RNA 및 DNA의 상보적 서열에 혼성화하는 능력을 갖는다.

포스포로티오에이트 핵산에서, 포스포로티오에이트 (PS) 결합은 폴리뉴클레오티드 포스페이트 백본 내에서 황 원자를 비-가교 산소로 치환한다. 이러한 변형은 뉴클레오티드간 연결이 뉴클레아제 분해에 저항성이게 만든다. 일부 실시양태에서, 포스포로티오에이트 결합은 엑소뉴클레아제 분해를 억제하도록 폴리뉴클레오티드 서열의 5' 또는 3' 말단에서 마지막 3 내지 5개의 뉴클레오티드 사이에 도입된다. 전체 올리고뉴클레오티드에 걸친 포스포로티오에이트의 배치는 또한 엔도뉴클레아제에 의한 분해를 감소시키는 데 도움이 된다.

트레오스 핵산 (TNA)은 인공 유전자 중합체이다. TNA의 백본 구조는 포스포디에스테르 결합에 의해 연결된 반복되는 트레오스 당을 포함한다. TNA 중합체는 뉴클레아제 분해에 저항성이다. TNA는 염기-쌍 수소 결합에 의해 듀플렉스 구조로 자기-조립될 수 있다.

연결 반전은 "역전된 포스포르아미다이트"의 사용을 통해 폴리뉴클레오티드 내로 도입될 수 있다 (예를 들어, www.ucalgary.ca/dnalab/synthesis/-modifications/linkages 참조). 폴리뉴클레오티드의 말단에서의 3'-3' 연결은 2개의 5'-OH 말단을 갖고 3'-OH 말단을 갖지 않는 올리고뉴클레오티드를 생성함으로써 엑소뉴클레아제 분해에 대해 폴리뉴클레오티드를 안정화시킨다. 전형적으로, 이러한 폴리뉴클레오티드는 5'-OH 위치 상에 포스포르아미다이트 기, 및 3'-OH 위치 상에 디메톡시트리틸 (DMT) 보호기를 갖는다. 통상적으로, DMT 보호기는 5'-OH 상에 있고, 포스포르아미다이트는 3'-OH 상에 있다.

폴리뉴클레오티드 서열은 달리 나타내지 않는 한 통상적인 5'에서 3' 배향으로 본원에 제시된다.

본원에 사용된 "서열 동일성"은 일반적으로 다양한 가중 파라미터를 갖는 알고리즘을 사용하여 제1 폴리뉴클레오티드 또는 폴리펩티드를 제2 폴리뉴클레오티드 또는 폴리펩티드에 비교한 뉴클레오티드 염기 또는 아미노산의 퍼센트 동일성을 지칭한다. 2종의 폴리뉴클레오티드 또는 2종의 폴리펩티드 사이의 서열 동일성은 진뱅크(GENBANK) (www.ncbi.nlm.nih.gov/genbank/) 및 EMBL-EBI (www.ebi.ac.uk.)를 포함하나 이에 제한되지는 않는 사이트에서의 월드와이드 웹을 통해 이용가능한 다양한 방법 및 컴퓨터 프로그램 (예를 들어, BLAST, CS-BLAST, FASTA, HMMER, L-ALIGN 등)에 의한 서열 정렬을 사용하여 결정될 수 있다. 2종의 폴리뉴클레오티드 또는 2종의 폴리펩티드 서열 사이의 서열 동일성은 일반적으로 다양한 방법 또는 컴퓨터 프로그램의 표준 디폴트 파라미터를 사용하여 계산된다. 본원에 사용된 2종의 폴리뉴클레오티드 또는 2종의 폴리펩티드 사이의 높은 정도의 서열 동일성은 전형적으로 약 90% 동일성 내지 100% 동일성, 예를 들어, 약 90% 동일성 이상, 바람직하게는 약 95% 동일성 이상, 보다 바람직하게는 약 98% 동일성 이상이다. 본원에 사용된 2종의 폴리뉴클레오티드 또는 2종의 폴리펩티드 사이의 중간 정도의 서열 동일성은 전형적으로 약 80% 동일성 내지 약 85% 동일성, 예를 들어, 약 80% 동일성 이상, 바람직하게는 약 85% 동일성이다. 본원에 사용된 2종의 폴리뉴클레오티드 또는 2종의 폴리펩티드 사이의 낮은 정도의 서열 동일성은 전형적으로 약 50% 동일성 내지 75% 동일성, 예를 들어 약 50% 동일성, 바람직하게는 약 60% 동일성, 보다 바람직하게는 약 75% 동일성이다. 예를 들어, Cas 단백질 (예를 들어, 아미노산 치환을 포함하는 Cas9)은 참조 Cas 단백질 (예를 들어, 야생형 Cas9)에 대해 그의 길이에 걸쳐 낮은 정도의 서열 동일성, 중간 정도의 서열 동일성, 또는 높은 정도의 서열 동일성을 가질 수 있다. 또 다른 예로서, NATNA는 참조 Cas 단백질과 복합체화하는 참조 야생형 폴리뉴클레오티드 (예를 들어, Cas9와 복합체를 형성하는 sgRNA)에 비해 그의 길이에 걸쳐 낮은 정도의 서열 동일성, 중간 정도의 서열 동일성, 또는 높은 정도의 서열 동일성을 가질 수 있다.

본원에 사용된 "혼성화" 또는 "혼성화하다" 또는 "혼성화하는"은 수소 염기 쌍형성을 통해 단일 이중-가닥 분자 (DNA/DNA, DNA/RNA, RNA/RNA)를 형성하도록 2개의 상보적 단일-가닥 DNA 또는 RNA 분자를 조합하는 과정이다. 혼성화 엄격도는 전형적으로 혼성화 온도 및 혼성화 완충제의 염 농도에 의해 결정되며; 예를 들어, 높은 온도 및 낮은 염은 높은 엄격도 혼성화 조건을 제공한다. 상이한 혼성화 조건에 대한 염 농도 범위 및 온도 범위의 예는 하기와 같다: 높은 엄격도, 대략 0.01M 내지 대략 0.05M 염, 혼성화 온도 T_m보다 5℃ 내지 10℃ 아래; 중간 엄격도, 대략 0.16M 내지 대략 0.33M 염, 혼성화 온도 T_m보다 20℃ 내지 29℃ 아래; 및 낮은 엄격도, 대략 0.33M 내지 대략 0.82M 염, 혼성화 온도 T_m보다 40℃ 내지 48℃ 아래. 듀플렉스 핵산의 T_m은 관련 기술분야에 널리 공지된 표준 방법에 의해 계산된다 (예를 들어, 문헌 [Maniatis, T., et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press: New York (1982); Casey, J., et al., Nucleic Acids Research 4:1539-1552 (1977); Bodkin, D.K., et al., Journal of Virological Methods 10(1):45-52 (1985); Wallace, R.B., et al., Nucleic Acids Research 9(4):879-894 (1981)] 참조). T_m을 추정하기 위한 알고리즘 예측 도구는 또한 광범위하게 이용가능하다. 혼성화를 위한 높은 엄격도 조건은 전형적으로 표적 서열에 상보적인 폴리뉴클레오티드가 표적 서열에 우세하게 혼성화하고, 실질적으로 비-표적 서열에 혼성화하지 않는 조건을 지칭한다. 전형적으로, 혼성화 조건은 중간 엄격도, 바람직하게는 높은 엄격도를 갖는다.

본원에 사용된 "스템 요소" 또는 "스템 구조"는 이중-가닥 영역을 형성하는 것으로 알려지거나 예측된 2개의 가닥을 포함하는 폴리뉴클레오티드를 지칭한다 ("스템 요소"). "스템-루프 요소" 또는 "스템-루프 구조"는 한 가닥의 3' 말단이 전형적으로 단일-가닥 뉴클레오티드의 뉴클레오티드 서열에 의해 제2 가닥의 5' 말단에 공유 결합된 스템 구조를 지칭한다 ("스템-루프 요소 뉴클레오티드 서열"). 일부 실시양태에서, 루프 요소는 약 3 내지 약 20개 뉴클레오티드 길이, 바람직하게는 약 4 내지 약 10개 뉴클레오티드 길이의 루프 요소 뉴클레오티드 서열을 포함한다. 바람직한 실시양태에서, 루프 요소 뉴클레오티드 서열은 루프 요소 뉴클레오티드 서열 내에 스템 요소를 생성하기 위해 수소 결합 형성을 통해 상호작용하지 않는 쌍형성되지 않은 핵산 염기의 단일-가닥 뉴클레오티드 서열이다. 용어 "헤어핀 요소"는 또한 스템-루프 구조를 지칭하는 것으로 본원에 사용된다. 이러한 구조는 관련 기술 분야에 널리 공지되어 있다. 염기 쌍형성은 정확할 수 있으나; 관련 기술분야에 공지된 바와 같이, 스템 요소는 정확한 염기 쌍형성을 필요로 하지 않는다. 따라서, 스템 요소는 1개 이상의 염기 미스매치 또는 쌍형성되지 않은 염기를 포함할 수 있다.

"링커 요소 뉴클레오티드 서열" 및 "링커 뉴클레오티드 서열"은 본원에서 상호교환가능하게 사용되고, 제1 폴리뉴클레오티드 서열의 5' 말단, 3' 말단, 또는 5' 및 3' 말단 둘 다에 공유 부착된 1개 이상의 뉴클레오티드의 단일-가닥 서열을 지칭하고, 전형적으로 제1 폴리뉴클레오티드 서열을 제2 폴리뉴클레오티드 서열과 연결하는 단일-가닥 핵산 서열을 지칭한다. 바람직한 실시양태에서, 링커 요소 뉴클레오티드 서열은 링커 요소 뉴클레오티드 서열 내에 스템 요소를 생성하기 위해 수소 결합 형성을 통해 상호작용하지 않는 쌍형성되지 않은 핵산 염기의 단일-가닥 뉴클레오티드 서열이다. 일부 실시양태에서, 링커 요소 뉴클레오티드 서열은 약 1 내지 약 20개 뉴클레오티드 길이, 바람직하게는 약 2 내지 약 10개 뉴클레오티드 길이이다.

본원에 사용된 용어 "아미노산"은 아미노산 유사체, 변형된 아미노산, 펩티드모방체, 글리신, 및 D 또는 L 광학 이성질체를 포함한 천연 및 합성 (비천연) 아미노산을 지칭한다.

본원에 사용된 용어 "펩티드", "폴리펩티드" 및 "단백질"은 상호교환가능하고, 아미노산의 중합체를 지칭한다. 폴리펩티드는 임의의 길이일 수 있다. 이는 분지형 또는 선형일 수 있고, 이는 비-아미노산에 의해 개재될 수 있고, 이는 변형된 아미노산을 포함할 수 있다. 용어는 또한, 예를 들어 아세틸화, 디술피드 결합 형성, 글리코실화, 지질화, 인산화, PEG화, 비오티닐화, 가교 및/또는 (예를 들어, 표지 성분 또는 리간드와의) 접합을 통해 변형된 아미노산 중합체를 지칭한다. 폴리펩티드 서열은 달리 나타내지 않는 한 통상적인 N-말단에서 C-말단 배향으로 본원에 제시된다.

폴리펩티드 및 폴리뉴클레오티드는 분자 생물학 분야에서의 상용 기술을 사용하여 제조될 수 있다 (예를 들어, 상기 논의된 표준 참고서 참조). 게다가, 본질적으로 임의의 폴리펩티드 또는 폴리뉴클레오티드는 상업적 공급원으로부터 이용가능하다.

본원에 사용된 용어 "융합 단백질" 및 "키메라 단백질"은 자연적으로는 단일 단백질로 함께 발생하지 않는 2종 이상의 단백질, 단백질 도메인 또는 단백질 단편을 연결함으로써 생성된 단일 단백질을 지칭한다. 예를 들어, 융합 단백질은 Cas9 단백질로부터의 제1 도메인 및 Csy4 단백질로부터의 제2 도메인을 함유할 수 있다. 융합 단백질 내에 이러한 도메인을 포함시키는 변형은 변형된 부위-지정 폴리펩티드 상에 추가의 활성을 부여할 수 있다. 이들 활성은 핵산 표적 서열과 회합된 폴리펩티드 (예를 들어, 히스톤)를 변형시키는 뉴클레아제 활성, 메틸트랜스퍼라제 활성, 데메틸라제 활성, DNA 복구 활성, DNA 손상 활성, 탈아미노화 활성, 디스뮤타제 활성, 알킬화 활성, 탈퓨린화 활성, 산화 활성, 피리미딘 이량체 형성 활성, 인테그라제 활성, 트랜스포사제 활성, 레콤비나제 활성, 폴리머라제 활성, 리가제 활성, 헬리카제 활성, 포토리아제 활성, 글리코실라제 활성, 아세틸트랜스퍼라제 활성, 데아세틸라제 활성, 키나제 활성, 포스파타제 활성, 유비퀴틴 리가제 활성, 탈유비퀴틴화 활성, 아데닐화 활성, 데아데닐화 활성, SUMO화 활성, 탈SUMO화 활성, 리보실화 활성, 탈리보실화 활성, 미리스토일화 활성 또는 탈미리스토일화 활성을 포함할 수 있다. 융합 단백질은 또한 에피토프 태그 (예를 들어, 히스티딘 태그, FLAG® (시그마 알드리치(Sigma Aldrich), 미주리주 세인트 루이스) 태그, Myc 태그), 리포터 단백질 서열 (예를 들어, 글루타티온-S-트랜스퍼라제, 베타-갈락토시다제, 루시페라제, 녹색 형광 단백질, 시안 형광 단백질, 황색 형광 단백질), 및/또는 핵산 결합 도메인 (예를 들어, DNA 결합 도메인, RNA 결합 도메인)을 포함할 수 있다. 융합 단백질은 또한 활성화인자 도메인 (예를 들어, 열 쇼크 전사 인자, NFKB 활성화인자) 또는 리프레서 도메인 (예를 들어, KRAB 도메인)을 포함할 수 있다. 문헌 [Lupo, A., et al., Current Genomics 14(4): 268-278 (2013)]에 기재된 바와 같이, KRAB 도메인은 강력한 전사 억제 모듈이고, 대부분의 C2H2 아연 핑거 단백질의 아미노-말단 서열에 위치한다 (예를 들어, 문헌 [Margolin, J., et al., Proceedings of the National Academy of Sciences of the United States of America 91:4509-4513 (1994); Witzgall, R., et al., Proceedings of the National Academy of Sciences of the United States of America 91:4514-4518 (1994)] 참조). KRAB 도메인은 전형적으로 단백질-단백질 상호작용을 통해 보조-리프레서 단백질 및/또는 전사 인자에 결합하여, KRAB 아연 핑거 단백질 (KRAB-ZFP)이 결합하는 유전자의 전사 억제를 유발한다 (예를 들어, 문헌 [Friedman J.R., et al., Genes & Development 10:2067-2678 (1996)] 참조). 일부 실시양태에서, 링커 핵산 서열은 2종 이상의 단백질, 단백질 도메인 또는 단백질 단편을 연결하는 데 사용된다.

본원에 사용된 "모이어티"는 분자의 일부를 지칭한다. 모이어티는 관능기이거나 또는 다중 관능기를 갖는 (예를 들어, 공통 구조적 측면을 공유하는) 분자의 일부를 기재할 수 있다. 용어 "모이어티" 및 "관능기"는 전형적으로 상호교환가능하게 사용되지만; "관능기"는 보다 구체적으로 일부 공통 화학적 거동을 포함하는 분자의 일부를 지칭할 수 있다. "모이어티"는 종종 구조 설명으로서 사용된다. 일부 실시양태에서, 5' 말단, 3' 말단, 또는 5' 말단 및 3' 말단 (예를 들어, 제1 스템 요소 내의 비-천연 5' 말단 및/또는 비-천연 3' 말단).

본원에 사용된 용어 "친화성 태그"는 전형적으로, 예를 들어 NASC 복합체의 형성을 용이하게 하기 위해 NASC 폴리뉴클레오티드 조성물의 폴리뉴클레오티드 성분의 결합 친화도를 증가시키는 1개 이상의 모이어티를 지칭한다. 본 발명의 일부 실시양태는 1종 이상의 친화성 태그를 포함하는 폴리뉴클레오티드 서열인 "친화성 태그"를 사용한다. 본 발명의 일부 실시양태에서, 폴리뉴클레오티드 성분은 5' 말단, 3' 말단에 위치하거나, 또는 5' 말단과 3' 말단 사이에 위치한 친화성 서열을 추가로 포함한다. 본 발명의 일부 실시양태는 1종 이상의 친화성 태그를 Cas 단백질 서열 (예를 들어, Cas9 단백질 서열)의 N-말단에, Cas 단백질 서열의 C-말단에, Cas 단백질 서열의 N-말단과 C-말단 사이에 위치한 위치에, 또는 그의 조합에 도입한다. 본 발명의 일부 실시양태에서, Cas-폴리펩티드는 친화성 태그 또는 친화성 서열로 변형된다. 매우 다양한 친화성 태그가 2014년 10월 23일에 공개된 미국 공개 특허 출원 번호 2014-0315985에 개시되어 있다.

본원에 사용된 "가교"는 1개의 중합체 쇄 (예를 들어, 폴리뉴클레오티드 또는 폴리펩티드)를 또 다른 것에 연결하는 결합이다. 이러한 결합은 공유 결합 또는 이온 결합일 수 있다. 일부 실시양태에서, 1종의 폴리뉴클레오티드는 폴리뉴클레오티드를 가교함으로써 또 다른 폴리뉴클레오티드에 결합될 수 있다. 다른 실시양태에서, 폴리뉴클레오티드는 폴리펩티드에 가교될 수 있다. 추가의 실시양태에서, 폴리펩티드는 폴리펩티드에 가교될 수 있다.

본원에 사용된 용어 "가교 모이어티"는 전형적으로 NASC 폴리뉴클레오티드 조성물의 폴리뉴클레오티드 성분 사이에 가교를 제공하기에 적합한 모이어티를 지칭한다. 가교 모이어티는 친화성 태그의 또 다른 예이다.

본원에 사용된 용어 "리간드" 및 "리간드-결합 모이어티"는 NASC 폴리뉴클레오티드 조성물을 형성하기 위해 폴리뉴클레오티드 성분의 결합을 용이하게 하는 모이어티를 지칭한다. 리간드 및 리간드-결합 모이어티는 쌍형성된 친화성 태그이다.

본원에 사용된 "숙주 세포"는 일반적으로 생물학적 세포를 지칭한다. 세포는 유기체의 기본적인 구조적, 기능적 및/또는 생물학적 단위이다. 세포는 1개 이상의 세포를 갖는 임의의 유기체로부터 유래될 수 있다. 숙주 세포의 예는 원핵 세포, 진핵 세포, 박테리아 세포, 고세균 세포, 단일-세포 진행 유기체의 세포, 원충성 세포, 식물로부터의 세포 (예를 들어, 식물 작물 (예컨대 대두, 토마토, 사탕무, 호박, 건초, 칸나비스, 담배, 플랜테인, 참마, 고구마, 카사바, 감자, 밀, 소르굼, 대두, 벼, 옥수수, 옥수수, 오일-생산 브라시카 (예를 들어, 오일-생산 평지씨 및 카놀라), 목화, 사탕수수, 해바라기, 기장 및 알팔파), 과일, 채소, 곡식, 종자, 현화 식물, 침엽수, 겉씨식물, 양치식물, 석송, 뿔이끼류, 우산이끼류, 선류로부터의 세포), 조류 세포 (예를 들어, 보트리오코쿠스 브라우니(Botryococcus braunii), 클라미도모나스 레인하르드티(Chlamydomonas reinhardtii), 난노클로롭시스 가디타나(Nannochloropsis gaditana), 클로렐라 피레노이도사(Chlorella pyrenoidosa), 사르가숨 파텐스 씨. 아가르드(Sargassum patens C. agardh) 등), 해조 (예를 들어, 켈프), 진균 세포 (예를 들어, 버섯으로부터의 효모 세포 또는 세포), 동물 세포, 무척추 동물 (예를 들어, 과실 파리, 자포동물, 극피동물, 선충류 등)로부터의 세포, 척추 동물 (예를 들어, 어류, 양서류, 파충류, 조류 또는 포유동물)로부터의 세포, 포유동물 (예를 들어, 돼지, 소, 염소, 양, 설치류, 래트, 마우스, 비-인간 영장류, 인간 등)로부터의 세포를 포함하나 이에 제한되지는 않는다. 게다가, 세포는 스템 세포 또는 전구 세포일 수 있다.

본원에 사용된 "스템 세포"는 자기-재생을 위한 능력, 즉, 미분화 상태를 유지하면서 세포 분열의 수많은 주기를 겪는 능력을 갖는 세포를 지칭한다. 스템 세포는 전능, 만능, 다능, 소기능 또는 단능일 수 있다. 스템 세포는 배아, 태아, 양막, 성체 또는 유도된 만능 스템 세포일 수 있다.

본원에 사용된 "유도된 만능 스템 세포"는 비-만능 세포, 전형적으로 성체 체세포로부터 특정 유전자의 발현을 유도함으로써 인공적으로 유래된 만능 스템 세포의 유형을 지칭한다.

본원에 사용된 "식물"은 전체 식물, 식물 기관, 식물 조직, 생식질, 종자, 식물 세포, 및 동일한 것의 자손을 지칭한다. 식물 세포는 비제한적으로 종자, 현택 배양, 배아, 분열조직 영역, 캘러스 조직, 잎, 뿌리, 싹, 배우체, 포자체, 화분 및 소포자로부터의 세포를 포함한다. 식물 부분은 뿌리, 줄기, 싹, 잎, 화분, 종자, 종양 조직 및 다양한 형태의 세포 및 배양물 (예를 들어, 단세포, 원형질체, 배아 및 캘러스 조직)을 포함하나 이에 제한되지는 않는 분화 및 미분화 조직을 포함한다. 식물 조직은 식물 내에, 또는 식물 기관, 조직 또는 세포 배양물에 존재할 수 있다. "식물 기관"은 식물 조직, 또는 식물의 형태학적으로 및 기능적으로 구분되는 부분을 구성하는 조직의 군을 지칭한다.

본원에 사용된 "대상체"는 비제한적으로 인간, 및 비-인간 영장류 예컨대 레서스 마카크, 침팬지 및 다른 원숭이 및 유인원 종; 농장 동물, 예컨대 소, 양, 돼지, 염소 및 말; 가축, 예컨대 개 및 고양이; 토끼, 마우스, 래트 및 기니 피그를 포함한 실험 동물; 가축용, 야생 및 사냥감 조류, 예컨대 닭, 칠면조 및 다른 가금 조류, 오리 및 거위 등을 포함한 다른 영장류를 포함한 척삭동물문의 임의의 구성원을 지칭한다. 용어는 특정한 연령 또는 성별을 나타내지 않는다. 따라서, 용어는 성체, 신생 및 초생 개체뿐만 아니라 웅성 및 자성을 포함한다. 일부 실시양태에서, 숙주 세포는 대상체로부터 유래된다 (예를 들어, 스템 세포, 전구 세포 또는 조직-특이적 세포). 일부 실시양태에서, 대상체는 비-인간 대상체이다.

본원에 사용된 "트랜스제닉 유기체"는 게놈이 유전자 변형된 유기체를 지칭한다. 용어는 트랜스제닉 유기체의 자손 (임의의 세대)를 포함하며, 단 자손은 유전자 변형을 갖는다.

본원에 사용된 "단리된"은 인간 개입에 의해, 그의 천연 환경으로부터 떨어져서 존재하고 따라서 자연의 산물이 아닌 핵산 또는 폴리펩티드를 지칭할 수 있다. 단리된 핵산 또는 폴리펩티드는 정제된 형태로 존재할 수 있고/거나 비-천연 환경 예컨대, 예를 들어, 재조합 세포에서 존재할 수 있다.

본 발명의 일반적 측면에서, NASC 폴리뉴클레오티드 조성물은 반복 요소 2와 연결된 반복 요소 1, 핵산 결합 단백질 요소 1 및 핵산 결합 단백질 결합 요소 2, 및 스페이서 요소 1 및 스페이서 요소 2를 포함한다.

반복 요소 1 및 반복 요소 2는 전형적으로 공유 결합, 비-공유 결합, 또는 공유 및 비-공유 결합의 조합에 의해 연결된다. 일부 실시양태에서, 반복 요소 1 및 반복 요소 2는 수소-결합된 염기 쌍에 의해 연결된다.

NASC 폴리뉴클레오티드 조성물은 핵단백질 복합체를 형성하기 위해 핵산 결합 단백질(들)과 회합할 수 있다. 일부 실시양태에서, 유사한 구조적 모티프 및 기능적 모티프를 갖는 2종 이상의 핵산 결합 단백질은 NASC 폴리뉴클레오티드 조성물과 핵단백질 복합체를 형성하는 데 사용된다. 바람직한 실시양태에서, 핵산 결합 단백질은 부류 2 CRISPR-Cas 단백질이다. 일부 실시양태에서, 핵산 결합 단백질은 이중-가닥 핵산 결합 단백질 결합 서열에 결합한다 ("이중-가닥 핵산 결합 단백질").

NASC 폴리뉴클레오티드 조성물/핵산 결합 단백질 1/핵산 결합 단백질 2 복합체는 (핵산 표적 서열을 포함하지 않는 폴리뉴클레오티드에 비해) 폴리뉴클레오티드 내의 핵산 표적 서열에 유선적으로 결합할 수 있다.

도 4a, 도 4b, 도 4c, 도 4d, 도 4e, 도 4f, 도 4g, 도 4h, 도 4i, 도 4j, 도 4k, 도 4l, 도 4m, 도 4n 및 도 4o는 본 발명의 상이한 유형의 핵산 스캐폴드의 일반적인 예를 도시한다. 이들 도면은 스캐폴드를 형성하기 위한 조작된 핵산 서열에서의 상이한 요소의 상대적 위치를 제시한다.

일부 실시양태에서, 스캐폴드를 형성하는 2종 이상의 조작된 핵산 서열의 복합체는 하기를 포함한다:

(i) 제1 말단 및 제2 말단을 갖는 핵산 결합 단백질 결합 서열 1 (예를 들어, 이중-가닥 핵산 결합 단백질 결합 서열 1)을 포함하는 핵산 결합 단백질 결합 요소 1, (ii) 제1 말단 및 제2 말단을 갖는 반복 핵산 서열 1을 포함하는 반복 요소 1, 및 (iii) 핵산 표적 결합 서열 1을 포함하는 스페이서 요소 1을 포함하는 제1 조작된 핵산; 및

(i) 제1 말단 및 제2 말단을 갖는 핵산 결합 단백질 결합 서열 2 (예를 들어, 이중-가닥 핵산 결합 단백질 결합 서열 2)를 포함하는 핵산 결합 단백질 결합 요소 1C, (ii) 제1 말단 및 제2 말단을 갖는 반복 핵산 서열 2를 포함하는 반복 요소 2, 및 (iii) 핵산 표적 결합 서열 2를 포함하는 스페이서 요소 2를 포함하는 제2 조작된 핵산.

반복 핵산 서열 1 및 반복 핵산 서열 1C는 상보적이다. 반복 핵산 서열 1C는 또한 반복 핵산 서열 2로도 지칭된다. 반복 핵산 서열 1은 수소-결합된 염기 쌍을 통해 반복 핵산 서열 1C와 연결된다.

표 2는 도 4a 내지 4o에서 일관되게 사용되는 일련의 식별자를 제시한다.

표 2

스캐폴드를 형성하기 위한 2종 이상의 조작된 핵산 서열의 복합체의 영역을 도시하는 데 사용되는 수치 식별자

# = 추가의 조작된 핵산에 대해, 번호 3 이후의 순차적 넘버링

도 4a, 도 4c, 도 4e, 도 4g, 도 4i 및 도 4k는 각각 제1 조작된 핵산 내의 영역 1-1, 영역 1-2 및 영역 1-3, 및 제2 조작된 핵산 내의 영역 2-1, 영역 2-2 및 영역 2-3의 6개의 상이한 배열의 집합으로부터의 한 예를 제시하며, 여기서 반복 핵산 서열 1-1은 반복 핵산 서열 1-1과 반복 핵산 서열 2-1 사이의 수소 결합을 통해 반복 핵산 서열 2-1과 회합된다. 이들 도면에서, 제1 조작된 핵산은 단일 폴리뉴클레오티드이고, 제2 조작된 핵산은 단일 폴리뉴클레오티드이다. 각각의 폴리뉴클레오티드는 제1 말단 및 제2 말단을 갖는다. 일부 실시양태에서, 제1 말단은 5' 말단이고, 제2 말단은 3' 말단이다. 다른 실시양태에서, 제1 말단은 3' 말단이고, 제2 말단은 5' 말단이다.

도 4b, 도 4d, 도 4f, 도 4h, 도 4j 및 도 4l은 각각 도 4a, 도 4c, 도 4e, 도 4g, 도 4i 및 도 4k와 동일한 배열을 제시하며, 여기서 제1 조작된 핵산은 수소 결합 (이들 도면에서 핵산 서열 사이의 다중 직선으로 표시됨)에 의해 회합된 다중 폴리뉴클레오티드를 포함하고, 제2 조작된 핵산은 수소 결합을 통해 회합된 다중 폴리뉴클레오티드를 포함한다. 각각의 폴리뉴클레오티드는 제1 말단 및 제2 말단을 갖는다. 일부 실시양태에서, 제1 말단은 5' 말단이고, 제2 말단은 3' 말단이며, 여기서 폴리뉴클레오티드 중에서 표준 5'에서 3' 배향은 유지된다. 다른 실시양태에서, 제1 말단은 3' 말단이고, 제2 말단은 5' 말단이며, 여기서 폴리뉴클레오티드 중에서 5'에서 3' 배향은 유지된다.

도 4m은 스캐폴드를 형성하는 3종의 조작된 핵산 서열의 복합체의 예를 도시한다. 이 도면에서, 제1, 제2 및 제3 조작된 핵산은 각각 단일 폴리뉴클레오티드이다. 제1 및 제2 조작된 핵산은 도 4a에 제시된 제1 및 제2 조작된 핵산에 상응하고, 제3 조작된 핵산은 도 4g의 제2 조작된 핵산에 상응한다.

도 4n은 스캐폴드를 형성하는 3종의 조작된 핵산 서열의 복합체의 예를 도시한다. 이 도면에서, 제1 및 제3 조작된 핵산은 각각 단일 폴리뉴클레오티드이다. 제2 조작된 핵산은 수소 결합을 통해 회합된 다중 폴리뉴클레오티드를 포함한다. 제1 조작된 핵산은 도 4c에 제시된 제1 조작된 핵산에 상응한다. 제2 조작된 핵산은 도 4d에 제시된 제2 조작된 핵산에 상응한다. 제3 조작된 핵산은 도 4e의 제2 조작된 핵산에 상응한다.

도 4o는 스캐폴드를 형성하는 3종의 조작된 핵산 서열의 복합체의 예를 도시한다. 이 도면에서, 제1 및 제3 조작된 핵산은 각각 단일 폴리뉴클레오티드이다. 제2 조작된 핵산은 수소 결합을 통해 회합된 다중 폴리뉴클레오티드를 포함한다. 제1 조작된 핵산은 도 4i에 제시된 제1 조작된 핵산에 상응한다. 제2 조작된 핵산은 도 4f에 제시된 제2 조작된 핵산에 상응한다. 제3 조작된 핵산은 도 4k의 제2 조작된 핵산에 상응한다.

본 발명은 2종 이상의 조작된 핵산 서열의 복합체로 구성된 매우 다양한 핵산-기재 스캐폴드를 포함한다. 바람직한 실시양태에서, 조작된 핵산 서열은 부류 2 CRISPR 핵산 표적화 핵산의 요소, 예를 들어, 제2형-crRNA, 제2형 CRISPR-tracrRNA 및 제2형 CRISPR 단일-가이드 RNA의 서열에 기초한 핵산 서열을 코딩하는 요소를 포함한다. 부류 2 CRISPR-회합된 요소의 예는 도 1a, 도 1b, 도 1c, 도 1d, 도 2a, 도 2b, 도 3a 및 도 3b에 제시된 요소를 포함하나 이에 제한되지는 않는다.

일부 실시양태에서, 핵산 스캐폴드는 게놈 편집 시스템 (예를 들어, 아연 핑커 뉴클레아제 (ZFN), 전사 활성화제-유사 이펙터-기반 뉴클레아제 (TALEN), 메가뉴클레아제 및 CRISPR-Cas)과 회합되는 것들을 포함하나 이에 제한되지는 않는 핵산 단백질 결합 서열을 포함한다. 핵산 단백질 결합 서열의 예는 하기 핵산 결합 단백질과 회합되는 것들을 포함하나 이에 제한되지는 않는다: 제2형 CRISPR 핵산 결합 단백질 (예를 들어, Cpf1 단백질, dCpf1 단백질 (촉매적으로 불활성), Cas9 단백질, 및/또는 dCas9 단백질 (촉매적으로 불활성)); 아르고노트 단백질; 이중-가닥 핵산 결합 단백질 (예를 들어, Csy4 단백질 및/또는 Csy4* 단백질 (촉매적으로 불활성); 예를 들어, 문헌 [Haurwitz, R., et al., Science 329(5997):1355-1358 (2010); Sternberg, S., et al., RNA 18(4):661-672 (2012)]; 미국 특허 번호 9,115,348 참조); 단일-가닥 RNA 결합 단백질 (예를 들어, p19 siRNA 결합 단백질); 단일-가닥 DNA 결합 단백질 (예를 들어, 아데노바이러스 DBP, 극도의 열안정성 SSB (단일-가닥 DNA 결합 단백질); 이중-가닥 RNA 결합 단백질 (예를 들어, DICER); 이중-가닥 DNA 결합 단백질 (예를 들어, ZFN); 및 이중-가닥 RNA/DNA 하이브리드 (예를 들어, 리보뉴클레아제 H); 뿐만 아니라 그의 촉매적으로 불활성인 버전. 추가의 실시양태에서, 핵산 스캐폴드 및 회합된 핵산 결합 단백질은 핵산 스캐폴드/핵산 결합 단백질 복합체, 예를 들어, 핵단백질 복합체 및 리보핵단백질 복합체로 존재한다.

일부 실시양태에서, 1-2, 2-2 및/또는 3-2의 각각의 핵산 결합 단백질 결합 서열은 각각 예를 들어 이중-가닥 DNA 결합 단백질 결합 서열, 단일-가닥 DNA 결합 단백질 결합 서열, 이중-가닥 RNA 결합 단백질 결합 서열, 단일-가닥 RNA 결합 단백질 결합 서열 또는 이중-가닥 DNA/RNA 하이브리드 결합 단백질 결합 서열이다. 바람직한 실시양태에서, 핵산 결합 단백질 결합 서열에 결합하는 핵산 결합 단백질은 Cas9 단백질 또는 Cpf1 단백질이다.

특정한 실시양태에서, 각각의 핵산 서열 1-1, 핵산 서열 1-2, 및/또는 핵산 서열 1-3은 표적 핵산 서열에 결합하는 핵산 서열 (예를 들어, 스페이서 요소)을 포함한다.

본 발명의 제1 측면에서, NASC 폴리뉴클레오티드 조성물은 NASC-PC1 및 NASC-PC2를 포함한다. NASC-PC1/NASC-PC2 복합체는 반복 요소 2에 연결된 반복 요소 1, 이중-가닥 핵산 결합 단백질 결합 요소 1 및 이중-가닥 핵산 결합 단백질 결합 요소 2, 및 스페이서 요소 1 및 스페이서 요소 2를 포함한다. NASC에 결합할 수 있는 이중-가닥 핵산 결합 단백질은 1종 이상의 부류 2 제V형 CRISPR-Cpf1 단백질이다.

NASC 폴리뉴클레오티드 조성물은 핵단백질 복합체를 형성하기 위해 2종의 부류 2 제V형 CRISPR-Cpf1 단백질과 회합할 수 있다. 일부 실시양태에서, NASC 폴리뉴클레오티드 조성물의 각각의 NASC-PC1 및 NASC-PC2는 핵단백질 복합체를 형성하기 위해 2종의 부류 2 제V형 CRISPR-Cpf1 단백질과 회합할 수 있다 (예를 들어, 도 5a, 도 5b, 도 5c, 도 5d, 도 5e, 도 5f 및 도 5g).

본 발명의 제1 측면에서, 반복 요소 1은 반복 핵산 서열 1을 포함하고, 반복 요소 2는 반복 핵산 서열 1C를 포함하고, 핵산 결합 단백질 결합 요소 1은 이중-가닥 핵산 결합 단백질 결합 서열 1을 포함하고, 핵산 결합 단백질 결합 요소 2는 이중-가닥 핵산 결합 단백질 결합 서열 2를 포함하고, 스페이서 요소 1은 핵산 표적 결합 서열 1을 포함하고, 스페이서 요소 2는 핵산 표적 결합 서열 2를 포함한다.

요소의 배열은 전형적으로 하기와 같다: (i) 반복 요소 1은 핵산 결합 단백질 결합 요소 1의 5'이고, 핵산 결합 단백질 결합 요소 1은 스페이서 요소 1의 5'이고, 반복 요소 2는 핵산 결합 단백질 결합 요소 2의 5'이고, 핵산 결합 단백질 결합 요소 2는 스페이서 요소 2의 5'이거나; 또는 (ii) 핵산 결합 단백질 결합 요소 1은 반복 요소 1의 5'이고, 반복 요소 1은 스페이서 요소 1의 5'이고, 핵산 결합 단백질 결합 요소 2는 반복 요소 2의 5'이고, 반복 요소 2는 스페이서 요소 2의 5'이거나; 또는 (iii) 핵산 결합 단백질 결합 요소 1은 스페이서 요소 1의 5'이고, 스페이서 요소 1은 반복 요소 1의 5'이고, 핵산 결합 단백질 결합 요소 2는 스페이서 요소 2의 5'이고, 스페이서 요소 2는 반복 요소 2의 5'이다.

제1 측면의 일부 실시양태에서, (i) 핵산 결합 단백질 결합 요소 1은 제1 스템 요소 핵산 서열 1-1 및 제1 스템 요소 핵산 서열 1-2를 포함하고, 제1 스템 요소 핵산 서열 1-1 및 제1 스템 요소 핵산 서열 1-2는 수소-결합된 염기 쌍을 통해 제1 스템 요소 1을 형성하고/거나, (ii) 핵산 결합 단백질 결합 요소 2는 제1 스템 요소 핵산 서열 2-1 및 제1 스템 요소 핵산 서열 2-2를 포함하고, 제1 스템 요소 핵산 서열 2-1 및 제1 스템 요소 핵산 서열 2-2는 수소-결합된 염기 쌍을 통해 제1 스템 요소 1을 형성한다 (예를 들어, 도 5b, 도 5f, 도 5g). 추가 실시양태에서, 제1 스템 요소 핵산 서열 1-1 및 제1 스템 요소 핵산 서열 1-2는 루프 요소 핵산 서열 1에 의해 연결되어 제1 스템-루프 요소 1을 형성하고/거나, 제1 스템 요소 핵산 서열 2-1 및 제1 스템 요소 핵산 서열 2-2는 루프 요소 핵산 서열 2에 의해 연결되어 제1 스템-루프 요소 2를 형성한다 (예를 들어, 도 5a, 도 5c, 도 5d, 도 5e).

추가의 실시양태에서, 반복 핵산 서열 1은 반복 핵산 서열 1과 반복 핵산 서열 1C 사이의 수소-결합된 염기 쌍을 통해 반복 핵산 서열 1C와 연결된다.

다른 실시양태에서, 반복 핵산 서열 1은 친화성 태그 1을 추가로 포함하고, 반복 핵산 서열 2는 친화성 태그 2를 추가로 포함하고, 친화성 태그 1은 친화성 태그 2와 연결된다. 예를 들어, 반복 핵산 서열 1은 이펙터 단백질 결합 부위 핵산 서열 1을 추가로 포함하고, 반복 핵산 서열 2는 이펙터 단백질 결합 부위 핵산 서열 2를 추가로 포함하고, 이펙터 결합 부위 1은 이펙터 단백질 결합 부위 핵산 서열 1과 이펙터 단백질 결합 부위 핵산 서열 2 사이의 수소 염기-쌍 결합에 의해 형성된다. 이펙터 결합 부위의 한 예는 Csy4 단백질 결합 부위이다.

표 3은 도 5a, 도 5b, 도 5c, 도 5d, 도 5e, 도 5f, 도 5g, 도 5h 및 도 5i에서 일관되게 사용되는 일련의 식별자를 제시한다.

표 3

¹ = 반복 요소는 이펙터 단백질 결합 부위를 포함할 수 있다

² = "C"는 상보적 서열을 나타낸다

도 5a는 본 발명의 스캐폴드를 형성하는 2종의 조작된 핵산 (NASC-PC1 및 NASC-PC2)의 예를 제시한다. 일부 실시양태에서, 조작된 핵산은 부류 2 제V형 CRISPR 핵산 표적화 핵산, 예를 들어, Cpf1 핵산 표적화 핵산의 5' 말단에 공유 부착된 반복 핵산 서열을 포함하는 Cpf1 핵산 표적화 핵산이다. 도 5a, (500) 내지 (507)은 제1 핵산 결합 부류 2 제V형 CRISPR 단백질 결합 서열 (도 5a, (504) 내지 (501)), 제1 핵산 결합 부류 2 제V형 CRISPR 단백질 결합 서열의 3'에 위치한 핵산 표적 결합 서열 1 (도 5a, (500) 내지 (501)), 및 제1 핵산 결합 부류 2 제V형 CRISPR 단백질 결합 서열의 5'에 위치한 제1 반복 서열 1 (도 5a, (504)-(507))을 포함하는 제1 조작된 핵산을 도시한다. 도 5a, (508) 내지 (515)는 제2 핵산 결합 부류 2 제V형 CRISPR 단백질 결합 서열 (도 5a, (514) 내지 (511)), 제2 핵산 결합 부류 2 제V형 CRISPR 단백질 결합 서열의 3'에 위치한 핵산 표적 결합 서열 2 (도 5a, (515) 내지 (514)), 및 제2 핵산 결합 부류 2 제V형 CRISPR 단백질 결합 서열의 5'에 위치한 제1 반복 서열 2 (도 5a, (511)-(508))를 포함하는 제2 조작된 핵산을 도시한다.

제1 조작된 핵산 및 제2 조작된 핵산은 추가의 요소 예컨대 이펙터 단백질 결합 서열, 예를 들어, 수소 결합 상호작용을 통한 반복 핵산 서열 1 (도 5a, (505)-(506))과 반복 핵산 서열 1C (도 5a, (509)-(510))의 회합에 의해 생성되는 이중-가닥 핵산 결합 단백질 결합 부위 (예를 들어, Csy4 단백질 결합 부위)를 포함할 수 있다.

도 5b는 도 5a에 제시된 예의 변형을 도시하며, 여기서 제1 조작된 핵산의 루프 요소 핵산 서열 1 (도 5a, (502) 내지 (503)) 및 제2 조작된 핵산의 루프 요소 핵산 서열 2 (도 5a, (513) 내지 (512))는 부재한다.

도 5c는 본 발명의 스캐폴드를 형성하는 2종의 조작된 핵산 (NASC-PC1 및 NASC-PC2)의 예를 제시한다. 일부 실시양태에서, 조작된 핵산은 부류 2 제V형 CRISPR 핵산 표적화 핵산, 예를 들어, Cpf1 핵산 표적화 핵산의 3' 말단에 공유 부착된 반복 핵산 서열을 포함하는 Cpf1 핵산 표적화 핵산이다. 도 5c는 조작된 핵산의 변형을 도시하며, 여기서 반복 서열은 제1 조작된 핵산 (도 5c, (500) 내지 (507))의 3' 말단 (도 5c, (500))에 부가되고, 상보적 반복 서열은 제2 조작된 핵산 (도 5c, (508) 내지 (515))의 3' 말단 (도 5c, (515))에 부가된다. 제1 조작된 핵산의 반복 서열 및 제2 핵산의 상보적 반복 서열은 수소 염기-쌍 결합을 통해 상호작용한다.

도 5d는 도 5a에 도시된 NASC-PC1 및 NASC-PC2의 변형을 제시한다. 도 5d에서 각각의 Cpf1 핵산 표적화 핵산의 5' 말단에 공유 부착된 반복 핵산 서열은 링커 요소 핵산 서열에 의해 분리된 2개의 반복 요소를 포함하며, 여기서 도 5d, I의 2개의 반복 요소 중 오직 1개만이 도 5d, II의 반복 요소 중 1개에 상보적이고, 그와 수소 결합을 형성할 수 있다. 도 5d는 스캐폴드를 형성하는 2종의 조작된 핵산의 버전을 도시하며, 여기서 제1 조작된 핵산 (도 5d, (500) 내지 (507))의 반복 서열 1b (도 5d, (506)-(517))는 제2 조작된 핵산 (도 5d, (515) 내지 (508))의 상보적 반복 서열 1bC (도 5d, (519) 내지 (510))와 수소 염기-쌍 결합할 수 있으며, 여기서 제1 조작된 핵산의 반복 서열 1b 및 제2 조작된 핵산의 상보적 반복 서열 1bC는 수소 염기-쌍 결합을 통해 상호작용한다.

도 5e는 도 5d의 2종의 조작된 핵산의 2개의 세트에 기초한, 스캐폴드를 형성하는 4종의 조작된 핵산의 예를 제시한다. 이 도 5e, I 및 도 5e, II에서 도 5d에 제시된 2종의 조작된 핵산 (즉, 도 5d, I 및 II)에 대한 비교를 용이하게 하기 위한 참조 지점을 제공한다. 도 5e는 도 5d에 제시된 예의 변형된 버전을 도시하며, 여기서 제1 조작된 핵산 (도 5e, I; NASC-PC-1)의 반복 요소는 수소 염기-쌍 결합을 통해 제2 조작된 핵산 (도 5e, II; NASC-PC-2)의 반복 요소와 상호작용하고, 제2 조작된 핵산 (도 5e, II)의 반복 요소는 수소 염기-쌍 결합을 통해 제3 조작된 핵산 (도 5e, III; NASC-PC-3)의 반복 요소와 상호작용하고, 제3 조작된 핵산 (도 5e, III)의 반복 요소는 수소 염기-쌍 결합을 통해 제4 조작된 핵산 (도 5e, IV; NASC-PC-4)의 반복 요소와 상호작용하고, 제4 조작된 핵산 (도 5e, IV)의 반복 요소는 수소 염기-쌍 결합을 통해 제1 조작된 핵산 (도 5e, I)의 반복 요소와 상호작용한다.

도 5f는 도 5d에 제시된 예의 변형된 버전을 도시하며, 여기서 루프 요소 핵산 서열 (도 5d, (502) 내지 (503) 및 도 5d, (513) 내지 (512))은 제1 조작된 핵산 서열 (도 5f, VIII 및 도 5f, V), 제2 조작된 핵산 서열 (도 5g, VI), 제3 조작된 핵산 서열 (도 5g, VI), 및 제4 조작된 핵산 서열 (도 5g, VII)에 존재하지 않는다.

도 5g는 도 5f의 2종의 조작된 핵산의 2개의 세트에 기초한, 스캐폴드를 형성하는 4종의 조작된 핵산의 예를 제시한다. 이 도 5g, V, 및 도 5g, VIII에서 도 5f에 제시된 2종의 조작된 핵산 (즉, 도 5f, V 및 VIII)에 대한 비교를 용이하게 하기 위한 참조 지점을 제공한다. 도 5g는 도 5f에 제시된 예의 변형된 버전을 도시하며, 여기서 제1 조작된 핵산 (도 5g, V; NASC-PC-1)의 반복 요소는 수소 염기-쌍 결합을 통해 제2 조작된 핵산 (도 5g, VI; NASC-PC-2)의 반복 요소와 상호작용하고, 제2 조작된 핵산 (도 5g, VI; NASC-PC-2)의 반복 요소는 수소 염기-쌍 결합을 통해 제3 조작된 핵산 (도 5g, VII; NASC-PC-3)의 반복 요소와 상호작용하고, 제3 조작된 핵산 (도 5g, VII)의 반복 요소는 수소 염기-쌍 결합을 통해 제4 조작된 핵산 (도 5g, VIII; NASC-PC-4)의 반복 요소와 상호작용하고, 제4 조작된 핵산 (도 5g, VIII)의 반복 요소는 수소 염기-쌍 결합을 통해 제1 조작된 핵산 (도 5g, V)의 반복 요소와 상호작용한다.

본 발명의 제1 측면의 다른 실시양태에서, 핵단백질 복합체는 핵산 표적 결합 서열 1, 반복 핵산 서열 1, 반복 핵산 서열 2, 및 핵산 표적 결합 서열 1을 포함하는 거대분자에 대한 핵산 결합 단백질 결합에 의해 형성될 수 있다 (예를 들어, 도 5h, 도 5i).

도 5h는 스캐폴드를 형성하는 2종의 조작된 핵산의 버전을 도시하며, 여기서 제1 조작된 핵산 IX (도 5h, (500) 내지 (502); NASC-PC1)의 부류 2 제V형 CRISPR 단백질 결합 부위 절반 스템 서열 1-1b (도 5h, (520)-(502))는 제2 조작된 핵산 X (도 5h, (515) 내지 (513); NASC-PC2)의 상보적 부류 2 제V형 CRISPR 단백질 결합 부위 절반 스템 서열 2-1b (도 5h, (514) 내지 (521))와 수소 염기-쌍 결합할 수 있고, 제1 조작된 핵산의 부류 2 제V형 CRISPR 단백질 결합 부위 절반 스템 서열 1-1b 및 제2 조작된 핵산의 상보적 부류 2 제V형 CRISPR 단백질 결합 부위 절반 스템 서열 2-1b는 수소 염기-쌍 결합을 통해 상호작용한다. 절반 스템 서열의 특정 쌍 사이의 서열 특이적 혼성화를 제공하기에 충분한 절반 스템 서열 사이의 서열 변화는 부류 2 제V형 CRISPR 단백질 결합 부위 인식이 이러한 서열 변화를 용인하기 때문에 가능하며, 단 2차 구조는 유지된다.

도 5i는 도 5h에 제시된 예의 변형된 버전을 도시하며, 여기서 제1 조작된 핵산 (도 5i, IX)의 부류 2 제V형 CRISPR 단백질 결합 부위 절반 스템 서열은 제2 조작된 핵산 (도 5i, X)의 부류 2 제V형 CRISPR 단백질 결합 부위 절반 스템 서열과 상호작용하고; 제2 조작된 핵산 (도 5i, X)의 부류 2 제V형 CRISPR 단백질 결합 부위 절반 스템 서열은 제3 조작된 핵산 (도 5i, XI)의 부류 2 제V형 CRISPR 단백질 결합 부위 절반 스템 서열과 상호작용하고; 제3 조작된 핵산 (도 5i, XI)의 부류 2 제V형 CRISPR 단백질 결합 부위 절반 스템 서열은 제4 조작된 핵산 (도 5i, XII)의 부류 2 제V형 CRISPR 단백질 결합 부위 절반 스템 서열과 상호작용하고; 제4 조작된 핵산 (도 5i, XII)의 부류 2 제V형 CRISPR 단백질 결합 부위 절반 스템 서열은 제1 조작된 핵산 (도 5i, IX)의 부류 2 제V형 CRISPR 단백질 결합 부위 절반 스템 서열과 상호작용한다.

본 발명의 제2 측면에서, NASC 폴리뉴클레오티드 조성물은 적어도 NASC-PC1 및 NASC-PC2를 포함한다. NASC-PC1/NASC-PC2 복합체는 반복 요소 2에 연결된 반복 요소 1, 이중-가닥 핵산 결합 단백질 결합 요소 1 및 이중-가닥 핵산 결합 단백질 결합 요소 2, 및 스페이서 요소 1 및 스페이서 요소 2를 포함한다. 본 발명의 실시양태는 1종 이상의 부류 2 CRISPR-Cas 단백질에 상응하는 이중-가닥 핵산 결합 단백질 결합 요소를 포함하는 NASC 폴리뉴클레오티드 조성물을 포함한다.

일부 실시양태에서, NASC 폴리뉴클레오티드 조성물은 핵단백질 복합체를 형성하기 위해 2종의 부류 2 제II형 CRISPR-Cas9 단백질과 회합할 수 있다. 도 6a, 도 6b 도 6c, 도 6d, 도 6e, 도 6f, 도 6g, 도 6h, 도 6i, 도 6k, 도 6l 및 도 6m은 전형적으로 핵산 결합 부류 2 CRISPR 단백질 결합 서열을 포함하는 본 발명의 조작된 핵산 스캐폴드의 요소 및 예를 도시한다.

표 4는 도 6a, 도 6b 도 6c, 도 6d, 도 6e, 도 6f 및 도 6g에서 일관되게 사용되는 일련의 식별자를 제시한다.

표 4

¹ = 반복 요소는 이펙터 단백질 결합 부위를 포함할 수 있다

² = "C"는 상보적 서열을 나타낸다

각각의 제1, 제2 및 제3 요소는 추가의 핵산 서열, 예를 들어, 요소의 5', 요소의 3', 또는 요소의 5' 및 요소의 3' 둘 다를 포함할 수 있다.

도 6a, (601)-(611)은 부류 2 제II형 CRISPR 결합 단백질 서열 (도 6a, (601)-(607))을 포함하는 제1 요소, 반복 핵산 서열 1 (도 6a, (608)-(609))을 포함하는 제2 요소, 및 핵산 서열 1 (도 6a, (610)-(611))을 포함하는 제3 요소를 포함하는 제1 조작된 핵산의 예를 도시한다. 반복 핵산 서열 1 내의 어떠한 핵산 서열도 부류 2 제II형 CRISPR-Cas 단백질에 결합할 수 있는 수소 결합을 통한 스템 요소를 형성하기 위해 반복 핵산 서열 1 내의 임의의 핵산 서열과 회합할 수 없다.

도 6b는 도 6a에 대한 변형을 도시하며, 여기서 제1 조작된 핵산 (도 6b, (601)-(611))은 반복 핵산 서열 1 (도 6a, (608)-(609))과 반복 핵산 서열 1C (도 6a, (619)-(620)) 사이의 수소 염기-쌍 결합을 통해 제2 조작된 핵산 (도 6b, (612)-(622))과 회합된다.

도 6b에 도시된 조성물과 유사한 NASC 폴리뉴클레오티드 조성물은 핵단백질 복합체를 형성하기 위해 부류 2 제V형 CRISPR-Cas 단백질과 함께 사용하도록 구축될 수 있다. 이러한 유형의 NASC 폴리뉴클레오티드 조성물의 예는 도 10, V에 도시된다.

도 6c는 제1 조작된 핵산의 예를 도시하며, 여기서 제2 성분은 3'에서 5' 배향으로 링커 요소 핵산 서열 1-1 (도 6c, (608)-(623)), 반복 핵산 서열 1a (도 6c, (623)-(624)), 링커 요소 핵산 서열 1-2 (도 6c, (624)-(625)), 반복 핵산 서열 1b (도 6d, (625)-(626)), 및 링커 요소 핵산 서열 1-3 (도 6c, (626)-(609))을 추가로 포함한다. 반복 핵산 서열 1 내의 어떠한 핵산 서열도 부류 2 제II형 CRISPR-Cas 단백질에 결합할 수 있는 수소 결합을 통한 스템 요소를 형성하기 위해 반복 핵산 서열 1 내의 임의의 핵산 서열과 회합할 수 없다.

도 6d는 2종의 조작된 핵산이 스캐폴드를 형성하는, 도 6c에 대한 변형을 도시하며, 여기서 제1 조작된 핵산은 반복 핵산 서열 1a (도 6d, (623)-(624))와 반복 핵산 서열 1aC (도 6d, (629)-(630)) 사이의 수소 염기-쌍 결합 및 반복 핵산 서열 1b (도 6d, (625)-(626))와 반복 핵산 서열 1bC (도 6d, (627)-(628)) 사이의 수소 염기-쌍 결합을 통해 제2 조작된 핵산과 회합된다.

도 6e는 제1 조작된 핵산의 예를 도시하며, 여기서 제2 요소는 3'에서 5' 배향으로 링커 요소 핵산 서열 1-1 (도 6c, (608)-(623)), 반복 핵산 서열 1a1 (도 6c, (623)-(631)), 벌지 핵산 서열 (도 6e, (631)-(632)), 반복 핵산 서열 1a2 (도 6e, (632)-(624)), 링커 요소 핵산 서열 1-2 (도 6c, (624)-(625)), 반복 핵산 서열 1b1 (도 6d, (625)-(633)), 벌지 핵산 서열 1b1 (도 6e, (633)-(634)), 및 반복 핵산 서열 1b2 (도 6e, (634)-(626))를 추가로 포함한다. 반복 핵산 서열 1 내의 어떠한 핵산 서열도 부류 2 제II형 CRISPR-Cas 단백질에 결합할 수 있는 수소 결합을 통한 스템 요소를 형성하기 위해 반복 핵산 서열 1 내의 임의의 핵산 서열과 회합할 수 없다.

도 6f는 2종의 조작된 핵산이 스캐폴드를 형성하는, 도 6e에 대한 변형을 도시하며, 여기서 제1 조작된 핵산은 반복 핵산 서열 1a1 (도 6f, (623)-(631))과 반복 핵산 서열 1a1C (도 6f, (638)-(630)) 사이의 수소 염기-쌍 결합, 반복 핵산 서열 1a2 (도 6f, (632)-(624))와 반복 핵산 서열 1a2C (도 6f, (629)-(637)) 사이의 수소 염기-쌍 결합, 반복 핵산 서열 1b1 (도 6f, (625)-(633))과 반복 핵산 서열 1b1C (도 6f, (636)-(628)) 사이의 수소 염기-쌍 결합, 및 반복 핵산 서열 1b2 (도 6e, (634)-(626))와 반복 핵산 서열 1b2C (도 6e, (627)-(635)) 사이의 수소 염기-쌍 결합을 통해 제2 조작된 핵산과 회합된다.

도 6g는 도 6f에 도시된 NASC 폴리뉴클레오티드 조성물의 변형이다. 링커 요소 핵산 서열 1-2는 이펙터 단백질 결합 부위 핵산 서열 1 (도 6g, (647)-(648))의 삽입에 의해 변형되고, 링커 요소 핵산 서열 2-2는 이펙터 단백질 결합 부위 핵산 서열 2 (도 6g, (649)-(650))의 삽입에 의해 변형된다. 이펙터 단백질 결합 부위 핵산 서열 1 및 이펙터 단백질 결합 부위 핵산 서열 2는 연결되어 수소-결합된 염기 쌍을 통해 이펙터 단백질 결합 부위를 형성한다. 한 실시양태에서, 이펙터 단백질 결합 부위는 Csy4 결합 부위이다. Csy4 단백질의 효소적으로 불활성인 형태는 부위에 결합하여 NASC 폴리뉴클레오티드 조성물 구조를 추가로 안정화시킬 수 있다. Csy4 단백질의 효소적으로 불활성인 형태는 부위에 결합하여 NASC 폴리뉴클레오티드 조성물 구조를 (예를 들어, 엔도리보뉴클레아제 활성을 통해) 탈안정화시킨다 (예를 들어, NASC 폴리뉴클레오티드 조성물/핵산 결합 단백질-기반 폐쇄 케이지 구조의 파괴를 유도한다). 도 6k는 제1 부류 2 제II형 CRISPR-Cas9 오르토로그 단백질 및 제2 부류 2 제II형 CRISPR-Cas9 오르토로그 단백질과 회합하여 핵단백질 복합체를 형성할 수 있는 NASC 폴리뉴클레오티드 조성물을 도시한다. 도 6k는 NASC-PC1 및 NASC-PC2를 포함하는 NASC 폴리뉴클레오티드 조성물을 도시한다. NASC-PC1 (도 6k, IX)은 5'에서 3' 방향으로 하기를 포함한다: 핵산 표적 결합 서열 1; 반복 핵산 서열 1a, 반복 핵산 서열 1b, 반복 핵산 1c, 및 반복 핵산 1d를 포함하는 링커 핵산 서열 1; 및 에스. 써모필루스 부류 2 제II형 CRISPR-Cas9 핵산 결합 단백질 결합 서열 1. NASC-PC2 (도 6k, X)는 5'에서 3' 방향으로 하기를 포함한다: 핵산 표적 결합 서열 2; 반복 핵산 서열 1dC, 반복 핵산 서열 1cC, 반복 핵산 1bC, 및 반복 핵산 서열 1aC를 포함하는 링커 핵산 서열 1; 및 에스. 피오게네스 부류 2 제II형 CRISPR-Cas9 핵산 결합 단백질 결합 서열 1. NASC-PC1 및 NASC-PC2는 반복 핵산 서열 1a / 반복 핵산 서열 1aC, 반복 핵산 서열 1b / 반복 핵산 서열 1bC, 반복 핵산 서열 1c / 반복 핵산 1cC, 및 반복 핵산 서열 1d / 반복 핵산 1dC 사이의 수소-결합된 염기 쌍을 통해 연결되어 거대분자를 형성한다. 거대분자는 에스. 써모필루스 부류 2 제II형 CRISPR-Cas9 단백질 (반복 핵산 서열 1d / 반복 핵산 서열 1dC 영역 및 반복 핵산 서열 1c / 반복 핵산 서열 1cC 영역 주위) 및 에스. 피오게네스 부류 2 제II형 CRISPR-Cas9 단백질 (반복 핵산 서열 1b / 반복 핵산 서열 1bC 영역, 반복 핵산 서열 1a / 반복 핵산 서열 1aC 영역 주위)에 결합할 수 있다. 이러한 NASC 폴리뉴클레오티드 조성물/Cas9 오르토로그 단백질 복합체의 사용은 예를 들어 (어느 하나의 Cas9 오르토로그 단독을 포함하는 1종의 가이드 핵산/Cas9 단백질의 사용에 비해) Cas9 오르토로그 단백질 사이의 PAM 가변성을 고려하여 증가된 수의 이용가능한 표적 서열을 제공한다. 추가로, NASC 폴리뉴클레오티드 조성물/Cas9 오르토로그 단백질 복합체는 (어느 하나의 Cas9 오르토로그 단독을 포함하는 1종의 가이드 핵산/Cas9 단백질 복합체의 사용에 비해) Cas9 오르토로그 단백질 사이의 PAM 가변성을 고려하여 근처 표적 서열을 선택하는 데 있어서 더 큰 융통성을 제공함으로써 폴리뉴클레오티드 영역의 표적화의 특이성을 개선시킬 수 있다. 본 명세서의 교시를 고려하여, 관련 기술분야의 통상의 기술자는 본원에 기재된 NASC 폴리뉴클레오티드 조성물의 상이한 성분을 조합함으로써 2종 이상의 상이한 Cas9 오르토로그 단백질의 이러한 사용을 적용할 수 있다.

추가 실시양태에서, NASC-PC1 (도 6k, IX) 및 NASC-PC2 (도 6k, X)는 동일한 부류 2 제II형 CRISPR-Cas9 오르토로그 단백질과 회합할 수 있다 (예를 들어, 문헌 [Fonfara, I., et al., Nucleic Acids Research 42(4):2577-2590 (2014)] 참조). 이러한 실시양태에서, 반복 핵산 서열 1d / 반복 핵산 서열 1dC 영역, 및 반복 핵산 서열 1c / 반복 핵산 서열 1cC 영역은 에스. 뮤탄스 부류 2 제II형 CRISPR-Cas9 단백질과 회합할 수 있고, 또한 에스. 피오게네스 부류 2 제II형 CRISPR-Cas9 단백질과 회합할 수 있다. 반복 핵산 서열 1b / 반복 핵산 서열 1bC 영역, 및 반복 핵산 서열 1a / 반복 핵산 서열 1aC 영역은 에스. 피오게네스 부류 2 제II형 CRISPR-Cas9 단백질과 회합할 수 있고, 또한 에스. 뮤탄스 부류 2 제II형 CRISPR-Cas9 단백질과 회합할 수 있다. 예를 들어, NASC-PC1 (도 6k, IX) 및 NASC-PC2 (도 6k, X)의 반복 영역이 부류 2 제II형 CRISPR 유전자좌를 함유하는 상이한 종 (예를 들어, 에스. 피오게네스 또는 에스. 뮤탄스)으로부터 유래될지라도, 오직 1종의 부류 2 제II형 CRISPR-Cas9 단백질 (예를 들어, 에스. 피오게네스 부류 2 제II형 CRISPR-Cas9 단백질 또는 에스. 뮤탄스 부류 2 제II형 CRISPR-Cas9 단백질)이 NASC 폴리뉴클레오티드 조성물/Cas9 복합체를 형성하는 데 사용된다. 이러한 유형의 NASC 폴리뉴클레오티드 조성물의 1가지 이점은 동일한 NASC 폴리뉴클레오티드 조성물과 2종의 Cas9 단백질 중 어느 하나를 사용하는 융통성이고, 각각의 Cas9 단백질은 상이한 PAM 서열을 인식한다. 따라서, NASC 폴리뉴클레오티드 조성물에 의해 표적화될 수 있는 가능한 결합 부위의 수는 증가된다.

본 발명의 제2 측면의 일부 실시양태에서, NASC 폴리뉴클레오티드 조성물은 적어도 3종의 폴리뉴클레오티드를 포함하며, 여기서 복합체는 반복 요소 1C에 연결된 반복 요소 1, 반복 요소 2C에 연결된 반복 요소 2, 반복 요소 3C에 연결된 반복 요소 3, 이중-가닥 핵산 결합 단백질 결합 요소 1 스페이서 요소 1, 스페이서 요소 2, 및 스페이서 요소 3을 포함하며, 여기서 NASC 폴리뉴클레오티드 조성물은 3종의 핵산 결합 단백질에 결합할 수 있다. 일부 실시양태에서, 핵산 결합 단백질은 이중-가닥 핵산 결합 단백질이다. 바람직한 실시양태에서, 핵산 결합 단백질은 부류 2 CRISPR-Cas 단백질이다.

표 5는 도 6h 및 도 6i에 사용되는 일련의 추가의 식별자를 제시한다.

표 5

¹ = 반복 요소는 이펙터 단백질 결합 부위를 포함할 수 있다

² = "C"는 상보적 서열을 나타낸다

도 6h는 3종의 조작된 핵산이 스캐폴드를 형성하는, 도 6c에 대한 변형을 도시하며, 여기서 제1 조작된 핵산 (도 6h, I)은 반복 핵산 서열 1b (도 6h, (625)-(626))와 반복 핵산 서열 1bC (도 6h, (627)-(628)) 사이의 수소 염기-쌍 결합을 통해 제2 조작된 핵산 (도 6h, II)과 회합되고, 제2 조작된 핵산 (도 6h, II)은 반복 핵산 서열 2a (도 6h, (638)-(639))와 반복 핵산 서열 2aC (도 6h, (642)-(643)) 사이의 수소 염기-쌍 결합을 통해 제3 조작된 핵산 (도 6h, III)과 회합되고, 제3 조작된 핵산 (도 6h, III)은 반복 핵산 서열 1aC (도 6h, (644)-(645))와 반복 핵산 서열 1a (도 6h, (623)-(624)) 사이의 수소 염기-쌍 결합을 통해 제1 조작된 핵산 (도 6h, I)과 회합된다.

도 6i는 3종의 조작된 핵산이 도 6e에 기재된 조작된 핵산을 사용하는 스캐폴드를 형성하는, 도 6e에 대한 변형을 도시하며, 여기서 제1 조작된 핵산 (도 6i, IV)은 반복 서열 사이의 수소 염기-쌍 결합을 통해 제2 조작된 핵산 (도 6i, V)과 회합되고, 제2 조작된 핵산 (도 6i, V)은 반복 서열 사이의 수소 염기-쌍 결합을 통해 제3 조작된 핵산 (도 6i, VI)과 회합되고, 제3 조작된 핵산 (도 6i, VI)은 반복 서열 사이의 수소 염기-쌍 결합을 통해 제1 조작된 핵산 (도 6i, IV)과 회합된다.

도 6j는 부류 2 제II형 CRISPR-Cas 단백질 및 부류 2 제V형 CRISPR-Cpf1 단백질과 회합하여 핵단백질 복합체를 형성할 수 있는 NASC 폴리뉴클레오티드 조성물을 도시한다.

도 6j는 부류 2 제II형 CRISPR-Cas9 단백질 및 부류 2 제V형 CRISPR-Cpf1 단백질과 회합하여 핵단백질 복합체를 형성할 수 있는 NASC 폴리뉴클레오티드 조성물을 도시한다. 도 6j는 스페이서 요소 1 및 스페이서 요소 2를 포함하는 NASC-PC1 (NASC-PC-2TS; 도 6j, VII)을 포함하는 NASC 폴리뉴클레오티드 조성물을 도시한다. NASC-PC-2TS는 5'에서 3' 방향으로 하기를 포함한다: 부류 2 제II형 CRISPR-Cas9 핵산 표적 결합 서열 1; 반복 핵산 서열 1a, 반복 핵산 서열 1b, 및 반복 핵산 서열 1c를 포함하는 링커 핵산 서열 1; 및 부류 2 제V형 CRISPR-Cpf1 핵산 표적 결합 서열 1. NASC 폴리뉴클레오티드 조성물은 부류 2 제II형 CRISPR-Cas9 핵산 결합 단백질 결합 서열 1 및 부류 2 제V형 CRISPR-Cpf1 핵산 결합 단백질 결합 서열 2를 포함하는 연쇄를 포함하는 NASC-PC2 (NASC-PC-CE; 도 6j, VIII)를 추가로 포함한다. NASC-PC-CE는 반복 핵산 서열 1aC, 반복 핵산 서열 1bC, 및 반복 핵산 서열 1cC를 추가로 포함하며 이를 통해 NASC-PC-CE가 수소-결합된 염기 쌍을 통해 NASC-PC-2TS에 연결되어 부류 2 제II형 CRISPR-Cas9 단백질 및 부류 2 제V형 CRISPR-Cpf1 단백질에 결합할 수 있는 거대분자를 형성한다. 이러한 NASC 폴리뉴클레오티드 조성물/Cas9 단백질/Cpf1 단백질 복합체의 사용은 예를 들어 (Cas9 단백질 또는 Cpf1 단백질 단독을 포함하는 1종의 가이드 핵산/Cas 단백질 복합체의 사용에 비해) Cas9 단백질과 Cpf1 단백질 사이의 PAM 가변성 및 표적 서열 길이 차이를 고려하여 증가된 수의 이용가능한 표적 서열을 제공한다. 게다가, NASC 폴리뉴클레오티드 조성물/Cas9 단백질/Cpf1 단백질 복합체는 (Cas9 단백질 또는 Cpf1 단백질 단독을 포함하는 1종의 가이드 핵산/Cas 단백질 복합체의 사용에 비해) Cas9 단백질과 Cpf1 단백질 사이의 PAM 가변성 및 표적 서열 길이를 고려하여 근처 표적 서열을 선택하는 데 있어서 더 큰 융통성을 제공함으로써 폴리뉴클레오티드 영역의 표적화의 특이성을 개선시킬 수 있다. 본 명세서의 교시를 고려하여, 관련 기술분야의 통상의 기술자는 본원에 기재된 NASC 폴리뉴클레오티드 조성물의 상이한 성분을 조합함으로써 2종 이상의 상이한 Cas 단백질의 이러한 사용을 적용할 수 있다.

다른 실시양태에서, 쌍의 제1 반복 핵산 서열은 제1 친화성 태그를 추가로 포함하고, 쌍의 제2 반복 핵산 서열은 제2 친화성 태그를 추가로 포함하고, 제1 친화성 태그는 제2 친화성 태그와 연결된다. 예를 들어, 반복 핵산 서열 1은 이펙터 단백질 결합 부위 핵산 서열 1을 추가로 포함하고, 반복 핵산 서열 2는 이펙터 단백질 결합 부위 핵산 서열 2를 추가로 포함하고, 이펙터 결합 부위 1은 이펙터 단백질 결합 부위 핵산 서열 1과 이펙터 단백질 결합 부위 핵산 서열 2 사이의 수소 염기-쌍 결합에 의해 형성된다. 이펙터 결합 부위의 한 예는 Csy4 단백질 결합 부위이다.

본 발명의 제3 측면에서, NASC 폴리뉴클레오티드 조성물은 조작된 연쇄된 핵산 성분 ("NASC-PC-CT") 및 적어도 NASC-PC1 및 NASC-PC2를 포함한다.

본 발명의 제3 측면의 한 실시양태에서, 조작된 NASC 폴리뉴클레오티드 연쇄된 요소 (NASC-PC-CE)는 3'에서 5' 방향으로 하기를 포함한다: 핵산 결합 단백질 결합 요소 1을 포함하는 제1 연쇄 요소 1, 및 반복 요소 A1을 포함하는 제2 연쇄 요소 1 (여기서 반복 요소 A1은 반복 핵산 서열 A1을 포함함); 핵산 결합 단백질 결합 요소 2를 포함하는 제1 연쇄 요소 2; 및 반복 요소 2를 포함하는 제2 연쇄 요소 2 (여기서 반복 요소 2는 반복 핵산 서열 A2를 포함함). 제1 연쇄 요소 1은 제2 연쇄 요소 1와 연결되고, 제2 연쇄 요소 1은 제1 연쇄 요소 2와 연결되고, 제1 연쇄 요소 2는 제2 연쇄 성분 2와 연결되어 NASC-PC-CE를 형성한다.

제3 연쇄 요소 1 (NASC-PC-CE3-1)은 3'에서 5' 방향으로 반복 핵산 서열 A1C를 포함하는 반복 요소 A1C, 및 핵산 표적 결합 서열 1을 포함하는 스페이서 요소 1을 포함한다. 제3 연쇄 요소 2 (NASC-PC-CE3-2)는 3'에서 5' 방향으로 반복 핵산 서열 A2C를 포함하는 반복 요소 A2C, 및 핵산 표적 결합 서열 2를 포함하는 스페이서 요소 2를 포함한다. 반복 핵산 서열 A1은 반복 핵산 서열 A1-C와 연결되고, 반복 핵산 서열 A2는 반복 핵산 서열 A2-C와 연결되어 NASC-PC-CE를 형성한다.

제1 핵산 결합 단백질은 핵산 결합 단백질 결합 요소 1에 결합할 수 있고, 제2 핵산 결합 단백질은 핵산 결합 단백질 결합 요소 2에 결합할 수 있다. 일부 실시양태에서, 핵산 결합 단백질 결합 요소는 이중-가닥 핵산 결합 단백질에 결합하는 이중-가닥 핵산 결합 단백질 결합 요소이다.

추가의 실시양태에서, 쌍의 제1 반복 핵산 서열은 수소-결합된 염기 쌍을 통해 쌍의 제2 반복 핵산 서열과 연결된다.

도 7a, 도 7b, 도 7c, 도 7d, 도 7e, 도 7f, 도 7g, 도 7h 및 도 7i는 본 발명의 조작된 연쇄된 핵산 스캐폴드의 요소 및 예를 도시한다.

표 6은 도 7a, 도 7b, 도 7c, 도 7d, 도 7e, 도 7f, 도 7g, 도 7h 및 도 7i에서 일관되게 사용되는 일련의 식별자를 제시한다.

표 6

¹ = 반복 요소는 이펙터 단백질 결합 부위를 포함할 수 있다

² = "C"는 상보적 서열을 나타낸다

³ = "n"은 대향하는 가닥 서열 (예를 들어, A2-1/A2-1n)을 나타낸다

각각의 제1, 제2 및 제3 요소는 추가의 핵산 서열, 예를 들어, 요소의 5', 요소의 3', 또는 요소의 5'과 요소의 3' 둘 다를 포함할 수 있다.

도 7a, (700)-(717)은 부류 2 제II형 CRISPR 결합 단백질 서열 (도 7a, (700)-(706))을 포함하는 제1 연쇄 요소 1, 반복 핵산 서열 A1을 포함하는 제2 연쇄 요소 1 (도 7a, (707)-(708)), 부류 2 제II형 CRISPR 결합 단백질 서열 (도 7a, (710)-(714))를 포함하는 제1 연쇄 요소 2 (도 7a, (709)-(714)), 반복 핵산 서열 A2 (도 7a, (715)-(716))를 포함하는 제2 연쇄 요소 2 (도 7a, (715)-(717)), 및 반복 핵산 서열 A1C (도 7a, (718)-(719)) 및 핵산 표적 결합 서열 1 (도 7a, (720)-(721))을 포함하는 제3 연쇄 요소 1 (NASC-PC-CE3-1; 도 7a, (718)-(721)), 및 반복 핵산 서열 A2C (도 7a, (722)-(723)) 및 핵산 표적 결합 서열 2 (도 7a, (724)-(725))를 포함하는 제3 연쇄 요소 2 (NASC-PC-CE3-2; 도 7a, (722)-(725))를 포함하는 NASC-PC-CE의 예를 도시한다. 반복 핵산 서열 중 1개 이상은 부류 II 제II형 CRISPR 단백질 결합 서열 (예를 들어, Cas9 단백질 결합 서열)이다. 반복 핵산 서열 A1은 반복 핵산 서열 A1C에 연결된다. 한 실시양태에서, 반복 핵산 서열 A1은 반복 핵산 서열에 수소-결합된 염기 쌍을 통해 연결된다.

도 7b는 반복 핵산 서열 A1 (도 7a, (707)-(708))과 반복 핵산 서열 A1C (도 7a, (718)-(719)) 사이의 수소 염기-쌍 결합을 통한 제3 연쇄 요소 1 (도 7a, (718)-(721))과 NASC-PC-CE (도 7a, (700)-(717))의 회합, 및 반복 핵산 서열 A2 (도 7a, (715)-(716))와 반복 핵산 서열 A2C (도 7a, (722)-(723)) 사이의 수소 염기-쌍 결합을 통한 제3 연쇄 요소 2 (도 7a, (722)-(725))와 NASC-PC-CE (도 7a, (700)-(717))의 회합을 통한 스캐폴드의 형성의 예를 도시한다.

도 7c는 NASC-PC-CE의 변형을 도시하며, 여기서 NASC-PC-CE (도 7a, (700)-(717))는 반복 핵산 서열 A1-1 (도 7c, (726)-(727)), 벌지 핵산 서열 A1-1 (도 7c, (727)-(728)), 반복 핵산 서열 A1-2 (도 7c, (728)-(729)) 및 반복 핵산 서열 A2-1 (도 7c, (731)-(732)), 벌지 핵산 서열 A2-1 (도 7c, (732)-(733)), 및 반복 핵산 서열 A2-2 (도 7c, (733)-(734))를 추가로 포함한다. 제3 연쇄 요소 1 (도 7c, (718)-(721))은 반복 핵산 서열 A1-1C (도 7c, (719)-(736)), 벌지 핵산 서열 A1-1 (도 7c, (736)-(737)), 및 반복 핵산 서열 A1-2C (도 7c, (737)-(748))를 추가로 포함한다. 제3 연쇄 요소 2 (도 7c, (722)-(725))는 반복 핵산 서열 A2-1C (도 7c, (723)-(739)), 벌지 핵산 서열 A2-1 (도 7c, (739)-(740)), 및 반복 핵산 서열 A2-2C (도 7c, (740)-(741))를 추가로 포함한다.

도 7d는 반복 핵산 서열 A1-1 (도 7c, (726)-(727))과 반복 핵산 서열 A1-1C (도 7c, (719)-(736)) 사이의 수소 염기-쌍 결합 및 반복 핵산 서열 A1-2 (도 7c, (728)-(729))와 반복 핵산 서열 A1-2C (도 7c, (737)-(748)) 사이의 수소 염기-쌍 결합을 통한 제3 연쇄 요소 1 (도 7d, (721)-(718))과 NASC-PC-CE (도 7d, (700)-(717))의 회합; 반복 핵산 서열 A2-1 (도 7c, (731)-(732))과 반복 핵산 서열 A2-1C (도 7c, (723)-(739)) 사이의 수소 염기-쌍 결합, 및 반복 핵산 서열 A2-2 (도 7c, (733)-(734))와 반복 핵산 서열 A2-2C (도 7c, (740)-(741)) 사이의 수소 염기-쌍 결합을 통한 제3 연쇄 요소 2 (도 7c, (722)-(725))와 조작된 연쇄된 요소 1 (도 7d, (700)-(717))의 회합을 통한 스캐폴드의 형성의 예를 도시한다.

도 7e는 원형 NASC-PC-CE를 포함하는 스캐폴드를 제조하도록 조작된 4종의 핵산 서열로부터 형성된 복합체의 예를 제시한다. 이 도면에서, NASC-PC-CE는 5' 말단에서 3' 말단으로 연결되어 원형 NASC-PC-CE를 형성하는, 도 7d, (700)-(717)에 제시된 NASC-PC-CE의 2개 카피를 포함한다. 이 도면에서, 도 7d에 대한 참조 번호는 원형 연쇄된 핵산 요소의 성분을 도시하는 것을 돕기 위해 제시된다.

도 7f는 도 7d에 제시된 예에 대한 변형의 도시이며, 여기서 NASC-PC-CE (도 7f, (700)-(717))는 5' 말단 (도 7f, (700)-(744))에 공유 연결된 제1 연쇄 요소 3 (도 7f, (717)-(744))을 추가로 포함한다. 제2 연쇄 요소 3은 제1 연쇄 요소 3 (도 7f, (743)-(744))과 회합된다.

도 7g는 도 7f에 도시된 NASC-PC-CE (도 7f, (700)-(744))에 대한 변형의 예를 도시하며, 여기서 NASC-PC-CE는 5' 말단 (도 7f, (700)-(747))에 공유 연결된 제4 연쇄 요소 (도 7g, (744)-(747))를 포함한다. 이 도면에서, 영역, 도 7g, (744)-(745)는 도 7h 및 도 7i의 교차선을 보다 명백하게 하는 백색 박스로서 도시된다. 이 영역은 또한 링커 요소 핵산 서열을 포함할 수 있다.

도 7h, (700)-(747)은 NASC-PC-CE의 예를 도시하며, 여기서 제2 연쇄 요소 1 (도 7h, (707)-(708))은 수소 염기-쌍 결합을 통해 제3 연쇄 요소 1 (도 7h, (744)-(747))과 회합된다.

도 7i는 도 7h에 제시된 예에 대한 변형을 도시하며, 여기서 제3 연쇄된 요소 I은 수소 염기-쌍 결합을 통해 NASC-PC-CE와 회합하여 요소 III (도 7i, III)을 형성하고, 제4 연쇄 요소는 수소 염기-쌍 결합을 통해 NASC-PC-CE와 회합하여 요소 IV (도 7i, IV)를 형성한다.

본 발명의 제3 측면의 다른 실시양태에서, NASC-PC-CE는 스플릿-넥서스 폴리뉴클레오티드를 포함한다.

도 8a, 도 8b, 도 8c, 도 8d, 도 8e, 도 8f, 도 8g, 도 8h, 도 8i, 도 8j, 도 8k, 도 8l, 도 8m 및 도 8n은 본 발명의 조작된 연쇄된 스플릿-넥서스 핵산 스캐폴드의 요소 및 예를 도시한다.

표 7은 도 8a 내지 8n에서 일관되게 사용되는 일련의 식별자를 제시한다.

표 7

¹ = 반복 요소는 이펙터 단백질 결합 부위를 포함할 수 있다

² = "C"는 상보적 서열을 나타낸다

도 8a는 스플릿-넥서스 Cas9-회합된 폴리뉴클레오티드의 예를 도시한다. 도 2b는 Cas9-회합된 단일-가이드 폴리뉴클레오티드의 예를 제시한다. 도 8a의 스플릿-넥서스 Cas9-회합된 폴리뉴클레오티드는 Cas9-회합된 단일-가이드 폴리뉴클레오티드의 넥서스 요소 (도 2b, (206)) 내의 폴리뉴클레오티드 백본을 분할함으로써 생성된다. 도 8a는 수소 결합 상호작용을 통해 회합되지 않은 경우의 2종의 생성된 스플릿-넥서스 폴리뉴클레오티드를 보여준다. 도 8b는 수소 결합 상호작용을 통해 회합된 경우의 스플릿-넥서스 폴리뉴클레오티드의 모습을 제시한다. 수소 결합 상호작용의 영역은 도 8b에서 파선 박스로 도시된다.

도 8c는 스플릿-넥서스 Cas9-회합된 폴리뉴클레오티드의 또 다른 예를 예시한다. 도 2a는 Cas9-회합된 단일-가이드 폴리뉴클레오티드의 예를 제시한다. 도 8c의 스플릿-넥서스 Cas9-회합된 폴리뉴클레오티드는 Cas9-회합된 단일-가이드 폴리뉴클레오티드의 넥서스 요소 (도 2a, (206)) 내의 폴리뉴클레오티드 백본을 분할함으로써 생성된다. 도 8c는 수소 결합 상호작용을 통해 회합되지 않은 경우의 2종의 생성된 스플릿-넥서스 폴리뉴클레오티드를 보여준다. 도 8d는 수소 결합 상호작용을 통해 회합된 경우의 스플릿-넥서스 폴리뉴클레오티드의 모습을 제시한다. 수소 결합 상호작용의 영역은 도 8d에서 파선 박스로 도시된다.

도 8e는 도 8a에 도시된 스플릿-넥서스 Cas9-회합된 폴리뉴클레오티드에 대한 보조 폴리뉴클레오티드의 추가를 예시한다. 이 도면에서, 제1 보조 폴리뉴클레오티드 (도 8e, (803)-(817))의 5' 말단은 스플릿-넥서스 요소 (도 8e, (803))의 한 절반의 3' 말단에 공유 부착되고, 제2 보조 폴리뉴클레오티드 (도 8e, (802)-(816))의 3' 말단은 스플릿-넥서스 요소 (도 8e, (802))의 다른 절반의 5' 말단에 공유 부착된다. 일부 실시양태에서, 오직 1종의 보조 폴리뉴클레오티드만이 포함된다. 다른 실시양태에서, 동일한 또는 상이한 길이의 2종의 보조 폴리뉴클레오티드가 포함된다. 도 8e는 수소 결합 상호작용을 통해 회합되지 않은 경우의 2종의 스플릿-넥서스 폴리뉴클레오티드를 보여준다.

도 8f는 수소 결합 상호작용을 통해 회합되지 않은 경우의 스플릿-넥서스 폴리뉴클레오티드의 모습을 제시한다. 수소 결합 상호작용의 영역은 도 8d, (803)-(804)/(801)-(802)에서 파선 박스로 도시된다. 보조 폴리뉴클레오티드는 추가의 요소 예컨대 이펙터 단백질 결합 서열을 포함할 수 있으며, 예를 들어, 이중-가닥 핵산 결합 단백질 결합 부위는 수소 결합 상호작용을 통해 2종의 보조 폴리뉴클레오티드의 회합에 의해 생성될 수 있다 (예를 들어, 이러한 수소 결합 상호작용의 영역은 도 8d, (818)-(819)-(804)/(814)-(815)에서 파선 박스로 도시된다).

도 8g는 도 8c에 도시된 스플릿-넥서스 Cas9-회합된 폴리뉴클레오티드에 대한 보조 폴리뉴클레오티드의 추가의 또 다른 예를 도시한다. 이 도면에서, 제1 보조 폴리뉴클레오티드 (도 8g, (803)-(817))의 5' 말단은 스플릿-넥서스 요소 (도 8e, (803))의 절반의 3' 말단에 공유 부착되고, 제2 보조 폴리뉴클레오티드 (도 8g, (802)-(816))의 3' 말단은 스플릿-넥서스 요소 (도 8g, (802))의 절반의 5' 말단에 공유 부착된다. 일부 실시양태에서, 오직 1종의 보조 폴리뉴클레오티드만이 포함된다. 다른 실시양태에서, 동일한 또는 상이한 길이의 2종의 보조 폴리뉴클레오티드가 포함된다. 도 8g는 수소 결합 상호작용을 통해 회합되지 않은 경우의 2종의 스플릿-넥서스 폴리뉴클레오티드를 보여준다. 도 8h는 수소 결합 상호작용을 통해 회합되지 않은 경우의 스플릿-넥서스 폴리뉴클레오티드의 모습을 제시한다. 수소 결합 상호작용의 영역은 도 8h, (803)-(804)/(801)-(802)에서 파선 박스로 도시된다. 보조 폴리뉴클레오티드는 추가의 요소 예컨대 이펙터 단백질 결합 서열을 포함할 수 있으며, 예를 들어, 이중-가닥 핵산 결합 단백질 결합 부위는 수소 결합 상호작용을 통해 2종의 보조 폴리뉴클레오티드의 회합에 의해 생성될 수 있다 (예를 들어, 이러한 수소 결합 상호작용의 영역은 도 8h, (818)-(819)-(804)/(814)-(815)에서 파선 박스로 도시된다).

한 실시양태에서, 본 발명의 제3 측면은 3'에서 5' 방향으로, 핵산 결합 단백질 결합 요소 1, 스플릿-넥서스 스템 요소 핵산 서열 1-1, 및 반복 핵산 서열 1-1을 포함하는 반복 요소를 포함하는 제1 연쇄 요소 1 (NASC-PC-SCE1-1), 및 핵산 결합 단백질 결합 요소 2, 스플릿-넥서스 스템 요소 핵산 서열 2-1, 및 반복 핵산 서열 2-1을 포함하는 반복 요소를 포함하는 제2 연쇄 요소 1 (NASC-PC-SCE1-2)을 포함하는 조작된 NASC 스플릿-넥서스 폴리뉴클레오티드 연쇄된 요소 (NASC-PC-SCE) 폴리뉴클레오티드 조성물에 관한 것이다. NASC-PC-SCE1-1 및 NASC-PC-SCE1-2는 연결되어 NASC-PC-SCE를 형성한다. 제2 연쇄 요소 1 (NASC-PC-SCE2-1)은 3'에서 5' 방향으로, 반복 핵산 서열 1-2, 스플릿-넥서스 스템 요소 핵산 서열 1-2 및 제1 스템 요소를 포함하는 반복 요소 1, 및 핵산 표적 결합 서열 1을 포함하는 스페이서 요소 1을 포함한다. 제2 연쇄 요소 2 (NASC-PC-SCE2-2)는 3'에서 5' 방향으로, 반복 핵산 서열 2-2, 스플릿-넥서스 스템 요소 핵산 서열 2-2 및 제1 스템 요소를 포함하는 반복 요소 2, 및 핵산 표적 결합 서열 2를 포함하는 스페이서 요소 2를 포함한다.

반복 요소 1-1은 반복 요소 1-2에 연결되고, 반복 요소 2-1은 반복 요소 2-2에 연결되어 NASC-PC-SCE를 형성하고, NASC-PC-SCE는 2종의 핵산 결합 단백질에 결합할 수 있다. 일부 실시양태에서, 핵산 결합 단백질 결합 요소는 이중-가닥 핵산 결합 단백질에 결합하는 이중-가닥 핵산 결합 단백질 결합 요소이다. 추가의 실시양태에서, 쌍의 제1 반복 핵산 서열은 수소-결합된 염기 쌍을 통해 쌍의 제2 반복 핵산 서열에 연결된다.

도 8i는 스캐폴드를 형성하는, 도 8b, (800)-(802)에 제시된 스플릿-넥서스 폴리뉴클레오티드의 2개 카피를 포함하는 NASC-PC-SCE의 예를 제시한다. 이 도면에서, NASC-PC-SCE는 보조 폴리뉴클레오티드 (도 8i, (802)-(816))를 통해 제2 스플릿-넥서스 폴리뉴클레오티드 (도 8i, (816)-(821))에 공유 부착된 제1 스플릿-넥서스 폴리뉴클레오티드 (도 8i, (800)-(802))이다. 스플릿-넥서스 요소의 각각의 제1 절반 (도 8i, (801)-(802) 및 (820)-(821))은, 예를 들어 수소-결합된 염기 쌍을 통해 그의 스플릿-넥서스 요소의 상보적 제2 절반 (각각 도 8i, (803)-(804) 및 (822)-(823))과 연결된다.

도 8j는 스캐폴드를 형성하는, 도 8d, (800)-(802)에 제시된 스플릿-넥서스 폴리뉴클레오티드의 2개 카피를 포함하는 NASC-PC-SCE의 예를 제시한다. 이 도면에서, NASC-PC-SCE는 보조 폴리뉴클레오티드 (도 8j, (802)-(816))를 통해 제2 스플릿-넥서스 폴리뉴클레오티드 (도 8j, (816)-(821))에 공유 부착된 제1 스플릿-넥서스 폴리뉴클레오티드 (도 8j, (800)-(802))이다. 스플릿-넥서스 요소의 각각의 제1 절반 (도 8j, (801)-(802) 및 (820)-(821))은, 예를 들어 수소-결합된 염기 쌍을 통해 그의 스플릿-넥서스 요소의 상보적 제2 절반 (각각 도 8j, (803)-(804) 및 (822)-(823))과 연결된다.

도 8k는 스캐폴드를 형성하는, 각각 보조 서열을 포함하는, 도 8f, (800)-(816)에 제시된 스플릿-넥서스 폴리뉴클레오티드의 2개 카피를 포함하는 NASC-PC-SCE의 예를 제시한다. 이 도면에서, NASC-PC-SCE는 보조 폴리뉴클레오티드 (도 8j, (802)-(816))를 통해 제2 스플릿-넥서스 폴리뉴클레오티드 (도 8j, (816)-(835))에 공유 부착된 제1 스플릿-넥서스 폴리뉴클레오티드 (도 8k, (800)-(816))이다. 스플릿-넥서스 요소의 각각의 제1 절반 (도 8k, (801)-(802) 및 (820)-(821))은 그의 스플릿-넥서스 요소의 상보적 제2 절반 (각각 도 8k, (803)-(804) 및 (822)-(823))과 연결되고, 또한 보조 서열 (도 8k, (802)-(815) 및 (803)-(818); 도 8k, (821)-(834) 및 (822)-(836))에 의해 연결된다. 연결은 예를 들어 수소-결합된 염기 쌍을 통해 이루어진다.

도 8l은 스캐폴드를 형성하는, 각각 보조 서열을 포함하는, 도 8h, (800)-(816)에 제시된 스플릿-넥서스 폴리뉴클레오티드의 2개 카피를 포함하는 NASC-PC-SCE의 예를 제시한다. 이 도면에서, NASC-PC-SCE는 보조 폴리뉴클레오티드 (도 8h, (802)-(816))를 통해 제2 스플릿-넥서스 폴리뉴클레오티드 (도 8h, (816)-(835))에 공유 부착된 제1 스플릿-넥서스 폴리뉴클레오티드 (도 8h, (800)-(816))이다. 스플릿-넥서스 요소의 각각의 제1 절반 (도 8h, (801)-(802) 및 (820)-(821))은 그의 스플릿-넥서스 요소의 상보적 제2 절반 (각각 도 8h, (803)-(804) 및 (822)-(823))과 연결되고, 또한 보조 서열 (도 8h, (802)-(815) 및 (803)-(818); 도 8k, (821)-(834) 및 (822)-(836))에 의해 연결된다. 연결은 예를 들어 수소-결합된 염기 쌍을 통해 이루어진다. NASC-PC-SCE의 2종의 성분은 이 도면에서 I 및 II로서 표시된다.

도 8m은 도 8l에 제시된 요소 I 및 II를 포함하는 NASC-PC-SCE의 예를 제시한다. NASC-PC-SCE는 원형 NASC-PC-SCE를 포함한다. 이 도면에서, 도 8l, (800)-(835)에 제시된 2개 세트의 요소 I 및 II는 5' 말단에서 3' 말단으로 연결되어 원형 NASC-PC-SCE를 형성한다. 이 도면에서, 도 8l에 대한 참조 번호는 원형 NASC-PC-SCE의 성분을 도시하는 것을 돕기 위해 제시된다.

도 8n은 제1 스템 요소 핵산 서열이 루프 요소 핵산 서열 (예를 들어, 도 8l, (806)-(807), (825)-(826) 참조)에 의해 연결되지 않는 것을 제외하고, 도 8l에 제시된 바와 같은 요소 I 및 II를 포함하는 NASC-PC-SCE의 예를 제시한다. NASC-PC-SCE는 원형 NASC-PC-SCE를 포함한다.

다른 실시양태에서, 쌍의 제1 반복 핵산 서열은 제1 친화성 태그를 추가로 포함하고, 쌍의 제2 반복 핵산 서열은 제2 친화성 태그를 추가로 포함하고, 제1 친화성 태그는 제2 친화성 태그와 연결된다. 예를 들어, 제1 반복 핵산 서열은 이펙터 단백질 결합 부위 핵산 서열 1을 추가로 포함하고, 제2 반복 핵산 서열은 이펙터 단백질 결합 부위 핵산 서열 2를 추가로 포함한다. 이펙터 단백질 결합 부위 핵산 서열 1은 수소-결합된 염기 쌍에 의해 이펙터 단백질 결합 부위 핵산 서열 2에 연결되어 이펙터 단백질 결합 부위 1을 형성한다. 이펙터 결합 부위의 한 예는 Csy4 단백질 결합 부위이다.

본 발명의 제4 측면에서, NASC 폴리뉴클레오티드 조성물은 2종 이상의 상이한 핵산 결합 단백질에 대한 핵산 결합 단백질 결합 요소의 조합을 포함한다. 일부 실시양태에서, 핵산 결합 단백질 결합 요소 중 1개 이상은 이중-가닥 핵산 결합 단백질 (예를 들어, 부류 2 CRISPR-Cas 단백질)에 결합하는 이중-가닥 핵산 결합 단백질 결합 요소이다. 본 발명의 제4 측면의 실시양태는 NASC 폴리뉴클레오티드 조성물을 형성하기 위해 제2 NATNA에 공유 연결된 제1 NATNA를 포함한다. 일부 실시양태에서, 제1 NATNA는 제2 NATNA에 연결되어 NASC-PC 성분을 형성하고, 2종 이상의 NASC-PC 성분은 공유 또는 비-공유 연결되어 NASC 폴리뉴클레오티드 조성물을 형성한다. NASC 폴리뉴클레오티드 조성물은 적어도 2종의 핵산 결합 단백질에 결합할 수 있다. 비-공유 연결은 수소-결합된 염기 쌍을 통해 NASC-PC 성분을 연결하는 것을 포함한다.

도 9a는 (i) 도 5d, I, (500)-(507)에 제시된 조작된 핵산 서열의 카피 (도 9a, I), 및 (ii) 도 2a에 제시된 단일-가이드 폴리뉴클레오티드에 상응하는 조작된 핵산 서열을 가지며, 단일-가이드 폴리뉴클레오티드의 3' 말단에 공유 부착된 링커 요소 핵산 서열을 추가로 포함하는 카피 (도 9a, II)를 포함하며, 여기서 링커 요소 핵산 서열은 도 5d, I, (500)-(507)에 제시된 조작된 핵산 서열의 5' 말단에 공유 부착되어 스캐폴드를 형성하는 것인, NASC 폴리뉴클레오티드 조성물을 형성하기 위해 연결된 2종의 NATNA의 예를 제시한다.

도 9b는 도 9a에 제시된 성분의 2개 세트의 복합체의 예를 제시한다. 이 도면에서, 도 9a, I 및 II에 대한 참조 번호는 성분을 도시하는 것을 돕기 위해 제시된다. 게다가, 도 9a, III은 도 5d에 제시된 복합체에 대한 도 9a의 복합체의 코어 구조의 비교를 용이하게 하기 위해 제공된다.

도 10은 스캐폴드를 형성하는 다수의 상이한 조작된 핵산 서열의 복합체를 제시한다. 이 도면에서, 참조 번호는 스캐폴드의 성분을 도시하는 것을 돕기 위해 제공된다: 도 10, I을 도 7f와 비교하고; 도 10, II를 도 6h와 비교하고; 도 10, III을 도 8l과 비교하고; 도 10, IV를 도 9a와 비교하며, 여기서 I 및 II는 공유 연결 대신에 수소-결합된 염기 쌍을 통해 연결되고; 도 10, V를 도 5h와 비교한다.

NASC 폴리뉴클레오티드 조성물의 1종 이상의 폴리뉴클레오티드 성분 사이의 이러한 유형의 연결은 예를 들어 공유 연결 및 비-공유 연결을 포함한다.

비-공유 연결의 한 예는 수소 결합이다. 수소 결합의 유형은 상기 논의된다. 본 발명의 실시양태는 수소-결합된 뉴클레오티드의 쌍에서의 수소 결합의 하기 유형을 포함하나 이에 제한되지는 않는다: W-C 수소 결합, 역 W-C 수소 결합, 후그스틴 수소 결합, 역 후그스틴 수소 결합, 워블 수소 결합, 역 워블 수소 결합, 또는 그의 조합.

NASC 폴리뉴클레오티드 성분은 특히 연결이 수소-결합된 염기 쌍을 통한 것인 경우에 전형적으로 쌍형성된 반복 요소가 서로 연결되는 것으로 의도되도록 설계되고, 오직 쌍형성된 반복 요소 사이에 연결 (예를 들어, 수소 결합)을 형성한다. 2개의 반복 요소 연결을 방해하는 각각의 반복 요소 내의 내부 구조의 형성은 전형적으로 회피된다. 게다가, 성분 NASC 폴리뉴클레오티드의 반복 요소 및 다른 영역 사이의 연결 (예를 들어, 수소-결합된 염기 쌍의 형성)은 또한 회피된다.

공유 연결 및 비-공유 연결에 더하여, 리간드/리간드 결합 모이어티 쌍형성 및/또는 가교를 포함하나 이에 제한되지는 않는 NASC 폴리뉴클레오티드 조성물의 1종 이상의 폴리뉴클레오티드 성분 사이의 다른 유형의 연결이 사용될 수 있다. 리간드/리간드 결합 모이어티 쌍형성은 선택된 핵산 서열 및 상응하는 압타머; 및 핵산 2차 구조/소분자, 이온, 또는 핵산 2차 구조에 결합하는 단백질을 포함하나 이에 제한되지는 않는다. 전형적으로, NASC 폴리뉴클레오티드 조성물의 제1 폴리뉴클레오티드 성분은 리간드를 포함하도록 적합화되고 (예를 들어, NASC 폴리뉴클레오티드 조성물의 제1 폴리뉴클레오티드 성분은 그의 3' 말단에서 선택된 핵산 서열을 포함함), NASC 폴리뉴클레오티드 조성물의 제2 폴리뉴클레오티드 성분은 리간드 결합 모이어티를 포함하도록 적합화된다 (예를 들어, NASC 폴리뉴클레오티드 조성물의 제2 폴리뉴클레오티드 성분은 그의 5' 말단에서 선택된 핵산 서열에 결합하는 압타머를 포함함).

NASC 폴리뉴클레오티드 조성물의 1종 이상의 폴리뉴클레오티드 성분 사이의 연결을 형성하는 데 유용한 가교제는 알킬화제 (예를 들어, 1,3-비스(2-클로로에틸)-1-니트로소우레아) 및 질소 머스타드); 시스플라틴 (시스-디암민디클로로백금(II)) 및 그의 유도체); 이온화 방사선; 아질산; 반응성 화학물질 (예를 들어, 말론디알데히드); 프소랄렌 (UV의 존재 하에 활성화됨); 및 알데히드 (예를 들어, 아크롤레인 및 크로톤알데히드)를 포함하나 이에 제한되지는 않는다.

본 발명의 일부 실시양태에서, 친화성 태그는 NASC 폴리뉴클레오티드 조성물의 2종 이상의 폴리뉴클레오티드 성분 내에 도입된다. 예를 들어, NASC 폴리뉴클레오티드 조성물의 1종의 폴리뉴클레오티드 성분 내의 핵산 서열은 친화성 서열을 포함하도록 변형될 수 있다. 핵산 결합 이펙터 단백질 및 그의 상응하는 이펙터 단백질 결합 서열은 친화성 태그의 예이다. 친화성 태그는 NASC 폴리뉴클레오티드 조성물의 제1 폴리뉴클레오티드 성분 내에 도입될 수 있다. 친화성 태그는 친화성 서열 예컨대 MS2 결합 서열, U1A 결합 서열, 스템-루프 서열 (예를 들어, Csy4 단백질 결합 서열 또는 Cas6 단백질 결합 서열), eIF4A 결합된 서열, 전사 활성화제-유사 이펙터 (TALE) 결합 서열 (예를 들어, 문헌 [Valton, J., et al., Journal of Biological Chemistry 287(46):38427-38432 (2012)] 참조), 또는 아연 핑거 도메인 결합 서열 (예를 들어, 문헌 [Font, J., et al., Methods Molecular Biology 649:479-491 (2010); Isalan, M., et al., Nature Biotechnology 19(7):656-660 (2001)] 참조)일 수 있다. NASC 폴리뉴클레오티드 조성물의 제2 폴리뉴클레오티드 성분은 상응하는 친화성 태그를 포함하도록 변형될 수 있다: 각각 MS2 코딩 서열, U1A 코딩 서열, 스템-루프 결합 단백질 코딩 서열 (예를 들어, Csy4 단백질 서열에 결합하는 효소 (엔도리보뉴클레아제) 불활성 Csy4 단백질), eIF4A 코딩 서열, TALE 코딩 서열 또는 아연 핑거 도메인 코딩 서열. 전형적으로, 서열 특이적 핵산 결합을 보유하는 효소적으로 불활성인 핵산 결합 단백질이 사용되지만 (예를 들어, 엔도리보뉴클레아제-불활성 Csy4 단백질 (dCsy4)); 일부 실시양태에서 변경된 효소적 활성을 갖는 효소적으로 활성인 핵산 결합 단백질 또는 핵산 단백질이 사용된다. NASC 폴리뉴클레오티드 조성물의 2개 초과의 폴리뉴클레오티드 성분이 친화성 서열로 변형되는 경우에, 바람직한 실시양태에서, 2종의 친화성 서열은 전형적으로 동일하지 않고; 따라서, Cas 단백질과 회합된 2종의 상이한 친화성 서열이 존재한다.

실시예 1은 조작된 NASC 폴리뉴클레오티드 조성물의 예시적인 성분의 제조를 기재한다. 실시예 1은 본원에 기재된 NASC 폴리뉴클레오티드 조성물의 다수의 실시양태에 상응하는 NASC 폴리뉴클레오티드 성분의 인 실리코 설계를 기재한다. 표 9는 도면에 도시된 NASC 폴리뉴클레오티드 성분과 구조 사이의 상관관계를 제시한다.

실시예 2는 본 발명의 NASC 폴리뉴클레오티드 성분의 제조를 기재한다. 본 실시예에서 기재된 NASC 폴리뉴클레오티드 성분은 NASC 폴리뉴클레오티드 조성물에 의한 핵산 표적 서열의 절단 백분율을 평가하기 위한 시험관내 Cas 절단 검정에 사용되었다. 실시예 5는 시험관내 Cas 단백질-매개 절단 검정의 성능을 기재한다. 실시예 3 및 실시예 4는 시험관내 Cas 절단 검정에 사용하기 위한 이중-가닥 DNA 표적 서열의 제조에 사용될 수 있는 방법을 기재한다.

실시예 6은 본 발명의 NASC 폴리뉴클레오티드 조성물/제1 핵산 결합 단백질/제2 핵산 결합 단백질 조성물 (예를 들어, 부류 2 CRISPR-Cas 단백질 포함)을 사용한, 진핵 세포에서의 표적 변형의 검출을 위한 심층 서열분석 분석을 제시한다.

실시예 9는 NASC 폴리뉴클레오티드 조성물/제1 핵산 결합 단백질/제2 핵산 결합 단백질 조성물 (예를 들어, 부류 2 CRISPR-Cas 단백질 포함)을 사용한, 진핵 세포에서의 표적 변형의 검출을 위한 대안적 분석인 T7E1 검정을 제시한다.

실시예 7은 본 발명의 NASC 폴리뉴클레오티드 성분을 제조하도록 조작될 수 있는 부류 2 crRNA의 확인 및 스크리닝을 기재한다.

실시예 8은 NASC 폴리뉴클레오티드 성분을 조작하는 데 사용될 수 있는 부류 2 tracrRNA의 확인 및 스크리닝을 기재한다.

실시예 10은 부류 2 제V형 가이드 crRNA의 다양한 변형의 생성 및 시험, 및 NASC 폴리뉴클레오티드 성분을 구축하는 데 사용하기 위한 그의 적합성을 기재한다.

실시예 11은 부류 2 제II형 가이드 RNA의 다양한 변형의 생성 및 시험, 및 NASC 폴리뉴클레오티드 성분을 구축하는 데 사용하기 위한 그의 적합성을 기재한다.

실시예 12는 인간 gDNA에 존재하는 핵산 표적 서열을 변형하고 이들 부위에서의 절단의 절단 활성 및 특이성의 수준을 측정하기 위한 NASC 폴리뉴클레오티드 조성물의 사용을 기재한다. 특정한 부위에서의 절단 백분율 및/또는 절단 특이성의 수준의 측정은 목적하는 절단 백분율 및/또는 특이성을 갖는 핵산 표적 서열을 확인하기 위한 옵션을 제공할 수 있다.

제5 측면에서, 본 발명은 제1 핵산 결합 단백질 및 제2 핵산 결합 단백질과 복합체화된 NASC 폴리뉴클레오티드 조성물을 포함하는 핵산/단백질 조성물에 관한 것이다. 제1 핵산 결합 단백질은 하나 이상의 뉴클레아제 활성을 포함할 수 있고, 제2 핵산 결합 단백질은 하나 이상의 뉴클레아제 활성을 포함할 수 있다. 일부 실시양태에서, 제1 핵산 결합 단백질은 뉴클레아제 활성 중 하나 이상에 대해 촉매적으로 불활성이거나, 제2 핵산 결합 단백질은 뉴클레아제 활성 중 하나 이상에 대해 촉매적으로 불활성이거나, 또는 제1 핵산 결합 단백질 둘 다는 뉴클레아제 활성 중 하나 이상에 대해 촉매적으로 불활성이고, 제2 핵산 결합 단백질은 뉴클레아제 활성 중 하나 이상에 대해 촉매적으로 불활성이다. NASC 폴리뉴클레오티드 조성물/제1 핵산 결합 단백질/제2 핵산 결합 단백질 복합체의 다른 실시양태에서, 제1 핵산 결합 단백질 또는 제2 핵산 결합 단백질은 촉매적으로 불활성이고, 복합체는 촉매적으로 불활성인 단백질을 통해 공여자 폴리뉴클레오티드와 추가로 연결될 수 있다. 바람직한 실시양태에서, 제1 핵산 결합 단백질 및 제2 핵산 결합 단백질은 부류 2 CRISPR-Cas 단백질 (예를 들어, Cas9 단백질, Cpf1 단백질, 또는 Cas9 단백질 및 Cpf1 단백질)이다.

NASC 폴리뉴클레오티드 조성물/제1 핵산 결합 단백질/제2 핵산 결합 단백질 조성물의 일부 실시양태에서, Cas9 단백질 또는 Cpf1 단백질은 촉매적으로 불활성이고 (dCas9 또는 dCpf1), NASC 폴리뉴클레오티드 조성물/제1 핵산 결합 단백질/제2 핵산 결합 단백질 조성물은 공여자 폴리뉴클레오티드를 추가로 포함하며, 여기서 공여자 폴리뉴클레오티드는 Cpf1 스페이서 요소 또는 Cpf1 스페이서 요소에 인접한 영역에 상보적인 뉴클레오티드 서열, 또는 스페이서 요소 또는 Cas9 스페이서 요소에 인접한 영역에 상보적인 핵산 서열을 포함한다. 공여자 폴리뉴클레오티드는 스페이서 요소 또는 스페이서 요소에 인접한 서열에 상보적인 공여자 폴리뉴클레오티드 뉴클레오티드 서열 사이의 수소 결합을 통해 스페이서 요소 또는 스페이서 요소에 인접한 영역과 회합할 수 있다.

RuvC-1-관련 뉴클레아제 활성, HNH-관련 뉴클레아제 활성, 및 RuvC-1-관련 뉴클레아제 활성 및 HNH-관련 뉴클레아제 활성 둘 다에 대해 효소적으로 불활성인 Cas9 단백질의 돌연변이가 관련 기술분야에 공지되어 있다. 효소적으로 불활성인 Cpf1 단백질의 돌연변이가 관련 기술분야에 공지되어 있다 (예를 들어, 문헌 [Yamano, T., et al., Cell 165(4):949-962 (2016)); Zetsche, B., et al., Cell 163:1-13 (2015)] 참조).

CRISPR 시스템 전반에 걸쳐, "가이드 생물발생" (또한 "가이드 프로세싱"으로도 지칭됨)은 CRISPR 어레이의 전사 후 가이드 RNA 서열의 엔도뉴클레아제 또는 엑소뉴클레아제 말단절단을 수반한다. 가이드 RNA의 효소적 프로세싱은 Cas 오페론 (예를 들어, 부류 1 제I-E형 시스템의 Cas6)에 의해 코딩되는 RNase 또는 내인성 RNase (예를 들어, 부류 2 제II-A형 시스템의 RNase III)에 의해 수행될 수 있다.

부류 2 제V형 시스템에서, 가이드 생물발생은 Cpf1 단백질 뉴클레아제에 의해 수행된다. Cpf1 단백질은 또한 서열-특이적 이중-가닥 DNA 표적 절단을 담당한다.

제V형 시스템에서, 프리-crRNA의 절단은 상부 영역 (5' 방향으로)에서 슈도-노트 2차 구조 (예를 들어, 도 3a, (303) 참조)로부터 발생하고, 가이드 Cpf1 crRNA의 생성을 일으킨다. 본 발명의 일부 실시양태에서, Cpf1 단백질이 가이드 crRNA 스템 요소의 5'를 절단하는 것을 방지하는 것은 예를 들어 Cpf-1매개 절단에 의해 NASC 폴리뉴클레오티드 조성물/Cas9 단백질/Cpf1 단백질 복합체의 분리를 방지하는 데 유용하다. 제V형 프리-crRNA의 서열은 제V형 CRISPR Cpf1 단백질에 의한 가이드 RNA 프로세싱을 방지하도록 변형될 수 있음이 입증되었다 (문헌 [Fonfara, I., et al., Nature 532(7600):517-521 (2016)] 참조).

가이드 crRNA 스템 요소의 5'의 서열의 Cpf1 절단을 방지하는 1개의 방법은 Cpf1 단백질에 의한 프리-crRNA의 프로세싱을 방지하기 위해 프리-crRNA의 슈도-노트의 상부 영역 내 또는 슈도-노트 내의 염기의 변형 (예를 들어, 염기 돌연변이, 삽입, 결실 또는 화학적 변형)에 의한 것이다. 이러한 변형의 가이드 프로세싱에 대한 효과를 평가하기 위해, 변형된 프리-crRNA를 적합한 완충제 중에서 일정 기간 동안 동족 Cpf1 단백질의 존재 하에 인큐베이션할 수 있다. 혼합물을 프로테이나제 K (덴빌 사이언티픽(Denville Scientific), 뉴저지주 사우스플레인필드)로 처리하여 단백질을 제거할 수 있고, 혼합물을 폴리아크릴아미드 겔 전기영동에 의해 분석하여 변형된 프리-crRNA의 절단이 발생하는지 평가할 수 있다. 동족 Cpf1 단백질의 존재 하에 인큐베이션되지 않은 프리-crRNA는 양성 대조군 (즉, 가이드 프로세싱의 부재 하의 대조군)으로서의 역할을 할 수 있다. 프리-crRNA에서의 어떠한 단일 변형도 가이드 프로세싱을 제거하기에 충분하지 않은 경우에 프리-crRNA의 감소된 프로세싱을 나타내는 변형의 조합이 프리-crRNA 설계 내에 조합되고, 가이드 프로세싱 활성의 존재 하에 재시험될 수 있다. 프로세싱될 변형된 프리-crRNA의 무능력을 일으키는 프리-crRNA의 변형은 프리-crRNA 스페이서 요소를 포함하는 DNA 표적 핵산의 서열-특이적 결합 및/또는 절단을 유지하는 Cpf1-프리-crRNA/Cpf1 단백질 복합체의 능력에 대해 추가로 평가될 수 있다.

가이드 crRNA 스템 요소의 5'의 서열의 Cpf1 절단을 방지하는 제2 방법은 Cpf1 단백질의 변형에 의한 것이다. 이 방법에서, Cpf1 단백질의 아미노산 잔기는 가이드 프로세싱을 교란시키도록 변형된다. 가이드 crRNA/Cpf1 단백질 복합체의 X-선 결정학은 슈도-노트가 웨지 도메인 (WED) 및 RuvC 도메인으로 지정된 2개의 단백질 도메인의 계면에 의해 결합된다 (문헌 [Yamano, T., et al., Cell 165(4):949-962 (2016)] 참조). 가이드 crRNA 및/또는 슈도-노트 구조의 5' 말단에 결합하는 영역에 근접한 Cpf1의 아미노산 잔기는 프리-crRNA의 엔도뉴클레아제 촉매작용에 수반될 가능성이 있다. 돌연변이유발 전략, 예컨대 알라닌 스크리닝 (예를 들어, 문헌 [Lefevre, F., et al., Nucleic Acids Research 25(2):447-448 (1997); Lee, et al., Molecular Pharmacology 50(1):140-148 (1996)] 참조)은 WED 및 RuvC 도메인 내의 영역, 또는 Cpf1 단백질 내의 다른 도메인을 변형시켜 가이드 crRNA 프로세싱을 담당하는 단백질 내의 잔기를 확인하는 데 사용될 수 있다. 이 방법에서, 알라닌 돌연변이를 포함하는 Cpf1 단백질을 적합한 완충제 중에서 동족 프리-crRNA와 함께 발현시키고 인큐베이션할 수 있다. 인큐베이션 후에, 프로테이나제 K를 반응물 믹스에 첨가하여 Cpf1 단백질을 제거할 수 있고, 반응물 믹스를 폴리아크릴아미드 겔 전기영동에 의해 분석하여 변형된 프리-crRNA의 절단이 발생하는지 평가할 수 있다. 동족 Cpf1 단백질의 존재 하에 인큐베이션되지 않은 프리-crRNA는 양성 대조군 (즉, 가이드 프로세싱의 부재 하의 대조군)으로서의 역할을 할 수 있다. Cpf1 단백질에서의 어떠한 단일 돌연변이도 가이드 프로세싱을 제거하기에 충분하지 않은 경우에, 프리-crRNA의 감소된 프로세싱을 나타내는 돌연변이의 조합은 단일 Cpf1 단백질 구축물 내에 조합되고, 가이드 프로세싱 활성의 부재 하에 재시험될 수 있다. Cpf1 단백질에서의 후보 돌연변이 또는 돌연변이의 조합은 프리-crRNA 스페이서 요소를 포함하는 DNA 표적 핵산의 서열-특이적 결합 및/또는 절단을 유지하기 위해 Cpf1-프리-crRNA 복합체의 능력에 대해 추가로 평가될 수 있다.

제6 측면에서, 본 발명은 NASC 폴리뉴클레오티드 조성물의 1종 이상의 폴리뉴클레오티드 성분을 코딩하는 핵산 서열, 뿐만 아니라 NASC 폴리뉴클레오티드 조성물의 1종 이상의 폴리뉴클레오티드 성분을 코딩하는 핵산 서열을 포함하는 발현 카세트, 벡터 및 재조합 세포에 관한 것이다. 일부 실시양태에서, 이러한 발현 카세트, 벡터 및 재조합 세포는 NASC 폴리뉴클레오티드 조성물과 함께 복합체를 형성할 수 있는 1종 이상의 핵산 결합 단백질 (예를 들어, 부류 2 CRISPR-Cas 단백질)을 코딩하는 서열을 추가로 포함한다.

본 발명의 추가 실시양태는 NASC 폴리뉴클레오티드 조성물의 1종 이상의 폴리뉴클레오티드 성분을 코딩하는 1종 이상의 핵산 서열, 및 임의로 NASC 폴리뉴클레오티드 조성물과 복합체를 형성할 수 있는 핵산 결합 단백질 (예를 들어, 부류 2 CRISPR-Cas 단백질)을 코딩하는 1종 이상의 핵산 서열을 포함하는, 발현 벡터를 포함한 벡터에 관한 것이다. 벡터는 또한 선택가능 또는 스크리닝 마커를 코딩하는 서열을 포함할 수 있다. 게다가, 핵 표적화 서열은 또한 예를 들어 Cas9 단백질 및 Cpf1 단백질 코딩 서열에 부가될 수 있다. 벡터는 또한 단백질 태그 (예를 들어, 폴리-His 태그, 헤마글루티닌 태그, 형광 단백질 태그, 생물발광 태그)를 코딩하는 폴리뉴클레오티드를 포함할 수 있다. 이러한 단백질 태그에 대한 코딩 서열은 예를 들어 Cas9 단백질 및/또는 Cpf1 단백질을 코딩하는 1종 이상의 핵산 서열에 융합될 수 있다.

발현 벡터의 일반적 구축 방법은 관련 기술분야에 공지되어 있고; 게다가, 숙주 세포를 위한 발현 벡터는 상업적으로 입수가능하다. 적절한 벡터 및 그의 구축물, 예컨대 곤충 세포에서의 곤충 세포 형질전환 및 유전자 발현을 위한 곤충 세포 벡터, 박테리아 세포에서의 박테리아 형질전환 및 유전자 발현을 위한 박테리아 플라스미드, 효소 및 다른 진균에서의 세포 형질전환 및 유전자 발현을 위한 효소 플라스미드, 포유동물 세포 또는 포유동물에서의 포유동물 세포 형질전환 및 유전자 발현을 위한 포유동물 벡터, 및 세포 형질전환 및 유전자 발현을 위한 바이러스 벡터 (렌티바이러스, 레트로바이러스, 아데노바이러스, 단순 포진 바이러스 I 또는 II, 파르보바이러스, 세망내피증 바이러스 및 아데노-연관 바이러스 (AAV) 벡터 포함), 및 이러한 폴리뉴클레오티드의 클로닝을 용이하게 가능하게 하는 방법의 선택을 용이하게 하도록 설계된 여러 상업적 소프트웨어 생성물이 존재한다. 예시적인 식물 형질전환 벡터는 아그로박테리움 투메파시엔스의 Ti 플라스미드로부터 유래된 것들을 포함한다 (Lee, L.Y., et al., Plant Physiology 146(2): 325-332 (2008)). 아그로박테리움 리조게네스 플라스미드가 또한 유용하고 관련 기술분야에 공지되어 있다. 예를 들어, 스냅진(SNAPGENE)™ (GSL 바이오테크 LLC, 일리노이주 시카고; snapgene.com/resources/plasmid_files/ your_time_is_valuable/)은 벡터, 개별 벡터 서열 및 벡터 맵, 뿐만 아니라 다수의 벡터에 대한 상업적 공급원의 광범위한 목록을 제공한다.

렌티바이러스 벡터는 NASC 폴리뉴클레오티드의 1종 이상의 폴리뉴클레오티드 성분을 코딩하는 1종 이상의 핵산 서열, 및 임의로 NASC 폴리뉴클레오티드 조성물과 함께 복합체를 형성할 수 있는 1종 이상의 핵산 결합 단백질 (예를 들어, 부류 2 CRISPR-Cas 단백질)을 코딩하는 1종 이상의 핵산 서열의 포유동물 세포 내로의 도입에 유용한 벡터의 예이다. 렌티바이러스는 레트로비리다에 패밀리의 구성원이고, 분리 및 비-분리 세포 둘 다를 감염시킬뿐만 아니라 게놈 내로의 통합을 통한 안정한 발현을 제공할 수 있는 단일-가닥 RNA 바이러스이다. 렌티바이러스의 안정성을 증가시키기 위해, 바이러스 벡터를 제조하는 데 필요한 성분은 다중 플라스미드에 걸쳐 분할된다. 전달 벡터는 전형적으로 복제 부적격이고, 추가적으로 통합 후 바이러스 자가-불활성화가 되게 하는 3'LTR에서의 결실을 함유할 수 있다. 패키징 및 외피 플라스미드는 전형적으로 전달 벡터와 조합되어 사용된다. 예를 들어, 패키징 플라스미드는 Gag, Pol, Rev 및 Tat 유전자의 조합을 코딩할 수 있다. 전달 플라스미드는 바이러스 LTR 및 psi 패키징 신호를 포함할 수 있다. 외피 플라스미드는 외피 단백질 (통상적으로 수포성 구내염 바이러스 당단백질인 VSV-GP, 그의 넓은 감염성 범위 때문)을 포함한다.

인간 면역결핍 바이러스 제1형 (HIV-1)에 기초한 렌티바이러스 벡터는 세포 분열의 부재 하에 통합을 용이하게 하는 추가의 보조 단백질을 갖는다. HIV-1 벡터는 다수의 안정성 우려를 다루도록 설계되었다. 이들은 복제-적격 바이러스의 생성으로 이어지는 재조합 사건을 방지하기 위해 인 트랜스 바이러스 유전자의 개별 발현을 포함한다. 게다가, 자가-불활성화 벡터의 개발은 이웃 유전자의 전사활성화에 대한 잠재력을 감소시키고, 표적 유전자 발현에 대한 조절 요소의 특정한 세포 유형으로의 혼입을 가능하게 한다 (예를 들어, 문헌 [Cooray, S., et al., Methods in Enzymology 507:29-57 (2012)] 참조).

형질전환된 숙주 세포 (또는 재조합 세포)는 NASC 폴리뉴클레오티드 조성물의 1종 이상의 폴리뉴클레오티드 성분을 코딩하는 1종 이상의 핵산, 및 임의로 NASC 폴리뉴클레오티드 조성물과 함께 복합체를 형성할 수 있는 1종 이상의 핵산 결합 단백질 (예를 들어, 부류 2 CRISPR-Cas 단백질)을 코딩하는 1종 이상의 핵산 서열을 사용한 재조합 DNA 기술을 사용하여 형질전환 또는 형질감염된 세포 또는 세포의 자손이다. 숙주 세포 내에 폴리뉴클레오티드 (예를 들어, 발현 벡터)를 도입하는 방법은 관련 기술분야에 공지되어 있고, 전형적으로 숙주 세포의 종류에 기초하여 선택된다. 이러한 방법은 예를 들어 바이러스 또는 박테리오파지 감염, 형질감염, 접합, 전기천공, 인산칼슘 침전, 폴리에틸렌이민-매개 형질감염, DEAE-덱스트란 매개 형질감염, 원형질체 융합, 리포펙션, 리포솜-매개 형질감염, 탄도 유전자 전달 기술 (예를 들어, 유전자 총 또는 바이오리스틱 입자 전달 시스템을 사용하여), 직접 미세주사 및 나노입자-매개 전달을 포함한다.

NASC 폴리뉴클레오티드 조성물의 1종 이상의 폴리뉴클레오티드 성분을 코딩하는 1종 이상의 핵산 서열, 및 임의로 NASC 폴리뉴클레오티드 조성물과 함께 복합체를 형성할 수 있는 1종 이상의 핵산 결합 단백질 (예를 들어, 부류 2 CRISPR-Cas 단백질)을 코딩하는 1종 이상의 핵산 서열을 발현하기 위한 대안으로서, NASC 폴리뉴클레오티드 조성물 및/또는 1종 이상의 핵산 결합 단백질 (예를 들어, 부류 2 CRISPR-Cas 단백질)은 예를 들어 세포 내에 직접적으로 도입될 수 있다. 대안적으로, 1종 이상의 성분은 세포 및 직접적으로 도입된 다른 성분(들)에 의해 발현될 수 있다. 세포 내에 성분을 도입하는 방법은 전기천공, 리포펙션 및 탄도 유전자 전달 기술을 포함한다.

NASC 폴리뉴클레오티드 조성물의 1종 이상의 폴리뉴클레오티드 성분을 코딩하는 1종 이상의 핵산 서열, 및 임의로 NASC 폴리뉴클레오티드 조성물과 함께 복합체를 형성할 수 있는 1종 이상의 핵산 결합 단백질 (예를 들어, 부류 2 CRISPR-Cas 단백질)을 코딩하는 1종 이상의 핵산 서열의 도입으로써 재조합 세포를 제조하는 데 사용될 수 있는 다양한 숙주 세포가 본원에 개시된다. 이러한 숙주 세포는 식물 세포, 효모 세포, 박테리아 세포, 곤충 세포, 조류 세포 또는 포유동물 세포를 포함하나 이에 제한되지는 않는다.

재조합 세포를 제조하기 위해 숙주 세포 내에 폴리뉴클레오티드 (예를 들어, 발현 벡터)를 도입하는 방법은 관련 기술분야에 공지되어 있고, 전형적으로 숙주 세포의 종류에 기초하여 선택된다. 이러한 방법은 예를 들어 바이러스 또는 박테리오파지 감염, 형질감염, 접합, 전기천공, 인산칼슘 침전, 폴리에틸렌이민-매개 형질감염, DEAE-덱스트란 매개 형질감염, 원형질체 융합, 리포펙션, 리포솜-매개 형질감염, 탄도 유전자 전달 기술, 직접 미세주사 및 나노입자-매개 전달을 포함한다. 논의의 용이성을 위해, "형질감염"은 숙주 세포 내에 폴리뉴클레오티드를 도입하는 임의의 방법을 지칭하는 것으로 하기 사용된다.

폴리뉴클레오티드 식물 세포를 도입하는 바람직한 방법은 미세발사체 충격 및 아그로박테리움-매개 형질전환을 포함한다. 대안적으로, 다른 비-아그로박테리움 종 (예를 들어, 리조비움), 및 식물 세포를 감염시키고 감염된 식물 세포의 게놈 내에 이종 폴리뉴클레오티드를 도입할 수 있는 다른 원핵 세포가 사용될 수 있다. 다른 방법은 전기천공, 리포솜-매개 형질감염, 화분 또는 바이러스를 사용한 형질전환, 및 미세발사체 충격을 사용하여 유리 DNA 흡수 또는 유리 DNA 전달을 증가시키는 화학물질을 포함한다. 예를 들어, 문헌 [Narusaka, Y., et al., Chapter 9, in Transgenic Plants - Advances 및 Limitations, edited by Yelda, O., ISBN 978-953-51-0181-9 (2012)]을 참조한다.

일부 실시양태에서, 숙주 세포는 일시적으로 또는 비-일시적으로 감염된다. 일부 실시양태에서, 세포는 대상체에서 자연적으로 발생하는 바와 같이 감염된다. 일부 실시양태에서, 감염된 세포는 대상체, 예를들어 1차 세포 또는 전구 세포로부터 취해진다. 일부 실시양태에서, 1차 세포 또는 전구 세포는 동일한 대상체 (자가 처리) 또는 상이한 대상체에 대한 생체외 형질감염 후에 배양 및/또는 반환된다.

본원에 기재된 NASC 폴리뉴클레오티드 조성물/제1 핵산 결합 단백질/제2 핵산 결합 단백질 (예를 들어, 부류 2 CRISPR-Cas 단백질 포함) 복합체는 gDNA의 변형을 생성하기 위해 게놈 내의 DNA 표적 유전자좌에서의 선택된 폴리뉴클레오티드 서열을 부위-특이적으로 도입함으로써 비-인간 트랜스제닉 유기체를 생성하는 데 사용될 수 있다. 트랜스제닉 유기체는 동물 또는 식물일 수 있다.

트랜스제닉 동물은 전형적으로 접합체 세포 내에 시스템을 도입함으로써 생성된다. 트랜스제닉 마우스를 제조하는 것과 관련하여 기재된 기본적 기술 (Cho, A., et al., "Generation of Transgenic Mice," Current Protocols in Cell Biology, CHAPTER.Unit-19.11 (2009))은 5개의 기본적 단계를 수반한다: 첫째, 적합한 공여자 폴리뉴클레오티드를 포함한, 본원에 기재된 바와 같은 시스템의 제조; 둘째, 공여자 접합자의 수확; 셋째, 마우스 접합자 내에 시스템의 미세주사; 넷째, 거짓-임신한 수용자 마우스 내로의 미세주입된 접합자의 이식; 및 다섯째, 창시자 마우스 내에 확립된 gDNA의 변형의 유전자형결정 및 분석의 수행. 창시자 마우스는 임의의 자손에 대한 유전자 변형을 통과할 것이다. 창시자 마우스는 전형적으로 트랜스진에 대해 이형접합이다. 이들 마우스 사이의 교배는 시간의 트랜스진 25%에 대해 동질접합인 마우스를 생산할 것이다.

트랜스제닉 식물을 생성하는 방법이 또한 널리 공지되어 있다. 예를 들어 아그로박테리움 형질전환 방법을 사용하여 생성된 트랜스제닉 식물은 전형적으로 1개의 염색체에 삽입된 1개의 트랜스진을 함유한다. F1 종자를 생산하기 위해, 트랜스진에 대해 동형접합인 트랜스제닉 식물은 단일 트랜스진을 함유하는 독립적인 분리 트랜스제닉 식물을 그 자체, 예를 들어 F0 식물과 유성 교배하여 (즉, 자가수분하여) 생산하는 것이 가능하다. F1 종자를 발아시킴으로써 형성된 식물은 동형접합성에 대해 시험될 수 있다. 전형적인 접합성 검정은 동형접합체와 이형접합체 사이를 구별하는 단일 뉴클레오티드 다형성 검정 및 열 증폭 검정을 포함하나 이에 제한되지는 않는다.

식물의 직접적 형질전환에 대해 본원에 기재된 시스템을 사용하기 위한 대안으로서, 트랜스제닉 식물은 전혀 시스템에 노출되지 않은 제2 식물을 갖는 시스템과 함께 형질전환된 제1 식물을 교차시킴으로써 형성될 수 있다. 예를 들어, 트랜스진을 함유하는 제1 식물 계통은 제2 식물 계통 내에 트랜스진을 유전자이입하기 위해 제2 식물 계통과 교차되어, 따라서 제2 트랜스제닉 식물 계통을 형성할 수 있다.

본 발명의 추가 측면은 NASC 폴리뉴클레오티드 조성물 및 핵산 결합 단백질 (예를 들어, 부류 2 CRISPR-Cas 단백질) 복합체를 포함하는 핵단백질 조성물을 사용하는 방법에 관한 것이다. 이러한 핵단백질 조성물의 실시양태가 본원에 기재된다. 본원에 기재된 조작된 핵산 서열의 수많은 용도는 핵산 결합 부류 2 CRISPR 단백질 결합 서열 및 표적 핵산 서열에 상보적인 스페이서 핵산 서열을 포함하는 2종 이상의 조작된 핵산의 복합체의 스캐폴드의 형성; gDNA 영역의 정확한 편집 (예를 들어, 절제, 삽입, 변형); 절단-부위 (예를 들어, Cas9 단백질 또는 Cpf1 단백질을 사용한 절단)에 매우 근접한 공여자 폴리뉴클레오티드의 테더링; gDNA 영역의 절제 및 절제 부위에서의 동시 공여자 폴리뉴클레오티드 테더링; 인공 히스톤의 형성 및 예를 들어 dCas9를 사용한 이질염색질 구조의 도입; 및 유전자 발현의 엄격한 전사 조절 (예를 들어, 유전자의 전사 차단)을 포함하나 이에 제한되지는 않는다. 본원에 기재된 조작된 핵산 서열 스캐폴드의 추가의 용도는 핵단백질 입자 시트; 예를 들어 조직 조작에 사용하기 위한 가요성 생체적합물질; 케이지 약물 전달 비히클; 백신 전달 비히클, 예를 들어 DNA 또는 RNA 백신; 예를 들어 고정된 크기의 세공을 갖는 막을 제조 및 사용하는 크기-게이팅 다공성 막; 선택된 크기의 나노입자; 및 단백질 핵산 폴리머의 사용 방법 및 그를 제조하는 방법을 포함하나 이에 제한되지는 않는다.

한 실시양태에서, 본 발명은 핵산 (예를 들어, DNA) 내의 제1 핵산 표적 서열 및 핵산 서열 (예를 들어, DNA) 내의 제2 핵산 표적 서열을 NASC 폴리뉴클레오티드 조성물/제1 핵산 결합 단백질/제2 핵산 결합 단백질 조성물 (예를 들어, 부류 2 CRISPR-Cas 단백질 포함)과 접촉시키고, 그에 의해 핵산 서열 내의 제1 핵산 표적 서열 및 핵산 내의 제2 핵산 표적 서열에 대한 핵단백질의 결합을 용이하게 하는 것을 포함하는 핵산 서열 (예를 들어, DNA)에 결합하는 방법을 포함한다. NASC 폴리뉴클레오티드 조성물/제1 핵산 결합 단백질/제2 핵산 결합 단백질 조성물 (예를 들어, 부류 2 CRISPR-Cas 단백질 포함)은 제1 핵산 표적 서열 (예를 들어, DNA)에 상보적인 제1 스페이서 요소 및 제2 핵산 표적 서열 (예를 들어, DNA)에 상보적인 제2 스페이서 요소를 포함한다. 일부 실시양태에서, 핵산 표적 서열은 gDNA이다. 핵산 표적 서열에 결합하는 이러한 방법은 시험관내 (생화학적 검정), 세포내 (배양된 세포 내), 생체외 (대상체로부터 제거된 세포), 또는 생체내 (유기체 내의 세포) 수행할 수 있다.

하기를 포함하나 이에 제한되지는 않는 단백질-핵산 상호작용을 평가 및/또는 정량화하는 다양한 방법이 관련 기술분야에 공지되어 있다: 면역침전 (ChIP) 검정, DNA 전기영동 이동성 이동 검정 (EMSA), DNA 풀-다운 검정, 및 마이크로플레이트 포획 및 검출 검정. 상업용 키트, 물질 및 시약은 예를 들어, 써모 사이언티픽(Thermo Scientific) (델라웨어주 윌밍톤), 시그노시스(Signosis) (캘리포니아주 산타 클라라), 바이오-래드(Bio-Rad) (캘리포니아주 허큘레스) 및 프로메가(Promega) (위스콘신주 매디슨)로부터의 이들 방법 중 다수를 실시하기 위해 이용가능하다. 단백질-핵산 상호작용을 검출하기 위한 통상적인 접근법은 EMSA이다 (예를 들어, 문헌 [Hellman L.M., et al., Nature Protocols 2(8):1849-1861 (2007)] 참조).

또 다른 실시양태에서, 본 발명은 핵산 (예를 들어, DNA) 내의 제1 핵산 표적 서열 및 핵산 서열 (예를 들어, DNA) 내의 제2 핵산 표적 서열을 NASC 폴리뉴클레오티드 조성물/제1 핵산 결합 단백질/제2 핵산 결합 단백질 조성물 (예를 들어, 부류 2 CRISPR-Cas 단백질 포함)과 접촉시키고, 그에 의해 핵산 서열 내의 제1 핵산 표적 서열 및 핵산 내의 제2 핵산 표적 서열에 대한 핵단백질 조성물의 결합을 용이하게 하는 것을 포함하는 핵산 서열 (예를 들어, DNA)을 절단하는 방법을 포함한다. 핵단백질 조성물은 제1 핵산 표적 서열 (예를 들어, DNA)에 상보적인 제1 스페이서 요소 및 제2 핵산 표적 서열 (예를 들어, DNA)에 상보적인 제2 스페이서 요소를 포함한다. 결합된 핵단백질 조성물의 제1 핵산 결합 단백질 (예를 들어, 부류 2 CRISPR-Cas 단백질)은 제1 핵산 표적 서열을 절단하고, 결합된 핵산/단백질 조성물의 제2 핵산 결합 단백질 (예를 들어, 부류 2 CRISPR-Cas 단백질)은 제2 핵산 표적 서열을 절단한다. 일부 실시양태에서, 핵산 표적 서열은 gDNA이다. 핵산 표적 서열에 결합하는 이러한 방법은 시험관내, 세포내, 생체외 또는 생체내 수행될 수 있다.

NASC-PC1/NASC-PC2/에스. 써모필루스 Cas9 단백질/에스. 피오게네스 단백질 조성물을 사용하여 핵산 표적 서열에 결합하고 그를 절단하는 방법이 도 16a, 도 16b 및 도 16c에 예시된다. 도 16a는 에스. 피오게네스 Cas9 단백질 (도 16a, (1604)) 및 에스. 써모필루스 Cas9 단백질 (도 16a, (1603)), NASC-PC1/NASC-PC2 조성물 (도 16a, (1600)) (일반적으로 도 6k에 제시된 구조를 가짐), NASC-PC1/NASC-PC2 에스. 피오게네스 Cas9 스페이서 요소 (도 16a, (1602))에 상보적인 제1 DNA 표적 결합 서열을 포함하는 이중-가닥 핵산 (도 16a, (1605)), 및 NASC-PC1/NASC-PC2 에스. 써모필루스 Cas9 스페이서 요소 (도 16a, (1601))에 상보적인 제2 DNA 표적 결합 서열을 포함하는 이중-가닥 핵산 (또 16a, (1607))을 도시한다. 도 16a, (1606)은 에스. 피오게네스 Cas9 PAM의 위치를 나타낸다. 도 16a, (1608)은 에스. 써모필루스 Cas9 PAM의 위치를 나타낸다.

도 16a는 NASC-PC1/NASC-PC2 조성물 (도 11a, (1600); 복합체 (1610))과 복합체화된 에스. 피오게네스 Cas9 단백질 (도 16a, (1604); 복합체 (1609)) 및 에스. 써모필루스 Cas9 단백질 (도 16a, (1603); 복합체 (1616))의 형성을 도시한다.

도 16a는 이중-가닥 DNA 표적 서열 (도 16a, (1611))에 대한 핵단백질 복합체의 수소 결합을 도시한다. 도 16a, (1611)은 NASC-PC1/NASC-PC2 에스. 피오게네스 Cas9 스페이서 요소 (도 16a, (1602))에 상보적인 제1 DNA 표적 결합 서열을 포함하는 이중-가닥 핵산 (도 16a, (1605)) 및 NASC-PC1/NASC-PC2 에스. 써모필루스 Cas9 스페이서 요소 (도 16a, (1601))에 상보적인 제2 DNA 표적 결합 서열을 포함하는 이중-가닥 핵산 (도 16a, (1607))에 대한 NASC-PC1/NASC-PC2/에스. 써모필루스 Cas9 단백질/에스. 피오게네스 Cas9 단백질 조성물의 결합을 도시한다. 에스. 피오게네스 Cas9 단백질 및 에스. 써모필루스 Cas9 단백질이 효소적으로 불활성인 경우에, 핵단백질 복합체 (도 16a, (1610))가 예를 들어 2종의 DNA 서열 (도 16a, (1605), (1607))을 근접하게 하는 데 사용될 수 있다 (예를 들어, 도 16a, (1607)).

도 16b는 DNA (도 16b, (1607))를 절단 부위 (도 16b, (1612), (1613))에 근접하게 유지하기 위한, 효소적으로 활성인 에스. 피오게네스 Cas9 단백질에 의한 도 16b, (1605), DNA의 절단 및 효소적으로 불활성인 에스. 써모필루스 Cas9 단백질을 사용한 도 16b, (1607), DNA의 테더링을 도시한다. 이러한 핵단백질 복합체는 공여자 폴리뉴클레오티드 (도 16b, (1607))를 사용하여 HDR의 빈도를 개선시키는 것을 도울 수 있다.

도 16c는 도 16c, (1605), DNA의 가닥 둘 다를 파괴하기 위한 효소적으로 활성인 에스. 피오게네스 Cas9 단백질에 의한 도 16c, (1605), DNA의 절단 (도 16c, (1612), (1613)) 및 도 16c, (1607), DNA에서의 가닥 둘 다를 파괴하기 위한 효소적으로 활성인 에스. 써모필루스 Cas9 단백질에 의한 도 16c, (1607), DNA의 절단 (도 16c, (1614), (1615))을 도시한다. 이러한 핵단백질 복합체는 염색체 재배열 (예를 들어, 전위)을 용이하게 하는 데 사용될 수 있다.

또 다른 실시양태에서, 본 발명은 DNA 내의 제1 DNA 표적 서열 및 DNA 내의 제2 DNA 표적 서열을 NASC 폴리뉴클레오티드 조성물/제1 핵산 결합 단백질/제2 핵산 결합 단백질 조성물 (예를 들어, 부류 2 CRISPR-Cas 단백질 예컨대 Cas9 단백질 및/또는 Cpf1 단백질 포함)과 접촉시키고, 그에 의해 핵산 서열 내의 제1 핵산 표적 서열 및 핵산 내의 제2 핵산 표적 서열에 대한 핵단백질 복합체의 결합을 용이하게 하는 것을 포함하는, 세포 내의 DNA를 변형시키는 방법을 포함한다. NASC 폴리뉴클레오티드 조성물/제1 핵산 결합 단백질/제2 핵산 결합 단백질 조성물 (예를 들어, 부류 2 CRISPR-Cas 단백질 포함)은 제1 핵산 표적 서열에 상보적인 제1 스페이서 요소 및 제2 핵산 표적 서열 (예를 들어, DNA)에 상보적인 제2 스페이서 요소를 포함한다. 결합된 핵단백질 복합체의 제1 단백질은 제1 DNA 표적 서열을 절단하고, 결합된 핵단백질 복합체의 제2 단백질은 제2 DNA 표적 서열을 절단한다. 세포는 제1 절단 부위 및 제2 절단 부위 둘 다를 복구한다. 예시적인 세포 DNA 복구 경로는 HDR, NHEJ 및 MMEJ를 포함한다. 일부 실시양태에서, 핵산 표적 서열은 gDNA이다. 핵산 표적 서열에 결합하는 이러한 방법은 시험관내, 세포내, 생체외 또는 생체내 수행될 수 있다. 접촉 단계는 존재하는 공여자 폴리뉴클레오티드를 추가로 포함할 수 있으며, 여기서 공여자 폴리뉴클레오티드 중 일부는 제1 절단 부위와 제2 절단 부위 사이에 혼입된다.

또 다른 실시양태에서, 본 발명은 공여자 폴리뉴클레오티드를 세포 내 핵산 표적, 전형적으로 DNA에서의 DSB에 근접하게 가져오는 방법에 관한 것이다. 방법은 DNA 내의 제1 DNA 표적 서열 및 공여자 폴리뉴클레오티드 내의 제2 DNA 표적 서열을 제1 DNA 표적에 상보적인 제1 DNA 표적 결합 서열 및 제2 DNA 표적에 상보적인 제2 DNA 표적 결합 서열을 갖는 NASC 폴리뉴클레오티드 조성물/제1 DNA 결합 단백질/제2 DNA 결합 단백질 조성물 (예를 들어, 부류 2 CRISPR-Cas 단백질 예컨대 Cas9 단백질 및/또는 Cpf1 단백질 포함)과 접촉시키는 것을 포함한다. 제1 DNA 결합 단백질은 촉매적으로 활성이고, 제1 DNA 표적 결합 서열과 회합된다. 제2 DNA 결합 단백질은 효소적으로 불활성이고, 제2 DNA 표적 결합 서열과 회합된다. 핵단백질 복합체를 제1 및 제2 DNA 표적 서열과 접촉시키는 것은 DNA 내의 제1 DNA 표적 서열 및 공여자 폴리뉴클레오티드 내의 제2 DNA 표적 서열에 대한 핵단백질 복합체의 결합을 용이하게 한다. 핵단백질 복합체의 촉매적으로 활성인 DNA 결합 단백질은 제1 DNA 표적 서열을 절단하여 절단 부위를 형성한다. 공여자 폴리뉴클레오티드는 촉매적으로 활성인 DNA 결합 단백질 및 촉매적으로 불활성인 DNA 결합 단백질이 NASC 폴리뉴클레오티드 조성물과 복합체화되며, 즉, 이들이 동일한 핵단백질 복합체의 부분이기 때문에 절단 부위 (예를 들어, DSB)에 근접하다. 일부 실시양태에서, 공여자 폴리뉴클레오티드 중 적어도 일부는 (예를 들어, HDR 복구 과정에 의해) DNA 내의 절단 부위 내에 도입되어 DNA를 변형시킬 수 있다.

도 12는 활성 Cas9의 엔도뉴클레아제 도메인은 활성이고 dCas9의 엔도뉴클레아제 도메인은 불활성인 NASC-PC1/NASC-PC2/활성 Cas9 단백질/dCas9 Cas9 단백질 조성물을 사용하여 공여자 폴리뉴클레오티드를 핵산 표적 서열에서의 DSB에 근접하게 가져오는 것을 도시한다. 도 12는 활성 Cas9 단백질 (도 12, (1211)) 및 dCas9 단백질 (도 12, (1203)), NASC-PC1/NASC-PC2 조성물 (도 12, (1205); 또한 도 6f 참조); 활성 Cas9-NASC-PC1/NASC-PC2 조성물 스페이서 요소 (도 12, (1210))에 상보적인 제1 DNA 표적 결합 서열을 포함하는 이중-가닥 핵산 (도 12, (1206)/(1207)); 및 dCas9-NASC-PC1/NASC-PC2 조성물 스페이서 요소 (도 12, (1204))에 상보적인 제2 DNA 표적 결합 서열을 포함하는 공여자 폴리뉴클레오티드 (도 12, (1200)/(1201))를 도시한다. 도 12는 공여자 폴리뉴클레오티드 내의 제1 Cas9 PAM (도 12, (1209))의 제1 DNA 표적 서열 상부에 대한 제1 DNA 표적 결합 서열 및 제2 Cas9 PAM (도 12, (1202))의 제2 표적 서열 상부에 대한 제2 DNA 표적 결합 서열과 복합체화 및 수소 결합하는 NASC-PC1/NASC-PC2/활성 Cas9 단백질/dCas9 단백질을 도시한다. 도 12, (1208)은 제1 DNA 표적 결합 서열에서의 Cas9에 의해 이루어지고, 제2 이중-가닥 핵산 (도 12, (1213)/(1212))을 생성하는 이중-가닥 평활-말단을 도시하고, 이중-가닥 평활-말단 절단에 근접한 공여자 폴리뉴클레오티드 (도 12, (1200)/(1201))를 보여준다. 공여자 폴리뉴클레오티드를 이중-가닥 절단에 매우 근접하게 하는 것은 제1 핵산 표적을 포함하는 DNA 내로의 공여자 폴리뉴클레오티드 서열 또는 그의 부분의 통합의 가능성을 증가시킨다.

추가 실시양태에서, 본 발명은 제1 핵산 표적 부위, 전형적으로 DNA를 세포 내의 제2 핵산 표적 부위, 전형적으로 DNA에 근접하게 가져오는 방법에 관한 것이다. 방법은 제1 핵산 표적 서열 및 제2 핵산 표적 서열을 핵산 결합 단백질 및 제2 핵산 결합 단백질과 복합체화된 NASC 폴리뉴클레오티드 조성물을 포함하는 핵단백질 복합체와 접촉시키고, 그에 의해 제1 핵산 표적 서열 및 제2 핵산 표적 서열에 대한 핵단백질 복합체의 결합을 용이하게 하는 것을 포함한다. 제1 DNA 표적 서열은 NASC 폴리뉴클레오티드 조성물의 제1 핵산 결합 서열에 상보적이며, 여기서 회합된 제1 단백질은 촉매적으로 불활성인 핵산 결합 단백질 (예를 들어, dCpf1 단백질 또는 dCas9 단백질)이다. 제2 DNA 표적 서열은 NASC 폴리뉴클레오티드 조성물의 제2 핵산 결합 서열에 상보적이며, 여기서 회합된 제2 단백질은 촉매적으로 불활성인 핵산 결합 단백질 (예를 들어, dCpf1 단백질 또는 dCas9 단백질)이다. 제1 핵산 표적 부위는 제1 및 제2 촉매적으로 불활성인 핵산 결합 단백질이 NASC 폴리뉴클레오티드 조성물과 복합체화되며, 즉, 이들은 동일한 핵산/단백질 조성물의 부분이기 때문에 제2 핵산 표적 부위에 근접하게 가져온다. 일부 실시양태에서, 제1 핵산 표적 서열 및 제2 핵산 표적 서열은 개별 폴리뉴클레오티드 (예를 들어, 상이한 염색체) 상에 있거나, 또는 단일 폴리뉴클레오티드는 제1 핵산 표적 서열 및 제2 핵산 표적 서열 (예를 들어, 동일한 염색체의 상이한 섹션)을 포함한다.

도 13은 단일 DNA 폴리뉴클레오티드 내의 3개의 부위에 결합하는 NASC 폴리뉴클레오티드 조성물/제1 dCas9 단백질/제2 dCas9 결합 단백질/제3 dCas9 단백질 조성물의 예를 도시한다. NASC 폴리뉴클레오티드 조성물은 또한 도 6i에 도시된다. 이 핵단백질 복합체는 세포 내의 제3 핵산 표적 부위, 전형적으로 DNA에 근접한 제2 핵산 표적 부위, 전형적으로 DNA에 근접하게 제1 핵산 표적 부위, 전형적으로 DNA를 가져오는 방법에 사용될 수 있다. 이 방법은 예를 들어 3개의 표적 부위에 인접한 유전자에 근접한 핵산 표적 부위의 검출, 및 3개의 표적 부위에 인접한 유전자의 시험관내 또는 생체내 전사 조정을 조정하는 데 적용될 수 있다. 도 13에 도시된 성분의 식별자는 표 8에 제시된다.

도 14는 다중 DNA 폴리뉴클레오티드의 3개의 부위에 결합하는 NASC 폴리뉴클레오티드 조성물/제1 dCas9 단백질/제2 활성 Cas9 결합 단백질/제3 활성 Cas9 단백질 조성물의 예를 도시한다. NASC 폴리뉴클레오티드 조성물은 또한 도 6i에 도시된다. 이 핵단백질 복합체는 예를 들어 세포 내의 핵산 표적, 전형적으로 DNA에서의 2개의 DSB에 근접하게 공여자 폴리뉴클레오티드를 가져와 2개의 DNA 표적 절단 부위 사이의 영역 내로의 공여자 폴리뉴클레오티드 또는 공여자 폴리뉴클레오티드의 부분의 HDR 통합을 용이하게 하는 방법에 사용될 수 있다. 도 14에 도시된 성분의 식별자는 표 8에 제시된다. NASC 폴리뉴클레오티드 조성물은 또한 도 6i에 도시된다.

도 15는 3종의 상이한 DNA 폴리뉴클레오티드 내의 3개의 부위에 결합하는 NASC 폴리뉴클레오티드 조성물/제1 dCas9 단백질/제2 활성 Cas9 결합 단백질/제3 활성 Cas9 단백질 조성물의 예를 도시한다. NASC 폴리뉴클레오티드 조성물은 또한 도 6i에 도시된다. 이 핵단백질 복합체는 예를 들어 제3 DNA 폴리뉴클레오티드의 5' 및 3' 말단에 대한 2종의 DNA 폴리뉴클레오티드의 라이게이션 빈도를 개선시키는 방법에 사용될 수 있다. 도 15에 도시된 성분의 식별자는 표 8에 제시된다. NASC 폴리뉴클레오티드 조성물은 또한 도 6i에 도시된다.

표 8

도 13, 도 14 및 도 15에 대한 식별자 및 상응하는 영역

또 다른 실시양태에서, 본 발명은 또한 시험관내 또는 생체내 전사, 예를 들어, 조절 요소 서열을 포함하는 유전자의 전사를 조정하는 방법을 포함한다. 방법은 적어도 제1 핵산 서열 및 제2 핵산 서열을 NASC 폴리뉴클레오티드 조성물/제1 핵산 결합 단백질/제2 핵산 결합 단백질 조성물 (예를 들어, 촉매적으로 불활성인 부류 2 CRISPR-Cas 단백질 예컨대 dCas9 및/또는 dCpf1 포함)과 접촉시키고, 그에 의해 제1 핵산 표적 서열 및 제2 핵산 표적 서열에 대한 핵단백질 조성물의 결합을 용이하게 하는 것을 포함한다. 제1 DNA 표적 서열 및 제2 DNA 표적 서열 중 적어도 1개는 조절 요소 서열을 포함한다. NASC 폴리뉴클레오티드 조성물/제1 핵산 결합 단백질/제2 핵산 결합 단백질 조성물의 제1 DNA 표적 결합 서열은 제1 핵산 표적 서열에 상보적이다. NASC 폴리뉴클레오티드 조성물/제1 핵산 결합 단백질/제2 핵산 결합 단백질 조성물의 제2 DNA 표적 결합 서열은 제2 DNA 표적 서열에 상보적이다. 또한, 제1 및/또는 제2 단백질은 융합 단백질, 예를 들어, 리프레서 또는 활성화제 도메인에 융합된 dCas9, 및/또는 리프레서 또는 활성화제 도메인에 융합된 dCpf1일 수 있다. 제1 DNA 표적 서열 및 제2 DNA 표적 서열에 대한 핵산/단백질 조성물의 결합은 유전자의 전사를 조정한다. 일부 실시양태에서, 제1 DNA 표적 서열 및 제2 DNA 표적 서열은 조절 요소 서열을 포함하고, 제1 DNA 표적 서열은 프로모터를 포함하고, 제2 DNA 표적 서열은 전사 개시 부위를 포함한다.

도 11은 본 발명의 NASC 폴리뉴클레오티드 조성물을 사용하여 시험관내 또는 생체내 전사를 조정하는 방법을 도시한다. 이 도면에서, NASC 폴리뉴클레오티드 조성물/제1 dCas9 단백질/제2 dCas9 단백질 복합체는 NASC 폴리뉴클레오티드 조성물 (도 11, (1103))의 제1 dCas9 단백질 (도 11, (1100)) 및 제2 dCas9 단백질 (도 11, (1101))과의 회합에 의해 형성된다 (도 11, (1111), (1110), (1103)). 복합체는 DNA 폴리뉴클레오티드 (도 11, (1105)) 내의 제1 Cas9 PAM (도 11, (1108))에 인접한 제1 핵산 표적 서열에 상보적인 제1 DNA 표적 결합 서열 (도 11, (1102)) 및 제2 Cas9 PAM (도 11, (1109))에 인접한 제2 핵산 표적 서열에 상보적인 제2 DNA 표적 결합 서열 (도 11, (1104))을 포함한다. NASC 폴리뉴클레오티드 조성물/제1 dCas9 단백질/제2 dCas9 단백질 복합체는 DNA 표적 서열을 포함하는 DNA 폴리뉴클레오티드와 접촉하고, 그에 의해 제1 핵산 표적 서열 및 제2 핵산 표적 서열에 대한 수소-결합된 염기 쌍을 통한 핵단백질 조성물의 결합을 용이하게 한다 (도 11, (1112), (1113)). 제1 DNA 표적 서열 및 제2 DNA 표적 서열 중 적어도 1개는 조절 요소 서열을 포함한다. NASC 폴리뉴클레오티드 조성물/제1 dCas9 단백질/제2 dCas9 단백질 조성물의 제1 DNA 표적 결합 서열은 제1 핵산 표적 서열에 상보적이다. NASC 폴리뉴클레오티드 조성물/제1 dCas9 단백질/제2 dCas9 단백질 조성물의 제2 DNA 표적 결합 서열은 제2 DNA 표적 서열에 상보적이다.

본 발명의 NASC 폴리뉴클레오티드 조성물은 복합체 아키텍처로 자가-조립된 핵산/단백질 거대분자를 설계하는 데 사용될 수 있다. 이러한 거대분자는 나노생명공학에서 약물 전달, 핵산/단백질 나노물질의 설계, 및 나노 구조 예컨대 나노튜브 및 폐쇄된-케이지 구조의 형성을 포함하나 이에 제한되지는 않는 많은 용도를 갖는다. 실시예 13은 NASC 폐쇄된-케이지 조성물 (NASC-CC)의 형성을 위한 본 발명의 NASC 폴리뉴클레오티드 조성물의 사용을 예시한다. NASC-CC는 소분자의 패키징에 사용될 수 있다. 실시예 14는 적절한 조립을 검증하고 조립된 NASC-CC/dCas 단백질 복합체의 크기 및 부피를 평가하기 위한 NASC-CC/dCas 단백질 복합체의 특징화에 사용될 수 있는 방법을 기재한다. 실시예 13 및 실시예 14에 기재된 NASC-CC는 도 6l에 도시된다. 도 6a에 도시된 NASC 폴리뉴클레오티드 조성물에 상응하는 2종의 NASC 폴리뉴클레오티드 조성물 (본 실시예에서 NASC-PC1-트리플렉스로 지칭됨)은 이중-가닥 DNA 브레이스 핵산 서열을 사용하여 연결될 수 있다. 이중-가닥 DNA 브레이스 핵산 서열은 제1 DNA 표적 서열 및 제2 DNA 표적 서열을 포함할 수 있다. 실시예 13에 기재된 바와 같이, NASC-CC는 제1 NASC-PC1-트리플렉스/dCas9 단백질 핵단백질 복합체가 브레이스 핵산 서열의 제1 DNA 표적 서열에 특이적으로 결합할 DNA 표적 결합 서열을 포함하기 때문에 자기-조립된다. DNA 표적 결합 서열을 포함하는 제2 NASC-PC1-트리플렉스/dCas9 단백질은 폐쇄된 케이지 구조를 형성하기 위해 브레이스 핵산 서열의 제2 DNA 표적 서열에 특이적으로 결합할 것이다. 도 6m은 핵단백질 케이지를 형성하는 6종의 회합된 Cas9 단백질을 갖는 NASC-CC를 도시한다.

광범위한 분자는 백신 (예를 들어, 불활성화된 백신, 약독화 백신, 단백질 서브유닛 백신 및 핵산 백신); 모노클로날 항체; 항생제; 소분자 약물; 암 치료제; 재조합 단백질, 생물제제 등을 포함하나 이에 제한되지는 않는 분자의 전달을 용이하게 하기 위한 NASC-CC 폴리뉴클레오티드 조성물 내로의 혼입을 위한 후보이다. 이러한 분자는 또한 본원에서 "페이로드"로 지칭된다.

표적화 단백질 및 핵산 결합 단백질 (예를 들어, Cas9, Cpf1)의 융합은 NASC-CC 폴리뉴클레오티드 조성물의 조직, 기관 또는 세포 유형 표적화된 전달을 달성하는 데 사용될 수 있다. 예를 들어, 특정한 종양에 특이적인 랜드스케이프 파지 펩티드는 친화성 선택에 의해 수득될 수 있고, 특정한 종양에 특이적인 정제된 펩티드는 Cas9 단백질에 융합될 수 있다. 이어서, Cas9 융합 단백질은 종양-표적화된 나노담체를 수득하기 위해 NASC-CC 폴리뉴클레오티드 조성물을 조립하는 데 사용될 수 있다. 특정한 종양에 특이적인 파지 펩티드의 제조는 문헌 [Jayanna, P., et al., Nanomedicine. 5(1):83 (2009)]에 의해 기재되었다.

NASC-CC의 세포로의 전달의 대안적 방식은 NASC-CC RNA, DNA 또는 단백질 ("NASC-CC/Cas") 성분의 다양한 리간드 또는 화학적 작용제와의 연결, 패키징 또는 회합을 통해 달성될 수 있다. 패키징 기술은 자가-조립 리포솜, 미셀, 덴드리머, 나노구체 또는 나노캡슐 내로의 NASC-CC/Cas 패키징을 포함한다.

분자 및 거대구조에 대한 폴리에틸렌 글리콜 (PEG, PEG화)의 공유 및 비공유 부착은 세포로의 표적 전달을 위한 페이로드의 패키징에 사용되었고, 본 명세서의 교시를 고려하여 관련 기술분야의 통상의 기술자에 의해 NASC-CC/Cas의 캡슐화에 적합할 수 있다. 게다가, 단백질 PEG화는 거대분자의 조직, 세포 및 소기관으로의 전달을 위한 접합 화학의 광범위하게 실시되는 형태이다. PEG화된 구조는 세포 흡수를 용이하게 하는 모이어티 (예를 들어, 폴레이트 모이어티)의 분자 부착으로 추가로 변형될 수 있다. 이들 모이어티의 선택은 NASC-CC/Cas 및 캡슐화된 페이로드 (즉, 세포외 매트릭스, 수용체 또는 항체 조성물)의 지시된 전달에 대해 표적화된 세포의 고유 특성에 의존한다. 이들 모이어티는 NASC-CC/Cas, NASC-CC 패키징제, 또는 NASC-CC/Cas 및 NASC-CC 패키징제 둘 다에 부착될 수 있다. 사용될 수 있는 모이어티는 항체, 리간드, 트랜스페린, 당단백질, 압타머, 세포 관통 펩티드, 매트릭스 메탈로프로테아제-절단가능 펩티드, 인테그린, 단백질 형질도입 도메인, 에피토프, 세포 부착 분자, 및 관련 기술분야에 공지된 다른 화합물을 포함하나 이에 제한되지는 않는다 (예를 들어, 문헌 [Steichen, S. et al., European Journal of Pharmaceutical Sciences. 48(3):416-27 (2013); Dashpande, P., et al., Nanomedicine. 8(9):1509-28 (2013)] 참조).

NASC-CC/Cas 캡슐화된 작용제의 트리거 방출은 별개의 화학적 모이어티 또는 서열 모티프의 NASC-CC/Cas 조성물로의 또는 NASC-CC 패키징제 내로의 혼입에 의해 용이해질 수 있다. 생분해성 중합체 조성물 (예를 들어, 변형된 PEG 조성물)의 NASC-CC/Cas 또는 NASC-CC 패키징제에 대한 부착은 세포 흡수 시 NASC-CC/Cas 또는 NASC-CC 패키징제의 파괴를 가능하게 할 수 있다. 조작된 감수성 부위 (즉, 단백질분해 감수성 펩티드 서열, pH 감수성 공중합체, 산화환원 감수성 연결 등) 또는 조작된 감수성 부위의 조합은 NASC-CC 캡슐화된 작용제의 방출을 용이하게 하는 데 사용될 수 있다. NASC-CC와 NASC-CC 패키징제 사이의 불안정성 연결, 예컨대 pH 감수성 연결은 고 pH 환경 (예를 들어, 세포내이입 공포)에서 NASC-CC 및 NASC-CC 패키징제로부터의 해리를 촉진하는 데 이용될 수 있다. NASC-CC/Cas 복합체는 페이로드의 특정한 소기관으로의 전달을 위해 소기관 특이적 에피토프 (즉, 핵 국재화 신호)로 추가로 변형될 수 있다.

본 명세서의 교시를 고려하여, 관련 기술분야의 통상의 기술자는 다양한 나노구조를 형성하기 위해 다양한 상이한 NASC 폴리뉴클레오티드 조성물을 사용할 수 있다.

상기 기재된 바와 같이, 본 발명의 NASC 폴리뉴클레오티드 조성물을 포함하는 핵단백질 조성물의 성분 중 임의의 것 또는 이러한 성분을 코딩하는 핵산 서열은 임의로 1종 이상의 시약을 포함하여, 키트 내에 혼입될 수 있다. 일부 실시양태에서, 키트는 1종 이상의 개별 조성물로서, 또는 임의로 성분의 상용성이 가능하게 될 혼합물로서 키트 요소를 보유하는 1개 이상의 용기를 갖는 패키지를 포함한다. 일부 실시양태에서, 키트는 또한 완충제, 완충 작용제, 염, 멸균 수용액 및/또는 보존제를 포함한다. 예시적인 키트는 NASC 폴리뉴클레오티드 조성물의 1종 이상의 성분 및 임의로 1종 이상의 동족 핵산 결합 단백질, 예컨대 Cpf1 및/또는 Cas9 단백질; 및 NASC 폴리뉴클레오티드 조성물의 1종 이상의 성분을 코딩하는 1종 이상의 핵산 서열 및 임의로 Cpf1 및/또는 Cas9 단백질을 코딩하는 1종 이상의 핵산 서열을 포함한다.

게다가, 키트는 본 발명의 NASC 폴리뉴클레오티드 조성물을 포함하는 핵단백질 복합체의 성분 또는 이러한 성분을 코딩하는 핵산 서열을 사용하는 것에 대한 지침서를 추가로 포함할 수 있다. 본 발명의 키트에 포함된 지침서는 패키징 물질에 부착될 수 있거나, 또는 패키징 재료로서 포함될 수 있다. 지침서는 전형적으로 서면 또는 인쇄 매체이지만, 이에 제한되지는 않는다. 이러한 지침서를 저장하고 이를 최종 사용자에게 전할 수 있는 임의의 매체가 본 발명에 의해 고려된다. 이러한 매체는 전자 저장 매체 (예를 들어, 자기 디스크, 테이프, 카트리지, 칩), 광학 매체 (예를 들어, CD ROM), RF 태그 등을 포함하나 이에 제한되지는 않는다. 지침서는 또한 지침서를 제공하는 인터넷 사이트의 주소를 포함할 수 있다.

본 발명의 또 다른 측면은 본 발명의 NASC 폴리뉴클레오티드 조성물 또는 NASC 폴리뉴클레오티드 조성물을 포함하는 핵산/단백질 조성물을 만들거나 제조하는 방법에 관한 것이다. 한 실시양태에서, 만들거나 제조하는 방법은 NASC 폴리뉴클레오티드 조성물의 폴리뉴클레오티드 성분을 화학적으로 합성하는 것을 포함한다. 일부 실시양태에서, NASC 폴리뉴클레오티드 조성물은 RNA 염기를 포함하고, 시험관내 전사를 사용하여 DNA 주형으로부터 생성될 수 있다.

일부 실시양태에서, NASC 폴리뉴클레오티드 조성물 성분은 모이어티 (예를 들어, 리간드 모이어티, 리간드 결합 모이어티, 친화성 태그, 엑소뉴클레아제 저항성 모이어티)에 의해 변형될 수 있다. 폴리뉴클레아제 성분은 예를 들어 폴리뉴클레오티드 성분의 5' 말단 서열 및/또는 3' 말단 서열에 연결될 수 있다.

NASC 폴리뉴클레오티드 조성물을 포함하는 핵산/단백질 조성물은 검출가능한 신호를 제공할 수 있는 모이어티를 포함하여, 검출가능한 표지를 추가로 포함할 수 있다. 검출가능한 표지의 예는 효소, 방사성동위원소, 특이적 결합 쌍의 구성원, 형광단 (FAM), 형광 단백질 (녹색 형광 단백질, 적색 형광 단백질, m체리, td토마토), 적합한 형광단 (증진된 GFP (EGFP), "스피니치(Spinach)")을 함께 갖는 DNA 또는 RNA 압타머, 양자점, 항체 등를 포함하나 이에 제한되지는 않는다. 수많은 및 다양한 적합한 검출가능한 표지가 관련 기술분야의 통상의 기술자에게 널리 공지되어 있다.

본원에 기재된 바와 같이, NASC 폴리뉴클레오티드 조성물을 포함하는 핵산/단백질 조성물 또는 NASC 폴리뉴클레오티드 조성물을 포함하는 핵산/단백질 조성물의 사용에 의해 변형된 세포는 예를 들어 제약상 허용되는 부형제를 사용하여 제제화된 제약 조성물로서 사용될 수 있다. 예시적인 부형제는 담체, 안정화제, 희석제, 분산제, 현탁화제, 증점제 등을 포함한다. 제약 조성물은 조작된 NASC 폴리뉴클레오티드 조성물을 포함하는 핵산/단백질 조성물의 유기체에 대한 투여를 용이하게 할 수 있다. 제약 조성물은 예를 들어 정맥내, 피하, 근육내, 경구, 에어로졸, 비경구, 안과적 및 폐 투여를 포함한 다양한 형태 및 경로에 의해 치료 유효량으로 투여될 수 있다.

하기를 포함하나 이에 제한되지는 않는 본 발명의 NASC 폴리뉴클레오티드 조성물 및 핵단백질 복합체를 사용하여 수많은 이점을 얻을 수 있다:

● 핵산 결합 단백질 (예를 들어, 부류 2 CRISPR-Cas 단백질)을 포함하는 핵산/단백질 조성물 및 유사하게 표적화된 개별 NATNA/핵산 결합 단백질 복합체 (예를 들어, sgRNA/Cas9 단백질 복합체)의 사용과 관련된 단일 핵단백질 복합체를 사용하여 다중 표적 핵산 서열에 대한 결합을 표적화하는 NASC 폴리뉴클레오티드 조성물을 사용한 오프-표적화 결합에서의 감소;

● 공여자 폴리뉴클레오티드를 이중-가닥 핵산에서의 절단에 근접하게 가져오기 위한, 핵산 결합 단백질 (예를 들어, 부류 2 CRISPR-Cas 단백질)을 포함하는 핵산/단백질 조성물 및 NASC 폴리뉴클레오티드 조성물의 사용을 통한 공여자 폴리뉴클레오티드의 테더링;

● 핵산 결합 단백질 (예를 들어, 부류 2 CRISPR-Cas 단백질)을 포함하는 핵산/단백질 조성물 및 NASC 폴리뉴클레오티드 조성물을 사용하여, 2종의 개별 폴리뉴클레오티드 (예를 들어, 2개의 상이한 염색체) 또는 단일 폴리뉴클레오티드의 2개의 영역 (예를 들어, 단일 염색체의 2개의 영역)을 서로 근접하게 가져오는 것;

● 표적 유전자에 작동가능하게 연결된 다중 조절 서열에 대한 핵산 결합 단백질 (예를 들어, 부류 2 CRISPR-Cas 단백질)을 포함하는 핵산/단백질 조성물 및 NASC 폴리뉴클레오티드 조성물의 결합에 의한 표적 유전자의 전사 조정;

● 2종의 개별 폴리뉴클레오티드 (예를 들어, 트랜스-작용 조절 요소) 또는 단일 폴리뉴클레오티드의 2개의 영역 (예를 들어, 시스-작용 조절 요소)을 서로 근접하게 가져오기 위한, 핵산 결합 단백질 (예를 들어, 부류 2 CRISPR-Cas 단백질)을 포함하는 핵산/단백질 조성물 및 NASC 폴리뉴클레오티드 조성물의 결합에 의한 표적 유전자의 전사 조정;

● 공여자 폴리뉴클레오티드가 또한 핵산/단백질 조성물에 테더링된 실시양태를 포함하여, 핵산 결합 단백질 (예를 들어, 부류 2 CRISPR-Cas 단백질)을 포함하는 핵산/단백질 조성물 및 NASC 폴리뉴클레오티드 조성물을 사용한 다중 표적 핵산 서열의 동시 표적화;

● 예를 들어 소분자의 제약 제제를 위해, 핵산 결합 단백질 (예를 들어, 부류 2 CRISPR-Cas 단백질)을 포함하는 핵산/단백질 조성물 및 NASC 폴리뉴클레오티드 조성물을 포함하는 생물학적 나노구조를 형성하는 것;

● 미리 규정된 크기 및 형상을 갖는, 핵산 결합 단백질 (예를 들어, 부류 2 CRISPR-Cas 단백질)을 포함하는 핵산/단백질 조성물 및 NASC 폴리뉴클레오티드 조성물을 갖는 나노규모 아키텍처를 구축하는 것;

● 미리 결정된 복합체 아키텍처로 자가-조립된, 핵산 결합 단백질 (예를 들어, 부류 2 CRISPR-Cas 단백질)을 포함하는 핵산/단백질 조성물 및 NASC 폴리뉴클레오티드 조성물을 포함하는 핵산/단백질 성분을 설계하는 것.

본원에 고려된 다양한 실시양태는 하기 중 하나 이상을 포함하나 이에 제한되지는 않는다. 실시양태는 참조의 용이성을 위해 넘버링된다.

본 발명의 실시양태는 하기를 포함하나 이에 제한되지는 않는다.

1. 제1 말단 및 제2 말단을 갖는 제1 이중-가닥 핵산 결합 단백질 결합 서열을 포함하는 제1 요소 1 - 반복 핵산 서열 1을 포함하며, 여기서 반복 핵산 서열 1은 제1 이중-가닥 핵산 결합 단백질 결합 서열의 제1 말단에 근접한 것인 제2 요소 1 - 핵산 서열 1을 포함하는 제3 요소 1 - 을 포함하는 제1 조작된 핵산; - 및 제1 말단 및 제2 말단을 갖는 제2 이중-가닥 핵산 결합 단백질 결합 서열을 포함하는 제1 요소 2 - 반복 핵산 서열 1C를 포함하며, 여기서 반복 핵산 서열 1C는 제1 이중-가닥 핵산 결합 단백질 결합 서열의 제1 말단에 근접한 것인 제2 요소 2 - 및 핵산 서열 2를 포함하는 제3 요소 2를 포함하는 제2 조작된 핵산을 포함하며; 여기서 반복 핵산 서열 1은 반복 핵산 서열 1과 반복 핵산 서열 1C 사이의 수소 결합을 통해 반복 핵산 서열 1C와 회합되는 것인, 스캐폴드를 형성하는 2종 이상의 조작된 핵산 서열의 복합체.

2. 실시양태 1에 있어서, 제1 조작된 핵산이 제1 이중-가닥 핵산 결합 단백질 결합 서열을 추가로 포함하며, 여기서 제1 말단은 5' 말단이고 제2 말단은 3' 말단인 제1 요소 1 - 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 1을 추가로 포함하며, 여기서 반복 핵산 서열 1의 3' 말단은 제1 이중-가닥 핵산 결합 단백질 결합 서열의 5' 말단의 5'에 위치하는 것인 제2 요소 1 - 및 5' 말단 및 3' 말단을 갖는 핵산 서열 1을 추가로 포함하며, 여기서 핵산 서열 1의 5' 말단은 제1 이중-가닥 핵산 결합 단백질 결합 서열의 3' 말단의 3'에 위치하는 것인 제3 요소 1을 포함하고; - 제2 조작된 핵산이 제2 이중-가닥 핵산 결합 단백질 결합 서열을 추가로 포함하며, 여기서 제1 말단은 5' 말단이고 제2 말단은 3' 말단인 제1 요소 2 - 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 1C를 추가로 포함하며, 여기서 반복 핵산 서열 1C의 3' 말단은 제2 이중-가닥 핵산 결합 단백질 결합 서열의 5' 말단의 5' 말단의 5'에 위치하는 것인 제2 요소 2 - 및 5' 말단 및 3' 말단을 갖는 핵산 서열 2를 추가로 포함하며, 여기서 핵산 서열 2의 5' 말단은 제2 이중-가닥 핵산 결합 단백질 결합 서열의 3' 말단의 3'에 위치하는 것인 제3 요소 2를 포함하는 것인 복합체.

3. 실시양태 1에 있어서, 제1 조작된 핵산이 제1 이중-가닥 핵산 결합 단백질 결합 서열을 추가로 포함하며, 여기서 제1 말단은 5' 말단이고 제2 말단은 3' 말단인 제1 요소 1 - 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 1을 추가로 포함하며, 여기서 반복 핵산 서열 1의 3' 말단은 제1 이중-가닥 핵산 결합 단백질 결합 서열의 5' 말단의 5'에 위치하는 것인 제2 요소 1 - 및 5' 말단 및 3' 말단을 갖는 핵산 서열 1을 추가로 포함하며, 여기서 핵산 서열 1의 3' 말단은 반복 핵산 서열 1의 5' 말단의 5'에 위치하는 것인 제3 요소 1을 포함하고; 제2 조작된 핵산이 제2 이중-가닥 핵산 결합 단백질 결합 서열을 추가로 포함하며, 여기서 제1 말단은 5' 말단이고 제2 말단은 3' 말단인 제1 요소 2 - 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 1C를 추가로 포함하며, 여기서 반복 핵산 서열 1C의 3' 말단은 제2 이중-가닥 핵산 결합 단백질 결합 서열의 5' 말단의 5' 말단의 5'에 위치하는 것인 제2 요소 2 - 및 5' 말단 및 3' 말단을 갖는 핵산 서열 2를 추가로 포함하며, 여기서 핵산 서열 2의 3' 말단은 반복 핵산 서열 1C의 5' 말단의 5'에 위치하는 것인 제3 요소 2를 포함하는 것인 복합체.

4. 제1 말단 및 제2 말단을 갖는 제1 핵산 결합 부류 2 CRISPR 단백질 결합 서열을 포함하는 제1 요소 1 - 반복 핵산 서열 1을 포함하며, 여기서 반복 핵산 서열 1은 제1 핵산 결합 부류 2 CRISPR 단백질 결합 서열의 제1 말단에 근접한 것인 제2 요소 1 - 및 핵산 서열 1을 포함하는 제3 요소 1을 포함하는 제1 조작된 핵산 서열; - 및 제1 말단 및 제2 말단을 갖는 제2 핵산 결합 부류 2 CRISPR 단백질 결합 서열을 포함하는 제1 요소 2 - 반복 핵산 서열 1C를 포함하며, 여기서 반복 핵산 서열 2는 제2 핵산 결합 부류 2 CRISPR 단백질 결합 서열의 제1 말단에 근접한 것인 제2 요소 2 - 및 핵산 서열 2를 포함하는 제3 요소 2를 포함하는 제2 조작된 핵산 서열을 포함하며; 여기서 반복 핵산 서열 1은 반복 핵산 서열 1과 반복 핵산 서열 1C 사이의 수소 결합을 통해 반복 핵산 서열 1C와 회합되는 것인, 스캐폴드를 형성하는 2종 이상의 조작된 핵산 서열의 복합체.

5. 실시양태 4에 있어서, 제1 핵산 결합 부류 2 CRISPR 단백질 결합 서열이 부류 2 제V형 CRISPR 단백질 결합 서열이며, 여기서 제1 말단은 5' 말단이고 제2 말단은 3' 말단이고 - 반복 핵산 서열 1이 5' 말단 및 3' 말단을 가지며, 여기서 반복 핵산 서열 1의 3' 말단은 제1 핵산 결합 부류 2 제V형 CRISPR 단백질 결합 서열의 5' 말단의 5'에 위치하고 - 핵산 서열 1이 5' 말단 및 3' 말단을 가지며, 여기서 핵산 서열 1의 5' 말단은 제1 핵산 결합 부류 2 제V형 CRISPR 단백질 결합 서열의 3' 말단의 3'에 위치하고; - 제2 핵산 결합 부류 2 CRISPR 단백질 결합 서열이 부류 2 제V형 CRISPR 단백질 결합 서열이며, 여기서 제1 말단은 5' 말단이고 제2 말단은 3' 말단이고 - 반복 핵산 서열 2가 5' 말단 및 3' 말단을 가지며, 여기서 반복 핵산 서열 2의 3' 말단은 제2 핵산 결합 부류 2 제V형 CRISPR 단백질 결합 서열의 5' 말단의 5'에 위치하고 - 핵산 서열 2가 5' 말단 및 3' 말단을 가지며, 여기서 핵산 서열 2의 5' 말단은 제2 핵산 결합 부류 2 제V형 CRISPR 단백질 결합 서열의 3' 말단의 3'에 위치하는 것인 복합체.

6. 실시양태 5에 있어서, 반복 핵산 서열 1이 5' 말단 및 3' 말단을 갖는 링커 요소 핵산 서열 1-1 - 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 1a - 5' 말단 및 3' 말단을 갖는 링커 요소 핵산 서열 1-2 - 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 1b - 및 5' 말단 및 3' 말단을 갖는 링커 요소 핵산 서열 1-3을 추가로 포함하며 이들은 하기 3'에서 5' 순서: 링커 요소 핵산 서열 1-1, 반복 핵산 서열 1a, 링커 요소 핵산 서열 1-2, 반복 핵산 서열 1b, 및 링커 요소 핵산 서열 1-3으로 배열되고; - 반복 핵산 서열 2가 5' 말단 및 3' 말단을 갖는 링커 요소 핵산 서열 2-1 - 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 1bC - 5' 말단 및 3' 말단을 갖는 링커 요소 핵산 서열 2-2 - 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 2a - 및 5' 말단 및 3' 말단을 갖는 링커 요소 핵산 서열 2-3을 추가로 포함하며 이들은 하기 3'에서 5' 순서: 링커 요소 핵산 서열 2-1, 반복 핵산 서열 1bC, 링커 요소 핵산 서열 2-2, 반복 핵산 서열 2a, 및 링커 요소 핵산 서열 2-3으로 배열되며; 여기서 반복 핵산 서열 1은 반복 핵산 서열 1b와 반복 핵산 서열 1bC 사이의 수소 결합을 통해 반복 핵산 서열 2와 회합되는 것인 복합체.

7. 실시양태 6에 있어서, 제3 핵산 결합 부류 2 제V형 CRISPR 단백질 결합 서열을 포함하며, 여기서 제1 말단은 5' 말단이고 제2 말단은 3' 말단인 제1 요소 3 - 및 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 3을 포함하며, 여기서 반복 핵산 서열 3의 3' 말단은 제3 핵산 결합 부류 2 제V형 CRISPR 단백질 결합 서열의 5' 말단의 5'에 위치하며, 여기서 반복 핵산 결합 서열 3은 5' 말단 및 3' 말단을 갖는 링커 요소 핵산 서열 3-1 - 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 2aC - 5' 말단 및 3' 말단을 갖는 링커 요소 핵산 서열 3-2 - 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 3a - 및 5' 말단 및 3' 말단을 갖는 링커 요소 핵산 서열 3-3을 추가로 포함하며 이들은 하기 3'에서 5' 순서: 링커 요소 핵산 서열 3-1, 반복 핵산 서열 2aC, 링커 요소 핵산 서열 3-2, 반복 핵산 서열 3a, 및 링커 요소 핵산 서열 3-3으로 배열되는 것인 제2 요소 3; - 및 5' 말단 및 3' 말단을 갖는 핵산 서열 3을 포함하며, 여기서 핵산 서열 3의 5' 말단은 제1 핵산 결합 부류 2 제V형 CRISPR 단백질 결합 서열의 3' 말단의 3'에 위치하는 것인 제3 요소 3을 포함하는 제3 조작된 핵산; - 및 제4 핵산 결합 부류 2 제V형 CRISPR 단백질 결합 서열을 포함하며, 여기서 제1 말단은 5' 말단이고 제2 말단은 3' 말단인 제1 요소 4 - 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 4를 포함하며, 여기서 반복 핵산 서열 3의 3' 말단은 제4 핵산 결합 부류 2 제V형 CRISPR 단백질 결합 서열의 5' 말단의 5'에 위치하며, 여기서 반복 핵산 결합 서열 4는 5' 말단 및 3' 말단을 갖는 링커 요소 핵산 서열 4-1 - 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 3aC - 5' 말단 및 3' 말단을 갖는 링커 요소 핵산 서열 4-2 - 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 1aC - 및 5' 말단 및 3' 말단을 갖는 링커 요소 핵산 서열 4-3을 추가로 포함하며 이들은 하기 3'에서 5' 순서: 링커 요소 핵산 서열 4-1, 반복 핵산 서열 3aC, 링커 요소 핵산 서열 4-2, 반복 핵산 서열 1aC, 및 링커 요소 핵산 서열 4-3으로 배열되는 것인 제2 요소 4; - 및 5' 말단 및 3' 말단을 갖는 핵산 서열 4를 추가로 포함하며, 여기서 핵산 서열 4의 5' 말단은 제1 핵산 결합 부류 2 제V형 CRISPR 단백질 결합 서열의 3' 말단의 3'에 위치하는 것인 제3 요소 4를 포함하는 제4 조작된 핵산을 추가로 포함하며; 여기서 반복 핵산 서열 1은 반복 핵산 서열 1b와 반복 핵산 서열 1bC 사이의 수소 결합을 통해 반복 핵산 서열 2와 회합되고, 반복 핵산 서열 1은 반복 핵산 서열 1a와 반복 핵산 서열 1aC 사이의 수소 결합을 통해 반복 핵산 서열 4와 회합되고, 반복 핵산 서열 2는 반복 핵산 서열 2a와 반복 핵산 서열 2aC 사이의 수소 결합을 통해 반복 핵산 서열 3과 회합되고, 반복 핵산 서열 3은 반복 핵산 서열 3a와 반복 핵산 서열 3aC 사이의 수소 결합을 통해 반복 핵산 서열 4와 회합되는 것인 복합체.

8. 실시양태 4 내지 7 중 어느 하나에 있어서, 반복 핵산 서열 1 및 반복 핵산 서열 2가 이중-가닥 핵산 결합 단백질 결합 부위 1을 추가로 포함하고, 이중-가닥 핵산 결합 단백질 결합 부위 1이 반복 핵산 서열 1과 반복 핵산 서열 2 사이의 수소 염기-쌍 결합에 의해 형성되는 것인 복합체.

9. 실시양태 8에 있어서, 이중-가닥 핵산 결합 단백질 결합 부위 1이 Csy4 단백질 결합 부위인 복합체.

10. 실시양태 4 내지 9 중 어느 하나에 있어서, 제1 조작된 핵산 및 제2 조작된 핵산이 각각 RNA, DNA 또는 그의 조합을 포함하는 것인 복합체.

11. 실시양태 7에 있어서, 제1 조작된 핵산, 제2 조작된 핵산, 제3 조작된 핵산 및 제4 조작된 핵산이 각각 RNA, DNA 또는 그의 조합을 포함하는 것인 복합체.

12. 실시양태 5 내지 11 중 어느 하나에 있어서, 제1 핵산 결합 부류 2 제V형 CRISPR 단백질 결합 서열 및 제2 핵산 결합 부류 2 제V형 CRISPR 단백질 결합 서열이 각각 Cpf1 단백질 결합 서열인 복합체.

13. 실시양태 7 또는 11에 있어서, 제1 핵산 결합 부류 2 제V형 CRISPR 단백질 결합 서열, 제2 핵산 결합 부류 2 제V형 CRISPR 단백질 결합 서열, 제3 핵산 결합 부류 2 제5형 CRISPR 단백질 결합 서열, 및 제4 핵산 결합 부류 2 제V형 CRISPR 단백질 결합 서열이 각각 Cpf1 단백질 결합 서열인 복합체.

14. 실시양태 5 내지 10 중 어느 하나에 있어서, (i) 핵산 서열 1이 스페이서 핵산 서열 1을 추가로 포함하고, 핵산 서열 2가 스페이서 핵산 서열 2를 추가로 포함하고, (ii) 스페이서 핵산 서열 1이 표적 핵산 서열 1에 상보적이고, 스페이서 핵산 서열 2가 표적 핵산 서열 2에 상보적인 복합체.

15. 실시양태 14에 있어서, 표적 핵산 서열 1 및 표적 핵산 서열 2가 각각 단일-가닥 RNA, 단일-가닥 DNA, 이중-가닥 RNA, 이중-가닥 DNA, 단일-가닥 RNA/DNA 하이브리드, 및 이중-가닥 RNA/DNA 하이브리드로 이루어진 군으로부터 선택되는 핵산 서열인 복합체.

16. 실시양태 7, 11 및 13 중 어느 하나에 있어서, (i) 핵산 서열 1이 스페이서 핵산 서열 1을 추가로 포함하고, 핵산 서열 2가 스페이서 핵산 서열 2를 추가로 포함하고, 핵산 서열 3이 스페이서 핵산 서열 3을 추가로 포함하고, 핵산 서열 4가 스페이서 핵산 서열 4를 추가로 포함하고, (ii) 스페이서 핵산 서열 1이 표적 핵산 서열 1에 상보적이고, 스페이서 핵산 서열 2가 표적 핵산 서열 2에 상보적이고, 스페이서 핵산 서열 3이 표적 핵산 서열 3에 상보적이고, 스페이서 핵산 서열 4가 표적 핵산 서열 4에 상보적인 복합체.

17. 실시양태 16에 있어서, 표적 핵산 서열 1, 표적 핵산 서열 2, 표적 핵산 서열 3, 및 표적 핵산 서열 4가 각각 단일-가닥 RNA, 단일-가닥 DNA, 이중-가닥 RNA, 이중-가닥 DNA, 단일-가닥 RNA/DNA 하이브리드, 및 이중-가닥 RNA/DNA 하이브리드로 이루어진 군으로부터 선택되는 핵산 서열인 복합체.

18. 실시양태 1 내지 17 중 어느 하나에 있어서, 제1 핵산 결합 부류 2 제V형 CRISPR 단백질 결합 서열에 결합된 제1 부류 2 제V형 CRISPR 단백질, 및 제2 핵산 결합 부류 2 제V형 CRISPR 단백질 결합 서열에 결합된 제2 부류 2 제V형 CRISPR 단백질을 추가로 포함하며, 여기서 제1 부류 2 제V형 CRISPR 단백질 및 제2 부류 2 제V형 CRISPR 단백질은 각각 Cpf1 단백질 및 촉매적으로 불활성인 Cpf1 단백질로 이루어진 군으로부터 선택되는 것인, 스캐폴드를 형성하는 2종 이상의 조작된 핵산 서열의 복합체.

19. 실시양태 7, 11, 13 및 16 중 어느 하나에 있어서, 제1 핵산 결합 부류 2 제V형 CRISPR 단백질 결합 서열에 결합된 제1 부류 2 제V형 CRISPR 단백질, 제2 핵산 결합 부류 2 제V형 CRISPR 단백질 결합 서열에 결합된 제2 부류 2 제V형 CRISPR 단백질, 제3 핵산 결합 부류 2 제V형 CRISPR 단백질 결합 서열에 결합된 제3 부류 2 제V형 CRISPR 단백질, 및 제4 핵산 결합 부류 2 제V형 CRISPR 단백질 결합 서열에 결합된 제4 부류 2 제V형 CRISPR 단백질을 추가로 포함하며, 여기서 제1 부류 2 제V형 CRISPR 단백질, 제2 부류 2 제V형 CRISPR 단백질, 제3 부류 2 제V형 CRISPR 단백질, 및 제4 부류 2 제V형 CRISPR 단백질은 각각 Cpf1 단백질 및 촉매적으로 불활성인 Cpf1 단백질로 이루어진 군으로부터 선택되는 것인, 스캐폴드를 형성하는 2종 이상의 조작된 핵산 서열의 복합체.

20. 실시양태 4에 있어서, 제1 핵산 결합 부류 2 CRISPR 단백질 결합 서열이 부류 2 제II형 CRISPR 단백질 결합 서열이며, 여기서 제1 말단은 5' 말단이고 제2 말단은 3' 말단이고 - 반복 핵산 서열 1이 5' 말단 및 3' 말단을 가지며, 여기서 반복 핵산 서열 1의 3' 말단은 제1 핵산 결합 부류 2 제II형 CRISPR 단백질 결합 서열의 5' 말단의 5'에 위치하고 - 핵산 서열 1이 5' 말단 및 3' 말단을 가지며, 여기서 핵산 서열 1의 3' 말단은 반복 핵산 서열 1의 5' 말단의 5'에 위치하고; - 제2 핵산 결합 부류 2 CRISPR 단백질 결합 서열이 부류 2 제II형 CRISPR 단백질 결합 서열이며, 여기서 제1 말단은 5' 말단이고 제2 말단은 3' 말단이고 - 반복 핵산 서열 1C가 5' 말단 및 3' 말단을 가지며, 여기서 반복 핵산 서열 1C의 3' 말단은 제2 핵산 결합 부류 2 제II형 CRISPR 단백질 결합 서열의 5' 말단의 5'에 위치하고 - 핵산 서열 2가 5' 말단 및 3' 말단을 가지며, 여기서 핵산 서열 2의 3' 말단은 반복 핵산 서열 1C의 5' 말단의 5'에 위치하는 것인 복합체.

21. 실시양태 20에 있어서, 반복 핵산 서열 1이 5' 말단 및 3' 말단을 갖는 링커 요소 핵산 서열 1-1 - 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 1a - 5' 말단 및 3' 말단을 갖는 링커 요소 핵산 서열 1-2 - 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 1b - 및 5' 말단 및 3' 말단을 갖는 링커 요소 핵산 서열 1-3을 추가로 포함하며 이들은 하기 3'에서 5' 순서: 링커 요소 핵산 서열 1-1, 반복 핵산 서열 1a, 링커 요소 핵산 서열 1-2, 반복 핵산 서열 1b, 및 링커 요소 핵산 서열 1-3으로 배열되고; - 반복 핵산 서열 2가 5' 말단 및 3' 말단을 갖는 링커 요소 핵산 서열 2-1 - 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 1aC - 5' 말단 및 3' 말단을 갖는 링커 요소 핵산 서열 2-2 - 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 1bC - 및 5' 말단 및 3' 말단을 갖는 링커 요소 핵산 서열 2-3을 추가로 포함하며 이들은 하기 3'에서 5' 순서: 링커 요소 핵산 서열 2-3, 반복 핵산 서열 1bC, 링커 요소 핵산 서열 2-2, 반복 핵산 서열 1aC, 및 링커 요소 핵산 서열 2-1로 배열되며; 여기서 반복 핵산 서열 1은 반복 핵산 서열 1a와 반복 핵산 서열 1aC 사이의 수소 결합을 통해 및 반복 핵산 서열 1b와 반복 핵산 서열 1bC 사이의 수소 결합을 통해 반복 핵산 서열 2와 회합되는 것인 복합체.

22. 실시양태 21에 있어서, 반복 핵산 서열 1a가 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 1a1 - 5' 말단 및 3' 말단을 갖는 벌지 핵산 서열 1a1 - 및 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 1a2를 추가로 포함하며 이들은 하기 3'에서 5' 순서: 반복 핵산 서열 1a1, 벌지 핵산 서열 1a1, 및 반복 핵산 서열 1a2로 배열되고; - 반복 핵산 서열 1b가 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 1b1 - 5' 말단 및 3' 말단을 갖는 벌지 핵산 서열 1b1 - 및 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 1b2를 추가로 포함하며 이들은 하기 3'에서 5' 순서: 반복 핵산 서열 1b1, 벌지 핵산 서열 1b1, 및 반복 핵산 서열 1b2로 배열되고; 반복 핵산 서열 1bC가 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 1b2C - 5' 말단 및 3' 말단을 갖는 벌지 핵산 서열 2b2 - 및 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 1b1C를 추가로 포함하며 이들은 하기 3'에서 5' 순서: 반복 핵산 서열 1b2C, 벌지 핵산 서열 2b2, 및 반복 핵산 서열 1b1C로 배열되고 - 반복 핵산 서열 1aC가 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 1a2C - 5' 말단 및 3' 말단을 갖는 벌지 핵산 서열 2a2 - 및 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 1a1C를 추가로 포함하며 이들은 하기 3'에서 5' 순서:반복 핵산 서열 1a2C, 벌지 핵산 서열 2a2, 및 반복 핵산 서열 1a1C로 배열되며; 여기서 반복 핵산 서열 1은 반복 핵산 서열 1a1과 반복 핵산 서열 1a1C, 반복 핵산 서열 1a2와 반복 핵산 서열 1a2C, 반복 핵산 서열 1b1과 반복 핵산 서열 1b1C, 반복 핵산 서열 1b2와 반복 핵산 서열 1b2C 사이의 수소 결합을 통해 반복 핵산 서열 2와 회합되는 것인 복합체.

23. 실시양태 20 내지 22 중 어느 하나에 있어서, 반복 핵산 서열 1 및 반복 핵산 서열 2가 이중-가닥 핵산 결합 단백질 결합 부위 1을 포함하고, 이중-가닥 핵산 결합 단백질 결합 부위 1이 반복 핵산 서열 1과 반복 핵산 서열 2 사이의 수소 염기-쌍 결합에 의해 형성되는 것인 복합체.

24. 실시양태 23에 있어서, 이중-가닥 핵산 결합 단백질 결합 부위 1이 Csy4 단백질 결합 부위인 복합체.

25. 실시양태 20 내지 24 중 어느 하나에 있어서, 제1 조작된 핵산 및 제2 조작된 핵산이 각각 RNA, DNA 또는 그의 조합을 포함하는 것인 복합체.

26. 실시양태 20 내지 25 중 어느 하나에 있어서, 제1 핵산 결합 부류 2 제II형 CRISPR 단백질 결합 서열 및 제2 핵산 결합 부류 2 제II형 CRISPR 단백질 결합 서열이 각각 Cas9 단백질 결합 서열인 복합체.

27. 실시양태 20 내지 26 중 어느 하나에 있어서, (i) 핵산 서열 1이 스페이서 핵산 서열 1을 추가로 포함하고, 핵산 서열 2가 스페이서 핵산 서열 2를 추가로 포함하고, (ii) 스페이서 핵산 서열 1이 표적 핵산 서열 1에 상보적이고, 스페이서 핵산 서열 2가 표적 핵산 서열 2에 상보적인 복합체.

28. 실시양태 27에 있어서, 표적 핵산 서열 1 및 표적 핵산 서열 2가 각각 단일-가닥 RNA, 단일-가닥 DNA, 이중-가닥 RNA, 이중-가닥 DNA, 단일-가닥 RNA/DNA 하이브리드, 및 이중-가닥 RNA/DNA 하이브리드로 이루어진 군으로부터 선택되는 핵산 서열인 복합체.

29. 실시양태 20 내지 28 중 어느 하나에 있어서, 제1 핵산 결합 부류 2 제II형 CRISPR 단백질 결합 서열에 결합된 제1 부류 2 제II형 CRISPR 단백질, 및 제2 핵산 결합 부류 2 제II형 CRISPR 단백질 결합 서열에 결합된 제2 부류 2 제II형 CRISPR 단백질을 추가로 포함하며, 여기서 제1 부류 2 제II형 CRISPR 단백질 및 제2 부류 2 제II형 CRISPR 단백질은 각각 Cas9 단백질 및 촉매적으로 불활성인 Cas9 단백질로 이루어진 군으로부터 선택되는 것인, 스캐폴드를 형성하는 2종 이상의 조작된 핵산 서열의 복합체.

30. 5' 말단 및 3' 말단을 갖는 제1 핵산 결합 부류 2 제II형 CRISPR 단백질 결합 서열 - 및 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 1을 포함하며, 여기서 반복 핵산 서열 1의 3' 말단은 제1 핵산 결합 부류 2 제II형 CRISPR 단백질 결합 서열의 5' 말단의 5'에 위치하고, 반복 핵산 서열 1은 5' 말단 및 3' 말단을 갖는 링커 요소 핵산 서열 1-1 - 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 1a - 5' 말단 및 3' 말단을 갖는 링커 요소 핵산 서열 1-2 - 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 1b - 및 5' 말단 및 3' 말단을 갖는 링커 요소 핵산 서열 1-3을 추가로 포함하며 이들은 하기 3'에서 5' 순서: 링커 요소 핵산 서열 1-1, 반복 핵산 서열 1a, 링커 요소 핵산 서열 1-2, 반복 핵산 서열 1b, 및 링커 요소 핵산 서열 1-3으로 배열되는 것인 제1 CRISPR 요소 1; - 및 5' 말단 및 3' 말단을 갖는 핵산 서열 1을 추가로 포함하며, 여기서 (i) 핵산 서열 1의 3' 말단은 반복 핵산 서열 1의 5' 말단의 5'에 위치하고, (ii) 핵산 서열 1은 스페이서 핵산 서열 1을 포함하는 것인 제2 CRISPR 요소 1을 포함하는 제1 조작된 핵산; - 5' 말단 및 3' 말단을 갖는 제2 핵산 결합 부류 2 제II형 CRISPR 단백질 결합 서열 - 및 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 2를 포함하며, 여기서 반복 핵산 서열 2의 3' 말단은 제2 핵산 결합 부류 2 제II형 CRISPR 단백질 결합 서열의 5' 말단의 5'에 위치하고, 반복 핵산 서열 2는 5' 말단 및 3' 말단을 갖는 링커 요소 핵산 서열 2-3 - 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 1bC - 5' 말단 및 3' 말단을 갖는 링커 요소 핵산 서열 2-4 - 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 2a - 및 5' 말단 및 3' 말단을 갖는 링커 요소 핵산 서열 2-5를 추가로 포함하며 이들은 하기 3'에서 5' 순서: 링커 요소 핵산 서열 2-3, 반복 핵산 서열 1bC, 링커 요소 핵산 서열 2-4, 반복 핵산 서열 2a, 및 링커 요소 핵산 서열 2-5로 배열되는 것인 제1 CRISPR 요소 2; - 5' 말단 및 3' 말단을 갖는 핵산 서열 2를 포함하며, 여기서 (i) 핵산 서열 1의 3' 말단은 반복 핵산 서열 2의 5' 말단의 5'에 위치하고, (ii) 핵산 서열 2는 스페이서 핵산 서열 2를 포함하는 것인 제2 CRISPR 요소 2를 포함하는 제2 조작된 핵산; - 및 5' 말단 및 3' 말단을 갖는 제3 핵산 결합 부류 2 제II형 CRISPR 단백질 결합 서열 - 및 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 3을 포함하며, 여기서 반복 핵산 서열 3의 3' 말단은 제3 핵산 결합 부류 2 제II형 CRISPR 단백질 결합 서열의 5' 말단의 5'에 위치하고, 반복 핵산 서열 3은 5' 말단 및 3' 말단을 갖는 링커 요소 핵산 서열 3-1 - 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 2aC - 5' 말단 및 3' 말단을 갖는 링커 요소 핵산 서열 3-2 - 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 1aC-1 - 및 5' 말단 및 3' 말단을 갖는 링커 요소 핵산 서열 3-3을 추가로 포함하며 이들은 하기 3'에서 5' 순서: 링커 요소 핵산 서열 3-1, 반복 핵산 서열 2aC, 링커 요소 핵산 서열 3-2, 반복 핵산 서열 1aC-1, 및 링커 요소 핵산 서열 3-3으로 배열되는 것인 제1 CRISPR 요소 3; 5' 말단 및 3' 말단을 갖는 핵산 서열 3을 포함하며, 여기서 (i) 핵산 서열 3의 3' 말단은 반복 핵산 서열 3의 5' 말단의 5'에 위치하고, (ii) 핵산 서열 3은 스페이서 핵산 서열 3을 포함하는 것인 제2 CRISPR 요소 3을 포함하는 제3 조작된 핵산을 포함하며, 여기서 반복 핵산 서열 1a는 반복 핵산 서열 1a와 반복 핵산 서열 1aC-1 사이의 수소 결합을 통해 반복 핵산 서열 1aC-1과 회합되고, 반복 핵산 서열 1b는 반복 핵산 서열 1b와 반복 핵산 서열 1bC 사이의 수소 결합을 통해 반복 핵산 서열 1bC와 회합되고, 반복 핵산 서열 2a는 반복 핵산 서열 2a와 반복 핵산 서열 2aC 사이의 수소 결합을 통해 반복 핵산 서열 2aC와 회합되는 것인, 스캐폴드를 형성하는 3종 이상의 조작된 핵산 서열의 복합체.

31. 실시양태 30에 있어서, 반복 핵산 서열 1 및 반복 핵산 서열 2가 이중-가닥 핵산 결합 단백질 결합 부위 1을 포함하고, 이중-가닥 핵산 결합 단백질 결합 부위 1이 반복 핵산 서열 1과 반복 핵산 서열 2 사이의 수소 염기-쌍 결합에 의해 형성되는 것인 복합체.

32. 실시양태 31에 있어서, 이중-가닥 핵산 결합 단백질 결합 부위 1이 Csy4 단백질 결합 부위인 복합체.

33. 실시양태 30 내지 32 중 어느 하나에 있어서, 제1 조작된 핵산, 제2 조작된 핵산, 및 제3 조작된 핵산이 각각 RNA, DNA 또는 그의 조합을 포함하는 것인 복합체.

34. 실시양태 30 내지 33 중 어느 하나에 있어서, 제1 핵산 결합 부류 2 제II형 CRISPR 단백질 결합 서열, 제2 핵산 결합 부류 2 제II형 CRISPR 단백질 결합 서열, 및 제3 핵산 결합 부류 2 제II형 CRISPR 단백질 결합 서열이 각각 Cas9 단백질 결합 서열인 복합체.

35. 실시양태 30 내지 34 중 어느 하나에 있어서, (i) 핵산 서열 1이 스페이서 핵산 서열 1을 추가로 포함하고, 핵산 서열 2가 스페이서 핵산 서열 2를 추가로 포함하고, 핵산 서열 3이 스페이서 핵산 서열 3을 추가로 포함하고, (ii) 스페이서 핵산 서열1이 표적 핵산 서열 1에 상보적이고, 스페이서 핵산 서열 2가 표적 핵산 서열 2에 상보적이고, 스페이서 핵산 서열 3이 표적 핵산 서열 3에 상보적인 복합체.

36. 실시양태 35에 있어서, 표적 핵산 서열 1, 표적 핵산 서열 2, 및 표적 핵산 서열 3이 각각 단일-가닥 RNA, 단일-가닥 DNA, 이중-가닥 RNA, 이중-가닥 DNA, 단일-가닥 RNA/DNA 하이브리드, 및 이중-가닥 RNA/DNA 하이브리드로 이루어진 군으로부터 선택되는 핵산 서열인 복합체.

37. 실시양태 30 내지 36 중 어느 하나에 있어서, 제1 핵산 결합 부류 2 제II형 CRISPR 단백질 결합 서열에 결합된 제1 부류 2 제II형 CRISPR 단백질, 제2 핵산 결합 부류 2 제II형 CRISPR 단백질 결합 서열에 결합된 제2 부류 2 제II형 CRISPR 단백질, 및 제3 핵산 결합 부류 2 제II형 CRISPR 단백질 결합 서열에 결합된 제3 부류 2 제II형 CRISPR 단백질을 추가로 포함하며, 여기서 제1 부류 2 제II형 CRISPR 단백질, 제2 부류 2 제II형 CRISPR 단백질, 및 제3 부류 2 제II형 CRISPR 단백질은 각각 Cas9 단백질 및 촉매적으로 불활성인 Cas9 단백질로 이루어진 군으로부터 선택되는 것인, 스캐폴드를 형성하는 3종 이상의 조작된 핵산 서열의 복합체.

38. 5' 말단 및 3' 말단을 갖는 제1 핵산 결합 부류 2 제II형 CRISPR 단백질 결합 서열을 포함하는 제1 연쇄 요소 1 - 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 A1을 포함하며, 여기서 제1 핵산 결합 부류 2 제II형 CRISPR 단백질 결합 서열은 반복 핵산 서열 A1의 3' 말단의 3'에 위치하는 것인 제2 연쇄 요소 1 - 5' 말단 및 3' 말단을 갖는 제2 핵산 결합 부류 2 제II형 CRISPR 단백질 결합 서열을 포함하는 제1 연쇄 요소 2 - 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 A2를 포함하며, 여기서 제2 핵산 결합 부류 2 제II형 CRISPR 단백질 결합 서열은 반복 핵산 서열 A2의 3' 말단의 3'에 위치하는 것인 제2 연쇄 요소 2 (여기서 제1 연쇄 요소 1의 5' 말단은 제1 연쇄 요소 2의 3' 말단에 공유 결합되어 조작된 연쇄된 핵산 1을 형성함); - 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 A1C 및 5' 말단 및 3' 말단을 갖는 핵산 서열 1을 포함하며, 여기서 핵산 서열 1은 반복 핵산 서열 A1C의 5' 말단의 5'에 위치하는 것인, 5' 말단 및 3' 말단을 갖는 제3 연쇄 요소 1 (여기서 (i) 반복 핵산 서열 A1C는 반복 핵산 서열 A1에 상보적이고, (ii) 반복 핵산 서열 A1C는 반복 핵산 서열 A1C와 반복 핵산 서열 A1 사이의 수소 결합을 통해 반복 핵산 서열 A1과 회합됨); - 및 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 A2C 및 5' 말단 및 3' 말단을 갖는 핵산 서열 2를 포함하며, 여기서 핵산 서열 2는 반복 핵산 서열 A2C의 5' 말단의 5'에 위치하는 것인, 5' 말단 및 3' 말단을 갖는 제3 연쇄 요소 (여기서 (i) 반복 핵산 서열 A2C는 반복 핵산 서열 A2에 상보적이고, (ii) 반복 핵산 서열 A2C는 반복 핵산 서열 A2와 회합되고, (iii) 반복 핵산 서열 A2C는 반복 핵산 서열 A2C와 반복 핵산 서열 A2 사이의 수소 결합을 통해 반복 핵산 서열 A2와 회합됨)를 포함하는, 5' 말단 및 3' 말단을 갖는 조작된 연쇄된 핵산 1을 포함하는, 스캐폴드를 형성하는 2종 이상의 조작된 핵산 서열의 복합체.

39. 실시양태 38에 있어서, 반복 핵산 서열 A1이 링커 요소 핵산 서열 A1-1의 3' 말단이 제1 핵산 결합 부류 2 제II형 CRISPR 단백질 결합 서열의 5' 말단의 5'에 위치하고, 링커 요소 핵산 서열 A1-1이 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 A1-1 및 5' 말단 및 3' 말단을 갖는 벌지 핵산 서열 A1-1을 포함하며, 벌지 핵산 서열 A1-1의 3' 말단은 반복 핵산 서열 A1-1의 5' 말단에 인접한, 5' 말단 및 3' 말단을 갖는 링커 요소 핵산 서열 A1-1 - 및 링커 요소 핵산 서열 A1-2가 링커 요소 핵산 A1-1의 5' 말단의 5'에 위치한, 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 A1-2를 추가로 포함하고; - 반복 핵산 서열 A2가 링커 요소 핵산 서열 A2-1의 3' 말단이 제2 핵산 결합 부류 2 제II형 CRISPR 단백질 결합 서열의 5' 말단의 5'에 위치하고, 링커 요소 핵산 서열 A2-1이 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 A2-1 및 5' 말단 및 3' 말단을 갖는 벌지 핵산 서열 A2-1을 포함하며, 벌지 핵산 서열 A2-1의 3' 말단은 반복 핵산 서열 A2-1의 5' 말단에 인접한, 5' 말단 및 3' 말단을 갖는 링커 요소 핵산 서열 A2-1 - 및 링커 요소 핵산 서열 A2-2의 3' 말단이 링커 요소 핵산 A2-1의 5' 말단의 5'에 위치한, 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 A2-2를 포함하는, 5' 말단 및 3' 말단을 갖는 링커 요소 핵산 서열 A2-2를 추가로 포함하고; - 반복 핵산 서열 A1C가 반복 핵산 서열 A1-1C의 5' 말단이 핵산 서열 1의 3' 말단의 3'에 위치한, 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 A1-1C 및 벌지 핵산 서열 A1-1C의 5' 말단이 반복 핵산 서열 A1-1C의 3' 말단의 3'에 위치한, 5' 말단 및 3' 말단을 갖는 벌지 핵산 서열 A1-1C를 포함하며, 여기서 (i) 반복 핵산 서열 A1-1C는 반복 핵산 서열 A1-1에 상보적이고, (ii) 반복 핵산 서열 A1-1C는 반복 핵산 서열 A1-1C와 반복 핵산 서열 A1-1 사이의 수소 결합을 통해 반복 핵산 서열 A1-1과 회합되는 것인 링커 요소 핵산 서열 A1-1C - 및 링커 요소 핵산 서열 A1-2C의 5' 말단이 링커 요소 핵산 서열 A1-1C의 3' 말단의 3'에 위치한, 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 A1-2C를 포함하며, 여기서 (i) 반복 핵산 서열 A1-2C는 반복 핵산 서열 A1-2에 상보적이고, (ii) 반복 핵산 서열 A1-2C는 반복 핵산 서열 A1-2C와 반복 핵산 서열 A1-2 사이의 수소 결합을 통해 반복 핵산 서열 A1-2와 회합되는 것인, 5' 말단 및 3' 말단을 갖는 링커 요소 핵산 서열 A1-2C를 추가로 포함하고; - 반복 핵산 서열 A2C가 반복 핵산 서열 A2-1C의 5' 말단이 핵산 서열 2의 3' 말단의 3'에 위치한, 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 A2-1C 및 벌지 핵산 서열 A2-1C의 5' 말단이 반복 핵산 서열 A2-1C의 3' 말단의 3'에 위치한, 5' 말단 및 3' 말단을 갖는 벌지 핵산 서열 A2-1C를 포함하며, 여기서 (i) 반복 핵산 서열 A2-1C는 반복 핵산 서열 A2-1에 상보적이고, (ii) 반복 핵산 서열 A2-1C는 반복 핵산 서열 A2-1C와 반복 핵산 서열 A2-1 사이의 수소 결합을 통해 반복 핵산 서열 A2-1과 회합되는 것인 링커 요소 핵산 서열 A2-1C - 및 링커 요소 핵산 서열 A2-2C의 5' 말단이 링커 요소 핵산 서열 A2-1C의 3' 말단의 3'에 위치한, 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 A2-2C를 포함하며, 여기서 (i) 반복 핵산 서열 A2-2C는 반복 핵산 서열 A2-2에 상보적이고, (ii) 반복 핵산 서열 A2-2C는 반복 핵산 서열 A2-2C와 반복 핵산 서열 A2-2 사이의 수소 결합을 통해 반복 핵산 서열 A2-2와 회합되는 것인, 5' 말단 및 3' 말단을 갖는 링커 요소 핵산 서열 A2-2C를 추가로 포함하는 것인 복합체.

40. 실시양태 38 또는 39에 있어서, 반복 핵산 서열 A1 및 반복 핵산 서열 A1C가 이중-가닥 핵산 결합 단백질 결합 부위 1을 추가로 포함하고, 이중-가닥 핵산 결합 단백질 결합 부위 1이 반복 핵산 서열 A1과 반복 핵산 서열 A1C 사이의 수소 염기-쌍 결합에 의해 형성되는 것인 복합체.

41. 실시양태 38 내지 40 중 어느 하나에 있어서, 반복 핵산 서열 A2 및 반복 핵산 서열 A2C가 이중-가닥 핵산 결합 단백질 결합 부위 2를 추가로 포함하고, 이중-가닥 핵산 결합 단백질 결합 부위 2가 반복 핵산 서열 A2와 반복 핵산 서열 A2C 사이의 수소 염기-쌍 결합에 의해 형성되는 것인 복합체.

42. 실시양태 40 또는 41에 있어서, 이중-가닥 핵산 결합 단백질 결합 부위 1이 Csy4 단백질 결합 부위인 복합체.

43. 실시양태 38 내지 42 중 어느 하나에 있어서, 조작된 연쇄된 핵산 1, 제3 연쇄 요소 1, 및 제3 연쇄 요소 2가 각각 RNA, DNA 또는 그의 조합을 포함하는 것인 복합체.

44. 실시양태 38 내지 43 중 어느 하나에 있어서, 제1 핵산 결합 부류 2 제II형 CRISPR 단백질 결합 서열 및 제2 핵산 결합 부류 2 제II형 CRISPR 단백질 결합 서열이 각각 Cas9 단백질 결합 서열인 복합체.

45. 실시양태 38 내지 44 중 어느 하나에 있어서, (i) 핵산 서열 1이 스페이서 핵산 서열 1을 추가로 포함하고, 핵산 서열 2가 스페이서 핵산 서열 2를 추가로 포함하고, (ii) 스페이서 핵산 서열 1이 표적 핵산 서열 1에 상보적이고, 스페이서 핵산 서열 2가 표적 핵산 서열 2에 상보적인 복합체.

46. 실시양태 45에 있어서, 표적 핵산 서열 1 및 표적 핵산 서열 2가 각각 단일-가닥 RNA, 단일-가닥 DNA, 이중-가닥 RNA, 이중-가닥 DNA, 단일-가닥 RNA/DNA 하이브리드, 및 이중-가닥 RNA/DNA 하이브리드로 이루어진 군으로부터 선택되는 핵산 서열인 복합체.

47. 실시양태 38 내지 46 중 어느 하나에 있어서, 제1 핵산 결합 부류 2 제II형 CRISPR 단백질 결합 서열에 결합된 제1 부류 2 제II형 CRISPR 단백질 및 제2 핵산 결합 부류 2 제II형 CRISPR 단백질 결합 서열에 결합된 제2 부류 2 제II형 CRISPR 단백질을 추가로 포함하며, 여기서 제1 부류 2 제II형 CRISPR 단백질 및 제2 부류 2 제II형 CRISPR 단백질은 각각 Cas9 단백질 및 촉매적으로 불활성인 Cas9 단백질로 이루어진 군으로부터 선택되는 것인, 스캐폴드를 형성하는 2종 이상의 조작된 핵산 서열의 복합체.

48. 제1 핵산 결합 부류 2 제II형 CRISPR 단백질 결합 서열 및 5' 말단 및 3' 말단을 갖는 스플릿-넥서스 스템 요소 핵산 서열 1-1을 포함하며, 여기서 제1 핵산 결합 부류 2 제II형 CRISPR 단백질 결합 서열은 스플릿-넥서스 스템 요소 핵산 서열 1-1의 3' 말단의 3'에 위치하는 것인, 5' 말단 및 3' 말단을 갖는 제1 스플릿-넥서스 요소 1 - 및 제2 핵산 결합 부류 2 제II형 CRISPR 단백질 결합 서열 및 5' 말단 및 3' 말단을 갖는 스플릿-넥서스 스템 요소 핵산 서열 2-1을 포함하며, 여기서 제2 핵산 결합 부류 2 제II형 CRISPR 단백질 결합 서열은 스플릿-넥서스 스템 요소 핵산 서열 2-1의 3' 말단의 3'에 위치하는 것인, 5' 말단 및 3' 말단을 갖는 제1 스플릿-넥서스 요소 2, - 및 5' 말단 및 3' 말단을 갖는 보조 폴리뉴클레오티드 1-1 (여기서 제1 스플릿-넥서스 요소 1의 5' 말단은 보조 폴리뉴클레오티드 1-1의 3' 말단에 공유 결합되고, 보조 폴리뉴클레오티드 1-1의 5' 말단은 제1 스플릿-넥서스 요소 2의 3' 말단에 공유 결합되어 연쇄된 스플릿-넥서스 요소를 형성함); - 5' 말단 및 3' 말단을 갖는 핵산 서열 1 및 5' 말단 및 3' 말단을 갖는 제1 스템 요소 핵산 서열 1-1을 포함하며, 여기서 핵산 서열 1의 3' 말단은 제1 스템 요소 핵산 서열 1-1의 5' 말단에 공유 결합되는 것인, 5' 말단 및 3' 말단을 갖는 제2 스플릿-넥서스 요소 1 - 5' 말단 및 3' 말단을 갖는 루프 요소 핵산 서열 1 (여기서 제1 스템 요소 핵산 서열 1-1의 3' 말단은 루프 요소 핵산 서열 1의 5' 말단에 공유 결합됨) - 5' 말단 및 3' 말단을 갖는 제1 스템 요소 핵산 서열 1-2 (여기서 루프 요소 핵산 서열 1의 3' 말단은 제1 스템 요소 핵산 서열 1-2의 5' 말단에 공유 결합됨) - 5' 말단 및 3' 말단을 갖는 연결 핵산 서열 1 (여기서 제1 스템 요소 핵산 서열 1-2의 3' 말단은 연결 핵산 서열 1의 5' 말단에 공유 결합됨) - 및 스플릿-넥서스 스템 요소 핵산 서열 1-2 (여기서 연결 핵산 서열 1의 3' 말단은 스템 요소 핵산 서열 1-2의 5' 말단에 공유 결합되며, 여기서 (i) 제1 스템 요소 핵산 서열 1-1 및 제1 스템 요소 핵산 서열 1-2는 제1 스템 요소 핵산 서열 1-1과 제1 스템 요소 핵산 서열 1-2 사이의 수소 염기-쌍 결합에 의해 제1 스템 요소 1을 형성하고, (ii) 스플릿-넥서스 스템 요소 핵산 서열 1-1 및 스플릿-넥서스 스템 요소 핵산 서열 1-2는 스플릿-넥서스 스템 요소 핵산 서열 1-1과 스플릿-넥서스 스템 요소 핵산 서열 1-2 사이의 수소 염기-쌍 결합에 의해 스플릿-넥서스 스템 요소 1을 형성함); - 5' 말단 및 3' 말단을 갖는 핵산 서열 2 및 5' 말단 및 3' 말단을 갖는 제1 스템 요소 핵산 서열 2-1을 포함하며, 여기서 핵산 서열 2의 3' 말단은 제1 스템 요소 핵산 서열 2-1의 5' 말단에 공유 결합되는 것인, 5' 말단 및 3' 말단을 갖는 제2 스플릿-넥서스 요소 2 - 5' 말단 및 3' 말단을 갖는 루프 요소 핵산 서열 2 (여기서 제1 스템 요소 핵산 서열 2-1의 3' 말단은 루프 요소 핵산 서열 2의 5' 말단에 공유 결합됨) - 5' 말단 및 3' 말단을 갖는 제1 스템 요소 핵산 서열 2-2 (여기서 루프 요소 핵산 서열 2의 3' 말단은 제1 스템 요소 핵산 서열 2-2의 5' 말단에 공유 결합됨) - 5' 말단 및 3' 말단을 갖는 연결 핵산 서열 2 (여기서 제1 스템 요소 핵산 서열 2-2의 3' 말단은 연결 핵산 서열 2의 5' 말단에 공유 결합됨) - 및 스플릿-넥서스 스템 요소 핵산 서열 2-2 (여기서 연결 핵산 서열 1의 3' 말단은 스플릿-넥서스 스템 요소 핵산 서열 2-2의 5' 말단에 공유 결합되며, 여기서 (i) 제1 스템 요소 핵산 서열 2-1 및 제1 스템 요소 핵산 서열 2-2는 제1 스템 요소 핵산 서열 2-1과 제1 스템 요소 핵산 서열 2-2 사이의 수소 염기-쌍 결합에 의해 제1 스템 요소 2를 형성하고, (ii) 스플릿-넥서스 스템 요소 핵산 서열 2-1 및 스플릿-넥서스 스템 요소 핵산 서열 2-2는 스플릿-넥서스 스템 요소 핵산 서열 2-1과 스플릿-넥서스 스템 요소 핵산 서열 2-2 사이의 수소 염기-쌍 결합에 의해 스플릿-넥서스 스템 요소 2를 형성함)를 포함하는, 5' 말단 및 3' 말단을 갖는 조작된 연쇄된 스플릿-넥서스 핵산 1을 포함하는, 스캐폴드를 형성하는 2종 이상의 조작된 핵산 서열의 복합체.

49. 실시양태 48에 있어서, 제1 스템 요소 1이 5'에서 3' 방향으로 하부 스템 요소 핵산 서열 1-1, 벌지 요소 핵산 서열 1-1, 상부 스템 요소 핵산 서열 1-1, 루프 요소 핵산 서열 1, 상부 스템 요소 핵산 서열 1-2, 벌지 요소 핵산 서열 1-2, 및 하부 스템 요소 핵산 서열 1-2를 추가로 포함하며, 여기서 상부 스템 요소 핵산 서열 1-1 및 상부 스템 요소 핵산 서열 1-2는 상부 스템 요소 뉴클레오티드 서열 1-1과 상부 스템 요소 뉴클레오티드 서열 1-2 사이의 수소 염기-쌍 결합에 의해 상부 스템 요소 1을 형성하고, 하부 스템 요소 핵산 서열 1-1 및 하부 스템 요소 핵산 서열 1-2는 하부 스템 요소 핵산 서열 1-1과 하부 스템 요소 뉴클레오티드 서열 1-2 사이의 수소 염기-쌍 결합에 의해 하부 스템 요소 1을 형성하는 것인 복합체.

50. 실시양태 48 또는 49에 있어서, 제1 스템 요소 2가 5'에서 3' 방향으로 하부 스템 요소 핵산 서열 2-1, 벌지 요소 핵산 서열 2-1, 상부 스템 요소 핵산 서열 2-1, 루프 요소 핵산 서열 2, 상부 스템 요소 핵산 서열 2-2, 벌지 요소 핵산 서열 2-2, 및 하부 스템 요소 핵산 서열 2-2를 추가로 포함하며, 여기서 상부 스템 요소 핵산 서열 2-1 및 상부 스템 요소 핵산 서열 2-2는 상부 스템 요소 뉴클레오티드 서열 2-1과 상부 스템 요소 뉴클레오티드 서열 2-2 사이의 수소 염기-쌍 결합에 의해 상부 스템 요소 2를 형성하고, 하부 스템 요소 핵산 서열 2-1 및 하부 스템 요소 핵산 서열 2-2는 하부 스템 요소 핵산 서열 2-1과 하부 스템 요소 뉴클레오티드 서열 2-2 사이의 수소 염기-쌍 결합에 의해 하부 스템 요소 2를 형성하는 것인 복합체.

51. 실시양태 48 내지 50 중 어느 하나에 있어서, 제2 스플릿-넥서스 요소 1이 5' 말단 및 3' 말단을 갖는 보조 폴리뉴클레오티드 1-2를 추가로 포함하며, 여기서 보조 폴리뉴클레오티드 1-2의 5' 말단은 스플릿-넥서스 스템 요소 핵산 서열 1-2의 3' 말단의 3'이며, 여기서 보조 폴리뉴클레오티드 1-2는 수소 염기-쌍 결합을 통해 보조 폴리뉴클레오티드 1-1과 회합되는 것인 복합체.

52. 실시양태 51에 있어서, 보조 폴리뉴클레오티드 1-1 및 보조 폴리뉴클레오티드 1-2가 이중-가닥 핵산 결합 단백질 결합 부위 1을 추가로 포함하고, 이중-가닥 핵산 결합 단백질 결합 부위 1이 보조 폴리뉴클레오티드 1-1과 보조 폴리뉴클레오티드 1-2 사이의 수소 염기-쌍 결합에 의해 형성되는 것인 복합체.

53. 실시양태 52에 있어서, 이중-가닥 핵산 결합 단백질 결합 부위 1이 Csy4 단백질 결합 부위 1인 복합체.

54. 실시양태 48 내지 53 중 어느 하나에 있어서, 제2 스플릿-넥서스 요소 2가 5' 말단 및 3' 말단을 갖는 보조 폴리뉴클레오티드 2-2를 추가로 포함하며, 여기서 보조 폴리뉴클레오티드 2-2의 5' 말단은 스플릿-넥서스 스템 요소 핵산 서열 2-2의 3' 말단의 3'이고 - 제1 스플릿-넥서스 요소 2가 5' 말단 및 3' 말단을 갖는 보조 폴리뉴클레오티드 2-1을 추가로 포함하며, 여기서 (i) 제1 스플릿-넥서스 요소 2의 5' 말단은 보조 폴리뉴클레오티드 2-1의 3' 말단에 공유 결합되고, (ii) 보조 폴리뉴클레오티드 2-2는 수소 염기-쌍 결합을 통해 보조 폴리뉴클레오티드 2-1과 회합되는 것인 복합체.

55. 실시양태 54에 있어서, 보조 폴리뉴클레오티드 2-1 및 보조 폴리뉴클레오티드 2-2가 이중-가닥 핵산 결합 단백질 결합 부위 2를 추가로 포함하고, 이중-가닥 핵산 결합 단백질 결합 부위 2가 보조 폴리뉴클레오티드 2-1과 보조 폴리뉴클레오티드 2-2 사이의 수소 염기-쌍 결합에 의해 형성되는 것인 복합체.

56. 실시양태 55에 있어서, 이중-가닥 핵산 결합 단백질 결합 부위 2가 Csy4 단백질 결합 부위 2인 복합체.

57. 실시양태 48 내지 56 중 어느 하나에 있어서, 조작된 연쇄된 스플릿-넥서스 핵산 1, 제3 연쇄 요소 1, 및 제3 연쇄 요소 2가 각각 RNA, DNA 또는 그의 조합을 포함하는 것인 복합체.

58. 실시양태 48 내지 57 중 어느 하나에 있어서, 제1 핵산 결합 부류 2 제II형 CRISPR 단백질 결합 서열 및 제2 핵산 결합 부류 2 제II형 CRISPR 단백질 결합 서열이 각각 Cas9 단백질 결합 서열인 복합체.

59. 실시양태 48 내지 58 중 어느 하나에 있어서, (i) 핵산 서열 1이 스페이서 핵산 서열 1을 추가로 포함하고, 핵산 서열 2가 스페이서 핵산 서열 2를 추가로 포함하고, (ii) 스페이서 핵산 서열 1이 표적 핵산 서열 1에 상보적이고, 스페이서 핵산 서열 2가 표적 핵산 서열 2에 상보적인 복합체.

60. 실시양태 59에 있어서, 표적 핵산 서열 1 및 표적 핵산 서열 2가 각각 단일-가닥 RNA, 단일-가닥 DNA, 이중-가닥 RNA, 이중-가닥 DNA, 단일-가닥 RNA/DNA 하이브리드, 및 이중-가닥 RNA/DNA 하이브리드로 이루어진 군으로부터 선택되는 핵산인 복합체.

61. 실시양태 48 내지 60 중 어느 하나에 있어서, 제1 핵산 결합 부류 2 제II형 CRISPR 단백질 결합 서열에 결합된 제1 부류 2 제II형 CRISPR 단백질 및 제2 핵산 결합 부류 2 제II형 CRISPR 단백질 결합 서열에 결합된 제2 부류 2 제II형 CRISPR 단백질을 추가로 포함하며, 여기서 제1 부류 2 제II형 CRISPR 단백질 및 제2 부류 2 제II형 CRISPR 단백질은 각각 Cas9 단백질 및 촉매적으로 불활성인 Cas9 단백질로 이루어진 군으로부터 선택되는 것인, 스캐폴드를 형성하는 2종 이상의 조작된 핵산 서열의 복합체.

62. 5' 말단 및 3' 말단을 갖는 제1 핵산 결합 부류 2 제II형 CRISPR 단백질 결합 서열을 포함하는 제1 요소 1 - 및 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 1을 포함하며, 여기서 반복 핵산 서열 1의 3' 말단은 제1 핵산 결합 부류 2 제II형 CRISPR 단백질 결합 서열의 5' 말단의 5'에 위치하고, 반복 핵산 서열 1은 5' 말단 및 3' 말단을 갖는 링커 요소 핵산 서열 1-1 - 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 1a - 5' 말단 및 3' 말단을 갖는 링커 요소 핵산 서열 1-2 - 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 1b - 및 5' 말단 및 3' 말단을 갖는 링커 요소 핵산 서열 1-3을 추가로 포함하며 이들은 하기 3'에서 5' 순서: 링커 요소 핵산 서열 1-1, 반복 핵산 서열 1a, 링커 요소 핵산 서열 1-2, 반복 핵산 서열 1b, 및 링커 요소 핵산 서열 1-3으로 배열되는 것인 제2 요소 1을 포함하며; 여기서 반복 핵산 서열 1 내의 어떠한 핵산 서열도 반복 핵산 서열 1 내의 임의의 핵산 서열과 회합하여 부류 2 제II형 CRISPR-Cas 단백질에 결합할 수 있는 수소 결합을 통해 스템 요소를 형성하지 않는 것인 제1 조작된 핵산을 포함하는 조작된 핵산 스캐폴드.

63. 실시양태 62에 있어서, 5' 말단 및 3' 말단을 갖는 핵산 서열 1을 포함하며, 여기서 (i) 핵산 서열 1의 3' 말단은 반복 핵산 서열 1의 5' 말단에 공유 부착되고, (ii) 핵산 서열 1은 스페이서 핵산 서열 1을 포함하는 것인 제3 요소 1을 추가로 포함하는 조작된 핵산 스캐폴드.

64. 실시양태 62 또는 63에 있어서, 5' 말단 및 3' 말단을 갖는 제2 핵산 결합 부류 2 제II형 CRISPR 단백질 결합 서열을 포함하는 제1 요소 2 - 및 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 1C를 포함하며, 여기서 반복 핵산 서열 1C의 3' 말단은 제2 핵산 결합 부류 2 제II형 CRISPR 단백질 결합 서열의 5' 말단의 5'에 위치하고, 반복 핵산 서열 2는 5' 말단 및 3' 말단을 갖는 링커 요소 핵산 서열 2-1 - 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 1bC - 5' 말단 및 3' 말단을 갖는 링커 요소 핵산 서열 2-2 - 5' 말단 및 3' 말단을 갖는 반복 핵산 서열 1aC - 및 5' 말단 및 3' 말단을 갖는 링커 요소 핵산 서열 2-3을 추가로 포함하며 이들은 하기 3'에서 5' 순서: 링커 요소 핵산 서열 2-3, 반복 핵산 서열 1bC, 링커 요소 핵산 서열 2-2, 반복 핵산 서열 1aC, 및 링커 요소 핵산 서열 2-1로 배열되는 것인 제2 요소 2를 포함하며; 여기서 반복 핵산 서열 1은 반복 핵산 서열 1a와 반복 핵산 서열 1aC 사이의 수소 결합을 통해 및 반복 핵산 서열 1b와 반복 핵산 서열 1bC 사이의 수소 결합을 통해 반복 핵산 서열 2와 회합되는 것인 제2 조작된 핵산을 추가로 포함하는 조작된 핵산 스캐폴드.

65. 실시양태 64에 있어서, 5' 말단 및 3' 말단을 갖는 핵산 서열 2를 포함하며, 여기서 (i) 핵산 서열 2의 3' 말단은 반복 핵산 서열 1C의 5' 말단에 공유 부착되고, (ii) 핵산 서열 2는 스페이서 핵산 서열 2를 포함하는 것인 제3 요소 2를 추가로 포함하는 조작된 핵산 스캐폴드.

본 발명의 바람직한 실시양태가 본원에 제시 및 기재되어 있으나, 이러한 실시양태는 단지 예로서 제공된다는 것이 관련 기술분야의 통상의 기술자에게 명백할 것이다. 상기 논의 및 하기 실시예로부터, 관련 기술분야의 통상의 기술자는 본 발명의 본질적인 특징을 확인할 수 있고, 그의 취지 및 범주로부터 벗어나지 않으면서 다양한 용법 및 조건에 적합하도록 본 발명의 변화, 치환, 변경 및 변형이 이루어질 수 있다. 이러한 변화, 치환, 변경 및 변형은 또한 본 개시내용의 범주 내에 속하는 것으로 의도된다.

실험

본 발명의 측면은 하기 실시예에 예시된다. 사용된 수치 (예를 들어, 양, 온도, 퍼센트 변화 등)에 대한 정확성을 보장하기 위해 노력하였지만, 일부 실험 오차 및 편차가 고려되어야 한다. 달리 나타내지 않는 한, 온도는 섭씨 온도이고, 압력은 대기압 또는 거의 대기압이다. 이들 실시예는 단지 예시로서 제공되며, 본 발명자들이 본 발명의 다양한 측면으로 간주하는 것의 범주를 제한하는 것으로 의도되지 않는 것으로 이해되어야 한다.

실시예 1

NASC 폴리뉴클레오티드 성분의 인 실리코 설계

본 실시예는 본원에 기재된 NASC의 다수의 실시양태에 대한 NASC 폴리뉴클레오티드 성분의 설계의 설명을 제공한다.

표 9는 도면에 도시된 NASC 폴리뉴클레오티드 성분과 구조 사이의 상관관계를 제시한다. 열 "회합된 Cas 단백질"은 NASC 폴리뉴클레오티드 성분과 함께 사용될 수 있는 Cas 단백질을 열거한다. 달리 나타내지 않는 한, Cas9 단백질은 에스. 피오게네스 Cas9 단백질 (에스. 피오게네스 Cas9 단백질, 서열식별번호(SEQ ID NO): 100 또는 에스. 피오게네스 dCas9 단백질 (서열식별번호: 101))이다. Cpf1 단백질은 달리 나타내지 않는 한 아시다미노코쿠스 종 Cpf1 단백질 (dCpf 서열식별번호: 105)이다.

폴리뉴클레오티드 성분 사이에서 혼성화하는 서열은 밑줄표시되어 있다. 핵산 표적 결합 서열은 일련의 20개의 N에 의해 표시되며, 여기서 N은 임의의 뉴클레오티드이다. 핵산 표적 결합 서열은 관련 기술분야의 통상의 기술자에 의해 조작될 수 있다.

표 9

NASC 폴리뉴클레오티드 성분 서열의 예

*에스. 써모필루스 CRISPR-I Cas9 단백질, 서열식별번호: 108 또는 에스. 써모필루스 CRISPR-I dCas9 단백질, 서열식별번호: 109

본 명세서의 안내에 따라, 관련 기술분야의 통상의 기술자는 상이한 동족 Cas 단백질 (예를 들어, 씨. 제주니 Cas9 단백질 (서열식별번호: 103), 씨. 제주니 dCas9 단백질 (서열식별번호: 56), 에스. 아우레우스 Cas9 (서열식별번호: 99), 에스. 아우레우스 dCas9 (서열식별번호: 102), 라크노스피라세아에 박테리움 Cpf1 단백질 (서열식별번호: 106), 라크노스피라세아에 박테리움 dCpf1 단백질 (서열식별번호: 107) 또는 아시다미노코쿠스 종 Cpf1 (서열식별번호: 104))에 대한 NASC 폴리뉴클레오티드 성분을 설계할 수 있다 (예를 들어, 본원에 기재된 다른 NASC 폴리뉴클레오티드 성분에 기초함).

실시예 2

sgRNA 및 NASC 폴리뉴클레오티드 성분의 제조

본 실시예는 도 6g에 도시된 바와 같이, sgRNA 및 NASC 폴리뉴클레오티드 성분 NASC-PC1 (표 9, 일반적 표적 서열 서열식별번호: 83) 및 NASC-PC2 (표 9, 일반적 표적 서열 서열식별번호: 84)의 제조를 기재한다. 본 실시예에 기재된 sgRNA 및 NASC 폴리뉴클레오티드 성분은 Cas 절단 검정 (실시예 5)에서 사용되었다.

NASC-PC1 및 NASC-PC2는 NASC-PC1 제1 스템 요소 핵산 서열과 제1 스템 요소 핵산 서열에 상보적인 NASC-PC2 제1 스템 요소 핵산 서열 사이의 안정한 2차 구조의 형성을 방해할 수 있는 각각의 NASC-PC 내의 2차 구조의 형성을 제한하기 위해 상이한 제1 스템 요소 핵산 서열 (도 6e, (608)-(609) 및 (619)-(620)에 도시됨)을 포함하였다.

2개의 sgRNA 백본 (sgRNA-1 및 sgRNA-2)이 사용되었으며, 각각은 상이한 상부 스템 및 하부 스템 핵산 서열 (각각 도 2c, (221)-(222)/(227)-(228) 및 (223)-(224)/(225)-(226)에 도시됨)을 포함하고; 벌지 서열은 동일하였다.

각각 20개 뉴클레오티드 길이인 4종의 핵산 표적-결합 서열을 선택하였다. 4종의 핵산 표적 결합 서열 중 1개를 sgRNA-1 및 sgRNA-2 백본의 5' 말단, 및 NASC-PC1 및 NASC-PC2의 5' 말단에 혼입시켰다. 4종의 이중-가닥 DNA 표적 서열은 하기와 같았다: 표적 1 (AAVST1)은 인간 AAVS-1 표적 서열에 상응하였다. 표적 2 (VT2), 표적 3 (VT3) 및 표적 4 (VT4)는 벡터 서열 (서열식별번호: 20)에 존재하는 DNA 표적 서열이었다.

RNA 성분을 DNA 서열의 5' 말단에 T7 프로모터를 혼입시키는 이중-가닥 DNA 주형으로부터 T7 퀵 고수율(T7 Quick High Yield) RNA 합성 키트 (뉴잉글랜드 바이오랩스(New England Biolabs), 매사추세츠주 입스위치)를 사용하여 시험관내 전사에 의해 제조하였다.

각각의 sgRNA, NASC-PC1 및 NASC-PC2에 대한 이중-가닥 DNA 주형을 각각의 sgRNA, NASC-PC1 및 NASC-PC2에 상응하는 DNA 서열을 함유하는 3' 중첩 올리고뉴클레오티드 프라이머를 사용하여 PCR에 의해 조립하였다. 올리고뉴클레오티드 프라이머는 표 10에 제시된다.

표 10

sgRNA, NASC-PC1 및 NASC-PC2 코딩 주형의 생성을 위한 중첩 프라이머

DNA 프라이머가 각각 2nM의 농도로 존재하였다. 1종의 DNA 프라이머는 T7 프로모터에 상응하고 (서열식별번호: 1), RNA 서열의 3' 말단에 대한 다른 프라이머 (서열식별번호: 2)를 640nM의 농도로 사용하여 증폭 반응을 유도하였다. PCR 반응을 제조업체의 지침에 따라 Q5 핫 스타트 고충실도 2X 마스터 믹스(Q5 Hot Start High-Fidelity 2X Master Mix) (뉴잉글랜드 바이오랩스, 매사추세츠주 입스위치)를 사용하여 수행하였다. PCR 조립 반응을 하기 열 사이클링 조건을 사용하여 수행하였다: 98℃에서 2분 동안; 98℃에서 20초, 52.5℃에서 20초, 72℃에서 20초의 2 사이클에 이어서; 98℃에서 20초, 57℃에서 20초, 72℃에서 20초의 32 사이클; 및 72℃에서 2분 동안 최종 연장. DNA 생성물 품질을 아가로스 겔 전기영동 (1.5%, SYBR® 세이프(Safe), 라이프 테크놀로지스(Life Technologies), 뉴욕주 그랜드 아일랜드)에 의해 PCR 반응 후에 평가하였다.

각각의 sgRNA, NASC-PC1 및 NASC-PC2에 대한 DNA 주형의 0.25-0.5μg을 T7 하이 일드 RNA 합성 키트 (뉴잉글랜드 바이오랩스, 매사추세츠주 입스위치)를 사용하여 37℃에서 대략 16시간 동안 전사를 위한 주형으로서 사용하였다. 전자 반응을 DNase I (뉴잉글랜드 바이오랩스, 매사추세츠주 입스위치)로 처리하고, 진제트(GeneJet) RNA 클린업 앤드 콘센트레이션 키트 (라이프 테크놀로지스, 뉴욕주 그랜드 아일랜드)를 사용하여 정제하였다. RNA 수율을 나노드롭(Nanodrop)™ 2000 시스템 (써모 사이언티픽, 델라웨어주 윌밍톤)을 사용하여 정량화하였다. 전사된 RNA의 품질을 아가로스 겔 전기영동 (2%, SYBR® 세이프; 라이프 테크놀로지스, 뉴욕주 그랜드 아일랜드)에 의해 체크하였다. sgRNA 및 NASC 폴리뉴클레오티드 성분 서열은 표 11에 제시된다.

표 11

sgRNA, NASC-PC1 및 NASC-PC2 서열

*NASC-PC 혼성화 영역은 밑줄표시되어 있다

sgRNA 및 NASC 폴리뉴클레오티드 성분의 이러한 제조 방법은 본 명세서의 교시를 고려하여 관련 기술분야의 통상의 기술자에 의해 다른 sgRNA 및 NASC 폴리뉴클레오티드 성분의 제조에 적용될 수 있다.

실시예 3

이중-가닥 DNA 표적 서열의 플라스미드 내로의 클로닝에 의한 절단 검정에 사용하기 위한 이중-가닥 DNA 표적 서열의 제조

시험관내 Cas 단백질 절단 검정에 사용하기 위한 이중-가닥 DNA 표적 서열을 이중-가닥 핵산 표적 서열 (예를 들어, AAVS-1 표적 서열)의 클로닝 벡터 백본 내로의 라이게이션을 통해 제조하였다. 각각의 벡터를 이중-가닥 DNA 표적 서열의 제조를 위한 이. 콜라이(E. coli)의 적합한 균주 내로 형질전환시켰다.

인간 아데노-연관 바이러스 통합 부위 1 (AAVS-1)에 상응하는 25개 뉴클레오티드 단일-가닥 DNA 표적 서열에 5' 말단에 47개 뉴클레오티드의 무작위 핵산 서열 및 3' 말단에 53개 뉴클레오티드의 무작위 핵산 서열을 인 실리코 부가하였다. 일렉트라(Electra)™ 벡터 시스템 (DNA2.0, 캘리포니아주 뉴어크)과 상용성인 정방향 및 역방향 올리고뉴클레오티드 프라이머를 DNA 표적 서열의 5' 말단 및 3' 말단에 혼입시켜 237bp 단일-가닥 DNA 서열을 제조하였다. 237bp 단일-가닥 DNA ("DNA 클로닝 단편")의 핵산 서열, 뿐만 아니라 정방향 및 역방향 증폭 올리고뉴클레오티드 프라이머의 핵산 서열을 합성을 위해 상업적 제조업체에 제공하였다. 이들 단일-가닥 DNA 서열은 표 12에 제시된다.

표 12

단일-가닥 DNA 서열

*PAM을 포함하는 AAVS-1 DNA 표적 서열은 밑줄표시되어 있다

단일-가닥 DNA 클로닝 단편을 PCR을 통해 증폭시켜 일렉트라™ 벡터 시스템 (DNA2.0, 캘리포니아주 뉴어크)과 함께 사용하기 위한 이중-가닥 DNA를 생성하였다. PCR 반응 혼합물은 하기와 같았다: 25μL의 총 부피로, 0.5 단위 카파 하이파이 핫 스타트(KAPA HiFi Hot Start) DNA 폴리머라제 (카파 바이오시스템즈, 매사추세츠주 윌밍톤), 1x 반응 완충제, 0.3mM dNTP, 200nM 정방향 프라이머 (서열식별번호: 21), 200nM 역방향 프라이머 (서열식별번호: 22), 및 80nM의 DNA 클로닝 단편 (서열식별번호: 19). DNA 클로닝 단편을 하기 조건을 사용하여 증폭시켰다: 95℃에서 4분 동안, 98℃에서 20초, 60℃에서 20초, 및 72℃에서 30초의 30 사이클에 이어서 72℃에서 5분 동안 최종 연장. PCR 생성물을 스핀 스마트(Spin Smart)™ PCR 정제 튜브 (덴빌 사이언티픽, 뉴저지주 사우스플레인필드)를 사용하여 정제하고, 나노드롭™ 2000 UV-Vis 분광광도계 (써모 사이언티픽, 델라웨어주 윌밍톤)를 사용하여 정량화하였다.

이중-가닥 DNA 클로닝 단편을 제조업체의 클로닝 프로토콜을 사용하여 상업적으로 입수가능한 "pD441-SR: T5-sRBS-ORF, Ecoli-Elec D" 벡터 (일렉트라™ 박테리아 DNA 벡터 (DNA2.0, 캘리포니아주 뉴어크)) 내로 클로닝하였다. 하기 클로닝 반응 혼합물을 제조하였다: 20μL의 최종 부피로, 20ng의 PCR-증폭된 클로닝 단편, 20ng의 박테리아 DNA 벡터, 2μl의 일렉트라™ 완충제 믹스 (DNA2.0, 캘리포니아주 뉴어크), 및 1μl의 일렉트라™ 효소 믹스 (DNA2.0, 캘리포니아주 뉴어크). 이어서 클로닝 반응 혼합물을 잠시 볼텍싱하고, 벤치탑 원심분리를 사용하여 원심분리에 적용하고, 실온에서 20분 동안 인큐베이션하였다.

인큐베이션 후에, 1μL의 원 샷(One Shot)® 마하1(Mach1)™ T1R (써모 사이언티픽, 델라웨어주 윌밍톤) 화학 적격 이. 콜라이 세포를 2μL의 클로닝 반응 혼합물과 혼합하여 형질전환 혼합물을 형성하였으며, 이를 얼음에서 30분 동안 인큐베이션하였다. 형질전환 혼합물을 42℃에서 30초 동안 열-쇼크 주고, 얼음에서 2분 동안 인큐베이션하였다. 250μL의 실온 S.O.C. 배지 (써모 사이언티픽, 델라웨어주 윌밍톤)를 형질전환 혼합물에 첨가하고, 혼합물을 37℃에서 1시간 동안 진탕하면서 인큐베이션하였다. 이 인큐베이션 후에, 50μL의 세포 혼합물을 50μg/mL 카나마이신을 함유한 LB 한천 플레이트 상에 펼치고, 플레이트를 박테리아 콜로니 형성을 위해 37℃에서 밤새 인큐베이션하였다.

5개의 박테리아 콜로니를 고르고, 50μg/mL 카나마이신 배양 배지로 보충된 5mL의 LB를 함유하는 개별 15mL 배양 튜브에 옮기고, 튜브를 8시간 동안 진탕하면서 인큐베이션하였다. 세포를 15분 동안 4000 RPM에서의 원심분리에 의해 펠릿화하고, 배양 배지를 흡인하고, 세포를 항생제를 함유하지 않은 200μL의 LB 배양 배지에 재-현탁시켰다. DNA 벡터를 제조업체의 지침에 따라 퀴아프렙 스핀 미니프렙 키트(QIAprep Spin Miniprep Kit) (퀴아젠(Qiagen), 네덜란드 벤로)를 사용하여 각각의 5개의 박테리아 콜로니의 박테리아로부터 추출하였다. DNA 벡터 수율을 나노드롭™ 2000 UV-Vis 분광광도계 (써모 사이언티픽, 델라웨어주 윌밍톤)를 사용하여 정량화하였다. 250ng의 각각의 DNA 벡터를 생어(Sanger) 서열분석하여 서열식별번호: 19에 상응하는 DNA 클로닝 단편의 혼입을 검증하였다. AAVS-1 표적 서열을 포함한 완전 DNA 벡터 서열이 서열식별번호: 20으로서 제공된다.

DNA 클로닝 단편을 포함하는 DNA 벡터를 함유하는 것으로 확인된 박테리아 클론을 50μg/mL 카나마이신 배양 배지로 보충된 100mL의 LB에서 배양하고, 37℃에서 밤새 진탕하면서 성장시켰다. 세포를 15분 동안 4000 RPM에서의 원심분리에 의해 펠릿화하고, 배양 배지를 흡인하고, DNA 벡터를 제조업체의 지침에 따라 퀴아프렙 스핀 맥시프렙 키트 (퀴아젠, 네덜란드 벤로)를 사용하여 정제하였다. DNA 벡터 수율을 나노드롭™ 2000 UV-Vis 분광광도계 (써모 사이언티픽, 델라웨어주 윌밍톤)를 사용하여 정량화하였다.

AscI 제II형 제한 엔도뉴클레아제를 사용한 원형 벡터의 선형화에 의한 Cas 절단 검정에 사용할 DNA 벡터를 제조하였다. 원형 DNA 벡터를 선형화하기 위해, 하기 반응 혼합물을 조립하였다: 50uL의 최종 부피로, 1μg의 원형 DNA 벡터당 1 단위의 AscI 제한 엔도뉴클레아제 (뉴잉글랜드 바이오랩스, 매사추세츠주 입스위치), 및 1x 컷스마트(CutSmart)® 완충제 (뉴잉글랜드 바이오랩스, 매사추세츠주 입스위치). 반응 혼합물을 37℃에서 1시간 동안 인큐베이션하고, 반응을 20분 동안 80℃에서의 인큐베이션에 의해 정지시켰다. 선형 DNA 벡터를 제조업체의 지침에 따라 퀴아퀵 PCR 정제 키트 (퀴아젠, 네덜란드 벤로)를 사용하여 정제하였다. 선형 DNA 벡터 수율을 나노드롭™ 2000 UV-Vis 분광광도계 (써모 사이언티픽, 델라웨어주 윌밍톤)를 사용하여 정량화하였다.

다른 적합한 클로닝 방법 및 DNA 벡터를 본질적으로 본 실시예에 기재된 방법에 따라 이중-가닥 DNA 표적 서열의 혼입에 사용할 수 있다. DNA 벡터의 선형화가 바람직하지 않거나 불필요한 경우, 원형 DNA 벡터를 Cas 절단 검정에 사용할 수 있다.

실시예 4

PCR을 사용한 절단 검정에 사용하기 위한 이중-가닥 DNA 표적 서열의 제조

시험관내 Cas 단백질 절단 검정에 사용하기 위한 이중-가닥 DNA 표적 서열을 게놈 인간 DNA로부터의 선택된 핵산 표적 서열의 PCR 증폭을 사용하여 제조할 수 있다.

아데노-연관 바이러스 통합 부위 1 (AAVS-1)을 포함하는 게놈 인간 DNA를 인간 세포주 K562 (아메리칸 타입 컬쳐 콜렉션(American Type Culture Collection) (ATCC), 버지니아주 마나사스)로부터의 페놀-클로로포름 추출에 의해 제조할 수 있다. PCR 반응을 제조업체의 지침에 따라 Q5 핫 스타트 고충실도 2X 마스터 믹스 (뉴잉글랜드 바이오랩스, 매사추세츠주 입스위치)를 사용하여 수행할 수 있다. 25μl의 최종 부피의 20ng/μL gDNA를 하기 조건 하에 선택된 핵산 표적 서열을 증폭시키는 데 사용할 수 있다: 98℃에서 2분 동안, 98℃에서 20초, 60℃에서 20초, 72℃에서 20초의 35 사이클, 및 72℃에서 2분 동안 최종 연장. PCR 생성물을 스핀 스마트™ PCR 정제 튜브 (덴빌 사이언티픽, 뉴저지주 사우스플레인필드)를 사용하여 정제할 수 있고, 나노드롭™ 2000 UV-Vis 분광광도계 (써모 사이언티픽, 델라웨어주 윌밍톤)를 사용하여 정량화할 수 있다.

gDNA로부터의 AAVS-1 DNA 표적 서열의 증폭에 사용될 수 있는 정방향 및 역방향 프라이머의 예는 표 13에 제시된다.

표 13

AAVS-1 DNA 표적 서열 올리고뉴클레오티드 프라이머

AAVS-1 DNA 표적 서열을 서열식별번호: 23 및 서열식별번호: 24를 사용하여 증폭시켜 495bp 이중-가닥 AAVS-1 DNA 표적 서열을 제조할 수 있다.

다른 적합한 이중-가닥 DNA 표적 서열을 적합한 올리고뉴클레오티드 프라이머를 선택함으로써 본질적으로 동일한 방법을 사용하여 수득할 수 있다. 임의의 유기체 (예를 들어, 식물, 박테리아, 효모, 조류 등)로부터의 gDNA를 인간 세포로부터 유래된 DNA 대신에 사용할 수 있다. 게다가, DNA 표적 서열을 gDNA 이외의 폴리뉴클레오티드 (예를 들어, 벡터 및 겔 단리된 DNA 단편)로부터 PCR을 통해 증폭시킬 수 있다.

실시예 5

Cas 절단 검정

본 실시예는 NASC 폴리뉴클레오티드 조성물에 의해 핵산 표적 서열의 절단 백분율을 평가하기 위한 시험관내 검정에서의 NASC 폴리뉴클레오티드 조성물 및 Cas9 단백질의 사용을 예시한다.

NASC-PC1 및 NASC-PC2는 NASC-PC1 제1 스템 요소 핵산 서열과 NASC-PC1 제1 스템 요소 핵산 서열에 상보적인 NASC-PC2 제1 스템 요소 핵산 서열 사이의 수소 결합 형성을 통한 안정한 2차 구조의 형성을 방해할 수 있는 각각의 NASC-PC 내의 2차 구조의 형성을 제한하기 위해 상이한 제1 스템 요소 핵산 서열을 포함하였다.

본 실시예에 사용된 NASC 폴리뉴클레오티드 조성물의 일반적 성분은 NASC-PC1 (표 9, 일반적 표적 서열 서열식별번호: 83) 및 NASC-PC2 (표 9, 일반적 표적 서열 서열식별번호: 84)였다. 이 NASC-P1/NASC-P2 쌍의 일반적 구조는 도 6g에 도시된다.

sgRNA/Cas9 단백질 및 NASC-PC1/NASC-PC2/Cas9 단백질의 리보핵단백질 복합체를 시험관내 Cas9 절단 검정에 사용하여 DNA 벡터 상의 상응하는 이중-가닥 DNA 표적 서열에 비한 각각의 복합체의 퍼센트 절단을 평가하였다.

sgRNA/Cas9 단백질 및 NASC-PC1/NASC-PC2/Cas9의 리보핵단백질 복합체는 실시예 2 표 11에 제시된 sgRNA 및 NASC-PC1/NASC-P2 구축물을 사용하였다. 표적 1 (AAVST1)은 인간 AAVS-1 표적 서열에 상응하였다. 표적 2 (VT2), 표적 3 (VT3) 및 표적 4 (VT4)는 벡터 서열 (서열식별번호: 20)에 존재하는 DNA 표적 서열이었다. 오직 단일 sgRNA 또는 단일 NASC 폴리뉴클레오티드 성분만을 사용한 절단 반응에서, 선형화 벡터를 사용하였다. 2종의 sgRNA 또는 NASC-PC1/NASC-PC2 성분을 사용한 절단 반응에서, 원형 벡터를 사용하였다. sgRNA를 사용한 선형 플라스미드의 절단은 2개의 DNA 단편을 생성하고, 2종의 sgRNA 또는 NASC-PC1/NASC-PC2 성분을 사용한 원형 플라스미드의 절단은 2개의 DNA 표적 단편을 생성하였다. 이중-가닥 DNA 표적 서열의 크기 및 예측된 절단 단편의 크기는 표 14에 제시된다.

표 14

표적 및 절단 단편 크기

sgRNA 및 NASC-PC1/NASC-PC2 성분을 적합한 작업 농도로 희석하였다. sgRNA 및 NASC-PC 성분을 50nM의 최종 농도로 개별 튜브 내에 분취하였다. sgRNA 및 NASC-PC1/NASC-PC2 성분의 쌍을 각각의 성분에 대해 50nM의 최종 농도로 개별 튜브 내에 분취하였다. 모든 RNA를 95℃에서 2분 동안 인큐베이션하고, 써모사이클러로부터 제거하고, 실온으로 평형화되게 하였다. 절단 반응에 사용된 sgRNA 및 NASC-PC1/NASC-PC2 성분의 조합은 표 15에 제시된다.

표 15

sgRNA 및 NASC-PC1/NASC-PC2 반응 혼합물 성분

각각의 sgRNA 반응 혼합물 성분(들) 및 NASC-PC1/NASC-PC2 반응 혼합물 성분(들)을 Cas9 반응물 믹스에 첨가하였다. 에스. 피오게네스 Cas9 단백질을 이. 콜라이에서 재조합적으로 발현시키고, 시험관내 생물학적 절단 검정에 사용하기 위해 정제하였다. Cas9 반응 혼합물은 반응 완충제 (pH 7.4에서 20mM HEPES, 100mM KCl, 5mM MgCl₂ 및 5% 글리세롤) 중에서 200nM의 최종 농도로 희석된 Cas9 단백질을 포함하였다. 각각의 Cas9 반응 혼합물을 37℃에서 10분 동안 인큐베이션하였다. 각각의 Cas9 반응 혼합물에서의 절단을 DNA 표적 벡터의 5nM의 최종 농도로의 첨가에 의해 개시하였다. 각각의 Cas9 반응 혼합물을 혼합하고, 잠시 원심분리하고, 37℃에서 15분 동안 인큐베이션하였다. 각각의 Cas9 반응 혼합물에 대한 0.2μg/μL의 최종 농도의 프로테이나제 K (덴빌 사이언티픽, 뉴저지주 사우스플레인필드) 및 0.44 mg/μL RNase A 용액 (시그마알드리치, 미주리주 세인트 루이스)의 첨가에 의해 절단 반응을 종결시켰다.

이어서, 각각의 Cas9 반응 혼합물을 37℃에서 25분, 및 55℃에서 25분 동안 인큐베이션하였다. 각각의 Cas9 반응 혼합물을 프래그먼트 애널라이저(Fragment Analyzer)™ (어드밴스드 애널리티컬 테크놀로지스(Advanced Analytical Technologies), 아이오와주 에임스) 시스템 및 DNF-474-05000 고감수성 NGS 시약 키트 (어드밴스드 애널리티컬 테크놀로지스, 아이오와주 에임스)를 사용하여 절단 활성에 대해 평가하였다. 프래그먼트 애널라이저™ 시스템으로부터의 데이터는 각각의 절단 단편 및 각각의 Cas9 반응 혼합물에 대한 절단 후에 남아있는 DNA 표적 벡터의 농도를 제공하였다. 각각의 Cas9 반응 혼합물에 대해, 퍼센트 절단은 절단 단편의 합계를 절단 단편 및 절단 후에 남아있는 DNA 표적 벡터 둘 다의 합계로 나눔으로써 계산하였다.

표 16은 sgRNA/Cas9 단백질 및 NASC-PC1/NASC-PC2/Cas9의 각각의 리보핵단백질 복합체에 대한 절단 데이터를 제시한다.

표 16

sgRNA/Cas9 단백질 복합체 및 NASC-PC1/NASC-PC2/Cas9 단백질 복합체를 사용한 DNA 표적 서열의 생화학적 절단

*LOD는 검출 한계 미만의 절단 값을 나타낸다

표 16에 제시된 데이터는 반응 18, 20, 22 및 24 (표 16)의 각각의 NASC-PC1/NASC-PC2/Cas9 단백질 복합체가 NASC-PC1/NASC-PC2/Cas9 단백질 복합체의 2종의 핵산 표적 결합 서열에 상응하는 2종의 DNA 표적 서열의 Cas 단백질 매개 부위-특이적 절단을 용이하게 하였음을 입증한다. 게다가, 각각의 NASC-PC1/NASC-PC2/Cas9 단백질 복합체에 의한 부위-특이적 절단의 퍼센트는 2종의 sgRNA/Cas9 단백질 복합체에 의한 동일한 2종의 DNA 표적 서열의 부위-특이적 절단과 본질적으로 동등하며, 여기서 1종의 sgRNA/Cas9 단백질 복합체는 제1 DNA 표적 서열에서의 절단을 표적화하고, 제2 sgRNA/Cas9 단백질 복합체는 제2 DNA 표적 서열에서의 절단을 표적화하였다 (반응 17과 18; 19와 20; 21과 22; 및 23과 24의 퍼센트 절단을 비교). 표 16에 제시된 데이터는 또한 각각의 NASC-PC1이 회합된 Cas9 단백질에 의한 부위-특이적 절단을 표적화하기 위해 상보적 NASC-PC2와 쌍형성되도록 요구되었으며 (표 16, 반응 9-16); 즉, NASC 폴리뉴클레오티드 조성물의 개별 폴리뉴클레오티드 성분이 Cas 단백질 매개 부위-특이적 절단을 지원할 수 없음을 입증한다.

본 명세서 및 실시예의 안내에 따라, 본 실시예에 기재된 생화학적 절단 검정은 다른 NASC 폴리뉴클레오티드 조성물 및 동족 Cas 단백질 (예를 들어, Cas9 단백질 및 Cpf1 단백질)을 사용하여 관련 기술분야의 통상의 기술자에 의해 실시될 수 있다.

실시예 6

진핵 세포에서의 표적 서열 변형의 검출을 위한 심층 서열분석 분석

본 실시예는 선택된 이중-가닥 DNA 표적 서열에 비해 NASC 폴리뉴클레오티드 조성물/Cas 단백질 복합체를 사용한 세포에서의 퍼센트 절단을 평가 및 비교하기 위한 심층 서열분석 분석의 사용을 예시한다.

A. 게놈 표적 서열 선택

2종의 표적 핵산 서열을 인간 게놈 내의 엑손 영역으로부터 선택할 수 있다 (예를 들어, X-선 복구 교차 상보적 5 (XRCC5) 유전자 서열). PAM 서열에 대해 5' 인접한 20개 뉴클레오티드 길이의 핵산 서열 (예를 들어, 에스. 피오게네스 Cas9 PAM 5' - NGG), 예를 들어 표 17에 제시된 XRCC5 표적 DNA 서열을 선택할 수 있다.

표 17

XRCC5 표적 DNA 서열

B. NASC 폴리뉴클레오티드 조성물의 구축

NASC-PC1 및 NASC-PC2를 포함하는 NASC 폴리뉴클레오티드 조성물을 사용할 수 있다. XRCC5T1에 상응하는 핵산 표적 결합 서열을 NASC-PC1의 5' 말단에 혼입시킬 수 있고, XRCC5T3에 상응하는 핵산 표적 결합 서열을 NASC-PC2의 5' 말단에 혼입시킬 수 있다. 양성 대조군으로서, XRCC5T1에 상응하는 핵산 표적 결합 서열을 sgRNA의 5' 말단에 혼입시킬 수 있고, XRCC5T3에 상응하는 핵산 표적 결합 서열을 sgRNA의 5' 말단에 혼입시킬 수 있다. NASC-PC1, NASC-PC2 및 sgRNA를 실시예 2에 기재된 바와 같이 제조할 수 있다. NASC-PC1, NASC-PC2 및 sgRNA에 대한 서열의 예는 표 18에 제공된다.

표 18

sgRNA 및 NASC 폴리뉴클레오티드 성분 서열

*NASC-PC 혼성화 영역은 밑줄표시되어 있다

C. NASC/Cas9 단백질 핵단백질 복합체의 형성

에스. 피오게네스 Cas9를 2종의 핵 국재화 서열 (NLS)로 C-말단 태그부착할 수 있고, 이. 콜라이에서 재조합적으로 발현시키고, 크로마토그래피 방법을 사용하여 정제할 수 있다. 리보핵단백질 복합체를 80pmol Cas9 단백질:120pmol NASC-PC1:120pmol NASC-PC2의 농도에서 형성할 수 있다. 대조군 sgRNA 성분을 유사한 방식으로 Cas9 단백질을 사용하여 리보핵단백질 복합체로 개별적으로 조립할 수 있다. Cas9 단백질을 사용하여 조립하기 전에, NASC-PC1, NASC-PC2 및 sgRNA를 2μL의 최종 부피로 목적하는 농도 (120pmol)로 희석하고, 95℃에서 2분 동안 인큐베이션하고, 써모사이클러로부터 제거하고, 실온으로 평형화되도록 할 수 있다. Cas9 단백질을 3μL의 최종 부피로 결합 완충제 (pH 7.4에서의 20mM HEPES, 100mM KCl, 5mM MgCl₂, 및 5% 글리세롤) 중에서 적절한 농도로 희석할 수 있고, 2μL의 각각의 NASC-PC1, NASC-PC2 및 sgRNA와 혼합한 후, 37℃에서 30분 동안 인큐베이션할 수 있다.

D. NASC/Cas9 리보핵단백질 복합체를 사용한 세포 형질감염

리보핵단백질 복합체를 제조업체의 프로토콜을 따라 뉴클레오펙터(Nucleofector)® 96-웰 셔틀 시스템 (론자(Lonza), 뉴저지주 알렌데일)을 사용하여 HEK293 세포 (ATCC, 버지니아주 마나사스) 내로 형질감염시킬 수 있다. 리보핵단백질 복합체를 5μL 최종 부피로 96-웰 플레이트의 개별 웰 내로 분배할 수 있으며, 여기서 웰은 배양 배지 중에 HEK293 세포를 함유한다. 세포 배양 배지를 플레이트의 웰로부터 제거할 수 있고, 세포를 트리플(TrypLE)™ 효소 (써모 사이언티픽, 델라웨어주 윌밍톤)를 사용하여 탈착시킬 수 있다. 현탁된 HEK293 세포를 3분 동안 200 x g에서의 원심분리에 의해 펠릿화할 수 있고, 트리플 시약을 흡인할 수 있고, 세포를 칼슘 및 마그네슘-무함유 포스페이트 완충 염수 (PBS)로 세척할 수 있다. 세포를 3분 동안 200 X g에서의 원심분리에 의해 펠릿화하고, PBS를 흡인할 수 있고, 세포 펠릿을 10mL의 칼슘 및 마그네슘-무함유 PBS에 재-현탁시킬 수 있다.

세포를 카운테스(Countess)® II 자동화 세포 계수기 (라이프 테크놀로지스, 뉴욕주 그랜드 아일랜드)를 사용하여 계수할 수 있다. 2.2 x 10⁷개 세포를 1.5ml 미세원심분리기 튜브에 옮기고, 펠릿화할 수 있다. PBS를 흡인하고, 세포를 1 x 10⁷개 세포/mL의 밀도로 뉴클레오펙터™ SF 용액 (론자, 뉴저지주 알렌데일)에 재-현탁시킬 수 있다. 20μL의 세포 현탁액을 5μL의 리보핵단백질 복합체를 함유하는 각각의 개별 웰에 첨가할 수 있고, 각각의 웰로부터의 전체 부피를 96-웰 뉴클레오큐벳(Nucleocuvette)™ 플레이트 (론자, 뉴저지주 알렌데일)의 웰에 옮길 수 있다. 플레이트를 뉴클레오펙터™ 96-웰 셔틀™ (론자, 뉴저지주 알렌데일) 상에 로딩할 수 있고, 세포를 96-CM-130 뉴클레오펙터™ 프로그램 (론자, 뉴저지주 알렌데일)을 사용하여 뉴클레오펙션시킬 수 있다. 뉴클레오펙션 후, 10% 소 태아 혈청 (FBS; 써모 사이언티픽, 델라웨어주 윌밍톤), 페니실린 및 스트렙토마이신 (라이프 테크놀로지스, 뉴욕주 그랜드 아일랜드)으로 보충된 70μL 둘베코 변형 이글 배지(Dulbecco's Modified Eagle Medium) (DMEM; 써모 사이언티픽, 델라웨어주 윌밍톤)를 각각의 웰에 첨가할 수 있고, 이어서 50μL의 세포 현탁액을 150μL 미리-가온된 DMEM 완전 배양 배지를 함유하는 96-웰 세포 배양 플레이트로 옮길 수 있다. 이어서, 플레이트를 조직 배양 인큐베이터로 옮기고, 37℃에서 5% CO₂ 하에 48시간 동안 유지할 수 있다.

E. 심층 서열분석을 위한 이중-가닥 DNA 표적 서열 생성

gDNA를 웰당 50μL 퀵익스트랙트(QuickExtract) DNA 추출 용액 (에피센터(Epicentre), 위스콘신주 매디슨)을 사용하여 리보핵단백질 복합체의 형질감염에 이어서 37℃에서 10분, 65℃에서 6분, 및 95℃에서 3분 동안 인큐베이션하여 반응을 정지시킨 후 48시간에 HEK293 세포로부터 단리할 수 있다. 단리된 gDNA를 50μL 멸균수로 희석할 수 있고, 샘플을 -80℃에서 저장할 수 있다.

단리된 gDNA를 사용하여, 제1 PCR을 1x 농도의 Q5 핫 스타트 고충실도 2X 마스터 믹스 (뉴잉글랜드 바이오랩스, 매사추세츠주 입스위치), 각각 0.5μM의 프라이머, 3.75μL의 gDNA를 10μL의 최종 부피로 사용하여 수행하고, 98℃에서 1분 동안, 98℃에서 10초, 60℃에서 20초, 72℃에서 30초의 35 사이클, 및 72℃에서 2분 동안 최종 연장으로 증폭시켰다. 프라이머를 XRCC5_T1 영역 (예를 들어, 서열식별번호: 47 및 서열식별번호: 48) 또는 XRCC5_T3 (서열식별번호: 49 및 서열식별번호: 50)을 증폭시키도록 설계할 수 있다. NASC-PC1/NASC-PC2/Cas9 뉴클레오펙션된 샘플 및 sgRNA/Ca9 뉴클레오펙션된 샘플로부터 준비한 gDNA를 프라이머 쌍 둘 다를 개별적으로 사용하여 증폭시켜, 리보핵단백질에 의한 각각의 표적 부위의 편집을 평가할 수 있다. 각각의 PCR 반응을 물 중에서 1:100 희석할 수 있다.

"바코딩" PCR을 각각의 샘플에 대한 고유 인덱스 프라이머를 사용하여 설정하여 멀티플렉스 서열분석을 용이하게 할 수 있다. 이러한 프라이머 쌍의 예는 표 19에 제시된다.

표 19

바코딩 프라이머

바코딩 PCR은 1x 농도의 Q5 핫 스타트 고충실도 2X 마스터 믹스 (뉴잉글랜드 바이오랩스, 매사추세츠주 입스위치), 각각 0.5μM의 프라이머 (표 19), 1μL의 1:100 희석된 제1 PCR을 10μL의 최종 부피로 사용하여 수행할 수 있고, 98℃에서 1분 동안, 98℃에서 10초, 60℃에서 20초, 72℃에서 30초의 12 사이클, 및 72℃에서 2분 동안 최종 연장으로 증폭시킬 수 있다.

F. SPRI셀렉트 클린업

모든 바코딩 PCR 반응물을 풀링하고, 서열분석을 위한 앰플리콘의 SPRI셀렉트 비드-기반 클린업 (베크만 쿨터(Beckman Coulter), 캘리포니아주 패서디나)을 위한 단일 미세원심분리기 ("앰플리콘 라이브러리") 튜브로 옮길 수 있다.

각각의 튜브에, 0.9x 부피의 SPRI셀렉트 비드를 첨가하고, 혼합하고, 실온에서 10분 동안 인큐베이션할 수 있다. 미세원심분리기 튜브를 용액이 투명해질 때까지 자기 튜브 스탠드 (베크만 쿨터, 캘리포니아주 패서디나) 상에 둘 수 있다. 상청액을 제거 및 폐기할 수 있고, 잔류 비드를 85% 에탄올 1 부피로 세척하고, 실온에서 30초 동안 인큐베이션할 수 있다. 인큐베이션 후에, 에탄올을 흡인할 수 있고, 비드를 실온에서 10분 동안 공기 건조시킬 수 있다. 각각의 미세원심분리기 튜브를 자기 스탠드로부터 제거할 수 있고, 퀴아젠 EB 완충제 (퀴아젠, 네덜란드 벤로) 0.25x 부피를 비드에 첨가하고, 격렬히 혼합하고, 실온에서 2분 동안 인큐베이션할 수 있다. 각각의 미세원심분리기 튜브를 자석으로 되돌리고, 용액이 투명해질 때까지 인큐베이션한 다음, 정제된 앰플리콘을 함유한 상청액을 깨끗한 미세원심분리기 튜브 내에 분배할 수 있다. 정제된 앰플리콘 라이브러리를 나노드롭™ 2000 시스템 (써모 사이언티픽, 델라웨어주 윌밍톤)을 사용하여 정량화할 수 있고, 라이브러리 품질을 프래그먼트 애널라이저™ 시스템 (어드밴스드 애널리티컬 테크놀로지스, 아이오와주 에임스) 및 DNF-910 이중-가닥 DNA 시약 키트 (어드밴스드 애널리티컬 테크놀로지스, 아이오와주 에임스)를 사용하여 분석할 수 있다.

G. 심층 서열분석 설정

풀링된 앰플리콘 라이브러리를 앰플리콘의 정량화된 값 및 평균 크기로부터 계산된 바와 같이 4nM 농도로 정규화할 수 있다. 앰플리콘 라이브러리를 MiSeq 시약 키트 v2 (일루미나(Illumina), 캘리포니아주 샌디에고)를 사용하는 MiSeq 서열분석기 (일루미나, 캘리포니아주 샌디에고) 상에서 2회의 151-사이클 쌍형성된-말단 실행 플러스 2회의 8-사이클 인덱스 판독을 사용하여 300 사이클에 대해 분석할 수 있다.

H. 심층 서열분석 데이터 분석

서열분석 데이터에서의 생성물의 동일성을 바코딩 PCR에서 앰플리콘 상에 적합화된 인덱스 바코드 서열에 기초하여 결정할 수 있다. 계산 스크립트를 예를 들어 하기 작업을 실행하는 MiSeq 데이터를 처리하는 데 사용할 수 있다:

● 보우타이(Bowtie) (bowtie-bio.sourceforge.net/index.shtml) 소프트웨어를 사용하여 판독물을 인간 게놈 (빌드 GRCh38/38)에 정렬할 수 있다.

● 정렬된 판독물을 예상된 야생형 유전자좌 영역 (예를 들어, XRCC5_T1 또는 XRCC5_T3)과 비교할 수 있다.

● 표적 유전자좌의 임의의 부분에 정렬되지 않은 유전자좌 서열 및 판독물을 폐기할 수 있다.

● 야생형 표적 유전자좌 서열에 매칭되는 판독물의 총계를 낼 수 있다.

● indel (염기의 삽입 또는 결실)을 갖는 판독물을 indel 유형에 의해 카테고리화하고, 총계를 낼 수 있다.

● 총 indel 판독물을 야생형 판독물 및 indel 판독물의 합계로 나누어 퍼센트-돌연변이된 판독물을 수득할 수 있다.

NASC-PC1/NASC-PC2/Cas9 단백질 리보핵단백질 복합체 및 sgRNA/Cas9 단백질 리보핵단백질 복합체에 의해 표적화된 영역에서의 indel 서열의 확인을 통해, 인간 세포주에서의 서열-특이적 표적화를 결정할 수 있다. NASC-PC1/NASC-PC2 샘플에서의 편집을 sgRNA 대조군의 편집 효율과 비교할 수 있다.

본 명세서 및 실시예의 안내에 따라, 게놈 서열의 세포내 편집은 다른 Cas 단백질 및 그의 동족 NASC 폴리뉴클레오티드 조성물을 사용하여 관련 기술분야의 통상의 기술자에 의해 실시될 수 있다.

실시예 7

crRNA의 확인 및 스크리닝

본 실시예에서, 부류 2 CRISPR 시스템을 갖는 종의 crRNA가 확인될 수 있는 방법이 기재된다. 본원에 제시된 방법은 문헌 [Chylinski, K., et al., RNA Biology 10(5):726-737 (2013)]로부터 적합화된다. 모든 하기 단계가 스크리닝하는 데 요구되는 것은 아니고, 또한 단계의 순서가 제시된 바와 같아야 하는 것도 아니다.

A. 부류 2 CRISPR 유전자좌를 함유하는 종의 확인

베이직 로컬 얼라인먼트 서치 툴(Basic Local Alignment Search Tool) (BLAST, blast.ncbi.nlm.nih.gov/Blast.cgi)을 사용하여, 다양한 종의 게놈의 검색을 부류 2 CRISPR Cas 뉴클레아제 (예를 들어, Cas9 단백질, Cpf1 단백질, Cas9-유사 단백질, Cpf1-유사 단백질 등)를 확인하기 위해 수행할 수 있다. 부류 2 CRISPR 시스템은 종 전반의 서열에서 높은 다양성을 나타내지만, 부류 2 CRISPR 뉴클레아제 오르토로그는 보존된 도메인, 예를 들어, HNH 엔도뉴클레아제 도메인 및/또는 RuvC/RNase H 도메인을 갖는다. 주요 BLAST 결과는 확인된 도메인에 대해 필터링될 수 있고, 불완전 또는 말단절단된 서열은 폐기될 수 있고, 부류 2 CRISPR 뉴클레아제 오르토로그를 갖는 종이 확인될 수 있다.

부류 2 CRISPR 뉴클레아제 오르토로그가 종에서 확인될 수 있는 경우에, Cas 단백질 오르토로그 코딩 서열 (예를 들어, Cas9 단백질 또는 Cpf1 단백질)에 인접한 서열을 다른 Cas 단백질 및 회합된 반복-스페이서 어레이에 대해 프로빙하여 CRISPR-Cas 유전자좌에 속하는 모든 서열을 확인할 수 있다. 이는 다른 기지의 부류 2 CRISPR 유전자좌에 대한 정렬에 의해 이루어질 수 있다.

뉴클레아제 오르토로그에 대한 부류 2 CRISPR 유전자좌의 서열을 종에 대해 확인할 수 있다면, 인 실리코 예측 스크리닝을 crRNA 서열을 추출하는 데 사용할 수 있다. crRNA 서열은 CRISPR 반복 어레이 내에 함유되고, 외래 스페이서 서열이 그 사이의 공간을 차지하는 그의 특징 반복 서열에 의해 확인될 수 있다.

B. RNA-Seq 라이브러리의 제조

인 실리코로 확인된 개별 crRNA를 함유하는 추정 CRISPR 어레이는 RNA 서열분석 (RNA-seq)을 사용하여 추가로 검증될 수 있다.

추정 crRNA를 포함하는 것으로 확인된 종으로부터의 세포를 상업적 저장소 (예를 들어, ATCC, 버지니아주 마나사스; 저먼 콜렉션 오브 마이크로오가니즘스 앤드 셀 컬쳐스 게엠베하(German Collection of Microorganisms and Cell Cultures GmbH) (DSMZ), 독일 브라운슈바이크)로부터 입수할 수 있다.

세포를 중간 로그기로 성장시키고, 트리졸(Trizol) 시약 (시그마알드리치, 미주리주 세인트 루이스)을 사용하여 총 RNA를 제조하고, DNaseI (퍼멘타스(Fermentas), 리투아니아 빌니우스)로 처리할 수 있다.

10μg의 총 RNA를 리보-제로(Ribo-Zero) rRNA 제거 키트 (일루미나, 캘리포니아주 샌디에고)로 처리하고, 나머지 RNA를 RNA 클린 앤드 콘센트레이터(RNA Clean and Concentrators) (지모 리서치(Zymo Research), 캘리포니아주 어바인)를 사용하여 정제할 수 있다.

이어서, 라이브러리를 제조업체의 지침에 따라 TruSeq 소형 RNA 라이브러리 제조 키트 (일루미나, 캘리포니아주 샌디에고)를 사용하여 제조할 수 있다. 이는 어댑터 서열을 갖는 cDNA를 생성한다.

생성된 cDNA 라이브러리를 MiSeq 서열분석기 (일루미나, 캘리포니아주 샌디에고)를 사용하여 서열분석할 수 있다.

C. 서열분석 데이터의 처리

cDNA 라이브러리의 서열분석 판독물은 예를 들어 하기 방법을 사용하여 처리할 수 있다.

어댑터 서열을 컷어댑트(cutadapt) 1.1 (pypi.python.org/pypi/cutadapt/1.1)을 사용하여 제거할 수 있고, 약 15nt를 판독물의 3' 말단으로부터 트리밍하여 판독 품질을 개선시킬 수 있다.

판독물을 보우타이 2 (http://bowtie-bio.sourceforge.net/bowtie2/index.shtml)를 사용하여 각각의 종의 게놈 (즉, 추정 crRNA가 확인된)에 대해 정렬할 수 있다.

보우타이 2에 의해 생성된 서열 정렬/맵 (SAM) 파일을 후속 서열분석 분석 단계에 대해 샘툴즈(SAMTools) (samtools.sourceforge.net/)를 사용하여 2원 정렬/맵 (BAM) 파일로 전환시킬 수 있다.

CRISPR 유전자좌 또는 유전자좌들에 대한 판독 커버리지 맵핑을 베드툴즈(BedTools) (bedtools.readthedocs.org/ en/latest/)를 사용하여 BAM 파일로부터 계산할 수 있다.

이전 단계에서 생성된 BED 파일을 인터그레이티브 게노믹스 뷰어(Integrative Genomics Viewer) (IGV; www.broadinstitute.org/igv/)로 로딩하여 서열분석 판독 파일업을 가시화할 수 있다. 판독 파일업을 사용하여 전사된 추정 crRNA 서열의 5' 및 3' 말단을 확인할 수 있다.

추정 crRNA 요소 서열이 생체내에서 활발히 전사되는 것을 검증하기 위해 RNA-seq 데이터를 사용할 수 있다. 인 실리코 및 RNA-seq 스크린의 비교로부터 확인된 히트를 본원에 약술된 방법을 사용하여 이중-가닥 DNA 표적 핵산 서열의 부류 2 CRISPR 뉴클레아제 절단을 지원하는 기능적 능력에 대해 검증할 수 있다 (실시예 2, 3 및 5 참조). 부류 2 제V형 CRISPR 시스템이 이중-가닥 DNA 표적 서열의 Cpf1 뉴클레아제 절단을 용이하게 하기 위해 오직 crRNA만을 필요로 하는 반면, 부류 2 제II형 CRISPR 시스템은 이중-가닥 DNA 표적 서열의 Cas9 뉴클레아제 절단을 용이하게 하기 위해 crRNA 및 동족 tracrRNA를 필요로 한다는 것이 관련 기술분야에 공지되어 있다.

본 명세서 및 실시예의 안내에 따라, Cas9 단백질과 회합된 crRNA 서열의 확인은 관련 기술분야의 통상의 기술자에 의해 실시될 수 있다.

실시예 8

tracrRNA의 확인 및 스크리닝

본 실시예는 예를 들어 부류 2 제II형 CRISPR-Cas9 시스템을 갖는 종의 tracrRNA가 확인될 수 있는 방법을 예시한다. 이는 문헌 [Chylinski, K., et al., RNA Biology 10(5):726-737 (2013)]으로부터 적합화된다. 모든 하기 단계가 스크리닝하는 데 요구되는 것은 아니고, 또한 단계의 순서가 제시된 바와 같아야 하는 것도 아니다.

A. CRISPR-Cas9 제II형 시스템을 함유하는 종의 확인

베이직 로컬 얼라인먼트 서치 툴 (BLAST, blast.ncbi.nlm.nih.gov/Blast.cgi)을 사용하여, 다양한 종의 게놈의 검색을 Cas9 단백질을 확인하기 위해 수행할 수 있다. 부류 2 제II형 CRISPR-Cas9 시스템은 종 전반의 서열에서 높은 다양성을 나타내지만, Cas9 오르토로그는 중심 HNH 엔도뉴클레아제 도메인 및 분할 RuvC/RNase 도메인의 보존된 도메인 아키텍처를 나타낸다. 주요 BLAST 결과는 확인된 도메인에 대해 필터링될 수 있고, 불완전 또는 말단절단된 서열은 폐기될 수 있고, Cas9 오르토로그가 확인될 수 있다.

Cas9 오르토로그가 종에서 확인될 수 있는 경우에, Cas9 오르토로그-코딩 서열에 인접한 서열을 다른 Cas 단백질 및 Cas-회합된 반복-스페이서 어레이에 대해 프로빙하여 CRISPR-Cas9 유전자좌에 속하는 모든 서열을 확인할 수 있다. 이는 밀접하게 관련된 종이 유사한 CRISPR-Cas9 유전자좌 아키텍처 (예를 들어, Cas 단백질 조성, 크기, 배향, 어레이의 위치, tracrRNA의 위치 등)를 나타낸다는 지식을 통해, 다른 기지의 부류 2 제II형 CRISPR-Cas9 유전자좌에 대한 정렬에 의해 이루어질 수 있다. tracrRNA 요소는 전형적으로 부류 2 제II형 CRISPR-Cas9 유전자좌 내에 함유되고, 반복-스페이서 어레이 내의 반복 요소에 상보적인 그의 서열에 의해 용이하게 확인될 수 있다. 반복 요소에 상보적인 tracr 서열은 tracr 안티-반복 서열로 불린다.

Cas9 오르토로그에 상응하는 CRISPR-Cas9 유전자좌의 서열이 종에 대해 확인된다면, 인 실리코 예측 스크리닝을 tracr 안티-반복 서열을 추출하는 데 사용여 Cas-회합된 tracrRNA를 확인할 수 있다. 추정 안티-반복부는 예를 들어 하기와 같이 스크리닝할 수 있다:

반복 서열이 기지의 종의 것인 경우에, 반복 서열을 CRISPRdb 데이터베이스 (crispr.u-psud.fr/crispr/)에서 확인하고 그로부터 검색할 수 있다. 반복 서열이 기지의 종의 것이 아닌 경우에, 반복 서열을 상기 기재된 바와 같은 종에 대한 부류 2 제II형 CRISPR-Cas9 유전자좌를 사용하는 CRISPR파인더(CRISPRfinder) 소프트웨어 (crispr.u-psud.fr/Server/)를 사용하여 예측할 수 있다.

종에 대해 확인된 반복 서열을 사용하여 안티-반복 서열에 대한 CRISPR-Cas9 유전자좌를 프로빙할 수 있다 (예를 들어, BLASTp 알고리즘 등을 사용함). 검색은 전형적으로 CRISPR-Cas9 유전자좌의 유전자간 영역으로 제한된다.

확인된 tracr 안티-반복 영역을 확인된 반복 서열에 대한 상보성에 대해 검증할 수 있다.

추정 안티-반복 영역을 Rho-비의존성 전사 종결인자 (트랜스텀 HP(TransTerm HP), transterm.cbcb.umd.edu/)의 존재에 대해 추정 안티-반복 영역의 영역 5' 및 3'에서 프로빙할 수 있다.

안티-반복 요소 및 Rho-비의존성 전사 종결인자를 포함하는 확인된 서열을 조합함으로써, 서열을 제공된 종의 추정 tracrRNA인 것으로 결정할 수 있다.

B. RNA-Seq 라이브러리의 제조

인 실리코 확인된 추정 tracrRNA를 RNA 서열분석 (RNA-seq)을 사용하여 추가로 검증할 수 있다.

추정 tracrRNA를 포함하는 종으로부터의 세포를 상업적 저장소 (예를 들어, ATCC, 버지니아주 마나사스; DSMZ, 독일 브라운슈바이크)로부터 입수할 수 있다.

세포를 중간 로그기로 성장시키고, 트리졸 시약 (시그마알드리치, 미주리주 세인트 루이스)을 사용하여 총 RNA를 제조하고, DNaseI (퍼멘타스, 리투아니아 빌니우스)로 처리할 수 있다.

10ug의 총 RNA를 리보-제로 rRNA 제거 키트 (일루미나, 캘리포니아주 샌디에고)를 사용하여 처리하고, 나머지 RNA를 RNA 클린 앤드 콘센트레이터 (지모 리서치, 캘리포니아주 어바인)를 사용하여 정제할 수 있다.

라이브러리를 제조업체의 지침에 따라 TruSeq 소형 RNA 라이브러리 제조 키트 (일루미나, 캘리포니아주 샌디에고)를 사용하여 제조할 수 있다. 이는 어댑터 서열을 갖는 cDNA를 생성한다.

C. 서열분석 데이터의 처리

어댑터 서열을 컷어댑트 1.1 (pypi.python.org/ pypi/cutadapt/1.1)을 사용하여 제거할 수 있고, 약 15nt를 판독물의 3' 말단으로부터 트리밍하여 판독 품질을 개선시킬 수 있다.

보우타이 2에 의해 생성된 서열 정렬/맵 (SAM) 파일을 후속 서열분석 분석 단계에 대해 샘툴즈 (http://samtools.sourceforge.net/)를 사용하여 2원 정렬/맵 (BAM) 파일로 전환시킬 수 있다.

CRISPR 유전자좌 또는 유전자좌들에 대한 판독 커버리지 맵핑을 베드툴즈 (bedtools.readthedocs.org/ en/latest/)를 사용하여 BAM 파일로부터 계산할 수 있다.

이전 단계에서 생성된 BED 파일을 인터그레이티브 게노믹스 뷰어 (IGV; www.broadinstitute.org/igv/)로 로딩하여 서열분석 판독 파일업을 가시화할 수 있다. 판독 파일업을 사용하여 전사된 추정 tracrRNA 서열의 5' 및 3' 말단을 확인할 수 있다.

추정 tracrRNA 요소 서열이 생체내에서 활발히 전사되는 것을 검증하기 위해 RNA-seq 데이터를 사용할 수 있다. 인 실리코 및 RNA-seq 스크린의 비교로부터 확인된 히트를 본원에 약술된 방법을 사용하여 이중-가닥 DNA 표적 서열의 Cas9-매개 절단을 지원하는 확인된 tracrRNA 서열 및 그의 동족 crRNA의 기능적 능력에 대해 검증할 수 있다 (예를 들어, 실시예 2, 3 및 5).

본 명세서 및 실시예의 안내에 따라, Cas9 단백질과 관련된 tracrRNA 서열의 확인은 관련 기술분야의 통상의 기술자에 의해 달성될 수 있다.

실시예 9

진핵 세포에서의 표적 서열 변형의 검출을 위한 T7E1 검정

본 실시예는 선택된 이중-가닥 DNA 표적 서열에 비해 NASC/Cas9 단백질 복합체 (예를 들어, NASC-PC1/NASC-PC2/Cas9 단백질 복합체)의 생체내 퍼센트 절단을 평가 및 비교하기 위한 T7E1 검정의 사용을 예시한다.

A. Cas 폴리뉴클레오티드 성분을 사용한 세포 형질감염

NASC-PC1 및 NASC-PC2를 뉴클레오펙터® 96-웰 셔틀 시스템 (론자, 뉴저지주 알렌데일) 및 하기 프로토콜을 사용하여 에스. 피오게네스 Cas9를 구성적으로 발현하는 HEK293 세포 (HEK293-Cas9) 내로 형질감염시킬 수 있다. NASC-PC1 및 NASC-PC2를 개별적으로 적절한 농도 (예를 들어, 120pmol)로 희석하고, 함께 혼합하고, 95℃에서 2분 동안 인큐베이션하고, 써모사이클러로부터 제거하고, 실온으로 평형화되도록 하고, 96-웰 플레이트에서 5μL 최종 부피로 분배할 수 있다. 배양 배지를 HEK293-Cas9 세포로부터 흡인할 수 있고, 세포를 칼슘 및 마그네슘-무함유 PBS로 1회 세척할 수 있고, 트리플 (라이프 테크놀로지스, 뉴욕주 그랜드 아일랜드)의 첨가에 의해 트립신처리한 후, 37℃에서 3-5분 동안 인큐베이션할 수 있다. 트립신처리된 세포를 위아래로 부드럽게 피펫팅하여 단세포 현탁액을 형성하고, 10% 소 태아 혈청 (FBS; 써모 사이언티픽, 델라웨어주 윌밍톤)을 함유하고 페니실린 및 스트렙토마이신 (라이프 테크놀로지스, 뉴욕주 그랜드 아일랜드)으로 보충된 DMEM 배양 배지 (라이프 테크놀로지스, 뉴욕주 그랜드 아일랜드)로 구성된 DMEM 완전 배양 배지에 첨가할 수 있다.

세포를 3분 동안 200 X g에서의 원심분리에 의해 펠릿화할 수 있고, 배양 배지를 흡인할 수 있고, 세포를 PBS에 재-현탁시킬 수 있다. 세포를 카운테스® II 자동화 세포 계수기 (라이프 테크놀로지스, 뉴욕주 그랜드 아일랜드)를 사용하여 계수할 수 있다. 2.2 x 10⁷개 세포를 1.5ml 미세원심분리기 튜브에 옮기고, 펠릿화할 수 있다. PBS를 흡인할 수 있고, 세포를 1 x 10⁷개 세포/mL의 밀도로 뉴클레오펙터™ SF (론자, 뉴저지주 알렌데일) 용액에 재-현탁시킬 수 있다. 20μL의 세포 현탁액을 5μL의 NASC-PC1/NASC-PC2를 함유하는 개별 웰에 첨가할 수 있고, 전체 부피를 96-웰 뉴클레오큐벳™ 플레이트 (론자, 뉴저지주 알렌데일)의 웰에 옮길 수 있다. 플레이트를 뉴클레오펙터™ 96-웰 셔틀™ (론자, 뉴저지주 알렌데일) 상에 로딩할 수 있고, 세포를 96-CM-130 뉴클레오펙터™ 프로그램 (론자, 뉴저지주 알렌데일)을 사용하여 뉴클레오펙션시킬 수 있다. 뉴클레오펙션 후, 70μL DMEM 완전 배양 배지를 각각의 웰에 첨가할 수 있고, 50μL의 세포 현탁액을 150μL 미리-가온된 DMEM 완전 배양 배지를 함유하는 콜라겐 코팅된 96-웰 세포 배양 플레이트로 옮길 수 있다. 플레이트를 조직 배양 인큐베이터로 옮기고, 37℃에서 5% CO₂ 하에 48시간 동안 유지할 수 있다.

B. T7E1 검정을 위한 이중-가닥 DNA 표적 서열 생성

gDNA를 웰당 50μL 퀵익스트랙트 DNA 추출 용액 (에피센터, 위스콘신주 매디슨)을 사용하여 NASC-PC1/NASC-PC2로의 형질감염에 이어서 37℃에서 10분, 65℃에서 6분, 및 95℃에서 3분 동안 인큐베이션하여 반응을 정지시킨 후 48시간에 HEK293-Cas9 세포로부터 단리할 수 있다. gDNA를 150μL 물로 희석할 수 있고, 샘플을 -80℃에서 저장할 수 있다.

단리된 gDNA로부터의 이중-가닥 DNA 표적 서열 (예를 들어, XRCC5_T1 및 XRCC5_T3)의 PCR 증폭에 의해 T7E1을 위한 DNA를 생성할 수 있다. PCR 반응은 카파 하이파이 핫 스타트 폴리머라제와 함께 8μL gDNA를 주형으로서 사용하여 설정되고, 25μL의 총 부피로 0.5U의 폴리머라제, 1x 반응 완충제, 0.4mM dNTP, 및 이중-가닥 DNA 표적 서열 중 1개에 대해 지시된 300nM 정방향 및 역방향 프라이머 (예를 들어, 서열식별번호: 47/서열식별번호: 48 및 서열식별번호: 49/서열식별번호: 50)를 함유할 수 있다. DNA 표적 서열을 하기 조건을 사용하여 증폭시킬 수 있다: 95℃에서 5분 동안, 98℃에서 20초, 70℃에서 20초, 마이너스 2℃/사이클, 72℃에서 30초의 4 사이클에 이어서 98℃에서 15초, 62℃에서 20초, 72℃에서 20초의 30 사이클, 및 72℃에서 1분 동안 최종 연장.

C. T7E1 검정

T7E1 검정을 위한 PCR-증폭된 이중-가닥 DNA 표적 서열을 95℃에서 10분 동안 변성시킨 다음, 써멀 사이클러에서 -0.5℃/초로 25℃로 냉각시킴으로써 재-어닐링되도록 할 수 있다. 재-어닐링된 DNA를 37℃에서 25분 동안 15μL의 총 부피로 1x NE버퍼 2 완충제 (뉴잉글랜드 바이오랩스, 매사추세츠주 입스위치) 중에서 0.5μL T7 엔도뉴클레아제 I과 함께 인큐베이션할 수 있다. T7E1 반응은 프래그먼트 애널라이저™ 시스템 (어드밴스드 어낼리티컬 테크놀로지스, 인크., 아이오와주 에임스) 및 DNF-910 이중-가닥 DNA 시약 키트 (어드밴스드 어낼리티컬 테크놀로지스, 인크., 미국 아이오와주 에임스)를 사용하여 분석할 수 있다. 프래그먼트 애널라이저™ 시스템은 각각의 절단 단편 및 절단 후 남아있는 이중-가닥 DNA 표적 서열의 농도를 제공한다.

이중-가닥 DNA 표적 서열의 절단 백분율은 각각의 절단 단편 및 절단이 일어난 후 남아있는 이중-가닥 DNA 표적 서열의 농도로부터 하기 식을 사용하여 계산할 수 있다.

방정식 1에서, 단편1 및 단편2 농도는 이중-가닥 DNA 표적 서열의 Cas9 절단 단편의 농도에 상응하고, 모 서열은 절단이 일어난 후 남아있는 이중-가닥 DNA 표적 서열에 상응한다.

진핵 세포에서의 표적 서열 변형의 검출을 위한 T7E1 검정은 본원에 기재된 NASC 폴리뉴클레오티드 조성물이 다중 이중-가닥 DNA 표적 서열의 Cas9-매개 부위-특이적 생체내 절단을 용이하게 하는 것을 입증하는 데이터를 제공한다. NASC 폴리뉴클레오티드 조성물과 동일한 DNA 표적 결합 서열을 갖는 sgRNA, crRNA, 및/또는 crRNA/tracrRNA 폴리뉴클레오티드는 또한 구축물 사이의 Cas-매개 부위-특이적 절단 백분율을 비교하기 위한 검정에 포함될 수 있다.

본 명세서 및 실시예의 안내에 따라, 본 실시예에 기재된 T7E1 검정은 다른 Cas 단백질 및 그의 동족 NASC 폴리뉴클레오티드 조성물을 사용하여 관련 기술분야의 통상의 기술자에 의해 실시될 수 있다.

실시예 10

부류 2 제V형 Cpf1 가이드 RNA 백본에서의 변형을 용인하는 부위에 대한 프로빙

본 실시예는 부류 2 제V형 가이드 crRNA의 다양한 변형의 생성 및 시험, 및 NASC 폴리뉴클레오티드 성분을 구축하는 데 사용하기 위한 그의 적합성을 기재한다. 하기 기재된 방법은 문헌 [Briner, A., et al., Molecular Cell 56(2):333-339 (2014)]으로부터 적합화된다. 모든 하기 단계가 스크리닝하는 데 요구되는 것은 아니고, 또한 단계의 순서가 제시된 바와 같아야 하는 것도 아니다.

본 실시예에서, 변형을 crRNA 백본 내에 도입하고, 변형된 crRNA를 NASC 폴리뉴클레오티드 성분에 대한 연결이 조작될 수 있는 Cpf1-crRNA 백본에서의 영역 또는 위치의 확인을 용이하게 하기 위해 동족 Cpf1 뉴클레아제를 사용하여 시험할 수 있다.

부류 2 제V형 CRISPR 시스템 (예를 들어, 아시다미노코쿠스 종 Cpf1)으로부터의 crRNA를 조작을 위해 선택할 수 있다. crRNA 서열을 인 실리코 변형하여 하기 영역 중 1개 이상으로부터 선택된 영역에서 하나 이상의 염기 치환, 결실 또는 삽입을 핵산 서열 내에 도입할 수 있다: 슈도-노트, Cpf1-스템 RNA 서열 1, 슈도-노트 루프 (루프 요소 핵산 서열), Cpf1-스템 RNA 서열 1C 또는 스페이서 요소의 5'의 핵산 서열.

crRNA 서열을 인 실리코 변형하여 하기로부터 선택되는 1개 이상의 영역에서 포스포디에스테르 백본에 하나 이상의 손상부를 도입할 수 있다: 슈도-노트, Cpf-1 스템 RNA 서열 1, 슈도-노트 루프 (루프 요소 핵산 서열), Cpf1-스템 RNA 서열 1C 또는 스페이서 요소의 5'의 핵산 서열.

염기 변형은 또한 crRNA 영역 중 임의의 것의 수소 염기-쌍 상호작용에서의 미스매치, 또는 2개의 염기의 치환을 통한 대안적 수소 염기-쌍 상호작용을 도입하는 염기-쌍 돌연변이를 도입하는 데 사용될 수 있으며, 여기서 대안적 수소 염기-쌍 상호작용은 원래 수소 염기-쌍 상호작용과 상이하다 (예를 들어, 원래 수소 염기-쌍 상호작용은 왓슨-크릭 염기 쌍형성이고, 2개의 염기의 치환은 역 후그스틴 염기 쌍형성을 형성함). 염기의 치환은 또한 crRNA 백본 내에 (예를 들어, 슈도-노트 루프 서열 내에) 수소 염기-쌍 상호작용을 도입하는 데 사용될 수 있다.

crRNA의 영역을 crRNA 백본에서의 2차 구조 요소를 도입하도록 독립적으로 조작할 수 있다. 이러한 2차 구조 요소는 하기를 포함하나 이에 제한되지는 않는다: 스템-루프 요소, 스템 요소, 슈도-노트 및 리보자임. 게다가, crRNA 가이드 RNA 백본을 변형시켜 crRNA에 대한 5' 말단, 3' 말단 또는 내부에서의 결실을 통해 crRNA 백본의 일부를 결실시킬 수 있다. 대안적 백본 구조를 또한 도입할 수 있다.

인 실리코 설계된 crRNA 서열을 합성을 위해 상업적 제조업체에 제공할 수 있다.

변형된 crRNA는 변형된 crRNA를 생성하는 crRNA에 대한 동족 Cpf1 단백질에 의해 매개된 이중-가닥 DNA 표적 서열의 절단을 지원하는 그의 능력에 대해 평가할 수 있다. 이중-가닥 DNA 표적 서열의 증폭 및 생화학적 절단 검정을 각각 실시예 4 및 실시예 5에 기재된 것들과 유사한 방식으로 수행할 수 있다. DNA 표적 서열의 그의 동족 Cpf1 단백질로의 절단을 매개할 수 있는 변형된 crRNA는 실시예 6에 기재된 방법을 사용하여 세포 내 활성에 대해 검증할 수 있다.

본 명세서 및 실시예의 안내에 따라, Cpf1 crRNA의 변형 (예를 들어, 다양한 서열의 도입 또는 결실, 및/또는 2차 구조 변형의 도입 또는 결실)은 NASC 폴리뉴클레오티드 조성물의 제조를 용이하게 하기 위한 삽입 또는 연결 위치에 대해 프로빙하는 데 사용될 수 있다. 본 실시예는 본 명세서의 교시를 고려하여 다른 제V형 CRISPR Cpf1 단백질 및 다른 제V형 CRISPR crRNA를 사용하여 관련 기술분야의 통상의 기술자에 의해 실시될 수 있다.

실시예 11

부류 2 제II형 Cas9 가이드 RNA 백본에서의 변형을 용인하는 부위에 대한 프로빙

본 실시예는 부류 2 제II형 가이드 RNA(들)의 다양한 변형의 생성 및 시험, 및 NASC 폴리뉴클레오티드 조성물을 구축하는 데 사용하기 위한 그의 적합성을 기재한다.

본 실시예에서, 변형을 부류 2 제II형 CRISPR 가이드 RNA(들) (예를 들어, 이중-가이드 RNA 또는 단일-가이드 RNA)의 RNA 백본 내에 도입하여 다양한 핵산 서열의 조작 또는 부착 위치를 확인할 수 있다. 하기 기재된 방법은 문헌 [Briner, A., et al., Molecular Cell 56(2):333-339 (2014)]으로부터 적합화된다. 모든 하기 단계가 스크리닝하는 데 요구되는 것은 아니고, 또한 단계의 순서가 제시된 바와 같아야 하는 것도 아니다.

부류 2 제II형 CRISPR sgRNA, crRNA, tracrRNA, 또는 crRNA 및 tracrRNA (집합적으로 "Cas9 가이드 RNA"로 지칭됨)를 조작을 위해 선택할 수 있다.

Cas9 가이드 RNA 서열을 인 실리코 변형하여 하기 중 1개 이상으로부터 선택되는 영역 내에 하나 이상의 염기 치환, 결실 또는 삽입을 도입할 수 있다: 핵산 표적 결합 서열, 하부 스템 핵산 서열, 벌지 핵산 서열, 상부 스템 핵산 서열, 제1 스템-루프 요소 핵산 서열, 넥서스 핵산 서열, 연결 핵산 서열 및/또는 3' 헤어핀. Cas9 가이드 RNA 서열을 인 실리코 변형하여 하기로부터 선택되는 1개 이상의 영역에서 포스포디에스테르 백본에 하나 이상의 손상부를 도입할 수 있다: 핵산 표적 결합 서열, 하부 스템 핵산 서열, 벌지 핵산 서열, 상부 스템 핵산 서열, 제1 스템-루프 요소 핵산 서열, 넥서스 핵산 서열, 연결 핵산 서열 및 3' 헤어핀.

염기 변형은 Cas9 가이드 RNA 영역 중 임의의 것의 수소 염기-쌍 상호작용에서의 미스매치를 도입하는 데 사용될 수 있다. 염기-쌍 돌연변이는 2개의 염기의 치환을 통한 대안적 수소 염기-쌍 상호작용을 도입하는 데 사용될 수 있으며, 여기서 대안적 수소 염기-쌍 상호작용은 원래 수소 염기-쌍 상호작용과 상이하다 (예를 들어, 원래 수소 염기-쌍 상호작용은 왓슨-크릭 염기 쌍형성이고, 2개의 염기의 치환은 역 후그스틴 염기 쌍형성을 형성함). 염기의 치환은 또한 Cas9 가이드 RNA 백본 내에 (예를 들어, 벌지 서열 내에) 수소 염기-쌍 상호작용을 도입하는 데 사용될 수 있다.

Cas9 가이드 RNA의 영역을 Cas9 가이드 RNA 백본 내에 2차 구조 요소를 도입하도록 독립적으로 조작할 수 있다. 이러한 2차 구조 요소는 하기를 포함하나 이에 제한되지는 않는다: 스템-루프 요소, 스템 요소, 슈도-노트 및 리보자임. 게다가, Cas9 가이드 RNA 백본을 변형하여 Cas9 가이드 RNA에 대한 5' 말단, 3' 말단 및/또는 내부에서의 결실을 통해 Cas9 가이드 RNA 백본의 일부를 결실시킬 수 있다. 대안적 백본 구조를 또한 도입할 수 있다.

인 실리코 설계된 부류 2 제II형 CRISPR Cas9 가이드 RNA 서열을 합성을 위해 상업적 제조업체에 제공할 수 있다.

변형된 부류 2 제II형 CRISPR Cas9 가이드 RNA는 변형된 Cas9 가이드 RNA를 생성하는 Cas9 가이드 RNA에 대한 동족 Cas9 단백질에 의해 매개된 이중-가닥 DNA 표적 서열의 절단을 지원하는 능력에 대해 평가할 수 있다. 이중-가닥 DNA 표적 서열의 증폭 및 생화학적 절단 검정을 각각 실시예 4 및 실시예 5에 기재된 것들과 유사한 방식으로 수행할 수 있다. DNA 표적 서열의 그의 동족 Cas9 단백질로의 절단을 매개할 수 있는 변형된 Cas9 가이드 RNA를 실시예 6에 기재된 방법을 사용하여 세포 내 활성에 대해 검증할 수 있다.

본 명세서 및 실시예의 안내에 따라, Cas9 가이드 RNA(들)의 변형 (예를 들어, 다양한 서열의 도입 또는 결실, 및/또는 2차 구조 변형의 도입 또는 결실)을 삽입 또는 연결 위치에 대해 프로빙하는 데 사용하여 NASC 폴리뉴클레오티드 조성물의 제조를 용이하게 할 수 있다. 본 실시예는 본 명세서의 교시를 고려하여 다른 제II형 CRISPR Cas9 단백질 및 다른 제II형 CRISPR Cas9 가이드 RNA를 사용하여 관련 기술분야의 통상의 기술자에 의해 실시될 수 있다.

실시예 12

DNA 표적 결합 서열을 포함하는 NASC 폴리뉴클레오티드 조성물의 스크리닝

본 실시예는 인간 gDNA에 존재하는 DNA 표적 서열을 변형시키고, 이들 부위에서의 절단 활성의 수준을 측정하기 위한 본 발명의 NASC 폴리뉴클레오티드 조성물의 사용을 예시한다.

표적 부위 (DNA 표적 서열)는 먼저 gDNA로부터 선택할 수 있다. NASC 폴리뉴클레오티드 조성물의 개별 성분은 선택된 서열을 표적화하도록 설계할 수 있다. 검정 (예를 들어, 실시예 5에 기재된 바와 같음)을 수행하여 DNA 표적 서열 절단의 수준을 결정할 수 있다.

모든 하기 단계가 모든 스크리닝에 요구되는 것은 아니고, 또한 단계의 순서가 제시된 바와 같아야 하는 것도 아니고, 스크리닝은 다른 실험에 커플링되거나 또는 보다 큰 실험의 부분을 형성할 수 있다.

A. gDNA로부터의 DNA 표적 영역 (DNA 표적 서열)의 선택

Cas 단백질 (예를 들어, 에스. 피오게네스 Cas9 또는 아시다미노코쿠스 종 Cpf1)에 대한 PAM 서열 (즉, NGG, TTN 등)을 선택된 게놈 영역 내에서 확인할 수 있다.

PAM 서열에 인접한 5'인 1종 이상의 Cas9 DNA 표적 서열 (20개 뉴클레오티드 길이)을 확인 및 선택할 수 있거나, 또는 PAM 서열에 인접한 3'인 1종 이상의 Cpf1 DNA 표적 서열 (20-24개 뉴클레오티드 길이)을 확인 및 선택할 수 있다.

핵산 표적 서열의 선택 기준은 하기를 포함하나 이에 제한되지 않을 수 있다: 게놈 내 다른 영역에 대한 상동성, 퍼센트 G-C 함량, 용융 온도, 스페이서 내의 단독중합체의 존재, 2종의 서열 사이의 거리, 및 관련 기술분야의 통상의 기술자에게 공지된 다른 기준.

제II형 CRISPR NASC 폴리뉴클레오티드 조성물을 사용하는 것이 바람직한 경우에, DNA 표적 결합 서열을 5' 말단에 혼입시킬 수 있다. 제V형 CRISPR NASC 폴리뉴클레오티드 조성물을 사용하는 것이 바람직한 경우에, DNA 표적 결합 서열을 3' 말단에 혼입시킬 수 있다. 상업적 제조업체는 전형적으로 제공된 서열에 기초하여 NASC 폴리뉴클레오티드 조성물을 합성한다. 대안적으로, NASC 폴리뉴클레오티드 조성물은 시험관내 전사에 의해 실시예 2에 기재된 바와 같이 제조될 수 있다.

본원에 기재된 바와 같은 NASC 폴리뉴클레오티드 조성물을 동족 부류 2 제II형 CRISPR 뉴클레아제 (예를 들어, Cas9 뉴클레아제), 부류 2 제V형 CRISPR 뉴클레아제 (예를 들어, Cpf1 뉴클레아제), 또는 동족 부류 2 제II형 CRISPR 뉴클레아제 및 부류 2 제V형 CRISPR 뉴클레아제 둘 다와 함께 사용하여 NASC/Cas 단백질 복합체를 형성할 수 있다.

B. 절단 백분율 및 특이성의 결정

NASC 폴리뉴클레오티드 조성물과 관련된 시험관내 절단 백분율 및 특이성 (예를 들어, 오프-타겟 결합의 양)은 예를 들어 실시예 5에 기재된 절단 검정을 사용하여 결정할 수 있고, 하기와 같이 비교할 수 있다:

(1) DNA 표적 서열의 오직 단일 쌍만이 NASC에 대해 확인 또는 선택될 수 있는 경우에, 각각의 DNA 표적 서열에 대한 절단 백분율 및 특이성을 결정할 수 있다. 필요한 경우에, 절단 백분율 및/또는 특이성은 NASC를 변형시키는 것; 또는 이펙터 단백질/이펙터 단백질-결합 서열을 도입하여 NASC, NASC 폴리뉴클레오티드 성분 또는 Cas 단백질을 변형시키는 것; 또는 리간드/리간드 결합 모이어티를 도입하여 NASC 폴리뉴클레오티드 또는 Cas 단백질을 변형시키는 것을 포함하나 이에 제한되지는 않는 방법을 사용하여 추가 실험에서 변경될 수 있다.

(2) DNA 표적 서열의 다중 쌍이 NASC에 대해 확인 또는 선택될 수 있는 경우에, 절단 검정으로부터 수득된 백분율 절단 데이터 및 부위-특이성 데이터를 표적 결합 서열을 포함하는 상이한 DNA 사이에 비교하여 목적하는 절단 백분율 및 특이성을 갖는 DNA 표적 서열을 확인할 수 있다. 절단 백분율 데이터 및 특이성 데이터는 다양한 적용에 대해 염기 선택 기준을 제공한다. 예를 들어, 일부 상황에서 NASC 폴리뉴클레오티드 조성물의 활성은 가장 중요한 인자일 수 있다. 다른 상황에서, 절단 부위의 특이성은 절단 백분율보다 상대적으로 더 중요할 수 있다. 필요한 경우에, 절단 백분율 및/또는 특이성은 NASC를 변형시키는 것; 또는 이펙터 단백질/이펙터 단백질-결합 서열을 도입하여 NASC, NASC 폴리뉴클레오티드 성분 또는 Cas 단백질을 변형시키는 것; 또는 리간드/리간드 결합 모이어티를 도입하여 NASC 폴리뉴클레오티드 성분 또는 Cas 단백질을 변형시키는 것을 포함하나 이에 제한되지는 않는 방법을 사용하여 추가 실험에서 변경될 수 있다.

대안적으로, 또는 시험관내 분석에 더하여, NASC 폴리뉴클레오티드 조성물과 연관된 세포내 절단 백분율 및 특이성은 예를 들어 실시예 6에 기재된 방법을 사용하여 수득할 수 있고, 하기와 같이 비교할 수 있다:

본 명세서 및 실시예의 안내에 따라, 본 실시예에 기재된 스크리닝은 동족 부류 2 제II형 CRISPR Cas9 단백질, 동족 부류 2 제V형 CRISPR Cpf1 단백질, 또는 동족 부류 2 제II형 CRISPR Cas9 단백질 및 동족 부류 2 제V형 CRISPR Cpf1 단백질 둘 다와 함께 사용하기 위한 다른 NASC 폴리뉴클레오티드 조성물을 사용하여 관련 기술분야의 통상의 기술자에 의해 실시될 수 있다.

실시예 13

NASC 폴리뉴클레오티드 조성물을 포함하는 리보핵단백질 폐쇄된-케이지 복합체의 조작

본 실시예는 소분자의 패키징을 위한 NASC-CC 폐쇄된-케이지 복합체의 형성을 위한 본 발명의 NASC 폴리뉴클레오티드 조성물의 사용을 예시한다.

NASC-CC는 예를 들어 각각 도 6h에 제시된 일반적 구조 (도 6h, I, NASC-PC1; 도 6h, II, NASC-PC2; 및 도 6h, III, NASC-PC-3)를 갖는 제1 NASC 폴리뉴클레오티드 조성물 및 제2 NASC 폴리뉴클레오티드 조성물을 사용하여 조작할 수 있다. 제1 NASC 폴리뉴클레오티드 조성물 및 제2 NASC 폴리뉴클레오티드 조성물을 3종의 이중-가닥 DNA 서열과 조합하여 사용할 수 있다. 각각의 이중-가닥 DNA 서열 ("이중-가닥 DNA 브레이스 서열")은 2종의 고유 DNA 표적 서열을 포함하며, 여기서 제1 DNA 표적 서열은 제1 NASC 폴리뉴클레오티드 조성물의 제1 핵산 결합 서열에 상보적이고, 제2 DNA 표적 서열은 제2 NASC 폴리뉴클레오티드 조성물의 제2 핵산 결합 서열에 상보적이다.

NASC-CC 및 회합된 Cas 단백질을 사용하여 분자의 패키징에 적합한 폐쇄된-케이지 복합체를 생성할 수 있다. 케이지의 크기는 NASC-CC 성분의 설계를 바꿈으로써 또는 상이한 길이 DNA 표적 서열에 결합함으로써 달라질 수 있다.

A. NASC-CC 성분의 설계

도 6a에 도시된 것들과 구조에서 유사한 NASC-PC1, NASC-PC2 및 NASC-PC3을 포함하는 제1 NASC 폴리뉴클레오티드 조성물 (본 실시예에서 "NASC-트리플렉스1"로 지칭됨)이 조작될 수 있다 (본 실시예에서 "NASC-PC1-트리플렉스1", "NASC-PC2-트리플렉스1" 및 "NASC-PC3-트리플렉스1"로 지칭됨). 제1 20개-뉴클레오티드 DNA 표적 서열을 각각의 NASC-PC1-트리플렉스1, NASC-PC2-트리플렉스1 및 NASC-PC3-트리플렉스1의 5' 말단 (예를 들어, 도 6a, (610)-(611))에 부가할 수 있다. DNA 표적 서열은 전형적으로 NASC-CC가 도입되는 유기체에서의 천연 DNA 서열 (예를 들어, 인간 gDNA 또는 식물 gDNA)에 대해 상동성을 갖지 않거나 제한된 상동성을 갖도록 선택될 것이다.

도 6a에 도시된 것들과 구조에서 유사한 NASC-PC1-트리플렉스2, NASC-PC2-트리플렉스2 및 NASC-PC3-트리플렉스2를 포함하는 제2 NASC 폴리뉴클레오티드 조성물 (본 실시예에서 "NASC-트리플렉스2"로 지칭됨)이 조작될 수 있다. 제2 20개-뉴클레오티드 DNA 표적 서열을 각각의 NASC-PC1-트리플렉스2, NASC-PC2-트리플렉스2 및 NASC-PC3-트리플렉스2의 5' 말단 (예를 들어, 도 6a, (610)-(611) 참조)에 부가할 수 있다. DNA 표적 서열은 전형적으로 NASC-CC가 도입되는 유기체에서의 천연 DNA 서열 (예를 들어, 인간 gDNA 또는 식물 gDNA)에 대해 상동성을 갖지 않거나 제한된 상동성을 갖도록 선택될 수 있다. 게다가, 20개-뉴클레오티드 DNA 표적 서열은 NASC-트리플렉스1에서 조작된 DNA 표적 서열과 구분되어야 (즉, 그에 대해 상보적이지 않아야) 한다.

NASC-트리플렉스1 및 NASC-트리플렉스2의 예시적인 성분은 표 20에 제시된다. 표에서, "표적 서열" 열은 상응하는 NASC 폴리뉴클레오티드 성분 내의 핵산 표적 결합 서열에 상보적인 20bp DNA 표적 서열을 나타낸다.

표 20

NASC-트리플렉스1 및 NASC-트리플렉스2 성분

*NASC-트리플렉스 혼성화 영역은 밑줄표시되어 있다

이중-가닥 DNA 브레이스 서열은 5'에서 3' 방향으로 5' 말단에 20개 뉴클레오티드 무작위 서열, 표적 서열 1, 씨. 제주니 PAM 서열 5'-NNNACA-3' (여기서 "N"은 임의의 뉴클레오티드임), 50개 뉴클레오티드의 무작위 서열, 역 상보적인 씨. 제주니 PAM 서열, 역 상보적인 표적 서열 2, 및 3' 말단에 무작위 20개-뉴클레오티드 서열을 혼입시키도록 조작될 수 있다. 이중-가닥 DNA 브레이스 서열은 NASC-PC1-트리플렉스1 및 NASC-PC1-TRP2 둘 다에 결합된 경우에 씨. 제주니 dCas9 단백질에 의해 표적화가능할 것이고, 2종의 NASC를 서로 근접하게 가져올 것이다. 이중-가닥 DNA 브레이스 서열의 서열을 이중-가닥 DNA의 합성을 위해 상업적 제조업체에 제공할 수 있다. 대안적으로, 이중-가닥 DNA 브레이스 서열의 서열은 단일-가닥 DNA 올리고뉴클레오티드를 사용하여 실시예 2에 제시된 이중-가닥 DNA 주형의 구축과 유사하게 구축할 수 있다.

이중-가닥 DNA 브레이스 서열에 대한 예시적인 서열은 표 21에 제시된다.

표 21

이중-가닥 DNA 브레이스 서열

*표적 및 PAM 서열은 볼드체이다

B. 씨. 제주니 dCas9 단백질의 조작 및 제조

씨. 제주니 (예를 들어, 씨. 제주니 NCTC 1168; 서열식별번호: 103) Cas9 아미노산 서열을 아미노산 위치 8의 아스파르트산에서 알라닌으로 (D8A) 및 위치 559의 히스티딘에서 알라닌으로 (D8A/H559A) 돌연변이시켜 씨. 제주니 Cas9 단백질의 뉴클레아제-불활성 형태 (씨. 제주니 dCas9 단백질; 서열식별번호: 56)를 생성할 수 있다. 씨. 제주니 dCas9 단백질은 NASC-트리플렉스1에 결합할 수 있는 채로 남아있을 것이다. 3종의 씨. 제주니 dCas9 단백질은 NASC-트리플렉스1에 결합할 수 있고, NASC-트리플렉스1이 그 안의 핵산 표적 결합 서열에 상보적인 표적 서열에 결합하도록 지시할 수 있다. 씨. 제주니 dCas9 단백질은 2종의 핵 국재화 서열 (NLS)로 C-말단 태그부착될 수 있고, 이. 콜라이에서 재조합적으로 발현되고, 크로마토그래피 방법을 사용하여 정제될 수 있다.

C. NASC-CC의 형성

NASC-트리플렉스1은 NASC-PC1-트리플렉스1, NASC-PC2-트리플렉스1 및 NASC-PC3-트리플렉스1 (표 20)을 등몰 농도로 혼합하고, 95℃에서 2분 동안 인큐베이션하고, 써멀 사이클러에서 -0.5℃/초로 25℃로 냉각시킴으로써 어닐링한 다음, 혼합물이 실온으로 평형화되도록 함으로써 형성할 수 있다. NASC-트리플렉스2는 NASC-PC1-트리플렉스2, NASC-PC2-트리플렉스2 및 NASC-PC3-트리플렉스2 (표 20)를 등몰 농도로 혼합하고, 95℃에서 2분 동안 인큐베이션하고, 써멀 사이클러에서 -0.5℃/초로 25℃로 냉각시킴으로써 어닐링한 다음, 혼합물이 실온으로 평형화되도록 함으로써 형성할 수 있다.

리보핵단백질 폐쇄된-케이지 복합체는 결합 완충제 (pH 7.4에서 20mM HEPES, 100mM KCl, 5mM MgCl₂, 및 5% 글리세롤) 중에서 씨. 제주니 dCas9 단백질의 과잉 농도의 존재 하에 NASC-트리플렉스1을 혼합하고, 37℃에서 20분 동안 인큐베이션함으로써 형성할 수 있다. 이중-가닥 DNA 브레이스 서열을 NASC-트리플렉스1/dCas9 단백질 복합체를 포함하는 혼합물에 한계 농도로 첨가하고, 37℃에서 20분 동안 인큐베이션할 수 있다. NASC-트리플렉스2를 NASC-트리플렉스1/dCas9 단백질/이중-가닥 DNA 브레이스 서열의 혼합물에 NASC-트리플렉스1의 등몰 농도로 첨가할 수 있다. 혼합물을 37℃에서 1시간 동안 인큐베이션할 수 있다. NASC-트리플렉스1/dCas9 단백질/이중-가닥 DNA 브레이스 서열/NASC-트리플렉스2/dCas9 단백질 폐쇄된-케이지 복합체를 -80℃에서 장기간 저장 동안 동결시킬 수 있다.

도 6l은 Cas 단백질이 명확성을 위해 생략된 기저 핵산 스캐폴드 구조 (NASC-CC)의 예를 도시한다. NASC-트리플렉스 1 및 NASC-트리플렉스2는 이 도면에서 도 6g에 제시된 구조에 상응하는 구조이다. 이 도면에서의 파선은 NASC-트리플렉스1 및 NASC-트리플렉스2 사이의 이중-가닥 DNA 브레이스 서열에 의해 생성된 연결의 종류의 표시를 제공한다. 도 6m은 dCas9 단백질 단백질과 복합체화된 NASC-CC를 예시한다. dCas9 단백질 단백질은 이 도면에서 회색 원으로 표시된다.

본 명세서 및 실시예의 안내에 따라, 다른 NASC-CC 리보핵단백질 폐쇄된-케이지 복합체 (예를 들어, 본원에 기재된 NASC 조성물의 다양한 조합 포함)의 제제화는 다른 NASC 조성물 및 동족 Cas 단백질을 사용하여 관련 기술분야의 통상의 기술자에 의해 실시될 수 있다.

실시예 14

NASC 리보핵단백질 폐쇄된-케이지 복합체의 구조적 분석

하기 실시예는 조립된 NASC-CC/dCas 단백질 복합체의 적절한 조립을 검증하고 그의 크기 및 부피를 평가하기 위한 NASC-CC/dCas 단백질 폐쇄된-케이지 복합체의 특징화를 기재한다. 하기 기재된 방법은 문헌 [Andersen, F., et al., Nucleic Acids Research 36(4):1113-1119 (2008) 및 Lapinaite, A., et al., Nature 502(7472):519-523 (2013)]으로부터 적합화된다. 모든 하기 단계가 스크리닝하는 데 요구되는 것은 아니고, 또한 단계의 순서가 제시된 바와 같아야 하는 것도 아니다.

A. NASC-CC/dCas 단백질 복합체의 전기영동 이동성 이동 검정

NASC-CC/dCas 단백질 복합체는 실시예 13에 기재된 바와 같이 제제화되고, 방사성표지된 이중-가닥 DNA 브레이스 서열이 사용될 수 있도록 변형될 수 있다. 이중-가닥 DNA 브레이스 서열은 하기 반응 혼합물을 제조함으로써 방사성표지될 수 있다: T4 폴리뉴클레오티드 키나제 (뉴잉글랜드 바이오랩스, 매사추세츠주 입스위치)의 존재 하의 이중-가닥 DNA 브레이스 서열, γ-(³²P) ATP (프로메가, 위스콘신주 매디슨), 및 1X T4 폴리뉴클레오티드 키나제 반응 완충제. 반응 혼합물을 인큐베이션한 다음, 65℃에서 20분 동안 열 불활성화시킬 수 있다. 방사성표지된 DNA를 일러스터라 마이크로스핀(Illustra MicroSpin) G-25 칼럼 (지이 헬스케어(GE Healthcare), 펜실베니아주 피츠버그)을 사용하여 정제할 수 있다.

대안적으로, NASC-CC 성분 중 1개 이상은 유사한 방식으로 방사성표지될 수 있다.

방사성표지된 NASC-CC/dCas9 단백질 복합체를 10μL 부피로 분취시키고, 4℃에서 1X 트리스/보레이트/EDTA 완충제 (pH 8.3에서 90mM 트리스, 90mM 붕산, 2mM EDTA) 및 5mM MgCl₂를 함유하는 8% 천연 폴리아크릴아미드 겔에서의 전기영동에 의해 분해하였다. 겔을 후속적으로 건조시키고, PMI™ 시스템 (바이오-라드 래보러토리즈(Bio-Rad Laboratories), 캘리포니아주 허큘레스)을 사용하여 이미징하였다. NASC-CC의 개별 폴리뉴클레오티드 성분 (예를 들어, NASC-PC1-트리플렉스1, NASC-PC2-트리플렉스1, NASC-PC3-트리플렉스1, NASC-PC1-트리플렉스2, NASC-PC2-트리플렉스2, NASC-PC3-트리플렉스2, 이중-가닥 DNA 브레이스 서열, 및/또는 dCas9 단백질과 복합체화된 개별 성분)을 비교를 위한 대조군으로서 사용하여 완전히 형성된 NASC-CC/dCas9 단백질 복합체의 전기영동 이동성 이동을 확인할 수 있다.

B. NASC-CC/dCas9 단백질 복합체의 소각 X-선 산란

실시예 13에 기재된 NASC-CC/dCas9 단백질 복합체를 4℃에서 pH 7.4에서의 20mM HEPES, 100mM KCl, 5mM MgCl₂ 및 5% 글리세롤의 완충제 중에서 투석할 수 있다. NASC-CC/dCas9 단백질 복합체의 투석된 제제를 1mg/mL 내지 5mg/mL의 농도 시리즈를 사용하여 40μL의 최종 부피로 96-웰 플레이트의 웰 내에 분배할 수 있다.

소각 X-선 산란 (SAXS) 측정을 서비스 제공자, 예컨대 더 어드밴스드 라이트 소스(The Advanced Light Source) (캘리포니아주 버클리)에서 Mar165CCD 검출기를 갖춘 스트럭쳐럴리 인테그레이티드 바이올로지 포 라이프 사이언시스(Structurally Integrated BiologY for Life Sciences) (SIBYLS) 빔라인을 사용하여 수집할 수 있다. 데이터를 0.5초 내지 10초의 노출 시간 범위 및 1.5 미터 내지 5 미터의 검출기 거리를 갖는 다중 프레임으로 수집할 수 있다. 최적 수집 조건을 샘플에 대한 최소 방사선 손상뿐만 아니라 최적의 신호 대 잡음 비에 대해 평가할 수 있다. 유사하게, 빔라인 킬로전자-볼트 (keV) 에너지를 7keV 내지 15 keV의 범위로 조정할 수 있다. 완충제만을 함유한 대조군을 배경으로서 사용하고, 측정으로부터 차감할 수 있다.

데이터 처리 및 분석을 표준 빔라인 소프트웨어 및 프리무스(PRIMUS)를 사용하여 수행할 수 있다 (Konarev, P., et al., Journal of Applied Crystallography 36:1277-1282 (2003)). 데이터 모델링을 SAXS 분석 프로그램, 예컨대 오픈 소스 소프트웨어 스위트 (예를 들어, ATSAS 2.7.2, 문헌 [Petoukhov, M., et al., Journal of Applied Crystallography 45:342-350 (2012)])를 사용하여 수행할 수 있다. 상이안 뉴클레오티드 결합 상태 (예를 들어, sgRNA 단독, sgRNA 플러스 표적 가닥, sgRNA 플러스 표적 및 비-표적 가닥), 뿐만 아니라 구조 (예를 들어, 뉴클레아제, 단백질, 이중-가닥 DNA 및 RNA)에서의 Cas9 단백질 및 단일-가이드 RNA의 원자 좌표는 단백질 데이터베이스 (PDB, www.rcsb.org/pdb/home/home.do) 또는 전자 현미경검사 데이터 뱅크 (EMDB, www.ebi.ac.uk/pdbe/emdb/)로부터 이용가능하다. 이들 원자 좌표는 SAXS 데이터와 조합된 모델링에 의해 NASC-CC/dCas9 단백질 복합체의 내부 부피, 세공 크기 및 폐쇄된-케이지 크기를 계산하는 데 사용할 수 있다.

NASC-CC/dCas9 단백질 복합체를 변형시켜 생체분자, 단백질 또는 다른 페이로드의 패키징 및 전달에 필요한 대로 내부 부피, 세공 크기 또는 폐쇄된-케이지 크기를 증가 또는 감소시킬 수 있다. 이러한 변형은 제1 스템 요소 핵산 서열 (도 6a, (608)-(609); 도 6h, (623)-(624)/(658)-(657), (626)-(625)/(627)-(628), (652)-(651)/(655)-(646)) 및/또는 이중-가닥 DNA 브레이스 서열 (표 21)의 연장 또는 단축을 포함할 수 있으나 이에 제한되지는 않는다.

본 명세서 및 실시예의 안내에 따라, 내부 부피, 세공 크기 및 폐쇄된 케이지 크기를 포함한, NASC-CC/Cas 단백질 복합체의 구조적 특색의 분석이 관련 기술분야의 통상의 기술자에 의해 실시될 수 있다.

관련 기술분야의 통상의 기술자에게 명백한 바와 같이, 상기 실시양태의 다양한 변형 및 변화가 본 발명의 취지 및 범주로부터 벗어나지 않으면서 이루어질 수 있다. 이러한 변형 및 변화는 본 발명의 범주 내에 있다.

SEQUENCE LISTING <110> CARIBOU BIOSCIENCES, INC <120> ENGINEERED NUCLEIC ACID-TARGETING NUCLEIC ACIDS <130> CBI020.30 <150> 62/263,232 <151> 2015-12-04 <160> 109 <170> PatentIn version 3.5 <210> 1 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide Primer <400> 1 agtaataata cgactcacta tag 23 <210> 2 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide Primer <400> 2 aagcaccgac tcggtgccac tttttc 26 <210> 3 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide Primer <400> 3 taatacgact cactataggg gccactaggg acaggatgtc tcagagctat gcagt 55 <210> 4 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide Primer <400> 4 taatacgact cactatagta ggctatagtg tagatctgtc tcagagctat gcagt 55 <210> 5 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide Primer <400> 5 taatacgact cactatagga aaaagtggaa gcggcgagtc tcagagctat gcagt 55 <210> 6 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide Primer <400> 6 taatacgact cactataggc gataagtcgt gtcttacgtc tcagagctat gcagt 55 <210> 7 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide Primer <400> 7 taatacgact cactataggg gccactaggg acaggatgca catgaggatt ctcat 55 <210> 8 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide Primer <400> 8 taatacgact cactatagta ggctatagtg tagatctgca catgaggatt ctcat 55 <210> 9 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide Primer <400> 9 taatacgact cactatagga aaaagtggaa gcggcgagca catgaggatt ctcat 55 <210> 10 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide Primer <400> 10 taatacgact cactataggc gataagtcgt gtcttacgca catgaggatt ctcat 55 <210> 11 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide Primer <400> 11 gtctcagagc tatgcagtcc tggacaactg ccgaacagga ctgcatagca agttgagata 60 <210> 12 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide Primer <400> 12 gactcggtgc cactttttca agttgataac ggactagcct tatctcaact tgctatgcag 60 <210> 13 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide Primer <400> 13 gcacatgagg attctcatga gggacggcag aagaacctca tgagaatcca agtatgtgta 60 <210> 14 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide Primer <400> 14 gactcggtgc cactttttca agttgataac ggactagcct tacacatact tggattctca 60 <210> 15 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide Primer <400> 15 gtctcagagc tatgcagtcc tggacaactg ccgaacctca tgagaatcca agtatgtgta 60 <210> 16 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide Primer <400> 16 gactcggtgc cactttttca agttgataac ggactagcct tacacatact tggattctca 60 <210> 17 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide Primer <400> 17 gcacatgagg attctcatga gggacggcag aagaacagga ctgcatagca agttgagata 60 <210> 18 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide Primer <400> 18 gactcggtgc cactttttca agttgataac ggactagcct tatctcaact tgctatgcag 60 <210> 19 <211> 237 <212> DNA <213> Artificial Sequence <220> <223> cloning oligonucleotides <220> <221> misc_feature <222> (125)..(125) <223> n is a, c, g, or t <400> 19 tacacgtact tagtcgctga agctcttcta tgcaagcaga agacggcata cgagatcgag 60 taatgtgact ggagttcaga cgtgtgctct tccgatctgc tactggggcc actagggaca 120 ggatnggtgc tagctcagat cggaagagcg tcgtgtaggg aaagagtgta ggctatagtg 180 tagatctcgg tggtcgccgt atcattggta gaagagccgt caatcgagtt cgtacct 237 <210> 20 <211> 4175 <212> DNA <213> Artificial Sequence <220> <223> AAVS-1 target sequence <400> 20 ctcatgacca aaatccctta acgtgagtta cgcgcgcgtc gttccactga gcgtcagacc 60 ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta atctgctgct 120 tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa gagctaccaa 180 ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact gttcttctag 240 tgtagccgta gttagcccac cacttcaaga actctgtagc accgcctaca tacctcgctc 300 tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt accgggttgg 360 actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca 420 cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag cgtgagctat 480 gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta agcggcaggg 540 tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat ctttatagtc 600 ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg tcaggggggc 660 ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc ttttgctggc 720 cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac cgtattaccg 780 cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc gagtcagtga 840 gcgaggaagc ggaaggcgag agtagggaac tgccaggcat caaactaagc agaaggcccc 900 tgacggatgg cctttttgcg tttctacaaa ctctttctgt gttgtaaaac gacggccagt 960 cttaagctcg ggccccctgg gcggttctga taacgagtaa tcgttaatcc gcaaataacg 1020 taaaaacccg cttcggcggg tttttttatg gggggagttt agggaaagag catttgtcag 1080 aatatttaag ggcgcctgtc actttgcttg atatatgaga attatttaac cttataaatg 1140 agaaaaaagc aacgcacttt aaataagata cgttgctttt tcgattgatg aacacctata 1200 attaaactat tcatctatta tttatgattt tttgtatata caatatttct agtttgttaa 1260 agagaattaa gaaaataaat ctcgaaaata ataaagggaa aatcagtttt tgatatcaaa 1320 attatacatg tcaacgataa tacaaaatat aatacaaact ataagatgtt atcagtattt 1380 attatgcatt tagaataaat tttgtgtcgc ccttaattgt gagcggataa caattacgag 1440 cttcatgcac agtgaaatca tgaaaaattt atttgctttg tgagcggata acaattataa 1500 tatgtggaat tgtgagcgct cacaattcca caacggtttc cctctagaaa taattttgtt 1560 taacttttaa ggaggtaaaa aatgtacacg tacttagtcg ctgaagctct tctatgcaag 1620 cagaagacgg catacgagat cgagtaatgt gactggagtt cagacgtgtg ctcttccgat 1680 ctgctactgg ggccactagg gacaggattg gtgctagctc agatcggaag agcgtcgtgt 1740 agggaaagag tgtaggctat agtgtagatc tcggtggtcg ccgtatcatt ggtagaagag 1800 ccgtcaatcg agttcgtacc tggttgaccc caagggcgac accccctaat tagcccgggc 1860 gaaaggccca gtctttcgac tgagcctttc gttttatttg atgcctggca gttccctact 1920 ctcgcatggg gagtccccac actaccatcg gcgctacggc gtttcacttc tgagttcggc 1980 atggggtcag gtgggaccac cgcgctactg ccgccaggca aacaaggggt gttatgagcc 2040 atattcaggt ataaatgggc tcgcgataat gttcagaatt ggttaattgg ttgtaacact 2100 gacccctatt tgtttatttt tctaaataca ttcaaatatg tatccgctca tgagacaata 2160 accctgataa atgcttcaat aatattgaaa aaggaagaat atgagccata ttcaacggga 2220 aacgtcgagg ccgcgattaa attccaacat ggatgctgat ttatatgggt ataaatgggc 2280 tcgcgataat gtcgggcaat caggtgcgac aatctatcgc ttgtatggga agcccgatgc 2340 gccagagttg tttctgaaac atggcaaagg tagcgttgcc aatgatgtta cagatgagat 2400 ggtcagacta aactggctga cggaatttat gccacttccg accatcaagc attttatccg 2460 tactcctgat gatgcatggt tactcaccac tgcgatcccc ggaaaaacag cgttccaggt 2520 attagaagaa tatcctgatt caggtgaaaa tattgttgat gcgctggcag tgttcctgcg 2580 ccggttgcac tcgattcctg tttgtaattg tccttttaac agcgatcgcg tatttcgcct 2640 cgctcaggcg caatcacgaa tgaataacgg tttggttgat gcgagtgatt ttgatgacga 2700 gcgtaatggc tggcctgttg aacaagtctg gaaagaaatg cataaacttt tgccattctc 2760 accggattca gtcgtcactc atggtgattt ctcacttgat aaccttattt ttgacgaggg 2820 gaaattaata ggttgtattg atgttggacg agtcggaatc gcagaccgat accaggatct 2880 tgccatccta tggaactgcc tcggtgagtt ttctccttca ttacagaaac ggctttttca 2940 aaaatatggt attgataatc ctgatatgaa taaattgcag tttcatttga tgctcgatga 3000 gtttttctaa gcggcgcgcc atcgaatggc gcaaaacctt tcgcggtatg gcatgatagc 3060 gcccggaaga gagtcaattc agggtggtga atatgaaacc agtaacgtta tacgatgtcg 3120 cagagtatgc cggtgtctct tatcagaccg tttcccgcgt ggtgaaccag gccagccacg 3180 tttctgcgaa aacgcgggaa aaagtggaag cggcgatggc ggagctgaat tacattccca 3240 accgcgtggc acaacaactg gcgggcaaac agtcgttgct gattggcgtt gccacctcca 3300 gtctggccct gcacgcgccg tcgcaaattg tcgcggcgat taaatctcgc gccgatcaac 3360 tgggtgccag cgtggtggtg tcgatggtag aacgaagcgg cgtcgaagcc tgtaaagcgg 3420 cggtgcacaa tcttctcgcg caacgcgtca gtgggctgat cattaactat ccgctggatg 3480 accaggatgc cattgctgtg gaagctgcct gcactaatgt tccggcgtta tttcttgatg 3540 tctctgacca gacacccatc aacagtatta ttttctccca tgaggacggt acgcgactgg 3600 gcgtggagca tctggtcgca ttgggtcacc agcaaatcgc gctgttagcg ggcccattaa 3660 gttctgtctc ggcgcgtctg cgtctggctg gctggcataa atatctcact cgcaatcaaa 3720 ttcagccgat agcggaacgg gaaggcgact ggagtgccat gtccggtttt caacaaacca 3780 tgcaaatgct gaatgagggc atcgttccca ctgcgatgct ggttgccaac gatcagatgg 3840 cgctgggcgc aatgcgcgcc attaccgagt ccgggctgcg cgttggtgcg gatatctcgg 3900 tagtgggata cgacgatacc gaagatagct catgttatat cccgccgtta accaccatca 3960 aacaggattt tcgcctgctg gggcaaacca gcgtggaccg cttgctgcaa ctctctcagg 4020 gccaggcggt gaagggcaat cagctgttgc cagtctcact ggtgaaaaga aaaaccaccc 4080 tggcgcccaa tacgcaaacc gcctctcccc gcgcgttggc cgattcatta atgcagctgg 4140 cacgacaggt ttcccgactg gaaagcgggc agtga 4175 <210> 21 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> cloning oligonucleotides <400> 21 tacacgtact tagtcgctga agctcttcta tgcaagcaga agacggcata cgagat 56 <210> 22 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> cloning oligonucleotides <400> 22 aggtacgaac tcgattgacg gctcttctac caatgatacg gcgaccaccg agatct 56 <210> 23 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 23 ccccgttctc ctgtggattc 20 <210> 24 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 24 atcctctctg gctccatcgt 20 <210> 25 <211> 127 <212> RNA <213> Artificial Sequence <220> <223> sgRNA-1-AAVST1 <400> 25 ggggccacua gggacaggau gucucagagc uaugcagucc uggacaacug ccgaacagga 60 cugcauagca aguugagaua aggcuagucc guuaucaacu ugaaaaagug gcaccgaguc 120 ggugcuu 127 <210> 26 <211> 127 <212> RNA <213> Artificial Sequence <220> <223> sgRNA-1-VT2 <400> 26 guaggcuaua guguagaucu gucucagagc uaugcagucc uggacaacug ccgaacagga 60 cugcauagca aguugagaua aggcuagucc guuaucaacu ugaaaaagug gcaccgaguc 120 ggugcuu 127 <210> 27 <211> 127 <212> RNA <213> Artificial Sequence <220> <223> sgRNA-1-VT3 <400> 27 ggaaaaagug gaagcggcga gucucagagc uaugcagucc uggacaacug ccgaacagga 60 cugcauagca aguugagaua aggcuagucc guuaucaacu ugaaaaagug gcaccgaguc 120 ggugcuu 127 <210> 28 <211> 127 <212> RNA <213> Artificial Sequence <220> <223> sgRNA-1-VT4 <400> 28 ggcgauaagu cgugucuuac gucucagagc uaugcagucc uggacaacug ccgaacagga 60 cugcauagca aguugagaua aggcuagucc guuaucaacu ugaaaaagug gcaccgaguc 120 ggugcuu 127 <210> 29 <211> 127 <212> RNA <213> Artificial Sequence <220> <223> sgRNA-2-AAVST1 <400> 29 ggggccacua gggacaggau gcacaugagg auucucauga gggacggcag aagaaccuca 60 ugagaaucca aguaugugua aggcuagucc guuaucaacu ugaaaaagug gcaccgaguc 120 ggugcuu 127 <210> 30 <211> 127 <212> RNA <213> Artificial Sequence <220> <223> sgRNA-2-VT2 <400> 30 guaggcuaua guguagaucu gcacaugagg auucucauga gggacggcag aagaaccuca 60 ugagaaucca aguaugugua aggcuagucc guuaucaacu ugaaaaagug gcaccgaguc 120 ggugcuu 127 <210> 31 <211> 127 <212> RNA <213> Artificial Sequence <220> <223> sgRNA-2-VT3 <400> 31 ggaaaaagug gaagcggcga gcacaugagg auucucauga gggacggcag aagaaccuca 60 ugagaaucca aguaugugua aggcuagucc guuaucaacu ugaaaaagug gcaccgaguc 120 ggugcuu 127 <210> 32 <211> 127 <212> RNA <213> Artificial Sequence <220> <223> sgRNA-2-VT4 <400> 32 ggcgauaagu cgugucuuac gcacaugagg auucucauga gggacggcag aagaaccuca 60 ugagaaucca aguaugugua aggcuagucc guuaucaacu ugaaaaagug gcaccgaguc 120 ggugcuu 127 <210> 33 <211> 127 <212> RNA <213> Artificial Sequence <220> <223> NASC-PC1-AAVST1 <400> 33 ggggccacua gggacaggau gucucagagc uaugcagucc uggacaacug ccgaaccuca 60 ugagaaucca aguaugugua aggcuagucc guuaucaacu ugaaaaagug gcaccgaguc 120 ggugcuu 127 <210> 34 <211> 127 <212> RNA <213> Artificial Sequence <220> <223> NASC-PC1-VT2 <400> 34 guaggcuaua guguagaucu gucucagagc uaugcagucc uggacaacug ccgaaccuca 60 ugagaaucca aguaugugua aggcuagucc guuaucaacu ugaaaaagug gcaccgaguc 120 ggugcuu 127 <210> 35 <211> 127 <212> RNA <213> Artificial Sequence <220> <223> NASC-PC1-VT3 <400> 35 ggaaaaagug gaagcggcga gucucagagc uaugcagucc uggacaacug ccgaaccuca 60 ugagaaucca aguaugugua aggcuagucc guuaucaacu ugaaaaagug gcaccgaguc 120 ggugcuu 127 <210> 36 <211> 127 <212> RNA <213> Artificial Sequence <220> <223> NASC-PC1-VT4 <400> 36 ggcgauaagu cgugucuuac gucucagagc uaugcagucc uggacaacug ccgaaccuca 60 ugagaaucca aguaugugua aggcuagucc guuaucaacu ugaaaaagug gcaccgaguc 120 ggugcuu 127 <210> 37 <211> 127 <212> RNA <213> Artificial Sequence <220> <223> NASC-PC2- AAVST1 <400> 37 ggggccacua gggacaggau gcacaugagg auucucauga gggacggcag aagaacagga 60 cugcauagca aguugagaua aggcuagucc guuaucaacu ugaaaaagug gcaccgaguc 120 ggugcuu 127 <210> 38 <211> 127 <212> RNA <213> Artificial Sequence <220> <223> NASC-PC2-VT2 <400> 38 guaggcuaua guguagaucu gcacaugagg auucucauga gggacggcag aagaacagga 60 cugcauagca aguugagaua aggcuagucc guuaucaacu ugaaaaagug gcaccgaguc 120 ggugcuu 127 <210> 39 <211> 127 <212> RNA <213> Artificial Sequence <220> <223> NASC-PC2-VT3 <400> 39 ggaaaaagug gaagcggcga gcacaugagg auucucauga gggacggcag aagaacagga 60 cugcauagca aguugagaua aggcuagucc guuaucaacu ugaaaaagug gcaccgaguc 120 ggugcuu 127 <210> 40 <211> 127 <212> RNA <213> Artificial Sequence <220> <223> NASC-PC2-VT4 <400> 40 ggcgauaagu cgugucuuac gcacaugagg auucucauga gggacggcag aagaacagga 60 cugcauagca aguugagaua aggcuagucc guuaucaacu ugaaaaagug gcaccgaguc 120 ggugcuu 127 <210> 41 <211> 20 <212> DNA <213> Homo sapiens <400> 41 ggtggacaag cggcagatag 20 <210> 42 <211> 20 <212> DNA <213> Homo sapiens <400> 42 gcaccatgtt gccggtcctc 20 <210> 43 <211> 118 <212> RNA <213> Artificial Sequence <220> <223> sgRNA- XRCC5-T1 <400> 43 gguggacaag cggcagauag guuuuagagc uaugcuguuu uggaaacaaa acagcauagc 60 aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuu 118 <210> 44 <211> 118 <212> RNA <213> Artificial Sequence <220> <223> sgRNA- XRCC5-T3 <400> 44 gcaccauguu gccgguccuc guuuuagagc uaugcuguuu uggaaacaaa acagcauagc 60 aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuu 118 <210> 45 <211> 118 <212> RNA <213> Artificial Sequence <220> <223> NASCA-PC1- XRCC5-T1 <400> 45 gguggacaag cggcagauag guuuuagagc uaugcuguuu uggaaacuuu ucagcacgau 60 aaguuauuau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuu 118 <210> 46 <211> 118 <212> RNA <213> Artificial Sequence <220> <223> NASCA-PC2- XRCC5-T3 <400> 46 gcaccauguu gccgguccuc guaauagaau cgugcugaaa aggaaacaaa acagcauagc 60 aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuu 118 <210> 47 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> XRCC5 target region 1 <400> 47 cactctttcc ctacacgacg ctcttccgat cttgcgcatg ctcagagttc 50 <210> 48 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> XRCC5 target region 1 <400> 48 ggagttcaga cgtgtgctct tccgatctcc aagtccatgg ctttcttt 48 <210> 49 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> XRCC5 target region 1 <400> 49 cactctttcc ctacacgacg ctcttccgat cttttcaggc ctagcaggaa ac 52 <210> 50 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> XRCC5 target region 1 <400> 50 ggagttcaga cgtgtgctct tccgatctcc cattctttgt cttgaccg 48 <210> 51 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 51 caagcagaag acggcatacg agattacgtg atgtgactgg agttcagacg tgtgctc 57 <210> 52 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 52 aatgatacgg cgaccaccga gatctacacc gtctaataca ctctttccct acacgacg 58 <210> 53 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 53 aatgatacgg cgaccaccga gatctacact ctctccgaca ctctttccct acacgacg 58 <210> 54 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 54 aatgatacgg cgaccaccga gatctacact cgactagaca ctctttccct acacgacg 58 <210> 55 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 55 aatgatacgg cgaccaccga gatctacact tctagctaca ctctttccct acacgacg 58 <210> 56 <211> 984 <212> PRT <213> Campylobacter jejuni <400> 56 Met Ala Arg Ile Leu Ala Phe Ala Ile Gly Ile Ser Ser Ile Gly Trp 1 5 10 15 Ala Phe Ser Glu Asn Asp Glu Leu Lys Asp Cys Gly Val Arg Ile Phe 20 25 30 Thr Lys Val Glu Asn Pro Lys Thr Gly Glu Ser Leu Ala Leu Pro Arg 35 40 45 Arg Leu Ala Arg Ser Ala Arg Lys Arg Leu Ala Arg Arg Lys Ala Arg 50 55 60 Leu Asn His Leu Lys His Leu Ile Ala Asn Glu Phe Lys Leu Asn Tyr 65 70 75 80 Glu Asp Tyr Gln Ser Phe Asp Glu Ser Leu Ala Lys Ala Tyr Lys Gly 85 90 95 Ser Leu Ile Ser Pro Tyr Glu Leu Arg Phe Arg Ala Leu Asn Glu Leu 100 105 110 Leu Ser Lys Gln Asp Phe Ala Arg Val Ile Leu His Ile Ala Lys Arg 115 120 125 Arg Gly Tyr Asp Asp Ile Lys Asn Ser Asp Asp Lys Glu Lys Gly Ala 130 135 140 Ile Leu Lys Ala Ile Lys Gln Asn Glu Glu Lys Leu Ala Asn Tyr Gln 145 150 155 160 Ser Val Gly Glu Tyr Leu Tyr Lys Glu Tyr Phe Gln Lys Phe Lys Glu 165 170 175 Asn Ser Lys Glu Phe Thr Asn Val Arg Asn Lys Lys Glu Ser Tyr Glu 180 185 190 Arg Cys Ile Ala Gln Ser Phe Leu Lys Asp Glu Leu Lys Leu Ile Phe 195 200 205 Lys Lys Gln Arg Glu Phe Gly Phe Ser Phe Ser Lys Lys Phe Glu Glu 210 215 220 Glu Val Leu Ser Val Ala Phe Tyr Lys Arg Ala Leu Lys Asp Phe Ser 225 230 235 240 His Leu Val Gly Asn Cys Ser Phe Phe Thr Asp Glu Lys Arg Ala Pro 245 250 255 Lys Asn Ser Pro Leu Ala Phe Met Phe Val Ala Leu Thr Arg Ile Ile 260 265 270 Asn Leu Leu Asn Asn Leu Lys Asn Thr Glu Gly Ile Leu Tyr Thr Lys 275 280 285 Asp Asp Leu Asn Ala Leu Leu Asn Glu Val Leu Lys Asn Gly Thr Leu 290 295 300 Thr Tyr Lys Gln Thr Lys Lys Leu Leu Gly Leu Ser Asp Asp Tyr Glu 305 310 315 320 Phe Lys Gly Glu Lys Gly Thr Tyr Phe Ile Glu Phe Lys Lys Tyr Lys 325 330 335 Glu Phe Ile Lys Ala Leu Gly Glu His Asn Leu Ser Gln Asp Asp Leu 340 345 350 Asn Glu Ile Ala Lys Asp Ile Thr Leu Ile Lys Asp Glu Ile Lys Leu 355 360 365 Lys Lys Ala Leu Ala Lys Tyr Asp Leu Asn Gln Asn Gln Ile Asp Ser 370 375 380 Leu Ser Lys Leu Glu Phe Lys Asp His Leu Asn Ile Ser Phe Lys Ala 385 390 395 400 Leu Lys Leu Val Thr Pro Leu Met Leu Glu Gly Lys Lys Tyr Asp Glu 405 410 415 Ala Cys Asn Glu Leu Asn Leu Lys Val Ala Ile Asn Glu Asp Lys Lys 420 425 430 Asp Phe Leu Pro Ala Phe Asn Glu Thr Tyr Tyr Lys Asp Glu Val Thr 435 440 445 Asn Pro Val Val Leu Arg Ala Ile Lys Glu Tyr Arg Lys Val Leu Asn 450 455 460 Ala Leu Leu Lys Lys Tyr Gly Lys Val His Lys Ile Asn Ile Glu Leu 465 470 475 480 Ala Arg Glu Val Gly Lys Asn His Ser Gln Arg Ala Lys Ile Glu Lys 485 490 495 Glu Gln Asn Glu Asn Tyr Lys Ala Lys Lys Asp Ala Glu Leu Glu Cys 500 505 510 Glu Lys Leu Gly Leu Lys Ile Asn Ser Lys Asn Ile Leu Lys Leu Arg 515 520 525 Leu Phe Lys Glu Gln Lys Glu Phe Cys Ala Tyr Ser Gly Glu Lys Ile 530 535 540 Lys Ile Ser Asp Leu Gln Asp Glu Lys Met Leu Glu Ile Asp Ala Ile 545 550 555 560 Tyr Pro Tyr Ser Arg Ser Phe Asp Asp Ser Tyr Met Asn Lys Val Leu 565 570 575 Val Phe Thr Lys Gln Asn Gln Glu Lys Leu Asn Gln Thr Pro Phe Glu 580 585 590 Ala Phe Gly Asn Asp Ser Ala Lys Trp Gln Lys Ile Glu Val Leu Ala 595 600 605 Lys Asn Leu Pro Thr Lys Lys Gln Lys Arg Ile Leu Asp Lys Asn Tyr 610 615 620 Lys Asp Lys Glu Gln Lys Asn Phe Lys Asp Arg Asn Leu Asn Asp Thr 625 630 635 640 Arg Tyr Ile Ala Arg Leu Val Leu Asn Tyr Thr Lys Asp Tyr Leu Asp 645 650 655 Phe Leu Pro Leu Ser Asp Asp Glu Asn Thr Lys Leu Asn Asp Thr Gln 660 665 670 Lys Gly Ser Lys Val His Val Glu Ala Lys Ser Gly Met Leu Thr Ser 675 680 685 Ala Leu Arg His Thr Trp Gly Phe Ser Ala Lys Asp Arg Asn Asn His 690 695 700 Leu His His Ala Ile Asp Ala Val Ile Ile Ala Tyr Ala Asn Asn Ser 705 710 715 720 Ile Val Lys Ala Phe Ser Asp Phe Lys Lys Glu Gln Glu Ser Asn Ser 725 730 735 Ala Glu Leu Tyr Ala Lys Lys Ile Ser Glu Leu Asp Tyr Lys Asn Lys 740 745 750 Arg Lys Phe Phe Glu Pro Phe Ser Gly Phe Arg Gln Lys Val Leu Asp 755 760 765 Lys Ile Asp Glu Ile Phe Val Ser Lys Pro Glu Arg Lys Lys Pro Ser 770 775 780 Gly Ala Leu His Glu Glu Thr Phe Arg Lys Glu Glu Glu Phe Tyr Gln 785 790 795 800 Ser Tyr Gly Gly Lys Glu Gly Val Leu Lys Ala Leu Glu Leu Gly Lys 805 810 815 Ile Arg Lys Val Asn Gly Lys Ile Val Lys Asn Gly Asp Met Phe Arg 820 825 830 Val Asp Ile Phe Lys His Lys Lys Thr Asn Lys Phe Tyr Ala Val Pro 835 840 845 Ile Tyr Thr Met Asp Phe Ala Leu Lys Val Leu Pro Asn Lys Ala Val 850 855 860 Ala Arg Ser Lys Lys Gly Glu Ile Lys Asp Trp Ile Leu Met Asp Glu 865 870 875 880 Asn Tyr Glu Phe Cys Phe Ser Leu Tyr Lys Asp Ser Leu Ile Leu Ile 885 890 895 Gln Thr Lys Asp Met Gln Glu Pro Glu Phe Val Tyr Tyr Asn Ala Phe 900 905 910 Thr Ser Ser Thr Val Ser Leu Ile Val Ser Lys His Asp Asn Lys Phe 915 920 925 Glu Thr Leu Ser Lys Asn Gln Lys Ile Leu Phe Lys Asn Ala Asn Glu 930 935 940 Lys Glu Val Ile Ala Lys Ser Ile Gly Ile Gln Asn Leu Lys Val Phe 945 950 955 960 Glu Lys Tyr Ile Val Ser Ala Leu Gly Glu Val Thr Lys Ala Glu Phe 965 970 975 Arg Gln Arg Glu Asp Phe Lys Lys 980 <210> 57 <211> 146 <212> RNA <213> Artificial Sequence <220> <223> NASC-PC1-triplex1 <400> 57 aucuuguuga cacgaggaau guuuuagucc cuaauuaaau uucuugaaau ugguauauaa 60 ggagggacua caacaaagag uuugcgggac ucugcggggu uacaaucccc uaaaaccgcu 120 uuuaaaauuc aaauaaauuu ugcuuu 146 <210> 58 <211> 146 <212> RNA <213> Artificial Sequence <220> <223> NASC-PC2-triplex1 <400> 58 aucuuguuga cacgaggaau guuguagucc cuccuuauau accaagaaaa agaaauuuaa 60 aacugaacuc caacaaagag uuugcgggac ucugcggggu uacaaucccc uaaaaccgcu 120 uuuaaaauuc aaauaaauuu ugcuuu 146 <210> 59 <211> 146 <212> RNA <213> Artificial Sequence <220> <223> NASC-PC3-triplex1 <400> 59 aucuuguuga cacgaggaau guuggaguuc aguuuuaaau uucuugaaaa agaaauuuaa 60 uuagggacua aaacaaagag uuugcgggac ucugcggggu uacaaucccc uaaaaccgcu 120 uuuaaaauuc aaauaaauuu ugcuuu 146 <210> 60 <211> 146 <212> RNA <213> Artificial Sequence <220> <223> NASC-PC1-triplex2 <400> 60 cgauauaaua cagcaaggug guuuuagacc ccucuuccau uucgcgaaag cguuuugaga 60 gagugaacua caacaaagag uuugcgggac ucugcggggu uacaaucccc uaaaaccgcu 120 uuuaaaauuc aaauaaauuu ugcuuu 146 <210> 61 <211> 146 <212> RNA <213> Artificial Sequence <220> <223> NASC-PC2-triplex2 <400> 61 cgauauaaua cagcaaggug guuguaguuc acucucucaa aacgcgaaaa agaaauuuaa 60 uaaggaacua caacaaagag uuugcgggac ucugcggggu uacaaucccc uaaaaccgcu 120 uuuaaaauuc aaauaaauuu ugcuuu 146 <210> 62 <211> 146 <212> RNA <213> Artificial Sequence <220> <223> NASC-PC3-triplex2 <400> 62 cgauauaaua cagcaaggug guuguaguuc cuuauuaaau uucuugaaag cgaaauggaa 60 gaggggucua aaacaaagag uuugcgggac ucugcggggu uacaaucccc uaaaaccgcu 120 uuuaaaauuc aaauaaauuu ugcuuu 146 <210> 63 <211> 144 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide sequence <400> 63 cgtcgctatg atttgcctat atcttgttga cacgaggaat gtaaacaacg agttccgcta 60 ttgggatgga gtttaactgt cgcaactctc atcgcaatgt cagtcacctt gctgtattat 120 atcgcgcatg ataaagtacg ccat 144 <210> 64 <211> 65 <212> RNA <213> Artificial Sequence <220> <223> NASCA polynucleotide component <220> <221> misc_feature <222> (46)..(65) <223> n is a, c, g, or u <400> 64 cuccggcgau gucacaccga acugauaauu ucuacucuug uagaunnnnn nnnnnnnnnn 60 nnnnn 65 <210> 65 <211> 65 <212> RNA <213> Artificial Sequence <220> <223> NASCA polynucleotide component <220> <221> misc_feature <222> (46)..(65) <223> n is a, c, g, or u <400> 65 ucggugugac aucgccggag uugauaaauu ucuacucuug uagaunnnnn nnnnnnnnnn 60 nnnnn 65 <210> 66 <211> 35 <212> RNA <213> Artificial Sequence <220> <223> NASCA polynucleotide component <400> 66 cuccggcgau gucacaccga acugauaauu ucuac 35 <210> 67 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> NASCA polynucleotide component <220> <221> misc_feature <222> (7)..(26) <223> n is a, c, g, or u <400> 67 guagaunnnn nnnnnnnnnn nnnnnn 26 <210> 68 <211> 35 <212> RNA <213> Artificial Sequence <220> <223> NASCA polynucleotide component <400> 68 ucggugugac aucgccggag uugauaaauu uguag 35 <210> 69 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> NASCA polynucleotide component <220> <221> misc_feature <222> (7)..(26) <223> n is a, c, g, or u <400> 69 cuacaunnnn nnnnnnnnnn nnnnnn 26 <210> 70 <211> 65 <212> RNA <213> Artificial Sequence <220> <223> NASCA polynucleotide component <220> <221> misc_feature <222> (20)..(39) <223> n is a, c, g, or u <400> 70 aauuucuacu cuuguagaun nnnnnnnnnn nnnnnnnnna cugaucuccg gcgaugucac 60 accga 65 <210> 71 <211> 65 <212> RNA <213> Artificial Sequence <220> <223> NASCA polynucleotide component <220> <221> misc_feature <222> (20)..(39) <223> n is a, c, g, or u <400> 71 aauuucuacu cuuguagaun nnnnnnnnnn nnnnnnnnnu ugauaucggu gugacaucgc 60 cggag 65 <210> 72 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> NASCA polynucleotide component <220> <221> misc_feature <222> (46)..(65) <223> n is a, c, g, or u <400> 72 cuccggcgau gucacaccga acugauaauu ucuacucuug uagaunnnnn nnnnnnnnnn 60 nnnnnuugau agucuaaggc agcuaggguc u 91 <210> 73 <211> 65 <212> RNA <213> Artificial Sequence <220> <223> NASCA polynucleotide component <220> <221> misc_feature <222> (46)..(65) <223> n is a, c, g, or u <400> 73 ucggugugac aucgccggag uugauaaauu ucuacucuug uagaunnnnn nnnnnnnnnn 60 nnnnn 65 <210> 74 <211> 65 <212> RNA <213> Artificial Sequence <220> <223> NASCA polynucleotide component <220> <221> misc_feature <222> (20)..(39) <223> n is a, c, g, or u <400> 74 aauuucuacu cuuguagaun nnnnnnnnnn nnnnnnnnnu accaaagacc cuagcugccu 60 uagac 65 <210> 75 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> NASCA polynucleotide component <220> <221> misc_feature <222> (72)..(91) <223> n is a, c, g, or u <400> 75 cuccggcgau gucacaccga acugaugucu aaggcagcua gggucuuuga uaaauuucua 60 cucuuguaga unnnnnnnnn nnnnnnnnnn n 91 <210> 76 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> NASCA polynucleotide component <220> <221> misc_feature <222> (72)..(91) <223> n is a, c, g, or u <400> 76 ugcgaaccac ugugagccag uaccaaucgg ugugacaucg ccggaguuga uaaauuucua 60 cucuuguaga unnnnnnnnn nnnnnnnnnn n 91 <210> 77 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> NASCA polynucleotide component <400> 77 cuccggcgau gucacaccga acugaugucu aaggcagcua gggucuuuga uaaauuucua 60 c 61 <210> 78 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> NASCA polynucleotide component <220> <221> misc_feature <222> (7)..(26) <223> n is a, c, g, or u <400> 78 guagaunnnn nnnnnnnnnn nnnnnn 26 <210> 79 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> NASCA polynucleotide component <400> 79 ugcgaaccac ugugagccag uaccaaucgg ugugacaucg ccggaguuga uaaauuugua 60 g 61 <210> 80 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> NASCA polynucleotide component <220> <221> misc_feature <222> (7)..(26) <223> n is a, c, g, or u <400> 80 cuacaunnnn nnnnnnnnnn nnnnnn 26 <210> 81 <211> 146 <212> RNA <213> Artificial Sequence <220> <223> NASCA polynucleotide component <220> <221> misc_feature <222> (1)..(20) <223> n is a, c, g, or u <400> 81 nnnnnnnnnn nnnnnnnnnn guuuuagucc cuaauuaaau uucuugaaau ugguauauaa 60 ggagggacua caacaaagag uuugcgggac ucugcggggu uacaaucccc uaaaaccgcu 120 uuuaaaauuc aaauaaauuu ugcuuu 146 <210> 82 <211> 146 <212> RNA <213> Artificial Sequence <220> <223> NASCA polynucleotide component <220> <221> misc_feature <222> (1)..(20) <223> n is a, c, g, or u <400> 82 nnnnnnnnnn nnnnnnnnnn guuguagucc cuccuuauau accaagaaaa agaaauuuaa 60 uuagggacua aaacaaagag uuugcgggac ucugcggggu uacaaucccc uaaaaccgcu 120 uuuaaaauuc aaauaaauuu ugcuuu 146 <210> 83 <211> 127 <212> RNA <213> Artificial Sequence <220> <223> NASCA polynucleotide component <220> <221> misc_feature <222> (1)..(20) <223> n is a, c, g, or u <400> 83 nnnnnnnnnn nnnnnnnnnn gucucagagc uaugcagucc uggacaacug ccgaaccuca 60 ugagaaucca aguaugugua aggcuagucc guuaucaacu ugaaaaagug gcaccgaguc 120 ggugcuu 127 <210> 84 <211> 127 <212> RNA <213> Artificial Sequence <220> <223> NASCA polynucleotide component <220> <221> misc_feature <222> (1)..(20) <223> n is a, c, g, or u <400> 84 nnnnnnnnnn nnnnnnnnnn gcacaugagg auucucauga gggacggcag aagaacagga 60 cugcauagca aguugagaua aggcuagucc guuaucaacu ugaaaaagug gcaccgaguc 120 ggugcuu 127 <210> 85 <211> 118 <212> RNA <213> Artificial Sequence <220> <223> NASCA polynucleotide component <220> <221> misc_feature <222> (1)..(20) <223> n is a, c, g, or u <400> 85 nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcuguuu uggaaagguc auguccuuca 60 aaguuguaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuu 118 <210> 86 <211> 118 <212> RNA <213> Artificial Sequence <220> <223> NASCA polynucleotide component <220> <221> misc_feature <222> (1)..(20) <223> n is a, c, g, or u <400> 86 nnnnnnnnnn nnnnnnnnnn guaauagaau cgugcugaaa aggaaacaaa acagcauagc 60 aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuu 118 <210> 87 <211> 118 <212> RNA <213> Artificial Sequence <220> <223> NASCA polynucleotide component <220> <221> misc_feature <222> (1)..(20) <223> n is a, c, g, or u <400> 87 nnnnnnnnnn nnnnnnnnnn guuacagaug aaggacauga ccgaaacuuu ucagcacgau 60 aaguuauuau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuu 118 <210> 88 <211> 45 <212> RNA <213> Artificial Sequence <220> <223> NASCA polynucleotide component <220> <221> misc_feature <222> (1)..(20) <223> n is a, c, g, or u <400> 88 nnnnnnnnnn nnnnnnnnnn guuuuagucc cuaauuaaau uucuu 45 <210> 89 <211> 45 <212> RNA <213> Artificial Sequence <220> <223> NASCA polynucleotide component <220> <221> misc_feature <222> (1)..(20) <223> n is a, c, g, or u <400> 89 nnnnnnnnnn nnnnnnnnnn guuguagucc cuccuuauau accaa 45 <210> 90 <211> 205 <212> RNA <213> Artificial Sequence <220> <223> NASCA polynucleotide component <400> 90 aagaaauuua auuagggacu aaaacaaaga guuugcggga cucugcgggg uuacaauccc 60 cuaaaaccgc uuuuaaaauu caaauaaauu uugcuuuagu ugauaaauuu gguauauaag 120 gagggacuac aacaaagagu uugcgggacu cugcgggguu acaauccccu aaaaccgcuu 180 uuaaaauuca aauaaauuuu gcuuu 205 <210> 91 <211> 75 <212> DNA/RNA <213> Artificial Sequence <220> <223> NASCA polynucleotide component <220> <221> misc_feature <222> (1)..(20) <223> n is a, c, g, t or u <400> 91 nnnnnnnnnn nnnnnnnnnn guuuuagagc tatgctgtga aaacagcata gcaaguuaaa 60 auaaggcuac ugccg 75 <210> 92 <211> 75 <212> DNA/RNA <213> Artificial Sequence <220> <223> NASCA polynucleotide component <220> <221> misc_feature <222> (1)..(20) <223> n is a, c, g, t or u <400> 92 nnnnnnnnnn nnnnnnnnnn guuuuagagc tatgctgtga aaacagcata gcaaguuaaa 60 auaaggcuag ucacg 75 <210> 93 <211> 105 <212> RNA <213> Artificial Sequence <220> <223> NASCA polynucleotide component <400> 93 cggcaguccg uuaucaacuu gaaaaagugg caccgagucg gugcuuaguu gauaaaucgu 60 gacguccguu aucaacuuga aaaaguggca ccgagucggu gcuuu 105 <210> 94 <211> 155 <212> RNA <213> Artificial Sequence <220> <223> NASCA polynucleotide component <220> <221> misc_feature <222> (1)..(20) <223> n is a, c, g, or u <220> <221> misc_feature <222> (136)..(155) <223> n is a, c, g, or u <400> 94 nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcuguga aaacagcaua gcaaguuaaa 60 auaaggcuag uccguuauca acuugaaaaa guggcaccga gucggugcuu acugauaauu 120 ucuacucuug uagaunnnnn nnnnnnnnnn nnnnn 155 <210> 95 <211> 114 <212> RNA <213> Artificial Sequence <220> <223> NASCA polynucleotide component <220> <221> misc_feature <222> (1)..(20) <223> n is a, c, g, or u <400> 95 nnnnnnnnnn nnnnnnnnnn guuuuuguac ucucaagauu caaauaacag cauagcaagu 60 uaaaauaagg cuauccguua ucaacuugaa aaaguggcac cgagucggug cuuu 114 <210> 96 <211> 116 <212> RNA <213> Artificial Sequence <220> <223> NASCA polynucleotide component <220> <221> misc_feature <222> (1)..(20) <223> n is a, c, g, or u <400> 96 nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcuguua cguaaaucuu gcagaagcua 60 caaagauaag gcuucaugcc gaaaucaaca cccugucauu uuauggcagg guguuu 116 <210> 97 <211> 76 <212> RNA <213> Artificial Sequence <220> <223> NASCA polynucleotide component <220> <221> misc_feature <222> (1)..(20) <223> n is a, c, g, or u <220> <221> misc_feature <222> (57)..(76) <223> n is a, c, g, or u <400> 97 nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcuguua ccaauugaua guagaunnnn 60 nnnnnnnnnn nnnnnn 76 <210> 98 <211> 83 <212> RNA <213> Artificial Sequence <220> <223> NASCA polynucleotide component <400> 98 aauuucuacu ugauaacagc auagcaaguu aaaauaaggc uauccguuau caacuugaaa 60 aaguggcacc gagucggugc uuu 83 <210> 99 <211> 1053 <212> PRT <213> Staphylococcus aureus <400> 99 Met Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile Thr Ser Val 1 5 10 15 Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly 20 25 30 Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg 35 40 45 Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile 50 55 60 Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His 65 70 75 80 Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu 85 90 95 Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu 100 105 110 Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr 115 120 125 Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala 130 135 140 Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys 145 150 155 160 Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr 165 170 175 Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln 180 185 190 Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg 195 200 205 Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys 210 215 220 Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe 225 230 235 240 Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr 245 250 255 Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn 260 265 270 Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe 275 280 285 Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu 290 295 300 Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys 305 310 315 320 Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr 325 330 335 Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala 340 345 350 Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu 355 360 365 Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser 370 375 380 Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile 385 390 395 400 Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala 405 410 415 Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln 420 425 430 Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro 435 440 445 Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile 450 455 460 Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg 465 470 475 480 Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys 485 490 495 Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr 500 505 510 Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp 515 520 525 Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu 530 535 540 Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro 545 550 555 560 Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys 565 570 575 Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu 580 585 590 Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile 595 600 605 Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu 610 615 620 Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp 625 630 635 640 Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu 645 650 655 Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys 660 665 670 Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp 675 680 685 Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp 690 695 700 Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys 705 710 715 720 Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys 725 730 735 Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu 740 745 750 Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp 755 760 765 Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile 770 775 780 Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu 785 790 795 800 Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu 805 810 815 Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His 820 825 830 Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly 835 840 845 Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr 850 855 860 Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile 865 870 875 880 Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp 885 890 895 Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr 900 905 910 Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val 915 920 925 Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser 930 935 940 Lys Ala Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala 945 950 955 960 Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly 965 970 975 Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile 980 985 990 Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met 995 1000 1005 Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys 1010 1015 1020 Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu 1025 1030 1035 Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly 1040 1045 1050 <210> 100 <211> 1368 <212> PRT <213> Streptococcus pyogenes <400> 100 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Asp Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Ser Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 101 <211> 1368 <212> PRT <213> Streptococcus pyogenes <400> 101 Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Asp Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Ser Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 102 <211> 1053 <212> PRT <213> Staphylococcus aureus <400> 102 Met Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val 1 5 10 15 Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly 20 25 30 Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg 35 40 45 Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile 50 55 60 Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His 65 70 75 80 Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu 85 90 95 Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu 100 105 110 Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr 115 120 125 Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala 130 135 140 Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys 145 150 155 160 Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr 165 170 175 Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln 180 185 190 Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg 195 200 205 Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys 210 215 220 Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe 225 230 235 240 Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr 245 250 255 Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn 260 265 270 Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe 275 280 285 Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu 290 295 300 Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys 305 310 315 320 Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr 325 330 335 Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala 340 345 350 Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu 355 360 365 Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser 370 375 380 Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile 385 390 395 400 Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala 405 410 415 Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln 420 425 430 Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro 435 440 445 Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile 450 455 460 Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg 465 470 475 480 Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys 485 490 495 Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr 500 505 510 Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp 515 520 525 Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu 530 535 540 Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro 545 550 555 560 Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys 565 570 575 Gln Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu 580 585 590 Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile 595 600 605 Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu 610 615 620 Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp 625 630 635 640 Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu 645 650 655 Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys 660 665 670 Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp 675 680 685 Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp 690 695 700 Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys 705 710 715 720 Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys 725 730 735 Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu 740 745 750 Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp 755 760 765 Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile 770 775 780 Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu 785 790 795 800 Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu 805 810 815 Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His 820 825 830 Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly 835 840 845 Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr 850 855 860 Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile 865 870 875 880 Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp 885 890 895 Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr 900 905 910 Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val 915 920 925 Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser 930 935 940 Lys Ala Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala 945 950 955 960 Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly 965 970 975 Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile 980 985 990 Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met 995 1000 1005 Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys 1010 1015 1020 Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu 1025 1030 1035 Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly 1040 1045 1050 <210> 103 <211> 984 <212> PRT <213> Campylobacter jejuni <400> 103 Met Ala Arg Ile Leu Ala Phe Asp Ile Gly Ile Ser Ser Ile Gly Trp 1 5 10 15 Ala Phe Ser Glu Asn Asp Glu Leu Lys Asp Cys Gly Val Arg Ile Phe 20 25 30 Thr Lys Val Glu Asn Pro Lys Thr Gly Glu Ser Leu Ala Leu Pro Arg 35 40 45 Arg Leu Ala Arg Ser Ala Arg Lys Arg Leu Ala Arg Arg Lys Ala Arg 50 55 60 Leu Asn His Leu Lys His Leu Ile Ala Asn Glu Phe Lys Leu Asn Tyr 65 70 75 80 Glu Asp Tyr Gln Ser Phe Asp Glu Ser Leu Ala Lys Ala Tyr Lys Gly 85 90 95 Ser Leu Ile Ser Pro Tyr Glu Leu Arg Phe Arg Ala Leu Asn Glu Leu 100 105 110 Leu Ser Lys Gln Asp Phe Ala Arg Val Ile Leu His Ile Ala Lys Arg 115 120 125 Arg Gly Tyr Asp Asp Ile Lys Asn Ser Asp Asp Lys Glu Lys Gly Ala 130 135 140 Ile Leu Lys Ala Ile Lys Gln Asn Glu Glu Lys Leu Ala Asn Tyr Gln 145 150 155 160 Ser Val Gly Glu Tyr Leu Tyr Lys Glu Tyr Phe Gln Lys Phe Lys Glu 165 170 175 Asn Ser Lys Glu Phe Thr Asn Val Arg Asn Lys Lys Glu Ser Tyr Glu 180 185 190 Arg Cys Ile Ala Gln Ser Phe Leu Lys Asp Glu Leu Lys Leu Ile Phe 195 200 205 Lys Lys Gln Arg Glu Phe Gly Phe Ser Phe Ser Lys Lys Phe Glu Glu 210 215 220 Glu Val Leu Ser Val Ala Phe Tyr Lys Arg Ala Leu Lys Asp Phe Ser 225 230 235 240 His Leu Val Gly Asn Cys Ser Phe Phe Thr Asp Glu Lys Arg Ala Pro 245 250 255 Lys Asn Ser Pro Leu Ala Phe Met Phe Val Ala Leu Thr Arg Ile Ile 260 265 270 Asn Leu Leu Asn Asn Leu Lys Asn Thr Glu Gly Ile Leu Tyr Thr Lys 275 280 285 Asp Asp Leu Asn Ala Leu Leu Asn Glu Val Leu Lys Asn Gly Thr Leu 290 295 300 Thr Tyr Lys Gln Thr Lys Lys Leu Leu Gly Leu Ser Asp Asp Tyr Glu 305 310 315 320 Phe Lys Gly Glu Lys Gly Thr Tyr Phe Ile Glu Phe Lys Lys Tyr Lys 325 330 335 Glu Phe Ile Lys Ala Leu Gly Glu His Asn Leu Ser Gln Asp Asp Leu 340 345 350 Asn Glu Ile Ala Lys Asp Ile Thr Leu Ile Lys Asp Glu Ile Lys Leu 355 360 365 Lys Lys Ala Leu Ala Lys Tyr Asp Leu Asn Gln Asn Gln Ile Asp Ser 370 375 380 Leu Ser Lys Leu Glu Phe Lys Asp His Leu Asn Ile Ser Phe Lys Ala 385 390 395 400 Leu Lys Leu Val Thr Pro Leu Met Leu Glu Gly Lys Lys Tyr Asp Glu 405 410 415 Ala Cys Asn Glu Leu Asn Leu Lys Val Ala Ile Asn Glu Asp Lys Lys 420 425 430 Asp Phe Leu Pro Ala Phe Asn Glu Thr Tyr Tyr Lys Asp Glu Val Thr 435 440 445 Asn Pro Val Val Leu Arg Ala Ile Lys Glu Tyr Arg Lys Val Leu Asn 450 455 460 Ala Leu Leu Lys Lys Tyr Gly Lys Val His Lys Ile Asn Ile Glu Leu 465 470 475 480 Ala Arg Glu Val Gly Lys Asn His Ser Gln Arg Ala Lys Ile Glu Lys 485 490 495 Glu Gln Asn Glu Asn Tyr Lys Ala Lys Lys Asp Ala Glu Leu Glu Cys 500 505 510 Glu Lys Leu Gly Leu Lys Ile Asn Ser Lys Asn Ile Leu Lys Leu Arg 515 520 525 Leu Phe Lys Glu Gln Lys Glu Phe Cys Ala Tyr Ser Gly Glu Lys Ile 530 535 540 Lys Ile Ser Asp Leu Gln Asp Glu Lys Met Leu Glu Ile Asp His Ile 545 550 555 560 Tyr Pro Tyr Ser Arg Ser Phe Asp Asp Ser Tyr Met Asn Lys Val Leu 565 570 575 Val Phe Thr Lys Gln Asn Gln Glu Lys Leu Asn Gln Thr Pro Phe Glu 580 585 590 Ala Phe Gly Asn Asp Ser Ala Lys Trp Gln Lys Ile Glu Val Leu Ala 595 600 605 Lys Asn Leu Pro Thr Lys Lys Gln Lys Arg Ile Leu Asp Lys Asn Tyr 610 615 620 Lys Asp Lys Glu Gln Lys Asn Phe Lys Asp Arg Asn Leu Asn Asp Thr 625 630 635 640 Arg Tyr Ile Ala Arg Leu Val Leu Asn Tyr Thr Lys Asp Tyr Leu Asp 645 650 655 Phe Leu Pro Leu Ser Asp Asp Glu Asn Thr Lys Leu Asn Asp Thr Gln 660 665 670 Lys Gly Ser Lys Val His Val Glu Ala Lys Ser Gly Met Leu Thr Ser 675 680 685 Ala Leu Arg His Thr Trp Gly Phe Ser Ala Lys Asp Arg Asn Asn His 690 695 700 Leu His His Ala Ile Asp Ala Val Ile Ile Ala Tyr Ala Asn Asn Ser 705 710 715 720 Ile Val Lys Ala Phe Ser Asp Phe Lys Lys Glu Gln Glu Ser Asn Ser 725 730 735 Ala Glu Leu Tyr Ala Lys Lys Ile Ser Glu Leu Asp Tyr Lys Asn Lys 740 745 750 Arg Lys Phe Phe Glu Pro Phe Ser Gly Phe Arg Gln Lys Val Leu Asp 755 760 765 Lys Ile Asp Glu Ile Phe Val Ser Lys Pro Glu Arg Lys Lys Pro Ser 770 775 780 Gly Ala Leu His Glu Glu Thr Phe Arg Lys Glu Glu Glu Phe Tyr Gln 785 790 795 800 Ser Tyr Gly Gly Lys Glu Gly Val Leu Lys Ala Leu Glu Leu Gly Lys 805 810 815 Ile Arg Lys Val Asn Gly Lys Ile Val Lys Asn Gly Asp Met Phe Arg 820 825 830 Val Asp Ile Phe Lys His Lys Lys Thr Asn Lys Phe Tyr Ala Val Pro 835 840 845 Ile Tyr Thr Met Asp Phe Ala Leu Lys Val Leu Pro Asn Lys Ala Val 850 855 860 Ala Arg Ser Lys Lys Gly Glu Ile Lys Asp Trp Ile Leu Met Asp Glu 865 870 875 880 Asn Tyr Glu Phe Cys Phe Ser Leu Tyr Lys Asp Ser Leu Ile Leu Ile 885 890 895 Gln Thr Lys Asp Met Gln Glu Pro Glu Phe Val Tyr Tyr Asn Ala Phe 900 905 910 Thr Ser Ser Thr Val Ser Leu Ile Val Ser Lys His Asp Asn Lys Phe 915 920 925 Glu Thr Leu Ser Lys Asn Gln Lys Ile Leu Phe Lys Asn Ala Asn Glu 930 935 940 Lys Glu Val Ile Ala Lys Ser Ile Gly Ile Gln Asn Leu Lys Val Phe 945 950 955 960 Glu Lys Tyr Ile Val Ser Ala Leu Gly Glu Val Thr Lys Ala Glu Phe 965 970 975 Arg Gln Arg Glu Asp Phe Lys Lys 980 <210> 104 <211> 1307 <212> PRT <213> Acidaminococcus sp. <400> 104 Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr 1 5 10 15 Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln 20 25 30 Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys 35 40 45 Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln 50 55 60 Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile 65 70 75 80 Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile 85 90 95 Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly 100 105 110 Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile 115 120 125 Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys 130 135 140 Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg 145 150 155 160 Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg 165 170 175 Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg 180 185 190 Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe 195 200 205 Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn 210 215 220 Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val 225 230 235 240 Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp 245 250 255 Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu 260 265 270 Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn 275 280 285 Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro 290 295 300 Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu 305 310 315 320 Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr 325 330 335 Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu 340 345 350 Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His 355 360 365 Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr 370 375 380 Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys 385 390 395 400 Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu 405 410 415 Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser 420 425 430 Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala 435 440 445 Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys 450 455 460 Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu 465 470 475 480 Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe 485 490 495 Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser 500 505 510 Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val 515 520 525 Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp 530 535 540 Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn 545 550 555 560 Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys 565 570 575 Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys 580 585 590 Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys 595 600 605 Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr 610 615 620 Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys 625 630 635 640 Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln 645 650 655 Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala 660 665 670 Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr 675 680 685 Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr 690 695 700 Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His 705 710 715 720 Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu 725 730 735 Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys 740 745 750 Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu 755 760 765 Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln 770 775 780 Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His 785 790 795 800 Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr 805 810 815 Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His 820 825 830 Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn 835 840 845 Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe 850 855 860 Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln 865 870 875 880 Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu 885 890 895 Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg 900 905 910 Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu 915 920 925 Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu 930 935 940 Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val 945 950 955 960 Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile 965 970 975 His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu 980 985 990 Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu 995 1000 1005 Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu 1010 1015 1020 Asn Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly 1025 1030 1035 Val Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala 1040 1045 1050 Lys Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro 1055 1060 1065 Tyr Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe 1070 1075 1080 Val Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu 1085 1090 1095 Glu Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe 1100 1105 1110 Ile Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly 1115 1120 1125 Leu Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn 1130 1135 1140 Glu Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys 1145 1150 1155 Arg Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr 1160 1165 1170 Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu 1175 1180 1185 Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu 1190 1195 1200 Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu 1205 1210 1215 Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly 1220 1225 1230 Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys 1235 1240 1245 Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp 1250 1255 1260 Ala Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu 1265 1270 1275 Asn His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile 1280 1285 1290 Ser Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn 1295 1300 1305 <210> 105 <211> 1307 <212> PRT <213> Acidaminococcus sp. <400> 105 Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr 1 5 10 15 Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln 20 25 30 Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys 35 40 45 Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln 50 55 60 Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile 65 70 75 80 Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile 85 90 95 Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly 100 105 110 Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile 115 120 125 Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys 130 135 140 Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg 145 150 155 160 Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg 165 170 175 Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg 180 185 190 Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe 195 200 205 Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn 210 215 220 Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val 225 230 235 240 Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp 245 250 255 Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu 260 265 270 Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn 275 280 285 Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro 290 295 300 Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu 305 310 315 320 Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr 325 330 335 Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu 340 345 350 Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His 355 360 365 Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr 370 375 380 Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys 385 390 395 400 Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu 405 410 415 Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser 420 425 430 Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala 435 440 445 Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys 450 455 460 Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu 465 470 475 480 Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe 485 490 495 Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser 500 505 510 Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val 515 520 525 Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp 530 535 540 Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn 545 550 555 560 Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys 565 570 575 Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys 580 585 590 Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys 595 600 605 Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr 610 615 620 Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys 625 630 635 640 Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln 645 650 655 Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala 660 665 670 Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr 675 680 685 Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr 690 695 700 Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His 705 710 715 720 Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu 725 730 735 Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys 740 745 750 Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu 755 760 765 Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln 770 775 780 Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His 785 790 795 800 Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr 805 810 815 Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His 820 825 830 Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn 835 840 845 Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe 850 855 860 Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln 865 870 875 880 Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu 885 890 895 Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Ala Arg Gly Glu Arg 900 905 910 Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu 915 920 925 Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu 930 935 940 Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val 945 950 955 960 Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile 965 970 975 His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu 980 985 990 Ala Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu 995 1000 1005 Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu 1010 1015 1020 Asn Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly 1025 1030 1035 Val Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala 1040 1045 1050 Lys Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro 1055 1060 1065 Tyr Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe 1070 1075 1080 Val Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu 1085 1090 1095 Glu Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe 1100 1105 1110 Ile Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly 1115 1120 1125 Leu Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn 1130 1135 1140 Glu Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys 1145 1150 1155 Arg Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr 1160 1165 1170 Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu 1175 1180 1185 Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu 1190 1195 1200 Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu 1205 1210 1215 Ile Arg Ser Val Leu Gln Met Ala Asn Ser Asn Ala Ala Thr Gly 1220 1225 1230 Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys 1235 1240 1245 Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp 1250 1255 1260 Ala Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu 1265 1270 1275 Asn His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile 1280 1285 1290 Ser Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn 1295 1300 1305 <210> 106 <211> 1245 <212> PRT <213> Lachnospiraceae bacterium <400> 106 Met Leu Lys Asn Val Gly Ile Asp Arg Leu Asp Val Glu Lys Gly Arg 1 5 10 15 Lys Asn Met Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr Ser Leu Ser 20 25 30 Lys Thr Leu Arg Phe Lys Ala Ile Pro Val Gly Lys Thr Gln Glu Asn 35 40 45 Ile Asp Asn Lys Arg Leu Leu Val Glu Asp Glu Lys Arg Ala Glu Asp 50 55 60 Tyr Lys Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu Ser Phe Ile 65 70 75 80 Asn Asp Val Leu His Ser Ile Lys Leu Lys Asn Leu Asn Asn Tyr Ile 85 90 95 Ser Leu Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn Lys Glu Leu 100 105 110 Glu Asn Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys Ala Phe Lys 115 120 125 Gly Asn Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile Ile Glu Thr 130 135 140 Ile Leu Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile Ala Leu Val Asn 145 150 155 160 Ser Phe Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe Asp Asn Arg 165 170 175 Glu Asn Met Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile Ala Phe Arg 180 185 190 Cys Ile Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn Met Asp Ile Phe 195 200 205 Glu Lys Val Asp Ala Ile Phe Asp Lys His Glu Val Gln Glu Ile Lys 210 215 220 Glu Lys Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe Phe Glu Gly 225 230 235 240 Glu Phe Phe Asn Phe Val Leu Thr Gln Glu Gly Ile Asp Val Tyr Asn 245 250 255 Ala Ile Ile Gly Gly Phe Val Thr Glu Ser Gly Glu Lys Ile Lys Gly 260 265 270 Leu Asn Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr Lys Gln Lys Leu 275 280 285 Pro Lys Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp Arg Glu Ser 290 295 300 Leu Ser Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu Glu Val Leu Glu 305 310 315 320 Val Phe Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile Phe Ser Ser Ile 325 330 335 Lys Lys Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu Tyr Ser Ser Ala 340 345 350 Gly Ile Phe Val Lys Asn Gly Pro Ala Ile Ser Thr Ile Ser Lys Asp 355 360 365 Ile Phe Gly Glu Trp Asn Val Ile Arg Asp Lys Trp Asn Ala Glu Tyr 370 375 380 Asp Asp Ile His Leu Lys Lys Lys Ala Val Val Thr Glu Lys Tyr Glu 385 390 395 400 Asp Asp Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser Phe Ser Leu Glu 405 410 415 Gln Leu Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val Val Glu Lys Leu 420 425 430 Lys Glu Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr Lys Val Tyr Gly 435 440 445 Ser Ser Glu Lys Leu Phe Asp Ala Asp Phe Val Leu Glu Lys Ser Leu 450 455 460 Lys Lys Asn Asp Ala Val Val Ala Ile Met Lys Asp Leu Leu Asp Ser 465 470 475 480 Val Lys Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe Gly Glu Gly Lys 485 490 495 Glu Thr Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe Val Leu Ala Tyr 500 505 510 Asp Ile Leu Leu Lys Val Asp His Ile Tyr Asp Ala Ile Arg Asn Tyr 515 520 525 Val Thr Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys Leu Tyr Phe Gln 530 535 540 Asn Pro Gln Phe Met Gly Gly Trp Asp Lys Asp Lys Glu Thr Asp Tyr 545 550 555 560 Arg Ala Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile Met 565 570 575 Asp Lys Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp Lys Asp Asp Val 580 585 590 Asn Gly Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu Pro Gly Pro Asn 595 600 605 Lys Met Leu Pro Lys Val Phe Phe Ser Lys Lys Trp Met Ala Tyr Tyr 610 615 620 Asn Pro Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn Gly Thr Phe Lys 625 630 635 640 Lys Gly Asp Met Phe Asn Leu Asn Asp Cys His Lys Leu Ile Asp Phe 645 650 655 Phe Lys Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp 660 665 670 Phe Asn Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr 675 680 685 Arg Glu Val Glu Glu Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser 690 695 700 Lys Lys Glu Val Asp Lys Leu Val Glu Glu Gly Lys Leu Tyr Met Phe 705 710 715 720 Gln Ile Tyr Asn Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn 725 730 735 Leu His Thr Met Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly 740 745 750 Gln Ile Arg Leu Ser Gly Gly Ala Glu Leu Phe Met Arg Arg Ala Ser 755 760 765 Leu Lys Lys Glu Glu Leu Val Val His Pro Ala Asn Ser Pro Ile Ala 770 775 780 Asn Lys Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp 785 790 795 800 Val Tyr Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile 805 810 815 Pro Ile Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr 820 825 830 Glu Val Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly 835 840 845 Ile Asp Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp Gly 850 855 860 Lys Gly Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile Asn Asn 865 870 875 880 Phe Asn Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu Leu Asp Lys 885 890 895 Lys Glu Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp Thr Ser Ile Glu 900 905 910 Asn Ile Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln Val Val His Lys 915 920 925 Ile Cys Glu Leu Val Glu Lys Tyr Asp Ala Val Ile Ala Leu Glu Asp 930 935 940 Leu Asn Ser Gly Phe Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val 945 950 955 960 Tyr Gln Lys Phe Glu Lys Met Leu Ile Asp Lys Leu Asn Tyr Met Val 965 970 975 Asp Lys Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr 980 985 990 Gln Ile Thr Asn Lys Phe Glu Ser Phe Lys Ser Met Ser Thr Gln Asn 995 1000 1005 Gly Phe Ile Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp 1010 1015 1020 Pro Ser Thr Gly Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser 1025 1030 1035 Ile Ala Asp Ser Lys Lys Phe Ile Ser Ser Phe Asp Arg Ile Met 1040 1045 1050 Tyr Val Pro Glu Glu Asp Leu Phe Glu Phe Ala Leu Asp Tyr Lys 1055 1060 1065 Asn Phe Ser Arg Thr Asp Ala Asp Tyr Ile Lys Lys Trp Lys Leu 1070 1075 1080 Tyr Ser Tyr Gly Asn Arg Ile Arg Ile Phe Arg Asn Pro Lys Lys 1085 1090 1095 Asn Asn Val Phe Asp Trp Glu Glu Val Cys Leu Thr Ser Ala Tyr 1100 1105 1110 Lys Glu Leu Phe Asn Lys Tyr Gly Ile Asn Tyr Gln Gln Gly Asp 1115 1120 1125 Ile Arg Ala Leu Leu Cys Glu Gln Ser Asp Lys Ala Phe Tyr Ser 1130 1135 1140 Ser Phe Met Ala Leu Met Ser Leu Met Leu Gln Met Arg Asn Ser 1145 1150 1155 Ile Thr Gly Arg Thr Asp Val Asp Phe Leu Ile Ser Pro Val Lys 1160 1165 1170 Asn Ser Asp Gly Ile Phe Tyr Asp Ser Arg Asn Tyr Glu Ala Gln 1175 1180 1185 Glu Asn Ala Ile Leu Pro Lys Asn Ala Asp Ala Asn Gly Ala Tyr 1190 1195 1200 Asn Ile Ala Arg Lys Val Leu Trp Ala Ile Gly Gln Phe Lys Lys 1205 1210 1215 Ala Glu Asp Glu Lys Leu Asp Lys Val Lys Ile Ala Ile Ser Asn 1220 1225 1230 Lys Glu Trp Leu Glu Tyr Ala Gln Thr Ser Val Lys 1235 1240 1245 <210> 107 <211> 1246 <212> PRT <213> Lachnospiraceae bacterium <400> 107 Met Leu Lys Asn Val Gly Ile Asp Arg Leu Asp Val Glu Lys Gly Arg 1 5 10 15 Lys Asn Met Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr Ser Leu Ser 20 25 30 Lys Thr Leu Arg Phe Lys Ala Ile Pro Val Gly Lys Thr Gln Glu Asn 35 40 45 Ile Asp Asn Lys Arg Leu Leu Val Glu Asp Glu Lys Arg Ala Glu Asp 50 55 60 Tyr Lys Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu Ser Phe Ile 65 70 75 80 Asn Asp Val Leu His Ser Ile Lys Leu Lys Asn Leu Asn Asn Tyr Ile 85 90 95 Ser Leu Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn Lys Glu Leu 100 105 110 Glu Asn Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys Ala Phe Lys 115 120 125 Gly Asn Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile Ile Glu Thr 130 135 140 Ile Leu Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile Ala Leu Val Asn 145 150 155 160 Ser Phe Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe Asp Asn Arg 165 170 175 Glu Asn Met Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile Ala Phe Arg 180 185 190 Cys Ile Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn Met Asp Ile Phe 195 200 205 Glu Lys Val Asp Ala Ile Phe Asp Lys His Glu Val Gln Glu Ile Lys 210 215 220 Glu Lys Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe Phe Glu Gly 225 230 235 240 Glu Phe Phe Asn Phe Val Leu Thr Gln Glu Gly Ile Asp Val Tyr Asn 245 250 255 Ala Ile Ile Gly Gly Phe Val Thr Glu Ser Gly Glu Lys Ile Lys Gly 260 265 270 Leu Asn Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr Lys Gln Lys Leu 275 280 285 Pro Lys Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp Arg Glu Ser 290 295 300 Leu Ser Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu Glu Val Leu Glu 305 310 315 320 Val Phe Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile Phe Ser Ser Ile 325 330 335 Lys Lys Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu Tyr Ser Ser Ala 340 345 350 Gly Ile Phe Val Lys Asn Gly Pro Ala Ile Ser Thr Ile Ser Lys Asp 355 360 365 Ile Phe Gly Glu Trp Asn Val Ile Arg Asp Lys Trp Asn Ala Glu Tyr 370 375 380 Asp Asp Ile His Leu Lys Lys Lys Ala Val Val Thr Glu Lys Tyr Glu 385 390 395 400 Asp Asp Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser Phe Ser Leu Glu 405 410 415 Gln Leu Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val Val Glu Lys Leu 420 425 430 Lys Glu Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr Lys Val Tyr Gly 435 440 445 Ser Ser Glu Lys Leu Phe Asp Ala Asp Phe Val Leu Glu Lys Ser Leu 450 455 460 Lys Lys Asn Asp Ala Val Val Ala Ile Met Lys Asp Leu Leu Asp Ser 465 470 475 480 Val Lys Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe Gly Glu Gly Lys 485 490 495 Glu Thr Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe Val Leu Ala Tyr 500 505 510 Asp Ile Leu Leu Lys Val Asp His Ile Tyr Asp Ala Ile Arg Asn Tyr 515 520 525 Val Thr Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys Leu Tyr Phe Gln 530 535 540 Asn Pro Gln Phe Met Gly Gly Trp Asp Lys Asp Lys Glu Thr Asp Tyr 545 550 555 560 Arg Ala Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile Met 565 570 575 Asp Lys Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp Lys Asp Asp Val 580 585 590 Asn Gly Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu Pro Gly Pro Asn 595 600 605 Lys Met Leu Pro Lys Val Phe Phe Ser Lys Lys Trp Met Ala Tyr Tyr 610 615 620 Asn Pro Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn Gly Thr Phe Lys 625 630 635 640 Lys Gly Asp Met Phe Asn Leu Asn Asp Cys His Lys Leu Ile Asp Phe 645 650 655 Phe Lys Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp 660 665 670 Phe Asn Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr 675 680 685 Arg Glu Val Glu Glu Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser 690 695 700 Lys Lys Glu Val Asp Lys Leu Val Glu Glu Gly Lys Leu Tyr Met Phe 705 710 715 720 Gln Ile Tyr Asn Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn 725 730 735 Leu His Thr Met Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly 740 745 750 Gln Ile Arg Leu Ser Gly Gly Ala Glu Leu Phe Met Arg Arg Ala Ser 755 760 765 Leu Lys Lys Glu Glu Leu Val Val His Pro Ala Asn Ser Pro Ile Ala 770 775 780 Asn Lys Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp 785 790 795 800 Val Tyr Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile 805 810 815 Pro Ile Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr 820 825 830 Glu Val Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly 835 840 845 Ile Ala Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp Gly 850 855 860 Lys Gly Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile Asn Asn 865 870 875 880 Phe Asn Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu Leu Asp Lys 885 890 895 Lys Glu Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp Thr Ser Ile Glu 900 905 910 Asn Ile Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln Val Val His Lys 915 920 925 Ile Cys Glu Leu Val Glu Lys Tyr Asp Ala Val Ile Ala Leu Ala Asp 930 935 940 Leu Asn Ser Gly Phe Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val 945 950 955 960 Tyr Gln Lys Phe Glu Lys Met Leu Ile Asp Lys Leu Asn Tyr Met Val 965 970 975 Asp Lys Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr 980 985 990 Gln Ile Thr Asn Lys Phe Glu Ser Phe Lys Ser Met Ser Thr Gln Asn 995 1000 1005 Gly Phe Ile Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp 1010 1015 1020 Pro Ser Thr Gly Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser 1025 1030 1035 Ile Ala Asp Ser Lys Lys Phe Ile Ser Ser Phe Asp Arg Ile Met 1040 1045 1050 Tyr Val Pro Glu Glu Asp Leu Phe Glu Phe Ala Leu Asp Tyr Lys 1055 1060 1065 Asn Phe Ser Arg Thr Asp Ala Asp Tyr Ile Lys Lys Trp Lys Leu 1070 1075 1080 Tyr Ser Tyr Gly Asn Arg Ile Arg Ile Phe Arg Asn Pro Lys Lys 1085 1090 1095 Asn Asn Val Phe Asp Trp Glu Glu Val Cys Leu Thr Ser Ala Tyr 1100 1105 1110 Lys Glu Leu Phe Asn Lys Tyr Gly Ile Asn Tyr Gln Gln Gly Asp 1115 1120 1125 Ile Arg Ala Leu Leu Cys Glu Gln Ser Asp Lys Ala Phe Tyr Ser 1130 1135 1140 Ser Phe Met Ala Leu Met Ser Leu Met Leu Gln Met Ala Asn Ser 1145 1150 1155 Ile Thr Gly Arg Thr Asp Val Asp Phe Leu Ile Ser Pro Val Lys 1160 1165 1170 Asn Ser Asp Gly Ile Phe Tyr Asp Ser Arg Asn Tyr Glu Ala Gln 1175 1180 1185 Glu Asn Ala Ile Leu Pro Lys Asn Ala Asp Ala Asn Gly Ala Tyr 1190 1195 1200 Asn Ile Ala Arg Lys Val Leu Trp Ala Ile Gly Gln Phe Lys Lys 1205 1210 1215 Ala Glu Asp Glu Lys Leu Asp Lys Val Lys Ile Ala Ile Ser Asn 1220 1225 1230 Lys Glu Trp Leu Glu Tyr Ala Gln Thr Ser Val Lys His 1235 1240 1245 <210> 108 <211> 1121 <212> PRT <213> Streptococcus thermophilus <400> 108 Met Ser Asp Leu Val Leu Gly Leu Asp Ile Gly Ile Gly Ser Val Gly 1 5 10 15 Val Gly Ile Leu Asn Lys Val Thr Gly Glu Ile Ile His Lys Asn Ser 20 25 30 Arg Ile Phe Pro Ala Ala Gln Ala Glu Asn Asn Leu Val Arg Arg Thr 35 40 45 Asn Arg Gln Gly Arg Arg Leu Thr Arg Arg Lys Lys His Arg Arg Val 50 55 60 Arg Leu Asn Arg Leu Phe Glu Glu Ser Gly Leu Ile Thr Asp Phe Thr 65 70 75 80 Lys Ile Ser Ile Asn Leu Asn Pro Tyr Gln Leu Arg Val Lys Gly Leu 85 90 95 Thr Asp Glu Leu Ser Asn Glu Glu Leu Phe Ile Ala Leu Lys Asn Met 100 105 110 Val Lys His Arg Gly Ile Ser Tyr Leu Asp Asp Ala Ser Asp Asp Gly 115 120 125 Asn Ser Ser Ile Gly Asp Tyr Ala Gln Ile Val Lys Glu Asn Ser Lys 130 135 140 Gln Leu Glu Thr Lys Thr Pro Gly Gln Ile Gln Leu Glu Arg Tyr Gln 145 150 155 160 Thr Tyr Gly Gln Leu Arg Gly Asp Phe Thr Val Glu Lys Asp Gly Lys 165 170 175 Lys His Arg Leu Ile Asn Val Phe Pro Thr Ser Ala Tyr Arg Ser Glu 180 185 190 Ala Leu Arg Ile Leu Gln Thr Gln Gln Glu Phe Asn Pro Gln Ile Thr 195 200 205 Asp Glu Phe Ile Asn Arg Tyr Leu Glu Ile Leu Thr Gly Lys Arg Lys 210 215 220 Tyr Tyr His Gly Pro Gly Asn Glu Lys Ser Arg Thr Asp Tyr Gly Arg 225 230 235 240 Tyr Arg Thr Ser Gly Glu Thr Leu Asp Asn Ile Phe Gly Ile Leu Ile 245 250 255 Gly Lys Cys Thr Phe Tyr Pro Asp Glu Phe Arg Ala Ala Lys Ala Ser 260 265 270 Tyr Thr Ala Gln Glu Phe Asn Leu Leu Asn Asp Leu Asn Asn Leu Thr 275 280 285 Val Pro Thr Glu Thr Lys Lys Leu Ser Lys Glu Gln Lys Asn Gln Ile 290 295 300 Ile Asn Tyr Val Lys Asn Glu Lys Ala Met Gly Pro Ala Lys Leu Phe 305 310 315 320 Lys Tyr Ile Ala Lys Leu Leu Ser Cys Asp Val Ala Asp Ile Lys Gly 325 330 335 Tyr Arg Ile Asp Lys Ser Gly Lys Ala Glu Ile His Thr Phe Glu Ala 340 345 350 Tyr Arg Lys Met Lys Thr Leu Glu Thr Leu Asp Ile Glu Gln Met Asp 355 360 365 Arg Glu Thr Leu Asp Lys Leu Ala Tyr Val Leu Thr Leu Asn Thr Glu 370 375 380 Arg Glu Gly Ile Gln Glu Ala Leu Glu His Glu Phe Ala Asp Gly Ser 385 390 395 400 Phe Ser Gln Lys Gln Val Asp Glu Leu Val Gln Phe Arg Lys Ala Asn 405 410 415 Ser Ser Ile Phe Gly Lys Gly Trp His Asn Phe Ser Val Lys Leu Met 420 425 430 Met Glu Leu Ile Pro Glu Leu Tyr Glu Thr Ser Glu Glu Gln Met Thr 435 440 445 Ile Leu Thr Arg Leu Gly Lys Gln Lys Thr Thr Ser Ser Ser Asn Lys 450 455 460 Thr Lys Tyr Ile Asp Glu Lys Leu Leu Thr Glu Glu Ile Tyr Asn Pro 465 470 475 480 Val Val Ala Lys Ser Val Arg Gln Ala Ile Lys Ile Val Asn Ala Ala 485 490 495 Ile Lys Glu Tyr Gly Asp Phe Asp Asn Ile Val Ile Glu Met Ala Arg 500 505 510 Glu Thr Asn Glu Asp Asp Glu Lys Lys Ala Ile Gln Lys Ile Gln Lys 515 520 525 Ala Asn Lys Asp Glu Lys Asp Ala Ala Met Leu Lys Ala Ala Asn Gln 530 535 540 Tyr Asn Gly Lys Ala Glu Leu Pro His Ser Val Phe His Gly His Lys 545 550 555 560 Gln Leu Ala Thr Lys Ile Arg Leu Trp His Gln Gln Gly Glu Arg Cys 565 570 575 Leu Tyr Thr Gly Lys Thr Ile Ser Ile His Asp Leu Ile Asn Asn Ser 580 585 590 Asn Gln Phe Glu Val Asp His Ile Leu Pro Leu Ser Ile Thr Phe Asp 595 600 605 Asp Ser Leu Ala Asn Lys Val Leu Val Tyr Ala Thr Ala Asn Gln Glu 610 615 620 Lys Gly Gln Arg Thr Pro Tyr Gln Ala Leu Asp Ser Met Asp Asp Ala 625 630 635 640 Trp Ser Phe Arg Glu Leu Lys Ala Phe Val Arg Glu Ser Lys Thr Leu 645 650 655 Ser Asn Lys Lys Lys Glu Tyr Leu Leu Thr Glu Glu Asp Ile Ser Lys 660 665 670 Phe Asp Val Arg Lys Lys Phe Ile Glu Arg Asn Leu Val Asp Thr Arg 675 680 685 Tyr Ala Ser Arg Val Val Leu Asn Ala Leu Gln Glu His Phe Arg Ala 690 695 700 His Lys Ile Asp Thr Lys Val Ser Val Val Arg Gly Gln Phe Thr Ser 705 710 715 720 Gln Leu Arg Arg His Trp Gly Ile Glu Lys Thr Arg Asp Thr Tyr His 725 730 735 His His Ala Val Asp Ala Leu Ile Ile Ala Ala Ser Ser Gln Leu Asn 740 745 750 Leu Trp Lys Lys Gln Lys Asn Thr Leu Val Ser Tyr Ser Glu Asp Gln 755 760 765 Leu Leu Asp Ile Glu Thr Gly Glu Leu Ile Ser Asp Asp Glu Tyr Lys 770 775 780 Glu Ser Val Phe Lys Ala Pro Tyr Gln His Phe Val Asp Thr Leu Lys 785 790 795 800 Ser Lys Glu Phe Glu Asp Ser Ile Leu Phe Ser Tyr Gln Val Asp Ser 805 810 815 Lys Phe Asn Arg Lys Ile Ser Asp Ala Thr Ile Tyr Ala Thr Arg Gln 820 825 830 Ala Lys Val Gly Lys Asp Lys Ala Asp Glu Thr Tyr Val Leu Gly Lys 835 840 845 Ile Lys Asp Ile Tyr Thr Gln Asp Gly Tyr Asp Ala Phe Met Lys Ile 850 855 860 Tyr Lys Lys Asp Lys Ser Lys Phe Leu Met Tyr Arg His Asp Pro Gln 865 870 875 880 Thr Phe Glu Lys Val Ile Glu Pro Ile Leu Glu Asn Tyr Pro Asn Lys 885 890 895 Gln Ile Asn Glu Lys Gly Lys Glu Val Pro Cys Asn Pro Phe Leu Lys 900 905 910 Tyr Lys Glu Glu His Gly Tyr Ile Arg Lys Tyr Ser Lys Lys Gly Asn 915 920 925 Gly Pro Glu Ile Lys Ser Leu Lys Tyr Tyr Asp Ser Lys Leu Gly Asn 930 935 940 His Ile Asp Ile Thr Pro Lys Asp Ser Asn Asn Lys Val Val Leu Gln 945 950 955 960 Ser Val Ser Pro Trp Arg Ala Asp Val Tyr Phe Asn Lys Thr Thr Gly 965 970 975 Lys Tyr Glu Ile Leu Gly Leu Lys Tyr Ala Asp Leu Gln Phe Glu Lys 980 985 990 Gly Thr Gly Thr Tyr Lys Ile Ser Gln Glu Lys Tyr Asn Asp Ile Lys 995 1000 1005 Lys Lys Glu Gly Val Asp Ser Asp Ser Glu Phe Lys Phe Thr Leu 1010 1015 1020 Tyr Lys Asn Asp Leu Leu Leu Val Lys Asp Thr Glu Thr Lys Glu 1025 1030 1035 Gln Gln Leu Phe Arg Phe Leu Ser Arg Thr Met Pro Lys Gln Lys 1040 1045 1050 His Tyr Val Glu Leu Lys Pro Tyr Asp Lys Gln Lys Phe Glu Gly 1055 1060 1065 Gly Glu Ala Leu Ile Lys Val Leu Gly Asn Val Ala Asn Ser Gly 1070 1075 1080 Gln Cys Lys Lys Gly Leu Gly Lys Ser Asn Ile Ser Ile Tyr Lys 1085 1090 1095 Val Arg Thr Asp Val Leu Gly Asn Gln His Ile Ile Lys Asn Glu 1100 1105 1110 Gly Asp Lys Pro Lys Leu Asp Phe 1115 1120 <210> 109 <211> 1121 <212> PRT <213> Streptococcus thermophilus <400> 109 Met Ser Asp Leu Val Leu Gly Leu Ala Ile Gly Ile Gly Ser Val Gly 1 5 10 15 Val Gly Ile Leu Asn Lys Val Thr Gly Glu Ile Ile His Lys Asn Ser 20 25 30 Arg Ile Phe Pro Ala Ala Gln Ala Glu Asn Asn Leu Val Arg Arg Thr 35 40 45 Asn Arg Gln Gly Arg Arg Leu Thr Arg Arg Lys Lys His Arg Arg Val 50 55 60 Arg Leu Asn Arg Leu Phe Glu Glu Ser Gly Leu Ile Thr Asp Phe Thr 65 70 75 80 Lys Ile Ser Ile Asn Leu Asn Pro Tyr Gln Leu Arg Val Lys Gly Leu 85 90 95 Thr Asp Glu Leu Ser Asn Glu Glu Leu Phe Ile Ala Leu Lys Asn Met 100 105 110 Val Lys His Arg Gly Ile Ser Tyr Leu Asp Asp Ala Ser Asp Asp Gly 115 120 125 Asn Ser Ser Ile Gly Asp Tyr Ala Gln Ile Val Lys Glu Asn Ser Lys 130 135 140 Gln Leu Glu Thr Lys Thr Pro Gly Gln Ile Gln Leu Glu Arg Tyr Gln 145 150 155 160 Thr Tyr Gly Gln Leu Arg Gly Asp Phe Thr Val Glu Lys Asp Gly Lys 165 170 175 Lys His Arg Leu Ile Asn Val Phe Pro Thr Ser Ala Tyr Arg Ser Glu 180 185 190 Ala Leu Arg Ile Leu Gln Thr Gln Gln Glu Phe Asn Pro Gln Ile Thr 195 200 205 Asp Glu Phe Ile Asn Arg Tyr Leu Glu Ile Leu Thr Gly Lys Arg Lys 210 215 220 Tyr Tyr His Gly Pro Gly Asn Glu Lys Ser Arg Thr Asp Tyr Gly Arg 225 230 235 240 Tyr Arg Thr Ser Gly Glu Thr Leu Asp Asn Ile Phe Gly Ile Leu Ile 245 250 255 Gly Lys Cys Thr Phe Tyr Pro Asp Glu Phe Arg Ala Ala Lys Ala Ser 260 265 270 Tyr Thr Ala Gln Glu Phe Asn Leu Leu Asn Asp Leu Asn Asn Leu Thr 275 280 285 Val Pro Thr Glu Thr Lys Lys Leu Ser Lys Glu Gln Lys Asn Gln Ile 290 295 300 Ile Asn Tyr Val Lys Asn Glu Lys Ala Met Gly Pro Ala Lys Leu Phe 305 310 315 320 Lys Tyr Ile Ala Lys Leu Leu Ser Cys Asp Val Ala Asp Ile Lys Gly 325 330 335 Tyr Arg Ile Asp Lys Ser Gly Lys Ala Glu Ile His Thr Phe Glu Ala 340 345 350 Tyr Arg Lys Met Lys Thr Leu Glu Thr Leu Asp Ile Glu Gln Met Asp 355 360 365 Arg Glu Thr Leu Asp Lys Leu Ala Tyr Val Leu Thr Leu Asn Thr Glu 370 375 380 Arg Glu Gly Ile Gln Glu Ala Leu Glu His Glu Phe Ala Asp Gly Ser 385 390 395 400 Phe Ser Gln Lys Gln Val Asp Glu Leu Val Gln Phe Arg Lys Ala Asn 405 410 415 Ser Ser Ile Phe Gly Lys Gly Trp His Asn Phe Ser Val Lys Leu Met 420 425 430 Met Glu Leu Ile Pro Glu Leu Tyr Glu Thr Ser Glu Glu Gln Met Thr 435 440 445 Ile Leu Thr Arg Leu Gly Lys Gln Lys Thr Thr Ser Ser Ser Asn Lys 450 455 460 Thr Lys Tyr Ile Asp Glu Lys Leu Leu Thr Glu Glu Ile Tyr Asn Pro 465 470 475 480 Val Val Ala Lys Ser Val Arg Gln Ala Ile Lys Ile Val Asn Ala Ala 485 490 495 Ile Lys Glu Tyr Gly Asp Phe Asp Asn Ile Val Ile Glu Met Ala Arg 500 505 510 Glu Thr Asn Glu Asp Asp Glu Lys Lys Ala Ile Gln Lys Ile Gln Lys 515 520 525 Ala Asn Lys Asp Glu Lys Asp Ala Ala Met Leu Lys Ala Ala Asn Gln 530 535 540 Tyr Asn Gly Lys Ala Glu Leu Pro His Ser Val Phe His Gly His Lys 545 550 555 560 Gln Leu Ala Thr Lys Ile Arg Leu Trp His Gln Gln Gly Glu Arg Cys 565 570 575 Leu Tyr Thr Gly Lys Thr Ile Ser Ile His Asp Leu Ile Asn Asn Ser 580 585 590 Asn Gln Phe Glu Val Asp Ala Ile Leu Pro Leu Ser Ile Thr Phe Asp 595 600 605 Asp Ser Leu Ala Asn Lys Val Leu Val Tyr Ala Thr Ala Asn Gln Glu 610 615 620 Lys Gly Gln Arg Thr Pro Tyr Gln Ala Leu Asp Ser Met Asp Asp Ala 625 630 635 640 Trp Ser Phe Arg Glu Leu Lys Ala Phe Val Arg Glu Ser Lys Thr Leu 645 650 655 Ser Asn Lys Lys Lys Glu Tyr Leu Leu Thr Glu Glu Asp Ile Ser Lys 660 665 670 Phe Asp Val Arg Lys Lys Phe Ile Glu Arg Asn Leu Val Asp Thr Arg 675 680 685 Tyr Ala Ser Arg Val Val Leu Asn Ala Leu Gln Glu His Phe Arg Ala 690 695 700 His Lys Ile Asp Thr Lys Val Ser Val Val Arg Gly Gln Phe Thr Ser 705 710 715 720 Gln Leu Arg Arg His Trp Gly Ile Glu Lys Thr Arg Asp Thr Tyr His 725 730 735 His His Ala Val Asp Ala Leu Ile Ile Ala Ala Ser Ser Gln Leu Asn 740 745 750 Leu Trp Lys Lys Gln Lys Asn Thr Leu Val Ser Tyr Ser Glu Asp Gln 755 760 765 Leu Leu Asp Ile Glu Thr Gly Glu Leu Ile Ser Asp Asp Glu Tyr Lys 770 775 780 Glu Ser Val Phe Lys Ala Pro Tyr Gln His Phe Val Asp Thr Leu Lys 785 790 795 800 Ser Lys Glu Phe Glu Asp Ser Ile Leu Phe Ser Tyr Gln Val Asp Ser 805 810 815 Lys Phe Asn Arg Lys Ile Ser Asp Ala Thr Ile Tyr Ala Thr Arg Gln 820 825 830 Ala Lys Val Gly Lys Asp Lys Ala Asp Glu Thr Tyr Val Leu Gly Lys 835 840 845 Ile Lys Asp Ile Tyr Thr Gln Asp Gly Tyr Asp Ala Phe Met Lys Ile 850 855 860 Tyr Lys Lys Asp Lys Ser Lys Phe Leu Met Tyr Arg His Asp Pro Gln 865 870 875 880 Thr Phe Glu Lys Val Ile Glu Pro Ile Leu Glu Asn Tyr Pro Asn Lys 885 890 895 Gln Ile Asn Glu Lys Gly Lys Glu Val Pro Cys Asn Pro Phe Leu Lys 900 905 910 Tyr Lys Glu Glu His Gly Tyr Ile Arg Lys Tyr Ser Lys Lys Gly Asn 915 920 925 Gly Pro Glu Ile Lys Ser Leu Lys Tyr Tyr Asp Ser Lys Leu Gly Asn 930 935 940 His Ile Asp Ile Thr Pro Lys Asp Ser Asn Asn Lys Val Val Leu Gln 945 950 955 960 Ser Val Ser Pro Trp Arg Ala Asp Val Tyr Phe Asn Lys Thr Thr Gly 965 970 975 Lys Tyr Glu Ile Leu Gly Leu Lys Tyr Ala Asp Leu Gln Phe Glu Lys 980 985 990 Gly Thr Gly Thr Tyr Lys Ile Ser Gln Glu Lys Tyr Asn Asp Ile Lys 995 1000 1005 Lys Lys Glu Gly Val Asp Ser Asp Ser Glu Phe Lys Phe Thr Leu 1010 1015 1020 Tyr Lys Asn Asp Leu Leu Leu Val Lys Asp Thr Glu Thr Lys Glu 1025 1030 1035 Gln Gln Leu Phe Arg Phe Leu Ser Arg Thr Met Pro Lys Gln Lys 1040 1045 1050 His Tyr Val Glu Leu Lys Pro Tyr Asp Lys Gln Lys Phe Glu Gly 1055 1060 1065 Gly Glu Ala Leu Ile Lys Val Leu Gly Asn Val Ala Asn Ser Gly 1070 1075 1080 Gln Cys Lys Lys Gly Leu Gly Lys Ser Asn Ile Ser Ile Tyr Lys 1085 1090 1095 Val Arg Thr Asp Val Leu Gly Asn Gln His Ile Ile Lys Asn Glu 1100 1105 1110 Gly Asp Lys Pro Lys Leu Asp Phe 1115 1120

Claims

스캐폴드를 형성하는 2종 이상의 조작된 핵산 서열 ("NASC")의 조성물이며, NASC 조성물은
5'에서 3' 방향으로
핵산 표적 결합 서열 1을 포함하는 스페이서 요소 1,
반복 핵산 서열 1을 포함하는 반복 요소 1, 및
이중-가닥 핵산 결합 단백질 결합 서열 1을 포함하는 핵산 결합 단백질 결합 요소 1
을 포함하며,
여기서 스페이서 요소 1은 반복 요소 1과 공유 연결되고, 반복 요소 1은 핵산 결합 단백질 결합 요소 1과 공유 연결되는 것인
제1 조작된 핵산 성분 ("NASC-PC1"); 및
5'에서 3' 방향으로
핵산 표적 결합 서열 2를 포함하는 스페이서 요소 2,
반복 핵산 서열 2를 포함하는 반복 요소 2, 및
이중-가닥 핵산 결합 단백질 결합 서열 2를 포함하는 핵산 결합 단백질 결합 요소 2
를 포함하며,
여기서 스페이서 요소 2는 반복 요소 2와 공유 연결되고, 반복 요소 2는 핵산 결합 단백질 결합 요소 2와 공유 연결되는 것인
제2 조작된 핵산 성분 ("NASC-PC2")
을 포함하며;
여기서 수소-결합된 염기 쌍을 통한 반복 핵산 서열 1과 반복 핵산 서열 2 사이의 연결이 존재하고, 연결은 NASC 조성물을 형성하고, NASC 조성물은 제1 이중-가닥 핵산 결합 단백질 및 제2 이중-가닥 핵산 결합 단백질에 결합할 수 있는 것인
NASC 조성물.
제1항에 있어서, 제1 이중-가닥 핵산 결합 단백질이 부류 2 제II형 CRISPR-Cas9 단백질이고, 제2 이중-가닥 핵산 결합 단백질이 부류 2 제II형 CRISPR-Cas9 단백질인 NASC 조성물.
제1항 또는 제2항에 있어서, 제1 이중-가닥 핵산 결합 단백질 및 제2 이중-가닥 핵산 결합 단백질이 동일한 부류 2 제II형 CRISPR-Cas9 단백질인 NASC 조성물.
제1항 내지 제3항 중 어느 한 항에 있어서,
스페이서 요소 1이 핵산 표적 결합 서열 1의 3' 및 반복 요소 1의 5'의 링커 요소 핵산 서열을 추가로 포함하고;
스페이서 요소 2가 핵산 표적 결합 서열 1의 3' 및 반복 요소 1의 5'의 링커 요소 핵산 서열을 추가로 포함하는 것인 NASC 조성물.
제4항에 있어서,
반복 요소 1이 5'에서 3' 방향으로 반복 핵산 서열 1b, 링커 요소 핵산 서열 1, 및 반복 핵산 서열 1a를 추가로 포함하고;
반복 요소 2가 5'에서 3' 방향으로 반복 핵산 서열 1aC, 링커 요소 핵산 서열 2, 및 반복 핵산 서열 1bC, 반복 핵산 서열 1, 및 링커 요소 핵산 서열을 추가로 포함하며;
여기서 반복 핵산 서열 1b 및 반복 핵산 서열 1bC는 수소-결합된 염기 쌍을 통해 연결되고, 반복 핵산 서열 1a 및 반복 핵산 서열 1aC는 수소-결합된 염기 쌍을 통해 연결되는 것인 NASC 조성물.
제5항에 있어서,
반복 핵산 서열 1b가 5'에서 3' 방향으로
반복 핵산 서열 1b2,
벌지 핵산 서열 1b1, 및
반복 핵산 서열 1b1
을 추가로 포함하고;
반복 핵산 서열 1a가 5'에서 3' 방향으로
반복 핵산 서열 1a2,
벌지 핵산 서열 1a1, 및
반복 핵산 서열 1a1
을 추가로 포함하고;
반복 핵산 서열 1aC가 5'에서 3' 방향으로
반복 핵산 서열 1a1C,
벌지 핵산 서열 2a2, 및
반복 핵산 서열 1a2C
를 추가로 포함하고;
반복 핵산 서열 1bC가 5'에서 3' 방향으로
반복 핵산 서열 1b1C,
벌지 핵산 서열 2b2, 및
반복 핵산 서열 1b2C
를 추가로 포함하며;
여기서 반복 핵산 서열 1a1 및 반복 핵산 서열 1a1C는 수소-결합된 염기 쌍을 통해 연결되고, 반복 핵산 서열 1a2 및 반복 핵산 서열 1a2C는 수소-결합된 염기 쌍을 통해 연결되고, 반복 핵산 서열 1b1 및 반복 핵산 서열 1b1C는 수소-결합된 염기 쌍을 통해 연결되고, 반복 핵산 서열 1b2 및 반복 핵산 서열 1b2C는 수소-결합된 염기 쌍을 통해 연결되는 것인 NASC 조성물.
제6항에 있어서,
링커 요소 핵산 서열 1이 5'에서 3' 방향으로
링커 요소 핵산 서열 1-2-2,
반복 핵산 서열 1-2a, 및
링커 요소 핵산 서열 1-2-1
을 추가로 포함하고;
링커 요소 핵산 서열 2-2가 5'에서 3' 방향으로
링커 요소 핵산 서열 2-2-1
반복 핵산 서열 1-2aC, 및
링커 요소 핵산 서열 2-2-2
를 추가로 포함하며;
여기서 반복 핵산 서열 1-2a 및 반복 핵산 서열 1-2aC는 수소-결합된 염기 쌍을 통해 연결되고, 이중-가닥 핵산 영역 1-2를 형성하는 것인 NASC 조성물.
제7항에 있어서,
이중-가닥 핵산 영역 1-2가 이펙터 단백질 결합 부위를 추가로 포함하고;
반복 핵산 서열 1-2a가 이펙터 단백질 결합 부위 핵산 서열 1-2a를 추가로 포함하고;
반복 핵산 서열 2가 이펙터 단백질 결합 부위 핵산 서열 1-2aC를 추가로 포함하며;
여기서 이펙터 결합 부위는 이펙터 단백질 결합 부위 핵산 서열 1-2a와 이펙터 단백질 결합 부위 핵산 서열 1-2aC 사이의 수소 염기-쌍 결합에 의해 형성되는 것인 NASC 조성물.
제8항에 있어서, 이펙터 단백질 결합 부위 1이 Csy4 단백질 결합 부위인 NASC 조성물.
제1항 내지 제9항 중 어느 한 항에 있어서,
반복 핵산 서열 1이 친화성 태그 1을 추가로 포함하고;
반복 핵산 서열 2가 친화성 태그 2를 추가로 포함하며;
여기서 친화성 태그 1은 친화성 태그 2와 연결되는 것인 NASC 조성물.
제10항에 있어서, RNA, DNA, 또는 RNA 및 DNA를 포함하는 NASC 조성물.
제11항에 있어서, NASC-PC2가 RNA 및 DNA를 포함하는 것인 NASC 조성물.
제1항 내지 제12항 중 어느 한 항의 NASC 조성물; 및
제1 Cas9 단백질 및 제2 Cas9 단백질
을 포함하는 핵산/단백질 조성물.
제13항에 있어서, 제1 Cas9 단백질이 제2 Cas9 단백질과 동일하고, 제1 Cas9 단백질 및 제2 Cas9 단백질이 스트렙토코쿠스 피오게네스(Streptococcus pyogenes) Cas9 단백질, 스트렙토코쿠스 써모필루스(Streptococcus thermophilus) Cas9 단백질, 스타필로코쿠스 아우레우스(Staphylococcus aureus) Cas9 단백질 및 캄필로박터 제주니(Campylobacter jejuni) Cas9 단백질로 이루어진 군으로부터 선택되는 것인 핵산/단백질 조성물.
제13항에 있어서, 제1 Cas9 단백질이 제2 Cas9 단백질과 상이하고, 제1 Cas9 단백질 및 제2 Cas9 단백질이 스트렙토코쿠스 피오게네스 Cas9 단백질, 스트렙토코쿠스 써모필루스 Cas9 단백질, 스타필로코쿠스 아우레우스 Cas9 단백질 및 캄필로박터 제주니 Cas9 단백질로 이루어진 군으로부터 선택되는 것인 핵산/단백질 조성물.
제15항에 있어서, 제1 Cas9 단백질 및 제2 Cas9 단백질이 각각 Cas9 단백질/Cas9 단백질, Cas9 단백질/dCas9 단백질, dCas9 단백질/Cas9 단백질 및 dCas9 단백질/dCas9 단백질로 이루어진 군으로부터 선택되는 것인 핵산/단백질 조성물.
제13항 내지 제16항 중 어느 한 항에 있어서, NASC 조성물이 RNA, DNA, 또는 RNA 및 DNA를 포함하는 것인 핵산/단백질 조성물.
제1항 내지 제12항 중 어느 한 항의 NASC 조성물, 또는 제1항 내지 제12항 중 어느 한 항의 NASC 조성물을 코딩하는 1종 이상의 핵산 서열; 및
완충제
를 포함하는 키트.
제18항에 있어서, 1종 이상의 Cas9 단백질, 또는 1종 이상의 Cas9 단백질을 코딩하는 1종 이상의 핵산 서열을 추가로 포함하는 키트.
제18항에 있어서, NASC 조성물 및 1종 이상의 Cas9 단백질을 포함하는 핵단백질 복합체를 추가로 포함하는 키트.