KR102629128B1

KR102629128B1 - 화학적 변형을 갖는 가이드 rna

Info

Publication number: KR102629128B1
Application number: KR1020177018311A
Authority: KR
Inventors: 다니엘 이 라이언; 더글라스 제이 델링저; 제프리 알 샘슨; 로버트 카이저; 조엘 마이어슨
Original assignee: 애질런트 테크놀로지스, 인크.
Priority date: 2014-12-03
Filing date: 2015-12-03
Publication date: 2024-01-25
Also published as: US10900034B2; JP2022078083A; KR20170084334A; EP3227447A4; KR20240013283A; CN107250148A; AU2015355546A1; US20210079389A1; US20230416733A1; EP3227447A1; WO2016089433A1; US10337001B2; CN107250148B; CA2969619A1; JP7068821B2; US20160289675A1; JP2017537626A; AU2015355546B2; EP3227447B1; US20180051281A1

Abstract

본 발명은 변형된 가이드 RNA, 및 간헐적으로 반복되는 회문구조 염기서열 집합체(크리스퍼)/크리스퍼-결합된(Cas) 시스템에서의 그의 용도에 관한 것이다.

Description

화학적 변형을 갖는 가이드 RNA{GUIDE RNA WITH CHEMICAL MODIFICATIONS}

본 발명은 분자 생물학 분야에 관한 것이다. 특히, 본 발명은 간헐적으로 반복되는 회문구조 염기서열 집합체(크리스퍼(CRISPR)) 기술에 관한 것이다.

고유 원핵생물 크리스퍼-Cas 시스템은 일정한 길이의 개재 가변 서열을 갖는 짧은 반복부의 배열(즉 간헐적으로 반복되는 회문구조 염기서열 집합체, 또는 "크리스퍼") 및 크리스퍼-결합된("Cas") 단백질을 포함한다. 전사된 크리스퍼 배열의 RNA는 상기 Cas 단백질의 부분집합에 의해 작은 가이드 RNA(일반적으로 하기에 논의되는 바와 같은 2개의 성분을 갖는다)로 가공된다. 적어도 3개의 상이한 시스템들: I형, II형 및 III형이 존재한다. 상기 RNA의 성숙한 crRNA로의 가공에 관련된 효소들은 상기 3개의 시스템에서 상이하다. 고유 원핵생물 시스템에서, 상기 가이드 RNA("gRNA")는 크리스퍼 RNA("crRNA") 및 트랜스-작용 RNA("tracrRNA")라 칭하는 2개의 짧은, 비-암호화 RNA 종들을 포함한다. 예시적인 시스템에서, 상기 gRNA는 Cas 뉴클레아제와 복합체를 형성한다. 상기 gRNA:Cas 뉴클레아제 복합체는 프로토스페이서(protospacer) 인접 동기("PAM") 및 프로토스페이서를 갖는 표적 폴리뉴클레오타이드 서열(상기 gRNA의 일부에 상보성인 서열이다)에 결합한다. 상기 gRNA:Cas 뉴클레아제 복합체에 의한 상기 표적 폴리뉴클레오타이드의 인식 및 결합은 상기 표적 폴리뉴클레오타이드의 절단을 유도한다. 상기 고유 크리스퍼-Cas 시스템은 원핵생물에서 면역 시스템으로서 기능하며, 이때 gRNA:Cas 뉴클레아제 복합체는 진핵생물 유기체에서 RNAi와 유사한 방식으로 외인성 유전 요소를 인식하고 침묵시키며, 이에 의해 외인성 유전 요소, 예를 들어 플라스미드 및 파지에 대한 내성을 부여한다.

단일-가이드 RNA("sgRNA")가 천연 crRNA와 tracrRNA 간에 형성된 복합체를 대체할 수 있음이 입증되었다.

sgRNA를 포함한 gRNA의 개발과 관련된 고려사항은 특이성, 안정성 및 기능성을 포함한다. 특이성은 특정한 gRNA:Cas 뉴클레아제 복합체가 목적하는 표적 서열에 결합하고/하거나 상기 서열을 절단하는 능력을 지칭하는 반면, 목적하는 표적으로부터 서열 및/또는 위치가 상이한 폴리뉴클레오타이드의 결합 및/또는 절단은 거의 또는 전혀 발생하지 않는다. 따라서, 특이성은 상기 gRNA:Cas 뉴클레아제 복합체의 표적-외 효과를 최소화함을 지칭한다. 안정성은 효소, 예를 들어 뉴클레아제, 및 세포-내 및 세포-외 환경에 존재하는 다른 물질들에 의한 분해에 저항하는 상기 gRNA의 능력을 지칭한다.

따라서, 핵산분해적 분해에 대한 증가된 내성, 표적 폴리뉴클레오타이드에 대한 증가된 결합 친화성, 및/또는 감소된 표적-외 효과를 갖는 반면, 그럼에도 불구하고 gRNA 기능성을 갖는, sgRNA를 포함한 gRNA를 제공할 필요가 있다. gRNA의 개발과 관련된 추가의 고려사항은 형질감염성 및 면역자극 성질을 포함한다. 따라서, 세포, 특히 진핵생물 세포의 핵내로의 효율적이고 적정 가능한 형질감염성을 갖고 형질감염된 세포에서 면역자극 성질을 최소로 갖거나 갖지 않는, sgRNA를 포함한 gRNA를 제공할 필요가 있다. gRNA에 대한 또 다른 중요한 고려사항은 목적하는 gRNA 기능성을 허용하기에 충분한 기간 동안 상기 gRNA를 목적하는 세포, 조직, 체액 또는 유기체내로 전달하고 여기에서 유지시키기에 유효한 수단을 제공하는 것이다.

도 1은 예시적인 크리스퍼-Cas 시스템의 도식적 모델을 도시하는 다이어그램 세트이다. 여기에 도시된 예시적인 시스템은 Cas 뉴클레아제를 갖는 II형 시스템이다. 본 특정 예에서, 상기 Cas 뉴클레아제는 Cas9 뉴클레아제이다. 상기 Cas9 뉴클레아제는 PAM 서열[여기에서 상기 PAM 서열은 NGG의 3-nt 서열(이때 N은 A, G, C 또는 T이다)이나, 다른 PAM 서열들도 존재하는 것으로 공지되어 있다]을 인식한다. 상기 sgRNA는 가이드 서열, crRNA 서열 또는 분절, 및 tracrRNA 서열 또는 분절을 포함한다. 상기 sgRNA의 가이드 서열은 상기 PAM 서열의 바로 상류의 DNA 표적과 하이브리드화한다. 여기에 도시된 예에서, Cas9는 상기 PAM 서열(화살표) 상류의 이중-가닥 끊김을 매개한다.
도 2a는 예시적인 크리스퍼-Cas9-매개된 절단 분석을 도시하는 다이어그램이다.
도 2b는 도 4의 데이터를 생성시키는데 사용되는 생화학적 절단 분석에 대한 성분들 및 그들의 농도를 도시하는 표이다.
도 2c는 상기 생화학적 절단 분석을 위한 스트렙토코커스 피오게네스(Streptococcus pyogenes) Cas9 뉴클레아제의 적정을 도시하는 다이어그램이다.
도 2d는 상기 생화학적 절단 분석을 위한 예시적인 sgRNA의 적정을 도시하는 다이어그램이다. 본 예에서 kanC1이라 명명하는 sgRNA는 가나마이신 내성 유전자 중의 상보성 서열에 표적화된다.
도 3은 시험관내에서 정제된 성분을 사용하는 상기 생화학적 절단 분석에 예시적인 조건 및 과정을 도시한다.
도 4는 상기 절단 분석에서 예시적인 변형된 가이드 RNA를 사용하여 획득된 데이터를 도시하는 표이다.
도 5a는 본 출원에 개시된 예시적인 가이드 RNA를 도시한다.
도 5b는 본 출원에 개시된 예시적인 단일 가이드 RNA(sgRNA)를 도시한다.
도 6은 적어도 2개(예를 들어, 제1 변형 및 제2 변형)의 화학적 변형을 갖는 예시적인 가이드 RNA를 도시하는 표이다. 각각의 숫자는 지시되는 바와 같은 변형을 나타내며 각각의 "x"는 가이드 RNA 중의 변형들의 조합을 가리킨다. 몇몇 실시태양에서, 상기 제1 및 제2 변형은 단일 뉴클레오타이드상에 존재한다. 몇몇 실시태양에서, 상기 제1 및 제2 변형은 별도의 뉴클레오타이드상에 존재한다.
도 7은 적어도 3개의 화학적 변형을 갖는 가이드 RNA의 예시적인 유형들을 도시한다. 도 7의 하부 부분은 다수 유형의 변형들을 나열한다. 도 7의 상부 부분의 표는 이중 변형("이중 변형", 2가지 유형의 변형의 조합)이 단일 변형("단일 변형", 한 가지 유형의 변형)과 어떻게 병행될 수 있는지를 가리킨다. "x"는 가이드 RNA에서 상응하는 이중 변형 및 단일 변형의 존재를 가리킨다.
도 8a 및 8b는 시험관내 시험에 대한 형광단-변형된 CLTA1 sgRNA를 도시한다. 도 8a에서, CLTA1에 대한 sgRNA의 RNA 서열을 도시하며, 형광 염료 또는 표지가 상기 sgRNA에 부착될 수 있는 위치를 포함한다. 도 8b는 문헌[Nishimasu et al., Cell (2014) 156, 1-15]에 보고된 바와 같은, Cas9:sgRNA 복합체의 X선 결정학에 의해 측정된 구조를 도시한다.
도 9a는 CTLA1 표적에 대한 특이성을 개선하고자 하는 노력으로 몇몇 위치(3, 9 및 11번 위치)에서 2-티오유리딘에 의해 변형된 CTLA1 sgRNA를 도시한다. 도 9b는 2-티오U에 의해 변형된 gRNA가, 표적-외 부위가 U-G 동요 짝짓기를 수반하는 경우, 상기 gRNA의 표적 특이성을 증가시킬 수 있음을 도시한다. 특히, CTLA1_2-티오U+11은 표적-외 서열 CLTA1 OFF3(5' 가닥 중 11번째 위치에 T에서 C로의 돌연변이를 갖는다)의 훨씬 더 낮은 절단을 가졌다.
도 10은 가이드 RNA 스캐폴드 2차 구조를 도시하며, 문헌[Jiang et al., Science (2015) 345:6242, 1477-81]에 보고된 바와 같은, Cas9의 아미노산과 비공유 결합 상호작용을 나타낸다.
도 11a 및 11b는 인간 세포주에서 유전자 파괴가 높은 빈도의 인델(indel) 및 상동성 재조합(HR)과 함께, 문헌[Hendel et al., Nat. Biotechnol. (2015) 33:9, 985-9]에 보고된 바와 같이, 본 명세서에 개시된 합성되고 화학적으로 변형된 sgRNA를 사용하여 성취될 수 있음을 보이는 실험 결과를 예시한다.
도 12a, 12b, 12c 및 12d는 본 명세서에 기재된 바와 같은 화학적으로 변형된 sgRNA를 사용하여, 문헌[Hendel et al., Nat. Biotechnol. (2015) 33:9, 985-9]에 보고된 바와 같이, 자극된 1차 인간 T 세포뿐만 아니라 CD34+ 조혈모세포 및 전구세포(HSPC)에서 높은 빈도의 유전자 파괴 또는 표적화된 게놈 편집을 성취할 수 있음을 나타내는 실험 결과를 예시한다.

본 발명은 적어도 부분적으로, gRNA에 대한 몇몇 화학적 변형이 크리스퍼-Cas 시스템에 의해 허용된다는 뜻밖의 발견에 근거한다. 특히, 상기 gRNA의 안정성을 증가시키고, gRNA 하이브리드화 상호작용의 열안정성을 변경시키고, 및/또는 Cas:gRNA 복합체형성의 표적-외 효과를 감소시키는 것으로 여겨지는 몇몇 화학적 변형들은 표적 폴리뉴클레오타이드의 틈 형성(nicking) 및/또는 절단에 대한 Cas:gRNA 결합의 효능을 실질적으로 손상시키지 않는다. 더욱 또한, 몇몇 화학적 변형들은, 세포, 특히 진핵생물 세포의 핵내로의 효율적이고 적정 가능한 형질감염성을 갖고 및/또는 형질감염된 세포에서 면역자극 성질을 최소로 갖거나 갖지 않는, sgRNA를 포함한 gRNA를 제공하는 것으로 여겨진다. 몇몇 화학적 변형들은 목적하는 gRNA 기능성을 허용하기에 충분한 기간 동안 목적하는 세포, 조직, 체액 또는 유기체내로 유효하게 전달되고 상기 중에서 유지될 수 있는, sgRNA를 포함한 gRNA를 제공하는 것으로 여겨진다.

I. 정의

본 명세서에 사용되는 "가이드 RNA"란 용어는 일반적으로 Cas 단백질에 결합할 수 있고 상기 Cas 단백질을 표적 폴리뉴클레오타이드(예를 들어, DNA)내의 특정 위치에 표적화하는 것을 도울 수 있는 RNA 분자(또는 집합적으로 RNA 분자들의 그룹)를 지칭한다. 가이드 RNA는 crRNA 분절 및 tracrRNA 분절을 포함할 수 있다. 본 명세서에 사용되는 "crRNA" 또는 "crRNA 분절"이란 용어는 폴리뉴클레오타이드-표적화 가이드 서열, 줄기 서열 및 임의로 5'-오버행 서열을 포함하는 RNA 분자 또는 그의 부분을 지칭한다. 본 명세서에 사용되는 "tracrRNA" 또는 "tracrRNA 분절"이란 용어는 단백질-결합 분절(예를 들어, 상기 단백질-결합 분절은 크리스퍼-결합된 단백질, 예를 들어 Cas9와 상호작용할 수 있다)을 포함하는 RNA 분자 또는 그의 부분을 지칭한다. 상기 "가이드 RNA"란 용어는 단일 가이드 RNA(sgRNA)를 포함하며, 이때 상기 crRNA 분절 및 상기 tracrRNA 분절은 동일한 RNA 분자 중에 위치한다. "가이드 RNA"란 용어는 또한 집합적으로 2개 이상의 RNA 분자들의 그룹을 포함하며, 이때 상기 crRNA 및 상기 tracrRNA 분절은 별도의 RNA 분자 중에 위치한다.

"스캐폴드"란 용어는 실질적으로 동일하거나 천연 생물종들에 걸쳐 고도로 보존되는 서열을 포함하는 가이드 RNA 분자의 부분을 지칭한다. 스캐폴드는, 고유 crRNA 및 tracrRNA 중에 보존되지 않는 서열을 포함하는 임의의 비천연 부분을 제외하고, 상기 tracrRNA 분절 및 상기 crRNA 분절의 5' 단부 또는 그 부근의 폴리뉴클레오타이드-표적화 가이드 서열 이외의 crRNA 분절의 부분을 포함한다.

"핵산", "폴리뉴클레오타이드" 또는 "올리고뉴클레오타이드"란 용어는 DNA 분자, RNA 분자 또는 이들의 유사체를 지칭한다. 본 명세서에 사용되는 "핵산", "폴리뉴클레오타이드" 및 "올리고뉴클레오타이드"란 용어는 비제한적으로 DNA 분자, 예를 들어 cDNA, 게놈 DNA 또는 합성 DNA 및 RNA 분자, 예를 들어 가이드 RNA, 전령 RNA 또는 합성 RNA를 포함한다. 더욱이, 본 명세서에 사용되는 "핵산" 및 "폴리뉴클레오타이드"란 용어는 단일-가닥 및 이중-가닥 형태를 포함한다.

올리고뉴클레오타이드 또는 폴리뉴클레오타이드와 관련하여 "변형"이란 용어는 비제한적으로 (a) 단부 변형, 예를 들어 5' 단부 변형 또는 3' 단부 변형, (b) 염기의 교체 또는 제거를 포함한 핵염기(또는 "염기") 변형, (c) 2', 3' 및/또는 4' 위치의 변형을 포함한 당 변형, 및 (d) 포스포다이에스터 결합의 변형 또는 교체를 포함한 주쇄 변형을 포함한다. "변형된 뉴클레오타이드"란 용어는 일반적으로 상기 염기, 당, 및 뉴클레오타이드 포스페이트를 포함한 포스포다이에스터 결합 또는 주쇄 부분 중 하나 이상의 화학 구조에 대한 변형을 갖는 뉴클레오타이드를 지칭한다.

"Z" 및 "P"란 용어는, 예를 들어 문헌["Artificially expanded genetic information system: a new base pair with an alternative hydrogen bonding pattern" Yang,Z., Hutter,D., Sheng,P., Sismour,A.M. and Benner,S.A. (2006) Nucleic Acids Res., 34, 6095-101](상기 문헌은 내용 전체가 본 명세서에 참고로 인용된다)에 기재된 바와 같은 스티븐 베너(Steven Benner)와 동료에 의해 개발된 뉴클레오타이드, 핵염기 또는 핵염기 유사체를 지칭한다.

용어 "xA", "xG", "xC", "xT", 또는 "x(A,G,C,T)" 및 "yA", "yG", "yC", "yT", 또는 "y(A,G,C,T)"는 문헌["Synthesis and Properties of Size-Expanded DNAs: Toward Designed, Functional Genetic Systems"; Andrew T. Krueger, Haige Lu, Alex H. F. Lee, and Eric T. Kool (2007) Acc. Chem. Res., 40, 141-50](상기 문헌은 내용 전체가 본 명세서에 참고로 인용된다)에서 크루에거(Krueger) 등에 의해 기재된 바와 같은 뉴클레오타이드, 핵염기, 또는 핵염기 유사체를 지칭한다.

"비구조화 핵산" 또는 "UNA"란 용어는 US7371580(그의 내용은 전체가 본 명세서에 참고로 인용된다)에 기재된 바와 같은 뉴클레오타이드, 핵염기 또는 핵염기 유사체를 지칭한다. 비구조화 핵산, 또는 UNA 변형을 또한 "의사-상보성" 뉴클레오타이드, 핵염기 또는 핵염기 유사체라 지칭한다(예를 들어, 문헌[Lahoud et al. (1991) Nucl. Acids Res., 36: 10, 3409-19]을 참조하시오).

"PACE" 및 "티오PACE"란 용어는 각각 포스포노아세테이트 또는 티오포스포노아세테이트기를 함유하는 뉴클레오타이드간 포스포다이에스터 결합 유사체를 지칭한다. 이들 변형은 포스포노카복실레이트 부분, 포스포노카복실레이트 에스터 부분, 티오포스포노카복실레이트 부분 및 티오포스포노카복실레이트 에스터 부분을 포함한 광범위한 화합물 부류에 속한다. 이들 결합을 각각 화학식 P(CR₁R₂)_nCOOR 및 (S)-P(CR₁R₂)_nCOOR(여기에서 n은 0 내지 6의 정수이고, R₁ 및 R₂는 각각 독립적으로 H, 알킬 및 치환된 알킬로 이루어진 군 중에서 선택된다)에 의해 기재할 수 있다. 이들 변형 중 일부는 문헌[Yamada et al. "Synthesis and Biochemical Evaluation of Phosphonoformate Oligodeoxyribonucleotides" Christina M. Yamada, Douglas J. Dellinger and Marvin H. Caruthers (2006) 7. Am. Chem. Soc. 128: 15, 5251-61](상기 문헌은 내용 전체가 본 명세서에 참고로 인용된다)에 기재되어 있다.

본 명세서에 사용되는 "변형"은 변형되지 않은 리보뉴클레오타이드, 즉 아데노신, 구아노신, 시티딘 및 유리딘 리보뉴클레오타이드에서 발견되는 것과 상이한 화학 부분 또는 화학 구조의 부분을 지칭한다. 상기 "변형"이란 용어는 변형의 유형을 지칭할 수도 있다. 예를 들어, "동일한 변형"은 동일한 유형의 변형을 의미하며, "변형된 뉴클레오타이드가 동일하다"는 변형된 뉴클레오타이드가 동일한 유형(들)의 변형을 갖는 반면 염기(A, G, C, U 등)는 상이할 수도 있음을 의미한다. 유사하게, "2개의 변형"을 갖는 가이드 RNA는 2개 유형의 변형(동일한 뉴클레오타이드 중에 있을 수도, 있지 않을 수도 있다)을 갖는 가이드 RNA이며, 각각의 유형은 상기 가이드 RNA 중의 다수의 뉴클레오타이드 중에 존재할 수 있다. 유사하게, "3개의 변형"을 갖는 가이드 RNA는 3개 유형의 변형(동일한 뉴클레오타이드 중에 있을 수도, 있지 않을 수도 있다)을 갖는 가이드 RNA이며, 각각의 유형은 다수의 뉴클레오타이드 중에 존재할 수 있다.

본 명세서에 사용되는 "표적 폴리뉴클레오타이드" 또는 "표적"이란 용어는 표적 핵산 서열을 함유하는 폴리뉴클레오타이드를 지칭한다. 표적 폴리뉴클레오타이드는 단일-가닥 또는 이중-가닥일 수 있으며, 몇몇 실시태양에서, 이중-가닥 DNA이다. 몇몇 실시태양에서, 상기 표적 폴리뉴클레오타이드는 단일-가닥 RNA이다. 본 명세서에 사용되는 바와 같은 "표적 핵산 서열" 또는 "표적 서열"은 크리스퍼 시스템을 사용하여 결합시키거나, 틈을 형성시키거나, 절단시키기를 원하는 특정 서열 또는 그의 보체를 의미한다.

"하이브리드화" 또는 "하이브리드화하는"이란 용어는 전적으로 또는 부분적으로 상보성인 폴리뉴클레오타이드 가닥들이 함께 적합한 하이브리드화 조건하에서 이중-가닥 구조 또는 영역(여기에서 상기 2개의 구성 가닥들은 수소 결합에 의해 결합된다)을 형성하는 과정을 지칭한다. 본 명세서에 사용되는 "부분적인 하이브리드화"란 용어는 상기 이중-가닥 구조 또는 영역이 하나 이상의 벌지 또는 불합치를 함유하는 경우를 포함한다. 수소 결합은 전형적으로 아데닌과 티민 또는 아데닌과 유라실(A와 T 또는 A와 U) 또는 시토신과 구아닌(C와 G) 사이에 형성되지만, 다른 비정규 염기쌍을 형성할 수도 있다(예를 들어, 문헌[Adams et ai, "The Biochemistry of the Nucleic Acids, " 11th ed., 1992]을 참조하시오). 변형된 뉴클레오타이드가, 하이브리드화를 허용하거나 촉진하는 수소 결합을 형성할 수도 있음이 고려된다.

"절단" 또는 "절단하는"이란 용어는 폴리뉴클레오타이드의 리보실포스포다이에스터 주쇄 중의 공유 포스포다이에스터 결합의 끊김을 지칭한다. 상기 "절단" 또는 "절단하는"이란 용어는 단일-가닥 끊김 및 이중-가닥 끊김을 모두 포함한다. 이중-가닥 절단은 2개의 별도의 단일-가닥 절단 사건의 결과로서 발생할 수 있다. 절단은 평활 단부 또는 엇갈린 단부를 생성시킬 수 있다.

"크리스퍼-결합된 단백질" 또는 "Cas 단백질"이란 용어는 야생형 Cas 단백질, 그의 단편, 또는 그의 돌연변이체 또는 변체를 지칭한다. "Cas 돌연변이체" 또는 "Cas 변체"란 용어는 야생형 Cas·단백질의 단백질 또는 폴리펩타이드 유도체, 예를 들어 하나 이상의 점 돌연변이, 삽입, 결실, 절두, 융합 단백질 또는 이들의 조합을 갖는 단백질을 지칭한다. 몇몇 실시태양에서, 상기 "Cas 돌연변이체" 또는 "Cas 변체"는 실질적으로 상기 Cas 단백질의 뉴클레아제 활성을 유지한다. 몇몇 실시태양에서, 상기 "Cas 돌연변이체" 또는 "Cas 변체"는 하나 또는 2개의 뉴클레아제 도메인이 모두 불활성이도록 돌연변이된다. 몇몇 실시태양에서, 상기 "Cas 돌연변이체" 또는 "Cas 변체"는 뉴클레아제 활성을 갖는다. 몇몇 실시태양에서, 상기 "Cas 돌연변이체" 또는 "Cas 변체"는 그의 야생형 대응물의 뉴클레아제 활성 중 일부 또는 전부가 없다.

Cas 단백질의 "뉴클레아제 도메인"이란 용어는 DNA 절단에 대한 촉매 활성을 갖는 단백질내의 폴리펩타이드 서열 또는 도메인을 지칭한다. 뉴클레아제 도메인은 단일 폴리펩타이드 쇄 중에 함유되거나, 절단 활성이 2개(또는 그 이상)의 폴리펩타이드의 결합으로부터 생성될 수 있다. 단일 뉴클레아제 도메인은 주어진 폴리펩타이드내 아미노산의 하나 초과의 단리된 신장부로 이루어질 수 있다. 이들 도메인의 예는 RuvC-형 동기(서열번호 1에서 아미노산 7-22, 759-766 및 982-989) 및 HNH 동기(aa 837-863)를 포함한다. 문헌[Gasiunas et al. (2012) Proc. Natl. Acad. Sci. USA, 109:39, E2579-E2586] 및 WO2013176772를 참조하시오.

"gRNA 기능성"을 갖는 합성 가이드 RNA는 천연 가이드 RNA의 기능들 중 하나 이상, 예를 들어 Cas 단백질과 결합하는 기능, 또는 Cas 단백질과 함께 상기 가이드 RNA에 의해 수행되는 기능을 갖는 것이다. 몇몇 실시태양에서, 상기 기능성은 표적 폴리뉴클레오타이드와 결합함을 포함한다. 몇몇 실시태양에서, 상기 기능성은 Cas 단백질 또는 gRNA:Cas 단백질 복합체를 표적 폴리뉴클레오타이드에 표적화함을 포함한다. 몇몇 실시태양에서, 상기 기능성은 표적 폴리뉴클레오타이드에 틈을 형성시킴을 포함한다. 몇몇 실시태양에서, 상기 기능성은 표적 폴리뉴클레오타이드를 절단함을 포함한다. 몇몇 실시태양에서, 상기 기능성은 Cas 단백질과 회합하거나 결합함을 포함한다. 몇몇 실시태양에서, 상기 기능성은 Cas 단백질을 갖는 크리스퍼-Cas 시스템, 예를 들어 조작된 Cas 단백질을 갖는 인공 크리스퍼-Cas 시스템에서 가이드 RNA의 임의의 다른 공지된 기능이다. 몇몇 실시태양에서, 상기 기능성은 천연 가이드 RNA의 임의의 다른 기능이다. 상기 합성 가이드 RNA는 gRNA 기능성을 천연 가이드 RNA보다 더 크거나 더 적은 정도로 가질 수 있다. 몇몇 실시태양에서, 합성 가이드 RNA는 유사한 천연 가이드 RNA에 비해 하나의 성질에 관하여 더 큰 기능성을 갖고 또 다른 성질에 관하여 덜한 기능성을 가질 수 있다.

"단일-가닥 틈 형성 활성을 갖는 Cas 단백질"은 야생형 Cas 단백질에 비해 dsDNA의 2개 가닥 중 하나를 절단하는 능력이 감소된 Cas 단백질(Cas 돌연변이체 또는 Cas 변체 포함)을 지칭한다. 예를 들어, 몇몇 실시태양에서, 단일-가닥 틈 형성 활성을 갖는 Cas 단백질은, RuvC 도메인(또는 HNH 도메인)의 기능을 감소시키고 결과적으로 표적 DNA의 하나의 가닥을 절단시키는 능력을 감소시키는 돌연변이(예를 들어, 아미노산 치환)를 갖는다. 상기와 같은 변체의 예는 스트렙토코커스 피오게네스 Cas9에서 D10A, H839A/H840A, 및/또는 N863A 치환을 포함하며, 다른 종들의 Cas9 효소 중 동일한 부위에서의 동일하거나 유사한 치환을 또한 포함한다.

본 명세서에 사용되는 바와 같이, 서열의 "부분" 또는 "단편"이란 용어는 완전한 서열보다 작은 서열(예를 들어, 뉴클레오타이드 하위서열 또는 아미노산 하위서열)의 임의의 부분을 지칭한다. 폴리뉴클레오타이드의 부분은 임의의 길이, 예를 들어 적어도 5, 10, 15, 20, 25, 30, 40, 50, 75, 100, 150, 200, 300 또는 500개 또는 그 이상의 뉴클레오타이드 길이일 수 있다. 가이드 서열의 일부는 상기 가이드 서열의 약 50%, 40%, 30%, 20%, 10%, 예를 들어 상기 가이드 서열의 1/3, 또는 더 짧은, 예를 들어 7, 6, 5, 4, 3, 또는 2개 뉴클레오타이드의 길이일 수 있다.

분자와 관련하여 "로부터 유래된"이란 용어는 모 분자 또는 상기 모 분자로부터의 정보를 사용하여 단리되거나 제조된 분자를 지칭한다. 예를 들어, Cas9 단일 돌연변이 니카제 및 Cas9 이중 돌연변이 삭제-뉴클레아제는 야생형 Cas9 단백질로부터 유래된다.

2개 이상의 폴리뉴클레오타이드(또는 2개 이상의 폴리펩타이드)와 관련하여 "실질적으로 동일한"이란 용어는 서열 비교 연산을 사용하거나 시각적 검사에 의해 최대의 상응성으로 비교 및 정렬했을 때, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 90-95%, 적어도 약 95%, 적어도 약 98%, 적어도 약 99% 이상의 뉴클레오타이드(또는 아미노산) 서열 일치성을 갖는 서열 또는 하위서열을 지칭한다. 바람직하게, 폴리뉴클레오타이드들간의 "실질적인 일치성"은 상기 폴리뉴클레오타이드의 영역에 걸쳐 적어도 약 50개 뉴클레오타이드 길이, 적어도 약 100개 뉴클레오타이드 길이, 적어도 약 200개 뉴클레오타이드 길이, 적어도 약 300개 뉴클레오타이드 길이, 적어도 약 500개 뉴클레오타이드 길이로 존재하거나, 상기 폴리뉴클레오타이드의 전체 길이에 걸쳐 존재한다. 바람직하게, 상기 폴리펩타이드간의 "실질적인 일치성"은 상기 폴리펩타이드의 영역에 걸쳐 적어도 약 50개 아미노산 잔기, 적어도 약 100개 아미노산 잔기의 길이로 존재하거나, 상기 폴리펩타이드의 전체 길이에 걸쳐 존재한다.

본 명세서에 개시되는 바와 같이, 다수의 값의 범위가 제공된다. 각각의 사이 값, 하한 단위의 1/10, 상기 범위의 상한과 하한 사이가 또한 구체적으로 고려되는 것으로 안다. 진술된 범위에 의해 포함되는 각각의 보다 작은 범위 또는 사이 값이 또한 구체적으로 고려된다. "약"이란 용어는 일반적으로, 지시된 수의 + 또는 - 10%를 지칭한다. 예를 들어, "약 10%"는 9% 내지 11%의 범위를 가리킬 수 있고, "약 20"은 18 내지 22를 의미할 수 있다. "약"의 다른 의미는 내용상 자명할 수 있다, 예를 들어 반올림, 따라서 예를 들어 "약 1"은 또한 0.5 내지 1.4를 의미할 수 있다.

II. 크리스퍼-매개된 서열-특이성 결합 및/또는 절단

도 1에 DNA의 크리스퍼-Cas9-매개된 서열-특이성 절단의 다이어그램을 도시한다. 상기 가이드 RNA는, 5' 도메인, 내부에 위치한 염기-쌍 줄기, 및 3' 도메인내의 예시적인 20-뉴클레오타이드(20-nt) 가이드 서열(다른 가이드 서열은, 예를 들어 길이가 약 15 내지 약 30 nt일 수 있다)을 갖는 sgRNA로서 묘사된다. 상기 가이드 서열은 DNA 표적 중 예시적인 20-nt 표적 서열에 상보성이다. 상기 줄기는 crRNA 중 반복 서열에 상응하며 tracrRNA 중의 서열에 상보성이다. 상기 가이드 RNA의 3' 도메인은 Cas9 뉴클레아제에 결합하는 tracrRNA의 3' 도메인에 상응한다. 상기 Cas9:가이드 RNA 복합체는 Cas9에 의해 인식되는 PAM 서열의 바로 상류의 프로토스페이서 또는 표적 DNA 서열에 결합하고 이를 절단한다. 도 1에서, 3-nt PAM 서열을 예시하나; 4-nt 및 5-nt PAM 서열을 포함하여 다른 PAM 서열들이 공지되어 있다. 도 1에 예시된 시스템에서, DNA 중의 표적 서열의 2개의 가닥은 모두 화살표로 지시된 부위에서 Cas9에 의해 절단된다.

III. 가이드 RNA

적어도 하나의 태양에서, 본 발명은 가이드 RNA 기능성을 갖는 화학적으로 변형된 가이드 RNA를 포함한다. 4개의 정규 리보뉴클레오타이드, 즉 A, C, G 및 U(비천연이든 천연이든 간에) 이외의 임의의 뉴클레오타이드(예를 들어, 슈도유리딘, 이노신 또는 데옥시뉴클레오타이드)를 포함하는 가이드 RNA는 화학적으로 변형된 가이드 RNA이다. 마찬가지로 천연 포스포다이에스테르 뉴클레오타이드간 결합 이외의 임의의 주쇄 또는 뉴클레오타이드간 결합을 포함하는 가이드 RNA는 화학적 변형을 가지며, 따라서 화학적으로 변형된 RNA이다. 몇몇 실시태양에서, 상기 유지되는 기능성은 Cas 단백질과의 결합을 포함한다. 몇몇 실시태양에서, 상기 유지되는 기능성은 표적 폴리뉴클레오타이드와의 결합을 포함한다. 몇몇 실시태양에서, 상기 유지되는 기능성은 Cas 단백질 또는 gRNA:Cas 단백질 복합체를 표적 폴리뉴클레오타이드에 표적화함을 포함한다. 몇몇 실시태양에서, 상기 유지되는 기능성은 gRNA:Cas 단백질 복합체에 의한 표적 폴리뉴클레오타이드의 틈 형성을 포함한다. 몇몇 실시태양에서, 상기 유지되는 기능성은 gRNA:Cas 단백질 복합체에 의한 표적 폴리뉴클레오타이드의 절단을 포함한다. 몇몇 실시태양에서, 상기 유지되는 기능성은 Cas 단백질을 갖는 크리스퍼-Cas 시스템, 예를 들어 조작된 Cas 단백질을 갖는 인공 크리스퍼-Cas 시스템에서 가이드 RNA의 임의의 다른 공지된 기능이다. 몇몇 실시태양에서, 상기 유지되는 기능성은 천연 가이드 RNA의 임의의 다른 기능이다.

A. 예시적인 변형

몇몇 실시태양에서, 상기 가이드 RNA에 통합된 뉴클레오타이드 당 변형은 2'-O-C_1-4알킬, 예를 들어 2'-O-메틸(2'-OMe), 2'-데옥시(2'-H), 2'-O-C_1- ₃알킬-O-C_1- ₃알킬, 예를 들어 2'-메톡시에틸("2'-MOE"), 2'-플루오로("2'-F"), 2'-아미노("2'-NH₂"), 2'-아라비노실("2'-아라비노") 뉴클레오타이드, 2'-F-아라비노실("2'-F-아라비노") 뉴클레오타이드, 2'-잠금 핵산("LNA")뉴클레오타이드, 2'-열림 핵산("ULNA") 뉴클레오타이드, L 형태의 당("L-당") 및 4'-티오리보실 뉴클레오타이드로 이루어진 군 중에서 선택된다. 몇몇 실시태양에서, 상기 가이드 RNA에 통합된 뉴클레오타이드간 결합 변형은 포스포로티오에이트 "P(S)"(P(S)), 포스포노카복실레이트(P(CH₂)_nCOOR), 예를 들어 포스포노아세테이트 "PACE"(P(CH₂COO^-)), 티오포스포노카복실레이트((S)P(CH₂)_nCOOR), 예를 들어 티오포스포노아세테이트 "티오PACE"((S)P(CH₂COO^-)), 알킬포스포네이트(P(C_1- ₃알킬)), 예를 들어 메틸포스포네이트-P(CH₃), 보라노포스포네이트(P(BH₃)) 및 포스포로다이티오에이트(P(S)₂)로 이루어진 군 중에서 선택된다.

몇몇 실시태양에서, 상기 가이드 RNA에 통합된 핵염기("염기") 변형은 2-티오유라실("2-티오U"), 2-티오시토신("2-티오C"), 4-티오유라실("4-티오U"), 6-티오구아닌("6-티오G"), 2-아미노아데닌("2-아미노A"), 2-아미노퓨린, 슈도유라실, 하이포잔틴, 7-데아자구아닌, 7-데아자-8-아자구아닌, 7-데아자아데닌, 7-데아자-8-아자아데닌, 5-메틸시토신("5-메틸C"), 5-메틸유라실("5-메틸U"), 5-하이드록시메틸시토신, 5-하이드록시메틸유라실, 5,6-데하이드로유라실, 5-프로피닐시토신, 5-프로피닐유라실, 5-에티닐시토신, 5-에티닐유라실, 5-알릴유라실("5-알릴U"), 5-알릴시토신("5-알릴C"), 5-아미노알릴유라실("5-아미노알릴U"), 5-아미노알릴-시토신("5-아미노알릴C"), 비염기성 뉴클레오타이드, Z 염기, P 염기, 비구조화 핵산("UNA"), 아이소구아닌("아이소G"), 아이소시토신("아이소C")[문헌["Enzymatic Incorporation of a New Base pair into DNA and RNA Extends the Genetic Alphabet." Piccirilli, J. A.; Krauch, T.; Moroney, S. E.; Benner, S. A. (1990) Nature, 343, 33]에 기재된 바와 같은), 5-메틸-2-피리미딘[문헌[Rappaport, H. P. (1993) Biochemistry, 32, 3047]에 기재된 바와 같은], x(A,G,C,T) 및 y(A,G,C,T)로 이루어진 군 중에서 선택된다.

몇몇 실시태양에서, 하나 이상의 동위원소 변형이 뉴클레오타이드 당, 핵염기, 포스포다이에스터 결합 및/또는 뉴클레오타이드 포스페이트상에 도입된다. 상기와 같은 변형은 추적자로서 사용되는 하나 이상의 ¹⁵N, ¹³C, ¹⁴C, 중수소, ³H, ³²P, ¹²⁵I, ¹³¹I 원자 또는 다른 원자 또는 원소를 포함하는 뉴클레오타이드를 포함한다.

몇몇 실시태양에서, 상기 가이드 RNA에 통합되는 "단부" 변형은 PEG(폴리에틸렌글리콜), 탄화수소 링커(헤테로원자(O,S,N)-치환된 탄화수소 스페이서; 할로-치환된 탄화수소 스페이서; 케토-, 카복실-, 아미도-, 티오닐-, 카바모일-, 티오노카바모일-함유 탄화수소 스페이서 포함), 스페르민 링커, 링커에 부착된 형광 염료(예를 들어, 플루오레세인, 로다민, 시아닌)를 포함하는 염료, 예를 들어 6-플루오레세인-헥실, 소광제(예를 들어, 답실, BHQ) 및 다른 표지(예를 들어, 비오틴, 디곡시제닌, 아크리딘, 스트렙트아비딘, 아비딘, 펩타이드 및/또는 단백질)로 이루어진 군 중에서 선택된다. 몇몇 실시태양에서, "단부" 변형은 상기 가이드 RNA의, 올리고뉴클레오타이드(데옥시뉴클레오타이드 및/또는 리보뉴클레오타이드 포함), 펩타이드, 단백질, 당, 올리고사카라이드, 스테로이드, 지질, 폴산, 비타민 및/또는 다른 분자를 포함하는 또 다른 분자에의 접합(또는 결찰)을 포함한다. 몇몇 실시태양에서, 상기 가이드 RNA에 통합된 "단부" 변형은 링커, 예를 들어 2-(4-부틸아미도플루오레세인)프로판-1,3-다이올 비스(포스포다이에스터) 링커(하기에 묘사됨)(이는 포스포다이에스터 결합으로서 통합되고 상기 가이드 RNA 중의 2개의 뉴클레오타이드 사이의 어디에나 통합될 수 있다)를 통해 상기 가이드 RNA 서열에 내부적으로 위치한다.

다른 링커는, 예를 들어 예시로서, 비제한적으로 하기를 포함한다:

몇몇 실시태양에서, 상기 단부 변형은 말단 작용기, 예를 들어 아민, 티올(또는 설프하이드릴), 하이드록실, 카복실, 카보닐, 티오닐, 티오카보닐, 카바모일, 티오카바모일, 포스포릴, 알켄, 알킨, 할로겐 또는 작용기-종결된 링커(이들 중 어느 하나는 후속으로 목적하는 부분, 예를 들어 형광 염료 또는 비-형광 표지 또는 태그에 접합될 수 있다) 또는 임의의 다른 분자, 예를 들어 올리고뉴클레오타이드(앱타머를 포함하여, 데옥시뉴클레오타이드 및/또는 리보뉴클레오타이드를 포함한다), 아미노산, 펩타이드, 단백질, 당, 올리고사카라이드, 스테로이드, 지질, 폴산, 비타민을 포함한다. 상기 접합은 당해 분야에 주지된 표준 화학, 예를 들어 비제한적으로 N-하이드록시숙신아미드, 아이소티오시아네이트, DCC(또는 DCI)를 통한 커플링, 및/또는 문헌["Bioconjugate Techniques" by Greg T. Hermanson, Publisher Eslsevier Science, 3rd ed. (2013)](상기 문헌의 내용은 전체가 본 명세서에 참고로 인용된다)에 기재된 바와 같은 임의의 다른 표준 방법을 사용한다.

몇몇 실시태양에서, 상기 표지 또는 염료는 상기 gRNA 중의 변형된 뉴클레오타이드에 부착되거나 접합된다. 형광 염료 또는 다른 부분, 예를 들어 비-형광 표지 또는 태그(예를 들어, 비오틴, 아비딘, 스트렙트아비딘, 또는 동위원소 표지, 예를 들어 ¹⁵N, ¹³C, ¹⁴C, 중수소, ³H, ³²P, ¹²⁵I 등을 함유하는 부분) 또는 임의의 다른 분자, 예를 들어 올리고뉴클레오타이드(앱타머를 포함하여, 데옥시뉴클레오타이드 및/또는 리보뉴클레오타이드를 포함한다), 아미노산, 펩타이드, 단백질, 당, 올리고사카라이드, 스테로이드, 지질, 폴산, 비타민 또는 다른 분자의 접합을 소위 "클릭" 화학 또는 소위 "스쿠아레이트" 접합 화학을 사용하여 수행할 수 있다. 상기 "클릭" 화학은 아지드 부분과 알킨 부분의 [3+2] 가환을 지칭하며, 이는, 예를 들어 문헌[El-Sagheer, A.H and Brown, T. "Click chemistry with DNA", Chem. Soc. Rev., 2010, 39, 1388-1405] 및 문헌[Mojibul, H.M. and XiaoHua, P., DNA-associated click chemistry, Sci. China Chem., 2014, 57:2, 215-31](상기 문헌의 내용은 전체가 본 명세서에 참고로 인용된다)에 기재된 바와 같이, 하기의 반응식에 나타내는 바와 같은 2개의 부분 사이의 트라이아졸로 결합을 유도한다:

몇몇 실시태양에서, 상기 접합을 선택적 가환, 예를 들어 알켄 부분과 π-접합된 다이엔 부분의 딜스-알더[4+2] 가환에 의해 수행할 수 있다.

상기 "스쿠아레이트" 접합 화학은 2개의 부분(각각 아민을 갖는다)을 스쿠아레이트 유도체를 통해 결합시켜 스쿠아레이트 부분을 함유하는 스쿠아레이트 접합체를 생성시킨다(예를 들어, 문헌[Tietze et al. (1991) Chem. Ber., 124, 1215-21](상기 문헌은 내용 전체가 본 명세서에 참고로 인용된다). 예를 들어, 링커 아민을 함유하는 플루오레세인을 하기의 반응식에 기재된 바와 같이 스쿠아레이트 링커를 통해 아민을 함유하는 올리고리보뉴클레오타이드에 접합시킨다. 상기 스쿠아레이트 링커의 일례를 하기 반응식에 묘사한다:

몇몇 실시태양에서, 상기 가이드 RNA에 통합되는 화학적 변형은 2'-O-C_1- ₄알킬, 2'-H, 2'-O-C_1- ₃알킬-O-C_1- ₃알킬, 2'-F, 2'-NH₂, 2'-아라비노, 2'-F-아라비노, 4'-티오리보실, 2-티오U, 2-티오C, 4-티오U, 6-티오G, 2-아미노A, 2-아미노퓨린, 슈도유라실, 하이포잔틴, 7-데아자구아닌, 7-데아자-8-아자구아닌, 7-데아자아데닌, 7-데아자-8-아자아데닌, 5-메틸C, 5-메틸U, 5-하이드록시메틸시토신, 5-하이드록시메틸유라실, 5,6-데하이드로유라실, 5-프로피닐시토신, 5-프로피닐유라실, 5-에티닐시토신, 5-에티닐유라실, 5-알릴U, 5-알릴C, 5-아미노알릴유라실, 5-아미노알릴-시토신, 비염기성 뉴클레오타이드("abN"), Z, P, UNA, 아이소C, 아이소G, 5-메틸-피리미딘, x(A,G,C,T) 및 y(A,G,C,T), 포스포로티오에이트 뉴클레오타이드간 결합, 포스포노아세테이트 뉴클레오타이드간 결합, 티오포스포노아세테이트 뉴클레오타이드간 결합, 메틸포스포네이트 뉴클레오타이드간 결합, 보라노포스페이트 뉴클레오타이드간 결합, 포스포로다이티오에이트 뉴클레오타이드간 결합, 4'-티오리보실 뉴클레오타이드, 잠금 핵산("LNA") 뉴클레오타이드, 열림 핵산("ULNA") 뉴클레오타이드, 알킬 스페이서, 헤테로알킬(N,O,S) 스페이서, 5'- 및/또는 3'-알킬 종결된 뉴클레오타이드, 유니캡, 자연으로부터 알려진 5'-말단 캡, xRNA 염기("xDNA" 염기와 유사함), yRNA 염기("yDNA" 염기와 유사함), PEG 치환체, 또는 염료 또는 비-형광 표지(또는 태그) 또는 상술한 바와 같은 다른 부분에 대한 접합된 링커로 이루어진 군 중에서 선택된다. 예시적인 변형된 뉴클레오타이드를 또한 표 2에 묘사한다.

[표 2]

본 명세서에 기재된 바와 같이 몇몇 비천연 염기쌍(예를 들어, 아이소G 및 아이소C, Z 염기 및 P 염기; 문헌[Zhang et al. (2015) J. Am. Chem. Soc.]을 참조하시오)이 상기 가이드 RNA 2차 구조의 열안정성에 영향을 미치는데 유리할 수 있다. 상기 변형을 사용하여 상기 가이드 RNA 스캐폴드와 가이드 RNA 서열의 다른 도메인과의 잘못접힘을 방지할 수 있다.

최근의 가이드 RNA:Cas9 단백질 구조 정보(도 10, 문헌[Jiang et al. 2015, Science]에 보고된 바와 같은) 및 생체내/시험관내 기능적 돌연변이 연구(예를 들어, 문헌[Briner et al. 2014, Mol. Cell, 56, 333-9]을 참조하시오)는 상기 가이드 RNA 스캐폴드가 우세하게 구조적으로 보존됨을 가리킨다. 이는 Cas9에 의한 기능성을 위해 가이드 RNA의 보존된 도메인의 정확한 접힘의 중요성을 보강한다. 도 10은 Cas9의 아미노산과 상호작용을 나타내는, 상기 가이드 RNA 스캐폴드 2차 구조를 도시한다. 상기 가이드 RNA 질소 염기의 대부분은 Cas9 단백질과의 결합 상호작용에 관여하지 않는다.

상기 sgRNA 스캐폴드의 인접 서열은 잘못 접힘 및 따라서 오기능의 가능성을 증가시킨다. 상기 20 nt 가이드 표적화 서열, 상기 스캐폴드 영역의 5'은 각 표적에 대해 사용자-특이적이며, 따라서 잘못 접힘의 가능성은 가변성이거나 표적-특이적이다. 또한, 다수의 최근 등장한 크리스퍼-Cas 응용은 상기 스캐폴드, 예를 들어 크리스퍼디스플레이(문헌[Schechner et al., Nat. Methods 2015]) 및 크리스퍼-i/-a(문헌[Chen et al., Cell 2013])(이들은 적합하게 기능하기 위해서 정확하고 독립적으로 접힐 필요가 있는 리보스위치 또는 앱타머이다)의 3'에 기능성 서열을 달고 있다. 주어진 sgRNA의 각각의 기능성 도메인(즉 표적화 가이드, 스캐폴드, 앱타머)이 모듈식으로, 독립적인 방식으로 확실히 접히도록, 상기 구조적으로 보존된 스캐폴드 염기쌍을 비천연의, 직교 염기쌍(예를 들어, 아이소G 및 아이소C; Z 염기 및 P 염기)으로 치환하고, 일부 실시태양에서, 독점적으로 비천연의, 직교 염기쌍으로 치환시킬 수 있다. 이는 상기 sgRNA 스캐폴드 서열이 상기 표적-짝짓기 가이드 서열의 요소 또는 상기 가이드 RNA에 통합된 다른 비-고유 도메인, 예를 들어 상기 가이드 RNA상의 임의의 앱타머 서열 또는 임의의 비-고유 5' 또는 3' 오버행과 2차 구조로 안정하게 상호작용하지 않을 것임을 보장한다. 한편으로, 상기 언급된 비천연의, 직교 염기쌍을, 존재할 수도 있는 임의의 비-고유 오버행 또는 앱타머에 통합시키고, 따라서 상기 스캐폴드 서열(들)의 잘못 접힘을 수반하는 2차 구조를 방지할 수 있었다.

B. 적어도 하나의 변형을 갖는 가이드 RNA

하나의 태양에서, 본 기술은 변형된 gRNA를 구성하는, 적어도 하나의 변형을 갖는 가이드 RNA를 제공한다.

몇몇 실시태양에서, 상기 변형된 gRNA는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 또는 50개의 변형된 뉴클레오타이드를 포함한다. 다른 실시태양에서, 상기 변형된 gRNA는 적어도 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130 또는 140개의 변형된 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 모든 뉴클레오타이드가 변형된다. 몇몇 실시태양에서, 상기 변형은 모두 동일하다. 몇몇 실시태양에서, 상기 변형된 뉴클레오타이드는 모두 동일한 유형의 변형을 갖는다. 몇몇 실시태양에서, 상기 변형된 gRNA는 상이하게 변형된 뉴클레오타이드의 조합을 포함한다. 몇몇 실시태양에서, 상기 변형된 gRNA는 2개 이상의 변형된 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 상기 변형된 gRNA는 3개 이상의 변형된 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 상기 변형된 뉴클레오타이드는 연속적으로 배열된다. 몇몇 실시태양에서, 상기 변형된 gRNA는 변형된 뉴클레오타이드의 적어도 하나의 연속적인 신장부를 포함한다. 몇몇 실시태양에서, 상기 변형된 gRNA는 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 또는 50개의 변형된 뉴클레오타이드의 연속적인 신장부를 포함한다. 각각의 변형된 뉴클레오타이드는 독립적으로 하나 이상 유형의 변형을 포함할 수 있다. 몇몇 실시태양에서, 변형된 뉴클레오타이드는 상기 변형된 gRNA의 서열에서 연속적이지 않거나, 일부 그러나 전부가 연속성이지는 않다.

몇몇 실시태양에서, 상기 변형은 상기 가이드 RNA의 5' 부분내에 있다. 몇몇 실시태양에서, 상기 변형은 상기 가이드 RNA의 5' 부분의 처음 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형은 상기 가이드 RNA의 5' 부분의 처음 3개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형은 상기 가이드 RNA의 3' 부분내에 있다. 몇몇 실시태양에서, 상기 변형은 상기 가이드 RNA의 3' 부분의 처음 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형은 상기 가이드 RNA의 3' 부분의 처음 3개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형은 상기 가이드 RNA의 내부 영역내에(즉 5' 단부와 3' 단부 사이에) 있다.

몇몇 실시태양에서, 상기 변형은, 예를 들어 뉴클레아제에 의한 분해로부터 상기 가이드 RNA를 보호하기 위해서 또는 다른 목적을 위해서 상기 가이드 RNA의 5' 부분 또는 3' 부분에, 특히 상기 5' 부분의 처음 5 또는 10개 뉴클레오타이드내에 또는 상기 3' 부분의 마지막 5 또는 10개 뉴클레오타이드내에 통합된다. 일부 다른 실시태양에서, 상기 변형은, 예를 들어 뉴클레아제에 의한 분해로부터 상기 가이드 RNA를 보호하기 위해서 또는 다른 목적을 위해서 상기 가이드 RNA의 5' 부분 및 3' 부분 모두에, 특히 상기 5' 부분의 처음 5 또는 10개 뉴클레오타이드내에 및 상기 3' 부분의 마지막 5 또는 10개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 하나 초과 유형의 변형이 상기 가이드 RNA의 5' 부분 및 3' 부분 모두에 존재한다. 몇몇 실시태양에서, 상기 변형은 상기 가이드 RNA의 5' 단부, 3' 단부, 및 내부 서열내에 위치한다. 몇몇 실시태양에서, 가이드 RNA는 상기 가이드 RNA의 5' 또는 3' 부분 중의 40개 이하, 한편으로 20개 이하, 한편으로 15개 이하, 한편으로 10개 이하, 한편으로 5개 이하, 한편으로 3개 이하의 데옥시리보뉴클레오타이드 잔기를 포함한다.

몇몇 실시태양에서, 상기 변형은 상기 가이드 RNA의 crRNA 분절내에 있다. 몇몇 실시태양에서, 상기 변형은 상기 crRNA의 가이드 서열내에 있다. 몇몇 실시태양에서, 상기 변형은 상기 crRNA 분절의 처음 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형은 상기 crRNA 분절의 처음 3개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형은 상기 crRNA 분절의 5'-오버행내에 있다. 몇몇 실시태양에서, 상기 변형은 상기 가이드 RNA의 tracrRNA 분절내에 있다. 몇몇 실시태양에서, 상기 변형은 상기 가이드 RNA의 tracrRNA 분절의 마지막 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형은 상기 가이드 RNA의 tracrRNA 분절의 마지막 3개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 가이드 RNA가 단일 가이드 RNA인 경우, 상기 변형은 상기 가이드 RNA의 고리내에 위치한다. 몇몇 실시태양에서, 상기 하나 이상의 변형은 상기 고리 L 영역내에 있다. 몇몇 실시태양에서, 상기 변형은 상술한 바와 같이, 예를 들어 2-(3-염료/표지/태그-아미도)프로판아미도)프로판-1,3-다이올 비스(포스포다이에스터) 링커 또는 상기 고리 또는 L 영역 중의 뉴클레오타이드의 변형된 염기에의 접합에 의해 2개의 뉴클레오타이드 사이에 통합된 링커에 접합된 염료, 비-형광 표지 또는 태그를 포함한다.

몇몇 실시태양에서, 상기 변형은 단부 변형, 예를 들어 5' 단부 변형 또는 3' 단부 변형을 포함한다. 단부 변형의 예는 비제한적으로 인산화(천연 포스페이트 또는 폴리포스페이트로서 또는 변형된 포스포네이트기, 예를 들어 알킬포스포네이트, 포스포노카복실레이트, 포스포노아세테이트, 보라노포스포네이트, 포스포로티오에이트, 포스포로다이티오에이트 등으로서), 비오틴화, 접합성 또는 접합된 분자, 링커, 염료, 표지, 태그, 작용기(예를 들어, 비제한적으로 5'-아미노, 5'-티오, 5'-아미도, 5'카복시 등), 역전된 결합, 또는 에테르, 폴리에틸렌 글리콜(PEG), 에스터, 하이드록실, 아릴, 할로, 포스포다이에스터, 바이사이클릭, 헤테로사이클릭 또는 다른 유기 작용기를 포함할 수 있는 탄화수소 부분을 포함한다. 몇몇 실시태양에서, 상기 단부 변형은 다이메톡시트리틸을 포함한다.

몇몇 실시태양에서, 상기 변형은 변형된 염기를 포함한다. 본 명세서에 사용되는 "변형되지 않은" 염기는 퓨린 염기 아데닌(A) 및 구아닌(G), 및 피리미딘 염기 티민(T), 시토신(C) 및 유라실(U)을 포함한다. 변형된 염기의 예는 비제한적으로 합성 및 천연 염기, 예를 들어 2-티오U, 2-티오C, 4-티오U, 6-티오G, 2-아미노A, 2-아미노P, 슈도유라실, 하이포잔틴, 7-데아자구아닌, 7-데아자-8-아자구아닌, 7-데아자아데닌, 7-데아자-8-아자아데닌, 5-메틸C, 5-메틸U, 5-하이드록시메틸시토신, 5-하이드록시메틸유라실, 5,6-데하이드로유라실, 5-프로피닐시토신, 5-프로피닐유라실, 5-에티닐시토신, 5-에티닐유라실, 5-알릴U, 5-알릴C, 5-아미노알릴-유라실, 및 5-아미노알릴-시토신을 포함한다. 몇몇 실시태양에서, 상기 변형은 비염기성 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 상기 변형은 비표준 퓨린 또는 피리미딘 구조, 예를 들어 Z 또는 P, 아이소C 또는 아이소G, UNA, 5-메틸피리미딘, x(A,G,C,T) 또는 y(A,G,C,T)를 포함한다. 몇몇 실시태양에서, 상기 변형된 gRNA는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 또는 50개의 변형된 염기를 포함한다. 다른 실시태양에서, 상기 변형된 gRNA는 적어도 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130 또는 140개의 변형된 염기를 포함한다. 몇몇 실시태양에서, gRNA 중의 모든 염기가 변형된다.

몇몇 실시태양에서, 상기 변형은 변형된 당을 포함한다. 변형된 당의 예는 비제한적으로 2' 위치의 변형 또는 4' 위치의 변형을 갖는 당을 포함한다. 예를 들어, 몇몇 실시태양에서, 상기 당은 2'-O-C_1- ₄알킬, 예를 들어 2'-O-메틸(2'-OMe)을 포함한다. 몇몇 실시태양에서, 상기 당은 2'-O-C_1- ₃알킬-O-C_1- ₃알킬, 예를 들어 2'-메톡시에톡시(2'-O-CH₂CH₂OCH₃)(또한 2'-O-(2-메톡시에틸) 또는 2'-MOE로서 공지됨)를 포함한다. 몇몇 실시태양에서, 상기 당은 2'-할로, 예를 들어 2'-F, 2'-Br, 2'-Cl 또는 2'-I를 포함한다. 몇몇 실시태양에서, 상기 당은 2'-NH₂를 포함한다. 몇몇 실시태양에서, 상기 당은 2'-H(예를 들어, 데옥시뉴클레오타이드)를 포함한다. 몇몇 실시태양에서, 상기 당은 2'-아라비노 또는 2'-F-아라비노를 포함한다. 몇몇 실시태양에서, 상기 당은 2'-LNA 또는 2'-ULNA를 포함한다. 몇몇 실시태양에서, 상기 당은 4'-티오리보실을 포함한다. 몇몇 실시태양에서, 상기 변형된 gRNA는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 또는 50개의 변형된 당을 포함한다. 다른 실시태양에서, 상기 변형된 gRNA는 적어도 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130 또는 140개의 변형된 당을 포함한다. 몇몇 실시태양에서, gRNA 중의 모든 당이 변형된다.

몇몇 실시태양에서, 상기 변형은 변형된 주쇄(즉 천연 포스포다이에스터 이외의 뉴클레오타이드간 결합)를 포함한다. 변형된 뉴클레오타이드간 결합의 예는 비제한적으로 포스포로티오에이트 뉴클레오타이드간 결합, 키랄 포스포로티오에이트 뉴클레오타이드간 결합, 포스포로다이티오에이트 뉴클레오타이드간 결합, 보라노포스포네이트 뉴클레오타이드간 결합, C_1- ₄알킬 포스포네이트 뉴클레오타이드간 결합, 예를 들어 메틸포스포네이트 뉴클레오타이드간 결합, 보라노포스포네이트 뉴클레오타이드간 결합, 포스포노카복실레이트 뉴클레오타이드간 결합, 예를 들어 포스포노아세테이트 뉴클레오타이드간 결합, 포스포노카복실레이트 에스터 뉴클레오타이드간 결합, 예를 들어 포스포노아세테이트 에스터 뉴클레오타이드간 결합, 티오포스포노카복실레이트 뉴클레오타이드간 결합, 예를 들어 티오포스포노아세테이트 뉴클레오타이드간 결합, 티오포스포노카복실레이트 에스터 뉴클레오타이드간 결합, 예를 들어 티오포스포노아세테이트 에스터 뉴클레오타이드간 결합을 포함한다. 다양한 염, 혼합된 염 및 유리산 형태들이 또한 포함된다. 몇몇 실시태양에서, 상기 변형된 gRNA는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 또는 50개의 변형된 뉴클레오타이드간 결합을 포함한다. 다른 실시태양에서, 상기 변형된 gRNA는 적어도 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130 또는 140개의 변형된 뉴클레오타이드간 결합을 포함한다. 몇몇 실시태양에서, gRNA 중의 모든 뉴클레오타이드간 결합이 변형된다.

몇몇 실시태양에서, 상기 변형은 2'-O-C_1- ₄알킬, 2'-H, 2'-O-C_1- ₃알킬-O-C_1- ₃알킬, 2'-F, 2'-NH₂, 2'-아라비노, 2'-F-아라비노, 2'-LNA, 2'-ULNA, 4'-티오리보실, 2-티오U, 2-티오C, 4-티오U, 6-티오G, 2-아미노A, 2-아미노P, 슈도유라실, 하이포잔틴, 7-데아자구아닌, 7-데아자-8-아자구아닌, 7-데아자아데닌, 7-데아자-8-아자아데닌, 5-MeC, 5-MeU, 5-하이드록시메틸시토신, 5-하이드록시메틸유라실, 5,6-데하이드로유라실, 5-프로피닐시토신, 5-프로피닐유라실, 5-에티닐시토신, 5-에티닐유라실, 5-알릴U, 5-알릴C, 5-아미노알릴유라실, 5-아미노알릴-시토신, 비염기성 뉴클레오타이드, Z, P, UNA, 아이소C, 아이소G, 5-메틸-피리미딘, x(A,G,C,T), y(A,G,C,T), 3'-포스포로티오에이트기, 3'-포스포노아세테이트기, 3'-포스포노아세테이트 에스터기, 3'-티오포스포노아세테이트기, 3'-티오포스포노아세테이트 에스터기, 3'-메틸포스포네이트기, 3-보라노포스포네이트기, 3'-포스포로다이티오에이트기, 또는 이들의 조합이다.

몇몇 실시태양에서, 상기 변형된 뉴클레오타이드는 2'-O-메틸-3'-포스포로티오에이트를 포함한다. 몇몇 실시태양에서, 상기 변형된 뉴클레오타이드는 2'-O-메틸-3'-포스포노아세테이트를 포함한다. 몇몇 실시태양에서, 상기 변형된 뉴클레오타이드는 2'-O-메틸-3'-티오포스포노아세테이트를 포함한다. 몇몇 실시태양에서, 상기 변형된 뉴클레오타이드는 Z 염기를 포함한다. 몇몇 실시태양에서, 상기 변형된 뉴클레오타이드는 2'-할로-3'-포스포로티오에이트를 포함한다. 몇몇 실시태양에서, 상기 변형된 뉴클레오타이드는 2'-할로-3'-포스포노아세테이트를 포함한다. 몇몇 실시태양에서, 상기 변형된 뉴클레오타이드는 2'-할로-3'-티오포스포노아세테이트를 포함한다. 몇몇 실시태양에서, 상기 변형된 뉴클레오타이드는 2'-플루오로-3'-포스포로티오에이트를 포함한다. 몇몇 실시태양에서, 상기 변형된 뉴클레오타이드는 2'-플루오로-3'-포스포노아세테이트를 포함한다. 몇몇 실시태양에서, 상기 변형된 뉴클레오타이드는 2'-플루오로-3'-티오포스포노아세테이트를 포함한다.

몇몇 실시태양에서, 상기 가이드 RNA는 하기 화학식 I에 의해 나타내는 올리고뉴클레오타이드를 포함한다:

[화학식 I]

W-Y 또는 Y-W

상기 식에서,

W는 적어도 하나의 변형을 포함하는 올리고뉴클레오타이드의 뉴클레오타이드 또는 뉴클레오타이드의 신장부를 나타내고;

Y는 상기 올리고뉴클레오타이드의 변형되지 않은 부분을 나타낸다.

몇몇 실시태양에서, W는 상기 가이드 RNA의 5' 부분내에 있다. 몇몇 실시태양에서, W는 적어도 부분적으로 상기 가이드 RNA의 5' 부분의 처음 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, W는 적어도 부분적으로 상기 가이드 RNA의 5' 부분의 처음 3개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, W는 상기 가이드 RNA의 3' 부분내에 있다. 몇몇 실시태양에서, W는 적어도 부분적으로 상기 가이드 RNA의 3' 부분의 처음 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, W는 적어도 부분적으로 상기 가이드 RNA의 3' 부분의 처음 3개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, W는 상기 가이드 RNA의 내부 영역내에(즉 5' 단부와 3' 단부 사이에) 있다.

몇몇 실시태양에서, W는 단부 변형, 예를 들어 상술한 바와 같은 5' 단부 변형 또는 3' 단부 변형을 포함한다. 몇몇 실시태양에서, 상기 단부 변형은 다이메톡시트리틸을 포함한다.

몇몇 실시태양에서, W는 상술한 바와 같은 변형된 염기를 포함한다. 몇몇 실시태양에서, W는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 또는 50개의 변형된 염기를 포함한다. 다른 실시태양에서, W는 적어도 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130 또는 140개의 변형된 염기를 포함한다. 몇몇 실시태양에서, gRNA 중의 모든 염기가 변형된다.

몇몇 실시태양에서, W는 상술한 바와 같은 변형된 당을 포함한다. 몇몇 실시태양에서, W는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 또는 50개의 변형된 당을 포함한다. 다른 실시태양에서, W는 적어도 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130 또는 140개의 변형된 당을 포함한다. 몇몇 실시태양에서, gRNA 중의 모든 당이 변형된다.

몇몇 실시태양에서, W는 상술한 바와 같은 변형된 주쇄(즉 포스포다이에스터 이외의 뉴클레오타이드간 결합)를 포함한다. 몇몇 실시태양에서, W는 1 초과, 예를 들어 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 또는 50개의 변형된 뉴클레오타이드간 결합을 포함한다. 다른 실시태양에서, W는 적어도 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130 또는 140개의 변형된 뉴클레오타이드간 결합을 포함한다. 몇몇 실시태양에서, gRNA 중의 모든 뉴클레오타이드간 결합이 변형된다.

몇몇 실시태양에서, W는 2'-O-C_1- ₄알킬, 2'-H, 2'-O-C_1- ₃알킬-O-C_1- ₃알킬, 2'-F, 2'-NH₂, 2'-아라비노, 2'-F-아라비노, 2'-LNA, 2'-ULNA, 4'-티오리보실, 2-티오U, 2-티오C, 4-티오U, 6-티오G, 2-아미노A, 2-아미노P, 슈도유라실, 하이포잔틴, 7-데아자구아닌, 7-데아자-8-아자구아닌, 7-데아자아데닌, 7-데아자-8-아자아데닌, 5-MeC, 5-MeU, 5-하이드록시메틸시토신, 5-하이드록시메틸유라실, 5,6-데하이드로유라실, 5-프로피닐시토신, 5-프로피닐유라실, 5-에티닐시토신, 5-에티닐유라실, 5-알릴U, 5-알릴C, 5-아미노알릴유라실, 5-아미노알릴-시토신, 비염기성 뉴클레오타이드, Z, P, UNA, 아이소C, 아이소G, 5-메틸-피리미딘, x(A,G,C,T), y(A,G,C,T), 포스포로티오에이트 뉴클레오타이드간 결합, 포스포노아세테이트 뉴클레오타이드간 결합, 포스포노아세테이트 에스터 뉴클레오타이드간 결합, 티오포스포노아세테이트 뉴클레오타이드간 결합, 티오포스포노아세테이트 에스터 뉴클레오타이드간 결합, 메틸포스포노아세테이트 뉴클레오타이드간 결합, 보라노포스포네이트 뉴클레오타이드간 결합, 포스포로다이티오에이트 뉴클레오타이드간 결합, 또는 이들의 조합을 포함한다.

몇몇 실시태양에서, W는 동일한 뉴클레오타이드상에 2'-O-메틸 및 3'-포스포로티오에이트기를 포함한다. 몇몇 실시태양에서, W는 동일한 뉴클레오타이드상에 2'-O-메틸 및 3'-포스포노아세테이트기를 포함한다. 몇몇 실시태양에서, W는 동일한 뉴클레오타이드상에 2'-O-메틸 및 3'-티오포스포노아세테이트기를 포함한다. 몇몇 실시태양에서, W는 동일한 뉴클레오타이드상에 2'-F 및 3'-포스포로티오에이트기를 포함한다. 몇몇 실시태양에서, W는 동일한 뉴클레오타이드상에 2'-F 및 3'-포스포노아세테이트기를 포함한다. 몇몇 실시태양에서, W는 동일한 뉴클레오타이드상에 2'-F 및 3'-티오포스포노아세테이트기를 포함한다.

몇몇 실시태양에서, W는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개의 변형된 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 상기 각각의 변형된 뉴클레오타이드는 동일한 변형을 포함한다. 몇몇 실시태양에서, W는 다양하게 변형된 뉴클레오타이드들의 조합을 포함한다. 몇몇 실시태양에서, W는 2개 이상의 변형된 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, W는 3개 이상의 변형된 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 상기 변형된 뉴클레오타이드는, 하나 이상의 변형되지 않은 뉴클레오타이드들은 개입할 수 있기 때문에, 상기 서열 중에 연속적으로 배열되지 않거나, 적어도 전적으로 배열되지는 않는다. 몇몇 실시태양에서, 상기 변형된 뉴클레오타이드는 연속적으로 배열된다. 몇몇 실시태양에서, W는 변형된 뉴클레오타이드의 적어도 하나의 연속적인 신장부를 포함한다. 몇몇 실시태양에서, W는 적어도 3개의 변형된 뉴클레오타이드의 연속적인 신장부를 포함한다. 몇몇 실시태양에서, W는 적어도 4개의 변형된 뉴클레오타이드의 연속적인 신장부를 포함한다. 몇몇 실시태양에서, W는 적어도 5개의 변형된 뉴클레오타이드의 연속적인 신장부를 포함한다.

몇몇 실시태양에서, 상기 가이드 RNA는 하기 화학식 II에 의해 나타내는 올리고뉴클레오타이드를 포함한다:

[화학식 II]

M_mN_n

상기 식에서,

각각의 N은 독립적으로 변형되지 않은 리보뉴클레오타이드를 나타내고;

각각의 M은 변형된 뉴클레오타이드를 나타내며 2'-O-메틸 리보뉴클레오타이드, 3'-P(S) 리보뉴클레오타이드, 3'-PACE 리보뉴클레오타이드, 3'-티오PACE 리보뉴클레오타이드, 2'-O-메틸-3'-P(S)-리보뉴클레오타이드, 2'-O-메틸-3'-PACE 리보뉴클레오타이드, 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드, Z 뉴클레오타이드 및 2'-데옥시뉴클레오타이드로 이루어진 군 중에서 독립적으로 선택되고;

각각의 M은 상기 가이드 RNA의 서열의 임의의 위치에 있고;

임의의 주어진 M은 임의의 다른 M과 동일하거나 상이하고, 임의의 주어진 N은 임의의 다른 N과 동일하거나 상이하며;

각각의 m 및 n은 0 내지 219의 정수로부터 독립적으로 선택되나, 단 50<m+n≤220이고, m은 0이 아니다.

일부 실시태양에서, m+n<150이다.

몇몇 실시태양에서, 각각의 M은 2'-F, 2-티오유라실, 4-티오유라실, 2-아미노아데닌, 하이포잔틴, 5-메틸시토신, 5-메틸유라실, 5-알릴아미노유라실, 스쿠아레이트 결합, 트라이아졸로 결합, 및 2-(4-부틸아미도플루오레세인)프로판-1,3-다이올 비스(포스포다이에스터) 결합으로 이루어진 군 중에서 독립적으로 선택되는 하나 이상의 부분으로 변형된다. 일부 실시태양에서, M은 링커를 통해 부착된 염료를 포함한다.

몇몇 실시태양에서, 각각의 M은 2'-O-메틸 리보뉴클레오타이드, 2'-O-메틸-3'-P(S)-리보뉴클레오타이드, 2'-O-메틸-3'-PACE 리보뉴클레오타이드, 및 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드로 이루어진 군 중에서 독립적으로 선택된다. 몇몇 실시태양에서, 각각의 M은 2'-O-메틸-3'-PACE 리보뉴클레오타이드 및 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드로 이루어진 군 중에서 독립적으로 선택된다.

몇몇 실시태양에서, m>1일 때, 임의의 주어진 M은 임의의 다른 M과 동일하거나 상이하다. 몇몇 실시태양에서, m>1일 때, 각각의 M은 동일한 변형을 갖는다.

몇몇 실시태양에서, 각각의 M은 2'-O-메틸-3'-PACE 리보뉴클레오타이드이고, m은 1 내지 10의 정수 중에서 선택되고, 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고, n은 1 내지 149의 정수 중에서 선택되나, 단 50<m+n≤150이다. 몇몇 실시태양에서, 각각의 M은 2'-O-메틸-3'-PACE 리보뉴클레오타이드이고, m은 1 내지 5의 정수 중에서 선택되고, 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고, n은 1 내지 149의 정수 중에서 선택되나, 단 50<m+n≤150이다. 몇몇 실시태양에서, 각각의 M은 2'-O-메틸-3'-PACE 리보뉴클레오타이드이고, m은 2 내지 5의 정수 중에서 선택되고, 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고, n은 1 내지 148의 정수 중에서 선택되나, 단 50<m+n≤150이다. 몇몇 실시태양에서, m은 1이다. 몇몇 실시태양에서, m은 2이다. 몇몇 실시태양에서, m은 3이다. 몇몇 실시태양에서, m은 4이다. 몇몇 실시태양에서, m은 5이다.

몇몇 실시태양에서, 각각의 M은 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드이고, m은 1 내지 10의 정수 중에서 선택되고, 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고, n은 1 내지 149의 정수 중에서 선택되나, 단 50<m+n≤150이다. 몇몇 실시태양에서, 각각의 M은 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드이고, m은 1 내지 5의 정수 중에서 선택되고, 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고, n은 1 내지 149의 정수 중에서 선택되나, 단 50<m+n≤150이다. 몇몇 실시태양에서, 각각의 M은 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드이고, m은 2 내지 5의 정수 중에서 선택되고, 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고, n은 1 내지 148의 정수 중에서 선택되나, 단 50<m+n≤150이다. 몇몇 실시태양에서, m은 1이다. 몇몇 실시태양에서, m은 2이다. 몇몇 실시태양에서, m은 3이다. 몇몇 실시태양에서, m은 4이다. 몇몇 실시태양에서, m은 5이다.

몇몇 실시태양에서, 각각의 M은 2'-O-메틸 리보뉴클레오타이드이고, m은 1 내지 40의 정수 중에서 선택되고, 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고, n은 1 내지 149의 정수 중에서 선택되나, 단 50<m+n≤150이다. 몇몇 실시태양에서, 각각의 M은 2'-O-메틸 리보뉴클레오타이드이고, m은 1 내지 25의 정수 중에서 선택되고, 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고, n은 1 내지 149의 정수 중에서 선택되나, 단 50<m+n≤150이다. 몇몇 실시태양에서, 각각의 M은 2'-O-메틸 리보뉴클레오타이드이고, m은 1 내지 20의 정수 중에서 선택되고, 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고, n은 1 내지 149의 정수 중에서 선택되나, 단 50<m+n≤150이다. 몇몇 실시태양에서, m은 1이다. 몇몇 실시태양에서, m은 2이다. 몇몇 실시태양에서, m은 3이다. 몇몇 실시태양에서, m은 4이다. 몇몇 실시태양에서, m은 5이다. 몇몇 실시태양에서, m은 10이다. 몇몇 실시태양에서, m은 15이다. 몇몇 실시태양에서, m은 20이다. 몇몇 실시태양에서, m은 30이다. 몇몇 실시태양에서, m은 40이다.

몇몇 실시태양에서, 각각의 M은 2'-데옥시뉴클레오타이드이고, m은 1 내지 3의 정수 중에서 선택되고, 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고, n은 1 내지 149의 정수 중에서 선택되나, 단 50<m+n≤150이다. 몇몇 실시태양에서, 각각의 M은 2'-데옥시뉴클레오타이드이고, m은 1 내지 20의 정수 중에서 선택되고, 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고, n은 1 내지 149의 정수 중에서 선택되나, 단 50<m+n≤150이다. 몇몇 실시태양에서, m은 5이다. 몇몇 실시태양에서, m은 10이다. 몇몇 실시태양에서, m은 15이다. 몇몇 실시태양에서, m은 20이다. 몇몇 실시태양에서, m은 30이다.

몇몇 실시태양에서, 각각의 M은 2'-O-메틸-3'-P(S) 리보뉴클레오타이드이고, m은 1 내지 10의 정수 중에서 선택되고, 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고, n은 1 내지 149의 정수 중에서 선택되나, 단 50<m+n≤150이다. 몇몇 실시태양에서, 각각의 M은 2'-O-메틸-3'-P(S) 리보뉴클레오타이드이고, m은 1 내지 5의 정수 중에서 선택되고, 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고, n은 1 내지 149의 정수 중에서 선택되나, 단 50<m+n≤150이다. 몇몇 실시태양에서, m은 1이다. 몇몇 실시태양에서, m은 2이다. 몇몇 실시태양에서, m은 3이다. 몇몇 실시태양에서, m은 4이다. 몇몇 실시태양에서, m은 5이다.

몇몇 실시태양에서, 각각의 M은 Z 뉴클레오타이드이고, m은 1 내지 10의 정수 중에서 선택되고, 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고, n은 1 내지 149의 정수 중에서 선택되나, 단 50<m+n≤150이다. 몇몇 실시태양에서, 각각의 M은 Z 뉴클레오타이드이고, m은 1 내지 5의 정수 중에서 선택되고, 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고, n은 1 내지 149의 정수 중에서 선택되나, 단 50<m+n≤150이다. 몇몇 실시태양에서, m은 1이다. 몇몇 실시태양에서, m은 2이다. 몇몇 실시태양에서, m은 3이다. 몇몇 실시태양에서, m은 4이다. 몇몇 실시태양에서, m은 5이다.

몇몇 실시태양에서, 상기 변형은 안정성-변경 변형이다. 몇몇 실시태양에서, 상기 변형은 상기 변형이 없는 가이드 RNA에 비해 상기 가이드 RNA의 뉴클레아제 내성을 증가시키며, 따라서 상기 가이드 RNA 안정성을 증대시킨다. 몇몇 실시태양에서, 상기 안정성-변경 변형은 안정성-증대 변형이다. 예를 들어, 몇몇 실시태양에서, 상기 안정성-증대 변형은 2'-O-메틸 또는 2'-O-C_1- ₄알킬 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 상기 안정성-증대 변형은 2'-할로 뉴클레오타이드, 예를 들어 2'-F, 2'-Br, 2'-Cl 또는 2'-I를 포함한다. 몇몇 실시태양에서, 상기 안정성-증대 변형은 2'MOE 또는 2'-O-C_1- ₃알킬-O-C_1- ₃알킬을 포함한다. 몇몇 실시태양에서, 상기 안정성-증대 변형은 2'-NH₂ 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 상기 안정성-증대 변형은 2'-H(또는 2'-데옥시) 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 상기 안정성-증대 변형은 2'-아라비노 또는 2'-F-아라비노를 포함한다. 몇몇 실시태양에서, 상기 안정성-증대 변형은 4'-티오리보실 당 부분을 포함한다. 몇몇 실시태양에서, 상기 안정성-증대 변형은 3'-포스포로티오에이트기를 포함한다. 몇몇 실시태양에서, 상기 안정성-증대 변형은 3'-포스포노아세테이트기를 포함한다. 몇몇 실시태양에서, 상기 안정성-증대 변형은 3'-티오포스포노아세테이트기를 함유하는 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 상기 안정성-증대 변형은 3'-메틸포스포네이트기를 함유하는 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 상기 안정성-증대 변형은 3'-보라노포스페이트기를 함유하는 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 상기 안정성-증대 변형은 3'-포스포로다이티오에이트기를 함유하는 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 상기 안정성-증대 변형은 잠금 핵산("LNA") 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 상기 안정성-증대 변형은 열림 핵산("ULNA") 뉴클레오타이드를 포함한다.

몇몇 실시태양에서, 상기 안정성-증대 변형은 동일한 뉴클레오타이드상에 2'-O-메틸 및 3'-포스포로티오에이트기를 포함한다. 몇몇 실시태양에서, 상기 안정성-증대 변형은 동일한 뉴클레오타이드상에 2'-O-메틸 및 3'-포스포노아세테이트기를 포함한다. 몇몇 실시태양에서, 상기 안정성-증대 변형은 동일한 뉴클레오타이드상에 2'-O-메틸 및 3'-티오포스포노아세테이트기를 포함한다. 몇몇 실시태양에서, 상기 안정성-증대 변형은 동일한 뉴클레오타이드상에 2'-플루오로 및 3'-포스포로티오에이트기를 포함한다. 몇몇 실시태양에서, 상기 안정성-증대 변형은 동일한 뉴클레오타이드상에 2'-플루오로 및 3'-포스포노아세테이트기를 포함한다. 몇몇 실시태양에서, 상기 안정성-증대 변형은 동일한 뉴클레오타이드상에 2'-플루오로 및 3'-티오포스포노아세테이트기를 포함한다.

몇몇 실시태양에서, 상기 변형은 특이성-변경 변형이다. 일부 실시태양에서, 특이성 증대는 표적-상 결합 및/또는 절단을 증대시키거나 표적-외 결합 및/또는 절단을 감소시키거나, 이 둘 모두의 병행에 의해 성취될 수 있다. 일부 다른 실시태양에서, 특이성 감소는, 예를 들어 표적-상 결합 및/또는 절단을 감소시키거나 표적-외 결합 및/또는 절단을 증가시키거나, 이 둘 모두의 병행에 의해 성취될 수 있다.

몇몇 실시태양에서, 상기 특이성-변경 변형은 2'-O-메틸을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 2'-할로, 예를 들어 2'-플루오로를 포함한다.

몇몇 실시태양에서, 상기 특이성-변경 변형은 2-티오유라실 염기(2-티오U)를 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 2-티오C를 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 4-티오U를 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 6-티오G를 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 2-아미노A를 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 2-아미노퓨린을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 슈도유라실을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 하이포잔틴을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 7-데아자구아닌을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 7-데아자-8-아자구아닌을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 7-데아자아데닌을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 7-데아자-8-아자아데닌을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 5-메틸C를 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 5-메틸U를 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 5-하이드록시메틸시토신을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 5-하이드록시메틸유라실을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 5,6-데하이드로유라실을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 5-프로피닐시토신을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 5-프로피닐유라실을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 5-에티닐시토신을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 5-에티닐유라실을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 5-알릴U를 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 5-알릴C를 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 5-아미노알릴U를 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 5-아미노알릴C를 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 비염기성 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 Z 염기를 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 P 염기를 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 UNA 염기를 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 아이소C를 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 아이소G를 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 5-메틸-피리미딘을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 x(A,G,C,T)를 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 y(A,G,C,T)를 포함한다.

몇몇 실시태양에서, 상기 특이성-변경 변형은 포스포로티오에이트 뉴클레오타이드간 결합을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 포스포노아세테이트 뉴클레오타이드간 결합을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 티오포스포노아세테이트 뉴클레오타이드간 결합을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 메틸포스포네이트 뉴클레오타이드간 결합을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 보라노포스페이트 뉴클레오타이드간 결합을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 포스포로다이티오에이트 뉴클레오타이드간 결합을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 ULNA를 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 LNA를 포함한다.

몇몇 실시태양에서, 상기 변형은 RNA 염기 짝짓기를, 예를 들어 상기 변형이 없는 가이드 RNA에 비해 상기 가이드 RNA의 융점(Tm)을 변경시킴으로써 변경시킨다. 몇몇 실시태양에서, 상기 변형은 상기 가이드 RNA의 Tm을, 상기 변형이 없는 가이드 RNA에 비해 낮춘다. 몇몇 실시태양에서, 상기 변형은 상기 가이드 RNA의 Tm을, 상기 변형이 없는 가이드 RNA에 비해 상승시킨다.

몇몇 실시태양에서, 상기 특이성-변경 변형은 염기 짝짓기 상호작용의 Tm을 낮춘다. 몇몇 실시태양에서, 상기 염기 짝짓기 상호작용의 Tm을 낮추는 변형은, DNA/DNA 염기쌍이 RNA/DNA 듀플렉스 중의 각각의 대응물보다 더 낮은 Tm을 가짐이 당해 분야에 주지되어 있는 바와 같이, 2'-데옥시이다. 몇몇 실시태양에서, 상기 염기 짝짓기 상호작용의 Tm을 낮추는 변형은 2-티오유라실이며, 상기는 G-U 동요 쌍의 Tm을 약간 낮춘다. 몇몇 실시태양에서, 상기 염기 짝짓기 상호작용의 Tm을 낮추는 변형은, 포스포로티오에이트 뉴클레오타이드간 결합 또는 포스포로다이티오에이트 뉴클레오타이드간 결합이며, 상기는 상기 Tm을 변형당 약 0.5 ℃까지 낮춘다. 몇몇 실시태양에서, 상기 염기 짝짓기 상호작용의 Tm을 낮추는 변형은, 보라노포스포네이트 뉴클레오타이드간 결합이며, 상기는 상기 Tm을 변형당 약 0.5 내지 0.8 ℃까지 낮춘다. 몇몇 실시태양에서, 상기 염기 짝짓기 상호작용의 Tm을 낮추는 변형은, 포스포노아세테이트 뉴클레오타이드간 결합이며, 상기는 상기 Tm을 변형당 약 1.3 ℃까지 낮춘다. 몇몇 실시태양에서, 상기 염기 짝짓기 상호작용의 Tm을 낮추는 변형은, 열림 핵산("ULNA")이며, 상기는 상기 Tm을 변형당 약 5 내지 8 ℃까지 낮춘다. 몇몇 실시태양에서, 상기 염기 짝짓기 상호작용을 낮추는 변형은 2'-O-메틸-3'-메틸포스포네이트이다.

몇몇 실시태양에서, 상기 특이성-변경 변형은 염기 짝짓기 상호작용의 Tm을 상승시킨다. 몇몇 실시태양에서, 상기 염기 짝짓기 상호작용의 Tm을 상승시키는 변형은 2'-O-메틸이며, 상기는 Tm을 변형당 약 0.5 내지 0.7 ℃까지 상승시킨다. 몇몇 실시태양에서, 상기 염기 짝짓기 상호작용의 Tm을 상승시키는 변형은 2'-F이며, 상기는 Tm을 변형당 약 1 ℃까지 상승시킨다. 몇몇 실시태양에서, 상기 염기 짝짓기 상호작용의 Tm을 상승시키는 변형은 2-티오유라실이며, 상기는 A-U 쌍의 Tm을 상승시킨다(그리고, 상기에 나타낸 바와 같이, G-U 동요 쌍의 Tm을 약간 낮춘다). 몇몇 실시태양에서, 상기 염기 짝짓기 상호작용의 Tm을 상승시키는 변형은 4-티오유라실이며, 상기는 G-U 동요 쌍의 Tm을 상승시키고 A-U 쌍의 Tm을 약간 상승시킨다. 몇몇 실시태양에서, 상기 염기 짝짓기 상호작용의 Tm을 상승시키는 변형은 2-아미노-아데닌이며, 상기는 U와의 염기 짝짓기의 Tm을 변형당 약 1 ℃까지 상승시킨다. 몇몇 실시태양에서, 상기 염기 짝짓기 상호작용의 Tm을 상승시키는 변형은 5-메틸-유라실(5-메틸U)이다(예를 들어, 문헌[Wang & Kool (1995) Biochemistry, 34, 4125-32]을 참조하시오). 몇몇 실시태양에서, 상기 염기 짝짓기 상호작용의 Tm을 상승시키는 변형은 5-메틸-시토신(5-메틸C)이다. 몇몇 실시태양에서, 상기 염기 짝짓기 상호작용의 Tm을 상승시키는 변형은 잠금 핵산("LNA")이며, 상기는 Tm을 변형당 2 내지 10 ℃까지 상승시킨다.

몇몇 실시태양에서, 상기 변형은 상기 변형이 없는 가이드 RNA에 비해 상기 가이드 RNA의 형질감염 효율을 변경시킨다. 몇몇 실시태양에서, 상기 변형은 상기 변형이 없는 가이드 RNA에 비해 상기 가이드 RNA의 형질감염 효율을 증가시킨다. 몇몇 실시태양에서, 상기 변형은 상기 변형이 없는 가이드 RNA에 비해 상기 가이드 RNA의 형질감염 효율을 감소시킨다. 몇몇 실시태양에서, 상기 변형은 세포내로의 수동 확산을 허용하도록 포스페이트상의 음이온성 전하를 중화시킨다. 몇몇 실시태양에서, 상기 전하-중화 변형은 포스포노아세테이트 알킬 에스터 뉴클레오타이드간 결합, 예를 들어 포스포노아세테이트 메틸 에스터 뉴클레오타이드간 결합을 포함한다.

몇몇 실시태양에서, 상기 변형은 상기 변형이 없는 가이드 RNA에 비해 상기 가이드 RNA의 면역자극 효과를 변경시킨다. 처음에, 메틸화되지 않은 세균성 DNA 및 그의 합성 유사체는 TLR9에 대한 리간드인 것으로 밝혀졌다(문헌[Hemmi et al. (2000) Nature, 408, 740-5]을 참조하시오). 상기 TLR9의 자극을 예를 들어 C 및 G 잔기를 변형시킴으로써 다이뉴클레오타이드 동기에서 경감시킬 수 있다. 5-메틸시토신, 2-아미노시토신, 2-티오시토신, 5-메틸아이소시토신, P 핵염기(6-(β-D-2'-데옥시리보퓨라노실)-3,4-다이하이드로-8H-피리미도[4,5-c][1,2]옥사진-7-온), 및 2'-O-메틸시토신의 사용은 모두 TLR9 자극의 상실 또는 감소를 생성시킨다. 몇몇 실시태양에서, 6-티오구아닌, 2,6-다이아미노퓨린, 2-아미노퓨린, 잔토신, 이노신, 7-데아자잔토신, 아이소구아닌, 8-옥소구아닌, 네뷸라린, 8-브로모구아닌, K-핵염기(2-아미노-N-메톡시아데노신), 및/또는 2'-O-메틸구아닌의 사용은 TLR9 자극의 상실 또는 감소를 생성시킬 수 있다. 일부 실시태양에서, 포스포다이에스터 변형의 사용은 상기 TLR9 응답을 낮추거나 제거할 수 있다. 전형적으로, 합성적으로 통합된 포스포로티오에이트는, 합성 RNA에서 각 포스포로티오에이트의 2개의 입체이성질체의 존재로부터 생성되는 것으로 생각되는 바와 같이, 상기 TLR9 응답을 제한된 정도로 감소시킬 수 있다. 그러나, CpG 동기가 없는 포스포로티오에이트-변형된 DNA는 TLR9를 다소 적은 정도로 자극하는 것으로 나타났다. 상기 인상의 음전하는 TLR9에 의한 인식에 중요한 요소이며 따라서 알킬포스포네이트를 사용하는 음전하의 제거는 TLR9 자극의 상실 또는 감소를 생성시킬 수 있다. 5' 및 3' 말단 서열 중의 데옥시뉴클레오사이드간의 포스포노아세테이트(PACE) 뉴클레오타이드간 결합의 사용은 상기 TLR9 응답을 현저하게 증가시킬 수 있으나; 5' 및 3' 말단 서열 중의 데옥시뉴클레오사이드간의 티오포스포노아세테이트(티오PACE) 뉴클레오타이드간 결합의 사용은 TLR9 자극의 상실 또는 감소를 생성시킬 수 있다. 몇몇 실시태양에서, C3'-엔도 형태에 유리한 당 변형, 예를 들어 2'-O-메틸 변형의 사용은 5' 및 3' 말단에 통합되어 상기 TLR9 응답을 감소시킬 수 있다. TLR7 및 TLR8을, 7-데아자구아닌을 함유하는 분자에 의해서 및 단일-가닥 RNA에 의해서 자극할 수 있다(예를 들어, 문헌[Heil et al. (2004) Science, 303, 1526-9]을 참조하시오). TLR3은 바이러스-유래된 이중-가닥 RNA에 대한 세포 면역응답에 관련되었다. 몇몇 실시태양에서, 상기 TLR 응답을, 예를 들어 2'-O-메틸 변형, 황을 함유하는 변형된 포스포다이에스터 결합, 또는 뉴클레오타이드간 음전하를 감소시키는 변형, 예를 들어 메틸포스포네이트 및/또는 포스포노아세테이트 뉴클레오타이드간 결합을 사용함으로써 경감시킬 수 있다.

몇몇 실시태양에서, 상기 변형은 상기 변형이 없는 가이드 RNA에 비해 상기 가이드 RNA의 안정성 및 특이성을 증대시킨다. 몇몇 실시태양에서, 상기 변형은 상기 변형이 없는 가이드 RNA에 비해 상기 가이드 RNA의 안정성 및 형질감염 효율을 증대시킨다. 몇몇 실시태양에서, 상기 변형은 상기 변형이 없는 가이드 RNA에 비해 상기 가이드 RNA의 특이성 및 형질감염 효율을 증대시킨다. 몇몇 실시태양에서, 상기 변형은 상기 변형이 없는 가이드 RNA에 비해 상기 가이드 RNA의 전체적인 효능을 증대시킨다.

C. 변형들의 조합을 갖는 가이드 RNA

하나의 태양에서, 본 발명의 기술은 2개 이상의 변형의 조합을 갖는 가이드 RNA를 제공한다.

몇몇 실시태양에서, 상기 2개의 변형은 동일한 뉴클레오타이드상에 있다(예를 들어, 하나의 뉴클레오타이드는 2'-O-메틸 및 3'-티오포스포노아세테이트 부분을 포함한다). 다른 실시태양에서, 상기 2개의 변형은 2개의 상이한 뉴클레오타이드상에 있다(예를 들어, 하나의 뉴클레오타이드는 2-티오U 염기를 갖고 또 다른 뉴클레오타이드는 2'-O-메틸기를 갖는다).

몇몇 실시태양에서, 상기 가이드 RNA 중의 각각의 변형은 동일하다. 몇몇 실시태양에서, 상기 가이드 RNA 중의 적어도 하나의 변형은 상기 가이드 RNA 중의 적어도 하나의 다른 변형과 상이하다. 몇몇 실시태양에서, 상기 가이드 RNA내의 단일 뉴클레오타이드는 2개 이상의 변형을 갖는다.

몇몇 실시태양에서, 상기 가이드 RNA는 상이한 유형의 변형들의 조합을 포함하며, 상기 조합 중 적어도 하나의 유형은 상기 가이드 RNA 중의 다수의 장소에 존재한다. 몇몇 실시태양에서, 상기 조합 중 적어도 하나의 유형은 상기 가이드 RNA에서 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20회 존재한다.

몇몇 실시태양에서, 상기 조합 중 변형들의 적어도 하나의 유형이 2개 이상의 변형된 뉴클레오타이드 중에 존재한다. 몇몇 실시태양에서, 상기 조합 중 변형들의 적어도 하나의 유형이 3개 이상의 변형된 뉴클레오타이드 중에 존재한다. 몇몇 실시태양에서, 상기 변형된 뉴클레오타이드는, 하나 이상의 변형되지 않은 뉴클레오타이드들이 개입할 수 있기 때문에, 상기 서열 중에 연속적으로 배열되지 않거나, 적어도 전적으로 배열되지는 않는다. 몇몇 실시태양에서, 상기 변형된 뉴클레오타이드는 연속적으로 배열된다. 몇몇 실시태양에서, 상기 가이드 RNA는 동일한 유형의 연속적인 변형된 뉴클레오타이드의 신장부를 포함한다. 몇몇 실시태양에서, 상기 신장부는 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 1 1, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 또는 40개의 변형된 뉴클레오타이드를 갖는다.

몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나의 유형은 상기 가이드 RNA의 5' 부분내에 있다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나의 유형은 상기 가이드 RNA의 5' 부분의 처음 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나의 유형은 상기 가이드 RNA의 5' 부분의 처음 3개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나의 유형은 상기 가이드 RNA의 3' 부분내에 있다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나의 유형은 상기 가이드 RNA의 3' 부분의 처음 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나의 유형은 상기 가이드 RNA의 3' 부분의 처음 3개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나의 유형은 상기 가이드 RNA의 내부 영역내에(즉 5' 단부와 3' 단부 사이에) 있다.

몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나의 유형은, 예를 들어 뉴클레아제에 의한 분해로부터 상기 RNA를 보호하기 위해서 또는 다른 목적을 위해서 상기 가이드 RNA의 5' 부분 또는 3' 부분에, 특히 상기 5' 부분의 처음 5 또는 10개 뉴클레오타이드내에 또는 상기 3' 부분의 마지막 5 또는 10개 뉴클레오타이드내에 통합된다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나의 유형은 상기 5' 부분에 있고 상기 조합 중 변형의 적어도 하나의 유형은, 예를 들어 뉴클레아제에 의한 분해로부터 상기 RNA를 보호하기 위해서 또는 다른 목적을 위해서 상기 가이드 RNA의 3' 부분에, 특히 상기 5' 부분의 처음 5 또는 10개 뉴클레오타이드내에 및 상기 3' 부분의 마지막 5 또는 10개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 가이드 RNA는 상기 가이드 RNA의 5' 부분 중의 20개 이하, 한편으로 15개 이하, 한편으로 15개 이하, 한편으로 10개 이하, 한편으로 5개 이하, 한편으로 3개 이하의 데옥시리보뉴클레오타이드 잔기를 포함한다.

몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나의 유형은 상기 가이드 RNA의 crRNA 분절내에 있다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나의 유형은 상기 crRNA의 가이드 서열내에 있다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나의 유형은 상기 crRNA 분절의 처음 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나의 유형은 상기 crRNA 분절의 처음 3개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나의 유형은 상기 가이드 RNA의 tracrRNA 분절내에 있다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나의 유형은 상기 가이드 RNA의 tracrRNA 분절의 마지막 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나의 유형은 상기 가이드 RNA의 tracrRNA의 마지막 3개 뉴클레오타이드내에 있다.

몇몇 실시태양에서, 상기 조합 중 변형의 제1 유형은 상기 가이드 RNA의 5' 부분내에 있고 상기 조합 중 변형의 제2 유형은 상기 가이드 RNA의 내부 영역내에(즉 5' 단부와 3' 단부 사이에) 있다. 몇몇 실시태양에서, 상기 변형의 제1 유형은 상기 가이드 RNA의 5' 부분의 처음 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형의 제1 유형은 상기 가이드 RNA의 5' 부분의 처음 3개 뉴클레오타이드내에 있다.

몇몇 실시태양에서, 상기 조합 중 변형의 제1 유형은 상기 가이드 RNA의 내부 영역내에(즉 5' 단부와 3' 단부 사이에) 있고 상기 조합 중 변형의 제2 유형은 상기 가이드 RNA의 3' 부분내에 있다. 몇몇 실시태양에서, 상기 변형의 제2 유형은 상기 가이드 RNA의 3' 부분의 마지막 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형의 제2 유형은 상기 가이드 RNA의 3' 부분의 마지막 3개 뉴클레오타이드내에 있다.

몇몇 실시태양에서, 상기 조합 중 변형의 제1 유형은 상기 가이드 RNA의 5' 부분내에 있고 상기 조합 중 변형의 제2 유형은 상기 가이드 RNA의 3' 부분내에 있다. 몇몇 실시태양에서, 상기 변형의 제1 유형은 상기 가이드 RNA의 5' 부분의 처음 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형의 제1 유형은 상기 가이드 RNA의 5' 부분의 처음 3개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형의 제2 유형은 상기 가이드 RNA의 3' 부분의 마지막 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형의 제2 유형은 상기 가이드 RNA의 3' 부분의 마지막 3개 뉴클레오타이드내에 있다.

몇몇 실시태양에서, 상기 조합 중 변형의 제1 유형은 상기 가이드 RNA의 5' 부분내에 있고, 상기 조합 중 변형의 제2 유형은 상기 가이드 RNA의 내부 영역내에(즉 5' 단부와 3' 단부 사이에) 있고, 상기 조합 중 변형의 제3 유형은 상기 가이드 RNA의 3' 부분내에 있다. 몇몇 실시태양에서, 상기 변형의 제1 유형은 상기 가이드 RNA의 5' 부분의 처음 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형의 제1 유형은 상기 가이드 RNA의 5' 부분의 처음 3개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형의 제3 유형은 상기 가이드 RNA의 3' 부분의 마지막 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형의 제3 유형은 상기 가이드 RNA의 3' 부분의 마지막 3개 뉴클레오타이드내에 있다.

몇몇 실시태양에서, 상기 조합 중 변형의 제1 유형은 상기 가이드 RNA의 crRNA 분절내에 있고 상기 조합 중 변형의 제2 유형은 상기 tracr 분절내에 있다. 몇몇 실시태양에서, 상기 변형의 제1 유형은 상기 crRNA의 가이드 서열내에 있다. 몇몇 실시태양에서, 상기 변형의 제1 유형은 상기 crRNA 분절의 처음 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형의 제1 유형은 상기 crRNA 분절의 처음 3개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형의 제2 유형은 상기 가이드 RNA의 tracrRNA 분절의 마지막 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형의 제2 유형은 상기 가이드 RNA의 tracrRNA 분절의 마지막 3개 뉴클레오타이드내에 있다.

몇몇 실시태양에서, 상기 조합 중 변형의 제1 유형 및 제2 유형은 상기 가이드 RNA의 crRNA 분절내에 있다. 몇몇 실시태양에서, 상기 변형의 제1 유형은 상기 crRNA의 가이드 서열내에 있다. 몇몇 실시태양에서, 상기 변형의 제1 유형은 상기 crRNA 분절의 처음 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형의 제1 유형은 상기 crRNA 분절의 처음 3개 뉴클레오타이드내에 있다.

몇몇 실시태양에서, 상기 조합 중 변형의 제1 유형 및 제2 유형은 상기 가이드 RNA의 crRNA 분절내에 있고 상기 조합 중 변형의 제3 유형은 상기 tracr 분절내에 있다. 몇몇 실시태양에서, 상기 변형의 제1 유형은 상기 crRNA의 가이드 서열내에 있다. 몇몇 실시태양에서, 상기 변형의 제1 유형은 상기 crRNA 분절의 처음 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형의 제1 유형은 상기 crRNA 분절의 처음 3개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형의 제3 유형은 상기 가이드 RNA의 tracrRNA 분절의 마지막 5개 뉴클레오타이드 내에 있다. 몇몇 실시태양에서, 상기 변형의 제3 유형은 상기 가이드 RNA의 tracrRNA 분절의 마지막 3개 뉴클레오타이드내에 있다.

몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 단부 변형, 예를 들어 상술한 바와 같은 5' 단부 변형 또는 3' 단부 변형을 포함한다. 몇몇 실시태양에서, 상기 단부 변형은 다이메톡시트리틸을 포함한다.

몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 변형된 염기를 포함한다. 몇몇 실시태양에서, 상기 변형된 gRNA는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 또는 40개의 변형된 염기를 포함한다. 다른 실시태양에서, 상기 변형된 gRNA는 적어도 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130 또는 140개의 변형된 염기를 포함한다. 몇몇 실시태양에서, gRNA 중의 모든 염기가 변형된다.

몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 변형된 당을 포함한다. 몇몇 실시태양에서, 상기 변형된 gRNA는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 또는 40개의 변형된 당을 포함한다. 다른 실시태양에서, 상기 변형된 gRNA는 적어도 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130 또는 140개의 변형된 당을 포함한다. 몇몇 실시태양에서, gRNA 중의 모든 당이 변형된다.

몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 변형된 주쇄(즉 천연 포스포다이에스터 이외의 뉴클레오타이드간 결합)를 포함한다. 몇몇 실시태양에서, 상기 변형된 gRNA는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 또는 40개의 변형된 뉴클레오타이드간 결합을 포함한다. 다른 실시태양에서, 상기 변형된 gRNA는 적어도 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130 또는 140개의 변형된 뉴클레오타이드간 결합을 포함한다. 몇몇 실시태양에서, gRNA 중의 모든 뉴클레오타이드간 결합이 변형된다.

몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 2'-O-메틸, 2'-플루오로, 2'-아미노, 2'-데옥시, 2'-아라비노, 2'-F-아라비노, 2-티오유라실, 2-아미노아데닌, 5-메틸시토신, 5-아미노알릴유라실, Z 염기, 3'-포스포로티오에이트, 3'-포스포노아세테이트, 3'-포스포노아세테이트 에스터, 3'-티오포스포노아세테이트, 3'-티오포스포노아세테이트 에스터, 3'-메틸포스포네이트, 3'-보라노포스포네이트, 3'-포스포로다이티오에이트, 또는 이들의 조합을 포함한다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 2'-O-메틸, 2'-데옥시, Z 염기, 포스포로티오에이트 뉴클레오타이드간 결합, 포스포노아세테이트 뉴클레오타이드간 결합, 티오포스포노아세테이트 뉴클레오타이드간 결합, 또는 이들의 조합을 포함한다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 2'-F, 2-티오U, 4-티오U, 2-아미노A, 5-메틸C, 5-메틸U, 5-아미노알릴U, 또는 이들의 조합을 포함한다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 "단부" 변형, 예를 들어 말단 포스페이트, PEG, 말단 아민, 말단 링커, 예를 들어 탄화수소 링커, 치환된 탄화수소 링커, 스쿠아레이트 링커, 트라이아졸로 링커, 내부 링커, 예를 들어 2-(4-부틸아미도플루오레세인)프로판-1,3-다이올 비스(포스포다이에스터) 링커, 염료에 접합된 링커, 비-형광 표지에 접합된 링커, 태그에 접합된 링커 또는 고체 지지체, 예를 들어 비드 또는 미세배열에 접합된 링커이다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 2개는 2'-O-메틸 뉴클레오타이드 및 포스포로티오에이트 뉴클레오타이드간 결합, 2'-O-메틸 뉴클레오타이드 및 포스포노아세테이트 뉴클레오타이드간 결합, 또는 2'-O-메틸 뉴클레오타이드 및 티오포스포노아세테이트 뉴클레오타이드간 결합을 포함한다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 2개는 2'-O-메틸 뉴클레오타이드 및 포스포노카복실레이트 뉴클레오타이드간 결합, 2'-O-메틸 뉴클레오타이드 및 포스포노카복실레이트 에스터 뉴클레오타이드간 결합, 2'-O-메틸 뉴클레오타이드 및 티오포스포노카복실레이트 뉴클레오타이드간 결합, 2'-O-메틸 뉴클레오타이드 및 티오포스포노카복실레이트 에스터 뉴클레오타이드간 결합, 또는 이들의 조합을 포함한다. 다른 실시태양에서, 상기 조합 중 변형은 2-티오유라실, 2-티오시토신, 4-티오유라실, 6-티오구아닌, 2-아미노아데닌, 2-아미노퓨린, 슈도유라실, 이노신, 7-데아자구아닌, 7-데아자-8-아자구아닌, 7-데아자아데닌, 7-데아자-8-아자아데닌, 5-메틸시토신, 5-메틸유라실, 5-하이드록시메틸시토신, 5-하이드록시메틸유라실, 5,6-데하이드로유라실, 5-프로피닐시토신, 5-프로피닐유라실, 5-에티닐시토신, 5-에티닐유라실, 5-알릴유라실, 5-알릴시토신, 5-아미노알릴-유라실, 5-아미노알릴-시토신, 또는 비염기성 뉴클레오타이드를 추가로 포함한다.

몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 2'-O-메틸-3'-포스포로티오에이트를 포함한다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 2'-O-메틸-3'-포스포노아세테이트를 포함한다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 2'-O-메틸-3'-티오포스포노아세테이트를 포함한다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 2'-할로-3'-포스포로티오에이트를 포함한다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 2'-할로-3'-포스포노아세테이트를 포함한다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 2'-할로-3'-티오포스포노아세테이트를 포함한다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 2'-플루오로-3'-포스포로티오에이트를 포함한다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 2'-플루오로-3'-포스포노아세테이트를 포함한다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 2'-플루오로-3'-티오포스포노아세테이트를 포함한다. 적어도 2개 또는 3개의 변형의 가능한 조합들을 각각 도 6 및 도 7에 나타내며, 이들은 본 명세서에 참고로 인용된다.

몇몇 실시태양에서, 상기 가이드 RNA는 하기 화학식 III 또는 화학식 IV에 의해 나타내는 올리고뉴클레오타이드를 포함한다:

[화학식 III]

W-Y-Q

[화학식 IV]

Y-W-X-Q

상기 식에서,

Q 및 W는 각각 독립적으로 적어도 하나의 변형을 포함하는 올리고뉴클레오타이드의 뉴클레오타이드 또는 뉴클레오타이드들의 신장부를 나타내고;

Y 및 X는 각각 독립적으로 상기 올리고뉴클레오타이드의 변형되지 않은 부분을 나타낸다.

몇몇 실시태양에서, W는 상기 가이드 RNA의 5' 부분내에 있다. 몇몇 실시태양에서, W는 적어도 부분적으로 상기 가이드 RNA의 5' 부분의 처음 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, W는 적어도 부분적으로 상기 가이드 RNA의 5' 부분의 처음 3개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, W는 상기 가이드 RNA의 내부 영역내에(즉 5' 단부와 3' 단부 사이에) 있다.

몇몇 실시태양에서, Q는 상기 가이드 RNA의 3' 부분내에 있다. 몇몇 실시태양에서, Q는 적어도 부분적으로 상기 가이드 RNA의 3' 부분의 마지막 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, Q는 적어도 부분적으로 상기 가이드 RNA의 3' 부분의 마지막 3개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, Q는 상기 가이드 RNA의 내부 영역내에(즉 5' 단부와 3' 단부 사이에) 있다.

몇몇 실시태양에서, W는 상술한 바와 같은 단부 변형, 예를 들어 5' 단부 또는 3' 단부 변형을 포함한다. 몇몇 실시태양에서, 상기 단부 변형은 다이메톡시트리틸을 포함한다.

몇몇 실시태양에서, W 및 Q 중 적어도 하나는 상술한 바와 같은 변형된 염기를 포함한다. 몇몇 실시태양에서, W 및 Q 중 적어도 하나는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 또는 50개의 변형된 염기를 포함한다. 몇몇 실시태양에서, W 및 Q 중 적어도 하나는 하나 초과의 변형된 염기, 예를 들어 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개의 변형된 염기를 포함한다.

몇몇 실시태양에서, W 및 Q 중 적어도 하나는 상술한 바와 같은 변형된 당을 포함한다. 몇몇 실시태양에서, W 및 Q 중 적어도 하나는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 또는 50개의 변형된 당을 포함한다. 몇몇 실시태양에서, W 및 Q 중 적어도 하나는 하나 초과, 예를 들어 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개의 변형된 당을 포함한다.

몇몇 실시태양에서, W 및 Q 중 적어도 하나는 상술한 바와 같은 변형된 주쇄(즉 포스포다이에스터 외에 뉴클레오타이드간 결합)을 포함한다. 몇몇 실시태양에서, W 및 Q 중 적어도 하나는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 또는 50개의 변형된 뉴클레오타이드간 결합을 포함한다. 몇몇 실시태양에서, W 및 Q 중 적어도 하나는 하나 초과, 예를 들어 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개의 변형된 뉴클레오타이드간 결합을 포함한다.

몇몇 실시태양에서, W 및 Q 중 적어도 하나는 2'-O-메틸 뉴클레오타이드, 2'-F 뉴클레오타이드, 2'-아미노 뉴클레오타이드, 2'-데옥시 뉴클레오타이드, 2-티오유리딘 뉴클레오타이드, 2-아미노아데노신 뉴클레오타이드, 6-티오구아노신 뉴클레오타이드, 5-메틸시티딘 뉴클레오타이드, 5-아미노알릴유리딘 뉴클레오타이드, Z 뉴클레오타이드, 3'-포스포로티오에이트 뉴클레오타이드간 결합, 3'-포스포로티오에이트 뉴클레오타이드간 결합, 3'-포스포노아세테이트 뉴클레오타이드간 결합, 5'-포스포노아세테이트 에스터 뉴클레오타이드간 결합, 3'-티오포스포노아세테이트 뉴클레오타이드간 결합, 3'-티오포스포노아세테이트 에스터 뉴클레오타이드간 결합, 3'-메틸포스포네이트 뉴클레오타이드간 결합, 3'-보라노포스포네이트 뉴클레오타이드간 결합, 3'-포스포로다이티오에이트 뉴클레오타이드간 결합, 또는 이들의 조합을 포함한다.

몇몇 실시태양에서, W 및 Q 중 적어도 하나는 동일한 뉴클레오타이드상에 2'-O-메틸 및 3'-포스포로티오에이트기를 포함한다. 몇몇 실시태양에서, W 및 Q 중 적어도 하나는 동일한 뉴클레오타이드상에 2'-O-메틸 및 3'-포스포노아세테이트기 결합을 포함한다. 몇몇 실시태양에서, W 및 Q 중 적어도 하나는 동일한 뉴클레오타이드상에 2'-O-메틸 및 3'-티오포스포노아세테이트기를 포함한다. 몇몇 실시태양에서, W 및 Q 중 적어도 하나는 동일한 뉴클레오타이드상에 2'-F 및 3'-포스포로티오에이트기를 포함한다. 몇몇 실시태양에서, W 및 Q 중 적어도 하나는 동일한 뉴클레오타이드상에 2'-F 및 3'-포스포노아세테이트기 결합 포함한다. 몇몇 실시태양에서, W 및 Q 중 적어도 하나는 동일한 뉴클레오타이드상에 2'-F 및 3'-티오포스포노아세테이트기를 포함한다.

몇몇 실시태양에서, W 및 Q 중 적어도 하나는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개의 변형된 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, W 및 Q 중 적어도 하나내의 각각의 변형된 뉴클레오타이드는 동일한 변형 또는 변형들을 포함한다. 몇몇 실시태양에서, W는 Q 중의 변형된 뉴클레오타이드와 상이한 변형된 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, W 및 Q 중 적어도 하나는 2개 이상의 변형된 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, W 및 Q 중 적어도 하나는 3개 이상의 변형된 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 상기 변형된 뉴클레오타이드는, 하나 이상의 변형되지 않은 뉴클레오타이드들이 개입할 수 있기 때문에, 상기 서열 중에 연속적으로 배열되지 않거나, 적어도 전적으로 배열되지는 않는다. 몇몇 실시태양에서, 상기 변형된 뉴클레오타이드는 연속적으로 배열된다. 몇몇 실시태양에서, W 및 Q 중 적어도 하나는 변형된 뉴클레오타이드의 적어도 하나의 연속적인 신장부를 포함한다. 몇몇 실시태양에서, W 및 Q 중 적어도 하나는 적어도 3개의 변형된 뉴클레오타이드의 연속적인 신장부를 포함한다. 몇몇 실시태양에서, W 및 Q 중 적어도 하나는 적어도 4개의 변형된 뉴클레오타이드의 연속적인 신장부를 포함한다. 몇몇 실시태양에서, W 및 Q 중 적어도 하나는 적어도 5개의 변형된 뉴클레오타이드의 연속적인 신장부를 포함한다.

몇몇 실시태양에서, 상기 가이드 RNA는 하기 화학식 V 또는 화학식 VI의 뉴클레오타이드 서열을 포함한다:

[화학식 V]

M_mN_nM'_m'N'_n _'

[화학식 VI]

M_mN_nM'_m'N'_n'M"_m _"

상기 식에서,

각각의 M은 독립적으로 변형된 리보뉴클레오타이드를 나타내고;

각각의 M'은 독립적으로 변형된 리보뉴클레오타이드를 나타내고;

각각의 N'은 독립적으로 변형되지 않은 리보뉴클레오타이드를 나타내고;

각각의 M"은 독립적으로 변형된 리보뉴클레오타이드를 나타내고;

m은 0 내지 40의 정수이고, n은 0 내지 130의 정수이고, m'은 0 내지 10의 정수이고, n'은 0 내지 130의 정수이고, m"은 0 내지 10의 정수이나, 단 m+m'+m"는 1 이상이고 50<m+n+m'+n'+m"≤150이다.

몇몇 실시태양에서, 각각의 M은 2'-O-메틸 리보뉴클레오타이드, 2'-O-메틸-3'-P(S) 리보뉴클레오타이드, 2'-O-메틸-3'-PACE 리보뉴클레오타이드, 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드, 및 2'-데옥시뉴클레오타이드로 이루어진 군 중에서 독립적으로 선택된다. 몇몇 실시태양에서, 각각의 M은 2'-O-메틸 리보뉴클레오타이드, 2'-O-메틸-3'-P(S) 리보뉴클레오타이드, 2'-O-메틸-3'-PACE 리보뉴클레오타이드, 및 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드로 이루어진 군 중에서 독립적으로 선택된다. 몇몇 실시태양에서, 각각의 M은 2'-O-메틸-3'-PACE 리보뉴클레오타이드 및 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드로 이루어진 군 중에서 독립적으로 선택된다. 몇몇 실시태양에서, m>1일 때, 임의의 주어진 M은 임의의 다른 M과 동일하거나 상이하다. 몇몇 실시태양에서, m>1일 때, 각각의 M은 동일한 변형 또는 변형들을 포함한다.

몇몇 실시태양에서, 각각의 M'은 2'-O-메틸 리보뉴클레오타이드, 2'-O-메틸-3'-P(S) 리보뉴클레오타이드, 2'-O-메틸-3'-PACE 리보뉴클레오타이드, 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드, 및 2'-데옥시뉴클레오타이드로 이루어진 군 중에서 독립적으로 선택된다. 몇몇 실시태양에서, 각각의 M'은 2'-O-메틸 리보뉴클레오타이드, 2'-O-메틸-3'-P(S) 리보뉴클레오타이드, 2'-O-메틸-3'-PACE 리보뉴클레오타이드, 및 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드로 이루어진 군 중에서 독립적으로 선택된다. 몇몇 실시태양에서, 각각의 M'은 2'-O-메틸-3'-PACE 리보뉴클레오타이드 및 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드로 이루어진 군 중에서 독립적으로 선택된다. 몇몇 실시태양에서, m'>1일 때, 임의의 주어진 M'은 임의의 다른 M'과 동일하거나 상이하다. 몇몇 실시태양에서, m'>1일 때, 각각의 M'은 동일한 변형 또는 변형들을 포함한다.

몇몇 실시태양에서, 각각의 M"은 2'-O-메틸 리보뉴클레오타이드, 2'-O-메틸-3'-P(S) 리보뉴클레오타이드, 2'-O-메틸-3'-PACE 리보뉴클레오타이드, 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드, 및 2'-데옥시뉴클레오타이드로 이루어진 군 중에서 독립적으로 선택된다. 몇몇 실시태양에서, 각각의 M"은 2'-O-메틸 리보뉴클레오타이드, 2'-O-메틸-3'-P(S) 리보뉴클레오타이드, 2'-O-메틸-3'-PACE 리보뉴클레오타이드, 및 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드로 이루어진 군 중에서 독립적으로 선택된다. 몇몇 실시태양에서, 각각의 M"은 2'-O-메틸-3'-PACE 리보뉴클레오타이드 및 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드로 이루어진 군 중에서 독립적으로 선택된다. 몇몇 실시태양에서, m">1일 때, 임의의 주어진 M"은 임의의 다른 M"과 동일하거나 상이하다. 몇몇 실시태양에서, m'>1일 때, 각각의 M"은 동일한 변형 또는 변형들을 포함한다.

몇몇 실시태양에서, 각각의 M은 2'-O-메틸-3'-PACE 리보뉴클레오타이드이고; m은 1 내지 10의 정수 중에서 선택되고; 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고; n은 10 내지 130의 정수 중에서 선택되고; 각각의 M'은 2'-O-메틸 리보뉴클레오타이드, 2'-O-메틸-3'-P(S) 리보뉴클레오타이드, 2'-O-메틸-3'-PACE 리보뉴클레오타이드, 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드, 2'-데옥시뉴클레오타이드 및 Z 뉴클레오타이드로 이루어진 군 중에서 독립적으로 선택되고; m'은 1 내지 10의 정수 중에서 선택되고; 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고; n'은 0 내지 130의 정수 중에서 선택된다. 몇몇 실시태양에서, 각각의 M'은 2'-O-메틸-3'-PACE 리보뉴클레오타이드이다. 몇몇 실시태양에서, 각각의 M'은 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드이다. 몇몇 실시태양에서, 각각의 M'은 2'-O-메틸 리보뉴클레오타이드이다. 몇몇 실시태양에서, 각각의 M'은 2'-O-메틸-3'-P(S) 리보뉴클레오타이드이다. 몇몇 실시태양에서, 각각의 M'은 Z 뉴클레오타이드이다.

몇몇 실시태양에서, 각각의 M은 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드이고; m은 1 내지 10의 정수 중에서 선택되고; 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고; n은 10 내지 130의 정수 중에서 선택되고; 각각의 M'은 2'-O-메틸 리보뉴클레오타이드, 2'-O-메틸-3'-P(S) 리보뉴클레오타이드, 2'-O-메틸-3'-PACE 리보뉴클레오타이드, 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드, 2'-데옥시뉴클레오타이드 및 Z 뉴클레오타이드로 이루어진 군 중에서 독립적으로 선택되고; m'은 1 내지 10의 정수 중에서 선택되고; 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고; n'은 0 내지 130의 정수 중에서 선택된다. 몇몇 실시태양에서, 각각의 M'은 2'-O-메틸-3'-PACE 리보뉴클레오타이드이다. 몇몇 실시태양에서, 각각의 M'은 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드이다. 몇몇 실시태양에서, 각각의 M'은 2'-O-메틸 리보뉴클레오타이드이다. 몇몇 실시태양에서, 각각의 M'은 2'-O-메틸-3'-P(S) 리보뉴클레오타이드이다. 몇몇 실시태양에서, 각각의 M'은 Z 뉴클레오타이드이다.

몇몇 실시태양에서, 각각의 M은 2'-O-메틸-3'-P(S) 리보뉴클레오타이드이고; m은 1 내지 10의 정수 중에서 선택되고; 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고; n은 10 내지 130의 정수 중에서 선택되고; 각각의 M'은 2'-O-메틸 리보뉴클레오타이드, 2'-O-메틸-3'-P(S) 리보뉴클레오타이드, 2'-O-메틸-3'-PACE 리보뉴클레오타이드, 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드, 2'-데옥시뉴클레오타이드 및 Z 뉴클레오타이드로 이루어진 군 중에서 독립적으로 선택되고; m'은 1 내지 10의 정수 중에서 선택되고; 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고; n'은 0 내지 130의 정수 중에서 선택된다. 몇몇 실시태양에서, 각각의 M'은 2'-O-메틸-3'-PACE 리보뉴클레오타이드이다. 몇몇 실시태양에서, 각각의 M'은 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드이다. 몇몇 실시태양에서, 각각의 M'은 2'-O-메틸 리보뉴클레오타이드이다. 몇몇 실시태양에서, 각각의 M'은 2'-O-메틸-3'-P(S) 리보뉴클레오타이드이다. 몇몇 실시태양에서, 각각의 M'은 Z 뉴클레오타이드이다.

몇몇 실시태양에서, 각각의 M은 2'-O-메틸 리보뉴클레오타이드, 2'-O-메틸-3'-P(S) 리보뉴클레오타이드, 2'-O-메틸-3'-PACE 리보뉴클레오타이드, 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드, 2'-데옥시뉴클레오타이드 및 Z 뉴클레오타이드로 이루어진 군 중에서 독립적으로 선택되고; m은 0 내지 10의 정수 중에서 선택되고; 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고; n은 10 내지 15의 정수 중에서 선택되고; 각각의 M'은 2'-O-메틸 리보뉴클레오타이드이고; m'은 1 내지 5의 정수 중에서 선택되고; 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고; n'은 0 내지 130의 정수 중에서 선택된다. 몇몇 실시태양에서, 각각의 M은 2'-O-메틸-3'-PACE 리보뉴클레오타이드이다. 몇몇 실시태양에서, 각각의 M은 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드이다. 몇몇 실시태양에서, 각각의 M은 2'-O-메틸 리보뉴클레오타이드이다. 몇몇 실시태양에서, 각각의 M은 2'-O-메틸-3'-P(S) 리보뉴클레오타이드이다. 몇몇 실시태양에서, m은 0이고; n은 10 내지 15의 정수 중에서 선택되고, m'은 1 내지 5의 정수 중에서 선택되고; n'은 0 내지 130 중에서 선택된다.

몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 안정성-변경 변형이다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 상기 변형이 없는 가이드 RNA에 비해 상기 가이드 RNA의 뉴클레아제 내성을 증가시키며, 따라서 상기 가이드 RNA의 안정성을 증대시킨다.

몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 상술한 바와 같은 안정성-증대 변형이다.

몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 상술한 바와 같은 특이성-변경 변형이다.

몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 RNA 염기 짝짓기를 변경시킨다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 상술한 바와 같은 염기 짝짓기 상호작용의 Tm을 낮춘다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 상술한 바와 같은 염기 짝짓기 상호작용의 Tm을 상승시킨다.

몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 상기 변형이 없는 가이드 RNA에 비해 상기 가이드 RNA의 형질감염 효율을 변경시킨다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 상기 변형이 없는 가이드 RNA에 비해 상기 가이드 RNA의 형질감염 효율을 증가시킨다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 상기 변형이 없는 가이드 RNA에 비해 상기 가이드 RNA의 형질감염 효율을 감소시킨다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 포스포노아세테이트 알킬 에스터 뉴클레오타이드간 결합, 예를 들어 포스포노아세테이트 메틸 에스터 뉴클레오타이드간 결합을 포함한다.

몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 상기 변형이 없는 가이드 RNA에 비해 상기 가이드 RNA의 안정성 및 특이성을 증대시킨다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 상기 변형이 없는 가이드 RNA에 비해 상기 가이드 RNA의 안정성 및 형질감염 효율을 증대시킨다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 상기 변형이 없는 가이드 RNA에 비해 상기 가이드 RNA의 특이성 및 형질감염 효율을 증대시킨다.

몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 상기 가이드 RNA의 2차 구조를 변경시킨다. 상기 변형은 상기 가이드 RNA 중의 RNA/RNA 내부 듀플렉스 중 어느 하나의 염기-짝짓기를 변경시킨다. 이들 변경 중 일부는 상기 RNA/RNA 구조의 염기 짝짓기를 증가시키거나 한편으로 상기 RNA/RNA 듀플렉스의 Tm을 증가시키는 반면, 다른 변형들은 상기 RNA/RNA 듀플렉스 또는 듀플렉스들의 염기 짝짓기(또는 Tm)를 감소시킨다. 상기와 같은 변형은 염기 변형된 뉴클레오타이드, 특히 UNA 뉴클레오타이드, 예를 들어 2-티오유리딘 및 2-아미노아데노신 쌍, Z/P 뉴클레오타이드 쌍, 아이소C/아이소G 쌍, 6-티오G/5-메틸피리미딘 쌍, 및 이전에 논의된 바와 같은 당 또는 뉴클레오타이드간 결합상에 변형을 갖는 뉴클레오타이드를 포함한다.

몇몇 실시태양에서, 상기 조합은 적어도 하나의 변형에 의해 뉴클레아제 내성(즉 안정성)을 증가시키는 적어도 하나의 변형 또는 변형들의 세트 또는 특이성을 증가시키는(즉 표적-외 효과를 감소시키는) 변형들의 세트를 포함한다. 몇몇 실시태양에서, 상기 조합은 적어도 하나의 변형에 의해 뉴클레아제 내성(즉 안정성)을 증가시키는 적어도 하나의 변형 또는 변형들의 세트 또는 상기 가이드 RNA 중의 일부 염기 짝짓기의 Tm을 상승시키는 변형들의 세트를 포함한다. 몇몇 실시태양에서, 상기 조합은 적어도 하나의 변형에 의해 뉴클레아제 내성(즉 안정성)을 증가시키는 적어도 하나의 변형 또는 변형들의 세트 또는 상기 가이드 RNA의 일부 염기 짝짓기의 Tm을 낮추는 변형들의 세트를 포함한다. 몇몇 실시태양에서, 상기 조합은 적어도 하나의 변형에 의해 뉴클레아제 내성(즉 안정성)을 증가시키는 적어도 하나의 변형 또는 변형들의 세트, 상기 가이드 RNA 중의 일부 염기 짝짓기의 Tm을 증가시키는 적어도 하나의 변형 또는 변형들의 세트, 및 상기 가이드 RNA 중의 어딘가의 일부 염기 짝짓기의 Tm을 감소시키는 적어도 하나의 변형 또는 변형들의 세트를 포함한다. 몇몇 실시태양에서, 상기 조합은 뉴클레아제 내성(즉 안정성)을 증가시키는 적어도 하나의 변형 또는 변형들의 세트 및 Cas 단백질에 대한 상기 가이드 RNA의 결합을 증가시키는 적어도 하나의 변형 또는 변형들의 세트를 포함한다. 몇몇 실시태양에서, 상기 조합은 뉴클레아제 내성(즉 안정성)을 증가시키는 적어도 하나의 변형 또는 변형들의 세트, 및 Cas 단백질에 대한 상기 가이드 RNA의 결합을 감소시키는 적어도 하나의 변형 또는 변형들의 세트를 포함한다. 몇몇 실시태양에서, 상기 가이드 RNA는 상이한 유형의 변형들의 조합을 포함한다.

D. 가이드 RNA 구조

몇몇 실시태양에서, 상기 가이드 RNA는 크리스퍼-결합된 단백질과 복합체를 형성할 수 있다. 몇몇 실시태양에서, 상기 크리스퍼-결합된 단백질은 RNA-가이드 폴리뉴클레오타이드 결합 및/또는 뉴클레아제 활성을 갖는 크리스퍼-Cas II유형 시스템에 의해 제공되거나 상기로부터 유래된다. 몇몇 실시태양에서, 상기 크리스퍼-결합된 단백질은 Cas9, Cas9 돌연변이체, 또는 Cas9 변체이다. 몇몇 실시태양에서, 상기 크리스퍼-결합된 단백질은 스트렙토코커스 피오게네스로부터의 Cas9 뉴클레아제이다. 몇몇 실시태양에서, 상기 크리스퍼-결합된 단백질은 스트렙토코커스 써모필루스(Streptococcus thermophilus)로부터의 Cas9 뉴클레아제이다. 몇몇 실시태양에서, 상기 크리스퍼-결합된 단백질은 스타필로코커스 아우레우스(Staphylococcus aureus)로부터의 Cas9 뉴클레아제이다. 몇몇 실시태양에서, 상기 합성 가이드 RNA 또는 합성 가이드 RNA:크리스퍼-결합된 단백질 복합체는 천연 가이드 RNA 또는 변형된 뉴클레오타이드를 갖지 않는 복합체의 기능성을 유지한다. 몇몇 실시태양에서, 상기 기능성은 표적 폴리뉴클레오타이드에의 결합을 포함한다. 몇몇 실시태양에서, 상기 기능성은 표적 폴리뉴클레오타이드의 틈 형성을 포함한다. 몇몇 실시태양에서, 상기 기능성은 표적 폴리뉴클레오타이드의 절단을 포함한다. 몇몇 실시태양에서, 상기 표적 폴리뉴클레오타이드는 시험관내에서 핵산내에 있다. 몇몇 실시태양에서, 상기 표적 폴리뉴클레오타이드는 생체내 또는 시험관내(예를 들어, 배양된 세포 또는 유기체로부터 단리된 세포내)에서 세포의 게놈내에 있다. 몇몇 실시태양에서, 상기 표적 폴리뉴클레오타이드는 DNA 중의 프로토스페이서이다.

몇몇 실시태양에서, 상기 crRNA는 25 내지 80개 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 상기 crRNA 분절은 표적 서열에 하이브리드화할 수 있는 가이드 서열을 포함한다. 몇몇 실시태양에서, 상기 가이드 서열은 표적 서열 또는 그의 일부에 상보성이다. 몇몇 실시태양에서, 상기 가이드 서열은 15 내지 30개 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 상기 crRNA는 줄기 서열을 포함한다. 몇몇 실시태양에서, 상기 줄기 서열은 10 내지 50개 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 상기 crRNA 분절은 5'-오버행 서열을 포함한다. 몇몇 실시태양에서, 상기 5'-오버행 서열은 1 내지 10개 뉴클레오타이드, 한편으로 1 내지 5개 뉴클레오타이드, 한편으로 1, 2 또는 3개 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 상기 crRNA는 (i) 표적 서열에 하이브리드화할 수 있는 가이드 서열 및 (ii) 줄기 서열 모두를 포함한다. 몇몇 실시태양에서, 상기 crRNA는 (i) 5'-오버행 서열, (ii) 표적 서열에 하이브리드화할 수 있는 가이드 서열 및 (iii) 줄기 서열을 포함한다. 상기 crRNA 분절이 줄기 서열을 포함하는 몇몇 실시태양에서, 상기 tracrRNA 분절은 상기 crRNA 분절의 줄기 서열에 부분적으로 또는 전적으로 상보성인 뉴클레오타이드 서열을 포함한다. 몇몇 실시태양에서, 상기 tracrRNA 분절은 적어도 하나 이상의 듀플렉스 구조를 포함한다.

몇몇 실시태양에서, 상기 가이드 RNA는 단일의 가이드 RNA이다. 몇몇 실시태양에서, 상기 가이드 RNA는 단일의 가이드 RNA이며, 여기에서 crRNA 분절 및 tracrRNA 분절이 고리 L을 통해 연결된다. 몇몇 실시태양에서, 상기 고리 L은 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 상기 고리 L은 GNRA의 뉴클레오타이드 서열을 포함하며, 여기에서 N은 A, C, G 또는 U를 나타내고 R은 A 또는 G를 나타낸다. 몇몇 실시태양에서, 상기 고리 L은 GAAA의 뉴클레오타이드 서열을 포함한다. 몇몇 실시태양에서, 상기 가이드 RNA는 하나 초과의 고리를 포함한다.

상기 가이드 RNA는 5' 부분(즉 5' 절반) 및 3' 부분(즉 3' 절반)을 포함한다. 몇몇 실시태양에서, 상기 crRNA 분절은 상기 tracrRNA 분절의 5'(즉 상류)이다. 몇몇 실시태양에서, 상기 tracrRNA 분절은 상기 crRNA 분절에 대해 5'이다.

몇몇 실시태양에서, 상기 가이드 RNA는 2개 이상의 별도의 RNA 가닥, 예를 들어 crRNA 가닥 및 별도의 tracrRNA 가닥을 포함한다. 예를 들어, 도 5a를 참조하시오. 몇몇 실시태양에서, 상기 가닥들은 각각 하나 이상의 변형을 포함하는 합성 가닥이다. 몇몇 실시태양에서, 상기 가닥들 중 적어도 하나는 하나 이상의 변형을 포함하는 합성 가닥이다. 몇몇 실시태양에서, 상기 가닥들은 함께 Cas 단백질, 예를 들어 Cas9에 의한 표적 폴리뉴클레오타이드의 결합, 틈 형성 또는 절단을 가이드하는 기능을 한다. 몇몇 실시태양에서, 상기 crRNA 서열 및 tracrRNA 서열은 별도의 가닥상에 있으며 2개의 상보성 서열을 통해 서로 하이브리드화하여 줄기 또는 듀플렉스를 형성한다.

몇몇 실시태양에서, 상기 가이드 RNA는 crRNA 서열 및 tracrRNA 서열을 포함하는 단일의 가이드 RNA이다. 예를 들어, 도 5b를 참조하시오. 몇몇 실시태양에서, 상기 crRNA 서열 및 tracrRNA 서열은 고리 서열 또는 "고리"에 의해 연결된다. 몇몇 실시태양에서, 단일의 가이드 RNA는 5' 부분 및 3' 부분을 포함하며, 여기에서 상기 crRNA 서열은 상기 tracrRNA 서열의 상류이다.

몇몇 실시태양에서, 상기 2개의 RNA 조각의 총 길이는 약 50 내지 220(예를 들어, 약 55 내지 200, 60 내지 190, 60 내지 180, 60 내지 170, 60 내지 160, 60 내지 150, 60 내지 140, 60 내지 130, 및 60 내지 120)개 뉴클레오타이드 길이, 예를 들어 약 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 또는 220개 뉴클레오타이드 길이일 수 있다. 유사하게, 단일의 가이드 RNA(예를 들어, 도 5b)는 약 50 내지 220(예를 들어, 약 55 내지 200, 60 내지 190, 60 내지 180, 60 내지 170, 60 내지 160, 60 내지 150, 60 내지 140, 60 내지 130, 및 60 내지 120)개 뉴클레오타이드 길이, 예를 들어 약 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 또는 220개 뉴클레오타이드 길이일 수 있다.

도 5a 및 5b에 도시된 바와 같이, 합성 가이드 RNA는 (i) (a) 핵산 중 표적 서열에 하이브리드화할 수 있는 가이드 서열(예를 들어, 분절 G₁-G_n, 이때 각각의 G는 상기 가이드 서열 중의 뉴클레오타이드를 나타낸다), (b) 제2 줄기 서열에 부분적으로 또는 전적으로 하이브리드화할 수 있는 제1 줄기 서열(예를 들어, 분절 X₁-X_n, 이때 각각의 X는 상기 제1 줄기 서열 중의 뉴클레오타이드를 나타낸다), 및 임의로 (c) 5'-오버행 서열(예를 들어, 분절 O₁-O_n, 이때 각각의 O는 상기 오버행 서열 중의 뉴클레오타이드를 나타낸다)를 포함하는 crRNA 서열, 및 (ii) 제2 줄기 서열(예를 들어, 분절 Y₁-Y_n, 이때 각각의 Y는 상기 제2 줄기 서열 중의 뉴클레오타이드를 나타낸다)을 포함하는 tracrRNA 서열을 포함한다. 상기 tracrRNA 서열은 분절 T₁-T_n(이때 각각의 T는 상기 tracrRNA 서열 중의 뉴클레오타이드를 나타낸다)을 추가로 포함한다. 도 5a에 도시된 합성 가이드 RNA는 하나 이상의 변형을 포함한다. 마찬가지로, 도 5b에 도시된 합성 가이드 RNA는 하나 이상의 변형을 포함한다. 몇몇 실시태양에서, 상기 변형은 상기 crRNA, tracrRNA, 또는 crRNA 분절, tracrRNA 분절 및 임의로 고리를 포함하는 단일 가이드 RNA의 길이를 따라 임의의 지점에 위치한다. 몇몇 실시태양에서, 도 5a 및 5b에 도시된 합성 가이드 RNA 중의 O, G, X, Y 또는 T에 의해 나타내는 임의의 뉴클레오타이드는 변형된 뉴클레오타이드일 수 있다. 도 5b에 도시된 가이드 RNA는 단일 가이드 RNA(sgRNA)를 나타내며, 이때 crRNA 분절 및 tracrRNA 분절은 서열 GNRA를 갖는 고리에 의해 연결되고, 여기에서 N은 A, C, G, 또는 U를 나타내고, R은 A 또는 G를 나타낸다.

몇몇 실시태양에서, 상기 가이드 RNA의 crRNA 분절은 25 내지 70(예를 들어, 30 내지 60, 35 내지 50 또는 40 내지 45)개 뉴클레오타이드 길이이다. 몇몇 실시태양에서, 상기 가이드 서열은 12 내지 30(예를 들어, 16 내지 25, 17 내지 20 또는 15 내지 18)개 뉴클레오타이드 길이이다. 일부 실시태양에서, 상기 crRNA의 5' 부분은 표적 서열과 하이브리드화하지 않거나 단지 부분적으로 하이브리드화한다. 예를 들어, 상기 crRNA 분절상에 5'-오버행이 존재할 수 있다.

몇몇 실시태양에서, 상기 단일 가이드 RNA는 상기 crRNA 분절의 줄기 서열, 상기 tracrRNA 분절의 줄기 서열, 및 임의로 상기 crRNA 분절을 상기 tracrRNA 분절에 공유적으로 연결시키는 고리를 포함하는 중심 부분을 포함한다. 몇몇 실시태양에서, 상기 단일 가이드 RNA의 중심 분절은 8 내지 60(예를 들어, 10 내지 55, 10 내지 50, 또는 20 내지 40)개 뉴클레오타이드 길이이다.

몇몇 실시태양에서, 상기 가이드 RNA의 tracrRNA 분절은 10 내지 130(예를 들어, 10 내지 125, 10 내지 100, 10 내지 75, 10 내지 50 또는 10 내지 25)개 뉴클레오타이드 길이이다. 몇몇 실시태양에서, 상기 tracrRNA 분절은 상기 중심 분절 중의 임의의 헤어핀 또는 듀플렉스 구조 외에 하나 이상의 헤어핀 또는 듀플렉스 구조를 포함한다.

몇몇 실시태양에서, 상기 tracrRNA는 참조 tracrRNA, 예를 들어 자연에 존재하는 성숙한 tracrRNA에 비해 절두된다. 일련의 길이가 별도의 유형(도 5a) 및 키메릭 sgRNA 유형(도 5b) 모두에서 기능하는 것으로 나타났다. 예를 들어, 몇몇 실시태양에서, tracrRNA는 그의 3' 단부로부터 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35 또는 40 nt까지 절두될 수 있다. 몇몇 실시태양에서, 상기 tracrRNA 분자는 그의 5' 단부로부터 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75 또는 80 nt까지 절두될 수 있다. 몇몇 실시태양에서, 상기 tracrRNA 분자는 5' 및 3' 단부 모두로부터, 예를 들어 상기 5' 단부로부터 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15 또는 20 nt까지, 및 상기 3' 단부로부터 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35 또는 40 nt까지 절두될 수 있다. 예를 들어, 문헌[Jinek et al. (2012) Science, 337, 816-21]; 문헌[Mali et al. (2013) Science, 33P:6121, 823-6]; 문헌[Cong et al. (2013) Science, 539:6121, 819-23]; 및 문헌[Hwang et al. (2013) Nat. Biotechnol. 31:3, 227-9]; 문헌[Jinek et al. (2013) eLife, 2, e00471]을 참조하시오. 몇몇 실시태양에서, 상기 tracrRNA는 절두되지 않는다.

몇몇 실시태양에서, 상기 개시된 변형은 상기 crRNA 분절 또는 tracrRNA 분절 또는 둘 다 중에 있다. 몇몇 실시태양에서, 상기 개시된 변형은 상기 crRNA 분절의 가이드 서열 중에 있다. 몇몇 실시태양에서, 상기 개시된 변형은 상기 crRNA 분절의 줄기 서열 중에 있다. 몇몇 실시태양에서, 상기 개시된 변형은 상기 crRNA 분절의 5'-오버행 서열 중에 있다. 몇몇 실시태양에서, 상기 개시된 변형은 상기 tracrRNA 분절의 줄기 서열 중에 있다. 몇몇 실시태양에서, 상기 개시된 변형은 상기 가이드 RNA의 고리 서열 중에 있다. 몇몇 실시태양에서, 상기 개시된 변형은 상기 가이드 RNA의 5' 부분 중에 있다. 몇몇 실시태양에서, 상기 개시된 변형은 상기 가이드 RNA의 3' 부분 중에 있다. 몇몇 실시태양에서, 상기 개시된 변형은 상기 가이드 RNA의 5' 부분 및 상기 가이드 RNA의 3' 부분 중에 있다.

E. 가이드 RNA의 합성

몇몇 실시태양에서, 단일 가이드 RNA(sgRNA; 도 1 및 5B를 참조하시오)를 포함한 가이드 RNA를 합성 유기 화학의 기술을 사용하여 화학 합성에 의해 생성시킨다. 4개의 우세한 리보뉴클레오타이드, 즉 A, C, G 및 U 이외의 임의의 뉴클레오타이드(천연이든 비천연이든), 예를 들어 슈도유리딘, 이노신 또는 데옥시뉴클레오타이드를 포함하는 가이드 RNA는, RNA 중의 상기 4개의 우세한 뉴클레오타이드 중 어느 하나와 화학적으로/구조적으로 상이한 뉴클레오타이드에 화학적 변형 또는 치환을 갖는다.

본 명세서에 기재된 합성 가이드 RNA를 화학적으로 합성할 수 있다. 예를 들어, 상기 합성 가이드 RNA를 문헌[Dellinger et al. (2011) J. Am. Chem. Soc, 133, 11540], 미국특허 제 8,202,983 호 및 미국특허 출원 제 2010/0076183A1 호(이들의 내용은 전체가 본 명세서에 참고로 인용된다)에 기재된 방법에 의해 TC 화학을 사용하여 합성할 수 있다. "TC 화학"은 티오노카바메이트 보호기에 의해 2' 하이드록실 부분상에서 보호된 RNA 단량체성 뉴클레오타이드 전구체를 사용하여, 변형되지 않은 RNA 또는 하나 이상의 변형된 뉴클레오타이드를 포함하는 변형된 RNA를 합성하는 조성물 및 방법을 지칭한다. TC-RNA 화학을 사용허여 비교적 긴 RNA(200머 이상 정도로 긴)를 화학적으로 합성하는 능력은 우리로 하여금 상기 4개의 우세한 리보뉴클레오타이드(A,C,G 및 U)에 의해 가능한 것들을 능가할 수 있는 특별한 특징들을 갖는 가이드 RNA를 생성할 수 있게 한다. 본 명세서에 기재된 일부 합성 가이드 RNA를 또한, 시험관내 전사 및 세포-기반 발현을 포함하는 당해 분야에 공지된 방법들을 사용하여 제조할 수 있다. 예를 들어, 2'-플루오로 NTP를 세포-기반 발현에 의해 생성된 합성 가이드 RNA에 통합시킬 수 있다.

가이드 RNA의 합성을 또한 효소에 의해 후속적으로 함께 결찰되거나, 화학적 결찰, 예를 들어 비제한적으로 시아노젠 브로마이드 화학, 문헌[R. Kumar et al. (2007) J. Am. Chem. Soc, 129, 6859-64]에 공개된 바와 같은 "클릭" 화학, 또는 "올리고뉴클레오타이드의 접합을 위한 조성물 및 방법"이란 표제하의 케이 힐(K. Hill)의 WO2013176844에 기재된 바와 같은 스쿠아레이트 접합 화학에 의해 화학적으로 결찰되는 RNA 서열의 화학적 또는 효소적 합성에 의해 수행할 수 있다.

하기에 추가로 기재되는 바와 같이, 변형된 뉴클레오타이드 및/또는 변형된 뉴클레오타이드간 결합을 포함하는 가이드 RNA를 포함한, 본 명세서에 개시된 가이드 RNA를 사용하여 다양한 크리스퍼-매개된 기능(비제한적으로 유전자 편집, 유전자 발현의 조절, 표적 서열의 절단, 및 표적 서열에의 결합을 포함한다)을 시험관내 또는 생체내에서, 예를 들어 무세포 분석에서, 완전 세포에서, 또는 전체 기관에서 수행할 수 있다. 시험관내 또는 생체내 적용을 위해서, 상기 RNA를 당해 분야에 공지된 임의의 방식으로 세포 또는 전체 기관내로 전달할 수 있다.

라이브러리 및 배열

하나의 태양에서, 본 발명은 다수의 가이드 RNA의 세트 또는 라이브러리를 제공한다. 몇몇 실시태양에서, 상기 라이브러리는 본 명세서에 개시된 2개 이상의 가이드 RNA를 함유한다. 상기 라이브러리는 약 10 내지 약 10⁷의 개별적인 구성원, 예를 들어 약 10 내지 약 10², 약 10² 내지 약 10³, 약 10³ 내지 약 10⁵, 약 10⁵ 내지 약 10⁷의 구성원을 함유할 수 있다. 상기 라이브러리의 개별적인 구성원은 적어도 상기 가이드 서열 중의 상기 라이브러리의 다른 구성원, 즉 상기 gRNA의 DNA 표적화 분절과 상이하다. 다른 한편으로, 몇몇 실시태양에서, 라이브러리의 각각의 개별적인 구성원은 상기 라이브러리의 모든 다른 구성원들과 동일하거나 실질적으로 동일한 tracrRNA 분절에 대한 뉴클레오타이드 서열을 함유할 수 있다. 이러한 방식으로, 상기 라이브러리는 상이한 폴리뉴클레오타이드 또는 하나 이상의 폴리뉴클레오타이드 중의 상이한 서열을 표적화하는 구성원들을 포함할 수 있다.

몇몇 실시태양에서, 상기 라이브러리는 적어도 10²개의 독특한 가이드 서열을 포함한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 10³개의 독특한 가이드 서열을 포함한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 10⁴개의 독특한 가이드 서열을 포함한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 10⁵개의 독특한 가이드 서열을 포함한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 10⁶개의 독특한 가이드 서열을 포함한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 10⁷개의 독특한 가이드 서열을 포함한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 10개의 상이한 폴리뉴클레오타이드를 표적화한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 10²개의 상이한 폴리뉴클레오타이드를 표적화한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 10³개의 상이한 폴리뉴클레오타이드를 표적화한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 10⁴개의 상이한 폴리뉴클레오타이드를 표적화한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 10⁵개의 상이한 폴리뉴클레오타이드를 표적화한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 10⁶개의 상이한 폴리뉴클레오타이드를 표적화한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 10⁷개의 상이한 폴리뉴클레오타이드를 표적화한다.

몇몇 실시태양에서, 상기 라이브러리는 상기 라이브러리 중의 구성원들의 서열을 가로질러 움직이는 점진적으로 이동하는 창 중에 동일한 서열 및 동일한 변형을 갖는 가이드 RNA의 콜렉션을 포함한다. 몇몇 실시태양에서, 상기 창은 집합적으로 상기 RNA의 전체 길이를 포함한다.

몇몇 실시태양에서, 상기 라이브러리는 대량 처리, 다중-표적 게놈 조작 및 분석의 수행을 허용한다. 몇몇 실시태양에서, 단지 상기 가이드 RNA의 DNA-표적화 분절만이 변하는 반면, Cas 단백질-결합 분절은 동일하다. 몇몇 실시태양에서, 상기 라이브러리의 제1 부분은 특정한 Cas 단백질을 인식하고, 결합하고 지시하는 Cas-결합 분절을 갖는 가이드 RNA를 포함하고, 상기 라이브러리의 제2 부분은 상이한 Cas 단백질(예를 들어, 상이한 종들로부터의 Cas 단백질)을 인식하고, 결합하고 지시하는 상이한 Cas-결합 분절을 포함하며, 이에 의해 상기 라이브러리는 2개 이상의 직교하는 Cas 단백질들과 함께 기능할 수 있다. 몇몇 실시태양에서, 제1 직교 Cas 단백질의 유도 발현은 상기 제1 직교 Cas 단백질과 상호작용하는 라이브러리의 부분을 사용한다. 몇몇 실시태양에서, 제1 및 제2 직교 Cas 단백질의 유도 발현은 각각 상기 제1 및 제2 직교 Cas 단백질과 상호작용하는 라이브러리의 부분들을 사용한다. 몇몇 실시태양에서, 상기 제1 및 제2 직교 Cas 단백질의 유도 발현은 상이한 횟수로 발생한다. 상응하게, 상기 라이브러리에 명시된 다수의 표적을 특이적으로 조작하거나 변형시킴으로써 대규모 유전자 편집 또는 유전자 조절을 수행할 수 있다.

몇몇 실시태양에서, 상기 라이브러리는 "배열된" 라이브러리, 즉 어드레스 가능한 배열의 상이한 특징들 또는 특징들의 풀의 콜렉션이다. 예를 들어, 배열의 특징들을 선택적으로 가르고, 미세적정 플레이트 중의 각 웰이 공지된 특징 또는 공지된 특징들의 풀을 함유하도록 상기 플레이트로 옮길 수 있다. 일부 다른 실시태양에서, 상기 라이브러리를 48-컬럼 또는 96-컬럼 미세적정 플레이트 포맷 또는 384-컬럼 플레이트에서 합성한다.

몇몇 실시태양에서, 본 발명의 가이드 RNA의 합성을, 화학적 존재가 결합될 수 있는 표면을 갖는 고체 지지체상에서 수행할 수 있다. 일부 실시태양에서, 합성되는 가이드 RNA들을 동일한 고체 지지체에 직접적으로 또는 간접적으로 부착시키고 배열의 부분을 형성할 수 있다. "배열"은, 각 서열의 위치를 알도록 각각 공간적으로 한정되고 물리적으로 어드레스 가능한 방식으로 배열된 공지된 단량체성 서열의 별도의 분자들의 콜렉션이다. 본 명세서에서 호환 가능하게 사용되는 "배열" 또는 "미세배열"은 특정한 화학적 부분 또는 부분들(예를 들어, 리간드, 예를 들어 생물중합체, 예를 들어 폴리뉴클레오타이드 또는 올리고뉴클레오타이드 서열(핵산), 폴리펩타이드(예를 들어, 단백질), 탄수화물, 지질 등)이 결합된, 어드레스 가능한 영역들의 임의의 1차원, 2차원 또는 실질적으로 2차원(뿐만 아니라 3차원)의 배열을 포함한다. 배열은 상기 배열상의 특정한 소정의 위치(즉 "어드레스")의 영역(즉 상기 배열의 "특징")이 특정 표적 또는 표적들의 부류를 검출하도록(특징이 상기 특징의 비-표적을 우연히 검출할 수도 있다) 상이한 부분(예를 들어, 상이한 폴리뉴클레오타이드 서열)의 다수의 영역을 가질 때 "어드레스 가능하다". 배열 특징은 전형적으로는 중재 공간에 의해 분리된다(필요한 것은 아니다). 배열상에 함유될 수 있는 특징들의 수는 주로 기재의 표면적, 특징의 크기 및 특징들간의 간격에 의해 결정될 것이다. 배열은 ㎠당 수십만 개 또는 더 많은 특징들의 밀도, 예를 들어 2,500 내지 200,000 특징/㎠를 가질 수 있다. 상기 특징들을 기재에 공유 결합시킬 수도, 공유 결합시키지 않을 수도 있다.

적합한 고체 지지체는 다양한 형태 및 조성을 가질 수 있으며 천연 물질, 합성적으로 변형된 천연 물질, 또는 합성 물질로부터 유래된다. 적합한 지지체 물질의 예는 비제한적으로 실리카, 규소 및 규소 산화물, 테플론, 유리, 폴리사카라이드, 예를 들어 아가로스(예를 들어, 파마시아(Pharmacia)로부터의 세파로스(등록상표)) 및 덱스트란(예를 들어, 파마시아로부터의 세파덱스(등록상표) 및 세파실(등록상표)), 폴리아크릴아미드, 폴리스타이렌, 폴리비닐 알콜, 하이드록시에틸 메트아크릴레이트 및 메틸 메트아크릴레이트의 공중합체 등을 포함한다. 일부 실시태양에서, 상기 고체 지지체는 다수의 비드이다.

상기 기재 표면상에서 합성되는 가이드 RNA의 초기 단량체를 링커에 결합시킬 수 있으며, 차례로 이는 표면 친수성기, 예를 들어 실리카 기재상에 존재하는 표면 하이드록실 부분에 결합된다. 일부 실시태양에서, 보편적인 링커가 사용된다. 일부 다른 실시태양에서, 상기 초기 단량체를 예를 들어 표면 하이드록실 부분과 직접 반응시킨다. 한편으로, 가이드 RNA를 본 발명에 따라 먼저 합성하고, 당해 분야에 공지된 임의의 방법에 의해 합성-후 고체 기재에 부착시킬 수 있다. 따라서, 본 발명을 사용하여 가이드 RNA의 배열을 제조할 수 있으며, 여기에서 상기 올리고뉴클레오타이드는 상기 배열상에서 합성되거나, 합성-후 배열 기재에 부착된다. 후속적으로, 상기 가이드 RNA 또는 가이드 RNA의 풀 또는 다수의 풀을 상기 배열 기재로부터 임의로 및 선택적으로 절단하고 라이브러리 또는 라이브러리들로서 사용할 수 있다.

IV. Cas 단백질

상기에 언급한 바와 같이, 기능성 크리스퍼-Cas 시스템은 또한 목적하는 활성, 예를 들어 표적 결합 또는 표적 틈 형성/절단을 제공하는 단백질 성분(예를 들어, Cas 단백질(상기는 Cas 뉴클레아제일 수도 있다))을 필요로 한다. 몇몇 실시태양에서, 상기 목적하는 활성은 표적 결합이다. 몇몇 실시태양에서, 상기 목적하는 활성은 표적 틈 형성 또는 표적 절단이다. 몇몇 실시태양에서, 상기 목적하는 활성은 또한 본 명세서에 개시된 바와 같은, Cas 단백질에 공유적으로 융합된 폴리펩타이드에 의해 제공되는 기능을 포함한다. 몇몇 실시태양에서, 상기 목적하는 활성은 또한 본 명세서에 개시된 바와 같은, 뉴클레아제-결핍 Cas 단백질에 공유적으로 융합된 폴리펩타이드에 의해 제공되는 기능을 포함한다. 상기와 같은 목적하는 활성의 예는 하기에 기재되는 바와 같은, 전사 조절 활성(활성화 또는 억제), 후성적 변형 활성, 또는 표적 가시화/식별 활성을 포함한다. 상기 Cas 단백질을 정제되거나 정제되지 않은 (i) Cas 단백질 또는 (ii) 상기 Cas 단백질의 발현을 암호화하는 mRNA 또는 (iii) 상기 단백질의 발현을 암호화하는 선형 또는 환상 DNA로서 시험관내 또는 생체내 시스템에 도입시킬 수 있다. 상기 Cas 단백질을 제공하는 상기 3가지 방법 중 어느 하나는 당해 분야에 주지되어 있으며 본 명세서에서 Cas 단백질 또는 Cas 단백질의 용도를 언급할 때 호환 가능하게 의미된다. 몇몇 실시태양에서, 상기 Cas 단백질은 mRNA 또는 DNA로부터 구성적으로 발현된다. 몇몇 실시태양에서, mRNA 또는 DNA로부터 Cas 단백질의 발현은 유도성이거나 유도된다.

몇몇 실시태양에서, 상기 Cas 단백질을 화학적으로 합성하거나(예를 들어, 문헌[Creighton, "Proteins: Structures and Molecular Principles," W.H. Freeman & Co., NY, 1983]을 참조하시오), 또는 본 명세서에 기재된 바와 같은 재조합 DNA 기술에 의해 생성시킨다. 추가적인 지침을 위해서, 숙련가들은 문헌[Frederick M. Ausubel et al, "Current Protocols in Molecular Biology," John Wiley & Sons, 2003]; 및 문헌[Sambrook et al, "Molecular Cloning, A Laboratory Manual," Cold Spring Harbor Press, Cold Spring Harbor, NY, 2001]을 고려할 수 있다.

몇몇 실시태양에서, 상기 Cas 단백질을 정제되거나 단리된 형태로 제공한다. 몇몇 실시태양에서, 상기 Cas 단백질을 약 80%, 약 90%, 약 95% 또는 약 99% 순도로 제공한다. 몇몇 실시태양에서, 상기 Cas 단백질을 조성물의 부분으로서 제공한다. 몇몇 실시태양에서, 상기 Cas 단백질을 RNA-가이드 뉴클레아제 반응을 위한 조성물로서 사용하기에 또는 상기 조성물에 포함시키기에 적합한 수성 조성물 중에 제공한다. 당해 분야의 숙련가들은 상기와 같은 뉴클레아제 반응 조성물 중에 포함될 수 있는 다양한 물질을 잘 알고 있다.

몇몇 실시태양에서, 상기 Cas 단백질을 재조합 폴리펩타이드로서 제공한다. 몇몇 실시태양에서, 상기 재조합 폴리펩타이드를 융합 단백질로서 제조한다. 예를 들어, 몇몇 실시태양에서, 상기 Cas 단백질을 암호화하는 핵산을 융합 짝, 예를 들어 글루타치온-s-트랜스퍼라제(GST), 6x-His 에피토프 태그, 또는 M13 유전자 3 단백질을 암호화하는 또 다른 핵산에 결합시킨다. 적합한 숙주 세포를 사용하여 상기 융합 단백질을 발현시킬 수 있다. 몇몇 실시태양에서, 상기 융합 단백질을 당해 분야에 공지된 방법에 의해 단리한다. 몇몇 실시태양에서, 상기 융합 단백질을, 예를 들어 효소 절단에 의해 추가로 처리하여 상기 융합 짝을 제거하고 Cas 단백질을 수득할 수 있다. 한편으로, Cas 단백질:가이드 RNA 복합체를 숙주 세포 시스템 또는 당해 분야에 공지된 시험관내 번역-전사 시스템을 사용하여 재조합 기술로 제조할 수 있다. 상기와 같은 시스템 및 기술에 대한 상세한 내용을 예를 들어 WO2014144761 WO2014144592, WO2013176772, US20140273226, 및 US20140273233(이들의 내용은 전체가 본 명세서에 참고로 인용된다)에서 찾을 수 있다.

야생형 Cas 단백질

몇몇 실시태양에서, Cas 단백질은 크리스퍼-Cas I형, II형 또는 III형 시스템으로부터 유래된 단백질을 포함하며, 상기 시스템은 RNA-가이드 폴리뉴클레오타이드 결합 및/또는 뉴클레아제 활성을 갖는다. 적합한 Cas 단백질의 비제한적인 예는 Cas3, Cas4, Cas5, Cas5e(또는 CasD), Cas6, Cas6e, Cas6f, Cas7, Cas8al, Cas8a2, Cas8b, Cas8c, Cas9, CaslO, CaslOd, CasF, CasG, CasH, Csyl, Csy2, Csy3, Csel(또는 CasA), Cse2(또는 CasB), Cse3(또는 CasE), Cse4(또는 CasC), Cscl, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csbl, Csb2, Csb3, Csxl7, Csxl4, CsxlO, Csxl6, CsaX, Csx3, Cszl, Csxl5, Csfl, Csf2, Csf3, Csf4, 및 Cul966을 포함한다. 예를 들어, WO2014144761 WO2014144592, WO2013176772, US20140273226, 및 US20140273233(이들의 내용은 전체가 본 명세서에 참고로 인용된다)을 참조하시오.

몇몇 실시태양에서, 상기 Cas 단백질은 II형 크리스퍼-Cas 시스템으로부터 유래된다. 몇몇 실시태양에서, 상기 Cas 단백질은 Cas9 단백질이거나 상기 단백질로부터 유래된다. 몇몇 실시태양에서, 상기 Cas 단백질은 WO2014144761에 나타낸 것들을 포함하여, 세균성 Cas9 단백질이거나 상기 단백질로부터 유래된다. 몇몇 실시태양에서, 상기 Cas 단백질은 스트렙토코커스 스페시즈 또는 스타필로코커스 스페시즈 Cas9 단백질이거나 상기 단백질로부터 유래된다. 몇몇 실시태양에서, 상기 Cas 단백질은 스트렙토코커스 써모필루스 Cas9 단백질이거나 상기 단백질로부터 유래된다. 몇몇 실시태양에서, 상기 Cas 단백질은 스트렙토코커스 피오게네스 Cas9 단백질이거나 상기 단백질로부터 유래된다. 몇몇 실시태양에서, 상기 Cas 단백질은 스타필로코커스 아우레우스 Cas9 단백질이거나 상기 단백질로부터 유래된다. 몇몇 실시태양에서, 상기 Cas 단백질은 스트렙토코커스 써모필루스 Cas9 단백질이거나 상기 단백질로부터 유래된다.

몇몇 실시태양에서, 상기 야생형 Cas 단백질은 Cas9 단백질이다. 몇몇 실시태양에서, 상기 야생형 Cas9 단백질은 스트렙토코커스 피오게네스로부터의 Cas9 단백질(서열번호 1)이다. 몇몇 실시태양에서, 상기 단백질 또는 폴리펩타이드는 서열번호 1의 단편을 포함하거나, 상기 단편으로 이루어지거나, 상기 단편으로 필수적으로 이루어진다.

일반적으로, Cas 단백질은 적어도 하나의 RNA 결합 도메인을 포함하며, 상기 도메인은 가이드 RNA와 상호작용한다. 몇몇 실시태양에서, 상기 Cas 단백질을 변형시켜, 상기 단백질의 핵산 결합 친화성 및/또는 특이성을 증가시키고, 효소 활성을 변경시키고, 및/또는 또 다른 성질을 변화시킨다. 예를 들어, 상기 Cas 단백질의 뉴클레아제(즉, DNase, RNase) 도메인을 변형시키거나, 돌연변이시키거나, 결실시키거나 불활성화시킬 수 있다. 한편으로, 상기 Cas 단백질을 절두시켜, 상기 단백질의 기능에 필수적이지 않은 도메인을 제거할 수 있다. 몇몇 실시태양에서, 상기 Cas 단백질을 절두시키거나 변형시켜 효과기 도메인의 활성을 최적화시킨다. 몇몇 실시태양에서, 상기 Cas 단백질은 핵 국소화 서열(NLS)-태그된 Cas 단백질의 살아있는 세포의 핵내로의 수입을 수행하는 NLS를 포함한다. 몇몇 실시태양에서, 상기 Cas 단백질은 2개 이상의 변형을 포함한다.

돌연변이 Cas 단백질

일부 실시태양에서, 상기 Cas 단백질은 야생형 Cas 단백질(예를 들어, Cas9)의 돌연변이체 또는 그의 단편일 수 있다. 다른 실시태양에서, 상기 Cas 단백질은 돌연변이 Cas 단백질로부터 유래할 수 있다. 예를 들어, 상기 Cas9 단백질의 아미노산 서열을 변형시켜 상기 단백질의 하나 이상의 성질(예를 들어, 뉴클레아제 활성, 결합 친화성, 프로테아제에 대한 안정성 등)을 변경시킬 수 있다. 한편으로, RNA-가이드 절단에 관련되지 않은 Cas9 단백질의 도메인을, 변형된 Cas9 단백질이 야생형 Cas9 단백질보다 작도록 상기 단백질로부터 제거할 수 있다. 예를 들어, 상기 Cas9 암호화 서열의 크기를 감소시키는 것은 상기 서열을 형질감염 벡터, 예를 들어 특히 AAV 벡터내에 적합하도록 할 수 있다(그렇지 않으면 상기 벡터는 야생형 서열을 수용할 수 없다). 일부 실시태양에서, 본 발명의 시스템은 세균에서 암호화되거나 진핵생물 세포에서의 발현에 대해 코돈-최적화된 스트렙토코커스 피오게네스로부터의 Cas9 단백질을 사용한다. 하기에 야생형 스트렙토코커스 피오게네스 Cas9 단백질 서열(서열번호 1, www.uniprot.org/uniprot/Q99ZW2에서 입수할 수 있다)의 아미노산 서열을 나타낸다.

Cas9 단백질은 일반적으로 2개 이상의 뉴클레아제(예를 들어, DNase) 도메인을 갖는다. 예를 들어, Cas9 단백질은 RuvC-형 뉴클레아제 도메인 및 HNH-형 뉴클레아제 도메인을 가질 수 있다. 상기 RuvC 및 HNH 도메인은 함께 표적 부위 중의 2개의 가닥을 모두 절단하여 표적 폴리뉴클레오타이드 중에 이중-가닥 끊김을 생성시킨다(문헌[Jinek et al., Science, 337:816-821). 몇몇 실시태양에서, 돌연변이 Cas9 단백질을 단지 하나의 기능성 뉴클레아제 도메인(RuvC-형 또는 HNH-형 뉴클레아제 도메인)을 함유하도록 변형시킨다. 예를 들어, 몇몇 실시태양에서, 상기 돌연변이 Cas9 단백질을, 상기 뉴클레아제 도메인들 중 하나가 더 이상 기능성이지 않도록(즉 상기 뉴클레아제 활성이 존재하지 않는다) 결실되거나 돌연변이되도록 변형시킨다. 상기 뉴클레아제 도메인들 중 하나가 불활성인 일부 실시태양에서, 상기 돌연변이체는 이중-가닥 폴리뉴클레오타이드에 틈을 도입시킬 수 있지만(상기와 같은 단백질을 "니카제"라 칭한다) 상기 이중-가닥 폴리뉴클레오타이드를 절단할 수는 없다. 예를 들어, RuvC-형 도메인에서 아스파테이트의 알라닌(D10A)으로의 전환은 상기 Cas9-유래된 단백질을 니카제로 전환시킨다. 마찬가지로, HNH 도메인에서 히스티딘의 알라닌(H840A)으로의 전환은 상기 Cas9-유래된 단백질을 니카제로 전환시킨다. 마찬가지로, HNH 도메인에서 아스파라진의 알라닌(N863A)으로의 전환은 상기 Cas9-유래된 단백질을 니카제로 전환시킨다.

몇몇 실시태양에서, 상기 RuvC-형 뉴클레아제 도메인 및 HNH-형 뉴클레아제 도메인을 모두, 돌연변이 Cas9 단백질이 표적 폴리뉴클레오타이드에 틈을 형성시키거나 상기를 절단할 수 없도록 변형시키거나 제거한다. 몇몇 실시태양에서, 상기 Cas9-유래된 단백질의 모든 뉴클레아제 도메인을, 상기 Cas9-유래된 단백질이 모든 뉴클레아제 활성이 없도록 변형시키거나 제거한다. 그럼에도 불구하고, 몇몇 실시태양에서, 야생형 대응물에 비해 일부 또는 모든 뉴클레아제 활성이 없는 Cas9 단백질은 표적 인식 활성을 더 크거나 더 적은 정도로 유지시킨다.

상술한 실시태양들 중 어느 하나에서, 상기 뉴클레아제 도메인 중 일부 또는 전부를 주지된 방법, 예를 들어 부위-지향된 변이도입, PCR-매개된 변이도입, 및 전체 유전자 합성뿐만 아니라 당해 분야에 공지된 다른 방법들을 사용하여 하나 이상의 결실 돌연변이, 삽입 돌연변이 및/또는 치환 돌연변이에 의해 불활성화시킬 수 있다.

몇몇 실시태양에서, 상기 "Cas 돌연변이체" 또는 "Cas 변체"는 서열번호 1과 적어도 50%(예를 들어, 50% 내지 100%(양끝 포함) 사이의 임의의 수, 예를 들어 50%, 60%, 70%, 80%, 90%, 95%, 98%, 및 99%) 일치한다. 몇몇 실시태양에서, 상기 "Cas 돌연변이체" 또는 "Cas 변체"는 RNA 분자(예를 들어, sgRNA)에 결합한다. 몇몇 실시태양에서, 상기 "Cas 돌연변이체" 또는 "Cas 변체"는 상기 RNA 분자를 통해 특정한 폴리뉴클레오타이드 서열에 표적화된다.

융합 단백질

몇몇 실시태양에서, 상기 Cas 단백질을 상기 Cas 단백질과 비상동성인 또 다른 단백질 또는 폴리펩타이드에 융합시켜 융합 단백질을 생성시킨다. 몇몇 실시태양에서, 상기 비상동 서열은 하나 이상의 효과기 도메인, 예를 들어 절단 도메인, 전사·활성화 도메인, 전사 억제 도메인, 또는 후성적 변형 도메인을 포함한다. 상기 효과기 도메인의 추가적인 예는 핵 국소화 신호, 세포-침투 또는 전좌 도메인, 또는 마커 도메인을 포함한다. 몇몇 실시태양에서, 상기 효과기 도메인은 상기 융합 단백질의 N-말단, C-말단 또는 내부 위치에 위치한다. 몇몇 실시태양에서, 상기 융합 단백질의 Cas 단백질은 Cas9 단백질이거나 상기 단백질로부터 유래된다. 몇몇 실시태양에서, 상기 융합 단백질의 Cas 단백질은 모든 뉴클레아제 도메인이 불활성화되거나 결실된 변형된 또는 돌연변이된 Cas9 단백질이거나 상기 단백질로부터 유래된다. 몇몇 실시태양에서, 상기 융합 단백질의 Cas 단백질은 뉴클레아제 활성이 결여된 변형되거나 돌연변이된 Cas9 단백질이거나 상기 단백질로부터 유래된다. 몇몇 실시태양에서, 상기 Cas 단백질의 RuvC 및/또는 HNH 도메인은 이들이 더 이상 뉴클레아제 활성을 갖지 못하도록 변형되거나 돌연변이된다.

절단 도메인

몇몇 실시태양에서, 상기 융합 단백질의 효과기 도메인은 절단 도메인이다. 본 명세서에 사용되는 "절단 도메인"은 DNA를 절단하는 도메인을 지칭한다. 상기 절단 도메인은 임의의 엔도뉴클레아제 또는 엑소뉴클레아제로부터 획득될 수 있다. 절단 도메인을 이끌어낼 수 있는 엔도뉴클레아제의 비제한적인 예는 제한 엔도뉴클레아제 및 귀소 엔도뉴클레아제를 포함한다. 예를 들어, 문헌[New England Biolabs Catalog] 또는 문헌[Belfort et al. (1997) Nucleic Acids Res. 25, 3379-88]을 참조하시오. DNA를 절단하는 추가적인 효소들(예를 들어, 51 뉴클레아제; 녹두 뉴클레아제; 췌장 DNase I; 마이크로코커스 뉴클레아제; 효모 HO 엔도뉴클레아제)이 공지되어 있다. 또한 문헌[Linn et al. (eds.) "Nucleases," Cold Spring Harbor Laboratory Press, 1993]을 참조하시오. 상기 효소들 중 하나 이상(또는 그의 기능성 단편들)을 절단 도메인의 공급원으로서 사용할 수 있다.

몇몇 실시태양에서, 상기 절단 도메인은 II-S형 엔도뉴클레아제로부터 유래될 수 있다. II-S형 엔도뉴클레아제는 특이적으로, 상기 엔도뉴클레아제의 DNA 인식 부위로부터 떨어져 있는 전형적으로 다수의 염기쌍인 부위에서 DNA를 절단하며, 그 자체로서 분리 가능한 인식 및 절단 도메인을 갖는다. 상기 효소는 일반적으로, 일시적으로 결합하여 이량체를 형성하여 엇갈린 위치에서 DNA의 각 가닥을 절단하는 단량체이다. 적합한 II-S형 엔도뉴클레아제의 비제한적인 예는 BfiI, BpmI, BsaI, BsgI, BsmBI, BsmI, BspMI, FokI, MbolI, 및 SapI를 포함한다. 몇몇 실시태양에서, 상기 융합 단백질의 절단 도메인은 FokI 절단 도메인 또는 그의 단편 또는 유도체이다. 문헌[Miller et al. (2007) Nat. Biotechnol. 25, 778-85]; 문헌[Szczpek et al. (2007) Nat. Biotechnol. 25, 786-93]; 문헌[Doyon et al. (2011) Nat. Methods, 8, 74-81]을 참조하시오.

전사 활성화 도메인

몇몇 실시태양에서, 상기 융합 단백질의 효과기 도메인은 전사 활성화 도메인이다. 일반적으로, 전사 활성화 도메인은 전사 조절 요소 및/또는 전사 조절 단백질(즉 전사 인자, RNA 폴리머라제 등)과 상호작용하여 유전자의 전사를 증가시키고/시키거나 전사를 활성화시킨다. 몇몇 실시태양에서, 상기 전사 활성화 도메인은 헤르페스 단순 바이러스 VP16 활성화 도메인, VP64(VP16의 사량체성 유도체이다), NFκB p65 활성화 도메인, p53 활성화 도메인 1 및 2, CREB(cAMP 응답 요소 결합 단백질) 활성화 도메인, E2A 활성화 도메인, 또는 NFAT(활성화된 T-세포의 핵 인자) 활성화 도메인이다. 몇몇 실시태양에서, 상기 전사 활성화 도메인은 Gal4, 'Gcn4, MLL, Rtg3, Gln3, Oafl , Pip2, Pdrl, Pdr3, Pho4, 또는 Leu3이다. 상기 전사 활성화 도메인은 야생형이거나, 원래 전사 활성화 도메인의 변형되거나 절두된 버전일 수 있다.

전사 억제인자 도메인

몇몇 실시태양에서, 상기 융합 단백질의 효과기 도메인은 전사 억제인자 도메인이다. 일반적으로 전사 억제인자 도메인은 전사 통제 요소 및/또는 전사 조절 단백질(즉 전사 인자, RNA 폴리머라제 등)과 상호작용하여 유전자의 전사를 감소시키고/시키거나 방지한다. 몇몇 실시태양에서, 상기 전사 억제인자 도메인은 유도성 cAMP 조기 억제인자(ICER) 도메인, 크루펠-결합된 박스 A(KRAB-A) 억제인자 도메인, YY1 글리신 풍부 억제인자 도메인, Sp1-형 억제인자, E(spI) 억제인자, IκB 억제인자, 또는 MeCP2이다.

후성적 변형 도메인

몇몇 실시태양에서, 상기 융합 단백질의 효과기 도메인은 후성적인 변형 도메인이다. 일반적으로, 후성적인 변형 도메인은 히스톤 구조 및/또는 염색체 구조를 변형시킴으로써 유전자 발현을 변경시킨다. 몇몇 실시태양에서, 상기 후성적인 변형 도메인은 히스톤 아세틸트랜스퍼라제 도메인, 히스톤 데아세틸라제 도메인, 히스톤 메틸트랜스퍼라제 도메인, 히스톤 데메틸라제 도메인, DNA 메틸트랜스퍼라제 도메인, 또는 DNA 데메틸라제 도메인이다.

추가적인 도메인들

몇몇 실시태양에서, 상기 융합 단백질은 적어도 하나의 추가적인 도메인을 추가로 포함한다. 적합한 추가적인 도메인의 비제한적인 예는 핵 국소화 신호(NLS), 세포-침투 또는 전좌 도메인, 및 마커 도메인을 포함한다. NLS는 일반적으로 염기성 아미노산의 신장부를 포함한다. 예를 들어, 문헌[Lange et al. (2007) J. Biol. Chem., 282, 5101-5]을 참조하시오. 예를 들어, 몇몇 실시태양에서, 상기 NLS는 단분입자 서열, 예를 들어 PKKKRKV(서열번호 2) 또는 PKRRV(서열번호 3)이다. 몇몇 실시태양에서, NLS는 이분입자 서열이다. 몇몇 실시태양에서, NLS는 KRPAATKKAGQAKKK(서열번호 4)이다.

몇몇 실시태양에서, 상기 융합 단백질은 적어도 하나의 세포-침투성 도메인을 포함한다. 몇몇 실시태양에서, 상기 세포-침투성 도메인은 HIV-1 TAT 단백질로부터 유래된 세포-침투성 펩타이드 서열이다. 일례로서, 상기 TAT 세포-침투성 서열은 GRKKRRQRRRPPQPKKKRKV(서열번호 5)일 수 있다. 몇몇 실시태양에서, 상기 세포-침투성 도메인은 TLM(PLSSIFSRIGDPPKKKRKV; 서열번호 6), 인간 B형 간염 바이러스로부터 유래된 세포-침투성 펩타이드 서열이다. 몇몇 실시태양에서, 상기 세포-침투성 도메인은 MPG(GALFLGWLGAAGSTMGAPKKRKV; 서열번호 7 또는 GALFLGFLGAAGSTMGAWSQPKKKRV; 서열번호 8)이다. 몇몇 실시태양에서, 상기 세포-침투성 도메인은 Pep-1(KETWWETWWTEWSQPKKKRKV; 서열번호 9), VP22, 헤르페스 단순 바이러스로부터의 세포 침투성 펩타이드, 또는 폴리아르기닌 펩타이드 서열이다.

몇몇 실시태양에서, 상기 융합 단백질은 적어도 하나의 마커 도메인을 포함한다. 마커 도메인의 비제한적인 예는 형광 단백질, 정제 태그, 및 에피토프 태그를 포함한다. 몇몇 실시태양에서, 상기 마커 도메인은 형광 단백질이다. 적합한 형광 단백질의 비제한적인 예는 녹색 형광 단백질(예를 들어, GFP, GFP-2, 태그GFP, 터보GFP, EGFP, 에머랄드, 아자미 그린, 단량체성 아자미 그린, CopGFP, AceGFP, Zs그린l), 황색 형광 단백질(예를 들어, YFP, EYFP, 시트린, 비너스, YPet, PhiYFP, Zs옐로우l,), 청색 형광 단백질(예를 들어, EBFP, EBFP2, 아주라이트, mKalamal, GFPuv, 사파이어, T-사파이어), 시안 형광 단백질(예를 들어, ECFP, 세룰린, CyPet, Am시안l, 미도리이시-시안), 적색 형광 단백질(mKate, mKate2, m플럼, Ds레드 단량체, m체리, mRFPl, Ds레드-익스프레스, Ds레드2, Ds레드-단량체, Hc레드-탠덤, Hc레드l, As레드2, eqFP61 1, m라스베리, m스트로베리, J레드), 오렌지 형광 단백질(m오렌지, mKO, 쿠사비라-오렌지, 단량체성 쿠사비라-오렌지, m탄제린, td토마토) 및 임의의 다른 적합한 형광 단백질들을 포함한다. 몇몇 실시태양에서, 상기 마커 도메인은 정제 태그 및/또는 에피토프 태그이다. 예시적인 태그는 비제한적으로 글루타치온-S-트랜스퍼라제(GST), 키틴 결합 단백질(CBP), 말토스 결합 단백질, 티오레독신(TRX), 폴리(NANP), 탠덤 친화성 정제(TAP) 태그, myc, AcV5, AU1, AU5, E, ECS, E2, FLAG, HA, nus, 소프트태그(Softag) 1, 소프트태그 3, 스트렙(Strep), SBP, Glu-Glu, HSV, KT3, S, SI, T7, V5, VSV-G, 6xHis, 비오틴 카복실 담체 단백질(BCCP), 및 칼모듈린을 포함한다.

V. 용도 및 방법

하나의 태양에서, 본 발명은 Cas 단백질에 의한 표적 폴리뉴클레오타이드의 절단 방법을 제공한다. 상기 방법은 표적 폴리뉴클레오타이드를 (i) 본 명세서에 기재된 가이드 RNA 또는 가이드 RNA 분자들의 세트, 및 (ii) Cas 단백질과 접촉시킴을 포함한다. 몇몇 실시태양에서, 상기 방법은 상기 표적 폴리뉴클레오타이드 중에 이중-가닥 끊김을 생성시킨다. 몇몇 실시태양에서, 상기 Cas 단백질은 단일-가닥 틈 형성 활성을 갖는 Cas 단백질이다. 몇몇 실시태양에서, 상기 방법은 상기 표적 폴리뉴클레오타이드 중에 단일-가닥 끊김을 생성시킨다. 몇몇 실시태양에서, 가이드 RNA 및 단일-가닥 틈 형성 활성을 갖는 Cas 단백질을 포함하는 복합체를 서열-표적화된 단일-가닥 DNA 절단, 즉 틈 형성에 사용한다.

하나의 태양에서, 본 발명은 Cas 단백질에 의한 2개 이상의 표적 폴리뉴클레오타이드의 절단 방법을 제공한다. 상기 방법은 표적 폴리뉴클레오타이드를 (i) 본 명세서에 기재된 가이드 RNA 분자들의 세트, 및 (ii) Cas 단백질과 접촉시킴을 포함한다. 몇몇 실시태양에서, 상기 방법은 상기 표적 폴리뉴클레오타이드 중에 이중-가닥 끊김을 생성시킨다. 몇몇 실시태양에서, 상기 Cas 단백질은 단일-가닥 틈 형성 활성을 갖는 Cas 단백질이다. 몇몇 실시태양에서, 상기 방법은 상기 표적 폴리뉴클레오타이드 중에 단일-가닥 끊김을 생성시킨다. 몇몇 실시태양에서, 가이드 RNA 및 단일-가닥 틈 형성 활성을 갖는 Cas 단백질을 포함하는 복합체를 서열-표적화된 단일-가닥 DNA 절단, 즉 틈 형성에 사용한다.

하나의 태양에서, 본 발명은 Cas 단백질과 표적 폴리뉴클레오타이드의 결합 방법을 제공한다. 상기 방법은 표적 폴리뉴클레오타이드를 (i) 본 명세서에 기재된 가이드 RNA 또는 가이드 RNA 분자들의 세트, 및 (ii) Cas 단백질과 접촉시켜 상기 표적 폴리뉴클레오타이드와 상기 Cas 단백질과의 결합을 생성시킨다. 몇몇 실시태양에서, 상기 Cas 단백질은 Cas 변체이다. 몇몇 실시태양에서, 상기 Cas 변체는 대응하는 야생형 Cas 단백질에 비해 일부 또는 모든 뉴클레아제 활성이 없다.

하나의 태양에서, 본 발명은 Cas 단백질과 2개 이상의 표적 폴리뉴클레오타이드의 결합 방법을 제공한다. 상기 방법은 표적 폴리뉴클레오타이드를 (i) 본 명세서에 기재된 RNA 분자들의 세트, 및 (ii) Cas 단백질과 접촉시켜 상기 표적 폴리뉴클레오타이드와 상기 Cas 단백질과의 결합을 생성시킨다. 몇몇 실시태양에서, 상기 Cas 단백질은 Cas 변체이다. 몇몇 실시태양에서, 상기 Cas 변체는 대응하는 야생형 Cas 단백질에 비해 일부 또는 모든 뉴클레아제 활성이 없다.

하나의 태양에서, 본 발명은 Cas 단백질을 표적 폴리뉴클레오타이드에 표적화하는 방법을 제공한다. 상기 방법은 상기 Cas 단백질을 본 명세서에 기재된 가이드 RNA 또는 가이드 RNA 분자들의 세트와 접촉시킴을 포함한다. 몇몇 실시태양에서, 상기 방법은 가이드 RNA:Cas 단백질 복합체를 형성시킨다. 몇몇 실시태양에서, 상기 Cas 단백질은 야생형 Cas9 단백질이다. 몇몇 실시태양에서, 상기 Cas 단백질은 Cas9 단백질의 돌연변이체 또는 변체이다. 몇몇 실시태양에서, 상기 Cas 단백질은 단일-가닥 틈 형성 활성을 갖는 Cas 단백질이다. 몇몇 실시태양에서, 상기 Cas 단백질은 뉴클레아제 활성이 없는 Cas 단백질(예를 들어, Cas 단백질의 뉴클레아제-결핍 돌연변이체)이다. 몇몇 실시태양에서, 상기 Cas 단백질은 융합 단백질(예를 들어, (i) Cas 단백질 및 (ii) 비상동 폴리펩타이드를 포함하는 융합 단백질)의 부분이다.

하나의 태양에서, 본 발명은 Cas 단백질을 2개 이상의 표적 폴리뉴클레오타이드에 표적화하는 방법을 제공한다. 상기 방법은 상기 Cas 단백질을 본 명세서에 기재된 가이드 RNA 분자들의 세트와 접촉시킴을 포함한다. 몇몇 실시태양에서, 상기 방법은 가이드 RNA:Cas 단백질 복합체를 형성시킨다. 몇몇 실시태양에서, 상기 Cas 단백질은 야생형 Cas9 단백질이다. 몇몇 실시태양에서, 상기 Cas 단백질은 Cas9 단백질의 돌연변이체 또는 변체이다. 몇몇 실시태양에서, 상기 Cas 단백질은 단일-가닥 틈 형성 활성을 갖는 Cas 단백질이다. 몇몇 실시태양에서, 상기 Cas 단백질은 뉴클레아제 활성이 없는 Cas 단백질(예를 들어, Cas 단백질의 뉴클레아제-결핍 돌연변이체)이다. 몇몇 실시태양에서, 상기 Cas 단백질은 융합 단백질(예를 들어, (i) Cas 단백질 및 (ii) 비상동 폴리펩타이드를 포함하는 융합 단백질)의 부분이다.

몇몇 실시태양에서, 상기 가이드 RNA를 형질감염에 의해 세포에 도입시킨다. RNA 형질감염 기법은 당해 분야에 공지되어 있으며 일렉트로포레이션 및 리포펙션을 포함한다. RNA 형질감염에 유효한 기법은 대개 세포 유형에 따라 변한다. 예를 들어, 문헌[Lujambio et al. (Spanish National Cancer Centre) Cancer Res. Feb. 2007](HTC-116 결장암 세포의 형질감염 및 상업적으로 수득된, 변형된 miRNA 또는 전구체 miRNA의 형질감염을 위한 올리고펙타민(인비트로젠)의 용도를 기재한다)을 참조하시오. 또한 문헌[Cho et al. (Seoul National Univ.) Nat. Biotechnol. Mar. 2013](K562 세포의 형질감염 및 전사된 sgRNA(약 60 nt 길이)의 형질감염을 위한 4D 뉴클레오펙션(Nucleofection)(상표)(론자(Lonza)) 일렉트로포레이션의 용도를 기재한다)을 참조하시오. RNA의 형질감염 기법은 또한 당해 분야에 공지되어 있다. 예를 들어, 치료학적 RNA를 인배신(Invasin) 단백질(β-1 인테그린 단백질을 발현하는 세포내로의 흡수를 촉진하기 위해서)로 코팅된 비-병원성 에스케리키아 콜라이 중에서, 에스케리키아 콜라이로부터 세포질내로의 shRNA의 통과를 허용하기 위해 리스테리올리신 O 기공-형성 단백질을 발현하도록 암호화된 에스케리키아 콜라이와 함께 전달하였다. 또한 문헌[Cho et al. (Seoul National Univ.) Nat. Biotechnol. Mar. 2013]을 참조하시오.

몇몇 실시태양에서, 상기 가이드 RNA를 세포내에 도입시키거나 전달한다. 가이드 RNA의 전달에 사용될 수 있는 기술은 생분해성 중합체, 리포솜 또는 나노입자에 의한 캡슐화를 사용하는 것들을 포함한다. 상기와 같은 중합체, 리포솜 및 나노입자를 정맥내로 전달할 수 있다. 몇몇 실시태양에서, 생체내 전달을 위해, 가이드 RNA를 조직 부위에 주사하거나 전신적으로 투여할 수 있다. 생체내 전달을 또한 베타-글루칸 전달 시스템, 예를 들어 미국특허 제 5,032,401 호 및 미국특허 제 5,607,677 호, 및 미국특허 공보 제 2005/0281781 호(이들은 내용 전체가 본 명세서에 참고로 인용된다)에 기재된 것들에 의해 수행할 수 있다. 몇몇 실시태양에서, 가이드 RNA 또는 가이드 RNA를 함유하는 전달 비히클을 특정한 조직 또는 신체 구획에 표적화한다. 예를 들어, 몇몇 실시태양에서, 외인성 RNA를 다른 조직에 표적화하기 위해서, 합성 담체를 세포-특이성 리간드 또는 수용체 흡수용 앱타머, 예를 들어 PEG로 코팅되고 트랜스페린 수용체(종양 세포에서 고도로 발현된다)를 통한 흡수를 위해 인간 트랜스페린 단백질로 기능화된 사이클로덱스트린 나노입자 중에 싸인 RNA로 장식한다. 추가적인 접근법들은 본 명세서에서 하기에 기재되거나 당해 분야에 공지되어 있다.

본 발명을 문헌[Hendel et al., Nat. Biotechnol. (2015) 33:9, 985-9](내용 전체가 본 출원에 인용된다)에 기재된 바와 같이 인간 세포에서 시험하였다. 상기 인용된 연구에서, 변형된 가이드 RNA를 K562 세포, 인간 1차 T 세포, 및 CD34+ 조혈모세포 및 전구세포(HSPC)에 도입시켰다. 상기 변형된 가이드 RNA는 변형되지 않은 가이드 RNA에 비해, 인간 1차 T 세포 및 CD34+ HSPC를 포함한 인간 세포에서 게놈 편집 효율을 현저하게 증대시켰다.

도 11a 및 11b는 인간 세포주에서 유전자 파괴가 인델의 높은 빈도에 의해서 또는 본 명세서에 개시된 합성되고 화학적으로 변형된 sgRNA를 사용하는 절단-자극된 상동성 재조합에 의해 성취될 수 있음을 보이는 실험 결과를 예시한다. 변이도입성 NHEJ에 의한 유전자 파괴를, PCR 앰플리콘의 심층 서열분석(도 12a)에 의해서 또는 합성 sgRNA와 함께 Cas9에 의해 유도된 K562 세포 중 3개의 유전자좌 IL2RG, HBB 및 CCR5에서의 HR에 의한 유전자 편집(도 12b)에 의해 측정하였다. 상기 합성 sgRNA를 100만 세포당 1 ㎍(밝은 음영) 또는 20 ㎍(어두운 음영)으로 전달하였다. Cas9는 플라스미드(2 ㎍)로부터 발현되었으며 HR 실험의 경우 5 ㎍의 GFP-암호화 공여 플라스미드가 포함되었다. 양성 대조군으로서 상기 sgRNA 및 Cas9 단백질을 모두 암호화하는 2 ㎍의 sgRNA 플라스미드가 사용되었다(회색 막대). 막대는 평균값 + s.e.m.을 나타낸다, n=3.

도 12a, 12b, 12c 및 12d는 본 명세서에 기재된 바와 같은 화학적으로 변형된 sgRNA를 사용하여, 자극된 1차 인간 T 세포 및 CD34+ 조혈모세포 및 전구세포(HSPC)에서 유전자 파괴 또는 표적화된 게놈 편집의 높은 빈도를 성취할 수 있음을 나타내는 실험 결과를 예시한다.

도 12a는 10 ㎍의 합성 CCR5 sgRNA 및 15 ㎍의 Cas9 mRNA 또는 1 ㎍의 Cas9-암호화 플라스미드로 뉴클레오펙션된 1차 인간 T 세포로부터의 결과를 예시한다. 상기 sgRNA 및 Cas9 단백질을 모두 암호화하는 1 ㎍의 sgRNA 플라스미드를 비교를 위해 포함시켰다. 막대는, 상기 sgRNA 표적 부위에 걸쳐 있고 대조군 참조로서 모의-처리된 샘플을 사용하는 PCR 앰플리콘의 TIDE(분해에 의한 인델의 추적) 분석에 의해 측정된 바와 같은, 3개의 상이한 공여체들에 대한 평균 인델 빈도 + s.e.m.을 나타내며, n=6이다. 변형되지 않거나 M-변형된 sgRNA와 함께 Cas9 mRNA의 전달 및 상기 sgRNA 및 Cas9 모두를 암호화하는 플라스미드의 뉴클레오펙션은 배경 이상의 대립유전자 변형 빈도를 생성시키지 않았다. Cas9에 대한 DNA 발현 플라스미드와 MSP-변형된 sgRNA의 동시-형질감염은 9.3% 인델 빈도를 생성시켰다. 상기 MS- 또는 MSP-변형된 sgRNA와 Cas9 mRNA는 각각 48.7% 및 47.9% 인델 빈도를 생성시켰다.

도 12b는 자극된 T 세포로부터의 결과를 예시한다. 상기 세포는 상기와 같이, 그러나 2.5 몰 과잉의 상기 지시된 합성 CCR5·sgRNA와 복합체화된 15 ㎍ Cas9 단백질로 뉴클레오펙션되었다. 인델 빈도를 TIDE 분석에 의해 측정하였다. 막대는 3개의 상이한 공여체에 대한 평균 인델 빈도 + s.e.m.을 나타내며, n=6이다. 상기 변형되지 않은 sgRNA에 대한 상기 MS-변형된 sgRNA의 인델 빈도의 2.4-배 개선(30.7% 대 12.8%)이, Cas9 단백질과 복합체화되어 전달시 화학적으로 변형된 sgRNA에 대해 관찰되었다. 이러한 결과는 화학적으로 변형된 sgRNA를 Cas9 단백질과 복합체화되어 전달시 자극된 T 세포의 게놈 편집에 사용할 수 있음을 확립시킨다.

도 12c는 인간 말초 혈액 CD34+ HSPC로부터의 결과를 예시한다. 500,000개의 동원된 세포를 IL2RG 또는 HBB를 표적화하는 10 ㎍의 상기 지시된 합성 sgRNA 및 15 ㎍의 Cas9 mRNA 또는 1 ㎍의 Cas9 플라스미드 1로 뉴클레오펙션시켰다. 상기 sgRNA 및 Cas9 단백질을 모두 암호화하는 1 ㎍의 sgRNA 플라스미드를 비교를 위해 포함시켰다. 막대는 T7 엔도뉴클레아제 절단 분석에 의해 측정된 바와 같은, 평균 인델 빈도 + s.e.m., n=3을 나타내었다. 인델은 Cas9 mRNA와 동시-형질감염시 변형되지 않거나 M-변형된 sgRNA를 사용하여 어느 한 유전자좌에서도 검출되지 않았다. 그러나, 상기 IL2RG MS- 및 MSP-변형된 sgRNA는 각각 17.5% 및 17.7% 인델 빈도를 나타내었고, 상기 HBB MS- 및 MSP-변형된 sgRNA의 경우 각각 23.4% 및 22.0%를 나타내었다.

도 12d는 자극된 T 세포 또는 동원된 인간 말초 혈액 CD34+·HSPC로부터의 결과를 예시한다. 100만개의 세포를 15 ㎍의 Cas9 mRNA 및 10 ㎍의 상기 지시된 합성 CCR5 sgRNA로 뉴클레오펙션시켰다. 최근의 연구는 2개의 sgRNA의 동시 사용이 인간 1차 T 세포 및 CD34+ HSPC에서 유전자 파괴를 개선시킬 수 있음을 나타내었다. 예를 들어, 문헌[Mandal et al. (2014) Cell Stem Cell, 15, 643-52]을 참조하시오. MS- 및 MSP-변형된 CCR5 sgRNA를 만달(Mandal) 연구에서 보고된 서열들('D' 및 'Q'라 칭함)(205 염기쌍을 분리 절단시킨다)로 화학적으로 합성하였다. 각각의 sgRNA의 양은 함께 사용시 5 ㎍이었다. 단일 sgRNA를 갖는 샘플에 대한 인델 빈도를 상기와 같은 TIDE 분석에 의해 측정하였으며 2개의 sgRNA를 갖는 샘플에 대한 대립유전자 파괴 빈도를 클로닝된 PCR 산물의 서열분석에 의해 측정하였다. 막대는 평균 인델 빈도 + s.e.m., n=3을 나타낸다. T 세포에서, 'D' sgRNA는 단독으로 상기 MS- 및 MSP-변형된 sgRNA에 대해 각각 56.0% 및 56.3% 인델을 생성시켰고, 'Q' sgRNA는 각각 62.6% 및 69.6% 인델을 생성시켰다. 함께 사용시 대립유전자 변형의 빈도는, 우리가 상기 MS- 및 MSP-변형된 sgRNA에 대해 각각 73.9% 및 93.1% 인델로 관찰한 바와 같이 증가하였으며, 상기 중 변형 사건의 대부분은 상기 2개의 sgRNA 표적 부위들간의 결실이었다. CD34+ HSPC에서, 전체적인 빈도가 더 낮았지만 관찰은 유사하였다. 'D' sgRNA의 경우, 상기 MS- 및 MSP-변형된 sgRNA에 대해 각각 9.8% 및 11.2%의 대립유전자 변형 빈도, 및 상기 'Q' sgRNA에 대해 17.8% 및 19.2%가 관찰되었다. 함께 사용시 상기 MS- 및 MSP-변형된 sgRNA에 대한 빈도는 각각 37.8% 및 43.0%까지 증가하였다. 이는 상기 2개의 화학적으로 변형된 sgRNA의 사용이 1차 인간 T 세포 및 CD34+ HSPC에서 유전자 파괴를 촉진하는데 매우 유효한 방식임을 나타낸다.

다른 사용 예들은 하기에 기재하는 바와 같은 게놈 편집 및 유전자 발현 조절을 포함한다.

게놈 편집

하나의 태양에서, 본 발명은 생체내 또는 시험관내("생체내"는 비제한적으로 무세포 시스템, 세포 용해물, 세포의 단리된 성분, 및 살아있는 유기체 밖의 세포를 포함한다)에서 DNA 서열을 변형시키기 위한 게놈 편집 방법을 제공한다. 상기 DNA 서열은 염색체 서열, 에피솜 서열, 플라스미드, 미토콘드리아 DNA 서열, 또는 기능성 유전자간 서열, 예를 들어 인헨서 서열 또는 비-암호화 RNA에 대한 DNA 서열을 포함할 수 있다. 상기 방법은 상기 DNA 서열을 (i) 본 명세서에 기재된 가이드 RNA 또는 가이드 RNA 분자들의 세트, 및 (ii) Cas 단백질과 접촉시킴을 포함한다. 몇몇 실시태양에서, 상기 DNA 서열을 세포 밖에서 접촉시킨다. 몇몇 실시태양에서, 상기 DNA 서열을 세포내의 게놈 중에 위치시키고 시험관내 또는 생체내에서 접촉시킨다. 몇몇 실시태양에서, 상기 세포는 유기체 또는 조직내에 있다. 몇몇 실시태양에서, 상기 세포는 인간 세포, 비-인간 포유동물 세포, 줄기 세포, 비-포유동물 척추동물 세포, 무척추동물 세포, 식물 세포, 단세포 유기체 또는 배아이다. 몇몇 실시태양에서, 상기 가이드 RNA는 상기 Cas 단백질을 상기 DNA 서열 중 표적화된 부위에 표적화하는 것을 돕는다. 몇몇 실시태양에서, 상기 Cas 단백질은 상기 표적화된 부위에서 상기 DNA 서열의 적어도 하나의 가닥을 절단한다. 몇몇 실시태양에서, 상기 Cas 단백질은 상기 표적화된 부위에서 상기 DNA 서열의 2개의 가닥을 모두 절단한다.

몇몇 실시태양에서, 상기 방법은 상기 Cas 단백질을 세포 또는 또 다른 시스템에 도입시킴을 추가로 포함한다. 몇몇 실시태양에서, 상기 Cas 단백질은 정제된 또는 정제되지 않은 단백질로서 도입된다. 몇몇 실시태양에서, 상기 Cas 단백질은 상기 Cas 단백질을 암호화하는 mRNA를 통해 도입된다. 몇몇 실시태양에서, 상기 Cas 단백질은 상기 Cas 단백질을 암호화하는 선형 또는 환상 DNA를 통해 도입된다. 몇몇 실시태양에서, 상기 세포 또는 시스템은 Cas 단백질 또는 Cas 단백질을 암호화하는 핵산을 포함한다.

몇몇 실시태양에서, 이중-가닥 끊김을 실수유발, 비-상동성 단부-결합("NHEJ") 수복 과정을 통해 수복할 수 있다. 몇몇 실시태양에서, 이중-가닥 끊김을, 공여 폴리뉴클레오타이드 중의 공여 서열이 표적화된 DNA 서열에 통합되거나 상기와 교환될 수 있도록 상동성-지시된 수복(HDR) 과정에 의해 수복할 수 있다.

몇몇 실시태양에서, 상기 방법은 적어도 하나의 공여 폴리뉴클레오타이드를 상기 세포 또는 시스템내에 도입시킴을 추가로 포함한다. 몇몇 실시태양에서, 상기 공여 폴리뉴클레오타이드는 상기 DNA 서열 중의 표적화된 부위의 어느 한쪽 상의 서열과 실질적인 서열 일치성을 갖는 적어도 하나의 상동 서열을 포함한다. 몇몇 실시태양에서, 상기 공여 폴리뉴클레오타이드는 상동성-지시된 수복, 예를 들어 상동성 재조합을 통해 DNA 서열에 통합되거나 상기 서열과 교환될 수 있는 공여 서열을 포함한다.

몇몇 실시태양에서, 상기 공여 폴리뉴클레오타이드는 상류 상동 서열 및 하류 상동 서열을 포함하며, 이들은 각각 상기 DNA 서열 중의 표적화된 부위의 상류 및 하류에 각각 위치한 서열들에 대해 실질적인 서열 일치성을 갖는다. 이러한 서열 유사성은, 예를 들어, 상기 공여 서열이 상기 표적화된 DNA 서열에 통합될 수 있도록(또는 상기 서열과 교환될 수 있도록) 상기 공여 폴리뉴클레오타이드와 표적화된 DNA 서열간의 상동성 재조합을 허용한다.

몇몇 실시태양에서, 상기 DNA 서열 중의 표적 부위(들)는 질환을 야기하거나 상기 질환과 관련될 수 있는 돌연변이, 예를 들어 점 돌연변이, 전좌 또는 역위에 걸쳐있거나 이에 인접한다. 몇몇 실시태양에서, 상기 방법은 상기 세포 또는 시스템에 (i) 돌연변이의 야생형 대응물 및 (ii) 상기 DNA 서열 중의 표적화된 부위의 한쪽 상의 서열과 실질적인 서열 일치성을 갖는 적어도 하나의 상동성 서열을 포함하는 적어도 하나의 공여 폴리뉴클레오타이드를 도입시킴으로써 상기 돌연변이를 교정함을 포함한다. 몇몇 실시태양에서, 상기 공여 폴리뉴클레오타이드는 상기 DNA 서열 중의 표적화된 부위의 한쪽 상의 서열과 실질적인 서열 일치성을 갖는 상동 서열을 포함한다.

몇몇 실시태양에서, 상기 공여 폴리뉴클레오타이드는 상동성-지시된 수복 과정, 예를 들어 상동성 재조합을 통해 상기 표적화된 DNA 서열에 통합되거나 상기 서열과 교환될 수 있는 외인성 서열을 포함한다. 몇몇 실시태양에서, 상기 외인성 서열은, 임의로 외인성 프로모터 조절 서열과 작동적으로 연결되는 단백질 암호화 유전자를 포함한다. 따라서, 몇몇 실시태양에서, 상기 외인성 서열의 통합시, 세포는 상기 통합된 유전자에 의해 암호화된 단백질을 발현할 수 있다. 몇몇 실시태양에서, 상기 외인성 서열을, 수용 세포 또는 시스템에서의 그의 발현이 상기 외인성 프로모터 조절 서열에 의해 조절되도록 상기 표적화된 DNA 서열에 통합시킨다. 상기 표적화된 DNA 서열내 외인성 유전자의 통합을 "녹인(knock in)"이라 칭한다. 다른 실시태양에서, 상기 외인성 서열은 전사 조절 서열, 또 다른 발현 조절 서열, RNA 암호화 서열 등일 수 있다.

몇몇 실시태양에서, 상기 공여 폴리뉴클레오타이드는, 표적화된 부위 또는 그 부근에서 DNA 서열의 일부와 필수적으로 동일하지만 적어도 하나의 뉴클레오타이드 변화를 포함하는 서열을 포함한다. 예를 들어, 몇몇 실시태양에서, 상기 공여 서열은, 상기 표적화된 부위와 통합 또는 교환시, 상기 표적화된 부위에 생성되는 서열이 적어도 하나의 뉴클레오타이드 변화를 포함하도록 상기 표적화된 부위 또는 그 부근에서 상기 DNA 서열의 변형되거나 돌연변이된 버전을 포함한다. 몇몇 실시태양에서, 상기 적어도 하나의 뉴클레오타이드 변화는 하나 이상의 뉴클레오타이드의 삽입, 하나 이상의 뉴클레오타이드의 결실, 하나 이상의 뉴클레오타이드의 치환, 또는 이들의 조합이다. 상기 변형된 서열의 통합의 결과로서, 상기 세포는 상기 표적화된 DNA 서열로부터 변형된 유전자 산물을 생성시킬 수 있다.

몇몇 실시태양에서, 상기 방법은 다중복합체 적용을 위한 것이다. 몇몇 실시태양에서, 상기 방법은 가이드 RNA의 라이브러리를 세포 또는 시스템에 도입시킴을 포함한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 100개의 독특한 가이드 서열을 포함한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 1,000개의 독특한 가이드 서열을 포함한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 10,000개의 독특한 가이드 서열을 포함한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 100,000개의 독특한 가이드 서열을 포함한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 1,000,000개의 독특한 가이드 서열을 포함한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 10개의 상이한 폴리뉴클레오타이드 또는 하나 이상의 폴리뉴클레오타이드내의 적어도 10개의 상이한 서열을 표적화한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 100개의 상이한 폴리뉴클레오타이드 또는 하나 이상의 폴리뉴클레오타이드내의 적어도 100개의 상이한 서열을 표적화한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 1000개의 상이한 폴리뉴클레오타이드 또는 하나 이상의 폴리뉴클레오타이드내의 적어도 1000개의 상이한 서열을 표적화한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 10,000개의 상이한 폴리뉴클레오타이드 또는 하나 이상의 폴리뉴클레오타이드내의 적어도 10,000개의 상이한 서열을 표적화한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 100,000개의 상이한 폴리뉴클레오타이드 또는 하나 이상의 폴리뉴클레오타이드내의 적어도 100,000개의 상이한 서열을 표적화한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 1,000,000개의 상이한 폴리뉴클레오타이드 또는 하나 이상의 폴리뉴클레오타이드내의 적어도 1,000,000개의 상이한 서열을 표적화한다.

인간 및 포유동물 세포에서 게놈 편집

본 발명의 실시태양은 포유동물 세포에서 표적 폴리뉴클레오타이드, 예를 들어 DNA 서열을 변형시키기 위한 게놈 편집 방법에 유용하다.

몇몇 실시태양에서, 상기 DNA 서열은 염색체 서열이다. 몇몇 실시태양에서, 상기 DNA 서열은 단백질-암호화 서열이다. 몇몇 실시태양에서, 상기 DNA 서열은 기능성 유전자간 서열, 예를 들어 인헨서 서열 또는 비-암호화 서열이다. 몇몇 실시태양에서, 상기 DNA는 인간 유전자의 부분이다. 일부 상기와 같은 실시태양에서, 상기 인간 유전자는 클라트린 경쇄(CLTA1) 유전자, 인간 인터류킨 2 수용체 감마(IL2RG) 유전자, 인간 세포독성 T-림프구-관련된 단백질 4(CLTA4) 유전자, 인간 프로토카데린 알파 4(PCDHA4) 유전자, 인간 분절발생 호메오박스 1(EN1) 유전자), 인간 헤모글로빈 베타(HBB) 유전자(겸상 적혈구 빈혈 및 지중해 빈혈의 원인 돌연변이를 가질 수 있다), 또는 인간 케모킨(C-C 동기) 수용체 5(CCR5) 유전자(HIV의 공-수용체를 암호화한다)이다.

몇몇 실시태양에서, 상기 포유동물 세포는 인간 세포이다. 일부 상기와 같은 실시태양에서, 상기 인간 세포는 1차 인간 세포이다. 추가의 실시태양에서, 상기 1차 인간 세포는 인간 1차 T 세포이다. 상기 인간 1차 T 세포는 자극되거나 자극되지 않을 수도 있다. 몇몇 실시태양에서, 상기 인간 세포는 줄기/전구세포, 예를 들어 CD34+ 조혈모세포 및 전구세포(HSPC)이다. 몇몇 실시태양에서, 상기 인간 세포는 배양된 세포주, 예를 들어 상업적으로 입수될 수 있는 세포주로부터 유래한다. 예시적인 세포주는 K562 세포, 인간 골수성 백혈병 세포주를 포함한다.

몇몇 실시태양에서, 상기 세포는 살아있는 유기체내에 있다. 몇몇 다른 실시태양에서, 상기 세포는 살아있는 유기체 밖에 있다.

상기 방법은 상기 DNA 서열을 (i) 본 명세서에 기재된 가이드 RNA 또는 가이드 RNA 분자들의 세트, 및 (ii) Cas 단백질과 접촉시킴을 포함한다.

몇몇 실시태양에서, 상기 방법은 상기 가이드 RNA를 상기 세포내로 도입하거나 전달함을 추가로 포함한다. 일부 상기와 같은 실시태양에서, 상기 가이드 RNA를 형질감염에 의해 세포내에 도입시킨다. RNA 형질감염 기법은 당해 분야에 공지되어 있으며 일렉트로포레이션 및 리포펙션을 포함한다. 다른 실시태양에서, 상기 가이드 RNA를 뉴클레오펙션에 의해 세포(및 보다 특히 세포 핵)내로 도입시킨다. 뉴클레오펙션 기법은 당해 분야에 공지되어 있으며 뉴클레오펙션 장치, 예를 들어 론자 뉴클레오펙터 2b 또는 론자 4D-뉴클레오펙터 및 관련 시약들을 사용할 수 있다.

몇몇 실시태양에서, 상기 방법은 상기 Cas 단백질을 상기 세포에 도입시키거나 전달함을 추가로 포함한다. 일부 상기와 같은 실시태양에서, 상기 Cas 단백질을 정제되거나 정제되지 않은 단백질로서 도입시킨다. 다른 실시태양에서, 상기 Cas 단백질을 상기 Cas 단백질을 암호화하는 mRNA를 통해 도입시킨다. 일부 상기와 같은 실시태양에서, 상기 Cas 단백질을 암호화하는 mRNA를 뉴클레오펙션에 의해 세포내로 도입시킨다. 다른 실시태양에서, 상기 Cas 단백질을 암호화하는 mRNA를 뉴클레오펙션에 의해 세포(및 보다 특히 세포 핵)내로 도입시킨다.

몇몇 실시태양에서, 상기 방법은 상기 Cas 단백질이 상기 가이드 RNA와의 복합체 중에서 상기 세포내로 도입되도록 리보뉴클레오단백질(RNP)-기반 전달을 사용한다. 예를 들어, Cas9 단백질을 Cas9:gRNA 복합체 중의 가이드 RNA와 복합체화시킬 수 있으며, 이는 상기 gRNA와 Cas 단백질의 동시-전달을 허용한다. 예를 들어, 상기 Cas:gRNA 복합체를 세포내에 뉴클레오펙션시킬 수 있다.

몇몇 실시태양에서, 상기 방법은 모든-RNA 전달 플랫폼을 사용한다. 예를 들어, 일부 상기와 같은 실시태양에서, 상기 가이드 RNA 및 상기 Cas 단백질을 암호화하는 mRNA를 상기 세포내에 동시에 또는 실질적으로 동시에(예를 들어, 동시-형질감염 또는 동시-뉴클레오펙션에 의해) 도입시킨다. 몇몇 실시태양에서, Cas mRNA 및 변형된 gRNA의 동시-전달은 Cas mRNA 및 변형되지 않은 gRNA의 동시-전달에 비해 더 높은 편집 효율을 생성시킨다. 특히, 5' 및 3' 단부 모두에서 3개의 말단 뉴클레오타이드에 통합된 2'-O-메틸-3'-포스포로티오에이트(MS), 또는 2'-O-메틸-3'-티오PACE(MSP)를 갖는 gRNA는 변형되지 않은 gRNA에 비해 보다 높은 편집 빈도를 제공한다.

몇몇 실시태양에서, 상기 가이드 RNA 및 상기 Cas 단백질을 암호화하는 mRNA를 세포에 연속적으로 도입시킨다; 즉, 상기 가이드 RNA 및 상기 Cas 단백질을 암호화하는 mRNA를 상기 세포에 상이한 시점에서 도입시킨다. 각 작용제 도입 사이의 기간은 수분(이하) 내지 수시간 또는 수일의 범위일 수 있다. 예를 들어, 일부 상기와 같은 실시태양에서, gRNA를 먼저 전달한 다음, Cas mRNA를 4, 8, 12 또는 24시간 후에 전달한다. 다른 상기와 같은 실시태양에서, Cas mRNA를 먼저 전달한 다음, gRNA를 4, 8, 12 또는 24시간 후에 전달한다. 일부 특정한 실시태양에서, 변형된 gRNA를 먼저 전달한 다음 Cas mRNA를 전달하는 것은, 변형되지 않은 gRNA를 전달한 다음 Cas mRNA를 전달하는 것에 비해 더 높은 편집 효율을 생성시킨다.

몇몇 실시태양에서, 상기 gRNA를 상기 Cas 단백질을 암호화하는 DNA 플라스미드와 함께 상기 세포내에 도입시킨다. 일부 상기와 같은 실시태양에서, 상기 gRNA 및 상기 Cas 단백질을 암호화하는 DNA 플라스미드를 뉴클레오펙션에 의해 상기 세포내에 도입시킨다. 일부 특정한 실시태양에서, RNP-기반 전달 플랫폼 또는 모든-RNA 전달 플랫폼은 DNA 플라스미드-기반 전달 시스템보다 1차 세포에서 더 낮은 세포독성을 제공한다.

몇몇 실시태양에서, 상기 방법은 인간 1차 T 세포 및 CD34+HSPC를 포함한 인간 세포에서 현저하게 증대된 게놈 편집 효율을 제공한다.

몇몇 실시태양에서, 변형된 gRNA는 변형되지 않은 gRNA에 비해, 삽입 또는 결실(인델)의 빈도를 증가시킨다(이는 변이도입 NHEJ 및 유전자 파괴를 가리킬 수 있다). 특히, 5' 및 3' 단부 모두에서 3개의 말단 뉴클레오타이드에 통합된 2'-O-메틸-3'-포스포로티오에이트(MS), 또는 2'-O-메틸-3'-티오PACE(MSP)를 갖는 변형된 gRNA는 변형되지 않은 gRNA에 비해 인델의 빈도를 증가시킨다.

몇몇 실시태양에서, 변형된 gRNA 및 Cas mRNA의 인간 1차 T 세포로의 동시-전달은 변형되지 않은 gRNA 및 Cas mRNA의 동시-전달에 비해 상기 인델의 빈도를 증가시킨다. 특히, 5' 및 3' 단부 모두에서 3개의 말단 뉴클레오타이드에 통합된 2'-O-메틸-3'-포스포로티오에이트(MS), 또는 2'-O-메틸-3'-티오PACE(MSP)를 갖는 변형된 gRNA는 변형되지 않은 gRNA에 비해 인간 1차 T 세포에서 인델의 빈도를 증가시킨다.

몇몇 실시태양에서, 변형된 gRNA는 변형되지 않은 gRNA에 비해 gRNA 안정성을 개선시킨다. 일례로서, 5' 및 3' 단부 모두에서 3개의 말단 뉴클레오타이드에 통합된 2'-O-메틸(M)을 갖는 gRNA는 변형되지 않은 gRNA보다 뉴클레아제에 대한 안정성을 적절히 개선시키며 염기 짝짓기 열안정성을 또한 개선시킨다. 또 다른 예로서, 5' 및 3' 단부 모두에서 3개의 말단 뉴클레오타이드에 통합된 2'-O-메틸-3'-포스포로티오에이트(MS), 또는 2'-O-메틸-3'-티오PACE(MSP)를 갖는 gRNA는 변형되지 않은 gRNA에 비해 뉴클레아제에 대한 안정성을 대단히 개선시킨다. gRNA 단부 변형이 엑소뉴클레아제에 대한 세포내 안정성을 증대시키며, 따라서 Cas mRNA 및 gRNA를 인간 세포내로 동시-전달하거나 연속 전달할 때 게놈 편집의 증가된 효능이 가능할 수 있음이 고려된다.

몇몇 실시태양에서, 변형된 gRNA는 유전자 표적화를 자극하며, 이는 차례로 예를 들어 상동성 재조합 또는 NHEJ에 의한 유전자 편집을 허용한다. 특히, 5' 및 3' 단부 모두에서 3개의 말단 뉴클레오타이드에 통합된 2'-O-메틸-3'-포스포로티오에이트(MS), 또는 2'-O-메틸-3'-티오PACE(MSP)를 갖는 gRNA는 변형되지 않은 gRNA보다 더 높은 수준의 상동성 재조합을 자극한다.

몇몇 실시태양에서, 변형된 gRNA는 높은 특이성을 유지한다. 몇몇 실시태양에서, 표적-상 대 표적-외 인델 빈도의 비는 변형되지 않은 gRNA에 비해 변형된 gRNA에 대해 개선된다. 몇몇 실시태양에서, Cas 단백질과의 RNP 복합체 중에서 전달된 변형된 gRNA는 DNA 플라스미드-기반 전달 시스템에 비해 현저하게 더 양호한 표적-상:표적-외 비를 제공한다.

유전자 발현 조절

몇몇 실시태양에서, 본 명세서에 기재된 가이드 RNA를 관심 유전자의 전사 또는 발현의 조절에 사용한다. 예를 들어, 몇몇 실시태양에서, Cas 단백질(예를 들어, 뉴클레아제-결핍 Cas9) 및 전사 활성제 폴리펩타이드를 포함하는 융합 단백질을 사용하여 유전자의 전사를 증가시킨다. 유사하게, 몇몇 실시태양에서, Cas 단백질(예를 들어, 뉴클레아제-결핍 Cas9) 및 억제인자 폴리펩타이드를 포함하는 융합 단백질을 사용하여 상기 유전자의 전사를 간섭함으로써 유전자 발현을 녹다운시킨다.

적어도 하나의 태양에서, 본 발명은 생체내 또는 시험관내에서 관심 유전자의 발현을 조절하는 방법을 제공한다. 상기 방법은 세포 또는 또 다른 시스템내에 (i) 본 명세서에 기재된 합성 가이드 RNA 및 (ii) 융합 단백질을 도입시킴을 포함한다. 몇몇 실시태양에서, 상기 융합 단백질은 Cas 단백질 및 효과기 도메인, 예를 들어 전사 활성화 도메인, 전사 억제인자 도메인, 또는 후성적 변형 도메인을 포함한다. 몇몇 실시태양에서, 상기 융합 단백질은 돌연변이된 Cas 단백질, 예를 들어 삭제 뉴클레아제인 Cas9 단백질을 포함한다. 몇몇 실시태양에서, 상기 Cas 단백질은 하나 이상의 돌연변이, 예를 들어 D10A, H840A 및/또는 N863A를 함유한다.

몇몇 실시태양에서, 상기 융합 단백질을 정제되거나 정제되지 않은 단백질로서 상기 세포 또는 시스템에 도입시킨다. 몇몇 실시태양에서, 상기 융합 단백질을 상기 융합 단백질을 암호화하는 mRNA를 통해 상기 세포 또는 시스템에 도입시킨다. 몇몇 실시태양에서, 상기 융합 단백질을 상기 융합 단백질을 암호화하는 선형 또는 환상 DNA를 통해 상기 세포 또는 시스템에 도입시킨다.

몇몇 실시태양에서, 상기 가이드 RNA는 상기 융합 단백질이, 염색체 서열, 에피솜 서열, 플라스미드, 미토콘드리아 DNA 서열, 또는 기능성 유전자간 서열, 예를 들어 인헨서 또는 비-암호화 RNA에 대한 DNA 서열을 포함하는 특정한 표적 폴리뉴클레오타이드로 향하는 것을 돕는다. 몇몇 실시태양에서, 상기 효과기 도메인은 상기 표적 폴리뉴클레오타이드 중 서열의 발현을 조절한다. 유전자 발현을 조절하기 위한 가이드 RNA를, 기능성 RNA를 암호화하는 임의의 목적하는 내인성 유전자 또는 서열을 표적화하도록 설계할 수 있다. 게놈 표적 서열을 상기 내인성 유전자의 전사 출발 부위의 부근에서, 또는 한편으로 상기 내인성 유전자의 번역 개시 부위의 부근에서 선택할 수 있다. 몇몇 실시태양에서, 상기 표적 서열은 전통적으로 유전자의 "프로모터 근위" 영역이라 지칭되는 DNA의 영역 중에 있다. 몇몇 실시태양에서, 상기 표적 서열은 전사 출발 부위의 상류 약 1,000개 염기쌍 내지 상기 전사 출발 부위의 하류 약 1,000개 염기쌍의 영역 중에 있다. 몇몇 실시태양에서, 상기 표적 서열은 상기 유전자의 전사 출발 부위로부터 멀리 있다(예를 들어, 또 다른 염색체상에).

몇몇 실시태양에서, 상기 방법은 복합체 적용을 위한 것이다. 몇몇 실시태양에서, 상기 방법은 가이드 RNA의 라이브러리를 세포 또는 시스템에 도입시킴을 포함한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 100개, 적어도 1,000개, 적어도 10,000개, 적어도 100,000개 또는 적어도 1,000,000개의 독특한 가이드 서열을 포함한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 10개의 상이한 폴리뉴클레오타이드 또는 하나 이상의 폴리뉴클레오타이드내의 적어도 10개의 상이한 서열을 표적화한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 100개의 상이한 폴리뉴클레오타이드 또는 하나 이상의 폴리뉴클레오타이드내의 적어도 100개의 상이한 서열을 표적화한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 1000개의 상이한 폴리뉴클레오타이드 또는 하나 이상의 폴리뉴클레오타이드내의 적어도 1000개의 상이한 서열을 표적화한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 10,000개의 상이한 폴리뉴클레오타이드 또는 하나 이상의 폴리뉴클레오타이드내의 적어도 10,000개의 상이한 서열을 표적화한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 100,000개의 상이한 폴리뉴클레오타이드 또는 하나 이상의 폴리뉴클레오타이드내의 적어도 100,000개의 상이한 서열을 표적화한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 1,000,000개의 상이한 폴리뉴클레오타이드 또는 하나 이상의 폴리뉴클레오타이드내의 적어도 1,000,000개의 상이한 서열을 표적화한다.

키트

하나의 태양에서, 본 발명은 gRNA:Cas 단백질 복합체를 생성시키고/시키거나 표적 폴리뉴클레오타이드의 결합, 틈 형성 또는 절단을 위한 그의 활성을 지지함을 포함한, 상술한 방법을 수행하기 위한 시약을 함유하는 키트를 제공한다. 몇몇 실시태양에서, 본 명세서에 개시된 방법들을 위한 상기 반응 성분들 중 하나 이상, 예를 들어 하나 이상의 가이드 RNA 및 Cas 단백질을, 사용을 위한 키트의 형태로 공급할 수 있다. 몇몇 실시태양에서, 상기 키트는 Cas 단백질 또는 상기 Cas 단백질을 암호화하는 핵산, 및 본 명세서에 기재된 하나 이상의 가이드 RNA 또는 가이드 RNA들의 세트 또는 라이브러리를 포함한다. 몇몇 실시태양에서, 상기 키트는 하나 이상의 다른 반응 성분을 포함한다. 몇몇 실시태양에서, 적합한 양의 하나 이상의 반응 성분을 하나 이상의 용기에 제공하거나 기재상에서 유지시킨다.

상기 키트의 추가적인 성분의 예는 비제한적으로 하나 이상의 상이한 폴리머라제, 하나 이상의 숙주 세포, 외래 핵산을 숙주 세포에 도입시키기 위한 하나 이상의 시약, 상기 가이드 RNA 및/또는 Cas mRNA 또는 단백질의 발현을 검출하기 위한 또는 표적 핵산의 상태를 확인하기 위한 하나 이상의 시약(예를 들어, 탐침 또는 PCR 프라이머), 및 완충제, 형질감염 시약 또는 반응용 배양 배지(1X 이상 농축된 형태로)를 포함한다. 몇몇 실시태양에서, 상기 키트는 하기의 성분들 중 하나 이상을 포함한다: 생화학적 및 물리적 지지체; 종결, 변형 및/또는 절단 시약; 삼투물질; 및 반응, 형질감염 및/또는 검출용 기구.

상기 사용되는 반응 성분들을 다양한 형태로 제공할 수 있다. 예를 들어, 상기 성분들(예를 들어, 효소, RNA, 탐침 및/또는 프라이머)을 수용액에 현탁시키거나 비드에 결합시키거나 동결 건조된 분말 또는 펠릿으로서 존재할 수 있다. 후자의 경우, 상기 성분들은 재조성 시 배열에 사용하기 위한 성분들의 완전한 혼합물을 형성한다. 본 발명의 키트를 임의의 적합한 온도에서 제공할 수 있다. 예를 들어, 액체 중에 단백질 성분 또는 그의 복합체를 함유하는 키트의 보관을 위해서, 상기를 가능하게는 글리세롤 또는 다른 적합한 부동제를 함유하는 동결-저항 용액 중에서, 0 ℃ 이하, 바람직하게는 약 -20 ℃에서 제공하고 유지시킨다.

키트 또는 시스템은 적어도 하나의 분석에 충분한 양으로, 본 명세서에 기재된 성분들의 임의의 조합을 함유할 수 있다. 일부 용도에서, 하나 이상의 반응 성분을 개별적인, 전형적으로 일회용의 튜브 또는 등가의 용기 중에서 사전-측정된 단일 사용량으로 제공할 수 있다. 상기와 같은 배열의 경우, RNA-가이드 뉴클레아제 반응을, 표적 핵산, 또는 표적 핵산을 함유하는 샘플 또는 셀을 개별적인 튜브에 직접 가함으로써 수행할 수 있다. 상기 키트에 공급되는 성분의 양은 임의의 적합한 양일 수 있으며 상기 생성물이 향하는 시장에 따라 변할 수 있다. 상기 성분들을 공급하는 용기(들)는 상기 공급된 형태를 유지할 수 있는 임의의 통상적인 용기, 예를 들어 미세 원심분리기 튜브, 미세적정 플레이트, 앰풀, 병, 또는 일체형 시험 장치, 예를 들어 유동성 장치, 카트리지, 측면 유동, 또는 다른 유사한 장치일 수 있다.

상기 키트는 또한 상기 용기 또는 용기들의 조합을 유지하기 위한 패키징 물질을 포함할 수 있다. 상기와 같은 키트 및 시스템에 전형적인 패키징 물질은 상기 반응 성분들 또는 검출 탐침들을 임의의 다양한 형태(예를 들어, 바이알, 미세적정 플레이트 웰, 미세배열 등 중에서)로 유지하는 고체 기질(예를 들어, 유리, 플라스틱, 종이, 호일, 미세입자 등)을 포함한다. 상기 키트는 또한 상기 성분들의 용도를 유형의 형태로 기록한 설명서를 포함할 수 있다.

실시예

실시예 1

DNA 표적 서열을 표적화하고 절단하는 화학 합성된 가이드 RNA의 능력을 평가하기 위해서, 시험관내 절단 분석을 개발하였다. 간단히, 도 3에 도시된 바와 같이, 약 4 kb PAM-어드레스 가능한 DNA 표적을, 플라스미드-기재 인간 서열(여기에서 인간 클라트린 경쇄 CLTA 유전자로부터의 서열)의 예비 PCR 증폭에 의해 제조하였다. 20-μL 반응 부피에서, 50 fmole의 선형화된 DNA 표적을 50 nM sgRNA, 39 nM 재조합 정제된 Cas9 단백질(스트렙토코커스 피오게네스; 에이질런트(Agilent)) 및 10 mM MgCl₂의 존재하에 pH 7.6에서, 37 ℃에서 30분 동안 배양하였다. 종료 시, 0.5 μL의 RNace It(에이질런트)를 가하고, 37 ℃에서 5분 및 이어서 70 ℃에서 15분 동안 배양을 계속하였다. 후속으로 0.5 ㎕의 프로테이나제 K(Mol. Bio. 등급, NEB)를 가하고 37 ℃에서 15분 동안 배양하였다. 분액을 DNA 7500 랩칩(LabChip)에 로딩하고 바이오어낼라이저(Bioanalyzer) 2200에서 분석하였다. 후처리 단계로 Cas9를 결합으로부터 표적 DNA로 방출시켰으며, 이를 절단에 대해 분석하였다.

도 4에 나열된 바와 같은 일련의 가이드 RNA를 화학적으로 합성하였다. 간단히, 개별적인 RNA 가닥을 합성하고 HPLC 정제하였다. 모든 올리고뉴클레오타이드는, HPLC 분석에 의한 화학적 순도 및 질량 분광분석에 의한 완전길이 가닥 순도를 토대로 품질 조절 승인되었다. 이들 각각의 가이드 RNA를 인간 CLTA 유전자를 표적화하도록 설계하였다.

상기 결과를 도 4에 나타낸다. 도 4의 표 1에 나타낸 바와 같이, 하나를 제외한 모든 화학 합성된 가이드 RNA는 CLTA-암호화된 DNA 표적 서열을 표적화하고 현저한 절단률로 절단하였다. 상기 하나의 예외는 "CLTA_37_데옥시" 가이드 RNA였으며, 이는 그의 5' 단부에 37개 데옥시리보뉴클레오타이드의 연속적인 서열을 가졌다.

본 명세서에 개시된 바와 같이, 다양한 화학 변형들을 가이드 RNA의 서열 중의 특정한 위치에서 시험하였다. 놀랍게도, 상기 가이드 RNA의 가이드 서열(a.k.a. 상기 가이드 RNA 중의 스페이서 서열) 중의 시험 위치들은, 변형이 표적-결합 서열 중에 예시된 경우에조차, 상기 가이드 RNA 중의 단일 뉴클레오타이드내 다수의 변형들의 조합을 포함하여 상기 시험된 변형의 대부분을 허용하였다.

상기 결과는 특정 위치에 변형을 함유하는 가이드 RNA가, 상기 변형이 상기 표적 폴리뉴클레오타이드의 표적-특이적 절단을 방지하지 않았으므로, 활성 Cas 단백질 및 gRNA:Cas 단백질 복합체에 의해 허용됨을 밝혀내었다. 도 4의 표 1에 나열된 모든 가이드 RNA 서열에서, 5' 단부의 처음 20개 뉴클레오타이드는 표적 DNA 중의 표적 서열에 상보성이다. 시험되고 특정 위치에서 허용되는 것으로 밝혀진 변형은 2'-O-메틸리보뉴클레오타이드(=2'OMe), 2'-데옥시리보뉴클레오타이드, 라세미 포스포로티오에이트 뉴클레오타이드간 결합(들)(=P(S)), 3'-포스포노아세테이트(=PACE), 3'-티오포스포노아세테이트(=티오PACE), Z 뉴클레오타이드, 및 이들의 조합을 포함한다.

본 명세서에서 개시되고 시험된 화학 변형들은, 특히 시험된 위치(도 4의 표 1에 나열된 바와 같은)에서, 다양한 가이드 RNA 중의 동등한 위치들에서 허용될 것으로 생각된다. 몇몇 실시태양에서, 본 명세서에 개시되고 시험된 화학 변형들은 가이드 RNA 중의 임의의 위치에서 허용된다.

본 명세서에 개시된 바와 같이, 화학적으로 변형된 뉴클레오타이드를 몇몇 성질들을 개선시키고자 가이드 RNA에 통합시켰다. 상기와 같은 성질들은 상기 가이드 RNA의 개선된 뉴클레아제 내성, gRNA:Cas 단백질 복합체의 감소된 표적-외 효과(또한 개선된 특이성으로서 공지됨), 표적 폴리뉴클레오타이드의 절단, 틈 형성 또는 결합시 gRNA:Cas 단백질 복합체의 개선된 효능, 개선된 형질감염 효율, 및/또는 개선된 세포 소기관 국소화, 예를 들어 핵 국소화를 포함한다.

변형된 RNA의 용도는 공지되어 있지만(예를 들어, 몇몇 용도에서 핵산분해적 분해를 차단하기 위한), RNA 서열 중 모든 위치에서 변형을 간단히 통합시킬 수 없고, 특히 상기 RNA 서열이 단백질 또는 효소와 복합체를 형성하여 몇몇 기능을 발휘하는 것이 필요한 경우, 기능을 예상할 수 없음은 널리 공지되어 있다. 따라서, 상기 가이드 RNA가 크리스퍼-Cas 시스템에서 충분히 또는 개선된 기능을 수행하면서 다양한 뉴클레오타이드 위치들에서 화학 변형들을 허용할 수 있는지의 여부를 예견할 수 없었다. 실제로, 상기 가이드 RNA는, 특히 시험된 다수의 위치들에서, 예시되고 시험된 정도로 특정한 변형을 허용할 수 있음은 예상되지 않았다.

실시예 2

DNA 표적 서열을 표적화하고 절단하는 화학 합성된 가이드 RNA의 능력을 평가하기 위해서, 실시예 1에 기재된 바와 유사한 시험관내 절단 분석을 사용하였다. 표적 DNA 구조물은 상기 표적 DNA와 하나 이상의 뉴클레오타이드만큼 상이한 표적-외 DNA 구조물과 함께, 인간 DNA 표적(클라트린 경쇄(CLTA1) 유전자, 인간 인터류킨 2 수용체 감마(IL2RG) 유전자, 인간 세포독성 T-림프구-관련된 단백질 4(CLTA4) 유전자, 인간 프로토카데린 알파 4(PCDHA4) 유전자, 및 인간 분절발생 호메오박스 1(EN1) 유전자로부터의 서열)에 대한 것이었다.

표 3은 가이드 RNA 구조물의 표적화 및 절단 능력을 평가하는데 사용되는 DNA 구조물과 함께, 상기 가이드 RNA 구조물들 및 그들의 서열을 제시한다. 표 3에 나열된 모든 가이드 RNA 서열에서, 5' 단부의 처음 20개 뉴클레오타이드는 표적 DNA 중의 표적 서열에 상보성이다. 온(ON) 표적 구조물은 20 nt 표적 서열을 포함한다. 오프(OFF) 표적 구조물은 1, 2 또는 3개 뉴클레오타이드 차이와 함께, 상기 표적 DNA와 동일한 20개 뉴클레오타이드의 대부분을 포함한다. 상응하게, 상기 가이드 RNA는 대개, 전부는 아니지만, 상기 오프 표적 구조물의 서열에 상보성이다. 상기 오프 표적 구조물은 인간 게놈 중에 존재하는 것으로 공지된 유전자 서열을 기본으로 한다.

[표 3]

20-μL 반응 부피에서, 50 fmole의 선형화된 DNA 표적을 50 nM sgRNA, 39 nM 재조합 정제된 Cas9 단백질(스트렙토코커스 피오게네스; 에이질런트) 및 10 mM 또는 0.8 mM MgCl₂의 존재하에 pH 7.6에서, 37 ℃에서 30분 동안 배양하였다. 종료 시, 0.5 μL의 RNace It(에이질런트)를 가하고, 37 ℃에서 5분 및 이어서 70 ℃에서 15분 동안 배양을 계속하였다. 후속으로 0.5 ㎕의 프로테이나제 K(Mol. Bio. 등급, NEB)를 가하고 37 ℃에서 15분 동안 배양하였다. 분액을 DNA 1000 또는 DNA 7500 랩칩에 로딩하고 바이오어낼라이저 2200에서 분석하거나, 한편으로 제노믹 DNA 스크린테이프(Genomic DNA ScreenTape)에 로딩하고 테이프스테이션(TapeStation)상에서 분석하였다. 후처리 단계로 Cas9를 표적 DNA의 결합으로부터 방출시켰으며, 이를 절단에 대해 분석하였다. 절단 수율을 식 a/(a+b)x100(여기에서 a는 2개의 절단 생성물의 밴드 강도의 합이고 b는 나머지 절단되지 않은 DNA(존재하는 경우)이다)에 의해 계산하였다. 100%의 절단율은 표적 DNA 구조물이 전부 절단되었음을 의미한다.

일련의 가이드 RNA를 화학적으로 합성하였다. 상기 가이드 RNA 올리고머를 문헌[Dellinger et al. (201 1) J. Am. Chem. Soc, 133, 11540-56]에 기재된 과정에 따라 2'-O-티오노카바메이트-보호된 뉴클레오사이드 포스포아미다이트를 사용하여 ABI 394 합성기(라이프 테크놀로지스(Life Technologies), 미국 캘리포니아주 칼스바드 소재)상에서 합성하였다. 2'-O-메틸 포스포아미다이트를 상기 2'-O-티오노카바메이트 보호된 포스포아미다이트와 동일한 조건하에서 RNA 올리고머내에 통합시켰다. 티오포스포노아세테이트(티오PACE)-변형된 RNA의 합성에 사용된 2'-O-메틸-3'-O-(다이아이소프로필아미노)포스피노아세트산-1,1-다이메틸시아노에틸 에스터-5'-O-다이메톡시트리틸 뉴클레오사이드를 필수적으로 공개된 방법에 따라 합성하였다. 문헌[Dellinger et al. (2003) J. Am. Chem. Soc, 125, 940-50]; 및 문헌[Threlfall et al. (2012) Org. Biomol. Chem., 0, 746-54]을 참조하시오. 포스포로티오에이트-함유 올리고머의 경우, 상기 결합 반응 후 요오드 산화 단계를, 피리딘-아세토나이트릴(3:2) 혼합물 중의 3-((N,N-다이메틸아미노메틸리덴)아미노)-3H-1,2,4-다이티아졸-5-티온의 0.05M 용액을 6분 동안 사용하는 황화 단계로 교체하였다.

상기 모든 올리고뉴클레오타이드를 역상 고성능 액체 크로마토그래피(HPLC)를 사용하여 정제하고 에이질런트 6520 Q-TOF(비행시간) 질량 분광계(에이질런트 테크놀로지스, 미국 캘리포니아주 산타 클라라 소재)에 결합된 에이질런트 1290 인피니티 시리즈 LC 시스템을 사용하여 액체 크로마토그래피-질량 분광분석(LC-MS)에 의해 분석하였다. 상기 sgRNA의 합성 및 정제 수율을 LC-MS-유래된 전체 이온 크로마토그램으로부터 획득된 질량 스펙트럼의 디콘볼루션을 사용하여 평가하였다. 상기 100-머 sgRNA의 화학 합성은 전형적으로 공칭 1 마이크로몰 규모 합성으로부터 25 내지 35% 완전길이 생성물을 제공하였다. 이온 짝짓기 완충제 조건을 사용하는 역상 HPLC 정제는 상기 조 생성물로부터 전형적으로 90% 내지 95% 범위의 최종 sgRNA의 추정 순도와 함께 20% 수율을 제공하였다.

상기 결과를 표 4에 나타낸다. "절단된 표적%"는 절단된 표적 DNA 구조물의 비율을 가리킨다. 실험을 몰 과잉의 무표적 경쟁자 DNA(tcDNA)(표적 DNA와 잠재적으로 경쟁하며, 따라서 분석시 상기 첨가된 비특이적인 DNA의 잠재적인 영향을 볼 수 있었다)의 첨가와 함께 또는 상기 첨가 없이 실행하였다.

[표 4]

상기 결과는 특정 위치에 변형을 함유하는 가이드 RNA가, 상기 변형이 표적-상 폴리뉴클레오타이드의 표적-특이적 절단을 방지하지 않으므로, 활성 Cas 단백질 및 gRNA:Cas 단백질 복합체에 의해 허용됨을 밝혀내었다. 상기 시험되고 특정 위치에서 허용되는 것으로 밝혀진 변형은 2'-O-메틸리보뉴클레오타이드(=2'OMe), 2'-데옥시리보뉴클레오타이드, 라세미 포스포로티오에이트 뉴클레오타이드간 결합, 3'-포스포노아세테이트(=PACE), 3'-티오포스포노아세테이트(=티오PACE), Z 뉴클레오타이드, 2-티오유라실, 2-아미노아데닌, 5-메틸유라실, Cy5 형광단에 결합된 5-아미노알릴유라실, 2-(4-부틸아미도플루오레세인)프로판-1,3-다이올 비스(포스포다이에스터) 링커, 및 이들의 조합을 포함한다.

본 명세서에 개시되고 시험된 화학 변형들은, 특히 시험된 위치에서(표 3 및 4에 나열된 바와 같은), 다양한 가이드 RNA 중의 동등한 위치에서 허용될 것으로 생각된다.

본 명세서에 개시된 바와 같이, 화학적으로 변형된 뉴클레오타이드를 몇몇 성질들을 개선시키고자 가이드 RNA에 통합시켰다. 상기와 같은 성질들은 상기 가이드 RNA의 개선된 뉴클레아제 내성(또한 개선된 안정성으로서 공지됨), gRNA:Cas 단백질 복합체의 감소된 표적-외 효과(또한 개선된 특이성으로서 공지됨), 표적 폴리뉴클레오타이드의 절단, 틈 형성 또는 결합시 gRNA:Cas 단백질 복합체의 개선된 효능, 개선된 형질감염 효율, 및/또는 개선된 세포 소기관 국소화를 포함한다.

표 3 및 4의 분석 결과는 (1) 가이드 RNA에서, 다수의 위치가 다양한 화학 변형을 허용할 수 있고; (2) 가이드 RNA의 5' 및 3' 단부가 광범위하게 다양한 단부-보호 변형을 허용할 것이며, 상기와 같은 변형이 외부핵산분해성 RNA 분해를 억제하기에 유용하고; (3) 2-티오U를 사용하여 G-U 동요 짝짓기를 수반하는 표적-외 상호작용을 저지할 수 있고, 이에 의해 표적-외 하이브리드화 상호작용을 억제함으로써 가이드 짝짓기의 특이성을 증가시키고; (4) 5'-연장이 일반적으로 잘-허용되고; (5) 가이드 RNA의 표면 노출된 영역(공개된 결정 구조로부터 추측되는 바와 같은)이 U의 5-메틸U로의 광범위한 변형(이는 잠재적으로 상기 변형된 RNA를 변형되지 않은 RNA에 의해 자극되는 바와 같은 면역 응답을 보다 잘 회피할 수 있게 한다)을 허용하고; (6) RNA 접힘의 경우, G-C 쌍이 A-U 쌍보다 더 강하고 더 안정성임을 가리킨다. 적어도 하나의 가이드 RNA는 일부 G-C 쌍의, 변형되지 않은 A-U 쌍보다 열역학적으로 더 안정한 2'-O-메틸A-2'-O-메틸U 쌍으로의 교체를 허용한다.

보다 특히, 본 실시예는 2'-O-메틸 변형이 이중-가이드 RNA(표 3 및 4에서 엔트리 12에 의해 나타내는 바와 같은) 및 단일-가이드 RNA(엔트리 143-146, 169-170)의 5' 및 3' 단부에서 허용되고, 따라서 gRNA를 엔도뉴클레아제에 대해 안정화시키는 단부-보호를 허용함을 나타낸다. 2'-O-메틸 변형은 대부분(전부는 아니지만)의 위치에서 허용되며, 따라서 엔도뉴클레아제(엔트리 146, 153-168, 174-179)를 포함한 다양한 뉴클레아제들에 대한 안정화를 허용한다. 그러나, 본 실시예는 또한 가이드 RNA 중의 모든 위치가 2'-O-메틸을 허용하는 것은 아님(엔트리 151-152 및 171-173에 의해 나타난 바와 같이)을 입증하며, 이는 상기 5' 단부에 너무 많은 연속적인 2'-O-메틸 변형(예를 들어, 26개 이상의 연속적인 2'-O-메틸-변형된 뉴클레오타이드), 또는 5'-말단 20머 가이드 서열의 하류(3') C 및 U 뉴클레오타이드의 너무 많은 2'-O-메틸 변형은 허용되지 않음(예를 들어, 엔트리 154-156 중의 시험된 위치들에 의해 밝혀진 바와 같이 엔트리 171-173 중의 서열 위치 +56 및 +69번에서 하나 또는 2개의 2'-O-메틸유라실 모두의 억제 효과)을 암시한다.

본 실시예는 상기 20머 가이드 서열 전체를 통한 2'-O-메틸 변형이 10 mM Mg⁺²를 함유하는 완충제 중에서 시험관내 사용 중 허용되지만(엔트리 146), 상기와 같은 광범위한 변형은 세포 중에 존재하는 바와 같은 생리 조건하에서 잘 허용되지 않음(엔트리 147-150)을 나타낸다. 따라서, 일부 실시태양에서, 상기 20머 가이드 서열 전체를 통해 15개 이상, 한편으로 17개 이상, 한편으로 18개 이상, 한편으로 20개의 2'-O-메틸 변형을 포함하는 gRNA를 본 명세서에 기재된 바와 같은 시험관내 방법, 예를 들어 시험관내에서 DNA 서열을 변형시키기 위한 게놈 편집, 시험관내에서 관심 유전자의 발현 조절, 시험관내에서 DNA 표적 서열의 절단, 및 다른 용도에 사용한다.

본 실시예는 2'-데옥시 변형의 광범위 통합이 충분히 허용되지 않으며 실질적으로 완전히 억제성일 수도 있음(엔트리 180-182)을 나타낸다. 그러나, 2'-데옥시 변형은 일부 위치에서 잘-허용될 수 있으며(엔트리 183), 따라서 상기와 같은 변형은 뉴클레아제 억제에 유용할 수 있다.

본 실시예는 또한 형광단 또는 염료 표지가 크리스퍼-Cas9 가이드 RNA 중의 3개의 공지된 줄기-고리의 모든 고리에서 허용됨을 나타낸다(엔트리 116). 상기와 같은 표지는 또한 상기 가이드 서열상의 5' 오버행에서 허용되고(엔트리 114), sgRNA 중의 추가적인 위치에서 허용되며(엔트리 114), 이중-가이드 용도에 사용되는 tracrRNA 중의 고리에서 허용된다(엔트리 11). 본 실시예에서, 2개의 상이한 유형의 형광단이 시험되었다: 뉴클레오타이드를 필수적으로 대신하는 포스포다이에스터-결합된 형광단(리보스 고리 없음)(엔트리 114 & 116), 및 가이드 RNA 중에 통합된 5-아미노알릴U에 공유 결합된 염료 표지(Cy5)(엔트리 11).

본 실시예는 또한 Z 염기가 합성 가이드 RNA에서, 특히 일부 C가 Z 염기로 교체된 합성 가이드 RNA의 변형으로서 허용됨을 나타낸다(엔트리 290-291). 본 실시예는 또한 다수의 다른 염기들이 표 3 및 4에 나타낸 바와 같이, 다양한 위치들에서 허용됨을 나타낸다.

본 실시예는 또한 가이드 RNA의 5' 및 3' 단부가 광범위하게 다양한 단부-보호 변형을 허용할 수 있음을 나타낸다. 상기와 같은 변형을 사용하여 외부핵산분해성 RNA 분해를 억제할 수 있다. 상기와 같은 변형의 허용을 위한 지지체를 문헌[Hendel et al., Nat. Biotechnol.(2015)33:9, 985-9]에서 찾을 수 있다. 가이드 RNA의 5' 및 3' 단부에서 변형을 위한 추가적인 지지체는 표 3 및 4 중의 엔트리 143-144, 185-223, 241-257, 258-266 및 272-279에 의해 제공된다. 일부 실시태양에서, 상기 가이드 RNA는 5' 단부 또는 3' 단부 또는 각각의 5' 및 3' 단부에서 7개 이하의 변형된 뉴클레오타이드, 한편으로 6개 이하, 한편으로 5개 이하, 한편으로 4개 이하, 한편으로 3개 이하, 한편으로 2개 이하, 한편으로 하나의 변형된 뉴클레오타이드를 포함한다. 이중-가이드 RNA가 유사하게 보호될 수 있다(엔트리 12-15).

본 실시예는 또한 2-티오U를 사용하여 G-U 동요 짝짓기를 수반하는 표적-외 상호작용을 저지할 수 있고, 이에 의해 표적-외 하이브리드화 상호작용을 억제함으로써 가이드 짝짓기의 특이성을 증가시킬 수 있음을 나타낸다(엔트리 16-39). 상기 가이드 RNA와 CLTA1 표적-외 3(또한 "CLTA1 오프3-표적" 또는 "CLTA1 오프3"라 칭한다)간의 하이브리드화에 관련된 염기쌍들 중 하나는 G-U 동요 쌍이다. 상기 가이드 RNA 중의 상응하는 U를 2-티오U로 교체하는 것은 절단을 100%(엔트리 8)에서 59%(엔트리 39)로 감소시킨다. 다른 U를 2-티오U로 교체하는 것(예를 들어, 서열 위치 +3 또는 +9에서, 엔트리 23 및 31)은 같은 효과를 갖지 못하는데, 그 이유는 상기 U가 상기 시험된 각각의 표적-외 부위에 완전히 하이브리드화될 때 G-U 동요 짝짓기를 수반하지 않기 때문이다. 상응하게, 2-티오U는 표적-외 부위가 G-U 동요 짝짓기를 수반할 때 가이드 RNA의 표적 특이성을 증가시킬 수 있다.

본 실시예는 또한 상기 가이드 서열에 부착된 5'-오버행 서열이 일반적으로 잘-허용됨을 나타낸다(엔트리 83-95, 114 및 206-223 참조). 예를 들어, 5' 단부의 벌키한 다이메톡시트리틸(dmt)기는 잘 허용되었다(엔트리 95). dmt의 크로마토그래피 성질을 사용하여 합성 중 일반적으로 생성되는 불완전하게 연장되는 부산물로부터 완전길이 합성 RNA의 정제를 촉진할 수 있다. 따라서, 일부 실시태양에서, 상기 합성 가이드 RNA는, 예를 들어 상기 가이드 서열에 상보성이고 3' 단부에서 상기 가이드 서열의 5' 단부에 중합체성 링커, 예를 들어 폴리뉴클레오타이드 또는 유사한 포스포다이에스터-기재 링커(여기에서 상기 링커는 5개 이상, 한편으로 6 또는 7개의 연속적인 유리딘 뉴클레오타이드일 수 있다)에 의해 공유적으로 결합되는 15개 이하 뉴클레오타이드의 짧은 폴리뉴클레오타이드 서열을 포함하는 5'-오버행 서열을 포함한다.

본 실시예는 또한 상기 가이드 RNA의 표면 노출된 영역(달리 공개된 결정 구조로부터 추측되는 바와 같은)이 유라실 뉴클레오타이드의 5-메틸유라실(5-메틸U)(엔트리 288)로의 광범위한 변형(이는 상기 변형된 RNA가 변형되지 않은 RNA에 의해 자극되는 바와 같은 면역 응답을 보다 잘 회피할 수 있게 한다)을 허용함을 나타낸다. 특히, 합성 가이드 RNA의 5' 및 3' 단부는 잠재적으로 면역자극성이며, 본 실시예는 5' 및 3' 단부가 5-메틸U 변형을 허용함을 나타낸다.

본 실시예는 또한 합성 가이드 RNA가, 일부 G-C 쌍의, 변형되지 않은 A-U 쌍(엔트리 292-293에서 비-말단 -2'-O-메틸U 및 상보적인 -2'-O-메틸A 변형을 참조하시오)보다 열역학적으로 더 안정한 2'-O-메틸A-2'-O-메틸U 쌍으로의 교체를 허용함을 나타낸다. 이는, 접힌 RNA의 경우 G-C 쌍이 A-U 쌍보다 더 강하고 더 안정하기 때문에 유리하다. 합성 가이드 RNA에서 G-C 쌍의 상기와 같은 열안정화된 A-U 쌍으로의 교체는, 통상적으로 사용되는 RNA 접힘 연산에 의해 예측될 수 있는 바와 같이, 의도하지 않는 G-C 쌍(들)을 수반하는 잘못 접힌 구조물을 방지함으로써 활성 구조물의 개선된 접힘을 허용한다.

예시적인 실시태양

본 명세서에 개시된 발명의 요지에 따라 제공된 예시적인 실시태양들은 비제한적으로 특허청구범위 및 하기의 실시태양들을 포함한다:

A1. (i) 표적 서열에 하이브리드화할 수 있는 가이드 서열, (ii) 줄기 서열을 포함하는 crRNA 분절; 및

상기 줄기 서열에 부분적으로 또는 전적으로 상보성인 뉴클레오타이드 서열을 포함하는 tracrRNA 분절

을 포함하는 합성 가이드 RNA로,

하나 이상의 변형된 뉴클레오타이드를 포함하고, gRNA 기능성을 갖는 상기 합성 가이드 RNA.

A2. 실시태양 A1의 합성 가이드 RNA로, 2'-데옥시 부분을 포함하는 합성 가이드 RNA.

A3. 실시태양 A1 또는 A2의 합성 가이드 RNA로, 2'-플루오로, 2'-클로로, 2'-브로모 및 2'-요오도 중에서 선택된 2'-할로 부분을 포함하는 합성 가이드 RNA.

A4. 실시태양 A1 내지 A3 중 어느 하나의 합성 가이드 RNA로, 포스포로티오에이트기를 포함하는 합성 가이드 RNA.

A5. 실시태양 A1 내지 A4 중 어느 하나의 합성 가이드 RNA로, PACE기를 포함하는 합성 가이드 RNA.

A6. 실시태양 A1 내지 A5 중 어느 하나의 합성 가이드 RNA로, 티오PACE기를 포함하는 합성 가이드 RNA.

A7. 실시태양 A2 내지 A6 중 어느 하나의 합성 가이드 RNA로, 2'-O-메틸 부분을 포함하는 합성 가이드 RNA.

A8. 실시태양 A1 내지 A7 중 어느 하나의 합성 가이드 RNA로, 2-티오유라실을 포함하는 합성 가이드 RNA.

A9. 실시태양 A1 내지 A8 중 어느 하나의 합성 가이드 RNA로, 4-티오유라실을 포함하는 합성 가이드 RNA.

A10. 실시태양 A1 내지 A9 중 어느 하나의 합성 가이드 RNA로, 2-아미노아데닌을 포함하는 합성 가이드 RNA.

A11. 실시태양 A1 내지 A10 중 어느 하나의 합성 가이드 RNA로, 하이포잔틴을 포함하는 합성 가이드 RNA.

A12. 실시태양 A1 내지 A11 중 어느 하나의 합성 가이드 RNA로, 5-메틸시토신을 포함하는 합성 가이드 RNA.

A13. 실시태양 A1 내지 A12 중 어느 하나의 합성 가이드 RNA로, 5-메틸유라실을 포함하는 합성 가이드 RNA.

A14. 실시태양 A1 내지 A13 중 어느 하나의 합성 가이드 RNA로, 5-아미노알릴-유라실을 포함하는 합성 가이드 RNA.

A15. 실시태양 A1 내지 A14 중 어느 하나의 합성 가이드 RNA로, Z 리보뉴클레오타이드를 포함하는 합성 가이드 RNA.

A16. 실시태양 A1 내지 A15 중 어느 하나의 합성 가이드 RNA로, Z 데옥시리보뉴클레오타이드를 포함하는 합성 가이드 RNA.

A17. 실시태양 A1 내지 A16 중 어느 하나의 합성 가이드 RNA로, 스쿠아레이트 접합을 포함하는 합성 가이드 RNA.

A18. 실시태양 A1 내지 A17 중 어느 하나의 합성 가이드 RNA로, 염료 링커를 포함하는 합성 가이드 RNA.

A19. 실시태양 A18의 합성 가이드 RNA로, 염료 링커가 2-(4-부틸아미도플루오레세인)프로판-1,3-다이올 비스(포스포다이에스터) 링커인 합성 가이드 RNA.

A20. 실시태양 A1 내지 A19 중 어느 하나의 합성 가이드 RNA로, 2'-O-메틸 및 3'-포스포로티오에이트를 갖는 뉴클레오타이드를 포함하는 합성 가이드 RNA.

A21. 실시태양 A1 내지 A20 중 어느 하나의 합성 가이드 RNA로, 2'O-메틸 및 3"-PACE를 갖는 뉴클레오타이드를 포함하는 합성 가이드 RNA.

A22. 실시태양 A1 내지 A21 중 어느 하나의 합성 가이드 RNA로, 2'-O-메틸 및 3'-티오PACE를 갖는 뉴클레오타이드를 포함하는 합성 가이드 RNA.

A23. 실시태양 A1 내지 A22 중 어느 하나의 합성 가이드 RNA로, 2'-데옥시 및 3'-PACE를 갖는 뉴클레오타이드를 포함하는 합성 가이드 RNA.

A24. 실시태양 A1 내지 A23 중 어느 하나의 합성 가이드 RNA로, 5-메틸시티딘을 포함하는 합성 가이드 RNA.

A25. 실시태양 A1 내지 A24 중 어느 하나의 합성 가이드 RNA로, 메틸포스포네이트를 포함하는 합성 가이드 RNA.

A26. 실시태양 A1 내지 A25 중 어느 하나의 합성 가이드 RNA로, PACE의 에스터를 포함하며, 상기 에스터가 임의로 메틸 에스터인 합성 가이드 RNA.

A27. 실시태양 A1 내지 A26 중 어느 하나의 합성 가이드 RNA로, crRNA 분절 및 tracrRNA 분절을 모두 포함하는 단일 RNA 가닥을 포함하는 합성 가이드 RNA.

A28. 실시태양 A1 내지 A26 중 어느 하나의 합성 가이드 RNA로, 2개의 RNA 가닥을 포함하고, crRNA 분절 및 tracrRNA 분절이 상이한 RNA 가닥 중에 있는 합성 가이드 RNA.

A29. 실시태양 A1 내지 A28 중 어느 하나의 합성 가이드 RNA로, 각각의 RNA 가닥의 5' 단부, 3' 단부, 또는 5' 단부와 3' 단부 모두에 변형된 뉴클레오타이드를 포함하는 합성 가이드 RNA.

A30. 실시태양 A1 내지 A29 중 어느 하나의 합성 가이드 RNA로, 가이드 서열 중에 변형된 뉴클레오타이드를 포함하는 합성 가이드 RNA.

A31. 실시태양 A1 내지 A30 중 어느 하나의 합성 가이드 RNA로, 가이드 서열에 대해 5'에 변형된 뉴클레오타이드를 포함하는 합성 가이드 RNA.

A32. 실시태양 A1 내지 A31 중 어느 하나의 합성 가이드 RNA로, 줄기 서열 중에 변형된 뉴클레오타이드를 포함하는 합성 가이드 RNA.

A33. 실시태양 A1 내지 A32 중 어느 하나의 합성 가이드 RNA로, 스캐폴드 영역 중에 변형된 뉴클레오타이드를 포함하는 합성 가이드 RNA.

A34. 실시태양 A1 내지 A33 중 어느 하나의 합성 가이드 RNA로, 스캐폴드 영역 중에 하나 이상의 비천연, 직교 염기쌍을 포함하고, 상기 염기쌍이 아이소G-아이소C 및 Z 염기-P 염기 중에서 독립적으로 선택되는 합성 가이드 RNA.

A35. 실시태양 A1 내지 A34 중 어느 하나의 합성 가이드 RNA로, 2'-아미노기를 포함하는 합성 가이드 RNA.

A36. 실시태양 A1 내지 A35 중 어느 하나의 합성 가이드 RNA로, 포스포로다이티오에이트 결합기를 포함하는 합성 가이드 RNA.

A37. 실시태양 A1 내지 A36 중 어느 하나의 합성 가이드 RNA로, 보라노포스포네이트 결합기를 포함하는 합성 가이드 RNA.

A38. 실시태양 A1 내지 A37 중 어느 하나의 합성 가이드 RNA로, 열림 핵산 변형(ULNA)을 포함하는 합성 가이드 RNA.

A39. 실시태양 A1 내지 A38 중 어느 하나의 합성 가이드 RNA로, 잠금 핵산 변형(LNA)을 포함하는 합성 가이드 RNA.

A40. 실시태양 A1 내지 A39 중 어느 하나의 합성 가이드 RNA로, 비구조화된 핵산 변형(UNA)을 포함하는 합성 가이드 RNA.

A41. 실시태양 A1 내지 A40 중 어느 하나의 합성 가이드 RNA로, 슈도U를 포함하는 합성 가이드 RNA.

A42. 실시태양 A1 내지 A41 중 어느 하나의 합성 가이드 RNA로, 2'-MOE를 포함하는 합성 가이드 RNA.

A43. 실시태양 A1 내지 A42 중 어느 하나의 합성 가이드 RNA로, 2'-아라비노를 포함하는 합성 가이드 RNA.

A44. 실시태양 A1 내지 A43 중 어느 하나의 합성 가이드 RNA로, 4'-티오리보스를 포함하는 합성 가이드 RNA.

A45. 실시태양 A1 내지 A44 중 어느 하나의 합성 가이드 RNA로, 스쿠아레이트 결합을 포함하는 합성 가이드 RNA.

A46. 실시태양 A1 내지 A45 중 어느 하나의 합성 가이드 RNA로, 트라이아자올로 결합을 포함하는 합성 가이드 RNA.

A47. 표적 폴리뉴클레오타이드의 절단 또는 틈 형성 방법으로, 상기 표적 폴리뉴클레오타이드를 크리스퍼-결합된 단백질 및 실시태양 A1 내지 A46 중 어느 하나의 합성 가이드 RNA와 접촉시키고, 상기 표적 폴리뉴클레오타이드를 절단하거나 틈 형성시킴을 포함하는 방법.

A48. 실시태양 A47의 방법에서, 절단 또는 틈 형성이 시험관내에서 발생하는 방법.

A49. 실시태양 A47의 방법에서, 절단 또는 틈 형성이 세포에서 발생하는 방법.

A50. 실시태양 A47의 방법에서, 절단 또는 틈 형성이 생체내에서 발생하는 방법.

A51. 실시태양 A47 내지 A50 중 어느 하나의 방법에서, 크리스퍼-결합된 단백질이 Cas9인 방법.

A52. 실시태양 A47 내지 A51 중 어느 하나의 방법에서, 절단 또는 틈 형성이 유전자 편집을 생성시키는 방법.

A53. 실시태양 A47 내지 A52 중 어느 하나의 방법에서, 절단 또는 틈 형성이 유전자 발현의 변경을 생성시키는 방법.

A54. 표적 폴리뉴클레오타이드의 결합 방법으로, 상기 표적 폴리뉴클레오타이드를 크리스퍼-결합된 단백질 및 실시태양 A1 내지 A53 중 어느 하나의 합성 가이드 RNA와 접촉시킴을 포함하는 방법.

A55. 실시태양 A54의 방법에서, 크리스퍼-결합된 단백질이, 절단 또는 틈 형성 활성을 갖지 않는 돌연변이체를 포함하는 방법.

A56. 실시태양 A54 또는 A55의 방법에서, 크리스퍼-결합된 단백질이, 크리스퍼 시스템 중에 자연적으로 존재하지 않는 단백질 성분을 포함하는 융합 단백질인 방법.

A57. 실시태양 A54 내지 A56 중 어느 하나의 방법에서, 표적 폴리뉴클레오타이드의 발현의 변화를 생성시키는 방법.

A58. 실시태양 A54 내지 A57 중 어느 하나의 방법에서, 표적 폴리뉴클레오타이드를 태그하기에 유용한 방법.

추가의 예시적인 실시태양

B1. (a) (i) 폴리뉴클레오타이드 중 표적 서열에 하이브리드화할 수 있는 가이드 서열, (ii) 줄기 서열을 포함하는 crRNA 분절; 및

(b) 상기 줄기 서열에 부분적으로 또는 전적으로 상보성인 뉴클레오타이드 서열을 포함하는 tracrRNA 분절

을 포함하는 합성 가이드 RNA로,

하나 이상의 변형을 포함하고, gRNA 기능성을 갖는 상기 합성 가이드 RNA.

B2. 실시태양 1의 합성 가이드 RNA로, 2'-O-메틸 부분, 2'-데옥시 부분, Z 염기, 포스포로티오에이트 뉴클레오타이드간 결합, 포스포노아세테이트 뉴클레오타이드간 결합, 티오포스포노아세테이트 뉴클레오타이드간 결합, 또는 이들의 조합을 포함하는 합성 가이드 RNA.

B3. 실시태양 1 또는 2의 합성 가이드 RNA로, 3'-포스포로티오에이트기를 갖는 2'-O-메틸 뉴클레오타이드, 3'-포스포노카복실레이트기를 갖는 2'-O-메틸 뉴클레오타이드, 3'-포스포노아세테이트기를 갖는 2'-O-메틸 뉴클레오타이드, 3'-티오포스포노카복실레이트기를 갖는 2'-O-메틸 뉴클레오타이드, 3'-티오포스포노아세테이트기를 갖는 2'-O-메틸 뉴클레오타이드, 3'-포스포노아세테이트기를 갖는 2'-데옥시 뉴클레오타이드, 3'-티오포스포노아세테이트기를 갖는 2'-데옥시 뉴클레오타이드, 및 Z 염기로 이루어진 군 중에서 선택된 하나 이상의 변형을 포함하는 합성 가이드 RNA.

B4. 실시태양 1 내지 3 중 어느 하나의 합성 가이드 RNA로, 2'-플루오로리보실, 2-티오유라실 염기, 4-티오유라실 염기, 2-아미노아데닌 염기, 하이포잔틴 염기, 5-메틸시토신 염기, 5-메틸유라실 염기, 메틸포스포네이트 뉴클레오타이드간 결합, 5-아미노알릴유라실 염기, 스쿠아레이트 결합, 트라이아졸로 결합, 뉴클레오타이드에 접합된 염료, 및 이들의 조합으로 이루어진 군 중에서 선택된 하나 이상의 변형을 포함하는 합성 가이드 RNA.

B5. 실시태양 1 내지 4 중 어느 하나의 합성 가이드 RNA로, 2'-MOE, 2'-아미노, 2'-F-아라비노, 2'-LNA, 2'-ULNA, 3'-메틸포스포네이트, 3'-보라노포스포네이트, 3'-포스포로다이티오에이트, 2'-OMe-3'-P(S)₂, 2'-OMe-3'-P(CH₃), 2'-OMe-3'-P(BH₃), 4'-티오리보실, L-당, 2-티오시토신, 6-티오구아닌, 2-아미노퓨린, 슈도유라실, 7-데아자구아닌, 7-데아자-8-아자구아닌, 7-데아자아데닌, 7-데아자-8-아자아데닌, 5-하이드록시메틸시토신, 5-하이드록시메틸유라실, 5,6-데하이드로유라실, 5-프로피닐시토신, 5-프로피닐유라실, 5-에티닐시토신, 5-에티닐유라실, 5-알릴유라실, 5-알릴시토신, 5-알릴아미노시토신, P 핵염기, 아이소시토신(아이소C), 아이소구아닌(아이소G), UNA, x(A,G,C,T), y(A,G,C,T), 비염기성 뉴클레오타이드, PEG, 탄화수소 링커, 할로-치환된 탄화수소 링커, 헤테로원자(O,N,S)-치환된 탄화수소 링커, (케토, 카복시, 아미도, 티오닐, 카바모일, 또는 티오노카바모일)-함유 탄화수소 링커, 스페르민 링커, 및 이들의 조합으로 이루어진 군 중에서 선택된 변형을 포함하는 합성 가이드 RNA.

B6. 실시태양 1 내지 5 중 어느 하나의 합성 가이드 RNA로, 안정성-증대 변형을 포함하는 합성 가이드 RNA.

B7. 실시태양 1 내지 6 중 어느 하나의 합성 가이드 RNA로, 2개 이상의 변형을 포함하고; 제1 변형이 안정성-증대 변형이고 제2 변형이 특이성-변경 변형인 합성 가이드 RNA.

B8. 실시태양 6 또는 7의 합성 가이드 RNA에서, 안정성-증대 변형이 가이드 서열 중에 위치하는 합성 가이드 RNA.

B9. 실시태양 6 또는 7의 합성 가이드 RNA에서, 안정성-증대 변형이 가이드 서열의 상류에 위치하는 합성 가이드 RNA.

B10. 실시태양 6 또는 7의 합성 가이드 RNA에서, 안정성-증대 변형이 crRNA 분절의 처음 5개 및/또는 마지막 5개 뉴클레오타이드내에 위치하는 합성 가이드 RNA.

B11. 실시태양 6 또는 7의 합성 가이드 RNA에서, 안정성-증대 변형이 tracrRAN 분절 중에 위치하는 합성 가이드 RNA.

B12. 실시태양 6 또는 7의 합성 가이드 RNA에서, 안정성-증대 변형이 tracrRNA 분절의 처음 5개 및/또는 마지막 5개 뉴클레오타이드내에 위치하는 합성 가이드 RNA.

B13. 실시태양 6 내지 12 중 어느 하나의 합성 가이드 RNA에서, 안정성-증대 변형이 2'-O-메틸 부분, 2'-플루오로 부분, 또는 2'-데옥시 부분을 포함하는 합성 가이드 RNA.

B14. 실시태양 6 내지 13 중 어느 하나의 합성 가이드 RNA에서, 안정성-증대 변형이 포스포로티오에이트 뉴클레오타이드간 결합, 포스포노아세테이트 뉴클레오타이드간 결합, 티오포스포노아세테이트 뉴클레오타이드간 결합, 메틸포스포네이트 뉴클레오타이드간 결합, 보라노포스포네이트 뉴클레오타이드간 결합, 또는 포스포로다이티오에이트 뉴클레오타이드간 결합을 포함하는 합성 가이드 RNA.

B15. 실시태양 6 내지 14 중 어느 하나의 합성 가이드 RNA에서, 안정성-증대 변형이 3'-포스포노아세테이트 또는 3'-티오포스포노아세테이트를 포함하는 합성 가이드 RNA.

B16. 실시태양 6 내지 15 중 어느 하나의 합성 가이드 RNA에서, 안정성-증대 변형이 2'-O-메틸-3'-포스포로티오에이트 뉴클레오타이드, 2'-O-메틸-3'-포스포노아세테이트 뉴클레오타이드 또는 2'-O-메틸-3'-티오포스포노아세테이트 뉴클레오타이드를 포함하는 합성 가이드 RNA.

B17. 실시태양 6 내지 16 중 어느 하나의 합성 가이드 RNA에서, 안정성-증대 변형이 2'-플루오로-3'-포스포로티오에이트 뉴클레오타이드, 2'-플루오로-3'-포스포노아세테이트 뉴클레오타이드 또는 2'-플루오로-3'-티오포스포노아세테이트 뉴클레오타이드를 포함하는 합성 가이드 RNA.

B18. 실시태양 1 내지 17 중 어느 하나의 합성 가이드 RNA로, 특이성-변경 변형을 포함하는 합성 가이드 RNA.

B19. 실시태양 18의 합성 가이드 RNA에서, 특이성-변경 변형이 가이드 서열 중에 위치하는 합성 가이드 RNA.

B20. 실시태양 18 또는 19의 합성 가이드 RNA에서, 특이성-변경 변형이 2-티오유라실, 4-티오유라실 또는 2-아미노아데닌을 포함하는 합성 가이드 RNA.

B21. 실시태양 18 내지 20 중 어느 하나의 합성 가이드 RNA에서, 특이성-변경 변형이 포스포로티오에이트 뉴클레오타이드간 결합, 포스포노아세테이트 뉴클레오타이드간 결합, 티오포스포노아세테이트 뉴클레오타이드간 결합, 메틸포스포네이트 뉴클레오타이드간 결합, 보라노포스페이트 뉴클레오타이드간 결합, 또는 포스포로다이티오에이트 뉴클레오타이드간 결합을 포함하는 합성 가이드 RNA.

B22. 실시태양 18 내지 21 중 어느 하나의 합성 가이드 RNA에서, 특이성-변경 변형이 3'-포스포노아세테이트 또는 3'-티오포스포노아세테이트를 포함하는 합성 가이드 RNA.

B23. 실시태양 1 내지 22 중 어느 하나의 합성 가이드 RNA에서, 형광 염료 또는 표지를 포함하는 합성 가이드 RNA.

B24. 실시태양 1 내지 23 중 어느 하나의 합성 가이드 RNA로, 하나 이상의 동위원소 표지를 포함하는 합성 가이드 RNA.

B25. 실시태양 1 내지 24 중 어느 하나의 합성 가이드 RNA에서, 가이드 RNA가 올리고뉴클레오타이드, 앱타머, 아미노산, 펩타이드, 단백질, 스테로이드, 지질, 폴산, 비타민, 당 또는 올리고사카라이드에 접합되는 합성 가이드 RNA.

B26. 실시태양 1 내지 25 중 어느 하나의 합성 가이드 RNA에서, 상기 합성 가이드 RNA가 단일 가이드 RNA이며, crRNA 분절 및 tracrRNA 분절이 고리 L을 통해 결합되는 합성 가이드 RNA.

B27. 실시태양 26의 합성 가이드 RNA에서, 고리 L이 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10 뉴클레오타이드를 포함하는 합성 가이드 RNA.

B28. 실시태양 26 또는 27의 합성 가이드 RNA에서, 고리 L이 GNRA의 뉴클레오타이드 서열을 포함하고, 여기에서 N이 A, C, G 또는 U를 나타내고, R이 A 또는 G를 나타내는 합성 가이드 RNA.

B29. 실시태양 26 내지 28 중 어느 하나의 합성 가이드 RNA에서, 고리 L이 GAAA의 뉴클레오타이드 서열을 포함하는 합성 가이드 RNA.

B30. 실시태양 26 내지 29 중 어느 하나의 합성 가이드 RNA에서, 고리 L이 하나 이상의 변형된 뉴클레오타이드를 포함하는 합성 가이드 RNA.

B31. 실시태양 30의 합성 가이드 RNA에서, 고리 L이 형광 염료를 포함하는 합성 가이드 RNA.

B32. 실시태양 31의 합성 가이드 RNA에서, 염료가 2-(4-부틸아미도-염료)프로판-1,3-다이올 비스(포스포다이에스터) 링커에 접합되는 합성 가이드 RNA.

B33. 실시태양 1 내지 32 중 어느 하나의 합성 가이드 RNA에서, crRNA 분절이 가이드 RNA의 5' 단부에 있는 합성 가이드 RNA.

B34. 실시태양 1 내지 33 중 어느 하나의 합성 가이드 RNA에서, tracrRNA 분절이 가이드 RNA의 3' 단부에 있는 합성 가이드 RNA.

B35. 실시태양 1 내지 34 중 어느 하나의 합성 가이드 RNA에서, crRNA 분절이 25 내지 70 뉴클레오타이드를 포함하는 합성 가이드 RNA.

B36. 실시태양 1 내지 35 중 어느 하나의 합성 가이드 RNA에서, 가이드 서열이 15 내지 30 뉴클레오타이드를 포함하는 합성 가이드 RNA.

B37. 실시태양 1 내지 36 중 어느 하나의 합성 가이드 RNA에서, 줄기 서열이 10 내지 50 뉴클레오타이드를 포함하는 합성 가이드 RNA.

B38. 실시태양 1 내지 37 중 어느 하나의 합성 가이드 RNA로, 하나 이상의 트라이아졸로 결합(들)을 포함하는 합성 가이드 RNA.

B39. 실시태양 1 내지 38 중 어느 하나의 합성 가이드 RNA로, 하나 이상의 스쿠아레이트 결합(들)을 포함하는 합성 가이드 RNA.

B40. 실시태양 1 내지 39 중 어느 하나의 합성 가이드 RNA에서, 하기의 뉴클레오타이드 조성을 포함하는 합성 가이드 RNA:

M_mN_n

상기 식에서,

각각의 N은 독립적으로 변형되지 않은 뉴클레오타이드를 나타내고;

각각의 M은 2'-O-메틸 리보뉴클레오타이드, 2'-O-메틸-3'-P(S)-리보뉴클레오타이드, 2'-O-메틸-3'-PACE 리보뉴클레오타이드, 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드, 및 2'-데옥시뉴클레오타이드 중에서 선택되고;

각각의 M은 상기 가이드 RNA의 서열 중 임의의 위치에 있고;

m은 1 내지 220의 정수이고, n은 0 내지 219의 정수이며, 50<m+n≤220이다.

B41. 실시태양 38의 합성 가이드 RNA에서, m+n<150이고, m 및 n은 각각 0 내지 150의 정수 중에서 독립적으로 선택되나, 단 m은 0이 아니다.

B42. 실시태양 1 내지 41 중 어느 하나의 합성 가이드 RNA에서, 하기의 뉴클레오타이드 조성을 포함하는 합성 가이드 RNA:

M_mN_nM'_m'N'_n'M"_m _"

상기 식에서,

각각의 M, M' 및 M"은 독립적으로 변형된 뉴클레오타이드를 나타내고, 각각의 N 및 N'은 독립적으로 변형되지 않은 리보뉴클레오타이드를 나타내며;

임의의 주어진 M은 임의의 다른 M과 동일하거나 상이하고, 임의의 주어진 N은 임의의 다른 N과 동일하거나 상이하고, 임의의 주어진 M'은 임의의 다른 M'과 동일하거나 상이하고, 임의의 주어진 N'은 임의의 다른 N'과 동일하거나 상이하고, 임의의 주어진 M"은 임의의 다른 M"과 동일하거나 상이하고;

m은 0 내지 40의 정수이고, n은 2 내지 130의 정수이고, m'은 0 내지 10의 정수이고, n'은 0 내지 50의 정수이고, m"는 0 내지 10의 정수이나, 단 m+m'+m"은 1 이상이다.

B43. 실시태양 1 내지 42 중 어느 하나의 합성 가이드 RNA에서, crRNA 분절이 하기의 뉴클레오타이드 서열을 포함하는 합성 가이드 RNA:

M_mN_nM'_m'N'_n _'

상기 식에서,

M 및 M'은 각각 변형된 뉴클레오타이드를 나타내고, N 및 N'은 각각 변형되지 않은 리보뉴클레오타이드를 나타내며;

임의의 주어진 M은 임의의 다른 M과 동일하거나 상이하고, 임의의 주어진 N은 임의의 다른 N과 동일하거나 상이하고, 임의의 주어진 M'은 임의의 다른 M'과 동일하거나 상이하고, 임의의 주어진 N'은 임의의 다른 N'과 동일하거나 상이하고;

n 및 n'은 각각 독립적으로 0 내지 50의 정수 중에서 선택되고, m 및 m'은 각각 독립적으로 0 내지 25의 정수 중에서 선택되나, 단 m+m'은 1 이상이다.

B44. 실시태양 1 내지 43 중 어느 하나의 합성 가이드 RNA에서, 가이드 서열이 하기의 뉴클레오타이드 서열을 포함하는 합성 가이드 RNA:

M_mN_nM'_m'N'_n _'

상기 식에서,

m, n, m' 및 n'은 각각 독립적으로 0 내지 40의 정수 중에서 선택되나, 단 m+m'은 1 이상이다.

B45. 실시태양 1 내지 44 중 어느 하나의 합성 가이드 RNA에서, tracrRNA 분절이 하기의 뉴클레오타이드 서열을 포함하는 합성 가이드 RNA:

N_nM_mN'_n'M'_m _'

상기 식에서,

n은 0 내지 130의 정수이고, m은 0 내지 40의 정수이고, n'은 0 내지 130의 정수이고, m'은 0 내지 40의 정수이나, 단 m+m'은 1 이상이다.

B46. 실시태양 40 내지 43 중 어느 하나의 합성 가이드 RNA에서, m, m', m+m' 또는 m+m'+m"이 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20인 합성 가이드 RNA.

B47. 실시태양 40 내지 43 중 어느 하나의 합성 가이드 RNA에서, m, m', m+m' 또는 m+m'+m"이 1, 2, 3, 4, 5 또는 6인 합성 가이드 RNA.

B48. 실시태양 40 내지 45 중 어느 하나의 합성 가이드 RNA에서, n이 16, 17, 18 또는 19인 합성 가이드 RNA.

B49. 실시태양 40 내지 45 중 어느 하나의 합성 가이드 RNA에서, n, n', 또는 n+n'이 75 내지 115의 정수인 합성 가이드 RNA.

B50. 실시태양 40 내지 47 중 어느 하나의 합성 가이드 RNA에서, 각각의 M이 2'-변형된 뉴클레오타이드, 3'-변형된 뉴클레오타이드 및 이들의 조합으로 이루어진 군 중에서 독립적으로 선택되는 합성 가이드 RNA.

B51. 실시태양 48의 합성 가이드 RNA에서, 2'-변형된 뉴클레오타이드가 2'-데옥시 뉴클레오타이드, 2'-O-메틸 뉴클레오타이드, 2'-플루오로 뉴클레오타이드, 및 2'-O-C_1- ₃알킬-O-C_1- ₃알킬 뉴클레오타이드로 이루어진 군 중에서 선택되는 합성 가이드 RNA.

B52. 실시태양 48의 합성 가이드 RNA에서, 3'-변형된 뉴클레오타이드가 3'-포스포노아세테이트 뉴클레오타이드 및 3'-티오포스포노아세테이트 뉴클레오타이드로 이루어진 군 중에서 선택되는 합성 가이드 RNA.

B53. 실시태양 48의 합성 가이드 RNA에서, 2'-변형된 뉴클레오타이드 및 3'-변형된 뉴클레오타이드의 조합이 2'-O-메틸-3'-포스포로티오에이트 뉴클레오타이드, 2'-O-메틸-3'-포스포노아세테이트 뉴클레오타이드, 또는 2'-O-메틸-3'-티오포스포노아세테이트 뉴클레오타이드를 포함하는 합성 가이드 RNA.

B54. 표적 폴리뉴클레오타이드의 절단 방법으로, 상기 표적 폴리뉴클레오타이드를 크리스퍼-결합된 단백질 및 실시태양 1 내지 53 중 어느 하나의 합성 가이드 RNA와 접촉시키고 상기 표적 폴리뉴클레오타이드를 절단시킴을 포함하는 방법.

B55. 실시태양 52의 방법으로, 표적 폴리뉴클레오타이드를 외인성 크리스퍼-결합된 단백질과 접촉시킴을 또한 포함하는 방법.

B56. 실시태양 53의 방법에서, 크리스퍼-결합된 단백질이 Cas9인 방법.

B57. 실시태양 52 내지 54 중 어느 하나의 방법에서, 절단이 표적 유전자의 기능성 녹아웃을 생성시키는 방법.

B58. 실시태양 52 내지 55 중 어느 하나의 방법으로, 절단된 표적 폴리뉴클레오타이드를 외인성 또는 내인성 주형 폴리뉴클레오타이드에 의한 상동성-지시된 수복에 의해 수복함을 또한 포함하는 방법.

B59. 실시태양 56의 방법에서, 외인성 또는 내인성 주형 폴리뉴클레오타이드가 절단 부위의 어느 한 쪽상의 서열과 실질적인 서열 일치성을 갖는 하나 이상의 서열을 포함하는 방법.

B60. 실시태양 52 내지 57 중 어느 하나의 방법으로, 절단된 표적 폴리뉴클레오타이드를 비-상동성 단부 결합에 의해 수복함을 또한 포함하는 방법.

B61. 실시태양 56 내지 58 중 어느 하나의 방법에서, 수복 단계가 표적 폴리뉴클레오타이드의 하나 이상의 뉴클레오타이드의 삽입, 결실 또는 치환을 생성시키는 방법.

B62. 실시태양 59의 방법에서, 삽입, 결실 또는 치환이 표적 폴리뉴클레오타이드를 포함하는 유전자로부터 발현된 단백질 중에 하나 이상의 아미노산 변화를 생성시키는 방법.

B63. 실시태양 52 내지 60 중 어느 하나의 방법에서, 표적 폴리뉴클레오타이드를 시험관내에서 크리스퍼-결합된 단백질 및 합성 가이드 RNA와 접촉시키는 방법.

B64. 실시태양 52 내지 61 중 어느 하나의 방법에서, 크리스퍼-결합된 단백질 및 합성 가이드 RNA와 접촉된 표적 폴리뉴클레오타이드가 시험관내 또는 생체내에서 세포의 게놈내에 있는 방법.

B65. 실시태양 62의 방법에서, 세포를, 표적 폴리뉴클레오타이드를 크리스퍼-결합된 단백질 및 합성 가이드 RNA와 접촉시키기 전에 다세포 공급원으로부터 단리시키는 방법.

B66. 실시태양 63의 방법에서, 공급원이 식물, 동물, 다세포 원생생물, 또는 진균인 방법.

B67. 실시태양 62 내지 64 중 어느 하나의 방법에서, 세포 또는 그로부터 유래된 세포를, 표적 폴리뉴클레오타이드를 크리스퍼-결합된 단백질 및 합성 가이드 RNA와 접촉시킨 후에 공급원으로 다시 복귀시키는 방법.

B68. 세포에서 표적 폴리뉴클레오타이드를 변형시키는 방법으로, 상기 세포내에 실시태양 1 내지 51 중 어느 하나의 합성 가이드 RNA를 도입시키고 상기 세포내에 크리스퍼-결합된 단백질 또는 상기 세포에서 크리스퍼-결합된 단백질을 발현하는 핵산을 도입시킴을 포함하는 방법.

B69. 실시태양 66의 방법에서, 크리스퍼-결합된 단백질이 Cas9인 방법.

B70. 세포에서 하나 이상의 유전자 산물의 발현을 변경시키는 방법으로, 상기 세포내에 실시태양 1 내지 51 중 어느 하나의 합성 가이드 RNA를 도입시키고 상기 세포내에 크리스퍼-결합된 단백질 또는 상기 세포에서 크리스퍼-결합된 단백질을 발현하는 핵산을 또한 도입시킴을 포함하며, 여기에서 상기 세포가 표적 서열을 갖고 상기 유전자 산물을 암호화하는 DNA 분자를 함유하고 발현하는 방법.

B71. 실시태양 68의 방법에서, 크리스퍼-결합된 단백질이 Cas9인 방법.

B72. 실시태양 69의 방법에서, 크리스퍼-결합된 단백질이 DNA 분자를 절단하는 방법.

B73. 실시태양 1 내지 51 중 어느 하나의 2개 이상의 합성 가이드 RNA를 포함하는 RNA 분자들의 세트 또는 라이브러리.

B74. 실시태양 1 내지 51 중 어느 하나의 합성 가이드 RNA 또는 실시태양 71의 RNA 분자들의 세트 또는 라이브러리를 포함하는 키트.

B75. 실시태양 72의 키트로, 크리스퍼-결합된 단백질 또는 상기 크리스퍼-결합된 단백질을 암호화하는 핵산을 또한 포함하는 키트.

B76. 실시태양 73의 키트에서, 크리스퍼-결합된-단백질이 Cas9인 키트.

B77. 실시태양 1 내지 76 중 어느 하나의 합성 가이드 RNA, 방법 또는 키트에서, 합성 가이드 RNA가 단부 변형을 포함하는 합성 가이드 RNA, 방법 또는 키트.

B78. 실시태양 1 내지 77 중 어느 하나의 합성 가이드 RNA로, 단일 RNA 가닥 또는 2개의 별도의 상보성 RNA 가닥을 갖고, 각각의 RNA 가닥의 양쪽 단부에서 하나 이상의 안정성-증대 변형을 포함하는 합성 가이드 RNA.

C1. (a) (i) 폴리뉴클레오타이드 중 표적 서열에 하이브리드화할 수 있는 가이드 서열, (ii) 줄기 서열을 포함하는 crRNA 분절; 및

을 포함하는 합성 가이드 RNA로,

C2. 실시태양 C1의 합성 가이드 RNA에서, 변형 중 하나 이상이 안정성-증대 변형을 포함하는 합성 가이드 RNA.

C3. 실시태양 C2의 합성 가이드 RNA에서, 안정성-증대 변형 중 하나 이상이 가이드 서열 중에 위치하는 합성 가이드 RNA.

C4. 실시태양 C2의 합성 가이드 RNA에서, 안정성-증대 변형이 2'-O-메틸 부분, Z 염기, 2'-데옥시 뉴클레오타이드, 포스포로티오에이트 뉴클레오타이드간 결합, 포스포노아세테이트(PACE) 뉴클레오타이드간 결합, 또는 티오포스포노아세테이트(티오PACE) 뉴클레오타이드간 결합, 또는 이들의 조합을 포함하는 합성 가이드 RNA.

C5. 실시태양 C1 내지 C4 중 어느 하나의 합성 가이드 RNA로, 가이드 RNA의 5' 단부에 26개 미만의 연속적인 2'-O-메틸 변형된 뉴클레오타이드를 포함하는 합성 가이드 RNA.

C6. 실시태양 C1 내지 C5 중 어느 하나의 합성 가이드 RNA로, 합성 가이드 RNA 중 시토신을 대체하는 Z 염기를 포함하는 합성 가이드 RNA.

C7. 실시태양 C1 내지 C6 중 어느 하나의 합성 가이드 RNA로, 잠재적인 표적-외 서열과의 U-G 동요 짝짓기에 관여할 수 있는 유리딘에 상응하는 위치에 하나 이상의 2-티오유라실을 포함하는 합성 가이드 RNA.

C8. 실시태양 C1 내지 C7 중 어느 하나의 합성 가이드 RNA로, 3'-포스포로티오에이트기를 갖는 2'-O-메틸 뉴클레오타이드, 3'-포스포노아세테이트기를 갖는 2'-O-메틸 뉴클레오타이드, 3'-티오포스포노아세테이트기를 갖는 2'-O-메틸 뉴클레오타이드, 및 3'-포스포노아세테이트기를 갖는 2'-데옥시 뉴클레오타이드로 이루어진 군 중에서 선택된 하나 이상의 변형을 포함하는 합성 가이드 RNA.

C9. 실시태양 C1 내지 C8 중 어느 하나의 합성 가이드 RNA로, 2개 이상의 변형을 포함하는 합성 가이드 RNA.

C10. 실시태양 C1 내지 C9 중 어느 하나의 합성 가이드 RNA로, 50개 이하의 변형을 포함하는 합성 가이드 RNA.

C11. 실시태양 C1 내지 C10 중 어느 하나의 합성 가이드 RNA로, 단일 RNA 가닥 또는 2개의 별도의 RNA 가닥, 및 각각의 RNA 가닥의 5' 단부, 각각의 RNA 가닥의 3' 단부, 또는 각각의 RNA 가닥의 5' 단부 및 3' 단부 모두에 하나 이상의 변형을 포함하는 합성 가이드 RNA.

C12. 실시태양 C1 내지 C11 중 어느 하나의 합성 가이드 RNA로, 5' 단부, 3' 단부, 또는 5' 및 3' 단부 각각에 7개 이하의 연속적인 변형된 뉴클레오타이드를 포함하는 합성 가이드 RNA.

C13. 실시태양 C1 내지 C12 중 어느 하나의 합성 가이드 RNA로, 5' 단부, 3' 단부, 및 줄기-고리 중 하나 이상에 하나 이상의 5-메틸유리딘 뉴클레오타이드를 포함하는 합성 가이드 RNA.

C14. 실시태양 C1 내지 C13 중 어느 하나의 합성 가이드 RNA에서, 변형 중 하나 이상이 염기-짝짓기 열안정성을 변경시키는 합성 가이드 RNA.

C15. 실시태양 C14의 합성 가이드 RNA에서, 하나 이상의 변형이 염기-짝짓기 열안정성을 증대시키는 합성 가이드 RNA.

C16. 실시태양 C15의 합성 가이드 RNA에서, 하나 이상의 변형이 2-티오유라실(2-티오U), 4-티오유라실(4-티오U), 2-아미노아데닌, 2'-O-메틸, 2'-플루오로, 5-메틸유리딘, 5-메틸시티딘, 및 잠금 핵산 변형(LNA) 중에서 독립적으로 선택되는 합성 가이드 RNA.

C17. 실시태양 C15의 합성 가이드 RNA로, 하나 이상의 변형이 염기-짝짓기 열안정성을 감소시키는 합성 가이드 RNA.

C18. 실시태양 C17의 합성 가이드 RNA로, 하나 이상의 변형이 2-티오유라실, 2'-데옥시, 포스포로티오에이트 결합, 포스포로다이티오에이트 결합, 보라노포스포네이트 결합, 포스포노아세테이트 결합, 티오포스포노아세테이트 결합, 및 열림 핵산 변형(ULNA) 중에서 독립적으로 선택되는 합성 가이드 RNA.

C19. 실시태양 C1 내지 C18 중 어느 하나의 합성 가이드 RNA로, 하나 이상의 2'-O-메틸A-2'-O-메틸U 염기쌍을 포함하는 합성 가이드 RNA.

C20. 실시태양 C1 내지 19 중 어느 하나의 합성 가이드 RNA에서, 변형 중 하나 이상이 특이성-변경 변형인 합성 가이드 RNA.

C21. 실시태양 C20의 합성 가이드 RNA로, 특이성-변경 변형이 가이드 서열 중에 위치하는 합성 가이드 RNA.

C22. 실시태양 C1 내지 C21 중 어느 하나의 합성 가이드 RNA에서, 특이성-변경 변형이 2-티오유라실, 4-티오유라실, 2-아미노아데닌, 2'-O-메틸, 2'-플루오로, LNA, 포스포로티오에이트 결합, 포스포로다이티오에이트 결합, 보라노포스포네이트 결합, 포스포노아세테이트 결합, 티오포스포노아세테이트 결합, ULNA, 2'-데옥시, 5-메틸유리딘, 5-메틸시티딘 또는 이들의 조합을 포함하는 합성 가이드 RNA.

C23. 실시태양 C1 내지 C22 중 어느 하나의 합성 가이드 RNA로, 형광 염료 또는 표지를 포함하는 합성 가이드 RNA.

C24. 실시태양 C23의 합성 가이드 RNA에서, 형광 염료 또는 표지가 합성 가이드 RNA의 줄기-고리에 결합되는 합성 가이드 RNA.

C25. DNA 서열을 변형시키기 위한 게놈 편집, 또는 관심 유전자 발현의 조절, 또는 표적 폴리뉴클레오타이드의 절단 방법으로, 상기 DNA 서열, 상기 관심 유전자, 또는 상기 표적 폴리뉴클레오타이드를 크리스퍼-결합된 단백질 및 실시태양 C1 내지 C24 중 어느 하나의 합성 가이드 RNA와 접촉시키고, 상기 DNA 서열, 상기 관심 유전자 또는 상기 표적 폴리뉴클레오타이드를 편집하거나 조절하거나 절단함을 포함하는 방법.

C26. 실시태양 C25의 방법에서, 합성 가이드 RNA가 가이드 서열 전체를 통해 15개 이상의 2'-O-메틸 변형을 포함하는, 시험관내에서 수행되는 방법.

C27. 실시태양 C1 내지 C26 중 어느 하나의 2개 이상의 합성 가이드 RNA를 포함하는 RNA 분자들의 세트 또는 라이브러리.

C28. 실시태양 C1 내지 C27 중 어느 하나의 합성 가이드 RNA를 포함하는 키트.

C29. 실시태양 C1 내지 C28 중 어느 하나의 2개 이상의 합성 가이드 RNA를 포함하는 RNA 분자들의 배열.

상기 예시적인 또는 바람직한 실시태양들의 기재는 특허청구범위에 의해 한정되는 바와 같은 본 발명을 제한하기보다는 예시하는 것으로서 간주해야 한다. 쉽게 이해되는 바와 같이, 상기에 제시된 특징들의 다수의 변화 및 조합을 특허청구범위에 제시된 바와 같은 본 발명으로부터 벗어남이 없이 사용할 수 있다. 상기와 같은 변화는 본 발명의 범위로부터의 이탈로서 간주되지 않으며, 모든 상기와 같은 변화를 하기 특허청구범위의 범위내에 포함하고자 한다. 본 명세서에 인용된 모든 참고문헌들은 내용 전체가 참고로 인용된다.

SEQUENCE LISTING <110> Agilent Technologies, Inc. <120> GUIDE RNA WITH CHEMICAL MODIFICATIONS <130> 20150013-04 <140> PCT/US2015/000143 <141> 2015-12-03 <150> US 62/087,211 <151> 2014-12-03 <150> US 62/146,189 <151> 2015-04-10 <150> US 62/256,095 <151> 2015-11-16 <160> 127 <170> PatentIn version 3.5 <210> 1 <211> 1368 <212> PRT <213> Streptococcus pyogenes <400> 1 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 2 <211> 7 <212> PRT <213> Simian virus 40 <400> 2 Pro Lys Lys Lys Arg Lys Val 1 5 <210> 3 <211> 7 <212> PRT <213> Simian virus 40 <400> 3 Pro Lys Lys Lys Arg Arg Val 1 5 <210> 4 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct <400> 4 Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 1 5 10 15 <210> 5 <211> 20 <212> PRT <213> Human immunodeficiency virus <220> <221> misc_feature <223> tat protein <400> 5 Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg Pro Pro Gln Pro Lys Lys 1 5 10 15 Lys Arg Lys Val 20 <210> 6 <211> 19 <212> PRT <213> Hepatitis B virus <220> <221> misc_feature <223> middle S protein, partial <400> 6 Pro Leu Ser Ser Ile Phe Ser Arg Ile Gly Asp Pro Pro Lys Lys Lys 1 5 10 15 Arg Lys Val <210> 7 <211> 24 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct <400> 7 Gly Ala Leu Phe Leu Gly Trp Leu Gly Ala Ala Gly Ser Thr Met Gly 1 5 10 15 Ala Pro Lys Lys Lys Arg Lys Val 20 <210> 8 <211> 27 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct <400> 8 Gly Ala Leu Phe Leu Gly Phe Leu Gly Ala Ala Gly Ser Thr Met Gly 1 5 10 15 Ala Trp Ser Gln Pro Lys Lys Lys Arg Lys Val 20 25 <210> 9 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct <400> 9 Lys Glu Thr Trp Trp Glu Thr Trp Trp Thr Glu Trp Ser Gln Pro Lys 1 5 10 15 Lys Lys Arg Lys Val 20 <210> 10 <211> 390 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 10 agaatttaac tgtggtcaca tttgctttat cgactggctt catctcacag ctcatcttac 60 gcaagttcga tgagtatgcc agtcactttc aatttggttg aatgttcccg tgacatgcga 120 gttctgtcga ccatgtgccg cggattgaat tcctcaaggg tggtgataga tgctacggtg 180 gtgatgcgca tgcgctcagt cctcatctcc ctcaagcagg ccccgctggt gggtcggagt 240 ccctagtgaa gccaccaata tagtggtcgt gtcaagcaac tgtccacgct ccaccctcga 300 ggtcgtaaca taaacgtact aaggcacgag taaacaagat cgatagcaag aacatggtat 360 agactgacgg agagctcgcc attagtctga 390 <210> 11 <211> 390 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 11 agaatttaac tgtggtcaca tttgctttat cgactggctt catctcacag ctcatcttac 60 gcaagttcga tgagtatgcc agtcactttc aatttggttg aatgttcccg tgacatgcga 120 gttctgtcga ccatgtgccg cggattgaat tcctcaaggg tggtgataga tgctacggtg 180 gtgatgcgta tgcactcagt cctcaactcc ctcaagcagg cgacccctgg gggtcggagt 240 ccctagtgaa gccaccaata tagtggtcgt gtcaagcaac tgtccacgct ccaccctcga 300 ggtcgtaaca taaacgtact aaggcacgag taaacaagat cgatagcaag aacatggtat 360 agactgacgg agagctcgcc attagtctga 390 <210> 12 <211> 390 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 12 agaatttaac tgtggtcaca tttgctttat cgactggctt catctcacag ctcatcttac 60 gcaagttcga tgagtatgcc agtcactttc aatttggttg aatgttcccg tgacatgcga 120 gttctgtcga ccatgtgccg cggattgaat tcctcaaggg tggtgataga tgctacggtg 180 gtgatgcaat aaatttcagc cctcatttcc ctcaagcagg ggttacttta gggtcggagt 240 ccctagtgaa gccaccaata tagtggtcgt gtcaagcaac tgtccacgct ccaccctcga 300 ggtcgtaaca taaacgtact aaggcacgag taaacaagat cgatagcaag aacatggtat 360 agactgacgg agagctcgcc attagtctga 390 <210> 13 <211> 390 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 13 agaatttaac tgtggtcaca tttgctttat cgactggctt catctcacag ctcatcttac 60 gcaagttcga tgagtatgcc agtcactttc aatttggttg aatgttcccg tgacatgcga 120 gttctgtcga ccatgtgccg cggattgaat tcctcaaggg tggtgataga tgctacggtg 180 gtgatgctct ccagcccact cctcatcccc ctcaagccgg tcccaggctg gggtcggagt 240 ccctagtgaa gccaccaata tagtggtcgt gtcaagcaac tgtccacgct ccaccctcga 300 ggtcgtaaca taaacgtact aaggcacgag taaacaagat cgatagcaag aacatggtat 360 agactgacgg agagctcgcc attagtctga 390 <210> 14 <211> 2838 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 14 gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 60 cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg 120 gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 180 ttccgcgcac atttccccga aaagtgccac ctaaattgta agcgttaata ttttgttaaa 240 attcgcgtta aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa 300 aatcccttat aaatcaaaag aatagaccga gatagggttg agtgttgttc cagtttggaa 360 caagagtcca ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca 420 gggcgatggc ccactacgtg aaccatcacc ctaatcaagt tttttggggt cgaggtgccg 480 taaagcacta aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc 540 ggcgaacgtg gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta gggcgctggc 600 aagtgtagcg gtcacgctgc gcgtaaccac cacacccgcc gcgcttaatg cgccgctaca 660 gggcgcgtcc cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc 720 ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt 780 aacgccaggg ttttcccagt cacgacgttg taaaacgacg gccagtgagc gcgcgtaata 840 cgactcacta tagggcgaat tgggtacgat cgatgcggcc tcgcaggcca aagatgtctc 900 ccgcatgcgc tcagtcctca tctccctcaa gcaggccctg ctggtgcact gaagagccac 960 cctgtgcgcg tgatatgcag ctccagcttt tgttcccttt agtgagggtt aattgcgcgc 1020 ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca 1080 cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa 1140 ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag 1200 ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc 1260 gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 1320 cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 1380 tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 1440 cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 1500 aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 1560 cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 1620 gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 1680 ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 1740 cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 1800 aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 1860 tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc 1920 ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 1980 tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 2040 ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 2100 agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca 2160 atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca 2220 cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag 2280 ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac 2340 ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc 2400 agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct 2460 agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc 2520 gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg 2580 cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc 2640 gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat 2700 tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag 2760 tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat 2820 aataccgcgc cacatagc 2838 <210> 15 <211> 2838 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 15 gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 60 cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg 120 gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 180 ttccgcgcac atttccccga aaagtgccac ctaaattgta agcgttaata ttttgttaaa 240 attcgcgtta aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa 300 aatcccttat aaatcaaaag aatagaccga gatagggttg agtgttgttc cagtttggaa 360 caagagtcca ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca 420 gggcgatggc ccactacgtg aaccatcacc ctaatcaagt tttttggggt cgaggtgccg 480 taaagcacta aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc 540 ggcgaacgtg gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta gggcgctggc 600 aagtgtagcg gtcacgctgc gcgtaaccac cacacccgcc gcgcttaatg cgccgctaca 660 gggcgcgtcc cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc 720 ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt 780 aacgccaggg ttttcccagt cacgacgttg taaaacgacg gccagtgagc gcgcgtaata 840 cgactcacta tagggcgaat tgggtacgat cgatgcggcc tcgcagggca aagaggtctc 900 ctgtatgcac tcagtcctca actccctcaa gcaggcgacc cttggtgcac tgacaaaccg 960 ctcctgcgcg tgatatgcag ctccagcttt tgttcccttt agtgagggtt aattgcgcgc 1020 ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca 1080 cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa 1140 ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag 1200 ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc 1260 gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 1320 cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 1380 tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 1440 cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 1500 aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 1560 cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 1620 gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 1680 ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 1740 cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 1800 aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 1860 tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc 1920 ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 1980 tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 2040 ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 2100 agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca 2160 atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca 2220 cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag 2280 ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac 2340 ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc 2400 agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct 2460 agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc 2520 gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg 2580 cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc 2640 gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat 2700 tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag 2760 tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat 2820 aataccgcgc cacatagc 2838 <210> 16 <211> 2838 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 16 gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 60 cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg 120 gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 180 ttccgcgcac atttccccga aaagtgccac ctaaattgta agcgttaata ttttgttaaa 240 attcgcgtta aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa 300 aatcccttat aaatcaaaag aatagaccga gatagggttg agtgttgttc cagtttggaa 360 caagagtcca ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca 420 gggcgatggc ccactacgtg aaccatcacc ctaatcaagt tttttggggt cgaggtgccg 480 taaagcacta aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc 540 ggcgaacgtg gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta gggcgctggc 600 aagtgtagcg gtcacgctgc gcgtaaccac cacacccgcc gcgcttaatg cgccgctaca 660 gggcgcgtcc cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc 720 ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt 780 aacgccaggg ttttcccagt cacgacgttg taaaacgacg gccagtgagc gcgcgtaata 840 cgactcacta tagggcgaat tgggtacgat cgatgcggcc tcaggagagg gagccatgct 900 catctccagc ccactcctca tccccctcaa gccggtccca ggctgagagg ctaaagcttg 960 tctttgcgcg tgatatgcag ctccagcttt tgttcccttt agtgagggtt aattgcgcgc 1020 ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca 1080 cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa 1140 ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag 1200 ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc 1260 gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 1320 cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 1380 tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 1440 cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 1500 aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 1560 cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 1620 gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 1680 ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 1740 cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 1800 aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 1860 tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc 1920 ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 1980 tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 2040 ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 2100 agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca 2160 atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca 2220 cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag 2280 ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac 2340 ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc 2400 agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct 2460 agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc 2520 gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg 2580 cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc 2640 gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat 2700 tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag 2760 tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat 2820 aataccgcgc cacatagc 2838 <210> 17 <211> 2995 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 17 gccgggcaag agcaactcgg tcgccgcata cactattctc agaatgactt ggttgagtac 60 tcaccagtca cagaaaagca tcttacggat ggcatgacag taagagaatt atgcagtgct 120 gccataacca tgagtgataa cactgcggcc aacttacttc tgacaacgat cggaggaccg 180 aaggagctaa ccgctttttt gcacaacatg ggggatcatg taactcgcct tgatcgttgg 240 gaaccggagc tgaatgaagc cataccaaac gacgagcgtg acaccacgat gcctgtagca 300 atggcaacaa cgttgcgcaa actattaact ggcgaactac ttactctagc ttcccggcaa 360 caattaatag actggatgga ggcggataaa gttgcaggac cacttctgcg ctcggccctt 420 ccggctggct ggtttattgc tgataaatct ggagccggtg agcgtgggtc tcgcggtatc 480 attgcagcac tggggccaga tggtaagccc tcccgtatcg tagttatcta cacgacgggg 540 agtcaggcaa ctatggatga acgaaataga cagatcgctg agataggtgc ctcactgatt 600 aagcattggt aactgtcaga ccaagtttac tcatatatac tttagattga tttaaaactt 660 catttttaat ttaaaaggat ctaggtgaag atcctttttg ataatctcat gaccaaaatc 720 ccttaacgtg agttttcgtt ccactgagcg tcagaccccg tagaaaagat caaaggatct 780 tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta 840 ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc tttttccgaa ggtaactggc 900 ttcagcagag cgcagatacc aaatactgtt cttctagtgt agccgtagtt aggccaccac 960 ttcaagaact ctgtagcacc gccacatacc tcgctctgct aatcctgtta ccagtggctg 1020 cttgccagtg gcgataagtc gtgtcttacc gggttggact caagacgata gttaccggat 1080 aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac agcccagctt ggagcgaacg 1140 acctacaccg aactgagata cctacagcgt gagctatgag aaagcgccac gcttcccgaa 1200 gggagaaagg cggacaggta tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg 1260 gagcttccag ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg ccacctctga 1320 cttgagcgtc gatttttgtg atgctcgtca ggggggcgga gcctatggaa aaacgccagc 1380 aacgcggcct ttttacggtt cctggccttt tgctggcctt ttgctcacat gttctttcct 1440 gcgttatccc ctgattctgt ggataaccgt attaccgcct ttgagtgagc tgataccgct 1500 cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga agagcgccca 1560 atacgcaaac cgcctctccc cgcgcgttgg ccgattcatt aatgcagctg gcacgacagg 1620 tttcccgact ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta gctcactcat 1680 taggcacccc aggctttaca ctttatgctt ccggctcgta tgttgtgtgg aattgtgagc 1740 ggataacaat ttcacacagg aaacagctat gaccatgatt acgccaagcg cgcaattaac 1800 cctcactaaa gggaacaaaa gctgggtacc gggccccccc tcgacaccag ttgcattcga 1860 ttcctgtttg taattgtcca attcctgcag cccgggggat cggcagatgt agtgtttcca 1920 caggggatcc actagttcta gagcggccgc caccgcggtg gagctccaat tcgccctata 1980 gtgagtcgta ttacgcgcgc tcactggccg tcgttttaca acgtcgtgac tgggaaaacc 2040 ctggcgttac ccaacttaat cgccttgcag cacatccccc tttcgccagc tggcgtaata 2100 gcgaagaggc ccgcaccgat cgcccttccc aacagttgcg cagcctgaat ggcgaatgga 2160 aattgtaagc gttaatattt tgttaaaatt cgcgttaaat ttttgttaaa tcagctcatt 2220 ttttaaccaa taggccgaaa tcggcaaaat cccttataaa tcaaaagaat agaccgagat 2280 agggttgagt gttgttccag tttggaacaa gagtccacta ttaaagaacg tggactccaa 2340 cgtcaaaggg cgaaaaaccg tctatcaggg cgatggccca ctacgtgaac catcacccta 2400 atcaagtttt ttggggtcga ggtgccgtaa agcactaaat cggaacccta aagggagccc 2460 ccgatttaga gcttgacggg gaaagccggc gaacgtggcg agaaaggaag ggaagaaagc 2520 gaaaggagcg ggcgctaggg cgctggcaag tgtagcggtc acgctgcgcg taaccaccac 2580 acccgccgcg cttaatgcgc cgctacaggg cgcgtcaggt ggcacttttc ggggaaatgt 2640 gcgcggaacc cctatttgtt tatttttcta aatacattca aatatgtatc cgctcatgag 2700 acaataaccc tgataaatgc ttcaataata ttgaaaaagg aagagtatga gtattcaaca 2760 tttccgtgtc gcccttattc ccttttttgc ggcattttgc cttcctgttt ttgctcaccc 2820 agaaacgctg gtgaaagtaa aagatgctga agatcagttg ggtgcacgag tgggttacat 2880 cgaactggat ctcaacagcg gtaagatcct tgagagtttt cgccccgaag aacgttttcc 2940 aatgatgagc acttttaaag ttctgctatg tggcgcggta ttatcccgta ttgac 2995 <210> 18 <211> 2838 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 18 gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 60 cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg 120 gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 180 ttccgcgcac atttccccga aaagtgccac ctaaattgta agcgttaata ttttgttaaa 240 attcgcgtta aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa 300 aatcccttat aaatcaaaag aatagaccga gatagggttg agtgttgttc cagtttggaa 360 caagagtcca ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca 420 gggcgatggc ccactacgtg aaccatcacc ctaatcaagt tttttggggt cgaggtgccg 480 taaagcacta aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc 540 ggcgaacgtg gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta gggcgctggc 600 aagtgtagcg gtcacgctgc gcgtaaccac cacacccgcc gcgcttaatg cgccgctaca 660 gggcgcgtcc cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc 720 ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt 780 aacgccaggg ttttcccagt cacgacgttg taaaacgacg gccagtgagc gcgcgtaata 840 cgactcacta tagggcgaat tgggtacgat cgatgcggcc tcaagagctt cactgagtag 900 gattaagata ttgcagatgt agtgtttcca cagggtggct cttcagtgca ccagcggaac 960 ctgctgcgcg tgatatgcag ctccagcttt tgttcccttt agtgagggtt aattgcgcgc 1020 ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca 1080 cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa 1140 ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag 1200 ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc 1260 gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 1320 cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 1380 tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 1440 cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 1500 aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 1560 cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 1620 gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 1680 ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 1740 cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 1800 aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 1860 tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc 1920 ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 1980 tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 2040 ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 2100 agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca 2160 atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca 2220 cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag 2280 ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac 2340 ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc 2400 agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct 2460 agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc 2520 gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg 2580 cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc 2640 gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat 2700 tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag 2760 tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat 2820 aataccgcgc cacatagc 2838 <210> 19 <211> 2838 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 19 gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 60 cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg 120 gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 180 ttccgcgcac atttccccga aaagtgccac ctaaattgta agcgttaata ttttgttaaa 240 attcgcgtta aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa 300 aatcccttat aaatcaaaag aatagaccga gatagggttg agtgttgttc cagtttggaa 360 caagagtcca ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca 420 gggcgatggc ccactacgtg aaccatcacc ctaatcaagt tttttggggt cgaggtgccg 480 taaagcacta aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc 540 ggcgaacgtg gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta gggcgctggc 600 aagtgtagcg gtcacgctgc gcgtaaccac cacacccgcc gcgcttaatg cgccgctaca 660 gggcgcgtcc cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc 720 ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt 780 aacgccaggg ttttcccagt cacgacgttg taaaacgacg gccagtgagc gcgcgtaata 840 cgactcacta tagggcgaat tgggtacgat cgatgcggcc tctctgaata gagttgggaa 900 gagatgcata caacatatgt agtatttcca cagggaatac aatggacaaa tgacctcaag 960 agcaggcgcg tgatatgcag ctccagcttt tgttcccttt agtgagggtt aattgcgcgc 1020 ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca 1080 cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa 1140 ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag 1200 ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc 1260 gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 1320 cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 1380 tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 1440 cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 1500 aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 1560 cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 1620 gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 1680 ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 1740 cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 1800 aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 1860 tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc 1920 ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 1980 tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 2040 ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 2100 agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca 2160 atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca 2220 cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag 2280 ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac 2340 ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc 2400 agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct 2460 agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc 2520 gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg 2580 cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc 2640 gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat 2700 tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag 2760 tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat 2820 aataccgcgc cacatagc 2838 <210> 20 <211> 2838 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 20 gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 60 cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg 120 gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 180 ttccgcgcac atttccccga aaagtgccac ctaaattgta agcgttaata ttttgttaaa 240 attcgcgtta aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa 300 aatcccttat aaatcaaaag aatagaccga gatagggttg agtgttgttc cagtttggaa 360 caagagtcca ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca 420 gggcgatggc ccactacgtg aaccatcacc ctaatcaagt tttttggggt cgaggtgccg 480 taaagcacta aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc 540 ggcgaacgtg gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta gggcgctggc 600 aagtgtagcg gtcacgctgc gcgtaaccac cacacccgcc gcgcttaatg cgccgctaca 660 gggcgcgtcc cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc 720 ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt 780 aacgccaggg ttttcccagt cacgacgttg taaaacgacg gccagtgagc gcgcgtaata 840 cgactcacta tagggcgaat tgggtacgat cgatgcggcc tcgggcagct gcaggaataa 900 gagggatgtg aatggtaatg atggcttcaa catggcgctt gctcttcatt ccctgggtgt 960 agtctgcgcg tgatatgcag ctccagcttt tgttcccttt agtgagggtt aattgcgcgc 1020 ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca 1080 cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa 1140 ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag 1200 ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc 1260 gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 1320 cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 1380 tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 1440 cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 1500 aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 1560 cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 1620 gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 1680 ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 1740 cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 1800 aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 1860 tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc 1920 ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 1980 tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 2040 ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 2100 agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca 2160 atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca 2220 cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag 2280 ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac 2340 ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc 2400 agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct 2460 agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc 2520 gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg 2580 cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc 2640 gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat 2700 tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag 2760 tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat 2820 aataccgcgc cacatagc 2838 <210> 21 <211> 2838 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 21 gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 60 cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg 120 gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 180 ttccgcgcac atttccccga aaagtgccac ctaaattgta agcgttaata ttttgttaaa 240 attcgcgtta aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa 300 aatcccttat aaatcaaaag aatagaccga gatagggttg agtgttgttc cagtttggaa 360 caagagtcca ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca 420 gggcgatggc ccactacgtg aaccatcacc ctaatcaagt tttttggggt cgaggtgccg 480 taaagcacta aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc 540 ggcgaacgtg gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta gggcgctggc 600 aagtgtagcg gtcacgctgc gcgtaaccac cacacccgcc gcgcttaatg cgccgctaca 660 gggcgcgtcc cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc 720 ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt 780 aacgccaggg ttttcccagt cacgacgttg taaaacgacg gccagtgagc gcgcgtaata 840 cgactcacta tagggcgaat tgggtacgat cgatgcggcc tcctccttac tgcagccgaa 900 gtccggcctc aggatgttgt cgatgaaaaa gttggtggtg cggtgcagct gggccgctgg 960 ctgcggcgcg tgatatgcag ctccagcttt tgttcccttt agtgagggtt aattgcgcgc 1020 ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca 1080 cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa 1140 ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag 1200 ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc 1260 gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 1320 cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 1380 tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 1440 cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 1500 aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 1560 cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 1620 gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 1680 ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 1740 cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 1800 aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 1860 tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc 1920 ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 1980 tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 2040 ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 2100 agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca 2160 atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca 2220 cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag 2280 ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac 2340 ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc 2400 agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct 2460 agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc 2520 gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg 2580 cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc 2640 gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat 2700 tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag 2760 tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat 2820 aataccgcgc cacatagc 2838 <210> 22 <211> 2838 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 22 gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 60 cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg 120 gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 180 ttccgcgcac atttccccga aaagtgccac ctaaattgta agcgttaata ttttgttaaa 240 attcgcgtta aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa 300 aatcccttat aaatcaaaag aatagaccga gatagggttg agtgttgttc cagtttggaa 360 caagagtcca ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca 420 gggcgatggc ccactacgtg aaccatcacc ctaatcaagt tttttggggt cgaggtgccg 480 taaagcacta aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc 540 ggcgaacgtg gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta gggcgctggc 600 aagtgtagcg gtcacgctgc gcgtaaccac cacacccgcc gcgcttaatg cgccgctaca 660 gggcgcgtcc cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc 720 ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt 780 aacgccaggg ttttcccagt cacgacgttg taaaacgacg gccagtgagc gcgcgtaata 840 cgactcacta tagggcgaat tgggtacgat cgatgcggcc tcgtcctttc gccggccgaa 900 ctcgggccgc aggatgttgt cgatgaagaa gttggtgatg cggtgcgggt gctggtggtt 960 gccgggcgcg tgatatgcag ctccagcttt tgttcccttt agtgagggtt aattgcgcgc 1020 ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca 1080 cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa 1140 ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag 1200 ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc 1260 gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 1320 cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 1380 tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 1440 cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 1500 aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 1560 cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 1620 gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 1680 ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 1740 cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 1800 aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 1860 tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc 1920 ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 1980 tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 2040 ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 2100 agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca 2160 atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca 2220 cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag 2280 ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac 2340 ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc 2400 agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct 2460 agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc 2520 gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg 2580 cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc 2640 gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat 2700 tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag 2760 tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat 2820 aataccgcgc cacatagc 2838 <210> 23 <211> 2838 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 23 gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 60 cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg 120 gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 180 ttccgcgcac atttccccga aaagtgccac ctaaattgta agcgttaata ttttgttaaa 240 attcgcgtta aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa 300 aatcccttat aaatcaaaag aatagaccga gatagggttg agtgttgttc cagtttggaa 360 caagagtcca ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca 420 gggcgatggc ccactacgtg aaccatcacc ctaatcaagt tttttggggt cgaggtgccg 480 taaagcacta aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc 540 ggcgaacgtg gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta gggcgctggc 600 aagtgtagcg gtcacgctgc gcgtaaccac cacacccgcc gcgcttaatg cgccgctaca 660 gggcgcgtcc cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc 720 ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt 780 aacgccaggg ttttcccagt cacgacgttg taaaacgacg gccagtgagc gcgcgtaata 840 cgactcacta tagggcgaat tgggtacgat cgatgcggcc tcggaacatt ggtaattaaa 900 cttaacgcct cagatttaga cgaaggattg aatggggaca ttgtttattc attctcgaat 960 gatacgcgcg tgatatgcag ctccagcttt tgttcccttt agtgagggtt aattgcgcgc 1020 ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca 1080 cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa 1140 ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag 1200 ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc 1260 gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 1320 cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 1380 tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 1440 cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 1500 aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 1560 cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 1620 gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 1680 ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 1740 cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 1800 aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 1860 tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc 1920 ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 1980 tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 2040 ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 2100 agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca 2160 atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca 2220 cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag 2280 ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac 2340 ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc 2400 agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct 2460 agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc 2520 gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg 2580 cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc 2640 gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat 2700 tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag 2760 tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat 2820 aataccgcgc cacatagc 2838 <210> 24 <211> 2838 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 24 gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 60 cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg 120 gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 180 ttccgcgcac atttccccga aaagtgccac ctaaattgta agcgttaata ttttgttaaa 240 attcgcgtta aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa 300 aatcccttat aaatcaaaag aatagaccga gatagggttg agtgttgttc cagtttggaa 360 caagagtcca ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca 420 gggcgatggc ccactacgtg aaccatcacc ctaatcaagt tttttggggt cgaggtgccg 480 taaagcacta aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc 540 ggcgaacgtg gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta gggcgctggc 600 aagtgtagcg gtcacgctgc gcgtaaccac cacacccgcc gcgcttaatg cgccgctaca 660 gggcgcgtcc cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc 720 ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt 780 aacgccaggg ttttcccagt cacgacgttg taaaacgacg gccagtgagc gcgcgtaata 840 cgactcacta tagggcgaat tgggtacgat cgatgcggcc tcggaacgct ggtgattcat 900 cccaatgcct cagatttaga cgaaggcttg aatggggata ttatttactc cttctccagt 960 gatgtgcgcg tgatatgcag ctccagcttt tgttcccttt agtgagggtt aattgcgcgc 1020 ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca 1080 cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa 1140 ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag 1200 ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc 1260 gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 1320 cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 1380 tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 1440 cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 1500 aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 1560 cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 1620 gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 1680 ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 1740 cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 1800 aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 1860 tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc 1920 ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 1980 tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 2040 ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 2100 agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca 2160 atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca 2220 cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag 2280 ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac 2340 ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc 2400 agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct 2460 agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc 2520 gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg 2580 cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc 2640 gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat 2700 tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag 2760 tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat 2820 aataccgcgc cacatagc 2838 <210> 25 <211> 56 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <400> 25 aguccucauc ucccucaagc guuuaagagc uaugcuguuu ugaauggucc caaaac 56 <210> 26 <211> 86 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <400> 26 ggaaccauuc aaaacagcau agcaaguuua aauaaggcua guccguuauc aacuuguaaa 60 aguggcaccg agucggugcu uuuuuu 86 <210> 27 <211> 56 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <400> 27 ugguaaugau ggcuucaaca guuuuagagc uaugcuguuu ugaauggucc caaaac 56 <210> 28 <211> 86 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <400> 28 ggaaccauuc aaaacagcau agcaaguuua aauaaggcua guccguuauc aacuuguaaa 60 aguggcaccg agucggugcu uuuuuu 86 <210> 29 <211> 56 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <400> 29 aguccucauc ucccucaagc guuuaagagc uaugcuguuu ugaauggucc caaaac 56 <210> 30 <211> 86 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> misc_feature <222> (57)..(57) <223> u is 5-(3-Aminoallyl)-uridine-5'-triphosphate, labeled with Cyanine5 <400> 30 ggaaccauuc aaaacagcau agcaaguuua aauaaggcua guccguuauc aacuuguaaa 60 aguggcaccg agucggugcu uuuuuu 86 <210> 31 <211> 56 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-methyl <222> (1)..(3) <220> <221> 2'-O-methyl <222> (53)..(55) <400> 31 ugguaaugau ggcuucaaca guuuuagagc uaugcuguuu ugaauggucc caaaac 56 <210> 32 <211> 86 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl <222> (1)..(3) <220> <221> 2'-O-Methyl <222> (83)..(85) <400> 32 ggaaccauuc aaaacagcau agcaaguuua aauaaggcua guccguuauc aacuuguaaa 60 aguggcaccg agucggugcu uuuuuu 86 <210> 33 <211> 56 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl <222> (1)..(3) <220> <221> phosphorothioate internucleotide linkage <222> (1)..(4) <220> <221> 2'-O-Methyl <222> (53)..(55) <220> <221> phosphorothioate internucleotide linkage <222> (53)..(56) <400> 33 ugguaaugau ggcuucaaca guuuuagagc uaugcuguuu ugaauggucc caaaac 56 <210> 34 <211> 86 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..(3) <220> <221> phosphorothioate internucleotide linkage <222> (1)..(4) <220> <221> 2'-O-Methyl nucleotide <222> (83)..(85) <220> <221> phosphorothioate internucleotide linkage <222> (83)..(86) <400> 34 ggaaccauuc aaaacagcau agcaaguuua aauaaggcua guccguuauc aacuuguaaa 60 aguggcaccg agucggugcu uuuuuu 86 <210> 35 <211> 56 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..(3) <220> <221> thiophosphonoacetate internucleotide linkage <222> (1)..(4) <220> <221> 2'-O-Methyl nucleotide <222> (53)..(55) <220> <221> thiophosphonoacetate internucleotide linkage <222> (53)..(56) <400> 35 ugguaaugau ggcuucaaca guuuuagagc uaugcuguuu ugaauggucc caaaac 56 <210> 36 <211> 86 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..(3) <220> <221> thiophosphonoacetate internucleotide linkage <222> (1)..(4) <220> <221> 2'-O-Methyl nucleotide <222> (83)..(85) <220> <221> thiophosphonoacetate internucleotide linkage <222> (83)..(86) <400> 36 ggaaccauuc aaaacagcau agcaaguuua aauaaggcua guccguuauc aacuuguaaa 60 aguggcaccg agucggugcu uuuuuu 86 <210> 37 <211> 56 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..(1) <220> <221> thiophosphonoacetate internucleotide linkage <222> (1)..(2) <220> <221> 2'-O-Methyl nucleotide <222> (55)..(55) <220> <221> thiophosphonoacetate internucleotide linkage <222> (55)..(56) <400> 37 ugguaaugau ggcuucaaca guuuuagagc uaugcuguuu ugaauggucc caaaac 56 <210> 38 <211> 86 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..(1) <220> <221> thiophosphonoacetate internucleotide linkage <222> (1)..(2) <220> <221> 2'-O-Methyl nucleotide <222> (85)..(85) <220> <221> thiophosphonoacetate internucleotide linkage <222> (85)..(86) <400> 38 ggaaccauuc aaaacagcau agcaaguuua aauaaggcua guccguuauc aacuuguaaa 60 aguggcaccg agucggugcu uuuuuu 86 <210> 39 <211> 56 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2-thiouridine nucleotide <222> (3)..(3) <400> 39 aguccucauc ucccucaagc guuuaagagc uaugcuguuu ugaauggucc caaaac 56 <210> 40 <211> 56 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2-thiouridine nucleotide <222> (9)..(9) <400> 40 aguccucauc ucccucaagc guuuaagagc uaugcuguuu ugaauggucc caaaac 56 <210> 41 <211> 56 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2-thiouridine nucleotide <222> (11)..(11) <400> 41 aguccucauc ucccucaagc guuuaagagc uaugcuguuu ugaauggucc caaaac 56 <210> 42 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <400> 42 aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 43 <211> 100 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <400> 43 aguccucauc ucccucaagc guuuuagagc uaguaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 44 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <400> 44 gcagauguag uguuuccaca guuuaagagc uaugcuggaa acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 45 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <400> 45 uccucaucuc ccucaagcgu uuaagagcua ugcugguaac agcauagcaa guuuaaauaa 60 ggcuaguccg uuaucaacuu gaaaaagugg caccgagucg gugcuuuuuu u 111 <210> 46 <211> 110 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <400> 46 ccucaucucc cucaagcguu uaagagcuau gcugguaaca gcauagcaag uuuaaauaag 60 gcuaguccgu uaucaacuug aaaaaguggc accgagucgg ugcuuuuuuu 110 <210> 47 <211> 114 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <400> 47 gaguccucau cucccucaag cguuuaagag cuaugcuggu aacagcauag caaguuuaaa 60 uaaggcuagu ccguuaucaa cuugaaaaag uggcaccgag ucggugcuuu uuuu 114 <210> 48 <211> 115 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <400> 48 ggaguccuca ucucccucaa gcguuuaaga gcuaugcugg uaacagcaua gcaaguuuaa 60 auaaggcuag uccguuauca acuugaaaaa guggcaccga gucggugcuu uuuuu 115 <210> 49 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <400> 49 aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aauucuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 50 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <400> 50 aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaaacuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 51 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <400> 51 aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaaacuaguu uguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 52 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <400> 52 ggacuuuuuu uaguccucau cucccucaag cguuuuagag cuagaaauag caaguuaaaa 60 uaaggcuagu ccguuaucaa cuugaaaaag uggcaccgag ucggugcuuu u 111 <210> 53 <211> 116 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <400> 53 gaugaggacu uuuuuuaguc cucaucuccc ucaagcguuu uagagcuaga aauagcaagu 60 uaaaauaagg cuaguccguu aucaacuuga aaaaguggca ccgagucggu gcuuuu 116 <210> 54 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <400> 54 gcuuguuuuu uaguccucau cucccucaag cguuuuagag cuagaaauag caaguuaaaa 60 uaaggcuagu ccguuaucaa cuugaaaaag uggcaccgag ucggugcuuu u 111 <210> 55 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> a is 5'-dimethoxytrityl-adenosine <222> (1)..(1) <400> 55 aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 56 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <400> 56 aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 57 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> fluorophore <222> (39)..(39) <220> <221> misc_feature <222> (39)..(39) <223> n is a, c, g, or u, unknown or other <400> 57 aguccucauc ucccucaagc guuuaagagc uaugcuggna acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 58 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl <222> (1)..(3) <220> <221> fluorophore <222> (39)..(39) <220> <221> misc_feature <222> (39)..(39) <223> n is a, c, g, or u, unknown or other <220> <221> 2'-O-Methyl <222> (110)..(112) <400> 58 aguccucauc ucccucaagc guuuaagagc uaugcuggna acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 59 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..(3) <220> <221> phosphorothioate internucleotide linkage <222> (1)..(4) <220> <221> fluorophore <222> (39)..(39) <220> <221> misc_feature <222> (39)..(39) <223> n is a, c, g, or u, unknown or other <220> <221> 2'-O-Methyl nucleotide <222> (110)..(112) <220> <221> phosphorothioate internucleotide linkage <222> (110)..(113) <400> 59 aguccucauc ucccucaagc guuuaagagc uaugcuggna acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 60 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..(3) <220> <221> thiophosphonoacetate internucleotide linkage <222> (1)..(4) <220> <221> fluorophore <222> (39)..(39) <220> <221> misc_feature <222> (39)..(39) <223> n is a, c, g, or u, unknown or other <220> <221> 2'-O-Methyl nucleotide <222> (109)..(111) <220> <221> thiophosphonoacetate internucleotide linkage <222> (109)..(112) <220> <221> 2'-O-Methyl nucleotide <222> (110)..(112) <400> 60 aguccucauc ucccucaagc guuuaagagc uaugcuggna acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 61 <211> 102 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..(1) <220> <221> thiophosphonoacetate internucleotide linkage <222> (1)..(2) <220> <221> fluorophore <222> (2)..(2) <220> <221> misc_feature <222> (2)..(2) <223> n is a, c, g, or u, unknown or other <220> <221> fluorophore <222> (68)..(68) <220> <221> misc_feature <222> (68)..(68) <223> n is a, c, g, or u <220> <221> fluorophore <222> (100)..(100) <220> <221> misc_feature <222> (100)..(100) <223> n is a, c, g, or u <220> <221> 2'-O-Methyl nucleotide <222> (101)..(101) <220> <221> thiophosphonoacetate internucleotide linkage <222> (101)..(102) <400> 61 ungcagaugu aguguuucca caguuuaaga gcuaguaaua gcaaguuuaa auaaggcuag 60 uccguuanca acuugaaaaa guggcaccga gucggugcun uu 102 <210> 62 <211> 100 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..(1) <220> <221> thiophosphonoacetate internucleotide linkage <222> (1)..(2) <220> <221> fluorophore <222> (34)..(34) <220> <221> misc_feature <222> (34)..(34) <223> n is a, c, g, or u, unknown or other <220> <221> fluorophore <222> (74)..(74) <220> <221> misc_feature <222> (74)..(74) <223> n is a, c, g, or u, unknown or other <220> <221> fluorophore <222> (90)..(90) <220> <221> misc_feature <222> (90)..(90) <223> n is a, c, g, or u, unknown or other <220> <221> 2'-O-Methyl nucleotide <222> (99)..(99) <220> <221> thiophosphonoacetate internucleotide linkage <222> (99)..(100) <400> 62 gcagauguag uguuuccaca guuuaagagc uagnaauagc aaguuuaaau aaggcuaguc 60 cguuaucaac uugnaaaagu ggcaccgagn cggugcuuuu 100 <210> 63 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> phosphorothioate internucleotide linkage <222> (1)..(3) <400> 63 aguccucauc ucccucaagc guuuaagagc uaugcuggaa acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 64 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> phosphorothioate internucleotide linkage <222> (1)..(4) <400> 64 aguccucauc ucccucaagc guuuaagagc uaugcuggaa acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 65 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> phosphorothioate internucleotide linkage <222> (1)..(5) <400> 65 aguccucauc ucccucaagc guuuaagagc uaugcuggaa acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 66 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> phosphorothioate internucleotide linkage <222> (109)..(113) <400> 66 aguccucauc ucccucaagc guuuaagagc uaugcuggaa acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 67 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (20)..(20) <400> 67 aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 68 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (19)..(19) <400> 68 aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 69 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (18)..(18) <400> 69 aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 70 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (17)..(17) <400> 70 aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 71 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (17)..(18) <400> 71 aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 72 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..(3) <220> <221> 2'-O-Methyl nucleotide <222> (110)..(112) <400> 72 aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 73 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..(3) <220> <221> 2'-O-Methyl nucleotide <222> (110)..(112) <400> 73 gcagauguag uguuuccaca guuuaagagc uaugcuggaa acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 74 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..(20) <400> 74 aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 75 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..(26) <400> 75 aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 76 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..(37) <400> 76 aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 77 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..(7) <220> <221> 2'-O-Methyl nucleotide <222> (9)..(11) <220> <221> 2'-O-Methyl nucleotide <222> (13)..(14) <220> <221> 2'-O-Methyl nucleotide <222> (20)..(20) <220> <221> 2'-O-Methyl nucleotide <222> (30)..(31) <220> <221> 2'-O-Methyl nucleotide <222> (33)..(33) <220> <221> 2'-O-Methyl nucleotide <222> (35)..(36) <220> <221> 2'-O-Methyl nucleotide <222> (42)..(42) <220> <221> 2'-O-Methyl nucleotide <222> (45)..(45) <220> <221> 2'-O-Methyl nucleotide <222> (76)..(77) <220> <221> 2'-O-Methyl nucleotide <222> (80)..(82) <220> <221> 2'-O-Methyl nucleotide <222> (90)..(90) <220> <221> 2'-O-Methyl nucleotide <222> (95)..(96) <220> <221> 2'-O-Methyl nucleotide <222> (100)..(101) <220> <221> 2'-O-Methyl nucleotide <222> (104)..(104) <220> <221> 2'-O-Methyl nucleotide <222> (106)..(112) <400> 77 aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 78 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..(7) <220> <221> 2'-O-Methyl nucleotide <222> (9)..(11) <220> <221> 2'-O-Methyl nucleotide <222> (17)..(17) <220> <221> 2'-O-Methyl nucleotide <222> (27)..(28) <220> <221> 2'-O-Methyl nucleotide <222> (30)..(30) <220> <221> 2'-O-Methyl nucleotide <222> (32)..(33) <220> <221> 2'-O-Methyl nucleotide <222> (36)..(36) <220> <221> 2'-O-Methyl nucleotide <222> (39)..(39) <220> <221> 2'-O-Methyl nucleotide <222> (42)..(42) <220> <221> 2'-O-Methyl nucleotide <222> (44)..(44) <220> <221> 2'-O-Methyl nucleotide <222> (47)..(47) <220> <221> 2'-O-Methyl nucleotide <222> (57)..(57) <220> <221> 2'-O-Methyl nucleotide <222> (62)..(63) <220> <221> 2'-O-Methyl nucleotide <222> (67)..(68) <220> <221> 2'-O-Methyl nucleotide <222> (73)..(74) <220> <221> 2'-O-Methyl nucleotide <222> (77)..(78) <220> <221> 2'-O-Methyl nucleotide <222> (87)..(87) <220> <221> 2'-O-Methyl nucleotide <222> (90)..(90) <220> <221> 2'-O-Methyl nucleotide <222> (92)..(93) <220> <221> 2'-O-Methyl nucleotide <222> (97)..(98) <220> <221> 2'-O-Methyl nucleotide <222> (101)..(101) <220> <221> 2'-O-Methyl nucleotide <222> (103)..(109) <400> 78 aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 79 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..(7) <220> <221> 2'-O-Methyl nucleotide <222> (9)..(11) <220> <221> 2'-O-Methyl nucleotide <222> (17)..(17) <220> <221> 2'-O-Methyl nucleotide <222> (27)..(28) <220> <221> 2'-O-Methyl nucleotide <222> (30)..(30) <220> <221> 2'-O-Methyl nucleotide <222> (32)..(33) <220> <221> 2'-O-Methyl nucleotide <222> (36)..(36) <220> <221> 2'-O-Methyl nucleotide <222> (39)..(39) <220> <221> 2'-O-Methyl nucleotide <222> (42)..(42) <220> <221> 2'-O-Methyl nucleotide <222> (44)..(44) <220> <221> 2'-O-Methyl nucleotide <222> (47)..(47) <220> <221> 2'-O-Methyl nucleotide <222> (57)..(57) <220> <221> 2'-O-Methyl nucleotide <222> (62)..(63) <220> <221> 2'-O-Methyl nucleotide <222> (67)..(68) <220> <221> 2'-O-Methyl nucleotide <222> (73)..(74) <220> <221> 2'-O-Methyl nucleotide <222> (77)..(78) <220> <221> 2'-O-Methyl nucleotide <222> (87)..(87) <220> <221> 2'-O-Methyl nucleotide <222> (90)..(90) <220> <221> 2'-O-Methyl nucleotide <222> (92)..(93) <220> <221> 2'-O-Methyl nucleotide <222> (97)..(98) <220> <221> 2'-O-Methyl nucleotide <222> (101)..(101) <220> <221> 2'-O-Methyl nucleotide <222> (103)..(109) <400> 79 aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 80 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..(3) <220> <221> 2'-O-Methyl nucleotide <222> (8)..(8) <220> <221> 2'-O-Methyl nucleotide <222> (17)..(18) <220> <221> 2'-O-Methyl nucleotide <222> (21)..(21) <220> <221> 2'-O-Methyl nucleotide <222> (26)..(26) <220> <221> 2'-O-Methyl nucleotide <222> (28)..(29) <220> <221> 2'-O-Methyl nucleotide <222> (32)..(32) <220> <221> 2'-O-Methyl nucleotide <222> (34)..(34) <220> <221> 2'-O-Methyl nucleotide <222> (37)..(38) <220> <221> 2'-O-Methyl nucleotide <222> (40)..(41) <220> <221> 2'-O-Methyl nucleotide <222> (43)..(44) <220> <221> 2'-O-Methyl nucleotide <222> (46)..(46) <220> <221> 2'-O-Methyl nucleotide <222> (48)..(49) <220> <221> 2'-O-Methyl nucleotide <222> (51)..(52) <220> <221> 2'-O-Methyl nucleotide <222> (58)..(58) <220> <221> 2'-O-Methyl nucleotide <222> (61)..(64) <220> <221> 2'-O-Methyl nucleotide <222> (67)..(67) <220> <221> 2'-O-Methyl nucleotide <222> (78)..(79) <220> <221> 2'-O-Methyl nucleotide <222> (83)..(89) <220> <221> 2'-O-Methyl nucleotide <222> (91)..(92) <220> <221> 2'-O-Methyl nucleotide <222> (94)..(94) <220> <221> 2'-O-Methyl nucleotide <222> (97)..(99) <220> <221> 2'-O-Methyl nucleotide <222> (102)..(103) <220> <221> 2'-O-Methyl nucleotide <222> (105)..(105) <400> 80 aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 81 <211> 100 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..(3) <220> <221> 2'-O-Methyl nucleotide <222> (8)..(8) <220> <221> 2'-O-Methyl nucleotide <222> (17)..(18) <220> <221> 2'-O-Methyl nucleotide <222> (21)..(21) <220> <221> 2'-O-Methyl nucleotide <222> (26)..(26) <220> <221> 2'-O-Methyl nucleotide <222> (28)..(29) <220> <221> 2'-O-Methyl nucleotide <222> (32)..(33) <220> <221> 2'-O-Methyl nucleotide <222> (35)..(36) <220> <221> 2'-O-Methyl nucleotide <222> (38)..(39) <220> <221> 2'-O-Methyl nucleotide <222> (41)..(42) <220> <221> 2'-O-Methyl nucleotide <222> (46)..(46) <220> <221> 2'-O-Methyl nucleotide <222> (48)..(48) <220> <221> 2'-O-Methyl nucleotide <222> (51)..(54) <220> <221> 2'-O-Methyl nucleotide <222> (57)..(57) <220> <221> 2'-O-Methyl nucleotide <222> (68)..(69) <220> <221> 2'-O-Methyl nucleotide <222> (73)..(79) <220> <221> 2'-O-Methyl nucleotide <222> (81)..(82) <220> <221> 2'-O-Methyl nucleotide <222> (84)..(84) <220> <221> 2'-O-Methyl nucleotide <222> (87)..(89) <220> <221> 2'-O-Methyl nucleotide <222> (92)..(93) <220> <221> 2'-O-Methyl nucleotide <222> (95)..(95) <400> 81 aguccucauc ucccucaagc guuuuagagc uaguaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 82 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..(3) <220> <221> 2'-O-Methyl nucleotide <222> (110)..(112) <400> 82 gcagauguag uguuuccaca guuuaagagc uaugcuggaa acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 83 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..(3) <220> <221> 2'-O-Methyl nucleotide <222> (6)..(6) <220> <221> 2'-O-Methyl nucleotide <222> (8)..(8) <220> <221> 2'-O-Methyl nucleotide <222> (11)..(11) <220> <221> 2'-O-Methyl nucleotide <222> (13)..(17) <220> <221> 2'-O-Methyl nucleotide <222> (30)..(31) <220> <221> 2'-O-Methyl nucleotide <222> (33)..(33) <220> <221> 2'-O-Methyl nucleotide <222> (35)..(36) <220> <221> 2'-O-Methyl nucleotide <222> (39)..(39) <220> <221> 2'-O-Methyl nucleotide <222> (42)..(42) <220> <221> 2'-O-Methyl nucleotide <222> (45)..(45) <220> <221> 2'-O-Methyl nucleotide <222> (47)..(47) <220> <221> 2'-O-Methyl nucleotide <222> (50)..(50) <220> <221> 2'-O-Methyl nucleotide <222> (56)..(56) <220> <221> 2'-O-Methyl nucleotide <222> (60)..(60) <220> <221> 2'-O-Methyl nucleotide <222> (65)..(66) <220> <221> 2'-O-Methyl nucleotide <222> (69)..(71) <220> <221> 2'-O-Methyl nucleotide <222> (76)..(77) <220> <221> 2'-O-Methyl nucleotide <222> (80)..(82) <220> <221> 2'-O-Methyl nucleotide <222> (90)..(90) <220> <221> 2'-O-Methyl nucleotide <222> (93)..(93) <220> <221> 2'-O-Methyl nucleotide <222> (95)..(96) <220> <221> 2'-O-Methyl nucleotide <222> (100)..(101) <220> <221> 2'-O-Methyl nucleotide <222> (104)..(104) <220> <221> 2'-O-Methyl nucleotide <222> (106)..(112) <400> 83 gcagauguag uguuuccaca guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 84 <211> 100 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..(5) <220> <221> 2'-O-Methyl nucleotide <222> (26)..(29) <220> <221> 2'-O-Methyl nucleotide <222> (32)..(33) <220> <221> 2'-O-Methyl nucleotide <222> (35)..(36) <220> <221> 2'-O-Methyl nucleotide <222> (38)..(39) <220> <221> 2'-O-Methyl nucleotide <222> (41)..(42) <220> <221> 2'-O-Methyl nucleotide <222> (46)..(46) <220> <221> 2'-O-Methyl nucleotide <222> (48)..(49) <220> <221> 2'-O-Methyl nucleotide <222> (52)..(54) <220> <221> 2'-O-Methyl nucleotide <222> (57)..(57) <220> <221> 2'-O-Methyl nucleotide <222> (68)..(69) <220> <221> 2'-O-Methyl nucleotide <222> (73)..(79) <220> <221> 2'-O-Methyl nucleotide <222> (81)..(82) <220> <221> 2'-O-Methyl nucleotide <222> (84)..(84) <220> <221> 2'-O-Methyl nucleotide <222> (87)..(89) <220> <221> 2'-O-Methyl nucleotide <222> (92)..(93) <220> <221> 2'-O-Methyl nucleotide <222> (95)..(95) <400> 84 gcagauguag uguuuccaca guuuuagagc uaguaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 85 <211> 100 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..(3) <220> <221> 2'-O-Methyl nucleotide <222> (6)..(6) <220> <221> 2'-O-Methyl nucleotide <222> (8)..(8) <220> <221> 2'-O-Methyl nucleotide <222> (11)..(11) <220> <221> 2'-O-Methyl nucleotide <222> (13)..(17) <220> <221> 2'-O-Methyl nucleotide <222> (25)..(25) <220> <221> 2'-O-Methyl nucleotide <222> (30)..(31) <220> <221> 2'-O-Methyl nucleotide <222> (34)..(34) <220> <221> 2'-O-Methyl nucleotide <222> (37)..(37) <220> <221> 2'-O-Methyl nucleotide <222> (40)..(40) <220> <221> 2'-O-Methyl nucleotide <222> (50)..(50) <220> <221> 2'-O-Methyl nucleotide <222> (55)..(56) <220> <221> 2'-O-Methyl nucleotide <222> (59)..(61) <220> <221> 2'-O-Methyl nucleotide <222> (66)..(67) <220> <221> 2'-O-Methyl nucleotide <222> (70)..(72) <220> <221> 2'-O-Methyl nucleotide <222> (80)..(80) <220> <221> 2'-O-Methyl nucleotide <222> (83)..(83) <220> <221> 2'-O-Methyl nucleotide <222> (85)..(86) <220> <221> 2'-O-Methyl nucleotide <222> (90)..(91) <220> <221> 2'-O-Methyl nucleotide <222> (94)..(94) <220> <221> 2'-O-Methyl nucleotide <222> (96)..(99) <400> 85 gcagauguag uguuuccaca guuuuagagc uaguaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 86 <211> 113 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-deoxy-nucleotide <222> (1)..(20) <400> 86 agtcctcatc tccctcaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 87 <211> 113 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-deoxy-nucleotide <222> (1)..(26) <400> 87 agtcctcatc tccctcaagc gtttaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 88 <211> 113 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-deoxy-nucleotide <222> (1)..(37) <400> 88 agtcctcatc tccctcaagc gtttaagagc tatgctggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 89 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-deoxy-nucleotide <222> (15)..(15) <220> <221> phosphonoacetate internucleotide linkage <222> (15)..(16) <400> 89 gcagauguag uguuuccaca guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 90 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..(1) <220> <221> phosphonoacetate internucleotide linkage <222> (1)..(2) <400> 90 aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 91 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..(2) <220> <221> phosphonoacetate internucleotide linkage <222> (1)..(3) <400> 91 aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 92 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..(3) <220> <221> phosphonoacetate internucleotide linkage <222> (1)..(4) <400> 92 aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 93 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..(4) <220> <221> phosphonoacetate internucleotide linkage <222> (1)..(5) <400> 93 aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 94 <211> 115 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..(5) <220> <221> phosphonoacetate internucleotide linkage <222> (1)..(6) <400> 94 ggaguccuca ucucccucaa gcguuuaaga gcuaugcugg uaacagcaua gcaaguuuaa 60 auaaggcuag uccguuauca acuugaaaaa guggcaccga gucggugcuu uuuuu 115 <210> 95 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (109)..(112) <220> <221> phosphonoacetate internucleotide linkage <222> (109)..(113) <400> 95 aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 96 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (108)..(112) <220> <221> phosphonoacetate internucleotide linkage <222> (108)..(113) <400> 96 aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 97 <211> 114 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 5'-overhang (5' to the 20-nt guide sequence) <222> (1)..(1) <220> <221> 2'-O-Methyl nucleotide <222> (1)..(3) <220> <221> phosphonoacetate internucleotide linkage <222> (1)..(4) <400> 97 caguccucau cucccucaag cguuuaagag cuaugcuggu aacagcauag caaguuuaaa 60 uaaggcuagu ccguuaucaa cuugaaaaag uggcaccgag ucggugcuuu uuuu 114 <210> 98 <211> 114 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 5'-overhang (5' to the 20-nt guide sequence) <222> (1)..(1) <220> <221> 2'-O-Methyl nucleotide <222> (1)..(3) <220> <221> phosphonoacetate internucleotide linkage <222> (1)..(4) <400> 98 gaguccucau cucccucaag cguuuaagag cuaugcuggu aacagcauag caaguuuaaa 60 uaaggcuagu ccguuaucaa cuugaaaaag uggcaccgag ucggugcuuu uuuu 114 <210> 99 <211> 115 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 5'-overhang (5' to the 20-nt guide sequence) <222> (1)..(2) <220> <221> 2'-O-Methyl nucleotide <222> (1)..(5) <220> <221> phosphonoacetate internucleotide linkage <222> (1)..(6) <400> 99 ucaguccuca ucucccucaa gcguuuaaga gcuaugcugg uaacagcaua gcaaguuuaa 60 auaaggcuag uccguuauca acuugaaaaa guggcaccga gucggugcuu uuuuu 115 <210> 100 <211> 115 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 5'-overhang (5' to the 20-nt guide sequence) <222> (1)..(2) <220> <221> 2'-O-Methyl nucleotide <222> (1)..(5) <220> <221> phosphonoacetate internucleotide linkage <222> (1)..(6) <400> 100 agaguccuca ucucccucaa gcguuuaaga gcuaugcugg uaacagcaua gcaaguuuaa 60 auaaggcuag uccguuauca acuugaaaaa guggcaccga gucggugcuu uuuuu 115 <210> 101 <211> 116 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 5'-overhang (5' to the 20-nt guide sequence) <222> (1)..(3) <220> <221> 2'-O-Methyl nucleotide <222> (1)..(7) <220> <221> phosphonoacetate internucleotide linkage <222> (1)..(8) <220> <221> 2'-O-Methyl nucleotide <222> (112)..(115) <220> <221> phosphonoacetate internucleotide linkage <222> (112)..(116) <400> 101 cucaguccuc aucucccuca agcguuuaag agcuaugcug guaacagcau agcaaguuua 60 aauaaggcua guccguuauc aacuugaaaa aguggcaccg agucggugcu uuuuuu 116 <210> 102 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (20)..(20) <220> <221> phosphonoacetate internucleotide linkage <222> (20)..(21) <400> 102 aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 103 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (19)..(20) <220> <221> phosphonoacetate internucleotide linkage <222> (19)..(20) <400> 103 aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 104 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (18)..(18) <220> <221> phosphonoacetate internucleotide linkage <222> (18)..(19) <400> 104 aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 105 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (17)..(17) <220> <221> phosphonoacetate internucleotide linkage <222> (17)..(18) <400> 105 aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 106 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (17)..(18) <220> <221> phosphonoacetate internucleotide linkage <222> (17)..(19) <400> 106 aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 107 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..(3) <220> <221> phosphorothioate internucleotide linkage <222> (1)..(4) <220> <221> 2'-O-Methyl nucleotide <222> (110)..(112) <220> <221> phosphorothioate internucleotide linkage <222> (110)..(113) <400> 107 aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 108 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..(3) <220> <221> phosphorothioate internucleotide linkage <222> (1)..(4) <220> <221> 2'-O-Methyl nucleotide <222> (108)..(112) <220> <221> phosphorothioate internucleotide linkage <222> (108)..(113) <400> 108 gcagauguag uguuuccaca guuuaagagc uaugcuggaa acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 109 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..(5) <220> <221> phosphorothioate internucleotide linkage <222> (1)..(6) <220> <221> 2'-O-Methyl nucleotide <222> (108)..(112) <220> <221> phosphorothioate internucleotide linkage <222> (108)..(113) <400> 109 gcagauguag uguuuccaca guuuaagagc uaugcuggaa acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 110 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..(1) <220> <221> thiophosphonoacetate internucleotide linkage <222> (1)..(2) <220> <221> 2'-O-Methyl nucleotide <222> (110)..(112) <220> <221> thiophosphonoacetate internucleotide linkage <222> (110)..(113) <400> 110 aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 111 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..1) <220> <221> thiophosphonoacetate internucleotide linkage <222> (1)..(2) <220> <221> 2'-O-Methyl nucleotide <222> (112)..(112) <220> <221> thiophosphonoacetate internucleotide linkage <222> (112)..(113) <400> 111 aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 112 <211> 75 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..(3) <220> <221> thiophosphonoacetate internucleotide linkage <222> (1)..(4) <220> <221> 2'-O-Methyl nucleotide <222> (72)..(74) <220> <221> thiophosphonoacetate internucleotide linkage <222> (72)..(75) <400> 112 aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuu 75 <210> 113 <211> 77 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..(1) <220> <221> thiophosphonoacetate internucleotide linkage <222> (1)..(2) <220> <221> 2'-O-Methyl nucleotide <222> (76)..(76) <220> <221> thiophosphonoacetate internucleotide linkage <222> (76)..(77) <400> 113 aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuauc 77 <210> 114 <211> 78 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..(1) <220> <221> thiophosphonoacetate internucleotide linkage <222> (1)..(2) <220> <221> 2'-O-Methyl nucleotide <222> (77)..(77) <220> <221> thiophosphonoacetate internucleotide linkage <222> (77)..(78) <400> 114 gaguccucau cucccucaag cguuuaagag cuaugcuggu aacagcauag caaguuuaaa 60 uaaggcuagu ccguuauc 78 <210> 115 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..(3) <220> <221> thiophosphonoacetate internucleotide linkage <222> (1)..(4) <220> <221> 2'-O-Methyl nucleotide <222> (110)..(112) <220> <221> thiophosphonoacetate internucleotide linkage <222> (110)..(113) <400> 115 gcagauguag uguuuccaca guuuaagagc uaugcuggaa acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 116 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..(1) <220> <221> thiophosphonoacetate internucleotide linkage <222> (1)..(2) <220> <221> 2'-O-Methyl nucleotide <222> (112)..(112) <220> <221> thiophosphonoacetate internucleotide linkage <222> (112)..(113) <400> 116 gcagauguag uguuuccaca guuuaagagc uaugcuggaa acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 117 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <400> 117 gauguugucg augaaaaagu guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 118 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2-aminoadenosine <222> (15)..(15) <400> 118 gauguugucg augaaaaagu guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 119 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <400> 119 gauuuagacg aaggauugaa guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 120 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2-aminoadenosine <222> (15)..(15) <400> 120 gauuuagacg aaggauugaa guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 121 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 5-methylUridine <222> (6)..(6) <220> <221> 5-methylUridine <222> (8)..(8) <220> <221> 5-methylUridine <222> (11)..(11) <220> <221> 5-methylUridine <222> (13)..(15) <220> <221> 5-methylUridine <222> (31)..(31) <220> <221> 5-methylUridine <222> (33)..(33) <220> <221> 5-methylUridine <222> (36)..(36) <220> <221> 5-methylUridine <222> (39)..(39) <220> <221> 5-methylUridine <222> (47)..(47) <220> <221> 5-methylUridine <222> (81)..(82) <220> <221> 5-methylUridine <222> (90)..(90) <220> <221> 5-methylUridine <222> (104)..(104) <220> <221> 5-methylUridine <222> (107)..(112) <400> 121 gcagauguag uguuuccaca guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 122 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> Z base <222> (70)..(71) <223> Z base <220> <221> misc_feature <222> (70)..(71) <223> n is a, c, g, or u, or unknown or other <400> 122 aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuagun nguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113 <210> 123 <211> 100 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..(1) <220> <221> thiophosphonoacetate internucleotide linkage <222> (1)..(2) <220> <221> 2'-O-Methyl-nucleotide <222> (54)..(54) <220> <221> 2'-O-Methyl-nucleotide <222> (57)..(57) <220> <221> 2'-O-Methyl nucleotide <222> (99)..(99) <220> <221> thiophosphonoacetate internucleotide linkage <222> (99)..(100) <400> 123 aguccucauc ucccucaagc guuuaagagc uaguaauagc aaguuuaaau aagguuaauc 60 cguuaucaac aagaaauugu ggcaccgagu cggugcuuuu 100 <210> 124 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..(1) <220> <221> thiophosphonoacetate internucleotide linkage <222> (1)..(2) <220> <221> 2'-O-Methyl-nucleotide <222> (64)..(64) <220> <221> 2'-O-Methyl-nucleotide <222> (67)..(67) <220> <221> 2'-O-Methyl nucleotide <222> (112)..(112) <220> <221> thiophosphonoacetate internucleotide linkage <222> (112)..(113) <400> 124 aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aagguuaauc cguuaucaac aagaaauugu ggcaccgagu cggugcuuuu uuu 113 <210> 125 <211> 113 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> Z base <222> (95)..(96) <223> Z base <220> <221> misc_feature <222> (95)..(96) <223> n is a, c, g, or u, or unknown or other <400> 125 aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguuaucaac uugaaaaagu ggcanngagu cggugcuuuu uuu 113 <210> 126 <211> 74 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..(1) <220> <221> thiophosphonoacetate internucleotide linkage <222> (1)..(2) <220> <221> 2'-O-Methyl nucleotide <222> (73)..(73) <220> <221> thiophosphonoacetate internucleotide linkage <222> (73)..(74) <400> 126 aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguu 74 <210> 127 <211> 75 <212> RNA <213> Artificial Sequence <220> <223> synthetic construct <220> <221> 2'-O-Methyl nucleotide <222> (1)..(1) <220> <221> thiophosphonoacetate internucleotide linkage <222> (1)..(2) <220> <221> 2'-O-Methyl nucleotide <222> (74)..(74) <220> <221> thiophosphonoacetate internucleotide linkage <222> (74)..(75) <400> 127 aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60 aaggcuaguc cguua 75

Claims

(a) (i) 폴리뉴클레오타이드 중 표적 서열에 하이브리드화할 수 있는 가이드 서열, 및 (ii) 줄기 서열을 포함하는 crRNA 분절; 및
(b) 상기 줄기 서열에 부분적으로 또는 전적으로 상보성인 뉴클레오타이드 서열을 포함하는 tracrRNA 분절
을 포함하되,
5' 단부, 3' 단부, 또는 5' 단부 및 3' 단부 둘다로부터 5개 뉴클레오타이드 내에, 2'-O-메틸, Z 염기, 2-티오유라실(2-티오U), 5-메틸유리딘, 2-아미노아데닌, 포스포로티오에이트 뉴클레오타이드간 결합, 포스포노아세테이트(PACE) 뉴클레오타이드간 결합, 티오포스포노아세테이트(티오PACE) 뉴클레오타이드간 결합, 3'-포스포로티오에이트기를 갖는 2'-O-메틸 뉴클레오타이드, 3'-포스포노아세테이트기를 갖는 2'-O-메틸 뉴클레오타이드, 3'-티오포스포노아세테이트기를 갖는 2'-O-메틸 뉴클레오타이드 및 3'-포스포노아세테이트기를 갖는 2'-데옥시 뉴클레오타이드로 이루어진 군 중에서 선택되는 하나 이상의 변형을 포함하고, gRNA 기능성을 갖는 합성 가이드 RNA.
제 1 항에 있어서,
변형 중 하나 이상이 안정성-증대 변형을 포함하는, 합성 가이드 RNA.
제 2 항에 있어서,
안정성-증대 변형 중 하나 이상이 가이드 서열 중에 위치하는, 합성 가이드 RNA.
제 2 항에 있어서,
안정성-증대 변형이 2'-O-메틸, Z 염기, 포스포로티오에이트 뉴클레오타이드간 결합, 포스포노아세테이트(PACE) 뉴클레오타이드간 결합, 또는 티오포스포노아세테이트(티오PACE) 뉴클레오타이드간 결합, 또는 이들의 조합을 포함하는, 합성 가이드 RNA.
제 1 항에 있어서,
가이드 RNA의 5' 단부에 26개 미만의 연속적인 2'-O-메틸 변형된 뉴클레오타이드를 포함하는 합성 가이드 RNA.
제 1 항에 있어서,
합성 가이드 RNA 중 시토신을 대체하는 Z 염기를 포함하는 합성 가이드 RNA.
제 1 항에 있어서,
잠재적인 표적-외 서열과의 U-G 동요(wobble) 짝짓기에 관여할 수 있는 유리딘에 상응하는 위치에 하나 이상의 2-티오유라실을 포함하는 합성 가이드 RNA.
제 1 항에 있어서,
하나 이상의 변형이 3'-포스포로티오에이트기를 갖는 2'-O-메틸 뉴클레오타이드, 3'-포스포노아세테이트기를 갖는 2'-O-메틸 뉴클레오타이드, 3'-티오포스포노아세테이트기를 갖는 2'-O-메틸 뉴클레오타이드, 및 3'-포스포노아세테이트기를 갖는 2'-데옥시 뉴클레오타이드로 이루어진 군 중에서 선택되는 합성 가이드 RNA.
제 1 항에 있어서,
2개 이상의 변형을 포함하는 합성 가이드 RNA.
제 1 항에 있어서,
50개 이하의 변형을 포함하는 합성 가이드 RNA.
제 1 항에 있어서,
단일 RNA 가닥 또는 2개의 별도의 RNA 가닥을 포함하는 합성 가이드 RNA.
제 11 항에 있어서,
5' 단부, 3' 단부, 또는 5' 및 3' 단부 각각에 7개 이하의 연속적인 변형된 뉴클레오타이드를 포함하는 합성 가이드 RNA.
제 12 항에 있어서,
5' 단부, 3' 단부, 및 줄기-고리 중 하나 이상에 하나 이상의 5-메틸유리딘 뉴클레오타이드를 포함하는 합성 가이드 RNA.
제 1 항에 있어서,
변형 중 하나 이상이 염기-짝짓기 열안정성을 변경시키는 하나 이상의 변형을 포함하는, 합성 가이드 RNA.
제 14 항에 있어서,
염기-짝짓기 열안정성을 변경시키는 변형 중 하나 이상이 염기-짝짓기 열안정성을 증대시키는, 합성 가이드 RNA.
제 15 항에 있어서,
염기-짝짓기 열안정성을 증대시키는 변형 중 하나 이상이 2'-O-메틸, 2-티오유라실(2-티오U), 5-메틸유리딘, 및 2-아미노아데닌 중에서 독립적으로 선택되는, 합성 가이드 RNA.
제 15 항에 있어서,
염기-짝짓기 열안정성을 변경시키는 변형 중 하나 이상이 염기-짝짓기 열안정성을 감소시키는, 합성 가이드 RNA.
제 17 항에 있어서,
염기-짝짓기 열안정성을 감소시키는 변형 중 하나 이상이 2-티오유라실, 포스포로티오에이트 뉴클레오타이드간 결합, 포스포노아세테이트 뉴클레오타이드간 결합, 및 티오포스포노아세테이트 뉴클레오타이드간 결합 중에서 독립적으로 선택되는, 합성 가이드 RNA.
제 1 항에 있어서,
하나 이상의 2'-O-메틸-A-2'-O-메틸-U 염기쌍을 포함하는 합성 가이드 RNA.
제 1 항에 있어서,
변형 중 하나 이상이 특이성-변경 변형을 포함하는, 합성 가이드 RNA.
제 20 항에 있어서,
특이성-변경 변형이 가이드 서열 중에 위치하는, 합성 가이드 RNA.
제 21 항에 있어서,
특이성-변경 변형이 2'-O-메틸, 2-티오유라실, 5-메틸유리딘, 2-아미노아데닌, 포스포로티오에이트 뉴클레오타이드간 결합, 포스포노아세테이트 뉴클레오타이드간 결합, 티오포스포노아세테이트 뉴클레오타이드간 결합 또는 이들의 조합을 포함하는, 합성 가이드 RNA.
제 1 항에 있어서,
형광 염료 또는 표지를 포함하는 합성 가이드 RNA.
제 23 항에 있어서,
형광 염료 또는 표지가 합성 가이드 RNA의 줄기-고리에 결합된, 합성 가이드 RNA.
DNA 서열, 관심 유전자 또는 표적 폴리뉴클레오타이드를 크리스퍼(CRISPR)-연관된 단백질 및 제 1 항 내지 제 24 항 중 어느 한 항에 따른 합성 가이드 RNA와 접촉시키고, 상기 DNA 서열, 상기 관심 유전자 또는 상기 표적 폴리뉴클레오타이드를 편집하거나 조절하거나 절단함을 포함하는, DNA 서열을 변형시키기 위해 게놈을 편집하거나 관심 유전자 발현을 조절하거나 표적 폴리뉴클레오타이드를 절단하는 시험관내 방법.
제 25 항에 있어서,
합성 가이드 RNA가 가이드 서열 전체를 통해 15개 이상의 2'-O-메틸 변형을 포함하는, 시험관내에서 수행되는 방법.
제 1 항 내지 제 24 항 중 어느 한 항에 따른 2개 이상의 합성 가이드 RNA를 포함하는 RNA 분자의 세트.
제 1 항 내지 제 24 항 중 어느 한 항에 따른 합성 가이드 RNA를 포함하는 키트.
삭제