KR20180037297A - 상동 재조합에 의한 crispr/cas-기반 게놈 편집을 위한 화합물 및 방법 - Google Patents

상동 재조합에 의한 crispr/cas-기반 게놈 편집을 위한 화합물 및 방법 Download PDF

Info

Publication number
KR20180037297A
KR20180037297A KR1020187008914A KR20187008914A KR20180037297A KR 20180037297 A KR20180037297 A KR 20180037297A KR 1020187008914 A KR1020187008914 A KR 1020187008914A KR 20187008914 A KR20187008914 A KR 20187008914A KR 20180037297 A KR20180037297 A KR 20180037297A
Authority
KR
South Korea
Prior art keywords
sequence
rna
segment
certain embodiments
adapter
Prior art date
Application number
KR1020187008914A
Other languages
English (en)
Other versions
KR102691636B1 (ko
Inventor
앤드류 케네디
거스티 자이너
서브하디프 로이
총 윙 융
Original Assignee
애질런트 테크놀로지스, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 애질런트 테크놀로지스, 인크. filed Critical 애질런트 테크놀로지스, 인크.
Publication of KR20180037297A publication Critical patent/KR20180037297A/ko
Application granted granted Critical
Publication of KR102691636B1 publication Critical patent/KR102691636B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/35Nature of the modification
    • C12N2310/351Conjugate
    • C12N2310/3519Fusion with another nucleic acid

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Cell Biology (AREA)
  • Mycology (AREA)

Abstract

본 발명은 하나 이상의 변형을 갖는 어댑터 분절을 포함하는 안내 RNA, 및 CRISPR/Cas 시스템에 의한 상동 재조합에서의 이들의 용도에 관한 것이다. 변형된 어댑터 분절은 RNase H에 의한 분해에 대해 저항성이다. 본 발명은 또한 2중 안내 RNA 전략에 관한 것이고, 여기서 제1 안내 RNA는 Cas 효소가 제1 표적 서열에서 2중-가닥 파괴를 수행하도록 지시하고, 제2 안내 RNA는 공여체 폴리뉴클레오티드에 부착된 어댑터 분절을 포함하고 제1 표적 서열로부터 이격된 제2 표적 서열에 결합한다.

Description

상동 재조합에 의한 CRISPR/CAS-기반 게놈 편집을 위한 화합물 및 방법
본 발명은 분자 생물학 분야에 관한 것이다. 특별히, 본 발명은 상동 재조합을 위하여 일정 간격을 두고 주기적으로 분포하는 짧은 회문구조 반복 서열 무리(CRISPR: c lusters of r egularly i nterspaced s hort p alindromic r epeats) 기술을 사용함에 관한 것이다.
관련 출원에 대한 상호참조
본 출원은 2015년 8월 31일자 출원된 미국 가출원 제62/212,456호를 우선권 주장한다.
고유의 원핵생물 CRISPR/Cas 시스템은 일정한 길이의 사이에 끼는 다양한 서열을 갖는 짧은 반복부의 배열(즉, 일정 간격을 두고 주기적으로 분포하는 짧은 회문구조 반복 서열 무리, 또는 "CRISPR"), 및 CRISPR-연관된("Cas": CRISPR-associated) 단백질을 포함한다. 전사된 CRISPR 배열의 RNA는 Cas 단백질의 부속 집합에 의해 작은 안내(guide) RNA로 프로세싱되고, 이는 일반적으로 하기 논의되는 바와 같이 2개의 성분을 갖는다. 적어도 3가지 상이한 시스템이 존재한다: 유형 I, 유형 II 및 유형 III. 성숙한 crRNA로의 RNA의 프로세싱에 관여하는 효소는 3가지 시스템에서 상이하다. 고유의 원핵생물 시스템에서, 안내 RNA("gRNA")는 CRISPR RNA("crRNA") 및 트랜스-작용 RNA("tracrRNA")로서 지칭되는 2개의 짧은 비-코딩 RNA 종을 포함한다. 예시적인 시스템에서, gRNA는 Cas 뉴클레아제(nuclease)와 복합체를 형성한다. gRNA:Cas 뉴클레아제 복합체는 프로토스페이서(protospacer) 및 프로토스페이서 인접 모티프("PAM": protospacer adjacent motif)를 갖는 표적 DNA 서열에 결합한다. 프로토스페이서는 표적 DNA에 상보성이고, gRNA는 또한 표적 DNA의 적어도 일부에 상보성이다. gRNA:Cas 뉴클레아제 복합체에 의한 표적 DNA의 인식 및 결합은 표적 DNA의 절단을 유도한다. gRNA:Cas 뉴클레아제 복합체가 외래성 유전자 요소를 인식하여 침묵하고, 이로써 플라스미드 및 파아지와 같은 외래성 유전자 요소에 대한 저항성을 부여하므로, 고유의 CRISPR/Cas 시스템은 원핵생물에서 후천성 면역 시스템(adaptive immune system)으로서 작용한다.
단일 안내 RNA("sgRNA")가 천연적으로-존재하는 crRNA 및 tracrRNA 사이에 형성된 복합체를 대체할 수 있음이 입증되었다. sgRNA를 비롯한 gRNA를 개발하는데 있어서 고려사항으로는, 특이성, 안정성, 및 작용성이 포함된다. 특이성은 특별한 gRNA:Cas 뉴클레아제 복합체가 원하는 표적에 결합하고/하거나 이를 절단시키는 반면, 원하는 표적과는 상이한(서열 및/또는 위치에 있어서) 폴리뉴클레오티드의 결합 및/또는 절단을 전혀 또는 거의 일으키지 않는 능력을 지칭한다. 이와 같이, 특이성은 gRNA:Cas 뉴클레아제 복합체의 표적-이외의(off-target) 영향을 최소화함을 지칭한다. 안정성은 효소, 예컨대 뉴클레아제, 및 세포내 및 세포외 환경에 존재하는 기타 물질에 의한 분해에 저항하는 gRNA의 능력을 지칭한다. 뉴클레아제 분해에 대한 저항성이 증가하고, 표적 DNA에 대한 결합 친화도가 증가하며/하거나 표적-이외의 영향이 감소하면서도, gRNA 작용성을 갖는 gRNA, 예컨대 sgRNA를 제공할 필요가 있다.
표적화된 유전자 편집은 작용성 유전자 분석 및 유전자 치료 용도를 위한 잠재력을 갖는다. 규정된 표적 부위에 2중-가닥 파괴(DSB: double-stranded break)를 도입하는 접근법은 외래성 공여체 폴리뉴클레오티드 주형의 상동 재조합(HR)을 통해 게놈 편집의 빈도를 증진시킨다. 반가(Banga) 등의 문헌[노랑초파리에서의 올리고뉴클레오티드-지시된 부위-특이적 돌연변이생성(Oligonucleotide-directed site-specific mutagenesis in Drosophila melanogaster). PNAS 89(5), 1735-9(1992)]; 누스바움(Nussbaum) 등의 문헌[에스케리치아 콜라이의 RecE 경로에 의한 플라스미드의 제한-자극된 상동 재조합(Restriction-stimulated homologous recombination of plasmids by the RecE pathway of Escherichia coli). Genetics, 130(1), 37-49 (1992)]; 푸치타(Puchta) 등의 문헌[식물 세포에서의 상동 재조합은 부위-특이적 엔도뉴클레아제에 의해 생체내에서 2중-가닥 파괴를 DNA로 유도함으로써 향상된다(Homologous recombination in plant cells is enhanced by in vivo induction of double-strand breaks into DNA by a site-specific endonuclease). Nucleic Acids Research, 21(22), 5034-40 (1993)]; 루에트(Rouet) 등의 문헌[부위-특이적 엔도뉴클레아제의 발현은 포유동물 세포에서 상동 재조합을 자극한다(Expression of a site-specific endonuclease stimulates homologous recombination in mammalian cells). PNAS 91(13), 6064-81994 (1994)]; 스토리시(Storici) 등의 문헌[염색체 부위-특이적 2중-가닥 파괴는 효모에서 올리고뉴클레오티드에 의한 복구에 대해 효율적으로 표적화된다(Chromosomal site-specific double-strand breaks are efficiently targeted for repair by oligonucleotieds in yeast). PNAS 100(25), 14994-9(2003)]. 이들 접근법은 규정된 게놈 표적 부위에서 DSB를 유도하기 위해 조작된 귀소성(homing) 엔도뉴클레아제, 아연 집게 뉴클레아제[비비코바(Bibikova) 등의 문헌 "고안된 아연 집게 뉴클레아제에 의한 유전자 표적화의 향상(Enhancing gene targeting with designed zinc finger nucleases). Science 300(5620), 764 (2003)"], 전사 활성화제-유사 효과자 뉴클레아제(TALENS: transcription activator-like effector nucleases)[밀러(Miller) 등의 문헌 "효율적 게놈 편집을 위한 TALE 뉴클레아제 구조(A TALE nuclease architecture for efficient genome editing). Nature Biotechnology, 29(2), 143-82011 (2011)"], 및 RNA-안내된 Cas9 뉴클레아제[수(Hsu) 등의 문헌 "게놈 조작을 위한 CRISPR-Cas9의 개발 및 적용(Development and Applications of CRISPR-Cas9 for genome Engineering). Cell, 157(6), 1262-1278 (2014)"]를 포함한다. 이들 뉴클레아제-중재된 유전자 표적화 접근법에 있어서, 주요 제한점은 낮은 빈도이고, 이에 의해 HR은 비-상동성 말단 연결(NHEJ: non-homologous end joining)의 빈도에 비례하여 DSB에서 일어난다[베테르미어(Betermier) 등의 문헌 "비-상동성 말단-연결은 실제로 본질적으로 오류-발생이 쉬운 공정인가?(Is non-homologous end-joining really an inherently error-prone process?). PLoS Genetics, 10(1), e1004086 (2014))"]. 포유동물 세포에서, NHEJ는 1000배 선호된 DSB 복구 양상이고, 하나의 성공적인 HR 및 NHEJ 사건은 각각 105 내지 107 및 102 내지 104개의 처리된 세포마다 발생한다[바스쿠에츠(Vasquez) 등의 문헌 "상동 재조합에 의한 포유동물 게놈의 조작(Manipulating the mammalian genome by homologous recombination). PNAS 98(15), 8403-10 (2001)"].
DSB가 유도된 이후 NHEJ에 비례하여 HR의 빈도를 증가시키는 게놈 편집 방법 및 NHEJ 이상으로 HR을 선호하는 것이 요망된다. 이를 용이하게 하기 위해, 연구자들은 귀소성 엔도뉴클레아제(I-SceI)에 의해 결합된 DNA 압타머(aptamer)에 공여체를 결박시킴으로써 외래성 공여체 폴리뉴클레오티드 주형을 DSB의 부근으로 안내함을 제안하였다. 이와 같이, 게놈-편집 제제는 HR 복구 주형을 유전자 변형 부위로 운반하고, 이는 게놈의 복구 부위에서 HR 주형의 국소적 농도를 증가시킬 것이다. 이러한 접근법을 사용하여, HR은 인간 및 효모 세포에서 각각 16-배 및 32-배 증가되었다[러프(Ruff) 등의 문헌 "효모 및 인간 세포에서의 압타머-안내된 유전자 표적화(Aptamer-guided gen targeting in years and human cells). Nucleic Acids Res. 42(7):e61, 2014"]. 그러나, 귀소성 엔도뉴클레아제 접근법에 의해, 표적 게놈 서열의 가로 배치는 속박되고, (Ice-I) 엔도뉴클레아제의 특이적인 18개의 DNA 염기-쌍 표적 인식 부위에 의해 제한된다. 상이한 귀소성 엔도뉴클레아제를 사용하도록 이러한 전략을 확장시키기 위해 신규한 DNA 압타머를 선택하는 것이 가능하지만, 압타머 선택은 실제로 어려운 공정인 것으로 입증되었다[골드(Gold) 등의 문헌 "생물표지 발견을 위한 압타머-기반의 다중 프로테옴 기술(Aptamer-Based Mutiplexed Proteomic Technology for Biomarker Discovery). PLOS ONE 5(12)e15004 2010"]. 추가적으로, 신규 DNA 서열을 표적화하도록 귀소성 엔도뉴클레아제, 아연 집게 뉴클레아제, 및 전사 활성화제-유사 뉴클레아제를 조작하는 것은 해결하기 쉽지 않은채로 남아 있다[가즈(Gaj) 등의 문헌 "게놈 조작을 위한 ZFN, TALEN, 및 CRISPR/Cas-기반 방법(ZFN, TALEN, and CRISPR/Cas-Cas-based for genome engineering). Trends in Biotech 31(7):307 (2013)"].
상동 유전자 표적화 접근법은 내생성 유전자를 넉-아웃(knock out)하거나 외래성 서열을 염색체에 넉-인(knock-in)하기 위해 사용되어 왔다. 이들은 또한 유전자 교정, 및 이론적으로, 단일유전자 질환과 연결된 돌연변이의 교정을 위해 사용될 수 있다. 그러나, 이러한 적용은, 공정의 낮은 효율로 인해 어렵다. 예를 들어, 말리(Mali) 등[문헌 "Science 339:823-826 (2013)"]은 CRISPR(안내 RNA 및 Cas9 엔도뉴클레아제) 및 동시에 공급된 단일-가닥 공여체 DNA를 사용하여 인간 K562 세포에서 유전자 변형을 시도하였고, AAVS1 유전자부위에서 2.0% 빈도로 HDR-중재된 유전자 변형을 관찰한 반면 동일한 유전자부위에서 NHEJ-중재된 표적화된 돌연변이생성을 38%의 빈도로 관찰하였다. 리(Li) 등[문헌 "Nat Biotechnol. (8):688-91 (2013)"]은 CRISPR(안내 RNA 및 Cas9 엔도뉴클레아제) 및 동시에 공급된 2중-가닥 공여체 DNA를 사용하여 식물 니코티아나 벤타미아나(Nicotiana benthamiana)에서의 유전자 대체를 시도하였고, 9.0% 빈도로 HDR-중재된 유전자 대체를 관찰한 반면 NHEJ-중재된 표적화된 돌연변이생성을 14.2%의 빈도로 관찰하였다. 리(Li) 등은 또한 세포 주기의 마스터(master) 활성화제인 애기장대(Arabidopsis) CYCD3[사이클린(Cyclin) D-유형 3]의 공동 발현을 경유하여 이소성(ectopic) 세포 분열을 개시함으로써 니코티아나 벤타미아나에서 HDR을 향상시키는 가능성에 대해 시험하였지만; 이는 HDR의 비율을 거의 촉진시키지 않았다(CYCD3에 비해 11.1% 내지 9% 더 낮음). 캐스(Kass) 등[문헌 "Proc Natl Acad Sci USA. 110(14): 5564-5569 (2013)"]은 다양한 계통으로부터 유래된 1차 정상 체세포 유형에서 HDR을 연구하였고, 마우스 배아 및 성체 섬유아세포 뿐만 아니라 유방 상피, 난소, 및 미성숙 뇌로부터 유도된 세포가 I-SceI 엔도뉴클레아제-유도된 DSB에서 HDR을 대략 1%(0.65 내지 1.7%)의 빈도로 겪음을 관찰하였다. 캐스(Kass) 등은 세포가 세포 주기의 S 및 G2 상에 존재할 경우 더 높은 HDR 활성을 기록하였다. HDR을 향상시키려는 전략은 또한 길항작용성 NHEJ 복구 기작을 넉-아웃함을 포함하였다. 예를 들어, 퀴(Qi) 등[문헌 "Genome Res 23:547-554 (2013)"]은 애기장대에서 HDR-중재된 유전자 표적화가 ku70 돌연변이체의 경우 5 내지 16 배 증가하고 lig4 돌연변이체의 경우 3 내지 4 배 증가함을 보고하였다. 그러나, 전체 비율은 ∼5% 이하인 것으로 관찰되었고, 대부분 1% 미만이었다. 더욱이, 원하는 유전자-표적화 사건이 나타나기만 하면, ku70 또는 lig4 돌연변이는 돌연변이체 식물로부터 제거되어야 하였다.
말리(Mali) 등의 US 제2014/0342458호에는 세포의 게놈 DNA에 상보성인 RNA를 인코딩하는 핵산에 의해 세포를 형질감염하고, RNA와 상호작용하고 게놈 DNA를 부위 특이적 방식으로 절단시키는 효소를 인코딩하는 핵산에 의해 세포를 형질감염시킴으로써 진핵 세포를 변경시키는 방법이 논의되어 있다. 이러한 세포는 RNA 및 효소를 발현하고, RNA는 상보성 게놈 DNA에 결합하고, 효소는 게놈 DNA를 부위 특이적 방식으로 절단시킨다. gRNA는 5' 및 3' 말단 상의 서열 삽입에 쉽게 적응하고(보유된 HR 유도 활성에 의해 측정될 경우), ssDNA 공여체는 하이브리드화(hybridization)를 통해 gRNA에 결박되어, 게놈 표적 절단 및 복구 주형의 즉각적인 물리적 편재화의 결합을 가능하게 하고, 이는 오류-발생이 쉬운 비-상동성 말단-연결에 비해 상동 재조합 비율을 촉진시킬 수 있음이 명시되어 있다. 또한, 처치(Church) 등의 US 제2015/0031133호를 참조한다.
두트레익스(Dutreix) 등의 US 제2003/0003547호는 올리고뉴클레오티드-지시된 3중 나선 형성 및 상동 재조합에 기초하여 유전자를 변경 또는 복구하기 위한 조성물 및 방법을 논의한다. 3중 나선-형성 올리고뉴클레오티드(TFO)는 게놈 DNA 상의 의도된 표적 부위로 상동성 공여체 DNA(DD)를 안내하고 상동 재조합 및/또는 유전자 전환을 통한 효율적인 정보 전달을 위해 이를 위치시키도록 선택된다고 명시되어 있다. 이러한 접근법에서, TFO는 연결기를 통해 DD에 공유적으로 결박된다. TFO-DD 컨쥬게이트(conjugate)의 효능은: (i) DD의 국소적 농도의 증가; 및 (ii) 상동성 짝형성, 가닥 교환 및/또는 재조합에 관여되는 단백질의 소집을 유발할 수 있는 3중 나선 형성에 의한 DNA 복구의 자극에 의해 설명될 수 있는 것으로 명시되어 있다. US 제2003/0003547호는 귀소성 장치(TFO) 및 공여체 DNA(DD)가 비-공유적 상호작용에 의해 어댑터(adaptor) 올리고뉴클레오티드(이는 공유적으로 TFO에 연결됨)를 통해 함께 연결되는 접근법을 제공한다. 올리고뉴클레오티드[천연 및 변형된 올리고뉴클레오티드(ODN), 또는 RNA-DNA 키메라성(chimeric) 올리고뉴클레오티드(RDO)], 또는 또한 작은 DNA 단편(단일-가닥 또는 2중-가닥)이 상동성 대체를 위한 표적 부위에 안내될 수 있는 것으로 명시되어 있다.
본 발명은 Cas 단백질:안내 RNA 시스템을 사용하여 상동 재조합에 의해 표적 폴리뉴클레오티드를 변형시키기 위한 화합물 및 방법에 관한 것이다. 본 개시내용은 공여체 폴리뉴클레오티드를 부착시키기 위한 어댑터 분절, 다른 어댑터, 또는 스플린트(splint) 분절을 포함하는 안내 RNA를 제공한다. 특정한 실시태양에서, 어댑터 분절에 대한 변형은 어댑터:공여체 폴리뉴클레오티드 복합체의 안정성을 증가시키지만; 표적 폴리뉴클레오티드로의 Cas:gRNA 결합, 이의 틈내기(nicking), 및/또는 이의 절단에 대한 효능을 실질적으로 절충시키지 않는다. 특정한 실시태양에서, 2중 Cas:gRNA 시스템이 사용되고, 여기서 제1 안내 RNA는 Cas 단백질이 제1 표적 서열에서 2중-가닥 파괴를 일으키도록 지시하고, 제2 안내 RNA는 공여체 폴리뉴클레오티드에 결박된 어댑터 분절을 포함한다. 제2 안내 RNA는 제1 표적 서열로부터 이격된 제2 표적 서열에 결합한다.
도 1은 DNA의 CRISPR-Cas9 중재된, 서열 특이적 절단을 도시한다.
도 2a는 crRNA 분절 및 별도의 tracrRNA 분절을 포함하는 안내 RNA를 도시한다.
도 2b는 crRNA 분절 및 tracrRNA 분절을 포함하는 단일 안내 RNA를 도시한다.
도 3은 잠재적 HR을 위하여 공여체 DNA에 안내 RNA를 결박시키기 위한 전략을 도시한다.
도 4는 제안된 공여체 DNA-결박된 Cas9-중재된 유전자 표적화를 도시한다.
도 5는 화학적 변형이 어댑터 RNA:공여체 DNA 듀플렉스(duplex)를 보호함을 도시한다.
도 6은 공여체 DNA를 Cas9 파괴 부위의 부근으로 편재화시키는 2중 안내 RNA 방법 및 조성물을 도시한다.
I. 정의
본원에 사용될 경우, 용어 "안내 RNA"는 일반적으로 Cas 단백질에 결합될 수 있고 표적 폴리뉴클레오티드(예를 들어, DNA)내의 특정 위치에 Cas 단백질을 표적화시키는데 도움을 줄 수 있는 RNA 분자(또는 총체적으로 RNA 분자의 그룹)를 지칭한다. 안내 RNA는 crRNA 분절 및 tracrRNA 분절을 포함할 수 있다. 본원에 사용될 경우, 용어 "crRNA" 또는 "crRNA 분절"은 폴리뉴클레오티드-표적화 안내 서열, 스템(stem) 서열, 및 임의적으로, 5'-오버행(overhang) 서열을 포함하는 RNA 분자 또는 이의 일부를 지칭한다. 본원에 사용될 경우, 용어 "tracrRNA" 또는 "tracrRNA 분절"은 단백질-결합 분절(예를 들어, 단백질-결합 분절은 CRISPR-연관된 단백질, 예컨대 Cas9와 상호작용할 수 있음)을 포함하는 RNA 분자 또는 이의 일부를 지칭한다. 용어 "안내 RNA"는 단일 안내 RNA(sgRNA)를 포괄하고, 여기서 crRNA 분절 및 tracrRNA 분절은 동일한 RNA 분자에 위치된다. 용어 "안내 RNA"는 또한, 총체적으로, 둘 이상의 RNA 분자의 그룹을 포괄하고, 여기서 crRNA 분절 및 tracrRNA 분절은 별도의 RNA 분자에 위치된다.
용어 "핵산", "폴리뉴클레오티드" 또는 "올리고뉴클레오티드"는 DNA 분자, RNA 분자, 또는 이의 유사체를 지칭한다. 본원에 사용될 경우, 용어 "핵산", "폴리뉴클레오티드" 및 "올리고뉴클레오티드"는, 제한되지 않지만 DNA 분자, 예컨대 cDNA, 게놈 DNA 또는 합성 DNA 및 RNA 분자, 예컨대 안내 RNA, 메신저(messenger) RNA 또는 합성 RNA를 포함한다. 게다가, 본원에 사용될 경우, 용어 "핵산" 및 "폴리뉴클레오티드"는 단일-가닥 및 2중-가닥 형태를 포함한다.
올리고뉴클레오티드 또는 폴리뉴클레오티드와 관련하여 용어 "변형"은, 제한되지 않지만 (a) 말단 변형, 예를 들어, 5' 말단 변형 또는 3' 말단 변형, (b) 염기의 대체 또는 제거를 포함하는 핵염기(또는 "염기") 변형, (c) 2', 3', 및/또는 4' 위치에서의 변형을 포함하는 당 변형, 및 (d) 인산이에스테르 연결기의 변형 또는 대체를 포함하는 주쇄 변형을 포함한다. 용어 "변형된 뉴클레오티드"는 일반적으로 염기, 당, 및 인산이에스테르 연결기 또는 주쇄 부분(뉴클레오티드 포스페이트 포함)중 하나 이상의 화학적 구조가 변형된 뉴클레오티드를 지칭한다.
본원에서 더욱 일반적으로 사용될 경우, "변형"은 화학적 작용기(moiety), 또는 화학 구조물의 일부를 지칭하고, 이는 변형되지 않은 리보뉴클레오티드, 즉 아데노신, 구아노신, 시티딘, 및 우리딘 리보뉴클레오티드에서 발견되는 것과 상이하다. 용어 "변형"은 변형의 유형을 지칭할 수 있다. 예를 들어, "동일한 변형"은 변형의 동일한 유형을 의미하고, "변형된 뉴클레오티드가 동일하다"는 변형된 뉴클레오티드가 변형의 동일한 유형(들)을 갖지만 염기(A, G, C, U, 등)는 상이할 수 있음을 의미한다. 유사하게, "2개의 변형"을 갖는 어댑터는 변형의 2가지 유형을 갖는 안내 RNA이고, 이는 동일한 뉴클레오티드에 존재하거나 존재하지 않을 수 있고, 각각의 유형은 어댑터중 다수의 뉴클레오티드에서 나타날 수 있다. 유사하게, "3개의 변형"을 갖는 어댑터 폴리뉴클레오티드는 변형의 3가지 유형을 갖는 어댑터이고, 이는 동일한 뉴클레오티드에 존재하거나 존재하지 않을 수 있고, 각각의 유형은 다수의 뉴클레오티드에서 나타날 수 있다.
"공여체 폴리뉴클레오티드"는 표적 폴리뉴클레오티드에 삽입하고자 하는 뉴클레오티드 중합체 또는 올리고머이다. 공여체 폴리뉴클레오티드는 천연의 또는 변형된 폴리뉴클레오티드, RNA-DNA 키메라, 또는 DNA 단편(단일- 또는 2중-가닥), 또는 PCR 증폭된 ssDNA 또는 dsDNA 단편일 수 있다. 완전한 2중-가닥 공여체 DNA는, dsDNA 단편이 일반적으로 ssDNA에 비해 뉴클레아제 분해에 대해 더욱 저항성이므로, 증가된 안정성을 제공할 가능성이 있기 때문에 유리하다.
용어 "xA", "xG", "xC", "xT", 또는 "x(A,G,C,T)" 및 "yA", "yG", "yC", "yT", 또는 "y(A,G,C,T)"는 크루에거(Krueger) 등의 문헌["크기-팽창된 DNA의 합성 및 특성: 고안된 작용성 유전 시스템에 대하여(Synthesis and Properties of Size-Expanded DNAs: Toward Designed, Functional Genetic Systems", Acc. Chem. Res. 2007, 40, 141-150 (2007)]에 기재된 바와 같이 뉴클레오티드, 핵염기, 또는 핵염기 유사체를 지칭한다.
용어 "구조화되지 않은 핵산" 또는 "UNA"는 US 제7,371,580호에 기재된 바와 같이 뉴클레오티드, 핵염기, 또는 핵염기 유사체를 지칭한다.
용어 "PACE" 및 "티오PACE"는 각각 포스포노아세테이트 또는 티오포스포노아세테이트 기를 함유하는 뉴클레오티드 사이의 인산이에스테르 연결기 유사체를 지칭한다. 이들 변형은 포스포노카복실레이트 작용기, 포스포노카복실레이트 에스테르 작용기, 티오포스포노카복실레이트 작용기 및 티오포스포노카복실레이트 에스테르 작용기를 포함하는 화합물의 광범위한 부류에 속한다. 이들 연결기는 일반식 P(CR1R2)nCOOR 및 (S)-P(CR1R2)nCOOR에 의해 각각 설명되고, 여기서 n은 0 내지 6의 정수이고 R1 및 R2는 각각 독립적으로 H, 알킬 및 치환된 알킬로 구성된 군에서 선택된다. 이들 변형중 몇몇은 야마다(Yamada) 등의 문헌["포스포노포메이트 올리고데옥시리보뉴클레오티드의 합성 및 생물학적 평가(Synthesis and Biochemical Evaluation of Phosphonoformate Oligodeoxyribonucleotide)", J. Am. Chem. Soc. 128(15), 5251-5261 (2006)]에 기재되어 있다.
본원에 사용될 경우, 용어 "표적 폴리뉴클레오티드" 또는 "표적"은 표적 핵산 서열을 함유하는 폴리뉴클레오티드를 지칭한다. 표적 폴리뉴클레오티드는 단일-가닥 또는 2중-가닥일 수 있고, 특정한 실시태양에서, 2중-가닥 DNA이다. 특정한 실시태양에서, 표적 폴리뉴클레오티드는 단일-가닥 RNA이다. "표적 핵산 서열" 또는 "표적 서열"은, 본원에 사용될 경우, CRISPR:Cas 시스템을 사용하여 결합시키거나 틈내기하거나 절단시키고자 하는 특정 서열 또는 이의 보체를 의미한다.
용어 "하이브리드화" 또는 "하이브리드화하는"은 완전한 또는 부분적 상보성 폴리뉴클레오티드 가닥들이 적합한 하이브리드화 조건하에 함께 2중-가닥 구조물 또는 영역을 형성하는 과정을 지칭하고, 여기서 2개의 구성 가닥은 수소 결합에 의해 연결된다. 본원에 사용될 경우, 용어 "부분적 하이브리드화"는 2중-가닥 구조물 또는 영역이 하나 이상의 벌지(bulge) 또는 부정합을 갖는 경우를 포함한다. 수소 결합은 전형적으로 아데닌 및 티민 또는 아데닌 및 우라실(A 및 T 또는 A 및 U) 또는 시토신 및 구아닌(C 및 G) 사이에 형성되지만, 이외의 다른 염기 쌍이 형성될 수 있다[예를 들어, 아담스(Adams) 등의 문헌 "The Biochemistry of the Nucleic acids, 11th ed., 1992"]. 변형된 뉴클레오티드는 하이브리드화를 허용하거나 촉진시키는 수소 결합을 형성할 수 있는 것으로 고려된다.
용어 "절단" 또는 "절단시키는"은 폴리뉴클레오티드의 리보실인산이에스테르 주쇄에서 인산이에스테르 연결기를 파괴함을 지칭한다. 용어 "절단" 또는 "절단시키는"은 단일-가닥 파괴 및 2중-가닥 파괴 둘다를 포괄한다. 2중-가닥 절단은 2개의 개별적인 단일-가닥 절단 사건의 결과로서 발생될 수 있다. 절단은 평활 말단(blunt end) 또는 엇갈린 말단(staggered end)의 생산을 초래할 수 있다.
용어 "CRISPR-연관된 단백질" 또는 "Cas 단백질"은 야생형 Cas 단백질, 이의 단편, 또는 이의 돌연변이체 또는 변형체를 지칭한다. 용어 "Cas 돌연변이체" 또는 "Cas 변이체"는 야생형 Cas 단백질의 단백질 또는 폴리펩티드 유도체, 예를 들어, 하나 이상의 점 돌연변이, 삽입, 결실, 절단축소(truncation)를 갖는 단백질, 융합 단백질, 또는 이들의 조합물을 지칭한다. 특정한 실시태양에서, "Cas 돌연변이체" 또는 "Cas 변이체"는 Cas 단백질의 뉴클레아제 활성을 실질적으로 보유한다. 특정한 실시태양에서, "Cas 돌연변이체" 또는 "Cas 변이체"는 하나 또는 둘 다의 뉴클레아제 도메인이 비활성화되도록 돌연변이된다. 특정한 실시태양에서, "Cas 돌연변이체" 또는 "Cas 변이체"는 뉴클레아제 활성을 갖는다. 특정한 실시태양에서, "Cas 돌연변이체" 또는 "Cas 변이체"는 야생형 대응물의 뉴클레아제 활성의 일부 또는 전부가 결핍된다.
"gRNA 작용성"을 갖는 합성 안내 RNA는 천연 발생 안내 RNA의 하나 이상의 작용, 예컨대 Cas 단백질과의 회합, 또는 Cas 단백질과 함께 안내 RNA에 의해 수행되는 기능을 갖는 것이다. 특정한 실시태양에서, 작용성은 표적 폴리뉴클레오티드에 결합함을 포함한다. 특정한 실시태양에서, 작용성은 Cas 단백질 또는 gRNA:Cas 단백질 복합체를 표적 폴리뉴클레오티드에 표적화시킴을 포함한다. 특정한 실시태양에서, 작용성은 표적 폴리뉴클레오티드를 틈내기함을 포함한다. 특정한 실시태양에서, 작용성은 gRNA:Cas 시스템내에서 표적 폴리뉴클레오티드를 절단시키는 작용을 포함한다. 특정한 실시태양에서, 작용성은 Cas 단백질과의 회합 또는 이로의 결합을 포함한다. 특정한 실시태양에서, 작용성은 Cas 단백질을 갖는 CRISPR/Cas 시스템, 예컨대 조작된 Cas 단백질을 갖는 인공적 CRISPR/Cas 시스템에서의 안내 RNA의 임의의 다른 공지된 작용이다. 특정한 실시태양에서, 작용성은 천연 안내 RNA의 임의의 다른 작용이다. 합성 안내 RNA는 천연 발생 안내 RNA에 비해 더 크거나 작은 정도로 gRNA 작용성을 가질 수 있다. 특정한 실시태양에서, 합성 안내 RNA는 유사한 천연 발생 안내 RNA와 비교하여 하나의 특성에 대한 더 큰 작용성 및 또 다른 특성에 대한 더 작은 작용성을 가질 수 있다.
본원에 사용될 경우, 서열의 "분절"이라는 용어는 완전한 서열에 비해 더 작은 서열의 임의의 부분(예를 들어, 뉴클레오티드 부속서열 또는 아미노산 부속서열)을 지칭한다. 폴리뉴클레오티드의 분절은 임의의 길이, 예를 들어, 적어도 5, 10, 15, 20, 25, 30, 40, 50, 75, 100, 150, 200, 300 또는 500개 또는 그 이상의 뉴클레오티드 길이일 수 있다. 안내 서열의 부분은 안내 서열의 약 50%, 40%, 30%, 20%, 10%, 예를 들어, 안내 서열의 1/3 이하의 길이, 예를 들어, 7, 6, 5, 4, 3, 또는 2개의 뉴클레오티드 길이일 수 있다.
분자와 관련하여 "…로부터 유래된"이라는 용어는 모 분자 또는 그러한 모 분자로부터의 정보를 사용하여 단리되거나 만들어진 분자를 지칭한다. 예를 들어, Cas9 단일 돌연변이체 틈내기효소(nickase) 및 Cas9 2중 돌연변이체 널(null)-뉴클레아제는 야생형 Cas9 단백질로부터 유래된다.
둘 이상의 폴리뉴클레오티드(또는 둘 이상의 폴리펩티드)와 관련하여 "실질적으로 동일한"이라는 용어는, 서열 비교 알고리즘을 사용하거나 시각적 검사에 의해 최대 관련성(correspondence)을 비교하여 정렬하는 경우, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 약 90 내지 95%, 적어도 약 95%, 적어도 약 98%, 적어도 약 99% 또는 그 이상의 뉴클레오티드(또는 아미노산) 서열 동일성을 갖는 서열 또는 부속서열을 지칭한다. 바람직하게는, 폴리뉴클레오티드 사이의 "실질적인 동일성"은 적어도 약 50개의 뉴클레오티드 길이, 적어도 약 100개의 뉴클레오티드 길이, 적어도 약 200개의 뉴클레오티드 길이, 적어도 약 300개의 뉴클레오티드 길이, 적어도 약 500개의 뉴클레오티드 길이의 폴리뉴클레오티드 영역에 걸쳐 존재하거나, 폴리뉴클레오티드의 전체 길이에 걸쳐 존재한다. 바람직하게는, 폴리펩티드 사이의 "실질적인 동일성"은 적어도 약 50개의 아미노산 잔기 길이, 적어도 약 100개의 아미노산 잔기 길이의 폴리펩티드의 영역에 걸쳐 존재하거나, 폴리펩티드의 전체 길이에 걸쳐 존재한다.
본원에 개시된 바와 같이, 다수의 값의 범위가 제공된다. 이러한 범위의 상한치 및 하한치 사이에 존재하는, 하한치 단위의 1/10까지의 사이 값들은 또한 각각 구체적으로 고려되는 것으로 이해해야 한다. 각각의 더 작은 범위 또는 언급된 범위에 포괄된 사이 값은 또한 구체적으로 고려된다. 용어 "약"은 일반적으로 표시된 수의 ± 10%를 지칭한다. 예를 들어, "약 10%"는 9% 내지 11%의 범위를 나타낼 수 있고, "약 20"은 18 내지 22를 의미할 수 있다. "약"의 다른 의미는 내용으로부터 명백할 수 있고, 예컨대 반올림이 그러하고, 예를 들어 "약 1"은 또한 0.5 내지 1.4를 의미할 수 있다.
II. CRISPR-중재된 서열-특이적 결합 또는 절단
도 1은 DNA의 CRISPR-Cas9 중재된, 서열 특이적 절단을 도시한다. 표적 폴리뉴클레오티드(112)의 프로토스페이서(118)에 부합되는 20개의 뉴클레오티드(nt) 5' 말단(104)를 갖고, 헤어핀(hairpin)(108) 및 tracrRNA 분절(106)을 포함하는 Cas9 결합 핸들(handle)이 수반된 조작된 단일 안내 RNA(sgRNA)를 갖는 Cas9:안내 RNA 복합체가 제시된다. sgRNA는 하나 보다 많은 헤어핀 또는 루우프(loop)를 포함할 수 있다. gRNA는 Cas9 뉴클레아제(116)와 복합체를 형성한다. Cas9:gRNA 복합체는, 3 nt의 프로토스페이서 인접 모티프(PAM)(120)의 바로 상류에 프로토스페이서(118)를 함유하는 표적 폴리뉴클레오티드(112)에 결합하고, 이때 5' 말단(104)은 표적 서열(114)과 하이브리드화된다. 절단은 화살표로 표시된 절단 부위(122)에서 표적 폴리뉴클레오티드의 양쪽 가닥에서 일어난다[지넥(Jinek) 등의 문헌 "박테리아 적응 면역력에 있어서 프로그램가능한 이중-RNA-안내된 DNA 엔도뉴클레아제(A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity). Science 337(6096), 816-21 (2012)].
III. 안내 RNA
적어도 하나의 양태에서, 본 발명은 안내 RNA 작용성을 갖고 어댑터 분절을 포함하는 합성 안내 RNA를 포함한다. 특정한 실시태양에서, 어댑터 분절은 화학적 변형, 예컨대 안정성-향상 변형을 포함한다. 비천연 치환체(예를 들어 2'-알콕시 또는 2'-할로 치환체)를 갖는 천연 뉴클레오티드, 또는 4개의 고전적 리보뉴클레오티드, 즉 A, C, G, 및 U 이외의 임의의 뉴클레오티드(비천연적인지 천연적인지와 무관하게, 예를 들어 유사우리딘, 이노신 또는 데옥시뉴클레오티드)를 포함하는 안내 RNA는 변형을 포함한다. 마찬가지로 임의의 주쇄, 또는 천연 인산이에스테르 뉴클레오티드 사이의 연결기 이외의 뉴클레오티드 사이의 연결기를 포함하는 안내 RNA는 변형을 포함하는 합성 안내 RNA이다.
특정한 실시태양에서, 보유된 안내 RNA 작용성은 Cas 단백질로의 결합을 포함한다. 특정한 실시태양에서, 보유된 작용성은 표적 폴리뉴클레오티드로의 결합을 포함한다. 특정한 실시태양에서, 보유된 작용성은 Cas 단백질 또는 gRNA:Cas 단백질 복합체를 표적 폴리뉴클레오티드에 표적화시킴을 포함한다. 특정한 실시태양에서, 보유된 작용성은 gRNA:Cas 단백질 복합체에 의해 표적 폴리뉴클레오티드를 틈내기함을 포함한다. 특정한 실시태양에서, 보유된 작용성은 gRNA:Cas 단백질 복합체에 의해 표적 폴리뉴클레오티드를 절단시킴을 포함한다. 특정한 실시태양에서, 보유된 작용성은 Cas 단백질을 갖는 CRISPR/Cas 시스템, 예컨대 조작된 Cas 단백질을 갖는 인공적 CRISPR/Cas 시스템에서의 안내 RNA의 임의의 다른 공지된 작용이다. 특정한 실시태양에서, 보유된 작용성은 천연 안내 RNA의 임의의 다른 작용을 포함한다.
A. 어댑터 분절을 포함하는 안내 RNA
특정한 실시태양에서, 안내 RNA는 어댑터 분절을 포함한다. 어댑터 분절(예를 들어 tracrRNA 분절의 3' 말단 또는 crRNA 분절의 5' 말단에서의 핵산의 분절)을 갖는 CRISPR 안내 RNA는, 상동 재조합을 위한 공여체(공여체 폴리뉴클레오티드)로서 작용할 수 있는 폴리뉴클레오티드 서열에 안내 RNA를 결박시킴을 용이하게 할 수 있다. 안내 RNA:공여체 폴리뉴클레오티드 복합체에 의해 적재될 경우, Cas 단백질은 공여체 폴리뉴클레오티드를 표적 절단 부위로 옮길 것이다. 이는 Cas 절단 부위 주변에 공여체 폴리뉴클레오티드의 국소적 농도를 증가시키고, DNA 공여체를 필요로 하지 않는 다른 DNA 복구 기작 이상으로 상동 재조합(HR) 사건이 발생되는 경향을 증가시킨다. 특정한 실시태양에서, 연장된 sgRNA는 TC 화학(아래 논의됨)에 의해 생성되어, Cas 단백질이 sgRNA에 결합될 경우 ssDNA 또는 ssRNA 3' 말단이 노출된다. HR을 증가시키는 "키메라성" 안내 RNA:공여체 DNA 접근법의 실행가능성을 증가시킬 신규 조성물(즉, 안내 RNA에 대한 화학적 변형) 및 고안물(즉, 2중 안내 RNA)이 제공된다.
특정한 실시태양에서, 어댑터 분절은 crRNA의 5' 말단 또는 tracrRNA의 3' 말단에 부착되지만, 분절 및/또는 작용이 중첩되는 몇몇 부분이 존재할 수 있다.
특정한 실시태양에서, 안내 RNA의 어댑터 분절은 적어도 10개의 뉴클레오티드, 다르게는 적어도 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 22, 24, 26, 28, 또는 30개의 뉴클레오티드 길이이다. 특정한 실시태양에서, 안내 RNA의 어댑터 분절은 많아야 18, 19, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 40개의 뉴클레오티드 길이이다. 전술된 임의의 최소값 및 최대값은 조합되어 일정 범위를 형성할 수 있지만, 단 최소값은 최대값에 비해 더 작아야 한다.
프로그램가능한 Cas9:안내 RNA 시스템의 유연성은 표적 세포의 게놈에서 특이적 DSB를 조작하기 위해 이용될 수 있고(도 1 참조), 이때 개선된 상동 재조합을 위해 결박된 공여체 폴리뉴클레오티드를 주형으로서 첨가한다(도 3 참조). 본 발명의 조성물 및 방법에서, 안내 RNA는 특이적 공여체 폴리뉴클레오티드에 그의 5' 말단에서, 중간 또는 내부 부위에서, 또는 그의 3' 말단에서 결박되어, Cas9:gRNA 복합체에 의해 생성된 2중-가닥 파괴의 부위에서 공여체 폴리뉴클레오티드의 국소적 농도를 증가시키는 목표 및 효과를 갖는다. 도 3은 이러한 접근법의 몇몇 실시태양을 제공한다.
안내 RNA의 3' 말단은 Cas9 단백질에 의해 커버되지 않고, 이러한 3' 연장부의 변형이 Cas9 활성을 방해하지 않는다는 증거가 있다. 특정한 실시태양에서, 연장된 안내 RNA가 생성되어, Cas9가 안내 RNA에 결합될 경우 ssDNA 또는 ssRN3' 말단(어댑터 분절)이 노출된다. 이러한 어댑터 분절은 몇몇 배열형태중 하나로(공여체로의 직접적인 부착에 의해 또는 제2 어댑터 또는 스플린트를 경유하여) 공여체 폴리뉴클레오티드에 결박되도록 조작될 수 있다. 특정한 실시태양에서, 어댑터 분절은 공여체 폴리뉴클레오티드의 5' 말단, 또는 공여체 폴리뉴클레오티드의 중간 또는 내부 부분, 또는 공여체 폴리뉴클레오티드의 3' 말단에서 부착된다. 특정한 실시태양에서, 어댑터 분절(및 결박된 공여체 폴리뉴클레오티드)은 안내 RNA의 3' 말단 이외의 위치에, 예컨대 gRNA의 5' 말단, 또는 gRNA의 5' 말단으로부터의 오버행에 위치된다.
안내 RNA의 어댑터 분절은 왓슨 크릭(Watson Crick) 염기-짝형성을 통해 폴리뉴클레오티드(예를 들어 공여체 폴리뉴클레오티드, 제2 어댑터 분절, 또는 스플린트)에 하이브리드화되도록 적응된 ssDNA 또는 ssRNA를 포함한다. 공여체 DNA에 직접 하이브리드화된 ssRNA 연장의 경우, 어댑터 RNA:공여체 DNA 듀플렉스가 형성된다. 이러한 듀플렉스는 RNA 가닥의 뉴클레아제, 예컨대 RNase H 절단에 영향받기 쉽다. 변형되지 않은 어댑터 RNA:공여체 DNA 듀플렉스는 RNase H 절단에 영향받기 쉽고, 이는 안내 RNA:Cas9 및 공여체 DNA 사이의 물리적 연결을 끊어내는 경향이 있고, 공여체 DNA는 Cas9에 의해 절단 부위에 편재화되지 않을 것이다(도 5a). 더욱이, RNase H 절단은 안내 RNA/Cas9 작용성을 방해하고, 안내 RNA 및/또는 공여체 DNA를 분해할 수 있다. RNase H 절단 및 어댑터 RNA:공여체 DNA 듀플렉스의 방해 가능성을 감소시키기 위해, 안정성-향상 변형을 안내 RNA의 어댑터 분절중의 뉴클레오티드에 도입한다(도 5b 및 아래에 더욱 상세히 기재됨). 변형, 예컨대 2'-O-메틸은 RNA:DNA 하이브리드에서 RNA를 RNase H 절단로부터 보호하는 것으로 입증되었다[유(Yu) 등의 문헌 "RNA 분자에서 2'-O-메틸화의 부위를 검출하기 위한 신규 방법(A new method for detecting sites of 2'-O-methylation in RNA molecules). RNA 3(3): 324-331 (1997)" 참조]. 안내 RNA에 대한 변형의 상이한 정도 및 유형은, Cas 활성 및 원하는 재조합에 영향을 주지 않으면서, RNase H 절단을 방지하기 위한 변형의 최소 및 최대 수를 산출할 것이다. 포스포디에스테라아제(phosphodiesterases)에 대항하여 안내 RNA를 안정화시키고 핵산의 면역자극 특성을 감소시키는 것으로 공지된 추가적인 변형(즉, 2'-O-메틸,3'포스포로티오에이트, 2'-O-메틸,3'티오PACE)은 또한 본 발명의 성분 및 방법에서 유리할 수 있다.
도 3a 내지 3e는 안내 RNA 및 공여체 폴리뉴클레오티드를 결박시키기 위한 몇몇 가능한 배열형태를 도시한다. 도 3a는 Cas 9 단백질(316)에 결합된 안내 RNA(306)의 3' 말단 상에 첨부된 어댑터 RNA 서열(310)을 보여준다. 도 3b는 어댑터 분절에 의해 안내 RNA에 결박될 수 있는 공여체 DNA 올리고뉴클레오티드의 상이한 위상(topology)의 3가지 예를 보여준다. 5' 오버행(333)을 갖는 2중-가닥 공여체 DNA(332)(또한 제2 어댑터 분절로 지칭됨)는 어댑터(310)와 직접적으로 하이브리드화되도록 고안될 수 있다(도 3c에 제시됨). DNA-RNA 결찰 효소는 *에 의해 표시된 연결 지점에서 DNA-RNA 키메라를 결찰시키기 위해 사용될 수 있다. 3' → 5' 방향성을 갖는 단일-가닥 공여체 DNA(336)(도 3d에 제시됨)는 또한 어댑터 RNA(310)에 하이브리드화되도록 고안될 수 있고, 이는 RNA 프라이머로부터 DNA 중합효소에 의해 2중-가닥 공여체 DNA를 생성하도록 연장될 수 있다(부위는 **에 의해 표시됨). 다르게는, 단일-가닥 스플린트 DNA(338) 및 공여체 DNA(336)는 어댑터 RNA에 하이브리드화될 경우(도 3e에 도시됨) 공여체 폴리뉴클레오티드가 이전의 배열형태와 반대 방향성(5' → 3')을 가지도록 고안될 수 있다. 공여체 DNA(336) 및 어댑터 RNA(310)는 DNA-RNA 리가아제(ligase)에 의해 다시 결찰될 수 있다(결찰 부위는 *에 의해 표시됨).
또 다른 가능한 배열형태는 공여체 폴리뉴클레오티드의 중간 부분에 (직접적으로 또는 간접적으로) 부착된 어댑터 분절을 갖는다. 이러한 배열형태에서, 어댑터 분절(또는 스플린트)에 부착된 공여체 폴리뉴클레오티드의 부분은 일반적으로 원하는 작용을 수행하도록 표적 폴리뉴클레오티드에 삽입된 유전자, 코딩 서열 또는 기타 서열의 일부를 포함한다. 따라서, 어댑터 분절 또는 스플린트는 그 부분을 위해 특별히 적응되어야 한다. 예를 들어, 어댑터 분절 또는 스플린트는 공여체 폴리뉴클레오티드의 중간 부분에 상보성인 뉴클레오티드 서열을 가짐으로써, 이들은 염기-쌍 하이브리드화에 의해 서로 부착될 것이다. 이러한 배열형태에서, 소정의 공여체 폴리뉴클레오티드에 특이적으로 결합하는 어댑터 분절이 제공될 수 있다. 다른 배열형태에서, 예컨대 공여체 폴리뉴클레오티드가 그의 5' 말단 또는 3' 말단에 의해 어댑터 분절에 부착되는 경우, 5' 말단 또는 3' 말단은 특별히 표적 폴리뉴클레오티드에 도입하고자 하는 유전자 또는 서열이 아닌 부분을 포함할 수 있고, 어댑터 분절은 어댑터 분절에 상보성인 공통의 부분을 갖는 복수개의 상이한 공여체 폴리뉴클레오티드에 부착되도록 적응될 수 있다.
어댑터 분절 및 공여체 폴리뉴클레오티드 사이의 상호작용은 공유적일 수 있거나(프라이머 연장에 의해 또는 결찰에 의해), 또는 이는 비-공유적일 수 있다. 스플린트는 뉴클레오티드로 구성된 폴리뉴클레오티드(올리고뉴클레오티드 포함)일 수 있거나, 스플린트는 핵산 및 기타 작용기, 예컨대 펩티드-핵산 또는 아미노산을 포함하는 분절일 수 있거나, 스플린트는 펩티드-핵산으로 구성된 중합체, 또는 천연 또는 비천연 아미노산으로 구성된 단백질 또는 펩티드일 수 있다.
도 4는 제안된 공여체 DNA-결박된 Cas9-중재된 유전자 표적화를 보여준다. (좌측) 안내 RNA(402)는 표적 폴리뉴클레오티드(412)의 프로토스페이서(418)에 부합하는 20 nt의 5' 말단(404)을 갖고, 헤어핀 및 tracrRNA 분절(406)을 포함하는 Cas9 결합 핸들이 수반된다. 안내 RNA(402)는 3' 말단에 어댑터 RNA(410)를 포함한다. 어댑터 RNA(410)는 5' 오버행(434)(이는 또한 제2 어댑터 분절로서 지칭될 수 있음)을 통해 2중-가닥 공여체 DNA(432)에 하이브리드화된다. 안내 RNA(402)는 Cas9 단백질(416)과 착화된다. Cas9:gRNA 복합체는 3 nt의 PAM(420) 바로 상류에 프로토스페이서(418)를 함유하는 표적 폴리뉴클레오티드(412)에 결합하고, 5' 말단(404)은 표적 서열(414)과 하이브리드화한다. Cas9:안내 RNA 복합체는 표적 폴리뉴클레오티드(412)의 두 가닥을 화살표로 표시된 절단 부위(422)에서 절단시킨다. 표적 폴리뉴클레오티드의 절단 이후, Cas9-안내 RNA 복합체는 이제 2중-가닥 파괴의 결과로서 분절(412a) 및 (412b)인 표적 폴리뉴클레오티드에 국소적으로 근접하여 유지된다(우측). 이러한 국소적 근접성은 공여체 폴리뉴클레오티드(432)와의 상동 재조합의 경향을 촉진시켜서 편집된 폴리뉴클레오티드(440)를 형성한다.
B. 적어도 하나의 변형을 갖는 어댑터 분절을 포함하는 안내 RNA
하나의 양태에서, 본 발명의 기술은, 변형된 어댑터 분절을 구성하는 적어도 하나의 변형을 갖는 어댑터 분절을 포함하는 안내 RNA를 제공한다. 특정한 실시태양에서, 변형은 안정성-변경 변형이다. 특정한 실시태양에서, 변형은 변형되지 않은 안내 RNA와 비교하여 안내 RNA의 뉴클레아제 저항성을 증가시킨다. 특정한 실시태양에서, 변형은 안정성 향상 변형이다.
도 5는 어댑터 RNA:공여체 DNA 듀플렉스를 RNase H 절단로부터 보호하는 화학적 변형을 도시한다. 도 5a는 어댑터 RNA:공여체 DNA 듀플렉스가 RNA 어댑터 서열 및 공여체 DNA(이 경우에, 짧은 단일-가닥 DNA 서열임) 사이의 하이브리드화를 포함함을 보여준다. 도 5b는 RNase H가 어댑터 RNA 및 공여체 DNA 사이에 형성된 RNA:DNA 하이브리드를 절단시키는 것을 방지하는 2'-O-메틸 화학 변형(깃발 표시)을 갖는 리보뉴클레오티드로 구성된 안내 RNA 어댑터 서열을 보여준다. 키메라성 안내 RNA:공여체 DNA를 RNase H 분해로부터 안정화시키는 것은 공여체 DNA가 sgRNA:Cas9 단백질과 함께 표적 부위에 편재화되는 것을 가능하게 한다.
특정한 실시태양에서, gRNA에 연결된 변형된 어댑터 분절은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 또는 40개의 변형을 포함한다. 특정한 실시태양에서, 모든 변형은 동일하다. 특정한 실시태양에서, 변형된 어댑터 분절의 모든 변형된 뉴클레오티드는 동일한 유형의 변형을 갖는다. 특정한 실시태양에서, 변형된 어댑터는 상이하게 변형된 뉴클레오티드의 조합을 포함한다. 특정한 실시태양에서, 변형된 어댑터 분절은 2개 이상의 변형된 뉴클레오티드를 포함한다. 특정한 실시태양에서, 변형된 어댑터 분절은 3개 이상의 변형된 뉴클레오티드를 포함한다. 특정한 실시태양에서, 변형된 뉴클레오티드는 연속적으로 배열된다. 특정한 실시태양에서, 변형된 어댑터 분절은 변형된 뉴클레오티드의 적어도 하나의 인접한 연신부를 포함한다. 특정한 실시태양에서, 변형된 어댑터 분절은 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 또는 40개의 변형된 뉴클레오티드의 인접한 연신부를 포함한다. 각각의 변형된 뉴클레오티드는 독립적으로 하나 이상의 변형 유형을 포함할 수 있다. 특정한 실시태양에서, 변형된 뉴클레오티드는 변형된 어댑터 분절의 서열에서 인접하지 않거나, 전부는 아니지만 일부는 인접하다.
특정한 실시태양에서, 변형은 2'-O-C1-C4알킬, 예컨대 메틸("2'-OMe"), 2'-데옥시(2'-H), 2'-OC1-C3알킬-OC1-C3알킬, 예컨대 2'-메톡시에틸("2'-MOE"), 2'-할로, 예컨대 2'-플루오로("2'-F") 또는 2'-클로로("2'-Cl"), 2'-아미노("2'-NH2"), 2'-아라비노실("2'-아라비노") 뉴클레오티드, 2'-F-아라비노실("2'-F-아라비노") 뉴클레오티드, 2'-잠긴 핵산 ("LNA": locked nucleic acid) 뉴클레오티드, 2'-잠기지 않은 핵산("ULNA": unlocked nucleic acid) 뉴클레오티드, L 형태의 당("L-당"), 및 4'-티오리보실 뉴클레오티드로 구성된 군에서 선택된 어댑터 분절내로 혼입되는 뉴클레오티드 당 변형이다. 특정한 실시태양에서, 변형은: 포스포로티오에이트 "P(S)"(P(S)), 포스포노카복실레이트(P(CH2)nCOOR), 예컨대 포스포노아세테이트 "PACE"(P(CH2COO-)), 티오포스포노카복실레이트((S)P(CH2)nCOOR), 예컨대 티오포스포노아세테이트 "티오PACE"((S)P(CH2COO-)), 알킬포스포네이트(P(C1-C3알킬), 예컨대 메틸포스포네이트-P(CH3), 보라노포스포네이트(P(BH3)), 및 포스포로디티오에이트(P(S)2)로 구성된 군에서 선택된 어댑터 분절내로 혼입된 뉴클레오티드 사이의 연결기 변형이다.
예를 들어, 특정한 실시태양에서, 당은 2'-O-C1-4알킬, 예컨대 2'-O-메틸(2'-OMe)을 포함한다. 특정한 실시태양에서, 당은 2'-O-C1-3알킬-O-C1-3알킬, 예컨대 2'-O-(2-메톡시에틸) 또는 2'-MOE로서도 공지된 2'-메톡시에톡시(2'-O-CH2CH2OCH3)를 포함한다. 특정한 실시태양에서, 당은 2'-할로, 예컨대 2'-F, 2'-Br, 2'-Cl, 또는 2'-I를 포함한다. 특정한 실시태양에서, 당은 2'-NH2를 포함한다. 특정한 실시태양에서, 당은 2'-H(예를 들어, 데옥시뉴클레오티드)를 포함한다. 특정한 실시태양에서, 당은 2'-아라비노 또는 2'-F-아라비노를 포함한다. 특정한 실시태양에서, 당은 2'-LNA 또는 2'-UNLA를 포함한다. 특정한 실시태양에서, 당은 4'-티오리보실을 포함한다. 특정한 실시태양에서, 변형된 어댑터 분절은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 또는 40개의 변형된 당을 포함한다.
특정한 실시태양에서, 변형은 변형된 주쇄(즉, 천연 인산이에스테르 이외의 뉴클레오티드 사이의 연결기)를 포함한다. 변형된 뉴클레오티드 사이의 연결기의 예로는, 제한되지 않지만, 포스포로티오에이트 뉴클레오티드 사이의 연결기, 키랄성(chiral) 포스포로티오에이트 뉴클레오티드 사이의 연결기, 포스포로디티오에이트 뉴클레오티드 사이의 연결기, 보라노포스포네이트 뉴클레오티드 사이의 연결기, C1-4알킬 포스포네이트 뉴클레오티드 사이의 연결기, 예컨대 메틸포스포네이트 뉴클레오티드 사이의 연결기, 보라노포스포네이트 뉴클레오티드 사이의 연결기, 포스포노카복실레이트 뉴클레오티드 사이의 연결기, 예컨대 포스포노아세테이트 뉴클레오티드 사이의 연결기, 포스포노카복실레이트 에스테르 뉴클레오티드 사이의 연결기, 예컨대 포스포노아세테이트 에스테르 뉴클레오티드 사이의 연결기, 티오포스포노카복실레이트 뉴클레오티드 사이의 연결기, 예컨대 예를 들어 티오포스포노아세테이트 뉴클레오티드 사이의 연결기, 티오포스포노카복실레이트 에스테르 뉴클레오티드 사이의 연결기, 예컨대 티오포스포노아세테이트 에스테르 뉴클레오티드 사이의 연결기가 포함된다. 다양한 염, 혼합된 염 및 자유산 형태가 또한 포함된다. 특정한 실시태양에서, 변형된 어댑터 분절은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 또는 40개의 변형된 뉴클레오티드 사이의 연결기를 포함한다.
또 다른 양태에서, 본 발명의 기술은 둘 이상의 변형의 조합을 갖는 어댑터 분절을 제공한다. 특정한 실시태양에서, 변형된 뉴클레오티드는 2'-O-메틸,3'-포스포로티오에이트를 포함한다. 특정한 실시태양에서, 변형된 뉴클레오티드는 2'-O-메틸,3'-포스포노아세테이트를 포함한다. 특정한 실시태양에서, 변형된 뉴클레오티드는 2'-O-메틸,3'-티오포스포노아세테이트를 포함한다. 특정한 실시태양에서, 변형된 뉴클레오티드는 2'-할로,3'-포스포로티오에이트를 포함한다. 특정한 실시태양에서, 변형된 뉴클레오티드는 2'-할로,3'-포스포노아세테이트를 포함한다. 특정한 실시태양에서, 변형된 뉴클레오티드는 2'-할로,3'-티오포스포노아세테이트를 포함한다. 특정한 실시태양에서, 변형된 뉴클레오티드는 2'-플루오로,3'-포스포로티오에이트를 포함한다. 특정한 실시태양에서, 변형된 뉴클레오티드는 2'-플루오로,3'-포스포노아세테이트를 포함한다. 특정한 실시태양에서, 변형된 뉴클레오티드는 2'-플루오로,3'-티오포스포노아세테이트를 포함한다.
특정한 실시태양에서, 둘 이상의 변형은 동일한 뉴클레오티드 상에 존재한다(예를 들어, 하나의 뉴클레오티드가 2'-O-메틸 및 3'-티오포스포노아세테이트 작용기를 포함함). 다른 실시태양에서, 둘 이상의 변형은 2가지 상이한 뉴클레오티드 상에 존재한다(예를 들어, 하나의 뉴클레오티드가 2'-플루오로 기를 갖고 또 다른 뉴클레오티드가 2'-O-메틸 기를 가짐).
특정한 실시태양에서, 어댑터 분절에서의 각각의 변형은 동일하다. 특정한 실시태양에서, 어댑터 분절에서의 적어도 하나의 변형은 어댑터 분절에서의 적어도 하나의 다른 변형과 상이하다. 특정한 실시태양에서, 어댑터 분절내의 단일 뉴클레오티드는 둘 이상의 변형을 갖는다.
특정한 실시태양에서, 어댑터 분절은 상이한 유형의 변형들의 조합을 포함하고, 이러한 조합시 적어도 하나의 유형은 어댑터 폴리뉴클레오티드에서 다수의 장소에 존재한다. 특정한 실시태양에서, 이러한 조합시 적어도 하나의 유형은 어댑터 분절에서 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20회 나타난다.
특정한 실시태양에서, 조합시 변형들중 적어도 하나의 유형은 2개 이상의 변형된 뉴클레오티드에서 나타난다. 특정한 실시태양에서, 조합시 변형들중 적어도 하나의 유형은 3개 이상의 변형된 뉴클레오티드에서 나타난다. 특정한 실시태양에서, 변형된 뉴클레오티드는 서열에서 인접하여 배열되지 않거나, 적어도 전체적으로 배열되지 않을 수 있는데, 이는 하나 이상의 변형되지 않은 뉴클레오티드가 개입될 수 있기 때문이다. 특정한 실시태양에서, 변형된 뉴클레오티드는 인접하여 배열된다. 특정한 실시태양에서, 어댑터 폴리뉴클레오티드는 동일한 유형의 인접한 변형된 뉴클레오티드의 연신부를 포함한다. 특정한 실시태양에서, 연신부는 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 또는 40개의 변형된 뉴클레오티드를 갖는다.
특정한 실시태양에서, 어댑터 폴리뉴클레오티드에서의 변형에 더하여, 변형들중 적어도 하나의 유형은 안내 RNA의 5' 부분 또는 3' 부분, 특별히 5' 부분의 처음 5 또는 10개의 뉴클레오티드내에 또는 3' 부분의 마지막 5 또는 10개의 뉴클레오티드내에 혼입되어, 예를 들어, RNA를 뉴클레아제에 의한 분해로부터 보호하거나 다른 목적을 위해 사용된다. 특정한 실시태양에서, 조합시 변형들중 적어도 하나의 유형은 안내 RNA의 5' 부분에 존재하고, 조합시 변형들중 적어도 하나의 유형은 안내 RNA의 3' 부분에 존재하며, 특별히 5' 부분의 처음 5 또는 10개의 뉴클레오티드내에 또는 3' 부분의 마지막 5 또는 10개의 뉴클레오티드내에 존재한다. 특정한 실시태양에서, 조합시 변형들중 적어도 하나의 유형은 안내 RNA의 내부 영역내에(즉, 5' 말단 및 3' 말단 사이에) 존재한다. 어댑터 분절 이외의 부분에서의 변형은, 예를 들어 RNA를 뉴클레아제에 의한 분해로부터 보호하거나 다른 목적을 위해 요망될 수 있다.
특정한 실시태양에서, 조합시 적어도 하나의 변형은 2'-O-메틸, 2'-플루오로, 2'-아미노, 2'-데옥시, 2'-아라비노실, 2'-F-아라비노실, 3'-포스포로티오에이트, 3'-포스포노아세테이트, 3'-포스포노아세테이트 에스테르, 3'-티오포스포노아세테이트, 3'-티오포스포노아세테이트 에스테르, 3'-메틸포스포네이트, 3'-보라노포스포네이트, 3'-포스포로디티오에이트, 또는 이들의 조합물을 포함한다. 특정한 실시태양에서, 조합시 적어도 하나의 변형은 2'-O-메틸, 2'-데옥시, 포스포로티오에이트 뉴클레오티드 사이의 연결기, 포스포노아세테이트 뉴클레오티드 사이의 연결기, 티오포스포노아세테이트 뉴클레오티드 사이의 연결기, 또는 이들의 조합물을 포함한다. 특정한 실시태양에서, 조합시 적어도 하나의 변형은 2'-O-메틸, 2'-데옥시, 2'-F, 포스포로티오에이트 뉴클레오티드 사이의 연결기, 포스포노아세테이트 뉴클레오티드 사이의 연결기, 티오포스포노아세테이트 뉴클레오티드 사이의 연결기, 또는 이들의 조합물을 포함한다. 특정한 실시태양에서, 조합시 적어도 2개의 변형은 2'-O-메틸 뉴클레오티드 및 포스포로티오에이트 뉴클레오티드 사이의 연결기, 2'-O-메틸 뉴클레오티드 및 포스포노아세테이트 뉴클레오티드 사이의 연결기, 또는 2'-O-메틸 뉴클레오티드 및 티오포스포노아세테이트 뉴클레오티드 사이의 연결기를 포함한다. 특정한 실시태양에서, 조합시 적어도 2개의 변형은 2'-O-메틸 뉴클레오티드 및 포스포노카복실레이트 뉴클레오티드 사이의 연결기, 2'-O-메틸 뉴클레오티드 및 포스포노카복실레이트 에스테르 뉴클레오티드 사이의 연결기, 2'-O-메틸 뉴클레오티드 및 티오포스포노카복실레이트 뉴클레오티드 사이의 연결기, 2'-O-메틸 뉴클레오티드 및 티오포스포노카복실레이트 에스테르 뉴클레오티드 사이의 연결기, 또는 이들의 조합물을 포함한다.
특정한 실시태양에서, 조합시 적어도 하나의 변형은 2'-O-메틸,3'-포스포로티오에이트를 포함한다. 특정한 실시태양에서, 조합시 적어도 하나의 변형은 2'-O-메틸,3'-포스포노아세테이트를 포함한다. 특정한 실시태양에서, 조합시 적어도 하나의 변형은 2'-O-메틸,3'-티오포스포노아세테이트를 포함한다. 특정한 실시태양에서, 조합시 적어도 하나의 변형은 2'-할로,3'-포스포로티오에이트를 포함한다. 특정한 실시태양에서, 조합시 적어도 하나의 변형은 2'-할로,3'-포스포노아세테이트를 포함한다. 특정한 실시태양에서, 조합시 적어도 하나의 변형은 2'-할로,3'-티오포스포노아세테이트를 포함한다. 특정한 실시태양에서, 조합시 적어도 하나의 변형은 2'-F,3'-포스포로티오에이트를 포함한다. 특정한 실시태양에서, 조합시 적어도 하나의 변형은 2'-F,3'-포스포노아세테이트를 포함한다. 특정한 실시태양에서, 조합시 적어도 하나의 변형은 2'-F,3'-티오포스포노아세테이트를 포함한다.
특정한 실시태양에서, 조합시 적어도 하나의 변형은 안정성-변경 변형이다. 특정한 실시태양에서, 조합시 적어도 하나의 변형은 안정성-향상 변형이다. 특정한 실시태양에서, 조합시 적어도 하나의 변형은 변형이 없는 안내 RNA에 비하여 안내 RNA의 뉴클레아제 저항성을 증가시킨다.
특정한 실시태양에서, 조합시 적어도 하나의 변형은 변형이 없는 안내 RNA에 비하여 안내 RNA의 안정성 및 특이성을 변경시킨다. 특정한 실시태양에서, 조합시 적어도 하나의 변형은 변형이 없는 안내 RNA에 비하여 안내 RNA의 안정성 및 형질감염 효율을 변경시킨다. 특정한 실시태양에서, 조합시 적어도 하나의 변형은 변형이 없는 안내 RNA에 비하여 안내 RNA의 특이성 및 형질감염 효율을 변경시킨다.
특정한 실시태양에서, 조합은 특이성을 증가시키는(즉, 표적-이외의 영향을 감소시키는) 적어도 하나의 변형 또는 변형의 집합과 함께 뉴클레아제 저항성(즉, 안정성)을 증가시키는 적어도 하나의 변형 또는 변형의 집합을 포함한다. 특정한 실시태양에서, 조합은 안내 RNA에서 몇몇 염기 짝형성의 Tm을 상승시키는 적어도 하나의 변형 또는 변형의 집합과 함께 뉴클레아제 저항성(즉, 안정성)을 증가시키는 적어도 하나의 변형 또는 변형의 집합을 포함한다. 특정한 실시태양에서, 조합은 안내 RNA에서 몇몇 염기 짝형성의 Tm을 저하시키는 적어도 하나의 변형 또는 변형의 집합과 함께 뉴클레아제 저항성(즉, 안정성)을 증가시키는 적어도 하나의 변형 또는 변형의 집합을 포함한다. 특정한 실시태양에서, 조합은 뉴클레아제 저항성(즉, 안정성)을 증가시키는 적어도 하나의 변형 또는 변형의 집합, 안내 RNA의 다른 곳에서 몇몇 염기 짝형성의 Tm을 증가시키는 적어도 하나의 변형 또는 변형의 집합, 및 안내 RNA에서 몇몇 염기 짝형성의 Tm을 감소시키는 적어도 하나의 변형 또는 변형의 집합을 포함한다. 특정한 실시태양에서, 조합은 뉴클레아제 저항성(즉, 안정성)을 증가시키는 적어도 하나의 변형 또는 변형의 집합, 및 안내 RNA와 Cas 단백질의 결합을 증가시키는 적어도 하나의 변형 또는 변형의 집합을 포함한다. 특정한 실시태양에서, 조합은 뉴클레아제 저항성(즉, 안정성)을 증가시키는 적어도 하나의 변형 또는 변형의 집합, 및 안내 RNA와 Cas 단백질의 결합을 증가시키는 적어도 하나의 변형 또는 변형의 집합을 포함한다. 특정한 실시태양에서, 안내 RNA는 상이한 유형의 변형들의 조합을 포함한다.
C. 안내 RNA 구조
특정한 실시태양에서, 안내 RNA는 CRISPR-연관된-단백질과 복합체를 형성할 수 있다. 특정한 실시태양에서, CRISPR-연관된 단백질은 CRISPR-Cas 유형 II 시스템이거나 이로부터 유래되고, 이는 RNA-안내된 핵산-결합 또는 뉴클레아제 활성을 갖는다. 특정한 실시태양에서, CRISPR-연관된 단백질은 Cas9, Cas9 돌연변이체, 또는 Cas9 변이체이다. 특정한 실시태양에서, CRISPR-연관된 단백질은 스트렙토코쿠스 파이오게네스(Streptococcus pyogenes)로부터의 Cas9 뉴클레아제이다. 특정한 실시태양에서, CRISPR-연관된 단백질은 스트렙토코쿠스 써모필루스(Streptococcus thermophilus)로부터의 Cas9 뉴클레아제이다. 특정한 실시태양에서, CRISPR-연관된 단백질은 스타필로코쿠스 아우레우스(Staphylococcus aureus)로부터의 Cas9 뉴클레아제이다. 특정한 실시태양에서, 합성 안내 RNA 또는 합성 안내 RNA:CRISPR-연관된 단백질 복합체는 변형된 뉴클레오티드를 갖지 않는 천연 안내 RNA 또는 복합체의 작용성을 유지한다. 특정한 실시태양에서, 작용성은 표적 폴리뉴클레오티드와의 결합을 포함한다. 특정한 실시태양에서, 작용성은 표적 폴리뉴클레오티드의 틈내기을 포함한다. 특정한 실시태양에서, 작용성은 표적 폴리뉴클레오티드의 절단을 포함한다. 특정한 실시태양에서, 표적 폴리뉴클레오티드는 시험관내 핵산에 존재한다. 특정한 실시태양에서, 표적 폴리뉴클레오티드는 생체내 또는 시험관내 세포(예컨대 배양된 세포 또는 유기체로부터 단리된 세포)의 게놈내에 존재한다. 특정한 실시태양에서, 표적 폴리뉴클레오티드는 DNA중의 프로토스페이서이다.
특정한 실시태양에서, crRNA 분절은 25 내지 80개의 뉴클레오티드를 포함한다. 특정한 실시태양에서, crRNA 분절은 표적 서열에 하이브리드화될 수 있는 안내 서열을 포함한다. 특정한 실시태양에서, 안내 서열은 표적 서열 또는 이의 일부에 상동성이다. 특정한 실시태양에서, 안내 서열은 15 내지 30개의 뉴클레오티드를 포함한다. 특정한 실시태양에서, crRNA 분절은 스템 서열을 포함한다. 특정한 실시태양에서, 스템 서열은 10 내지 50개의 뉴클레오티드를 포함한다. 특정한 실시태양에서, crRNA 분절은 5'-오버행 서열을 포함한다. 특정한 실시태양에서, 5'-오버행 서열은 어댑터 분절에 부착된다. 특정한 실시태양에서, 5'-오버행 서열은 1 내지 10개의 뉴클레오티드를 포함한다. 특정한 실시태양에서, crRNA는 (i) 표적 서열에 하이브리드화될 수 있는 안내 서열 및 (ii) 스템 서열 둘 다를 포함한다. 특정한 실시태양에서, crRNA는 (i) 5'-오버행 서열, (ii) 표적 서열에 하이브리드화될 수 있는 안내 서열, 및 (iii) 스템 서열을 포함한다. crRNA 분절이 스템 서열을 포함하는 특정한 실시태양에서, tracrRNA 분절은 crRNA 분절의 스템 서열에 부분적으로 또는 완전히 상동성인 뉴클레오티드 서열을 포함한다. 특정한 실시태양에서, tracrRNA 분절은 적어도 하나 이상의 듀플렉스 구조물을 포함한다.
안내 RNA는 5' 부분(즉, 5' 절반) 및 3' 부분(즉, 3' 절반)을 포함한다. 특정한 실시태양에서, crRNA 분절은 tracrRNA 분절의 5'(즉, 상류)이다. 특정한 실시태양에서, tracrRNA 분절은 crRNA 분절에 상대적으로 5'이다.
특정한 실시태양에서, 안내 RNA는 적어도 2개의 별도의 RNA 가닥, 예를 들어, crRNA 가닥 및 별도의 tracrRNA 가닥을 포함한다. 예를 들어, 도 2a를 참조한다. 특정한 실시태양에서, 가닥은 Cas 단백질, 예컨대 Cas9에 의한 표적 폴리뉴클레오티드의 결합, 틈내기, 또는 절단을 안내하기 위해 함께 작용한다. 특정한 실시태양에서, crRNA 분절 및 tracrRNA 분절은 별도의 가닥 상에 존재하고 2개의 상보성 서열을 통해 서로 하이브리드화되어 스템 또는 듀플렉스를 형성한다.
특정한 실시태양에서, 안내 RNA는 crRNA 분절 및 tracrRNA 분절을 포함하는 단일 안내 RNA이다. 예를 들어, 도 2b를 참조한다. 특정한 실시태양에서, crRNA 분절 및 tracrRNA 분절은 루우프 서열 L에 의해 연결된다. 특정한 실시태양에서, 루우프 L은 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 뉴클레오티드를 포함한다. 특정한 실시태양에서, 루우프 L은 GNRA의 뉴클레오티드 서열을 포함하고, 여기서 N은 A, C, G, 또는 U를 나타내고 R은 A 또는 G를 나타낸다. 특정한 실시태양에서, 루우프 L은 GAAA의 뉴클레오티드 서열을 포함한다. 특정한 실시태양에서, 단일 안내 RNA는 5' 부분 및 3' 부분을 포함하고, 여기서 crRNA 분절은 tracrRNA 분절의 상류이다.
특정한 실시태양에서, 2개의 RNA 조각의 총 길이는 약 60 내지 280개(예를 들어, 약 60 내지 260, 60 내지 240, 65 내지 280, 65 내지 270, 65 내지 260, 65 내지 250, 65 내지 240, 70 내지 230, 및 70 내지 220개)의 뉴클레오티드 길이, 예컨대 약 60, 65, 70, 75, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 220, 230, 240, 250, 260, 270 또는 280개의 뉴클레오티드 길이이다. 유사하게, 단일 안내 RNA(예를 들어, 도 2b)는 약 60 내지 280개(예를 들어, 약 60 내지 260, 60 내지 240, 65 내지 280, 65 내지 270, 65 내지 260, 65 내지 250, 65 내지 240, 70 내지 230, 및 70 내지 220개)의 뉴클레오티드 길이, 예컨대 약 60, 65, 70, 75, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 220, 230, 240, 250, 260, 270 또는 280개의 뉴클레오티드 길이이다.
도 2a 및 2b에 제시된 바와 같이, 합성 안내 RNA는 (i) (a) 핵산에서 표적 서열에 하이브리드화될 수 있는 안내 서열(224), (b) 제2 스템 서열(228), 및 임의적으로 5'-오버행 서열에 부분적으로 또는 완전히 하이브리드화될 수 있는 제1 스템 서열(226)을 포함하는 crRNA 분절(204); 및 (ii) 제2 스템 서열(228)을 포함하는 tracrRNA 분절(206)을 포함한다. 특정한 실시태양에서, 도 2a 및 2b에 제시된 합성 안내 RNA에서 O, G, X, Y, 또는 T로 표시되는 임의의 뉴클레오티드는 변형된 뉴클레오티드일 수 있다. 도 2b에 제시된 안내 RNA는 crRNA 분절 및 tracrRNA 분절이 서열 GAAA를 갖는 루우프(230)에 의해 연결되는 단일 안내 RNA(sgRNA)를 나타낸다.
특정한 실시태양에서, 안내 RNA의 crRNA 분절은 25 내지 70개(예를 들어, 30 내지 60, 35 내지 50, 또는 40 내지 45개)의 뉴클레오티드 길이이다. 특정한 실시태양에서, 안내 서열은 12 내지 30개(예를 들어, 16 내지 25, 17 내지 20, 또는 15 내지 18개)의 뉴클레오티드 길이이다. 몇몇 실시태양에서, crRNA의 5' 부분은 표적 서열과 하이브리드화하지 않거나 단지 부분적으로 하이브리드화한다. 예를 들어, crRNA 분절 상에 5'-오버행이 존재할 수 있다.
특정한 실시태양에서, 단일 안내 RNA는 crRNA 분절의 스템 서열, tracrRNA 분절의 스템 서열, 및 임의적으로, crRNA 분절을 tracrRNA 분절에 공유적으로 연결시키는 루우프를 포함하는 중심 부분을 포함한다. 특정한 실시태양에서, 단일 안내 RNA의 중심 분절은 8 내지 60개(예를 들어, 10 내지 55, 10 내지 50, 또는 20 내지 40개)의 뉴클레오티드 길이이다.
특정한 실시태양에서, 안내 RNA의 tracrRNA 분절은 10 내지 130개(예를 들어, 10 내지 125, 10 내지 100, 10 내지 75, 10 내지 50, 또는 10 내지 25개)의 뉴클레오티드 길이이다. 특정한 실시태양에서, tracrRNA 분절은 중심 분절중의 임의의 헤어핀 또는 듀플렉스 구조에 더하여 하나 이상의 헤어핀 또는 듀플렉스 구조를 포함한다.
특정한 실시태양에서, tracrRNA 분절은 기준 tracrRNA, 예컨대 천연적으로 존재하는 성숙한 tracrRNA와 비교하여 절단축소된다. 분리된 유형(도 2a) 및 sgRNA 유형(도 2b) 둘 다에서 일정 범위의 길이가 작용하는 것으로 보여졌다. 예를 들어, 특정한 실시태양에서, tracrRNA는 그의 3' 말단으로부터 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35 또는 40 nt만큼 절단축소될 수 있다. 특정한 실시태양에서, tracrRNA 분자는 그의 5' 말단으로부터 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75 또는 80 nt만큼 절단축소될 수 있다. 특정한 실시태양에서, tracrRNA 분자는 5' 및 3' 말단 둘 다로부터, 예를 들어, 5' 말단으로부터 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15 또는 20 nt만큼, 및 3' 말단으로부터 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35 또는 40 nt만큼 절단축소될 수 있다. 예를 들어, 지넥(Jinek) 등의 문헌[Science 2012; 337:816-821]; 말리(Mali) 등의 문헌[Science. 2013 Feb 15; 339(6121):823-6]; 콩(Cong) 등의 문헌[Science. 2013 Feb 15; 339(6121):819-23]; 및 황(Hwang) 및 푸(Fu) 등의 문헌[Nat Biotechnol. 2013 Mar; 31(3):227-9]; 지넥(Jinek) 등의 문헌[Elife 2, e00471 (2013)]을 참조한다. 특정한 실시태양에서, tracrRNA는 절단축소되지 않는다. tracrRNA 분절은 이것이 tracrRNA 작용성을 보유하도록 충분한 수의 뉴클레오티드를 갖는다.
E. 공여체 폴리뉴클레오티드
공여체 폴리뉴클레오티드 및 어댑터 RNA는 DNA-RNA 리가아제에 의해 결찰되어 키메라성 RNA-DNA를 형성할 수 있고, 여기서 어댑터는 뉴클레오티드 사이의 연결기에 의해 공여체에 결합된다(도 3c 및 3e에서 * 위치).
본 발명의 조성물 및 방법을 사용하여, 공여체 폴리뉴클레오티드는 표적 폴리뉴클레오티드내로, 예를 들어, 세포의 게놈내로 삽입될 수 있다. 특정한 실시태양에서, 공여체 폴리뉴클레오티드는, 절단된 표적 폴리뉴클레오티드와의 공여체 폴리뉴클레오티드의 삽입을 촉진시키기 위해 절단된 표적 폴리뉴클레오티드의 상응하는 폴리뉴클레오티드 오버행에 적어도 부분적으로 상보성인 센스(sense) 및/또는 안티센스(antisense) 가닥 폴리뉴클레오티드 오버행을 갖는 2중-가닥 폴리뉴클레오티드이다. 몇몇 실시태양에서 공여체 폴리뉴클레오티드는 일단 표적 폴리뉴클레오티드내로 삽입된다면 폴리펩티드를 발현할 수 있다. 특정한 실시태양에서, 폴리펩티드는, 예컨대 특이적 계통을 향해 특별한 방식으로 진행된 세포 분화 또는 성숙을 유도하는 작용을 할 수 있는 단백질일 수 있다. 특정한 실시태양에서, 공여체 폴리뉴클레오티드에 의한 폴리펩티드의 발현은 유도가능한 프로모터에 의해 제어될 수 있다. 다른 실시태양에서, 공여체 폴리뉴클레오티드에 의한 폴리펩티드의 발현은 억제가능한 프로모터에 의해 제어될 수 있다. 다른 실시태양에서, 공여체 폴리뉴클레오티드는 하나 보다 많은 폴리펩티드를 인코딩할 수 있고, 예를 들어, 공여체 폴리뉴클레오티드는 복수개의 유전자를 갖는 발현 카세트(cassette)를 포함할 수 있다. 공여체 폴리뉴클레오티드가 하나 보다 많은 폴리펩티드를 인코딩하는 특정한 실시태양에서, 공여체 폴리뉴클레오티드는 특정한 유전자의 발현을 조절하는 유도가능한 프로모터 및 유전자의 발현을 조절하는 억제가능한 프로모터를 가질 수 있다.
특정한 실시태양에서, 공여체 폴리뉴클레오티드는, 게놈 삽입 부위에서 절단될 경우 절단된 게놈 DNA의 상응하는 폴리뉴클레오티드 오버행에 상보성인 센스 및/또는 안티센스 가닥 폴리뉴클레오티드 오버행을 갖는 단일-가닥 또는 2중-가닥 공여체 폴리뉴클레오티드이다. 상보성 오버행은 절단된 게놈 DNA와 공여체 폴리뉴클레오티드의 상동 재조합을 용이하게 하여, 폴리뉴클레오티드가 세포의 게놈내로 도입되도록 한다. 특정한 실시태양에서, 오버행은 약 15개 염기 내지 약 500개 염기이다. 특정한 실시태양에서, 오버행은 적어도 15개의 뉴클레오티드 길이, 예컨대 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1,000개의 염기이다. 특정한 실시태양에서, 오버행은 적어도 15개의 염기, 다르게는 적어도 20개의 염기, 다르게는 적어도 25개의 염기, 다르게는 적어도 30개의 염기, 다르게는 적어도 35개의 염기, 다르게는 적어도 40개의 염기, 다르게는 적어도 50개의 염기, 다르게는 적어도 55개의 염기, 다르게는 적어도 60개의 염기, 다르게는 적어도 65개의 염기, 다르게는 적어도 70개의 염기, 다르게는 적어도 75개의 염기, 다르게는 적어도 약 100개의 염기, 다르게는 적어도 약 150개의 염기, 다르게는 적어도 약 200개의 염기, 다르게는 적어도 약 300개의 염기, 다르게는 적어도 약 400개의 염기, 다르게는 적어도 약 500개의 염기, 다르게는 적어도 약 800개의 염기이다. 상보성은 100% 상보성일 필요는 없다. 예를 들어, 상보성 오버행은 절단된 표적 폴리뉴클레오티드의 오버행에 95%, 96%, 97%, 98%, 또는 99% 상보성일 수 있다.
특정한 실시태양에서, 방법은 공여체 폴리뉴클레오티드를 세포의 게놈내로 삽입하는 단계를 포함한다. 공여체 폴리뉴클레오티드는 임의의 길이, 예컨대 약 10 내지 약 10,000개의 뉴클레오티드 길이(또는 그 사이의 임의의 정수 값), 예컨대 약 50 내지 약 2,000개의 뉴클레오티드 길이, 또는 약 100 내지 약 1,000개의 뉴클레오티드 길이(또는 그 사이의 임의의 정수 값), 또는 약 200 내지 약 500개의 뉴클레오티드 길이일 수 있다. 핵산 및 아미노산 서열 동일성을 결정하기 위한 기법은 당분야에 공지되어 있다.
F. 2중 안내 RNA 방법
도 6은 공여체 폴리뉴클레오티드를 Cas-촉매화된 파괴 부위 부근으로 편재화시키는 2중 안내 RNA 전략을 도시한다. 더욱 특별히, 도 6은 전략적인 2개의 안내 RNA(602 및 650), Cas9 효소(616), 및 촉매적 비활성 Cas9 돌연변이체(dCas9)를 도시한다. 제1 단일-안내 RNA(602)는, 표적 폴리뉴클레오티드(612)중의 제1 표적 서열(614)에 상보성인, 안내 서열을 함유하는 crRNA 도메인(604), Cas9 효소(616)에 결합하는 tracrRNA 도메인(606), 및 crRNA(604) 및 tracrRNA(606) 사이의 헤어핀 또는 듀플렉스 구조물(608)을 갖는다. Cas9:제1 안내 RNA 복합체는 PAM 부위의 바로 상류에 프로토스페이서를 함유하는 제1 표적 서열(614)에 결합한다. 표적 폴리뉴클레오티드(612)중의 제1 표적 서열(614)에서, 2중-가닥 파괴(DSB)는 화살표에 의해 표시된 부위(622)에서 Cas9 절단에 의해 이루어진다. 제2 단일-안내 RNA(650)는 5' 말단에서의 crRNA 도메인(658)(이는 표적 폴리뉴클레오티드(612)중의 제2 표적 서열(656)에 상보성임), 및 dCas9 돌연변이체(652)에 결합하는 tracrRNA 도메인(660)을 갖는다. 제2 단일-안내 RNA(650)는 또한 공여체 단일-가닥 폴리뉴클레오티드(636)에 부착되는 제1 어댑터 분절(610)을 포함한다. dCas9:제2 안내 RNA 복합체는 제2 표적 서열(656)에 결합하지만 이를 절단시키지 않는다.
Cas9:제1 안내 RNA(sgRNA1) 복합체는 정확한 표적 폴리뉴클레오티드 부위(622)에서 절단하는 반면, 제2 안내 RNA(sgRNA2)(650)는 공여체 DNA(636)(여기서는 단일-가닥)에 결박되고 제1 표적 서열(614)로부터 오프셋(offset)(654) 만큼 분리된 인근의 제2 표적 서열에 결합된다. 이러한 경우에, 제2 안내 RNA에 촉매적 비활성 Cas9(dCas9)(652)가 적재되고, 이에 따라 DNA를 절단시키거나 틈내기하지 않는다. 표적 폴리뉴클레오티드에서 sgRNA1:Cas9 중재된 DSB는 DNA 복구 기작을 개시하는데, 인근에 공여체 DNA(636)가 존재함으로써 상동 재조합의 경향이 더 높다.
HR을 위한 주형으로서의 결박된 공여체 폴리뉴클레오티드의 작용성은, 결박 배열형태에 의해 안내 RNA 및 Cas9 단백질에 착화될 경우 보유될 수 있다. 그러나, Cas9-중재된 HR의 기작은 완전히 유발되지 않고, 절단 이후, 안내 RNA:Cas9 복합체를 DNA에서 2중-가닥 파괴(DSB) 부위로부터 제거하는 수단은 아직 특징지워지지 않았다. DSB의 HR 복구 이전 또는 복구 과정에서, DSB로부터의 안내 RNA:Cas9 복합체의 격리 또는 분해가 관여되는 것으로 고려된다. 이러한 상황에서, 안내 RNA:Cas9에 결박된 공여체 DNA는 DSB에 편재화되어 머무르지 않거나 분해될 수 있다. HR 사건이 안내 RNA:Cas9 복합체에 대해 무력화되는 것으로 발견되는 상황에서, 2중 안내 RNA 접근법은, 제2 안내 RNA:dCas9(촉매적 비활성) 복합체를 갖고, 제1 안내 RNA:Cas9 복합체의 표적 부근의 DNA 서열에 결합하는 Cas-기반의 HR을 위해 바람직할 수 있다(도 6). 제1 안내 RNA는 어댑터 서열을 함유하지 않고 이러한 안내 RNA:Cas9 복합체는 DSB를 원하는 표적 부위에서 일으키는 작용을 하는 한편, 제2 안내 RNA는 어댑터를 갖고 공여체 DNA에 결박된다. DSB를 수행한 후 제1 안내 RNA:Cas9 복합체의 운명과는 상관없이, (제2) 안내 RNA:공여체 DNA:dCas9 복합체는 DNA 복구 이전 및 복구 동안 DSB의 근처에 유지되어, HR 경로에 대한 복구를 편향시키는 편재화된 공여체 폴리뉴클레오티드를 제공한다.
2중 안내 RNA의 DNA 표적 서열 사이의 오프셋(654)의 거리 또는 길이(염기 쌍으로)는, 표적들이 서로의 작용성 또는 HR 사건에 간섭하지 않도록 충분히 떨어지는 한편, DSB가 제1 안내 RNA:Cas9 복합체에 의해 표적 부위에서 이루어질 경우, 오프셋 표적에서 결박된 공여체 DNA는 HR 주형으로서 효과적으로 사용될 수 있도록 충분히 가깝게 선택되어야 한다. 적절한 오프셋 거리는 짝형성된 틈내기효소에 대한 오프셋 범위를 평가하는 공개된 연구에 대한 정보에 의해 선택되고, 이는 유사하게 표적 DNA 서열 상의 매우 가까운 위치에서 2중 sgRNA:Cas9 작용을 독립적으로 필요로 한다[예를 들어, 말리(Mali) 등의 문헌 "표적 특이성 선별을 위한 Cas9 전사 활성화제 및 협동적 게놈 조작을 위한 짝형성된 틈내기효소(Cas9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering). Nature Biotechnology 31, 833-838(2013)"; 란(Ran) 등의 문헌 "향상된 게놈 편집 특이성을 위해 RNA-안내된 CRISPR Cas9에 의한 2중 틈내기(Double nicking by RNA-Guided CRISPR Cas9 for Enhanced Genome Editing Specificity). Cell, 154(6), 1380-1389 (2013)" 참조].
예를 들어, 오프셋은 적어도 -8 bp 내지 100 bp, 다르게는 -4 bp 내지 20 bp, 다르게는 0 bp 내지 12 bp의 범위일 수 있다. 특정한 실시태양에서, 오프셋은 적어도 -8 bp, 적어도 -6 bp, 또는 적어도 -4 bp, 또는 적어도 -2 bp, 또는 적어도 0 bp, 또는 적어도 2 bp, 또는 적어도 4 bp이다. 특정한 실시태양에서, 오프셋은 많아야 100 bp, 또는 많아야 60 bp, 또는 많아야 40 bp, 또는 많아야 30 bp, 또는 많아야 20 bp, 또는 많아야 18 bp, 또는 많아야 16 bp, 또는 많아야 14 bp, 또는 많아야 12 bp, 또는 많아야 10 bp, 또는 많아야 8 bp이다. 전술된 임의의 최소값 및 최대값은 조합되어 일정 범위를 형성할 수 있다. 음성 오프셋은 안내 서열이 많은 염기 쌍에 의해 중첩됨을 의미하고; -4의 오프셋은, 제2 안내 서열에 의해 결합된 상보성 서열에서 뉴클레오티드와 염기-짝형성된 표적 폴리뉴클레오티드의 제1 가닥에서 4개의 뉴클레오티드에 제1 안내 서열이 결합함을 나타낸다.
이러한 전략은 안내 RNA:공여체 DNA가 dCas9와 착화되는 한편 절단-표적화 안내 RNA가 촉매적 활성 Cas9 단백질과 착화됨을 필요로 한다. 이를 확보하기 위해, 하나의 가능성은 직교 Cas9 단백질을 이용하는 것이고[에스벨트(Esvelt) 등의 문헌 "RNA-안내된 유전자 조절 및 편집을 위한 직교 Cas9 단백질(Orthogonal Cas9 proteins for RNA-guided gene regulation and editing). Nat Methods. 2013 Nov; 10(11): 1116-21 (2013)"], 이는 원하는 안내 RNA를 특이적으로 적재하는 플라스미드, mRNA 또는 단백질로서 세포에 도입될 수 있다. 다르게는, 각각의 안내 RNA는 세포내로 전달되기 이전에 시험관내에서 개개의 Cas9 단백질과 예비-착화될 수 있고, 이러한 방식으로 안내 RNA:공여체 DNA가 dCas9내로 적재되는 것을 확보한다. 마지막으로, 몇몇 경우에, 안내 RNA 표적 둘 다가 HR 주형에 의해 커버되는 서열내에 존재한다면, 절단부중 하나는 HR에 의해 복구되어야 하고, 줄기 세포 유전자 편집에서 관찰되는 바와 같이, 절단부 둘 다는 사실 HR을 증가시킬 수 있다[만델(Mandal) 등의 문헌 "CRISPR/Cas9를 사용하는 인간 조혈 줄기 및 효과자 세포에서의 유전자의 효율적인 절제(Efficient ablation of genes in human hematopoietic stem and effector cells using CRISPR/Cas9). Cell stem Cell. Nov 6;15(5):643-52 (2014)"].
Cas-촉매화된 파괴 부위 근처에 공여체 폴리뉴클레오티드를 편재화시키기 위한 또 다른 2중 안내 RNA 전략은 절단축소된 안내 서열의 사용을 포함한다. 더욱 특별히, 이러한 전략은 표적 폴리뉴클레오티드의 제1 표적 서열을 표적화하고 이에 하이브리드화되는 제1 안내 RNA를 이용한다. 제1 안내 RNA는 촉매적 활성 Cas9 단백질과 복합체를 형성하도록 적응되고, 이로써 촉매적 활성 복합체를 형성한다. 이러한 전략은 또한 표적 폴리뉴클레오티드의 제2 표적 서열을 표적화하고 이에 하이브리드화되는 제2 안내 RNA를 이용하여, 촉매적 활성 Cas9 단백질과 복합체를 형성한다. 그러나, 제2 안내 RNA는 절단축소된 안내 서열을 갖고, Cas9:제2 gRNA 복합체는 촉매적 비활성이다. 제2 안내 RNA의 절단축소된 안내 서열은 14, 15 또는 16개의 뉴클레오티드를 포함한다. 본 발명자들은 이론에 얽매이려는 것은 아니지만, 14, 15 또는 16개의 뉴클레오티드를 갖는 절단축소된 안내 RNA는 Cas 단백질과 복합체를 형성하고, 상보성 표적 서열을 인식하며, 그러한 표적 서열에 결합하는 이의 능력을 보유할 것이지만; Cas 단백질 및 14 nt의 gRNA, 15 nt의 gRNA 또는 16 nt의 gRNA에 의해 형성된 복합체는 절단 또는 틈내기가 거의 또는 전혀 검출되지 않는다는 점에서 실질적으로 표적 서열을 절단 또는 틈내기하지 않을 것으로 생각한다. 푸(Fu) 등의 문헌[Nat. Biotechnol., 32, 279-84 (2014)]에서, CRISPR-Cas9 절단의 특이성에 있어서의 개선은 20-nt의 안내 서열을 그의 5' 말단에서 2개 또는 3개 뉴클레오티드만큼 절단축소하여 절단축소된 안내 RNA(tru-RGN)를 생성함으로써 달성되었다. 표적-이외의 절단 활성은 표적 서열에 상보성인 17 또는 18개의 뉴클레오티드를 갖는 이들 tru-RGN에 의해 감소되었다. 그러나, 5' 말단의 추가적인 절단축소는 일반적으로 표적에 대한 안내 RNA-Cas9 활성을 감소시키고, DNA-짝형성 서열이 15 nt 또는 그 이하로 절단축소될 경우 활성을 배경 수준으로 감소시키고, 16 nt로 절단축소될 경우 검출가능한 활성을 실질적으로 감소시키거나 제거한다. 절단축소된 gRNA의 원하는 길이는 유전자 표적(유기체 및 표적 폴리뉴클레오티드의 성질을 포함함)에 기초하여, 상이한 유기체의 Cas9 단백질에 기초하여, 또는 이들 둘 다에 기초하여 선택될 수 있다.
이러한 2중 gRNA 전략에서, 제2 gRNA는 절단축소된 안내 서열을 포함하는 crRNA 도메인을 5' 말단에서 갖고, Cas9 단백질에 결합하는 tracrRNA 도메인을 3' 말단에서 가지며, 5' 말단 또는 3' 말단에 부착되는 제1 어댑터 분절을 갖는다. 제1 어댑터 분절은 (i) 공여체 폴리뉴클레오티드, (ii) 제2 어댑터 분절, 또는 (iii) 스플린트 분절에 상보성이다. 제1 어댑터 분절은 직접적으로 또는 간접적으로 공여체 폴리뉴클레오티드에 부착될 수 있다. Cas 단백질:제2 안내 RNA 복합체는 제2 표적 서열에 결합하지만 이를 절단시키지 않는다. 제1 표적 서열 및 제2 표적 서열은 상기 기재된 바와 같이 이들 사이에 오프셋을 가질 수 있어서, 제2 gRNA는 공여체 폴리뉴클레오티드를 Cas9:제1 gRNA 복합체에 의해 만들어진 절단 부위의 원하는 근처로 옮기고, 이로써 상동 재조합의 경향을 증가시킨다. 이러한 2중 gRNA 전략의 이점은, 이러한 전략이 직교 Cas9 단백질을 필요로 하지 않을 뿐만 아니라, dCas9 또는 기타 "활성이 없는(dead)" Cas 단백질을 필요로 하지 않고, 하나 보다 더 많은 Cas 단백질을 필요로 하지 않는다는 것이다.
G. 안내 RNA의 합성
특정한 실시태양에서, 단일 안내 RNA(sgRNA; 도 1 및 2B 참조)를 비롯한 안내 RNA는 합성 유기 화학 기술을 사용하여 화학적 합성에 의해 생산된다. 4가지 주된 리보뉴클레오티드, 즉 A, C, G, 및 U 이외의 임의의 뉴클레오티드(비천연적인지 천연적인지와 무관하게, 예컨대 유사우리딘, 이노신 또는 데옥시뉴클레오티드)를 포함하는 안내 RNA는, RNA에서 4가지 주된 리보뉴클레오티드중 임의의 것과 화학적으로/구조적으로 별개인 뉴클레오티드에서 화학적 변형 또는 치환을 갖는다.
본원에 기재된 합성 안내 RNA는 화학적으로 합성될 수 있다. 예를 들어, 합성 안내 RNA는 델링거(Dellinger) 등의 문헌[J. Am. Chem. Soc. 2011, 133, 11540], 미국 특허 제8,202,983호, 및 미국 특허 출원 제2010/0076183A1호에 기재된 방법에 의해 TC 화학을 사용하여 합성될 수 있다. "TC 화학"은, 티오노카바메이트 보호기에 의해 2'-하이드록실 작용기 상에서 보호된 RNA 단량체성 뉴클레오티드 전구체를 사용하여, 변형되지 않은 RNA, 또는 하나 이상의 변형된 뉴클레오티드를 포함하는 변형된 RNA를 합성하는 조성물 및 방법을 지칭한다. TC-RNA 화학을 사용하여 상대적으로 긴(200개 이상의 뉴클레오티드 정도로 긴) RNA를 화학적으로 합성하는 능력은, 4가지 주된 리보뉴클레오티드(A, C, G 및 U)에 의해 가능한 것을 능가할 수 있는 특별한 특징을 갖는 안내 RNA를 생산할 수 있도록 한다. 본원에 기재된 몇몇 합성 안내 RNA는 또한 시험관내 전사 및 세포-기반의 발현을 포함하는 당분야에 공지된 방법을 사용하여 제조될 수 있다. 예를 들어, 2'-플루오로 NTP는 세포-기반의 발현에 의해 생산된 합성 안내 RNA내로 혼입될 수 있다.
안내 RNA의 합성은 후속적으로 효소에 의해 함께 결찰되거나, 화학적 결찰에 의해, 예컨대 제한되지 않지만, 브롬화 시아노겐 화학, 쿠마(R. Kumar) 등의 문헌[Journal of the American Chemical Society, 2007, 129, 6859-6864]에 공개된 "클릭(click)" 화학, 또는 "올리고뉴클레오티드를 컨주게이션하기 위한 조성물 및 방법(Compositions and methods for conjugating oligonucleotides)"이라는 명칭의 힐(K. Hill)의 국제 특허출원 공개공보 제WO2013/176844호에 기재된 바와 같은 스쿠아레이트(squarate) 컨주게이션 화학에 의해 화학적으로 결찰된 RNA 서열의 화학적 또는 효소적 합성에 의해 달성된다.
아래에 추가로 기재되는 바와 같이, 본원에 개시된 안내 RNA, 예컨대 변형된 뉴클레오티드 및/또는 변형된 뉴클레오티드 사이의 연결기를 갖는 어댑터 분절을 포함하는 안내 RNA는, 다양한 CRISPR-중재된 작용(예컨대, 제한되지 않지만 유전자 편집, 유전자 발현 조절, 표적 서열 절단, 및 표적 서열로의 결합)을 시험관내 또는 생체내에서, 예컨대 무세포 검정에서, 온전한 세포에서, 또는 전체 유기체에서 수행하기 위해 사용될 수 있다. 시험관내 또는 생체내 적용을 위해, RNA는 당분야에 공지된 임의의 방식으로 세포 또는 전체 유기체내로 전달될 수 있다.
H. 안내 RNA의 라이브러리(library)
하나의 양태에서, 본 발명은 어댑터 분절을 갖는 다수의 안내 RNA의 집합 또는 라이브러리를 제공한다. 특정한 실시태양에서, 라이브러리는 본원에 개시된 둘 이상의 안내 RNA를 함유한다. 라이브러리는 약 10 내지 약 107개의 개별 구성원, 예를 들어, 약 10 내지 약 102, 약 102 내지 약 103, 약 103 내지 약 105, 약 105 내지 약 107개의 구성원을 함유할 수 있다. 라이브러리의 개별적 구성원은 적어도 안내 서열에서, 즉, gRNA DNA 표적화 분절에서 라이브러리의 다른 구성원과 상이하다. 한편, 특정한 실시태양에서, 라이브러리의 각각의 개별적 구성원은 tracrRNA 분절 및/또는 어댑터 분절에 대해 라이브러리의 모든 다른 구성원과 동일하거나 실질적으로 동일한 뉴클레오티드 서열을 함유할 수 있다. 이러한 방식으로, 라이브러리는 상이한 폴리뉴클레오티드 또는 하나 이상의 폴리뉴클레오티드중의 상이한 서열을 표적화하는 구성원들을 포함할 수 있다.
특정한 실시태양에서, 라이브러리는 적어도 102개의 특유의 안내 서열을 포함한다. 특정한 실시태양에서, 라이브러리는 적어도 103개의 특유의 안내 서열을 포함한다. 특정한 실시태양에서, 라이브러리는 적어도 104개의 특유의 안내 서열을 포함한다. 특정한 실시태양에서, 라이브러리는 적어도 105개의 특유의 안내 서열을 포함한다. 특정한 실시태양에서, 라이브러리는 적어도 106개의 특유의 안내 서열을 포함한다. 특정한 실시태양에서, 라이브러리는 적어도 107개의 특유의 안내 서열을 포함한다. 특정한 실시태양에서, 라이브러리 표적은 적어도 10개의 상이한 폴리뉴클레오티드를 표적화한다. 특정한 실시태양에서, 라이브러리는 적어도 102개의 상이한 폴리뉴클레오티드를 표적화한다. 특정한 실시태양에서, 라이브러리는 적어도 103개의 상이한 폴리뉴클레오티드를 표적화한다. 특정한 실시태양에서, 라이브러리는 적어도 104개의 상이한 폴리뉴클레오티드를 표적화한다. 특정한 실시태양에서, 라이브러리는 적어도 105개의 상이한 폴리뉴클레오티드를 표적화한다. 특정한 실시태양에서, 라이브러리는 적어도 106개의 상이한 폴리뉴클레오티드를 표적화한다. 특정한 실시태양에서, 라이브러리는 적어도 107개의 상이한 폴리뉴클레오티드를 표적화한다.
특정한 실시태양에서, 라이브러리는 고-처리량의 다중-표적 게놈 조작 및 분석을 수행할 수 있도록 허용한다. 특정한 실시태양에서, 안내 RNA의 DNA-표적화 분절만이 달라지고, Cas 단백질-결합 분절은 동일하다. 특정한 실시태양에서, 라이브러리의 제1 부분은 특별한 Cas 단백질을 인식하고, 이에 결합하고, 이를 지시하는 Cas-결합 분절을 갖는 안내 RNA를 포함하고, 라이브러리의 제2 부분은 상이한 Cas 단백질(예를 들어, 상이한 종으로부터의 Cas 단백질)을 인식하고, 이에 결합하고, 이를 지시하는 상이한 Cas-결합 분절을 포함함으로써, 라이브러리가 둘 이상의 직교 Cas 단백질과 작용할 수 있도록 허용한다. 특정한 실시태양에서, 제1 직교 Cas 단백질의 유도된 발현은 제1 직교 Cas 단백질과 상호작용하는 라이브러리의 부분을 이용한다. 특정한 실시태양에서, 제1 및 제2 직교 Cas 단백질의 유도된 발현은 각각 제1 및 제2 직교 Cas 단백질과 상호작용하는 라이브러리의 부분을 이용한다. 특정한 실시태양에서, 제1 및 제2 직교 Cas 단백질의 유도된 발현은 상이한 시간에 발생한다. 따라서, 라이브러리에서 특정화된 바와 같이 다수의 표적을 특이적으로 조작하거나 변형시킴으로써 대규모의 유전자 편집 또는 유전자 조절을 수행할 수 있다.
IV. Cas 단백질
상기 언급된 바와 같이, 작용성 CRISPR-Cas 시스템은 또한 원하는 활성, 예컨대 표적 결합 또는 표적 틈내기/절단을 제공하는 단백질 성분(예를 들어, Cas 단백질, 이는 Cas 뉴클레아제일 수 있음)을 필요로 한다. 특정한 실시태양에서, 원하는 활성은 표적 결합이다. 특정한 실시태양에서, 원하는 활성은 표적 틈내기 또는 표적 절단이다. Cas 단백질은 정제되거나 정제되지 않은 (i) Cas 단백질 또는 (ii) Cas 단백질의 발현을 위해 인코딩되는 mRNA 또는 (iii) 단백질의 발현을 위해 인코딩되는 선형 또는 환형 DNA로서 시험관내 또는 생체내 시스템내로 도입될 수 있다. Cas 단백질을 제공하는 임의의 이들 3가지 방법은 당분야에 잘 공지되어 있고, Cas 단백질 또는 Cas 단백질의 사용이 본원에 언급되는 경우 상호교환적으로 암시된다. 특정한 실시태양에서, Cas 단백질은 mRNA 또는 DNA로부터 구성적으로 발현된다. 특정한 실시태양에서, mRNA 또는 DNA로부터의 Cas 단백질의 발현은 유도가능하거나 유도된다.
특정한 실시태양에서, Cas 단백질은 화학적으로 합성되거나[예를 들어, 크레이턴(Creighton)의 문헌 "단백질: 구조 및 분자 원리(Proteins: Structures and Molecular Principles) W.H. Freeman & Co., NY, 1983" 참조], 또는 본원에 기재된 바와 같이 재조합 DNA 기술에 의해 생산된다. 추가적인 안내를 위해, 숙련가는 프레더릭(Frederick M.), 어수벨(Ausubel) 등의 문헌[Current Protocols in Molecular Biology, John Wiley & Sons, 2003]; 및 샘브룩(Sambrook) 등의 문헌[Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Press, Cold Spring Harbor, NY, 2001]을 찾아볼 수 있다.
특정한 실시태양에서, Cas 단백질은 정제되거나 단리된 형태로 제공된다. 특정한 실시태양에서, Cas 단백질은 약 80%, 약 90%, 약 95%, 또는 약 99% 순도로 제공된다. 특정한 실시태양에서, Cas 단백질은 조성물의 일부로서 제공된다. 특정한 실시태양에서, Cas 단백질은 RNA-안내된 뉴클레아제 반응을 위한 조성물로서 사용하거나 이에 포함되기에 적합한 수성 조성물로 제공된다. 당분야의 숙련가라면 이러한 뉴클레아제 반응 조성물에 포함될 수 있는 다양한 물질들을 잘 알 것이다.
특정한 실시태양에서, Cas 단백질은 재조합 폴리펩티드로서 제공된다. 특정한 예에서, 재조합 폴리펩티드는 융합 단백질로서 제조된다. 예를 들어, 특정한 실시태양에서, Cas 단백질을 인코딩하는 핵산은 융합 파트너, 예를 들어, 글루타티온-s-전달효소(GST: glutathione-s-transferase), 6x-His 에피토프 태그(epitope tag), 또는 M13 유전자 3 단백질을 인코딩하는 또 다른 핵산에 연결된다. 적합한 숙주 세포는 융합 단백질을 발현하기 위해 사용될 수 있다. 특정한 실시태양에서, 융합 단백질은 당분야에 공지된 방법에 의해 단리된다. 특정한 실시태양에서, 융합 단백질은 추가로, 예를 들어, 효소적 소화에 의해 처리되어, 융합 파트너를 제거하고 Cas 단백질을 수득한다. 다르게는, Cas 단백질:안내 RNA 복합체는 당분야에 공지된 숙주 세포 시스템 또는 시험관내 번역-전사 시스템을 사용하여 재조합 기술에 의해 제조될 수 있다. 이러한 시스템 및 기술에 대한 세부사항은, 예를 들어, 국제 특허출원 공개공보 제WO2014/144761호, 제WO2014/144592호, 제WO2013/176772호, US 제2014/0273226호, 및 US 제2014/0273233호에서 찾아볼 있다.
A. 야생형 Cas 단백질
특정한 실시태양에서, Cas 단백질은 RNA-유래된 폴리뉴클레오티드-결합 또는 뉴클레아제 활성을 갖는, CRISPR-Cas 유형 I, 유형 II, 또는 유형 III 시스템의 단백질 또는 이로부터 유래된 단백질을 포함한다. 적합한 Cas 단백질의 비제한적 예로는 Cas3, Cas4, Cas5, Cas5e(또는 CasD), Cas6, Cas6e, Cas6f, Cas7, Cas8a1, Cas8a2, Cas8b, Cas8c, Cas9, Cas10, Cas10d, CasF, CasG, CasH, Csy1, Csy2, Csy3, Cse1(또는 CasA), Cse2(또는 CasB), Cse3(또는 CasE), Cse4(또는 CasC), Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csz1, Csx15, Csf1, Csf2, Csf3, Csf4, 및 Cu1966이 포함된다. 예를 들어, 국제 특허출원 공개공보 제WO2014/144761호, 제WO2014/144592호, 제WO2013/176772호, US 제2014/0273226호, 및 US 제2014/0273233호를 참조한다.
특정한 실시태양에서, Cas 단백질은 유형 II CRISPR-Cas 시스템으로부터 유래된다. 특정한 실시태양에서, Cas 단백질은 Cas9 단백질이거나 이로부터 유래된다. 특정한 실시태양에서, Cas 단백질은 박테리아성 Cas9 단백질(예컨대, 국제 특허출원 공개공보 제WO2014/144761호에서 식별된 단백질)이거나 이로부터 유래된다. 특정한 실시태양에서, Cas 단백질은 스트렙토코쿠스 종 또는 스타필로코쿠스 종 Cas9 단백질이거나 이로부터 유래된다. 특정한 실시태양에서, Cas 단백질은 스트렙토코쿠스 써모필루스 Cas9 단백질이거나 이로부터 유래된다. 특정한 실시태양에서, Cas 단백질은 스트렙토코쿠스 파이오게네스 Cas9 단백질이거나 이로부터 유래된다. 특정한 실시태양에서, Cas 단백질은 스타필로코쿠스 아우레우스 Cas9 단백질이거나 이로부터 유래된다. 특정한 실시태양에서, Cas 단백질은 스트렙토코쿠스 써모필루스 Cas9 단백질이거나 이로부터 유래된다.
특정한 실시태양에서, 야생형 Cas 단백질은 Cas9 p이다. 특정한 실시태양에서, 야생형 Cas9 단백질은 스트렙토코쿠스 파이오게네스로부터의 Cas9 단백질(서열번호 1)이다. 특정한 실시태양에서, 단백질 또는 폴리펩티드는 서열번호 1의 단편을 포함하거나, 이로 구성되거나, 이로 본질적으로 구성될 수 있다.
일반적으로, Cas 단백질은 안내 RNA와 상호작용하는 적어도 하나의 RNA 결합 도메인을 포함한다. 특정한 실시태양에서, Cas 단백질은 핵산 결합 친화도 및/또는 특이성을 증가시키고, 효소 활성을 변경시키고/시키거나, 단백질의 또 다른 특성을 바꾸기 위해 변형된다. 예를 들어, Cas 단백질의 뉴클레아제(즉, DNase, RNase) 도메인은 변형되거나, 돌연변이되거나, 결실되거나, 비활성화될 수 있다. 다르게는, Cas 단백질은 단백질의 작용을 위해 필수적이지 않은 도메인을 제거하기 위해 절단축소될 수 있다. 특정한 실시태양에서, Cas 단백질은 절단축소되거나 변형되어 효과자 도메인의 활성을 최적화한다. 특정한 실시태양에서, Cas 단백질은 핵 편재화 서열(NLS: nuclear localization sequence)-태깅된(tagged) Cas 단백질을 생 세포의 핵내로 유입시키는데 영향을 주는 NLS를 포함한다. 특정한 실시태양에서, Cas 단백질은 둘 이상의 변형을 포함한다.
B. 돌연변이체 Cas 단백질
몇몇 실시태양에서, CRISPR 단백질은 야생형 CRISPR 단백질(예컨대 Cas9) 또는 이의 단편의 돌연변이체일 수 있다. Cas9의 공지된 돌연변이체의 예로는 Cas9 틈내기효소, 예컨대 Cas9-D10A, 절단-불활성화된 dCas9, 변경된 PAM 특이성을 갖는 Cas9 돌연변이체, 예컨대 클라인스티버(Kleinstiver) 등의 문헌["변경된 PAM 특이성을 갖는 조작된 CRISPR-Cas9 뉴클레아제(Engineered CRISPR-Cas9 nucleases with altered PAM specificities)", Nature 523, 481-485 (2015)]에 개시된 돌연변이체(예를 들어, D1135E SpCas9), 스타필로코쿠스 아우레우스로부터의 Cas9 돌연변이체(SaCas9), 예컨대 란(Ran) 등의 문헌["스타필로코쿠스 아우레우스 Cas9를 사용한 생체내 게놈 편집(In vivo genome editing using Staphylococcus aureus Cas9)", Nature 520, 186-191 (2015)]에 개시된 돌연변이체가 포함된다. 다른 실시태양에서, CRISPR 단백질은 돌연변이 CRISPR 단백질로부터 유래될 수 있다. 예를 들어, Cas9 단백질의 아미노산 서열은 단백질의 하나 이상의 특성(예를 들어, 뉴클레아제 활성, 친화도, 안정성 등)을 변경시키기 위해 변형될 수 있다. 다르게는, RNA-안내된 절단에 관여되지 않는 Cas9 단백질의 도메인은, 변형된 Cas9 단백질이 야생형 Cas9 단백질에 비해 더 작도록 단백질로부터 제거될 수 있다. 몇몇 실시태양에서, 본 발명의 시스템은 박테리아에서 인코딩되거나 포유동물 세포에서의 발현을 위해 코돈-최적화될 경우, 스트렙토코쿠스 파이오게네스로부터의 Cas9 단백질을 이용한다. 때때로 (SpCas9)로서 지칭되는, 야생형 스트렙토코쿠스 파이오게네스 Cas9 단백질 서열(서열번호 1)의 아미노산 서열이 아래에 제시된다.
Figure pct00001
Cas9 단백질은 일반적으로 적어도 2개의 뉴클레아제(예를 들어, DNase) 도메인을 갖는다. 예를 들어, Cas9 단백질은 RuvC-유사 뉴클레아제 도메인 및 HNH-유사 뉴클레아제 도메인을 가질 수 있다. RuvC 및 HNH 도메인은 함께 작용하여 표적 부위에서 가닥 둘 다를 절단함으로써 표적 폴리뉴클레오티드에서 2중-가닥 파괴를 일으킨다[지넥(Jinek) 등의 문헌 "Science, 337: 816-821"]. 특정한 실시태양에서, 돌연변이체 Cas9 단백질은 단지 1개의 작용성 뉴클레아제 도메인(RuvC-유사 또는 HNH-유사 뉴클레아제 도메인)을 함유하도록 변형된다. 예를 들어, 특정한 실시태양에서, 돌연변이체 Cas9 단백질은 뉴클레아제 도메인중 하나가 결실되거나 돌연변이되어 이것이 더 이상 작용성이 아니도록(즉, 뉴클레아제 활성이 존재하지 않도록) 변형된다. 뉴클레아제 도메인중 하나가 비활성인 몇몇 실시태양에서, 돌연변이체는 2중-가닥 폴리뉴클레오티드내로 틈(nick)을 도입할 수 있지만(이러한 단백질은 "틈내기효소"로서 지칭됨), 2중-가닥 폴리뉴클레오티드를 절단시키지는 못한다. 예를 들어, RuvC-유사 도메인에서의 아스파테이트의 알라닌(D10A)으로의 전환은 Cas9-유래된 단백질을 틈내기효소로 전환시킨다. 마찬가지로, HNH 도메인에서의 히스티딘의 알라닌(H840A)으로의 전환은 Cas9-유래된 단백질을 틈내기효소로 전환시킨다. 마찬가지로, HNH 도메인에서의 아스파라긴의 알라닌(N863A)으로의 전환은 Cas9-유래된 단백질을 틈내기효소로 전환시킨다.
특정한 실시태양에서, RuvC-유사 뉴클레아제 도메인 및 HNH-유사 뉴클레아제 도메인 둘 다는, 돌연변이체 Cas9 단백질이 표적 폴리뉴클레오티드를 틈내기하거나 절단시킬 수 없도록 변형되거나 제거된다. 특정한 실시태양에서, Cas9-유래된 단백질의 모든 뉴클레아제 도메인은 Cas9-유래된 단백질이 모든 뉴클레아제 활성을 결핍하도록 변형되거나 제거된다. 특정한 실시태양에서, 야생형 대응물에 비하여 일부 또는 모든 뉴클레아제 활성이 결핍된 Cas9 단백질은, 그럼에도 불구하고, 표적 인식 활성을 더 크거나 더 적은 정도로 유지한다.
촉매적 비활성 Cas9 단백질은 "dCas9" 단백질(뉴클레아제의 경우 "활성이 없는" Cas9)로서 상호교환적으로 지칭될 수 있다. 몇몇 실시태양에서, Cas9 돌연변이체 D10A 및 H840A에 상응하거나 이의 일부 또는 전부를 포함하는 dCas9가 제공되고, 이는 예를 들어, 뉴클레아제 비활성화된 Cas9(dCas9)를 생성한다. 이러한 돌연변이는, 예로서, D10 및 H840에서의 다른 아미노산 치환, 또는 Cas9의 뉴클레아제 도메인내에서의 다른 치환(예를 들어, HNH 뉴클레아제 부속도메인 및/또는 RuvC1 부속도메인에서의 치환)을 포함한다. 몇몇 실시태양에서, dCas9의 변이체 또는 상동체(예를 들어, 서열번호 5의 변이체)가 제공되고, 이는 서열번호 5에 대하여 적어도 약 70% 동일하거나, 적어도 약 80% 동일하거나, 적어도 약 90% 동일하거나, 적어도 약 95% 동일하거나, 적어도 약 98% 동일하거나, 적어도 약 99% 동일하거나, 적어도 약 99.5% 동일하거나, 적어도 약 99.9% 동일하다. 몇몇 실시태양에서, 약 5개의 아미노산, 약 10개의 아미노산, 약 15개의 아미노산, 약 20개의 아미노산, 약 25개의 아미노산, 약 30개의 아미노산, 약 40개의 아미노산, 약 50개의 아미노산, 약 75개의 아미노산, 약 100개의 아미노산 또는 그 이상으로 서열번호 5에 비해 더 짧거나 더 긴 아미노산을 갖는 dCas9의 변이체(예를 들어, 서열번호 5의 변이체)가 제공된다.
본 발명의 조성물 및 방법은, 스트렙토코쿠스 파이오게네스 Cas9 이외의 CRISPR 단백질, 예를 들어 박테리아 또는 고세균(archaea)으로부터의 다른 Cas 단백질 뿐만 아니라 DNA의 단일 가닥을 틈내기하거나 뉴클레아제 활성을 갖지 않는 Cas9 변이체, 예컨대 뉴클레아제 도메인중 하나 또는 둘 다에서 촉매-비활성화 돌연변이를 함유하는 전술된 절단-불활성화된 Cas9를 갖고 사용될 수 있다. 이러한 방법은 단일 안내 RNA를 이용하는 시스템 뿐만 아니라 2중 RNA(예를 들어, 천연 발생 시스템에서 발견되는 crRNA 및 tracrRNA)를 사용하는 시스템에 적용될 수 있다.
상기 기재된 임의의 실시태양에서, 임의의 또는 모든 뉴클레아제 도메인은 하나 이상의 결실 돌연변이, 삽입 돌연변이, 및/또는 치환 돌연변이에 의해 공지된 방법, 예컨대 부위-지시된 돌연변이생성, PCR-중재된 돌연변이생성, 및 전체 유전자 합성, 뿐만 아니라 당분야에 공지된 기타 방법을 사용하여 비활성화될 수 있다.
특정한 실시태양에서, "Cas 돌연변이체" 또는 "Cas 변이체"는 서열번호 1에 적어도 50%(예를 들어, 50% 내지 100% 사이의 임의의 수, 예를 들어, 50%, 60%, 70%, 80%, 90%, 95%, 98%, 및 99% 포함) 동일하다. 특정한 실시태양에서, "Cas 돌연변이체" 또는 "Cas 변이체"는 RNA 분자(예를 들어, sgRNA)에 결합한다. 특정한 실시태양에서, "Cas 돌연변이체" 또는 "Cas 변이체"는 특이적 폴리뉴클레오티드 서열에 RNA 분자를 경유하여 표적화된다.
CRISPR/Cas 단백질-안내 RNA 복합체는 당분야에 공지된 숙주 세포 시스템 또는 시험관내 번역-전사 시스템을 사용하여 재조합 기술에 의해 제조될 수 있다. 이러한 시스템 및 기술에 대한 세부사항은, 예를 들어, 국제 특허출원 공개공보 제WO2014/144761호, 제WO2014/144592호, 제WO2013/176772호, US 제2014/0273226호, 및 US 제2014/0273233호에서 찾아볼 수 있다. 복합체는, 적어도 어느 정도, 이들이 생산되는 세포의 세포 물질로부터 또는 시험관내 번역-전사 시스템으로부터 단리되거나 정제될 수 있다.
V. 용도 및 방법
하나의 양태에서, 본 발명은 표적 폴리뉴클레오티드를 Cas 단백질에 의해 절단시키는 방법을 제공한다. 방법은 표적 폴리뉴클레오티드를 (i) 본원에 기재된 안내 RNA 또는 안내 RNA 분자의 집합, 및 (ii) Cas 단백질과 접촉시키는 단계를 포함한다. 특정한 실시태양에서, 방법은 표적 폴리뉴클레오티드에서 2중-가닥 파괴를 초래한다. 특정한 실시태양에서, Cas 단백질은 단일-가닥 틈내기 활성을 갖는 Cas 단백질이다. 특정한 실시태양에서, 방법은 표적 폴리뉴클레오티드에서 단일-가닥 파괴를 초래한다. 특정한 실시태양에서, 단일-가닥 틈내기 활성을 갖는 Cas 단백질 및 안내 RNA를 포함하는 복합체는 서열-표적화된 단일-가닥 DNA 절단, 즉, 틈내기를 위해 사용된다. 몇몇 실시태양에서, 방법은 표적 폴리뉴클레오티드를 2개의 Cas 단백질과 접촉시키는 단계를 포함하고; 이들 실시태양중 몇몇에서, 2개의 Cas 단백질은 각각 단일 가닥 틈내기 활성을 갖는다.
하나의 양태에서, 본 발명은 둘 이상의 표적 폴리뉴클레오티드를 Cas 단백질과 결합시키는 방법을 제공한다. 방법은 표적 폴리뉴클레오티드를 (i) 본원에 기재된 RNA 분자의 집합 및 (ii) Cas 단백질과 접촉시키는 단계를 포함하여, Cas 단백질과 표적 폴리뉴클레오티드의 결합을 초래한다. 특정한 실시태양에서, 방법은 2가지 Cas 단백질을 포함하고, 여기서 Cas 단백질중 하나는 대응 야생형 Cas 단백질에 비해 일부 또는 전체 뉴클레아제 활성이 결핍된 Cas 변이체이고 나머지 Cas 단백질은 2중-가닥 절단 활성을 갖는다.
하나의 양태에서, 본 발명은 Cas 단백질을 표적 폴리뉴클레오티드에 표적화시키는 방법을 제공한다. 방법은 Cas 단백질을 본원에 기재된 안내 RNA 또는 안내 RNA 분자의 집합과 접촉시키는 단계를 포함한다. 특정한 실시태양에서, 방법은 안내 RNA:Cas 단백질 복합체의 형성을 초래한다. 특정한 실시태양에서, Cas 단백질은 야생형 Cas9 단백질이다. 특정한 실시태양에서, Cas 단백질은 Cas9 단백질의 돌연변이체 또는 변이체이다. 특정한 실시태양에서, Cas 단백질은 단일-가닥 틈내기 활성을 갖는 Cas 단백질이다. 특정한 실시태양에서, Cas 단백질은 뉴클레아제 활성이 결핍된 Cas 단백질(예를 들어, Cas 단백질의 뉴클레아제-결손 돌연변이체)이다. 특정한 실시태양에서, Cas 단백질은 융합 단백질(예를 들어, (i) Cas 단백질 또는 및 (ii) 이종성 폴리펩티드를 포함하는 융합 단백질)의 일부이다.
하나의 양태에서, 본 발명은 Cas 단백질을 둘 이상의 표적 폴리뉴클레오티드에 표적화시키는 방법을 제공한다. 방법은 Cas 단백질을 본원에 기재된 안내 RNA 분자의 집합과 접촉시키는 단계를 포함한다. 특정한 실시태양에서, 방법은 안내 RNA:Cas 단백질 복합체의 형성을 초래한다. 특정한 실시태양에서, Cas 단백질은 야생형 Cas9 단백질이다. 특정한 실시태양에서, Cas 단백질은 Cas9 단백질의 돌연변이체 또는 변이체이다. 특정한 실시태양에서, Cas 단백질은 단일-가닥 틈내기 활성을 갖는 Cas 단백질이다. 특정한 실시태양에서, Cas 단백질은 뉴클레아제 활성이 결핍된 Cas 단백질(예를 들어, Cas 단백질의 뉴클레아제-결손 돌연변이체)이다. 특정한 실시태양에서, Cas 단백질은 융합 단백질(예를 들어, (i) Cas 단백질 또는 및 (ii) 이종성 폴리펩티드를 포함하는 융합 단백질)의 일부이다.
특정한 실시태양에서, 안내 RNA는 형질감염에 의해 세포내로 도입된다. RNA 형질감염을 위한 기법은 당분야에 공지되어 있고 전기천공법 및 리포펙션(lipofection)을 포함한다. RNA 형질감염을 위한 효과적인 기법은 주로 세포 유형에 의존한다. 예를 들어, HTC-116 결장 암 세포의 형질감염을 기재하고 상업적으로 입수된, 변형된 miRNA 또는 전구체 miRNA의 형질감염을 위해 올리고펙타민(Oligofectamine)[인비트로겐(Invitrogen)]을 사용하는, 루잠비오(Lujambio) 등(스페인 국립 암 센터)의 문헌[Cancer Res. Feb. 2007]을 참조한다. 또한, K562 세포의 형질감염을 기재하고 전사된 sgRNA(약 60 nt의 길이)의 형질감염을 위해 4D 뉴클레오펙션(Nucleofection)(상표명)[론자(Lonza)]을 사용하는, 조(Cho) 등(서울대학교)의 문헌[Nat. Biotechnol. Mar. 2013]을 참조한다. RNA의 형질감염을 위한 기법은 또한 당분야에 기재되어 있다. 예를 들어, 치료학적 RNA는 인바신(Invasin) 단백질로 코팅된(β-1 인테그린 단백질을 발현하는 세포내로의 섭취를 용이하게 하기 위해) 비-병원성 이. 콜라이(E. coli)에 전달되었고, 이러한 이. 콜라이는, shRNA가 이. 콜라이로부터 세포질내로 통과할 수 있도록 허용하기 위해 리스테리오라이신(lysteriolysin) O 기공-형성 단백질을 발현하도록 인코딩된다. 또한 조(Cho) 등(서울대학교)의 문헌[Nat. Biotechnol. Mar. 2013]을 참조한다.
특정한 실시태양에서, 안내 RNA는 세포내로 도입되거나 전달된다. 안내 RNA의 전달을 위해 사용될 수 있는 기술은, 생물분해성 중합체, 리포솜(liposome), 또는 나노입자에 의한 캡슐화(encapsulation)를 이용하는 기술을 포함한다. 이러한 중합체, 리포솜, 및 나노입자는 정맥내로 전달될 수 있다. 특정한 실시태양에서, 생체내 전달을 위해, 안내 RNA는 조직 부위내로 주사되거나 전신적으로 투여될 수 있다. 생체내 전달은 또한 베타-글루칸 전달 시스템, 예컨대 미국 특허 제5,032,401호 및 제5,607,677호, 및 미국 공고 번호 제2005/0281781호에 기재된 시스템에 의해서일 수 있다. 특정한 실시태양에서, 안내 RNA 또는 안내 RNA를 함유한 전달 비히클은 특별한 조직 또는 신체 구획에 표적화된다. 예를 들어, 특정한 실시태양에서, 외래성 RNA를 다른 조직에 표적화시키기 위해, 합성 담체에는 세포-특이적 리간드 또는 수용기 섭취를 위한 압타머가 부가되고, 예를 들어, RNA는 사이클로덱스트린 나노입자 코팅된 w/PEG내에 넣어지고, 종양 세포에서 고도로 발현되는 트랜스페린(transferrin) 수용기를 경유하여 섭취를 위해 인간 트렌스페린 단백질에 의해 작용화된다. 추가의 접근법은 이후 본원에 기재되거나 당분야에 공지되어 있다.
특정한 실시태양에서, 상기 기재된 방법 및 조성물은 세포, 배아 또는 동물에서 염색체 서열을 변형시키기 위해 사용될 수 있다. 방법은 (a) 하나 이상의 RNA-안내된 엔도뉴클레아제 또는 RNA-안내된 엔도뉴클레아제를 인코딩하는 핵산 및 (b) 하나 이상의 안내 RNA 또는 안내 RNA를 인코딩하는 DNA를 세포 또는 배아와 접촉시키거나 이에 도입하는 단계를 포함하고, 여기서 안내 RNA는 염색체 서열중의 표적화된 부위로 엔도뉴클레아제를 이끌고, RNA-안내된 엔도뉴클레아제는 표적화된 부위에서 염색체 서열의 적어도 하나의 가닥을 절단시킨다. 표적 부위는 돌연변이, 예를 들어, 점 돌연변이, 전위(translocation) 또는 역위(inversion)(이는 질병을 일으키거나 이와 연관됨)를 함유하거나 이에 인접할 수 있다. 이러한 돌연변이를 교정하기 위해, 몇몇 실시태양에서, 방법은 염색체 서열에서 표적화된 부위의 한쪽 측부 상의 서열과 실질적인 서열 동일성을 갖는 적어도 하나의 서열 및 돌연변이의 야생형 대응물을 포함하는 적어도 하나의 공여체 폴리뉴클레오티드를 세포 또는 배아와 접촉시키거나 이로 도입하는 단계를 추가로 포함한다.
특정한 실시태양에서, 상기 기재된 방법 및 조성물은 포유동물 세포, 예컨대 제한되지 않지만, 1차 세포, 줄기 세포, 불멸화된 세포(immortalized cell), 및 조건적으로 불멸화된 세포를 변형시키기 위해 사용될 수 있다. 본 발명의 방법 및 안내 RNA를 위해 적합한 세포의 표현형은 연골세포, 당뇨병 세포, 상피 세포, 섬유아세포, 위장관세포, 조혈 줄기/전구 및 면역 세포, 간세포, 각질세포, 멜라닌세포, 신경 세포, 전구 세포, 신장 세포, 근골격 세포, 평활근 세포, 세르톨리(sertoli) 세포, 및 기타 세포이다.
A. 게놈 편집
하나의 양태에서, 본 발명은 DNA 서열을 생체내 또는 시험관내에서 변형시키는 게놈 편집을 위한 방법을 제공한다("시험관내"는, 제한없이, 무세포 시스템, 세포 용해물, 세포의 단리된 성분, 및 살아있는 유기체 밖의 세포를 포함한다). DNA 서열은 염색체 서열, 에피솜(episomal) 서열, 플라스미드, 미토콘드리아 DNA 서열, 또는 작용성 유전자 사이의 서열, 예컨대 인헨서(enhancer) 서열 또는 비-코딩 RNA를 포함할 수 있다. 방법은 DNA 서열을 (i) 본원에 기재된 안내 RNA 또는 안내 RNA 분자의 집합, 및 (ii) Cas 단백질과 접촉시키는 단계를 포함한다. 특정한 실시태양에서, DNA 서열은 세포의 밖에서 접촉된다. 특정한 실시태양에서, DNA 서열은 세포내의 게놈에 위치되고 시험관내 또는 생체내에서 접촉된다. 특정한 실시태양에서, 세포는 유기체 또는 조직내에 존재한다. 특정한 실시태양에서, 세포는 인간 세포, 인간 이외의 포유동물 세포, 줄기 세포, 포유동물 이외의 척추동물 세포, 무척추동물 세포, 식물 세포, 단일 세포 유기체, 또는 배아이다. 특정한 실시태양에서, 안내 RNA는 Cas 단백질이 DNA 서열중의 표적화된 부위로 표적화하는 것을 돕는다. 특정한 실시태양에서, Cas 단백질은 DNA 서열의 적어도 하나의 가닥을 표적화된 부위에서 절단시킨다. 특정한 실시태양에서, Cas 단백질은 DNA 서열의 양쪽 가닥을 표적화된 부위에서 절단시킨다.
특정한 실시태양에서, 방법은 Cas 단백질을 세포 또는 또 다른 시스템내로 도입하는 단계를 포함한다. 특정한 실시태양에서, Cas 단백질은 정제되거나 정제되지 않은 단백질로서 도입된다. 특정한 실시태양에서, Cas 단백질은 Cas 단백질을 인코딩하는 mRNA를 경유하여 도입된다. 특정한 실시태양에서, Cas 단백질은 Cas 단백질을 인코딩하는 선형 또는 환형 DNA를 경유하여 도입된다. 특정한 실시태양에서, 세포 또는 시스템은 Cas 단백질 또는 Cas 단백질을 인코딩하는 핵산을 포함한다.
특정한 실시태양에서, 2중-가닥 파괴는 공여체 폴리뉴클레오티드중의 공여체 폴리뉴클레오티드가 표적화된 DNA 서열내로 통합되거나 이와 교환되도록 상동성-지시된 복구(HDR: homology-directed repair) 과정에 의해 복구될 수 있다.
특정한 실시태양에서, 방법은 적어도 하나의 공여체 폴리뉴클레오티드를 세포 또는 시스템내로 도입하는 단계를 추가로 포함한다. 특정한 실시태양에서, 공여체 폴리뉴클레오티드는 DNA 서열에서 표적화된 부위의 한쪽 측부 상의 서열과 실질적인 서열 동일성을 갖는 적어도 하나의 상동성 서열을 포함한다. 특정한 실시태양에서, 공여체 폴리뉴클레오티드는 상동성-지시된 복구, 예컨대 상동 재조합을 경유하여 DNA 서열내로 통합되거나 이와 교환될 수 있는 공여체 폴리뉴클레오티드를 포함한다.
특정한 실시태양에서, 공여체 폴리뉴클레오티드는 상류 상동성 서열 및 하류 상동성 서열을 포함하고, 이들 각각은 DNA 서열에서 표적화된 부위의 상류 및 하류에 각각 위치된 서열과 실질적인 서열 동일성을 갖는다. 이들 서열 유사성은, 예를 들어, 상동 재조합을 공여체 폴리뉴클레오티드 및 표적화된 DNA 서열 사이에서 허용하여, 공여체 폴리뉴클레오티드는 표적화된 DNA 서열내로 통합(또는 이와 교환)될 수 있다.
특정한 실시태양에서, DNA 서열에서 표적 부위(들)는 질병을 일으키거나 이와 연관된 돌연변이, 예를 들어, 점 돌연변이, 전위 또는 역위를 포괄하거나 이에 인접한다. 특정한 실시태양에서, 방법은 (i) 돌연변이의 야생형 대응물 및 (ii) DNA 서열에서 표적화된 부위의 한쪽 측부 상의 서열과 실질적인 서열 동일성을 갖는 적어도 하나의 상동성 서열을 포함하는 적어도 하나의 공여체 폴리뉴클레오티드를 세포 또는 시스템내로 도입함으로써 돌연변이를 교정하는 단계를 포함한다. 특정한 실시태양에서, 공여체 폴리뉴클레오티드는 DNA 서열에서 표적화된 부위의 양쪽 측부 상의 서열과 실질적인 서열 동일성을 갖는 상동성 서열을 포함한다.
특정한 실시태양에서, 공여체 폴리뉴클레오티드는 상동성-지시된 복구 과정, 예컨대 상동 재조합을 경유하여 표적화된 DNA 서열내로 통합되거나 이와 교환될 수 있는 외래성 서열을 포함한다. 특정한 실시태양에서, 외래성 서열은 단백질 코딩 유전자를 포함하고, 이는, 임의적으로, 외래성 프로모터 제어 서열에 작동적으로 연결된다. 이와 같이, 특정한 실시태양에서, 외래성 서열의 통합시, 세포는 통합된 유전자에 의해 인코딩된 단백질을 발현할 수 있다. 특정한 실시태양에서, 외래성 서열은 표적화된 DNA 서열내로 통합되어, 수여자 세포 또는 시스템에서의 그의 발현이 외래성 프로모터 제어 서열에 의해 조절되게 된다. 표적화된 DNA 서열로의 외래성 유전자의 통합은 "넉-인"으로 지칭된다. 다른 실시태양에서, 외래성 서열은 전사적 제어 서열, 또 다른 발현 제어 서열, RNA 코딩 서열, 또는 또 다른 작용성 서열일 수 있다.
특정한 실시태양에서, 공여체 폴리뉴클레오티드는 표적화된 부위 또는 그 부근의 DNA 서열의 일부와 본질적으로 동일하지만, 적어도 하나의 뉴클레오티드 변화를 포함하는 서열을 포함한다. 예를 들어, 특정한 실시태양에서, 공여체 폴리뉴클레오티드는, 표적화된 부위로의 통합 또는 이와의 교환시, 표적화된 부위에서 생성된 서열이 적어도 하나의 뉴클레오티드 변화를 포함하도록, 표적화된 부위 또는 그 부근의 DNA 서열의 변형되거나 돌연변이된 형태를 포함한다. 특정한 실시태양에서, 적어도 하나의 뉴클레오티드 변화는 하나 이상의 뉴클레오티드의 삽입, 하나 이상의 뉴클레오티드의 결실, 하나 이상의 뉴클레오티드의 치환 또는 이들의 조합이다. 변형된 서열의 통합의 결과로서, 세포는 표적화된 DNA 서열로부터 변형된 유전자 생성물을 생산할 수 있다.
특정한 실시태양에서, 화합물 및 방법은 복합 적용을 위한 것이다. 특정한 실시태양에서, 안내 RNA의 라이브러리가 제공되거나 세포 또는 시스템내로 도입된다. 특정한 실시태양에서, 라이브러리는 적어도 100개의 특유의 안내 서열을 포함한다. 특정한 실시태양에서, 라이브러리는 적어도 1,000개의 특유의 안내 서열을 포함한다. 특정한 실시태양에서, 라이브러리는 적어도 10,000개의 특유의 안내 서열을 포함한다. 특정한 실시태양에서, 라이브러리는 적어도 100,000개의 특유의 안내 서열을 포함한다. 특정한 실시태양에서, 라이브러리는 적어도 1,000,000개의 특유의 안내 서열을 포함한다. 특정한 실시태양에서, 라이브러리는 하나 이상의 폴리뉴클레오티드내에서 적어도 10개의 상이한 폴리뉴클레오티드 또는 적어도 10개의 상이한 서열을 표적화한다. 특정한 실시태양에서, 라이브러리는 하나 이상의 폴리뉴클레오티드내에서 적어도 100개의 상이한 폴리뉴클레오티드 또는 적어도 100개의 상이한 서열을 표적화한다. 특정한 실시태양에서, 라이브러리는 하나 이상의 폴리뉴클레오티드내에서 적어도 1,000개의 상이한 폴리뉴클레오티드 또는 적어도 1,000개의 상이한 서열을 표적화한다. 특정한 실시태양에서, 라이브러리는 하나 이상의 폴리뉴클레오티드내에서 적어도 10,000개의 상이한 폴리뉴클레오티드 또는 적어도 10,000개의 상이한 서열을 표적화한다. 특정한 실시태양에서, 라이브러리는 하나 이상의 폴리뉴클레오티드내에서 적어도 100,000개의 상이한 폴리뉴클레오티드 또는 적어도 100,000개의 상이한 서열을 표적화한다. 특정한 실시태양에서, 라이브러리는 하나 이상의 폴리뉴클레오티드내에서 적어도 1,000,000개의 상이한 폴리뉴클레오티드 또는 적어도 1,000,000개의 상이한 서열을 표적화한다.
특정한 실시태양에서, 화합물 및 방법은 안내 RNA 서열 상의 복수개의 직교 어댑터 분절이 상이한 공여체 폴리뉴클레오티드를 결박하기 위해 사용되는 복합 적용을 위해 제공된다. 각각의 직교 어댑터 분절은 상이한 crRNA를 갖는 안내 RNA의 부분이다. 이는 복수개의 안내 RNA가 특유의 동족(cognate) 공여체 폴리뉴클레오티드에 특이적으로 결합하여, 복수개의 표적 폴리뉴클레오티드를 세포에서 HR을 통해 편집할 수 있도록 한다. 이러한 복합 게놈 편집 접근법의 적용은 효소, 예컨대 키나아제의 작용성 기에서의 동시적인 표적화된 아미노산 치환, 또는 mRNA 이소형(isoform)의 정상 상태 푸울(pool)을 변경시키기 위한 다중 스플라이스(splice) 공여체 또는 수용체 부위의 조작일 수 있다.
VI. 키트
하나의 양태에서, 본 발명은 전술된 방법을 수행하기 위한 시약, 예컨대 gRNA:Cas 단백질 복합체를 생산하고/하거나, 결합을 위해 그의 활성을 지지하거나, 표적 폴리뉴클레오티드를 절단시키는 시약을 함유하는 키트를 제공한다. 특정한 실시태양에서, 하나 이상의 반응 성분들, 예를 들어, 하나 이상의 안내 RNA 및 Cas 단백질은, 본원에 개시된 방법을 위해, 사용가능한 키트의 형태로 공급될 수 있다. 특정한 실시태양에서, 키트는 Cas 단백질 또는 Cas 단백질을 인코딩하는 핵산, 및 본원에 기재된 하나 이상의 안내 RNA, 또는 안내 RNA의 집합 또는 라이브러리를 포함한다. 특정한 실시태양에서, 키트는 공여체 폴리뉴클레오티드를 포함한다. 특정한 실시태양에서, 키트는 하나 이상의 다른 반응 성분을 포함한다. 특정한 실시태양에서, 하나 이상의 반응 성분의 적절한 양은 하나 이상의 용기에 제공되거나 기질 상에 보유된다.
키트의 추가적인 성분의 예로는, 제한되지 않지만, 하나 이상의 상이한 중합효소, 하나 이상의 숙주 세포, 숙주 세포내로 외래 핵산을 도입하기 위한 하나 이상의 시약, 안내 RNA 및/또는 Cas mRNA 또는 단백질의 발현을 검출하거나 표적 핵산의 상태를 입증하기 위한 하나 이상의 시약(예를 들어, 탐침자 또는 PCR 프라이머), 및 완충액, 형질감염 시약 또는 반응을 위한 배양 배지(1x 또는 그 이상 농축된 형태임)가 포함된다. 특정한 실시태양에서, 키트는 하나 이상의 하기 성분을 포함한다: 생화학적 및 물리적 지지체; 종결, 변형 및/또는 분해 시약; 삼투질(osmolyte); 및 반응, 형질감염 및/또는 검출을 위한 장비.
사용된 반응 성분들은 다양한 형태로 제공될 수 있다. 예를 들어, 성분들(예를 들어, 효소, RNA, 탐침자 및/또는 프라이머)은 수용액에 현탁되거나 비이드(bead)에 결합되거나, 냉동-건조되거나 동결건조된 분말 또는 펠릿으로서 제공될 수 있다. 후자의 경우, 재구성될 때 성분들은 검정에 사용하기 위한 성분들의 완전한 혼합물을 형성한다. 본 발명의 키트는 임의의 적합한 온도에서 제공될 수 있다. 예를 들어, 단백질 성분 또는 이의 복합체를 액체중에서 함유하는 키트를 저장하기 위해, 0℃ 미만, 바람직하게는 약 -20℃에서, 가능하게는 글리세롤 또는 기타 적합한 결빙 방지제를 함유하는 냉동-저항성 용액에서 제공되고 유지되는 것이 바람직하다.
키트 또는 시스템은, 적어도 하나의 상동 재조합을 위해 충분한 양으로 본원에 기재된 성분들의 임의의 조합을 포함할 수 있다. 몇몇 적용에서, 하나 이상의 반응 성분은 예비-측정된 단일 사용량으로 개별적으로, 전형적으로는 일회용 튜브 또는 동등한 용기에 제공될 수 있다. 이러한 방식으로, RNA-안내된 뉴클레아제 반응은 표적 핵산, 또는 표적 핵산이 함유된 샘플 또는 세포를 개별 튜브에 직접적으로 첨가함으로써 수행될 수 있다. 키트에 공급되는 성분들의 양은 임의의 적절한 양일 수 있고, 생성물이 지향되는 시장에 따라 달라질 수 있다. 성분들이 공급되는 용기(들)는 공급 형태를 유지할 수 있는 임의의 관례적인 용기이고, 예를 들어 마이크로퓨즈(microfuge) 튜브, 미량정량판, 앰풀(ampule), 병, 또는 적분판정 장치(integral testing device), 예컨대 유량조절 장치, 카트리지(cartridge), 측방 유동, 또는 기타 유사 장치이다.
키트는 또한 용기 또는 용기들의 조합을 유지하기 위한 포장 물질을 포함할 수 있다. 이러한 키트 및 시스템을 위한 전형적인 포장 물질은 반응 성분들 또는 검출 탐침자를 임의의 다양한 형태[예를 들어, 바이알, 미량정량판 웰, 마이크로어레이(microarray) 등]로 유지시키는 고체 기질(예를 들어, 유리, 플라스틱, 종이, 호일, 미립자 등)을 포함한다. 키트는 추가로 성분들의 사용을 위해 유형(有形)의 형태로 기록된 지침서를 추가로 포함한다.
예시적 실시태양
본원에 개시된 주제에 따라 제공된 예시적 실시태양은, 제한되지 않지만, 특허청구범위 및 하기 실시태양을 포함한다:
A1. (i) 표적 서열에 하이브리드화될 수 있는 안내 서열, 및 (ii) 스템 서열을 포함하는 crRNA 분절;
상기 스템 서열에 부분적으로 또는 완전히 상보성인 뉴클레오티드 서열을 포함하는 tracrRNA 분절; 및
(i) 공여체 폴리뉴클레오티드, (ii) 제2 어댑터 분절, 또는 (iii) 스플린트 분절에 상보성인 서열을 포함하는 제1 어댑터 분절
을 포함하되, 어댑터 서열이 하나 이상의 안정성-향상 변형을 포함하고; 합성 안내 RNA가 gRNA 작용성을 갖는, 합성 안내 RNA.
A2. 적어도 하나의 변형이 RNase H 절단에 대한 어댑터 서열의 저항성을 증가시키는 변형인 실시태양 A1의 합성 안내 RNA.
A3. 어댑터 서열이 하나 이상의 2'-O-메틸 작용기를 포함하는 실시태양 A1 또는 A2의 합성 안내 RNA.
A4. 어댑터 서열이 하나 이상의 포스포로티오에이트 기를 포함하는 실시태양 A1 또는 A2의 합성 안내 RNA.
A5. 어댑터 서열이 하나 이상의 포스포노아세테이트(PACE) 기를 포함하는 실시태양 A1 또는 A2의 합성 안내 RNA.
A6. 어댑터 서열이 하나 이상의 티오포스포노아세테이트(티오PACE) 기를 포함하는 실시태양 A1 또는 A2의 합성 안내 RNA.
A7. 어댑터 분절에서의 변형이 2'-O-메틸 작용기, 2'-플루오로 작용기, 2'-데옥시 작용기, 포스포로티오에이트 뉴클레오티드 사이의 연결기, 포스포노아세테이트 뉴클레오티드 사이의 연결기, 티오포스포노아세테이트 뉴클레오티드 사이의 연결기, 또는 이들의 조합물을 포함하는 실시태양 A1 또는 A2의 합성 안내 RNA.
A8. 어댑터 분절이 3'-포스포로티오에이트 기를 갖는 2'-O-메틸 뉴클레오티드, 3'-포스포노카복실레이트 기를 갖는 2'-O-메틸 뉴클레오티드, 3'-포스포노아세테이트 기를 갖는 2'-O-메틸 뉴클레오티드, 3'-티오포스포노카복실레이트 기를 갖는 2'-O-메틸 뉴클레오티드, 3'-티오포스포노아세테이트 기를 갖는 2'-O-메틸 뉴클레오티드, 3'-포스포노아세테이트 기를 갖는 2'-데옥시 뉴클레오티드, 및 3'-티오포스포노아세테이트 기를 갖는 2'-데옥시 뉴클레오티드로 구성된 군에서 선택된 하나 이상의 변형을 포함하는 실시태양 A1 또는 A2의 합성 안내 RNA.
A9. 안정성-향상 변형이 2'-O-메틸 작용기, 2'-플루오로 작용기, 또는 2'-데옥시 작용기를 포함하는 실시태양 A1 또는 A2의 합성 안내 RNA.
A10. 안정성-향상 변형이 포스포로티오에이트 뉴클레오티드 사이의 연결기, 포스포노아세테이트 뉴클레오티드 사이의 연결기, 티오포스포노아세테이트 뉴클레오티드 사이의 연결기, 메틸포스포네이트 뉴클레오티드 사이의 연결기, 보라노포스페이트 뉴클레오티드 사이의 연결기, 또는 포스포로디티오에이트 뉴클레오티드 사이의 연결기를 포함하는 실시태양 A1 또는 A2의 합성 안내 RNA.
A11. 안정성-향상 변형이 2'-O-메틸,3'-포스포로티오에이트 뉴클레오티드, 2'-O-메틸,3'-포스포노아세테이트 뉴클레오티드, 또는 2'-O-메틸,3'-티오포스포노아세테이트 뉴클레오티드를 포함하는 실시태양 A1 또는 A2의 합성 안내 RNA.
A12. 안정성-향상 변형이 2'-플루오로,3'-포스포로티오에이트 뉴클레오티드, 2'-플루오로,3'-포스포노아세테이트 뉴클레오티드, 또는 2'-플루오로,3'-티오포스포노아세테이트 뉴클레오티드를 포함하는 실시태양 A1 또는 A2의 합성 안내 RNA.
A13. 안정성-향상 변형이 하나 보다 더 많은 안정성-향상 변형을 포함하는 실시태양 A1 내지 A12중 어느 한 실시태양의 합성 안내 RNA.
A14. 어댑터 분절이 tracrRNA 분절에 연결되고, 안정성-향상 변형중 하나가 어댑터 분절의 마지막 5개 뉴클레오티드내에 위치된 실시태양 A1 내지 A13중 어느 한 실시태양의 합성 안내 RNA.
A15. 제1 어댑터 분절이 RNA 서열인 실시태양 A1 내지 A14중 어느 한 실시태양의 합성 안내 RNA.
A16. 제2 어댑터 분절이 DNA 서열인 실시태양 A1 내지 A15중 어느 한 실시태양의 합성 안내 RNA.
A17. 어댑터 분절이 염기-쌍 하이브리드화에 의해 공여체 폴리뉴클레오티드에 부착되는 실시태양 A1 내지 A16중 어느 한 실시태양의 합성 안내 RNA.
A18. 어댑터 분절이 뉴클레오티드 사이의 연결기에 의해 공여체 폴리뉴클레오티드에 부착되는 실시태양 A1 내지 A16중 어느 한 실시태양의 합성 안내 RNA.
A19. 합성 안내 RNA가 단일 안내 RNA이고, crRNA 분절 및 tracrRNA 분절이 연결되는 실시태양 A1 내지 A18중 어느 한 실시태양의 합성 안내 RNA.
A20. crRNA 분절이 안내 RNA의 5' 말단에 존재하고 어댑터 분절이 (i) crRNA 분절 또는 (ii) crRNA 분절의 5' 말단에 부착된 5' 오버행에 부착되는 실시태양 A1 내지 A19중 어느 한 실시태양의 합성 안내 RNA.
A21. tracrRNA 분절이 안내 RNA의 3' 말단에 존재하고 어댑터 분절이 (i) tracrRNA 분절 또는 (ii) tracrRNA 분절의 3' 말단에 부착된 3' 오버행에 부착되는 실시태양 A1 내지 A20중 어느 한 실시태양의 합성 안내 RNA.
A22. crRNA 분절이 25 내지 70개의 뉴클레오티드를 포함하는 실시태양 A1 내지 A21중 어느 한 실시태양의 합성 안내 RNA.
A23. 안내 서열이 15 내지 30개의 뉴클레오티드를 포함하는 실시태양 A1 내지 A22중 어느 한 실시태양의 합성 안내 RNA.
A24. 스템 서열이 10 내지 50개의 뉴클레오티드를 포함하는 실시태양 A1 내지 A23중 어느 한 실시태양의 합성 안내 RNA.
A25. 어댑터 분절이 10 내지 40개의 뉴클레오티드인 실시태양 A1 내지 A24중 어느 한 실시태양의 합성 안내 RNA.
B1. (a) gRNA 작용성을 갖는 합성 안내 RNA, 및 (b) 공여체 폴리뉴클레오티드를 포함하는 안내 RNA:공여체 폴리뉴클레오티드 복합체로서,
상기 합성 안내 RNA가:
(i) 표적 서열에 하이브리드화될 수 있는 안내 서열, 및 (ii) 스템 서열을 포함하는 crRNA 분절;
상기 스템 서열에 부분적으로 또는 완전히 상보성인 뉴클레오티드 서열을 포함하는 tracrRNA 분절; 및
(i) 공여체 폴리뉴클레오티드, (ii) 제2 어댑터 분절, 또는 (iii) 스플린트 분절에 상보성인 서열을 포함하는 제1 어댑터 분절
을 포함하고, 어댑터 서열이 하나 이상의 안정성-향상 변형을 포함하고;
상기 공여체 폴리뉴클레오티드가 제1 어댑터 분절, 제2 어댑터 분절, 및 스플린트 분절중 하나에 부착되는, 안내 RNA:공여체 폴리뉴클레오티드 복합체.
B2. 공여체 폴리뉴클레오티드가 염기-짝형성 하이브리드화에 의해 제1 어댑터 분절에 부착되는 실시태양 B1의 안내 RNA:공여체 폴리뉴클레오티드 복합체.
B3. 공여체 폴리뉴클레오티드가 뉴클레오티드 사이의 연결기에 의해 제1 어댑터 분절에 부착되는 실시태양 B1의 안내 RNA:공여체 폴리뉴클레오티드 복합체.
B4. 제1 어댑터 분절이 염기-짝형성 하이브리드화에 의해 제2 어댑터 분절에 부착되고, 제2 어댑터 분절이 뉴클레오티드 사이의 연결기에 의해 공여체 폴리뉴클레오티드에 부착되는 실시태양 B1의 안내 RNA:공여체 폴리뉴클레오티드 복합체.
B5. 제1 어댑터 분절이 RNA 서열이고, 제2 어댑터 분절이 DNA 서열인 실시태양 B4의 안내 RNA:공여체 폴리뉴클레오티드 복합체.
B6. 공여체 폴리뉴클레오티드가 단일-가닥 DNA인 실시태양 B4의 안내 RNA:공여체 폴리뉴클레오티드 복합체.
B7. 공여체 폴리뉴클레오티드가 2중-가닥 DNA인 실시태양 B4의 안내 RNA:공여체 폴리뉴클레오티드 복합체.
B8. 제1 어댑터 분절이 염기-짝형성 하이브리드화에 의해 스플린트 분절에 부착되고, 스플린트 분절이 염기-짝형성 하이브리드화에 의해 공여체 폴리뉴클레오티드에 부착되는 실시태양 B1의 안내 RNA:공여체 폴리뉴클레오티드 복합체.
C1. 표적 폴리뉴클레오티드를 CRISPR-연관된 단백질 및 실시태양 A1 내지 A25중 어느 한 실시태양의 합성 안내 RNA 또는 실시태양 B1 내지 B8중 어느 한 실시태양의 안내 RNA:공여체 폴리뉴클레오티드 복합체와 접촉시키는 단계;
표적 폴리뉴클레오티드를 절단시키는 단계; 및
공여체 폴리뉴클레오티드를 표적 폴리뉴클레오티드에 연결시키는 단계
를 포함하는, 표적 폴리뉴클레오티드를 편집하는 방법.
C2. 표적 폴리뉴클레오티드를 외래성 CRISPR-연관된 단백질과 접촉시키는 단계를 추가로 포함하는 실시태양 C1의 방법.
C3. CRISPR-연관된 단백질이 Cas9인 실시태양 C2의 방법.
C4. 절단된 표적 폴리뉴클레오티드를 공여체 폴리뉴클레오티드에 의한 상동성-지시된 복구에 의해 복구시키는 단계를 추가로 포함하는 실시태양 C1 내지 C3중 어느 한 실시태양의 방법.
C5. 공여체 폴리뉴클레오티드가 절단 부위의 한쪽 측부 상의 서열과 실질적인 서열 동일성을 갖는 적어도 하나의 서열을 포함하는 실시태양 C4의 방법.
C6. 연결 단계가 표적 폴리뉴클레오티드의 하나 이상의 뉴클레오티드의 삽입, 결실, 또는 치환을 생산하는 실시태양 C4 또는 C5의 방법.
C7. 삽입, 결실, 또는 치환이 표적 폴리뉴클레오티드를 포함하는 유전자로부터 발현된 단백질에서 하나 이상의 아미노산 변화를 초래하는 실시태양 C6의 방법.
C8. 표적 폴리뉴클레오티드를 CRISPR-연관된 단백질 및 합성 안내 RNA 또는 안내 RNA:공여체 폴리뉴클레오티드 복합체와 시험관내에서 접촉시키는 실시태양 C1 내지 C7중 어느 한 실시태양의 방법.
C9. CRISPR-연관된 단백질 및 합성 안내 RNA 또는 안내 RNA:공여체 폴리뉴클레오티드 복합체와 접촉된 표적 폴리뉴클레오티드가 시험관내 또는 생체내에서 세포의 게놈내에 존재하는 실시태양 C1 내지 C8중 어느 한 실시태양의 방법.
C10. 표적 폴리뉴클레오티드를 CRISPR-연관된 단백질 및 합성 안내 RNA와 접촉시키기 이전에 세포를 다세포 공급원으로부터 단리하는 실시태양 C9의 방법.
C11. 공급원이 식물, 동물, 다세포 원생생물, 또는 곰팡이인 실시태양 C10의 방법.
C12. 표적 폴리뉴클레오티드를 CRISPR-연관된 단백질 및 합성 안내 RNA와 접촉시킨 이후 세포, 또는 이로부터 유래된 세포를 공급원으로 되돌려보내는 실시태양 C9 내지 C11중 어느 한 실시태양의 방법.
D1. (a) 실시태양 A1 내지 A25중 어느 한 실시태양의 합성 안내 RNA; (b) 하나 이상의 공여체 폴리뉴클레오티드; 및 (c) CRISPR-연관된 단백질 또는 세포에서 CRISPR-연관된 단백질을 발현하는 핵산을 세포내로 도입하는 단계를 포함하는, 세포에서 표적 폴리뉴클레오티드를 변형시키는 방법.
D2. (a) 실시태양 B1 내지 B8중 어느 한 실시태양의 안내 RNA:공여체 폴리뉴클레오티드 복합체 및 (b) CRISPR-연관된 단백질 또는 세포에서 CRISPR-연관된 단백질을 발현하는 핵산을 세포내로 도입하는 단계를 포함하는, 세포에서 표적 폴리뉴클레오티드를 변형시키는 방법.
D3. CRISPR-연관된-단백질이 Cas9인 실시태양 D1 또는 D2의 방법.
D4. 실시태양 A1 내지 A25중 어느 한 실시태양의 둘 이상의 합성 안내 RNA를 포함하는 RNA 분자의 집합 또는 라이브러리.
D5. 집합 또는 라이브러리가 합성 안내 RNA 상에 복수개의 직교 어댑터 분절을 포함하되, 어댑터 분절이 상이한 공여체 폴리뉴클레오티드를 결박하기 위해 적응되는 실시태양 D4의 RNA 분자의 집합 또는 라이브러리.
D6. 집합 또는 라이브러리가 복수개의 합성 안내 RNA를 포함하고, 이들 각각이 특유의 crRNA 및 상이한 공여체 폴리뉴클레오티드를 결박하기 위해 적응된 특유의 어댑터 분절을 포함하여, 세포에서 HR을 경유하여 복수개의 표적 폴리뉴클레오티드를 편집할 수 있는 실시태양 D4의 RNA 분자의 집합 또는 라이브러리.
E1. (a) 실시태양 A1 내지 A25중 어느 한 실시태양의 합성 안내 RNA; 또는 (b) 실시태양 B1 내지 B8중 어느 한 실시태양의 안내 RNA:공여체 폴리뉴클레오티드 복합체; 또는 (c) 실시태양 D1 내지 D6중 어느 한 실시태양의 RNA 분자의 집합 또는 라이브러리; 또는 (d) 이들의 조합물을 포함하는 키트.
E2. 하나 이상의 공여체 폴리뉴클레오티드를 추가로 포함하는 실시태양 E1 또는 E2의 키트.
E3. CRISPR-연관된 단백질 또는 CRISPR-연관된 단백질을 인코딩하는 핵산을 추가로 포함하는 실시태양 E1 또는 E2의 키트.
E4. CRISPR-연관된-단백질이 Cas9인 실시태양 E3의 키트.
E5. (a) 실시태양 A1 내지 A25중 어느 한 실시태양의 합성 안내 RNA; 또는 (b) 실시태양 B1 내지 B8중 어느 한 실시태양의 안내 RNA:공여체 폴리뉴클레오티드 복합체; 또는 (c) 실시태양 D1 내지 D6중 어느 한 실시태양의 RNA 분자의 집합 또는 라이브러리를 게놈 편집 방법에 사용하기 위한 지침서를 추가로 포함하는 실시태양 E1 내지 E4중 어느 한 실시태양의 키트.
F1. (a) 실시태양 A1 내지 A25중 어느 한 실시태양의 합성 안내 RNA; 또는 (b) 실시태양 B1 내지 B8중 어느 한 실시태양의 안내 RNA:공여체 폴리뉴클레오티드 복합체를 세포내로 도입하는 단계를 포함하는, 상동 재조합을 사용하여 세포의 게놈내로 외래성 DNA를 삽입하는 방법.
G1. Cas 단백질; 및
(i) 표적 서열에 하이브리드화될 수 있는 안내 서열, 및 (ii) 스템 서열을 포함하는 crRNA 분절;
상기 스템 서열에 부분적으로 또는 완전히 상보성인 뉴클레오티드 서열을 포함하는 tracrRNA 분절; 및
(i) 공여체 폴리뉴클레오티드, (ii) 제2 어댑터 분절, 또는 (iii) 스플린트 분절에 상보성인 서열을 포함하는 제1 어댑터 분절을 포함하는 합성 안내 RNA
를 포함하되, 어댑터 서열이 하나 이상의 안정성-향상 변형을 포함하고; 합성 안내 RNA가 gRNA 작용성을 갖는, 표적 폴리뉴클레오티드의 상동 재조합에 사용하기 위한 CRISPR-Cas 시스템.
G2. Cas 단백질이 촉매적으로 비활성인 실시태양 G1의 시스템.
G3. 안내 서열이 17, 18, 19 또는 20개의 뉴클레오티드 길이인 실시태양 G1의 시스템.
G4. 안내 서열이 14, 15 또는 16개의 뉴클레오티드 길이인 실시태양 G1의 시스템.
H1. 촉매적 활성 Cas 단백질;
표적 폴리뉴클레오티드의 제1 표적 서열을 표적화하고 이에 하이브리드화되는 제1 안내 RNA(여기서 제1 안내 RNA는 촉매적 활성 Cas 단백질과 복합체를 형성함);
촉매적 비활성 Ca9 단백질;
표적 폴리뉴클레오티드의 제2 표적 서열을 표적화하고 이에 하이브리드화되는 제2 안내 RNA(여기서 제2 안내 RNA는 촉매적 비활성 Cas 단백질과 복합체를 형성하고, 제2 안내 RNA는 제1 어댑터 분절을 포함함)
를 포함하는, 표적 폴리뉴클레오티드의 상동 재조합을 위한 CRISPR-Cas 시스템.
H2. 제1 표적 서열 및 제2 표적 서열이 2중-가닥 표적 폴리뉴클레오티드의 동일한 가닥에 존재하거나 반대쪽 가닥에 존재하고, -8 내지 100개의 염기 쌍의 오프셋이 제1 표적 서열 및 제2 표적 서열을 분리시키는 실시태양 H1의 시스템.
H3. 제1 어댑터 분절이 (i) 공여체 폴리뉴클레오티드; (ii) 제2 어댑터 분절; 또는 (iii) 스플린트 분절에 부착되는, 실시태양 H1 또는 H2의 시스템.
H4. 제1 어댑터 분절이 염기-짝형성에 의해 제2 어댑터 분절에 부착되고, 제2 어댑터 분절이 공여체 폴리뉴클레오티드에 부착되는, 실시태양 H3의 시스템.
H5. 제2 어댑터 분절이 뉴클레오티드 사이의 연결기에 의해 공여체 폴리뉴클레오티드에 부착되는, 실시태양 H4의 시스템.
H6. 제1 어댑터 분절이 스플린트 분절에 의해 공여체 폴리뉴클레오티드에 부착되고, 스플린트 분절이 제1 및 제2 부분을 갖고, 제1 부분이 상보성 염기 쌍의 하이브리드화에 의해 제1 어댑터에 부착되고, 제2 부분이 상보성 염기 쌍의 하이브리드화에 의해 공여체 폴리뉴클레오티드에 부착되는, 실시태양 H1 또는 H2의 시스템.
H7. 제1 어댑터 분절이 하나 이상의 안정성-향상 변형을 갖는 실시태양 H1 내지 H6중 어느 한 실시태양의 시스템.
H8. 촉매적 활성 Cas 단백질이 Cas9, Cas9 돌연변이체, 또는 Cas9 변이체인 실시태양 H1 내지 H7중 어느 한 실시태양의 시스템.
H9. 촉매적 비활성 Cas 단백질이 dCas9인 실시태양 H1 내지 H8중 어느 한 실시태양의 시스템.
I1. Cas 단백질;
표적 폴리뉴클레오티드의 제1 표적 서열을 표적화하고 이에 하이브리드화되는 제1 안내 RNA(여기서 제1 안내 RNA는 Cas 단백질과 복합체를 형성함);
14, 15 또는 16개의 뉴클레오티드 길이이고 표적 폴리뉴클레오티드의 제2 표적 서열에 상동성인 제2 안내 RNA(여기서 제2 안내 RNA는 Cas 단백질과 복합체를 형성하고, 제2 안내 RNA는 제1 어댑터 분절을 포함함)
를 포함하되, Cas 단백질:제2 안내 RNA 복합체가 제2 표적 서열을 인식하고 이에 결합하지만 복합체가 촉매적으로 비활성인, 표적 폴리뉴클레오티드의 상동 재조합을 위한 CRISPR-Cas 시스템.
I2. 제1 표적 서열 및 제2 표적 서열이 2중-가닥 표적 폴리뉴클레오티드의 동일한 가닥에 존재하거나 반대쪽 가닥에 존재하고, -8 내지 100개의 염기 쌍의 오프셋이 제1 표적 서열 및 제2 표적 서열을 분리시키는, 실시태양 I1의 시스템.
I3. 제1 어댑터 분절이 (i) 공여체 폴리뉴클레오티드; (ii) 제2 어댑터 분절; 또는 (iii) 스플린트 분절에 부착되는, 실시태양 I1 또는 I2의 시스템.
I4. 제1 어댑터 분절이 염기-짝형성에 의해 제2 어댑터 분절에 부착되고, 제2 어댑터 분절이 공여체 폴리뉴클레오티드에 부착되는, 실시태양 I3의 시스템.
I5. 제2 어댑터 분절이 뉴클레오티드 사이의 연결기에 의해 공여체 폴리뉴클레오티드에 부착되는, 실시태양 I4의 시스템.
I6. 제1 어댑터 분절이 스플린트 분절에 의해 공여체 폴리뉴클레오티드에 부착되고, 스플린트 분절이 제1 및 제2 부분을 갖고, 제1 부분이 상보성 염기 쌍의 하이브리드화에 의해 제1 어댑터에 부착되고, 제2 부분이 상보성 염기 쌍의 하이브리드화에 의해 공여체 폴리뉴클레오티드에 부착되는, 실시태양 I1 또는 I2의 시스템.
I7. 제1 어댑터 분절이 하나 이상의 안정성-향상 변형을 갖는, 실시태양 I1 내지 I6중 어느 한 실시태양의 시스템.
I8. Cas 단백질이 Cas9, Cas9 돌연변이체, 또는 Cas9 변이체인 실시태양 I1 내지 I7중 어느 한 실시태양의 시스템.
예시적인 또는 바람직한 실시태양에 대한 전술된 기재내용은 특허청구범위에 의해 정의된 바와 같이 본 발명을 제한하기 보다는 예시하는 것으로 받아들여져야 한다. 쉽게 이해될 수 있듯이, 상기 제시된 특징들의 많은 변형 및 조합은 특허청구범위에 제시된 바와 같이 본 발명으로부터 벗어나지 않고 이용될 수 있다. 이러한 변형은 본 발명의 범주로부터 벗어나는 것으로 간주되지 않고, 모든 이러한 변형은 하기 특허청구범위의 범주내에 포함되고자 한다.
SEQUENCE LISTING <110> Agilent Technologies, Inc. <120> COMPOUNDS AND METHODS FOR CRISPR/CAS-BASED GENOME EDITING BY HOMOLOGOUS RECOMBINATION <130> 20150037-03 (027644.8154) <140> PCT/US2016/049468 <141> 2016-08-30 <150> US 62/212,456 <151> 2015-08-31 <160> 1 <170> PatentIn version 3.5 <210> 1 <211> 1368 <212> PRT <213> Streptococcus pyogenes <400> 1 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365

Claims (19)

  1. gRNA 작용성을 갖고,
    (i) 표적 서열에 하이브리드화(hybridization)될 수 있는 안내 서열, 및 (ii) 스템(stem) 서열을 포함하는 crRNA 분절;
    상기 스템 서열에 부분적으로 또는 완전히 상보성인 뉴클레오티드 서열을 포함하는 tracrRNA 분절; 및
    (i) 공여체 폴리뉴클레오티드, (ii) 제2 어댑터(adaptor) 분절, 또는 (iii) 스플린트(splint) 분절에 상보성인 서열을 포함하는 제1 어댑터 분절
    을 포함하되, 어댑터 서열이 하나 이상의 안정성-향상 변형을 포함하는, 합성 안내 RNA.
  2. 제1항에 있어서,
    하나 이상의 변형이 RNase H 절단에 대한 어댑터 서열의 저항성을 증가시키는 변형인, 합성 안내 RNA.
  3. 제1항 또는 제2항에 있어서,
    어댑터 분절에서의 변형이 2'-O-메틸 작용기, 2'-플루오로 작용기, 2'-데옥시 작용기, 포스포로티오에이트 뉴클레오티드 사이의 연결기, 포스포노아세테이트 뉴클레오티드 사이의 연결기, 티오포스포노아세테이트 뉴클레오티드 사이의 연결기, 또는 이들의 조합을 포함하는, 합성 안내 RNA.
  4. 제1항 또는 제2항에 있어서,
    어댑터 분절이 3'-포스포로티오에이트 기를 갖는 2'-O-메틸 뉴클레오티드, 3'-포스포노카복실레이트 기를 갖는 2'-O-메틸 뉴클레오티드, 3'-포스포노아세테이트 기를 갖는 2'-O-메틸 뉴클레오티드, 3'-티오포스포노카복실레이트 기를 갖는 2'-O-메틸 뉴클레오티드, 3'-티오포스포노아세테이트 기를 갖는 2'-O-메틸 뉴클레오티드, 3'-포스포노아세테이트 기를 갖는 2'-데옥시 뉴클레오티드, 및 3'-티오포스포노아세테이트 기를 갖는 2'-데옥시 뉴클레오티드로 구성된 군에서 선택된 하나 이상의 변형을 포함하는, 합성 안내 RNA.
  5. 제1항 내지 제4항중 어느 한 항에 있어서,
    어댑터 분절이 tracrRNA 분절에 연결되고, 안정성-향상 변형중 하나가 어댑터 분절의 마지막 5개의 뉴클레오티드내에 위치하는, 합성 안내 RNA.
  6. 제1항 내지 제5항중 어느 한 항에 있어서,
    제1 어댑터 분절이 RNA 서열인, 합성 안내 RNA.
  7. 제1항 내지 제6항중 어느 한 항에 있어서,
    제2 어댑터 분절이 DNA 서열인, 합성 안내 RNA.
  8. (a) gRNA 작용성을 갖는 합성 안내 RNA, 및 (b) 공여체 폴리뉴클레오티드를 포함하는 안내 RNA:공여체 폴리뉴클레오티드 복합체로서,
    상기 합성 안내 RNA가
    (i) 표적 서열에 하이브리드화될 수 있는 안내 서열, 및 (ii) 스템 서열을 포함하는 crRNA 분절;
    상기 스템 서열에 부분적으로 또는 완전히 상보성인 뉴클레오티드 서열을 포함하는 tracrRNA 분절; 및
    (i) 공여체 폴리뉴클레오티드, (ii) 제2 어댑터 분절, 또는 (iii) 스플린트 분절에 상보성인 서열을 포함하는 제1 어댑터 분절
    을 포함하고, 어댑터 서열이 하나 이상의 안정성-향상 변형을 포함하고;
    상기 공여체 폴리뉴클레오티드가 제1 어댑터 분절, 제2 어댑터 분절, 및 스플린트 분절중 하나에 부착되는,
    안내 RNA:공여체 폴리뉴클레오티드 복합체.
  9. 제8항에 있어서,
    공여체 폴리뉴클레오티드가 염기-짝형성 하이브리드화에 의해 제1 어댑터 분절에 부착되는, 안내 RNA:공여체 폴리뉴클레오티드 복합체.
  10. 제8항에 있어서,
    공여체 폴리뉴클레오티드가 뉴클레오티드 사이의 연결기에 의해 제1 어댑터 분절에 부착되는, 안내 RNA:공여체 폴리뉴클레오티드 복합체.
  11. 제8항에 있어서,
    제1 어댑터 분절이 염기-짝형성 하이브리드화에 의해 스플린트 분절에 부착되고, 스플린트 분절이 염기-짝형성 하이브리드화에 의해 공여체 폴리뉴클레오티드에 부착되는, 안내 RNA:공여체 폴리뉴클레오티드 복합체.
  12. 표적 폴리뉴클레오티드를 CRISPR-연관된 단백질, 및 제1항 내지 제7항중 어느 한 항에 따른 합성 안내 RNA 또는 제8항 내지 제11항중 어느 한 항에 따른 안내 RNA:공여체 폴리뉴클레오티드 복합체와 접촉시키는 단계;
    표적 폴리뉴클레오티드를 절단시키는 단계; 및
    공여체 폴리뉴클레오티드를 표적 폴리뉴클레오티드에 연결시키는 단계
    를 포함하는, 표적 폴리뉴클레오티드를 편집하는 방법.
  13. 제12항에 있어서,
    표적 폴리뉴클레오티드를 외래성 CRISPR-연관된 단백질과 접촉시키는 단계를 추가로 포함하는 방법.
  14. 제13항에 있어서,
    CRISPR-연관된 단백질이 Cas9인, 방법.
  15. 제12항 내지 제14항중 어느 한 항에 있어서,
    공여체 폴리뉴클레오티드에 의한 상동성-지시된 복구(homology-directed repair)에 의해 절단된 표적 폴리뉴클레오티드를 복구시키는 단계를 추가로 포함하는 방법.
  16. 제15항에 있어서,
    공여체 폴리뉴클레오티드가 절단 부위의 한쪽 측부 상의 서열과 실질적인 서열 동일성을 갖는 하나 이상의 서열을 포함하는, 방법.
  17. 제12항 내지 제16항중 어느 한 항에 있어서,
    표적 폴리뉴클레오티드를 CRISPR-연관된 단백질 및 합성 안내 RNA 또는 안내 RNA:공여체 폴리뉴클레오티드 복합체와 시험관내에서 접촉시키는 방법.
  18. (a) 제1항 내지 제7항중 어느 한 항에 따른 합성 안내 RNA; (b) 하나 이상의 공여체 폴리뉴클레오티드; 및 (c) CRISPR-연관된 단백질 또는 세포에서 CRISPR-연관된 단백질을 발현하는 핵산을 세포내로 도입하는 단계
    를 포함하는, 세포에서 표적 폴리뉴클레오티드를 변형시키는 방법.
  19. (a) 제8항 내지 제11항중 어느 한 항에 따른 안내 RNA:공여체 폴리뉴클레오티드 복합체, 및 (b) CRISPR-연관된 단백질 또는 세포에서 CRISPR-연관된 단백질을 발현하는 핵산을 세포내로 도입하는 단계
    를 포함하는, 세포에서 표적 폴리뉴클레오티드를 변형시키는 방법.
KR1020187008914A 2015-08-31 2016-08-30 상동 재조합에 의한 crispr/cas-기반 게놈 편집을 위한 화합물 및 방법 KR102691636B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562212456P 2015-08-31 2015-08-31
US62/212,456 2015-08-31
PCT/US2016/049468 WO2017040511A1 (en) 2015-08-31 2016-08-30 Compounds and methods for crispr/cas-based genome editing by homologous recombination

Publications (2)

Publication Number Publication Date
KR20180037297A true KR20180037297A (ko) 2018-04-11
KR102691636B1 KR102691636B1 (ko) 2024-08-02

Family

ID=

Also Published As

Publication number Publication date
US20170058298A1 (en) 2017-03-02
WO2017040511A1 (en) 2017-03-09
US10526590B2 (en) 2020-01-07
EP3344771A1 (en) 2018-07-11
CN107922949A (zh) 2018-04-17
EP3344771A4 (en) 2019-03-20

Similar Documents

Publication Publication Date Title
US10526590B2 (en) Compounds and methods for CRISPR/Cas-based genome editing by homologous recombination
JP7038079B2 (ja) Crisprハイブリッドdna/rnaポリヌクレオチドおよび使用方法
US10689691B2 (en) Unbiased identification of double-strand breaks and genomic rearrangement by genome-wide insert capture sequencing
JP7068821B2 (ja) 化学修飾を有するガイドrna
JP7379447B2 (ja) ゲノム編集分子の細胞内送達のためのペプチドおよびナノ粒子
ES2884838T3 (es) ARN guía químicamente modificados para la regulación génica mediada por CRISPR/CAS
EP3080260B1 (en) Crispr-cas systems and methods for altering expression of gene products, structural information and inducible modular cas enzymes
WO2017127807A1 (en) Crystal structure of crispr cpf1
EP3464587B1 (en) Compositions and methods for enhancing homologous recombination
WO2015089473A9 (en) Engineering of systems, methods and optimized guide compositions with new architectures for sequence manipulation
WO2016049258A2 (en) Functional screening with optimized functional crispr-cas systems
WO2018117746A1 (ko) 동물 배아의 염기 교정용 조성물 및 염기 교정 방법
EP3447139A1 (en) Method for increasing mutation introduction efficiency in genome sequence modification technique, and molecular complex to be used therefor
US20220364122A1 (en) Bacterial platform for delivery of gene-editing systems to eukaryotic cells
EP4230737A1 (en) Novel enhanced base editing or revising fusion protein and use thereof
WO2018217537A1 (en) Selective insertion of suicide genes into cancer cells
KR102691636B1 (ko) 상동 재조합에 의한 crispr/cas-기반 게놈 편집을 위한 화합물 및 방법
WO2021183850A1 (en) Compositions and methods for modifying a target nucleic acid
US20220372522A1 (en) Compositions and methods for homology-directed recombination
US20230340468A1 (en) Methods for using guide rnas with chemical modifications
US20230407278A1 (en) Compositions and methods for cas9 molecules with improved gene editing properties
KR20230016751A (ko) 염기 편집기 및 이의 용도
WO2023137233A2 (en) Compositions and methods for editing genomes

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right