KR20220104837A - 신규한 crispr 효소 및 시스템 - Google Patents

신규한 crispr 효소 및 시스템 Download PDF

Info

Publication number
KR20220104837A
KR20220104837A KR1020227024312A KR20227024312A KR20220104837A KR 20220104837 A KR20220104837 A KR 20220104837A KR 1020227024312 A KR1020227024312 A KR 1020227024312A KR 20227024312 A KR20227024312 A KR 20227024312A KR 20220104837 A KR20220104837 A KR 20220104837A
Authority
KR
South Korea
Prior art keywords
cpf1
sequence
target
mutated
protein
Prior art date
Application number
KR1020227024312A
Other languages
English (en)
Inventor
펑 장
베른트 체체
린이 가오
이안 슬레이메이커
데이비드 벤자민 털리츠 콕스
Original Assignee
더 브로드 인스티튜트, 인코퍼레이티드
매사추세츠 인스티튜트 오브 테크놀로지
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 더 브로드 인스티튜트, 인코퍼레이티드, 매사추세츠 인스티튜트 오브 테크놀로지 filed Critical 더 브로드 인스티튜트, 인코퍼레이티드
Publication of KR20220104837A publication Critical patent/KR20220104837A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/22Vectors comprising a coding region that has been codon optimised for expression in a respective host
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Mycology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Cell Biology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Bakery Products And Manufacturing Methods Therefor (AREA)
  • Noodles (AREA)
  • Detergent Compositions (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

본 발명은 핵산을 표적화하기 위한 시스템, 방법 및 조성물을 제공한다. 특히, 본 발명은 신규 DNA-표적화 CRISPR 이펙터 단백질 및 가이드 RNA와 같은 적어도 하나의 표적화 핵산 성분을 포함하는 비-천연 발생 또는 조작된 DNA-표적화 시스템을 제공한다. 특히, 본 발명의 양태는 변경된 PAM 특이성을 갖는 Cpf1 돌연변이체에 관한 것이다.

Description

신규한 CRISPR 효소 및 시스템 {The novel CRISPR enzyme and system}
관련 출원 및 참조에 의한 포함
본 출원은 본원에 참조로 포함되는 2016년 4월 19일에 출원된 미국 가출원 제62/324,820호, 2016년 6월 17일에 출원된 미국 가출원 제62/351,558호, 2016년 7월 11일에 출원된 미국 가출원 제62/360,765호 및 2016년 10월 19일에 출원된 미국 가출원 62/410,196의 이익 및 이들 출원에 대한 우선권을 주장한다.
본원에 참조로 포함되는 2016년 4월 19일에 출원된 미국 가출원 제62/324,777호 및 제62/324,834호, 2016년 8월 17일에 출원된 미국 가출원 제62/376,379호 및 2016년 10월 19일에 출원된 미국 가출원 제62/410,240호가 참조된다.
상기 출원, 및 본원에 인용된 문헌들에서 인용되거나 언급된 모든 문헌은, 본원에 언급된 임의의 제품에 대한 임의의 제조사의 지침서, 설명서, 제품 명세서 및 제품 시트(sheet) 또는 본원에 참고로 포함된 임의의 문헌과 함께, 본원에 참고로 포함되어 있으며, 본 발명의 실시에 이용될 수 있다. 더 구체적으로, 모든 참조된 문헌은, 마치 각각의 개별 문헌을 참고로 포함하는 것으로 특정적으로 그리고 개별적으로 나타내는 것과 동일한 정도로 참고로 포함된다.
연방 정부가 후원하는 연구에 대한 성명
본 발명은 미국 국립 보건원(National Institutes of Health)에 의해 지급된 MH100706 및 MH110049 하에 정부 지원으로 수행되었다. 정부는 본 발명에 대해 특정 권리를 갖는다.
본 발명의 분야
본 발명은 일반적으로 클러스터링되고 규칙적으로 산재된 짧은 팔린드로믹 반복부(Clustered Regularly Interspaced Short Palindromic Repeats; CRISPR)와 관련된 벡터 시스템 및 이의 성분을 사용할 수 있는, 서열 표적화를 수반하는 유전자 발현의 제어, 예컨대 유전자 전사물의 변동(perturbation) 또는 핵산 편집에 사용되는 시스템, 방법 및 조성물에 관한 것이다.
최근 게놈 시퀀싱 기법 및 분석 방법의 진보는 다양한 범위의 생물학적 기능 및 질환과 연관된 유전적 요인을 목록화하고 매핑하는 능력을 상당히 가속화시켰다. 개별적인 유전 요소의 선택적인 변동을 허용함으로써 원인이 되는 유전 변이의 체계적인 역조작(reverse engineering)을 가능하게 할 뿐만 아니라, 합성 생물학, 생명공학, 및 의학 응용 분야를 진전시키기 위하여, 정확한 게놈 표적화 기술이 필요하다. 게놈-편집 기법, 예컨대 디자이너 징크 핑거(designer zinc finger), 전사 활성인자-유사 이펙터(transcription activator-like effector; TALE), 또는 귀소 메가뉴클레아제(homing meganuclease)가 표적화된 게놈 변동을 생성하는 데 이용가능하지만, 신규 전략과 분자 메커니즘을 이용하고, 입수가능하며, 설정하기 쉽고, 확장성이 있으며, 진핵세포 게놈 내의 다수의 위치를 표적화할 수 있는 새로운 게놈 조작 기술에 대한 필요성이 계속 남아 있다. 이는 게놈 조작 및 생명공학에서 새로운 응용 분야에 대한 주요 자원을 제공할 것이다.
박테리아 및 고세균의(archaeal) 적응 면역의 CRISPR-Cas 시스템은 단백질 조성 및 게놈 유전자좌 구조의 극단적인 다양성을 나타낸다. CRISPR-Cas 시스템 유전자좌는 50 개 초과의 유전자 패밀리를 가지며, 유전자좌 구조의 빠른 진화 및 극단적인 다양성을 나타내는 엄격한 보편적 유전자는 존재하지 않는다. 지금까지는, 다면적인 접근법을 채택하여, 93 개의 Cas 단백질에 대해 약 395 개의 프로파일의 포괄적인 cas 유전자 확인이 있다. 분류는 유전자 프로파일의 특징 및 유전자좌 구조의 특징을 포함한다. CRISPR-Cas 시스템의 새로운 분류가 제안되어 있으며, 여기서 이들 시스템은 광범위하게 2 개의 부류, 즉 다수 서브유닛 이펙터 복합체를 가지는 클래스 1 및 Cas9 단백질로 예시되는 단일-서브유닛 이펙터 모듈을 가지는 클래스 2로 나뉜다. 클래스 2 CRISPR-Cas 시스템과 연관된 신규 이펙터 단백질은 강력한 게놈 조작 도구로서 개발될 수 있으며, 추정상의 신규 이펙터 단백질 및 이의 조작 및 최적화의 예측이 중요하다.
본 출원에서 임의의 문헌의 인용 또는 확인은 상기 문헌이 본 출원에 대한 선행 기술로서 이용가능하다는 인정이 아니다.
광범위한 적용 배열을 이용하여 핵산 또는 폴리뉴클레오티드(예를 들어, DNA 또는 이의 임의의 하이브리드 또는 유도체)를 표적화하기 위한 대안적이고 강력한 시스템 및 기법에 대한 절박한 필요성이 존재한다. 본 발명은 이러한 필요성을 해결하고, 관련 이점을 제공한다. 게놈 및 후생유전체(epigenomic) 표적화 기술의 레퍼토리에 본 출원의 신규 DNA-표적화 시스템의 추가로, 직접 검출, 분석 및 조작을 통한 특정 효적 부위의 연구 및 변동 또는 편집을 변형시킬 수 있다. 유해한 효과 없이 게놈 또는 후생유전체 표적화에 효과적으로 본 출원의 DNA-표적화 시스템을 이용하기 위하여, 이들 DNA 표적화 도구의 조작 및 최적화의 양태를 이해하는 것이 중요하다.
본 발명은 Cpf1, 및 본원에 추가로 정의된 바와 같은 확인을 위한 표기된 용도 및 방법에 관한 것이다. Cpf1은 클래스 2 CRISPR-Cas 시스템의 단일의 RNA-인도된 엔도뉴클레아제로서 특성화되었다(문헌[Zetsche et al. (2015) Cell; 163(3):759-771]). 본 발명은 특히 돌연변이 Cpf1 폴리펩티드 및 폴리뉴클레오티드에 관한 것이다. 본 발명자들은 Cpf1을 돌연변이시켜, 예컨대 PAM 인식을 변경시킬 수 있으며, 즉, 상이한 PAM 서열이 본원에 기재된 Cpf1 돌연변이체에 의해 기능적으로 인식되어, 예컨대 PAM 인식 레퍼토리를 확대할 수 있음을 놀랍게도 발견하였다. 본원에 기재된 바와 같은 본 발명에 따른 돌연변이체는 (아마도 상응하는 야생형 Cpf1에 의해 인식되는 PAM 서열도 또한 여전히 인식할 수 있으면서) 상응하는 야생형 Cpf1에 의해 인식되는 PAM 서열과 상이하고/거나 이보다 더 짧은 PAM 서열을 인식할 수 있다. 따라서, 이와 같이, 본 발명은 Cpf1 PAM 인식의 유도된 진화에 관한 것이다.
따라서, 일 양태에서, 본 발명은 PAM 인식 또는 특이성에 영향을 미치는 하나 이상의 돌연변이를 갖는 돌연변이된 Cpf1 폴리펩티드에 관한 것이다. 추가의 양태에서, 본 발명은 하나 이상의 돌연변이를 갖는 돌연변이된 Cpf1 폴리펩티드에 관한 것이며, 상기 돌연변이된 Cpf1 단백질은 상응하는 야생형 Cpf1에 의해 인식되지 않는 PAM 서열을 인식한다. 추가의 양태에서, 본 발명은 하나 이상의 돌연변이를 갖고, N 이외의 4개 미만의 뉴클레오티드로 이루어진 PAM 서열을 인식하는 돌연변이된 Cpf1 폴리펩티드에 관한 것이되, 단, 상기 돌연변이된 Cpf1은 돌연변이된 FnCpf1이 아니다. 추가의 양태에서, 본 발명은 서열 YCV를 갖는 PAM을 인식하는 돌연변이된 Cpf1 폴리펩티드에 관한 것이다. 추가의 양태에서, 본 발명은 서열 NYCV를 갖는 PAM을 인식하는 돌연변이된 Cpf1 폴리펩티드에 관한 것이다. 추가의 양태에서, 본 발명은 서열 TYCV를 갖는 PAM을 인식하는 돌연변이된 Cpf1 폴리펩티드에 관한 것이다. 추가의 양태에서, 본 발명은 서열 VYCV를 갖는 PAM을 인식하는 돌연변이된 Cpf1 폴리펩티드에 관한 것이다. 추가의 양태에서, 본 발명은 서열 RYN을 갖는 PAM을 인식하는 돌연변이된 Cpf1 폴리펩티드에 관한 것이다. 추가의 양태에서, 본 발명은 서열 YCN을 갖는 PAM을 인식하는 돌연변이된 Cpf1 폴리펩티드에 관한 것이다. 추가의 양태에서, 본 발명은 서열 RCN을 갖는 PAM을 인식하는 돌연변이된 Cpf1 폴리펩티드에 관한 것이다. 추가의 양태에서, 본 발명은 서열 AYV를 갖는 PAM을 인식하는 돌연변이된 Cpf1 폴리펩티드에 관한 것이다. 추가의 양태에서, 본 발명은 서열 TYV를 갖는 PAM을 인식하는 돌연변이된 Cpf1 폴리펩티드에 관한 것이다. 추가의 양태에서, 본 발명은 서열 TNYS 또는 TNYC를 갖는 PAM을 인식하는 돌연변이된 Cpf1 폴리펩티드에 관한 것이되, 단, 상기 PAM은 TTTV가 아니거나, 단, 상기 PAM은 TTTN 또는 TTTC가 아니다. 추가의 양태에서, 본 발명은 서열 TNYS 또는 TNYC를 갖는 PAM을 인식하는 돌연변이된 Cpf1 폴리펩티드에 관한 것이되, 단, 상기 PAM은 TCTG 또는 TCTC가 아니다. 추가의 양태에서, 본 발명은 서열 TNYS 또는 TNYC를 갖는 PAM을 인식하는 돌연변이된 Cpf1 폴리펩티드에 관한 것이되, 단, 상기 PAM은 TTTV가 아니거나, 단, 상기 PAM은 TTTN 또는 TCTC가 아니다. 추가의 양태에서, 본 발명은 서열 TYCC(즉, TCCC 또는 TTCC), TRTC(즉, TATC 또는 TGTC), TATV(즉, TATA, TATC 또는 TATG), NTTV(즉, NTTA, NTTC 또는 NTTG), TTV(즉, TTA, TTC 또는 TTG), TGYV, TYTV, TYCT, TSTG, TVYS, TVTS, TYYS, TCYS, TBYS, TCYS, TNYS, TYYS, TNTN, TSTG, TTCC, TCCC, TATC, TGTG, TCTG, TACT, AATA, TGTC, TRYV, RYH, TCTC, NTTN, TTN, TRTN, TYCN, TTCN, TCCN 또는 TATN을 갖는 PAM을 인식하는 돌연변이된 Cpf1 폴리펩티드에 관한 것이되, 선택적으로, 단, 상기 PAM은 TTTV가 아니거나, TTTV에 제한되고/거나, 선택적으로, 단, 상기 PAM은 TTTN이 아니거나, TTTN에 제한되고/거나, 선택적으로, 단, 상기 PAM은 TCTC가 아니거나, TCTC에 제한된다. 이러한 양태에서, 일 구현예에서, 상기 PAM은 TTTV 또는 TTTC가 아니거나, TTTV 또는 TTTC에 제한된다. 추가의 구현예에서, 상기 PAM은 TCTG가 아니거나, TCTG에 제한된다. 추가의 구현예에서, 상기 PAM은 TCTC가 아니거나, TCTC에 제한된다. 특정 구현예에서, Cpf1은 AsCpf1이다. 추가의 구현예에서, Cpf1은 아시다미노코커스(Acidaminococcus) 종 BV3L6, 티오마이크로스피라(Thiomicrospira) XS5, 모락셀라 보보쿨리(Moraxella bovoculi) AAX08_00205, 모락셀라 보보쿨리 AAX11_00205 라크노스피라세아에 박테리움(Lachnospiraceae bacterium) MA2020으로부터 선택되는 유기체로부터의 Cpf1이다.
일 양태에서, 본 발명은 AsCpf1(바람직하게는, 아시다미노코커스 종 BV3L6)의 위치 11, 12, 13, 14, 15, 16, 17, 34, 36, 39, 40, 43, 46, 47, 50, 54, 57, 58, 111, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 532, 533, 534, 535, 536, 537, 538, 539, 540, 541, 542, 543, 544, 545, 546, 547, 548, 549, 550, 551, 552, 553, 554, 555, 556, 565, 566, 567, 568, 569, 570, 571, 572, 573, 574, 575, 592, 593, 594, 595, 596, 597, 598, 599, 600, 601, 602, 603, 604, 605, 606, 607, 608, 609, 610, 611, 612, 613, 614, 615, 616, 617, 618, 619, 620, 626, 627, 628, 629, 630, 631, 632, 633, 634, 635, 636, 637, 638, 642, 643, 644, 645, 646, 647, 648, 649, 651, 652, 653, 654, 655, 656, 676, 679, 680, 682, 683, 684, 685, 686, 687, 688, 689, 690, 691, 692, 693, 707, 711, 714, 715, 716, 717, 718, 719, 720, 721, 722, 739, 765, 768, 769, 773, 777, 778, 779, 780, 781, 782, 783, 784, 785, 786, 871, 872, 873, 874, 875, 876, 877, 878, 879, 880, 881, 882, 883, 884 또는 1048, 또는 AsCpf1 오솔로그(orthologue)(상이한 종, 예컨대 LbCpf1로부터의 상응하는 이펙터), 동족체(homologue)(동일하거나 상이한 종으로부터의, 동일한 기능을 갖는 이펙터) 또는 변이체(예를 들어, 절단된 Cpf1을 포함하는 본원의 다른 곳에 기재된 바와 같이 추가로 변형된 Cpf1 중 임의의 것)의 상응하는 위치에 하나 이상의 돌연변이된 아미노산 잔기, 예컨대, AsCpf1(바람직하게는 아시다미노코커스 종 BV3L6)의 위치 Y11, Q12, V13, S14, K15, T16, L17, Q34, F36, E39, D40, R43, H46, Y47, L50, I54, I57, Y58, I111, A126, E127, I128, Y129, K130, G131, L132, F133, K134, A135, E136, A157, L158, L159, R160, S161, F162, D163, K164, F165, T166, T167, Y168, F169, S170, G171, F172, Y173, E174, N175, R176, K177, N178, K532, L533, N534, F535, Q536, M537, P538, T539, L540, A541, S542, G543, W544, D545, V546, N547, K548, E549, K550, N551, N552, G553, A554, I555, L556, L565, G566, I567, M568, P569, K570, Q571, K572, G573, R574, Y575, K592, M593, Y594, Y595, D596, Y597, F598, P599, D600, A601, A602, K603, M604, I605, P606, K607, C608, S609, T610, Q611, L612, K613, A614, V615, T616, A617, H618, F619, Q620, I626, L627, L628, S629, N630, N631, F632, I633, E634, P635, L636, E637, I638, I642, Y643, D644, L645, N646, N647, P648, E649, E651, P652, K653, K654, F655, Q656, W676, F679, T680, D682, F683, L684, S685, K686, Y687, T688, K689, T690, T691, S692, I693, L707, Y711, L714, N715, P716, L717, L718, Y719, H720, I721, S722, K739, W765, L768, F769, N773, T777, S778, I779, K780, L781, N782, G783, Q784, A785, E786, F871, H872, V873, P874, I875, T876, L877, N878, Y879, Q880, A881, A882, N883, S884 또는 Q1048, 또는 AsCpf1 오솔로그(상이한 종, 예컨대 LbCpf1로부터의 상응하는 이펙터), 동족체(동일하거나 상이한 종 유래의 동일한 기능을 갖는 이펙터) 또는 변이체(예를 들어, 절단된 Cpf1을 포함하는 본원에 다른 곳에 기재된 바와 추가로 변형된 Cpf1 중 임의의 것)의 상응하는 위치에 하나 이상의 돌연변이된 아미노산 잔기를 갖는 돌연변이된 Cpf1 폴리펩티드에 관한 것이다.
일 양태에서, 본 발명은 AsCpf1(바람직하게는 아시다미노코커스 종 BV3L6)의 위치 130, 131, 132, 133, 134, 135, 136, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 536, 537, 538, 539, 540, 541, 542, 543, 544, 545, 546, 547, 548, 549, 550, 551, 552, 570, 571, 572, 573, 595, 596, 597, 598, 599, 600, 601, 602, 603, 604, 605, 606, 607, 608, 609, 610, 611, 612, 613, 614, 615, 630, 631, 632, 646, 647, 648, 649, 650, 651, 652, 653, 683, 684, 685, 686, 687, 688, 689 또는 690, 또는 AsCpf1 오솔로그(상이한 종, 예컨대 LbCpf1로부터의 상응하는 이펙터), 동족체(동일하거나 상이한 종 유래의 동일한 기능을 갖는 이펙터) 또는 변이체(예를 들어, 절단된 Cpf1을 포함하는 본원에 다른 곳에 기재된 바와 추가로 변형된 Cpf1 중 임의의 것)의 상응하는 위치에 하나 이상의 돌연변이된 아미노산 잔기, 예컨대 AsCpf1(바람직하게는 아시다미노코커스 종 BV3L6)의 위치 K130, G131, L132, F133, K134, A135, E136, F162, D163, K164, F165, T166, T167, Y168, F169, S170, G171, F172, Y173, E174, N175, R176, K177, Q536, M537, P538, T539, L540, A541, S542, G543, W544, D545, V546, N547, K548, E549, K550, N551, N552, K570, Q571, K572, G573, Y595, D596, Y597, F598, P599, D600, A601, A602, K603, M604, I605, P606, K607, C608, S609, T610, Q611, L612, K613, A614, V615, N630, N631, F632, N646, N647, P648, E649, K650, E651, P652, K653, F683, L684, S685, K686, Y687, T688, K689 또는 T690, 또는 AsCpf1 오솔로그(상이한 종, 예컨대 LbCpf1로부터의 상응하는 이펙터), 동족체(동일하거나 상이한 종 유래의 동일한 기능을 갖는 이펙터) 또는 변이체(예를 들어, 절단된 Cpf1을 포함하는 본원에 다른 곳에 기재된 바와 추가로 변형된 Cpf1 중 임의의 것)의 상응하는 위치에 하나 이상의 돌연변이된 아미노산 잔기를 갖는 돌연변이된 Cpf1 폴리펩티드에 관한 것이다.
일 양태에서, 본 발명은 AsCpf1(바람직하게는 아시다미노코커스 종 BV3L6)의 위치 539, 542, 547, 548, 550, 551, 552 또는 607, 또는 AsCpf1 오솔로그(상이한 종, 예컨대 LbCpf1로부터의 상응하는 이펙터), 동족체(동일하거나 상이한 종 유래의 동일한 기능을 갖는 이펙터) 또는 변이체(예를 들어, 절단된 Cpf1을 포함하는 본원에 다른 곳에 기재된 바와 추가로 변형된 Cpf1 중 임의의 것)의 상응하는 위치에 하나 이상의 돌연변이된 아미노산 잔기, 예컨대 AsCpf1(바람직하게는 아시다미노코커스 종 BV3L6)의 위치 T539, S542, N547, K548, K550, N551, N552 또는 K607, 또는 AsCpf1 오솔로그(상이한 종, 예컨대 LbCpf1로부터의 상응하는 이펙터), 동족체(동일하거나 상이한 종 유래의 동일한 기능을 갖는 이펙터) 또는 변이체(예를 들어, 절단된 Cpf1을 포함하는 본원에 다른 곳에 기재된 바와 추가로 변형된 Cpf1 중 임의의 것)의 상응하는 위치에 하나 이상의 돌연변이된 아미노산 잔기, 예컨대 AsCpf1(바람직하게는 아시다미노코커스 종 BV3L6)의 S542R, N547K, K548A, K548H, K548N, K548Q, K548R, K550Y, N551R, N552G, N552K, N552R, N552S, N552T, K607A, K607R, T539R, T539K, K548G, K548C, K548F, K548I, K548M, K548S, K548T, K548V, K548W 또는 K548Y로부터 선택되는 하나 이상의 돌연변이, 또는 AsCpf1 오솔로그(상이한 종, 예컨대 LbCpf1로부터의 상응하는 이펙터), 동족체(동일하거나 상이한 종 유래의 동일한 기능을 갖는 이펙터) 또는 변이체(예를 들어, 절단된 Cpf1을 포함하는 본원에 다른 곳에 기재된 바와 추가로 변형된 Cpf1 중 임의의 것)의 상응하는 위치에 하나 이상의 돌연변이를 갖는 돌연변이된 Cpf1 폴리펩티드에 관한 것이다.
일 양태에서, 본 발명은 AsCpf1(바람직하게는 아시다미노코커스 종 BV3L6)의 위치 542, 547, 548, 550, 551, 552, 167, 604 또는 607에 하나 이상의 돌연변이된 아미노산 잔기, 또는 위치 542, 547, 548, 550, 551, 552 또는 607, 또는 AsCpf1 오솔로그(상이한 종, 예컨대 LbCpf1로부터의 상응하는 이펙터), 동족체(동일하거나 상이한 종 유래의 동일한 기능을 갖는 이펙터) 또는 변이체(예를 들어, 절단된 Cpf1을 포함하는 본원에 다른 곳에 기재된 바와 추가로 변형된 Cpf1 중 임의의 것)의 상응하는 위치에 하나 이상의 돌연변이된 아미노산 잔기를 갖는 돌연변이된 Cpf1 폴리펩티드에 관한 것이다.
일 양태에서, 본 발명은 AsCpf1(바람직하게는 아시다미노코커스 종 BV3L6)의 위치 542/548, 542/607, 548/552, 542/550/607, 542/548/550/607, 542/548/552, 542/548/551/552, 542/607/547 또는 542/607/547/550, 또는 AsCpf1 오솔로그(상이한 종, 예컨대 LbCpf1로부터의 상응하는 이펙터), 동족체(동일하거나 상이한 종 유래의 동일한 기능을 갖는 이펙터) 또는 변이체(예를 들어, 절단된 Cpf1을 포함하는 본원에 다른 곳에 기재된 바와 추가로 변형된 Cpf1 중 임의의 것)의 상응하는 위치에 조합된 돌연변이된 아미노산 잔기를 갖는, 예컨대, AsCpf1(바람직하게는 아시다미노코커스 종 BV3L6)의 위치 S542R/K548R, S542R/K607A, K548R/N552R, S542R/K550Y/K607R, S542R/K548R/K550Y/K607R, S542R/K548V/N552R, S542R/K548V/N551R/N552R, S542R/K607R/N547K 또는 S542R/K607R/N547K/K550Y, 또는 AsCpf1 오솔로그(상이한 종, 예컨대 LbCpf1로부터의 상응하는 이펙터), 동족체(동일하거나 상이한 종 유래의 동일한 기능을 갖는 이펙터) 또는 변이체(예를 들어, 절단된 Cpf1을 포함하는 본원에 다른 곳에 기재된 바와 추가로 변형된 Cpf1 중 임의의 것)의 상응하는 위치에 조합된 돌연변이된 아미노산 잔기를 갖는, 예컨대, AsCpf1(바람직하게는 아시다미노코커스 종 BV3L6)의 S542R/K548R, S542R/K607A, S542R/K607R, K548R/N552R, S542R/K550Y/K607R, S542R/K548R/K550Y/K607R, S542R/K548V, K548V/N552R, S542R/K548V/N552R, S542R/K548V/N551R/N552R, S542R/K607R/N547K, S542R/K607R/N547K/K550Y, K548V/N552G 또는 S542R/K548V/N552G로부터 선택되는 조합된 돌연변이, 또는 AsCpf1 오솔로그(상이한 종, 예컨대 LbCpf1로부터의 상응하는 이펙터), 동족체(동일하거나 상이한 종 유래의 동일한 기능을 갖는 이펙터) 또는 변이체(예를 들어, 절단된 Cpf1을 포함하는 본원에 다른 곳에 기재된 바와 추가로 변형된 Cpf1 중 임의의 것)의 상응하는 위치에 조합된 돌연변이를 갖는, 돌연변이된 Cpf1 폴리펩티드에 관한 것이다.
바람직한 구현예에서, 본 발명은 AsCpf1의 위치 542 및/또는 607에 하나 이상의 돌연변이된 아미노산 잔기, 또는 위치 542 및/또는 607, 또는 AsCpf1 오솔로그(상이한 종, 예컨대 LbCpf1로부터의 상응하는 이펙터), 동족체(동일하거나 상이한 종 유래의 동일한 기능을 갖는 이펙터) 또는 변이체(예를 들어, 절단된 Cpf1을 포함하는 본원에 다른 곳에 기재된 바와 추가로 변형된 Cpf1 중 임의의 것)의 상응하는 위치에 하나 이상의 돌연변이된 아미노산 잔기를 갖는 돌연변이된 Cpf1 폴리펩티드에 관한 것이다.
바람직한 구현예에서, 본 발명은 AsCpf1의 위치 542 및/또는 548(및 선택적으로 552)에 하나 이상의 돌연변이된 아미노산 잔기, 또는 위치 542 및/또는 548(및 선택적으로 552), 또는 AsCpf1 오솔로그(상이한 종, 예컨대 LbCpf1로부터의 상응하는 이펙터), 동족체(동일하거나 상이한 종 유래의 동일한 기능을 갖는 이펙터) 또는 변이체(예를 들어, 절단된 Cpf1을 포함하는 본원에 다른 곳에 기재된 바와 추가로 변형된 Cpf1 중 임의의 것)의 상응하는 위치에 하나 이상의 돌연변이된 아미노산 잔기를 갖는 돌연변이된 Cpf1 폴리펩티드에 관한 것이다.
특정 구현예에서, Cpf1은 AsCpf1 또는 LbCpf1이다. 추가의 지침으로, 하기 표에 나타낸 바와 같이 AsCpf1(아시다미노코커스 종 BV3L6)의 하기의 아미노산 잔기는 LbCpf1(라크노스피라세아에 박테리움 ND2006)의 각각의 아미노산 잔기에 상응한다.
Figure pat00001
따라서, 상기 AsCpf1 잔기가 언급되는 구현예 및 양태에서, 상응하는 LbCpf1 잔기에 동일하게 적용된다.
특정 구현예에서, 본 발명의 돌연변이된 Cpf1은 AsCpf1의 S542R, N547K, K548A, K548H, K548N, K548Q, K548R, K550Y, N551R, N552G, N552K, N552R, N552S, N552T, K607A, K607R, T539R, T539K, K548G, K548C, K548F, K548I, K548M, K548S, K548T, K548V, K548W 및 K548Y 또는 Cpf1 오솔로그의 상응하는 아미노산 잔기로부터 선택되는 돌연변이 중 하나 이상을 포함한다.
특정 구현예에서, 본 발명의 돌연변이된 Cpf1은 LbCpf1의 G532R, D537K, K538A, K538H, K538N, K538Q, K538R, T540Y, D541R, Y542G, Y542K, Y542R, Y542S, Y542T, K595A, K595R, G529R, G529K, K538G, K538C, K538F, K538I, K538M, K538S, K538T, K538V, K538W 및 K538Y 또는 Cpf1 오솔로그의 상응하는 아미노산 잔기로부터 선택되는 돌연변이 중 하나 이상을 포함한다.
본 발명의 일 구현예에 따른 바람직한 돌연변이된 Cpf1은 하기 표에 나타나 있다.
Figure pat00002
본 발명의 일 구현예에 따른 바람직한 돌연변이된 Cpf1 및 관련 인식 PAM 서열은 하기 표에 나타나 있다.
Figure pat00003
일 양태에서, 본 발명은 본원에 기재된 바와 같은 돌연변이된 Cpf1을 인코딩하는 다중핵산에 관한 것이다. 추가의 양태에서, 본 발명은 이러한 다중핵산을 포함하는 벡터에 관한 것이다. 추가의 양태에서, 본 발명은 이러한 벡터 및 동일한 또는 상이한 벡터 상에 gRNA(가이드 RNA)를 포함하는 벡터 시스템에 관한 것이다. 이러한 벡터 시스템은 동족 DNA 표적 서열에 결합되는 경우, 기능적 CRISPR-Cas 복합체가 재구성되게 한다. 따라서, 추가의 양태에서, 본 발명은 본원에 기재된 바와 같은 돌연변이된 Cpf1 및 gRNA를 포함하는 복합체에 관한 것이다. 추가의 양태에서, 본 발명은 본원에 기재된 바와 같은 돌연변이된 Cpf1, 다중핵산, 벡터 또는 벡터 시스템을 포함하는 전달 시스템에 관한 것이다. 추가의 양태에서, 본 발명은 본원에 기재된 바와 같은 돌연변이된 Cpf1, 다중핵산, 벡터, 벡터 시스템, 복합체 또는 전달 시스템을 포함하거나 이를 발현하는 숙주 세포에 관한 것이다. 추가의 양태에서, 본 발명은 본원에 기재된 바와 같은 돌연변이된 Cpf1, 다중핵산, 벡터, 벡터 시스템, 복합체, 전달 시스템 또는 숙주 세포를 포함하는, 약제학적 조성물일 수 있는 조성물에 관한 것이다. 추가의 양태에서, 본 발명은 본원에 기재된 바와 같은 돌연변이된 Cpf1, 다중핵산, 벡터, 벡터 시스템, 복합체, 전달 시스템, 숙주 세포 또는 조성물을 포함하는 키트를 제공한다. 추가의 양태에서, 본 발명은 본원에 기재된 바와 같은 돌연변이된 Cpf1, 다중핵산, 벡터, 벡터 시스템, 복합체, 전달 시스템, 숙주 세포 또는 조성물을 포함하거나 이를 발현하는 유전자이식 유기체, 예컨대, 비-인간 유전자이식 유기체에 관한 것이다.
일 양태에서, 본 발명은 표적 DNA 유전자좌의 변형 또는 표적화 방법에 관한 것이며, 상기 방법은 본원에 기재된 바와 같은 폴리펩티드, 폴리뉴클레오티드, 벡터, 벡터 시스템, 전달 시스템, 복합체 또는 조성물을 상기 유전자좌에 전달하는 단계를 포함한다. 추가의 양태에서, 본 발명은 표적 DNA 유전자좌의 변형 또는 표적화 방법에 관한 것이며, 상기 방법은 본원에 기재된 바와 같은 본 발명에 따른 돌연변이된 Cpf1 폴리펩티드 또는 상기 돌연변이된 Cpf1을 인코딩하는 폴리뉴클레오티드, 및 gNRA 또는 상기 gRNA를 인코딩하는 폴리뉴클레오티드를 상기 유전자좌에 전달하는 단계를 포함한다. 상기 돌연변이된 Cpf1 폴리펩티드는 바람직하게는 상기 gRNA와 복합체를 형성하며, 상기 표적 DNA 유전자좌는 바람직하게는 상기 표적 DNA 유전자좌로의 상기 복합체의 결합시에 변형되거나 표적화된다.
일 양태에서, 본 발명은 하기의 단계를 포함하는 PAM 인식에 영향을 미치는 하나 이상의 돌연변이를 갖는 돌연변이된 Cpf1 폴리펩티드를 확인하는 방법에 관한 것이다:
(a) - PAM 인식에 영향을 미치는 하나 이상의 돌연변이를 갖는 돌연변이된 Cpf1 폴리펩티드 후보를 포함하거나 이를 발현하고,
- gRNA를 포함하거나 이를 발현하고,
- DNA 표적 서열에 연결된 특정 PAM 서열을 포함하는 폴리뉴클레오티드를 포함하는 숙주 세포를 제공하는 단계로서, 상기 폴리뉴클레오티드가 선별 마커를 추가로 포함하며, 상기 DNA 표적 서열이 상기 gRNA와 혼성화할 수 있는 단계,
(b) 상기 선별 마커의 활성에 기초하여, PAM 인식에 영향을 미치는 하나 이상의 돌연변이를 갖는 돌연변이된 Cpf1 폴리펩티드를 확인하는 단계.
추가의 양태에서, 본 발명은 하기의 단계를 포함하는, PAM 인식에 영향을 미치는 하나 이상의 돌연변이를 갖는 돌연변이된 Cpf1 폴리펩티드의 확인 방법에 관한 것이다:
(a1) PAM 인식에 영향을 미치는 하나 이상의 돌연변이를 갖는 돌연변이된 Cpf1 폴리펩티드 후보 및 gRNA를 포함하거나 이를 발현하는 숙주 세포를 제공하는 단계;
(b1) 상기 gRNA가 혼성화할 수 있는 DNA 표적 서열에 연결된 특정 PAM 서열을 포함하는 폴리뉴클레오티드를 상기 숙주 세포에 도입하는 단계로서, 상기 폴리뉴클레오티드가 선별 마커를 추가로 포함하는 단계; 또는
(a2) DNA 표적 서열에 연결된 특정 PAM 서열을 포함하는 폴리뉴클레오티드를 포함하는 숙주 세포를 제공하는 단계로서, 상기 폴리뉴클레오티드가 선별 마커를 추가로 포함하는 단계;
(b2) PAM 인식에 영향을 미치는 하나 이상의 돌연변이를 갖는 돌연변이된 Cpf1 폴리펩티드 후보 또는 이를 발현하는 폴리뉴클레오티드, 및 상기 DNA 표적 서열과 혼성화할 수 있는 gRNA 또는 이를 발현하는 폴리뉴클레오티드를 상기 숙주 세포에 도입하는 단계;
(c) PAM 인식에 영향을 미치는 하나 이상의 돌연변이를 갖는 돌연변이된 Cpf1 폴리펩티드를 상기 선별 마커의 활성에 기초하여 확인하는 단계.
또 다른 양태에서, 본 발명은 또한, 상기 방법에 의해 확인되는 돌연변이된 Cpf1, 및 이러한 확인된 돌연변이된 Cpf1을 인코딩하는 폴리뉴클레오티드, 벡터, 벡터 시스템, 복합체, 조성물, 전달 시스템, 숙주 세포 또는 유전자이식 유기체에 관한 것이다.
일 양태에서, 본 발명은 바람직하게는 시험관내 또는 생체외에서 DNA 표적 유전자좌를 변형시키거나 표적화하기 위한 또는 비-인간 및/또는 비-동물 유기체에서 DNA 표적 유전자좌를 변형시키거나 표적화하기 위한 본원에 기재된 바와 같은 본 발명에 따른 Cpf1 폴리펩티드, 폴리뉴클레오티드, 벡터, 벡터 시스템, 복합체, 전달 시스템, 숙주 세포 또는 조성물의 용도에 관한 것이다. 추가의 양태에서, 본 발명은 바람직하게는 시험관내 또는 생체외에서의 게놈 편집을 위한, 또는 비-인간 및/또는 비-동물 유기체의 게놈 편집을 위한 본원에 기재된 바와 같은 본 발명에 따른 Cpf1 폴리펩티드, 폴리뉴클레오티드, 벡터, 벡터 시스템, 복합체, 전달 시스템 또는 숙주 세포의 용도에 관한 것이다. 또 다른 양태에서, 본 발명은 DNA 표적 유전자좌를 변형시키거나 표적화하는데 사용하기 위한 본원에 기재된 바와 같은 본 발명에 따른 Cpf1 폴리펩티드, 폴리뉴클레오티드, 벡터, 벡터 시스템, 복합체, 전달 시스템, 숙주 세포 또는 조성물에 관한 것이다. 또 다른 양태에서, 본 발명은 게놈 편집에 사용하기 위한 본원에 기재된 바와 같은 본 발명에 따른 Cpf1 폴리펩티드, 폴리뉴클레오티드, 벡터, 벡터 시스템, 복합체, 전달 시스템, 숙주 세포 또는 조성물에 관한 것이다. 추가의 양태에서, 본 발명은 치료법에 사용하기 위한 또는 약제로서 사용하기 위한 본원에 기재된 바와 같은 본 발명에 따른 Cpf1 폴리펩티드, 폴리뉴클레오티드, 벡터, 벡터 시스템, 복합체, 전달 시스템, 숙주 세포 또는 조성물에 관한 것이다. 또 다른 양태에서, 본 발명은 약제의 제조를 위한 본원에 기재된 바와 같은 본 발명에 따른 Cpf1 폴리펩티드, 폴리뉴클레오티드, 벡터, 벡터 시스템, 복합체, 전달 시스템, 숙주 세포 또는 조성물의 용도에 관한 것이다.
첨부된 청구범위는 본원에 참조로 포함된다.
명세서 전체에 걸쳐 "Cpf1"에 대하여 언급되는 경우에는 언제나, 명백하게 또는 명시적으로 다르게 지시되지 않는 한, 이러한 언급이 본원에 기재된 바와 같은 본 발명에 따른 돌연변이 Cpf1에 대한 것임이 이해될 것이다.
본 발명은 관심 표적 유전자좌와 연관된 또는 상기 관심 표적 유전자좌에서의 서열을 변형시키는 방법을 제공하며, 상기 방법은 상기 유전자좌에 본 발명에 따른 (돌연변이) Cpf1 이펙터 단백질 및 하나 이상의 핵산 성분을 포함하는 (비-천연적으로 발생하거나 조작된) 조성물을 전달하는 단계를 포함하고, 상기 이펙터 단백질은 하나 이상의 핵산 성분과 복합체를 형성하고, 관심 유전자좌로의 상기 복합체의 결합시에 이펙터 단백질은 관심 표적 유전자좌와 연관된 또는 관심 표적 유전자좌에서의 서열 또는 서열의 기능성(예를 들어, 전사 활성화 또는 억제)의 (유전적, 후생적 또는 다른) 변형을 유도한다. 바람직한 구현예에서, 변형은 (단일 또는 이중) 가닥 파손의 도입이다. 바람직한 구현예에서, 관심 표적 유전자좌와 연관된 또는 관심 표적 유전자좌에서의 서열은 DNA를 포함하고, 이펙터 단백질은 하위유형 V-A CRISPR-Cas 유전자좌 또는 하위유형 V-B CRISPR-Cas 유전자좌에 의해 인코딩된다.
용어 Cas 효소, CRISPR 효소, CRISPR 단백질 Cas 단백질 및 CRISPR Cas는 일반적으로 상호교환적으로 사용되며 본원에서 모든 판단 기준에서, Cas9에 대한 구체적인 언급에 의하는 것과 같이 달리 명백한 경우를 제외하고, 유추하여 본 출원에 추가로 기재된 신규 CRISPR 이펙터 단백질을 말한다. 본원에 기재된 CRISPR 이펙터 단백질은 바람직하게 본원에 기재된 바와 같은 본 발명에 따른 (돌연변이) Cpf1 이펙터 단백질이다.
본 발명은 관심 표적 유전자좌와 연관된 또는 관심 표적 유전자좌에서의 서열을 변형시키는 방법을 제공하며, 상기 방법은 상기 유전자좌와 연관된 또는 상기 유전자좌에서의 상기 서열에 본원에 기재된 바와 같은 본 발명에 따른 Cpf1 유전자좌 이펙터 단백질 및 하나 이상의 핵산 성분을 포함하는 (비천연적으로 발생하거나 조작된) 조성물을 전달하는 단계를 포함하고, 상기 Cpf1 이펙터 단백질은 하나 이상의 핵산 성분와 복합체를 형성하며 관심이 있는 유전자좌에 상기 복합체의 결합시 이펙터 단백질은 관심 표적 유전자좌와 연관되거나 상기 표적 유전자좌에서 서열 또는 서열의 기능성(예를 들어, 전사 활성화 또는 억제)의 (유전적, 후생적 또는 다른) 변형을 유도한다. 바람직한 구현예에서, 변형은 (단일 또는 이중) 가닥 파손의 도입이다. 바람직한 구현예에서, Cpf1 이펙터 단백질은 하나의 핵산 성분; 유리하게는 조작되거나 비천연적으로 발생하는 핵산 성분와 복합체를 형성한다. 관심 표적 유전자좌와 연관되거나 상기 표적 유전자좌에서의 서열의 변형의 도입은 Cpf1 이펙터 단백질-핵산으로 인도될 수 있다. 바람직한 구현예에서, 하나의 핵산 성분은 CRISPR RNA(crRNA)이다. 바람직한 구현예에서, 하나의 핵산 성분은 성숙 crRNA 또는 가이드 RNA이며, 상기 성숙 crRNA 또는 가이드 RNA는 스페이서 서열(또는 가이드 서열) 및 직접 반복부 서열 또는 이들의 유도체를 포함한다. 바람직한 구현예에서, 스페이서 서열 또는 이의 유도체는 씨드(seed) 서열을 포함하며, 상기 씨드 서열은 표적 유전자좌에서 서열에 대한 인식 및/또는 혼성화에 중요하다. 바람직한 구현예에서, 본원에 기재된 바와 같은 본 발명에 따른 Cpf1은 AsCpf1(아시다미노코커스 종, 예컨대 아시다미노코커스 종 BV3L6) 또는 LbCpf1(라크노스피라세아에 박테리움(Lachnospiraceae bacterium), 예컨대 라크노스피라세아에 박테리움 MA2020 또는 라크노스피라세아에 박테리움 ND2006)이다. 바람직한 구현예에서, FnCpf1 가이드 RNA의 씨드 서열은 스페이서 서열(또는 가이드 서열)의 5' 말단 상의 대략 처음 5 nt 이내에 존재한다. 바람직한 구현예에서, 가닥 파손은 5' 오버행을 가지는 엇갈린(staggered) 절단이다. 바람직한 구현예에서, 관심 표적 유전자좌와 연관된 또는 관심 표적 유전자좌에서의 서열은 선형 또는 초나선 DNA(super coiled DNA)를 포함한다.
본 발명의 양태는 하나 이상의 (비천연적으로 발생하거나 조작되거나 변형되거나 최적화된) 핵산 성분을 가지는 본원에 기재된 바와 같은 본 발명에 따른 Cpf1 이펙터 단백질 복합체에 관한 것이다. 바람직한 구현예에서, 상기 복합체의 핵산 성분은 직접 반복부 서열에 연결된 가이드 서열을 포함할 수 있으며, 상기 직접 반복부 서열은 하나 이상의 줄기 루프(stem loop) 또는 최적화된 2차 구조를 포함한다. 바람직한 구현예에서, 직접 반복부는 최소한의 길이가 16 nt이고 단일 줄기 루프를 가진다. 추가 구현예에서, 직접 반복부는 길이가 16 nt보다 더 길며, 바람직하게는 17 nt 초과이고, 하나 초과의 줄기 루프 또는 최적화된 2차 구조를 가진다. 바람직한 구현예에서, 직접 반복부는 변형되어 하나 이상의 단백질-결합 RNA 압타머를 포함할 수 있다. 바람직한 구현예에서, 최적화된 2차 구조의 일부와 같은 하나 이상의 압타머가 포함될 수 있다. 이러한 압타머는 박테리오파지 코트 단백질에 결합할 수 있다. 박테리오파지 코트 단백질은 Qβ, F2, GA, fr, JP501, MS2, M12, R17, BZ13, JP34, JP500, KU1, M11, MX1, TW18, VK, SP, FI, ID2, NL95, TW19, AP205, ΦCb5, ΦCb8r, ΦCb12r, ΦCb23r, 7s 및 PRR1을 포함하는 군으로부터 선택될 수 있다. 바람직한 구현예에서, 박테리아파지 코트 단백질은 MS2이다. 본 발명은 또한 길이가 30 개 이상, 40 개 이상 또는 50 개 이상의 뉴클레오티드인 복합체의 핵산 성분을 제공한다.
본 발명은 게놈 편집 방법을 제공하며, 상기 방법은 2 회 이상 라운드의 Cpf1 이펙터 단백질 표적화 및 절단을 포함한다. 특정 구현예에서, 제1 라운드는 씨드 서열로부터 멀리 떨어진 표적 유전자좌와 연관된 Cpf1 이펙터 단백질 절단 서열을 포함하고 제2 라운드는 표적 유전자좌에서 Cpf1 이펙터 단백질 절단 서열을 포함한다. 본 발명의 바람직한 구현예에서, Cpf1 이펙터 단백질에 의한 표적화의 제1 라운드는 삽입결실(indel) 부위를 초래하고, Cpf1 이펙터 단백질에 의한 표적화의 제2 라운드는 상동 직접 수복(homology directed repair; HDR)을 통해 수복될 수 있다. 본 발명의 가장 바람직한 구현예에서, Cpf1 이펙터 단백질에 의한 표적화의 하나 이상의 라운드는 수복 주형의 삽입으로 수복될 수 있는 엇갈린 절단을 초래한다.
본 발명은 관심 표적 유전자좌와 연관된 또는 상기 표적 유전자좌에서의 서열을 변형시키거나 게놈 편집하는 방법을 제공하며, 상기 방법은 임의의 원하는 세포 유형, 원핵 또는 진핵 세포로 Cpf1 이펙터 단백질 복합체를 도입하여 Cpf1 이펙터 단백질 복합체가 효과적으로 진핵 또는 원핵 세포의 게놈 내로 DNA 삽입물을 통합시키는 작용을 하는 단계를 포함한다. 바람직한 구현예에서, 세포는 진핵 세포이고 게놈은 포유동물 게놈이다. 바람직한 구현예에서, DNA 삽입물의 통합은 비-상동성 말단 접합(non-homologous end joining; NHEJ)-기반 유전자 삽입 메커니즘에 의해 촉진된다. 바람직한 구현예에서, DNA 삽입물은 외인성으로 도입된 DNA 주형 또는 수복 주형이다. 바람직한 일 구현예에서, 외인성으로 도입된 DNA 주형 또는 수복 주형은 복합체의 성분의 발현을 위하여 Cpf1 이펙터 단백질 복합체 또는 하나의 성분 또는 폴리뉴클레오티드 벡터와 함께 전달된다. 더 바람직한 구현예에서, 진핵 세포는 비분할 세포(예를 들어 HDR을 통한 게놈 편집이 특히 어려운 비분할 세포)이다. 인간 세포에서 게놈 편집의 바람직한 방법에서, Cpf1 이펙터 단백질은 FnCpf1, AsCpf1 및 LbCpf1 이펙터 단백질을 포함할 수 있지만 이에 한정되지는 않는다.
이러한 방법에서, 관심 표적 유전자좌는 시험관 내에서 DNA 분자에 포함될 수 있다. 바람직한 구현예에서, DNA 분자는 플라스미드이다.
이러한 방법에서, 관심 표적 유전자좌는 세포 내 DNA 분자에 포함될 수 있다. 세포는 원핵 세포 또는 진핵 세포일 수 있다. 세포는 포유동물 세포일 수 있다. 포유동물 세포는 비인간 영장류, 소, 돼지, 설치류 또는 마우스 세포일 수 있다. 세포는 비포유동물 진핵 세포, 예컨대 가금류, 어류 또는 새우일 수 있다. 세포는 또한 식물 세포일 수 있다. 식물 세포는 농작물, 예컨대 카사바, 옥수수, 수수, 밀, 또는 쌀의 것일 수 있다. 식물 세포는 또한 조류, 수목 또는 채소의 것일 수 있다. 본 발명에 의해 세포에 도입된 변형은, 세포 및 세포의 자손이 생물학적 생성물, 예컨대 항체, 전분, 알코올 또는 기타 다른 원하는 세포 산출물의 개선된 생성을 위하여 변경되도록 하는 것일 수 있다. 본 발명에 의해 세포에 도입된 변형은 세포 및 세포의 자손이 생성된 생물학적 생성물을 변화시키는 변경을 포함하도록 하는 것일 수 있다.
바람직한 구현예에서, 관심 표적 유전자좌는 DNA를 포함한다.
이러한 방법에서, 관심 표적 유전자는 세포 내 DNA 분자에 포함될 수 있다. 세포는 원핵 세포 또는 진핵 세포일 수 있다. 세포는 포유동물 세포일 수 있다. 포유동물 세포는 비인간 포유동물, 예를 들어 영장류, 소, 양, 돼지, 개, 설치류, 토끼과, 예컨대 원숭이, 소, 양, 돼지, 개, 토끼, 래트 또는 마우스 세포일수 있다. 세포는 비인간 진핵 세포, 예컨대 가금류 조류(예를 들어, 닭), 척추동물 어류(예를 들어, 연어) 또는 패류(예를 들어, 굴, 조개, 바닷가재, 새우) 세포일 수 있다. 세포는 또한 식물 세포일 수 있다. 식물 세포는 외떡잎식물 또는 쌍떡잎식물의 것 또는 작물 또는 곡물 식물, 예컨대 카사바, 옥수수, 수수, 대두, 밀, 귀리 또는 쌀의 것일 수 있다. 식물 세포는 또한 조류, 수목 또는 생산성 식물, 과일 또는 채소(예를 들어, 수목, 예컨대 감귤 나무, 예를 들어 오렌지, 자몽 또는 레몬 나무; 복숭아 또는 넥타린 나무; 사과 또는 배 나무; 견과류 나무, 예컨대 아몬드 또는 호두 또는 피스타치오 나무; 가지속 식물; 유채속(Brassica)의 식물; 락투카(Lactuca) 속의 식물; 시금치(Spinacia;) 속; 고추속(Capsicum)의 식물; 목화, 담배, 아스파라거스, 당근, 양배추, 브로콜리, 콜리플라워, 토마토, 가지, 후추, 상추, 시금치, 딸기, 블루베리, 라즈베리, 블랙베리, 포도, 커피, 코코아 등)의 것일 수 있다.
기재된 방법 중 임의의 것에서, 관심 표적 유전자좌는 관심 게놈 또는 후생유전체 유전자좌일 수 있다. 기재된 방법 중 임의의 것에서, 복합체는 다중화된 사용을 위하여 다수의 가이드와 함께 전달될 수 있다. 기재된 방법 중 임의의 것에서 하나 초과의 단백질(들)이 사용될 수 있다.
본 발명의 바람직한 구현예에서, 관심 표적 유전자좌와 연관되거나 상기 표적 유전자좌에서의 서열의 생화학적 또는 시험관 내 또는 생체내 절단은 추정상의 전사촉진(transactivating) crRNA(tracr RNA) 없이, 예를 들어 Cpf1 이펙터 단백질에 의한 절단을 초래한다. 본 발명의 다른 구현예에서, 절단은 추정상의 전사촉진 crRNA(tracr RNA) 서열을 이용하여, 예를 들어 기타 다른 CRISPR 패밀리 이펙터 단백질의 절단을 초래할 수 있지만, Cpf1 유전자좌의 평가 후, 출원인은 Cpf1 이펙터 단백질 복합체에 의한 표적 DNA 절단이 tracrRNA를 필요로 하지 않는다고 결론지었다. 출원인은 단지 Cpf1 이펙터 단백질 및 crRNA(직접 반복부 서열 및 가이드 서열을 포함하는 가이드 RNA)를 포함하는 Cpf1 이펙터 단백질 복합체가 표적 DNA를 절단하는 데 충분하였음을 알아내었다. 바람직한 구현예에서, Cpf1 이펙터 단백질은 AsCpf1 또는 LbCpf1이다.
기재된 방법 중 임의의 것에서, 이펙터 단백질(예를 들어, Cpf1) 및 핵산 성분은 단백질 및/또는 핵산 성분(들)을 인코딩하는 하나 이상의 폴리뉴클레오티드 분자를 통해 제공될 수 있으며, 여기서 하나 이상의 폴리뉴클레오티드 분자는 작동가능하게 구성되어 단백질 및/또는 핵산 성분(들)을 발현한다. 하나 이상의 폴리뉴클레오티드 분자는 작동가능하게 구성되어 단백질 및/또는 핵산 성분(들)을 발현하는 하나 이상의 조절 요소를 포함할 수 있다. 하나 이상의 폴리뉴클레오티드 분자는 하나 이상의 벡터 내에 포함될 수 있다. 본 발명은 이러한 폴리뉴클레오티드 분자(들), 예를 들어 작동가능하게 구성되어 단백질 및/또는 핵산 성분(들)을 발현하는 폴리뉴클레오티드 분자뿐만 아니라, 이러한 벡터(들)를 포괄한다.
기재된 방법 중 임의의 것에서, 가닥 파손은 단일 가닥 파손 또는 이중 가닥 파손일 수 있다.
조절 요소는 유도 프로모터를 포함할 수 있다. 폴리뉴클레오티드 및/또는 벡터 시스템은 유도 시스템을 포함할 수 있다.
기재된 방법 중 임의의 것에서, 하나 이상의 폴리뉴클레오티드 분자가 전달 시스템에 포함될 수 있거나, 하나 이상의 벡터가 전달 시스템에 포함될 수 있다.
기재된 방법 중 임의의 것에서, (비천연적으로 발생하거나 조작된) 조성물은 리포좀, 입자(예를 들어, 나노입자), 엑소좀, 미세소포, 유전자총 또는 하나 이상의 벡터, 예를 들어 핵산 분자 또는 바이러스 벡터를 통해 전달될 수 있다.
본 발명은 또한 본원에서 논의되거나 본원에 기재된 방법 중 임의의 것에서 정의된 바와 같은 특징을 가지는 조성물인 비천연적으로 발생하거나 조작된 조성물을 제공한다.
본 발명은 또한 하나 이상의 벡터를 포함하는 벡터 시스템을 제공하며, 상기 하나 이상의 벡터는 본원에서 논의되거나 본원에 기재된 방법 중 임의의 것에서 정의된 바와 같은 특징을 가지는 조성물인 (비천연적으로 발생하거나 조작된) 조성물의 성분을 암호화하는 하나 이상의 폴리뉴클레오티드 분자를 포함한다.
본 발명은 또한 하나 이상의 벡터 또는 하나 이상의 폴리뉴클레오티드 분자를 포함하는 전달 시스템을 제공하며, 상기 하나 이상의 벡터 또는 폴리뉴클레오티드 분자는 본원에서 논의되거나 본원에 기재된 방법 중 임의의 것에서 정의된 바와 같은 특징을 가지는 조성물인 (비천연적으로 발생하거나 조작된) 조성물의 성분을 암호화하는 하나 이상의 폴리뉴클레오티드 분자를 포함한다.
본 발명은 또한 (비천연적으로 발생하거나 조작된) 조성물, 또는 상기 조성물의 성분을 암호화하는 하나 이상의 폴리뉴클레오티드, 또는 치료의 치료 방법에서 사용하기 위한 상기 조성물의 성분을 암호화하는 하나 이상의 폴리뉴클레오티드를 포함하는 벡터 또는 전달 시스템을 제공한다. 치료의 치료 방법은 유전자 또는 게놈 편집, 또는 유전자 요법을 포함할 수 있다.
본 발명은 또한 이펙터 단백질, 예를 들어 조작되거나 비천연적으로 발생하는 이펙터 단백질 또는 Cpf1의 하나 이상의 추가의 아미노산 잔기가 변형될 수 있는 방법 및 조성물을 제공한다. 일 구현예에서, 상기 변형은 이펙터 단백질의 하나 이상의 아미노사 잔기의 돌연변이를 포함할 수 있다. 하나 이상의 돌연변이는 이펙터 단백질의 하나 이상의 촉매적으로 활성인 도메인에 존재할 수 있다. 이펙터 단백질은 상기 하나 이상의 돌연변이가 없는 이펙터 단백질과 비교하여 감소되거나 제거된 뉴클레아제 활성을 가질 수 있다. 이펙터 단백질은 관심 표적 유전자좌에서 하나 또는 기타 다른 DNA 가닥의 절단을 지시하지 않을 수 있다. 이펙터 단백질은 관심 표적 유전자좌에서 DNA 가닥의 절단을 지시하지 않을 수 있다. 바람직한 구현예에서, 하나 이상의 돌연변이는 2 개의 돌연변이를 포함할 수 있다. 바람직한 구현예에서, 하나 이상의 아미노산 잔기는 Cpf1 이펙터 단백질, 예를 들어 조작되거나 비천연적으로 발생하는 이펙터 단백질 또는 Cpf1에서 변형된다. 바람직한 구현예에서, Cpf1 이펙터 단백질은 AsCpf1, LbCpf1 또는 FnCpf1 이펙터 단백질이다. 바람직한 구현예에서, 하나 이상의 변형되거나 돌연변이된 아미노산 잔기는 FnCpf1 이펙터 단백질의 아미노산 위치 넘버링을 참고로 하여 D917A, E1006A 또는 D1255A이다.
본 발명은 또한 RuvC 도메인을 포함하는 이펙터 단백질의 촉매적으로 활성인 도메인에 존재하는 추가의 하나 이상의 돌연변이 또는 둘 이상의 돌연변이를 제공한다. 본 발명의 일부 구현예에서, RuvC 도메인은 RuvCI, RuvCII 또는 RuvCIII 도메인, 또는 RuvCI, RuvCII 또는 RuvCIII 도메인 등에 상동성이거나 본원에 기재된 방법 중 임의의 것에 기재된 바와 같은 임의의 관련 도메인에 상동성인 촉매적으로 활성인 도메인을 포함할 수 있다. 이펙터 단백질은 하나 이상의 이종성 기능적 도메인을 포함할 수 있다. 하나 이상의 이종성 기능적 도메인은 하나 이상의 핵 국소화 신호(nuclear localization signal; NLS) 도메인을 포함할 수 있다. 하나 이상의 이종성 기능적 도메인은 적어도 둘 이상의 NLS 도메인을 포함할 수 있다. 하나 이상의 NLS 도메인(들)은 이펙터 단백질(예를 들어, Cpf1)의 말단에 또는 상기 말단 근처에 또는 상기 말단에 근접하여 위치할 수 있으며, 둘 이상의 NLS가 있는 경우, 2 개의 NLS 각각은 이펙터 단백질(예를 들어, Cpf1)의 말단에 또는 상기 말단 근처에 또는 상기 말단에 근접하여 위치할 수 있다. 하나 이상의 이종성 기능적 도메인은 하나 이상의 전사 활성화 도메인을 포함할 수 있다. 바람직한 구현에에서, 전사 활성 도메인은 VP64를 포함할 수 있다. 하나 이상의 이종성 기능적 도메인은 하나 이상의 전사 억제 도메인을 포함할 수 있다. 바람직한 구현예에서, 전사 억제 도메인은 KRAB 도메인 또는 SID 도메인(예를 들어, SID4X)을 포함한다. 하나 이상의 이종성 기능적 도메인은 하나 이상의 뉴클레아제 도메인을 포함할 수 있다. 바람직한 구현예에서, 뉴클레아제 도메인은 Fok1을 포함한다.
본 발명은 또한 다음의 활성 중 하나 이상을 가지는 하나 이상의 이종성 기능적 도메인을 제공한다: 메틸라제 활성, 데메틸라제 활성, 전사 활성화 활성, 전사 억제 활성, 전사 방출 인자 활성, 히스톤 변형 활성, 뉴클레아제 활성, 단일-가닥 RNA 절단 활성, 이중-가닥 RNA 절단 활성, 단일-가닥 DNA 절단 활성, 이중-가닥 DNA 활성 및 핵산 결합 활성. 적어도 하나 이상의 이종성 기능적 도메인은 이펙터 단백질의 아미노-말단에 또는 상기 말단 근처에 존재할 수 있고, 있거나 여기서 적어도 하나 이상의 이종성 기능적 도메인은 이펙터 단백질의 카르복시-말단에 또는 상기 말단 근처에 존재한다. 하나 이상의 이종성 기능적 도메인은 이펙터 단백질과 융합될 수 있다. 하나 이상의 이종성 기능적 도메인은 이펙터 단백질에 묶일 수 있다. 하나 이상의 이종성 기능적 도메인은 링커 모이어티에 의해 이펙터 단백질에 연결될 수 있다.
일부 구현예에서, 기능적 도메인은 데아미나제, 예컨대 시티딘 데아미나제이다. 시티딘 데아미나제는 표적 핵산으로 지향될 수 있으며, 여기서, 이는 시티딘에서 우리딘으로의 전환을 유도하여, C에서 T로의 치환을 초래한다(상보 가닥에서는 G에서 A로). 이러한 구현예에서, 뉴클레오티드 치환은 DNA 절단 없이 시행될 수 있다.
일부 구현예에서, 본 발명은 데아미나제에 융합된 제V형 CRISPR 이펙터를 포함하는 표적화된 염기 에디터(base editor)에 관한 것이다. 제II형 CRISPR 이펙터에 기초한 표적화된 염기 에디터는 문헌[Komor et al., Nature (2016) 533:420-424]; 문헌[Kim et al., Nature Biotechnology (2017) 35:371-376]; 문헌[Shimatani et al., Nature Biotechnology (2017) doi:10.1038/nbt.3833]; 및 문헌[Zong et al., Nature Biotechnology (2017) doi:10.1038/nbt.3811]에 기재되어 있으며, 이의 각각은 그의 전체가 참조로 포함된다.
일부 구현예에서, 표적화된 염기 에디터는 시티딘 데아미나제에 융합된 Cpf1 이펙터 단백질을 포함한다. 일부 구현예에서, 시티딘 데아미나제는 Cpf1 이펙터 단백질의 카복시 말단에 융합된다. 일부 구현예에서, Cpf1 이펙터 단백질 및 시티딘 데아미나제는 링커를 통해 융합된다. 다양한 구현예에서, 링커는 상이한 길이 및 조성을 가질 수 있다. 일부 구현예에서, 링커 서열의 길이는 약 3 내지 약 21 개 아미노산 잔기의 범위이다. 일부 구현예에서, 링커 서열의 길이는 9 개 초과의 아미노산 잔기이다. 일부 구현예에서, 링커 서열의 길이는 약 16 개의 아미노산 잔기이다. 일부 구현예에서, Cpf1 이펙터 단백질 및 시티딘 데아미나제는 XTEN 링커를 통해 융합된다.
일부 구현예에서, 시티딘 데아미나제는 진핵 기원의 것, 예컨대 인간, 랫트 또는 칠성장어 기원의 것이다. 일부 구현예에서, 시티딘 데아미나제는 AID, APOBEC3G, APOBEC1 또는 CDA1이다. 일부 구현예에서, 표적화된 염기 에디터는 염기 절제 수복(BER)을 억제하는 도메인을 추가로 포함된다. 일부 구현예에서, 표적화된 염기 에디터는 Cpf1 이펙터 단백질 또는 시티딘 데아미나제에 융합된 우라실 DNA 글리코실라제 억제제(UGI)를 추가로 포함한다.
일부 구현예에서, 시티딘 데아미나제는 탈아미노화 편집에 감수성인 뉴클레오티드를 포함하는 효율적인 탈아미노화 창을 갖는다. 따라서, 일부 구현예에서, "편집 창 폭"은 시티딘 데아미나제의 편집 효율이 표적 부위에 대하여 반수-최대 값을 초과하는 주어진 표적 부위에서의 뉴클레오티드 위치의 수를 말한다. 일부 구현예에서, 시티딘 데아미나제는 약 1 내지 약 6 개의 범위의 뉴클레오티드의 편집 창 폭을 갖는다. 일부 구현예에서, 시티딘 데아미나제의 편집 창 폭은 1, 2, 3, 4, 5 또는 6 개 뉴클레오티드이다.
이론에 구애되고자 하지 않고, 일부 구현예에서, 링커 서열의 길이가 편집 창 폭에 영향을 미치는 것으로 고려된다. 일부 구현예에서, 편집 창 폭은 링커 길이가 약 3 개에서 21 개의 아미노산으로 연장되는 경우 약 3 개에서 6 개의 뉴클레오티드로 증가한다. 일부 구현예에서, 16-잔기 링커는 약 5개 뉴클레오티드의 효율적인 탈아미노화 창을 제공한다. 일부 구현예에서, 가이드 RNA의 길이는 편집 창 폭에 영향을 미친다. 일부 구현예에서, 가이드 RNA의 단축은 시티딘 데아미나제의 좁은 효율적인 탈아미노화 창을 야기한다.
일부 구현예에서, 시티딘 데아미나제에 대한 돌연변이는 편집 창 폭에 영향을 미친다. 일부 구현예에서, 표적화된 염기 에디터는 데아미나제가 DNA 결합 사건당 다수의 시티딘의 탈아미노화를 방지하도록 시티딘 데아미나제의 촉매 효율을 감소시키는 하나 이상의 돌연변이를 포함한다. 일부 구현예에서, APOBEC1의 잔기 90에서의 트립토판(W90) 또는 상동성 서열에서의 상응하는 트립토판 잔기가 돌연변이된다. 일부 구현예에서, Cpf1 이펙터 단백질은 W90Y 또는 W90F 돌연변이를 포함하는 APOBEC1 돌연변이체에 융합된다. 일부 구현예에서, APOBEC3G의 잔기 285의 트립토판(W285) 또는 상동성 서열에서의 상응하는 트립토판 잔기가 돌연변이된다. 일부 구현예에서, Cpf1 이펙터 단백질은 W285Y 또는 W285F 돌연변이를 포함하는 APOBEC3G 돌연변이체에 융합된다.
일부 구현예에서, 표적화된 염기 에디터는 데아미나제 활성 부위로의 최적이 아닌 시티딘의 제시에 대한 내성을 감소시키는 하나 이상의 돌연변이를 포함한다. 일부 구현예에서, 시티딘 데아미나제는 데아미나제 활성 부위의 기질 결합 활성을 변경시키는 하나 이상의 돌연변이를 포함한다. 일부 구현예에서, 시티딘 데아미나제는 인식되고, 데아미나제 활성 부위에 의해 결합될 DNA의 입체형태를 변경시키는 하나 이상의 돌연변이를 포함한다. 일부 구현예에서, 시티딘 데아미나제는 데아미나제 활성 부위에 대한 기질 접근 가능성을 변경시키는 하나 이상의 돌연변이를 포함한다. 일부 구현예에서, APOBEC1의 잔기 126의 아르기닌(R126) 또는 상동성 서열에서의 상응하는 아르기닌 잔기가 돌연변이된다. 일부 구현예에서, Cpf1 이펙터 단백질은 R126A 또는 R126E 돌연변이를 포함하는 APOBEC1에 융합된다. 일부 구현예에서, APOBEC3G의 잔기 320의 트립토판(R320) 또는 상동성 서열에서의 상응하는 아르기닌 잔기가 돌연변이된다. 일부 구현예에서, Cpf1 이펙터 단백질은 R320A 또는 R320E 돌연변이를 포함하는 APOBEC3G 돌연변이체에 융합된다. 일부 구현예에서, APOBEC1의 잔기 132의 아르기닌(R132) 또는 상동성 서열에서의 상응하는 아르기닌 잔기가 돌연변이된다. 일부 구현예에서, Cpf1 이펙터 단백질은 R132E 돌연변이를 포함하는 APOBEC1 돌연변이체에 융합된다.
일부 구현예에서, 표적화된 염기 에디터의 APOBEC1 도메인은 W90Y, W90F, R126A, R126E 및 R132E로부터 선택되는 1, 2 또는 3 개의 돌연변이를 포함한다. 일부 구현예에서, APOBEC1 도메인은 W90Y 및 R126E의 이중 돌연변이를 포함한다. 일부 구현예에서, APOBEC1 도메인은 W90Y 및 R132E의 이중 돌연변이를 포함한다. 일부 구현예에서, APOBEC1 도메인은 R126E 및 R132E의 이중 돌연변이를 포함한다. 일부 구현예에서, APOBEC1 도메인은 W90Y, R126E 및 R132E의 3개의 돌연변이를 포함한다.
일부 구현예에서, 본원에 개시된 바와 같은 시티딘 데아미나제의 하나 이상의 돌연변이는 편집 창 폭을 약 2 개의 뉴클레오티드로 감소시킨다. 일부 구현예에서, 본원에 개시된 바와 같은 시티딘 데아미나제의 하나 이상의 돌연변이는 편집 창 폭을 약 1 개의 뉴클레오티드로 감소시킨다. 일부 구현예에서, 본원에 개시된 바와 같은 시티딘 데아미나제의 하나 이상의 돌연변이는 효소의 편집 효율에 오직 최소로 또는 중등으로 영향을 미치면서, 편집 창 폭을 감소시킨다. 일부 구현예에서, 본원에 개시된 바와 같은 시티딘 데아미나제의 하나 이상의 돌연변이는 효소의 편집 효율을 감소시키지 않고, 편집 창 폭을 감소시킨다. 일부 구현예에서, 본원에 개시된 바와 같은 시티딘 데아미나제의 하나 이상의 돌연변이는 다르게 시티딘 데아미나제에 의하여 유사한 효율로 편집될 이웃 시티딘 뉴클레오티드의 식별을 가능하게 한다.
일부 구현예에서, Cpf1 이펙터 단백질은 촉매적 비활성 RuvC 도메인을 갖는 데드(dead) Cpf1이다(예를 들어, AsCpf1 D908A, AsCpf1 E993A, AsCpf1 D1263A, LbCpf1 D832A, LbCpf1 E925A, LbCpf1 D947A 및 LbCpf1 D1180A). 일부 구현예에서, Cpf1 이펙터 단백질은 촉매적 비활성 Nuc 도메인을 갖는 Cpf1 닉카제이다(예를 들어, AsCpf1 R1226A).
일부 구현예에서, Cpf1 이펙터 단백질은 표적 DNA 상의 프로토스페이서-인접 모티프(PAM) 서열을 인식한다. 일부 구현예에서, PAM은 표적 시티딘의 상류 또는 하류이다. 일부 구현예에서, Cpf1 이펙터 단백질과 PAM 서열 간의 상호작용은 표적 시티딘을 시티딘 데아미나제의 효율적인 탈아미노화 창 내에 배치한다. 일부 구현예에서, Cpf1 이펙터 단백질의 PAM 특이성은 표적화된 염기 에디터에 의해 편집될 수 있는 부위를 결정한다. 일부 구현예에서, Cpf1 이펙터 단백질은 V가 A/C 또는 G인 TTTV(예를 들어, 야생형 AsCpf1 또는 LbCpf1) 및 N이 A/C/G 또는 T인 TTN(예를 들어, 야생형 FnCpf1)을 포함하나 이에 제한되지 않는 하나 이상의 PAM 서열을 인식할 수 있다. 일부 구현예에서, Cpf1 이펙터 단백질은 변경된 PAM 서열을 초래하는 하나 이상의 아미노산 돌연변이를 포함한다. 예를 들어, Cpf1 이펙터 단백질은 S542(예를 들어, S542R), K548(예를 들어, K548V), N552(예를 들어, N552R) 또는 K607(예를 들어, K607R)에서 하나 이상의 아미노산 돌연변이를 포함하는 AsCpf1 돌연변이체 또는 G532(예를 들어, G532R), K538(예를 들어, K538V), Y542(예를 들어, Y542R) 또는 K595(예를 들어, K595R)에서 하나 이상의 아미노산 돌연변이를 포함하는 LbCpf1 돌연변이체일 수 있다.
WO2016022363호에는 또한, RNA-프로그램가능한 엔도뉴클레아제, 예컨대 Cas9의 활성을 제어하기 위한 또는 기능적 이펙터 도메인, 예컨대 뉴클레아제, 닉카제, 재조합효소, 데아미나제, 전사 활성화인자, 전사 억제인자 또는 후생적 변형 도메인에 융합된 Cas9 변이체를 포함하는 단백질의 활성을 제어하기 위한 조성물, 방법, 시스템 및 키트가 기재되어 있다. 따라서, 유사한 Cpf1 융합 단백질이 본원에 제공되어 있다. 특정 구현예에서, Cpf1 융합 단백질은 리간드-의존적 인테인을 포함하며, 이의 존재는 단백질의 하나 이상의 활성(예를 들어, gRNA 결합, 효소 활성, 표적 DNA 결합)을 억제한다. 인테인으로의 리간드의 결합은 인테인의 자가-절제를 초래하여, 단백질의 활성을 복구시킨다.
일부 구현예에서, 본 발명은 상기 기재된 표적화된 염기 에디터를 가이드 핵산과 동시에 또는 이와 순차적으로 원핵 또는 진핵 세포, 바람직하게는 포유류 세포와 접촉시키는 단계를 포함하는 표적화된 염기 편집 방법에 관한 것이며, 가이드 핵산은 Cpf1 이펙터 단백질과 복합체를 형성하며, 복합체가 세포 내의 표적 DNA의 주형 가닥에 결합되게 하며, 시티딘 데아미나제는 표적 DNA의 비-주형 가닥에서 C를 U로 전환시킨다. 일부 구현예에서, Cpf1 이펙터 단백질은 편집된 U 반대편에 G를 함유하는 주형/비-편집된 가닥을 닉킹시킨다.
본 발명은 또한 스트렙토코커스(Streptococcus), 캄필로박터(Campylobacter), 니트라티프락토르(Nitratifractor), 스타필로코커스(Staphylococcus), 파르비바쿨룸(Parvibaculum), 로세부리아(Roseburia), 네이세리아(Neisseria), 글루콘아세토박터(Gluconacetobacter), 아조스피릴룸(Azospirillum), 스파에로카에타(Sphaerochaeta), 락토바실러스(Lactobacillus), 유박테리움(Eubacterium), 코리네박터(Corynebacter), 카르노박테리움(Carnobacterium), 로도박터(Rhodobacter), 리스테리아(Listeria), 팔루디박터(Paludibacter), 클로스트리디움(Clostridium), 라크노스피라세아에(Lachnospiraceae), 클로스트리디아리디움(Clostridiaridium), 렙토트리키아(Leptotrichia), 프란시셀라(Francisella), 레지오넬라(Legionella), 알리사이클로바실러스(Alicyclobacillus), 메타노메티오필러스(Methanomethyophilus), 포르피로모나스(Porphyromonas), 프레보텔라(Prevotella), 박테로이데테스(Bacteroidetes), 헬코코커스(Helcococcus), 레토스피라(Letospira), 데설포비브리오(Desulfovibrio), 데설포나트로눔(Desulfonatronum), 오피투타세아에(Opitutaceae), 투베리바실러스(Tuberibacillus), 바실러스(Bacillus), 브레비바실러스(Brevibacilus), 메틸로박테리움(Methylobacterium) 또는 아시다미노코커스(Acidaminococcus)를 포함하는 속으로부터의 유기체 유래의 Cpf1 이펙터 단백질을 포함하는 본원에 기재된 바와 같은 Cpf1 이펙터 단백질을 제공한다.
본 발명은 또한 에스. 뮤탄스(S. mutans), 에스. 아갈락티아에(S. agalactiae), 에스. 에퀴시밀리스(S. equisimilis), 에스. 상귀니스(S. sanguinis), 에스. 뉴모니아(S. pneumonia); 씨. 제주니(C. jejuni), 씨. 콜리(C. coli); 엔. 살수기니스(N. salsuginis), 엔. 테르가르쿠스(N. tergarcus); 에스. 아우리쿨라리스(S. auricularis), 에스. 카르노수스(S. carnosus); 엔. 메닌기티데스(N. meningitides), 엔. 고노로에아에(N. gonorrhoeae); 엘. 모노사이토게네스(L. monocytogenes), 엘. 이바노비(L. ivanovii); 씨. 보툴리눔(C. botulinum), 씨. 디피실레(C. difficile), 씨. 테타니(C. tetani), 씨. 소르델리(C. sordellii)로부터의 유기체 유래의 Cpf1 이펙터 단백질을 포함하는 Cpf1 이펙터 단백질을 제공한다.
이펙터 단백질은 제1 이펙터 단백질 오솔로그 유래의 제1 단편 및 제2 Cpf1 이펙터 단백질 오솔로그 유래의 제2 단편을 포함하는 키메라 이펙터 단백질을 포함할 수 있으며, 여기서 상기 제1 및 제2 이펙터 단백질 오솔로그는 상이하다. 제1 및 제2 이펙터 단백질 오솔로그 중 적어도 하나는 스트렙토코커스, 캄필로박터, 니트라티프락토르, 스타필로코커스, 파르비바쿨룸, 로세부리아, 네이세리아, 글루콘아세토박터, 아조스피릴룸, 스파에로카에타, 락토바실러스, 유박테리움, 코리네박터, 카르노박테리움, 로도박터, 리스테리아, 팔루디박터, 클로스트리디움, 라크노스피라세아에, 클로스트리디아리디움, 렙토트리키아, 프란시셀라, 레지오넬라, 알리사이클로바실러스, 메타노메티오필러스, 포르피로모나스, 프레보텔라, 박테로이데테스, 헬코코커스, 레토스피라, 데설포비브리오, 데설포나트로눔, 오피투타세아에, 투베리바실러스, 바실러스, 브레비바실러스, 메틸로박테리움 또는 아시다미노코커스를 포함하는 유기체 유래의 이펙터 단백질; 예를 들어, 제1 및 제2 단편 각각이 스트렙토코커스, 캄필로박터, 니트라티프락토르, 스타필로코커스, 파르비바쿨룸, 로세부리아, 네이세리아, 글루콘아세토박터, 아조스피릴룸, 스파에로카에타, 락토바실러스, 유박테리움, 코리네박터, 카르노박테리움, 로도박터, 리스테리아, 팔루디박터, 클로스트리디움, 라크노스피라세아에, 클로스트리디아리디움, 렙토트리키아, 프란시셀라, 레지오넬라, 알리사이클로바실러스, 메타노메티오필러스, 포르피로모나스, 프레보텔라, 박테로이데테스, 헬코코커스, 레토스피라, 데설포비브리오, 데설포나트로눔, 오피투타세아에, 투베리바실러스, 바실러스, 브레비바실러스, 메틸로박테리움 또는 아시다미노코커스를 포함하는 유기체의 Cpf1로부터 선택되는 제1 단편 및 제2 단편을 포함하는 키메라 이펙터 단백질을 포함할 수 있으며, 제1 및 제2 단편은 동일한 박테리아 유래가 아니고; 예를 들어 키메라 이펙터 단백질은 제1 단편 및 제2 단편 각각이 에스. 뮤탄스, 에스. 아갈락티아에, 에스. 에퀴시밀리스, 에스. 상귀니스, 에스. 뉴모니아; 씨. 제주니, 씨. 콜리; 엔. 살수기니스, 엔. 테르가르쿠스; 에스. 아우리쿨라리스(S. auricularis), 에스. 카르노수스; 엔. 메닌기티데스, 엔. 고노로에아에; 엘. 모노사이토게네스, 엘. 이바노비; 씨. 보툴리눔, 씨. 디피실레, 씨. 테타니, 씨. 소르델리; 프란시셀라 툴라렌시스 1(Francisella tularensis 1), 프레보텔라 알벤시스(Prevotella albensis), 라크노스피라세아에 박테리움 MC2017 1(라크노스피라세아에 박테리움 MC2017 1), 부티리비브리오 프로테오클라스티쿠스(Butyrivibrio proteoclasticus), 페레그리니박테리아 박테리움 GW2011_GWA2_33_10(Peregrinibacteria bacterium GW2011_GWA2_33_10), 파르쿠박테리아 박테리움 GW2011_GWC2_44_17(Parcubacteria bacterium GW2011_GWC2_44_17), 스미텔라 종 SCADC(Smithella sp. SCADC), 아시다미노코커스 종 BV3L6(Acidaminococcus sp. BV3L6), 라크노스피라세아에 박테리움 MA2020(라크노스피라세아에 박테리움 MA2020), 칸디다투스 메타노플라즈마 테르미툼(Candidatus Methanoplasma termitum), 유박리테리움 엘리겐스(Eubacterium eligens), 모락셀라 보보쿨리 237(Moraxella bovoculi 237), 모락셀라 보보쿨리 AAX08_00205, 모락셀라 보보쿨리 AAX11_00205, 부티리비브리오(Butyrivibrio) 종 NC3005, 티오마이크로스피라(Thiomicrospira) 종 XS5, 렙토스피라 이나다이(Leptospira inadai), 라크노스피라세아에 박테리움 ND2006(라크노스피라세아에 박테리움 ND2006), 포르피로모나스 크레비오리카니스 3(Porphyromonas crevioricanis 3), 프레보텔라 디시엔스(Prevotella disiens) 및 포르피로모나스 마카카에(Porphyromonas macacae)의 Cpf1로부터 선택되는 제1 단편 및 제2 단편을 포함하며, 제1 및 제2 단편은 동일한 박테리아 유래가 아니다. 특정 구현예에서, Cpf1은 아시다미노코커스 종 BV3L6, 티오마이크로스피라 종 XS5, 모락셀라 보보쿨리 AAX08_00205, 모락셀라 보보쿨리 AAX11_00205 및 라크노스피라세아에 박테리움 MA2020으로부터 선택되는 유기체 유래이다.
본 발명의 바람직한 구현예에서, 이펙터 단백질은 Cpf1 유전자좌(본원에서 이러한 이펙터 단백질은 또한 "Cpf1p"로도 지칭됨)로부터 유래되며, 예를 들어 Cpf1 단백질(이러한 이펙터 단백질 또는 Cpf1 단백질 또는 Cpf1 유전자좌로부터 유래된 단백질은 또한 "CRISPR 효소"로 불림)이다. Cpf1 유전자좌는 프란시셀라 툴라렌시스 1, 프레보텔라 알벤시스, 라크노스피라세아에 박테리움 MC2017 1, 부티리비브리오 프로테오클라스티쿠스, 페레그리니박테리아 박테리움 GW2011_GWA2_33_10, 파르쿠박테리아 박테리움 GW2011_GWC2_44_17, 스미텔라 종 SCADC, 아시다미노코커스 종 BV3L6, 라크노스피라세아에 박테리움 MA2020, 칸디다투스 메타노플라즈마 테르미툼, 유박테리움 엘리겐스, 모락셀라 보보쿨리 237, 모락셀라 보보쿨리 AAX08_00205, 모락셀라 보보쿨리 AAX11_00205, 부티리비브리오 종 NC3005, 티오마이크로스피라 종 XS5, 렙토스피라 이나다이, 라크노스피라세아에 박테리움 ND2006, 포르피로모나스 크레비오리카니스 3, 프레보텔라 디시엔스 및 포르피로모나스 마카카에로부터 선택되는 박테리아 종의 Cpf1 유전자좌를 포함하나 이에 제한되지 않는다. 특정 구현예에서, Cpf1p는 아시다미노코커스 종 BV3L6, 라크노스피라세아에 박테리움 ND2006, 라크노스피라세아에 박테리움 MA2020, 모락셀라 보보쿨리 AAX08_00205, 모락셀라 보보쿨리 AAX11_00205, 부티리비브리오 종 NC3005 또는 티오마이크로스피라 종 XS5로부터 선택되는 박테리아 종으로부터 유래된다. 특정 구현예에서, Cpf1p는 아시다미노코커스 종 BV3L6 또는 라크노스피라세아에 박테리움 ND2006으로부터 선택되는 박테리아 종으로부터 유래된다. 특정 구현에에서, 이펙터 단백질은 프란시셀라 툴라렌시스 1 아종 노비시다(Francisella tularensis subsp. Novicida)를 포함하지만 이로 제한되지 않는, 프란시셀라 툴라렌시스 1의 아종으로부터 유래된다.
본 발명의 추가 구현예에서, 프로토스페이서 인접 모티프(protospacer adjacent motif; PAM) 또는 PAM-유사 모티프는 이펙터 단백질 복합체가 관심 표적 유전자좌에 결합하는 것을 지시한다. 본 발명의 바람직한 구현예에서, PAM은 5' TTN이며, 여기서 N은 A/C/G 또는 T이고 이펙터 단백질은 야생형 FnCpf1p이다. 본 발명의 또 다른 바람직한 구현예에서, PAM은 5' TTTV이며, 여기서 V는 A/C 또는 G이고 이펙터 단백질은 야생형 AsCpf1, 야생형 LbCpf1 또는 야생형 PaCpf1이다. 특정 구현예에서, PAM은 5' TTN이며, 여기서 N은 A/C/G 또는 T이고, 이펙터 단백질은 야생형 FnCpf1p이며, PAM은 프로토스페이서의 5 말단의 상류에 위치한다. 본 발명의 특정 구현예에서, PAM은 5' CTA이며, 여기서 이펙터 단백질은 야생형 FnCpf1p이고, PAM은 프로토스페이서 또는 표적 유전자좌의 5' 말단의 상류에 위치한다. 바람직한 구현예에서, 본 발명은 RNA 가이드 게놈 편집 뉴클레아제에 대한 확대된 표적화 범위를 제공하며, 여기서 Cpf1 패밀리의 T-풍부 PAM은 AT-풍부 게놈의 표적화 및 편집을 가능하게 한다.
특정 구현예에서, CRISPR 효소는 조작되어 뉴클레아제 활성을 감소시키거나 제거하는 하나 이상의 돌연변이를 포함할 수 있다. FnCpf1p RuvC 도메인 내 아미노산 위치는 D917A, E1006A, E1028A, D1227A, D1255A, N1257A, D917A, E1006A, E1028A, D1227A, D1255A 및 N1257A를 포함하지만 이에 제한되지 않는다. 출원인은 또한 PD-(D/E)XK 뉴클레아제 슈퍼패밀리 및 HincII 엔도뉴클레아제 등과 가장 유사한 추정 제2 뉴클레아제 도메인을 확인하였다. 이러한 추정 뉴클레아제 도메인에서 생성되어 실질적으로 뉴클레아제 활성을 감소시키는 점 돌연변이는 N580A, N584A, T587A, W609A, D610A, K613A, E614A, D616A, K624A, D625A, K627A 및 Y629A를 포함하지만 이에 제한되지 않는다. 바람직한 구현예에서, FnCpf1p RuvC 내 돌연변이는 D917A 또는 E1006A이며, 여기서 D917A 또는 E1006A 돌연변이는 FnCpf1 이펙터 단백질의 DNA 절단 활성을 완전히 불활성화시킨다. 또 다른 구현예에서, FnCpf1p RuvC 도메인 내 돌연변이는 D1255A이며, 여기서 돌연변이된 FnCpf1 이펙터 단백질은 상당히 감소된 핵산분해 활성을 갖는다.
돌연변이는 또한 이웃 잔기, 예를 들어 뉴클레아제 활성에 참여하는 상기 나타낸 것들 근처의 아미노산에서 만들어질 수 있다. 일부 구현예에서, 단지 RuvC만이 불활성화되고, 다른 구현예에서 또 다른 추정 뉴클레아제 도메인이 불활성화되며, 여기서 이펙터 단백질 복합체는 닉카제로서 작용하여 하나의 DNA 가닥만 절단한다. 바람직한 구현예에서, 기타 다른 추정 뉴클레아제 도메인은 HincII-유사 엔도뉴클레아제 도메인이다. 일부 구현예에서, 2 가지 FnCpf1 변이체(각각 상이한 닉카제)는 특이성을 증가시키는 데 사용되고, 2 가지 닉카제 변이체는 표적(여기서 2 가지 닉카제는 모두, 1 개의 DNA 가닥만이 절단되고 이어서 수복되는 표적외 변형을 최소화하거나 제거하면서, DNA 가닥을 절단함)에서 DNA를 절단하는 데 사용된다. 바람직한 구현예에서, Cpf1 이펙터 단백질은 2 가지 Cpf1 이펙터 단백질 분자를 포함하는 동형이량체로서 관심 표적 유전자좌와 연관되거나 관심 표적 유전자좌에서 서열을 절단한다. 바람직한 구현예에서, 동형이량체는 각각의 RuvC 도메인에서 상이한 돌연변이를 포함하는 2 가지 Cpf1 이펙터 단백질 분자를 포함할 수 있다.
본 발명은 2 가지 이상의 닉카제, 특히 이원화 또는 이중 닉카제 접근법을 사용하는 방법을 고려한다. 일부 양태 및 구현예에서, 단일 유형의 Cpf1 닉카제, 예를 들어 변형된 Cpf1 또는 본 명세서에 기재된 바와 같은 변형된 Cpf1이 전달될 수 있다. 이는 표적 DNA가 2 개의 Cpf1 닉카제에 의해 결합되게 한다. 추가적으로 또한, 상이한 오솔로그, 예를 들어 DNA의 하나의 가닥(예를 들어, 코딩 가닥) 상에 Cpf1 닉카제, 그리고 비-코딩 또는 반대 DNA 가닥 상에 오솔로그가 사용될 수 있다고 예상된다. 오솔로그는 Cas9 닉카제, 예컨대 SaCas9 닉카제 또는 SpCas9 닉카제일 수 있지만 이로 제한되지 않는다. 상이한 PAM을 필요로 하고 또한 상이한 가이드 요건을 가져서 사용자에게 더 많은 제어를 가능하게 할 수 있는 2 가지 상이한 오솔로그를 사용하는 것이 유리할 수 있다. 특정 구현예에서, DNA 절단은 적어도 4 가지 유형의 닉카제를 수반할 것이며, 여기서 각각의 유형은 상이한 서열의 표적 DNA로 유도되고, 각각의 쌍은 하나의 DNA 가닥 내로 제1 닉을 도입하고 둘째는 제2 DNA 가닥 내로 닉을 도입한다. 이러한 방법에서, 단일 가닥 파손의 적어도 2 개의 쌍이 표적 DNA 내로 도입되고, 여기서 단일-가닥 파손의 제1 및 제2 쌍의 도입 시, 단일-가닥 파손의 제1 및 제2 쌍 사이의 표적 서열은 절단된다. 특정 구현예에서, 오솔로그의 하나 또는 둘 모두는 제어가능하며, 즉 유도성이다.
본 발명의 특정 구현예에서, 가이드 RNA 또는 성숙 crRNA는 직접 반복부 서열 및 가이드 서열 또는 스페이서 서열을 포함하거나, 이들로 본질적으로 이루어지거나, 이들로 이루어진다. 특정 구현예에서, 가이드 RNA 또는 성숙 crRNA는 가이드 서열 또는 스페이서 서열에 연결된 직접 반복부 서열을 포함하거나, 이로 본질적으로 이루어지거나, 이로 이루어진다. 특정 구현예에서, 가이드 RNA 또는 성숙 crRNA는 19 nt의 부분적인 직접 반복부에 뒤이은 23 nt 내지 25 nt의 가이드 서열 또는 스페이서 서열을 포함한다. 특정 구현예에서, 이펙터 단백질은 FnCpf1 이펙터 단백질로, 검출가능한 DNA 절단을 달성하기 위하여 적어도 16 nt의 가이드 서열 및 시험관 내에서 효율적인 DNA 절단을 달성하기 위하여 최소 17 nt의 가이드 서열을 요구한다. 특정 구현예에서, 직접 반복부 서열은 가이드 서열 또는 스페이서 서열로부터 상류(즉, 5')에 위치된다. 바람직한 구현예에서, 가이드 RNA의 씨드 서열(즉, 표적 유전자좌에서 서열에 대한 혼성화 및/또는 인식에 매우 중요한 서열)은 가이드 서열 또는 스페이서 서열의 5' 말단에서 대략적으로 처음 5 개 nt 내에 존재한다.
본 발명의 바람직한 구현예에서, 성숙 crRNA는 스템 루프 또는 최적화된 스템 루프 구조 또는 최적화된 2차 구조를 포함한다. 바람직한 구현예에서, 성숙 crRNA는 직접 반복부 서열에서 스템 루프 또는 최적화된 스템 루프 구조를 포함하며, 여기서 스템 루프 또는 최적화된 스템 루프 구조는 절단 활성에 중요하다. 특정 구현예에서, 성숙 crRNA는 바람직하게 단일 스템 루프를 포함한다. 특정 구현예에서, 직접 반복부 서열은 바람직하게 단일 스템 루프를 포함한다. 특정 구현예에서, 이펙터 단백질 복합체의 절단 활성은 스템 루프 RNA 이중나선 구조에 영향을 미치는 돌연변이를 도입함으로써 변형된다. 바람직한 구현예에서, 스템 루프의 RNA 이중나선을 유지하는 돌연변이가 도입될 수 있으며, 이에 의해 이펙터 단백질 복합체의 절단 활성이 유지된다. 다른 바람직한 구현예에서, 스템 루프의 RNA 이중나선 구조를 파괴하는 돌연변이가 도입될 수 있으며, 이에 의해 이펙터 단백질 복합체의 절단 활성이 완전히 없어진다.
본 발명은 또한 본 명세서에 기재된 임의의 방법 또는 조성물에서 진핵생물 또는 진핵 세포에서의 발현을 위해 코돈 최적화된 이펙터 단백질을 인코딩하는 뉴클레오티드 서열을 제공한다. 본 발명의 구현예에서, 코돈 최적화된 이펙터 단백질은 FnCpf1p, AsCpf1p 또는 LbCpf1p이고, 진핵 세포 또는 유기체, 예를 들어 본 명세서의 다른 곳에 언급된 바와 같은 세포 또는 유기체, 예를 들어 효모 세포, 또는 마우스 세포, 래트 세포, 및 인간 세포 또는 비-인간 진핵 생물, 예를 들어 식물을 포함하는 유기체를 포함하는 포유동물 세포 또는 유기체(이로 제한되지 않음)에서 작동성을 위해 코돈 최적화된다.
본 발명의 특정 구현예에서, 적어도 하나의 핵 국소화 신호(nuclear localization signal; NLS)가 Cpf1 이펙터 단백질을 인코딩하는 핵산 서열에 부착된다. 바람직한 구현예에서, 적어도 하나 이상의 C-말단 또는 N-말단 NLS가 부착된다(그리고 이에 따라 Cpf1 이펙터 단백질을 코딩하는 핵산 분자(들)는, 발현된 생성물이 부착되거나 연결된 NLS(들)를 갖도록 NLS(들)에 대한 코딩을 포함할 수 있다). 바람직한 구현예에서, C-말단 NLS는 진핵 세포, 바람직하게는 인간 세포에서 최적 발현 및 핵 표적화를 위해 부착된다. 특정 구현예에서, NLS 서열은 Cpf1 이펙터 단백질을 인코딩하는 핵산 서열에 대해 이종이다. 바람직한 구현예에서, 코돈 최적화된 이펙터 단백질은 FnCpf1p이고, 가이드 RNA의 스페이서 길이는 15 nt 내지 35 nt이다. 특정 구현예에서, 가이드 RNA의 스페이서 길이는 적어도 16 개의 뉴클레오티드, 예컨대 적어도 17 개의 뉴클레오티드이다. 특정 구현예에서, 스페이서 길이는 15 nt 내지 17 nt, 17 nt 내지 20 nt, 20 nt 내지 24 nt, 예를 들어, 20 nt, 21 nt, 22 nt, 23 nt, 또는 24 nt, 23 내지 25 nt, 예를 들어 23 nt, 24 nt, 또는 25 nt, 24 nt 내지 27 nt, 27 nt 내지 30 nt, 30 nt 내지 35 nt, 또는 35 nt 이상이다. 본 발명의 특정 구현예에서, 코돈 최적화된 이펙터 단백질은 FnCpf1p이고, 가이드 RNA의 직접 반복부 길이는 적어도 16 개의 뉴클레오티드이다. 특정 구현예에서, 코돈 최적화된 이펙터 단백질은 FnCpf1p이고, 가이드 RNA의 직접 반복부 길이는 16 nt 내지 20 nt, 예를 들어 16 개, 17 개, 18 개, 19 개, 또는 20 개 뉴클레오티드이다. 바람직한 특정 구현예에서, 가이드 RNA의 직접 반복부 길이는 19 개 뉴클레오티드이다.
본 발명은 또한 다수의 핵산 성분을 전달하기 위한 방법을 포함하며, 여기서 각각의 핵산 성분은 상이한 관심 표적 유전자좌에 특이적이고, 이에 의해 다수의 관심 표적 유전자좌를 변형시킨다. 복합체의 핵산 성분은 하나 이상의 단백질-결합 RNA 압타머를 포함할 수 있다. 하나 이상의 압타머는 박테리오파지 코트 단백질을 결합할 수 있다. 박테리오파지 코트 단백질은 Qβ, F2, GA, fr, JP501, MS2, M12, R17, BZ13, JP34, JP500, KU1, M11, MX1, TW18, VK, SP, FI, ID2, NL95, TW19, AP205, ΦCb5, ΦCb8r, ΦCb12r, ΦCb23r, 7s 및 PRR1을 포함하는 군으로부터 선택될 수 있다. 바람직한 구현예에서, 박테리오파지 코트 단백질은 MS2이다. 본 발명은 또한 길이가 30 개 이상, 40 개 이상 또는 50 개 이상의 뉴클레오티드인 복합체의 핵산 성분을 제공한다.
따라서, 본 발명의 목적은 출원인이 권리를 보유하도록 임의의 이전에 공지된 생성물, 그 생성물의 제조 공정, 또는 그 생성물의 사용 방법을 본 발명 내에 포함시키지 않으며, 이에 의하여 임의의 이전에 공지된 생성물, 공정, 또는 방법의 권리 포기를 개시한다. 본 발명은 출원인이 권리를 보유하도록 USPTO(35 U.S.C. §112, 첫 절) 또는 EPO(EPC의 83항)의 서면 기재 요건 및 실시 가능 요건을 충족하지 않는, 임의의 생성물, 공정, 또는 그 생성물의 제조 또는 그 생성물의 사용 방법을 본 발명의 범주 내에 포함시키는 것으로 의도되지 않으며, 이에 의하여 임의의 이전에 공지된 생성물, 그 생성물의 제조 공정, 또는 그 생성물의 사용 방법의 권리 포기를 개시함을 추가로 유의한다. 본 발명의 실시에 있어서 Art. 53(c) EPC 및 규칙 28(b) 및 (c) EPC에 따르는 것이 유리할 수 있다. 본 명세서에서 어떤 것도 약속으로 해석되어서는 안 된다.
본 개시 내용 및 특히 청구범위 및/또는 단락에서, "포함한다(comprises)", "포함된(comprised)", "포함하는(comprising)" 등과 같은 용어는 미국 특허법에서 이에 귀속된 의미를 가질 수 있음에 유의하며; 예를 들어 이들은 "포함한다(includes)", "포함된(included)", "포함하는(including)" 등을 의미할 수 있고; "본질적으로 이루어지는" 및 "본질적으로 이루어진다"와 같은 용어는 미국 특허법에서 이들에게 할당된 의미를 갖는다.
이들 및 다른 구현예는 하기 상세한 설명에 개시되어 있거나 이로부터 명백 해지고 이에 의해 포함된다.
본 발명의 신규 특징은 특히 첨부된 청구범위에 제시되어 있다. 본 발명의 원리가 이용된 예시적인 구현예를 제시하는 하기의 상세한 설명을 참조함으로써 본 발명의 특징 및 이점을 더욱 잘 이해할 것이며, 첨부된 도면은 다음과 같다:
도 1. 황색으로 나타낸 PI(PAM 상호작용) 및 REC1 도메인 내의 PAM 인접 영역을 갖는 아시다미노코커스 종 BV3L6(AsCpf1)의 개략적 Cpf1 구조.
도 2a 내지 도 2c. Cpf1 돌연변이체에 의해 인식되는 대안적인 PAM 서열을 확인하기 위한 방법.
도 3a 내지 도 3c. a. Cpf1 라이브러리 제조; b: 돌연변이유발 스크린 개요; c: 시퀀싱 라이브러리 제조.
도 4a 및 도 4b. 야생형 AsCpf1을 사용한 PAM 스크린의 검증. a. 표기된 PAM 서열을 함유하는 클론에 대한 cam/amp 배지에서의 콜로니 성장. b. 표기된 PAM 서열을 함유하는 클론에 대한 cam/amp 배지에서의 콜로니 성장. c. PAM 내의 치환 돌연변이에 대한 야생형 AsCpf1의 감수성을 보여주는 막대 그래프.
도 5a 및 도 5b. 개별 AsCpf1 돌연변이체의 표현. 각 점은 특정 점 돌연변이를 나타낸다. 중복 돌연변이가 개별적으로 나타나 있다. a: 대조군; pUC19 rep1 및 pUC19 rep2는 PAM 서열을 함유하지 않는 pUC19 플라스미드의 복제물이다; b: pUC19 rep1(PAM 부재) 대 야생형 AsCpf1에 의해 인식되는 PAM(TTTC).
도 6. 개별 AsCpf1 돌연변이체의 표현. 각 점은 특정 점 돌연변이를 나타낸다. 중복 돌연변이가 개별적으로 나타나 있다. 결과는 pUC19 대조군(즉, PAM 부재)에 비하여 표기된 PAM 서열에 대하여 나타나 있다.
도 7a 및 도 7b. AsCpf1 돌연변이체 S542R은 PAM 서열 TCCC를 인식한다.
도 8a 및 도 8b. AsCpf1 돌연변이체 S542R은 PAM 서열 TTCC를 인식한다.
도 9a 내지 도 9f. 상이한 AsCpf1 돌연변이체 K548은 PAM 서열 TATC를 인식한다. a/b: AsCpf1 돌연변이체 K548A; c: AsCpf1 돌연변이체 K548G; d: AsCpf1 돌연변이체 K548L; e: AsCpf1 돌연변이체 K548R; F: 원으로 둘러싼 AsCpf1 돌연변이체 K548 돌연변이체는 모두 PAM 서열 TATC를 인식한다(K548에서 Ala, Arg, Gly, Leu, Ile, Asn, Cys, Gln, His, Phe, Ser, Thr, Trp, Tyr, Val으로의 돌연변이).
도 10. 상이한 AsCpf1 돌연변이체 K548은 PAM 서열 TGTC를 인식하며; 원으로 둘러싼 AsCpf1 돌연변이체 K548 돌연변이체 모두는 PAM 서열 TGTC를 인식한다(K548에서 Arg, Gly, Cys, Gln, His, Ser, Thr, Trp, Tyr, Val으로의 돌연변이).
도 11a 내지 도 11e. 절단된 가이드와 함께 AsCpf1 및 LbCpf1의 Cpf1 표적 뉴클레아제 활성을 보여준다. 도 11a는 패널 b 내지 d에 도시된 가이드 길이에 관한 요지를 제공한다. 도 11b는 DNMT1-3을 표적화하는 절단된 가이드와 함께 AsCpf1의 활성을 도시한 것이다. 도 11c는 DNMT1-4를 표적화하는 절단된 가이드와 함께 AsCpf1의 활성을 도시한 것이다. 도 11d는 DNMT1-3을 표적화하는 절단된 가이드와 함께 LbCpf1의 활성을 도시한 것이다. 도 11e는 DNMT1-4를 표적화하는 절단된 가이드와 함께 AsCpf1의 활성을 도시한 것이다.
도 12a 내지 도 12e. 부분 결합 가이드와 함께 AsCpf1 및 LbCpf1의 Cpf1 표적 뉴클레아제 활성을 보여준다. 모든 가이드는 24 nt 길이였으며, 24 nt 내지 14 nt의 범위에 걸쳐 표적과 매치된다. 도 12a는 패널 b 내지 d에 도시된 부분 결합 가이드에 관한 요지를 제공한다. 도 12b는 DNMT1-3을 표적화하는 부분 매칭 가이드와 함께 AsCpf1의 활성을 도시한 것이다. 도 12c는 DNMT1-4를 표적화하는 부분 매칭 가이드와 함께 AsCpf1의 활성을 도시한 것이다. 도 12d는 DNMT1-3을 표적화하는 부분 매칭 가이드와 함께 LbCpf1의 활성을 도시한 것이다. 도 12e는 DNMT1-4를 표적화하는 부분 매칭 가이드와 함께 AsCpf1의 활성을 도시한 것이다.
도 13a 내지 도 13d. 시험관내 절단 검정. AsCpf1 PAM 돌연변이체 S542R/K607R은 시험관 내에서 변경된 PAM 특이성을 갖는다. a. 모든 고갈된 판독물; b. 시험관 내 절단 검정에서 결정되는 바와 같이 TNTN을 필터링한 고갈된 판독물; c. WT(진청색), S542R/K607R(황색) 및 S542R/K548V/N552R(연황색)을 포함하는 인간 게놈 내의 Cpf1 변이체의 표적화 범위. 백분율은 상응하는 PAM으로 나타낸 모든 비-반복 가이드 서열(상측 및 하측 가닥 둘 모두)의 비를 나타낸다; d. TTTV PAM(진청색) 및 임의의 변이체에 의해 절단 가능한 모든 PAM(황색)에 대한 인간 게놈의 비-반복 영역 내의 가장 가까운 표적 부위 사이의 거리.
도 14a 내지 도 14d. HEK293 세포 내의 AsCpf1 PAM 돌연변이체의 검증. 표기된 표적 유전자에 대한 표기된 Cpf1 돌연변이체 및 표기된 PAM 서열에 대하여 결정된 바와 같은 삽입결실%. 표기된 PAM 부위 다음의 수는 상이한 표적 서열(예를 들어, TGTG - 48) 및 주어진 표적 서열에 대한 상이한 트랜스펙션(예를 들어, TGTG - 48.2)을 나타낸다. AsCpf1을 발현하는 플라스미드(야생형 또는 돌연변이체) 및 AsCpf1 DR+스페이서를 발현하는 플라스미드의 동시-트랜스펙션. 트랜스펙션 3일 후의 표적화된 게놈 유전자좌의 표적화된 딥 시퀀싱.
도 15a 내지 도 15d. a. TATV 표적 부위에서의 S542R/K548V/N552R 변이체의 활성; b. TYCV 부위에서의 S542R/K607 변이체의 활성; c. TYCV 및 CCCC 표적 부위에서의 S542R/K607R 변이체의 활성 및 TTTV 표적 부위에서의 S542R/K548V 변이체의 활성; d. VYCV 부위에서의 S542R/K607R 변이체의 활성. 모든 삽입결실 백분율을 HEK293 세포에서 측정하였다.
도 16. HEK293 세포에서의 AsCpf1 PAM 돌연변이체 S542R/K607R의 검증. 다양한 표적 유전자의 63개의 상이한 표적 부위에 대한 Cpf1 돌연변이체 및 표기된 PAM 서열에 대하여 결정된 바와 같은 삽입결실%. AsCpf1(야생형 또는 돌연변이체)을 발현하는 플라스미드 및 AsCpf1 DR+스페이서를 발현하는 플라스미드의 동시-트랜스펙션. 트랜스펙션 3일 후의 표적화된 게놈 유전자좌의 표적화된 딥 시퀀싱.
도 17. AsCpf1(아시다미노코커스 종 BV3L6) 및 LbCpf1(라크노스피라세아에 박테리움 ND2006)의 단백질 정렬.
도 18a 내지 도 18d. 본 발명의 일 구현예에 따른 돌연변이 Cpf1을 인코딩하는 예시적인 발현 플라스미드. (a) AsCpf1 돌연변이체 S542R/K607R을 인코딩하는 pY036의 플라스미드 맵. (b) pY036의 뉴클레오티드 서열 및 특징. (c) AsCpf1 돌연변이체 S542R/K607R을 인코딩하는 pcDNA의 플라스미드 맵. 기능적 특징은 각각의 맵 및 서열 상에 나타나 있다. (d) AsCpf1 돌연변이체 S542R/K607R을 인코딩하는 pcDNA-hAsCpf1의 뉴클레오티드 서열 및 특징.
도 19a 내지 도 19d. 박테리아 간섭-기반의 음성 선별 스크린에 의해, 비-정규 PAM에서 활성을 부여하는 AsCpf1의 아미노산 치환이 확인된다. (a) 돌연변이 유발을 위해 선택되는 PAM 뉴클레오티드(자홍색) 및 PAM-근위 잔기(청색)를 강조표시한, crRNA 및 표적 DNA와의 복합체에서의 AsCpf1(PDB ID: 5B43)의 결정 구조. (b) 변경된 PAM 특이성을 갖는 변이체를 확인하기 위해 사용되는 박테리아 간섭 검정의 개략도. (c) 박테리아 간섭에 의해 측정시 PAM 내의 치환 돌연변이에 대한 야생형 AsCpf1의 감수성. (d) 고갈된 변이체를 강조표시한, 스크린 판독물의 산점도. 각각의 점은 야생형 또는 돌연변이체 코돈을 나타낸다. 파선은 15배 고갈을 나타낸다.
도 20a 내지 도 20f. 변경된 PAM 특이성을 갖는 AsCpf1 변이체의 작제 및 특성화. (a) 조합 돌연변이유발에 의해, HEK293T 세포 내의 TYCV 및 TATV PAM이 있는 표적 부위를 절단하는 AsCpf1 변이체를 확인하며, 여기서, Y는 C 또는 T이며, V는 A, C 또는 G이다(도 22 참조). (b) 전체 PAM 특이성을 결정하기 위하여 사용되는 시험관 내 절단 검정의 개략도(또한, 도 23 및 도 24 참조). (c) 야생형(WT), S542R/K607R(RR) 및 S542R/K548V/N552R(RVR) 변이체에 대하여 가장 신속하게 절단되는 PAM의 웹 로고. (d) 야생형 및 변이체에 대한 모든 4-염기 PAM에 대한 정규화된 절단율. NNRN PAM은 무시할 수 있는 절단으로 인하여 나타내지 않음. 가장 활성인 PAM은 적색 네모 안에 있다. (e) HEK293T 세포 내의 표적 부위의 다양한 패널에서 그들의 바람직한 PAM에서의 야생형, RR 및 RVR의 활성의 비교(또한, 도 26 참조). 삽입결실 데이터에 있어서, 각 점은 3회의 반복실험의 평균을 나타내며, 적색 선은 각 군 내의 전체 평균을 나타낸다. 배수 개선을 위하여, 각 점은 상응하는 삽입결실 반복실험의 평균의 비를 나타낸다. 유의미하지 않음. p > 0.05(만-휘트니(Mann-Whitney)); *p < 0.05(만-휘트니); ****p < 0.0001(윌콕슨 순위-검정(Wilcoxon signed-rank)). (f) 인간 게놈 및 코딩 서열 내의 AsCpf1 변이체의 표적화 범위(또한, 도 28 참조). 플롯은 가장 가까운 절단 부위까지의 거리(염기 쌍)의 질량 확률 함수를 보여준다. 박스플롯은 중간값 및 사분 범위를 나타낸다. N 또는 마스킹된 반복부를 함유하는 게놈 영역을 이러한 분석에서 무시하였다.
도 21a 내지 도 21d. AsCpf1 PAM 변이체의 DNA 표적화 특이성. a. HEK293 세포 내의 4개의 표적 부위(VEGFA, GRIN2B, EMX1 DNMT1)에 대한 동소에서의 DNA 이중-가닥 파손 표지화 및 시퀀싱(BLISS). 105개의 판독물당 log10 이중-가닥 파손(DSB) 말단은 주홍색 열 지도로 나타나 있으며, 21d에서 시험관내 절단 검정으로부터의 상대적 PAM 절단율은 청색 열 지도로 나타나 있다. 가이드의 마지막 3개 염기(염기 21 내지 23)의 미스매치는 이들의 절단 효율에 최소의 영향을 갖기 때문에, 회색이다. b. 표적-외 활성에 대한 PAM 선호의 기여를 입증하는 TTTV 표적-외 부위가 알려져 있는 RPL32P3 유전자 내의 추가의 표적 부위의 평가. c. K949A 돌연변이의 부가는 야생형 및 변이체 둘 모두의 특이성을 개선한다(도 29도 또한 참조). d. K949A가 존재하거나 존재하지 않는 RR 및 RVR 변이체의 표적상 효율. 각 점은 3회의 반복실험의 평균을 나타낸다.
도 22a 및 도 22b. TATV PAM이 있는 표적 부위에서 활성인 AsCpf1 RVR 변이체를 작제하기 위한 (a) 단일 아미노산 돌연변이 및 (b) 조합 돌연변이체의 평가(도 20a도 또한 참조).
도 23a 내지 도 23c. (a) 야생형 AsCpf1, (b) S542R/K607R 및 (b) S542R/K548V/N552R에 대한 각 시험관내 절단 시점에서의 48개의 PAM(NNNNNNNN)의 존재비의 히스토그램(도 20b 내지 도 20d도 또한 참조). 각 히스토그램의 색은 경과 시간을 나타낸다. 히스토그램의 중심을 결정하기 위해 사용한 NNNNVRRT 서열은 흑색으로 나타나 있다.
도 24. 도 20d를 위해 사용되는 시험관내 절단 검정을 위한 데이터 처리 파이프라인.
도 25a 및 도 25b. (a) 시토신-함유 PAM이 있는 표적 부위에서 야생형 AsCpf1과 RR 변이체의 활성의 비교. (b) PAM 서열 내의 5' T의 존재가 많은 경우에 선택적일 수 있음(즉, NYCV PAM이 인식될 수 있음)을 보여주는 TYCV 및 VYCV 부위(V = A, C 또는 G)에서의 RR 변이체의 활성. TYCV 부위에 대한 데이터는 (a)에 나타낸 것과 동일하다. 모든 삽입결실 백분율을 HEK293T 세포에서 측정하였다.
도 26a 내지 도 26c. HEK293T 세포에서 고도로 활성인 PAM을 갖는 표적 부위에서의 (a) 야생형 AsCpf1, (b) RR 변이체 및 (c) RVR 변이체의 활성. 도 20e는 이들 데이터를 전체적으로 보여준다. AsCpf1 RR 변이체에 있어서, 3개의 CCCC 부위는 도 20e에 포함되지 않는다.
도 27a 내지 도 27c. 마우스 Neuro2a 세포 내의 TYCV 부위에서의 AsCpf1 RR 변이체의 편집 효율. (a) 마우스 PCSK9 유전자좌의 다이어그램. 회색 네모는 코딩 서열을 나타낸다. (b) TYCV PAM이 있는 PCSK9 표적 부위에서 RR 변이체에 의해 생성되는 삽입결실 백분율. (c) 가장 높은 편집 효율을 갖는 표적 부위(#2)에서의 대표적인 삽입결실. 적색 삼각형은 상부 가닥 상의 추정의 절단 부위를 나타낸다.
도 28a 내지 도 28c. (a) Cpf1 및 Cas9에 대한 표적화 범위의 정의(도 20f도 또한 참조). (b) 인간 게놈 및 (c) 코딩 서열에서의 Cas9(+VQR 및 VRER 변이체)에 대한 Cpf1(+RR 및 RVR 변이체)의 표적화 범위의 비교. 플롯은 가장 가까운 절단 부위까지의 거리(염기 쌍)의 질량 확률 함수를 보여준다. 박스플롯은 중간값 및 사분 범위를 나타낸다. N 또는 마스킹된 반복부를 함유하는 게놈 영역을 이러한 분석에서 무시하였다.
도 29. AsCpf1의 특이성 돌연변이유발. (도 21c도 또한 참조). DNA 가닥과 상호작용하거나 추정적으로 상호작용하는 잔기의 알라닌 스캔. K949A를 AsCpf1의 특이성을 향상시키기 위한 후보로서 선택하였다. Lys949는 브릿지 나선의 일부이다.
도 30a 및 도 30b. Cpf1 오솔로그의 서열 보존. (a) 돌연변이유발 스크리닝을 위해 선택된 잔기를 함유하는, REC1, WED-II 및 PI 도메인에 강조 표시한, 43개의 Cpf1 또는 추정의 Cpf1 오솔로그의 서열 정렬. Cpf1 명칭 약어는 본 발명자들이 이전에 보고한 관례에 따른다(문헌[Zetsche et al. Cell 2015]). (b) 변경된 PAM 특이성을 부여하는 AsCpf1 내의 돌연변이된 잔기에 상응하는 위치(녹색 네모)의 확대. 적색 선은 정렬에서 하나 이상의 염기의 삽입을 나타내며, 이는 명확성을 위해 생략된다. 표 19도 또한 참조한다.
도 31a 및 도 31b. LbCpf1의 PAM 인식의 조작. (a) PAM 특이성을 변경시키기 위해 돌연변이된 상응하는 잔기를 강조 표시한 AsCpf1(PBD ID: 5B43) 및 LbCpf1(PDB ID: 5ID6)의 결정 구조. LbCpf1에 대하여 나타낸 PAM 듀플렉스는 한 모델이다. (b) HEK293T 세포 내의 각각 TYCV 및 TATV 부위에서의 LbCpf1 G532R/K595R 및 G532R/K538V/Y542R의 활성. 각각의 점은 3회의 반복실험의 평균을 나타내며, 적색 선은 각 군 내의 전체 평균을 나타낸다. AsCpf1에 대한 데이터는 또한 도 20e에 나타나 있다. 유의미하지 않음 p > 0.05(만-휘트니); ****p < 0.0001(윌콕슨 순위-검정).
도 32a 및 도 32b. HEK293T 세포 내의 바람직한 PAM이 있는 표적 부위에서의 (a) LbCpf1 RR 변이체 및 (b) LbCpf1 RVR 변이체의 활성. 도 31b는 이들 데이터를 전체적으로 보여준다. 표적 부위는 도 26b 및 도 26c에 나타낸 것과 동일하다. RR 변이체에 있어서, 3개의 CCCC 부위가 도 31b에 포함되지 않는다.
본 출원은 이전에 기재된 CRISPR-Cas9 시스템과 기능적으로 구별되는 신규 RNA-가이드된 엔도뉴클레아제(Cpf1 이펙터 단백질)을 기재한다. 본 명세서에 기재된 Cpf1-연관 CRISPR 어레이는 추가적인 tracrRNA를 요구하지 않으면서 성숙 crRNA로 가공된다. 본 명세서에 기재된 crRNA는 스페이서 서열(또는 가이드 서열) 및 직접 반복부 서열을 포함하고 Cpf1p-crRNA 복합체는 그 자체로 표적 DNA를 효율적으로 절단하기에 충분하다.
일반적으로, CRISPR 시스템은 표적 서열의 부위에서 CRISPR 복합체의 형성을 촉진하는 요소(내생의 CRISPR 시스템의 맥락에서 프로토스페이서(protospacer)로서도 지칭됨)에 의해 특징지어진다. CRISPR 복합체의 형성의 맥락에서, "표적 서열"은 가이드 서열이 표적화되도록, 예를 들어 상보성을 갖도록 설계된 서열을 지칭하며, 여기서 표적 서열과 가이드 서열 간의 혼성화는 CRISPR 복합체의 형성을 촉진한다. 표적 서열에 대한 상보성이 절단 활성에 중요한 가이드 서열의 섹션은 본 명세서에서 씨드 서열로서 지칭된다. 표적 서열은 임의의 폴리뉴클레오티드, 예컨대 DNA 폴리뉴클레오티드를 포함할 수 있고 관심 표적 유전자좌 내에 포함된다. 일부 구현예에서, 표적 서열은 세포의 핵 또는 세포질 내에 위치된다. 본 명세서에 기재된 발명은 클래스 2 CRISPR-Cas 시스템의 신규 이펙터 단밸질을 포함하며, 이 중 Cas9는 예시적인 이펙터 단백질이고 따라서 신규 이펙터 단백질을 기재하는 데 본 출원에서 사용된 용어는 CRISPR-Cas9 시스템을 기재하는 데 사용된 용어와 상관관계가 있다.
CRISPR-Cas 유전자좌는 50 개 초과의 유전자 패밀리를 가지며, 엄격하게 보편적인 유전자가 없다. 따라서, 어떠한 단일 진화 계보도 실현가능하지 않으며, 새로운 패밀리를 확인하기 위해 다면적인 접근법이 필요하다. 지금까지, 93 개의 Cas 단백질에 대한 395 개의 프로파일의 포괄적인 cas 유전자 확인이 있다. 분류는 특징적인 유전자 프로파일 및 유전자좌 구성의 특징을 포함한다. 클래스 1은 다수 서브유닛 crRNA-이펙터 복합체(캐스케이드)를 포함하고, 클래스 2는 단일-서브유닛 crRNA-이펙터 복합체(Cas9-유사)를 포함한다.
CRISPR-Cas 시스템의 작용은 보통 3 단계로 나뉜다: (1) 적응 및 스페이서 통합, (2) CRISPR 유전자좌 (예비-crRNA)의 1차 전사물의 가공 및 CRISPR 반복부의 5' 및 3' 단편에 해당하는 스페이서 및 가변 영역을 포함하는 crRNA의 성숙, 및 (3) DNA(또는 RNA) 간섭. 공지된 CRISPR-Cas 시스템의 대다수에 존재하는 2 가지 단백질, 즉 Cas1 및 Cas2는 CRISPR 카세트 내로 스페이서를 삽입하기에 충분하다. 이들 2 가지 단백질은 이러한 적응 공정에 필요한 복합체를 형성하며: Cas1의 엔도뉴클레아제 활성은 스페이서 통합에 필요한 반면, Cas2는 비효소적 작용을 실행하는 것으로 보인다. Cas1-Cas2 복합체는 시스템의 나머지 부분으로부터 준-자율적인(quasi-autonomous) 것으로 보이는 CRISPR-Cas의 고도로 보존된 "정보 처리" 모듈을 나타낸다. (문헌[Annotation and Classification of CRISPR-Cas Systems. Makarova KS, Koonin EV. Methods Mol Biol. 2015;1311:47-75] 참조).
이전에 기재된 클래스 2 시스템, 즉 유형 II 및 추정 유형 V는, cas 오페론에서 단지 3 개 또는 4 개의 유전자, 즉 적응 모듈을 포함하는 cas1 및 cas2 유전자(유전자의 cas1-cas2 쌍은 간섭에 수반되지 않음), 간섭의 원인이 될 뿐만 아니라 예비-crRNA 가공 및 적응에 기여하는 단일 다수도메인 이펙터 단백질, 및 종종 적어도 일부 유형 II 시스템에서 불필요한 즉성화되지 않은 작용을 가지는 제4 유전자(및 일부 경우에서 제4 유전자는 cas4(생화학적 또는 인실리코(in silico) 증거는 Cas4가 3 개의 시스테인 C-말단 클러스터를 가지는 PD-(DE)xK 슈퍼패밀리이고; 5'-ssDNA 엑소뉴클레아제 활성을 가짐을 나타냄) 또는 비활성화된 ATPase를 인코딩하는 csn2임)로 이루어졌다. 대부분의 경우, CRISPR 어레이 및 tracrRNA, 즉 트랜스-인코딩된 작은 CRISPR RNA로 알려진 별개의 RNA 종에 대한 유전자는 클래스 2 cas 오페론에 인접한다. tracrRNA는 반복적인 CRISPR 어레이 내의 반복부에 대하여 부분적으로 상동성을 가지며, CRISPR-Cas 유전자좌와 연관되지 않은 아주 흔한 박테리아 효소인 RNAse III에 의해 촉진되는 예비-crRNA의 가공에 필수적이다.
Cas1은 대부분의 CRISPR-Cas 시스템에 존재하고 기타 다른 Cas 단백질보다 느리게 진화하는 가장 보존된 단백질이다. 따라서, Cas1 계통발생은 CRISPR-Cas 시스템 분류에 대한 지침으로서 사용되어 왔다. 생화학적 또는 인실리코 증거는 Cas1이 금속-의존성 데옥시리보뉴클레아제임을 나타낸다. 에스케리키아 콜라이(E. coli)에서 Cas1의 결실은 문헌["A dual function of the CRISPR-Cassystem in bacterial antivirus immunity and DNA repair", Babu M et al. Mol Microbiol 79:484-502 (2011)]에 기재된 바와 같이 DNA 손상 및 손상된 염색체 분리에 대한 민감성을 증가시킨다. 생화학적 또는 인실리코 증거는 Cas 2가 U-풍부 영역에 특이적인 RNase이고 이중-가닥 DNase임을 나타낸다.
본 발명의 양태는 클래스 2 CRISPR-Cas 시스템과 연관된 신규 이펙터 단백질의 확인 및 조작에 관한 것이다. 바람직한 구현예에서, 이펙터 단백질은 단일-서브유닛 이펙터 모듈을 포함한다. 추가 구현예에서, 이펙터 단백질은 시험관 내, 생체 내 또는 생체 외 적용을 위한 원핵 세포 또는 진핵 세포에서 기능적이다. 본 발명의 양태는 새로운 클래스 2 CRISPR-Cas 시스템을 예측하고 그 안에 있는 성분을 확인하기 위한 컴퓨터 방법 및 알고리즘을 포함한다.
일 양태에서, 본 발명은 PAM 인식에 영향을 미치는 하나 이상의 돌연변이를 갖는 돌연변이된 Cpf1 폴리펩티드에 관한 것이다. 바람직하게는, 상기 돌연변이된 Cpf1 폴리펩티드는 상응하는 야생형 Cpf1에 의해 인식되지 않는 PAM 서열을 인식한다. 따라서, 일 양태에서, 본 발명은 하나 이상의 돌연변이를 갖는 돌연변이된 Cpf1 폴리펩티드에 관한 것이며, 상기 돌연변이된 Cpf1 단백질은 상응하는 야생형 Cpf1에 의해 인식되지 않는 PAM 서열을 인식한다.
본원에 사용되는 바와 같이, 용어 "돌연변이"는 해당 분야에서의 그의 통상의 의미를 갖는다. 추가의 지침에 의해, 돌연변이는 점 돌연변이를 포함할 수 있다. 선택적으로, 돌연변이는 하나 이상의 연속 또는 비-연속 아미노산의 삽입을 포함할 수 있다. 바람직하게는, 본원에 사용되는 바와 같은 돌연변이는 점 돌연변이이거나, 이를 포함하며, 즉, 하나 이상의 아미노산이 상이한 아미노산으로 대체된다. 몇몇의 점 돌연변이의 경우에, 각 아미노산은 동일한 또는 상이한 아미노산으로 대체될 수 있다. 아미노산 치환은 본원의 다른 곳에 기재된 바와 같은 보존적 아미노산 치환 또는 비-보존적 아미노산 치환일 수 있다(예를 들어, 보존적 치환은 비-보존적 치환과 대조적으로 동일한 세트 또는 하위세트, 예컨대 소수성, 극성 등에 속하는 아미노산의 치환을 포함한다). 본원에 사용되는 바와 같이, "돌연변이된" Cpf1은 하나 이상의 돌연변이를 포함하도록 조작된 Cpf1을 말한다. 따라서, 돌연변이된 Cpf1은 비-천연 발생 또는 조작된 Cpf1을 말하며, 여기서, 하나 이상의 돌연변이가 의도적으로 도입된다. 따라서, 특정 기원 또는 종으로부터 유래된 돌연변이된 Cpf1은 상기 기원 또는 종으로부터의 천연 발생 Cpf1과 상이하다.
본 발명에 따르면, 돌연변이된 Cpf1은 PAM 인식에 영향을 미치는 하나 이상의 돌연변이를 포함한다. 이것은 적어도 하나의 상이한 PAM 서열 또는 상이한 PAM 서열이 야생형(즉, 돌연변이되지 않은) Cpf1에 비하여 돌연변이된 Cpf1에 의해 인식되거나, 돌연변이된 Cpf1이 상응하는 야생형 Cpf1에 의해 (실질적으로) 인식되지 않는 적어도 하나의 PAM 서열 또는 PAM 서열들을 인식하는 것을 의미한다. 이러한 맥락에서 상응하는 야생형 Cpf1은 돌연변이되지 않고, 본 발명에 따른 돌연변이된 Cpf1이 유래되는 원래의 Cpf1을 말한다. 본 발명에 따른 돌연변이된 Cpf1이 상응하는 야생형 Cpf1에 의해 인식되는 PAM 서열을 인식할 수 있거나, 이를 인식하지 않을 수 있음이 이해될 것이다. 돌연변이된 Cpf1이 상응하는 야생형 Cpf1에 의해 인식되는 PAM 서열을 인식한다면, 상응하는 야생형 Cpf1에 의해 (실질적으로) 인식되지 않는 적어도 하나의 추가의 PAM 서열이 인식된다. 따라서, 본 발명은 상응하는 야생형 Cpf1에 의해 (실질적으로) 인식되지 않는 PAM 서열을 인식하거나, 이를 인식할수 있는 돌연변이된 Cpf1에 관한 것이다.
본원에 사용되는 바와 같이, 이러한 맥락에서 용어 "인식된", "인식하는" 또는 "인식"은 gRNA가 혼성화하고(즉, gRNA의 가이드 서열이 혼성화하고) PAM 서열이 측접하는 DNA 표적 부위에서 gRNA와 기능적 복합체를 형성하는 Cpf1의 능력을 말하며, 여기서, Cpf1은 그의 천연의 기능, 즉, DNA 절단을 수행할 수 있다. 이러한 맥락에서, 이러한 DNA 절단은, Cpf1이 촉매적 비활성 Cpf1이 되는 것을 방해하는 것을 주목해야 한다. 예를 들어, 비활성화된 Cpf1(예를 들어, 데드 Cpf1)의 경우에, 그럼에도 불구하고, Cpf1, gRNA 및 동족 표적 간의 복합체는 필요한 PAM 서열이 존재한다면 형성될 수 있지만, 이는 DNA 절단은 초래하지 않는다. 이러한 맥락에서, 본 발명에 따른 돌연변이된 Cpf1이 그의 동족 PAM 서열이 표적 서열에 인접하여 존재한다면 기능적 CRISPR-Cas 복합체를 형성할 수 있지만, 돌연변이 Cpf1에 의해 인식되는 동족 PAM 서열이 표적 서열에 인접하여 존재한다면 상응하는 야생형 Cpf1이 기능적 CRISPR-Cas 복합체를 형성할 수 없음을 주의해야 한다. 바람직하게는, 시험관 내 절단 검정에서, 실질적으로 모든 DNA가 절단되면, 즉, 실질적으로 100%의 DNA가 절단되면, 예컨대, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90% 또는 적어도 95%의 DNA가 절단되면, 특정 PAM 서열은 Cpf1, 예컨대, 본원에 기재된 바와 같은 본 발명에 따른 돌연변이된 Cpf1에 의해 인식되는 것으로 지칭된다. 유사하게, 예를 들어, 박테리아 성장 및/또는 생존이 특정 Cpf1(돌연변이체)에 의해 인식되는 동족 PAM 서열의 존재 또는 부재에 좌우되는 박테리아 성장 검정(도 2 참조)에서, 실질적으로 박테리아 성장이 관찰되지 않는다면, 예컨대, PAM 서열의 부재(또는 표적 서열의 부재 또는 Cpf1의 부재 또는 gRNA의 부재) 하에서의 박테리아 성장에 비하여 실질적으로 0%의 박테리아 성장, 예컨대 최대 40%의 박테리아 성장, 또는 최대 30%의 박테리아 성장, 또는 최대 20%의 박테리아 성장, 또는 최대 10%의 박테리아 성장, 또는 최대 5%의 박테리아 성장이 관찰된다면, 특정 PAM 서열이 Cpf1, 예컨대 본원에 기재된 바와 같은 본 발명에 따른 돌연변이된 Cpf1에 의해 인식되는 것으로 지칭된다. 박테리아 성장은 해당 분야에 알려져 있는 바와 같이, 예를 들어, 콜로니 검정에서 평가될 수 있다.
추가의 양태에서, 본 발명은 하나 이상의 돌연변이를 가지며, N 이외의 4개 미만의 뉴클레오티드로 이루어진 PAM을 인식하는 돌연변이된 Cpf1 폴리펩티드에 관한 것이되, 단, 상기 돌연변이된 Cpf1은 돌연변이된 FnCpf1(프란시셀라 노비시다 Cpf1, 예컨대 프란시셀라 노비시다 U112 Cpf1, 예컨대 문헌[Zetsche et al. (2015) Cell; 163(3):759-771]에 기재된 바와 같은 FnCpf1)이 아니다. N은 A, T, G 또는 C이다. 특정 구현예에서, 본 발명에 따른 돌연변이된 Cpf1 단백질은 N 이외의 3개의 뉴클레오티드로 이루어진 PAM 서열을 인식한다. 특정 구현예에서, 본 발명에 따른 돌연변이된 Cpf1 단백질은 N 이외의 2개의 뉴클레오티드로 이루어진 PAM 서열을 인식한다. 특정 구현예에서, 본 발명에 따른 돌연변이된 Cpf1 단백질은 N 이외의 1개의 뉴클레오티드로 이루어진 PAM 서열을 인식한다. 특정 구현예에서, 본 발명에 따른 돌연변이된 Cpf1 단백질은 PAM 서열을 인식하지 않는다(즉, 작용성을 위하여 PAM 서열이 필요하지 않다). 특정 구현예에서, 본 발명에 따른 돌연변이된 Cpf1 단백질은 3개의 뉴클레오티드로 이루어진 PAM 서열을 인식한다. 특정 구현예에서, 본 발명에 따른 돌연변이된 Cpf1 단백질은 2개의 뉴클레오티드로 이루어진 PAM 서열을 인식한다. 특정 구현예에서, 본 발명에 따른 돌연변이된 Cpf1 단백질은 1개의 뉴클레오티드로 이루어진 PAM 서열을 인식한다. 특정 구현예에서, 본 발명에 따른 돌연변이된 Cpf1 단백질은 N 이외의 3개의 뉴클레오티드로 이루어진 PAM 서열을 인식한다. 특정 구현예에서, 본 발명에 따른 돌연변이된 Cpf1 단백질은 4개의 뉴클레오티드로 이루어진 PAM 서열을 인식한다. 특정 구현예에서, 본 발명에 따른 돌연변이된 Cpf1 단백질은 4개의 연속 뉴클레오티드로 이루어진 PAM 서열을 인식한다. 특정 구현예에서, 본 발명에 따른 돌연변이된 Cpf1 단백질은 N 이외의 4개의 연속 뉴클레오티드로 이루어진 PAM 서열을 인식한다. 특정 구현예에서, 본 발명에 따른 돌연변이된 Cpf1 단백질은 N 이외의 4개 미만의 연속 뉴클레오티드로 이루어진 PAM 서열을 인식한다. 특정 구현예에서, 본 발명에 따른 돌연변이된 Cpf1 단백질은 N 이외의 3개의 연속 뉴클레오티드로 이루어진 PAM 서열을 인식한다. 특정 구현예에서, 본 발명에 따른 돌연변이된 Cpf1 단백질은 N 이외의 2개의 연속 뉴클레오티드로 이루어진 PAM 서열을 인식한다. 특정 구현예에서, 본 발명에 따른 돌연변이된 Cpf1 단백질은 3개의 연속 뉴클레오티드로 이루어진 PAM 서열을 인식한다. 특정 구현예에서, 본 발명에 따른 돌연변이된 Cpf1 단백질은 2개의 연속 뉴클레오티드로 이루어진 PAM 서열을 인식한다. (N을 포함하든지 그렇지 않든지 및/또는 연속 뉴클레오티드이든지 그렇지 않든지) 4개 미만의 뉴클레오티드의 PAM 서열을 인식하는 돌연변이된 Cpf1 중 임의의 것이 FnCpf1로부터 유래되지 않음(즉, 상응하는 야생형이 FnCpf1이 아님)을 이해해야 한다.
추가의 양태에서, 본 발명은 서열 YCV를 갖거나, 이를 포함하는 PAM을 인식하는 돌연변이된 Cpf1 폴리펩티드, 예컨대 AsCpf1에 관한 것이다. 추가의 양태에서, 본 발명은 서열 TYCV를 갖거나, 이를 포함하는 PAM을 인식하는 돌연변이된 Cpf1 폴리펩티드, 예컨대 AsCpf1에 관한 것이다. 추가의 양태에서, 본 발명은 서열 VYCV를 갖거나, 이를 포함하는 PAM을 인식하는 돌연변이된 Cpf1 폴리펩티드, 예컨대 AsCpf1에 관한 것이다. 추가의 양태에서, 본 발명은 서열 NYCV를 갖거나, 이를 포함하는 PAM을 인식하는 돌연변이된 Cpf1 폴리펩티드, 예컨대 AsCpf1에 관한 것이다. 추가의 양태에서, 본 발명은 서열 RYN을 갖거나, 이를 포함하는 PAM을 인식하는 돌연변이된 Cpf1 폴리펩티드에 관한 것이다. 추가의 양태에서, 본 발명은 서열 YCN을 갖거나, 이를 포함하는 PAM을 인식하는 돌연변이된 Cpf1 폴리펩티드에 관한 것이다. 추가의 양태에서, 본 발명은 서열 RCN을 갖거나, 이를 포함하는 PAM을 인식하는 돌연변이된 Cpf1 폴리펩티드에 관한 것이다. 추가의 양태에서, 본 발명은 서열 AYV를 갖거나, 이를 포함하는 PAM을 인식하는 돌연변이된 Cpf1 폴리펩티드에 관한 것이다. 추가의 양태에서, 본 발명은 서열 TYV를 갖거나, 이를 포함하는 PAM을 인식하는 돌연변이된 Cpf1 폴리펩티드에 관한 것이다. 추가의 양태에서, 본 발명은 서열 TNYC 또는 TNYS를 갖거나, 이를 포함하는 PAM을 인식하는 돌연변이된 Cpf1 폴리펩티드에 관한 것이되, 단, 상기 PAM은 TTTV 또는 TTTC가 아니거나, 단, 상기 PAM은 TTTN이 아니다. N은 A, C, T 또는 G이다. V는 A, C 또는 G이다. Y는 C 또는 T이다. S는 C 또는 G이다. 특정 구현예에서, 돌연변이된 Cpf1 폴리펩티드는 서열 YCV, TYCV, VYCV, YCN, RCN, AYV, TYV, RYN, TGYV, TYTV, TYCT, TYCC, TRTC, TATV, NTTV, TTV, TSTG, TVTS, TYYS, TCYS, TBYS, TCYS, TVYS, TNYS, TYYS, TNTN, TSTG, TTCC, TCCC, TATC, TACT, AATA, TGTC, TRYV, RYH, TGTG, TCTG, NTTN, TTN, TRTN, TCN, TCTC, TYCN, TTCN, TCCN 또는 TATN을 갖거나 이를 포함하는 PAM을 인식한다. 이러한 양태에서, 일 구현예에서, 상기 PAM은 TTTV, TTTC 또는 TCTG가 아니다. 추가의 구현예에서, 상기 PAM은 TCTG가 아니다. 추가의 구현예에서, 상기 PAM은 TCTC가 아니다. N은 A, C, T 또는 G이다. V는 A, C 또는 G이다. Y는 C 또는 T이다. R은 A 또는 G이다, S는 C 또는 G이다, B는 C 또는 T 또는 G이며, W는 A 또는 T이며, R은 A 또는 G이며, K는 G 또는 T이며, M은 A 또는 C이며, D는 A 또는 G 또는 T이며, H는 A 또는 C 또는 T이다. 상기 구현예 중 특정 구현예에서, 상기 Cpf1은 AsCpf1이다. 특정 구현예에서, 돌연변이된 Cpf1 폴리펩티드는 서열 TYCC 또는 TRTC를 갖거나 이를 포함하는 PAM을 인식한다. Y는 C 또는 T이다. R은 A 또는 G이다. 특정 구현예에서, 상기 돌연변이된 Cpf1은 서열 TNYC 또는 TNYS를 갖거나 이를 포함하는 PAM을 인식하는 돌연변이된 AsCpf1이되, 단, 상기 PAM은 TTTV 및/또는 TTTC 및/또는 TCTG 및/또는 TCTC가 아니다. N은 A, C, T 또는 G이다. V는 A, C 또는 G이다. Y는 C 또는 T이다. 특정 구현예에서, 돌연변이된 Cpf1은 서열 YCN, RCN, YCV, TYCV, VYCV, RYN, TYCC, TRTC, TATV, NTTV, TTV, TSTG, TVTS, TVYS, TYYS, TCYS, TBYS, TCYS, TNYS, TYYS, TNTN, TSTG, TTCC, TCCC, TATC, TGTG, TCTG, TYTV, TYCT, NTTN, TTN, TRTN, TCN, TCTC, TYCN, TTCN, TCCN 또는 TATN을 갖거나, 이를 포함하는 PAM을 인식하는 돌연변이된 AsCpf1이다. N은 A, C, T 또는 G이다. V는 A, C 또는 G이다. Y는 C 또는 T이다. R은 A 또는 G이다. 특정 구현예에서, 돌연변이된 Cpf1은 서열 YCN, RCN, YCV, TYCV, VYCV, RYN, TYTV, TYCT, TYCC,TRTC, TSTG, TVTS, TYYS, TCYS, TBYS, TCYS, TNYS, TYYS, TNTN, TVYS, TSTG, TTCC, TCCC, TATC, TGTG, TCTG, NTTN, TTN, TRTN, TCN, TCTC, TYCN, TTCN, TCCN 또는 TATN을 갖거나, 이를 포함하는 PAM을 인식하는 AsCpf1이다. Y는 C 또는 T이다. R은 A 또는 G이다.
PAM 서열 길이를 언급하는 경우, 이것이 무작위 뉴클레오티드(즉, "N")를 포함할 수 있거나, 이를 포함하지 않을 수 있는 것이 인지될 것이다. 예를 들어, 4개의 뉴클레오티드로 이루어진 PAM 서열은 하나 이상의 무작위 뉴클레오티드를 포함할 수 있으며, 이는 내부(예를 들어, TNCC, TCNC 등) 또는 측접 뉴클레오티드(NTCC, TCCN 등)일 수 있다. 그럼에도 불구하고, 이러한 PAM은 뉴클레오티드 중 하나 이상이 무작위일지라도, 기능적 인식이 4개의 뉴클레오티드의 존재를 필요로 한다면, 4개의 뉴클레오티드로 이루어지는 것으로 간주될 수 있다. 대안적으로, 측접 무작위 뉴클레오티드(특히, 5' 측접 무작위 뉴클레오티드)(즉, "N")는 무관한 것으로 간주될 수 있으며(예를 들어, PAM 서열 NYCV는 YCV로 간주될 수 있음), 이런 이유로, 또한 4개 미만의 뉴클레오티드의 PAM 서열의 정의 내에 속하는 것으로 간주될 수 있다.
일 양태에서, 본 발명은 돌연변이된 Cpf1, 예컨대 상기 기재된 바와 같은 돌연변이된 Cpf1에 관한 것이며, 상기 돌연변이된 Cpf1은 AsCpf1의 위치 539, 542, 547, 548, 550, 551, 552, 167, 604 또는 607에 하나 이상의 돌연변이된 아미노산 잔기, 또는 위치 539, 542, 547, 548, 550, 551, 552 또는 607, 또는 AsCpf1 오솔로그(상이한 종으로부터의 상응하는 이펙터), 동족체(동일하거나 상이한 종 유래의 동일한 기능을 갖는 이펙터) 또는 변이체(예를 들어, 절단된 Cpf1을 포함하는 본원의 다른 곳에 기재된 바와 같은 추가로 변형된 Cpf1 중 임의의 것)의 상응하는 위치에 하나 이상의 돌연변이된 아미노산 잔기를 포함한다. 명세서 전체에 걸쳐 AsCpf1의 특정 아미노산 잔기에 대한 언급은 바람직하게는 아시다미노코커스 종 BV3L6 Cpf1에 관한 것이다. 명세서 전체에 걸쳐 LbCpf1의 특정 아미노산 잔기에 대한 언급은 바람직하게는 라크노스피라세아에 박테리움 ND2006 Cpf1에 관한 것이다. 동족체 및 오솔로그는 해당 분야에 알려져 있는 기법, 예컨대 또한, 본원의 다른 곳에 기재된 바와 같은 서열 정렬에 의해 확인될 수 있다. 특정 구현예에서, 상기 돌연변이된 Cpf1은 위치 539, 542, 547, 548, 550, 551, 552, 167, 604 또는 607에 하나 이상의 돌연변이된 아미노산 잔기; 또는 위치 539, 542, 547, 548, 550, 551, 552 또는 607에 하나 이상의 돌연변이된 아미노산 잔기를 포함하는 AsCpf1이다. 일 양태에서, 본 발명은 돌연변이된 Cpf1, 예컨대, 상기 기재된 바와 같은 돌연변이된 Cpf1에 관한 것이며, 상기 돌연변이된 Cpf1은 AsCpf1의 위치 542 및 607에 하나 이상의 돌연변이된 아미노산 잔기 또는 위치 542 및 607 또는 AsCpf1 오솔로그(상이한 종으로부터의 상응하는 이펙터), 동족체(동일하거나 상이한 종 유래의 동일한 기능을 갖는 이펙터) 또는 변이체(예를 들어, 절단된 Cpf1을 포함하는 본원의 다른 곳에 기재된 바와 같은 추가로 변형된 Cpf1 중 임의의 것)의 상응하는 위치에 하나 이상의 돌연변이된 아미노산 잔기를 포함한다. 동족체 및 오솔로그는 해당 분야에 알려져 있는 기법, 예컨대 또한, 본원의 다른 곳에 기재된 바와 같은 서열 정렬에 의해 확인될 수 있다. 특정 구현예에서, 상기 돌연변이된 Cpf1은 위치 542 및 607에 하나 이상의 돌연변이된 아미노산 잔기; 위치 542 및 607에 하나 이상의 돌연변이된 아미노산 잔기를 포함하는 AsCpf1이다. 일 양태에서, 본 발명은 돌연변이된 Cpf1, 예컨대, 상기 기재된 바와 같은 돌연변이된 Cpf1에 관한 것이며, 상기 돌연변이된 Cpf1은 AsCpf1의 위치 542 및 548(및 선택적으로 552)에 하나 이상의 돌연변이된 아미노산 잔기 또는 위치 542 및 548(및 선택적으로 552), 또는 AsCpf1 오솔로그(상이한 종으로부터의 상응하는 이펙터), 동족체(동일하거나 상이한 종 유래의 동일한 기능을 갖는 이펙터) 또는 변이체(예를 들어, 절단된 Cpf1을 포함하는 본원의 다른 곳에 기재된 바와 같은 추가로 변형된 Cpf1 중 임의의 것)의 상응하는 위치에 하나 이상의 돌연변이된 아미노산 잔기를 포함한다. 동족체 및 오솔로그는 해당 분야에 알려져 있는 기법, 예컨대 또한, 본원의 다른 곳에 기재된 바와 같은 서열 정렬에 의해 확인될 수 있다. 특정 구현예에서, 상기 돌연변이된 Cpf1은 위치 542 및 548(및 선택적으로 552)에 하나 이상의 돌연변이된 아미노산 잔기; 또는 위치 542 및 548(및 선택적으로 552)에 하나 이상의 돌연변이된 아미노산 잔기를 포함하는 AsCpf1이다. 특정 구현예에서, 상기 돌연변이된 Cpf1은 AsCpf1의 위치 542 또는 548, 특정 구현예에서 542 및 548 둘 모두 또는 AsCpf1 오솔로그(상이한 종으로부터의 상응하는 이펙터), 동족체(동일하거나 상이한 종 유래의 동일한 기능을 갖는 이펙터) 또는 변이체(예를 들어, 절단된 Cpf1을 포함하는 본원의 다른 곳에 기재된 바와 같은 추가로 변형된 Cpf1 중 임의의 것)의 상응하는 위치에 하나 이상의 돌연변이된 아미노산 잔기를 포함한다. 특정 구현예에서, 상기 돌연변이된 Cpf1은 위치 542 또는 548, 특정 구현예에서, 542 및 548 둘 모두에 하나 이상의 돌연변이된 아미노산 잔기를 포함하는 AsCpf1이다. 특정 구현예에서, 상기 돌연변이된 Cpf1은 AsCpf1의 위치 S542, N547, K548, K550, N551, N552, T167, M604 또는 K607에 또는 AsCpf1 오솔로그(상이한 종으로부터의 상응하는 이펙터), 동족체(동일하거나 상이한 종 유래의 동일한 기능을 갖는 이펙터) 또는 변이체(예를 들어, 절단된 Cpf1을 포함하는 본원의 다른 곳에 기재된 바와 같은 추가로 변형된 Cpf1 중 임의의 것)의 상응하는 위치에 하나 이상의 돌연변이된 아미노산 잔기를 포함한다. 특정 구현예에서, 상기 돌연변이된 Cpf1은 위치 S542, N547, K548, K550, N551, N552, T167, M604 또는 K607에 하나 이상의 돌연변이된 아미노산 잔기를 포함하는 AsCpf1이다. 특정 구현예에서, 상기 돌연변이된 Cpf1은 AsCpf1의 위치 S542 또는 K548, 특정 구현예에서, 둘 모두, 또는 AsCpf1 오솔로그(상이한 종으로부터의 상응하는 이펙터), 동족체(동일하거나 상이한 종 유래의 동일한 기능을 갖는 이펙터) 또는 변이체(예를 들어, 절단된 Cpf1을 포함하는 본원의 다른 곳에 기재된 바와 같은 추가로 변형된 Cpf1 중 임의의 것)의 상응하는 위치에 하나 이상의 돌연변이된 아미노산 잔기를 포함한다. 특정 구현예에서, 상기 돌연변이된 Cpf1은 위치 S542 또는 K548, 특정 구현예에서, 둘 모두에 하나 이상의 돌연변이된 아미노산 잔기를 포함하는 AsCpf1이다. 특정 구현예에서, 상기 돌연변이된 Cpf1은 AsCpf1의 위치 S542 또는 K607, 특정 구현예에서, 둘 모두, 또는 AsCpf1 오솔로그(상이한 종으로부터의 상응하는 이펙터), 동족체(동일하거나 상이한 종 유래의 동일한 기능을 갖는 이펙터) 또는 변이체(예를 들어, 절단된 Cpf1을 포함하는 본원의 다른 곳에 기재된 바와 같은 추가로 변형된 Cpf1 중 임의의 것)의 상응하는 위치에 하나 이상의 돌연변이된 아미노산 잔기를 포함한다. 특정 구현예에서, 상기 돌연변이된 Cpf1은 위치 S542 또는 K607, 특정 구현예에서, 둘 모두에 하나 이상의 돌연변이된 아미노산 잔기를 포함하는 AsCpf1이다. 특정 구현예에서, 상기 돌연변이된 Cpf1은 AsCpf1의 위치 S542 또는 K548(및 선택적으로 N552), 특정 구현예에서 둘 모두, 또는 AsCpf1 오솔로그(상이한 종으로부터의 상응하는 이펙터), 동족체(동일하거나 상이한 종 유래의 동일한 기능을 갖는 이펙터) 또는 변이체(예를 들어, 절단된 Cpf1을 포함하는 본원의 다른 곳에 기재된 바와 같은 추가로 변형된 Cpf1 중 임의의 것)의 상응하는 위치에 하나 이상의 돌연변이된 아미노산 잔기를 포함한다. 특정 구현예에서, 상기 돌연변이된 Cpf1은 위치 S542 또는 K548(및 선택적으로 N552), 특정 구현예에서, 둘 모두에 하나 이상의 돌연변이된 아미노산 잔기를 포함하는 AsCpf1이다.
특정 구현예에서, 상기 돌연변이된 Cpf1은 하기의 돌연변이된 아미노산 잔기 중 하나 이상을 포함한다: AsCpf1의 542R, 547K, 548M, 548A, 548G, 548L, 548R, 548I, 548N, 548C, K548Q, 548H, 548F, 548S, 548T, 548W, 548Y, 548V, 550Y, 551R, 552G, 552K, 552R, 552S, 552T, 167A, 604A 또는 607A, 또는 AsCpf1 오솔로그(상이한 종으로부터의 상응하는 이펙터), 동족체(동일하거나 상이한 종 유래의 동일한 기능을 갖는 이펙터) 또는 변이체(예를 들어, 절단된 Cpf1을 포함하는 본원의 다른 곳에 기재된 바와 같은 추가로 변형된 Cpf1 중 임의의 것)의 상응하는 잔기. 특정 구현예에서, 상기 돌연변이된 Cpf1은 하기의 아미노산 잔기 중 하나 이상을 포함하는 AsCpf1이다: 542R, 547K, 548M, 548A, 548G, 548L, 548R, 548I, 548N, 548C, K548Q, 548H, 548F, 548S, 548T, 548W, 548Y, 548V, 550Y, 551R, 552G, 552K, 552R, 552S, 552T, 167A, 604A 또는 607A. 특정 구현예에서, 상기 돌연변이된 Cpf1은 하기의 돌연변이된 아미노산 잔기 중 하나 이상을 포함한다: AsCpf1의 542R, 548M, 548A, 548G, 548L, 548R, 548I, 548N, 548C, K548Q, 548H, 548F, 548S, 548T, 548W, 548Y 또는 548V, 또는 AsCpf1 오솔로그(상이한 종으로부터의 상응하는 이펙터), 동족체(동일하거나 상이한 종 유래의 동일한 기능을 갖는 이펙터) 또는 변이체(예를 들어, 절단된 Cpf1을 포함하는 본원의 다른 곳에 기재된 바와 같은 추가로 변형된 Cpf1 중 임의의 것)의 상응하는 위치. 특정 구현예에서, 상기 돌연변이된 Cpf1은 하기의 돌연변이된 아미노산 잔기 중 하나 이상을 포함하는 AsCpf1이다: 542R, 548M, 548A, 548G, 548L, 548R, 548I, 548N, 548C, K548Q, 548H, 548F, 548S, 548T, 548W, 548Y 또는 548V. 특정 구현예에서, 상기 돌연변이된 Cpf1은 하기의 돌연변이된 아미노산 잔기 중 하나 이상을 포함한다: AsCpf1의 542R 또는 607R, 특정 구현예에서, 둘 모두, 또는 AsCpf1 오솔로그(상이한 종으로부터의 상응하는 이펙터), 동족체(동일하거나 상이한 종 유래의 동일한 기능을 갖는 이펙터) 또는 변이체(예를 들어, 절단된 Cpf1을 포함하는 본원의 다른 곳에 기재된 바와 같은 추가로 변형된 Cpf1 중 임의의 것)의 상응하는 위치. 특정 구현예에서, 상기 돌연변이된 Cpf1은 하기의 돌연변이된 아미노산 잔기 중 하나 이상을 포함하는 AsCpf1이다: 542R 또는 607R, 특정 구현예에서, 둘 모두. 특정 구현예에서, 상기 돌연변이된 Cpf1은 하기의 돌연변이된 아미노산 잔기 중 하나 이상, 특정 구현예에서, 둘 모두를 포함한다: AsCpf1의 542R 또는 548V(및 선택적으로 552R) 또는 AsCpf1 오솔로그(상이한 종으로부터의 상응하는 이펙터), 동족체(동일하거나 상이한 종 유래의 동일한 기능을 갖는 이펙터) 또는 변이체(예를 들어, 절단된 Cpf1을 포함하는 본원의 다른 곳에 기재된 바와 같은 추가로 변형된 Cpf1 중 임의의 것)의 상응하는 위치. 특정 구현예에서, 상기 돌연변이된 Cpf1은 하기의 돌연변이된 아미노산 잔기 중 하나 이상, 특정 구현예에서, 둘 모두를 포함하는 AsCpf1이다: 542R 또는 548V(및 선택적으로 552R). 특정 구현예에서, 상기 돌연변이된 Cpf1은 AsCpf1과 관련하여 돌연변이된 아미노산 잔기 542 또는 Cpf1 오솔로그에서의 상응하는 잔기를 포함한다. 특정 구현예에서, 상기 돌연변이된 Cpf1은 LbCpf1에 관하여 돌연변이된 아미노산 잔기 532 또는 Cpf1 오솔로그에서의 상응하는 잔기를 포함한다.
특정 구현예에서, 상기 돌연변이된 Cpf1은 하기의 돌연변이된 아미노산 잔기 중 하나 이상을 포함한다: AsCpf1의 S542R, N547K, K548M, K548A, K548G, K548L, K548R, K548I, K548N, K548C, K548Q, K548H, K548F, K548S, K548T, K548W, K548Y, K548V, K550Y, N551R, N552G, N552K, N552R, N552S, N552T, T167A, M604A 또는 K607A, 또는 AsCpf1 오솔로그(상이한 종으로부터의 상응하는 이펙터), 동족체(동일하거나 상이한 종 유래의 동일한 기능을 갖는 이펙터) 또는 변이체(예를 들어, 절단된 Cpf1을 포함하는 본원의 다른 곳에 기재된 바와 같은 추가로 변형된 Cpf1 중 임의의 것)의 상응하는 위치. 특정 구현예에서, 상기 돌연변이된 Cpf1은 하기의 돌연변이된 아미노산 잔기 중 하나 이상을 포함하는 AsCpf1이다: S542R, N547K, K548M, K548A, K548G, K548L, K548R, K548I, K548N, K548C, K548Q, K548H, K548F, K548S, K548T, K548W, K548Y, K548V, K550Y, N551R, N552G, N552K, N552R, N552S, N552T, T167A, M604A 또는 K607A. 특정 구현예에서, 상기 돌연변이된 Cpf1은 하기의 돌연변이된 아미노산 잔기 중 하나 이상을 포함한다: AsCpf1의 S542R, K548M, K548A, K548G, K548L, K548R, K548I, K548N, K548C, K548Q, K548H, K548F, K548S, K548T, K548W, K548Y 또는 K548VA, 또는 AsCpf1 오솔로그(상이한 종으로부터의 상응하는 이펙터), 동족체(동일하거나 상이한 종 유래의 동일한 기능을 갖는 이펙터) 또는 변이체(예를 들어, 절단된 Cpf1을 포함하는 본원의 다른 곳에 기재된 바와 같은 추가로 변형된 Cpf1 중 임의의 것)의 상응하는 위치. 특정 구현예에서, 상기 돌연변이된 Cpf1은 하기의 돌연변이된 아미노산 잔기 중 하나 이상을 포함하는 AsCpf1이다: S542R 또는 K548A, K548G, K548L, K548R, K548I, K548N, K548C, K548Q, K548H, K548F, K548S, K548T, K548W, K548Y, K548V. 특정 구현예에서, 상기 돌연변이된 Cpf1은 하기의 돌연변이된 아미노산 잔기 중 하나 이상을 포함한다: AsCpf1의 S542R 및 K607R, 또는 AsCpf1 오솔로그(상이한 종으로부터의 상응하는 이펙터), 동족체(동일하거나 상이한 종 유래의 동일한 기능을 갖는 이펙터) 또는 변이체(예를 들어, 절단된 Cpf1을 포함하는 본원의 다른 곳에 기재된 바와 같은 추가로 변형된 Cpf1 중 임의의 것)의 상응하는 위치. 특정 구현예에서, 상기 돌연변이된 Cpf1은 하기의 돌연변이된 아미노산 잔기 중 하나 이상을 포함하는 AsCpf1이다: S542R 및 K607R. 특정 구현예에서, 상기 돌연변이된 Cpf1은 하기의 돌연변이된 아미노산 잔기 중 하나 이상을 포함한다: AsCpf1의 S542R 및 K548V(및 선택적으로 552R) 또는 AsCpf1 오솔로그(상이한 종으로부터의 상응하는 이펙터), 동족체(동일하거나 상이한 종 유래의 동일한 기능을 갖는 이펙터) 또는 변이체(예를 들어, 절단된 Cpf1을 포함하는 본원의 다른 곳에 기재된 바와 같은 추가로 변형된 Cpf1 중 임의의 것)의 상응하는 위치. 특정 구현예에서, 상기 돌연변이된 Cpf1은 하기의 돌연변이된 아미노산 잔기 중 하나 이상을 포함하는 AsCpf1이다: S542R 및 K548V(및 선택적으로 N552R).
상기 기재된 특정 구현예에서, Cpf1은 하기의 조합된 돌연변이 중 하나 이상을 갖거나 이를 포함한다: AsCpf1에 관하여 아미노산 위치 542/548; 542/607; 548/552; 542/548/552, 542/550/607; 542/548/550/607 또는 Cpf1 오솔로그에서의 상응하는 잔기. 상기 기재된 특정 구현예에서, Cpf1은 하기의 조합된 돌연변이 중 하나 이상을 갖거나 이를 포함한다: LbCpf1에 관하여 아미노산 위치 532/538; 532/595; 538/542; 532/538/542, 또는 Cpf1 오솔로그에서의 상응하는 잔기.
특정 구현예에서, 상기 돌연변이된 Cpf1은 (AsCpf1의 또는 이와 관련하여) 하나 이상의 돌연변이를 갖고, (적어도) 하기 표에 나타낸 바와 같은 PAM 서열을 인식하며, 상기 PAM은 바람직하게는 상응하는 야생형 Cpf1에 의해 인식되지 않는다. 다중의 PAM 서열이 주어진 돌연변이체에 대하여 열거되는 경우, 이러한 돌연변이체는 하나 이상, 예컨대, 모든 열거된 PAM 서열을 인식할 수 있다.
Figure pat00004
Figure pat00005
Figure pat00006
Figure pat00007
Figure pat00008
Figure pat00009
Figure pat00010
Figure pat00011
Figure pat00012
Figure pat00013
Figure pat00014
다른 곳에 나타낸 바와 같이, AsCpf1에서의 상기 열거된 아미노산 잔기에 대한 언급은 다른 Cpf1 오솔로그, 예컨대 LbCpf1에서의 상응하는 잔기(들)에 동일하게 적용한다.
특정 구현예에서, 본 발명의 Cpf1 돌연변이체는 하기 표에서와 같은 하나 이상의 돌연변이를 포함하고/포함하거나 (적어도) 표기된 PAM 서열을 인식한다.
Figure pat00015
특정 구현예에서, 상기 표에 나타낸 바와 같은 상기 PAM은 또한, 야생형 Cpf1에 의해 인식되는 PAM 서열을 인식할 수 있거나, 이를 인식하지 않을 수 있다. 특정 구현예에서, 추가의 PAM 서열도 또한 인식될 수 있다. 특정 구현예에서, 상기 열거된 돌연변이체는 적어도 표기된 PAM 서열을 인식한다. 예로서 그리고 제한 없이, 위치 542 및 548에서의 이중 돌연변이, 예컨대 Cpf1, 예컨대 AsCpf1에서의 상기 열거된 이중 돌연변이 S542/K548(예컨대 S542R/K548V) 또는 Cpf1 오솔로그에서의 상응하는 돌연변이가 또한 정규 PAM 서열 TTTV를 인식할 수 있는 것이 관찰되었다. 놀랍게도, 이러한 이중 돌연변이체는 야생형 Cpf1보다 효율이 더 높지만 특이성이 감소되어 그를 행한다.
특정 구현예에서, 상기 Cpf1은 AsCpf1의 도 14에 나타낸 바와 같은 위치(들) 또는 AsCpf1 오솔로그(상이한 종으로부터의 상응하는 이펙터), 동족체(동일하거나 상이한 종 유래의 동일한 기능을 갖는 이펙터) 또는 변이체(예를 들어, 절단된 Cpf1을 포함하는 본원의 다른 곳에 기재된 바와 같은 추가로 변형된 Cpf1 중 임의의 것)의 상응하는 위치에 하나 이상의 돌연변이된 아미노산 잔기를 갖는다. 특정 구현예에서, 상기 PAM은 삽입결실%가 적어도 5%, 예컨대 적어도 10%, 예컨대 적어도 15%, 예컨대 적어도 20%이면, 인식되는 것으로 간주된다.
특정 구현예에서, 상기 Cpf1은 AsCpf1의 도 14에 나타낸 바와 같은 위치(들) 또는 AsCpf1 오솔로그(상이한 종으로부터의 상응하는 이펙터), 동족체(동일하거나 상이한 종 유래의 동일한 기능을 갖는 이펙터) 또는 변이체(예를 들어, 절단된 Cpf1을 포함하는 본원의 다른 곳에 기재된 바와 같은 추가로 변형된 Cpf1 중 임의의 것)의 상응하는 위치에 하나 이상의 돌연변이된 아미노산 잔기를 가지며, 도 14에 나타낸 PAM 서열을 인식한다. 특정 구현예에서, 상기 PAM은 삽입결실%가 적어도 5%, 예컨대 적어도 10%, 예컨대 적어도 15%, 예컨대 적어도 20%이면, 인식되는 것으로 간주된다.
특정 구현예에서, 상기 Cpf1은 단일의 돌연변이, 예컨대 단일의 점 돌연변이를 갖는다.
바람직하게는, AsCpf1의 아미노산 위치는 UniProtKB/Swiss-Prot 수탁 번호 U2UMQ6.1(유전자은행 수탁 번호 961512548)에 나타낸 바와 같거나, 문헌[Zetsche et al. (2015); Cell; 163(3):759-771]에 나타낸 바와 같다.
특정 구현예에서, 이에 따라 돌연변이된 Cpf1은 돌연변이된 AsCpf1(아시다미노코커스 종, 예컨대 아시다미노코커스 종 BV3L6) 또는 돌연변이된 LbCpf1(라크노스피라세아에 박테리움, 예컨대 라크노스피라세아에 박테리움 MA2020 또는 라크노스피라세아에 박테리움 ND2006)이다. 바람직한 구현예에서, 이에 따라 돌연변이된 Cpf1은 돌연변이된 AsCpf1(아시다미노코커스 종, 예컨대 아시다미노코커스 종 BV3L6)이다.
특정 구현예에서, 본원에 기재된 바와 같은 본 발명에 따른 돌연변이된 Cpf1 폴리펩티드는 본원의 다른 곳에 추가로 기재된 바와 같이, Cpf1 촉매 활성 및/또는 Cpf1 안정성에 영향을 미치는 변형 또는 돌연변이를 추가로 포함한다. 예로서, 그리고 제한 없이, Cpf1은 본원의 다른 곳에 기재된 바와 같이, 불활성화되거나 비활성화된 Cpf1(예를 들어, "데드" Cpf1)과 같이 추가로 변형될 수 있으며, 촉매적 활성은 부분적으로 또는 (실질적으로) 완전하게 소실된다. 이러한 맥락에서 촉매 활성의 소실은 Cpf1 단백질이 DNA를 절단할 수 없음(예를 들어, 이중 가닥 파손을 유도할 수 없거나 닉카제와 같이 오직 단일 가닥 파손만을 유도할 수 있음)을 의미한다. 또한, Cpf1은 본원의 다른 곳에 정의된 바와 같이 표적외 효과를 감소시키기 위해 변형될 수 있다. Cpf1은 또한 본원의 다른 곳에 정의된 바와 같이 융합 단백질의 일부일 수 있다. Cpf1은 또한, 본원의 다른 곳에 정의된 바와 같이, 불안정화 도메인을 포함하도록 변형될 수 있다. Cpf1은 또한, 본원의 다른 곳에 정의된 바와 같이 스플릿(split) Cpf1일 수 있다. Cpf1은 또한 본원의 다른 곳에 정의된 바와 같이 유도성 Cpf1일 수 있다. Cpf1은 또한, 본원의 다른 곳에 정의된 바와 같이 자가-비활성화 시스템(SIN)의 일부일 수 있다. Cpf1은 또한 본원의 다른 곳에 정의된 바와 같이 상승적 활성인자 시스템(SAM)의 일부가 되도록 변형될 수 있다. 이들 추가로 변형된 Cpf1 단백질 중 몇몇은 본원의 다른 곳에 정의된 바와 같이 기능적 스크린에서 또는 기능적 이펙터의 전달을 위하여 사용될 수 있다. 유리하게는, 이러한 Cpf1(융합) 단백질은 본원의 다른 곳에 정의된 바와 같이 (부분적으로) 불활성화된/비활성화된 Cpf1 단백질을 포함할 수 있다.
따라서, 일부 구현예에서, 본원에 기재된 바와 같은 본 발명에 따른 돌연변이된 Cpf1 폴리펩티드는 기능적 도메인이 있는 융합 단백질에 포함된다. 특정 구현예에서, 상기 기능적 도메인은 (전사) 활성인자 도메인, (전사) 억제인자 도메인, 재조합효소, 트랜스포사제(transposase), 히스톤 리모델러(remodeler), DNA 메틸트랜스퍼라제, 크립토크롬(cryptochrome), 광 유도성/제어성 도메인 또는 화학 유도성/제어성 도메인을 포함한다.
특정 구현예에서, 본원에 기재된 바와 같은 본 발명에 따른 돌연변이된 Cpf1 폴리펩티드는 DNA 이중 가닥 파손을 유도할 수 없다. 특정 구현예에서, 본원에 기재된 바와 같은 본 발명에 따른 돌연변이된 Cpf1 폴리펩티드는 닉카제이다. 특정 구현예에서, 본원에 기재된 바와 같은 본 발명에 따른 돌연변이된 Cpf1 폴리펩티드는 촉매적 비활성 Cpf1 폴리펩티드이다. 특정 구현예에서, 본원에 기재된 바와 같은 본 발명에 따른 돌연변이된 Cpf1 폴리펩티드는 DNA 단일 가닥 파손을 유도할 수 없다.
일 양태에서, 본 발명은 본원에 기재된 바와 같은 본 발명에 따른 돌연변이된 Cpf1 폴리펩티드를 인코딩하는 폴리뉴클레오티드에 관한 것이다. 특정 구현예에서, Cpf1 폴리뉴클레오티드는 본원의 다른 곳에 기재된 바와 같이, 관심 세포에서의 발현을 위해 코돈 최적화된다. 특정 구현예에서, 본원에 기재된 바와 같은 본 발명에 따른 돌연변이된 Cpf1 폴리펩티드를 인코딩하는 폴리뉴클레오티드는 본원의 다른 곳에 기재된 바와 같이 하나 이상의 NLS를 인코딩하는 하나 이상의 서열을 포함한다.
일 양태에서, 본 발명은 본원에 기재된 바와 같은 본 발명에 따른 돌연변이된 Cpf1을 인코딩하는 폴린뉴클레오티드를 포함하는 벡터에 관한 것이다. 특정 구현예에서, 벡터는 발현 벡터이다. 특정 구현예에서, 벡터는 원핵 발현 벡터이다. 특정 구현예에서, 벡터는 진핵 발현 벡터이다. 특정 구현예에서, 벡터는 본원의 다른 곳에 기재된 바와 같이, 유도성, 조건적 또는 구성적 (원핵 또는 진핵) 발현 벡터이다.
일 양태에서, 본 발명은 하나 이상의 벡터를 포함하는 벡터 시스템에 관한 것이며, 상기 하나 이상의 벡터는 본원에 기재된 바와 같은 본 발명에 따른 돌연변이된 Cpf1을 인코딩하는 폴리뉴클레오티드 및 동일하거나 상이한 벡터 상에 가이드 RNA(gRNA)를 인코딩하는 하나 이상의 폴리뉴클레오티드를 포함한다. 특정 구현예에서, 상기 벡터 시스템은 상기 정의된 바와 같이, 하나 이상의 발현 벡터를 포함한다.
일 양태에서, 본 발명은 본원에 기재된 바와 같은 본 발명에 따른 돌연변이된 Cpf1 폴리펩티드를 포함하며, 및 본원의 다른 곳에 정의된 바와 같은 gRNA를 추가로 포함하는 복합체에 관한 것이다. 추가의 지침에 의해, 특정 구현예에서, 상기 gRNA는 본원의 다른 곳에 정의된 바와 같이, 가이드 서열 및 직접 반복부 서열을 포함한다.
특정 구현예에서, 그리고 추가의 지침에 의해, 본원에 정의된 바와 같은 gRNA는 본원의 다른 곳에 정의된 바와 같이, 가이드 서열 및 직접 반복부 서열을 포함한다. 특정 구현예에서, 상기 gRNA는 5' 가이드 서열 및 3' 직접 반복부 서열을 포함하는 폴리뉴클레오티드 서열을 포함한다. 특정 구현예에서, 상기 가이드 서열은 표적 DNA 서열에 혼성화할 수 있다. 특정 구현예에서, 상기 가이드 서열은 본원의 다른 곳에 정의된 바와 같이 기능성, 특이성 및/또는 안정성을 변경시키기 위해 변형된다. 추가의 예에 의해, 그리고 제한 없이, 상기 gRNA는 본원의 다른 곳에 기재된 바와 같이 데드 gRNA일 수 있다. 추가의 예에 의해, 그리고 제한 없이, 상기 gRNA는 본원의 다른 곳에 기재된 바와 같이 보호된 gRNA일 수 있다. 추가의 예에 의해, 그리고 제한 없이, 상기 gRNA는 본원의 다른 곳에 기재된 바와 같이 에스코트된(escorted) gRNA일 수 있다. 추가의 예에 의해, 그리고 제한 없이, 상기 gRNA는 본원의 다른 곳에 정의된 바와 같이, 하나 이상의 압타머의 부가에 의해 변형될 수 있으며, 예를 들어, 본원의 다른 곳에 기재된 바와 같은 상승적 활성화 시스템(SAM)에 이용 가능할 수 있다.
바람직한 특정 구현예에서, 본원에 기재된 바와 같은 본 발명에 따른 돌연변이된 Cpf1은 본원에 기재된 바와 같은 gRNA에 결합할 수 있다. 특정 구현예에서, 본원에 기재된 바와 같은 본 발명에 따른 돌연변이된 Cpf1은 상기 gRNA와 (기능적) 복합체를 형성할 수 있다. 특정 구현예에서, 상기 (기능적) 복합체에서 본원에 기재된 바와 같은 본 발명에 따른 돌연변이된 Cpf1은 상기 표적 DNA 유전자좌로의 결합 시에 표적 DNA 유전자좌를 변형시키거나 표적화시킬 수 있다. 특정 구현예에서, 상기 (기능적) 복합체에서 본원에 기재된 바와 같은 본 발명에 따른 돌연변이된 Cpf1은 상기 gRNA와 복합체를 형성할 수 있으며, 상기 표적 DNA 유전자좌로의 상기 복합체의 서열 특이적인 결합 및/또는 상기 표적 유전자좌의 변형을 초래할 수 있다. 이러한 복합체는 본원의 다른 곳에 기재된 바와 같이, DNA 변형, 예컨대, 단일 가닥 또는 이중 가닥 DNA 절단을 유도할 수 있거나, (유리하게는 본원의 다른 곳에 기재된 바와 같이 예컨대, 데드 Cpf1, 예컨대 기능적 도메인에 융합된 데드 Cpf1을 이용하여) 본원의 다른 곳에 기재된 바와 같이 DNA 구성/구조, 후생적 변형 또는 유전자 발현을 변경시킬 수 있다.
일 양태에서, 본 발명은 본원에 기재된 바와 같은 본 발명에 따른 돌연변이된 Cpf1 폴리펩티드, 폴리뉴클레오티드, 벡터, 벡터 시스템 또는 복합체를 포함하는 전달 시스템에 관한 것이다. 전달 시스템은 본원의 다른 곳에 정의된 바와 같이, 원핵 전달 또는 진핵 전달을 위해 구성될 수 있다. 전달 시스템은 본원의 다른 곳에 정의된 바와 같이, 조직-특이적 전달 또는 비 조직-특이적 전달을 위해 구성될 수 있다. 전달 시스템은 본원의 다른 곳에 정의된 바와 같이 유도성 또는 비-유도성 전달을 위해 구성될 수 있다. 특정 구현예에서, 전달 시스템은 본원의 다른 곳에 기재된 바와 같이, 리포좀, 입자, 엑소좀, 미세소포, 유전자-총 또는 바이러스 전달 시스템이거나 이를 포함한다.
일 양태에서, 본 발명은 본원에 기재된 바와 같은 본 발명에 따른 돌연변이된 Cpf1 폴리펩티드, 폴리뉴클레오티드, 벡터, 벡터 시스템, 복합체 또는 전달 시스템을 포함하는 숙주 세포에 관한 것이다. 일 양태에서, 본 발명은 본원에 기재된 바와 같은 본 발명에 따른 돌연변이된 Cpf1 폴리펩티드를 발현하거나 이를 발현할 수 있는 숙주 세포(예컨대, 유리하게는 벡터, 예컨대 적합한 발현 벡터 상에 제공되는 Cpf1을 인코딩하는 다중핵산 서열을 포함하는 숙주 세포)에 관한 것이다. 숙주 세포는 본원의 다른 곳에 정의된 바와 같이 임의의 유형의 숙주 세포일 수 있다. 예에 의해, 숙주 세포는 원핵 숙주 세포일 수 있다. 추가의 예에 의해, 숙주 세포은 진핵 숙주 세포일 수 있다. 특정 구현예에서, 숙주 세포는 단리된 숙주 세포, 즉, (다세포) 유기체 내에 존재하지 않는 세포, 예컨대 단리된 인간 또는 동물 숙주 세포이다.
일 양태에서, 본 발명은 본원에 기재된 바와 같은 본 발명에 따른 돌연변이된 Cpf1 폴리펩티드, 폴리뉴클레오티드, 벡터, 벡터 시스템, 복합체, 전달 시스템 또는 숙주 세포를 포함하는 조성물에 관한 것이다. 특정 구현예에서, 상기 조성물은 본원의 다른 곳에 기재된 바와 같이, 약제학적 또는 비-약제학적 조성물이다.
일 양태에서, 본 발명은 본원에 기재된 바와 같은 본 발명에 따른 돌연변이된 Cpf1 폴리펩티드, 폴리뉴클레오티드, 벡터, 벡터 시스템, 복합체, 전달 시스템, 숙주 세포 또는 조성물을 포함하는 키트에 관한 것이다. 특정 구현예에서, 이러한 키트는 본원의 다른 곳에 기재된 바와 같은 성분일 수 있거나 이를 포함할 수 있다.
일 양태에서, 본 발명은 본원에 기재된 바와 같은 본 발명에 따른 돌연변이된 Cpf1 폴리펩티드, 폴리뉴클레오티드, 벡터, 벡터 시스템, 복합체, 전달 시스템, 숙주 세포 또는 조성물을 포함하는 유전자이식 유기체에 관한 것이다. 추가의 양태에서, 본 발명은 본원에 기재된 바와 같은 본 발명에 따른 돌연변이된 Cpf1 폴리펩티드를 발현하거나, 이를 발현할 수 있는 유전자이식 유기체(예컨대, 유리하게는 벡터, 예컨대 적합한 발현 벡터 상에 제공되는 Cpf1을 인코딩하는 다중핵산 서열 또는 예컨대, 본원의 다른 곳에 기재된 바와 같이 유리하게 적합한 프로모터 및 선택적으로 추가의 조절 요소의 제어 하에 게놈 내에 통합된 Cpf1을 인코딩하는 다중핵산 서열을 포함하는 유전자이식 유기체)에 관한 것이다.
일 양태에서, 본 발명은 표적 DNA 유전자좌의 변형 또는 표적화 방법에 관한 것이며, 상기 방법은 본원에 기재된 바와 같은 본 발명에 따른 폴리펩티드, 폴리뉴클레오티드, 벡터, 벡터 시스템, 전달 시스템, 복합체 또는 조성물을 상기 유전자좌로 전달하는 단계를 포함한다. 추가의 양태에서, 본 발명은 표적 DNA 유전자좌의 변형 또는 표적화 방법에 관한 것이며, 상기 방법은 본원에 기재된 바와 같이 본 발명에 따른 돌연변이된 Cpf1 폴리펩티드 또는 본원에 기재된 바와 같은 상기 돌연변이된 Cpf1을 인코딩하는 폴리뉴클레오티드 및 gRNA 또는 상기 gRNA를 인코딩하는 폴리뉴클레오티드를 상기 유전자좌에 전달하는 단계를 포함하며, 바람직하게는 상기 돌연변이된 Cpf1 폴리펩티드는 상기 gRNA와 복합체를 형성하며, 바람직하게는 상기 표적 DNA 유전자좌는 상기 표적 DNA 유전자좌의 결합 시에 변형되거나 표적화된다. 이러한 표적 DNA 유전자좌의 변형 또는 표적화 방법은 일반적으로 본원의 다른 곳에 기재되어 있다. 바람직한 특정 구현예에서, 상기 방법에서 본원에 기재된 바와 같은 본 발명에 따른 돌연변이된 Cpf1은 본원에 기재된 바와 같은 gRNA에 결합할 수 있다. 특정 구현예에서, 상기 방법에서 본원에 기재된 바와 같은 본 발명에 따른 돌연변이된 Cpf1은 상기 gRNA와 (기능적) 복합체를 형성할 수 있다. 특정 구현예에서, 상기 방법에서 본원에 기재된 바와 같은 상기 (기능적) 복합체 내의 본 발명에 따른 돌연변이된 Cpf1은 상기 표적 DNA 유전자좌로의 결합 시에 표적 DNA 유전자좌를 변형시키거나 표적화할 수 있다. 특정 구현예에서, 상기 방법에서 본원에 기재된 바와 같은 상기 (기능적) 복합체 내의 본 발명에 따른 돌연변이된 Cpf1은 상기 gRNA와 복합체를 형성할 수 있으며, 표적 DNA 유전자좌로의 상기 복합체의 서열 특이적 결합 및/또는 상기 표적 유전자좌의 변형을 초래할 수 있다. 이러한 복합체는 본원의 다른 곳에 기재된 바와 같이 DNA 변형, 예컨대, 단일 가닥 또는 이중 가닥 DNA 절단을 유도할 수 있거나, (유리하게는 본원의 다른 곳에 기재된 바와 같이 예컨대, 데드 Cpf1, 예컨대 기능적 도메인에 융합된 데드 Cpf1을 이용하여) 본원의 다른 곳에 기재된 바와 같이 DNA 구성/구조, 후생적 변형 또는 유전자 발현을 변경시킬 수 있다. 특정 구현예에서, 상기 표적 유전자좌를 변형시키거나 표적화하는 단계는 DNA 가닥 파손을 유도하는 것을 포함한다. 특정 구현예에서, 상기 표적 유전자좌를 변형시키거나 표적화하는 단계는 DNA 단일 가닥 파손을 유도하는 것을 포함한다. 특정 구현예에서, 상기 표적 유전자좌를 변형시키거나 표적화하는 단계는 DNA 이중 가닥 파손을 유도하는 것을 포함한다. 특정 구현예에서, 상기 표적 유전자좌를 변형시키거나 표적화하는 단계는 하나 이상의 유전자의 유전자 발현을 변경시키는 것을 포함한다. 이러한 방법에서, 유리하게는 본원의 다른 곳에 기재된 바와 같은 불활성화된 또는 비활성화된 Cpf1이 사용될 수 있으며, 본원의 다른 곳에 기재된 바와 같이 이종성 기능적 도메인에 선택적으로 결합되거나, 회합되거나 융합된다. 특정 구현예에서, 상기 표적 유전자좌를 변형시키거나 표적화하는 단계는 상기 표적 DNA 유전자좌의 후생적 변형을 포함한다. 특정 구현예에서, 상기 표적 유전자좌를 변형시키거나 표적화하는 단계는 상기 표적 DNA 유전자좌의 염색질 변형을 포함한다. 특정 구현예에서, 상기 표적 유전자좌를 변형시키거나 표적화하는 단계는 상기 표적 DNA 유전자좌의 구성의 변형을 포함한다.
일 양태에서, 본 발명은 하기의 단계를 포함하는 PAM 인식에 영향을 미치는 하나 이상의 돌연변이를 갖는 돌연변이된 Cas, CRISPR 효소, CRISPR 단백질 또는 CRISPR 이펙터, 예컨대, 본원에 기재된 본 발명에 따른 돌연변이된 Cpf1 폴리펩티드의 확인 방법에 관한 것이다:
(a) 숙주 세포를 제공하는 단계로서, 상기 숙주 세포가
- PAM 인식에 영향을 미치는 하나 이상의 돌연변이를 갖는 돌연변이된 Cpf1 폴리펩티드 후보를 포함하거나 이를 발현하고,
- gRNA를 포함하거나 이를 발현하고,
- DNA 표적 서열에 연결된 특정 PAM 서열을 포함하는 폴리뉴클레오티드를 포함하고, 폴리뉴클레오티드가 선별 마커를 추가로 포함하고, 상기 DNA 표적 서열이 상기 gRNA와 혼성화할 수 있는 단계,
(b) 상기 선별 마커의 활성에 기초하여 PAM 인식에 영향을 미치는 하나 이상의 돌연변이를 갖는 돌연변이된 Cpf1 폴리펩티드를 확인하는 단계.
추가의 양태에서, 본 발명은 하기의 단계를 포함하는 PAM 인식에 영향을 미치는 하나 이상의 돌연변이를 갖는 돌연변이된 Cas, CRISPR 효소, CRISPR 단백질 또는 CRISPR 이펙터, 예컨대, 본원에 기재된 본 발명에 따른 돌연변이된 Cpf1 폴리펩티드의 확인 방법(예컨대, 상기 기재된 방법)에 관한 것이다:
(a1) PAM 인식에 영향을 미치는 하나 이상의 돌연변이를 갖는 돌연변이된 Cpf1 폴리펩티드 후보 및 gRNA를 포함하거나 이를 발현하는 숙주 세포를 제공하는 단계;
(b1) 상기 gRNA가 혼성화할 수 있는 DNA 표적 서열에 연결된 특정 PAM 서열을 포함하는 폴리뉴클레오티드를 상기 숙주 세포에 도입시키는 단계로서, 상기 폴리뉴클레오티드가 선별 마커를 추가로 포함하는 단계; 또는
(a2) DNA 표적 서열에 연결된 특정 PAM 서열을 포함하는 폴리뉴클레오티드를 포함하는 숙주 세포를 제공하는 단계로서, 상기 폴리뉴클레오티드가 선별 마커를 추가로 포함하는 단계;
(b2) PAM 인식에 영향을 미치는 하나 이상의 돌연변이를 갖는 돌연변이된 Cpf1 폴리펩티드 후보 또는 이를 발현하는 폴리뉴클레오티드, 및 상기 DNA 표적 서열과 혼성화할 수 있는 gRNA 또는 이를 발현하는 폴리뉴클레오티드를 상기 숙주 세포에 도입시키는 단계;
(c) 상기 선별 마커의 활성에 기초하여 PAM 인식에 영향을 미치는 하나 이상의 돌연변이를 갖는 돌연변이된 Cpf1 폴리펩티드를 확인하는 단계.
특정 구현예에서, PAM 인식에 영향을 미치는 하나 이상의 돌연변이를 갖는 돌연변이된 Cpf1 폴리펩티드의 확인 방법은 도 2 및/또는 도 3에 나타낸 바와 같은 단계를 포함한다.
특정 구현예에서, 이들 방법에서 상기 특정 PAM 서열은 상응하는 야생형 Cpf1에 의해 인식되지 않는다.
특정 구현예에서, 이들 방법에서 상기 숙주 세포는 원핵 숙주 세포이다. 특정 구현예에서, 이들 방법에서 상기 숙주 세포는 진핵 숙주 세포이다.
특정 구현예에서, 이들 방법에서 상기 선별 마커는 양성 또는 음성 선별 마커이다(예를 들어, 숙주 세포의 생존은 선별 마커의 활성에 좌우될 수 있다). 특정 구현예에서, 상기 선별 마커는 항생제 내성 유전자이다.
특정 구현예에서, 이들 방법에서 상기 돌연변이된 Cpf1 폴리펩티드는 촉매적으로 활성이며, 즉, 적어도 단일 가닥 DNA 파손, 바람직하게는 이중 가닥 DNA 파손을 유도할 수 있다.
특정 구현예에서, 이들 방법의 단계 (a), (a1) 또는 (a2)에서 상기 숙주 세포는 숙주 세포 라이브러리이거나 이를 포함한다. 특정 구현예에서, 상기 숙주 세포 라이브러리는 PAM 인식에 영향을 미치는 하나 이상의 돌연변이를 갖는 돌연변이된 Cpf1 폴리펩티드 후보의 라이브러리이거나 이를 포함한다. 특정 구현예에서, 상기 숙주 세포 라이브러리는 폴리뉴클레오티드의 PAM 라이브러리이거나, 이를 포함한다. 특정 구현예에서, 이들 방법의 단계 (a) 또는 (b1)에서 상기 폴리뉴클레오티드는 폴리뉴클레오티드의 PAM 라이브러리이거나, 이를 포함한다. 특정 구현예에서, 단계 (a) 또는 (b2)에서 PAM 인식에 영향을 미치는 하나 이상의 돌연변이를 갖는 상기 돌연변이된 Cpf1 폴리펩티드 후보는 Cpf1 돌연변이체 라이브러리이거나, 이를 포함한다.
일 양태에서, 본 발명은 상기 기재된 바와 같은 본 발명에 따른 방법에 의해 확인되는 돌연변이된 Cpf1 폴리펩티드에 관한 것이다. 추가의 양태에서, 본 발명은 상기 기재된 바와 같은 본 발명에 따른 방법에 따라 확인된 이러한 돌연변이된 폴리펩티드를 인코딩하는 폴리뉴클레오티드, 또는 본원의 다른 곳에 기재된 바와 같이, 벡터, 벡터 시스템, 복합체, 조성물, 전달 시스템, 숙주 세포 또는 유전자이식 유기체에 관한 것이다.
본원에 기재된 바와 같은 본 발명에 따른 돌연변이체 Cpf1은 예컨대, 제한 없이, 세포 또는 유기체의 기능적 스크리닝, 게놈-와이드 낙아웃 스크리닝, 복합화, 포화 돌연변이 유발원 또는 변형에서 본원의 다른 곳에 기재된 바와 같은 방법 또는 용도 중 임의의 것을 위해 및 치료적 응용, 예컨대 본원의 다른 곳에 기재된 것들을 위해 사용될 수 있다.
일 양태에서, 본 발명은 본원의 다른 곳에 기재된 바와 같이, 바람직하게는 시험관내 또는 생체외에서 DNA 표적 유전자좌를 변형시키거나 표적화하기 위한 또는 비-인간 및/또는 비-동물 유기체에서 DNA 표적 유전자좌를 변형시키거나 표적화하기 위한 본원에 기재된 바와 같은 본원에 따른 Cpf1 폴리펩티드, 폴리뉴클레오티드, 벡터, 벡터 시스템, 복합체, 전달 시스템, 숙주 세포 또는 조성물의 용도에 관한 것이다. 추가의 양태에서, 본 발명은 본원의 다른 곳에 기재된 바와 같이, 바람직하게는 시험관내 또는 생체외에서의 게놈 편집을 위한, 또는 비-인간 및/또는 비-동물 유기체의 게놈 편집을 위한, 본원에 기재된 바와 같은 본 발명에 따른 Cpf1 폴리펩티드, 폴리뉴클레오티드, 벡터, 벡터 시스템, 복합체, 전달 시스템 또는 숙주 세포의 용도에 관한 것이다. 또 다른 양태에서, 본 발명은 본원의 다른 곳에 기재된 바와 같이, 예컨대, 시험관내, 생체외 또는 생체내에서 DNA 표적 유전자좌를 변형시키거나 표적화하는데 사용하기 위한 본원에 기재된 바와 같은 본 발명에 따른 Cpf1 폴리펩티드, 폴리뉴클레오티드, 벡터, 벡터 시스템, 복합체, 전달 시스템, 숙주 세포 또는 조성물에 관한 것이다. 또 다른 양태에서, 본 발명은 본원의 다른 곳에 기재된 바와 같이, 예컨대, 시험관내, 생체외 또는 생체내에서 게놈 편집에 사용하기 위한 본원에 기재된 바와 같은 본 발명에 따른 Cpf1 폴리펩티드, 폴리뉴클레오티드, 벡터, 벡터 시스템, 복합체, 전달 시스템, 숙주 세포 또는 조성물에 관한 것이다. 추가의 양태에서, 본 발명은 본원의 다른 곳에 기재된 바와 같이, 치료법에 사용하기 위한 또는 약제로서 사용하기 위한 본원에 기재된 바와 같은 본 발명에 따른 Cpf1 폴리펩티드, 폴리뉴클레오티드, 벡터, 벡터 시스템, 복합체, 전달 시스템, 숙주 세포 또는 조성물에 관한 것이다. 또 다른 양태에서, 본 발명은 본원의 다른 곳에 기재된 바와 같이, 약제의 제조를 위한 본원에 기재된 바와 같은 본 발명에 따른 Cpf1 폴리펩티드, 폴리뉴클레오티드, 벡터, 벡터 시스템, 복합체, 전달 시스템, 숙주 세포 또는 조성물의 용도에 관한 것이다.
일 양태에서, 본 발명은 본원에 기재된 바와 같은 본 발명에 따른 돌연변이된 Cpf1(또는 이를 인코딩하는 다중핵산)을 포함하는 핵산 표적화 시스템에 관한 것이다.
핵산이 DNA이고, 일부 양태에서는 또한 DNA-RNA 하이브리드 또는 이의 유도체를 지칭할 수 있는 용어 "핵산-표적화 시스템"은, DNA-표적화 CRISPR-연관된 ("Cas") 유전자의 발현 또는 이의 활성의 유도에 포함되는 전사물 및 기타 다른 요소를 집합적으로 지칭하며, 이는 DNA-표적화 Cas 단백질을 인코딩하는 서열 및 CRISPR RNA(crRNA) 서열을 포함하는 DNA-표적화 가이드 RNA 및 (모든 시스템에서는 아닌 CRISPR-Cas9 시스템에서) 트랜스-활성화 CRISPR-Cas 시스템 RNA(tracrRNA) 서열, 또는 DNA-표적화 CRISPR 유전자좌로부터의 기타 다른 서열 및 전사물을 포함할 수 있다. 본 명세서에 기재된 Cpf1 DNA 표적화 RNA-가이드된 엔도뉴클레아제 시스템에서, tracrRNA 서열은 요구되지 않는다. 일반적으로, RNA-표적화 시스템은 표적 DNA 서열의 부위에서 RNA-표적화 복합체의 형성을 촉진하는 요소들에 의해 특징지어진다. DNA-표적화 복합체의 형성의 맥락에서, "표적 서열"은 DNA-표적화 가이드 RNA가 그에 대한 상보성을 갖도록 설계된 DNA 서열을 지칭하며, 여기서 표적 서열과 RNA-표적화 가이드 RNA 사이에서의 혼성화는 RNA-표적화 복합체의 형성을 촉진한다. 일부 구현예에서, 표적 서열은 세포의 핵 내 또는 세포질 내에 위치된다.
일 양태에서, 본 발명은 본원에 기재된 바와 같은 본 발명에 따른 돌연변이된 Cpf1(또는 이를 인코딩하는 다중핵산)을 포함하는 핵산 표적화 시스템에 관한 것이다.
본 발명의 일 양태에서, 또한 본 출원의 DNA-표적화 CRISPR-Cas 또는 CRISPR-Cas DNA-표적화 시스템으로서 지칭되는 신규 DNA 표적화 시스템은, 특이적 DNA 서열을 표적화하기 위하여 맞춤화된 단백질의 생성을 필요로 하지 않는 확인된 유형 V(예를 들어, 하위유형 V-A 및 하위유형 V-B) Cas 단백질을 기반으로 하지만, 오히려 단일 이펙터 단백질 또는 효소는 특이적 DNA 표적을 인식하도록 RNA 분자에 의해 프로그래밍될 수 있으며, 달리 말하면 효소가 상기 RNA 분자를 사용하여 특이적 DNA 표적에 채용될 수 있다. 본 발명의 양태는 특히 DNA 표적화 RNA-가이드된 Cpf1 CRISPR 시스템과 관련이 있다.
본 명세서에 기재된 핵산-표적화 시스템, 벡터 시스템, 벡터 및 조성물은 다양한 핵산-표적화 응용, 유전자 생성물, 예컨대 단백질의 합성 변경 또는 변형, 핵산 절단, 핵산 편집, 핵산 스플라이싱; 표적 핵산의 트래픽킹, 표적 핵산의 추적, 표적 핵산의 분리, 표적 핵산의 가시화 등에 사용될 수 있다.
본 명세서에서 사용된 바와 같이, Cas 단백질 또는 CRISPR 효소는 CRISPR-Cas 시스템의 새로운 분류에 제시된 임의의 단백질을 지칭한다. 유리한 구현예에서, 본 발명은 유형 V CRISPR-Cas 유전자좌, 예를 들어 하위유형 V-A로 나타낸 Cpf1-인코딩 유전자좌에서 확인된 이펙터 단백질을 포함한다. 현재, 하위유형 V-A 유전자좌는 cas1, cas2, cpf1로 나타낸 별개의 유전자 및 CRISPR 어레이를 포함한다. Cpf1(CRISPR-연관 단백질 Cpf1, 하위유형 PREFRAN)은 Cas9의 특징적인 아리그닌-풍부 클러스터에 대응하는 부분과 함께 Cas9의 해당하는 도메인에 상응하는 RuvC-유사 뉴클레아제 도메인을 함유하는 거대 단백질(약 1300 개 아미노산)이다. 그러나, Cpf1은 모든 Cas9 단백질에 존재하는 HNH 뉴클레아제 도메인이 결핍되어 있고, RuvC-유사 도메인은 HNH 도메인을 포함하는 긴 삽입물을 함유하는 Cas9와 달리 Cpf1 서열에서 연속적이다. 따라서, 특정 구현예에서, CRISPR-Cas 효소는 RuvC-유사 뉴클레아제 도메인만을 포함한다.
Cpf1 유전자는, 통상적으로 cas1, cas2, 및 cas4 유전자 및 CRISPR 카세트를 갖는 동일한 유전자좌(예를 들어, 프란시셀라 cf . 노비시다 Fx1의 FNFX1_1431-FNFX1_1428)에 있는 여러 가지 다양한 박테리아 게놈에서 발견된다. 따라서, 이러한 추정 신규 CRISPR-Cas 시스템의 레이아웃은 유형 II-B와 유사한 것으로 보인다. 또한, Cas9와 유사하게, Cpf1 단백질은 트랜스포손 ORF-B와 상동성이고 활성 RuvC-유사 뉴클레아제, 아르기닌-풍부 영역, 및 Zn 핑거(Cas9에는 부재함)를 포함하는 용이하게 확인가능한 C-말단 영역을 함유한다. 그러나, Cas9와 달리, Cpf1은 또한 CRISPR-Cas 내용 없이 여러 가지 게놈에 존재하며, ORF-B와 이의 상대적으로 높은 유사성은 이것이 트랜스포손 성분일 수 있음을 시사한다. 이것이 진정한 CRISPR-Cas 시스템이고 Cpf1이 Cas9의 기능적 유사체인 경우, 이는 신규 CRISPR-Cas 유형, 즉 유형 Vdlf 것이다(문헌[Annotation and Classification of CRISPR-Cas Systems. Makarova KS, Koonin EV. Methods Mol Biol. 2015;1311:47-75] 참조). 그러나, 본 명세서에 기재된 바와 같이, Cpf1은 하위유형 V-A인 것으로 표시되어 동일한 도메인 구조를 갖지 않고 따라서 하위유형 V-B인 것으로 표시되는 C2c1p와 구별된다.
본 발명의 양태는 또한, 예를 들어 시험관 내, 생체 내 또는 생체 외에서, 원핵 세포 또는 진핵 세포에서 하나 이상의 유전자 또는 하나 이상의 유전자 생성물의 발현을 변경하거나 조작하기 위한, 게놈 조작에 있어서 본 명세서에 기재된 조성물 및 시스템의 방법 및 용도를 포함한다.
특정 양태에서, 본 발명은 벡터를 포함한다. 본원에 사용되는 바와 같이, "벡터"는 엔티티를 하나의 환경에서 또 다른 환경으로 전달하는 것을 허용 또는 촉진하는 도구이다. 이는 레플리콘, 예컨대 플라스미드, 파지, 또는 코스미드로, 또 다른 DNA 세그먼트가 그 안에 삽입될 수 있어서, 삽입된 세그먼트의 복제를 유발한다. 일반적으로, 벡터는 적절한 제어 요소와 연결된 경우 복제할 수 있다. 일반적으로, 그리고 본 명세서에 걸쳐서, 용어 "벡터"는 그것이 연결되어 있는 다른 핵산을 수송할 수 있는 핵산 분자를 지칭한다. 벡터는, 이로 제한되지는 않지만, 단일-가닥, 이중-가닥, 또는 부분적 이중-가닥인 핵산 분자; 하나 이상의 자유 말단을 포함하는 핵산 분자, 자유 말단이 없는 핵산 분자(예를 들어, 원형); DNA, RNA 또는 이들 둘 다를 포함하는 핵산 분자; 및 당업계에서 알려진 기타 다른 다양한 폴리뉴클레오티드를 포함한다. 벡터의 일 종류로 "플라스미드"가 있으며, 이는 원형 이중 가닥 DNA 루프를 지칭하며, 그 안으로 예컨대 표준 분자 클로닝 기법에 의해서 추가적인 DNA 분절이 삽입될 수 있다. 벡터의 또 다른 종류로 바이러스 벡터가 있으며, 바이러스-유래된 DNA 또는 RNA 서열이 바이러스(예를 들어, 레트로바이러스, 복제 결함 레트로바이러스, 아데노바이러스, 복제 결함 아데노바이러스, 및 아데노-연관 바이러스) 내로의 패키징을 위해 벡터에 존재한다. 바이러스 벡터는 또한 숙주 세포 내로의 트랜스펙션을 위한, 바이러스가 보유하는 폴리뉴클레오티드를 포함한다. 특정 벡터는 그것이 도입된 숙주 세포에서 자율적 복제가 가능하다(예를 들어, 박테리아 복제 원점을 가진 박테리아 벡터 및 에피솜 포유동물 벡터). 다른 벡터(예를 들어, 비-에피솜 포유동물 벡터)는 숙주 세포 내로 도입시 숙주 세포의 게놈에 통합되며, 이에 의해 숙주 게놈과 함께 복제된다. 더욱이, 특정 벡터는 그것이 작동 가능하게 연결된 유전자의 발현을 지시할 수 있다. 이러한 벡터는 본 명세서에서 "발현 벡터"로 지칭된다. 진핵 세포에서의 발현을 위한 벡터 및 이를 초래하는 벡터는 본 명세서에서 "진핵 발현 벡터"로 지칭될 수 있다. 재조합 DNA 기법에서 유용성이 있는 통상적인 발현 벡터는 종종 플라스미드 형태이다.
재조합 발현 벡터는 숙주 세포에서 핵산의 발현에 적합한 형태로 본 발명의 핵산을 포함할 수 있는데, 이는 재조합 발현 벡터가 하나 이상의 조절 요소를 포함하는 것을 의미하며, 하나 이상의 조절 요소는 발현에 사용될 숙주 세포에 기반하여 선택될 수 있고, 발현될 핵산 서열에 작동 가능하게 연결된다. 재조합 발현 벡터 내에서, "작동 가능하게 연결된"은 관심 뉴클레오티드 서열이 (예를 들어, 시험관 내 전사/번역 시스템에서 또는 벡터가 숙주 세포에 도입된 경우에는 숙주 세포에서) 상기 뉴클레오티드 서열의 발현을 허용하는 방식으로 조절 요소(들)에 연결됨을 의미하는 것으로 의도된다. 재조합 및 클로닝 방법에 관련하여, US 2004-0171156 A1호로서 2004년 9월 2일 간행된 미국 특허 출원 10/815,730호가 언급될 수 있으며, 이의 모든 내용은 그 전체로서 본원에 참조로 포함된다.
용어 "조절 요소"는 프로모터, 인핸서, 내부 리보솜 엔트리 부위(internal ribosomal entry site; IRES), 및 기타 다른 발현 제어 요소(예를 들어, 전사 종결 신호, 예컨대 폴리아데닐화 신호 및 폴리-U 서열)를 포함하는 것으로 의도된다. 이러한 조절 요소는, 예를 들어 문헌[Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990)]에 기재되어 있다. 조절 요소는 많은 유형의 숙주 세포에서 뉴클레오티드 서열의 구성적 발현을 지시하는 것들과 특정 숙주 세포에서만 뉴클레오티드 서열의 발현을 지시하는 것들(예를 들어, 조직-특이적 조절 서열)을 포함한다. 조직-특이적 프로모터는 근육, 뉴런, 뼈, 피부, 혈액, 특정 장기(예를 들어, 간, 췌장)와 같은 원하는 관심 조직, 또는 특정 세포 유형(예를 들어, 림프구)에서 주로 발현을 지시할 수 있다. 조절 요소는 시간-의존적 방식으로, 예컨대 세포-주기 의존적 또는 발생 단계 의존적 방식으로 발현을 지시할 수 있으며, 이것은 조직 특이적이거나 세포-유형 특이적일 수 있거나, 또한 그렇지 않을 수 있다. 일부 구현예에서, 벡터는 하나 이상의 pol III 프로모터 (예를 들어, 1, 2, 3, 4, 5 개 또는 그 이상의 pol III 프로모터), 하나 이상의 pol II 프로모터(예를 들어, 1, 2, 3, 4, 5 개 또는 그 이상의 pol II 프로모터), 하나 이상의 pol I 프로모터(예를 들어, 1, 2, 3, 4, 5 개 또는 그 이상의 pol I 프로모터), 또는 이들의 조합을 포함한다. pol III 프로모터의 예들은, 이로 제한되지는 않지만, U6 및 H1 프로모터를 포함한다. pol II 프로모터의 예들은, 이로 제한되지는 않지만, 레트로바이러스 라우스 육종 바이러스(Rous sarcoma virus; RSV) LTR 프로모터(선택적으로 RSV 인핸서와 함께), 사이토메갈로바이러스(CMV) 프로모터(선택적으로 CMV 인핸서와 함께)[예를 들어, 문헌[Boshart et al, Cell, 41:521-530 (1985)] 참조], SV40 프로모터, 디하이드로폴레이트 환원효소 프로모터, β-액틴 프로모터, 포스포글리세롤 키나아제(phosphoglycerol kinase; PGK) 프로모터, 및 EF1α 프로모터를 포함한다. 또한, 용어 "조절 요소"에는 인핸서 요소, 예컨대 WPRE; CMV 인핸서; HTLV-I의 LTR에서 R-U5' 분절(문헌[Mol. Cell. Biol., Vol. 8(1), p. 466-472, 1988]); SV40 인핸서; 및 토끼 β-글로빈의 엑손 2와 3 사이의 인트론 서열(문헌[Proc. Natl. Acad. Sci. USA., Vol. 78(3), p. 1527-31, 1981])이 포함된다. 발현 벡터의 설계는 형질전환될 숙주 세포의 선택, 원하는 발현 수준 등과 같은 요인에 따라 달라질 수 있다는 것이 당업자에 의해서 이해될 것이다. 벡터는 숙주 세포에 도입될 수 있고, 이에 의해 본 명세서에 기재된 바와 같이 핵산에 의해서 인코딩된, 융합 단백질 또는 펩티드를 포함하는, 전사물, 단백질 또는 펩티드(예를 들어, 클러스터링되고 규칙적으로 산재된 짧은 팔린드로믹 반복부(CRISPR) 전사물, 단백질, 효소, 이들의 돌연변이체 형태, 이들의 융합 단백질 등)가 생성될 수 있다. 조절 서열에 관련하여, 미국 특허 출원 10/491,026호가 언급될 수 있으며, 이의 내용은 그 전체로서 본원에 참조로 포함된다. 프로모터에 관련하여, PCT 공개 WO 2011/028929호 및 미국 출원 12/511,940호가 언급될 수 있으며, 이의 내용은 그 전체로서 본원에 참조로 포함된다.
유리한 벡터로는 렌티바이러스 및 아데노-연관 바이러스를 포함하며, 이러한 벡터의 유형은 또한 특정 유형의 세포들의 표적화를 위해 선택될 수 있다.
본 명세서에서 사용된 바와 같이, 유형 V CRISPR-Cas 유전자좌 이펙터 단백질의 용어 "crRNA" 또는 "가이드 RNA" 또는 "단일 가이드 RNA" 또는 "sgRNA" 또는 "하나 이상의 핵산 성분"은 표적 핵산 서열과 혼성화하고, 표적 핵산 서열로의 핵산-표적화 복합체의 서열-특이적 결합을 지시하기에, 표적 핵산 서열과의 충분한 상보성을 갖는 임의의 폴리뉴클레오티드 서열을 포함한다. 본 발명의 구현예에서, 용어 성숙 crRNA 및 가이드 RNA 및 단일의 가이드 RNA는 전술된 인용 문헌, 예컨대 WO 2014/093622호(PCT/US2013/074667)에서 상호교환가능하게 사용된다. 일부 구현예에서, 상보성의 정도는 적합한 정렬 알고리즘을 사용하여 최적으로 정렬되는 경우, 약 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99% 이상 또는 이를 초과한다. 최적의 정렬은 서열을 정렬하기에 적절한 임의의 알고리즘의 사용으로 결정될 수 있으며, 그의 비제한적인 예는 스미스-워터만 알고리즘, 니들만-분쉬 알고리즘, 버로우즈-휠러 형질전환에 기반한 알고리즘(예를 들어, Burrows Wheeler Aligner), ClustalW, Clustal X, BLAT, Novoalign(Novocraft Technologies; www.novocraft.com에서 이용 가능함), ELAND(Illumina, 미국 캘리포니아주 샌 디에고 소재), SOAP(soap.genomics.org.cn에서 이용 가능함), 및 Maq(maq.sourceforge.net에서 이용 가능함)를 포함한다. 일부 구현예에서, 가이드 서열은 길이가 약 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75 개 이상이거나 이를 초과한다. 일부 구현예에서, 가이드 서열은 길이가 약 75, 50, 45, 40, 35, 30, 25, 20, 15, 12 개 이하의 뉴클레오티드이다. 바람직하게 가이드 서열은 길이가 10 개 내지 30 개 뉴클레오티드이다. 표적 핵산 서열로의 핵산-표적화 복합체의 서열-특이적 결합을 지시하는 (핵산-표적화 가이드 RNA 내) 가이드 서열의 능력은 임의의 적합한 분석에 의해 평가될 수 있다. 예를 들어, 시험되는 가이드 서열을 포함하는 핵산-표적화 복합체를 형성하기에 충분한 핵산-표적화 CRISPR 시스템의 성분은, 핵산-표적화 복합체의 성분을 인코딩하는 벡터를 이용한 트랜스펙션에 의해서와 같이 해당하는 표적 핵산 서열을 갖는 숙주 세포로 제공될 수 있으며, 본 명세서에 기재된 바와 같은 Surveyor 분석에 의해서와 같이, 표적 핵산 서열 내의 우선적인 표적화(예를 들어, 절단)의 평가로 이어질 수 있다. 유사하게, 표적 핵산 서열(또는 이의 가까이의 서열)의 절단은 표적 핵산 서열, 즉 시험 가이드 서열 및 시험 가이드 서열과 상이한 대조군 가이드 서열을 포함하는 핵산-표적화 복합체의 성분을 제공하고, 표적 서열에서 또는 이의 가까이에서 시험 및 대조군 가이드 서열 반응 간의 결합 또는 절단 속도를 비교함으로써 시험관에서 평가될 수 있다. 기타 다른 분석이 가능하며, 이는 당업자에게 일어날 것이다. 가이드 서열, 따라서 핵산-표적화 가이드 RNA는 임의의 표적 핵산 서열을 표적화하도록 선택될 수 있다. 표적 서열은 DNA일 수 있다. 일부 구현예에서, 표적 서열은 세포의 게놈 내의 서열이다. 예시적인 표적 서열은 표적 게놈 내의 독특한 것들을 포함한다.
일부 구현예에서, 핵산-표적화 가이드 RNA는 RNA-표적화 가이드 RNA 내의 2차 구조 정도를 감소시키도록 선택된다. 일부 구현예에서, 핵산-표적화 가이드 RNA의 뉴클레오티드의 약 75%, 50%, 40%, 30%, 25%, 20%, 15%, 10%, 5%, 1% 이하 또는 이의 미만이 최적으로 폴딩된 경우 자기-상보성 염기 쌍형성에 참여한다. 최적 폴딩은 임의의 적합한 폴리뉴클레오티드 폴딩 알고리즘에 의해 결정될 수 있다. 일부 프로그램은 최소 깁스(Gibbs) 자유 에너지 계산을 기반으로 한다. 이러한 한 알고리즘의 예는 mFold이며, 이는 문헌[Zuker and Stiegler, Nucleic Acids Res. 9 (1981), 133-148]에 기재된 바와 같다. 또 다른 예의 폴딩 알고리즘은, 비엔나 대학의 이론 화학 연구소(Institute for Theoretical Chemistry)에서 개발된, 중심 구조 예측 알고리즘을 사용하는, 온라인 웹서버 RNAfold이다(예를 들어, 문헌[A.R. Gruber et al., 2008, Cell 106(1): 23-24]; 및 [PA Carr and GM Church, 2009, Nature Biotechnology 27(12): 1151-62] 참조).
"tracrRNA" 서열 또는 유사체라는 용어는 혼성화를 위해 crRNA 서열과 충분한 상보성을 갖는 임의의 폴리뉴클레오티드 서열을 포함한다. 본 명세서에서 상기 나타낸 바와 같이, 본 발명의 구현예에서, tracrRNA는 Cpf1 이펙터 단백질 복합체의 절단 활성에 있어서 요구되지 않는다.
출원인은 또한 Cpf1과 같은 제V형 단백질의 DNA 표적화 및 절단 능력을 검증하기 위한 도전 실험을 실행한다. 이 실험은 StCas9의 이종성 발현을 위한 에스케리키아 콜라이에서의 유사한 연구와 거의 유사하다(Sapranauskas, R. et al. 핵산s Res 39, 9275-9282 (2011)). 출원인은 이종성 에스케리키아 콜라이 내로 PAM 및 저항성 유전자 둘 다를 함유하는 플라스미드를 도입한 다음, 해당하는 항생제 상에 도말한다. 플라스미드의 DNA 절단이 있는 경우, 출원인은 생존 콜로니를 관찰하지 않는다.
보다 상세하게, DNA 표적에 대하여 분석은 다음과 같다. 2 가지 에스케리키아 콜라이 균주가 이 분석에서 사용된다. 하나는 박테리아 균주 유래의 내인성 이펙터 단백질 유전자좌를 인코딩하는 플라스미드를 보유한다. 나머지 균주는 빈 플라스미드(예를 들어, pACYC184, 대조 균주)를 보유한다. 가능한 모든 7 bp 또는 8 bp PAM 서열을 항생제 저항성 플라스미드(앰피실린 저항성 유전자를 갖는 pUC19) 상에 제시한다. PAM은 프로토-스페이서 1의 서열(내인성 이펙터 단백질 유전자좌에서 제1 스페이서에 대한 DNA 표적) 옆에 위치한다. 2 개의 PAM 라이브러리를 클로닝하였다. 하나는 프로토-스페이서의 8 랜덤 bp 5'를 갖는다(예를 들어, 총 65536 개의 상이한 PAM 서열 = 복잡성). 나머지 라이브러리는 프로토-스페이서의 7 랜덤 bp 3'를 갖는다(예를 들어, 총 복잡성은 16384 개의 상이한 PAM임). 2 가지 라이브러리 모두 가능한 PAM 당 평균 500 개의 플라스미드를 갖도록 클로닝되었다. 시험 균주 및 대조 균주를 별도의 형질전환에서 5'PAM 및 3'PAM 라이브러리로 형질전환하고, 형질전환된 세포를 앰피실린 플레이트 상에 별도로 도말하였다. 플라스미드를 이용한 인식 및 후속 절단/간섭은 세포를 앰피실린에 취약하게 만들고 성장을 방지한다. 대략 형질전환 12 시간 후, 시험 및 대조 균주에 의해 형성된 모든 콜로니를 수확하고 플라스미드 DNA를 분리하였다. 플라스미드 DNA를 PCR 증폭 및 후속 딥 시퀀싱을 위한 주형으로서 사용하였다. 비형질전환 라이브러리에서 모든 PAM의 표현은 형질전환된 세포에서 PAM의 예상된 표현을 나타내었다. 대조 균주에서 발견된 모든 PAM의 표현은 실제 표현을 나타내었다. 시험 균주에서 모든 PAM의 표현은 어떤 PAM이 효소에 의해 인식되지 않는지를 나타내었고 대조 균주와의 비교는 고갈된 PAM의 서열을 추출할 수 있게 한다.
독성 및 표적외 효과의 최소화를 위해, 전달되는 핵산-표적화 가이드 RNA의 농도를 제어하는 것이 중요할 것이다. 핵산-표적화 가이드 RNA의 최적 농도는 세포 또는 비-인간 진핵 생물 동물 모델에서 상이한 농도를 시험함으로써, 그리고 잠재적인 표적외 게놈 유전자좌에서의 변형 정도를 분석하는 딥 시퀀싱을 사용함으로써 결정될 수 있다. 표적외 변형 수준을 최소화하면서 표적상 변형의 가장 높은 수준을 제공하는 농도는 생체 내 전달을 위해 선택되어야 한다. 핵산-표적화 시스템은 유리하게 제V형 CRISPR 시스템으로부터 유래된다. 일부 구현예에서, 핵산-표적화 시스템의 하나 이상의 요소는 내인성 RNA-표적화 시스템을 포함하는 특정 유기체로부터 유래한다. 본 발명의 바람직한 구현예에서, RNA-표적화 시스템은 제V형 CRISPR 시스템이다. 용어 "오솔로그(orthologue)"(또한 본 명세서에서 "오솔로그(ortholog)"로 지칭됨) 및 "동족체(homologue)"(또한 본 명세서에서 "동족체(homolog)"로 지칭됨)는 당업계에 잘 공지되어 있다. 추가 지침에 의해, 본 명세서에서 사용된 바와 같은 단백질의 "동족체"는 이의 동족체인 단백질과 동일 또는 유사한 기능을 실행하는 동일 종의 단백질이다. 상동성 단백질은 구조적으로 관련될 수 있지만 관련될 필요가 없거나, 부분적으로만 구조적으로 관련된다. 본 명세서에서 사용된 바와 같은 단백질의 "오솔로그"는 이의 오솔로그인 단백질과 동일 또는 유사한 기능을 실행하는 상이한 종의 단백질이다. 오솔로그 단백질은 구조적으로 관련될 수 있지만 관련될 필요가 없거나, 부분적으로만 구조적으로 관련된다. 동족체 및 오솔로그는 상동성 모델링(예를 들어, 문헌[Greer, Science vol. 228 (1985) 1055, and Blundell et al. Eur J Biochem vol 172 (1988), 513] 참조) 또는 "구조적 BLAST"(Dey F, Cliff Zhang Q, Petrey D, Honig B. Toward a "structural BLAST": using structural relationships to infer function. Protein Sci. 2013 Apr;22(4):359-66. doi: 10.1002/pro.2225.)에 의해 확인될 수 있다. 또한 CRISPR-Cas 유전자좌의 분야에서의 적용을 위해서는 문헌[Shmakov et al. (2015)]을 참조한다. 상동성 단백질은 구조적으로 관련될 수 있지만 관련될 필요가 없거나, 부분적으로만 구조적으로 관련된다. 특정 구현예에서, 본 명세서에 언급된 바와 같은 Cpf1의 동족체 또는 오솔로그는 Cpf1과 적어도 80%, 더 바람직하게는 적어도 85%, 훨씬 더 바람직하게는 적어도 90%, 예컨대 적어도 95%의 서열 상동성 또는 동일성을 갖는다. 추가 구현예에서, 본 명세서에 언급된 바와 같은 Cpf1의 동족체 또는 오솔로그는 야생형 Cpf1과 적어도 80%, 더 바람직하게는 적어도 85%, 훨씬 더 바람직하게는 적어도 90%, 예컨대 적어도 95%의 서열 동일성을 갖는다. Cpf1이 하나 이상의 돌연변이를 갖는(돌연변이된) 경우, 본 명세서에서 언급된 바와 같은 상기 Cpf1의 동족체 또는 오솔로그는 돌연변이된 Cpf1과 적어도 80%, 더 바람직하게는 적어도 85%, 훨씬 더 바람직하게는 적어도 90%, 예컨대 적어도 95%의 서열 동일성을 갖는다.
본 명세서에서 기재된 임의의 작용성은 다수의 오솔로그 유래의 단편을 포함하는 키메라 효소를 포함하는, 기타 다른 오솔로그 유래의 CRISPR 효소로 조작될 수 있음이 이해될 것이다. 이러한 오솔로그의 예는 본 명세서의 다른 곳에 기재되어 있다. 따라서, 키메라 효소는 코리네박터, 수테렐라(Sutterella), 레지오넬라, 트레포네마(Treponema), 피리팩터(Filifactor), 유박테리움, 스트렙토코커스, 락토바실러스, 마이코플라즈마(Mycoplasma), 박테로이데스(Bacteroides), 플라비볼라(Flaviivola), 플라보박테리움(Flavobacterium), 스파에로카에타, 아조스피릴룸, 글루콘아세토박터, 네이세리아, 로세부리아, 파르비바쿨룸, 스타필로코커스, 니트라티프락토르, 마이코플라즈마 및 캄필로박터를 포함하지만, 이로 제한되지 않는 속의 유기체의 CRISPR 효소 오솔로그의 단편을 포함할 수 있다. 키메라 효소는 본 명세서에서 언급된 속 또는 본 명세서에서 언급된 종의 유기체의 CRISPR 효소 오솔로그일 수 있으며; 유리하게 단편은 상이한 종의 CRISPR 효소 오솔로그 유래의 것이다.
구현예에서, 본 명세서에서 언급된 제V형 단백질은 또한 기능적 변이체 또는 이의 동족체 또는 오솔로그를 포함한다. 본 명세서에서 사용된 바와 같은 단백질의 "기능적 변이체"는 그 단백질의 활성을 적어도 부분적으로 보유하는 단백질의 변이체를 지칭한다. 기능적 변이체는 돌연변이체(이는 삽입, 결실, 또는 치환 돌연변이체일 수 있음)를 포함할 수 있으며, 이는 다형체 등을 포함한다. 또한, 기능적 변이체 내에는 또 다른, 보통 관련되지 않은, 핵산, 단백질, 폴리펩티드 또는 펩티드와 이러한 단백질의 융합 생성물이 포함된다. 기능적 변이체는 천연적으로 발생할 수 있거나 인공적일 수 있다.
구현예에서, 제V형 이펙터 단백질, 특히 Cpf1 또는 이의 오솔로그 또는 동족체를 인코딩하는 핵산 분자(들)는 진핵 세포에서 발현을 위해 코돈 최적화될 수 있다. 진핵 생물은 본 명세서에 논의된 바와 같을 수 있다. 핵산 분자(들)는 조작되거나 비천연적으로 발생할 수 있다.
일 구현예에서, 제V형 이펙터 단백질, 특히 Cpf1 또는 이의 오솔로그 또는 동족체는 하나 이상의 돌연변이를 포함할 수 있다(그리고 따라서 이들을 코딩하는 핵산 분자(들)은 돌연변이(들)를 포함할 수 있다). 돌연변이는 인위적으로 도입된 돌연변이일 수 있으며, 촉매 도메인에 하나 이상의 돌연변이를 포함할 수 있지만, 이로 제한되지 않는다. Cas9 효소에 관한 촉매 도메인의 예는 RuvC I, RuvC II, RuvC III 및 HNH 도메인을 포함할 수 있지만, 이로 제한되지 않는다.
일 구현예에서, 제V형 단백질, 예컨대 Cpf1 또는 이의 오솔로그 또는 동족체는 기능적 도메인에 융합되거나 작동 가능하게 연결된 총칭적인 핵산 결합 단백질로서 사용될 수 있다. 예시적인 기능적 도메인은 번역 개시제, 번역 활성화제, 번역 억제제, 뉴클레아제, 특히 리보뉴클레아제, 스플라이세오좀(spliceosome), 비드, 광 유도성/제어성 도메인 또는 화학적 유도성/제어성 도메인을 포함할 수 있지만, 이로 제한되지 않는다.
일부 구현예에서, 비-변형된 핵산-표적화 이펙터 단백질은 절단 활성을 가질 수 있다. 일부 구현예에서, RNA-표적화 이펙터 단백질은 표적 서열의 위치에서 또는 그 가까이에서, 예컨대 표적 서열 내 및/또는 표적 서열의 상보체 내 또는 표적 서열과 연관된 서열에서, 1 개 또는 2 개의 핵산(DNA) 가닥의 절단를 지시할 수 있다. 일부 구현예에서, 핵산-표적화 이펙터 단백질은, 표적 서열의 제1 또는 최종 뉴클레오티드로부터의 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 50, 100, 200, 500 개 이상의 염기쌍 내에서 1 개 또는 2 개의 DNA 가닥의 절단을 지시할 수 있다. 일부 구현예에서, 절단은, 엇갈린 상태일 수 있으며, 즉 접착성 말단을 생성할 수 있다. 일부 구현예에서, 절단은 5' 오버행을 이용한 엇갈린 절단이다. 일부 구현예에서, 절단은 1 개 내지 5 개의 뉴클레오티드의 5' 오버행을 이용한 엇갈린 절단이다. 일부 구현예에서, 절단 부위는 PAM으로부터 떨어져 있으며, 예를 들어 절단은 비-표적 가닥 상의 18번째 뉴클레오티드 및 표적화된 가닥 상의 23번째 뉴클레오티드 다음에 발생한다. 일부 구현예에서, 절단 부위는 비-표적 가닥 상의 18번째 뉴클레오티드(PAM으로부터 계수함) 및 표적화된 가닥 상의 23번째 뉴클레오티드(PAM으로부터 계수함) 다음에 발생한다. 일부 구현예에서, 벡터는, 돌연변이된 핵산-표적화 이펙터 단백질이 1 개 또는 표적 서열을 함유하는 표적 폴리뉴클레오티드의 2 개의 DNA 가닥을 절단하는 능력이 결여되도록 해당하는 야생형 효소와 관련하여 돌연변이될 수 있는 핵산-표적화 이펙터 단백질을 인코딩한다. 추가 예로서, Cas 단백질의 2 개 이상의 촉매 도메인(예를 들어, Cas9 단백질의 RuvC I, RuvC II, and RuvC III 또는 HNH 도메인)은 돌연변이되어 모든 DNA 절단 활성이 실질적으로 결여된 돌연변이된 Cas 단백질을 생성할 수 있다. 본 명세서에 기재된 바와 같이, Cpf1 이펙터 단백질의 해당하는 촉매 도메인은 또한 돌연변이되어 모든 DNA 절단 활성이 결여되거나 실질적으로 감소된 DNA 절단 활성을 가지는 돌연변이된 Cpf1 이펙터 단백질을 생성할 수 있다. 일부 실시형태에서, 돌연변이된 효소의 RNA 절단 활성이 효소의 비-돌연변이 형태의 핵산 절단 활성의 약 25%, 10%, 5%, 1%, 0.1%, 0.01% 이하, 또는 그 미만인 경우, 핵산-표적화 이펙터 단백질은 모든 RNA 절단 활성이 실질적으로 결여된 것으로 간주될 수 있으며; 예는, 돌연변이된 형태의 핵산 절단 활성이 0이거나 비-돌연변이된 형태에 비하여 무시해도 될 정도인 경우일 수 있다. 이펙터 단백질은 제V형 CRISPR 시스템 유래의 다수 뉴클레아제 도메인을 갖는 가장 큰 뉴클레아제에 대하여 상동성을 공유하는 일반적인 부류의 효소를 참조하여 확인될 수 있다. 가장 바람직하게, 이펙터 단백질은 제V형 단백질, 예컨대 Cpf1이다. 추가 구현예에서, 이펙터 단백질은 제V형 단백질이다. "유래"란, 출원인은 유래된 효소가 야생형 효소와 높은 정도의 서열 상동성을 갖는 의미에서 크게 기반으로 하지만, 당업계에 공지되거나 본 명세서에 기재된 바와 같은 일부 방법으로 돌연변이된(변형된) 것을 의미한다.
다시, 용어 "Cas" 및 "CRISPR 효소" 및 "CRISPR 단백질" 및 "Cas 단백질"은 일반적으로 상호교환 가능하게 사용되며, Cas9에 대한 특정 언급에 의한 것과 같이 본 명세서에서 달리 명백하지 않다면, 본 명세서에서의 언급한 모든 점은 본 출원에서 추가로 기재된 신규 CRISPR 이펙터 단백질에 대한 유사성을 언급하는 것으로 이해될 것이다. 상기 언급된 바와 같이, 본 명세서에서 사용된 많은 잔기의 넘버링은 제V형 CRISPR 유전자좌로부터의 이펙터 단백질을 지칭한다. 그러나, 본 발명은 미생물의 기타 다른 종로부터의 다수의 더 많은 이펙터 단백질을 포함한다는 것이 이해될 것이다. 특정 구현예에서, 이펙터 단백질은 구성적으로 존재하거나 유도성으로 존재하거나, 조건부로 존재하거나 투여되거나 전달될 수 있다. 이펙터 단백질 최적화를 사용하여 기능을 향상시키거나 새로운 기능을 발생시킬 수 있으며, 키메라 이펙터 단백질을 생성할 수 있다. 그리고 본 명세서에 기재된 바와 같이 이펙터 단백질은 변형되어 총칭적인 핵산 결합 단백질로 사용될 수 있다.
통상적으로, 핵산-표적화 시스템의 맥락에서, (표적 서열에 혼성화되고 하나 이상의 핵산-표적화 이펙터 단백질과 복합체화된 가이드 RNA를 포함하는) 핵산-표적화 복합체의 형성은, 표적 서열 내 또는 가까이에서(예를 들어, 그로부터 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 개 이상의 염기쌍 내) 1 개 또는 2 개의 DNA 가닥의 절단을 초래한다. 본 명세서에서 사용된 바와 같이, 용어 "관심 표적 유전자와 연관된 서열(들)"은 표적 서열의 부근 가까이의(예를 들어, 표적 서열로부터 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 개 이상의 염기쌍 내, 여기서 표적 서열은 관심 표적 유전자좌 내에 포함됨) 서열을 지칭한다.
코돈 최적화된 서열의 예는, 이러한 예에서, 진핵생물, 예를 들어 인간(즉, 인간에서의 발현을 위해 최적화됨), 또는 본 명세서에서 논의된 바와 같은 또 다른 진핵생물, 동물 또는 포유동물에서의 발현을 위해 최적화된 서열이며; 예를 들어, 코돈 최적화된 서열의 예로서 WO 2014/093622(PCT/US2013/074667)에서의 SaCas9 인간 코돈 최적화 서열을 참조한다(당업계 및 본 개시 내용의 지식으로부터, 특히 이펙터 단백질(예를 들어, Cpf1)에 대해, 핵산 분자(들)를 코딩하는 코돈 최적화는 당업자의 범위 내에 있다). 이것이 바람직하지만, 기타 다른 예들도 가능하며, 인간 이외의 숙주 종에 대한 코돈 최적화, 또는 특정 기관에 대한 코돈 최적화가 공지되어 있다는 것이 이해될 것이다. 일부 구현예에서, DNA/RNA-표적화 Cas 단백질을 인코딩하는 효소 코딩 서열은 진핵 세포와 같은 특정 세포에서의 발현에 대해 코돈 최적화된다. 진핵 세포는, 특정 유기체, 예컨대 식물, 인간 또는 본 명세서에서 논의된 바와 같은 비-인간 진핵생물 또는 동물 또는 포유동물, 예를 들어 마우스, 래트, 토끼, 개, 가축 또는 비-인간 포유동물 또는 영장류(이로 제한되지 않음)를 포함하는 포유동물의 것이거나 또는 그로부터 유래될 수 있다. 일부 구현예에서, 인간이나 동물에 임의의 실질적인 의학적 이익 없이 그들을 고통스럽게 할 수 있는 인간의 생식계열 유전자 아이덴티티를 변형하기 위한 과정 및/또는 동물의 유전자 아이덴티티를 변형하기 위한 과정과, 또한 이러한 과정으로부터 생긴 동물이 배제될 수 있다. 일반적으로, 코돈 최적화는 고유 아미노산 서열을 유지하면서, 고유 서열의 적어도 하나의 코돈(예를 들어, 약 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 개 이상, 또는 그를 초과하는 코돈)을 숙주 세포의 유전자에 더 빈번하게 또는 가장 빈번하게 사용되는 코돈으로 대체함으로써, 관심 숙주 세포에서의 발현의 향상을 위해 핵산 서열을 변형시키는 과정을 지칭한다. 다양한 종은 특정 아미노산의 특정 코돈에 대하여 특정 편향을 나타낸다. 코돈 편향(유기체 간의 코돈 사용의 차이)은 종종 메신저 RNA(mRNA)의 번역의 효율과 상관관계가 있으며, 이는 결국, 특히, 번역되는 코돈의 특성 및 특정 운반 RNA(tRNA) 분자의 이용 가능성에 좌우되는 것으로 여겨진다. 세포에서의 선택된 tRNA의 우세는 일반적으로 펩티드 합성에 가장 빈번하게 사용되는 코돈을 반영하는 것이다. 따라서, 유전자는 코돈 최적화를 기반으로 하여 주어진 유기체에서의 최적의 유전자 발현을 위해 맞춤화될 수 있다. 코돈 사용 표는, 예를 들어 www.kazusa.orjp/codon/에서 이용 가능한 "코돈 사용 데이터베이스"에서 용이하게 이용 가능하며, 이 표는 다수의 방식으로 적합하게 될 수 있다. 문헌[Nakamura, Y., et al. “Codon usage tabulated from the international DNA sequence databases: status for the year 2000” Nucl. Acids Res. 28:292 (2000)]을 참조한다. 특정 숙주 세포에서의 발현을 위해 특정 서열을 코돈 최적화시키는 컴퓨터 알고리즘이 또한 이용 가능하며, 예를 들어 Gene Forge(Aptagen; 미국 펜실베이니아주 야코부스)도 또한 이용 가능하다. 일부 구현예에서, DNA/RNA-표적화 Cas 단백질을 인코딩하는 서열 내의 하나 이상의 코돈(예를 들어, 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 개 이상의, 또는 모든 코돈)은 특정 아미노산에 대하여 가장 빈번하게 사용되는 코돈에 해당한다. 효모에서의 코돈 사용에 대해서는, 문헌[Codon selection in yeast, Bennetzen and Hall, J Biol Chem. 1982 Mar 25;257(6):3026-31]에서 이용 가능한 온라인 효모 게놈 데이터베이스가 언급될 수 있다. 조류를 포함한 식물에서의 코돈 사용에 대해서는, 문헌[Codon usage in higher plants, green algae, and cyanobacteria, Campbell and Gowri, Plant Physiol. 1990 Jan; 92(1): 1-11.]; 및 [Codon usage in plant genes, Murray et al, Nucleic Acids Res. 1989 Jan 25;17(2):477-98]; 또는 [Selection on the codon bias of chloroplast and cyanelle genes in different plant and algal lineages, Morton BR, J Mol Evol. 1998 Apr;46(4):449-59]이 언급될 수 있다.
일부 구현예에서, 벡터는 제V형 RNA-표적화 이펙터 단백질와 같은 핵산-표적화 이펙터 단백질, 특히 하나 이상의 핵 국소화 서열(NLS), 예컨대 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 개 이상, 또는 이를 초과하는 NLS를 포함하는 Cpf1 또는 이의 오솔로그 또는 동족체를 인코딩한다. 일부 구현예에서, RNA-표적화 이펙터 단백질은 아미노-말단 또는 그 근처에 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 개 이상, 또는 이를 초과하는 NLS, 카르복시-말단 또는 그 근처에 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 개 이상, 또는 이를 초과하는 NLS, 또는 이들의 조합(예를 들어 아미노-말단에서 0 개 또는 적어도 1 개 이상의 NLS, 그리고 카르복시 말단에서 0 개 또는 적어도 1 개 이상의 NLS)을 포함한다. 1 개 초과의 NLS가 존재하는 경우, 각각은 단일의 NLS가 1 개 초과의 복제물로 존재하고/존재하거나 1 개 이상의 복제물로 존재하는 1 개 이상의 기타 다른 NLS와 조합될 수 있도록, 다른 것들로부터 독립적으로 선택될 수 있다. 일부 구현예에서, NLS는 NLS의 가장 가까운 아미노산이 N- 또는 C-말단으로부터 폴리펩티드 사슬을 따라 약 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 40, 50 개 이상의 아미노산 내에 존재하는 경우, N- 또는 C-말단 근처에 있는 것으로 간주된다. NLS의 비제한적인 예는 하기로부터 유래된 NLS 서열을 포함한다: 아미노산 서열 PKKKRKV를 갖는 SV40 바이러스 대형 T-항원의 NLS; 뉴클레오플라스민으로부터의 NLS(예를 들어, 서열 KRPAATKKAGQAKKKK를 갖는 뉴클레오플라스민 이분(bipartite) NLS); 아미노산 서열 PAAKRVKLD 또는 RQRRNELKRSP를 갖는 c-myc NLS; 서열 NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY를 갖는 hRNPA1 M9 NLS; 임포틴-알파로부터의 IBB 도메인의 서열 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV; 마이오마(myoma) T 단백질의 서열 VSRKRPRP 및 PPKKARED; 인간 p53의 서열 PQPKKKPL; 마우스 c-abl IV의 서열 SALIKKKKKMAP; 인플루엔자 바이러스 NS1의 서열 DRLRR 및 PKQKKRK; 간염 바이러스 델타 항원의 서열 RKLKKKIKKL; 마우스 Mx1 단백질의 서열 REKKKFLKRR; 인간 폴리(ADP-리보스) 중합효소의 서열 KRKGDEVDGVDEVAKKKSKK; 및 스테로이드 호르몬 수용체(인간) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK. 일반적으로, 하나 이상의 NLS는 진핵 세포의 핵에서 검출 가능한 양의 DNA/RNA-표적화 Cas 단백질의 축적을 유도하기에 충분한 세기의 것이다. 일반적으로, 핵 국소화 활성의 세기는 핵산-표적화 이펙터 단백질 내 NLS의 수, 사용되는 특정 NLS(들), 또는 이들 인자의 조합으로부터 유래할 수 있다. 핵에서의 축적의 검출은 임의으 적합한 기법에 의해 실행될 수 있다. 예를 들어, 검출 가능한 마커는, 예컨대 핵위 위치를 검출하기 위한 수단(예를 들어, 핵에 특이적인 염색제, 예컨대 DAPI)과 함께, 세포 내의 위치가 가시화될 수 있도록, 핵산-표적화 단백질에 융합될 수 있다. 세포 핵을 또한 세포로부터 분리할 수 있으며, 그 다음 이의 내용물을 단백질을 검출하기 위한 임의의 적합한 과정, 예컨대 면역조직화학, 웨스턴 블롯, 또는 효소 활성 분석에 의해 분석할 수 있다. 또한 핵에서의 축적은, 핵산-표적화 Cas 단백질 또는 핵산-표적화 복합체에 노출되지 않거나, 하나 이상의 NLS가 결여된 핵산-표적화 Cas 단백질에 노출된 대조군에 비하여, 간접적으로, 예를 들어 핵산-표적화 복합체 형성의 영향에 대한 분석(예를 들어, 표적 서열에서의 DNA 절단 또는 돌연변이에 대한 분석, 또는 DNA-표적화 복합체 형성 및/또는 DNA-표적화 Cas 단백질 활성에 의해 영향을 받는 변경된 유전자 발현 활성에 대한 분석)에 의해 결정될 수 있다. 본 명세서에 기재된 Cpf1 이펙터 단백질 복합체의 바람직한 구현예에서, 코돈 최적화된 이펙터 단백질은 단백질의 C-말단에 부착된 NLS를 포함한다. 특정 구현예에서, NLS 서열은 Cpf1 이펙터 단백질을 인코딩하는 핵산 서열에 대하여 이종이다.
일부 구현예에서, 핵산-표적화 시스템의 하나 이상의 요소의 발현을 구동하는 하나 이상의 벡터는, 핵산-표적화 시스템의 요소의 발현이 하나 이상의 표적 부위에서 핵산-표적화 복합체의 형성을 지시하도록 숙주 세포 내로 도입된다. 예를 들어, 핵산-표적화 이펙터 효소 및 핵산-표적화 가이드 RNA는 각각 별개의 벡터 상에서 별개의 조절 요소에 작동 가능하게 연결될 수 있다. 핵산-표적화 시스템의 RNA(들)는 유전자이식 핵산-표적화 이펙터 단백질 동물 또는 포유동물, 예를 들어 핵산-표적화 이펙터 단백질을 구조적으로 또는 유도적으로 또는 조건적으로 발현하는 동물 또는 포유동물; 또는 그렇지 않으면 핵산-표적화 이펙터 단백질을 발현하거나 핵산-표적화 이펙터 단백질을 함유하는 세포를 갖는 동물 또는 포유동물에게, 예컨대 생체 내 핵산-표적화 이펙터 단백질을 코딩하고 발현하는 벡터 또는 벡터들을 이에 사전 투여함으로써 전달될 수 있다. 대안적으로, 동일하거나 상이한 조절 요소로부터 발현된 둘 이상의 요소는, 제1 벡터 내에 포함되지 않은 핵산-표적화 시스템의 임의의 성분을 제공하는 하나 이상의 추가적인 벡터들과 단일 벡터로 조합될 수 있다. 단일 벡터로 조합된 핵산-표적화 시스템 요소는 임의의 적합한 배향으로, 예컨대 제2의 요소에 대하여 5'(제2의 요소의 "상류) 또는 3'(제2의 요소의 "하류")에 위치되어 배열될 수 있다. 하나의 요소의 코딩 서열은 제2 요소의 코딩 서열의 동일한 가닥 또는 반대의 가닥에 위치될 수 있고, 동일하거나 반대의 방향으로 배향될 수 있다. 일부 구현예에서, 단일 프로모터는 하나 이상의 인트론 서열 내에 임베딩된(예를 들어, 상이한 인트론 내 각각, 적어도 하나의 인트론 내 둘 이상, 또는 단일 인트론 내 모두), 핵산-표적화 가이드 RNA 및 핵산-표적화 이펙터 단백질을 인코딩하는 전사물의 발현을 구동한다. 일부 구현예에서, 핵산-표적화 이펙터 단백질 및 핵산-표적화 가이드 RNA는 동일한 프로모터에 작동 가능하게 연결되고 발현될 수 있다. 핵산-표적화 시스템의 하나 이상의 요소의 발현을 위한 전달 비히클, 벡터, 입자, 나노입자, 제형 및 그의 성분은 이전의 문헌, 예컨대 WO 2014/093622(PCT/US2013/074667)에서 사용된 바와 같다. 일부 구현예에서, 벡터는 하나 이상의 삽입 부위, 예컨대 제한 엔도뉴클레아제 인식 서열(또한 "클로닝 부위"로서 지칭됨)을 포함한다. 일부 구현예에서, 하나 이상의 삽입 부위(예를 들어, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 개 이상, 또는 이를 초과하는 삽입 부위)가 하나 이상의 벡터의 하나 이상의 서열 요소의 상류 및/또는 하류에 위치된다. 다수의 상이한 가이드 서열이 사용된 경우, 핵산-표적화 활성을 세포 내에서 다수의 상이한 해당하는 표적 서열로 표적화하는 데 단일 발현 작제물이 사용될 수 있다. 예를 들어, 단일 벡터는 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20 개 이상, 또는 이를 초과하는 가이드 서열을 포함할 수 있다. 일부 구현예에서, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 개 이상, 또는 이를 초과하는 이러한 가이드-서열 함유 벡터가 제공될 수 있으며, 선택적으로 세포로 전달될 수 있다. 일부 구현예에서, 벡터는 핵산-표적화 이펙터 단백질을 인코딩하는 효소-코딩 서열에 작동 가능하게 연결된 조절 요소를 포함한다. 핵산-표적화 이펙터 단백질 또는 핵산-표적화 가이드 RNA 또는 RNA(들)는 개별적으로 전달될 수 있으며; 유리하게는 이들 중 적어도 하나가 입자 또는 나노입자 복합체를 통해 전달된다. 핵산-표적화 이펙터 단백질 mRNA는 핵산-표적화 이펙터 단백질이 발현될 시간을 제공하기 위하여 핵산-표적화 가이드 RNA 이전에 전달될 수 있다. 핵산-표적화 이펙터 단백질 mRNA는 핵산-표적화 가이드 RNA의 투여 전 1 시간 내지 12 시간(바람직하게는 약 2 시간 내지 6 시간)에 투여될 수 있을 것이다. 대안적으로, 핵산-표적화 이펙터 단백질 mRNA 및 핵산-표적화 가이드 RNA는 함께 투여될 수 있다. 유리하게, 가이드 RNA의 제2 부스터 용량은 핵산-표적화 이펙터 단백질 mRNA + 가이드 RNA의 초기 투여 후 1 시간 내지 12 시간(바람직하게는 약 2 시간 내지 6 시간)에 투여될 수 있다. 핵산-표적화 이펙터 단백질 mRNA 및/또는 가이드 RNA의 추가적인 투여는 게놈 변형의 가장 효율적인 수준을 달성하는 데 유용할 수 있다.
일 양태에서, 본 발명은 핵산-표적화 시스템의 하나 이상의 요소의 사용 방법을 제공한다. 본 발명의 핵산-표적화 복합체는 표적 DNA(단일 또는 이중 가닥, 선형 또는 수퍼코일)를 변형시키기 위한 효율적인 수단을 제공한다. 본 발명의 핵산-표적화 복합체는 다수의 세포 유형에서 표적 DNA를 변형시키는(예를 들어, 결실시키는, 삽입하는, 전위시키는, 불활성화시키는, 활성화시키는) 것을 포함하는 매우 다양한 유용성을 갖는다. 이와 같이, 본 발명의 핵산-표적화 복합체는, 예를 들어 유전자 치료법, 약물 스크리닝, 질병 진단 및 예후에서 광범위한 적용을 갖는다. 예시적인 핵산-표적화 복합체는 관심 표적 유전자좌 내의 표적 서열에 혼성화되는 가이드 RNA와 복합체화되는 DNA-표적화 이펙터 단백질을 포함한다.
일 양태에서, 본 발명은 표적 폴리뉴클레오티드의 변형 방법을 제공한다. 일부 구현예에서, 상기 방법은 CRISPR 복합체가 표적 폴리뉴클레오티드에 결합되게 하여, 상기 표적 폴리뉴클레오티드의 절단을 초래하여, 이에 의해, 표적 폴리뉴클레오티드를 변형시키는 단계를 포함하며, CRISPR 복합체는 상기 표적 폴리뉴클레오티드 내의 표적 서열에 혼성화되는 가이드 서열(본원에 기재된 바와 같은 가이드 서열의 변형된 가이드 중 임의의 것 포함)과 복합체화된 본원에 기재된 바와 같은 CRISPR 효소(변형된 효소, 예컨대 데드 Cpf1 또는 Cpf1 닉카제 등 포함)를 포함하며, 바람직하게는, 상기 가이드 서열은 직접 반복부 서열에 연결된다. 일 양태에서, 본 발명은 진핵 세포에서 DNA의 발현을 변형시켜, 상기 결합이 상기 DNA의 증가된 또는 감소된 발현을 초래하게 하는 방법을 제공한다. 일부 구현예에서, 상기 방법은 핵산-표적화 복합체가 DNA에 결합하는 것을 허용하여, 상기 결합이 상기 DNA의 증가된 또는 감소된 발현을 초래하는 단계를 포함하며; 여기서 핵산-표적화 복합체는 가이드 RNA와 복합체화된 핵산-표적화 이펙터 단백질을 포함한다. 일부 구현예에서, 상기 방법은 하나 이상의 벡터를 상기 진핵 세포에 전달하는 단계를 추가로 포함하며, 여기서, 하나 이상의 벡터는 Cpf1 및 DR 서열에 연결된 (다수의) 가이드 서열 중 하나 이상의 발현을 유도한다. 유사한 고려사항 및 조건을 표적 DNA를 변형시키는 방법에 대해 상기와 같이 적용한다. 실제로, 이들 샘플링, 배양 및 재도입 옵션들이 본 발명의 양태들에 걸쳐 적용된다. 일 양태에서, 본 발명은 표적 DNA를 진핵 세포에서 변형시키는 방법을 제공하며, 이는 생체 내, 생체 외 또는 시험관 내일 수 있다. 일부 구현예에서, 본 방법은 인간 또는 비-인간 동물로부터 세포 또는 세포 집단을 샘플링하고, 그 세포 또는 세포들을 변형시키는 것을 포함한다. 배양은 생체 외 임의의 단계에서 발생할 수 있다. 세포 또는 세포들은 비-인간 동물 또는 식물 내로 재도입될 수도 있다. 재도입된 세포의 경우, 세포는 줄기 세포인 것이 바람직할 수 있다. 세포는 본 발명에 따라 변형되어 유전자 산물을, 예를 들어 제어된 양으로 생산할 수 있으며, 이는 이용에 따라 증가 또는 감소, 및/또는 돌연변이될 수 있다. 특정 구현예에서, 세포의 유전자좌는 수복된다.
실제로, 본 발명의 임의의 양태에서, 핵산-표적화 복합체는 표적 서열과 혼성화된 가이드 RNA와 복합체화된 핵산-표적화 이펙터 단백질을 포함할 수 있다.
본 발명은 핵산-표적화 시스템 및 그의 성분에 관한 DNA 서열 표적화를 수반하는 유전자 발현의 제어에 사용되는 시스템, 방법 및 조성물의 조작 및 최적화에 관한 것이다. 유리한 구현예에서, 이펙터 효소는 제V형 단백질, 예컨대 Cpf1이다. 본 방법의 이점은 CRISPR 시스템이 표적외 결합 및 그 결과의 부작용을 최소화시키거나 회피한다는 점이다. 이는 표적 DNA에 대하여 고도의 서열 특이성을 갖도록 배열된 시스템을 사용하여 달성된다.
바람직하게는 핵산-표적화 복합체 또는 시스템과 관련하여, crRNA 서열은 하나 이상의 스템 루프 또는 헤어핀을 가지며, 이는 길이가 30 개 이상의 뉴클레오티드, 길이가 40 개 이상의 뉴클레오티드, 또는 길이가 50 개 이상의 뉴클레오티드이고; crRNA 거열은 길이가 10 개 내지 30 개 뉴클레오티드이며, 핵산-표적화 이펙터 단백질은 제V형 Cas 효소이다. 특정 구현예에서, crRNA 서열은 길이가 42 개 내지 44 개 뉴클레오티드이고, 핵산-표적화 Cas 단백질은 프란시셀라 툴라렌시스 1 아종 노비시다 U112의 Cpf1이다. 특정 구현예에서, crRNA는 19 개 뉴클레오티드의 직접 반복부 및 23 개 내지 25 개 뉴클레오티드의 스페이서 서열을 포함하거나, 이들로 본질적으로 이루어지거나, 이들로 이루어지고, 핵산-표적화 Cas 단백질은 프란시셀라 툴라렌시스 아종 노비시다 U112의 Cpf1이다.
2 개의 상이한 압타머(각각 별개의 핵산-표적화 가이드 RNA)의 사용은 상이한 핵산-표적화 가이드 RNA를 이용하여, 사용될 활성화제-어댑터 단백질 융합 및 억제제-어댑터 단백질 융합이, 다른 하나는 억제하는 한편 하나의 DNA의 발현은 활성화시키는 것을 가능하게 한다. 이들은 그들의 상이한 가이드 RNA와 함께, 다중화된 접근법에서 함께, 또는 실질적으로 함께 투여될 수 있다. 이러한 변형된 핵산-표적화 가이드 RNA의 다수, 예를 들어 10 개 또는 20 개 또는 30 개 등이 모두 동시에 사용될 수 있고, 한편 비교적 적은 수의 이펙터 단백질 분자로서, 전달되는 이펙터 단백질 분자 중 단지 하나(또는 적어도 최소 수)가 다수의 변형된 가이드와 함께 사용될 수 있다. 어댑터 단백질은 하나 이상의 활성화제 또는 하나 이상의 억제제에 연관(바람직하게는 연결 또는 융합)될 수 있다. 예를 들어, 어댑터 단백질은 제1 활성화제 및 제2 활성화제와 연관될 수 있다. 제1 및 제2 활성화제는 동일할 수 있지만, 이들은 바람직하게 상이한 활성화제이다. 3 개 이상 또는 심지어 4 개 이상의 활성화제(또는 억제제)가 사용될 수 있지만, 패키지 크기는 5 개를 초과하는 개수의 상이한 기능적 도메인은 제한할 수 있다. 어댑터 단백질에 대한 직접 융합에 대하여, 링커가 바람직하게 사용되며, 여기서 2 개 이상의 기능적 도메인은 어댑터 단백질에 연결된다. 적합한 링커는 GlySer 링커를 포함할 수 있다.
또한 핵산-표적화 이펙터 단백질-가이드 RNA 복합체는 전체로서 둘 이상의 기능적 도메인과 회합될 수 있음이 고려된다. 예를 들어, 핵산-표적화 이펙터 단백질과 회합된 둘 이상의 기능적 도메인이 존재할 수 있거나, (하나 이상의 어댑터 단백질을 통해) 가이드 RNA와 회합된 둘 이상의 기능적 도메인이 존재할 수 있거나, (하나 이상의 어댑터 단백질을 통해) 핵산-표적화 이펙터 단백질과 회합된 하나 이상의 기능적 도메인 및 가이드 RNA와 회합된 하나 이상의 기능적 도메인이 존재할 수 있다.
어댑터 단백질과 활성화제 또는 억제제 사이의 융합은 링커를 포함할 수 있다. 예를 들어, GlySer 링커 GGGS가 사용될 수 있다. 이들은 3((GGGGS)3 ) 또는 6, 9 또는 심지어는 12 이상의 반복부로 사용되어, 필요에 따라 적합한 길이를 제공할 수 있다. 링커는 가이드 RNA와 기능적 도메인(활성화제 또는 억제제) 사이, 또는 핵산-표적화 Cas 단백질(Cas)과 기능적 도메인(활성화제 또는 억제제) 사이에서 사용될 수 있다. 사용자는 링커를 "기계적 유연성"의 적절한 양으로 조작한다.
본 발명은 핵산-표적화 이펙터 단백질 및 가이드 RNA를 포함하는 핵산-표적화 복합체를 포괄하며, 여기서 핵산-표적화 이펙터 단백질은 적어도 하나의 돌연변이를 포함하여, 핵산-표적화 이펙터 단백질이 적어도 하나의 돌연변이를 갖지 않는 핵산-표적화 이펙터 단백질의 활성의 5% 이하, 및 선택적으로 적어도 하나 이상의 핵 국소화 서열을 갖도록 하며; 가이드 RNA는 세포 내 관심 RNA에서 표적 서열에 혼성화할 수 있는 가이드 서열을 포함하고; 여기서 핵산-표적화 이펙터 단백질은 둘 이상의 기능적 도메인과 회합되거나; 가이드 RNA의 적어도 하나의 루프는 하나 이상의 어댑터 단백질에 결합하는 별개의 RNA 서열(들)의 삽입에 의해 변형되고; 여기서 어댑터 단백질은 둘 이상의 기능적 도메인과 회합되거나; 핵산-표적화 Cas 단백질은 하나 이상의 기능적 도메인과 회합되고, 가이드 RNA의 적어도 하나의 루프는 하나 이상의 어댑터 단백질에 결합하는 별개의 RNA 서열(들)의 삽입에 의해 변형되고, 여기서 어댑터 단백질은 하나 이상의 기능적 도메인에 회합된다.
일 양태에서, 본 발명은 돌연변이된 질병 유전자를 포함하는 모델 진핵 세포를 생성하는 방법을 제공한다. 일부 구현예에서, 질병 유전자는 질병을 갖거나 발생시키는 위험에서의 증가와 연관된 임의의 유전자이다. 일부 구현예에서, 본 방법은 (a) 하나 이상의 벡터를 진핵 세포 내로 도입하는 단계로, 여기서 하나 이상의 벡터는 Cpf1 효소, 및 직접 반복부 서열에 연결된 가이드 서열을 포함하는 보호된 가이드 RNA 중 하나 이상의 발현을 유도하는 단계; 및 (b) CRISPR 복합체가 표적 폴리뉴클레오티드에 결합되어 상기 질병 유전자 내에서 표적 폴리뉴클레오티드의 절단을 달성하는 것을 가능하게 하는 단계를 포함하며, 여기서 CRISPR 복합체는 표적 폴리뉴클레오티드 내에서 표적 서열에 혼성화된 서열을 포함하는 가이드 RNA와 복합체화된 Cpf1 효소를 포함하며, 이에 의해 돌연변이된 질병 유전자를 포함하는 모델 진핵 세포를 생성한다. 일부 구현예에서, 상기 절단은 표적 서열의 위치에서 상기 Cpf1 효소에 의한 하나 또는 두 개의 가닥의 절단을 포함한다. 일부 구현예에서, 상기 절단은 표적 유전자의 감소된 전사를 초래한다. 일부 구현예에서, 방법은 상기 절단된 표적 폴리뉴클레오티드를, 비-상동성 말단 접합(NHEJ)에 기반한 유전자 삽입 메커니즘에 의해 외인성 주형 폴리뉴클레오티드를 이용하여 수복하는 것을 추가로 포함하며, 상기 수복은 상기 표적 폴리뉴클레오티드의 하나 이상의 뉴클레오티드의 삽입, 결실, 또는 치환을 포함하는 돌연변이를 초래한다. 일부 구현예에서, 상기 돌연변이는 표적 서열을 포함하는 유전자로부터의 단백질 발현에서 하나 이상의 아미노산 변화를 초래한다.
일 양태에서, 본 발명은 숙주가 진핵 세포인 본 명세서에서 논의된 바와 같은 방법을 제공한다. 일 양태에서, 본 발명은 숙주가 포유동물 세포인 본 명세서에서 논의된 바와 같은 방법을 제공한다. 일 양태에서, 본 발명은 숙주가 비-인간 진핵 세포인 본 명세서에서 논의된 바와 같은 방법을 제공한다. 일 양태에서, 본 발명은 비-인간 진핵 세포가 비-인간 포유동물 세포인 본 명세서에서 논의된 바와 같은 방법을 제공한다. 일 양태에서, 본 발명은 비-인간 포유동물 세포가 이로 제한되지는 않지만, 영장류, 소류, 양류, 돼지류, 개류, 설치류, 토끼류, 예컨대 원숭이, 소, 양, 돼지, 개, 토끼, 래트 또는 마우스 세포를 포함할 수 있는 본 명세서에서 논의된 바와 같은 방법을 제공한다. 일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같은 방법을 제공하며, 세포는 비-포유동물 진핵 세포, 예컨대 가금류 새(예를 들어, 닭), 척추 생선(예를 들어, 연어) 또는 어패류(예를 들어, 굴, 조개, 바닷가재, 새우) 세포일 수 있다. 일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같은 방법을 제공하며, 비-인간 진핵 세포는 식물 세포이다. 식물 세포는 단자엽 또는 쌍자엽의 세포, 또는 작물 또는 곡물, 예컨대 카사바, 옥수수, 수수, 대두, 밀, 귀리 또는 쌀의 세포일 수 있다. 식물 세포는 또한 해조류, 나무 또는 생산용 식물, 과일 또는 채소(예를 들어, 감귤 나무와 같은 나무, 예를 들어 오렌지, 포도 또는 레몬 나무; 복숭아 또는 넥타린(nectarine) 복숭아 나무; 사과 또는 배 나무; 견과류 나무, 예컨대 아몬드 또는 호두 또는 피스타치오 나무; 까마중(nightshade) 식물; 유채(Brassica) 속 식물; 고들빼기 (Lactuca) 속 식물; 시금치(Spinacia) 속의 식물; 고추(Capsicum) 속의 식물; 목화, 담배, 아스파라거스, 당근, 양배추, 브로콜리, 콜리플라워, 토마토, 가지, 고추, 상추, 시금치, 딸기, 블루베리, 라스베리, 블랙베리, 포도, 커피, 코코아, 등)의 세포일 수 있다.
일 양태에서, 본 발명은 질병 유전자와 연관된 세포 신호화 사건을 조절하는 생물학적 활성제를 개발하는 방법을 제공한다. 일부 구현예에서, 질병 유전자는 질병을 갖거나 발생시킬 위험과 연관된 임의의 유전자이다. 일부 구현예에서, 본 방법은 (a) 시험 화합물을 상기 기재된 구현예들 중 어느 하나의 모델 세포와 접촉시키는 단계; 및 (b) 상기 질병 유전자에서 상기 돌연변이와 연관된 세포 신호화 사건의 감소 또는 증강을 표시하는 판독 정보(readout)에서의 변화를 검출하는 단계를 포함하며, 이에 의해 상기 질병 유전자와 연관된 상기 세포 신호화 사건을 조절하는 상기 생물학적 활성제를 개발한다.
일 양태에서, 본 발명은 하나 이상의 세포(들)에서의 유전자 내에 하나 이상의 돌연변이를 도입함으로써 하나 이상의 세포(들)를 선택하는 방법을 제공하며, 상기 방법은, 하나 이상의 벡터를 세포(들) 내로 도입시키는 단계로서, 여기서 하나 이상의 벡터는 Cpf1, 직접 반복부 서열에 연결된 가이드 서열, 및 편집 주형 중 하나 이상의 발현을 유도하며; 여기서 편집 주형은 Cpf1 절단을 폐지하는 하나 이상의 돌연변이를 포함하는 단계; 세포(들)에서 표적 폴리뉴클레오티드를 이용하여 편집 주형의 상동성 재조합이 선택되도록 하는 단계; Cpf1 CRISPR-Cas 복합체가 표적 폴리뉴클레오티드에 결합하여 상기 유전자 내에서 표적 폴리뉴클레오티드를 절단이 달성되도록 하는 단계로, 여기서 Cpf1 CRISPR-Cas 복합체는 (1) 표적 폴리뉴클레오티드 내의 표적 서열에 혼성화된 가이드 서열, 및 (2) 직접 반복부 서열과 복합체화된 Cpf1을 포함하며, 여기서 Cpf1 CRISPR-Cas 복합체의 표적 폴리뉴클레오티드로의 결합은 세포 사멸을 유도하며, 이에 의해 하나 이상의 돌연변이가 도입된 하나 이상의 세포(들)가 선택되는 것을 가능하게 하는 단계를 포함하며; 이는 본 발명의 스플릿 Cas9를 포함한다. 본 발명의 또 다른 바람직한 구현예에서, 선택되는 세포는 진핵 세포일 수 있다. 본 발명의 양태는 선별 마커 또는 대항-선택 시스템을 포함할 수 있는 2-단계 공정을 필요로 하지 않으면서 특이적 세포의 선택을 가능하게 한다.
일 양태에서, 본 발명은 직접 반복부 서열의 하류에 가이드 서열을 포함하는 재조합 폴리뉴클레오티드를 제공하며, 여기서 발현된 경우 가이드 서열은 진핵 세포 내에 존재하는 상응하는 표적 서열에 대한 Cpf1 CRISPR-Cas 복합체의 서열-특이적 결합을 유도한다. 일부 구현예에서, 표적 서열은 진핵 세포 내에 존재하는 바이러스 서열이다. 일부 구현예에서, 표적 서열은 원-종양형성유전자 또는 종양형성유전자이다.
일 양태에서, 본 발명은 (a) 직접 반복부 서열 및 DR 서열의 하류에 하나 이상의 가이드 서열(본 명세서에 기재된 바와 같은 변형된 가이드 서열 중 임의의 것을 포함함)을 삽입하기 위한 하나 이상의 삽입 부위에 작동 가능하게 연결된 제1 조절 요소로서, 발현된 경우, 가이드 서열은 진핵 세포 내에서 Cpf1 CRISPR-Cas 복합체의 표적 서열로의 서열-특이적 결합을 유도하며, 여기서 Cpf1 CRISPR-Cas 복합체는 표적 서열(및 선택적으로 DR 서열)에 혼성화된 가이드 서열과 복합체화된 Cpf1(본 명세서에 기재된 바와 같은 변형된 효소 중 임의의 것을 포함함)을 포함하는 제1 조절 요소; 및/또는 (b) 핵 국소화 서열 및/또는 NES를 포함하는 상기 Cpf1 효소를 인코딩하는 효소-코딩 서열에 작동 가능하게 연결된 제2 조절 요소를 포함하는, 벡터 시스템 또는 진핵 숙주 세포를 제공한다. 일부 구현예에서, 숙주 세포는 성분 (a) 및 (b)를 포함한다. 일부 구현예에서, 성분 (a), 성분 (b), 또는 성분 (a) 및 (b)는 숙주 진핵 세포의 게놈 내로 안정적으로 통합된다. 일부 구현예에서, 성분 (a)는 제1 조절 요소에 작동 가능하게 연결되고, 발현된 경우, 둘 이상의 가이드 서열 각각은 진핵 세포 내에서 Cpf1 CRISPR-Cas 복합체의 상이한 표적 서열로의 서열 특이적 결합을 유도한다. 일부 구현예에서, CRISPR 효소는, 진핵 세포의 핵 내 및/또는 핵 외부에서 검출가능한 양으로 상기 CRISPR 효소의 축적을 유도하기에 충분한 강도의 하나 이상의 핵 국소화 서열 및/또는 핵외 수송(nucelear export) 서열 또는 NES를 포함한다. 일부 구현예에서, Cpf1 효소는 프란시셀라 툴라렌시스(Francisella tularensis) 1, 프란시셀라 툴라렌시스 아종 노비시다, 프레보텔라 알벤시스, 라크노스피라세아에 박테리움 MC2017 1, 부티리비브리오 프로테오클라스티쿠스, 페레그리니박테리아 박테리움 GW2011_GWA2_33_10, 파르쿠박테리아 박테리움 GW2011_GWC2_44_17, 스미텔라 종 SCADC, 아시다미노코커스 종 BV3L6, 라크노스피라세아에 박테리움 MA2020, 칸디다투스 메타노플라즈마 테르미툼, 유박테리움 엘리겐스, 모락셀라 보보쿨리 237, 모락셀라 보보쿨리 AAX08_00205, 모락셀라 보보쿨리 AAX11_00205, 부티리비브리오 종 NC3005, 티오마이크로스피라 종 XS5, 렙토스피라 이나다이, 라크노스피라세아에 박테리움 ND2006, 포르피로모나스 크레비오리카니스 3, 프레보텔라 디시엔스, 또는 포르피로모나스 마카카에 Cpf1(본 명세서에 기재된 바와 같은 변형된 효소 중 임의의 것을 포함함)로부터 유래되고, Cpf1의 추가의 변경 또는 돌연변이를 포함할 수 있으며, 키메라 Cpf1일 수 있다. 일부 구현예에서, CRISPR 효소는 진핵 세포 내에서의 발현에 대해 코돈-최적화된다. 일부 구현예에서, CRISPR 효소는 표적 서열의 위치에서 하나 또는 2 개의 가닥의 절단을 유도한다. 바람직한 구현예에서, 가닥 파손은 5' 오버행을 이용한 엇갈린 절단이다. 일부 구현예에서, Cpf1은 DNA 가닥 절단 활성을 결여한다(예를 들어, 야생형 효소 또는 뉴클레아제 활성을 감소시키는 돌연변이 또는 변경을 갖지 않은 효소에 비하여 5% 이하의 뉴클레아제 활성). 일부 구현예에서, 제1 조절 요소는 중합효소 III 프로모터이다. 일부 구현예에서, 제2 조절 요소는 중합효소 II 프로모터이다. 일부 구현예에서, 직접 반복부는 16 개 nt의 최소 길이 및 단일 줄기 루프를 갖는다. 추가의 구현예에서, 직접 반복부는 16 개 nt 보다 긴, 바람직하게는 17 개 nt 초과의 길이를 갖고, 하나 초과의 줄기 루프 또는 최적화된 2차 구조를 갖는다. 일부 구현예에서, 가이드 서열은 적어도 16, 17, 18, 19, 20, 25 개 길이의 뉴클레오티드, 또는 16 개 내지 30 개, 또는 16 개 내지 25 개, 또는 16 개 내지 20 개 길이의 뉴클레오티드이다.
일 양태에서, 본 발명은 본 명세서에서 기재된 하나 이상의 성분을 포함하는 키트를 제공한다. 일부 구현예에서, 키트는 본 명세서에 기재된 바와 같은 벡터 시스템 또는 숙주 세포 및 상기 키트의 사용을 위한 설명서를 포함한다.
변형된 Cpf1 효소
Cpf1 뉴클레아제의 일차 구조의 컴퓨터 분석은 3 개의 별개의 영역을 드러낸다. 먼저, C-말단 RuvC 유사 도메인은 유일한 기능적 특성화된 도메인이다. 두번째로 N-말단 알파-나선형 영역 및 세번째로 혼합된 알파 및 베타 영역은, RuvC 유사 도메인과 알파-나선형 영역 사이에 위치된다.
미구조화된 영역의 몇몇 작은 스트레치는 Cpf1 일차 구조 내에서 예측된다. 용매에 노출되고 상이한 Cpf1 오솔로그 내에서 보존되지 않은 미구조화된 영역은, 작은 단백질 서열의 삽입 및 스플릿에 대한 바람직한 면이다. 추가적으로, 이들 면은 Cpf1 오솔로그 사이의 키메라 단백질을 생성하는 데 사용될 수 있다.
상기 정보를 기반으로 하여, 본원에 기재된 바와 같은 본 발명에 따른 Cpf1의 돌연변이체가 생성될 수 있으며, 이는 효소의 부분적인 또는 완전한 비활성화를 야기하거나, 이는 이중 가닥 뉴클레아제를 닉카제 활성으로 변형시킨다. 대안적인 구현예에서, 이러한 정보는 변형된 활성, 예컨대 감소된 표적외 효과(본 명세서의 다른 곳에 기재되어 있음)를 가지는 효소를 개발하는 데 사용된다.
불활성화된/비활성화된 Cpf1 단백질
본원에 기재된 바와 같은 본 발명에 따른 Cpf1 단백질이 뉴클레아제 활성을 갖는 경우, Cpf1 단백질은 감소된 뉴클레아제 활성, 예를 들어 야생형 효소에 비하여 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95% 이상, 적어도 97%, 또는 100%의 뉴클레아제 비활성화를 갖도록 변형될 수 있거나; 달리 말하면 Cpf1 효소는 유리하게 비-돌연변이된 또는 야생형 Cpf1 효소 또는 CRISPR 효소의 약 0%의 뉴클레아제 활성, 또는 비-돌연변이된 또는 야생형 Cpf1 효소 또는 CRISPR 효소, 또는 예를 들어 비-돌연변이된 또는 야생형 프란시셀라 노비시다 U112(FnCpf1), 아시다미노코커스 종 BV3L6(AsCpf1), 라크노스피라세아에 박테리움 ND2006(LbCpf1) 또는 모락셀라 보보쿨리 237(MbCpf1) Cpf1 효소 또는 CRISPR 효소, 또는 모락셀라 보보쿨리 AAX08_00205 Cpf1 효소 또는 CRISPR 효소, 모락셀라 보보쿨리 AAX11_00205 Cpf1 효소 또는 CRISPR 효소, 부티리비브리오 종 NC3005 Cpf1 효소 또는 CRISPR 효소, 티오마이크로스피라 종 XS5 Cpf1 효소 또는 CRISPR 효소, 라크노스피라세아에 박테리움 MA2020 Cpf1 효소 또는 CRISPR 효소의 비-돌연변이된 또는 야생형 Cpf1 효소의 약 3% 또는 약 5% 또는 약 10% 이하의 뉴클레아제 활성을 갖는다. 이는 Cpf1과 이의 오솔로그의 뉴클레아제 도메인 내로 돌연변이를 도입함으로써 가능하다.
비활성화된 Cpf1 CRISPR 효소는, 예를 들어 메틸라제 활성, 데메틸라제 활성, 전사 활성화 활성, 전사 억제 활성, 전사 방출 인자 활성, 히스톤 변형 활성, RNA 절단 활성, DNA 절단 활성, 핵산 결합 활성 및 분자 스위치(molecular switch)(예를 들어, 광 유도성)를 포함하거나, 이로 본질적으로 이루어지거나, 이로 이루어진 군으로부터의 하나 이상의 도메인을 포함하여, (예를 들어, 융합 단백질을 통해) 회합된 하나 이상의 기능적 도메인을 가질 수 있다. 바람직한 도메인은 Fok1, VP64, P65, HSF1, MyoD1이다. Fok1이 제공되는 경우, 다수의 Fok1 기능적 도메인이 제공되어 작용성 다이머를 허용하고, gRNA가 문헌[Tsai et al. Nature Biotechnology, Vol. 32, Number 6, June 2014]에 구체적으로 기재된 바와 같이 작용적 사용(Fok1)을 위해 적절한 스페이싱을 제공하도록 설계되는 것이 유리하다. 어댑터 단백질은 이러한 기능적 도메인에 부착하는 공지된 링커를 이용할 수 있다. 일부 경우에서, 추가적으로 적어도 하나의 NLS가 제공되는 것이 유리하다. 일부 경우에서, NLS를 N 말단에 위치시키는 것이 유리하다. 하나 초과의 기능적 도메인이 포함되는 경우, 기능적 도메인은 동일하거나 상이할 수 있다.
일반적으로, 비활성화된 Cpf1 효소 상에의 하나 이상의 기능적 도메인의 위치 선정은 기능적 도메인이 귀속된 작용 효과로 표적에 작용하도록 공간 배향을 수정하는 것을 가능하게 하는 것이다. 예를 들어, 기능적 도메인이 전사 활성화제(예를 들어, VP64 또는 p65)인 경우, 전사 활성화제는, 표적의 전사에 작용하도록 하는 공간 배향으로 위치된다. 유사하게, 전사 억제제는 표적의 전사에 작용하도록 유리하게 위치될 것이고, 뉴클레아제(예를 들어, Fok1)는 표적을 절단 또는 부분적으로 절단하기에 유리하게 위치될 것이다. 이는 CRISPR 효소의 N-말단/C-말단 외의 위치를 포함할 수 있다.
본 발명에 따른 효소는 기능적 스크리닝을 위해 관심이 있는 최적화된 기능적 CRISPR-Cas 시스템에 적용될 수 있다
일 양태에서, 본 발명은 제V형, 더욱 특히, Cpf1, 세포 내의 관심 게놈 유전자좌 내의 표적 서열에 혼성화할 수 있는 가이드 서열을 포함하는 CRISPR 가이드 RNA를 포함하는 (비-천연 발생 또는 조작된) 조성물, 복합체, 전달 시스템, 키트, (벡터) 시스템, 숙주 세포 또는 유전자이식 유기체를 제공하며, 가이드 RNA는 둘 이상의 어댑터 단백질(예를 들어, 압타머)에 결합하는 별개의 RNA 서열(들)의 삽입에 의해 변형되며, 각 어댑터 단백질은 하나 이상의 기능적 도메인과 회합되거나; 또는 가이드 RNA는 적어도 하나의 비-코딩 기능적 루프를 갖도록 변형된다. 특정 구현예에서, 가이드 RNA는 직접 반복부의 5', 직접 반복부 내측, 또는 가이드 서열의 3'의 별개의 RNA 서열(들)의 삽입에 의해 변형된다. 1개 초과의 기능적 도메인이 존재하는 경우, 기능적 도메인은 동일하거나 상이할 수 있으며, 예를 들어, 2개가 동일하거나, 2개가 상이한 활성인자 또는 억제인자이다. 일 양태에서, 본 발명은 본원에 논의된 바와 같은 가이드 RNA 및 본원에 기재된 바와 같은 본 발명에 따른 Cpf1 효소인 CRISPR 효소를 포함하는 비-천연 발생 또는 조작된 CRISPR-Cas 복합체 조성물을 제공하며, 선택적으로, Cpf1 효소는 적어도 하나의 돌연변이를 포함하여, Cpf1 효소가 적어도 하나의 돌연변이를 갖지 않는 Cpf1 효소의 5% 이하의 뉴클레아제 활성을 갖게 하고, 선택적으로 적어도 하나 이상의 핵 국소화 서열을 포함한다. 일 양태에서, 본 발명은 본원에 논의된 Cpf1 CRISPR 가이드 RNA 또는 둘 이상의 어댑터 단백질을 포함하는 비-천연 발생 또는 조작된 조성물을 포함하는 Cpf1 CRISPR-Cas 복합체를 제공하며, 각 단백질은 하나 이상의 기능적 도메인과 회합되며, 어댑터 단백질은 가이드 RNA 내로 삽입된 별개의 RNA 서열(들)에 결합한다. 특정 구현예에서, 가이드 RNA는 추가로 또는 대안적으로 Cpf1 CRISPR 복합체의 결합을 여전히 보장하고, Cpf1 효소(본원의 다른 곳에 상세히 설명된 바와 같음)에 의한 절단을 방지하도록 변형된다.
일 양태에서, 본 발명은 세포 내의 관심 게놈 유전자좌 내의 표적 서열에 혼성화할 수 있는 가이드 서열을 포함하는 가이드 RNA(gRNA)를 포함하는 (비-천연 발생 또는 조작된) 조성물, 복합체, 전달 시스템, 키트, (벡터) 시스템, 숙주 세포 또는 유전자이식 유기체를 제공하며, Cpf1 효소는 적어도 하나의 돌연변이를 포함하며, Cpf1 효소가 적어도 하나의 돌연변이를 갖지 않는 Cpf1 효소의 5% 이하의 뉴클레아제 활성을 갖게 하고, 가이드 RNA는 하나 이상의 어댑터 단백질에 결합된 별개의 RNA 서열(들)의 삽입에 의해 변형되고, 어댑터 단백질은 하나 이상의 기능적 도메인과 회합되거나; 가이드 RNA는 적어도 하나의 비-코딩 기능적 루프를 갖도록 변형되고, 조성물은 둘 이상의 어댑터 단백질을 포함하고, 각 단백질은 하나 이상의 기능적 도메인과 회합된다. 일 양태에서, 본 발명은 본원에 논의된 조성물을 제공하며, Cpf1 효소는 적어도 하나의 돌연변이를 갖지 않는 Cpf1 효소와 비교시 적어도 97% 또는 100%의 감소된 뉴클레아제 활성을 갖는다. 일 양태에서, 본 발명은 본원에 논의된 조성물을 제공하며, Cpf1 효소는 둘 이상의 돌연변이를 포함한다. 본 발명의 일 양태에서, 본 발명에 따른 Cpf1 효소는 하나 이상의 기능적 도메인과 회합된다. 일 양태에서, 어댑터 단백질과 회합된 둘 이상의 기능적 도메인은 각각 이종성 기능적 도메인이다. 일 양태에서, Cpf1 효소와 회합된 하나 이상의 기능적 도메인은 각각 이종성 기능적 도메인이다. 일 양태에서, 어댑터 단백질은 기능적 도메인을 포함하는 융합 단백질이며, 융합 단백질은 선택적으로 어댑터 단백질과 기능적 도메인 사이에 링커를 포함하며, 링커는 선택적으로 GlySer 링커를 포함한다. 일 양태에서, gRNA는 둘 이상의 어댑터 단백질에 결합하는 별개의 RNA 서열(들)의 삽입에 의해 변형되지 않는다. 일 양태에서, 어댑터 단백질과 회합된 하나 이상의 기능적 도메인은 전사 활성화 도메인이다. 일 양태에서, Cpf1 효소와 회합된 하나 이상의 기능적 도메인은 전사 활성화 도메인이다. 일 양태에서, 어댑터 단백질과 회합된 하나 이상의 기능적 도메인은 VP64, p65, MyoD1, HSF1, RTA 또는 SET7/9를 포함하는 전사 활성화 도메인이다. 특정 구현예에서, 기능적 도메인은 인간 E1A-회합 단백질 p300의 촉매적 히스톤 아세틸트랜스퍼라제(HAT) 코어 도메인(아미노산 1048-1664)이다. p300 히스톤 아세틸트랜스퍼라제 단백질은 이의 표적 부위에서 히스톤 H3 라이신 27의 아세틸화를 촉매작용시키고, DNA를 그의 이질염색질 상태로부터 방출시켜, 이의 전사를 촉진시킨다(문헌[Hilton et al. 2015, Nature Nature Biotechnology, 33: 510-517]). 일 양태에서, Cpf1 효소와 회합된 하나 이상의 기능적 도메인은 VP64, p65, MyoD1, HSF1, RTA, SET7/9 또는 코어 단백질 p300을 포함하는 전사 활성화 도메인이다. 일 양태에서, 어댑터 단백질과 회합된 하나 이상의 기능적 도메인은 전사 억제인자 도메인이다. 일 양태에서, Cpf1 효소와 회합된 하나 이상의 기능적 도메인은 전사 억제인자 도메인이다. 일 양태에서, 전사 억제인자 도메인은 KRAB 도메인이다. 일 양태에서, 전사 억제인자 도메인은 NuE 도메인, NcoR 도메인, SID 도메인 또는 SID4X 도메인이다. 일 양태에서, 어댑터 단백질과 회합된 하나 이상의 기능적 도메인 중 적어도 하나는 메틸라제 활성, 데메틸라제 활성, 전사 활성화 활성, 전사 억제 활성, 전사 방출 인자 활성, 히스톤 변형 활성, DNA 통합 활성 RNA 절단 활성, DNA 절단 활성 또는 핵산 결합 활성을 포함하는 하나 이상의 활성을 갖는다. 일 양태에서, Cpf1 효소와 회합된 하나 이상의 기능적 도메인은 메틸라제 활성, 데메틸라제 활성, 전사 활성화 활성, 전사 억제 활성, 전사 방출 인자 활성, 히스톤 변형 활성, DNA 통합 활성 RNA 절단 활성, DNA 절단 활성, 핵산 결합 활성 또는 분자 전환 활성 또는 화학적 유도성 또는 광 유도성을 포함하는 하나 이상의 활성을 갖는다. 일 양태에서, DNA 절단 활성은 Fok1 뉴클레아제에 기인한다. 일 양태에서, 하나 이상의 기능적 도메인은 Cpf1 효소에 부착되어, gRNA 및 표적으로의 결합시에, 기능적 도메인이 이의 부여된 기능으로 기능하도록 하는 공간적 배향으로 기능적 도메인이 존재하게 하거나; 또는 선택적으로, 하나 이상의 기능적 도메인은 링커, 선택적으로 GlySer 링커를 통해 Cpf1 효소에 부착된다. 일 양태에서, gRNA는 변형되어, gRNA가 어댑터 단백질에 결합하고, Cpf1 효소 및 표적에 추가로 결합한 후에, 기능적 도메인이 이의 부여된 기능으로 기능하도록 하는 공간적 배향으로 기능적 도메인이 존재하게 한다. 일 양태에서, Cpf1 효소와 회합된 하나 이상의 기능적 도메인은 Cpf1의 RuvC 도메인에 부착된다. 일 양태에서, 가이드 RNA의 직접 반복부는 별개의 RNA 서열(들)의 삽입에 의해 변형된다. 일 양태에서, 하나 이상의 어댑터 단백질에 결합하는 별개의 RNA 서열(들)의 삽입은 압타머 서열이다. 일 양태에서, 압타머 서열은 동일한 어댑터 단백질에 특이적인 둘 이상의 압타머 서열이다. 일 양태에서, 압타머 서열은 상이한 어댑터 단백질에 특이적인 둘 이상의 압타머 서열이다. 일 양태에서, 어댑터 단백질은 MS2, PP7, Qβ, F2, GA, fr, JP501, M12, R17, BZ13, JP34, JP500, KU1, M11, MX1, TW18, VK, SP, FI, ID2, NL95, TW19, AP205, ΦCb5, ΦCb8r, ΦCb12r, ΦCb23r, 7s, PRR1을 포함한다. 따라서, 특정 구현예에서, 압타머는 상기 열거된 어댑터 단백질 중 임의의 것에 특이적으로 결합하는 결합 단백질로부터 선택된다. 일 양태에서, 제1 어댑터 단백질은 p65 도메인과 회합되며, 제2 어댑터 단백질은 HSF1 도메인과 회합된다. 일 양태에서, 본 발명은 적어도 3 개의 기능적 도메인을 가지며, 이 중 적어도 하나가 Cpf1 효소와 회합되며, 이 중 적어도 2개가 gRNA와 회합된 CRISPR-Cas 복합체를 포함하는 본원에 논의된 조성물, 복합체, 전달 시스템, 키트, (벡터) 시스템, 숙주 세포 또는 유전자이식 유기체를 제공한다.
일 양태에서, 1가지 초과의 gRNA가 존재하며, gRNA는 상이한 서열을 표적화함으로써, 조성물이 채용되는 경우, 다중화가 존재한다. 일 양태에서, 본 발명은 하나 이상의 어댑터 단백질에 결합하는 별개의 RNA 서열(들)의 삽입에 의해 변형되는 1가지 초과의 gRNA가 존재하는 조성물을 제공한다.
일 양태에서, 하나 이상의 기능적 도메인과 회합된 하나 이상의 어댑터 단백질이 존재하며, 가이드 RNA 내로 삽입된 별개의 RNA 서열(들)에 결합된다.
일 양태에서, 표적 서열(들)은 비-코딩 또는 조절 서열이다. 조절 서열은 프로모터, 인핸서 또는 사일런서(silencer) 서열(들)일 수 있다.
일 양태에서, 가이드 RNA는 적어도 하나의 비-코딩 기능적 루프를 갖도록 변형되며; 예를 들어, 적어도 하나의 비-코딩 기능적 루프는 억제성이며; 예를 들어, 적어도 하나의 비-코딩 기능적 루프는 Alu를 포함한다.
일 양태에서, 본 발명은 Cpf1을 함유하거나 이를 발현하는 본원에 논의된 바와 같은 세포주 또는 본원에 논의된 모델의 세포를 포함하고, 본원에 논의된 바와 같은 조성물을 세포주 또는 모델의 세포 내로 도입하여, 이에 의해, gRNA가 활성인자 또는 억제인자 중 어느 하나를 포함하고, 도입된 gRNA가 활성인자를 포함하는 이들 세포에 관하여, 또는 도입된 gRNA가 억제인자를 포함하는 이들 세포에 관하여 각각 GOF 또는 LOF에 대하여 모니터링하는 기능 획득(GOF) 또는 기능 손실(LOF)에 대한 스크리닝 방법 또는 비-코딩 RNA 또는 잠재적인 조절 영역(예를 들어, 인핸서, 억제인자)의 스크리닝 방법을 제공한다. 본 발명의 스크리닝은 SAM 스크린으로 지칭된다.
일 양태에서, 본 발명은 가이드 서열을 포함하는 복수의 Cpf1 가이드 RNA(gRNA)를 포함하는 게놈 와이드 라이브러리를 제공하며, 이의 각각은 세포 내의 관심 게놈 유전자좌 내의 표적 서열에 혼성화할 수 있으며, 이에 의해, 라이브러리는 진핵 세포의 집단에서 복수의 게놈 유전자좌 내의 복수의 표적 서열을 표적화할 수 있으며, 각 gRNA는 본원에 기재된 바와 같이 하나 이상의 또는 둘 이상의 어댑터 단백질에 결합하는 별개의 RNA 서열(들)의 삽입에 의해 변형되며, 어댑터 단백질은 하나 이상의 기능적 도메인과 회합되거나; 또는, gRNA는 적어도 하나의 비-코딩 기능적 루프를 갖도록 변형된다. 그리고, 1가지 초과의 기능적 도메인이 존재하는 경우, 기능적 도메인은 동일하거나 상이할 수 있으며, 예를 들어, 2개가 동일하거나, 2개가 상이한 활성화제 또는 억제제이다. 일 양태에서, 본 발명은 본 발명의 gRNA 및 Cpf1 효소를 포함하는 비-천연 발생 또는 조작된 CRISPR-Cas 복합체 조성물(들)의 라이브러리를 제공하며, 선택적으로, Cpf1 효소는 적어도 하나의 돌연변이를 포함하여, Cpf1 효소가 적어도 하나의 돌연변이를 갖지 않는 Cpf1 효소의 5% 이하의 뉴클레아제 활성을 갖게 하며, 선택적으로, 적어도 하나 이상의 핵 국소화 서열을 포함한다. 일 양태에서, 본 발명은 gRNA(들) 또는 하나의 또는 둘 이상의 어댑터 단백질을 포함하는 비-천연 발생 또는 조작된 조성물을 포함하는 본 발명의 Cpf1 CRISPR-Cas 복합체(들)을 제공하며, 각 단백질은 하나 이상의 기능적 도메인과 회합되며, 어댑터 단백질은 gRNA의 적어도 하나의 루프 내로 삽입된 별개의 RNA 서열(들)에 결합한다.
일 양태에서, 본 발명은 복수의 Cpf1 CRISPR-Cas 시스템 가이드 RNA(gRNA)를 포함하는 라이브러리의 투여 또는 발현을 포함하는 생체 외 또는 생체 내 세포의 풀(pool)에서의 게놈의 유전자의 기능적 스크리닝 방법을 제공하며, 여기서 스크리닝은 본원에 기재된 바와 같은 본 발명에 따른 CRISPR 효소의 이용을 추가로 포함하고, CRISPR 복합체는 이종성 기능적 도메인을 포함하도록 변형된다. 일 양태에서, 본 발명은 숙주로의 투여 또는 라이브러리의 숙주에서의 생체 내 발현을 포함하는 게놈의 스크리닝 방법을 제공한다. 일 양태에서, 본 발명은 숙주로 투여되거나 숙주 내에서 발현되는 활성인자를 추가로 포함하는 본원에 논의된 바와 같은 방법을 제공한다. 일 양태에서, 본 발명은 본원에 논의된 바와 같은 방법을 제공하며, 여기서 활성인자는 Cpf1 효소에 부착된다. 일 양태에서, 본 발명은 활성인자가 Cpf1 효소의 N 말단 또는 C 말단에 부착된 본원에 논의된 바와 같은 방법을 제공한다. 일 양태에서, 본 발명은 활성인자가 Cpf1 CRISPR gRNA 직접 반복부에 부착된, 본원에 논의된 바와 같은 방법을 제공한다. 일 양태에서, 본 발명은 숙주에 투여되거나 숙주에서 발현되는 억제인자를 추가로 포함하는, 본원에서 논의된 바와 같은 방법을 제공한다. 일 양태에서, 본 발명은 본원에 논의된 바와 같은 방법을 제공하며, 여기서 스크리닝은 유전자좌에서의 유전자 활성화, 유전자 억제 또는 절단에 영향을 미치거나 이를 검출하는 것을 포함한다. 일 양태에서, 본 발명은 Cpf1 CRISPR-Cas 복합체 또는 이의 성분(들) 또는 이에 대해 코딩하는 핵산 분자(들)의 전달을 포함하는, 본원에 논의된 바와 같은 방법을 제공하며, 여기서 상기 핵산 분자(들)는 조절 서열(들)에 작동 가능하게 연결되고 생체 내에서 발현된다. 일 양태에서, 본 발명은 본원에 논의된 바와 같은 방법을 제공하며, 여기서 생체 내 발현은 렌티바이러스, 아데노바이러스, 또는 AAV를 통한 것이다. 일 양태에서, 본 발명은 본원에 논의된 바와 같은 방법을 제공하며, 여기서 전달은 입자, 나노입자, 지질 또는 세포 투과 펩티드(CPP)를 통한 것이다.
일 양태에서, 본 발명은 한 쌍의 Cpf1 CRISPR-Cas 복합체를 제공하며, 각각은 세포 내의 관심 게놈 유전자좌 내의 표적 서열에 혼성화할 수 있는 가이드 서열을 포함하는 Cpf1 가이드 RNA(gRNA)를 포함하며, 상기 gRNA는 하나 이상의 어댑터 단백질에 결합하는 별개의 RNA 서열(들)의 삽입에 의해 변형되며, 어댑터 단백질은 하나 이상의 기능적 도메인과 회합되며, 각각의 Cpf1 CRISPR-Cas의 각각의 gRNA는 DNA 절단 활성을 갖는 기능적 도메인을 포함한다. 일 양태에서, 본 발명은 본원에 논의된 바와 같이 쌍을 형성한 Cpf1 CRISPR-Cas 복합체를 제공하며, DNA 절단 활성은 Fok1 뉴클레아제에 기인한다.
바람직한 일부 구현예에서, 기능적 도메인은 전사 활성화 도메인, 바람직하게는 VP64이다. 일부 구현예에서, 기능적 도메인은 전사 억제 도메인, 바람직하게는 KRAB이다. 일부 구현예에서, 전사 억제 도메인은 SID, 또는 SID의 연쇄체(concatemer)(예를 들어, SID4X)이다. 일부 구현예에서, 기능적 도메인은 후생적 변형 효소가 제공되도록 하는 후생적 변형 도메인이다. 일부 구현예에서, 기능적 도메인은 P65 활성화 도메인일 수 있는 활성화 도메인이다.
일반적으로, 가이드 RNA는 (예를 들어, 융합 단백질을 통하여) 하나 이상의 기능적 도메인을 포함하는 어댑터 단백질이 결합하기 위한 특이적 결합 부위(예를 들어, 압타머)를 제공하는 방식으로 변형된다. 변형된 가이드 RNA는, 일단 가이드 RNA가 CRISPR 복합체(즉, 가이드 RNA 및 표적으로의 Cpf1 효소 결합)를 형성하면, 어댑터 단백질이 결합하고, 부여된 기능이 효율적이 되기에 유리한 공간적 배향으로 어댑터 단백질 상의 기능적 도메인이 배치되도록 변형된다. 예를 들어, 기능적 도메인이 전사 활성인자(예를 들어, VP64 또는 p65)이면, 전사 활성인자는 이것이 표적의 전사에 영향을 미치는 것을 허용하는 공간적 배향으로 배치된다. 마찬가지로, 전사 억제인자는 유리하게는 표적의 전사에 영향을 미치도록 배치될 것이며, 뉴클레아제(예를 들어, Fok1)는 유리하게는 표적을 절단하거나 부분적으로 절단하도록 배치될 것이다.
숙련자는 어댑터 + 기능적 도메인의 결합을 허용하지만, (예를 들어, CRISPR 복합체의 3차원 구조 내의 입체 장해로 인하여) 어댑터 + 기능적 도메인의 적절한 배치를 허용하지 않는 가이드 RNA에 대한 변형은 의도되지 않는 변형임을 이해할 것이다. 하나 이상의 가이드 RNA는 직접 반복부의 5', 직접 반복부 내, 또는 가이드 서열의 3'에서의 별개의 RNA 서열(들)의 도입에 의해 변형될 수 있다.
가이드 RNA는 동일하거나 상이한 어댑터 단백질에 특이적인 다수의 결합 인식 부위(예를 들어, 압타머)를 포함하도록 설계될 수 있다. Cpf1 효소의 가이드 RNA는 이것이 전형적으로 37 내지 43 개 뉴클레오티드이며, 이것이 오직 하나의 스템 루프만을 함유하는 점을 특징으로 한다. 가이드 RNA는 프로모터 영역 -1000 내지 전사 시작 부위(즉, TSS)의 +1 핵산 상류, 바람직하게는 -200 핵산에 결합하도록 설계될 수 있다. 이러한 배치는 유전자 활성화(예를 들어, 전사 활성인자) 또는 유전자 억제(예를 들어, 전사 억제인자)에 영향을 미치는 기능적 도메인을 개선시킨다. 변형된 가이드 RNA는 조성물에 포함된 하나 이상의 표적 유전자좌에 표적화된 하나 이상의 변형된 가이드 RNA(예를 들어, 적어도 1개의 가이드 RNA, 적어도 2개의 가이드 RNA, 적어도 5개의 가이드 RNA, 적어도 10개의 가이드 RNA, 적어도 20개의 가이드 RNA, 적어도 30개의 가이드 RNA, 적어도 50개의 가이드 RNA)일 수 있다.
표적외 효과를 감소시키는 효소 돌연변이
일 양태에서, 본원에 기재된 바와 같은 본 발명에 따른 CRISPR 효소(Cpf1)는, 감소된 표적외 효과, 즉 예컨대 가이드 RNA에 복합체화될 경우 유전자좌를 표적화하지만, 표적외에 대한 활성을 감소시키거나 제거하는 변형을 달성하는 데 사용하기 위한 개선된 CRISPR 효소뿐만 아니라, 예컨대 가이드 RNA에 복합체화될 경우 CRISPR 효소의 활성을 증가시키기 위한 개선된 개선된 CRISPR 효소를 초래하는 하나 이상의 돌연변이를 갖는다. 하기 본 명세서에 기재된 바와 같은 돌연변이된 효소는 본 명세서의 다른 곳에서 기재된 바와 같은 본 발명에 따른 방법 중 임의의 것에서 사용될 수 있음이 이해되어야 한다. 본 명세서의 다른 곳에 기재된 바와 같은 임의의 방법, 생성물, 조성물 및 용도는 하기 더 상술된 바와 같은 돌연변이된 CRISPR 효소와 함께 동등하게 적용가능하다. Cpf1을 CRISPR 효소로 지칭하거나 읽을 경우, 본 명세서에 기재된 바와 같은 양태 및 구현예에서, 기능적 CRISPR-Cas 시스템의 재구성은 바람직하게 tracr 서열을 필요로 하지 않거나 이에 의존하지 않고/않거나 직접 반복부가 가이드(표적 또는 스페이서) 서열의 5'(상류)임이 이해되어야 한다.
추가 지침에 의해, 다음과 같은 특정 양태 및 구현예가 제공된다.
본 발명자들은, 비변형된 CRISPR 효소에 비하여 감소된 표적외 활성 및/또는 비변형된 CRISPR 효소에 비하여 증가된 표적 활성을 부여하는 변형이 CRISPR 효소에 만들어질 수 있음을 놀랍게도 결정하였다. 따라서, 본 발명의 특정 양태에서, 광범위한 유전자 변형 응용 분야에서 유용성을 가질 수 있는 개선된 CRISPR 효소가 본 명세서에서 제공된다. CRISPR 복합체, 조성물 및 시스템뿐만 아니라, 방법 및 용도 또한 본 명세서에서 제공되며, 이들 모두는 본 명세서에서 개시된 변형된 CRISPR 효소를 포함한다.
이러한 개시 내용에서, 용어 "Cas"는 "Cpf1" 또는 CRISPR 효소를 의미할 수 있다. 본 발명의 이러한 양태의 맥락에서, Cpf1 또는 CRISPR 효소는 돌연변이되거나 변형되며, "이로 인해 CRISPR 복합체 내 효소는 비변형된 효소에 비하여 하나 이상의 표적외 유전자좌를 변형할 수 있는 능력이 감소된다"(또는 유사한 표현); 및 본 명세서를 읽을 때 용어 "Cpf1" 또는 "Cas" 또는 "CRISP 효소" 등은 본 발명에 따른 돌연변이되거나 변형된 Cpf1 또는 Cas 또는 CRISPR 효소를 포함하는 것으로 의도되며, 즉 "이로 인해 CRISPR 복합체 내 효소는 비변형된 효소에 비하여 하나 이상의 표적외 유전자좌를 변형시키는 능력이 감소된다"(또는 유사한 표현).
일 양태에서, 본원에 기재된 바와 같은 본 발명에 따른 Cpf1은 RNA를 포함하는 핵산 분자와 복합체화하여 CRISPR 복합체를 형성하고, CRISPR 복합체에서 핵산 분자가 하나 이상의 표적 폴리뉴클레오티드 유전자좌를 표적화할 경우, 단백질은 비변형된 Cpf1 단백질을 포함하는 복합체에 비하여 변경된 활성을 갖는다. 본 명세서에서 CRISPR "단백질"을 말할 경우, Cpf1 단백질은 바람직하게, 예컨대 Cpf1(이로 제한되지 않음) 변형된 CRISPR 효소(예를 들어, 증가되거나 감소된 효소 활성을 가짐(또는 효소 활성을 가지지 않음))이다. 용어 "CRISPR 단백질"은, 야생형 CRISPR 단백질에 비하여, CRISPR 단백질이 변경된 효소 활성, 예컨대 증가되거나 감소된 효소 활성(또는 효소 활성을 가지지 않음)을 가지는지 여부와 무관하게, "CRISPR 효소"와 상호교환 가능하게 사용될 수 있다.
일 양태에서, 조작된 CRISPR 단백질의 변경된 활성은, 표적외 폴리뉴클레오티드 유전자좌에 비하여, RNA 또는 표적 폴리뉴클레오티드 유전자좌를 포함하는 핵산 분자에 대해 변경된 결합 특성, RNA 또는 표적 폴리뉴클레오티드 유전자좌를 포함하는 핵산 분자에 대해 변경된 결합 역학(kinetic), 또는 RNA 또는 표적 폴리뉴클레오티드 유전자좌를 포함하는 핵산 분자에 대해 변경된 결합 특이성을 포함한다.
일부 구현예에서, 비변형된 Cas, 예컨대 Cpf1은 DNA 절단 활성을 갖는다. 일부 구현예에서, Cas는 표적 서열 내 및/또는 표적 서열의 상보물 내와 같은 표적 서열의 위치에서 1 개 또는 둘 모두의 가닥의 절단을 유도한다. 일부 구현예에서, Cas는 표적 서열의 처음 또는 마지막 뉴클레오티드로부터 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 50, 100, 200, 500 개 이상의 염기쌍 내에서 1 개 또는 둘 모두의 가닥의 절단을 유도한다. 일부 구현예에서, 벡터는 상응하는 야생형 효소에 대하여 돌연변이되어, 돌연변이된 Cas에 표적 서열을 함유하는 표적 폴리뉴클레오티드의 1 개 또는 둘 모두의 가닥의 절단 능력이 결여되게 한 Cas를 인코딩한다. 일부 구현예에서, Cas는 돌연변이된 효소의 DNA 절단 활성이 비-돌연변이 형태의 효소의 DNA 절단 활성의 약 25%, 10%, 5%, 1%, 0.1%, 0.01% 이하, 또는 그 미만인 경우 모든 DNA 절단 활성이 실질적으로 결여된 것으로 여겨지며; 예는 돌연변이된 형태의 DNA 절단 활성이 0이거나, 비-돌연변이 형태에 비하여 무시해도 될 정도인 경우일 수 있다. 따라서, Cas는 하나 이상의 돌연변이를 포함할 수 있고, 작용성 도메인에 대한 융합을 갖는 또는 융합을 갖지 않는 일반 DNA 결합 단백질로서 사용될 수 있다. 돌연변이는 인공적으로 도입된 돌연변이 또는 기능 획득 또는 기능 손실 돌연변이일 수 있다. 본 발명의 일 양태에서, Cas 효소는 단백질, 예를 들어 TAG, 및/또는 유도성/제어가능한 도메인, 예컨대 화학적으로 유도성/제어가능한 도메인에 융합될 수 있다. 본 발명에서 Cas는 키메라 Cas 단백질일 수 있으며; 예를 들어 키메라인 것에 의해 향상된 작용을 갖는 Cas일 수 있다. 키메라 Cas 단백질은 하나 초과의 천연 발생 Cas로부터의 단편을 함유하는 새로운 Cas일 수 있다. 이들은 하나의 Cas9 상동체의 N-말단 단편(들)의 또 다른 Cas 상동체의 C-말단 단편(들)과의 융합을 포함할 수 있다. Cas는 mRNA 형태로 세포 내에 전달될 수 있다. 알려진 돌연변이에 대한 판독을 회피하는 것이 본 발명의 명백한 하나의 목적이다. 실제로, "이로 인해 CRISPR 복합체 내 효소가 비변형된 효소에 비하여 하나 이상의 표적외 유전자좌를 변형시키는 능력의 감소를 갖고/갖거나 이로 인해 CRISPR 복합체 내 효소가 비변형된 효소에 비하여 하나 이상의 표적 유전자좌를 변형시키는 능력의 증가를 갖는다" 라는 구절(또는 이와 유사한 표현)은 단지 닉카제 또는 데드 Cas 또는 알려진 Cas 돌연변이를 초래하는 돌연변이에 대한 판독은 의도되지 않는다. 그러나, 본 발명의 변형(들) 또는 돌연변이(들)가 "이로 인해 CRISPR 복합체 내 효소가 비변형된 효소에 비하여 하나 이상의 표적외 유전자좌를 변형시키는 능력의 감소를 갖고/갖거나 이로 인해 CRISPR 복합체 내 효소가 비변형된 효소에 비하여 하나 이상의 표적 유전자좌를 변형시키는 능력의 증가를 갖는다"라는 구절(또는 이와 유사한 표현)이 닉카제 또는 데드가 되는 효소를 초래하는 돌연변이와 조합될 수 없다고 말하는 것은 아니다. 이러한 데드 효소는 향상된 핵산 분자 결합제일 수 있다. 그리고, 이러한 닉카제는 향상된 닉카제일 수 있다. 예를 들어, 홈 내 및/또는 홈 가까이에서 중성 아미노산(들) 및/또는 핵산(예를 들어, DNA, cDNA, RNA, sgRNA)에 매우 가까운 Cas에서의 기타 다른 위치에서 기타 다른 하전된 잔기의 양으로 하전된 아미노산(들)로의 변경은, "이로 인해, CRISPR 복합체 내 효소가 비변형된 효소에 비하여 하나 이상의 표적외 유전자좌를 변형시키는 능력의 감소를 갖고/갖거나 이로 인해 CRISPR 복합체 내 효소가 비변형된 효소에 비하여 하나 이상의 표적 유전자좌를 변형시키는 능력의 증가를 갖는다"를 초래할 수 있으며, 예를 들어 추가의 절단을 초래할 수 있다. 이는 표적상 및 표적외 절단(수퍼 절단 Cpf1) 모두에서 향상될 수 있음에 따라, 이를 당업계에서 tru-가이드 또는 tru-sgRNA로서 알려진 것들과 사용하는 것은(예를 들어, 문헌[Fu et al., "Improving CRISPR-Cas nuclease specificity using truncated guide RNAs," Nature Biotechnology 32, 279-284 (2014) doi:10.1038/nbt.2808 참조(2013년 11월 17일 수령, 2014년 1월 6일 허가, 2014년 1월 26일 온라인 간행, 2014년 1월 28일 온라인 수정됨)), 더욱 높은 표적외 절단 없이 표적 활성에 대한 향상시키거나, 수퍼 절단 닉카제 제조를 위해 또는 수퍼 결합제를 위해 Cas를 죽게 만드는 돌연변이와의 조합을 위한 것이다.
예상되는 상이한 응용을 위하여 Cpf1 이펙터 단백질의 적합성을 최적화시키기 위하여, Cpf1과 표적 DNA 간의 상호작용은 최적화되고 맞춤화될 수 있다. Cpf1과 표적 DNA 간의 상호작용은 특이적 및 비특이적 상호작용 성분으로 구성된다. 실제로, Cpf1과 표적 DNA 간의 상호작용은 비-특이적인 방식으로 예를 들어, DNA 결합에 영향을 미칠 수 있는 효소의 일반적 입체형태에 기반할 것이다. 이러한 비-특이적인 상호작용에 영향을 미치는 Cpf1 효소의 돌연변이가 도입될 수 있다. 반면, Cpf1의 특이적인 상호작용은 또한 변형될 수 있다. 최근에 향상된 특이성을 가지는 Cas9 오솔로그의 생성을 위한 방법이 설명되었다(문헌[Slaymaker et al. 2015]). 이 전략은 Cpf1 오솔로그의 특이성을 향상시키는 데 사용될 수 있다. 이것은 Cpf1의 뉴클레아제 도메인(들) 내의 모든 양의 전하 잔기(K/R)의 돌연변이에 기초한다. 이상적으로, 두 양태 모두는 숙련자가 요망되는 응용을 위하여 DNA 결합 상호작용을 최적화시키게 할 것이다. 특정 구현예에서, 이것은 다른 이펙터를 위한 DNA 도킹 플랫폼으로서 Cpf1의 이용을 허용할 것이다.
특정 구현예에서, 조작된 Cpf1 단백질의 변경된 활성은 증가된 표적화 효율 또는 감소된 표적외 결합을 포함한다. 특정 구현예에서, 조작된 Cpf1 단백질의 변경된 활성은 변형된 절단 활성을 포함한다.
특정 구현예에서, 변경된 활성은, 표적외 폴리뉴클레오티드 유전자좌에 비하여, RNA 또는 표적 폴리뉴클레오티드 유전자좌를 포함하는 핵산 분자에 대해 변경된 결합 특성, 또는 RNA 또는 표적 폴리뉴클레오티드 유전자좌를 포함하는 핵산 분자에 대해 변경된 결합 특이성을 포함한다.
특정 구현예에서, 변경된 활성은 증가된 표적 효율 또는 감소된 표적외 결합을 포함한다. 특정 구현예에서, 변경된 활성은 변형된 절단 활성을 포함한다. 특정 구현예에서, 변경된 활성은 표적 폴리뉴클레오티드 유전자좌에 대해 증가된 절단 활성을 포함한다. 특정 구현예에서, 변경 활성은 표적 폴리뉴클레오티드 유전자좌에 대해 감소된 절단 활성을 포함한다. 특정 구현예에서, 변경된 활성은 표적외 폴리뉴클레오티드 유전자좌에 대해 감소된 절단 활성을 포함한다. 특정 구현예에서, 변경된 활성은 표적외 폴리뉴클레오티드 유전자좌에 대해 증가된 절단 활성을 포함한다.
특정 구현예에서, 변경된 활성은 표적 폴리뉴클레오티드 유전자좌에 대한 증가된 절단 활성을 포함한다. 특정 구현예에서, 변경된 활성은 표적 폴리뉴클레오티드 유전자좌에 대한 감소된 절단 활성을 포함한다. 특정 구현예에서, 변경된 활성은 표적외 폴리뉴클레오티드 유전자좌에 대한 감소된 절단 활성을 포함한다. 특정 구현예에서, 변경된 활성은 표적외 폴리뉴클레오티드 유전자좌에 대한 증가된 절단 활성을 포함한다. 따라서, 특정 구현예에서, 표적외 폴리뉴클레오티드 유전자좌에 비하여, 표적 폴리뉴클레오티드 유전자좌에 대한 증가된 특이성이 있다. 다른 구현예에서, 표적외 폴리뉴클레오티드 유전자좌에 비하여, 표적 폴리뉴클레오티드 유전자좌에 대해 감소된 특이성이 있다.
본 발명의 일 양태에서, 조작된 Cpf1 단백질의 변경된 활성은 변경된 헬리카제(helicase) 역할을 포함한다.
본 발명의 일 양태에서, 조작된 Cpf1 단백질은 RNA, 또는 표적 폴리뉴클레오티드 유전자좌의 가닥, 또는 표적외 폴리뉴클레오티드 유전자좌의 가닥을 포함하는 핵산 분자와 단백질의 회합을 변경시키는 변형을 포함한다. 본 발명의 일 양태에서, 조작된 Cpf1 단백질은 CRISPR 복합체의 형성을 변경시키는 변형을 포함한다.
특정 구현예에서, 변형된 Cpf1 단백질은 핵산 분자의 표적화를 폴리뉴클레오티드 유전자좌로 변경하는 변형을 포함한다. 특정 구현예에서, 변형은 핵산 분자와 회합하는 단백질의 영역에서의 돌연변이를 포함한다. 특정 구현예에서, 변형은 표적 폴리뉴클레오티드 유전자좌의 가닥과 회합하는 단백질의 영역에서의 돌연변이를 포함한다. 특정 구현예에서, 변형은 표적외 폴리뉴클레오티드 유전자좌의 가닥과 회합하는 단백질의 영역에서의 돌연변이를 포함한다. 특정 구현예에서, 변형 또는 돌연변이는 RNA를 포함하는 핵산 분자, 또는 표적 폴리뉴클레오티드 유전자좌의 가닥, 또는 표적외 폴리뉴클레오티드 유전자좌의 가닥과 회합하는 단백질의 영역에서의 감소된 양전하를 포함한다. 특정 구현예에서, 변형 또는 돌연변이는 RNA를 포함하는 핵산 분자, 또는 표적 폴리뉴클레오티드 유전자좌의 가닥, 또는 표적외 폴리뉴클레오티드 유전자좌의 가닥과 회합하는 단백질의 영역에서의 감소된 음전하를 포함한다. 특정 구현예에서, 변형 또는 돌연변이는 RNA를 포함하는 핵산 분자, 또는 표적 폴리뉴클레오티드 유전자좌의 가닥, 또는 표적외 폴리뉴클레오티드 유전자좌의 가닥과 회합하는 단백질의 영역에서의 증가된 양전하를 포함한다. 특정 구현예에서, 변형 또는 돌연변이는 RNA를 포함하는 핵산 분자, 또는 표적 폴리뉴클레오티드 유전자좌의 가닥, 또는 표적외 폴리뉴클레오티드 유전자좌의 가닥과 회합하는 단백질의 영역에서의 증가된 음전하를 포함한다. 특정 구현예에서, 변형 또는 돌연변이는 단백질과, RNA를 포함하는 핵산 분자, 또는 표적 폴리뉴클레오티드 유전자좌의 가닥, 또는 표적외 폴리뉴클레오티드 유전자좌의 가닥 사이의 입체 장애를 증가시킨다. 특정 구현예에서, 변형 또는 돌연변이는 Lys, His, Arg, Glu, Asp, Ser, Gly, 또는 Thr의 치환을 포함한다. 특정 구현예에서, 변형 또는 돌연변이는 Gly, Ala, Ile, Glu, 또는 Asp로의 치환을 포함한다. 특정 구현예에서, 변형 또는 돌연변이는 결합 홈에서 아미노산 치환을 포함한다.
특정 구현예에서, 변형은 효소의 하나 이상의 아미노산 잔기의 변형을 포함할 수 있다. 특정 구현예에서, 변형은 비변형된 효소에서 양으로 하전된 잔기를 포함하는 영역에 위치된 하나 이상의 아미노산 잔기의 변형을 포함할 수 있다. 특정 구현예에서, 변형은 비변형된 효소에서 양으로 하전된 하나 이상의 아미노산 잔기의 변형을 포함할 수 있다. 특정 구현예에서, 변형은 비변형된 효소에서 양으로 하전되지 않은 하나 이상의 아미노산 잔기의 변형을 포함할 수 있다. 변형은 비변형된 효소에서 하전되지 않은 하나 이상의 아미노산 잔기의 변형을 포함할 수 있다. 변형은 비변형된 효소에서 음으로 하전된 하나 이상의 아미노산 잔기의 변형을 포함할 수 있다. 변형은 비변형된 효소에서 소수성인 하나 이상의 아미노산 잔기의 변형을 포함할 수 있다. 변형은 비변형된 효소에서 극성인 하나 이상의 아미노산 잔기의 변형을 포함할 수 있다. 특정 구현예에서, 변형은 홈(groove)에 위치된 하나 이상의 잔기의 변형을 포함할 수 있다. 특정 구현예에서, 변형은 홈 외부에 위치된 하나 이상의 잔기의 변형을 포함할 수 있다. 특정 구현예에서, 변형은 하나 이상의 잔기의 변형을 포함하며, 여기서 하나 이상의 잔기는 아르기닌, 히스티딘 또는 리신을 포함한다. 특정 구현예에서, 효소는 상기 하나 이상의 잔기의 돌연변이에 의해 변형될 수 있다. 특정 구현예에서, 효소는 상기 하나 이상의 잔기의 돌연변이에 의해 변형되며, 여기서 돌연변이는 비변형된 효소 내의 잔기의, 알라닌 잔기로의 치환을 포함한다. 특정 구현예에서, 효소는 상기 하나 이상의 잔기의 돌연변이에 의해 변형되며, 여기서 돌연변이는 비변형된 효소 내의 잔기의, 아스파르트산 또는 글루탐산으로의 치환을 포함한다. 특정 구현예에서, 효소는 상기 하나 이상의 잔기의 돌연변이에 의해 변형되고, 여기서 돌연변이는 비변형된 효소 내의 잔기의, 세린, 트레오닌, 아스파라긴 또는 글루타민으로의 치환을 포함한다. 특정 구현예에서, 효소는 상기 하나 이상의 잔기의 돌연변이에 의해 변형되고, 여기서 돌연변이는 비변형된 효소 내의 잔기의, 알라닌, 글리신, 이소류신, 류신, 메티오닌, 페닐알라닌, 트립토판, 티로신 또는 발린으로의 치환을 포함한다. 특정 구현예에서, 효소는 상기 하나 이상의 잔기의 돌연변이에 의해 변형되고, 여기서 돌연변이는 비변형된 효소 내의 잔기의, 극성 아미노산 잔기로의 치환을 포함한다. 특정 구현예에서, 효소는 상기 하나 이상의 잔기의 돌연변이에 의해 변형되며, 여기서 돌연변이는 비변형된 효소 내의 잔기의, 극성 아미노산 잔기가 아닌 아미노산 잔기로의 치환을 포함한다. 특정 구현예에서, 효소는 상기 하나 이상의 잔기의 돌연변이에 의해 변형되며, 여기서 돌연변이는 비변형된 효소 내의 잔기의, 음으로 하전된 아미노산 잔기로의 치환을 포함한다. 특정 구현예에서, 효소는 상기 하나 이상의 잔기의 돌연변이에 의해 변형되며, 여기서 돌연변이는 비변형된 효소 내의 잔기의, 음으로 하전되지 않은 아미노산 잔기인 아미노산 잔기로의 치환을 포함한다. 특정 구현예에서, 효소는 상기 하나 이상의 잔기의 돌연변이에 의해 변형되며, 여기서 돌연변이는 비변형된 효소 내의 잔기의, 하전되지 않은 아미노산 잔기로의 치환을 포함한다. 특정 구현예에서, 효소는 상기 하나 이상의 잔기의 돌연변이에 의해 변형되며, 여기서 돌연변이는 비변형된 효소 내의 잔기의, 하전되지 않은 아미노산 잔기가 아닌 아미노산 잔기로의 치환을 포함한다. 특정 구현예에서, 효소는 상기 하나 이상의 잔기의 돌연변이에 의해 변형되며, 여기서 돌연변이는 비변형된 효소 내의 잔기의, 소수성 아미노산 잔기로의 치환을 포함한다. 특정 구현예에서, 효소는 상기 하나 이상의 잔기의 돌연변이에 의해 변형되며, 여기서 돌연변이는 비변형된 효소 내의 잔기의, 소수성 아미노산 잔기가 아닌 아미노산 잔기로의 치환을 포함한다. 특정 구현예에서, 효소는 본 명세서에 열거된 잔기 중 임의의 하나 또는 각각의 오솔로그에서 상응하는 잔기의 돌연변이에 의해 변형되거나 상기 돌연변이에 의한 변형을 포함하는데, 예를 들어 상기 돌연변이에 의한 변형을 포함하거나, 이로 본질적으로 이루어지거나, 이로 이루어지거나; 효소는 본 출원의 전체 개시 내용에 따른 임의의 1 개(단일), 2 개(2중), 3 개(3중), 4 개(4중) 이상의 위치(들), 또는 CRISPR 효소 오솔로그 내 상응하는 잔기 또는 위치에서의 변형을 포함하거나, 이로 본질적으로 이루어지거나, 이로 이루어지는데, 예를 들어 효소는 본 명세서에 열거된 Cpf1 중 임의의 하나, 또는 CRISPR 효소 오솔로그에서 상응하는 잔기 또는 위치에서의 변형을 포함하거나, 이로 본질적으로 이루어지거나, 이로 이루어진다. 이러한 효소에서, 각각의 잔기는 알라닌 잔기에 의한 치환에 의해 변형될 수 있다.
출원인은 최근에 향상된 특이성을 가지는 Cas9 오솔로그의 생성을 위한 방법을 기재하였다(Slaymaker et al. 2015 "Rationally engineered Cas9 nucleases with improved specificity"). 이 전략은 Cpf1 오솔로그의 특이성을 향상시키는 데 사용될 수 있다. 돌연변이유발을 위한 일차 잔기는 바람직하게 RuvC 도메인 내의 모든 양전하 잔기이다. 추가적인 잔기는 상이한 오솔로그 간에 보존되는 양전하 잔기이다.
특정 구현예에서, Cpf1의 특이성은 비-표적화 DNA 가닥을 안정화시키는 잔기를 돌연변이시킴으로써 개선될 수 있다.
(비-천연-발생) CRISPR 효소(본원에 정의된 바와 같은 본 발명에 따른 Cpf1) 중 임의의 것에서:
단일 미스매치(mismatch)가 표적과 하나 이상의 표적외 유전자좌의 상응 서열 사이에 존재할 수 있고/있거나;
2 개, 3 개 또는 4 개 이상의 미스매치가 표적과 하나 이상의 표적외 유전자좌의 상응 서열 사이에 존재할 수 있고/있거나,
(ii)에서, 상기 2 개, 3 개 또는 4 개 이상의 미스매치는 연속적이다.
임의의 비-천연 발생 CRISPR 효소에서, CRISPR 복합체 내 효소는, 비변형된 효소에 비하여 하나 이상의 표적외 유전자좌를 변형서키는 능력이 감소될 수 있고, 여기서 CRISPR 복합체 내 효소는 비변형된 효소에 비하여 상기 표적 유전자좌를 변형시키는 능력이 증가된다.
임의의 비-천연 발생 CRISPR 효소에서, CRISPR 복합체에서 표적과 적어도 하나의 표적외 유전자좌 사이에서와 같이 효소의 변형 능력의 상대적 차이는 비변형된 효소의 상대적 차이에 비하여 증가될 수 있다.
일 양태에서, 본 발명은 표적에 대한 상호작용에 연루된 경우 절단 활성과 연관된 배좌를 향한 개선된 평형 및/또는 표적외 상호작용에 연루된 경우 절단 활성에 연관된 배좌로부터 멀어지는 개선된 평형을 포함하는, 본원에 정의된 바와 같은 CRISPR 뉴클레아제, 예컨대 본원에 기재된 바와 같은 본 발명에 따른 Cpf1을 제공한다. 일 양태에서, 본 발명은 개선된 편집 작용을 갖는 Cas(예를 들어, Cpf1) 뉴클레아제, 즉 표적상 부위에서 뉴클레아제 활성을 포함하는 배좌를 사용하고, 배좌가 표적외 부위에서 증가된 비호감도를 갖는 Cas(예를 들어, Cpf1) 뉴클레아제를 제공한다. 문헌[Sternberg et al., Nature 527(7576):110-3, doi: 10.1038/nature15544, 2015년 10월 28일 온라인 발행. Epub 2015년 10월 28일]은, 포스터(
Figure pat00016
) 공명 에너지 전이(FRET) 실험을 사용하여 표적상 및 표적외 DNA와 연관된 경우 Cas(예를 들어, Cpf1) 촉매 도메인의 상대적 배향을 탐지하고, 본 발명의 CRISPR 효소(예를 들어, Cpf1)로 추정될 수 있다.
본 발명은 변형된 가이드 RNA를 사용하여 뉴클레아제 활성 및/또는 특이성을 조절(modulating)하는 방법 및 돌연변이를 추가로 제공한다. 논의된 바와 같이, 표적상 뉴클레아제 활성은 증가되거나 감소될 수 있다. 또한, 표적외 뉴클레아제 활성은 증가되거나 감소될 수 있다. 추가로, 표적상 활성 대 표적외 활성에 대해 증가되거나 감소된 특이성이 존재할 수 있다. 변형된 가이드 RNA는, 이로 제한됨이 없이, 절단된 가이드 RNA, 데드(dead) 가이드 RNA, 화학적으로 변형된 가이드 RNA, 기능적 도메인과 연관된 가이드 RNA, 기능적 도메인을 포함하는 변형된 가이드 RNA, 압타머(aptamer)를 포함하는 변형된 가이드 RNA, 어댑터(adapter) 단백질을 포함하는 변형된 가이드 RNA, 및 첨가된 또는 변형된 루프를 포함하는 가이드 RNA를 포함한다. 일부 구현예에서, 하나 이상의 기능적 도메인은 데드 gRNA(dRNA)와 연관된다. 일부 구현예에서, CRISPR 효소와의 dRNA 복합체는 유전자좌 상에서 기능적 도메인에 의한 유전자 조절을 유도하는 한편, gRNA는 또 다른 유전자좌에서 CRISPR 효소에 의한 DNA 절단을 유도한다. 일부 구현예에서, dRNA는 표적외 조절에 비하여 관심 유전자좌에 대한 조절의 선택성을 최대화하도록 선택된다. 일부 구현예에서, dRNA는 표적 유전자 조절을 최대화하고 표적 절단은 최소화하도록 선택된다.
일 양태에서, 본 발명은 또한 Cas(예를 들어, Cpf1) 결합 활성 및/또는 결합 특이성을 조절하기 위한 방법 및 돌연변이를 제공한다. 특정 구현예에서, 뉴클레아제 활성을 결여한 Cas(예를 들어, Cpf1) 단백질이 사용된다. 특정 구현예에서, Cas(예를 들어, Cpf1) 뉴클레아제의 결합은 촉진하지만 뉴클레아제 활성은 촉진시키지 않는 변형된 가이드 RNA가 이용된다. 이러한 구현예에서, 표적상 결합은 증가되거나 감소될 수 있다. 또한, 이러한 구현예에서, 표적외 결합은 증가되거나 감소될 수 있다. 나아가 표적상 결합 대 표적외 결합에 대해 증가되거나 감소된 특이성이 있을 수 있다.
활성 및/또는 표적상 대 표적외 활성의 특이성을 증가시키거나 감소시키거나, 또는 결합 및/또는 표적상 대 표적외 결합의 특이성을 증가시키거나 감소시키기 위한 다양한 조합에서 이용될 수 있는 방법 및 돌연변이를 사용하여, 다른 효과를 촉진시키기 위해 이루어진 돌연변이 또는 변형을 보완 또는 증진시킬 수 있다. 다른 효과를 촉진하기 위해 이루어진 이러한 돌연변이 또는 변형은 Cas(예를 들어, Cpf1)에 대한 돌연변이 또는 변형 및/또는 가이드에 대해 이루어진 설계/돌연변이/변형을 포함한다. 특히, 천연 발생 CRISPR/Cas 시스템은 리보뉴클레오티드로 이루어진 가이드(즉, 가이드 RNA)를 포함하지만, 본 발명의 조작된 시스템의 가이드는 데옥시리보뉴클레오티드, 비-천연 발생 뉴클레오티드 및/또는 뉴클레오티드 유사체 및 리보뉴클레오티드를 포함할 수 있다. 추가로, 본 발명의 가이드는 염기 치환/부가/결실을 포함할 수 있다.
특정 구현예에서, 방법 및 Cpf1 단백질은 비-천연 발생 핵산 및/또는 비-천연 발생 뉴클레오티드 및/또는 뉴클레오티드 유사체를 포함하는 가이드와 함께 사용되거나, 가이드는 화학적으로 변형된 가이드 RNA이다. 비-천연 발생 핵산은 예를 들어, 뉴클레오티드의 혼합물을 포함한다. 비-천연 발생 뉴클레오티드 및/또는 뉴클레오티드 유사체는 리보스, 포스페이트 및/또는 염기 모이어티에서 변형될 수 있다. 본 발명의 일 구현예에서, 가이드 핵산은 리보뉴클레오티드 및 비-리보뉴클레오티드를 포함한다. 이러한 일 구현예에서, 가이드는 하나 이상의 리보뉴클레오티드 및 하나 이상의 데옥시리보뉴클레오티드를 포함한다. 본 발명의 일 구현예에서, 가이드는 하나 이상의 비-천연 발생 뉴클레오티드 또는 뉴클레오티드 유사체, 예컨대 포스포로티오에이트 결합이 있는 뉴클레오티드, 리보스 고리의 2' 및 4' 탄소 사이에 메틸렌 브릿지를 포함하는 잠금 핵산(LNA) 뉴클레오티드 또는 브릿징된 핵산(BNA)을 포함한다. 변형된 뉴클레오티드의 다른 예는 2'-O-메틸 유사체, 2'-데옥시 유사체 또는 2'-플루오로 유사체를 포함한다. 가이드 RNA 화학 변형의 예로는, 이로 제한되지는 않지만, 하나 이상의 말단 뉴클레오티드에서 2'-O-메틸(M), 2'-O-메틸 3'포스포로티오에이트(MS), 또는 2'-O-메틸 3'티오PACE(MSP)의 혼입을 포함한다. 이러한 화학적으로 변형된 가이드는, 표적상 특이성 대 표적외 특이성은 예측가능하지 않지만, 비변형된 가이드에 비하여 증가된 안정성 및 증가된 활성을 포함할 수 있다. (문헌[Hendel, 2015, Nat Biotechnol. 33(9):985-9, doi: 10.1038/nbt.3290, 2015년 6월 29일 온라인 발행] 참조). 특정 구현예에서, 가이드는 표적 DNA에 결합하는 영역 내에 리보뉴클레오티드 및 Cpf1에 결합하는 영역 내에 하나 이상의 데옥시리보뉴클레오티드 및/또는 뉴클레오티드 유사체를 포함한다. 본 발명의 일 구현예에서, 데옥시리보뉴클레오티드 및/또는 뉴클레오티드 유사체는 조작된 가이드 구조, 예컨대, 제한 없이 스템-루프 영역에 혼입된다. 본 발명의 방법 및 돌연변이는 Cas(예를 들어, Cpf1) 뉴클레아제 활성 및/또는 dCpf1 표적 결합 활성 및/또는 화학적으로 변형된 가이드 RNA와의 Cpf1 결합을 조절하는 데 사용된다.
RNA-가이드된 결합 단백질로서의 Cas(예를 들어, Cpf1)의 사용은 뉴클레아제-널 Cas(예를 들어, Cpf1)에 제한되지 않는다. 뉴클레아제 활성을 포함하는 Cas9 효소는 또한 특정의 가이드 RNA와 함께 사용되는 경우 RNA-가이드된 결합 단백질로서 작용할 수 있다. 예를 들어, 짧은 가이드 RNA 및 표적에 미스매치된 뉴클레오티드를 포함하는 가이드 RNA는 표적의 적은 절단 또는 절단 없이 표적 서열에의 RNA 지시된 Cas(예를 들어, Cpf1) 결합을 촉진할 수 있다. (예를 들어, 문헌 [Dahlman, 2015, Nat Biotechnol. 33(11):1159-1161, doi: 10.1038/nbt.3390, 2015년 10월 5일 온라인 발행] 참조).
본 발명은 Cas(예를 들어, Cpf1) 단백질의 결합을 조절하기 위한 방법 및 돌연변이를 제공한다. 일 구현예에서, 기능적 도메인은 VP64를 포함하여, RNA-가이드된 전사 인자를 제공한다. 또 다른 구현예에서, 기능적 도메인은 Fok I를 포함하여, RNA-가이드된 뉴클레아제 활성을 제공한다. 미국 특허 공개 2014/0356959, 미국 특허 공개 2014/0342456, 미국 특허 공개 2015/0031132, 및 문헌[Mali, P. et al., 2013, Science 339(6121):823-6, doi: 10.1126/science.1232033, 2013년 1월 3일 온라인 발행]이 언급되며, 본 명세서에 걸친 교시를 통하여, 본 발명은 본 명세서에서의 교시와 함께 연결하여 적용된 이들 문헌의 방법 및 재료를 이해한다. 특정 구현예에서, 표적상 결합은 증가된다. 특정 구현예에서, 표적외 결합은 감소된다. 특정 구현예에서, 표적상 결합은 감소된다. 특정 구현예에서, 표적외 결합은 증가된다. 따라서, 본 발명은 또한 작용화된 Cas(예를 들어, Cpf1) 결합 단백질의 표적상 결합 대 표적외 결합의 특이성의 증가 또는 감소를 제공한다.
Cas(예를 들어, Cpf1) 효소는 또한, 특정 가이드 RNA와 함께 사용되는 경우, RNA-가이드된 결합 단백질로서 기능할 수 있다. 예를 들어, 짧은 가이드 RNA 및 표적에 미스매치된 뉴클레오티드를 포함하는 가이드 RNA는 표적의 적은 절단 또는 절단 없이 표적 서열에의 RNA 지시된 Cas(예를 들어, Cpf1) 결합을 촉진할 수 있다. (예를 들어, 문헌[Dahlman, 2015, Nat Biotechnol. 33(11):1159-1161, doi: 10.1038/nbt.3390, 2015년 10월 5일 온라인 발행] 참조). 일 양태에서, 본 발명은 뉴클레아제 활성을 포함하는 Cas(예를 들어, Cpf1) 단백질의 결합을 조절하기 위한 방법 및 돌연변이를 제공한다. 특정 구현예에서, 표적상 결합은 증가된다. 특정 구현예에서, 표적외 결합은 감소된다. 특정 구현예에서, 표적상 결합은 감소된다. 특정 구현예에서, 표적외 결합은 증가된다. 특정 구현예에서, 표적상 결합 대 표적외 결합의 증가되거나 감소된 특이성이 존재한다. 특정 구현예에서, 가이드 RNA-Cas(예를 들어, Cpf1) 효소의 뉴클레아제 활성이 또한 조절된다.
RNA-DNA 헤테로듀플렉스(heteroduplex) 형성은, PAM에 가장 근접한 씨드 영역 서열에서뿐만 아니라, 표적 영역에 걸쳐서 절단 활성 및 특이성을 위해 중요하다. 따라서, 절단된 가이드 RNA는 감소된 절단 활성 및 특이성을 나타낸다. 일 양태에서, 본 발명은 변경된 가이드 RNA를 사용하여 절단의 활성 및 특이성을 증가시키기 위한 방법 및 돌연변이를 제공한다.
일 양태에서, 본 발명은 효율적인 표적상 활성을 제공하고, 표적외 활성은 최소화한다. 일 양태에서, 본 발명은 CRISPR 단백질에 의한 효율적인 표적상 절단을 제공하고, CRISPR 단백질에 의한 표적외 절단은 최소화한다. 일 양태에서, 본 발명은 DNA 절단 없이, 유전자좌에서의 CRISPR 단백질의 가이드 특이적 결합을 제공한다. 일 양태에서, 본 발명은 유전자좌에서 CRISPR 단백질의 효율적인 가이드 유도된 표적상 결합을 제공하고, CRISPR 단백질의 표적외 결합은 최소화한다. 이에 따라, 일 양태에서, 본 발명은 표적-특이적 유전자 조절을 제공한다. 일 양태에서, 본 발명은 DNA 절단 없이 유전자좌에서 CRISPR 효소의 가이드 특이적 결합을 제공한다. 이에 따라, 일 양태에서, 본 발명은 단일 CRISPR 효소를 이용하여 하나의 유전자좌에서의 절단 및 상이한 유전자좌에서의 유전자 조절을 제공한다. 일 양태에서, 본 발명은 하나 이상의 CRISPR 단백질 및/또는 효소를 이용하여 다수의 표적의 직교(orthogonal) 활성화 및/또는 저해 및/또는 절단을 제공한다.
유도성 Cpf1 CRISPR-Cas 시스템("스플릿-Cpf1”)
일 양태에서, 본 발명은,
유도성 이량체의 제1 절반에 부착된 제1 Cpf1 융합 작제물, 및
유도성 이량체의 제2 절반에 부착된 제2 Cpf1융합 작제물
을 포함하는 본원에 기재된 바와 같은 본 발명에 따른 (비-천연 발생 또는 조작된) 유도성 Cpf1(CRISPR-Cas 시스템)을 제공하며,
여기서 제1 Cpf1 융합 작제물은 하나 이상의 핵 국소화 신호에 작동 가능하게 연결되고,
여기서 제2 Cpf1 융합 작제물은 하나 이상의 핵외 수송 신호에 작동 가능하게 연결되며,
여기서 유도 물질 에너지원과의 접촉은 유도성 이량체의 제1 절반과 제2 절반을 함께 모으고,
여기서 유도성 이량체의 제1 절반과 제2 절반을 함께 모으는 것은 제1 및 제2 Cpf1 융합 작제물이 기능적 Cpf1을 구축하는 것을 가능하게 한다(선택적으로, 여기서 Cpf1 CRISPR-Cas 시스템은 세포에서 관심 게놈 유전자좌의 표적 서열에 혼성화될 수 있는 가이드 서열을 포함하는 가이드 RNA(gRNA)를 포함하고,
여기서 작용성 Cpf1 CRISPR-Cas 시스템은 표적 서열에 결합하고, 선택적으로 게놈 유전자좌를 편집하여 유전자 발현을 변경시킨다).
유도성 Cpf1 CRISPR-Cas 시스템의 본 발명의 일 양태에서 유도성 이량체는 유도성 이형이량체이거나 이를 포함하거나 이로 본질적으로 이루어지거나 이로 이루어진다. 유도성 Cpf1 CRISPR-Cas 시스템의 일 양태에서, 유도성 이형이량체의 제1 절반 또는 제1 부분 또는 제1 단편은 FKBP, 선택적으로 FKBP12이거나 이를 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다. 유도성 Cpf1 CRISPR-Cas 시스템의 본 발명의 일 양태에서, 유도성 이형이량체의 제2 절반 또는 제2 부분 또는 제2 단편은 FRB이거나 이를 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다. 유도성 Cpf1 CRISPR-Cas 시스템의 본 발명의 일 양태에서, 제1 Cpf1 융합 작제물의 배열은 N' 말단 Cpf1 부분-FRB-NES이거나 이를 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다. 유도성 Cpf1 CRISPR-Cas 시스템의 본 발명의 일 양태에서, 제1 Cpf1 융합 작제물의 배열은 NES-N' 말단 Cpf1 부분-FRB-NES이거나 이를 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다. 유도성 Cpf1 CRISPR-Cas 시스템의 본 발명의 일 양태에서, C' 말단 Cpf1 부분-FKBP-NLS이거나 이를 포함하거나 이로 본질적으로 이루어지거나 이로 이루어진다. 유도성 Cpf1 CRISPR-Cas 시스템의 본 발명의 일 양태에서, 제2 Cpf1 융합 작제물의 배열은 NLS-C' 말단 Cpf1 부분-FKBP-NLS이거나 이를 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다. 유도성 Cpf1 CRISPR-Cas 시스템의 일 양태에서, Cpf1 부분을 유도성 이량체의 절반 또는 일부 또는 단편과 분리하는 링커가 있을 수 있다. 유도성 Cpf1 CRISPR-Cas 시스템의 일 양태에서, 유도 물질 에너지원은 라파마이신을 포함하거나 이로 본질적으로 이루어지거나 이로 이루어진다. 유도성 Cpf1 CRISPR-Cas 시스템의 일 양태에서, 유도성 이량체는 유도성 동형이량체이다. 유도성 Cpf1 CRISPR-Cas 시스템의 일 양태에서, Cpf1은 AsCpf1, LbCpf1 또는 FnCpf1이다.
일 양태에서, 본 발명은,
유도성 이형이량체의 제1 절반에 부착된 제1 Cpf1 융합 작제물, 및
유도성 이형이량체의 제2 절반에 부착된 제2 Cpf1 융합 작제물
을 포함하는 (비-천연 발생 또는 조작된) 유도성 Cpf1(CRISPR-Cas 시스템)을 제공하며,
여기서 제1 Cpf1 융합 작제물은 하나 이상의 핵 국소화 신호에 작동 가능하게 연결되고,
여기서 제2 Cpf1 융합 작제물은 핵외 수송 신호에 작동 가능하게 연결되며,
여기서 유도 물질 에너지원과의 접촉은 유도성 이형이량체의 제1 절반과 제2 절반을 함께 모으고,
여기서 유도성 이형이량체의 제1 절반과 제2 절반을 함께 모으는 것은 제1 및 제2 Cpf1 융합 작제물이 작용성 Cpf1을 구축하는 것을 가능하게 한다(선택적으로, 여기서 Cpf1 CRISPR-Cas 시스템은 세포에서 관심 게놈 유전자좌의 표적 서열에 혼성화될 수 있는 가이드 서열을 포함하는 가이드 RNA(gRNA)를 포함하고,
여기서 작용성 Cpf1 CRISPR-Cas 시스템은 게놈 유전자좌를 편집하여 유전자 발현을 변경시킨다).
따라서, 본 발명은 특히 동형이량체뿐만 아니라, 이형이량체, 데드-Cpf1 또는 예를 들어 돌연변이를 통하여 뉴클레아제 활성이 본질적으로 없는 Cpf1, 하나 이상의 NLS 및/또는 하나 이상의 NES가 있는 시스템 또는 복합체; 스플릿 Cpf1에 연결된 기능적 도메인(들); 치료 방법을 포함하는, 방법 및 용도를 포괄한다.
유도 물질 에너지원은 단순히 유도 물질 또는 이량체화제로 여겨질 수 있다. 일관성을 위해 용어 '유도 물질 에너지원'을 본 명세서 전체에 걸쳐 사용한다. 유도 물질 에너지원(또는 유도 물질)은 작용하여 Cpf1을 재구성한다. 일부 구현예에서, 유도 물질 에너지원은 유도성 이량체의 2 개의 절반의 작용을 통하여 Cpf1의 두 부분을 함께 모은다. 따라서 유도성 이량체의 2 개의 절반은 유도 물질 에너지원의 존재 하에서 더욱 강하게 된다. 이량체의 2 개의 절반물은 유도 물질 에너지원 없이 이량체를 형성(이량체화)하지 않을 것이다.
따라서, 유도성 이량체의 2 개의 절반은 유도 물질 에너지원과 협동하여 이량체를 이량체화한다. 이는 결국 Cpf1의 제1 및 제2 부분을 함께 모음으로써 Cpf1을 재구성한다.
CRISPR 효소 융합 작제물 각각은 스플릿 Cpf1의 한 부분을 포함한다. 이들은 바람직하게 본 명세서에 기재된 GlySer 링커와 같은 링커를 통해, 이량체의 2 개의 절반 중 하나에 융합된다. 이량체의 2 개의 절반은 함께 동형이량체를 형성하는 실질적으로 동일한 2 개의 단량체일 수 있거나, 또는 이들은 함께 이형이량체를 형성하는 상이한 단량체일 수 있다. 이와 같이, 2 개의 단량체는 전체 이량체 중 하나의 절반부로 고려될 수 있다.
Cpf1은, Cpf1 효소의 2 개 부분이 실질적으로 작용하는 Cpf1을 포함한다는 의미에서 스플릿된다. 그 Cpf1은, 닉카제 또는 뉴클레아제(DNA의 2 개 가닥 모두를 절단함)와 같은, 게놈 편집 효소로서 작용(표적 DNA 및 가이드와 복합체를 형성하는 경우)할 수 있거나, 이의 촉매 도메인에서 통상적으로 돌연변이(들)로 인하여, 촉매 활성이 매우 적거나 없는 본질적으로 DNA-결합 단백질인 데드-Cpf1일 수 있다.
스플릿 Cpf1의 2 개 부분은 스플릿 Cpf1의 N' 말단 부분 및 C' 말단 부분으로서 여겨질 수 있다. 융합은 통상적으로 Cpf1 스플릿 지점에서이다. 다시 말해서, 스플릿 Cpf의 N' 말단 부분의 C' 말단이 이량체 절반물들 중 하나에 융합되는 한편, C' 말단 부분의 N' 말단은 다른 하나의 이량체 절반에 융합된다.
Cpf1은, 파손이 새롭게 형성된다는 의미에서 스플릿되어야만 하는 것은 아니다. 스플릿 지점은 통상적으로 가상 환경에서 설계되고, 작제물 내로 클로닝된다. 스플릿 Cpf1의 2 개 부분, 즉 N' 말단 및 C' 말단 부분은 함께 전체 Cpf1을 형성하며, 이는 바람직하게 적어도 70% 이상의 야생형 아미노산(또는 이를 인코딩하는 뉴클레오티드), 바람직하게는 적어도 80% 이상, 바람직하게는 적어도 90% 이상, 바람직하게는 적어도 95% 이상, 가장 바람직하게는 적어도 99% 이상의 야생형 아미노산(또는 이를 인코딩하는 뉴클레오티드)를 포함한다. 일부 트리밍(trimming)이 가능할 수 있으며, 돌연변이체가 고려된다. 비-기능적 도메인은 완전히 제거될 수 있다. 중요한 것은 2 개의 부분이 함께 모일 수 있으며, 원하는 Cpf1 작용이 복구 또는 재구성된다는 것이다
이량체는 동형이량체 또는 이형이량체일 수 있다.
하나 이상, 바람직하게는 2 개의 NLS를 제1 Cpf1 작제물에의 작동 가능한 연결에 사용할 수 있다. 하나 이상, 바람직하게는 2 개의 NES를 제1 Cpf1 작제물에의 작동 가능한 연결에 사용할 수 있다. NLS 및/또는 NES는 바람직하게 스플릿 Cpf1-이량체(즉, 절반 이량체) 융합물에 측접되며, 즉 하나의 NLS는 제1 Cpf1 작제물의 N' 말단에 위치될 수 있으며, 하나의 NLS는 제1 Cpf1 작제물의 C' 말단에 존재할 수 있다. 유사하게, 하나의 NES는 제2 Cpf1 작제물의 N' 말단에 위치될 수 있으며, 하나의 NES는 제2 Cpf1 작제물의 C' 말단에 위치될 수 있다. N' 또는 C' 말단을 참조하는 경우, 이들은 상응하는 뉴클레오티드 서열에서 5' 및 3' 말단에 상응함을 이해할 것이다.
바람직한 배열은, 제1 Cpf1 작제물이 5'-NLS-(N' 말단 Cpf1 부분)-링커-(이량체의 제1 절반)-NLS-3'으로 배열된 것이다. 바람직한 배열은, 제2 Cpf1 작제물이 5'-NES--(이량체의 제2 절반)-링커-(C' 말단 Cpf1 부분)-NES-3'으로 배열된 것이다. 적합한 프로모터는 바람직하게 이들 작제물 각각의 상류에 있다. 2 개의 작제물은 개별적으로 또는 함께 전달될 수 있다.
일부 구현예에서, 제2 Cpf1 작제물에 작동 가능하게 연결된 NES(들) 중 하나 또는 모두는 NLS로 교환될 수 있다. 그러나, 이는 통상적으로 바람직하지 않을 수 있으며, 다른 구현예에서, 제2 Cpf1 작제물에 대해 작동 가능하게 연결된 국소화 신호는 하나 이상의 NES(들)이다.
NES가 스플릿 Cpf1의 N' 말단 단편에 작동 가능하게 연결될 수 있고, NLS가 스플릿 Cpf1의 C' 말단 단편에 작동 가능하게 연결될 수 있음이 또한 이해될 것이다. 그러나, NLS가 스플릿 Cpf1의 N' 말단 단편에 작동 가능하게 연결되고, NES가 스플릿 Cpf1의 C' 말단 단편에 작동 가능하게 연결된 배열이 바람직할 수 있다.
NES는, 적어도 유도물질 에너지원이 제공될 때까지(예를 들어, 적어도 에너지원이 유도 물질로 제공되어 그 기능을 실행할 때까지) 핵의 외부에서 제2 Cpf1 융합 작제물을 국소화하는 작용을 한다. 유도 물질의 존재는 세포질 내에서 2 개의 Cpf1 융합물의 이량체화를 자극하고, 이량체화된 제1 및 제2 Cpf1 융합물이 핵에 국소화되기에 열역학적으로 가치있도록 만든다. 이론에 구속되지 않으면서, 출원인은, NES가 세포질에 대한 제2 Cpf1 융합을 격리시킨다고(즉, 핵 외부) 여긴다. 제1 Cpf1 융합에 대한 NLS는 이를 핵으로 국소화시킨다. 두 경우 모두에서, 출원인은 NES 또는 NLS를 원하는 방향에 대한 평형(핵 수송의 평형)으로 전이시키는 데 사용한다. 이량체화는 통상적으로 핵의 외부에서 발생하며(매우 작은 분획이 핵 내에서 발생할 수 있음), 이량체화된 복합체 상에서 NLS는 핵 수송의 평형을 핵 국소화로 전이시키고, 그렇게 이량체화되고 이에 따라 재구성화된 Cpf1은 핵으로 들어간다.
유익하게, 출원인은 스플릿 Cpf1에서 작용을 재구성할 수 있다. 일시적 트랜스펙션은 개념을 입증하는 데 사용되고, 이량체화는 유도 물질 에너지원의 존재 하에 백그라운드로 발생한다. Cpf1의 별개의 단편에서는 활성이 나타나지 않는다. 렌티바이러스 전달을 통한 안정적인 발현을 이후 사용하여 이를 발전시키고 스플릿 Cpf1 접근이 사용될 수 있음을 나타낸다.
이러한 본 발명의 스플릿 Cpf1 접근은, Cpf1 활성이 유도성이 되는 것을 가능하게 하고, 이에 따라 시간적 제어를 가능하게 하기 때문에 유익하다. 추가로, 상이한 국소화 서열(즉, 바람직하게는 NES 및 NLS)을 사용하여 자가-조립된 복합체로부터의 백그라운드 활성을 감소시킨다. 조직-특이적 프로모터, 예를 들어 제1 및 제2 Cpf1 융합 작제물들 각각에 대한 조직 특이적 프로모터 또한 조직-특이적 표적화에 사용될 수 있으며, 이에 따라 공간적 제어를 제공한다. 요구되는 경우, 2 개의 상이한 조직 특이적 프로모터가 사용되어 더욱 세밀한 정도의 제어를 행사할 수 있다. 단계-특이적 프로모터에 대해 동일한 접근이 사용될 수 있거나, 또는 제1 및 제2 Cpf1 융합 작제물 중 하나가 조직-특이적 프로모터의 제어 하에 있는 한편(즉, 조직-특이적 프로모터에 작동 가능하게 연결되거나 이를 포함함), 제1 및 제2 Cpf1 융합 작제물 중 다른 하나가 단계-특이적 프로모터의 제어 하에 있는 경우(즉, 단계-특이적 프로모터에 작동 가능하게 연결되거나 이를 포함함), 단계 및 조직 특이적 프로모터의 혼합물이 존재할 수 있다.
유도성 Cpf1 CRISPR-Cas 시스템은 본 명세서에 기재된 바와 같이, 예를 들어 제1 Cpf1 융합 작제물에 작동 가능하게 연결된 바와 같은 하나 이상의 핵 국소화 서열(NLS)을 포함한다. 이러한 핵 국소화 서열은 이상적으로, 진핵 세포의 핵에서 검출 가능한 양으로 상기 제1 Cpf1 융합 작제물의 축적을 유도하기에 충분한 강도이다. 이론에 구속되고자 하지는 않지만, 핵 국소화 서열은 진핵 생물에서 Cpf1 CRISPR-Cas 복합체 활성에 필수는 아니지만, 이러한 서열의 포함은 시스템의 활성, 특히 핵 내에서 핵산 분자를 표적화하는 것에 대한 활성을 향상시키고, 본 발명의 2-부 시스템의 작동을 보조하는 것으로 여겨진다.
동일하게, 제2 Cpf1 융합 작제물은 핵외 수송 서열(NES)에 작동 가능하게 연결된다. 실제로, 이는 하나 이상의 핵외 수송 서열에 연결될 수 있다. 다시 말해서, 제2 Cpf1 융합 작제물과 사용된 엑스포트(export) 서열의 수는 바람직하게 1 개 또는 2 개 또는 3 개이다. 통상적으로, 2 개가 바람직하지만, 일부 구현예에서 1 개가 충분하고 바람직하다. NLS 및 NES의 적합한 예는 당업계에 알려져 있다. 예를 들어, 바람직한 핵외 수송 신호(NES)는 인간 단백질 티로신 키나아제 2이다. 바람직한 신호는 종 특이적일 것이다.
FRB 및 FKBP 시스템이 사용된 경우, FKBP는 바람직하게 핵 국소화 서열(NLS)에 의해 측접된다. FRB 및 FKBP 시스템이 사용된 경우, 바람직한 배열은 N' 말단 Cpf1 - FRB - NES : C' 말단 Cpf1-FKBP-NLS이다. 따라서, 제1 Cpf1 융합 작제물은 C' 말단 Cpf1 부분을 포함할 것이고, 제2 Cpf1 융합 작제물은 N' 말단 Cpf1 부분을 포함할 것이다.
본 발명에 대한 또 다른 유익한 양태는, 빠르게 작동될 수 있다는 것, 즉 빠른 반응을 갖는다는 것이다. 이론에 구속되지 않으면서, Cpf1 활성이 새로운 융합 작제물의 발현(특히, 번역)을 통한 것보다 더욱 신속하게 기존(이미 존재하는) 융합 작제물(유도 물질 에너지원과의 접촉을 통한)의 이량체를 통해 유도될 수 있는 것으로 여겨진다. 이와 같이, 제1 및 제2 Cpf1 융합 작제물은 미리, 즉 Cpf1 활성이 요구되기 전에 발현될 수 있다. Cpf1 활성은 이후 시간적으로 제어될 수 있고, 이후 유도 물질 에너지원의 첨가를 통하여 빠르게 구성될 수 있으며, 이는 이상적으로 예를 들어 벡터에 의해 전달된 Cpf1의 발현(전사의 유도를 포함함)을 통한 것보다 더욱 빠르게 작용한다(이형이량체를 이량체화하고 이에 의해 Cpf1 활성을 제공함).
출원인은 Cpf1이 2 개의 성분으로 스플릿될 수 있음을 입증하며, 이는 다시 함께 모였을 때 작용성 뉴클레아제를 재구성한다. 라파마이신 민감성 이량체화 도메인을 이용하여, 출원인은 Cpf1-매개된 게놈 편집 및 전사 조절의 시간적 제어를 위해 화학적으로 유도성인 Cpf1을 생성한다. 바꿔 말하면, 출원인은, Cpf1이 2 개의 단편으로 스플릿됨으로써 화학적으로 유도성이 될 수 있고, 라파마이신-민감성 이량체화 도메인은 Cpf1의 제어된 재조립에 사용될 수 있음을 입증한다. 출원인은, (뉴클레아제/닉카제 활성을 통해) 재조립된 Cpf1이 게놈 편집뿐만 아니라, (DNA-결합 도메인, 소위 "데드 Cas9"로서) 전사 조절을 매개하는 데 사용될 수 있음을 나타낸다.
이와 같이, 라파마이신-민감성 이량체화 도메인의 사용이 바람직하다. Cpf1의 재조립이 바람직하다. 재조립은 결합 활성의 복구에 의해 결정될 수 있다. Cpf1이 닉카제이거나 이중-가닥 파손을 유도하는 경우, 야생형에 비교된 적합한 비교 백분율이 본 명세서에서 기재된다.
라파마이신 처리는 12 일 지속될 수 있다. 용량은 200 nM일 수 있다. 이러한 시간적 및/또는 몰 투여량(dosage)은 인간 배아 신장 293FT(HEK293FT) 세포주에 적절한 용량의 예이며, 이는 기타 다른 세포주에 또한 사용될 수 있다. 이러한 특징은 생체 내에서 치료적 사용을 위해, 예를 들어 mg/kg로 추정될 수 있다. 그러나, 이는 또한 대상체로의 라파마이신을 투여하기 위한 표준 용량이 여기에 또한 사용될 수 있음도 고려된다. "표준 투여량량"이라 함은, 라파마이신의 보통 치료적 사용 또는 일차 징후(primary indication) 하에서의 투여량(즉, 라파마이신이 기관 거부반응을 예방하는 용도로 투여된 경우에 사용되는 용량)을 의미한다.
FRB 및 FKBP의 라파마이신-유도된 이량체가 작용성 전장 Cpf1 뉴클레아제의 재조립을 초래할 때까지 Cpf1-FRB/FKBP의 바람직한 배열은 분리되고 비활성인 것이 주목할 만하다. 따라서, 유도성 이형이량체의 제1 절반에 부착된 제1 Cpf1 융합 작제물은 별도로 전달되고/전달되거나, 유도성 이형이량체의 제1 절반에 부착된 제2 Cpf1 융합 작제물로부터 별도로 국소화되는 것이 바람직하다.
핵-국소화된 Cpf1(C)-FKBP 단편을 이용하여 이량체화될 가능성이 더 적은 경우, 세포질 내에서 Cpf1(N)-FRB 단편을 격리하기 위하여, 이는 Cpf19(N)-FRB 상에서 인간 단백질 티로신 키나아제 2(Cpf1(N)-FRB-NES)로부터의 단일 핵외 수송 서열(NES)을 이용하는 것이 바람직하다. 라파마이신 존재 하에서, Cpf1(N)-FRB-NES는 Cpf1(C)-FKBP-2xNLS와 이량체화하여 완전한 Cpf1 단백질을 재구성하며, 이는 핵 수송의 균형을 핵 임포트(import) 방향으로 전위시키고 DNA 표적화를 가능하게 한다.
Cpf1의 높은 투여량은, 가이드 가닥에 대한 적은 미스매치를 나타내는 표적외(OT) 서열에서 삽입결실 빈도를 악화시킬 수 있다. 이러한 서열은, 미스매치가 비연속적 및/또는 가이드의 씨드 영역 외부인 경우 특히 민감하다. 따라서, Cpf1 활성의 시간적 제어는 장기간 발현 실험에서 투여량을 감소시키는 데 사용될 수 있을 것이며, 따라서 구조적으로 활성인 Cpf1에 비하여 감소된 표적외 삽입결실을 초래한다.
출원인은, 스플릿 Cpf1의 안정적인 낮은 복제물 발현이, 표적외 부위에서 현저한 돌연변이 없이, 표적화된 유전자좌에서 상당한 삽입결실을 유도하는 데 사용될 수 있음을 입증한다. 출원인은 Cpf1 단편을 클로닝한다(본 명세서에 기재된 스플릿 5를 기반으로 한 2 개 부분).
바람직한 배열은 제1 Cas9 작제물이 5'-제1 국소화 신호-(N' 말단 Cpf 부분)-링커-(이량체의 제1 절반)-제1 국소화 신호-3'로 배열되고, 제2 Cpf 작제물이 5'-제2 국소화 신호--(이량체의 제2 절반)-링커-(C' 말단 Cpf 부분)-제2 국소화 신호-기능적 도메인-3'으로 배열된 것이다. 여기서, 기능적 도메인은 제2 Cpf 작제물의 3' 말단에 위치된다. 대안적으로, 기능적 도메인은 제1 Cpf 작제물의 5' 말단에 위치될 수 있다. 하나 이상의 기능적 도메인은 3' 말단 또는 5' 말단 또는 두 말단 모두에서 사용될 수 있다. 적합한 프로모터는 바람직하게 이들 작제물 각각의 상류에 있다. 2 개 작제물은 개별적으로 또는 함께 전달될 수 있다. 국소화 신호는, 이들이 각각의 작제물 상에서 섞이지 않는 한, NLS 또는 NES일 수 있다.
출원인은, Cpf1이 2 개의 별개의 단편으로 스플릿될 수 있고, 이는 화학적 유도를 사용하여 다시 함께 모였을 때 작용성 전장 Cpf1 뉴클레아제를 재구성함을 입증한다. 스플릿 Cpf1 건축은 다양한 응용을 위해 유용할 것이다. 예를 들어, 스플릿 Cpf1은 각각의 단편을 상이한 조직 특이적 프로모터 하에 놓음으로써 교차 세포에 대한 Cpf1 활성을 제한하기 위한 유전적 전략을 가능하게 할 수 있다. 추가적으로, 상이한 화학 유도성 이량체화 도메인, 예컨대 APA 및 지베렐린이 또한 이용될 수 있다.
유도 물질 에너지원은 바람직하게 화학 유도이다.
스플릿 자리 또는 위치는 Cpf1 효소의 제1 부분이 제2 부분과 분리되는 지점이다. 일부 구현예에서, 제1 부분은 아미노산 1 내지 X를 포함하거나 이를 인코딩할 것인 한편, 제2 부분은 아미노산 X+1 내지 말단까지를 포함하거나 이를 인코딩할 것이다. 이러한 예에서, 번호매김은 인접성이지만, 이는 아미노산(또는 이를 인코딩하는 뉴클레오티드)은 스플릿 말단 중 어느 하나의 말단으로부터 트리밍될 수 있으므로, 단 충분한 DNA 결합 활성 및 필요한 경우 DNA 닉카제 또는 절단 활성이, 예를 들어 야생형 Cpf1에 비하여 적어도 40%, 50%, 60%, 70%, 80%, 90% 또는 95% 활성으로 유지되는 경우, 이는 언제나 필수적이지는 않다.
본 명세서에서 제공된 예시적인 번호매김은 야생형 단백질, 바람직하게는 야생형 FnCpf1, AsCpf1 또는 LbCpf1을 참조할 수 있다. 그러나, AsCpf1, LbCpf1 또는 FnCpf1 단백질과 같은 야생형 Cpf1의 돌연변이체가 사용될 수 있음이 고려된다. 특정 Cpf1에 대하여 언급되는 경우, 번호매김은, 예를 들어 일부 N' 또는 C' 말단 절단 또는 결실이 사용될 수 있으므로, 정확하게 따르지 않을 수도 있지만, 이는 표준 서열 정렬 도구를 사용하여 해결될 수 있다. 오솔로그는 또한 서열 정렬 도구로서 바람직하다.
따라서, 스플릿 위치는 당업계의 일반 기술을 사용하여, 예를 들어 결정 데이터 및/또는 컴퓨터 구조 예측을 기반으로 선택될 수 있다.
예를 들어, Cpf1 뉴클레아제의 1차 구조의 컴퓨터 분석은 3 개의 별개의 영역을 드러낸다. 먼저, C-말단 RuvC 유사 도메인이 유일한 작용적 특성화된 도메인이다. 두번째로, N-말단 알파-나선형 영역 및 세번째로 혼합된 알파 및 베타 영역은, RuvC 유사 도메인과 알파-나선형 영역 사이에 위치된다. 미구조화된 영역의 몇몇 작은 스트레치는 Cpf1 1차 구조 내에서 예측된다. 용매에 노출되고 상이한 Cpf1 오솔로그 내에서 보존되지 않는 미구조화된 영역은, 스플릿에 대한 바람직한 면을 대표할 수 있다.
Fn, As 및 Lb Cpf1 돌연변이체의 경우, 서열 정렬을 기반으로, 잠재적인 스플릿 부위에 대한 상응하는 위치가 무엇인지 쉽게 명백할 것이다. Fn, As 및 Lb 효소가 아닌 경우, 상대적으로 높은 상동성 정도가 오솔로그와 의도된 Cpf1 사이에 존재하는 경우 오솔로그의 결정 구조를 사용할 수 있거나, 컴퓨터 예측을 사용할 수 있다.
이상적으로, 스플릿 위치는 영역 또는 루프 내에 위치되어야 한다. 바람직하게, 스플릿 위치는 아미노산 서열의 중단이 구조적 특징의 부분적 또는 완전한 파괴를 초래하지 않는 곳(예를 들어, 알파-나선 또는 베타-시트)에서 발생한다. 미구조화된 영역(결정 내에서 "동결"되기에 충분하게 구조화되지 않기 때문에, 결정 구조에서 나타나지 않는 영역)은 종종 바람직한 선택사항이다. 출원인은, 예를 들어 Cpf19의 표면 상에 노출된 미구조화된 영역에서 스플릿을 만들 수 있다.
출원인은 바람직한 예 및 가이드로서 제공되는 하기 절차를 따를 수 있다. 미구조화된 영역은 결정 구조에 나타나지 않기 때문에, 출원인은 결정의 주위 아미노산 서열을 Cpf1의 1차 아미노산 서열과 상호참조한다. 각각의 미구조화된 영역은 예를 들어 약 3 개 내지 10 개의 아미노산으로 만들어질 수 있으며, 이는 결정에서 나타나지 않는다. 따라서 출원인은 이들 아미노산 사이에서 스플릿을 만든다. 더욱 잠재적인 스플릿 부분들을 포함하기 위하여, 출원인은, 미구조화된 영역에서와 동일한 기준을 사용하여 Cpf1의 외부에 있는 루프에 위치된 스플릿을 포함한다.
일부 구현예에서, 스플릿 위치는 Cas9의 외부 루프에 존재한다. 다른 바람직한 구현예에서, 스플릿 위치는 Cpf1의 미구조화된 영역에 있다. 미구조화된 영역은 통상적으로 매우 유연한 외부 루프이며, 그의 구조는 결정 패턴으로부터 쉽게 결정될 수 없다.
스플릿 위치가 확인되면, 적합한 작제물이 설계될 수 있다.
통상적으로, NES는 스플릿 아미노산의 제1 부분의 N' 말단(또는 이를 인코딩하는 뉴클레오티드의 5' 말단)에 위치된다. 그러한 경우, NLS는 스플릿 아미노산의 제2 부분의 C' 말단(또는 이를 인코딩하는 뉴클레오티드의 3' 말단) 위치된다. 이러한 방식으로, 제1 Cpf1 융합 작제물은 하나 이상의 핵외 수송 신호에 작동 가능하게 연결될 수 있고, 제2 Cpf1 융합 작제물은 핵 국소화 신호에 작동 가능하게 연결될 수 있다.
물론, 역배열이 제공될 수 있으며, NLS는 스플릿 아미노산의 제1 부분의 N' 말단(또는 이를 인코딩하는 뉴클레오티드의 5' 말단)에 위치된다. 그러한 경우, NES는 스플릿 아미노산의 제2 부분의 C' 말단(또는 이를 인코딩하는 뉴클레오티드의 3' 말단)에 위치된다. 따라서, 제1 Cpf1 융합 작제물은 하나 이상의 핵 국소화 신호에 작동 가능하게 연결될 수 있고, 제2 Cpf1 융합 작제물은 핵외 수송 신호에 작동 가능하게 연결될 수 있다.
2 개 부분(스플릿의 각 면)을 대략 동일한 길이로 유지하는 스플릿은 패킹 목적에 유리할 수 있다. 예를 들어, 전사물이 대략 동일한 크기인 경우, 두 조각들 모두 사이에서 화학양론을 유지하는 것이 더 용이한 것으로 생각된다.
특정 예에서, 인간 코돈-최적화된 Cpf1, 예컨대 Cpf1 이펙터 단백질, 예컨대 AsCpf1, LbCpf1 또는 FnCpf1의 N- 및 C-말단 조각은 FRB 및 FKBP 이량체화 도메인에 각각 융합된다. 이 배열은 바람직할 수 있다. 이들은 전환될 수 있다(즉, FKBP에 N' 말단 및 FRB에 C' 말단).
이량체화 도메인으로부터 Cpf1 단편을 분리하는 데 (GGGGS)3과 같은 링커가 본 명세서에서 바람직하게 사용된다. (GGGGS)3은 상대적으로 긴 링커(15 개 아미노산)이기 때문에 바람직하다. 글리신 잔기가 가장 유연하며, 세린 잔기는 링커가 단백질의 외부 상에 존재하는 가능성을 향상시킨다. (GGGGS)6 (GGGGS)9 또는 (GGGGS)12가 대안으로서 바람직하게 사용될 수 있다. 기타 다른 바람직한 대안은 (GGGGS)1, (GGGGS)2, (GGGGS)4, (GGGGS)5, (GGGGS)7, (GGGGS)8, (GGGGS)10, 또는 (GGGGS)11이다.
예를 들어, (GGGGS)3은 N' 말단 Cpf1 단편 및 FRB 사이에 포함될 수 있다. 예를 들어, (GGGGS)3은 FKB와 C' 말단 Cpf1 단편 사이에 포함될 수 있다.
대안적인 링커가 이용가능하지만, Cpf1의 두 부분을 함께 모으고 이에 따라 Cpf1 활성을 재구성하기 위한 최대의 기회를 가능하게 하기에는, 고도로 유연한 링커가 가장 잘 작용하는 것으로 생각된다. 한 가지 대안은, 뉴클레오플라스민(nucleoplasmin)의 NLS가 링커로서 사용될 수 있다는 것이다.
링커는 또한 Cpf1과 임의의 기능적 도메인 사이에서 사용될 수 있다. 또 다시, (GGGGS)3 링커(또는 그에 따라 6 개, 9 개, 또는 12 개의 반복 형태)가 본 명세서에서 사용될 수 있거나, 뉴클레오플라스민의 NLS가 CPf1과 기능적 도메인 사이에서 링커로서 사용될 수 있다.
FRB/FKBP 시스템에 대한 대안이 고려된다. 예를 들어, ABA 및 지베릴렌 시스템.
따라서, FKBP 패밀리의 바람직한 예는 하기 유도성 시스템 중 어느 하나이다. FK506 존재 하에서, 칼시뉴린A(CNA)와 이량체화하는 FKBP; FKCsA 존재 하에서, CyP-Fas와 이량체화하는 FKBP; 라파마이신 존재 하에서, FRB와 이량체화하는 FKBP; 쿠메르마이신 존재 하에서 GryB와 이량체화하는 GyrB; 지베렐린 존재 하에서 GID1과 이량체화하는 GAI; 또는 HaXS 존재 하에서, HaloTag와 이량체화하는 스냅-태그(snap-tag).
FKBP 패밀리 자체 내의 대안이 또한 바람직하다. 예를 들어, FKBP는 FK1012 존재 하에서 동형이량체화 한다(즉, 하나의 FKBP가 또 다른 KFBP와 이량체화한다). 따라서, 비-천연 발생 또는 조작된 유도성 Cpf1 CRISPR-Cas 시스템이 또한 제공되며, 이는
유도성 동형이량체의 제1 절반에 부착된 제1 Cpf1 융합 작제물, 및
유도성 동형이량체의 제2 절반에 부착된 제2 Cpf1 융합 작제물
을 포함하며,
여기서 제1 Cpf1 융합 작제물은 하나 이상의 핵 국소화 신호에 작동 가능하게 연결되고,
여기서 제2 Cpf1 융합 작제물은 (선택적으로 하나 이상의) 핵외 수송 신호(들)에 작동 가능하게 연결되며,
여기서 유도 물질 에너지원과의 접촉은 유도성 이량체의 제1 절반과 제2 절반을 함께 모으고,
여기서 유도성 동형이량체의 제1 절반과 제2 절반을 함께 모으는 것은 제1 및 제2 Cpf1 융합 작제물이 작용성 Cpf1 CRISPR-Cas 시스템을 구축하는 것을 가능하게 하며,
여기서 Cpf1 CRISPR-Cas 시스템은 세포에서 관심 게놈 유전자좌의 표적 서열에 혼성화할 수 있는 가이드 서열을 포함하는 가이드 RNA(gRNA)를 포함하고,
여기서 작용성 Cpf1 CRISPR-Cas 시스템은 표적 서열에 결합하며, 선택적으로 게놈 유전자좌를 편집하여 유전자 발현을 변경한다.
일 구현예에서, 동형이량체는 바람직하게는 FKBP이고, 유도물질 에너지원은 바람직하게는 FK1012이다. 또 다른 구현예에서, 동형이량체는 바람직하게 GryB이고, 유도물질 에너지원은 바람직하게 쿠메르마이신이다. 또 다른 구현예에서, 동형이량체는 바람직하게 ABA이고, 유도물질 에너지원은 바람직하게 지베렐린이다.
다른 구현예에서, 이량체는 이형이량체이다. 이형이량체의 바람직한 예는 하기 유도성 시스템들 중 임의의 하나이다: FK506 존재 하에서, 칼시뉴린A(CNA)와 이량체화하는 FKBP; FKCsA 존재 하에서, CyP-Fas와 이량체화하는 FKBP; 라파마이신 존재 하, 쿠메르마이신 존재 하에서 FRB와 이량체화하는 FKBP; 지베렐린 존재 하에서 GID1와 이량체화하는 GAI; 또는 HaXS 존재 하에서, HaloTag과 이량체화하는 스냅-태그.
FKBP/FRB는 잘 특성화되었으며, 2 개의 도메인이 패키징을 보조하기에 충분히 작기 때문에(100 개 미만의 아미노산), 출원인은 FKBP/FRB를 사용하였다. 추가로, 라파마이신은 오랫동안 사용되어 왔고, 부작용이 잘 이해된다. 큰 이량체화 도메인(300 개 초과 aa) 역시 작용하지만 Cpf1 재구성화를 가능하게 만들기 위해서는 더욱 긴 링커를 필요로 할 수 있다.
문헌[Paulmurugan and Gambhir, Cancer Res, August 15, 2005 65; 7413]은 FRB/FKBP/라파마이신 시스템에 대한 백그라운드를 논의한다. 또 다른 유용한 논문은 문헌[Crabtree et al., Chemistry & Biology 13, 99-107, Jan 2006]이다.
유도된 Cpf1 활성의 피크는 일부 구현예에서 유익하며, 단일 전달 벡터를 사용하여 가장 쉽게 유발될 수 있지만, 이는 또한 이중 벡터 시스템(각각의 벡터는 스플릿 Cpf1의 1 개의 절반을 전달함)을 통해 가능하다. 피크는 짧은 시간 척도 동안, 통상적으로 유도 물질의 수명 동안 높은 활성일 수 있다.
본 명세서에서 기재된 모든 방법과 마찬가지로, 적합한 gRNA 또는 가이드가 요구될 것이라는 것이 이해될 것이다.
유도 물질의 기타 다른 예는 광 및 호르몬을 포함한다. 광의 경우, 유도성 이량체는 이형이량체일 수 있고, 이량체 중 제1의 광-유도성 절반 및 이량체 중 제2 (및 상보적인) 광-유도성 절반을 포함한다. 제1 및 제2 광-유도성 이량체 절반들의 바람직한 예는 CIB1 및 CRY2 시스템이다. CIB1 도메인은 광-민감성 크립토크롬 2(CRY2)의 이형이량체성 결합 파트너이다.
또 다른 예에서, 청색-반응성 마그넷 이량체화 시스템(pMag 및 nMag)은 스플릿 Cpf1 단백질의 2 개 부분에 융합될 수 있다. 광 자극에 반응하여, pMag 및 nMag는 이량체화하고, Cpf1은 재조립한다. 예를 들어, 이러한 시스템은 문헌[Nihongaki et al., Nat. Biotechnol. 33, 755-790, 2015]에 Cas9와 연결되어 기재되어 있다.
본 발명은, 유도 물질 에너지원이 열, 초음파, 전자기 에너지 또는 화학물질일 수 있음을 포괄한다. 본 발명의 바람직한 구현예에서, 유도 물질 에너지원은 항생 물질, 소분자, 호르몬, 호르몬 유도체, 스테로이드 또는 스테로이드 유도체일 수 있다. 더욱 바람직한 구현예에서, 유도 물질 에너지원은 아브시스산(ABA), 독시사이클린(DOX), 큐메이트, 라파마이신, 4-하이드록시타목시펜(4OHT), 에스트로겐 또는 엑디손일 수 있다. 본 발명은, 적어도 하나의 전환(switch)이 항생 물질 기반 유도성 시스템, 전자기 에너지 기반 유도성 시스템, 소분자 기반 유도성 시스템, 핵 수용체 기반 유도성 시스템 및 호르몬 기반 유도성 시스템으로 이루어진 군으로부터 선택될 수 있음을 제공한다. 더욱 바람직한 구현예에서, 적어도 하나의 전환은 테트라사이클린(Tet)/DOX 유도성 시스템, 광 유도성 시스템, ABA 유도성 시스템, 큐메이트 억제제/작동자 시스템, 4OHT/에스트로겐 유도성 시스템, 엑디손-기반 유도성 시스템 및 FKBP12/FRAP(FKBP12-라파마이신 복합체) 유도성 시스템으로 이루어진 군으로부터 선택될 수 있다. 이러한 유도 물질은 또한 본 명세서 및 본 명세서에 참고로 통합된, PCT/US2013/051418에서 논의된다.
추가의 예로서, GFP와 같은 형광 단백질과의 스플릿 CPf1 융합물이 제조될 수 있다. 이는 게놈 유전자좌의 이미지화를, 유도성 방식으로 가능하게 할 수 있다(문헌[Dynamic Imaging of Genomic Loci in Living Human Cells by an Optimized CRISPR/Cas System" Chen B et al. Cell 2013] 참조). 이와 같이, 일부 구현예에서, 하나 이상의 Cpf1 부분은 형광 단백질, 예를 들어 GFP에 회합(및 특히 이와 융합)될 수 있다.
일 양태에서, 본 발명은 적어도 하나의 전환을 포함할 수 있는 (비-천연 발생 또는 조작된) Cpf1(CRISPR-Cas 시스템)을 제공하며, 여기서 상기 Cpf1 CRISPR-Cas 시스템의 활성은 전환에 대하여 적어도 하나의 유도 물질 에너지원과의 접촉에 의해 제어된다. 본 발명의 일 구현예에서, 적어도 하나의 전환 또는 상기 Cpf1 CRISPR-Cas 시스템의 활성에 대한 제어는 활성화, 향상, 종료 또는 억제될 수 있다. 적어도 하나의 유도 물질 에너지원과의 접촉은 제1 효과 및 제2 효과를 초래할 수 있다. 제1 효과는 핵 임포트, 핵외 수송, 제2 성분의 채용(예컨대, 이펙터 분자), (단백질, DNA 또는 RNA의) 배좌 변화, 절단, 카고(cargo)(예컨대, 갇힌 분자 또는 공동-인자)의 방출, 회합 또는 해리 중 하나 이상일 수 있다. 제2 효과는 상기 Cpf1 CRISPR-Cas 시스템의 활성 또는 적어도 하나의 전환에 대한, 제어의 활성화, 향상, 종료 또는 억제 중 하나 이상일 수 있다. 일 구현예에서, 제1 효과 및 제2 효과는 단계적으로 연속하여 발생할 수 있다.
본 발명의 또 다른 양태에서, Cpf1은 적어도 하나 이상의 핵 국소화 신호(NLS), 핵외 수송 신호(NES), 기능적 도메인, 유연 링커, 돌연변이, 결실, 변경 또는 절단을 추가로 포함할 수 있다. NLS, NES 또는 기능적 도메인 중 하나 이상은 조건적으로 활성화 또는 비활성화될 수 있다. 또 다른 구현예에서, 돌연변이는 전사 인자 상동성 영역에서의 돌연변이, DNA 결합 도메인(예컨대, 기본 나선 루프 나선의 기본 잔기를 돌연변이시킴), 내인성 NLS에서의 돌연변이 또는 내인성 NES에서의 돌연변이 중 하나 이상일 수 있다. 본 발명은, 유도 물질 에너지원이 열, 초음파, 전자기 에너지 또는 화학물질일 수 있음을 포괄한다. 본 발명의 바람직한 구현예에서, 유도 물질 에너지원은 항생 물질, 소분자, 호르몬, 호르몬 유도체, 스테로이드 또는 스테로이드 유도체일 수 있다. 더욱 바람직한 구현예에서, 유도 물질 에너지원은 아브시스산(ABA), 독시사이클린(DOX), 큐메이트, 라파마이신, 4-하이드록시타목시펜(4OHT), 에스트로겐 또는 엑디손일 수 있다. 본 발명은, 적어도 하나의 전환이 항생 물질 기반 유도성 시스템, 전자기 에너지 기반 유도성 시스템, 소분자 기반 유도성 시스템, 핵 수용체 기반 유도성 시스템 및 호르몬 기반 유도성 시스템으로 이루어진 군으로부터 선택될 수 있음을 제공한다. 더욱 바람직한 구현예에서, 적어도 하나의 전환은 테트라사이클린(Tet)/DOX 유도성 시스템, 광 유도성 시스템, ABA 유도성 시스템, 큐메이트 억제제/작동자 시스템, 4OHT/에스트로겐 유도성 시스템, 엑디손-기반 유도성 시스템 및 FKBP12/FRAP(FKBP12-라파마이신 복합체) 유도성 시스템으로 이루어진 군으로부터 선택될 수 있다.
본 출원에서 상술된 바와 같은 제어의 양태는 적어도 하나 이상의 전환(들)에 관한 것이다. 본 명세서에서 사용된 바와 같은 용어 "전환"은, 조직화된 방식으로 작용하여, 그 작용의 활성화, 억제, 향상 또는 종료와 같은 생물학적 작용의 모든 양태를 포괄하는 변화를 발생시키는 성분들의 세트 또는 시스템에 관한 것이다. 일 양태에서, 전환이라는 용어는 유전자 조절 단백질의 기본 성분 및 이들 단백질이 인식하는 특이적 DNA 서열을 포함하는 유전적 전환을 포괄한다. 일 양태에서, 전환은 유전자 조절에서 사용된 유도성 또는 억제성 시스템에 관한 것이다. 일반적으로, 유도성 시스템은 유전자 발현을 허용하는 일부 분자(유도 물질로 명명됨)의 존재가 있지 않은 경우, 오프(off) 상태일 수 있다. 그 분자는 "발현을 유도한다"고 언급된다. 이러한 것이 일어나는 방식은 제어 메커니즘뿐만 아니라, 세포 유형에서의 차이에 따라 달라진다. 억제성 시스템은, 유전자 발현을 억제하는 일부 분자(공동 억제제로 명명됨)의 존재를 제외하고 온(on) 상태이다. 그 분자는 "발현을 억제한다"고 언급된다. 이러한 것이 일어나는 방식은 제어 메커니즘뿐만 아니라, 세포 유형에서의 차이에 따라 달라진다. 본 명세서에서 사용된 바와 같은 용어 "유도성"은 연루된 분자 메커니즘과 관계없는 전환의 모든 양태를 포괄할 수 있다. 따라서, 본 발명에 의해 포괄되는 바와 같은 전환은 이로 제한되지 않지만, 항생 물질 기반 유도성 시스템, 전자기 에너지 기반 유도성 시스템, 소분자 기반 유도성 시스템, 핵 수용체 기반 유도성 시스템 및 호르몬 기반 유도성 시스템을 포함할 수 있다. 바람직한 구현예에서, 상기 전환은 테트라사이클린(Tet)/DOX 유도성 시스템, 광 유도성 시스템, 아브시스산(ABA) 유도성 시스템, 큐메이트 억제제/작동자 시스템, 4OHT/에스트로겐 유도성 시스템, 엑디손-기반 유도성 시스템 및 FKBP12/FRAP(FKBP12-라파마이신 복합체) 유도성 시스템일 수 있다.
이러한 화학 유도성 시스템을 생성하기 위한 몇 가지 상이한 방법이 존재한다: 1. 아브시스산(ABA)에 의해 유도가능한 ABI-PYL 기반 시스템(예를 들어, 웹사이트 stke.sciencemag.org/cgi/content/abstract/sigtrans;4/164/rs2 참조), 2. 라파마이신에 의해 유도가능한 FKBP-FRB 기반 시스템(또는 라파마이신을 기반으로 한 관련 화학 물질)(예를 들어, 웹사이트 nature.com/nmeth/journal/v2/n6/full/nmeth763.html 참조), 3. 지베렐린(GA)에 의해 유도가능한 GID1-GAI 기반 시스템(예를 들어, 웹사이트 nature.com/nchembio/journal/v8/n5/full/nchembio.922.html 참조).
본 발명에 의해 고려되는 또 다른 시스템은 준-세포 국소화에서의 변화를 기반으로 한 화학 유도성 시스템이다. 출원인은 또한, 관심 게놈 유전자좌를 표적하도록 조작된 유도성 Cpf1 CRISPR-Cas 시스템을 포괄하며, 여기서 Cpf1 효소는 화학 또는 에너지 민감성 단백질의 상이한 부분에 추가로 연결된 2 개의 융합 작제물로 스플릿된다. 이러한 화학 또는 에너지 민감 단백질은, 화학 또는 에너지 민감 단백질로의 화학 또는 에너지 전달의 결합시, Cpf1 효소의 어느 하나의 절반의 준-세포성 국소화에서의 변화(즉, Cpf1 효소의 어느 하나의 절반의 세포질에서 세포의 핵 내로의 수송)를 일으킬 것이다. 이러한 융합 작제물을, 재구성된 Cpf1 CRISPR-Cas 시스템에 대한 기질의 결여로 인해 이의 활성이 격리된, 하나의 준-세포 구획 또는 세포소기관으로부터, 기질이 존재하는 또 다른 곳으로의 수송은 성분을 모으고 작용적 활성을 재구성하고, 이후 이의 원하는 기질(즉, 포유동물 핵 내 게놈 DNA)과 접촉되는 것을 가능하게 할 수 있으며, 이는 표적 유전자 발현의 활성화 또는 억제를 초래할 것이다.
기타 다른 유도성 시스템이 고려되며, 예컨대 이로 제한되지는 않지만, 중금속에 의한 조절(문헌[Mayo KE et al., Cell 1982, 29:99-108]; [Searle PF et al., Mol Cell Biol 1985, 5:1480-1489] 및 [Brinster RL et al., Nature (London) 1982, 296:39-42]), 스테로이드 호르몬(문헌[Hynes NE et al., Proc Natl Acad Sci USA 1981, 78:2038-2042]; [Klock G et al., Nature (London) 1987, 329:734-736] 및 [Lee F et al., Nature (London) 1981, 294:228-232]), 열 쇼크(문헌[Nouer L: Heat Shock Response. Boca Raton, FL: CRC; 1991] 및 기타 다른 시약들이 개발되어 왔다(문헌[Mullick A, Massie B: Transcription, translation and the control of gene expression. In Encyclopedia of Cell Technology Edited by: Speir RE. Wiley; 2000:1140-1164] 및 [Fussenegger M, . Biotechnol Prog 2001, 17:1-51]). 그러나, 이들 유도성 포유동물 프로모터에는, 예컨대 "오프" 상태의 "누설(leakiness)" 및 유도 물질의 다면적(pleiotropic) 효과와 같은(열 쇼크, 중금속, 글루코코르티코이드 등) 제한이 있다. 포유동물 세포에서 세포성 과정으로 인한 간섭을 감소시키고자 하는 의도에서 곤충 호르몬(엑디손)의 사용이 제안되어 왔다(문헌[No D et al., Proc Natl Acad Sci USA 1996, 93:3346-3351]). 또 다른 명쾌한 시스템은 라파마이신을 유도 물질로서 사용하지만(문헌[Rivera VM et al., Nat Med 1996, 2:1028-1032]), 라파마이신의 면역억제제로서의 역할은 이의 사용이 생체 내로만 주로 제한되었다는 것이며, 따라서 유전자 발현의 제어를 위해 생물학적으로 비활성인 화합물을 찾는 것이 필요하였다(문헌[Saez E et al., Proc Natl Acad Sci USA 2000, 97:14512-14517]).
특정 구현예에서, 본 명세서에 기재된 유전자 편집 시스템은, 세포의 조건이 변경될 때 숙주 세포를 효율적으로 사멸시키는 메커니즘인 패스코드 사멸 스위치의 제어 하에 놓인다. 이는, 스위치를 키는 데 IPTG의 존재를 필요로 하는(문헌[Chan et al. 2015 Nature Nature Chemical Biology doi:10.1038/nchembio.1979]) 하이브리드 LacI-GalR 패밀리 전사 인자를 도입함으로써 보장되며, 이는 세포-생존에 중요한 효소를 인코딩하는 효소를 유도하는 데 사용될 수 있다. 상이한 화학물질에 민감한 상이한 전사 인자를 조합함으로써, "코드"가 생성될 수 있다. 이 시스템은 CRISPR-유도 유전자 변형의 범위를 공간적으로 그리고 시간적으로 제어하는 데 사용될 수 있으며, 이는 치료적 적용을 포함하여 상이한 분야에서 관심이 있고 또한 의도된 환경에서 GMO의 "탈출"을 피하는 것에도 관심이 있을 수 있다.
자가-비활성화 시스템
일단 세포의 게놈 내 유전자의 모든 복제물이 편집되면, 그 세포에서 연속된 CRISPR/Cpf1 발현은 더 이상 필요하지 않다. 실제로 지속된 발현은, 의도되지 않은 게놈 부위 등에서 표적외 효과의 경우에 바람직하지 않을 것이다. 따라서, 시간-제한된 발현이 유용할 것이다. 유도성 발현은 하나의 접근을 제공하지만, 추가적으로 출원인은 CRISPR 벡터 그 자체 내에 있는 비-코딩 가이드 표적 서열의 사용에 의존하는 자가-비활성화 Cpf1 또는 CRISPR-Cpf1 시스템을 예상하였다. 따라서, 발현이 시작된 후, CRISPR 시스템은 그 자신의 파괴를 일으킬 것이지만, 파괴가 완료되기 전에, 이는 표적 유전자의 게놈 복제물을 편집할 시간이 있을 것이다(이는, 이배체 세포에서 정상의 점 돌연변이를 이용하여, 많아야 2 개의 편집물을 필요로 함). 간단하게, 자가-비활성화 Cpf1 또는 CRISPR-Cas 시스템은 추가적인 RNA(즉, 가이드 RNA)를 포함하며, 이는 CRISPR 효소 자체에 대한 코딩 서열을 표적화하거나 다음 (a) 내지 (d) 중 하나 이상에서 존재하는 독특한 서열에 상보적인 하나 이상의 비-코딩 가이드 표적 서열을 표적화한다:
(a) 비-코딩 RNA 요소의 발현을 유도하는 프로모터 내,
(b) Cpf1 유전자의 발현을 유도하는 프로모터 내,
(c) Cpf1 코딩 서열에서 ATG 번역 시작 코돈의 100 bp 내,
(d) 예를 들어 AAV 게놈에서, 바이러스 전달 벡터의 역위 말단 반복부(inverted terminal repeat; iTR) 내.
추가로, 그 RNA는 벡터, 예를 들어 별도의 벡터 또는 CRISPR 복합체를 인코딩하는 동일한 벡터를 통해 전달될 수 있다. 별도의 벡터에 의해 제공되는 경우, Cpf1 발현을 표적화하는 CRISPR RNA는 순차적으로 또는 동시에 투여될 수 있다. 순차적으로 투여되는 경우, Cpf1 발현을 표적화하는 CRISPR RNA는, 예를 들어 유전자 편집 또는 유전자 조작을 위해 의도된 CRISPR RNA 다음에 전달되어야 한다. 이 기간은 분 단위 기간(예를 들어, 5 분, 10 분, 20 분, 30 분, 45 분, 60 분)일 수 있다. 이 기간은 시 단위 기간(예를 들어, 2 시간, 4 시간, 6 시간, 8 시간, 12 시간, 24 시간)일 수 있다. 이 기간은 일 단위 기간(예를 들어, 2 일, 3 일, 4 일, 7 일)일 수 있다. 이 기간은 주 단위 기간(예를 들어, 2 주, 3 주, 4 주)일 수 있다. 이 기간은 달 단위 기간(예를 들어, 2 개월, 4 개월, 8 개월, 12 개월)일 수 있다. 이 기간은 년 단위 기간(2 년, 3 년, 4 년)일 수 있다. 이러한 방식으로, Cas 효소는 제1 표적에 혼성화할 수 있는 제1 gRNA, 예컨대 관심 게놈 유전자좌 또는 유전자좌들과 회합하고, CRISPR-Cas 시스템에 원하는 작용(들)(예를 들어, 유전자 조작)을 착수하며; 순차적으로 Cpf1 효소는 이후 Cpf1 또는 CRISPR 카세트의 적어도 일부를 포함하는 서열에 혼성화할 수 있는 제2 gRNA와 회합할 수 있다. gRNA가 Cpf1 단백질의 발현을 인코딩하는 서열을 표적화하는 경우, 효소는 방해되고, 시스템은 자가 비활성화된다. 동일한 방식으로, 예를 들어, 본 명세서에서 설명된 바와 같은, 리포좀, 리포펙션, 나노입자, 미세소포를 통해 적용된 Cpf1 발현을 표적화하는 CRISPR RNA는 순차적으로 또는 동시에 투여될 수 있다. 유사하게, 자가-비활성화는 하나 이상의 표적을 표적화하는 데 사용된 하나 이상의 가이드 RNA의 비활성화를 위해 사용될 수 있다.
일부 양태에서, CRISPR 효소 출발 코돈의 하류에서 서열에 혼성화할 수 있는 단일 gRNA가 제공되며, 이에 의해 일정 기간 후에, CRISPR 효소 발현의 손실이 있게 된다. 일부 양태에서, CRISPR-Cas 시스템을 인코딩하는 폴리뉴클레오티드의 하나 이상의 코딩 또는 비-코딩 영역에 혼성화할 수 있는 하나 이상의 gRNA(들)가 제공되며, 이에 의해 일정 기간 후에, CRISPR-Cas 시스템의 하나 이상, 또는 일부 경우에는 모든 비활성화가 존재한다. 본 시스템의 일부 양태에서, 그리고 이론에 구애되지는 않지만, 세포는 복수의 CRISPR-Cas 복합체를 포함할 수 있으며, 여기서 CRISPR 복합체의 제1 하위세트는 편집될 게놈 유전자좌 또는 유전자좌들을 표적화할 수 있는 제1 gRNA를 포함하고, CRISPR 복합체의 제2 하위세트는 CRISPR-Cas 시스템을 인코딩하는 폴리뉴클레오티드를 표적화할 수 있는 적어도 하나의 제2 gRNA를 포함하며, 여기서 CRISPR-Cas 복합체의 제1 하위세트는 표적화된 게놈 유전자좌 또는 유전자좌들의 편집을 매개하고, CRISPR 복합체의 제2 하위세트는 CRISPR-Cas 시스템을 결과적으로 비활성화하여, 세포 내에서 추가의 CRISPR-Cas 발현을 비활성화한다.
제1 가이드 RNA는 본 명세서의 다른 곳에 기재된 바와 같이, 게놈 내에서 임의의 관심 표적 서열을 표적화할 수 있다. 제2 가이드 RNA는 CRISPR Cas9 효소를 인코딩하는 벡터 내 서열을 표적화하며, 이에 의해 그 벡터로부터 효소의 발현을 비활성화한다. 따라서, 벡터 내 표적 서열은 발현을 비활성화할 수 있어야만 한다. 적합한 표적 서열은, 예를 들어 AAV 게놈에서, 예를 들어 Cpf1 코딩 서열에 대한 번역 출발 코돈 가까이 또는 그 안에, 비-코딩 RNA 요소의 발현을 유도하는 프로모터 내 비-코딩 서열 내, Cpf1 유전자의 발현을 유도하는 프로모터 내, Cpf1 코딩 서열 내 ATG 번역 출발 코돈의 100 bp 내 및/또는 바이러스 전달 벡터의 역위 말단 반복부(iTR) 내에 있을 수 있다. 이 영역 가까이에서 이중 가닥 파손은 Cpf1 코딩 서열에서 프레임시프트(frame shift)를 유도할 수 있으며, 단백질 발현의 손실을 유발한다. "자가-비활성화" 가이드 RNA에 대한 대안적인 표적 서열은 CRISPR-Cpf1 시스템의 발현에 또는 벡터의 안정화에 필요한 조절 영역/서열을 편집/비활성화하는 것을 목적으로 할 것이다. 예를 들어, Cpf1 코딩 서열에 대한 프로모터가 붕괴되면, 전사는 억제 또는 방지될 수 있다. 유사하게, 벡터가 복제, 유지 또는 안정성을 위한 서열을 포함하는 경우, 이들을 표적화하는 것이 가능하다. 예를 들어, AAV 벡터에서, 유용한 표적 서열은 iTR 내에 존재한다. 표적에 대한 기타 다른 유용한 서열은 프로모터 서열, 폴리아데닐화 부위 등일 수 있다.
나아가, 가이드 RNA가 어레이(array) 포맷으로 발현되는 경우, 프로모터 둘 모두를 동시에 표적화하는 "자가-비활성화" 가이드 RNA는 CRISPR-Cas 발현 작제물 내로부터의 개재하는 뉴클레오티드의 절제를 초래할 것이며, 효과적으로 이의 완전한 비활성화를 이끈다. 유사하게, 개재 뉴클레오티드의 절제는 가이드 RNA가 두 ITR 모두를 표적화하거나 둘 이상의 기타 다른 CRISPR-Cas 성분을 동시에 표적화하는 것을 초래할 것이다. 본 명세서에서 설명된 바와 같은 자가-비활성화는 일반적으로, CRISPR-Cpf1의 조절을 제공하기 위하여 CRISPR-Cpf1 시스템을 이용하여 적용가능하다. 예를 들어, 본 명세서에서 설명된 바와 같은 자가-비활성화는, 돌연변이, 예를 들어 본 명세서에서 설명된 바와 같은, 확장 장애(expansion disorder)의 CRISPR 수복에 적용될 수 있다. 이러한 자가-비활성화의 결과, CRISPR 수복은 단지 일시적으로 활성이다.
"자가-비활성화" 가이드 RNA의 5' 말단으로의 비-표적화 뉴클레오티드의 첨가(예를 들어, 1 개 내지 10 개 뉴클레오티드, 바람직하게는 1 개 내지 5 개 뉴클레오티드)는, CRISPR-Cpf1 셧다운(shutdown) 전에 표적화된 게놈 유전자좌에서의 편집을 보장하는 수단으로서 이의 가공을 지연시키고/지연시키거나 이의 효율을 변형시키는 데 사용될 수 있다.
자가-비활성화 Cpf1 또는 CRISPR-Cpf1 시스템의 일 양태에서, 관심 게놈 서열(예를 들어, 1 내지 2, 1 내지 5, 1 내지 10, 1 내지 15, 1 내지 20, 1 내지 30)을 표적화하는 하나 이상의 gRNA를 공동발현하는 플라스미드는 조작된 ATG 출발 부위에서 또는 그 가까이에서(예를 들어, 5 개 뉴클레오티드 내, 15 개 뉴클레오티드 내, 30 개 뉴클레오티드 내, 50 개 뉴클레오티드 내, 100 개 뉴클레오티드 내) LbCpf1을 표적화하는 "자가-비활성화" gRNA를 이용하여 수립될 수 있다. U6 프로모터 영역 내 조절 서열은 또한 gRNA로 표적화될 수 있다. U6-유도된 gRNA는 다수의 gRNA 서열이 동시에 방출될 수 있는 어레이 포맷으로 설계될 수 있다. 표적 조직/세포(남은 세포) 내로 먼저 전달된 경우, gRNA는 축적되기 시작하는 한편, Cpf1 수준은 핵 내에서 상승한다. Cpf1은 모든 gRNA와 복합체화하여 게놈 편집 및 CRISPR-Cpf1 플라스미드의 자가-비활성화를 매개한다.
자가-비활성화 CRISPR-Cpf1 시스템의 일 양태는 1 개 내지 4 개 이상의 상이한 가이드 서열; 예를 들어 최대 약 20 개 또는 약 30 개의 가이드 서열로부터의 탠덤 어레이 포맷 또는 단독 어레이의 발현이다. 각각의 개별적인 자가 비활성화 가이드 서열은 상이한 표적을 표적화할 수 있다. 이러한 것은 예를 들어 하나의 키메라 pol3 전사물로부터 가공될 수 있다. U6 또는 H1 프로모터와 같은 Pol3 프로모터가 사용될 수 있다. Pol2 프로모터는 예컨대 본 명세서 전체에 걸쳐 언급된 것이다. 역위 말단 반복부(iTR) 서열은 Pol3 프로모터 - gRNA(들)-Pol2 프로모터- Cpf1에 측접할 수 있다.
키메라성 탠덤 어레이 전사물의 일 양태는 하나 이상의 가이드(들)가 하나 이상의 표적(들)을 편집하는 한편, 하나 이상의 자가 비활성화 가이드는 CRISPR/Cpf1 시스템을 비활성화시킨다. 따라서, 예를 들어 확장 장애를 수복하기 위해 기재된 CRISPR-Cpf1 시스템은 본 명세서에 기재된 자가-비활성화 CRISPR-Cpf1 시스템과 직접 조합될 수 있다. 이러한 시스템은, 예를 들어 수복을 위해 표적 영역으로 유도된 2 개의 가이드 및 CRISPR-Cpf1의 자가-비활성화로 유도된 적어도 제3의 가이드를 갖는다. "Compositions And Methods Of Use Of CRISPR-Cas Systems In Nucleotide Repeat Disorders"라는 명칭의 2014년 12월 12일 WO/2015/089351로서 간행된, 출원 일련 번호 PCT/US2014/069897을 참조한다.
가이드 RNA는 제어 가이드일 수 있다. 예를 들어, 개시 내용이 본 명세서에 참고로 포함되어 있는 US2015232881A1에 기재된 바와 같이, 가이드RNA는 CRISPR 효소 그 자체를 인코딩하는 핵산 서열을 표적화하도록 조작될 수 있다. 일부 구현예에서, 시스템 또는 조성물에는 CRISPR 효소를 인코딩하는 핵산 서열을 표적화하도록 조작된 가이드RNA만이 제공될 수 있다. 추가적으로, 시스템 또는 조성물에는 CRISPR 효소를 인코딩하는 핵산 서열을 표적화하도록 조작된 가이드RNA뿐만 아니라, CRISPR 효소를 인코딩하는 핵산 서열, 및 선택적으로 제2 가이드 RNA, 및 추가로 선택적으로 수복 주형이 제공될 수 있다. 제2 가이드RNA는 CRISPR 시스템 또는 조성물의 일차 표적일 수 있다(본 명세서에서 규정된 바와 같은 치료, 진단, 낙아웃 등). 이러한 방식으로, 시스템 또는 조성물은 자가-비활성화된 것이다. 이는 Cas9와 관련하여 US2015232881A1(본 명세서의 다른 곳에서 언급된 WO2015070083 (A1)으로 공개됨)에 예시되어 있으며, Cpf1에 대해 추론될 수 있다.
Cpf1을 이용한 표적 유전자좌의 유전자 편집 또는 변경
가닥들 중 하나에서의 이중 가닥 파손 또는 단일 가닥 파손은 유리하게 편집이 발생하도록 표적 위치에 충분히 가까워야 한다. 일 구현예에서, 거리는 50 개, 100 개, 200 개, 300 개, 350 개 또는 400 개 이하의 뉴클레오티드이다. 이론에 구애되고자 하지는 않지만, 그 파손이 말단 절제 동안 엑소뉴클레아제-매개된 제거 대상인 영역 내에 있도록 하는 표적 위치에 충분히 가까워야 하는 것으로 여겨진다. 표적 위치와 파손 간의 거리가 너무 큰 경우, 돌연변이는 말단 절제 내에 포함되지 않을 수 있으며, 그에 따라 주형 핵산 서열만이 말단 절제 영역 내에서 서열을 편집하는 데 사용될 수 있음으로, 편집되지 않을 수 있다.
가이드 RNA 및 제V형 분자, 특히 Cpf1 또는 이의 오솔로그 또는 상동체, 바람직하게는 Cpf1 뉴클레아제가 HDR-매개된 편집을 유도하기 위한 목적으로 이중 가닥 파손을 유도하는 일 구현예에서, 절단 부위는 표적 위치로부터 0 내지 200 bp(예를 들어, 0 bp 내지 175 bp, 0 bp 내지 150 bp, 0 bp 내지 125 bp, 0 bp 내지 100 bp, 0 bp 내지 75 bp, 0 bp 내지 50 bp, 0 bp 내지 25 bp, 25 bp 내지 200 bp, 25 bp 내지 175 bp, 25 bp 내지 150 bp, 25 bp 내지 125 bp, 25 bp 내지 100 bp, 25 bp 내지 75 bp, 25 bp 내지 50 bp, 50 bp 내지 200 bp, 50 bp 내지 175 bp, 50 bp 내지 150 bp, 50 bp 내지 125 bp, 50 bp 내지 100 bp, 50 bp 내지 75 bp, 75 bp 내지 200 bp, 75 bp 내지 175 bp, 75 bp 내지 150 bp, 75 bp 내지 1 25 bp, 75 bp 내지 100 bp)이다. 일 구현예에서, 절단 부위는 표적 위치로부터 0 bp 내지 100 bp(예를 들어, 0 bp 내지 75 bp, 0 bp 내지 50 bp, 0 bp 내지 25 bp, 25 bp 내지 100 bp, 25 bp 내지 75 bp, 25 bp 내지 50 bp, 50 bp 내지 100 bp, 50 bp 내지 75 bp 또는 75 bp 내지 100 bp) 사이에 있다. 추가의 구현예에서, Cpf1 또는 이의 오솔로그 또는 상동체와 복합체화하는 둘 이상의 가이드 RNA는 HDR-매개된 편집을 유도하기 위한 목적을 위해 다중화된 파손을 유도하는 데 사용될 수 있다.
상동성 암은, 예를 들어 절단된 단일 가닥 오버행이 공여자 주형 내에서 상보성 영역을 찾는 것을 가능하게 하기 위하여, 말단 절제가 발생할 수 있는 영역에서 적어도 멀리 연장되어야 한다. 전체 길이는 플라스미드 크기 또는 바이러스 패키징 한계와 같은 파라미터에 의해 제한될 수 있다. 일 구현예에서, 상동성 암은 반복된 요소 내로 연장되지 않을 수 있다. 예시적인 상동성 암 길이는 적어도 50 개, 100 개, 250 개, 500 개, 750 개 또는 1000 개의 뉴클레오티드이다.
본 명세서에서 사용된 바와 같은 표적 위치는 제V형, 특히 Cpf1 또는 이의 오솔로그 또는 상동체, 바람직하게는 Cpf1 분자-의존 공정에 의해 변형된 표적 핵산 또는 표적 유전자(예를 들어, 염색체) 상의 부위를 지칭한다. 예를 들어, 표적 위치는 표적 핵산의 변형된 Cpf1 분자 절단 및 표적 위치의 주형 핵산 유도된 변형, 예를 들어 편집일 수 있다. 일 구현예에서, 표적 위치는, 하나 이상의 뉴클레오티드가 첨가된 표적 핵산 상의 2 개의 뉴클레오티드 사이의 부위, 예를 들어 인접 뉴클레오티드일 수 있다. 표적 위치는 주형 핵산에 의해 변경된, 예를 들어 편집된 하나 이상의 뉴클레오티드를 포함할 수 있다. 일 구현예에서, 표적 위치는 표적 서열(예를 들어, 가이드 RNA가 결합하는 서열) 내에 존재한다. 일 구현예에서, 표적 위치는 표적 서열(예를 들어, 가이드 RNA가 결합하는 서열)의 상류 또는 하류이다.
용어가 본 명세서에서 사용된 바와 같은, 주형 핵산은 제V형 분자, 특히 Cpf1 또는 이의 오솔로그 또는 상동체, 바람직하게는 Cpf1 분자 및 표적 위치의 구조를 변경시키기 위한 가이드 RNA 분자와 함께 사용될 수 있는 핵산 서열을 지칭한다. 일 구현예에서, 표적 핵산은 주형 핵산, 통상적으로 절단 부위(들)에서 또는 그 가까이에서 주형 핵산의 서열의 일부 또는 전부를 갖도록 변형된다. 일 구현예에서, 주형 핵산은 단일 가닥이다. 대안적인 구현예에서, 주형 핵산은 이중 가닥이다. 일 구현예에서, 주형 핵산은 DNA, 예를 들어, 이중 가닥 DNA이다. 대안적인 구현예에서, 주형 핵산은 단일 가닥 DNA이다.
일 구현예에서, 주형 핵산은 상동성 재조합에 참여함으로써 표적 위치의 구조를 변경시킨다. 일 구현예에서, 주형 핵산은 표적 위치의 서열을 변경시킨다. 일 구현예에서, 주형 핵산은 변형되거나 비-천연 발생 염기의 표적 핵산 내로의 혼입을 초래한다.
주형 서열은 표적 서열과의 파손 매개된 또는 촉매된 재조합 처리될 수 있다. 일 구현예에서, 주형 핵산은 Cpf1 매개된 절단 사건에 의해 절단된 표적 서열 상에서의 부위에 상응하는 서열을 포함할 수 있다. 일 구현예에서, 주형 핵산은 제1 Cpf1 매개된 사건에서 절단된 표적 서열 상의 제1 부위, 및 제2 Cpf1 매개된 사건에서 절단된 표적 서열 상의 제2 부위, 모두에 상응하는 서열을 포함할 수 있다.
특정 구현예에서, 주형 핵산은 번역된 서열의 코딩 서열 내에서의 변경을 초래하는 서열을 포함할 수 있으며, 예를 들어 단백질 생성물 내에서 하나의 아미노산을 또 다른 것으로 치환, 예를 들어 돌연변이체 대립형질을 야생형 대립형질로 형질전환, 야생형 대립형질을 돌연변이체 대립형질로 형질전환, 및/또는 정지 코돈의 도입, 아미노산 잔기의 삽입, 아미노산 잔기의 결실, 또는 논센스 돌연변이를 초래하는 것을 포함할 수 있다. 특정 구현예에서, 주형 핵산은 비-코딩 서열에서의 변경, 예를 들어 엑손에서의 변경 또는 5' 또는 3' 비-번역된 또는 비-전사된 영역을 초래하는 서열을 포함할 수 있다. 이러한 변경은 제어 요소, 예를 들어 프로모터, 인핸서, 및 시스-작용 또는 트랜스-작용 제어 요소에서의 변경을 포함한다.
표적 유전자에서 표적 위치와의 상동성을 갖는 주형 핵산은 표적 서열의 구조를 변경시키는 데 사용될 수 있다. 주형 서열은 원하지 않는 구조, 예를 들어 원하지 않는 또는 돌연변이체 뉴클레오티드를 변경시키는 데 사용될 수 있다. 주형 핵산은 통합된 경우, 다음을 초래하는 서열을 포함할 수 있다: 양성 제어 요소의 활성 감소; 양성 제어 요소의 활성 증가; 음성 제어 요소의 활성 감소; 음성 제어 요소의 활성 증가; 유전자의 발현을 감소; 유전자의 발현을 증가; 장애 또는 질병에 대한 내성 증가; 바이러스 침입에 대한 내성 증가; 돌연변이 편집 또는 원하지 않는 아미노산 잔기의 변경; 유전자 생성물의 생물학적 특성의 수여, 증가, 제거 또는 감소, 예를 들어 효소의 효소 활성 증가, 또는 유전자 생성물이 또 다른 분자와 상호작용하는 능력의 증가.
주형 핵산은 표적 서열의 1 개, 2 개, 3 개, 4 개, 5 개, 6 개, 7 개, 8 개, 9 개, 10 개, 11 개, 12 개 이상의 뉴클레오티드 서열에서의 변화를 초래하는 서열을 포함할 수 있다. 일 구현예에서, 주형 핵산은 길이가 20+/- 10, 30+/- 10, 40+/- 10, 50+/- 10, 60+/- 10, 70+/- 10, 80+/- 10, 90+/- 10, 100+/- 10, 1 10+/- 10, 120+/- 10, 130+/- 10, 140+/- 10, 150+/- 10, 160+/- 10, 170+/- 10, 1 80+/- 10, 190+/- 10, 200+/- 10, 210+/-10, 또는 220+/- 10 개의 뉴클레오티드일 수 있다. 일 구현예에서, 주형 핵산은 길이가 30+/-20, 40+/-20, 50+/-20, 60+/-20, 70+/- 20, 80+/-20, 90+/-20, 100+/-20, 110+/-20, 120+/-20, 130+/-20, 140+/-20, 150+/-20, 160+/-20, 170+/-20, 180+/-20, 190+/-20, 200+/-20, 210+/-20, 또는 220+/-20 개의 뉴클레오티드일 수 있다. 일 구현예에서, 주형 핵산은 길이가 10 내지 1,000, 20 내지 900, 30 내지 800, 40 내지 700, 50 내지 600, 50 내지 500, 50 내지 400, 50 내지 300, 50 내지 200, 또는 50 내지 100 개의 뉴클레오티드이다.
주형 핵산은 [5' 상동성 암]-[치환 서열]-[3' 상동성 암]의 성분을 포함한다. 상동성 암은 염색체 내로의 재조합을 제공하고, 따라서 원하지 않는 요소, 예를 들어 돌연변이 또는 특징을 대체 서열로 대체시킨다. 일 구현예에서, 상동성 암은 가장 원위의 절단 부위에 측접한다. 일 구현예에서, 5' 상동성 암의 3' 말단은 대체 서열의 5' 말단 다음의 위치이다. 일 구현예에서, 5' 상동성 암은 대체 서열의 5' 말단으로부터 적어도 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1500, 또는 2000 개의 뉴클레오티드 5'로 연장될 수 있다. 일 구현예에서, 3' 상동성 암의 5' 말단은 대체 서열의 3' 말단 다음의 위치이다. 일 구현예에서, 3' 상동성 암은 대체 서열의 3' 말단으로부터 적어도 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1500, 또는 2000 개의 뉴클레오티드 3'로 연장될 수 있다.
특정 구현예에서, 하나 또는 2 개의 상동성 암은 단축되어 특정 서열 반복 요소의 포함을 회피할 수 있다. 예를 들어, 5' 상동성 암은 단축되어 서열 반복 요소를 회피할 수 있다. 다른 구현예에서, 3' 상동성 암은 단축되어 서열 반복 요소를 회피할 수 있다. 일부 구현예에서, 5' 및 3' 개의 상동성 암 모두는 특정 서열 반복 요소 포함을 회피하기 위하여 단축될 수 있다.
Cpf1 이펙터 단백질 복합체 시스템 촉진된 비-상동성 말단 접합
특정 구현예에서, 뉴클레아제-유도된 비-상동성 말단 접합(NHEJ)은 유전자-특이적 낙아웃을 표적화하는 데 사용될 수 있다. 뉴클레아제-유도된 NHEJ는 또한 관심 유전자에서 서열을 제거(예를 들어, 결실)하는 데 사용될 수 있다. 일반적으로, NHEJ는 두 개의 말단을 함께 접합함으로써 DNA 내 이중-가닥 파손을 수복시키지만; 그러나, 일반적으로 원래 서열은 2 개의 양립성 말단이 이중-가닥 파손에 의해 형성된 것과 같이 정확하게, 완벽히 결찰되는 경우에만 회복된다. 이중-가닥 파손의 DNA 말단은 종종 효소 가공의 대상으로, 하나 또는 2 개의 가닥에서, 말단의 재접합 전에, 뉴클레오티드의 추가 또는 제거를 초래한다. 이는 NHEJ 수복의 부위에서 DNA 서열에서의 삽입 및/또는 결실(삽입결실) 돌연변이의 존재를 초래한다. 이들 돌연변이의 2/3는 통상적으로 리딩 프레임을 변경하고, 따라서 비작용성 단백질을 생산한다. 추가적으로, 리딩 프레임을 유지하지만, 상당한 양의 서열을 삽입 또는 결실시키는 돌연변이는 단백질의 작용성을 파괴할 수 있다. 이중-가닥 파손의 DNA 말단은 종종 효소 가공의 대상으로, 하나 또는 두 가닥에서, 말단의 재접합 전에, 뉴클레오티드의 추가 또는 제거를 결과로서 초래한다. 이는 NHEJ 수복의 부위에서 DNA 서열에서의 삽입 및/또는 결실(삽입결실) 돌연변이의 존재를 결과로서 초래한다. 이들 돌연변이의 2/3은 통상적으로 리딩 프레임을 변경하고, 이에 따라 비작용성 단백질을 생산한다. 추가적으로, 리딩 프레임을 유지하지만, 상당한 양의 서열을 삽입 또는 결실시키는 돌연변이는 단백질의 작용성을 파괴할 수 있다. 이는 중요한 기능적 도메인에서의 돌연변이가 단백질의 비-중요 영역에서의 돌연변이보다 덜 감내성일 것 같음에 따른 유전자좌 의존성이다. NHEJ에 의해 생성된 삽입결실 돌연변이는 성질에 있어서 예측적이지 않지만; 그러나, 소정의 파손 부위에서, 아마도 미세상동성의 작은 영역으로 인하여, 집단 내에서 특정의 삽입결실 서열이 선호되고 과잉으로 나타내어진다. 결실의 길이는 매우 광범위할 수 있으며; 가장 흔하게는 1 bp 내지 50 bp 범위이지만, 이들은 용이하게 50 bp 초과일 수 있고, 예를 들어 이는 약 100 bp 내지 200 bp 초과에 용이하게 도달할 수 있다. 삽입은 더 짧은 경향이 있으며, 종종 파손 부위 주위를 즉시 둘러싸는 서열의 짧은 복제물을 포함한다. 그러나, 큰 삽입물을 수득하는 것이 가능하며, 이 경우에, 삽입된 서열은 게놈의 기타 다른 영역 또는 세포 내 존재하는 플라스미드 DNA로 종종 추적된다.
NHEJ는 돌연변이원성 과정이기 때문에, 또한 특이적 최종 서열의 생성이 요구되지 않는 한 작은 서열 모티프를 결실하는 데 사용될 수 있다. 이중-가닥 파손이 짧은 표적 서열에 가깝게 표적화되는 경우, NHEJ 수복에 의해 유발된 결실 돌연변이는 원하지 않는 뉴클레오티드에 종종 걸쳐 이어지고, 따라서 이를 제거한다. 더욱 큰 DNA 세그먼트의 결실의 경우, 서열의 각각의 측면 상에 하나 있는, 2 개의 이중-가닥 파손의 도입은 전체 개재 서열의 제거가 있는 말단 사이에서 NHEJ를 초래할 수 있다. 이들 접근 모두는 특이적 DNA 서열을 결실시키는 데 사용될 수 있지만; NHEJ의 에러 발생이 일어나기 쉬운 성질은 수복 부위에서 여전히 삽입결실 돌연변이를 생산할 수 있다.
둘 모두의 이중 가닥 절단 제V형 분자, 특히 Cpf1 또는 이의 오솔로그 또는 상동체, 바람직하게는 Cpf1 분자 및 단일 가닥, 또는 닉카제, 제V형 분자, 특히 Cpf1 또는 이의 오솔로그 또는 상동체, 바람직하게는 Cpf1 분자가 본 명세서에 기재된 방법 및 조성물에서 사용되어 NHEJ-매개 삽입결실을 생성할 수 있다. 유전자로 표적화된 NHEJ-매개 삽입결실, 예를 들어 코딩 영역, 예를 들어 관심 유전자의 초기 코딩 영역은 관심 유전자를 낙아웃(즉, 관심 유전자의 발현을 제거)하는 데 사용될 수 있다. 예를 들어, 관심 유전자의 초기 코딩 영역은, 코딩 서열의 제1 엑손 내 또는 전사 출발 부위의 500 bp 내(예를 들어, 500 bp, 450 bp, 400 bp, 350 bp, 300 bp, 250 bp, 200 bp, 150 bp, 100 bp 또는 50 bp 미만)에 있는, 전사 출발 부위 직후의 서열을 포함한다.
가이드 RNA 및 제V형 분자, 특히 Cpf1 또는 이의 오솔로그 또는 상동체, 바람직하게는 Cpf1 뉴클레아제가 NHEJ-매개된 삽입결실을 유도하기 위한 목적의 이중 가닥 파손을 생성하는 일 구현예에서, 가이드 RNA는 표적 위치의 뉴클레오티드에 매우 인접하여 하나의 이중-가닥 파손을 위치시키도록 구성될 수 있다. 일 구현예에서, 절단 부위는 표적 위치로부터 0 bp 내지 500 bp(예를 들어, 표적 위치로부터 500 bp, 400 bp, 300 bp, 200 bp, 100 bp, 50 bp, 40 bp, 30 bp, 25 bp, 20 bp, 15 bp, 10 bp, 9 bp, 8 bp, 7 bp, 6 bp, 5 bp, 4 bp, 3 bp, 2 bp 또는 1 bp 미만) 떨어져 있을 수 있다.
제V형 분자, 특히 Cpf1 또는 이의 오솔로그 또는 상동체, 바람직하게는 Cpf1 닉카제와 복합체화하는 2 개의 가이드 RNA가 NHEJ-매개된 삽입결실을 유도하기 위한 목적을 위해 2 개의 단일 가닥 파손을 유도하는 일 구현예에서, 2 개의 가이드 RNA는 NHEJ 수복을 위해 표적 위치의 뉴클레오티드를 제공하기 위하여 2 개의 단일-가닥 파손을 위치시키도록 구성될 수 있다.
Cpf1 이펙터 단백질 복합체는 작용 이펙터를 전달할 수 있다
DNA수준에서 유전자를 돌연변이시킴으로써 발현을 영구히 제거하는, CRISPR-Cas-매개된 유전자 낙아웃과 달리, CRISPR-Cas 낙다운은 인공 전사 인자의 사용을 통해 유전자 발현의 일시적 감소를 가능하게 한다. Cpf1 단백질, 예컨대 FnCpf1 단백질의 DNA 절단 도메인 모두에서 중요 잔기를 돌연변이시키는 것(예를 들어, D917A 및 H1006A 돌연변이)은 촉매적으로 비활성인 Cpf1의 생성을 초래한다. 촉매적으로 비활성인 Cpf1은 가이드 RNA와 복합체화하고, 도메인을 표적화하는 가이드 RNA에 의해 특정된 DNA 서열에 국소화되지만, 이는 표적 DNA를 절단하지 않는다. 비활성 Cpf1 단백질, 예컨대 FnCpf1 단백질(예를 들어, D917A 및 H1006A 돌연변이)의 이펙터 도메인, 예를 들어 전사 억제 도메인으로의 융합은 이펙터의 가이드 RNA에 의해 특정된 임의의 DNA 부위로의 채용을 가능하게 한다. 특정 구현예에서, Cpf1은 전사 억제 도메인에 융합될 수 있고, 유전자의 프로모터 영역에 채용될 수 있다. 특히 유전자 억제의 경우, 내인성 전사 인자의 결합 부위를 차단하는 것은 유전자 발현을 하향조절하는 것을 보조할 것으로 본 명세서에서 고려된다. 또 다른 구현예에서, 비활성 Cpf1은 크로마틴 변형 단백질에 융합될 수 있다. 크로마틴 상태의 변경은 표적 유전자의 발현 감소를 초래할 수 있다.
일 구현예에서, 가이드 RNA 분자는 공지된 전사 반응 요소(예를 들어, 프로모터, 인핸서 등), 공지된 상류 활성화 서열, 및/또는 표적 DAN의 발현을 제어할 수 있는 것으로 의심되는 미지의 또는 공지된 작용의 서열로 표적화될 수 있다.
일부 방법에서, 표적 폴리뉴클레오티드는 비활성화되어 세포 내에서 발현의 변형을 일으킬 수 있다. 예를 들어, CRISPR 복합체의 세포 내의 표적 서열로의 결합시, 표적 폴리뉴클레오티드는 비활성화되어, 서열이 전사되지 않거나, 코딩된 단백질이 생산되지 않거나, 서열이 야생형 서열이 작용하는 것처럼 작용하지 않게 된다. 예를 들어, 단백질 또는 마이크로RNA 코딩 서열은 비활성화되어 단백질이 생산되지 않게 된다.
특정 구현예에서, CRISPR 효소는 D917A, E1006A 및 D1225A로 이루어진 군으로부터 선택되는 하나 이상의 돌연변이를 포함하고/포함하거나, 하나 이상의 돌연변이는 CRISPR 효소의 RuvC 도메인 내에 있거나, 다르게는 본 명세서에서 논의된 바와 같은 돌연변이다. 일부 구현예에서, CRISPR 효소는 촉매 도메인 내에서 하나 이상의 돌연변이를 갖고, 전사된 경우, 직접 반복부 서열은 단일 줄기 루프를 형성하고, 가이드 서열은 표적 서열로의 CRISPR 복합체의 서열-특이적 결합을 유도하며, 여기서 효소는 기능적 도메인을 추가로 포함한다. 일부 구현예에서, 기능적 도메인은 전사 활성화 도메인, 바람직하게는 VP64이다. 일부 구현예에서, 기능적 도메인은 전사 억제 도메인, 바람직하게는 KRAB이다. 일부 구현예에서, 전사 억제 도메인은 SID, 또는 SID의 연쇄체(예를 들어, SID4X)이다. 일부 구현예에서, 기능적 도메인은 후생적 변형 도메인으로, 후생적 변형 효소가 제공되도록 한다. 일부 구현예에서, 기능적 도메인은 활성화 도메인으로, 이는 P65 활성화 도메인일 수 있다.
Cpf1 이펙터 단백질 복합체 또는 이의 성분 또는 이의 성분을 인코딩하는 핵산 분자의 전달
본 개시 내용 및 당업계의 지식을 통하여, CRISPR-Cas 시스템, 구체적으로 본 명세서에 개시된 신규 CRISPR 시스템 또는 이의 성분 또는 이의 핵산 분자(예를 들어, HDR 주형을 포함함) 또는 이의 성분을 인코딩하거나 제공하는 핵산 분자는 본 명세서에서 일반적으로 그리고 상세하게 기재된 전달 시스템에 의해 전달될 수 있다.
따라서, 본원에 정의된 바와 같은 CRISPR 효소(본원의 다른 곳에 기재된 바와 같은 변형된 CRISPR 효소 중 임의의 것 포함), gRNA(본원의 다른 곳에 기재된 바와 같은 변형된 gRNA 중 임의의 것 포함)는 각각 개별적으로 조성물 내에 포함되고, 개별적으로 또는 집합적으로 숙주에 투여될 수 있다. 대안적으로, 이들 성분은 숙주에의 투여를 위해 단일 조성물로 제공될 수 있다. 숙주에의 투여는 숙련자에게 알려진 또는 본 명세서에서 설명된 숙주로의 전달을 위한 바이러스 벡터(예를 들어, 렌티바이러스 벡터, 아데노바이러스 벡터, AAV 벡터)를 통해 제공될 수 있다. 본 명세서에 설명된 바와 같이, (예를 들어, 렌티바이러스 gRNA 선택을 위한) 상이한 선별 마커 및 gRNA의 농도(예를 들어, 다수의 gNRA가 사용되었는지의 여부에 따라)의 이용은 개선된 효과의 유도를 위해 유리할 수 있다. 이러한 개념에 기초하여, 몇몇 변화들은 게놈 유전자좌에서의 이벤트, 예를 들어 DNA 절단, 유전자 활성화, 또는 유전자 탈활성화를 유도하는데 적절하다. 제공된 조성물을 이용하여, 당업자는 하나 이상의 게놈 유전자좌 이벤트를 유도하기 위해 동일하거나 상이한 기능적 도메인을 갖는 단일 또는 다수의 유전자좌를 유리하게 특이적으로 표적할 수 있다. 조성물은 세포 내 라이브러리에서의 스크리닝 및 생체 내 작용적 모델링을 위한 광범위한 방법에서 적용될 수 있다 (예를 들어, lincRNA의 유전자 활성화 및 작용의 확인; 기능 획득 모델링; 기능 손실 모델링; 최적화 및 스크리닝 목적을 위한 세포주 및 유전자이식 동물을 수립하기 위한 본 발명의 조성물의 이용).
일부 양태에서, 본 발명은 본 명세서에 기재된 바와 같은 하나 이상의 폴리뉴클레오티드, 하나 이상의 벡터, 하나 이상의 이의 전사물, 및/또는 이로부터의 하나 이상의 단백질을 숙주 세포에 전달하는 것을 포함하는 방법을 제공한다. 일부 양태에서, 본 발명은 이러한 방법에 의해 생산된 이러한 세포, 및 상기 세포를 포함하거나 상기 세포로부터 생산된 유기체(예컨대, 동물, 식물, 또는 균류)를 제공한다. 일부 구현예에서, 가이드 RNA와 조합된(및 선택적으로 이와 복합체화된) 핵산-표적화 이펙터 단백질은 세포로 전달된다. 통상의 바이러스 및 비-바이러스 기반 유전자 수송 방법이 포유동물 세포 또는 표적 조직 내로 핵산을 도입시키는 데 사용될 수 있다. 이러한 방법은 핵산-표적화 시스템의 성분을 인코딩하는 핵산을 배양물, 또는 숙주 유기체 내 세포로 투여하는 데 사용될 수 있다. 비-바이러스 벡터 전달 시스템은 DNA 플라스미드, RNA(예를 들어, 본 명세서에 기재된 벡터의 전사물), 네이키드 핵산, 및 리포좀과 같은 전달 비히클과 복합체화된 핵산을 포함한다. 바이러스 벡터 전달 시스템은 DNA 및 RNA 바이러스를 포함하며, 이는 세포로의 전달 후 에피솜 또는 통합된 게놈 중 하나를 갖는다. 유전자 치료법 절차의 검토에 대해서는, 문헌[Anderson, Science 256:808-813 (1992)]; [Nabel & Felgner, TIBTECH 11:211-217 (1993)]; [Mitani & Caskey, TIBTECH 11:162-166 (1993)]; [Dillon, TIBTECH 11:167-175 (1993)]; [Miller, Nature 357:455-460 (1992)]; [Van Brunt, Biotechnology 6(10):1149-1154 (1988)]; [Vigne, Restorative Neurology and Neuroscience 8:35-36 (1995)]; [Kremer & Perricaudet, British Medical Bulletin 51(1):31-44 (1995)]; [Haddada et al., in Current Topics in Microbiology and Immunology, Doerfler and Bohm (eds) (1995)]; 및 [Yu et al., Gene Therapy 1:13-26 (1994)]을 참조한다.
핵산의 비-바이러스 전달 방법은 리포펙션, 뉴클레오펙션, 미세주입, 바이오리스틱스, 비로좀, 리포좀, 면역리포좀, 다가양이온 또는 지질:핵산 컨쥬게이트, 네이키드 DNA, 인공 비리온, 및 DNA의 제제-향상 흡수를 포함한다. 리포펙션은, 예를 들어 미국 특허 5,049,386, 4,946,787; 및 4,897,355에 기재되어 있으며, 리포펙션 시약은 상업적으로 판매된다(예를 들어, Transfectam™ 및 Lipofectin™). 폴리뉴클레오티드의 효율적인 수용체-인식 리포펙션에 대해 적합한 양이온성 및 중성 지질은 Felgner의 WO 91/17424; WO 91/16024의 것을 포함한다. 전달은 세포(예를 들어, 시험관 내 또는 생체 외 투여) 또는 표적 조직(예를 들어, 생체내 투여)으로 이루어질 수 있다.
면역지질 복합체와 같은 표적화된 리포좀을 포함하는, 지질:핵산 복합체의 제조는 당업자에게 잘 알려져 있다(예를 들어, 문헌[Crystal, Science 270:404-410 (1995)]; [Blaese et al., Cancer Gene Ther. 2:291-297 (1995)]; [Behr et al., Bioconjugate Chem. 5:382-389 (1994)]; [Remy et al., Bioconjugate Chem. 5:647-654 (1994)]; [Gao et al., Gene Therapy 2:710-722 (1995)]; [Ahmad et al., Cancer Res. 52:4817-4820 (1992)]; 미국 특허 4,186,183, 4,217,344, 4,235,871, 4,261,975, 4,485,054, 4,501,728, 4,774,085, 4,837,028, 및 4,946,787 참조).
핵산 전달을 위한 RNA 또는 DNA 바이러스 기반 시스템의 사용은 바이러스를 체내 특정 세포로 표적화하고, 핵으로의 바이러스 페이로드(payload)를 수송하기 위한 매우 진화된 공정을 이용한다. 바이러스 벡터는 환자에게 직접(생체내) 투여될 수 있거나, 또는 이들은 시험관 내에서 세포를 처리하는 데 사용될 수 있고, 변형된 세포는 환자에게 선택적으로 투여될 수 있다(생체 외). 통상의 바이러스 기반 시스템은 유전자 운반을 위해 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 및 단순포진 바이러스 벡터를 포함할 수 있다. 숙주 게놈 내 통합은 레트로바이러스, 렌티바이러스, 및 아데노-연관 바이러스 유전자 운반 방법에서 가능하며, 이는 종종 삽입된 이식유전자의 장기간 발현을 초래한다. 추가적으로, 높은 형질도입 효능은 많은 상이한 세포 유형 및 표적 조직에서 관찰되었다.
레트로바이러스의 친화성은 외부 외피 단백질을 통합하여 변경될 수 있으며, 이는 표적 세포의 잠재적 표적 집단을 확장한다. 렌티바이러스 벡터는 비-분열 세포를 형질도입하거나 감염하고 통상적으로 높은 바이러스 역가를 생산할 수 있는 레트로바이러스 벡터이다. 그러므로, 레트로바이러스 유전자 이동 시스템의 선택은 표적 조직에 의존할 것이다. 레트로바이러스 벡터는 최대 6 kb 내지 10 kb까지의 외부 서열에 대한 패키징 능력을 갖는 시스-작용의 긴 말단 반복부로 구성된다. 최소한의 시스-작용 LTR은 벡터의 복제 및 패키징에 대하여 충분하며, 이들은 그 후 표적 세포 내로 치료적 유전자를 통합하는 데 사용되어 영구적인 이식유전자 발현을 제공한다. 널리 사용된 레트로바이러스 벡터는 뮤린 백혈병 바이러스(MuLV), 기본 유인원(gibbon ape) 백혈병 바이러스(GaLV), 원숭이 면역결핍 바이러스(SIV), 인간 면역결핍 바이러스(HIV), 및 이들의 조합을 기반으로 한 벡터를 포함한다(예를 들어, 문헌[Buchscher et al., J. Virol. 66:2731-2739 (1992)]; [Johann et al., J. Virol. 66:1635-1640 (1992)]; [Sommnerfelt et al., Virol. 176:58-59 (1990)]; [Wilson et al., J. Virol. 63:2374-2378 (1989)]; [Miller et al., J. Virol. 65:2220-2224 (1991)]; PCT/US94/05700 참조). 일시적인 발현이 바람직한 적용에서, 아데노바이러스 기반 시스템이 사용될 수 있다. 아데노바이러스 기반 벡터는 많은 세포 유형에서 매우 높은 형질도입 효율을 가능하게 하며 세포 분열을 필요로 하지 않는다. 이러한 벡터로, 높은 역가 및 발현 수준이 수득되었다. 이 벡터는 상대적으로 간단한 시스템에서 다량으로 생산될 수 있다. 아데노-연관 바이러스("AAV") 벡터는 또한, 예를 들어 핵산 및 펩티드의 시험관 내 생산에서, 그리고 생체내 및 생체 외 유전자 치료법 과정을 위해 세포를 표적 핵산으로 세포 형질도입시키는 데 사용될 수 있다(예를 들어, 문헌[West et al., Virology 160:38-47 (1987)]; 미국 특허 4,797,368; WO 93/24641; 문헌[Kotin, Human Gene Therapy 5:793-801 (1994)]; [Muzyczka, J. Clin. Invest. 94:1351 (1994)] 참조). 재조합 AAV 벡터의 구성은 미국 특허 5,173,414; 문헌[Tratschin et al., Mol. Cell. Biol. 5:3251-3260 (1985)]; [Tratschin, et al., Mol. Cell. Biol. 4:2072-2081 (1984)]; [Hermonat & Muzyczka, PNAS 81:6466-6470 (1984)]; 및 [Samulski et al., J. Virol. 63:03822-3828 (1989)]을 포함하여, 다수의 간행물에 기재되어 있다.
벡터 전달, 예를 들어 플라스미드, 바이러스 전달: CRISPR 효소, 예를 들어 Cpf1, 및/또는 본 발명의 임의의 RNA, 예를 들어 가이드 RNA는 임의의 적합한 벡터, 예를 들어 플라스미드 또는 바이러스 벡터, 예컨대 아데노 연관 바이러스(AAV), 렌티바이러스, 아데노바이러스 또는 기타 다른 바이러스 벡터 유형, 또는 이의 조합을 사용하여 전달될 수 있다. Cpf1 및 하나 이상의 가이드 RNA는 하나 이상의 벡터, 예를 들어 플라스미드 또는 바이러스 벡터 내로 패키지될 수 있다. 일부 구현예에서, 벡터, 예를 들어 플라스미드 또는 바이러스 벡터는, 예를 들어 근육내 주사에 의해 관심 조직으로 전달되는 한편, 기타 다른 경우에 전달은 정맥내, 경피, 비강내, 구강, 점막 또는 기타 다른 전달 방법을 통하여 이루어진다. 이러한 전달은 단일 용량 또는 다중 용량 중 어느 하나를 통하여 이루어질 수 있다. 당업자는, 본 명세서에서 전달되는 실제 투여량은 다양한 인자, 예컨대 벡터 선택, 표적 세포, 유기체, 또는 조직, 치료될 대상체의 일반 상태, 구하는 형질전환/변형의 정도, 투여 경로, 투여 방법, 구하는 형질전환/변형의 형태 등에 따라 크게 달라질 수 있다.
이러한 투여량은, 예를 들어 담체(물, 식염수, 에탄올, 글리세롤, 락토오스, 수크로오스, 인산칼슘, 젤라틴, 덱스트란, 한천, 펙틴, 땅콩유, 참기름 등), 희석제, 약학적으로 허용가능한 담체(예를 들어, 인산염 완충 식염수), 약학적으로 허용가능한 부형제, 및/또는 당업계에 알려진 기타 다른 화합물을 추가로 함유할 수 있다. 투여량은 하나 이상의 약학적으로 허용가능한 염, 예를 들어 무기산 염, 예컨대 염산염, 브롬화수소산염, 인산염, 황산염 등; 및 유기산 염, 예컨대 아세테이트, 프로피오네이트, 말로네이트, 벤조에이트 등을 추가로 함유할 수 있다. 추가적으로, 보조 성분, 예컨대 습윤 또는 유화제, pH 완충 성분, 겔 또는 겔화 물질, 풍미제, 착색제, 마이크로스피어, 중합체, 현탁제 등이 또한 본 명세서에서 제시될 수 있다. 추가적으로, 하나 이상의 기타 다른 통상의 약학 성분들, 예컨대 보존제, 보수제, 현탁화제, 계면활성제, 산화방지제, 케이킹방지제(anticaking agent), 충전제, 킬레이트화제, 코팅제, 화학 안정화제 등이 또한 존재할 수 있으며, 특히 투약 형태는 재구성가능한 형태이다. 적합한 예시적인 성분으로는, 미세결정성 셀룰로오스, 카르복시메틸셀룰로오스 나트륨, 폴리소르베이트 80, 페닐에틸 알코올, 클로로부탄올, 칼륨 소르베이트, 소르빈산, 이산화황, 프로필 갈레이트, 파라벤, 에틸 바닐린, 글리세린, 페놀, 파라클로로페놀, 젤라틴, 알부민 및 이의 조합을 포함한다. 약학적으로 허용가능한 부형제의 철저한 논의는 문헌[REMINGTON'S PHARMACEUTICAL SCIENCES (Mack Pub. Co., N.J. 1991)]에서 이용가능하며, 이는 본 명세서에 참고로 포함된다.
본 명세서의 일 구현예에서, 전달은 아데노바이러스를 통한 것으로, 이는 적어도 1×105 개의 입자(입자 단위, pu로서도 지칭됨)의 아데노바이러스 벡터를 함유하는 단일 부스터(booster) 용량일 수 있다. 본 명세서의 일 구현예에서, 용량은 바람직하게 적어도 약 1×106 개의 입자(예를 들어, 약 1×106 개 내지 1×1012 개 입자), 더욱 바람직하게는 적어도 약 1×107 개의 입자, 더욱 바람직하게는 적어도 약 1×108 개 이상의 입자(예를 들어, 약, 1×108 개 내지 1×1011 개 입자 또는 약 1×108 개 내지 1×1012 개 입자), 가장 바람직하게는 적어도 약 1×100 개의 입자(예를 들어, 약 1×109 개 내지 1×1010 개 입자 또는 약 1×109 개 내지 1×1012 입자), 또는 심지어 적어도 약 1×1010 개의 입자(예를 들어, 약 1×1010 개 내지 1×1012 개 입자)의 아데노바이러스 벡터이다. 대안적으로, 용량은 약 1×1014 개 이하의 입자, 바람직하게는 약 1×1013 개 이하의 입자, 훨씬 더 바람직하게는 약 1×1012 개 이하의 입자, 훨씬 더 바람직하게는 약 1×1011 개 이하의 입자, 가장 바람직하게는 약 1×1010 개 이하의 입자(예를 들어, 약 1×109 개 입자)를 포함한다. 따라서, 용량은 단일 용량의 아데노바이러스 벡터를 함유할 수 있으며, 이는 예를 들어 약 1×106 입자 단위(pu), 약 2×106 pu, 약 4×106 pu, 약 1×107 pu, 약 2×107 pu, 약 4×107 pu, 약 1×108 pu, 약 2×108 pu, 약 4×108 pu, 약 1×109 pu, 약 2×109 pu, 약 4×109 pu, 약 1×1010 pu, 약 2×1010 pu, 약 4×1010 pu, 약 1×1011 pu, 약 2×1011 pu, 약 4×1011 pu, 약 1×1012 pu, 약 2×1012 pu, 또는 약 4×1012 pu의 아데노바이러스 벡터이다. 예를 들어, 아데노바이러스 벡터에 대해, Nabel외 다수에게, 2013년 6월 4일 수여된, 미국 특허 8,454,972 B2를 참조하며, 이는 본 명세서에 참고로 포함되고, 이의 컬럼 29, 36 내지 58 줄의 투여량을 참조한다. 본 명세서의 일 구현예에서, 아데노바이러스는 다중 용량을 통해 전달된다.
본 명세서의 일 구현예에서, 전달은 AAV를 통해 이루어진다. 인간에 대한 AAV의 생체 내 전달을 위한 치료적으로 유효한 투여량은, 용액 ml 당 약 1×1010 내지 약 1×1010의 작용적 AAV를 함유하는 약 20 ml 내지 약 50 ml 범위의 식염수 용액인 것으로 여겨진다. 투여량은 임의의 부작용에 대하여 치료 이익의 균형을 맞추도록 조정될 수 있다. 본 명세서의 일 구현예에서, AAV 용량은 일반적으로 약 1×105 내지 1×1050 개의 게놈 AAV, 약 1×108 내지 1×1020 개의 게놈 AAV, 약 1×1010 내지 약 1×1016 개의 게놈, 또는 약 1×1011 내지 약 1×1016 개의 게놈 AAV의 농도 범위 내에 있다. 인간 투여량은 약 1×1013 개의 게놈 AAV이다. 이러한 농도는 약 0.001 ml 내지 약 100 ml, 약 0.05 ml 내지 약 50 ml, 또는 약 10 ml 내지 약 25 ml의 담체 용액 중에서 전달될 수 있다. 기타 다른 효과적인 투여량은 당업자에 의해, 용량 반응 곡선을 수립하는 일상적 시험을 통해 쉽게 수립될 수 있다. 예를 들어, 2013년 3월 26일 등록된 Hajjar외 다수의 미국 특허 8,404,658 B2, 27 칼럼 45 내지 60 줄을 참조한다.
본원의 일 구현예에서, 전달은 플라스미드를 통해 이루어진다. 이러한 플라스미드 조성물에서, 투여량은 반응을 유발하는 데 충분한 양의 플라스미드이어gi한다. 예를 들어, 플라스미드 조성물 중의 플라스미드 DNA의 적합한 양은 70 ㎏의 개체 당 약 0.1 ㎎ 내지 약 2 ㎎, 또는 약 1 ㎍ 내지 약 10 ㎍일 수 있다. 본 발명의 플라스미드는 일반적으로 (i) 프로모터; (ii) 상기 프로모터에 작동 가능하게 연결된 CRISPR 효소를 인코딩하는 서열; (iii) 선택 가능 마커; (iv) 복제 원점; 및 (v) (ii)에 작동 가능하게 연결되는 (ii)의 하류 전사 종결자를 포함할 것이다. 플라스미드는 또한 CRISPR 복합체의 RNA 성분을 인코딩할 수 있지만, 대신에 이들 중 하나 이상은 상이한 벡터 상에서 인코딩될 수 있다.
본 명세서의 용량은 평균 70 ㎏ 개체를 기준으로 한다. 투여 빈도는 해당 분야의 숙련된 의학적 또는 수의학적 실행자(예를 들어, 의사, 수의사) 또는 과학자의 영역 내이다. 또한, 실험에 사용된 마우스는 통상적으로 약 20 g이며, 마우스 실험으로부터 70 ㎏ 개체까지 증대될 수 있음이 주목된다.
일부 구현예에서, 본 발명의 RNA 분자는 리포좀 또는 리포펙틴 제형 등으로 전달되며, 당업자에게 잘 공지된 방법에 의해 제조될 수 있다. 이러한 방법은, 예를 들어 미국 특허 5,593,972, 5,589,466, 및 5,580,859에 기재되어 있으며, 이들 특허는 본원에 참고로 포함된다. 포유동물 세포 내로의 siRNA의 향상 및 개선된 전달을 구체적으로 목표로 하는 전달 시스템이 개발되었고(예를 들어, 문헌[Shen et al FEBS Let. 2003, 539:111-114]; [Xia et al., Nat. Biotech. 2002, 20:1006-1010]; [Reich et al., Mol. Vision. 2003, 9: 210-216]; [Sorensen et al., J. Mol. Biol. 2003, 327: 761-766]; [Lewis et al., Nat. Gen. 2002, 32: 107-108] 및 [Simeoni et al., NAR 2003, 31, 11: 2717-2724] 참조), 본 발명에 적용될 수 있다. siRNA는 최근에 영장류에서 유전자 발현의 억제를 위해 성공적으로 사용되었다(예를 들어, 또한 본 발명에 적용될 수 있는 문헌[Tolentino et al., Retina 24(4):660] 참조).
실제로, RNA 전달은 생체내 전달의 유용한 방법이다. 리포좀 또는 나노입자를 사용하여 Cpf1 및 gRNA(예를 들어, HR 수복 주형)를 세포 내로 전달할 수 있다. 따라서, Cpf1과 같은 CRISPR 효소의 전달 및/또는 본 발명의 RNA의 전달은 RNA 형태로, 그리고 미세소포, 리포좀 또는 입자 또는 나노입자를 통해 이루어질 수 있다. 예를 들어, Cpf1 mRNA 및 gRNA는 생체내 전달을 위해 리포좀 입자 내로 패키징될 수 있다. Life Technologies로부터의 리포펙타민(Lipofectamine)과 같은 리포좀 트랜스펙션 시약 및 시판 중인 기타 다른 시약은 RNA 분자를 간에 효과적으로 전달할 수 있다.
RNA의 전달 수단은 또한 바람직하게는 입자 또는 입자(문헌[Cho, S., Goldberg, M., Son, S., Xu, Q., Yang, F., Mei, Y., Bogatyrev, S., Langer, R. and Anderson, D., Lipid-like nanoparticles for small interfering RNA delivery to endothelial cells, Advanced Functional Materials, 19: 3112-3118, 2010]) 또는 엑소좀(문헌[Schroeder, A., Levins, C., Cortez, C., Langer, R., and Anderson, D., Lipid-based nanotherapeutics for siRNA delivery, Journal of Internal Medicine, 267: 9-21, 2010, PMID: 20059641])을 통한 RNA의 전달을 포함한다. 실제로, 엑소좀은 CRISPR 시스템과 조금 유사한 시스템인 전달 siRNA에서 특히 유용한 것으로 나타났다. 예를 들어, El-Andaloussi S외 다수(문헌["Exosomes-mediated delivery of siRNA in vitro and in vivo." Nat Protoc. 2012 Dec;7(12):2112-26. doi: 10.1038/nprot.2012.131. Epub 2012 Nov 15.])은 엑소좀이 상이한 생물학적 장벽을 가로질러 약물을 전달하기 위한 촉망받는 도구가 되고 시험관 내 및 생체내에서 siRNA의 전달을 위해 이용될 수 있는 방법을 기재한다. 이들의 접근법은 펩티드 리간드와 융합된 엑소좀 단백질을 포함하여, 발현 벡터의 트랜스펙션을 통해 표적화된 엑소좀을 생성하는 것이다. 이어서, 엑소좀은 트랜스펙션된 세포 상청액으로부터 정제 및 특성화된 다음, RNA는 엑소좀에 로딩된다. 본 발명에 따른 전달 또는 투여는 엑소좀을 이용하여, 특히 비제한적으로 뇌로 실행될 수 있다. 비타민 E(α-토코페롤)는 CRISPR Cas와 컨쥬게이트될 수 있고, 예를 들어 뇌에 짧은 간섭 RNA(siRNA)를 전달하기 위해 Uno외 다수(문헌[HUMAN GENE THERAPY 22:711-719 (June 2011)])에 의해 행해지는 것과 유사한 방식으로 고밀도 지단백질(HDL)과 함께 뇌에 전달될 수 있다. 마우스에 인산염 완충 식염수(PBS) 또는 유리 TocsiBACE 또는 Toc-siBACE/HDL이 충전되고, 뇌 주입 키트 3(Brain Infusion Kit 3)(Alzet)과 연결된 삼투 미니펌프(Osmotic minipump)(모델 1007D; Alzet, 미국 캘리포니아주 쿠퍼티노 소재)를 통해 주입하였다. 뇌 주입 캐뉼라를 등쪽의 제3 뇌실 내로의 주입을 위해 중앙에서 브레그마(bregma)보다 약 0.5 mm 뒤에 위치시켰다. Uno외 다수는 HDL과 함께 3 nmol만큼 적은 Toc-siRNA가 동일한 ICV 주입 방법에 의해 유사한 정도로 표적 감소를 유도할 수 있었다는 것을 발견하였다. α-토코페롤에 컨쥬게이트되고 뇌에 표적화된 HDL과 동시-투여되는 유사한 투여량의 CRISPR Cas가 본 발명에서 인간에 대해 고려될 수 있으며, 예를 들어 뇌에 표적화된 약 3 nmol 내지 약 3 μmol의 CRISPR Cas가 고려될 수 있다. Zou외 다수(문헌[HUMAN GENE THERAPY 22:465-475 (April 2011)])는 래트의 척수에서 생체내 유전자 침묵화를 위한 PKCγ를 표적화하는 짧은 헤어핀 RNA의 렌티바이러스-매개의 전달 방법을 기재한다. Zou외 다수는 척추강내 카테터에 의해 1 × 109 형질도입 단위(TU)/㎖의 역가를 갖는 재조합 렌티바이러스 약 10 ㎕를 투여하였다. 뇌에 표적화된 렌티바이러스 벡터에서 발현된 유사한 투여량의 CRISPR Cas가 본 발명에서 인간에 대해 고려될 수 있으며, 예를 들어 1 × 109 형질도입 단위(TU)/㎖의 역가를 갖는 렌티바이러스에서 뇌에 표적화된 약 10 ㎖ 내지 50 ㎖의 CRISPR Cas가 고려될 수 있다.
뇌로의 국소 전달에 관하여, 이는 다양한 방법으로 달성될 수 있다. 예를 들어, 물질은, 예를 들어 주사에 의해 선상체 내로 전달될 수 있다. 주사는 개두술을 통해 정위적으로 실행될 수 있다.
NHEJ 또는 HR 효율을 향상시키는 것은 또한 전달에 도움을 준다. NHEJ 효율은 Trex2와 같은 최종 가공 효소를 동시발현시킴으로써 향상되는 것이 바람직하다(문헌[Dumitrache et al. Genetics. 2011 August; 188(4): 787-797]). HR 효율은 Ku70 및 Ku86과 같은 NHEJ 기구를 일시적으로 억제함으로써 증가되는 것이 바람직하다. HR 효율은 또한 RecBCD, RecA와 같은 원핵 또는 진핵 상동성 재조합 효소를 동시발현시킴으로써 증가될 수 있다.
패키징 및 프로모터
생체내에서 게놈 변형을 매개하기 위해 본 발명의 Cpf1 코딩 핵산 분자, 예를 들어 DNA를 벡터, 예를 들어 바이러스 벡터 내로 패키징하는 방법은 다음을 포함한다:
● NHEJ-매개 유전자 낙아웃을 달성하기 위한 것:
● 단일 바이러스 벡터:
● 2 개 이상의 발현 카세트를 함유하는 벡터:
● 프로모터-Cpf1 코딩 핵산 분자 -종결자
● 프로모터-gRNA1-종결자
● 프로모터-gRNA2-종결자
● 프로모터-gRNA(N)-종결자(벡터의 크기 제한까지)
● 이중 바이러스 벡터:
● Cpf1의 발현을 유도하기 위한 하나의 발현 카세트를 함유하는 벡터 1
● 프로모터-Cpf1 코딩 핵산 분자-종결자
● 하나 이상의 가이드RNA의 발현을 유도하기 위한 하나 이상의 발현 카세트를 함유하는 벡터 2
● 프로모터-gRNA1-종결자
● 프로모터-gRNA(N)-종결자(벡터의 크기 제한까지)
● 상동성-유도 수복을 매개하는 것.
● 상기 기재한 단일 및 이중 바이러스 벡터 접근에 더하여, 추가적인 벡터를 사용하여 상동성-유도 수복 주형을 전달할 수 있다.
Cpf1 코딩 핵산 분자 발현을 유도하기 위해 사용되는 프로모터는 다음을 포함할 수 있다:
- AAV ITR은 프로모터로서 작용할 수 있다: 이는 추가적인 프로모터 요소(벡터 내 공간을 차지할 수 있음)에 대한 필요를 없애는데 유리하다. 추가적인 비어 있는 공간은 추가적인 요소(gRNA 등)의 발현을 유도하는 데 사용될 수 있다. 또한, ITR 활성은 상대적으로 더 약하고, 따라서 Cpf1의 과발현에 기인하는 잠재적인 독성을 감소시키기 위해 사용될 수 있다.
- 편재하는 발현을 위해, 사용될 수 있는 프로모터는 CMV, CAG, CBh, PGK, SV40, 페리틴 중쇄 또는 경쇄 등을 포함한다.
뇌 또는 기타 다른 CNS 발현에서, 프로모터: 모든 뉴런에 대해 시냅신I, 흥분성 뉴런에 대해 CaMKII알파, GABAergic 뉴런에 대해 GAD67 또는 GAD65 또는 VGAT 등을 사용할 수 있다. 간 발현에서, 알부민 프로모터를 사용할 수 있다. 폐 발현에서, SP-B를 사용할 수 있다. 내피 세포에서, ICAM을 사용할 수 있다. 조혈 세포에서 IFN베타 또는 CD45를 사용할 수 있다. 조골세포에서 OG-2를 사용할 수 있다.
가이드 RNA를 유도하기 위해 사용되는 프로모터는 다음을 포함할 수 있다:
- U6 또는 H1과 같은 Pol III 프로모터.
- gRNA를 발현시키기 위한 Pol II 프로모터 및 인트론 카세트의 사용.
아데노 연관 바이러스(AAV)
Cpf1 및 하나 이상의 가이드 RNA는 아데노 연관 바이러스(AAV), 렌티바이러스, 아데노바이러스 또는 기타 다른 플라스미드 또는 바이러스 벡터 유형을 사용하여, 특히, 예를 들어, 미국 특허 8,454,972(아데노바이러스에 대한 제형, 용량), 8,404,658(AAV에 대한 제형, 용량) 및 5,846,946(DNA 플라스미드에 대한 제형, 용량)으로부터의 제형 및 용량, 및 렌티바이러스, AAV 및 아데노바이러스를 수반하는 임상 시험 및 임상 시험에 관한 간행물로부터의 제형 및 용량을 사용하여 전달될 수 있다. 예를 들어, AAV에 대해, 투여 경로, 제형 및 용량은 미국 특허 8,454,972에서와 같고, AAV를 수반하는 임상 시험에서와 같을 수 있다. 아데노바이러스에 대해, 투여 경로, 제형 및 용량은 미국 특허 8,404,658에서와 같을 수 있고 아데노바이러스를 수반하는 임상 시험에서와 같을 수 있다. 플라스미드 전달에 대해, 투여 경로, 제형 및 용량은 미국 특허 5,846,946에서와 같고, 플라스미드를 수반하는 임상 연구에서와 같을 수 있다. 용량은 평균 70 kg 개체(예를 들어, 성인 남성)를 기준으로 하거나 또는 이로 추정될 수 있고, 상이한 체중 및 종의 환자, 대상체, 포유동물에 대해 조정될 수 있다. 투여 빈도는 환자 또는 대상체의 연령, 성별, 일반적 건강상태, 기타 다른 질환 및 다루어질 특정 질환 또는 증상을 포함하는 보통의 인자에 따라서 의학적 또는 수의학적 실행자(예를 들어, 의사, 수의사)의 영역 내에 있다. 바이러스 벡터는 관심 조직 내에 주사될 수 있다. 세포 유형 특이적 게놈 변형을 위해, Cpf1의 발현은 세포 유형 특이적 프로모터에 의해 유도될 수 있다. 예를 들어, 간 특이적 발현은 알부민 프로모터를 사용할 수 있고, 뉴런 특이적 발현(예를 들어, CNS 장애를 표적화하기 위함)은 시냅신 I 프로모터를 사용할 수 있다.
생체내 전달에 관하여, AAV는 몇 가지 이유로 기타 다른 바이러스 벡터에 비하여 유리하다:
낮은 독성(이것은 면역 반응을 활성화시킬 수 있는 세포 입자의 초원심분리를 필요로 하지 않는 정제 방법 때문일 수 있음);
숙주 게놈 내로 통합하지 않기 때문에 삽입 돌연변이유발을 야기할 확률이 낮음.
AAV는 4.5 Kb 또는 4.75 Kb의 패키징 제한을 갖는다. 이는 Cpf1뿐만 아니라 프로모터 및 전사 종결자가 모두 동일한 바이러스 벡터에 핏팅되어야 함을 의미한다. 4.5 Kb 또는 4.75 Kb보다 큰 작제물은 상당히 감소된 바이러스 생산을 야기할 것이다. SpCas9는 상당히 크며, 유전자 그 자체가 4.1 Kb가 넘는데, 이는 그것이 AAV 내로 패키징되는 것을 어렵게 만든다. 따라서 본 발명의 구현예는 더 짧은 Cpf1의 상동체를 이용하는 것을 포함한다.
AAV에 관해서, AAV는 AAV1, AAV2, AAV5 또는 이들의 임의의 조합일 수 있다. 표적화될 세포에 관한 AAV의 AAV를 선택할 수 있고; 예를 들어, 뇌 또는 뉴런 세포를 표적화하기 위하여 AAV 혈청형 1, 2, 5 또는 하이브리드 캡시드 AAV1, AAV2, AAV5 또는 이들의 임의의 조합을 선택할 수 있으며; 심장 조직을 표적화하기 위하여 AAV4를 선택할 수 있다. AAV8은 간으로의 전달에 유용하다. 본 명세서의 프로모터 및 벡터는 개별적으로 바람직하다. 이들 세포에 관한 특정 AAV 혈청형의 표 작성(문헌[Grimm, D. et al, J. Virol. 82: 5887-5911 (2008)] 참조)은 하기와 같다:
Figure pat00017
렌티바이러스
렌티바이러스는 유사분열과 유사분열 후 세포 둘 다에서 그들의 유전자를 감염 및 발현시키는 능력을 갖는 복합 레트로바이러스이다. 가장 흔히 알려진 렌티바이러스는 광범위한 세포 유형을 표적화하기 위해 기타 다른 바이러스의 외피 당단백질을 사용하는 인간 면역결핍 바이러스(HIV)이다.
렌티바이러스는 다음과 같이 제조될 수 있다. (렌티바이러스 전달 플라스미드 백본을 함유하는) pEFF03 Lenti AsDR huLbCpf1의 클로닝 후에, 낮은 계대(p=5)에서 HEK293FT를 10% 우태아혈청이 있고 항생제가 없는 DMEM 중의 트랜스펙션 전날에 50% 컨플루언스(confluence)까지 T-75 플라스크에 씨딩하였다. 20시간 후에, 배지를 OptiMEM(무혈청) 배지로 바꾸고, 4 시간 후에 트랜스펙션을 행하였다. 세포를 10 ㎍의 렌티바이러스 전달 플라스미드(pCasES10), 및 5 ㎍의 pMD2.G(VSV-g 위형), 및 7.5 ㎍의 psPAX2(gag/pol/rev/tat)의 패키징 플라스미드를 이용하여 트랜스펙션시켰다. 양이온성 지질 전달제(50 ㎕ 리포펙타민 2000 및 100 ㎕ 플러스(Plus) 시약)를 이용하여 4 ㎖ OptiMEM 중에서 트랜스펙션을 행하였다. 6 시간 후, 배지를 10% 우태아혈청이 있는 무항생제 DMEM으로 바꾸었다. 이들 방법은 세포 배양 동안 혈청을 사용하지만, 무혈청 방법이 바람직하다.
렌티바이러스는 다음과 같이 정제될 수 있다. 바이러스 상청액을 48 시간 후에 수집하였다. 상청액을 먼저 데브리스(debris)를 없애고, 0.45 ㎛ 저 단백질 결합(PVDF) 필터를 통해 여과시켰다. 이어서, 이들을 24,000 rpm에서 2 시간 동안 초원심분리기에서 회전시켰다. 바이러스 펠렛을 4C에서 밤새 50 ㎕의 DMEM 중에서 재현탁화시켰다. 이어서 이들을 분주하고 즉시 -80℃에서 즉시 동결시켰다.
또 다른 구현예에서, 말 감염성 빈혈 바이러스(equine infectious anemia virus; EIAV)에 기반한 최소 비-영장류 렌티바이러스 벡터는 또한, 특히 눈 유전자 치료법을 위해 고려된다(예를 들어, 문헌[Balagaan, J Gene Med 2006; 8: 275 - 285] 참조). 또 다른 구현예에서, RetinoStat®, 망(web) 형태의 노인성 황반변성의 치료를 위한 망막하 주사를 통해 전달되는 혈관신생억제 단백질 엔도스타틴 및 앤지오스타틴을 발현시키는 말 감염성 빈혈 바이러스-기반의 렌티바이러스 유전자 치료법 벡터가 또한 고려되며(예를 들어, 문헌[Binley et al., HUMAN GENE THERAPY 23:980-991 (September 2012)]), 이러한 벡터는 본 발명의 CRISPR-Cas 시스템을 위해 변형될 수 있다.
또 다른 구현예에서, HIV tat/rev에 의해 공유되는 공통 엑손을 표적화하는 siRNA, 핵소체-국소화 TAR 데코이(decoy), 및 항-CCR5-특이적 해머헤드(hammerhead) 리보자임을 이용하는 자가-불활성화 렌티바이러스 벡터(예를 들어, 문헌[DiGiusto et al. (2010) Sci Transl Med 2:36ra43] 참조)가 본 발명의 CRISPR-Cas 시스템에 대해 사용되고/사용되거나 적합하게 될 수 있다. 최소 2.5 × 106 개 CD34+ 세포/킬로그램(환자의 체중)을 수집하고, 2 × 106 개 세포/㎖의 밀도에서 2 μmol/L-글루타민, 줄기 세포 인자(100 ng/㎖), Flt-3 리간드(Flt-3L)(100 ng/㎖), 및 트롬보포이에틴(10 ng/㎖)(CellGenix)을 함유하는 X-VIVO 15 배지(Lonza))에서 16 시간 내지 20 시간 동안 사전자극할 수 있다. 사전자극된 세포는 피브로넥틴(25 ㎎/㎠)으로 코팅된 75-㎠ 조직 배양 플라스크에서 16 시간 내지 24 시간 동안 감염다중도 5로 렌티바이러스에 의해 형질도입될 수 있다(RetroNectin, Takara Bio Inc.).
렌티바이러스 벡터는 파킨슨병의 치료에서와 같이 개시되었으며, 예를 들어 미국 특허 공개 20120295960 및 미국 특허 7303910 및 7351585를 참조한다. 렌티바이러스 벡터는 또한 안질환의 치료용으로 개시되었으며, 예를 들어 미국 특허 공개 20060281180, 20090007284, US20110117189; US20090017543; US20070054961, US20100317109를 참조한다. 렌티바이러스 벡터는 또한 뇌에 대한 전달용으로 개시되었으며, 예를 들어 미국 특허 공개 US20110293571; US20110293571, US20040013648, US20070025970, US20090111106 및 미국 특허 US7259015를 참조한다.
RNA 전달
RNA 전달: CRISPR 효소, 예를 들어 Cpf1, 및/또는 본 발명의 임의의 RNA, 예를 들어 가이드 RNA는 또한 RNA의 형태로 전달될 수 있다. Cpf1 mRNA는 시험관 내 전사를 사용하여 생성될 수 있다. 예를 들어, Cpf1 mRNA는 다음의 요소를 함유하는 PCR 카세트를 사용하여 합성될 수 있다: 베타 글로빈-폴리A 테일(120 개 이상의 아데닌의 스트링(string))로부터의 T7_프로모터-코작 서열(GCCACC)-Cas9-3' UTR. 카세트는 T7 중합효소에 의한 전사를 위해 사용될 수 있다. 가이드 RNA는 또한 T7_프로모터-GG-가이드 RNA 서열을 함유하는 카세트로부터의 시험관 내 전사를 사용하여 전사될 수 있다.
발현을 향상시키고 가능한 독성을 감소시키기 위해, CRISPR 효소-코딩 서열 및/또는 가이드 RNA는, 예를 들어 슈도-U 또는 5-메틸-C를 사용하여 하나 이상의 변형된 뉴클레오시드를 포함하도록 변형될 수 있다.
mRNA 전달 방법은 현재 간 전달용으로 특히 촉망된다.
RNA 전달에 대한 많은 임상적 연구는 RNAi 또는 안티센스에 집중되어 있으나, 이들 시스템은 본 발명을 이행하기 위하여 RNA의 전달에 적합하게 될 수 있다. 따라서, RNAi 등에 대한 하기의 참고문헌을 확인해야 한다.
입자 전달 시스템 및/또는 제형:
여러 유형의 입자 전달 시스템 및/또는 제형은 다양한 범위의 생체의학 적용에서 유용하다고 알려져 있다. 일반적으로, 입자는 이의 운반 및 특성에 대해서 전체 유닛으로서 거동하는 작은 물체로서 규정된다. 입자는 직경에 따라서 추가로 분류된다. 조립 입자는 2,500 나노미터 내지 10,000 나노미터 사이의 범위를 망라한다. 미세 입자는 100 나노미터 내지 2,500 나노미터 사이의 크기이다. 초미세 입자, 또는 나노입자는 일반적으로 1 나노미터 내지 100 나노미터 크기 사이이다. 100-nm 한계의 근거는 벌크 물질로부터 입자를 구별하는 신규한 특성이 통상적으로 100 nm 미만의 역치 길이 규모에서 발생한다는 사실이다.
본원에서 사용된 바와 같이, 입자 전달 시스템/제형은 본 발명에 따른 입자를 포함하는 임의의 생물학적 전달 시스템/제형으로서 규정된다. 본 발명에 따른 입자는 100 미크론(㎛) 미만의 가장 큰 크기(예를 들어, 직경)를 갖는 임의의 개체(entity)이다. 일부 구현예에서, 본 발명의 입자는 10 ㎛ 미만의 가장 큰 치수를 갖는다. 일부 구현예에서, 본 발명의 입자는 2000 나노미터(nm) 미만의 가장 큰 치수를 갖는다. 일부 구현예에서, 본 발명의 입자는 1000 나노미터(nm) 미만의 가장 큰 치수를 갖는다. 일부 구현예에서, 본 발명의 입자는 900 nm, 800 nm, 700 nm, 600 nm, 500 nm, 400 nm, 300 nm, 200 nm, 또는 100 nm 미만의 가장 큰 치수를 갖는다. 통상적으로, 본 발명의 입자는 500 nm 이하의 가장 큰 치수(예를 들어, 직경)를 갖는다. 일부 구현예에서, 본 발명의 입자는 250 nm 이하의 가장 큰 치수(예를 들어, 직경)를 갖는다. 일부 구현예에서, 본 발명의 입자는 200 nm 이하의 가장 큰 치수(예를 들어, 직경)를 갖는다. 일부 구현예에서, 본 발명의 입자는 150 nm 이하의 가장 큰 치수(예를 들어, 직경)를 갖는다. 일부 구현예에서, 본 발명의 입자는 100 nm 이하의 가장 큰 치수(예를 들어, 직경)를 갖는다. 더 작은 입자, 예를 들어 50 nm 이하의 가장 큰 치수를 갖는 더 작은 입자가 본 발명의 일부 구현예에서 사용된다. 일부 구현예에서, 본 발명의 입자는 25 nm 및 200 nm 사이 범위의 가장 큰 치수를 갖는다.
입자 특성화(예를 들어, 형태, 치수 등의 특성화를 포함함)는 상이한 기법을 사용하여 수행된다. 일반적인 기법은 전자 현미경검사법(TEM, SEM), 원자력 현미경검사법(AFM), 동적 광 산란(DLS), X-선 광전자 분광법(XPS), 분말 X-선 회절(XRD), 푸리에 형질전환 적외선 분광광도법(FTIR), 매트릭스-보조 레이저 탈착/이온화 비행시간형 질량 분석기(MALDI-TOF), 자외선-가시 분광법, 이중 분극 간섭계 및 핵 자기 공명(NMR)이다. 특성화(치수 측정)는 본 발명의 임의의 시험관 내, 생체 외 및/또는 생체내 적용을 위한 전달에 있어서 최적인 크기의 입자를 제공하기 위해 고유 입자(즉, 로딩 이전)에 대해 또는 카고(cargo)의 로딩 후(본원에서 카고는, 예를 들어, 하나 이상의 성분의 CRISPR-Cas 시스템, 예를 들어, CRISPR 효소 또는 mRNA 또는 가이드 RNA, 또는 이들의 임의의 조합을 지칭하며, 추가적인 담체 및/또는 부형제를 포함할 수 있음)에 이루어질 수 있다. 바람직한 특정 구현예에서, 입자 치수(예를 들어, 직경) 특성화는 동적 레이저 산란(DLS)을 사용한 측정을 기반으로 한다. 입자, 이들을 제조하고 사용하는 방법 및 이들의 측정과 관련하여 미국 특허 8,709,843; 미국 특허 6,007,845; 미국 특허 5,855,913; 미국 특허 5,985,309; 미국 특허 5,543,158; 및 2014년 5월 11일에 온라인 공개된 간행물(James E. Dahlman and Carmen Barnes et al. Nature Nanotechnology (2014), doi:10.1038/nnano.2014.84)이 언급된다.
본 발명의 범주 내의 입자 전달 시스템은 고체, 반고체, 에멀젼 또는 콜로이드 입자를 포함하지만 이에 제한되지 않는 임의의 형태로 제공될 수 있다. 예를 들어, 지질-기반 시스템, 리포좀, 미셀, 미세소포, 엑소좀, 또는 유전자총을 포함하지만 이에 제한되지는 않는 본 명세서에 기재된 전달 시스템 중 임의의 전달 시스템이 본 발명의 범주 내의 입자 전달 시스템으로서 제공될 수 있다.
입자
본 명세서에서 입자 또는 나노입자에 대한 언급은 적절한 경우 상호교환적일 수 있음이 이해될 것이다. CRISPR 효소 mRNA 및 가이드 RNA는 입자 또는 지질 외피를 사용하여 동시에 전달될 수 있으며; 예를 들어, 복합체로서, 예를 들어 CRISPR 효소 및 본 발명의 RNA는 문헌[Dahlman et al., WO2015089419 A2] 및 거기서 인용된 문헌들에서와 같이 입자, 예컨대 7C1(예를 들어, 문헌[James E. Dahlman and Carmen Barnes et al. Nature Nanotechnology (2014), 2014년 5월 11일 온라인 발행, doi:10.1038/nnano.2014.84])을 통해, 예를 들어 지질 또는 리피도이드(lipidoid) 및 친수성 중합체, 예를 들어 양이온성 지질 및 친수성 중합체를 포함하는 전달 입자를 통해 전달될 수 있으며, 예를 들어 양이온 지질은 1,2-디올레일-3-트리메틸암모늄-프로판(DOTAP) 또는 1,2-디테트라데카노일-sn-글리세로-3-포스포콜린(DMPC)을 포함하고/포함하거나, 여기서 친수성 중합체는 에틸렌 글리콜 또는 폴리에틸렌 글리콜(PEG)을 포함하고/포함하거나; 여기서 입자는 콜레스테롤을 추가로 포함하고(예를 들어, 제형 1 = DOTAP 100, DMPC 0, PEG 0, 콜레스테롤 0; 제형 번호 2 = DOTAP 90, DMPC 0, PEG 10, 콜레스테롤 0; 제형 번호 3 = DOTAP 90, DMPC 0, PEG 5, 콜레스테롤 5로부터의 입자), 여기서 입자는 효율적인 다단계 공정을 사용하여 형성되며, 여기서 먼저 이펙터 단백질 및 RNA는 함께, 예를 들어 1:1의 몰 비로, 예를 들어 실온에서, 예를 들어 30 분 동안, 예를 들어 멸균 무-뉴클레아제 1X PBS 중에서 혼합되고; 별도로 제형에 대해 적용가능함에 따라 DOTAP, DMPC, PEG, 및 콜레스테롤을 알코올, 예를 들어 100% 에탄올에 용해시키고; 2 개의 용액을 함께 혼합하여 복합체를 함유하는 입자를 형성한다.
핵산 및 표적화 단백질(예컨대, Cpf1과 같은 제V형 단백질) mRNA 및 가이드 RNA는 입자 또는 지질 외피를 사용하여 동시에 전달될 수 있다.
예를 들어, 문헌[Su X, Fricke J, Kavanagh DG, Irvine DJ ("In vitro and in vivo mRNA delivery using lipid-enveloped pH-responsive polymer nanoparticles" Mol Pharm. 2011 Jun 6;8(3):774-87. doi: 10.1021/mp100390w. Epub 2011 Apr 1)]은 인지질 이중층 쉘에 의해 둘러싸인 폴리(β-아미노 에스테르)(PBAE) 코어를 지니는 생분해성 코어-쉘 구조의 나노입자를 기재한다. 이들은 생체내 mRNA 전달을 위해 개발되었다. pH-반응성 PBAE 성분은 엔도솜 파괴를 촉진하도록 선택되는 한편, 지질 표면층은 다가양이온 코어의 독성을 최소화하도록 선택되었다. 따라서 이러한 것은 본 발명의 RNA를 전달하는 데 바람직하다.
일 구현예에서, 모두 뇌로의 펩티드의 구강 전달, 펩티드의 정맥내 전달 및 펩티드의 비강 전달에 적용될 수 있는 생접착성 중합체의 자가 조립에 기반한 입자/나노입자가 고려된다. 다른 구현예, 예컨대 소수성 약물의 구강 흡수 및 눈 전달이 또한 고려된다. 분자 외피 기술은 보호되고, 질병의 부위에 전달되는 조작된 중합체 외피를 수반한다(예를 들어, 문헌[Mazza, M. et al. ACSNano, 2013. 7(2): 1016-1026]; [Siew, A., et al. Mol Pharm, 2012. 9(1):14-28]; [Lalatsa, A., et al. J Contr Rel, 2012. 161(2):523-36]; [Lalatsa, A., et al., Mol Pharm, 2012. 9(6):1665-80]; [Lalatsa, A., et al. Mol Pharm, 2012. 9(6):1764-74]; [Garrett, N.L., et al. J Biophotonics, 2012. 5(5-6):458-68]; [Garrett, N.L., et al. J Raman Spect, 2012. 43(5):681-688]; [Ahmad, S., et al. J Royal Soc Interface 2010. 7:S423-33]; [Uchegbu, I.F. Expert Opin Drug Deliv, 2006. 3(5):629-40]; [Qu, X.,et al. Biomacromolecules, 2006. 7(12):3452-9] 및 [Uchegbu, I.F., et al. Int J Pharm, 2001. 224:185-199] 참조). 표적 조직에 따라, 약 5 ㎎/kg 용량의 단일 또는 다중 용량이 고려된다.
일 구현예에서, MIT의 Dan Anderson 연구소에 의해 개발된 종양 성장을 중단시키기 위해 암 세포에 RNA를 전달할 수 있는 입자/나노입자가 본 발명의 CRISPR Cas 시스템에 대해 사용되고/사용되거나 적합하게 될 수 있다. 특히, Anderson 연구소는 새로운 생체재료 및 나노제형의 합성, 정제, 특성화 및 제형화를 위한 완전히 자동화된 조합 시스템을 개발하였다. 예를 들어, 문헌[Alabi et al., Proc Natl Acad Sci U S A. 2013 Aug 6;110(32):12881-6]; [Zhang et al., Adv Mater. 2013 Sep 6;25(33):4641-5]; [Jiang et al., Nano Lett. 2013 Mar 13;13(3):1059-64]; [Karagiannis et al., ACS Nano. 2012 Oct 23;6(10):8484-7]; [Whitehead et al., ACS Nano. 2012 Aug 28;6(8):6922-9] 및 [Lee et al., Nat Nanotechnol. 2012 Jun 3;7(6):389-93]을 참조한다.
미국 특허 출원 20110293703은 또한 본 발명의 CRISPR Cas 시스템을 전달하기 위해 적용될 수 있는 폴리뉴클레오티드의 투여에서 특히 유용한 리피도이드 화합물에 관한 것이다. 일 양태에서, 아미노알코올 리피도이드 화합물은 작용제와 병용되어 세포 또는 대상체에게 전달되어 마이크로입자, 나노입자, 리포좀, 또는 미셀을 형성한다. 입자, 리포좀 또는 미셀에 의해 전달될 작용제는 기체, 액체 또는 고체의 형태일 수 있고, 작용제는 폴리뉴클레오티드, 단백질, 펩티드 또는 소분자일 수 있다. 미노알코올 리피도이드 화합물은 기타 다른 아미노알코올 리피도이드 화합물, 중합체(합성 또는 천연), 계면활성제, 콜레스테롤, 탄수화물, 단백질, 지질 등과 조합되어 입자를 형성할 수 있다. 이어서 이들 입자는 선택적으로 약학적 부형제와 조합되어 약학적 조성물을 형성할 수 있다.
미국 특허 공개 20110293703은 또한 아미노알코올 리피도이드 화합물의 제조 방법을 제공한다. 1 이상의 당량의 아민을 본 발명의 아미노알코올 리피도이드 화합물을 형성하기에 적합한 조건 하에서 에폭시드-말단 화합물의 1 당량 이상과 반응되게 한다. 특정 구현예에서, 아민의 모든 아미노기는 에폭시드-말단 화합물과 완전히 반응되어 3차 아민을 형성한다. 다른 구현예에서, 아민의 모든 아미노기는 3차 아민을 형성하기 위하여 에폭시드-말단 화합물과 완전히 반응되지 않으며, 이에 의해 아미노알코올 리피도이드 화합물에서 1차 또는 2차 아민이 초래된다. 이들 1차 또는 2차 아민은 그대로 남아 있거나, 또 다른 친핵체, 예컨대 상이한 에폭시드-말단 화합물과 반응할 수 있다. 당업자에 의해 인식될 바와 같이, 아민을 과량 미만의 에폭시드-말단 화합물과 반응시키는 것은 다양한 수의 테일을 지니는 복수의 상이한 아미노알코올 리피도이드 화합물을 초래할 것이다. 특정 아민은 2 개의 에폭시드 유래 화합물 테일로 완전히 작용화될 수 있는 반면, 기타 다른 분자는 에폭시드 유래 화합물 테일에 의해 완전히 작용화되지 않을 것이다. 예를 들어, 디아민 또는 폴리아민은 분자의 다양한 아미노 모이어티를 제거하는 1 개, 2 개, 3 개 또는 4 개의 에폭시드 유래 화합물 테일을 포함하여 1차, 2차 및 3차 아민을 초래할 수 있다. 특정 구현예에서, 모든 아미노기는 완전히 작용화되지 않는다. 특정 구현예에서, 2 가지 동일 유형의 에폭시드 말단 화합물이 사용된다. 다른 구현예에서, 2 개 이상의 상이한 에폭시드 말단 화합물이 사용된다. 아미노알코올 리피도이드 화합물의 합성은 용매와 함께 또는 용매 없이 수행되고, 합성은 30℃ 내지 100℃, 바람직하게는 대략 50℃ 내지 90℃ 범위의 고온에서 실행될 수 있다. 제조된 아미노알코올 리피도이드 화합물은 선택적으로 정제될 수 있다. 예를 들어, 아미노알코올 리피도이드 화합물의 혼합물을 정제하여, 특정 수의 에폭시드 유래 화합물 테일을 지니는 아미노알코올 리피도이드 화합물을 수득할 수 있다. 또는 혼합물을 정제하여 특정 입체 이성질체 또는 구조 이성질체를 수득할 수 있다. 아미노알코올 리피도이드 화합물은 또한 알킬 할로겐화물(예를 들어, 요오드화메틸) 또는 기타 다른 알킬화제를 사용하여 알킬화될 수 있고/있거나 이들은 아실화될 수 있다.
미국 특허 공개 20110293703은 또한 본 발명의 방법에 의해 제조된 아미노알코올 리피도이드 화합물의 라이브러리를 제공한다. 이들 아미노알코올 리피도이드 화합물은 액체 핸들러(handler), 로봇, 마이크로타이터 플레이트, 컴퓨터 등을 수반하는 고처리량 기법을 사용하여 제조 및/또는 스크리닝될 수 있다. 특정 구현예에서, 아미노알코올 리피도이드 화합물을 폴리뉴클레오티드 또는 기타 다른 작용제(예를 들어, 단백질, 펩티드, 소분자)를 세포에 트랜스펙션시키는 이들의 능력에 대해 스크리닝한다.
미국 특허 공개 20130302401은 조합 중합을 사용하여 제조된 폴리(베타-아미노 알코올)(PBAA)의 부류에 관한 것이다. 본 발명의 PBAA는 코팅(예컨대, 의료장치 또는 이식물에 대한 필름 또는 다중층 필름의 코팅), 첨가제, 재료, 부형제, 비생물오손제(non-biofouling agent), 미세패터닝제 및 세포 캡슐화제로서 생명공학 및 생체의학 적용분야에서 사용될 수 있다. 표면 코팅제로서 사용될 때, 이들 PBAA는 이들의 화학적 구조에 따라서 시험관 내와 생체내 둘 다에서 상이한 염증 수준을 유발하였다. 이러한 부류의 물질의 큰 화학적 다양성은 본 발명자들이 시험관 내 대식세포 활성화를 억제하는 중합체 코팅제를 확인하게 하였다. 더욱이, 이들 코팅제는 카르복실화된 폴리스티렌 마이크로입자의 피하 이식 후에 염증 세포의 동원을 감소시키고, 섬유증을 감소시킨다. 이들 중합체를 사용하여 세포 캡슐화를 위한 고분자전해질 복합체 캡슐을 형성할 수 있다. 본 발명은 또한 미생물방지 코팅, DNA 또는 siRNA 전달, 및 줄기 세포 조직 조작과 같은 다수의 다른 생물학적 적용분야를 가질 수 있다. 미국 특허 공개 20130302401의 교시는 본 발명의 CRISPR Cas 시스템에 적용될 수 있다. 일부 구현예에서, 본 명세서에서 기재된 바와 같이, 당-기반 입자, 예를 들어 GalNAc가 사용될 수 있으며, WO2014118272(본 명세서에 참고로 포함됨) 및 문헌[Nair, JK et al., 2014, Journal of the American Chemical Society 136 (49), 16958-16961)], 및 특히 전달에 관한 본 명세서의 교시를 참조하여, 이는 달리 명백하지 않은 한 모든 입자에 적용된다.
또 다른 구현예에서, 지질 나노입자(LNP)가 고려된다. 항트렌스티레틴(anti트렌스티레틴) 짧은 간섭 RNA는 지질 나노입자에서 캡슐화되고, 인간으로 전달되며(예를 들어, 문헌[Coelho et al., N Engl J Med 2013;369:819-29] 참조), 이러한 시스템은 본 발명의 CRISPR Cas 시스템에 적합하게 되고, 적용될 수 있다. 정맥내로 투여된 체중 kg 당 약 0.01 ㎎ 내지 약 1 ㎎의 용량이 고려된다. 주입 관련 반응의 위험을 감소시키기 위한 의약이 고려되며, 예컨대 덱사메타손, 아세탐피노펜, 디펜하이드라민 또는 세티리진 및 라니티딘이 고려된다. 5 회 용량에 있어서 4 주마다 킬로그램 당 약 0.3 ㎎의 다회 용량이 또한 고려된다.
LNP는 siRNA를 간에 전달함에 있어 고도로 효과적인 것으로 나타났으며(예를 들어, 문헌[Tabernero et al., Cancer Discovery, April 2013, Vol. 3, No. 4, pages 363-470] 참조), 따라서 CRISPR Cas를 인코딩하는 RNA를 간으로 전달하기 위해 고려된다. 2 주마다 6 ㎎/kg의 LNP의 약 4 회 용량의 투여량이 고려될 수 있다. Tabernero외 다수는 0.7 ㎎/kg으로 투약한 LNP의 처음 2 사이클 후에 종양 퇴행을 관찰하였고, 6 사이클의 종료까지 환자는 림프절 전이의 완전한 퇴행 및 간 종양의 실질적 수축으로 부분적 반응을 달성하였음을 입증하였다. 관해가 남아 있는 이러한 환자에서 40 회 용량 후에 완전한 반응을 수득하였고, 26 개월에 걸쳐 용량을 제공한 후에 치료를 완료하였다. VEGF 경로 억제제를 이용한 사전 치료법 후에 진행한 신장, 폐 및 림프절을 포함하는 RCC 및 간외영역 질병을 지니는 2 명의 환자는 대략 8 개월 내지 12 개월 동안 모든 부위에서 안정적인 질병을 가졌고, PNET 및 간 전이를 지니는 환자는 안정적인 질병과 함께 18 개월(36 회 용량) 동안 연장 연구를 계속하였다.
그러나, LNP의 전하를 고려하여야 한다. 양이온성 지질은 세포내 전달을 용이하게 하는 비이중층 구조를 유도하기 위해 음으로 하전된 지질과 조합되기 때문이다. 하전된 LNP는 정맥내 주사 후 순환으로부터 빠르게 제거되기 때문에, 7 미만의 pKa 값을 지니는 이온화 가능한 양이온성 지질을 개발하였다(예를 들어, 문헌[Rosin et al, Molecular Therapy, vol. 19, no. 12, pages 1286-2200, Dec. 2011] 참조). 음으로 하전된 중합체, 예컨대 RNA는 이온화 가능한 지질이 양전하를 나타내는 경우 낮은 pH 값(예를 들어, pH 4)에서 LNP에 로딩될 수 있다. 그러나, 생리적 pH 값에서, LNP는 더 긴 순환 시간과 양립가능한 낮은 표면 전하를 나타낸다. 이온화 가능한 양이온성 지질의 4 개 종, 즉, 1,2-디리네오일-3-디메틸암모늄-프로판(DLinDAP), 1,2-디리놀레일옥시-3-N,N-디메틸아미노프로판(DLinDMA), 1,2-디리놀레일옥시-케토-N,N-디메틸-3-아미노프로판(DLinKDMA), 및 1,2-디리놀레일-4-(2-디메틸아미노에틸)-[1,3]-디옥솔란(DLinKC2-DMA)에 중점을 두었다. 이들 지질을 함유하는 LNP siRNA 시스템은 생체내 간세포에서 현저하게 상이한 유전자 침묵화 특성을 나타내는 것으로 나타났고, 효능은 인자 VII 유전자 침묵화 모델을 이용하는 시리즈 DLinKC2-DMA>DLinKDMA>DLinDMA>>DLinDAP에 따라 다르다(예를 들어, 문헌[Rosin et al, Molecular Therapy, vol. 19, no. 12, pages 1286-2200, Dec. 2011] 참조). 특히 DLinKC2-DMA를 함유하는 제형에 대하여, 1 ㎍/㎖의 투여량의 LNP 또는 LNP 중의 또는 이와 회합된 CRISPR Cas RNA가 고려될 수 있다.
LNP의 제조 및 CRISPR Cas 캡슐화가 사용될 수 있고/있거나 문헌[Rosin et al, Molecular Therapy, vol. 19, no. 12, pages 1286-2200, Dec. 2011]으로부터 적합하게 될 수 있다. 양이온성 지질 1,2-디리네오일-3-디메틸암모늄-프로판(DLinDAP), 1,2-디리놀레일옥시-3-N,N-디메틸아미노프로판(DLinDMA), 1,2-디리놀레일옥시케토-N,N-디메틸-3-아미노프로판(DLinK-DMA), 1,2-디리놀레일-4-(2-디메틸아미노에틸)-[1,3]-디옥솔란(DLinKC2-DMA), (3-o-[2"-(메톡시폴리에틸렌글리콜 2000) 숙시노일]-1,2-디미리스토일-sn-글리콜(PEG-S-DMG), 및 R-3-[(ω-메톡시-폴리(에틸렌 글리콜)2000) 카르바모일]-1,2-디미리스틸옥시프로필-3-아민(PEG-C-DOMG)은 Tekmira Pharmaceuticals(캐나다 밴쿠버에 소재)에 의해 제공될 수 있거나 합성될 수 있다. 콜레스테롤은 Sigma(미국 미주리주 세인트루이스 소재)로부터 구입할 수 있다. 특정 CRISPR Cas RNA는 DLinDAP, DLinDMA, DLinK-DMA 및 DLinKC2-DMA(40:10:40:10 몰비의 양이온성 지질:DSPC:CHOL: PEGS-DMG 또는 PEG-C-DOMG)를 함유하는 LNP 내에 캡슐화될 수 있다. 필요하다면, 0.2% SP-DiOC18(Invitrogen, 캐나다 벌링턴 소재)을 혼입시켜 세포 흡수, 세포내 전달, 및 생체분포를 평가할 수 있다. 캡슐화는 10 mmol/l의 최종 지질 농도로 양이온성 지질:DSPC:콜레스테롤:PEG-c-DOMG(40:10:40:10 몰비)로 구성된 지질 혼합물을 에탄올 중에 용해함으로써 실행될 수 있다. 이러한 지질의 에탄올 용액을 50 mmol/ℓ 시트르산염, pH 4.0에 적가하여 다중 라멜라 소낭를 형성하여 30% 에탄올 vol/vol의 최종 농도를 생성할 수 있다. 압출기(Northern Lipids, 캐나다 벤쿠버 소재)를 사용하여 2 개의 적층 80 nm Nuclepore 폴리카르보네이트 필터를 통해 다중 라멜라 소낭을 압출한 후 거대 단일 라멜라 소낭이 형성될 수 있다. 30% 에탄올 vol/vol을 함유하는 50 mmol/l 시트르산염, pH 4.0 중에 2 ㎎/㎖로 용해시킨 RNA를 압출된 사전형성된 거대 단일 라멜라 소낭에 적가하고, 0.06/1 wt/wt의 최종 RNA/지질 중량비로 일정하게 혼합하면서 30 분 동안 31℃에서 인큐베이션함으로써 캡슐화를 달성할 수 있다. Spectra/Por 2 재생 셀룰로스 투석막을 사용하여 16 시간 동안 인산염 완충 식염수(PBS), pH 7.4에 대해 투석함으로써 에탄올의 제거 및 제형 완충제의 중화를 실행하였다. NICOMP 370 입도 분석기, 소낭/강도 모드, 및 가우시안(Gaussian) 핏팅(Nicomp Particle Sizing, 미국 캘리포니아주 산타 바바라 소재)을 사용하여 동적 광 산란에 의해 입자 크기 분포를 결정할 수 있다. 3 개 모두의 LNP 시스템에 대한 입자 크기는 직경이 약 70 nm일 수 있다. VivaPureD MiniH 컬럼(Sartorius Stedim Biotech)을 사용하여 투석 전 및 후에 수집한 샘플로부터 유리 RNA를 제거함으로써 RNA 캡슐화 효율을 결정할 수 있다. 캡슐화된 RNA는 용리된 나노입자로부터 추출되고, 260 nm에서 정량화될 수 있다. RNA 대 지질 비는 Wako Chemicals USA(미국 버지니아주 리치몬드 소재)로부터의 콜레스테롤 E 효소 검정을 사용하여 소낭 내 콜레스테롤 함량의 측정에 의해 결정되었다. LNP 및 PEG 지질의 본 명세서에서의 논의와 함께, PEG화 리포좀 또는 LNP는 마찬가지로 CRISPR-Cas 시스템 또는 이의 성분의 전달에 적합하다.
거대 LNP의 제조는 문헌[Rosin et al, Molecular Therapy, vol. 19, no. 12, pages 1286-2200, Dec. 2011]으로부터 사용될 수 있고/있거나 이에 적합하게 될 수 있다. 지질 예비혼합 용액(20.4 ㎎/㎖ 총 지질 농도)은 50:10:38.5 몰비로 DLinKC2-DMA, DSPC 및 콜레스테롤을 함유하는 에탄올 중에서 제조될 수 있다. 아세트산나트륨은 0.75:1의 몰비(아세트산나트륨:DLinKC2-DMA)로 지질 예비혼합물에 첨가될 수 있다. 지질은 격렬한 교반과 함께 1.85 부피의 시트르산염 완충제(10 mmol/l, pH 3.0)와 혼합물을 합함으로써 이후에 수화되어, 35% 에탄올을 함유하는 수성 완충제 중의 자발적 리포좀 형성을 초래할 수 있다. 리포좀 용액을 37℃에서 인큐베이션시켜 시간-의존적 입자 크기의 증가를 가능하게 할 수 있다. 분취물을 인큐베이션 동안 다양한 시간에 제거하여, 동적 광 산란에 의해 리포좀 크기의 변화를 조사할 수 있다(Zetasizer Nano ZS, Malvern Instruments, 영국 우스터셔 소재). 일단 원하는 입자 크기가 달성되면, 수성 PEG 지질 용액(원액 = 35%(vol/vol) 에탄올 중의 10 ㎎/㎖ PEG-DMG)을 리포좀 혼합물에 첨가하여 3.5%의 총 지질의 최종 PEG 몰 농도를 제공할 수 있다. PEG-지질의 첨가 시, 리포좀을 추가 성장을 효과적으로 켄칭시켜 이들의 크기를 해야 한다. 이어서, RNA를 대략 1:10(wt:wt)의 RNA 대 총 지질 비로 빈 리포좀에 첨가한 후에 37℃에서 30 분 동안 인큐베이션시켜 로딩된 LNP를 형성할 수 있다. 혼합물을 후속적으로 PBS 중에 밤새 투석시키고, 0.45-㎛ 주사기 필터로 여과할 수 있다.
구체 핵산(Spherical Nucleic Acid; SNA™) 작제물 및 기타 다른 입자(특히, 금 나노입자)는 또한 의도된 표적에 CRISPR-Cas 시스템을 전달하기 위한 수단으로서 고려된다. 유의한 데이터는 핵산 작용화된 금 나노입자에 기반한 AuraSense Therapeutics의 구체 핵산(SNA™) 작제물이 유용한 것을 나타낸다.
본 명세서의 교시와 함께 이용될 수 있는 문헌은 문헌[Cutler et al., J. Am. Chem. Soc. 2011 133:9254-9257], [Hao et al., Small. 2011 7:3158-3162], [Zhang et al., ACS Nano. 2011 5:6962-6970], [Cutler et al., J. Am. Chem. Soc. 2012 134:1376-1391], [Young et al., Nano Lett. 2012 12:3867-71], [Zheng et al., Proc. Natl. Acad. Sci. USA. 2012 109:11975-80], [Mirkin, Nanomedicine 2012 7:635-638], [Zhang et al., J. Am. Chem. Soc. 2012 134:16488-1691], [Weintraub, Nature 2013 495:S14-S16], [Choi et al., Proc. Natl. Acad. Sci. USA. 2013 110(19):7625-7630], [Jensen et al., Sci. Transl. Med. 5, 209ra152 (2013)] 및 [Mirkin, et al., Small, 10:186-192]을 포함한다.
RNA를 지니는 자가 조립 입자는, 폴리에틸렌 글리콜(PEG)의 원위 말단에 부착된 Arg-Gly-Asp(RGD) 펩티드 리간드로 PEG화된 폴리에틸렌이민(PEI)을 이용하여 작제될 수 있다. 이러한 시스템은, 예를 들어 인테그린을 발현하는 종양 신생혈관을 표적화하고, 혈관 내피 성장 인자 수용체-2(VEGF R2) 발현을 억제하는 siRNA를 전달하여, 이에 의해, 종양 혈관형성을 달성하기 위한 수단으로 사용된다(예를 들어, 문헌[Schiffelers et al., Nucleic Acids Research, 2004, Vol. 32, No. 19] 참조). 나노플렉스(nanoplex)를 동일한 부피의 양이온성 중합체 및 핵산의 수용액을 혼합함으로써 제조하여 2 내지 6의 범위에 걸쳐 인산염(핵산)에 대한 순 몰 과량의 이온화 가능한 질소(중합체)를 제공할 수 있다. 양이온성 중합체와 핵산 간의 정전기적 상호작용은 약 100 nm의 평균 입자 크기 분포를 갖는 폴리플렉스(polyplex)의 형성을 초래하며, 따라서 본 명세서에서 나노플렉스로서 지칭된다. Schiffelers외 다수의 자가 조립 나노입자에서의 전달을 위해 약 100 ㎎ 내지 200 ㎎의 CRISPR Cas의 투여량이 예상된다.
Bartlett외 다수(문헌[PNAS, September 25, 2007,vol. 104, no. 39])의 나노플렉스가 또한 본 발명에 적용될 수 있다. Bartlett외 다수의 나노플렉스는 동일 부피의 양이온성 중합체 및 핵산의 수용액을 혼합함으로써 제조되어 2 내지 6의 범위에 걸쳐 인산염(핵산)에 대한 순 몰 과량의 이온화 가능한 질소(중합체)를 제공한다. 양이온성 중합체와 핵산 간의 정전기적 상호작용은 약 100 nm의 평균 입자 크기 분포를 지니는 폴리플렉스의 형성을 초래하였고, 따라서 본 명세서에서 나노플렉스로서 지칭된다. Bartlett외 다수의 DOTA-siRNA를 다음과 같이 합성하였다: 1,4,7,10-테트라아자사이클로도데칸-1,4,7,10-테트라아세트산 모노(N-하이드록시숙신이미드 에스테르)(DOTA-NHS에스테르)를 Macrocyclics(미국 텍사스주 달라스 소재)에서 주문하였다. 탄산염 완충제(pH 9) 중의 100 배 몰 과량의 DOTA-NHS-에스테르에 의한 아민 변형 RNA 센스 가닥을 마이크로원심분리 튜브에 첨가하였다. 내용물을 실온에서 4 시간 동안 교반시킴으로써 반응시켰다. DOTA-RNA센스 컨쥬게이트를 에탄올 침전시키고, 수 중에 재현탁화한 다음, 미변형 안티센스 가닥에 어닐링시켜 DOTA-siRNA를 수득하였다. 모든 액체를 Chelex-100(Bio-Rad, 미국 캘리포니아주 허큘러스 소재)으로 전처리하여 미량의 금속 오염물질을 제거하였다. Tf-표적화 및 비표적화 siRNA 나노입자를 사이클로덱스트린-함유 다가양이온을 사용함으로써 형성할 수 있다. 통상적으로, 나노입자를 전하비 3(+/-) 및 siRNA 농도 0.5 g/리터로 수 중에서 형성하였다. 표적화된 나노입자의 표면 상의 아다만탄-PEG 분자의 1%를 Tf로 변형시켰다(아다만탄-PEG-Tf). 나노입자를 주사용 5%(wt/vol) 글루코스 담체 용액 중에서 현탁화시켰다.
Davis외 다수(문헌[Nature, Vol 464, 15 April 2010])는 표적화된 나노입자-전달 시스템(임상 시험 등록 번호 NCT00689065)을 사용하는 RNA 임상 시험을 수행한다. 표준 치료 치료법에 난치성인 고형암을 지니는 환자에게 30 분 정맥내 주입에 의해 21 일 사이클 중 제1 일, 제3 일, 제8 일 및 제10 일에 표적화된 나노입자의 용량을 투여한다. 나노입자는 하기를 함유하는 합성 전달 시스템으로 이루어진다: (1) 선형, 사이클로덱스트린-기반 중합체(CDP), (2) 암 세포의 표면 상의 TF 수용체(TFR)에 맞물리는 나노입자 외부에 나타나는 인간 트랜스페린 단백질(TF) 표적화 리간드, (3) 친수성 중합체(생물학적 유체 중에서 나노입자 안정성을 촉진하기 위해 사용되는 폴리에틸렌 글리콜(PEG)), 및 (4) RRM2의 발현을 감소시키도록 설계된 siRNA(임상에서 사용한 서열은 앞서 정의한 siR2B+5였음). TFR는 악성 세포에서 상향조절되는 것으로 오랫동안 알려져 있고, RRM2는 확립된 항암 표적이다. 이들 나노입자(CALAA-01로서 정의된 임상 형태)는 비-인간 영장류에서의 다회 투약 연구에서 잘 용인되는 것으로 나타났다. 만성 골수성 백혈병을 지니는 단일 환자에게 리포좀 전달에 의해 siRNA가 투여되었지만, Davis외 다수의 임상 시험은 표적화된 전달 시스템을 이용하여 siRNA를 전신으로 전달하기 위한 그리고 고형암을 지니는 환자를 치료하기 위한 초기 인간 시험이다. 표적화된 전달 시스템이 인간 종양으로의 작용성 siRNA의 효과적인 전달을 제공할 수 있는지 여부를 확인하기 위해, Davis외 다수는 3 개의 상이한 투약 코호트로부터의 3 명 환자로부터의 생검을 조사하였으며; 환자 A, B 및 C는 모두 전이성 흑색종을 가졌고, 각각 18 mg m-2, 24 mg m-2 및 30 ㎎ m-2 siRNA의 CALAA-01 용량을 받았다. 유사한 용량이 또한 본 발명의 CRISPR Cas 시스템을 위해 고려될 수 있다. 본 발명의 전달은 선형, 사이클로덱스트린-기반 중합체(CDP), 암세포의 표면 상의 TF 수용체(TFR)에 맞물리는 나노입자 외부에 나타나는 인간 트랜스페린 단백질(TF) 표적화 리간드 및/또는 친수성 중합체(예를 들어, 생물학적 유체 중에서 나노입자 안정성을 촉진하기 위해 사용되는 폴리에틸렌 글리콜(PEG))를 함유하는 나노입자에 의해 달성될 수 있다.
본 발명과 관련하여, 나노입자 또는 지질 외피를 사용하여 CRISPR 복합체의 하나 이상의 성분, 예를 들어 CRISPR 효소 또는 mRNA 또는 가이드 RNA가 전달될 수 있는 것이 바람직하다. 기타 다른 전달 시스템 또는 벡터가 본 발명의 나노입자 양태와 함께 사용될 수 있다.
일반적으로, "나노입자"는 1000 nm 미만의 직경을 갖는 임의의 입자를 나타낸다. 바람직한 특정 구현예에서, 본 발명의 나노입자는 500 nm 이하의 가장 큰 치수(예를 들어, 직경)를 갖는다. 다른 바람직한 구현예에서, 본 발명의 나노입자는 25 nm 내지 200 nm 범위의 가장 큰 치수를 갖는다. 다른 바람직한 구현에에서, 본 발명의 나노입자는 100 nm 이하의 가장 큰 치수를 갖는다. 다른 바람직한 구현예에서, 본 발명의 나노입자는 35 nm 내지 60 nm 범위의 가장 큰 치수를 갖는다.
본 발명에 포함된 나노입자는 상이한 형태, 예를 들어 고체 나노입자(예를 들어, 금속, 예컨대 은, 금, 철, 티타늄), 비-금속, 지질-기반 고체, 중합체), 나노입자의 현탁액, 또는 이들의 조합물로 제공될 수 있다. 금속, 유전체, 및 반도체 나노입자뿐만 아니라 ㅎ하이브리드 구조(예를 들어, 코어-쉘 나노입자)가 제조될 수 있다. 반도체 물질로 제조된 나노입자는 또한 이들이 전자 에너지 수준의 양자화가 발생하기에 충분히 작은(통상적으로, 10 nm 이하) 경우 양자점으로 표지화될 수 있다. 이러한 나노규모 입자는 약물 담체 또는 영상화 작용제로서 생물의학 응용에서 사용되며, 본 발명에서 유사한 목적을 위해 적합하게 될 수 있다.
반고체 및 연성 나노입자가 제조되었고, 이들은 본 발명의 범주 내에 속한다. 반고체 성질의 프로토타입 나노입자는 리포좀이다. 다양한 유형의 리포좀 나노입자가 항암 약물 및 백신을 위한 전달 시스템으로서 현재 임상적으로 사용된다. 절반이 친수성이고, 나머지 절반이 소수성인 나노입자는 야누스(Janus) 입자로 명명되며, 에멀젼을 안정화시키는데 특히 효과적이다. 이들은 물/오일 계면에서 자가-조립되며, 고체 계면활성제로 작용할 수 있다.
참고로 본 명세서에 포함되는 미국 특허 8,709,843은 조직, 세포, 및 세포내 구획으로의 치료제-함유 입자의 표적화된 전달을 위한 약물 전달 시스템을 제공한다. 상기 발명은 계면활성제, 친수성 중합체 또는 지질에 컨쥬게이트된 중합체를 포함하는 포함하는 표적화된 입자를 제공한다.
참고로 본 명세서에 포함되는 미국 특허 6,007,845는 다작용성 화합물과 하나 이상의 소수성 중합체 및 하나 이상의 친수성 중합체를 공유적으로 연결시킴으로써 형성된 멀티블록 공중합체의 코어를 갖고, 생물학적으로 활성인 물질을 함유하는 입자를 제공한다.
참고로 본 명세서에 포함되는 미국 특허 5,855,913은 폐기관계로의 약물 전달을 위해 표면 상에 계면활성제가 혼입된, 0.4 g/㎤ 미만의 탭 밀도(tap density)와 함께 5 ㎛ 내지 30 ㎛의 평균 직경을 갖는 공기역학적으로 가벼운 입자를 갖는 미립자 조성물을 제공한다.
참고로 본 명세서에 포함되는 미국 특허 5,985,309는 폐기관계로의 전달을 위한 계면활성제 및/또는 양으로 또는 음으로 하전된 치료제 또는 진단제 및 반대 전하로 하전된 분자의 친수성 또는 소수성 복합체가 혼입된 입자를 제공한다.
참고로 본 명세서에 포함되는 미국 특허 5,543,158은 표면 상에 폴리(알킬렌 글리콜) 모이어티 및 생물학적 활성 물질을 함유하는 생분해성 고체 코어를 갖는 생분해성 주사가능한 입자를 제공한다.
참고로 본 명세서에 포함되는 WO2012135025(또한 US20120251560으로 공개됨)는 컨쥬게이트된 폴리에틸렌이민(PEI) 중합체 및 컨쥬게이트된 아자-마크로사이클(집합적으로, "컨쥬게이트된 리포머" 또는 "리포머"로 지칭됨)이 기재한다. 특정 구현예에서, 이러한 컨쥬게이트된 리포머가 단백질 발현의 조절을 포함하여 유전자 발현을 변형시키기 위한 시험관 내, 생체 외 및 생체내 게놈 변동을 달성하기 위해 CRISPR-Cas 시스템의 상황에서 사용될 수 있음이 계획될 수 있다.
일 구현예에서, 나노입자는 에폭시드-변형된 지질-중합체, 유리하게는 7C1일 수 있다(예를 들어, 문헌[James E. Dahlman and Carmen Barnes et al. Nature Nanotechnology (2014), 2014년 5월 11일 온라인 발행, doi:10.1038/nnano.2014.84] 참조). C71을 14:1의 몰비로 C15 에폭시드-말단 지질과 PEI600을 반응시킴으로써 합성하였고, 적어도 40 일 동안 PBS 용액에서 안정적인 나노입자(35 nm 내지 60 nm의 직경)를 생성시키기 위해 C14PEG2000과 함께 제형화하였다.
폐, 심혈관 또는 신장 세포로 본 발명의 CRISPR-Cas 시스템을 전달하기 위해 에폭시드-변형된 지질-중합체가 이용될 수 있으나, 당업자는 기타 다른 표적 기관으로 전달하기 위해 시스템을 적합하게 할 수 있다. 약 0.05 ㎎/㎏ 내지 약 0.6 ㎎/㎏ 범위의 투여량이 계획된다. 약 2 ㎎/㎏의 전체 투여량의 수 일 또는 수 주에 걸친 투여량이 또한 계획된다.
Xu 등의 WO 2014/186366 A1호(US20160082126)는 사포린의 전달을 위한 나노복합체를 추가로 제공하며, 여기서, 나노복합체는 사포린 및 지질-유사 화합물을 포함하며, 나노복합체는 50 nm 내지 1000 nm의 입자 크기를 가지며; 사포린은 비-공유적 상호작용 또는 공유 결합을 통해 지질-유사 화합물에 결합하며; 지질-유사 화합물은 친수성 모이어티, 소수성 모이어티, 및 친수성 모이어티 및 소수성 모이어티를 연결하는 링커를 가지며, 친수성 모이어티는 임의로 하전되며, 소수성 모이어티는 8 내지 24개 탄소 원자를 갖는다. Xu 등의 WO 2014/186348호(US20160129120호)는 양이온 전달제 및 음이온 약제를 포함하는 펩티드 또는 단백질의 나노복합체의 예를 제공하며, 나노복합체는 50 내지 1000 nm의 입자 크기를 가지며, 양이온 전달제는 음이온 약제에 결합하며, 음이온 약제는 펩티드 및 단백질 및 음이온 기를 함유하는 부가된 화학적 모이어티로 형성된 변형된 펩티드 또는 단백질이다. 부가되는 화학적 모이어티는 아미드 기, 에스테르 기, 에테르 기, 티오에테르 기, 이황화 기, 하이드라존 기, 설페네이트 에스테르 기, 아미딘 기, 우레아 기, 카바메이트 기, 이미도에스테르 기 또는 카보네이트 기를 통해 펩티드 또는 단백질에 연결된다.
Anderson 등(US 20170079916호)은 하나 이상의 0 내지 7 세대 알킬화된 덴드리머; 하나 이상의 양친매성 중합체; 및 그 안에 캡슐화된 하나 이상의 치료제, 예방제 및/또는 진단제를 포함하는 대상체로의 치료적, 예방적 및/또는 진단적 작용제의 전달을 위한 변형된 덴드리머 나노입자를 제공한다. 한 알킬화된 덴드리머는 폴리(에틸렌이민), 폴리(폴리프로일렌이민), 디아미노부탄 아민 폴리프로필렌이민 테트라민 및 폴리(아미도 아민)으로 이루어진 군으로부터 선택될 수 있다. 치료제, 예방제 및 진단제는 단백질, 펩티드, 탄수화물, 핵산, 지질, 소분자 및 이의 조합으로 이루어진 군으로부터 선택될 수 있다.
Anderson 등(US 20160367686호)은 화학식 (I)의 화합물 또는 이의 염, 및 대상체 또는 세포로의 작용제의 전달을 위한 화합물 또는 이의 염; 작용제; 및 선택적으로 부형제를 포함하는 조성물을 제공한다:
Figure pat00018
상기 식에서, R.sup.L의 각 예는 독립적으로 선택적으로 치환되는 C.sub.6-C.sub.40 알케닐이다. 작용제는 유기 분자, 무기 분자, 핵산, 단백질, 펩티드, 폴리뉴클레오티드, 표적화제, 동위원소 표지 화합물, 백신, 면역학적 작용제, 또는 응용 생물학적 제법(bioprocessing)에 유용한 작용제일 수 있다. 조성물은 콜레스테롤, PEG화 지질, 인지질 또는 아포지질단백질을 추가로 포함할 수 있다.
Anderson 등(US20150232883호)은 (a) CRISPR-Cas 시스템 RNA 폴리뉴클레오티드 서열; 또는 (b) Cas9; 또는 (c) CRISPR-Cas 시스템 RNA 폴리뉴클레오티드 서열 및 Cas9 둘 모두; 또는 (d) (a), (b) 또는 (c)를 인코딩하는 핵산 분자(들)를 함유하는 하나 이상의 벡터를 포함하는 전달 입자 제형 및/또는 시스템, 바람직하게는 나노입자 전달 제형 및/또는 시스템을 제공하며, CRISPR-Cas 시스템 RNA 폴리뉴클레오티드 서열 및 Cas9는 천연적으로 함께 발생하지 않는다. 전달 입자 제형은 계면활성제, 지질 또는 단백질을 추가로 포함할 수 있으며, 계면활성제는 양이온성 지질을 포함할 수 있다.
Anderson 등(US20050123596호)은 산성 환경에 노출되는 경우, 이들의 페이로드를 방출시키도록 설RP된 마이크로입자의 예를 제공하며, 마이크로입자는 전달될 적어도 하나의 작용제, pH 촉발제 및 중합체를 포함하며, 중합체는 폴리메타크릴레이트 및 폴리아크릴레이트의 군으로부터 선택된다.
Anderson 등(US 20020150626호)은 핵산의 전달을 위한 지질-단백질-당 입자를 제공하며, 폴리뉴클레오티드는 폴리뉴클레오티드를 지질, 단백질 및 당과 접촉시키고; 폴리뉴클레오티드, 지질, 단백질 및 당의 혼합물을 분무 건조시켜 마이크로입자를 제조함으로써 지질-단백질-당 매트릭스에 캡슐화된다.
Liu 등(US 20110212179호)은 염기 중합체를 포함하는 바이모달 다공성 중합체 미세소체를 제공하며, 입자는 약 20 내지 약 500 미크론 범위의 직경을 갖는 마크로포어 및 약 1 내지 약 70 미크론 범위의 직경을 갖는 마이크로포어를 포함하며, 미세소체는 약 50 내지 약 1100 미크론 범위의 직경을 갖는다.
Berg 등(US20160174546호)은 지질 , 오일 또는 용매를 포함하는 조성물을 포함하는 나노지질 전달 시스템, 특히 나노-입자 농축물을 제공하며, 조성물은 25℃에서 100 cP 미만의 점도 및 25 Kb 초과의 카우리(Kauri) 부탄올 용매력; 및 알콕실화된 지질, 알콕실화된 지방산, 알콕실화된 알코올, 헤테로원자 친수성 지질 , 헤테로원자 친수성 지방산, 헤테로원자 친수성 알코올, 희석제 및 이의 조합으로 이루어진 군으로부터 선택되는 적어도 하나의 양친매성 화합물을 가지며, 화합물은 50℃에서 1000 cP 미만의 점도를 갖는 출발 화합물로부터 유래되며, 농축물은 희석되는 경우 100 nm 미만의 평균 입자 크기 분포 및 D50을 갖는 안정한 나노 에멀젼을 제공하도록 구성된다.
Zhu 등(US20140348900호)은 다중-포트 매니폴드를 사용한 리포좀, 지질 디스크 및 다른 지질 나노입자의 제조 방법을 제공하며, 유기 용매를 함유하는 지질 용액 스트림을 수용액(예를 들어, 완충액)의 2가지 이상의 스트림과 혼합한다. 일부 양태에서, 액체 및 수용액의 스트림의 적어도 일부는 서로 직접적으로 반대가 아니다. 따라서, 상기 방법은 추가의 단계로서 유기 용매의 희석을 필요로 하지 않는다. 일부 구현예에서, 용액 중 하나는 또한 활성 약제 성분(API)을 함유할 수 있다. 본 발명은 상이한 지질 제형 및 상이한 페이로드를 갖는 견고한 리포좀의 제조 방법을 제공한다. 입자 크기, 형태 및 제조 규모는 포트 크기 및 매니포드 포트의 수를 변경시키고, 지질 및 수용액의 유동 속도 또는 유속을 선택함으로써 제어될 수 있다.
Cullis 등(US 20140328759호)은 특히 수성 코어를 둘러싸는 지질 이중층을 포함하는 10 내지 100 nm의 직경을 갖는 제한된 크기의 지질 나노입자를 제공한다. 이러한 제한된 크기의 지질 나노입자의 제조를 위한 방법 및 장치도 또한 개시되어 있다.
Manoharan 등(US 20140308304호)은 화학식 (I)의 양이온성 지질 또는 이의 염을 제공한다:
[화학식 I]
Figure pat00019
상기 식에서, X는 N 또는 P이고; R'는 부재이거나, 수소 또는 알킬이고; R.sup.1 및 R.sup.2에 관하여, (i) R.sup.1 및 R.sup.2는 각각 독립적으로, 선택적으로 치환되는 알킬, 알케닐, 알키닐, 사이클로알킬, 사이클로알킬알킬, 헤테로사이클 또는 R.sup.10이거나; (ii) R.sup.1 및 R.sup.2는 그들이 부착된 질소 원자와 함께, 선택적으로 치환되는 헤테로사이클릭 고리를 형성하거나; 또는 (iii) R.sup.1 및 R.sup.2 중 하나는 선택적으로 치환되는 알킬, 알케닐, 알키닐, 사이클로알킬, 사이클로알킬알킬 또는 헤테로사이클이며, 다른 것은 (a) 인접한 질소 원자 및 (b) 질소 원자에 인접한 (R).sub.a 기와 4 내지 10원 헤테로사이클릭 고리 또는 헤테로아릴을 형성하며; R은 각 경우, 독립적으로, --(CR.sup.3R.sup.4)--이며; R.sup.3 및 R.sup.4는 각 경우, 독립적으로 H, 할로겐, OH, 알킬, 알콕시, --NH.sub.2, 알킬아미노 또는 디알킬아미노이거나; R.sup.3 및 R.sup.4는 그들이 직접 부착되는 탄소 원자와 함께, 사이클로알킬 기를 형성하며, 원자 X*에 부착되는 각 쇄 내의 3개 이하의 R기는 사이클로알킬이며; R.sup.10은 각 경우에, PEG 및 폴리(옥사졸린), 폴리(에틸렌 옥사이드), 폴리(비닐 알코올), 폴리(글리세롤), 폴리(N-비닐피롤리돈), 폴리[N-(2-하이드록시프로필)메타크릴아미드] 및 폴리(아미노산)에 기반한 중합체로부터 독립적으로 선택되며, (i) PEG 또는 중합체는 선형 또는 분지형이며, (ii) PEG 또는 중합체는 n개 서브유닛에 의해 중합되며, (iii) n은 10 내지 200 유닛의 수 평균 중합도이며, (iv) 화학식의 화합물은 최대 2개의 R.sup.10 기를 가지며; Q는 부재이거나, --O--, --NH--, --S--, --C(O)O--, --OC(O)--, --C(O)N(R.sup.4)--, --N(R.sup.5)C(O)--, --S--S--, --OC(O)O--, --O--N.dbd.C(R.sup.5)--, --C(R.sup.5).dbd.N--O--, --OC(O)N(R.sup.5)--, --N(R.sup.5)C(O)N(R.sup.5)--, --N(R.sup.5)C(O)O--, --C(O)S--, --C(S)O-- 또는 --C(R.sup.5).dbd.N--O--C(O)--이며; Q.sup.1 및 Q.sup.2는 각각 독립적으로, 부재이거나, --O--, --S--, --OC(O)--, --C(O)O--, --SC(O)--, --C(O)S--, --OC(S)--, --C(S)O--, --S--S--, --C(O)(NR.sup.5)--, --N(R.sup.5)C(O)--, --C(S)(NR.sup.5)--, --N(R.sup.5)C(O)--, --N(R.sup.5)C(O)N(R.sup.5)-- 또는 --OC(O)O--이며; Q.sup.3 및 Q.sup.4는 각각 독립적으로, H, --(CR.sup.3R.sup.4)--, 아릴 또는 콜레스테롤 모이어티이며; A.sup.1, A.sup.2, A.sup.3 및 A.sup.4는 각 경우 독립적으로 --(CR.sup.5R.sup.5--CR.sup.5.dbd.CR.sup.5)--이며; R.sup.5는 각 경우 독립적으로 H 또는 알킬이며; M.sup.1 및 M.sup.2는 각각 독립적으로 생분해성 기(예를 들어, --OC(O)--, --C(O)O--, --SC(O)--, --C(O)S--, --OC(S)--, --C(S)O--, --S--S--, --C(R.sup.5).dbd.N--, --N.dbd.C(R.sup.5)--, --C(R.sup.5).dbd.N--O--, --O--N.dbd.C(R.sup.5)--, --C(O)(NR.sup.5)--, --N(R.sup.5)C(O)--, --C(S)(NR.sup.5)--, --N(R.sup.5)C(O)--, --N(R.sup.5)C(O)N(R.sup.5)--, --OC(O)O--, --OSi(R.sup.5).sub.2O--, --C(O)(CR.sup.3R.sup.4)C(O)O-- 또는 --OC(O)(CR.sup.3R.sup.4)C(O)--)이며; Z는 부재이거나, 알킬렌 또는 --O--P(O)(OH)--O--이며; Z에 부착된 각각의 ------는 Z가 부재인 경우 Q.sup.3 및 Q.sup.4는 직접적으로 함께 공유 결합되지 않게 하는 선택적 결합이며; a는 1, 2, 3, 4, 5 또는 6이며; b는 0, 1, 2 또는 3이며; c, d, e, f, i, j, m, n, q 및 r은 각각 독립적으로 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10이며; g 및 h는 각각 독립적으로 0, 1 또는 2이며; k 및 l은 각각 독립적으로 0 또는 1이며, k 및 l 중 적어도 하나는 1이며; o 및 p는 각각 독립적으로 0, 1 또는 2이며, Q.sup.3 및 Q.sup.4는 각각 독립적으로 8개 이상의 원자의 쇄에 의해 별표로 표시된 3차 원자(X*)로부터 분리된다. 양이온성 지질을 다른 지질 성분, 예컨대 콜레스테롤 및 PEG-지질과 함께 사용하여, 올리고뉴클레오티드가 있는 지질 나노입자를 형성하여, 세포 흡수 및 엔도좀 탈출을 용이하게 하고, 시험관내 및 생체내 둘 모두에서 표적 mRNA를 낙다운시킬 수 있다.
Liu 등(US 20140301951호)은 복수의 포어를 포함하는 다공성 입자 코어; 및 다공성 입자 코어를 둘러싸는 적어도 하나의 지질 이중층을 포함하여, 원세포를 형성하는 원세포(protocell) 나노구조를 제공하며, 원세포는 하나 이상의 카고(cargo) 성분을 다공성 입자 코어의 복수의 포어에 로딩할 수 있고, 다공성 입자 코어로부터 하나 이상의 카고 성분을 주변의 지질 이중층을 가로질러 방출할 수 있다.
Chromy 등(US 20150105538호)은 나노지질단백질 입자 내 막 회합 단백질의 조립, 가용화 및/또는 정제를 위한 방법 및 시스템을 제공하며, 이는 세제의 존재 하에 수행되는 온도 전이 사이클을 포함하며, 온도 전이 사이클 동안 나노지질단백질 성분은 나노지질단백질 입자의 막 형성 지질의 겔에서 액체로의 결정화 전이 온도를 초과하는 및 그 미만의 온도가 되게 한다.
Bader 등(US 20150250725호)은 하기의 단계를 포함하는 지질 입자의 생성 방법을 제공한다: i) 변성된 아포지질단백질을 포함하는 제1 용액을 제공하는 단계, ii) 제1 용액을 적어도 2가지의 지질 및 세제를 포함하지만 아포지질단백질을 함유하지 않는 제2 용액에 첨가하는 단계, 및 iii) ii)에서 수득되는 용액으로부터 세제를 제거하고, 이에 의해, 지질 입자를 생성하는 단계.
Mirkin 등(US20100129793호)은 (a) 유전체 성분 및 자성 성분을 혼합하여, 제1 중간체를 형성하는 단계, (b) 제1 중간체 및 금 씨드를 혼합하여, 제2 중간체를 형성하는 단계, 및 (c) 제 중간체를 금 공급원 및 환원제와 혼합하여, 복합 입자를 형성함으로써 제2 중간체 상에 금 쉘(shell)을 형성하는 단계를 포함하는 복합 입자의 제조 방법을 제공한다.
엑소좀
엑소좀은 뇌 및 기타 다른 표적 기관에 RNA를 전달할 수 있는, 단백질 및 RNA를 전달하는 내인성 나노-소낭이다. 면역원성을 감소시키기 위해, Alvarez-Erviti외 다수(문헌[2011, Nat Biotechnol 29: 341])는 엑소좀 생성을 위해 자가-유래 수상돌기 세포를 사용하였다. 뉴런-특이적 RVG 펩티드에 융합된 엑소좀 막 단백질인 Lamp2b를 발현하도록 수상돌기 세포를 조작함으로써 뇌로의 표적화를 달성하였다. 정제된 엑소좀에 전기천공법에 의해 외인성 RNA를 로딩하였다. 정맥내로 주사한 RVG-표적화 엑소좀은 뇌 내의 뉴런, 미세아교세포, 희소돌기신경교에 특이적으로 GAPDH siRNA를 전달하여, 특이적 유전자 낙다운을 초래하였다. RVG 엑소좀에 대한 사전 노출은 낙다운을 약화시키지 않았고, 기타 다른 조직에서의 비-특이적 흡수는 관찰되지 않았다. 엑소좀-매개 siRNA 전달의 치료 잠재력은 알츠하이머병에서의 치료 표적인 BACE1의 강력한 mRNA(60%) 및 단백질(62%) 낙다운에 의해 입증되었다.
면역학적으로 비활성인 엑소좀의 풀을 얻기 위해, Alvarez-Erviti외 다수는 상동성 주조직적합성 복합체(MHC) 단상형을 지니는 근친교배 C57BL/6 마우스로부터 골수를 수집하였다. 미성숙 수상돌기 세포가 MHC-II 및 CD86과 같은 T-세포 활성화제가 없는 다량의 엑소좀을 생성하기 때문에, Alvarez-Erviti외 다수는 7 일 동안 과립구/대식세포-콜로니 자극 인자(GM-CSF)를 지니는 수상돌기 세포에 대해 선택하였다. 잘 확립된 초원심분리 프로토콜을 사용하여 다음날 배양 상청액으로부터 엑소좀을 정제하였다. 생성된 엑소좀은 물리적으로 균질하였고, 크기 분포는 나노입자 트래킹 분석(NTA) 및 전자 현미경에 의해 결정하였을 때, 직경 80 nm에서 최고였다. Alvarez-Erviti외 다수는 106 개 세포당 6 ㎍ 내지 12 ㎍의 엑소좀(단백질 농도를 기준으로 측정)을 얻었다.
다음에, Alvarez-Erviti외 다수는 나노규모 적용에 적합한 전기천공법 프로토콜을 사용하여 외인성 카고로의 변형된 엑소좀의 로딩 가능성을 조사하였다. 나노미터 규모에서 막 입자에 대한 전기천공법은 제대로 특성화되지 않기 때문에, 비특이적 Cy5-표지화 RNA를 전기천공법 프로토콜의 경험적 최적화를 위해 사용하였다. 캡슐화된 RNA의 양을 엑소좀의 초원심분리 및 용해 후에 분석하였다. 400 V 및 125 μF에서의 전기천공법은 RNA의 가장 큰 보유를 초래하였고, 모든 후속 실험에 대해 사용하였다.
Alvarez-Erviti외 다수는 150 ㎍의 RVG 엑소좀 중에 캡슐화된 150 ㎍의 각각의 BACE1 siRNA를 정상 C57BL/6 마우스에게 투여하고, 낙다운 효율을 4 개의 대조군, 즉 미처리 마우스, RVG 엑소좀만을 주사한 마우스, 생체내 양이온성 리포좀 시약에 복합체화된 BACE1 siRNA를 주사한 마우스, 및 siRNA에 정전기적으로 결합된 9 개의 D-아르기닌에 컨쥬게이트된 RVG 펩티드인 RVG-9R에 복합체화된 BACE1 siRNA를 주사한 마우스에 대하여 비교하였다. 투여 3 일 후 피질 조직 샘플을 분석하였고, siRNA-RVG-9R-처리 마우스와 siRNARVG 엑소좀-처리 마우스 둘 다에서 BACE1 mRNA 수준의 상당한 감소(각각 66% [+ 또는 -] 15%, P < 0.001 및 61% [+ 또는 -] 13%, P < 0.01)로부터 초래되는 상당한 단백질 낙다운(45%, P < 0.05, 대 62%, P < 0.01)을 관찰하였다. 게다가, 본 발명자들은 RVG-엑소좀-처리 동물에서 알츠하이머 병증에서의 아밀로이드 플라크의 주요 성분인 총 [베타]-아밀로이드 1 내지 42 수준에서 상당한 감소(55%, P < 0.05)를 입증하였다. 관찰한 감소는 BACE1 억제제의 정맥내 주사 후 정상 마우스에서 입증된 β-아밀로이드 1 내지 40 감소보다 더 컸다. Alvarez-Erviti외 다수는 BACE1 절단 생성물에 대해 cDNA 말단의 5'-신속한 증폭(RACE)을 수행하였는데, 이는 siRNA에 의한 RNAi-매개 낙다운의 증거를 제공하였다.
최종적으로, Alvarez-Erviti외 다수는 IL-6, IP-10, TNFα 및 IFN-α 혈청 농도를 평가함으로써 RNA-RVG 엑소좀이 생체내 면역 반응을 유도하였는지 여부를 조사하였다. 엑소좀 처리 후에, 모든 사이토카인에서의 중요하지 않은 변화가 IL-6 분비를 강력하게 자극한 siRNA-RVG-9R과 대조적으로 siRNA-트랜스펙션 시약 처리와 유사하게 등록되었는데, 이는 엑소좀 처리의 면역학적 비활성 프로파일을 확인시켜준다. 엑소좀이 단지 20%의 siRNA를 캡슐화하는 것을 고려해 볼 때, RVG-엑소좀에 의한 전달은 비슷한 mRNA 낙다운으로서 RVG-9R 전달보다 더 효율적인 것으로 나타나며, 대응하는 면역 자극 수준 없이, 더 큰 단백질 낙다운이 5 배 더 적은 siRNA에 의해 달성되었다. 이 실험은 신경변성 질병과 관련된 유전자의 장기간 침묵화에 잠재적으로 적합한 RVG-엑소좀 기술의 치료 잠재력을 입증하였다. Alvarez-Erviti외 다수의 엑소좀 전달 시스템은 치료 표적, 특히 신경변성 질병에 본 발명의 CRISPR-Cas 시스템을 전달하기 위해 적용될 수 있다. 약 100 ㎎ 내지 1000 ㎎의 RVG 엑소좀에서 캡슐화된 약 100 ㎎ 내지 1000 ㎎의 CRISPR Cas의 투여량은 본 발명을 위해 고려될 수 있다.
El-Andaloussi외 다수(문헌[Nature Protocols 7,2112-2126(2012)])는 배양 세포로부터 유래된 엑소좀이 시험관 내 및 생체내 RNA의 전달을 위해 이용될 수 있는 방법을 개시한다. 이 프로토콜은 펩티드 리간드와 융합된 엑소좀 단백질을 포함하는 발현 벡터의 트랜스펙션을 통한 표적화된 엑소좀의 생성을 처음으로 기재한다. 다음에, El-Andaloussi외 다수는 트랜스펙션된 세포 상청액으로부터 엑소좀을 정제하고 특성화하는 방법을 설명한다. 다음에, El-Andaloussi외 다수는 RNA를 엑소좀에 로딩하기 위한 결정적인 단계를 상술한다. 최종적으로, El-Andaloussi외 다수는 마우스 뇌에서 시험관 내 및 생체내 RNA를 효율적으로 전달하기 위해 엑소좀을 사용하는 방법을 약술한다. 엑소좀-매개 RNA 전달이 작용성 분석 및 영상에 의해 평가되는 예상된 결과의 예가 또한 제공된다. 전체 프로토콜은 약 3 주가 걸린다. 본 발명에 따른 전달 또는 투여는 자가-유래 수상돌기 세포로부터 생성된 엑소좀을 사용하여 실행될 수 있다. 본 명세서의 교시로부터, 이는 본 발명의 실시에 이용될 수 있다.
또 다른 구현예에서, Wahlgren외 다수(문헌[Nucleic Acids Research, 2012, Vol. 40, No. 17 e130])의 혈장 엑소좀이 고려된다. 엑소좀은 수상돌기 세포(DC), B 세포, T 세포, 비만 세포, 상피 세포 및 종양 세포를 포함하는 다수의 세포 유형에 의해 생성된 나노 크기 소낭(30 nm 내지 90 nm 크기)이다. 이들 소낭은 후기 엔도솜의 안쪽으로 향하는 출아에 의해 형성되며, 이어서 혈장막과 융합시 세포외 환경으로 방출된다. 엑소좀은 천연적으로 세포 간에 RNA를 운반하기 때문에, 이 특성은 유전자 치료법에 유용할 수 있으며, 이러한 개시 내용으로부터, 본 발명의 실시에 이용될 수 있다. 혈장으로부터의 엑소좀은 20 분 동안 900 g에서 버피 코트의 원심분리로 혈장을 분리시킨 다음에 세포 상청액을 수집하고 10 분 동안 300 g에서 그리고 30 분 동안 16 500 g에서 원심분리하여 세포를 제거한 후 0.22 mm 필터를 통해 여과시킴으로써 제조될 수 있다. 엑소좀을 120 000 g에서 70 분 동안 초원심분리에 의해 펠렛화시킨다. siRNA의 엑소좀 내로의 화학적 트랜스펙션을 RNAi 인간/마우스 스타터 키트(Human/Mouse Starter Kit)(Quiagen, Hilden, 독일 힐덴 소재)에서 제조업자의 지침서에 따라 수행한다. siRNA를 2 mmol/㎖의 최종 농도로 100 ㎖ PBS에 첨가한다. HiPerFect 트랜스펙션 시약을 첨가한 후에, 혼합물을 실온에서 10 분 동안 인큐베이션시킨다. 과량의 미셀을 제거하기 위해, 알데하이드/설페이트 라텍스 비드를 사용하여 엑소좀을 재분리시킨다. 엑소좀 내로의 CRISPR Cas의 화학적 트랜스펙션은 siRNA와 유사하게 수행될 수 있다. 엑소좀은 건강한 공여자의 말초혈액으로부터 분리된 림프구 및 단핵구와 동시배양될 수 있다. 따라서, CRISPR Cas를 함유하는 엑소좀은 인간의 단핵구 및 림프구에 도입될 수 있고 인간에게 자가 조직으로 재도입될 수도 있는 것이 고려될 수 있다. 따라서, 본 발명에 따른 전달 또는 투여는 혈장 엑소좀을 사용하여 실행될 수 있다.
리포좀
본 발명에 따른 전달 또는 투여는 리포좀을 이용하여 실행될 수 있다. 리포좀은 내부 수성 구획을 둘러싸는 단일 또는 다중 라멜라 지질 이중층 및 상대적으로 불투과성인 외측 친지성 인지질 이중층으로 구성된 구체 소낭 구조이다. 리포좀은 이들이 생체적합성, 비독성이기 때문에 약물 전달 담체로서 상당한 관심을 얻었고, 친수성과 친지성 약물 분자를 둘 다 전달할 수 있으며, 혈장 효소에 의한 분해로부터 그들의 카고를 보호하고, 생물학적 막 및 혈액 뇌 장벽(BBB)을 가로질러 그들의 로드를 전달할 수 있다(예를 들어, 검토를 위해 문헌[Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679] 참조).
리포좀은 몇몇 상이한 유형의 지질로부터 만들어질 수 있지만; 약물 담체로서 리포좀을 생성하는 데 인지질이 가장 통상적으로 사용된다. 지질 필름이 수용액과 혼합될 때 리포좀 형성은 자발적이지만, 또한 균질화기, 초음파처리기, 또는 압출 장치를 사용하는 것에 의한 진탕 형태로 힘을 적용함으로써 더 신속히 처리될 수 있다(예를 들어, 검토를 위해 문헌[Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679] 참조).
리포좀의 구조 및 특성을 변형시키기 위해 몇몇 기타 다른 첨가제가 리포좀에 첨가될 수 있다. 예를 들어, 콜레스테롤 또는 스핑고미엘린을 리포좀 혼합물에 첨가하여 리포좀 구조를 안정화시키는 데 도움을 주고 리포좀 내부 카고의 누출을 방지할 수 있다. 추가로, 리포좀을 수소화된 난(egg) 포스파티딜콜린 또는 난 포스파티딜콜린, 콜레스테롤, 및 디세틸 포스페이트로부터 제조하고, 리포좀의 평균 소낭 크기를 약 50 nm 및 100 nm로 조정하였다. (예를 들어, 검토를 위해 문헌[Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679] 참조).
리포좀 제형은 주로 천연 인지질 및 지질, 예컨대 1,2-디스테아로릴-sn-글리세로-3-포스파티딜 콜린(DSPC), 스핑고미엘린, 난 포스파티딜콜린 및 모노시알로강글리오사이드로 구성될 수 있다. 이 제형은 인지질만으로 구성되기 때문에, 리포좀 제형은 다수의 난제와 마주치는데, 그 중 하나는 혈장 내 불안정성이다. 구체적으로 지질막의 조작에서 이들 난제를 극복하기 위한 몇몇 시도가 이루어졌다. 이들 시도 중 하나는 콜레스테롤의 조작에 집중되어 있다. 통상의 제형으로의 콜레스테롤의 첨가는 캡슐화된 생활성 화합물의 혈장 내로의 신속한 방출을 감소시키거나 또는 1,2-디올레오일-sn-글리세로-3-포스포에탄올아민(DOPE)은 안정성을 증가시킨다(예를 들어, 검토를 위해 문헌[Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679] 참조).
특히 유리한 구현예에서, 트로이 목마 리포좀(또한 분자 트로이 목마로 알려져 있음)이 바람직하며, 프로토콜은 http://cshprotocols.cshlp.org/content/2010/4/pdb.prot5407.long에서 찾을 수 있다. 이들 입자는 혈관내 주사 후 전체 뇌로의 이식유전자의 전달을 가능하게 한다. 제한에 의해 구속되지 않고, 표면에 컨쥬게이트된 특이적 항체를 지니는 중성 지질 입자는 엔도시토시스를 통해 혈액 뇌 장벽을 가로지르는 것으로 여겨진다. 본 발명자들은 혈관내 주사를 통해 뇌에 뉴클레아제의 CRISPR 패밀리를 전달하기 위해 트로이 목마 리포좀을 이용하는 것을 가정하는데, 이는 배아 조작에 대한 필요 없이 전체 뇌 유전자이식 동물을 가능하게 할 것이다. 약 1 g 내지 5 g의 DNA 또는 RNA가 리포좀 내 생체내 투여를 위해 고려될 수 있다.
또 다른 구현예에서, CRISPR Cas 시스템 또는 이의 성분은 안정적인 핵산-지질 입자(SNALP)와 같은 리포좀으로 투여될 수 있다(예를 들어, 문헌[Morrissey et al., Nature Biotechnology, Vol. 23, No. 8, August 2005] 참조). SNALP에서 표적화된 특이적 CRISPR Cas의 약 1 ㎎/㎏/일, 3 ㎎/㎏/일 또는 5 ㎎/㎏/일의 매일의 정맥내 주사가 고려된다. 매일의 치료는 약 3 일에 걸쳐 이루어질 수 있고, 이어서 약 5 주 동안 주마다 이루어질 수 있다. 또 다른 구현예에서, 약 1 ㎎/㎏ 또는 2.5 ㎎/㎏의 용량에서 정맥내 주사에 의해 투여되는 특정 CRISPR Cas 캡슐화된 SNALP가 또한 고려된다(예를 들어, 문헌[Zimmerman et al., Nature Letters, Vol. 441, 4 May 2006] 참조). SNALP 제형은 지질 3-N-[(w메톡시폴리(에틸렌 글리콜) 2000) 카바모일]-1,2-디미리스틸옥시-프로필아민(PEG-C-DMA), 1,2-디리놀레일옥시-N,N-디메틸-3-아미노프로판(DLinDMA), 1,2-디스테아로일-sn-글리세로-3-포스포콜린(DSPC) 및 콜레스테롤을 2:40:10:48 몰 백분율 비로 함유할 수 있다(예를 들어, 문헌[Zimmerman et al., Nature Letters, Vol. 441, 4 May 2006] 참조).
또 다른 구현예에서, 안정적인 핵산-지질 입자(SNALP)는 고도로 혈관화된 HepG2-유래 간 종양에 대해 효과적인 전달 분자인 것으로 입증되었지만, 불량하게 혈관화된 HCT-116 유래 간 종양에 대해서는 그렇지 않다(예를 들어, 문헌[Li, Gene Therapy (2012) 19, 775-780] 참조). SNALP 리포좀은 25:1의 지질/siRNA 비 및 48/40/10/2 몰비의 콜레스테롤/D-Lin-DMA/DSPC/PEG-C-DMA를 사용하여 디스테아로일포스파티딜콜린(DSPC), 콜레스테롤 및 siRNA로 D-Lin-DMA 및 PEG-C-DMA를 제형화함으로써 제조될 수 있다. 생성된 SNALP 리포좀은 크기가 약 80 nm 내지 100 nm이다.
또 다른 구현예에서, SNALP는 합성 콜레스테롤(Sigma-Aldrich, 미국 미주리주 세인트루이스 소재), 디팔미토일포스파티딜콜린(Avanti Polar Lipids, 미국 앨라배마주 앨러배스터 소재), 3-N-[(w-메톡시 폴리(에틸렌 글리콜)2000)카바모일]-1,2-디미레스틸옥시프로필아민, 및 양이온성 1,2-디리놀레일옥시-3-N,N디메틸아미노프로판(예를 들어, 문헌[Geisbert et al., Lancet 2010; 375: 1896-905] 참조)를 포함할 수 있다. 예를 들어, 볼루스 정맥내 주입으로서 투여되는 용량당 약 2 ㎎/㎏의 총 CRISPR Cas의 투여량이 고려될 수 있다.
또 다른 구현예에서, SNALP는 합성 콜레스테롤(Sigma-Aldrich), 1,2-디스테아로일-sn-글리세로-3-포스포콜린(DSPC; Avanti Polar Lipids Inc.), PEG-cDMA, 및 1,2-디리놀레일옥시-3-(N;N-디메틸)아미노프로판(DLinDMA)(예를 들어, 문헌[Judge, J. Clin. Invest. 119:661-673 (2009)] 참조)을 포함할 수 있다. 생체내 연구를 위해 사용되는 제형은 약 9:1의 최종 지질/RNA 질량비를 포함할 수 있다.
RNAi 나노의학의 안전성 프로파일은 Alnylam Pharmaceuticals의 Barros 및 Gollob에 의해 검토되었다(예를 들어, 문헌[Advanced Drug Delivery Reviews 64 (2012) 1730-1737] 참조). 안정적인 핵산 지질 입자(SNALP)는 4 가지 상이한 지질, 즉 낮은 pH에서 양이온성인 이온화 가능한 지질(DLinDMA), 중성 헬퍼 지질, 콜레스테롤, 및 확산성 폴리에틸렌 글리콜(PEG)-지질로 구성된다. 입자는 직경이 대략 80 nm이고, 생리학적 pH에서 중성 전하이다. 제형화 동안, 이온화 가능한 지질은 입자 형성 동안 음이온성 RNA와 지질을 축합하는 작용을 한다. 점점 더 산성인 엔도좀 조건 하에 양으로 하전될 때, 이온화 가능한 지질은 또한 RNA의 세포질 내로의 방출을 가능하게 하는 엔도좀 막과 SNALP의 융합을 매개한다. PEG-지질은 입자를 안정화시키고, 제형화 동안 응집을 감소시키며, 후속적으로 약동학적 특성을 개선시키는 외부의 중성 친수성을 제공한다.
지금까지, RNA가 있는 SNALP 제형을 사용하여 2 가지 임상 프로그램을 개시하였다. Tekmira Pharmaceuticals는 최근에 상승된 LDL 콜레스테롤을 지니는 성인 지원자에서 SNALP-ApoB의 I상 단일 용량 연구를 완료하였다. ApoB는 간 및 공장에서 대부분 발현되며, VLDL 및 LDL의 어셈블리 및 분비에 필수적이다. 17 명의 대상체에 단일 용량의 SNALP-ApoB를 제공하였다(7 가지 용량 수준에 걸친 용량 상승). 간 독성의 증거는 없었다(전임상 연구에 기반한 잠재적 용량 제한 독성으로서 예상). 가장 높은 용량에서 (둘 중) 한 명의 대상체는 면역계 자극과 일치되는 감기-유사 증상을 경험하였고, 시험을 끝내는 결정을 하였다.
Alnylam Pharmaceuticals는 상기 기재한 SNALP 기술을 이용하고, TTR 아밀로이드증(ATTR)을 치료하기 위해 돌연변이체와 야생형 TTR 둘 다의 간세포 생성을 표적화하는 유사하게 진보된 ALN-TTR01을 갖는다. 3 가지 ATTR 증후군이 기재되었다: 가족성 아밀로이드성 다발신경병증(FAP) 및 가족성 아밀로이드성 심근증(FAC)(둘 다 TTR에서의 상염색체 우성 돌연변이에 의해 야기됨); 및 야생형 TTR에 의해 야기되는 노인 전신성 아밀로이드증(SSA). ALN-TTR01의 위약 조절, 단일 용량 상승 I상 시험을 ATTR을 지니는 환자에서 최근에 완료하였다. ALN-TTR01을 0.01 ㎎/㎏ 내지 1.0 ㎎/㎏(siRNA 기준)의 용량 범위 내에서 31 명의 환자(연구 약물에 의한 23 명 및 위약에 의한 8 명)에 대한 15 분 IV 주입으로서 투여하였다. 간 기능 시험에서 유의한 증가 없이 치료는 잘 용인되었다. 주입 관련 반응은 0.4 ㎎/㎏ 이상에서 23 명의 환자 중 3 명에서 언급되었고; 모두 주입 속도의 늦춤에 반응하였으며, 모두 연구를 계속하였다. 1 ㎎/㎏의 가장 높은 용량에서 2 명의 환자에서 혈청 사이토카인 IL-6, IP-10 및 IL-1ra의 최소 및 일시적 상승이 언급되었다(전임상 및 NHP 연구로부터 예상되는 바와 같음). 혈청 TTR의 저하, ALN-TTR01의 예상된 약동학적 효과가 1 ㎎/㎏에서 관찰되었다.
또 다른 구현예에서, SNALP는 양이온성 지질, DSPC, 콜레스테롤 및 PEG-지질을, 예를 들어 각각 40:10:40:10의 몰비로, 예를 들어 에탄올 중에 용해시킴으로써 제조될 수 있다(문헌[Semple et al., Nature Niotechnology, Volume 28 Number 2 February 2010, pp. 172-177] 참조). 지질 혼합물을 혼합하면서, 각각 30%(vol/vol) 및 6.1 ㎎/㎖의 최종 에탄올 및 지질 농도로 수성 완충제(50 mM 시트르산염, pH 4)에 첨가하고, 2 분 동안 22℃에서 평형화되게 한 후 압출시켰다. 수화된 지질을 동적 광 산란 분석에 의해 결정될 때 70 nm 내지 90 nm의 소낭 직경이 수득될 때까지 Lipex Extruder(Northern Lipids)를 사용하여 22℃에서 2층 80 nm 기공 크기 필터(Nuclepore)를 통해 압출하였다. 이는 일반적으로 1 회 내지 3 회의 통과를 필요로 하였다. siRNA(30% 에탄올을 함유하는 50 mM 시트르산염, pH 4 수용액 중에 용해)를 혼합하면서 약 5 ㎖/분의 속도로 사전 평형화된(35℃) 소낭에 첨가하였다. 0.06(wt/wt)의 최종 표적 siRNA/지질 비에 도달한 후, 혼합물을 35℃에서 추가 30 분 동안 인큐베이션시켜 소낭 재조직화 및 siRNA의 캡슐화를 가능하게 하였다. 이어서, 에탄올을 제거하고, 투석 또는 접선 유동 정용여과에 의해 외부 완충제를 PBS로 대체하였다(155 mM NaCl, 3 mM Na2HPO4, 1 mM KH2PO4, pH 7.5). siRNA를 제어된 계단식 희석 방법 과정을 사용하여 SNALP에서 캡슐화하였다. KC2-SNALP의 지질 성분은 57.1:7.1:34.3:1.4의 몰비로 사용한 DLin-KC2-DMA(양이온성 지질), 디팔미토일포스파티딜콜린(DPPC; Avanti Polar Lipids), 합성 콜레스테롤(Sigma) 및 PEG-C-DMA였다. 로딩된 입자의 형성시에, SNALP를 PBS에 대해 투석하였고, 사용 전 0.2 μm 필터를 통해 멸균 여과시켰다. 평균 입자 크기는 75 nm 내지 85 nm였고, siRNA의 90% 내지 95%는 지질 입자 내에서 캡슐화되었다. 생체내 시험을 위해 사용한 제형 내 최종 siRNA/지질 비는 약 0.15(wt/wt)였다. 인자 VII siRNA를 함유하는 LNP-siRNA 시스템을 사용 직전에 멸균 PBS 중에서 적절한 농도로 희석시켰고, 제형을 총 10 ㎖/㎏의 부피로 옆 꼬리 정맥을 통해 정맥내로 투여하였다. 이러한 방법 및 이들 전달 시스템은 본 발명의 CRISPR Cas 시스템에 대해 추론될 수 있다.
기타 다른 지질
기타 다른 양이온성 지질, 예컨대 아미노 지질 2,2-디리놀레일-4-디메틸아미노에틸-[1,3]-디옥솔란(DLin-KC2-DMA)은 예를 들어, siRNA와 유사한 CRISPR Cas 또는 이의 성분 또는 이를 코딩하는 핵산 분자(들)를 캡슐화하기 위해 이용될 수 있으며(예를 들어, 문헌[Jayaraman, Angew. Chem. Int. Ed. 2012, 51, 8529 - 8533] 참조), 이런 이유로, 본 발명의 실시에 이용될 수 있다. 다음의 지질 조성물이 있는 사전 형성된 소낭이 고려될 수 있다: 대략 0.05(w/w)의 FVII siRNA/총 지질 비 및 각각 40/10/40/10의 몰비의 아미노 지질, 디스테아로일포스파티딜콜린(DSPC), 콜레스테롤 및 (R)-2,3-비스(옥타데실옥시) 프로필-1-(메톡시 폴리(에틸렌 글리콜)2000)프로필카바메이트(PEG-지질). 70 nm 내지 90 nm 범위의 좁은 입자 크기 분포 및 0.11±0.04(n=56)의 낮은 다분산지수를 보장하기 위해, 입자를 가이드 RNA를 첨가하기 전에 80 nm 막을 통해 최대 3 회까지 압출시킬 수 있다. 매우 강력한 아미노 지질 16을 함유하는 입자가 사용될 수 있으며, 여기서 4 가지 지질 성분, 16, DSPC, 콜레스테롤 및 PEG-지질의 몰비(50/10/38.5/1.5)는 생체내 활성을 향상시키도록 추가로 최적화될 수 있다.
Michael S D Kormann외 다수(문헌["Expression of therapeutic proteins after delivery of chemically modified mRNA in mice: Nature Biotechnology, Volume:29, Pages: 154-157 (2011)])는 RNA를 전달하기 위한 지질 외피의 사용을 기재한다. 지질 외피의 사용은 또한 본 발명에서 바람직하다.
또 다른 구현예에서, 지질은 본 발명의 CRISPR Cas 시스템 또는 이의 성분(들) 또는 이를 코딩하는 핵산 분자(들)와 함께 제형화되어 지질 나노입자(LNP)를 형성할 수 있다. 지질은 DLin-KC2-DMA4, C12-200 및 공지질 디스테로일포스파티딜 콜린을 포함하지만 이들로 제한되지 않으며, 콜레스테롤, 및 PEG-DMG는 자발적 소낭 형성 절차를 사용하여 siRNA 대신 CRISPR Cas를 이용하여 제형화될 수 있다(예를 들어, 문헌[Novobrantseva, Molecular Therapy-핵산s (2012) 1, e4; doi:10.1038/mtna.2011.3] 참조). 성분 몰비는 약 50/10/38.5/1.5(DLin-KC2-DMA 또는 C12-200/디스테로일포스파티딜 콜린/콜레스테롤/PEG-DMG)일 수 있다. 최종 지질:siRNA 중량비는 DLin-KC2-DMA 및 C12-200 지질 나노입자(LNP)의 경우에 각각 약 12:1 및 9:1일 수 있다. 제형은 90% 초과의 포획 효율을 지니는 약 80 nm의 평균 입자 직경을 가질 수 있다. 3 ㎎/㎏ 용량이 고려될 수 있다.
Tekmira는 LNP 및 LNP 제형의 다양한 양태와 관련된 미국 및 해외에서의 대략 95 개의 특허 패밀리의 포트폴리오를 가지며(예를 들어, 미국 특허 7,982,027; 7,799,565; 8,058,069; 8,283,333; 7,901,708; 7,745,651; 7,803,397; 8,101,741; 8,188,263; 7,915,399; 8,236,943 및 7,838,658 및 유럽 특허 1766035; 1519714; 1781593 및 1664316 참조), 이들 모두는 본 발명에 대해 사용되고/사용되거나 적합하게 될 수 있다.
CRISPR Cas 시스템 또는 이의 성분 또는 이를 코딩하는 핵산 분자(들)는 단백질, 단백질 전구체, 또는 단백질 또는 단백질 전구체의 부분적으로 또는 완전히 가공된 형태를 인코딩할 수 있는 변형된 핵산 분자를 포함하는 조성물의 제형의 양태에 관한 미국 출원 공개 20130252281 및 20130245107 및 20130244279(Moderna Therapeutics 출원)에서 추가로 기재된 것과 같은 PLGA 미소구체에서 캡슐화되어 전달될 수 있다. 제형은 몰비 50:10:38.5:1.5 내지 3.0(양이온성 지질:융합생성 지질:콜레스테롤:PEG 지질)을 가질 수 있다. PEG 지질은 PEG-c-DOMG, PEG-DMG로부터 선택될 수 있지만, 이들로 제한되지 않는다. 융합생성 지질은 DSPC일 수 있다. 또한, Schrum외 다수의 미국 출원 공개 20120251618(Delivery and Formulation of Engineered Nucleic Acids)을 참조한다.
나노머 기술은 저분자량 소수성 약물, 펩티드 및 핵산 기반 치료제(플라스미드, siRNA, miRNA)를 포함하는 광범위한 치료제에 대한 생체이용성 난제를 다룬다. 기술이 명확한 이점을 입증한 특정 투여 경로는 경구 경로, 혈액 뇌 장벽을 가로지르는 전달, 고형 종양으로의 전달뿐만 아니라, 눈으로의 전달을 포함한다. 예를 들어, 문헌[Mazza et al., 2013, ACS Nano. 2013 Feb 26;7(2):1016-26]; 문헌Mazza et al., 2013, ACS Nano. 2013 Feb 26;7(2):1016-26]; [Uchegbu and Siew, 2013, J Pharm Sci. 102(2):305-10] 및 [Lalatsa et al., 2012, J Control Release. 2012 Jul 20; 161(2):523-36]을 참조한다.
미국 특허 공개 20050019923은 생활성 분자, 예컨대 폴리뉴클레오티드 분자, 펩티드 및 폴리펩티드 및/또는 약제학적 작용제를 포유동물 신체에 전달하기 위한 양이온성 덴드리머를 기재한다. 덴드리머는, 예를 들어 간, 비장, 폐, 신장 또는 심장(또는 심지어 뇌)으로의 생활성 분자의 전달을 표적화하는 데 적합하다. 덴드리머는 단순한 분지형 단량체 단위로부터 단계적 방식으로 제조된 합성 3-차원 거대분자이며, 이의 특성 및 작용성은 용이하게 제어되고 달라질 수 있다. 덴드리머는 다작용성 코어에 대한(합성에 대한 확산적 접근), 또는 다작용성 코어를 향한(합성에 대한 수렴적 접근) 빌딩 블록의 반복된 첨가로부터 합성되고, 빌딩 블록의 3차원 쉘의 각각의 첨가는 덴드리머의 더 고차 세대의 형성을 야기한다. 폴리프로필렌이민 덴드리머는 디아미노부탄 코어로부터 출발하며, 이것에 일차 아민으로의 아크릴로니트릴의 이중 마이클 첨가(Michael addition)에 의해 아미노기 수의 2 배가 첨가된 후, 니트릴이 수소화된다. 이는 아미노기의 배가를 초래한다. 폴리프로필렌이민 덴드리머는 100% 양성자화 가능한 질소 및 최대 64 개의 말단 아미노기를 함유한다(5세대, DAB 64). 양성자화 가능한 기는 보통 중성 pH에서 양성자를 수용할 수 있는 아민기이다. 유전자 전달제로서 덴드리머의 용도는 컨쥬게이팅 단위로서 각각 아민/아미드 또는 N--P(O2)S의 혼합물과 함께 폴리아미도아민 및 인 함유 화합물의 용도에 크게 집중되어 있는데 유전자 전달을 위한 더 낮은 세대 폴리프로필렌이민 덴드리머의 용도에 대해 보고한 연구는 없었다. 폴리프로필렌이민 덴드리머는 또한 주변 아미노기에 의해 화학적으로 변형될 때 약물 전달을 위해 그리고 게스트 분자의 캡슐화를 위해 pH 감수성 제어 방출 시스템으로서 연구되었다. 세포독성 및 DNA와 폴리프로필렌이민 덴드리머의 상호작용뿐만 아니라 DAB 64의 트랜스펙션 효능이 또한 연구되었다.
미국 특허 공개 20050019923은 이전의 보고와 상반되게 양이온성 덴드리머, 예컨대 폴리프로필렌이민 덴드리머가 유전 물질과 같은 생활성 분자의 표적화된 전달에서 사용하기 위한 적합한 특성, 예컨대 특이적 표적화 및 낮은 독성을 나타낸다는 관찰에 기반한다. 추가적으로, 양이온성 덴드리머의 유도체는 또한 생활성 분자의 표적화된 전달을 위한 적합한 특성을 나타낸다. 또한, 미국 출원 공개 20080267903의 생활성 중합체를 참조하며, 이는 "양이온성 폴리아민 중합체 및 덴드리머 중합체를 포함하는 다양한 중합체가 항증식 활성을 갖는 것으로 나타나며, 따라서 신생물 및 종양과 같은 바람직하지 않은 세포 증식을 특징으로 하는 장애, 염증 장애(자가면역 장애를 포함함), 건선 및 아테롬성 동맥경화증의 치료에 유용할 수 있다. 중합체는 단독으로 활성제로서 또는 기타 다른 치료제, 예컨대 유전자 치료법을 위한 약물 분자 또는 핵산을 위한 전달 비히클로서 사용될 수 있다. 이러한 경우에, 중합체 자체의 고유 항종양 활성은 전달될 작용제의 활성을 보완할 수 있다"고 개시한다. 이들 특허 간행물의 개시 내용은 CRISPR Cas 시스템(들) 또는 이의 성분(들) 또는 이를 코딩하는 핵산 분자(들)의 전달을 위한 본 발명의 교시와 함께 이용될 수 있다.
초하전(supercharged) 단백질
초하전 단백질은 대단히 높은 양 또는 음의 이론적 순전하를 지니는 조작된 또는 천연적으로 발생하는 단백질의 부류이며, CRISPR Cas 시스템(들) 또는 이의 성분(들) 또는 이를 코딩하는 핵산 분자(들)의 전달에 이용될 수 있다. 초음성으로 하전된 단백질과 초양성으로 하전된 단백질은 둘 다 열적으로 또는 화학적으로 유도된 응집을 견뎌내는 현저한 능력을 나타낸다. 초양성으로 하전된 단백질은 또한 포유동물 세포를 침투할 수 있다. 카고와 이들 단백질, 예컨대 플라스미드 DNA, RNA 또는 기타 다른 단백질의 회합은 시험관 내와 생체내 둘 다에서 포유동물 세포 내로 이들 거대분자의 작용성 전달을 가능하게 할 수 있다. David Liu 연구소는 2007년에 초하전 단백질의 생성 및 특성화를 보고하였다(문헌[Lawrence et al., 2007, Journal of the American Chemical Society 129, 10110-10112]).
포유동물 세포 내로의 RNA 및 플라스미드 DNA의 비바이러스 전달은 연구와 치료 응용 둘 다에 대해 가치가 있다(문헌[Akinc et al., 2010, Nat. Biotech. 26, 561-569]). 정제된 +36 GFP 단백질(또는 기타 다른 초양성으로 하전된 단백질)은 적절한 무혈청 배지에서 RNA와 혼합되고, 세포에 첨가 전 복합체화되게 한다. 이 단계에서 혈청의 포함은 초하전 단백질-RNA 복합체의 형성을 억제하고, 치료 효능을 감소시킨다. 다음의 프로토콜은 다양한 세포주에 대해 효과적이 되는 것으로 관찰되었다(문헌[McNaughton et al., 2009, Proc. Natl. Acad. Sci. USA 106, 6111-6116])(그러나, 단백질 및 RNA의 용량을 변화시키는 파일럿 실험은 특정 세포주에 대하여 절차를 최적화하도록 수행되어야 함):
(1) 치료 하루 전, 48-웰 플레이트에서 웰당 1 × 105 개 세포를 도말함.
(2) 치료일에, 최종 농도 200 nM로 무혈청 배지에서 정제된 +36 GFP 단백질을 희석시킴. RNA를 50 nM의 최종 농도로 첨가함. 와류시켜 혼합하고 실온에서 10 분 동안 인큐베이션시킴.
(3) 인큐베이션 동안, 세포로부터 배지를 흡입하고, PBS로 1 회 세척함.
(4) +36 GFP 및 RNA의 인큐베이션 후에, 단백질-RNA 복합체를 세포에 첨가함.
(5) 37℃에서 4 시간 동안 복합체와 세포를 인큐베이션시킴.
(6) 인큐베이션 후에, 배지를 흡입하고, 20 U/㎖ 헤파린 PBS로 3 회 세척함. 활성에 대한 검정에 따라 추가 48 시간 또는 그 이상 동안 혈청-함유 배지와 세포를 인큐베이션시킴.
(7) 세포를 면역블롯, qPCR, 표현형 분석 또는 기타 다른 적절한 방법에 의해 분석함.
David Liu 연구소는 다양한 세포에서 +36 GFP가 효과적인 플라스미드 전달 시약인 것으로 추가로 발견하였다. 플라스미드 DNA는 siRNA보다 더 큰 카고이기 때문에, 비례하여 더 많은 +36 GFP 단백질이 효과적으로 플라스미드와 복합체화하는 데 필요로 한다. 효과적인 플라스미드 전달을 위해, 출원인들은 인플루엔자 바이러스 혈구응집소 단백질로부터 유래된 공지된 엔도좀-파괴 펩티드인 C-말단의 HA2 펩티드 태그를 보유하는 +36 GFP의 변이체를 개발하였다. 다음의 프로토콜은 다양한 세포에서 효과적이었지만, 상기와 같이 플라스미드 DNA 및 초하전 단백질 용량이 특정 세포주 및 전달 응용분야를 위해 최적화되는 것이 권장된다:
(1) 치료 하루 전, 48-웰 플레이트에서 웰당 1 × 105 개를 도말함.
(2) 치료일에, 최종 농도 2 mM로 무혈청 배지에서 정제된 þ36 GFP 단백질을 희석시킴. 1 ㎎의 플라스미드 DNA를 첨가함. 와류시켜 혼합하고 실온에서 10 분 동안 인큐베이션시킴.
(3) 인큐베이션 동안, 세포로부터 배지를 흡입하고, PBS로 1 회 세척함.
(4) þ36 GFP 및 플라스미드 DNA의 인큐베이션 후에, 단백질-DNA 복합체를 세포에 온건하게 첨가함.
(5) 37C에서 4 시간 동안 복합체와 세포를 인큐베이션시킴.
(6) 인큐베이션 후에, 배지를 흡입하고, PBS로 세척함. 혈청-함유 배지에서 세포를 인큐베이션시키고 추가 24 시간 내지 48 시간 동안 인큐베이션시킴.
(7) 적절하다면(예를 들어, 플라스미드-유도 유전자 발현에 의해) 플라스미드 전달을 분석함.
또한, 예를 들어, 문헌[McNaughton et al., Proc. Natl. Acad. Sci. USA 106, 6111-6116 (2009)]; [Cronican et al., ACS Chemical Biology 5, 747-752 (2010)]; [Cronican et al., Chemistry & Biology 18, 833-838 (2011)]; [Thompson et al., Methods in Enzymology 503, 293-319 (2012)]; [Thompson, D.B., et al., Chemistry & Biology 19 (7), 831-843 (2012)]을 참조한다. 초하전된 단백질의 방법은 본 발명의 CRISPR Cas 시스템의 전달을 위해 사용되고/사용되거나 이를 위해 적합하게 될 수 있다. Lui 박사 및 본 명세서의 교시와 함께 본 명세서의 문헌의 이들 시스템은 CRISPR Cas 시스템(들) 또는 이의 성분(들) 또는 이를 코딩하는 핵산 분자(들)의 전달에 이용될 수 있다.
세포 투과성 펩티드(CPP)
또 다른 구현예에서, 세포 투과성 펩티드(CPP)가 CRISPR Cas 시스템의 전달을 위해 고려된다. CPP는 다양한 분자 카고(나노크기 입자로부터 작은 화학 분자 및 DNA의 큰 단편까지)의 세포 흡수를 용이하게 하는 짧은 펩티드이다. 본 명세서에서 사용된 바와 같은 용어 "카고"는 치료제, 진단 프로브, 펩티드, 핵산, 안티센스 올리고뉴클레오티드, 플라스미드, 단백질, 입자(나노입자를 포함함), 리포좀, 발색단, 소분자 및 방사성 물질로 이루어진 군을 포함하지만 이에 제한되지 않는다. 본 발명의 양태에서, 카고는 또한 CRISPR Cas 시스템의 임의의 성분 또는 전체 작용성 CRISPR Cas 시스템을 포함할 수 있다. 본 발명의 양태는 하기를 포함하는, 원하는 카고를 대상체로 전달하는 방법을 제공한다: (a) 본 발명의 세포 투과성 펩티드 및 원하는 카고를 포함하는 복합체를 제조하는 단계, 및 (b) 대상체에게 복합체를 경구, 관절내, 복강내, 척추강내, 동맥내, 비강내, 뇌실내, 피하내, 근육내, 정맥내, 피부, 직장내, 또는 국소투여하는 단계. 카고는 공유 결합을 통한 화학적 결합 또는 비-공유 상호작용을 통해 펩티드와 회합된다.
CPP의 기능은 카고를 세포로 전달하는 것이며, 살아있는 포유동물 세포의 엔도솜으로 전달된 카고의 엔도시토시스를 통해 일반적으로 발생하는 공정이다. 세포-침투성 펩티드는 상이한 크기, 아미노산 서열, 및 전하를 가지지만, 모든 CPP가, 혈장 막을 전위시키고 세포질 또는 세포소기관으로 다양한 분자 카고의 전달을 용이하게 하는 능력인 하나의 별개 특징을 갖는다. CPP 전위는 3 개의 주요 엔트리 메커니즘으로 분류될 수 있다: 막에서의 직접 투과, 엔도시토시스-매개 엔트리, 및 일시적 구조의 형성을 통한 전위. CPP는 암을 포함하는 상이한 질병의 치료에서 약물 전달제, 바이러스 억제제뿐만 아니라, 세포 표지화를 위한 조영제로서 의약에서의 많은 적용이 발견되었다. 후자의 예는 GFP에 대한 담체, MRI 조영제, 또는 양자점으로서 작용하는 것을 포함한다. CPP는 연구 및 의약에서의 용도에서 시험관 내 및 생체내 전달 벡터로서 훌륭한 잠재성을 보유한다. CPP는 통상적으로 리신 또는 아르기닌과 같은 상대적으로 풍부한 양전하 아미노산을 함유하거나 극성/전하 아미노산 및 비-극성 소수성 아미노산의 교대 패턴을 함유하는 서열을 갖는 아미노산 조성물을 갖는다. 이들 2 가지 유형의 구조는 각각 다가이온성 또는 양친매성으로서 지칭된다. CPP의 세번째 부류는 낮은 순 전하를 갖는 극성 잔기만을 함유하는 소수성 펩티드이거나, 세포 흡수에 결정적인 소수성 아미노산 그룹을 갖는다. 발견된 초기 CPP 중 하나는 배양에서 많은 세포 유형에 의해 배지 주위로부터 효율적으로 취득되어 발견되는 인간 면역결핍 바이러스 1(HIV-1)로부터의 트랜스-활성화 전사 활성화제(Tat)였다. 그 이후부터, 많은 공지된 CPP는 상당히 확장되었으며 더 효과적인 단백질 형질도입 특성을 갖는 소분자 합성 유사체가 생성되었다. CPP는 페너트라틴, Tat(48-60), 트란스포르탄, 및 (R-AhX-R4)(Ahx=아미노헥사노일)을 포함하지만 이에 제한되지 않는다.
미국 특허 8,372,951은 높은 세포-투과 효율 및 낮은 독성을 나타내는 호산구 양이온성 단백질(ECP)으로부터 유래된 CPP를 제공한다. 척추동물 대상체로 CPP를 이의 카고와 함께 전달하는 양태가 또한 제공된다. CPP 및 이의 전달의 추가 양태는 미국 특허 8,575,305; 8;614,194 및 8,044,019에 기재되어 있다. CPP는 CRISPR-Cas 시스템 또는 이의 성분을 전달하기 위해 사용될 수 있다. CPP가 CRISPR-Cas 시스템 또는 이의 성분을 전달하기 위해 이용될 수 있는 것은 또한 본원에 전체가 참고로 포함된, Suresh Ramakrishna, Abu-Bonsrah Kwaku Dad, Jagadish Beloor외 다수의 문헌["Gene disruption by cell-penetrating peptide-mediated delivery of Cas9 protein and guide RNA", Gees.nome R 2014 Apr 2. [인쇄 전 전자논문상태]]에서 제공되며, 여기에서 CPP-컨쥬게이트된 재조합 Cas9 단백질 및 CPP-복합체화 가이드 RNA를 이용한 치료가 인간 세포주에서의 내인성 유전자 파괴를 이끌어냄이 입증되었다. 이 논문에서 Cas9 단백질은 티오에스테르 결합을 통해 CPP에 컨쥬게이트되는 반면, 가이드 RNA는 CPP와 복합체화되어, 축합된 양으로 하전된 입자를 형성한다. 변형된 Cas9 및 가이드 RNA와 함께, 배아 줄기 세포, 피부 섬유아세포, HEK293T 세포, HeLa 세포, 및 배아 암종 세포를 포함하는 인간 세포의 동시 및 순차적 치료가 플라스미드 트랜스펙션에 비하여 감소된 표적외 돌연변이로 효율적인 유전자 파괴를 이끌어냄을 나타내었다.
이식 가능한 장치
또 다른 구현예에서, CRISPR Cas 시스템 또는 이의 성분(들) 또는 이를 코딩하는 핵산 분자(들)의 전달을 위해 이식 가능한 장치가 또한 고려된다. 예를 들어, 미국 특허 공개 20110195123은 국소적으로 그리고 연장된 기간 동안 약물을 용리하는 이식 가능한 의료 장치(이러한 장치의 몇 가지 유형, 실행의 처리 방식 및 이식 방법을 포함함)가 제공됨을 개시한다. 장치는 중합체 기질, 예컨대 매트릭스, 예를 들어 장치 몸체로서 사용되는 매트릭스, 및 약물, 및 일부 경우에 추가적인 스캐폴딩 재료, 예컨대 금속 또는 추가적인 중합체, 및 가시성 및 영상화를 향상시키는 재료를 포함한다. 이식 가능한 전달 장치는 국소적인, 그리고 연장된 기간에 걸친 방출을 제공하는 데 유리할 수 있으며, 여기서 약물은, 예컨대 종양, 염증, 변성과 같은 병에 걸린 영역의 세포외 매트릭스(ECM)로 직접 방출되거나, 증상 목표를 위해, 또는 손상된 평활근 세포에 또는 예방을 위해 방출된다. 한 종류의 약물은 상기 개시된 바와 같은 RNA이며, 이러한 시스템은 본 발명의 CRISPR Cas 시스템에 사용될 수 있고/있거나 적합하게 될 수 있다. 일부 구현예에서 이식 방식은 근접 치료법 및 바늘 생검을 포함하는 기타 다른 치료를 위해 오늘날 개발되고 사용되는 기존의 이식 절차이다. 이러한 경우에, 본 발명에 기재된 새로운 이식물의 치수는 본래의 이식물과 유사하다. 통상적으로 소수의 장치는 동일한 치료 절차 동안 이식된다.
미국 특허 공개 20110195123은, 복강과 같은 강에 적용 가능한 시스템을 포함하는 약물 전달 이식 가능한 또는 삽입 가능한 시스템 및/또는 임의의 기타 다른 유형의 투여를 제공하며, 여기서, 예를 들어 선택적으로 매트릭스일 수 있는 생체안정성 및/또는 분해가능 및/또는 생체흡수성 중합체성 기질을 포함하는 약물 전달 시스템은 고정 또는 부착되지 않는다. 용어 "삽입"은 또한 이식을 포함하는 것을 주목하여야 한다. 약물 전달 시스템은 바람직하게 미국 특허 공개 20110195123에 기재된 바와 같은 "로더(Loder)"로서 실행된다.
중합체 또는 복수의 중합체는 생체적합성이며, 제어된 속도로 작용제를 방출시킬 수 있는 작용제 및/또는 복수의 작용제를 혼입하며, 중합체성 기질, 예컨대 일부 구현예에서 매트릭스의 총 부피는, 선택적으로 그리고 바람직하게는 작용제의 치료 수준이 도달되게 하는 최대 부피 이하이다. 비제한적 예로서, 이러한 부피는 작용제 로드를 위한 부피에 의해 필요한 바와 같은 바람직하게는 0.1 ㎥ 내지 1000 ㎣ 범위 내에 있다. 로더는, 예를 들어 크기가 작용성에 의해 결정되는 장치, 예를 들어 제한 없이, 무릎 관절, 자궁내 또는 자궁경부 링 등과 함께 혼입될 때, 선택적으로 더 클 수 있다.
(조성물을 전달하기 위한) 약물 전달 시스템은 바람직하게 일부 구현예에서 분해성 중합체를 이용하도록 설계되거나(주요 방출 메카니즘은 벌크 침식(bulk erosion)임); 또는 일부 구현예에서, 비분해성 또는 서서히 분해되는 중합체가 사용되며(주요 방출 메카니즘은 벌크 침식보다는 확산임), 따라서 외부는 막으로서 기능하고, 내부는 약물 저장소로서 기능하는데, 이는 연장된 기간(예를 들어, 약 1 주 내지 약 수 개월) 동안 주변에 의해 실제로 영향받지 않는다. 상이한 방출 메카니즘을 지니는 상이한 중합체의 조합이 또한 선택적으로 사용될 수 있다. 표면에서 농도 기울기는 바람직하게 총 약물 방출 기간의 상당한 기간 동안 효과적으로 일정하게 유지되고, 따라서 확산 속도는 효과적으로 일정하다("제로 방식" 확신으로 지칭됨). 용어 "일정한"은 더 낮은 치료적 유효성의 역치 초과로 바람직하게 유지되지만, 여전히 선택적으로 초기 버스트를 특징으로 하고/하거나 변동할 수 있는, 예를 들어 특정 정도로 증가 및 감소할 수 있는 확산 속도를 의미한다. 확산 속도는 바람직하게 연장된 기간 동안 이렇게 유지되며, 치료적으로 효과적인 기간, 예를 들어 효과적인 침묵화 기간을 최적화하기 위해 특정 수준으로 일정한 것으로 고려될 수 있다.
약물 전달 시스템은 선택적으로 그리고 바람직하게는 성질이 화학물질이든 대상체의 체내의 효소 및 기타 다른 인자로부터의 공격에 기인하든, 분해로부터 뉴클레오티드 기반 치료제를 보호하도록 설계된다.
미국 특허 공개 20110195123의 약물 전달 시스템은 장치의 이식 시 및/또는 이식 후에, 활성화 및/또는 가속화/감속화의 비침습적 및/또는 최소 침습적 방법에 의해 작동되는 감지 및/또는 활성화 기기와 선택적으로 연동되며, 예를 들어 선택적으로 제한되는 것은 아니지만, 열적인 가열 및 냉각, 레이저 빔 및 집속 초음파 및/또는 RF(무선주파수)를 포함하는 초음파 방법 또는 장치를 포함한다.
미국 특허 공개 20110195123의 일부 구현예에 따르면, 국소 전달을 위한 부위는 선택적으로 종양을 포함하는 세포의 고도 비정상 증식, 및 억제된 아폽토시스, 자가면역질병 상태를 포함하는 활성 및 또는 만성 염증 및 감염, 근육 및 신경 조직을 포함하는 변성 조직, 만성 통증, 변성 부위, 및 뼈 골절 위치 및 조직 재생의 향상을 위한 기타 다른 상처 위치, 및 손상된 심근, 평활근 및 횡문근을 특징으로 하는 표적 부위를 포함할 수 있다.
조성물의 이식을 위한 부위, 또는 표적 부위는 바람직하게 표적화된 국소 전달에 충분히 작은 반경, 면적 및/또는 부피를 특징으로 한다. 예를 들어, 표적 부위는 선택적으로 약 0.1 ㎜ 내지 약 5 ㎝ 범위의 직경을 가진다.
표적 부위의 위치는 바람직하게 최대 치료 효능에 대해 선택된다. 예를 들어, 약물 전달 시스템의 조성물(선택적으로 상기 기재한 바와 같은 이식을 위한 장치와 함께)은 선택적으로 그리고 바람직하게는 종양 환경, 또는 이들의 연관된 혈액 공급 내에서 또는 이에 근접하여 이식된다.
예를 들어 조성물은 (선택적으로 장치와 함께) 선택적으로 췌장, 전립선, 유방, 간 내에 또는 그에 근접하여, 니플을 통해, 혈관계 내 등에 이식된다.
표적 위치는 (선택적으로 체내의 임의의 부위가 로더를 이식하는데 적합할 수 있기 때문에 단지 비제한적 예로서): 1. 기저핵, 백질 및 회백질에서 파킨슨병 또는 알츠하이머병에서와 같은 변성 부위의 뇌; 2. 근위축성 측삭경화증(ALS)의 경우에서와 같은 척추; 3. HPV 감염을 예방하기 위한 자궁경부; 4. 활성 및 만성 염증 관절; 5. 건선의 경우에서와 같은 진피; 6. 진통 효과를 위한 교감 및 감각 신경 부위; 7. 골내이식; 8. 급성 및 만성 감염 부위; 9. 질내; 10. 내이--청각기관, 내이의 미로, 전정계; 11. 기관내; 12. 심장내; 관상동맥, 심외막; 13. 방광; 14. 담도계; 15. 신장, 간, 비장을 포함하지만, 이들로 제한되지 않는 실질세포; 16. 림프절; 17. 침샘; 18. 치과용 수지; 19. 관절내(관절 내로); 20. 안내; 21. 뇌조직; 22. 뇌실; 23. 복강을 포함하는 강(예를 들어, 제한되는 것은 아니지만, 난소암); 24. 식도내 및 25. 직장내를 포함하거나, 이로 본질적으로 이루어지거나, 이로 이루어진 군으로부터 선택적으로 선택된다.
선택적으로 시스템의 삽입(예를 들어, 조성물을 함유하는 장치)은 표적 부위의 및 이러한 부위 부근의, 국소 pH 및/또는 온도 및/또는 ECM 내 약물의 확산 및/또는 약물 역학에 영향을 미치는 기타 다른 생물학적 인자에 영향을 미치도록 하는 표적 부위 및 해당 부위 부근에서 ECM에 대한 물질의 주사와 연관된다.
선택적으로, 일부 구현예에 따르면, 상기 작용제의 방출은 삽입 전 및/또는 삽입 시 및/또는 삽입 후, 레이저빔, 조사, 열적 가열 및 냉각, 및 집속 초음파 및/또는 RF(무선주파수)를 포함하는 초음파 방법 또는 장치 및 화학적 활성화제를 포함하는 활성화 및/또는 가속화/감속화의 비침습적 및/또는 최소 침습적 및/또는 그 밖의 방법에 의해 작동되는 감지 및/또는 활성화 기기와 연관될 수 있었다.
미국 특허 공개 20110195123의 다른 구현예에 따르면, 약물은 바람직하게, 예를 들어 이하에 기재되는 바와 같이 유방, 췌장, 뇌, 신장, 방광, 폐 및 전립선에서 국소화된 암 경우를 위한 RNA를 포함한다. RNAi로 예시되지만, 약물이 로더 기질, 예컨대 매트릭스와 함께 캡슐화될 수 있는 한, 다수 약물이 로더에서 캡슐화되어 적용 가능하고, 본 발명과 함께 사용될 수 있으며, 이러한 시스템이 본 발명의 CRISPR Cas 시스템을 전달하는 데 사용되고/사용되거나 그에 적합하게 될 수 있다.
구체적 적용의 또 다른 예로서, 신경 및 근육 변성 질병은 비정상 유전자 발현에 기인하여 발생한다. RNA의 국소 전달은 이러한 비정상 유전자 발현을 방해하는 치료적 특성을 가질 수 있다. 작은 약물 및 거대분자를 포함하는 아폽토시스방지, 염증방지 및 변성방지 약물의 국소 전달은 또한 선택적으로 치료적일 수 있다. 이러한 경우에, 로더는 일정한 속도로 및/또는 별도로 이식되는 전용 장치를 통해 연장된 방출을 위해 적용된다. 이것 모두는 본 발명의 CRISPR Cas 시스템에 사용될 수 있고/있거나 적합하게 될 수 있다.
구체적 적용의 또 다른 예로서, 정신과적 및 인지 장애가 유전자 변형자를 이용하여 치료된다. 유전자 낙다운은 치료적 선택사항이다. 중추 신경계 부위에 작용제를 국소적으로 전달하는 로더는 정신병, 양극성 질병, 신경성 장애 및 행동 병폐를 포함하지만, 이들로 제한되지 않는 정신과적 및 인지 장애에 대한 치료적 선택사항이다. 로더는 또한 특정 뇌 부위에 이식시 작은 약물 및 거대분자를 포함하는 약물을 국소적으로 전달할 수 있었다. 이것 모두는 본 발명의 CRISPR Cas 시스템에 사용될 수 있고/있거나 적합하게 될 수 있다.
구체적 적용의 또 다른 예로서, 국소 부위에서 선천성 및/또는 적응성 면역 매개체의 침묵화는 기관 이식 거부를 예방할 수 있다. 이식된 기관 및/또는 이식된 부위에 이식된 로더를 이용한 RNA 및 면역조절 시약의 국소 전달은 이식 기관에 대해 활성화된 CD8과 같은 면역 세포를 퇴치함으로써 국소 면역 억제를 제공한다. 이것 모두는 본 발명의 CRISPR Cas 시스템에 사용될 수 있고/있거나 적합하게 될 수 있다.
구체적 적용의 또 다른 예로서, VEGF 및 안지오제닌 등을 포함하는 혈관 성장 인자는 신혈관형성에 필수적이다. 인자, 펩티드, 펩티드모방체의 국소 전달 또는 이들의 억제제의 억제는 중요한 치료적 양식이며; 억제제의 침묵화 및 로더를 이용한 혈관형성을 자극하는 인자, 펩티드, 거대분자 및 작은 약물의 국소 전달은 말초, 전신 및 심혈관 질병에 대하여 치료적이다.
이식과 같은 삽입 방법은 선택적으로 기타 다른 유형의 조직 이식을 위해 및/또는 삽입을 위해 및/또는 조직 샘플링을 위해 선택적으로 변형 없이, 또는 대안적으로 선택적으로 이러한 방법에서 주요하지 않은 변형만을 이용하여 이전에 사용될 수 있다. 이러한 방법은 선택적으로 근접치료 방법, 생검, 초음파와 함께 및/또는 초음파 없이 내시경, 예컨대 ERCP, 뇌 조직 내로의 정위적 방법, 관절, 복부 기관, 방광벽 및 체강 내로의 복강경의 이식을 포함하는 복강경검사를 포함하지만, 이들로 제한되지 않는다.
본 명세서에서 논의된 이식가능한 장치 기술이 본 명세서의 교시와 함께 이용될 수 있으며, 이에 따라 본 개시 내용 및 당업계의 지식에 의해, CRISPR-Cas 시스템 또는 이의 성분 또는 이의 핵산 분자 또는 성분의 인코딩 또는 제공이 이식가능한 장치를 통해 전달될 수 있다.
환자-특이적 스크리닝 방법
DNA, 예를 들어 트리뉴클레오티드 반복부를 표적화하는 핵산-표적화 시스템을 사용하여 이러한 반복부의 존재에 대하여 환자 또는 환자 샘플을 스크리닝할 수 있다. 반복부는 핵산-표적화 시스템의 RNA의 표적일 수 있으며, 핵산-표적화 시스템에 의한 이로의 결합이 존재한다면, 결합을 검출하여, 이러한 반복부가 존재하는 것을 나타낼 수 있다. 따라서, 핵산-표적화 시스템을 사용하여 환자 또는 환자 샘플을 반복부의 존재에 대하여 스크리닝할 수 있다. 그 다음, 환자에게 질환을 다루기 위한 적합한 화합물(들)을 투여할 수 있거나; 또는 이에 결합하고 삽입, 결실 또는 돌연변이를 야기하며, 질환을 완화시키는 핵산-표적화 시스템을 투여할 수 있다.
본 발명은 핵산을 사용하여 표적 DNA 서열에 결합한다.
CRISPR 이펙터 단백질 mRNA 및 가이드 RNA
CRISPR 효소 mRNA 및 가이드 RNA는 또한 별도로 전달될 수 있다. CRISPR 효소 mRNA는 가이드 RNA 전에 전달되어 CRISPR 효소가 발현될 시간을 제공할 수 있다. CRISPR 효소 mRNA는 가이드 RNA 투여 1 시간 내지 12 시간(바람직하게는, 약 2 시간 내지 6 시간) 전에 투여될 수 있다.
대안적으로, CRISPR 효소 mRNA 및 가이드 RNA는 함께 투여될 수 있다. 유리하게, 가이드 RNA의 제2 부스터 용량은 CRISPR 효소 mRNA + 가이드 RNA의 초기 투여 1 시간 내지 12 시간(바람직하게는, 약 2 시간 내지 6 시간) 이후에 투여될 수 있다.
본 발명의 CRISPR 이펙터 단백질, 즉 Cpf1 이펙터 단백질은 때때로 본 명세서에서 CRISPR 효소로 지칭된다. 이펙터 단백질은 효소를 기반으로 하거나 효소로부터 유래되어, 따라서 용어 '이펙터 단백질'은 일부 구현예에서 확실히 '효소'를 포함하는 것으로 이해될 것이다.
그러나, 또한 이펙터 단백질은, 일부 구현예에서 요구되는 바와 같이, DNA 결합을 가질 수 있지만, 반드시 데드-Cas 이펙터 단백질 기능을 포함하여 절단 또는 닉킹, 활성을 필요로 하는 것은 아님을 이해할 것이다.
CRISPR 효소 mRNA 및/또는 가이드 RNA의 추가적인 투여는 가장 효율적인 수준의 게놈 변형을 달성하기 위해 유용할 수 있다. 일부 구현예에서, 표현형 변경은 특히 치료 방법에서, 바람직하게는 표현형의 편집 또는 변경을 위해 수복 주형이 제공된 경우에서, 바람직하게는 유전적 질병이 표적화된 경우 게놈 변형의 결과이다.
일부 구현예에서, 표적화될 수 있는 질병은 질병-유발 스플라이스 결함과 연관이 있는 것들을 포함한다.
일부 구현예에서, 세포 표적은, 조혈 줄기/선조 세포(CD34+); 인간 T 세포; 및 눈(망막 세포)(예를 들어, 광수용체 전구 세포)를 포함한다.
일부 구현예에서, 유전자 표적은, 인간 베타 글로빈 - HBB((내인성 주형으로서 밀접하게 관련된 HBD 유전자를 사용하여 )유전자-전환을 자극시키는 것을 포함하는, 겸상 적혈구 빈혈증의 치료를 위함); CD3(T-세포); 및 CEP920 - 망막(눈)을 포함한다.
일부 구현예에서, 질병 표적은 또한, 암; 겸상 적혈구 빈혈증(점 돌연변이를 기반으로 함); HIV; 베타-지중해빈혈(Beta-Thalassemia); 및 안과질환 또는 안 질환(예를 들어, 레베르 선천성 흑암시(Leber Congenital Amaurosis; LCA)-유발 스플라이스 결함을 포함한다.
암 치료의 맥락에서 특정 관심 표적은 종양유전자, 예컨대 PIK3CA 또는 KRAS이다. 특정 구현예에서, Cpf1 이펙터 단백질은 기능 획득 RAS 돌연변이체 유전자를 낙아웃시킴으로써 종양을 파괴하기 위해 사용된다. 작은 GTPase 상과인 ras 유전자 과의 구성원은 폐 선암종, 장액성 선종, 췌장의 유관 암종 및 대장 암종을 포함하는 다양한 악성종양에 연루된다. RAS 종양유전자를 표적화히기에 적합한 가이드 서열의 예는 해당 분야에 알려져 있으며, CTGAATTAGCTGTATCGTCA(SEQ ID NO: ) 및 GAATATAAACTTGTGGTAGT(SEQ ID NO: )를 포함하나 이에 제한되지 않는다.
일부 구현예에서, 전달 방법은, 효소-가이드 복합체(리보뉴클레오단백질)의 양이온 지질 매개 "직접" 전달 및 플라스미드 DNA의 전기천공을 포함한다.
본 발명의 방법은, dsODN 또는 ssODN일 수 있는 수복 주형과 같은 주형의 전달을 추가로 포함할 수 있으며, 하기를 참조한다. 주형의 전달은 임의의 또는 모든 CRISPR 효소 또는 가이드의 전달과 함께 또는 이와 분리된 전달을 통해 그리고 동일하거나 상이한 전달 메커니즘을 통한 것일 수 있다. 일부 구현예에서, 주형은 가이드와 함께, 바람직하게는 또한 CRISPR 효소와 함께 전달되는 것이 바람직하다. 예는, AAV 벡터일 수 있다.
본 발명의 방법은 (a) 상기 이중 가닥 파손에 의해 형성된 오버행에 대해 상보적인 오버행을 포함하는 이중-가닥 올리고데옥시뉴클레오티드(dsODN)를 세포로 전달하는 것으로서, 상기 dsODN은 관심 유전자 내로 통합되는 것; 또는 (b) 단일-가닥 올리고데옥시뉴클레오티드(ssODN)를 세포로 전달하는 것으로서, 상기 ssODN은 상기 이중 가닥 파손의 상동 직접 수복을 위한 주형으로서 작용하는 것을 추가로 포함할 수 있다. 본 발병의 방법은 개인에서 질병의 예방 또는 치료를 위한 것일 수 있으며, 선택적으로 상기 질병은 상기 관심 유전자좌에서의 결함에 의해 유발된다. 본 발명의 방법은 개인에서 생체내에서 또는 개인으로부터 취한 세포 상에서 생체 외에서 수행될 수 있으며, 여기서 선택적으로 상기 세포는 개인에게 되돌려진다.
독성 및 표적외 효과의 최소화를 위해, 전달되는 CRISPR 효소 mRNA 및 가이드 RNA의 농도를 제어하는 것이 중요할 것이다. CRISPR 효소 mRNA 및 가이드 RNA의 최적 농도는 세포 또는 동물 모델에서 상이한 농도를 시험하고, 잠재적인 표적외 게놈 유전자좌에서 변형 정도를 분석하는 딥 시퀀싱을 사용함으로써 결정될 수 있다. 예를 들어, 인간 게놈의 EMX1 유전자에서 5'-GAGTCCGAGCAGAAGAAGAA-3'을 표적화하는 가이드 서열에 있어서, 딥 시퀀싱을 사용하여 2 가지 표적외 유전자좌, 즉 1: 5'-GAGTCCTAGCAGGAGAAGAA-3' 및 2: 5'-GAGTCTAAGCAGAAGAAGAA-3'에서의 변형 수준을 평가할 수 있다. 표적외 변형의 수준을 최소화하면서 표적상 변형의 가장 높은 수준을 제공하는 농도가 생체내 전달을 위하여 선택되어야 한다.
유도성 시스템
일부 구현예에서, CRISPR 효소는 유도성 시스템의 성분을 형성할 수 있다. 시스템의 유도성 성질은 에너지 형태를 사용하여 유전자 편집 또는 유전자 발현의 시공간적 제어를 가능하게 할 것이다. 에너지의 형태는 이로 제한되지 않지만, 전자기 방사, 음향 에너지, 화학 에너지 및 열 에너지를 포함할 수 있다. 유도성 시스템의 예는 테트라사이클린 유도성 프로모터(Tet-온(Tet-On) 또는 Tet-오프(Tet-Off)), 소분자 2-하이브리드 전사 활성화 시스템(FKBP, ABA 등), 또는 광 유도성 시스템(피토크롬, LOV 도메인, 또는 크립토크롬)을 포함한다. 일 구현예에서, CRISPR 효소는 서열-특이적 방식으로 전사 활성에서의 변화를 유도하기 위한 광 유도성 전사 이펙터(LITE)의 일부일 수 있다. 광의 성분은 CRISPR 효소, 광-반응성 시토크롬 이형이량체(예를 들어, 아라비돕시스 탈리아나(Arabidopsis thaliana) 유래), 및 전사 활성화/억제 도메인을 포함할 수 있다. 유도성 DNA 결합 단백질 및 이의 사용을 위한 방법의 추가의 예는 미국 61/736,465호, 미국 61/721,283호 및 WO 2014/018423 A2호 및 US8889418호, US8895308호, US20140186919호, US20140242700호, US20140273234호, US20140335620호, WO2014093635호에서 제공되며, 이는 전체가 참고로 본 명세서에 포함된다.
본 발명은 조건적 또는 유도성 CRISPR 유전자이식 세포/동물을 확립하고 이용하기 위한 본 발명의 조성물의 용도를 이해하며; 예를 들어, 문헌[Platt et al., Cell (2014), 159(2): 440-455] 또는 본원에 인용된 PCT 특허 공보, 예컨대 WO 2014/093622호(PCT/US2013/074667호)를 참조한다. 예를 들어, 세포 또는 동물, 예컨대 비-인간 동물, 예를 들어, 척추동물 또는 포유류, 예컨대 설치류, 예를 들어, 마우스, 랫트 또는 기타 실험용 또는 사육 동물, 예를 들어, 고양이, 개, 양 등은 '낙-인'될 수 있으며, 이로 인해 동물은 조건적으로 또는 유도성으로 Cpf1(본원에 기재된 바와 같은 변형된 Cpf1 중 임의의 것 포함)을 Platt 등과 유사하게 발현한다. 표적 세포 또는 동물은 이에 따라 조건적 또는 유도적으로(예를 들어, Cre 의존성 작제물의 형태로) CRISRP 효소(예를 들어, Cpf1) 및/또는 조건적으로 또는 유도적으로 어댑터 단백질을 포함하고, 표적 세포 내로 도입된 벡터의 발현시, 그 벡터는 표적 세포에서 CRISRP 효소(예를 들어, Cpf1) 발현 및/또는 어댑터 발현의 조건을 유도하거나 이 조건이 생기게 하는 것을 발현한다. CRISPR 복합체 생성을 위한 알려진 방법을 이용하여 본 발명의 교시 및 조성물을 적용함에 의한 유도성 게놈 이벤트 또한 본 발명의 일 양태이다. 이의 단지 하나의 예는 CRISPR 낙-인/조건적 유전자이식 동물(예를 들어, Lox-Stop-polyA-Lox(LSL) 카세트를 포함하는 예를 들어, 마우스)의 생성 및 하나 이상의 (변형된) gRNA(예를 들어, 유전자 활성 목적을 위한 관심 표적 유전자의 -200 뉴클레오티드 내지 TSS, 예를 들어, 코트 단백질, 예를 들어, MS2에 의해 인식되는 하나 이상의 어댑터가 있는 변형된 gRNA), 본원에 기재된 바와 같은 하나 이상의 어댑터 단백질(하나 이상의 VP64에 연결된 MS2 결합 단백질) 및 조건적 동물을 유도하기 위한 수단(예를 들어, Cpf1 발현을 유도 가능하게 하기 위한 Cre 재조합효소)을 제공하는 하나 이상의 조성물의 이후의 전달이다. 대안적으로, 어댑터 단백질은 조건적 또는 유도성 CRISPR 효소와 함께 조건적 또는 유도성 요소로서 제공되어, 스크리닝 목적을 위한 효율적인 모델을 제공할 수 있으며, 이는 유리하게는 넓은 범위의 응용을 위한 특정 gRNA의 최소의 설계 및 투여만을 필요로 한다.
불안정화 도메인을 갖거나 이와 회합된 본 발명에 따른 효소
일 양태에서, 본 발명은 적어도 하나의 불안정화 도메인(DD)과 회합된 본원의 다른 곳에 기재된 바와 같은 Cpf1을 제공하며; 약칭을 위하여, 적어도 하나의 불안정화 도메인(DD)과 회합된 이러한 CRISPR 효소는 본원에 "DD-CRISPR 효소"로 명명된다. 본원의 다른 곳에 기재된 바와 같은 본 발명에 따른 CRISPR 효소 중 임의의 것이 본원에 하기 기재된 바와 같이 불안정화 도메인을 갖거나, 이와 회합된 것으로서 사용될 수 있음이 이해될 것이다. 본원의 다른 곳에 기재된 바와 같은 방법, 제품, 조성물 및 용도 중 임의의 것은 하기에 추가로 상세히 기재된 바와 같은 불안정화 도메인과 회합된 CRISPR 효소를 사용하여 동일하게 적용 가능하다. 본원에 기재된 바와 같은 양태 및 구현예에서, CRISPR 효소로서 Cpf1을 언급하거나, 이에서 읽히는 경우, 기능적 CRISPR-Cas 시스템의 재구성이 바람직하게는 tracr 서열을 필요로 하지 않거나, 이에 의존되지 않고/않거나 직접 반복부는 가이드(표적 또는 스페이서) 서열의 5'(상류)인 것을 이해할 것이다.
추가의 지침에 의해, 하기의 특정 양태 및 구현예가 제공된다.
이러한 섹션에 기재된 바와 같은 양태 및 구현예가 DD-CRISPR 효소, DD-Cas, DD-Cpf1, DD-CRISPR-Cas 또는 DD-CRISPR-Cpf1 시스템 또는 복합체를 포함하기 때문에, 용어 "CRISPR", "Cas", "Cpf1, "CRISPR 시스템", "CRISPR 복합체", "CRISPR-Cas", "CRISPR-Cpf1" 등은 특히 본 발명이 DD 구현예에서 읽히도록 문맥이 허용하는 경우에 접두사 "DD" 없이 접두사 DD를 갖는 것으로 간주될 수 있다. 일 양태에서, 본 발명은 DD-CRISPR 효소, 예를 들어, 이러한 DD-CRISPR 효소를 포함하는 조작된, 비-천연 발생 DD-CRISPR-Cas 시스템을 제공하며, CRISPR 효소는 Cas 단백질(본원에서 "DD-Cas 단백질"로 명명되며, 즉, "DD-CRISPR-Cpf1 복합체"와 같은 용어 앞의 "DD"는 회합된 적어도 하나의 불안정화 도메인을 갖는 Cpf1 단백질을 갖는 CRISPR-Cpf1 복합체를 의미함), 유리하게는 DD-Cas 단백질, 예를 들어, 적어도 하나의 불안정화 도메인 및 가이드 RNA와 회합된 Cpf1 단백질(본원에서 "DD-Cpf1 단백질"로 명명)이다. 핵산 분자, 예를 들어, DNA 분자는 유전자 생성물을 인코딩할 수 있다. 일부 구현예에서, DD-Cas 단백질은 유전자 생성물을 인코딩하는 DNA 분자를 절단할 수 있다. 일부 구현예에서, 유전자 생성물의 발현이 변경된다. Cas 단백질 및 가이드 RNA는 천연적으로 함께 발생하지 않는다. 본 발명은 가이드 서열을 포함하는 가이드 RNA를 이해한다. 일부 구현예에서, 기능적 CRISPR-Cas 시스템은 추가의 기능적 도메인을 포함할 수 있다. 일부 구현예에서, 본 발명은 유전자 생성물의 발현을 변경시키거나 변형하기 위한 방법을 제공한다. 상기 방법은 표적 핵산, 예를 들어, DNA 분자를 함유하거나, 표적 핵산, 예를 들어, DNA 분자를 함유하고 이를 발현하는 세포 내로 도입하는 단계를 포함할 수 있으며; 예를 들어, 표적 핵산은 유전자 생성물을 인코딩하거나, 유전자 생성물의 발현을 제공할 수 있다(예를 들어, 조절 서열).
일부 일반적인 구현예에서, DD-CRISPR 효소는 하나 이상의 기능적 도메인과 회합된다. 일부 더욱 구체적인 구현예에서, DD-CRISPR 효소는 데드Cpf1이고/이거나 하나 이상의 기능적 도메인과 회합된다. 일부 구현예에서, DD-CRISPR 효소는 α-나선 또는 혼합된 α/β 이차 구조의 절단을 포함한다. 일부 구현예에서, 절단은 제거 또는 링커로의 대체를 포함한다. 일부 구현예에서, 링커는 분지화되거나, 다르게는 DD 및/또는 기능적 도메인의 테더링을 허용한다. 일부 구현예에서, CRISPR 효소는 융합 단백질에 의해 DD와 회합된다. 일부 구현예에서, CRISPR 효소는 DD에 융합된다. 다시 말하면, DD는 상기 CRISPR 효소와의 융합에 의해 CRISPR 효소와 회합될 수 있다. 일부 구현예에서, 효소는 변형된 CRISPR 효소인 것으로 간주될 수 있으며, CRISPR 효소는 적어도 하나의 불안정화 도메인(DD)에 융합된다. 일부 구현예에서, DD는 커넥터 단백질을 통하여, 예를 들어, 시스템, 예컨대 마커 시스템, 예컨대 스트렙트아비딘-비오틴 시스템을 사용하여 CRISPR 효소에 회합될 수 있다. 이와 같이, CRISPR 효소와 커넥터에 대한 고 친화성 리간드에 특이적인 커넥터 단백질의 융합체가 제공되는 한편, DD는 상기 고 친화성 리간드에 결합된다. 예를 들어, 스트렙트아비딘은 CRISPR 효소에 융합된 커넥터일 수 있는 한편, 비오틴은 DD에 결합될 수 있다. 동시-국소화 시에, 스트렙트아비딘은 비오틴에 결합하여, 이에 따라, CRISPR 효소를 DD에 연결할 것이다. 간략성을 위하여, CRISPR 효소와 DD의 융합체가 일부 구현예에서 바람직하다. 일부 구현예에서, 융합체는 DD와 CRISPR 효소 사이에 링커를 포함한다. 일부 구현예에서, 융합은 CRISPR 효소의 N-말단에 대하여 이루어질 수 있다. 일부 구현예에서, 적어도 하나의 DD는 CRISPR 효소의 N-말단에 융합된다. 일부 구현예에서, 융합은 CRISPR 효소의 C-말단에 대하여 이루어질 수 있다. 일부 구현예에서, 적어도 하나의 DD는 CRISPR 효소의 C-말단에 융합된다. 일부 구현예에서, 하나의 DD는 CRISPR 효소의 N-말단에 융합되며, 또 다른 DD는 CRISPR 효소의 C-말단에 융합될 수 있다. 일부 구현예에서, CRISPR 효소는 적어도 2개의 DD와 회합되며, 제1 DD는 CRISPR 효소의 N-말단에 융합되며, 제2 DD는 CRISPR 효소의 C-말단에 융합되며, 제1 및 제2 DD는 동일하거나 상이하다. 일부 구현예에서, 융합은 DD의 N-말단에 대하여 이루어질 수 있다. 일부 구현예에서, 융합은 DD의 C-말단에 대하여 이루어질 수 있다. 일부 구현예에서, 융합은 CRISPR 효소의 C-말단과 DD의 N-말단 사이에 이루어질 수 있다. 일부 구현예에서, 융합은 DD의 C-말단과 CRISPR 효소의 N-말단 사이에 이루어질 수 있다. 적어도 하나의 C 말단 융합을 포함하는 DD보다 적어도 하나의 N-말단 융합을 포함하는 DD에서 더 적은 백그라운드가 관찰되었다. N- 및 C-말단 융합의 조합이 최소의 백그라운드를 가졌으나, 가장 낮은 전체 활성을 가졌다. 유리하게, DD는 적어도 하나의 N-말단 융합 또는 적어도 하나의 N 말단 융합 + 적어도 하나의 C-말단 융합을 통해 제공된다. 그리고 물론, DD는 적어도 하나의 C-말단 융합에 의해 제공될 수 있다.
특정 구현예에서, 단백질 불안정화 도메인은, 예컨대 유도성 조절을 위하여, 예를 들어, Cpf1의 N-말단 및/또는 C-말단에 융합될 수 있다. 또한, 불안정화 도메인은 예를 들어, 용매 노출 루프에서 Cpf1의 일차 서열 내로 도입될 수 있다. Cpf1 뉴클레아제의 일차 구조의 컴퓨터 분석에 의해, 3개의 별개의 영역이 드러났다. 먼저, 유일한 기능적 특성화 도메인인 C-말단 RuvC 유사 도메인, 두번째로, N-말단 알파-나선 영역 및 세번째로, RuvC 유사 도메인과 알파-나선 영역 사이에 위치한 혼합된 알파 및 베타 영역. 미구조화된 영역의 몇몇 작은 스트레치는 Cpf1 일차 구조 내에서 예측된다. 용매에 노출되고 상이한 Cpf1 오솔로그 내에서 보존되지 않은 미구조화된 영역은, 작은 단백질 서열의 삽입 및 스플릿에 대한 바람직한 면이다. 추가적으로, 이들 면은 Cpf1 오솔로그 사이의 키메라 단백질을 생성하는 데 사용될 수 있다.
일부 구현예에서, DD는 ER50이다. 이러한 DD에 대해 상응하는 안정화 리간드는, 일부 구현예에서, 4HT이다. 이와 같이 일부 구현예에서, 적어도 하나의 DD 중 하나는 ER50이며, 이를 위한 안정화 리간드는 4HT 또는 CMP8이다. 일부 구현예에서, DD는 DHFR50이다. 이러한 DD에 대해 상응하는 안정화 리간드는, 일부 구현예에서 TMP이다. 이와 같이 일부 구현예에서, 적어도 하나의 DD 중 하나는 DHFR50이고, 이를 위한 안정화 리간드는 TMP이다. 일부 구현예에서, DD는 ER50이다. 이러한 DD에 대해 상응하는 안정화 리간드는, 일부 구현예에서 CMP8이다. 따라서 CMP8은 ER50 시스템에서 4HT에 대한 대안적인 안정화 리간드일 수 있다. CMP8 및 4HT는 경쟁적인 방식으로 사용될 수 있고/있어야 함이 가능할 수 있는 한편, 일부 세포 유형은 이들 2 개의 리간드 중 하나 또는 나머지 하나에 더욱 민감할 수 있고, 이러한 개시 내용 및 당업자의 지식으로부터 CMP8 및/또는 4HT가 사용될 수 있다.
일부 구현예에서, 하나 또는 2 개의 DD가, CRISPR 효소의 C-말단에 융합된 하나 또는 2 개의 DD를 갖는 CRISPR 효소의 N-말단 끝에 융합될 수 있다. 일부 구현예에서, 적어도 2 개의 DD는 CRISPR 효소와 회합되고, 그 DD는 동일한 DD이며, 즉 DD는 상동성이다. 따라서, 2 개의 DD 모두(또는 둘 이상)는 ER50 DD일 수 있다. 이는 일부 구현예에서 바람직하다. 대안적으로, 2 개의 DD 모두(또는 둘 이상)는 DHFR50 DD일 수 있다. 이는 또한 일부 구현예에서 바람직하다. 일부 구현예에서, 적어도 2 개의 DD는 CRISPR 효소와 회합되고, DD는 상이한 DD이며, 즉 DD는 이종성이다. 따라서, DD 중 1 개는 ER50일 수 있는 한편, 하나 이상의 DD 또는 임의의 기타 다른 DD는 DHFR50일 수 있다. 이종성인 둘 이상의 DD의 소유는, 더욱 큰 수준의 분해 제어를 제공할 것이므로, 유리할 수 있다. N-말단 또는 C-말단에서 하나 초과의 DD의 탠덤 융합은 분해를 향상시킬 수 있고; 이러한 탠덤 융합은, 예를 들어 ER50-ER50-C2c2 또는 DHFR-DHFR-Cpf1일 수 있다. 이는, 어느 하나의 안정화 리간드 부재시 높은 수준의 분해가 발생할 것이며, 하나의 안정화 리간드 부재 및 기타 다른(또는 또 다른) 안정화 리간드의 존재시 중간 수준의 분해가 발생할 것인 한편, 2 개(또는 둘 이상)의 모든 안정화 리간드의 존재 하에서 낮은 수준의 분해가 발생할 것임이 생각된다. 또한 N-말단 ER50 DD 및 C-말단 DHFR50 DD의 소유에 의해 제어가 부여될 수 있다.
일부 구현예에서, DD와 CRISPR 효소의 융합은 DD와 CRISPR 효소 사이의 링커를 포함한다. 일부 구현예에서, 링커는 GlySer 링커이다. 일부 구현예에서, DD-CRISPR 효소는 적어도 하나의 핵외 수송 신호(NES)를 추가로 포함한다. 일부 구현예에서, DD-CRISPR 효소는 둘 이상의 NES를 포함한다. 일부 구현예에서, DD-CRISPR 효소는 적어도 하나의 핵 국소화 신호(NLS)를 포함한다. 이는 NES에 추가적일 수 있다. 일부 구현예에서, CRISPR 효소는, CRISPR 효소와 DD 사이의 링커로서 또는 그 일부로서, 국소화(핵 이동 또는 핵외 수송) 신호를 포함하거나, 이로 본질적으로 이루어지거나, 이로 이루어진다. HA 또는 플랙 태그(Flag tag) 또한 링커로서 본 발명의 영역 내에 있다. 출원인은 링커로서 NLS 및/또는 NES를 사용하고, 또한 최대 (GGGGS)3의 GS만큼 짧은 글리신 세린 링커를 사용한다.
일 양태에서, 본 발명은 CRISPR 효소 및 회합된 DD를 인코딩하는 폴리뉴클레오티드를 제공한다. 일부 구현예에서, 인코딩된 CRISPR 효소 및 회합된 DD는 제1 조절 요소에 작동 가능하게 연결된다. 일부 구현예에서, DD도 또한 인코딩되며, 제2 조절 요소에 작동 가능하게 연결된다. 유리하게, 본원에서 DD는 안정화 리간드를 "제거(mop up)"하는 것이며, 그래서, 예를 들어, 본원에 논의된 바와 같은 효소와 회합된 것과 동일한 DD(즉, 동일한 유형의 도메인)이다(용어 "제거"는 본원에 논의된 바와 같은 의미이며, 활성에 기여하거나 결론을 내리기 위한 수행을 전달할 수도 있음이 이해된다). CRISPR 효소와 회합되지 않은 과잉의 DD를 사용하여 안정화 리간드를 제거함으로써, CRISPR 효소의 더 큰 분해가 관찰될 것이다. 이론에 구속되지 않고, 추가의 또는 과잉의 회합되지 않은 DD가 첨가되기 때문에, 평형이 안정화 리간드 복합체화 또는 CRISPR 효소와 회합된 DD로의 결합으로부터 멀리 이동하고, 그 대신, 더 많은 안정화 리간드 복합체화 또는 유리 DD(즉, CRISPR 효소와 회합되지 않는 것)로의 결합을 향해 이동하는 것이 예상된다. 따라서, CRISPR 효소의 증가된 분해를 통해 CRISPR 효소 활성을 감소시키는 것이 바람직한 경우, 과량의 또는 추가의 회합되지 않은(o 유리) DD를 제공하는 것이 바람직하다. 과잉의 유리 DD는 잔류 리간드에 결합하며, 또한, 결합된 리간드를 DD-Cas 융합체로부터 없앤다. 따라서, 그것은 DD-Cas 분해를 가속화시키며, Cas 활성의 일시적인 제어를 향상시킨다. 일부 구현예에서, 제1 조절 요소는 프로모터이며, 선택적으로 인핸서를 포함할 수 있다. 일부 구현예에서, 제2 조절 요소는 프로모터이며, 선택적으로 인핸서를 포함할 수 있다. 일부 구현예에서, 제1 조절 요소는 조기 프로모터이다. 일부 구현예에서, 제2 조절 요소는 후기 프로모터이다. 일부 구현예에서, 제2 조절 요소는 유도성 제어 요소, 선택적으로, tet 시스템 또는 억제성 제어 요소, 선택적으로 tetr 시스템이거나, 이를 포함하거나, 본질적으로 이로 이루어진다. 독시사이클린의 존재 하에 tet를 유도하기 위하여 유도성 프로모터, 예를 들어, rTTA가 바람직할 수 있다.
부착 또는 회합은 본원의 다른 곳에 기재된 바와 같은 링커를 통해 이루어질 수 있다. 대안적인 링커가 이용가능하지만, Cas의 두 부분을 함께 모으고 이에 따라 Cas 활성을 재구성하기 위한 최대의 기회를 가능하게 하기에는, 고도로 유연한 링커가 가장 잘 작용하는 것으로 생각된다. 한 가지 대안은, 뉴클레오플라스민(nucleoplasmin)의 NLS가 링커로서 사용될 수 있다는 것이다. 예를 들어, 링커는 또한 Cas와 임의의 기능적 도메인 사이에서 사용될 수 있다. 또 다시, (GGGGS)3 링커(또는 그에 따라 6 개, 9 개, 또는 12 개의 반복 형태)가 본 명세서에서 사용될 수 있거나, 뉴클레오플라스민의 NLS가 Cas와 기능적 도메인 사이에서 링커로서 사용될 수 있다.
기능적 도메인 등이 효소의 한 부분 또는 다른 부분과 "회합된" 경우, 이들은 통상적으로 융합물이다. 용어 "~와 회합된"은 본 명세서에서 하나의 분자가 또 다른 분자에 대하여, 예를 들어, CRISPR 효소의 부분과 기능적 도메인 사이에서 어떻게 '회합'하는지와 관련되어 사용된다. 둘은 서로 테더링되는 것으로 간주될 수 있다. 이러한 단백질-단백질 상호작용의 경우, 이라힌 회합은 항체가 에피토프를 인식하는 방식에 있어서 인식에 관하여 생각될 수 있다. 대안적으로, 하나의 단백질은 2 개의 융합, 예를 들어 또 다른 서브유닛에 융합된 하나의 서브유닛을 통해, 또 다른 단백질과 회합될 수 있다. 통상적으로, 예를 들어 각각의 단백질 또는 서브유닛을 인코딩하는 뉴클레오티드 서열들을 함께 스플라이싱하는 것을 통한, 하나의 아미노산 서열의 다른 한 서열로의 추가에 의해, 융합이 발생한다. 대안적으로, 이는 본질적으로 2 개의 분자 간의 결합 또는 직접 연결, 예컨대 융합 단백질로 볼 수 있다.
어떤 상황에서든, 융합 단백질은 2 개의 관심의 서브유닛 사이(즉, 효소와 기능적 도메인 사이 또는 어댑터 단백질과 기능적 도메인 사이)에 링커를 포함할 수 있다. 따라서, 일부 구현예에서, CRISPR 효소의 일부는 기능적 도메인에 결합함으로써 기능적 도메인과 회합된다. 다른 구현예에서, CRISPR 효소는 기능적 도메인에 회합되는데, 이는 CRISPR 효소와 기능적 도메인이 선택적으로 중간체 링커를 통하여 함께 융합되기 때문이다. 링커의 예는 본 명세서에서 논의된 GlySer 링커를 포함한다. 비-공유 결합된 DD가 회합된 Cas(예를 들어, Cpf1)의 분해를 개시할 수 있지만, 프로테아좀 분해는 단백질 쇄의 풀림을 수반하며; DD가 분해 시에 Cas에 연결되는 것을 유지할 수 있기 때문에, 융합이 바람직하다. 그러나, CRISPR 효소 및 DD는 DD에 특이적인 안정화 리간드의 존재 하에 함께 결합되어, 안정화 복합체가 형성된다. 이러한 복합체는 DD에 결합된 안정화 리간드를 포함한다. 복합체는 또한, CRISPR 효소와 회합된 DD를 포함한다. 상기 안정화 리간드의 부재 하에, DD 및 이의 회합된 CRISPR 효소의 분해가 촉진된다.
탈안정화 도메인은 광범위한 단백질에 대해 비안정성을 수여하기 위한 일반적인 유용성을 가지며; 예를 들어 본 명세서에서 참고로서 포함된, 문헌[Miyazaki, J Am Chem Soc. Mar 7, 2012; 134(9): 3942-3945]을 참조한다. CMP8 또는 4-하이드록시타목시펜은 탈안정화 도메인일 수 있다. 더욱 일반적으로, N-말단 지배에 의한 탈안정화 잔기인, 포유동물 DHFR(DHFRts)의 온도-민감성 돌연변이체는 관대한 온도에서 안정적이지만 37℃에서는 불안정한 것으로 발견되었다. 포유동물 DHFR에 대해 고친화성 리간드인 메토트렉세이트의, DHFRts을 발현하는 세포로의 첨가는 단백질의 분해를 부분적으로 억제하였다. 이는 작은 분자 리간드가, 그렇지 않으면 세포 내에서 분해를 위해 표적화될 단백질을 안정화할 수 있다는 중요한 설명이었다. 라파마이신 유도체는 mTOR(FRB*)의 FRB 도메인의 불안정적인 돌연변이체를 안정화하고, 융합된 키나아제, GSK-3β.6,7의 작용을 회복시키는 데 사용되었다. 이 시스템은, 리간드-의존성 안정성이 복합체 생물학적 환경에서 특이적 단백질의 작용을 조절하기 위한 매력적인 전략을 나타냄을 입증하였다. 단백질 활성을 제어하기 위한 시스템은 유비퀴틴 상보성이, FK506-결합 단백질 및 FKBP12의 라파마이신 유도된 이량체에 의해 발생하는 경우, 작용성이 되는 DD를 수반할 수 있다. 인간 FKBP12 또는 ecDHFR 단백질의 돌연변이체는 이의 고친화성 리간드, 실드(Shield)-1 또는 트리메토프림(TMP) 각각의 부재 하에서 대사적으로 불안정하도록 조작될 수 있다. 이들 돌연변이체는 본 발명의 실시에 유용한 가능한 탈안정화 도메인(DD)의 일부이며, CRISPR 효소와의 융합물로서 DD의 불안정성이 프로테아솜에 의한 전체 융합 단백질의 CRISPR 단백질 분해에 부여된다. 실드-1 및 TMP는 용량-의존적 방식으로 DD에 결합하고 이를 안정화시킨다. 에스트로겐 수용체 리간드 결합 도메인(ERLBD, ERS1의 잔기 305 내지 549)은 또한 탈안정화 도메인으로서 조작될 수 있다. 에스트로겐 수용체 신호화 경로는 다양한 질병, 예컨대 유방암에 수반되기 때문에, 이 경로는 널리 연구되었고, 에스트로겐 수용체의 다양한 작용제(agonist) 및 길항제가 개발되어 왔다. 따라서, ERLBD와 약물의 상용성 쌍이 알려져 있다. 돌연변이체에 결합하지만 ERLBD의 야생 형태에는 결합하지 않는 리간드가 존재한다. 3 개의 돌연변이를 인코딩하는 이들 돌연변이체 도메인들 (L384M, M421G, G521R)12 중 하나를 사용함으로써, 내인성 에스트로겐-민감성 네트워크를 동요시키지 않는 리간드를 사용하여 ERLBD-유도된 DD의 안정성을 조절하는 것이 가능하다. 추가적인 돌연변이(Y537S)가 도입되어 ERLBD를 추가로 불안정화시키고, 잠재적 DD 후보물로서 이를 구성할 수 있다. 이러한 테트라-돌연변이체는 유리한 DD 개발이다. 돌연변이체 ERLBD는 CRISPR 효소에 융합될 수 있고, 이의 안정성은 리간드를 사용하여 조절 또는 동요될 수 있으며, 이로 인해 CRISPR 효소는 DD를 갖는다. 또 다른 DD는 돌연변이된 FKBP 단백질을 기반으로 한 12-kDa(107-아미노산)이며, 실드1 리간드에 의해 안정화될 수 있고; 예를 들어 문헌[Nature Methods 5, (2008)]을 참조한다. 예를 들어, DD는 합성의 생물학적으로 비활성인 소분자, 실드-1에 결합하고 이에 의해 가역적으로 안정화되는 변형된 FK506 결합 단백질 12(FKBP12)일 수 있으며; 예를 들어, 문헌[Banaszynski LA, Chen LC, Maynard-Smith LA, Ooi AG, Wandless TJ. A rapid, reversible, and tunable method to regulate protein function in living cells using synthetic small molecules. Cell. 2006;126:995-1004]; [Banaszynski LA, Sellmyer MA, Contag CH, Wandless TJ, Thorne SH. Chemical control of protein stability and function in living mice. Nat Med. 2008;14:1123-1127]; [Maynard-Smith LA, Chen LC, Banaszynski LA, Ooi AG, Wandless TJ. A directed approach for engineering conditional protein stability using biologically silent small molecules. The Journal of biological chemistry. 2007;282:24866-24872]; 및 [Rodriguez, Chem Biol. Mar 23, 2012; 19(3): 391-398](이들 모두는 본 명세서에 참고로서 포함되어 있으며, 본 발명의 실시에서 CRISPR 효소와 회합되는 DD를 선택하는 것에 있어서 본 발명의 실시에 이용될 수 있다. 알 수 있는 바와 같이, 당업계의 지식은 다수의 DD를 포함하며, DD는 유리하게는 링커를 이용하여, CRISPR 효소에 회합, 예를 들어, 이에 융합될 수 있으며, 이로 인해 DD는 리간드의 존재 하에서 안정화될 수 있고, 이의 부재시, DD는 탈안정화될 수 있고, 이로 인해 CRISPR 효소가 전체적으로 탈안정화되거나, DD는 리간드의 부재 하에서 안정화될 수 있고, 그리고 리간드가 존재하는 경우 DD는 탈안정화될 수 있고; DD는 CRISPR 효소를 허용하고, 이에 따라 CRISPR-Cas 복합체 또는 시스템이 조절 또는 제어되도록 하여-소위 껐다 켰다 하여, 이에 의해 예를 들어 생체 내 또는 시험관 내 환경에서, 시스템의 조절 또는 제어를 위한 수단을 제공한다. 예를 들어, 관심 단백질이 DD 태그를 이용하여 융합물로서 발현된 경우, 이는 세포 내에서, 예를 들어 프로테아솜에 의해 탈안정화되고 신속히 분해된다. 따라서, 안정화 리간드의 부재는 분해되는 D 회합된 Cas를 초래한다. 새로운 DD가 관심 단백질에 융합된 경우, 이의 불안정성이 관심 단백질에 부여되어, 전체 융합 단백질의 신속한 분해를 초래한다. Cas에 대한 피크 활성도는 때때로 표적외 효과를 감소시키는 데 유익하다. 따라서, 높은 활성의 짧은 파열이 바람직하다. 본 발명은 이러한 피크를 제공할 수 있다. 일부 의미에서, 시스템은 유도성이다. 일부 기타 다른 의미에서, 안정화 리간드의 부재 하에서 시스템은 억제되고, 안정화 리간드의 존재 하에서 탈-억제된다. 임의의 이론에 의해 결부시키려 하지 않고, 어떠한 약속도 없이, 본 발명의 다른 이익은 그것이 하기와 같은 이익을 포함할 수 있다:
- 분량을 정할 수 있음(개시시키거나 중단시키는 시스템과 대조적이며, 예를 들어, 가변적인 CRISPR-Cas 시스템 또는 복합체 활성을 허용함).
- 직교이며, 예를 들어, 리간드가 오직 그의 동족 DD에만 영향을 미쳐, 둘 이상의 시스템이 독립적으로 작동할 수 있고/거나 CRISPR 효소가 하나 이상의 오솔로그로부터의 것일 수 있음.
- 이동 가능하며, 예를 들어, 상이한 세포 유형 또는 세포주에서 작동할 수 있음.
- 신속함.
- 일시적 제어.
- Cas가 분해되게 함으로써 백그라운드 또는 표적외 Cas 또는 Cas 독성 또는 과잉의 Cas의 축적을 감소시킬 수 있음.
DD가 CRISPR 효소의 N 및/또는 C 말단(들)에 존재할 수 있지만, 스플릿(본원의 다른 곳에 정의된 바와 같음)의 하나 이상의 측에 DD를 포함하는 것, 예를 들어, Cpf1(N)-링커-DD-링커-Cpf1(C)도 또한 DD를 도입하기 위한 하나의 방식이다. 일부 구현예에서, 사용될 CRISPR 효소로의 DD의 오직 하나의 말단 회합만을 사용한다면, DD로서 ER50을 사용하는 것이 바람직하다. 일부 구현예에서, N- 및 C-말단 둘 모두가 사용된다면, ER50 및/또는 DHFR50의 이용이 바람직하다. N-말단 융합에서 특히 우수한 결과가 관찰되며, 이는 놀라운 것이다. N 및 C 말단 융합은 상승적일 수 있다. 불안정화 도메인의 크기는 달라지지만, 전형적으로 크기가 대략 100 내지 대략 300개 아미노산이다. DD는 바람직하게는 조작된 불안정화 단백질 도메인이다. DD 및 고 친화성 리간드 및 그의 리간드 결합 도메인으로부터의 DD의 제조 방법. 오직 특정 리간드만이 그의 각각의(동족) DD를 안정화할 것이고, 그것은 비-동족 DD의 안정성에 영향을 갖지 않을 것이기 때문에, 본 발명은 "직교"인 것으로 간주될 수 있다. 구매 가능한 DD 시스템은 클론테크(CloneTech), ProteoTuner™ 시스템이며; 안정화 리간드는 Shield1이다.
일부 구현예에서, 안정화 리간드는 '소분자'이다. 일부 구현예에서, 안정화 리간드는 세포-투과성이다. 그것은 그의 상응하는 DD에 대하여 고 친화성을 갖는다. 적합한 DD - 안정화 리간드 쌍은 해당 분야에 알려져 있다. 일반적으로, 안정화 리간드는 하기에 의해 제거될 수 있다:
- 예를 들어, 생체내에서의 천연의 가공(예를 들어, 프로테아좀 분해);
- 예를 들어, 생체 외/세포 배양에서의 하기에 의한 제거:
- 바람직한 결합 파트너의 제공; 또는
- XS 기질(Cas 없이 DD)의 제공.
또 다른 양태에서, 본 발명은 유전자 생성물을 인코딩하는 DNA 분자를 표적화하는 CRISPR-Cas 시스템 가이드 RNA에 작동 가능하게 연결된 제1 조절 요소 및 DD-Cas 단백질에 대한 코딩에 작동 가능하게 연결된 제2 조절 요소를 포함하는 하나 이상의 벡터를 포함하는 조작된, 비-천연 발생 벡터 시스템을 제공한다. 성분 (a) 및 (b)는 시스템의 동일한 또는 상이한 벡터 상에 위치할 수 있다. 가이드 RNA는 세포 내의 유전자 생성물을 인코딩하는 DNA 분자를 표적화하며, DD-Cas 단백질은 유전자 생성물을 인코딩하는 DNA 분자를 절단하여(이는 하나의 또는 둘 모두의 가닥을 절단하거나 실질적으로 뉴클레아제 활성을 갖지 않을 수 있음), 그에 의해, 유전자 생성물의 발현을 변경시킬 수 있으며; DD-Cas 단백질 및 가이드 RNA는 천연적으로 함께 발생하지 않는다. 본 발명의 일 구현예에서, DD-Cas 단백질은 DD-Cpf1 단백질이다.
일 양태에서, 본 발명은 진핵 세포의 핵 내측 및/또는 외측에 검출가능한 양의 상기 DD-CRISPR 효소의 축적을 유도하기에 충분한 세기의 하나 이상의 핵 국소화 서열 및/또는 NES를 포함하는 DD-CRISPR 효소를 제공한다. 일부 구현예에서, DD-CRISPR 효소는 DD-Cpf1 효소이다. 일부 구현예에서, DD-Cpf1 효소는 프란시셀라 툴라렌시스 1, 프란시셀라 툴라렌시스 아종 노비시다, 프레보텔라 알벤시스, 라크노스피라세아에 박테리움 MC2017 1, 부티리비브리오 프로테오클라스티쿠스, 페레그리니박테리아 박테리움 GW2011_GWA2_33_10, 파르쿠박테리아 박테리움 GW2011_GWC2_44_17, 스미텔라 종 SCADC, 아시다미노코커스 종 BV3L6, 라크노스피라세아에 박테리움 MA2020, 칸디다투스 메타노플라즈마 테르미툼, 유박테리움 엘리겐스, 모락셀라 보보쿨리 237, 모락셀라 보보쿨리 AAX08_00205, 모락셀라 보보쿨리 AAX11_00205, 부티리비브리오 종 NC3005, 티오마이크로스피라 종 XS5, 렙토스피라 이나다이, 라크노스피라세아에 박테리움 ND2006, 포르피로모나스 크레비오리카니스 3, 프레보텔라 디시엔스, 또는 포르피로모나스 마카카에 Cpf1(예를 들어, 적어도 하나의 DD를 갖거나, 이와 회합되도록 변형)으로부터 유래되며, Cpf1의 추가의 변경 또는 돌연변이를 포함하며, 키메라 Cpf1일 수 있다. 일부 구현예에서, DD-CRISPR 효소는 진핵 세포에서의 발현을 위하여 코돈-최적화된다. 일부 구현예에서, DD-CRISPR 효소는 표적 서열의 위치에서 하나의 또는 두개의 가닥의 절단을 유도한다. 일부 구현예에서, DD-CRISPR 효소에는 DNA 가닥 절단 활성이 결여되어 있거나, 실질적으로 결여되어 있다(예를 들어, 야생형 효소 또는 뉴클레아제 활성을 감소시키는 돌연변이 또는 변경을 갖지 않는 효소와 비교하여 6% 이하의 뉴클레아제 활성).
추가의 양태에서, 본 발명은 DD-CRISPR-Cpf1 시스템 또는 이의 기능적 부분 내에 핏팅되거나, 이에 결합하거나 그의 역인 잠재적인 화합물을 확인하거나 설계하기 위한 컴퓨터-보조 방법을 포함한다(예를 들어, "보호된 가이드" 하에 본원의 다른 곳에 기재된 바와 같음).
본 발명의 특정 구현예에서, DD-CRISPR-Cpf1 시스템의 또는 DD-CRISPR-Cpf1의 성분의 결정 구조의 입체형태 변이는 DD-CRISPR-Cas 시스템 기능에 중요할 수 있는 뉴클레오티드(RNA 또는 DNA) 구조 영역에 비하여 단백질 구조 영역의 유연성 또는 이동에 관한 중요하고 결정적인 정보를 제공한다. 본원에 인용된 물질에서 Cpf1에 대해 제공된 구조적 정보를 사용하여 본원의 DD-CRISPR-Cas 시스템을 추가로 조작하고 최적화시킬 수 있으며, 이것을 외삽하여, 다른 CRISPR 효소, 예를 들어, 또한 DD-CRISPR 효소 시스템, 예를 들어, 다른 제V형 CRISPR 효소 시스템(예를 들어, 다른 제V형 DD-CRISPR 효소 시스템)에서 구조-기능 관계를 질의할 수 있다. 본 발명은 최적화된 기능적 DD-CRISPR-Cas 효소 시스템을 이해한다. 특히, DD-CRISPR 효소는 그것을 관심 기능을 나타내는 기능적 도메인이 동원되거나, 첨부되거나, 삽입되거나, 부착될 수 있는 DNA 결합 단백질로 전환시키는 하나 이상의 돌연변이를 포함한다. 특정 구현예에서, CRISPR 효소는 DD-CRISPR 효소의 RuvC1 내의 및/또는 다르게는 본원에 논의된 바와 같은 돌연변이인 하나 이상의 돌연변이를 포함한다. 일부 구현예에서, DD-CRISPR 효소는 촉매 도메인 내에 하나 이상의 돌연변이를 가지며, 가이드 서열은 전사되는 경우, 표적 서열로의 DD-CRISPR 복합체의 서열-특이적 결합을 유도하며, 효소는 기능적 도메인(예를 들어, 불안정화된 도메인을 제공하거나 이에 기여하기 위함)을 추가로 포함한다. 본원에 인용된 물질에서 제공되는 구조적 정보는 표적 DNA 및 CRISPR 효소(예를 들어, Cpf1; 예를 들어, DD-CRISPR 효소, 예를 들어, DD-Cpf1)와의 가이드 상호작용의 질의를 가능하게 하여, sgRNA 구조의 조작 또는 변경을 허용하여, 전체 DD-CRISPR-Cas 시스템의 기능성을 최적화시킨다. 예를 들어, 가이드의 루프는 RNA에 결합할 수 있는 어댑터 단백질의 삽입에 의해 Cpf1 단백질과의 충돌 없이 연장될 수 있다. 이들 어댑터 단백질은 하나 이상의 기능적 도메인을 포함하는 이펙터 단백질 또는 융합체를 추가로 동원할 수 있다. 기능적 도메인은 전사 활성화 도메인, 예를 들어, VP64를 포함하거나, 본질적으로 이로 이루어지거나, 이로 이루어질 수 있다. 기능적 도메인은 전사 억제 도메인, 예를 들어, KRAB를 포함하거나, 본질적으로 이로 이루어질 수 있다. 일부 구현예에서, 전사 억제 도메인은 SID 또는 SID의 연쇄체(예를 들어, SID4X)이거나, 이를 포함하거나, 본질적으로 이로 이루어진다. 일부 구현예에서, 기능적 도메인은 후생적 변형 효소가 제공되도록 후생적 변형 도메인을 포함하거나, 본질적으로 이로 이루어진다. 일부 구현예에서, 기능적 도메인은 P65 활성화 도메인일 수 있는 활성화 도메인을 포함하거나, 본질적으로 이로 이루어진다.
본 발명의 양태는 세포 내의 관심 게놈 유전자좌 내의 표적 서열에 혼성화할 수 있는 가이드 서열을 포함하는 가이드 RNA(gRNA)를 포함할 수 있는 비-천연 발생 또는 조작된 조성물, 및 적어도 하나 이상의 핵 국소화 서열을 포함할 수 있는 DD-CRISPR 효소를 포함하며, DD-CRISPR 효소는 효소가 야생형 효소와 비교하여 변경되거나 감소된 뉴클레아제 활성을 갖도록 하나 이상의 돌연변이를 포함하며, gRNA의 적어도 하나의 루프는 하나 이상의 어댑터 단백질에 결합하는 별개의 RNA 서열(들)의 삽입에 의해 변형되며, 어댑터 단백질은 하나 이상의 이종 기능적 도메인을 추가로 동원한다. 본 발명의 일 구현예에서, DD-CRISPR 효소는 하나 또는 둘 이상의 돌연변이를 포함한다. 또 다른 구현예에서, 기능적 도메인은 전사 활성화 도메인, 예를 들어, VP64를 포함하거나, 본질적으로 이로 이루어진다. 또 다른 구현예에서, 기능적 도메인은 전사 억제인자 도메인, 예를 들어, KRAB 도메인, SID 도메인 또는 SID4X 도메인을 포함하거나, 본질적으로 이로 이루어진다. 본 발명의 구현예에서, 하나 이상의 이종 기능적 도메인은 메틸라제 활성, 데메틸라제 활성, 전사 활성화 활성, 전사 억제 활성, 전사 방출 인자 활성, 히스톤 변형 활성, RNA 절단 활성 및 핵산 결합 활성을 포함하거나, 이로 본질적으로 이루어지거나, 이로 이루어진 군으로부터 선택되는 하나 이상의 활성을 갖는다. 본 발명의 추가의 구현예에서, 세포는 진핵 세포 또는 포유류 세포 또는 인간 세포이다. 추가의 구현예에서, 어댑터 단백질은 MS2, PP7, Qβ, F2, GA, fr, JP501, M12, R17, BZ13, JP34, JP500, KU1, M11, MX1, TW18, VK, SP, FI, ID2, NL95, TW19, AP205, ΦCb5, ΦCb8r, ΦCb12r, ΦCb23r, 7s, PRR1를 포함하거나 이로 본질적으로 이루어지거나, 이로 이루어진 군으로부터 선택된다. 또 다른 구현예에서, gRNA의 적어도 하나의 루프는 테트라루프 및/또는 루프2이다. 본 발명의 일 양태는 본원에 기재된 조성물 중 임의의 것을 세포 내로 도입함으로써 세포에서 유전자 발현을 변경시키기 위한 관심 게놈 유전자좌의 변형 방법을 포함한다.
본 발명의 일 양태는 상기 요소가 단일의 조성물에 포함되거나, 개별 조성물에 포함되는 것이다. 이들 조성물은 게놈 수준에서 기능적 효과를 유도하기 위하여 유리하게는 숙주에 적용될 수 있다.
일반적으로, gRNA는 (예를 들어, 융합 단백질을 통하여) 하나 이상의 기능적 도메인을 포함하는 어댑터 단백질이 결합하기 위한 특이적 결합 부위(예를 들어, 압타머)를 제공하는 방식으로 변형된다. 변형된 sgRNA는, 일단 gRNA가 DD-CRISPR 복합체(즉, gRNA 및 표적으로의 DD-CRISPR 효소 결합)를 형성하면, 어댑터 단백질이 결합하고, 부여된 기능이 효율적이 되기에 유리한 공간적 배향으로 어댑터 단백질 상의 기능적 도메인이 배치되도록 변형된다. 예를 들어, 기능적 도메인이 전사 활성인자(예를 들어, VP64 또는 p65)이면, 전사 활성인자는 이것이 표적의 전사에 영향을 미치는 것을 허용하는 공간적 배향으로 배치된다. 마찬가지로, 전사 억제인자는 유리하게는 표적의 전사에 영향을 미치도록 배치될 것이며, 뉴클레아제(예를 들어, Fok1)는 유리하게는 표적을 절단하거나 부분적으로 절단하도록 배치될 것이다.
숙련자는 어댑터 + 기능적 도메인의 결합을 허용하지만, (예를 들어, CRISPR 복합체의 3차원 구조 내의 입체 장해로 인하여) 어댑터 + 기능적 도메인의 적절한 배치를 허용하지 않는 gRNA에 대한 변형은 의도되지 않는 변형임을 이해할 것이다. 하나 이상의 변형된 gRNA는 본원에 기재된 바와 같이 테트라 루프, 스템 루프 1, 스템 루프 2 또는 스템 루프 3에서, 바람직하게는 테트라 루프 또는 스템 루프 2 중 어느 하나에서, 가장 바람직하게는 테트라 루프 및 스템 루프 2 둘 모두에서 변형될 수 있다.
본원에 설명된 바와 같이, 기능적 도메인은 예를 들어 메틸라제 활성, 데메틸라제 활성, 전사 활성화 활성, 전사 억제 활성, 전사 방출 인자 활성, 히스톤 변형 활성, RNA 절단 활성, DNA 절단 활성, 핵산 결합 활성 및 분자 스위치(예를 들어, 광 유도성)를 포함하거나, 이로 본질적으로 이루어지거나, 이로 이루어진 군으로부터의 하나 이상의 도메인일 수 있다. 일부 경우에, 추가적으로 적어도 하나의 NLS 및/또는 NES가 제공되는 것이 유리하다. 일부 경우에서, NLS를 N 말단에 위치시키는 것이 유리하다. 일부 경우에, NLS 및/또는 NES를 N 말단에 배치하는 것이 유리하다. 하나 초과의 기능적 도메인이 포함되는 경우, 기능적 도메인은 동일하거나 상이할 수 있다.
gRNA는 동일하거나 상이한 어댑터 단백질에 특이적인 다수의 결합 인식 부위(예를 들어, 압타머)를 포함하도록 설계될 수 있다. gRNA는 프로모터 영역 -1000 내지 전사 시작 부위(즉, TSS)의 +1 핵산 상류, 바람직하게는 -200 핵산에 결합하도록 설계될 수 있다. 이러한 배치는 유전자 활성화(예를 들어, 전사 활성인자) 또는 유전자 억제(예를 들어, 전사 억제인자)에 영향을 미치는 기능적 도메인을 개선시킨다. 변형된 gRNA는 조성물에 포함된 하나 이상의 표적 유전자좌에 표적화된 하나 이상의 변형된 gRNA(예를 들어, 적어도 1개의 gRNA, 적어도 2개의 gRNA, 적어도 5개의 gRNA, 적어도 10개의 gRNA, 적어도 20개의 gRNA, 적어도 30개의 gRNA, 적어도 50개의 gRNA)일 수 있다.
추가로, 감소된 뉴클레아제 활성을 갖는 DD-CRISPR 효소는 뉴클레아제 활성이 비활성화되는 경우(예를 들어 야생형 효소에 비하여 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95% 이상, 적어도 97%, 또는 100%의 뉴클레아제 비활성화; 또는 달리 말하면 유리하게 비-돌연변이된 또는 야생형 Cpf1 효소 또는 CRISPR 효소의 약 0%의 뉴클레아제 활성, 또는 비-돌연변이된 또는 야생형 Cpf1 효소 또는 CRISPR 효소의 약 3% 또는 약 5% 또는 약 10% 이하의 뉴클레아제 활성을 갖는 DD-Cpf1 효소 또는 DD-CRISPR 효소) 가장 효율적이다. 이는 Cpf1과 이의 오솔로그의 RuvC 뉴클레아제 도메인 내로 돌연변이를 도입함으로써 가능하다. 비활성화된 CRISPR 효소는, (예를 들어, 융합 단백질을 통해) 회합된 하나 이상의 기능적 도메인, 예를 들어, 적어도 하나의 불안정화 도메인; 또는 예를 들어 메틸라제 활성, 데메틸라제 활성, 전사 활성화 활성, 전사 억제 활성, 전사 방출 인자 활성, 히스톤 변형 활성, RNA 절단 활성, DNA 절단 활성, 핵산 결합 활성 및 분자 스위치(예를 들어, 광 유도성)를 포함하거나, 이로 본질적으로 이루어지거나, 이로 이루어진 군으로부터의 하나 이상의 도메인을 포함하여, 변형된 gRNA 어댑터 단백질을 위하여 본원에 기재된 것들을 가질 수 있다. 바람직한 도메인은 Fok1, VP64, P65, HSF1, MyoD1이다. Fok1이 제공되는 경우, 다수의 Fok1 기능적 도메인이 제공되어 작용성 다이머를 허용하고, gRNA가 문헌[Tsai et al. Nature Biotechnology, Vol. 32, Number 6, June 2014]에 구체적으로 기재된 바와 같이 작용적 사용(Fok1)을 위해 적절한 스페이싱을 제공하도록 설계되는 것이 유리하다. 어댑터 단백질은 이러한 기능적 도메인에 부착하는 공지된 링커를 이용할 수 있다. 일부 경우에서, 추가적으로 적어도 하나의 NLS 또는 NES가 제공되는 것이 유리하다. 일부 경우에서, NLS 또는 NES를 N 말단에 위치시키는 것이 유리하다. 하나 초과의 기능적 도메인이 포함되는 경우, 기능적 도메인은 동일하거나 상이할 수 있다. 일반적으로, 비활성화된 DD-CRISPR 효소 상에의 하나 이상의 기능적 도메인의 위치 선정은 기능적 도메인이 귀속된 작용 효과로 표적에 작용하도록 공간 배향을 수정하는 것을 가능하게 하는 것이다. 예를 들어, 기능적 도메인이 전사 활성화제(예를 들어, VP64 또는 p65)인 경우, 전사 활성화제는, 표적의 전사에 작용하도록 하는 공간 배향으로 위치된다. 유사하게, 전사 억제제는 표적의 전사에 작용하도록 유리하게 위치될 것이고, 뉴클레아제(예를 들어, Fok1)는 표적을 절단 또는 부분적으로 절단하기에 유리하게 위치될 것이다. 이는 DD-CRISPR 효소의 N-말단/C-말단 외의 위치를 포함할 수 있다.
어댑터 단백질은 압타머 또는 변형된 gRNA 내로 도입된 인식 부위에 결합하며, 일단 gRNA가 DD-CRISPR 복합체 내로 혼입되면, 하나 이상의 기능적 도메인의 적절한 배치를 허용하여, 귀속된 기능으로 표적에 영향을 미치는 임의의 수의 단백질일 수 있다. 본 출원에서 상세히 설명된 바와 같이, 이는 코트 단백질, 바람직하게는 박테리오파지 코트 단백질일 수 있다. 이러한 어댑터 단백질과 회합된 기능적 도메인(예를 들어, 융합 단백질의 형태)은 예를 들어, 메틸라제 활성, 데메틸라제 활성, 전사 활성화 활성, 전사 억제 활성, 전사 방출 인자 활성, 히스톤 변형 활성, RNA 절단 활성, DNA 절단 활성, 핵산 결합 활성 및 분자 스위치(예를 들어, 광 유도성)를 포함하거나, 이로 본질적으로 이루어지거나, 이로 이루어진 군으로부터의 하나 이상의 도메인을 포함할 수 있다. 바람직한 도메인은 Fok1, VP64, P65, HSF1, MyoD1이다. 기능적 도메인이 전사 활성인자 또는 전사 억제인자인 사건에서, 추가적으로 적어도 하나의 NLS 또는 NES가 바람직하게는 N 말단에 제공되는 것이 유리하다. 하나 초과의 기능적 도메인이 포함되는 경우, 기능적 도메인은 동일하거나 상이할 수 있다. 어댑터 단백질은 알려져 있는 링커를 사용하여 이러한 기능적 도메인을 부착할 수 있다. 이러한 링커는 DD를 CRISPR 효소와 회합시키거나, CRISPR 효소가 DD를 포함하도록 사용될 수 있다.
일부 구현예에서, 표현형 변경은 바람직하게는 유전적 질병이 표적화되는 경우에, 특히 치료 방법에서, 바람직하게는 수복 주형을 제공하여 표현형을 편집하거나 변경시키는 경우에 게놈 변형의 결과이다.
일부 구현예에서, 표적화될 수 있는 질환은 질환-유발 스플라이스 결함과 관련된 질환을 포함한다.
일부 구현예에서, 세포 표적은 조혈 줄기/전구 세포(CD34+); 인간 T 세포; 및 눈(망막 세포) - 예를 들어, 광수용기 전구 세포를 포함한다.
일부 구현예에서, 유전자 표적은 인간 베타 글로빈 - HBB(유전자-전환의 자극에 의한 것을 포함하여, 겸상 적혈구 빈혈증을 치료하기 위함(내인성 주형으로서 밀접하게 관련된 HBD 유전자 사용)); CD3(T-세포); 및 CEP920 - 망막(눈)을 포함한다.
일부 구현예에서, 질환 표적은 또한, 암; 겸상 적혈구 빈혈증(점 돌연변이에 기초함); HBV, HIV; 베타-지중해빈혈; 및 안과적 또는 안구 질환 - 예를 들어, 레베르 선천성 흑내장(LCA)-유발 스플라이스 결함을 포함한다.
일부 구현예에서, 전달 방법은 효소-가이드 복합체(리보핵단백질)의 양이온 지질 매개의 "직접적인" 전달 및 플라스미드 DNA의 전기천공법을 포함한다.
본원에 기재된 방법, 생성물 및 용도는 비-치료적 목적을 위해 사용될 수 있다. 추가로, 본원에 기재된 방법 중 임의의 것은 시험관 내 및 생체 외에서 적용될 수 있다.
일 양태에서,
I. (a) 폴리뉴클레오티드 유전자좌 내의 제1 표적 서열에 혼성화할 수 있는 제1 가이드 서열,
(b) 폴리뉴클레오티드 유전자좌 내의 제2 표적 서열에 혼성화할 수 있는 제2 가이드 서열,
(c) 직접 반복부 서열을 포함하는 둘 이상의 CRISPR-Cas 시스템 폴리뉴클레오티드 서열, 및
II. Cpf1 효소 또는 이를 인코딩하는 제2 폴리뉴클레오티드 서열을 포함하는 비-천연 발생 또는 조작된 조성물이 제공되며,
Cpf1 효소는 본원에 기재된 바와 같은 하나 이상의 DD를 포함하는 변형된 효소이며,
제1 및 제2 가이드 서열은 전사되는 경우, 각각 제1 및 제2 표적 서열로의 제1 및 제2 CRISPR 복합체의 서열-특이적 결합을 유도하며,
제1 CRISPR 복합체는 제1 표적 서열에 혼성화할 수 있는 제1 가이드 서열과 복합체화된 Cpf1 효소를 포함하며,
제2 CRISPR 복합체는 제2 표적 서열에 혼성화할 수 있는 제2 가이드 서열과 복합체화된 Cpf1 효소를 포함하며,
제1 가이드 서열은 제1 표적 서열의 근처에서 DNA 듀플렉스의 하나의 가닥의 절단을 유도하며, 제2 가이드 서열은 제2 표적 서열의 근처에서 다른 가닥의 절단을 유도하여, 이중 가닥 파손을 유도하며, 이에 의해, 유기체 또는 비-인간 또는 비-동물 유기체를 변형시킨다.
또 다른 구현예에서, Cpf1은 단백질로서 세포 내로 전달된다. 또 다른 그리고 특히 바람직한 구현예에서, Cpf1은 단백질로서 또는 이를 인코딩하는 뉴클레오티드 서열로서 세포 내로 전달된다. 단백질로서의 세포로의 전달은 리보핵단백질(RNP) 복합체의 전달을 포함할 수 있으며, 여기서, 단백질은 가이드와 복합체화된다.
일 양태에서, 본 발명의 조성물, 시스템 또는 변형된 효소에 의해 변형된 또는 이들을 포함하는 숙주 세포 및 세포주가 제공되며, 이는 그의 줄기 세포 및 자손을 포함한다.
일 양태에서, 세포적 치료 방법이 제공되며, 예를 들어 단일 세포 또는 세포 집단이 샘플링되거나 배양되며, 여기서 세포 또는 세포들은 본 명세서에 설명된 바와 같이 생체 외 변형되거나 변형된 것이며, 이후 유기체 내로 재도입(샘플링된 세포) 또는 도입(배양된 세포)된다. 배아성인지 또는 만능성 또는 전능성 줄기 세포를 유도하는지의 여부에 관계없이, 줄기 세포 또한 이러한 면에서 특히 바람직하다. 그러나, 물론 생체 내 구현예도 또한 고려된다.
본 발명의 방법은 수복 주형과 같은 주형의 전달을 추가로 포함할 수 있으며, 하기를 참조하여, 이는 dsODN 또는 ssODN일 수 있다. 주형의 전달은 임의의 또는 모든 CRISPR 효소 또는 가이드 RNA와 함께 또는 그와 분리되어, 그리고 동일하거나 상이한 전달 메커니즘을 통해 전달될 수 있다. 일부 구현예에서, 주형은 가이드와 함께, 바람직하게는 CRISPR 효소와도 함께 전달되는 것이 바람직하다. 예로는, CRISPR 효소가 AsCpf1 또는 LbCpf1인 AAV 벡터일 수 있다.
본 발명의 방법은 (a) 상기 이중 가닥 파손에 의해 창출된 오버행(overhang)에 대해 상보적인 오버행을 포함하는 이중-가닥 올리고데옥시뉴클레오티드 (dsODN)의 세포로의 전달로서, 상기 dsODN은 관심 유전자 내로 통합된 전달; 또는 (b) 단일-가닥 올리고데옥시뉴클레오티드(ssODN)의 세포로의 전달을 추가로 포함할 수 있고, 상기 ssODN은 상기 이중 가닥 파손의 상동성 직접 수복을 위한 주형으로서 작용한다. 본 발병의 방법은 개인에서 질병의 예방 또는 치료를 위한 것일 수 있으며, 선택적으로 상기 질병은 상기 관심 유전자좌에서의 결함에 의해 유발된다. 본 발명의 방법은 개인에서 생체 내에서 또는 개인으로부터 취한 세포 상에서 생체 외에서 수행될 수 있으며, 여기서 선택적으로 상기 세포는 개인에게 되돌려진다.
본 발명은 또한 본 명세서에서 정의된 바와 같은 탠덤 또는 다중 표적화에서의 이용을 위하여, CRISPR 효소 또는 Cas 효소 또는 Cpf1 효소 또는 CRISPR-CRISPR 효소 또는 CRISPR-Cas 시스템 또는 CRISPR-Cpf1 시스템의 이용으로부터 수득된 생성물을 포괄한다.
멀티플렉스(탠덤) 표적화 접근법에 사용되는 본 발명에 따른 효소
본 발명자들은 본 명세서에서 정의된 바와 같은 CRISPR 효소가 활성을 잃지 않으면서 하나 초과의 RNA 가이드를 사용할 수 있음을 보여주었다. 이는 본 명세서에서 정의된 바와 같은 단일 효소, 시스템 또는 복합체를 이용하여 다수의 DNA 표적, 유전자 또는 유전자좌를 표적하기 위한 본 명세서에서 정의된 바와 같은 CRISPR 효소, 시스템 또는 복합체의 이용을 가능하게 한다. 가이드 RNA는 탠덤적으로 배열될 수 있고, 본 명세서에서 정의된 바와 같은 직접 반복부와 같은 뉴클레오티드 서열에 의해 선택적으로 분리될 수 있다. 상이한 가이드 RNA의 위치는 그 탠덤이 활성에 영향을 미치지 않는 것이다.
일 양태에서, 본 발명은, 탠덤 또는 멀티플렉스 표적화를 위해 사용되는, 본 명세서에서 설명된 바와 같은 본 발명에 따른 Cpf1을 제공한다. 본원의 다른 곳에 기재된 것과 같은, 본 발명에 따른 CRISPR(또는 CRISPR-Cas 또는 Cas) 효소, 복합체, 또는 시스템이 그러한 시도에 사용될 수 있을 것임이 이해되어야 한다. 본 명세서에서 설명된 것과 같은 방법, 생성물, 조성물 및 이용 중 어느 하나는 하기 더욱 상술되는 멀티플렉스 또는 탠덤 표적화 접근과 함께 균등하게 적용가능하다. 추가의 안내에 의해, 하기 특정 양태 및 구현예가 제공된다.
일 양태에서, 본 발명은 다수의 유전자좌를 표적화하기 위한, 본 명세서에서 정의된 바와 같은 Cpf1 효소, 복합체 또는 시스템의 이용을 제공한다. 일 구현예에서, 이는 다수의 (탠덤 또는 멀티플렉스) 가이드 RNA(gRNA) 서열을 이용함으로써 수립될 수 있다.
일 양태에서, 본 발명은 탠덤 또는 멀티플렉스 표적화를 위해 본 명세서에서 정의된 바와 같은 Cpf1 효소, 복합체 또는 시스템의 하나 이상의 요소를 이용하는 방법을 제공하며, 여기서 상기 CRISP 시스템은 다수의 가이드 RNA 서열을 포함한다. 바람직하게는, 상기 gRNA 서열은 본 명세서 어느 부분에서 정의된 바와 같은 직접 반복부와 같은 뉴클레오티드 서열에 의해 분리된다.
일 양태에서, 본 발명은 본 명세서에서 정의된 바와 같은 Cpf1 효소, 시스템 또는 복합체, 즉, Cpf1 단백질, 및 DNA 분자와 같은 다수의 핵산 분자를 표적화하는 다수의 가이드 RNA를 갖는 Cpf1 CRISPR-Cas 복합체를 제공하며, 이로 인해 상기 다수의 가이드 RNA 각각은 그의 상응하는 핵산 분자, 예를 들어 DNA 분자를 표적한다. 각각의 핵산 분자 표적, 예를 들어 DNA 분자는 유전자 생성물을 인코딩할 수 있거나 유전자좌를 포괄할 수 있다. 다수의 가이드 RNA의 이용은, 따라서 다수의 유전자좌 또는 다수의 유전자의 표적화를 가능하게 한다. 일부 구현예에서 Cpf1 효소는 그 유전자 생성물을 인코딩하는 DNA 분자를 절단할 수 있다. 일부 구현예에서 유전자 생성물의 발현은 변경된다. Cpf1 단백질 및 가이드 RNA는 함께 자연적으로 발생하지 않는다. 본 발명은 탠덤적으로 배열된 가이드 서열을 포함하는 가이드 RNA를 포괄한다. Cpf1 효소는 CRISPR 시스템 또는 복합체의 부분을 형성할 수 있으며, 이는 각각 세포 내 관심 게놈 유전자좌에서 표적 서열에 특이적으로 혼성화할 수 있는 일련의 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 25, 25, 30, 또는 30 초과의 가이드 서열을 포함하는, 탠덤적으로 배열된 가이드 RNA(gRNA)를 추가로 포함한다. 일부 구현예에서, 작용적 Cpf1 CRISPR 시스템 또는 복합체는 다수의 표적 서열에 결합한다. 일부 구현예에서, 작용적 CRISPR 시스템 또는 복합체는 다수의 표적 서열을 편집할 수 있으며, 예를 들어, 표적 서열은 게놈 유전자좌를 포함할 수 있으며, 일부 구현예에서 유전자 발현의 변경이 있을 수 있다. 일부 구현예에서, 작용적 CRISPR 시스템 또는 복합체는 작용 도메인을 추가로 포함할 수 있다. 일부 구현예에서, 본 발명은 다수의 유전자 생성물의 발현을 변경 또는 변형하는 방법을 제공한다. 본 방법은 상기 표적 핵산, 예를 들어 DNA 분자를 함유하거나, 또는 표적 핵산 예를 들어 DNA 분자를 함유 및 발현하는 세포 내로의 도입을 포함할 수 있고; 예를 들어 표적 핵산은 유전자 생성물을 인코딩할 수 있거나 유전자 생성물의 발현을 제공할 수 있다(예를 들어, 조절 서열).
바람직한 구현예에서, 멀티플렉스 표적화에 사용된 CRISPR 효소는 Cpf1이거나, CRISPR 시스템 또는 복합체는 Cpf1을 포함한다. 일부 구현예에서, 멀티플렉스 표적화에 사용된 CRISPR 효소는 AsCpf1이거나, 또는 멀티플렉스 표적화에 사용된 CRISPR 시스템 또는 복합체는 AsCpf1를 포함한다. 일부 구현예에서, CRISPR 효소는 LbCpf1이거나, 또는 CRISPR 시스템 또는 복합체는 LbCpf1을 포함한다. 일부 구현예에서, 멀티플렉스 표적화에 사용된 Cpf1 효소는 DNA의 가닥 모두를 절단하여 이중 가닥 파손(DSB)을 생성한다. 일부 구현예에서, 멀티플렉스 표적화에 사용된 CRISPR 효소는 닉카제이다. 일부 구현예에서, 멀티플렉스 표적화에 사용된 Cpf1 효소는 이중 닉카제이다. 일부 구현예에서, 멀티플렉스 표적화에 사용된 Cpf1 효소는 Cpf1 효소 예컨대 본 명세서 어느 부분에서 정의된 바와 같은 DD Cpf1 효소이다.
일부 일반적인 구현예에서, 멀티플렉스 표적화에 사용된 Cpf1 효소는 하나 이상의 작용 도메인에 연결된다. 더욱 특정한 일부 구현예에서, 멀티플렉스 표적화에 사용된 CRISPR 효소는 본 명세서 어느 부분에서 정의된 바와 같은 deadCpf1이다.
멀티플렉스 표적화에서의 이용을 위해 본 명세서에서 사용된 바와 같은 Cpf1 효소, 복합체 또는 시스템을 구성적으로 발현하는 모델이 또한 제공된다. 생물은 유전자이식성일 수 있으며, 본 벡터로 트랜스펙션된 것일 수 있거나 그렇게 트랜스펙션된 생물의 자손일 수 있다. 추가의 양태에서, 본 발명은 본 명세서에서 정의된 바와 같은 CRISPR 효소, 시스템 및 복합체를 포함하는 조성물 또는 본 명세서에서 설명된 폴리뉴클레오티드 또는 벡터를 제공한다. 바람직하게는 탠덤적으로 배열된 포맷으로, 다수의 가이드 RNA를 포함하는 Cpf1 CRISPR 시스템 또는 복합체가 또한 제공된다. 상기 상이한 가이드 RNA는 직접 반복부와 같은 뉴클레오티드 서열에 의해 분리될 수 있다.
대상체, 예를 들어 치료를 필요로 하는 대상체를 치료하는 방법으로서, 이는 대상체를 Cpf1 CRISPR 시스템 또는 복합체를 인코딩하는 폴리뉴클레오티드 또는 본 명세서에 설명된 임의의 폴리뉴클레오티드 또는 벡터로 형질전환시킴으로써 유전자 편집을 유도하고, 그를 대상체로 투여하는 것을 포함하는 방법이 또한 제공된다. 적합한 수복 주형이 또한 제공될 수 있으며, 예를 들어 상기 수복 주형을 포함하는 벡터에 의해 전달될 수 있다. 대상체, 예를 들어 치료를 필요로 하는 대상체를 치료하는 방법으로서, 대상체를 본 명세서에 설명된 바와 같은 폴리뉴클레오티드 또는 벡터로 형질전환시킴으로써 다수 표적 유전자좌의 전사 활성화 또는 억제를 유도하는 것을 포함하는 방법이 또한 제공되며, 여기서 상기 폴리뉴클레오티드 또는 벡터는 바람직하게는 탠덤적으로 배열된 다수의 가이드 RNA를 포함하는 Cpf1 효소, 복합체 또는 시스템을 인코딩 또는 포함한다. 임의의 치료가 생체 외, 예를 들어 세포 배양물에서 일어나는 경우, 이는 용어 '대상체'가 '세포 또는 세포 배양물'이라는 구절로 대체될 수 있음을 이해해야 할 것이다.
바람직하게는 탠덤적으로 배열된, 다수의 가이드 RNA를 포함하는 Cpf1 효소, 복합체 또는 시스템을 포함하는 조성물 또는 바람직하게는 탠덤적으로 배열된, 다수의 가이드 RNA를 포함하는 상기 Cpf1 효소, 복합체 또는 시스템을 인코딩 또는 포함하는 폴리뉴클레오티드 또는 벡터 또한, 본 명세서 어느 부분에서 정의된 바와 같은 처리 방법에서의 이용을 위해 제공된다. 그러한 치료 방법을 위한 의약의 제조에서 상기 조성물의 이용이 또한 제공된다. 스크리닝에서의 Cpf1 CRISPR 시스템의 이용 또한 본 발명에 의해 제공되고, 예를 들어 작용의 획득을 스크리닝한다. 유전자를 과잉발현하도록 인공적으로 강제된 세포는 예를 들어 음성 피드백 루프(negative feedback loop)에 의해 시간 경과에 따라 유전자를 하향 조절할 수 있다(평형 재-수립). 스크리닝 시작까지는, 비조절된 유전자가 다시 감소될 수 있다. 유도성 Cpf1 활성화제의 이용은, 스크리닝 전에 전사가 유도되는 것을 허용하고, 이에 따라 잘못된 음성 히트(hit)의 가능성을 최소화한다. 따라서, 스크리닝, 예를 들어 작용의 획득 스크리닝에서 본 발명의 이용에 의해, 잘못된 음성 결과의 가능성이 최소화될 수 있다.
일부 구현예에서, 숙주 세포는 본 명세서에서 정의된 바와 같은 다중 표적화에서의 이용을 위해 Cpf1 효소, 시스템 또는 복합체를 인코딩하는 폴리뉴클레오티드를 포함하는 하나 이상의 벡터를 이용하여 일시적으로 또는 일시적이지 않게 트랜스펙션된다. 일부 구현예에서, 세포는 대상체에서 자연적으로 발생하기 때문에, 트랜스펙션된다. 일부 구현예에서, 트랜스펙션된 세포를 대상체로부터 취한다. 일부 구현예에서, 세포는 대상체로부터 취한 세포, 예컨대 세포주로부터 유도된다. 조직 배양을 위한 광범위한 세포주가 당업계에 알려져 있고 본 명세서 어느 부분에서 예시된다. 세포주는 당업자에게 알려진 각종 공급원으로부터 입수가능하다(예를 들어, 미국 균주 은행(ATCC)(버지니아 매나서스 소재) 참조). 일부 구현예에서, 본 명세서에서 정의된 바와 같은 다중 표적화에서의 이용을 위한 Cpf1 효소, 시스템 또는 복합체를 인코딩하는 폴리뉴클레오티드를 포함하는 하나 이상의 벡터로 트랜스펙션된 세포는 하나 이상의 벡터 유도된 서열을 포함하는 신규 세포주를 수립하는데 사용된다. 일부 구현예에서, 본 명세서에 설명된 바와 같은 다중 표적화에서의 이용을 위한 Cpf1 CRISPR 시스템 또는 복합체의 성분으로 일시적으로 트랜스펙션되고(예컨대, 하나 이상의 벡터의 일시 트랜스펙션, 또는 RNA를 이용한 트랜스펙션에 의해), Cpf1 CRISPR 시스템 또는 복합체의 활성을 통하여 변형된 세포는 변형을 포함하지만 임의의 다른 외인성 서열은 결여한 세포를 포함하는 신규 세포주를 수립하는데 사용된다. 일부 구현예에서, 본 명세서에서 정의된 바와 같은 다중 표적화에서의 이용을 위한 Cpf1 효소, 시스템 또는 복합체를 인코딩하는 폴리뉴클레오티드를 포함하는 하나 이상의 벡터를 이용하여 일시적으로 또는 비-일시적으로 트랜스펙션된 세포, 또는 그러한 세포로부터 유래된 세포주는 하나 이상의 시험 화합물을 평가하는데 사용된다.
용어 "조절 요소"는 본 명세서 어느 부분에서 정의된 바와 같다.
유리한 벡터는 렌티바이러스 및 아데노-연관 바이러스를 포함하며, 그러한 유형의 벡터들이 또한 세포의 특정 유형을 표적화하도록 선택될 수 있다.
일부 구현예에서, Cpf1 효소는 제V형 또는 제VI형 CRISPR 시스템 효소이다. 일부 구현예에서, Cpf1 효소는 Cpf1 효소이다. 일부 구현예에서, Cpf1 효소는 야토균(프란시셀라 툴라렌시스) 1, 야토균 아종 노비시다, 프레보텔라 알벤시스, 라크노스피라세 박테리움 MC2017 1, 부티리비브리오 프로테오클라스티쿠스, 페레그리니박테리아 박테리움 GW2011_GWA2_33_10, 파르쿠박테리아 박테리움 GW2011_GWC2_44_17, 스미텔라 종 SCADC, 아시다미노코커스 종 BV3L6, 라크노스피라세 박테리움 MA2020, 칸디다투스 메타노플라즈마 테르미툼, 유박테리움 엘리겐스, 모락셀라 보보쿨리 237, 모락셀라 보보쿨리 AAX08_00205, 모락셀라 보보쿨리 AAX11_00205, 부티리비브리오 종 NC3005, 티오마이크로스피라 종 XS5, 렙토스피라 이나다이, 라크노스피라세 박테리움 ND2006, 포르피로모나스 크레비오리카니스 3, 프레보텔라 디시엔스, 또는 포르피로모나스 마카카에 Cpf1로부터 유래되며, 본 명세서 어느 부분에서 정의된 바와 같은 Cpf1의 추가의 변경 또는 돌연변이를 포함할 수 있으며, 키메라 Cpf1일 수 있다. 다수의 가이드 RNA가 사용된 경우, 이들은 바람직하게는 직접 반복부 서열에 의해 분리된다.
일 양태에서, 본 발명은 진핵 세포와 같은 숙주 세포에서 다수의 폴리뉴클레오티드의 변형 방법을 제공한다. 일부 구현예에서, 본 방법은 Cpf1CRISPR 복합체가 다수의 표적 폴리뉴클레오티드에 결합하는 것을 가능하게 하여, 예를 들어 상기 다수의 표적 폴리뉴클레오티드를 절단시키고, 그에 의해 다수의 표적 폴리뉴클레오티드를 변형시키는 것을 포함하고, 여기서 Cpf1CRISPR 복합체는, 그 각각이 상기 표적 폴리뉴클레오티드 내에서 특정 표적 서열에 혼성화되는 다수의 가이드 서열에 복합체화된 Cpf1 효소를 포함하며, 상기 다수의 가이드 서열은 직접 반복부 서열에 연결된다. 일부 구현예에서, 상기 절단은 표적 서열 각각의 위치에서 하나 또는 두 가닥을 상기 Cpf1 효소에 의해 절단하는 것을 포함한다. 일부 구현예에서, 상기 절단은 다수의 표적 유전자의 감소된 전사를 결과로서 초래한다. 일부 구현예에서, 본 방법은 외인성 주형 폴리뉴클레오티드를 이용한 상동성 재조합에 의해 상기 절단된 하나 이상의 표적 폴리뉴클레오티드를 수복하는 것을 추가로 포함하며, 상기 수복은 하나 이상의 상기 표적 폴리뉴클레오티드의 하나 이상의 뉴클레오티드의 삽입, 결실 또는 치환을 포함하는 돌연변이를 결과로서 초래한다. 일부 구현예에서, 상기 돌연변이는 하나 이상의 표적 서열(들)을 포함하는 유전자로부터 발현된 단백질에서 하나 이상의 아미노산의 변화를 결과로서 초래한다. 일부 구현예에서, 본 발명은 하나 이상의 벡터를 상기 진핵 세포에 전달하는 것을 추가로 포함하며, 여기서 하나 이상의 벡터는 Cpf1 효소 및 직접 반복부 서열에 연결된 다수의 가이드 RNA 서열 중 하나 이상의 발현을 유도한다. 일부 구현예에서, 상기 벡터는 대상체 내 진핵 세포로 전달된다. 일부 구현예에서, 상기 변형은 세포 배양물 내 상기 진핵 세포에서 일어난다. 일부 구현예에서, 방법은 상기 변형 전에 대상체로부터 상기 진핵 세포를 분리하는 것을 추가로 포함한다. 일부 구현예에서, 방법은 상기 진핵 세포 및/또는 그로부터 유도된 세포를 상기 대상체로 되돌려주는 것을 추가로 포함한다.
본 발명의 일 양태는 상기 요소가 단일의 조성물에 포함되거나, 개별 조성물에 포함되는 것이다. 이들 조성물을 유리하게는 숙주에 적용하여, 게놈 수준에서 기능적 효과를 유도할 수 있다.
각각의 gRNA는 동일하거나 상이한 어댑터 단백질에 특이적인 다수의 결합 인식 부위(예를 들어, 압타머)를 포함하도록 설계될 수 있다. 각각의 gRNA는 전사 시작 부위 (즉, TSS)의 상류에서 -1000 내지 +1 개 핵산, 바람직하게는 -200 개 핵산 영역에 결합하도록 설계될 수 있다. 이러한 위치선정은 유전자 활성화(예를 들어, 전사 활성화제) 또는 유전자 저해 (예를 들어, 전사 억제제)에 작용하는 작용 도메인을 개선시킨다. 변형된 gRNA는 조성물을 구성하는 하나 이상의 표적 유전자좌(예를 들어, 1 이상의 gRNA, 2 이상의 gRNA, 5 이상의 gRNA, 10 이상의 gRNA, 20 이상의 gRNA, 30 이상의 gRNA, 50 이상의 gRNA에서)로 표적되는 하나 이상의 변형된 gRNA일 수 있다. 상기 다수의 gRNA 서열은 탠덤적으로 배열될 수 있고, 바람직하게는 직접 반복부에 의해 구분된다.
일부 구현예에서, 표현형 변경은 특히 치료 방법에서, 바람직하게는 표현형의 편집 또는 변경을 위해 수복 주형이 제공된 경우에서, 바람직하게는 유전적 질병이 표적된 경우 게놈 변경의 결과이다.
일부 구현예에서, 표적될 수 있는 질병은 질병-유발 스플라이스 결함과 연관이 있는 것들을 포함한다.
일부 구현예에서, 세포 표적은, 조혈성 줄기/선조 세포(progenitor cell)(CD34+); 인간 T 세포; 및 눈(망막 세포) - 예를 들어 광수용체 전구 세포를 포함한다.
일부 구현예에서, 유전자 표적은, 인간 베타 글로빈- HBB(유전자-전환을 자극시키는 것을 포함하는(내생의 주형으로서 밀접하게 연관된 HBD 유전자를 이용), 겸상 적혈구 빈혈증의 치료를 위함); CD3(T-세포); 및 CEP920 -망막(눈)을 포함한다.
일부 구현예에서, 질병 표적은 또한, 암; 겸상 적혈구 빈혈증(점 돌연변이를 기초로 함); HBV, HIV; 베타-지중해빈혈(Beta-Thalassemia); 및 안과질환 또는 안 질환- 예를 들어 레베르 선천성 흑암시(Leber Congenital Amaurosis(LCA))-유발 스플라이스 결함을 포함한다. 일부 구현예에서 전달 방법은, 효소-가이드 복합체(리보뉴클레오단백질(RiboNucleoProtein))의 양이온 지질 매개 "직접" 전달 및 플라스미드 DNA의 전기천공을 포함한다.
본 명세서에 설명된 방법, 생성물 및 이용은 비-치료적 목적을 위해 사용될 수 있다. 추가로, 본 명세서에 설명된 임의의 방법은 시험관 내 및 생체 외에 적용될 수 있다.
일 양태에서, 하기 I 및 II를 포함하는 비-천연 발생 또는 조작된 조성물이 제공되며:
I. (a) 폴리뉴클레오티드 유전자좌 내 제1 표적 서열에 혼성화할 수 있는 제1 가이드 서열,
(b) 폴리뉴클레오티드 유전자좌 내 제2 표적 서열에 혼성화할 수 있는 제2 가이드 서열,
(c) 직접 반복부 서열
을 포함하는 둘 이상의 CRISPR-Cas 시스템 폴리뉴클레오티드 서열,
II. Cpf1 효소 또는 그를 인코딩하는 제2 폴리뉴클레오티드 서열,
전사된 경우, 제1 및 제2 가이드 서열은 제1 및 제2 Cpf1 CRISPR 복합체의 제1 및 제2 표적 서열 각각으로의 서열-특이적 결합을 유도하며,
제1 CRISPR 복합체는 제1 표적 서열에 혼성화가능한 제1 가이드 서열과 복합체화된 Cpf1 효소를 포함하고,
제2 CRISPR 복합체는 제2 표적 서열에 혼성화가능한 제2 가이드 서열과 복합체화된 Cpf1 효소를 포함하고,
제1 가이드 서열은 제1 표적 서열 가까이에서 DNA 이중나선의 하나의 가닥의 절단을 유도하고, 제2 가이드 서열은 제2 표적 서열 가까이에서 다른 하나의 가닥의 절단을 유도하여 이중 가닥 파손을 유도하고, 이에 의해 생물 또는 비-인간 또는 비-동물성 생물을 변형시킨다. 유사하게, 둘 초과의 가이드 RNA를 포함하는 조성물이 고려될 수 있으며, 예를 들어 이들 각각은 하나의 표적에 특이적이고, 본 명세서에서 설명된 바와 같은 조성물 또는 CRISPR 시스템 또는 복합체에서 탠덤적으로 배열된다.
데드 가이드 서열을 포함하는 본 발명에 따른 가이드 RNA
일 양태에서, 본 발명은 CRISPR 복합체의 형성 및 표적으로의 성공적인 결합을 허용함과 동시에, 성공적인 뉴클레아제 활성을 허용하지 않는(즉, 뉴클레아제 활성 부재/삽입결실 활성 부재)방식으로 변형되는 가이드 서열을 제공한다. 설명을 위하여, 이러한 변형된 가이드 서열은 "데드 가이드" 또는 "데드 가이드 서열"로 지칭된다. 이들 데드 가이드 또는 데드 가이드 서열은 뉴클레아제 활성에 관하여 촉매적으로 비활성이거나 입체형태적으로 비활성인 것으로 생각될 수 있다. 뉴클레아제 활성은 해당 분양에 흔히 사용되는 바와 같은 surveyor 분석 또는 딥 시퀀싱, 바람직하게는 surveyor 분석을 사용하여 측정될 수 있다. 유사하게, 데드 가이드 서열은 촉매 활성을 촉진시키는 능력 또는 표적상 및 표적외 결합 활성을 구별하는 능력에 관하여 생성적 염기 쌍형성에서 충분히 관여하지 않을 수 있다. 약술하면, surveyor 검정은 유전자에 대한 CRISPR 표적 부위를 정제하고, 증폭시키고, CRISPR 표적 부위를 증폭시키는 프라이머를 사용하여 헤테로듀플렉스를 형성하는 것을 포함한다. 재-어닐링 후에, 생성물을 제조처의 권고된 프로토콜에 따라 SURVEYOR 뉴클레아제 및 SURVEYOR 인핸서 S(트랜스게노믹스(Transgenomics))로 처리하고, 겔 상에서 분석하고, 상대적 밴드 세기에 기초하여 정량화시킨다.
그러므로, 관련 양태에서, 본 발명은 본원에 기재된 바와 같은 기능적 Cpf1 및 가이드 RNA(gRNA)를 포함하는 비-천연 발생 또는 조작된 조성물 Cpf1 CRISPR-Cas 시스템을 제공하며, gRNA는 데드 가이드 서열을 포함하며, 이에 의해, gRNA는 표적 서열에 혼성화하여, SURVEYOR 검정에 의해 검출시 시스템의 비-돌연변이체 Cpf1 효소의 뉴클레아제 활성으로부터 생기는 검출 가능한 삽입결실 활성 없이 Cpf1 CRISPR-Cas 시스템이 세포 내의 관심 게놈 유전자에 지향되게 할 수 있다. 약칭 목적을 위하여, gRNA는 데드 가이드 서열을 포함하여, 이에 의해, gRNA는 표적 서열에 혼성화하여, SURVEYOR 검정에 의해 검출시 시스템의 비-돌연변이체 Cpf1 효소의 뉴클레아제 활성으로부터 생기는 검출 가능한 삽입결실 활성 없이 Cpf1 CRISPR-Cas 시스템이 세포 내의 관심 게놈 유전자에 지향되게 할 수 있으며, 이는 본원에 "데드 gRNA"로 명명된다. 본원의 다른 곳에 기재된 바와 같은 본 발명에 따른 gRNA 중 임의의 것이 하기 본원에 기재된 바와 같은 데드 gRNA/데드 가이드 서열을 포함하는 gRNA로서 사용될 수 있는 것이 이해될 것이다. 본원의 다른 곳에 기재된 바와 같은 방법, 생성물, 조성물 및 용도 중 임의의 것은 하기에 추가로 상세히 기재된 바와 같은 데드 gRNA/데드 가이드 서열을 포함하는 gRNA를 사용하여 동일하게 적용 가능하다. 추가의 지침에 의해 하기의 특정 양태 및 구현예가 제공된다.
표적 서열로의 CRISPR 복합체의 서열-특이적 결합을 유도하기 위한 데드 가이드 서열의 능력은 임의의 적합한 검정에 의해 평가될 수 있다. 예를 들어, 시험할 데드 가이드 서열을 포함하는, CRISPR 복합체를 형성하기에 충분한 CRISPR 시스템의 성분은 예컨대, CRISPR 서열의 성분을 인코딩하는 벡터로의 트랜스펙션에 의해 상응하는 표적 서열을 갖는 숙주 세포에게 제공되고, 이어서 예컨대, 본원에 기재된 바와 같은 Surveyor 검정에 의하여 표적 서열 내의 우선적인 절단을 평가할 수 있다. 유사하게, 표적 폴리뉴클레오티드 서열의 절단은, 시험할 데드 가이드 서열 및 시험 데드 가이드 서열과 상이한 대조군 가이드 서열을 포함하는 CRISPR 복합체의 성분을 제공하고, 시험 및 대조군 가이드 서열 반응 간의 표적 서열에서의 결합 또는 절단율을 비교함으로써 시험관에서 평가될 수 있다. 다른 검정이 가능하며, 해당 분야의 숙련자에게 일어날 것이다. 데드 가이드 서열을 선택하여 임의의 표적 서열을 표적화할 수 있다. 일부 구현예에서, 표적 서열은 세포의 게놈 내의 서열이다.
본원에 추가로 설명된 바와 같이, 몇몇의 구조적 파라미터는 적절한 프레임워크가 이러한 데드 가이드에 도달하게 한다. 데드 가이드 서열은 활성 Cpf1-특이적 삽입결실 형성을 초래하는 각각의 가이드 서열보다 더 짧다. 데드 가이드는 활성 Cpf1-특이적 삽입결실 형성을 야기하는 동일한 Cpf1에 대해 유도된 각각의 가이드보다 5%, 10%, 20%, 30%, 40%, 50% 더 짧다.
하기에 설명되고, 해당 분야에 알려져 있는 바와 같이, gRNA - Cpf1 특이성의 일 양태는 직접 반복부 서열이며, 이는 적절하게 이러한 가이드에 연결될 것이다. 특히, 이것은 직접 반복부 서열이 Cpf1의 기원에 따라 설계되는 것을 암시한다. 따라서, 입증된 데드 가이드 서열에 대하여 이용 가능한 구조 데이터는 Cpf1 특이적 등가물을 설계하기 위해 사용될 수 있다. 예를 들어, 둘 이상의 Cpf1 이펙터 단백질의 오솔로그 뉴클레아제 도메인 RuvC의 구조적 유사성을 사용하여 등가의 설계 데드 가이드를 전달할 수 있다. 따라서, 본원의 데드 가이드는 길이 및 서열을 적절하게 변형시켜, 이러한 Cpf1 특이적 등가물을 반영하여, CRISPR 복합체의 형성 및 표적으로의 성공적인 결합을 가능하게 함과 동시에, 성공적인 뉴클레아제 활성을 허용하지 않을 수 있다.
본원 및 해당 기술의 상태의 맥락에서 데드 가이드의 용도는 놀랍고 예상하지 못한 시험관내, 생체외 및 생체내 응용 모두에서의 네트워크 생물학 및/또는 시스템 생물학을 위한 플랫폼을 제공하여, 멀티플렉스 유전자 표적화 및 특히 양방향적 멀티플렉스 유전자 표적화를 허용한다. 데드 가이드의 사용 전에, 예를 들어, 유전자 활성의 활성화, 억제 및/또는 침묵화를 위하여 다수의 표적을 다루는 것은 힘들고, 일부 경우에는 가능하지 않다. 데드 가이드의 사용으로, 예를 들어, 동일한 세포, 동일한 동물 또는 동일한 환자에서 다수의 표적 및 이에 따라 다수의 활성이 대처될 수 있다. 이러한 다중화는 동시에 또는 원하는 기간 동안 엇갈리게 발생할 수 있다.
예를 들어, 데드 가이드는 이제 처음으로 뉴클레아제 활성의 결과 없이 유전자 표적화를 위한 수단으로서 gRNA를 사용하게 함과 동시에, 활성화 또는 억제를 위해 유도된 수단을 제공한다. 데드 가이드를 포함하는 가이드 RNA는 유전자 활성의 활성화 또는 억제를 허용하는 방식으로 요소, 특히, 본원의 다른 곳에 기재된 바와 같은 단백질 어댑터(예를 들어, 압타머)를 추가로 포함하여, 유전자 이펙터(예를 들어, 유전자 활성의 활성인자 또는 억제인자)의 기능적 배치를 허용하도록 변형될 수 있다. 일 예는 본원에 설명된, 해당 분야의 상태의 압타머의 혼입이다. 데드 가이드를 포함하는 gRNA를 조작하여, 단백질-상호작용 압타머(문헌[Konermann et al., "Genome-scale transcription activation by an engineered CRISPR-Cas9 complex," doi:10.1038/nature14136, incorporated herein by reference])를 혼입시킴으로써, 다수의 별개의 이펙터 도메인으로 이루어진 합성 전사 활성화 복합체를 조립할 수 있다. 이는 천연의 전사 활성화 과정 후에 모델링될 수 있다. 예를 들어, 이펙터(예를 들어, 활성인자 또는 억제인자; 활성인자 또는 억제인자와의 융합 단백질로서 이량체화된 MS2 박테리오파지 코트 단백질)에 선택적으로 결합하는 압타머 또는 그 자체가 이펙터(예를 들어, 활성인자 또는 억제인자)에 결합하는 단백질은 데드 gRNA 테트라루프 및/또는 스템-루프 2에 첨부될 수 있다. MS2의 경우에, 융합 단백질 MS2-VP64는 테트라루프 및/또는 스템-루프 2에 결합하고, 차례로 예를 들어, Neurog2에 대하여 전사 상향-조절을 매개한다. 다른 전사 활성인자는 예를 들어, VP64. P65, HSF1 및 MyoD1이다. 이러한 개념의 단지 예에 의해, PP7-상호작용 스템-루프로의 MS2 스템-루프의 대체를 사용하여 억제 요소를 동원할 수 있다.
따라서, 일 양태는 데드 가이드를 포함하는 본 발명의 gRNA이며, gRNA는 본원에 기재된 바와 같이 유전자 활성화 또는 억제를 제공하는 변형을 추가로 포함한다. 데드 gRNA는 하나 이상의 압타머를 포함할 수 있다. 압타머는 유전자 이펙터, 유전자 활성인자 또는 유전자 억제인자에 특이적일 수 있다. 대안적으로, 압타머는 단백질에 특이적일 수 있으며, 이는 차례로 특정 유전자 이펙터, 유전자 활성 인자 또는 유전자 억제인자에 특이적이고, 이를 동원/이에 결합한다. 활성인자 또는 억제인자 동원을 위한 다수의 부위가 존재한다면, 부위가 활성인자 또는 억제인자에 특이적인 것이 바람직하다. 활성인자 또는 억제인자 결합을 위한 다수의 부위가 존재한다면, 부위는 동일한 활성인자 또는 동일한 억제인자에 특이적일 수 있다. 또한, 부위는 상이한 활성인자 또는 상이한 억제인자에 특이적일 수도 있다. 유전자 이펙터, 유전자 활성인자, 유전자 억제인자는 융합 단백질의 형태로 존재할 수 있다.
특정 구현예에서, 조성물은 제2 gRNA를 추가로 포함하며, 제2 gRNA는 제2 표적 서열에 혼성화할 수 있는 라이브(live) gRNA이어서, 시스템의 Cpf1 효소의 뉴클레아제 활성으로부터 생기는 제2 게놈 유전자좌에서의 검출 가능한 삽입 결실 활성과 함께, 제2 Cpf1 CRISPR-Cas 시스템이 세포 내의 관심 있는 제2 게놈 유전자좌에 지향되게 한다.
특정 구현예에서, 조성물은 복수의 데드 gRNA 및/또는 복수의 라이브 gRNA를 추가로 포함한다.
본 발명의 일 양태는 gRNA 스캐폴드의 모듈성 및 맞춤성을 이용하여, 직교 방식으로 별개의 유형의 이펙터를 동원하기 위한 상이한 결합 부위(특히 압타머)를 갖는 일련의 gRNA 스캐폴드를 확립하는 것이다. 다시, 더 넓은 개념의 예시 및 실례를 위하여, PP7-상호작용 스템-루프로의 MS2 스템-루프의 대체를 사용하여, 억제 요소를 결합/동원하여, 다중화된 양방향성 전사 제어를 가능하게 할 수 있다. 따라서, 일반적으로, 데드 가이드를 포함하는 gRNA를 사용하여 멀티플렉스 전사 제어 및 바람직한 양방향성 전사 제어를 제공할 수 있다. 이러한 전사 제어는 유전자에서 가장 바람직하다. 예를 들어, 데드 가이드(들)를 포함하는 하나 이상의 gRNA가 하나 이상의 표적 유전자의 활성화를 표적화하는데 사용될 수 있다. 동시에, 데드 가이드(들)를 포함하는 하나 이상의 gRNA가 하나 이상의 표적 유전자의 억제를 표적화하는데 사용될 수 있다. 이러한 서열은 다양한 상이한 조합으로 적용될 수 있으며, 예를 들어, 표적 서열이 먼저 억제된 다음, 적절한 기간에 다른 표적이 활성화되거나, 선택된 유전자가 억제됨과 동시에 선택된 유전자가 활성화된 후, 추가의 활성화 및/또는 억제로 이어진다. 결과적으로, 하나 이상의 생물학적 시스템의 다수의 성분이 유리하게 함께 대처될 수 있다.
또 다른 양태에서, 또한, 구조적 분석을 사용하여 DNA 결합을 가능하게 하지만 DNA 절단을 가능하게 하지 않는 데드 가이드와 활성 Cpf1 뉴클레아제 간의 상호작용을 연구할 수 있다. 이러한 방식으로 Cpf1의 뉴클레아제 활성에 중요한 아미노산이 결정된다. 이러한 아미노산의 변형은 유전자 편집을 위해 사용되는 Cpf1 효소의 개선을 허용한다.
일 양태에서, 본 발명은 Cpf1 CRISPR-Cas 시스템을 표적 유전자좌에 가이드하기 위하여, 데드 가이드 RNA 표적화 서열(데드 가이드 서열)을 설계하거나, 평가하거나, 선택하기 위한 알고리즘을 제공한다. 특히, 데드 가이드 RNA 특이성이 표적화 서열 길이 및 조성과 관련이 있으며, 표적화 서열 길이 및 조성을 달라지게 함으로써 최적화될 수 있는 것이 결정되었다. 일 양태에서, 본 발명은 표적외 결합 또는 데드 가이드 RNA의 상호작용을 최소화시키는 데드 가이드 RNA 표적화 서열의 설계 또는 평가를 위한 알고리즘을 제공한다. 본 발명의 일 구현예에서, 유기체 내의 유전자좌로 CRISPR 시스템을 지향시키기 위한 데드 가이드 RNA 표적화 서열을 선택하기 위한 알고리즘은 a) 하나 이상의 CRISPR 모티프(PAM)를 유전자좌 내에 배치하고, 하나 이상의 CRISPR 모티프의 하류의 서열의 전부 또는 일부를 분석하고, 1, 2, 3개 이상의 미스매치가 상이한 표적화 서열과 매치되는 표적외 서열이 존재하는지 여부를 결정하는 것을 포함한다. 본 발명의 구현예에서, 표적화 서열은 천연 발생 Cpr1 스페이서의 길이에 비하여 절단될 수 있으며, 10 내지 15 또는 10 내지 18, 또는 10 내지 23, 또는 15 내지 23 개 뉴클레오티드, 예를 들어, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22 또는 23 개 뉴클레오티드이다. 특정 구현예에서, 가장 가까운 표적외 서열이 2 개 뉴클레오티드 또는 3 개 이상의 뉴클레오티드가 상이한 것이 필요하다면, 서열은 gRNA에 사용하기 위해 선택된다. 바람직한 구현예에서, gRNA를 위해 선택된 서열은 CRISPR 모티프에 가장 가까운 표적 서열과 매치된다.
일 양태에서, 본 발명은 표적외 결합 또는 데드 가이드 RNA의 상호작용을 최소화시키는 데드 가이드 RNA 표적화 서열을 설계하거나 평가하기 위한 알고리즘을 제공한다. 본 발명의 일 구현예에서, 유기체 내의 유전자좌로 CRISPR 시스템을 지향시키기 위한 데드 가이드 RNA 표적화 서열을 선택하기 위한 알고리즘은 a) 하나 이상의 CRISPR 모티프를 유전자좌 내에 배치하고, b) i) 서열의 GC 함량을 결정하고; ii) 유기체의 게놈 내의 CRISPR 모티프에 가장 가까운 15 개 하류 뉴클레오티드의 표적외 매치가 존재하는지 여부를 결정함으로써 각 CRISPR 모티프의 하류의 20 nt 서열을 분석하고, c) 서열의 GC 함량이 70% 이하이고, 표적외 매치가 확인되지 않으면, 데드 가이드 RNA에 사용하기 위하여 15 개 뉴클레오티드 서열을 선택하는 것을 포함한다. 일 구현예에서, GC 함량이 60% 이하이면, 표적화 서열을 위해 서열을 선택한다. 특정 구현예에서, GC 함량이 55% 이하, 50% 이하, 45% 이하, 40% 이하, 35% 이하, 또는 30% 이하이면, 서열을 표적화 서열을 위해 선택한다. 일 구현예에서, 유전자좌의 둘 이상의 서열을 분석하고, 가장 낮은 GC 함량, 다음으로 가장 낮은 GC 함량 또는 다음으로 가장 낮은 GC 함량을 갖는 서열을 선택한다. 일 구현예에서, 유기체의 게놈에서 표적외 매치가 확인되지 않으면, 서열을 표적화 서열을 위해 선택한다. 일 구현예에서, 표적외 매치가 게놈의 조절 서열에서 확인되지 않으면, 표적화 서열을 선택한다.
일 양태에서, 본 발명은 유기체 내의 유전자좌로 기능화된 CRISPR 시스템을 지향시키기 위하여 데드 가이드 RNA 표적화 서열을 선택하는 방법을 제공하며, 이는 a) 하나 이상의 CRISPR 모티프를 유전자좌 내에 배치하고, b) i) 서열의 GC 함량을 결정하고; ii) 유기체의 게놈 내의 처음 15 nt의 서열의 표적외 매치가 존재하는지 여부를 결정함으로써 각 CRISPR 모티프의 하류의 20 nt 서열을 분석하고, c) 서열의 GC 함량이 70% 이하이고, 표적외 매치가 확인되지 않으면, 가이드 RNA에 사용하기 위하여 서열을 선택하는 것을 포함한다. 일 구현예에서, GC 함량이 50% 이하이면, 서열을 선택한다. 일 구현예에서, GC 함량이 40% 이하이면, 서열을 선택한다. 일 구현예에서, GC 함량이 30% 이하이면, 서열을 선택한다. 일 구현예에서, 둘 이상의 서열을 분석하고, 가장 낮은 GC 함량을 갖는 서열을 선택한다. 일 구현예에서, 표적외 매치를 유기체의 조절 서열에서 결정한다. 일 구현예에서, 유전자좌는 조절 영역이다. 일 양태는 상기 언급된 방법에 따라 선택되는 표적화 서열을 포함하는 데드 가이드 RNA를 제공한다.
일 양태에서, 본 발명은 기능성 CRISPR 시스템을 유기체 내의 유전자좌에 표적화시키기 위한 데드 가이드 RNA를 제공한다. 본 발명의 일 구현예에서, 데드 가이드 RNA는 표적화 서열을 포함하며, 표적 서열의 GC 함량은 70%이하이며, 표적화 서열의 처음 15 nt는 유기체 내의 또 다른 유전자좌의 조절 서열 내의 CRISPR 모티프로부터 하류의 표적외 서열과 매치되지 않는다. 특정 구현예에서, 표적화 서열의 GC 함량은 60% 이하, 55% 이하, 50% 이하, 45% 이하, 40% 이하, 35% 이하 또는 30% 이하이다. 특정 구현예에서, 표적화 서열의 GC 함량은 70% 내지 60% 또는 60% 내지 50% 또는 50% 내지 40% 또는 40% 내지 30%이다. 일 구현예에서, 표적화 서열은 유전자좌의 잠재적인 표적화 서열 중에 가장 낮은 GC 함량을 갖는다.
본 발명의 일 구현예에서, 데드 가이드의 처음 15 nt는 표적 서열과 매치된다. 또 다른 구현예에서, 데드 가이드의 처음 14 nt는 표적 서열과 매치된다. 또 다른 구현예에서, 데드 가이드의 처음 13 nt는 표적 서열과 매치된다. 또 다른 구현예에서, 데드 가이드의 처음 12 nt는 표적 서열과 매치된다. 또 다른 구현예에서, 데드 가이드의 처음 11 nt는 표적 서열과 매치된다. 또 다른 구현예에서, 데드 가이드의 처음 10 nt는 표적 서열과 매치된다. 본 발명의 일 구현예에서, 데드 가이드의 처음 15 nt는 또 다른 유전자좌의 조절 영역 내의 CRISPR 모티프로부터 하류의 표적외 서열과 매치되지 않는다. 다른 구현예에서, 데드 가이드의 처음 14 nt 또는 처음 13 nt, 또는 가이드의 처음 12 nt, 또는 데드 가이드의 처음 11 nt 또는 데드 가이드의 처음 10 nt는 또 다른 유전자좌의 조절 영역 내의 CRISPR 모티프로부터 하류의 표적외 서열과 매치되지 않는다. 다른 구현예에서, 데드 가이드의 처음 15 nt 또는 14 nt 또는 13 nt 또는 12 nt 또는 11 nt는 게놈 내의 CRISPR 모티프로부터 하류의 표적외 서열과 매치되지 않는다.
특정 구현예에서, 데드 가이드 RNA는 표적 서열, 또는 연장된 데드 가이드를 전체로서 취하여, 게놈 내의 임의의 다른 서열과 매치되지 않는 3'-말단에 추가의 뉴클레오티드를 포함한다. 따라서, CRISPR 모티프의 하류의 처음 15 nt 또는 14 nt 또는 13 nt 또는 12 nt 또는 11 nt를 포함하는 데드 가이드 RNA는 3' 말단에서 길이가 12 nt, 13 nt, 14 nt, 15 nt, 16 nt, 17 nt, 18 nt, 19 nt, 20 nt 이상까지 연장될 수 있다.
본 발명은 데드 Cpf1(dCpf1) 또는 기능화된 Cpf1 시스템(기능화된 Cpf1 또는 기능화된 가이드를 포함할 수 있음)을 포함하나 이에 한정되지 않는 Cpf1 CRISPR-Cas 시스템을 유기체 내의 유전자좌에 지향시키는 방법을 제공한다. 일 양태에서, 본 발명은 데드 가이드 RNA 표적화 서열을 선택하기 위한 방법 및 기능성 Cpf1 CRISPR-Cas 시스템에 의한 표적 유전자좌의 유전자 제어를 시행하기 위한 방법을 제공한다. 특정 구현예에서, 상기 방법을 사용하여, 표적외 효과를 최소화시키면서 표적 유전자 조절을 시행한다. 일 양태에서, 본 발명은 둘 이상의 데드 가이드 RNA 표적화 서열을 선택하기 위한 방법 및 기능성 Cpf1 CRISPR-Cas 시스템에 의해 둘 이상의 표적 유전자좌의 유전자 조절을 시행하기 위한 방법을 제공한다. 특정 구현예에서, 상기 방법을 사용하여 표적외 효과를 최소화시키면서 둘 이상의 표적 유전자좌의 조절을 시행한다.
일 양태에서, 본 발명은 유기체 내의 유전자좌로 CRISPR 시스템을 지향시키기 위한 데드 가이드 RNA 표적화 서열을 선택하기 위한 알고리즘은 a) 하나 이상의 CRISPR 모티프를 유전자좌 내에 배치하고, b) i) CRISPR 모티프에 인접한 10 내지 15 nt를 선택하고; ii) 서열의 GC 함량을 결정함으로써 각 CRISPR 모티프의 하류의 서열의 분석하고; c) 서열의 GC 함량이 40% 이상이면, 가이드 RNA에서 사용하기 위하여 표적 서열로서 10 내지 15 nt 서열을 선택하는 것을 포함한다. 일 구현예에서, GC 함량이 50% 이하이면, 서열을 선택한다. 일 구현예에서, GC 함량이 60% 이하이면, 서열을 선택한다. 일 구현예에서, GC 함량이 70% 이하이면, 서열을 선택한다. 일 구현예에서, 둘 이상의 서열을 분석하고, 가장 큰 GC 함량을 갖는 서열을 선택한다. 일 구현예에서, 상기 방법은 CRISPR 모티프의 하류의 서열과 매치되지 않는 뉴클레오티드를 선택된 서열의 3' 말단에 부가하는 것을 추가로 포함한다. 일 양태는 상기 언급된 방법에 따라 선택된 표적화 서열을 포함하는 데드 가이드 RNA를 제공한다.
일 양태에서, 본 발명은 유기체 내의 유전자좌로 기능성화된 CRISPR 시스템을 지향시키기 위한 데드 가이드 RNA를 제공하며, 데드 가이드 RNA의 표적화 서열은 유전자좌의 CRISPR 모티프에 인접한 10 내지 15개 뉴클레오티드로 이루어지며, 표적 서열의 CG 함량은 50% 이상이다. 특정 구현예에서, 데드 가이드 RNA는 유전자좌의 CRISPR 모티프의 하류의 서열과 매치되지 않는 표적화 서열의 3' 말단에 부가되는 뉴클레오티드를 추가로 포함한다.
일 양태에서, 본 발명은 하나 이상의 또는 둘 이상의 유전자좌에 지향될 단일의 이펙터를 제공한다. 특정 구현예에서, 이펙터는 Cpf1과 회합되며, 하나 이상의 또는 둘 이상의 선택된 데드 가이드 RNA는 Cpf1-회합된 이펙터를 하나 이상의 또는 둘 이상의 선택된 표적 유전자좌에 지향시키기 위해 사용된다. 특정 구현예에서, 이펙터는 하나 이상의 또는 둘 이상의 선택된 데드 가이드 RNA와 회합되며, 각각의 선택된 데드 가이드 RNA는 Cpf1 효소와 복합체화되는 경우, 그의 회합된 이펙터가 데드 가이드 RNA 표적으로 국소화되게 한다. 이러한 CRISPR 시스템의 비제한적인 일예는 동일한 전사 인자에 의한 조절을 겪는 하나 이상의 또는 둘 이상의 유전자좌의 활성을 조절한다.
일 양태에서, 본 발명은 하나 이상의 유전자좌에 지향될 둘 이상의 이펙터를 제공한다. 특정 구현예에서, 둘 이상의 데드 가이드 RNA가 사용되며, 둘 이상의 이펙터의 각각은 선택된 데드 가이드 RNA와 회합되며, 둘 이상의 이펙터의 각각은 그의 데드 가이드 RNA의 선택된 표적에 국소화된다. 이러한 CRISPR 시스템의 비제한적인 일 예는 상이한 전사 인자에 의한 조절을 겪는 하나 이상의 또는 둘 이상의 유전자좌의 활성을 조절한다. 따라서, 비제한적인 일 구현예에서, 둘 이상의 전사 인자가 단일의 유전자의 상이한 조절 서열에 국소화된다. 또 다른 비제한적인 구현예에서, 둘 이상의 전사 인자는 상이한 유전자의 상이한 조절 서열에 국소화된다. 특정 구현예에서, 하나의 전사 인자는 활성화제이다. 특정 구현예에서, 하나의 전사 인자는 억제제이다. 특정 구현예에서, 하나의 전사 인자는 활성화제이며, 또 다른 전사 인자는 억제제이다. 특정 구현예에서, 동일한 조절 경로의 상이한 성분을 발현하는 유전자좌가 조절된다. 특정 구현예에서, 상이한 조절 경로의 성분을 발현하는 유전자좌가 조절된다.
일 양태에서, 본 발명은 또한, 활성 Cpf1 CRISPR-Cas 시스템에 의해 매개되는 표적 DNA 절단 또는 표적 결합 및 유전자 조절에 특이적인 데드 가이드 RNA를 설계하고 선택하기 위한 방법 및 알고리즘을 제공한다. 특정 구현예에서, Cpf1 CRISPR-Cas 시스템은 하나의 유전자좌에서 표적 DNA를 절단함과 동시에, 또 다른 유전자좌에 결합하고, 이의 조절을 촉진시키는 활성 Cpf1을 사용하여 직교 유전자 제어를 제공한다.
일 양태에서, 본 발명은 절단 없이, 기능성화된 Cpf1을 유기체 내의 유전자좌에 지향시키기 위한 데드 가이드 RNA 표적화 서열의 선택 방법을 제공하며, 이는 a) 하나 이상의 CRISPR 모티프를 유전자좌 내에 배치하고, b) i) CRISPR 모티프에 인접한 10 내지 15 nt를 선택하고; ii) 서열의 GC 함량을 결정함으로써 각 CRISPR 모티프의 하류의 서열의 분석하고; c) 서열의 GC 함량이 30% 이상, 40% 이상이면, 데드 가이드 RNA에서 사용하기 위하여 표적 서열로서 10 내지 15 nt 서열을 선택하는 것을 포함한다. 일 구현예에서, 표적화 서열의 GC 함량은 35% 이상, 40% 이상, 45% 이상, 50% 이상, 55% 이상, 60% 이상, 65% 이상 또는 70% 이상이다. 특정 구현예에서, 표적화 서열의 GC 함량은 30% 내지 40% 또는 40% 내지 50% 또는 50% 내지 60% 또는 60% 내지 70%이다. 본 발명의 일 구현예에서, 유전자좌 내의 둘 이상의 서열을 분석하고, 가장 높은 GC 함량을 갖는 서열을 선택한다.
본 발명의 일 구현예에서, GC 함량이 평가되는 표적화 서열의 부분은 PAM에 가장 가까운 15개의 표적 뉴클레오티드의 10 내지 15개 연속 뉴클레오티드이다. 본 발명의 일 구현예에서, GC 함량이 고려되는 가이드의 부분은 PAM에 가장 가까운 15 개 뉴클레오티드 중 10 내지 11 개의 뉴클레오티드 또는 11 내지 12 개의 뉴클레오티드 또는 12 내지 13 개의 뉴클레오티드 또는 13 또는 14 또는 15 개의 연속 뉴클레오티드이다.
일 양태에서, 본 발명은 기능적 활성화 또는 억제를 피하면서, CRISPR 시스템 유전자좌 절단을 촉진시키는 데드 가이드 RNA를 확인하기 위한 알고리즘을 추가로 제공한다. 16 내지 20 개 뉴클레오티드의 데드 가이드 RNA 내의 증가된 GC 함량이 증가된 DNA 절단 및 감소된 기능적 활성화와 동시에 일어나는 것이 관찰된다.
또한, 기능성 Cpf1의 효율이 CRISPR 모티프의 하류의 표적 서열과 매치되지 않는 가이드 RNA의 3' 말단으로의 뉴클레오티드의 부가에 의해 증가될 수 있음이 본원에 입증된다. 예를 들어, 11 내지 15 nt 길이의 데드 가이드 RNA의 더 짧은 가이드는 표적 절단을 촉진시킬 가능성이 더 적을 뿐 아니라, CRISPR 시스템 결합 및 기능적 제어를 촉진시키는데 덜 효율적일 수 있다. 특정 구현예에서, 데드 가이드 RNA의 3' 말단으로의 표적 서열과 매치되지 않는 뉴클레오티드의 부가는 활성화 효율을 증가시키는 한편, 요망되지 않는 표적 절단을 증가시키지 않는다. 일 양태에서, 본 발명은 또한, DNA 절단을 촉진시키지 않으면서, DNA 결합 및 유전자 조절에서 CRISPRP 시스템 기능을 효율적으로 촉진시키는 개선된 데드 가이드 RNA를 확인하기 위한 방법 및 알고리즘을 제공한다. 따라서, 특정 구현예에서, 본 발명은 CRISPR 모티프의 하류의 처음 15 nt 또는 14 nt 또는 13 nt 또는 12 nt 또는 11 nt를 포함하며, 3' 말단에서 표적과 미스매치되는 뉴클레오티드에 의해 12 nt, 13 nt, 14 nt, 15 nt, 16 nt, 17 nt, 18 nt, 19 nt, 20 nt 이상으로 길이가 연장되는 데드 가이드 RNA를 제공한다.
일 양태에서, 본 발명은 선택적 직교 유전자 제어를 시행하기 위한 방법을 제공한다. 본원의 발명으로부터 인식될 바와 같이, 본 발명에 따른 데드 가이드 선택은 가이드 길이 및 GC 함량을 고려하여, 기능적 Cpf1 CRISPR-Cas 시스템에 의해 효율적이며 선택적인 전사 제어를 제공하여, 예를 들어, 활성화 또는 억제에 의해 유전자좌의 전사를 조절하고, 표적외 효과를 최소화시킨다. 따라서, 개별 표적 유전자좌의 효율적인 제어를 제공함으로써, 본 발명은 또한, 둘 이상의 표적 유전자좌의 효율적인 직교 제어를 제공한다.
특정 구현예에서, 직교 유전자 제어는 둘 이상의 표적 유전자좌의 활성화 또는 억제에 의해 이루어진다. 특정 구현예에서, 직교 유전자 제어는 하나 이상의 표적 유전자좌의 활성화 또는 억제 및 하나 이상의 표적 유전자좌의 절단에 의해 이루어진다.
본 발명에 따른 Cpf1 CRISPR-Cas 시스템을 위한 에스코트된(escorted) 가이드
일 양태에서, 본 발명은 에스코트된 Cpf1 CRISPR-Cas 시스템 또는 복합체, 특히 에스코트된 Cpf1 CRISPR-Cas 시스템 가이드를 수반하는 그러한 시스템을 제공한다. "에스코트된"은 Cpf1 CRISPR-Cas 시스템 또는 복합체 또는 가이드가 세포 내에 선택된 시기 또는 장소로 전달되어, Cpf1 CRISPR-Cas 시스템 또는 복합체 또는 가이드의 활성이 공간적 또는 시간적으로 제어되도록 한다는 것을 의미한다. 예를 들어, Cpf1 CRISPR-Cas 시스템 또는 복합체 또는 가이드의 활성 및 목적지는 압타머 리간드에 대한 결합 활성을 갖는 에스코트 RNA 압타머 서열, 예컨대 세포 표면 단백질 또는 기타 국소화된 세포 성분에 의해 제어될 수 있다. 대안적으로, 에스코트 압타머는 예를 들어 세포 상에 또는 세포 내에서 압타머 이펙터, 예컨대 특정 시기에 세포에 적용되는 외부 에너지 공급원인 예컨대 임시 이펙터에 대해 반응성일 수 있다.
에스코트된 Cpf1 CRISPR-Cas 시스템 또는 복합체는 gRNA 구조, 건축, 안정성, 유전적 발현, 또는 이들의 임의의 조합을 개선시키기 위하여 설계된 작용적 구조를 갖는 gRNA를 갖는다.
압타머는 예를 들어 기하급수적 농축에 의한 시스템적 리간드 발전(SELEX; 문헌[Tuerk C, Gold L: "Systematic evolution of ligands by exponential enrichment: RNA ligands to bacteriophage T4 DNA polymerase" Science 1990, 249:505-510])라 지칭되는 기술을 이용하여, 다른 리간드에 단단히 결합하도록 설계되거나 선발될 수 있는 생체분자이다. 핵산 압타머는 예를 들어 랜덤-서열 올리고뉴클레오티드의 풀(pool)로부터, 광범위한 생물 의학적으로 연관된 표적에 대해 높은 결합 친화성 및 특이성을 갖는 것으로 선택될 수 있기에, 이는 압타머에 대한 광범위한 치료적 활용을 제안한다(문헌[Keefe, Anthony D, Supriya Pai, and Andrew Ellington "Aptamers as therapeutics" Nature Reviews Drug Discovery 97 (2010): 537-550]) 이들 특징은 약물 전달 비히클로서의 압타머의 광범위한 이용을 또한 제안하는 것이다(문헌 [Levy-Nissenbaum, Etgar, et al "Nanotechnology and aptamers: applications in drug delivery" Trends in biotechnology 268 (2008): 442-449; 및 Hicke BJ, Stephens AW "Escort aptamers: a delivery service for diagnosis and therapy" J Clin Invest 2000, 106:923-928]). 압타머는 또한 녹색 형광 단백질의 활성을 모방하는 형광단에 결합하는 RNA 압타머와 같이, 특성 변화에 의한 신호에 반응하는, 분자 스위치로서 작용하도록 구축될 수 있다(문헌 [Paige, Jeremy S, Karen Y Wu, and Samie R Jaffrey "RNA mimics of green fluorescent protein" Science 3336042 (2011): 642-646]). 압타머는 예를 들어 세포 표면 단백질을 표적화하는, 표적된 siRNA 치료 전달 시스템의 성분으로서 사용될 수 있음이 또한 제안되어 왔다(문헌 [Zhou, Jiehua, and John J Rossi "aptamertargeted cell-specific RNA interference" Silence 11 (2010): 4]).
따라서, 본 명세서에서는 예를 들어 세포막을 지나서, 세포내 구간으로, 또는 핵 내로의 전달을 포함하는 gRNA 전달을 개선하도록 설계된 하나 이상의 압타머에 의해, 변형된 gRNA이 제공된다. 그러한 구조는, 하나 이상의 압타머(들)에 추가하여 또는 그러한 하나 이상의 압타머(들) 없이, 가이드를 선택된 이펙터에 대해 전달가능하거나, 유도가능하거나 반응성으로 만들기 위한 모이어티(들)를 포함할 수 있다. 본 발명은 이에 따라, 이로 제한되지는 않지만, pH, 저산소증, O2 농도, 온도, 단백질 농도, 효소 농도, 지질 구조, 광 노출, 기계적 파괴(예를 들어, 초음파), 자기장, 전계, 또는 전자기 복사를 포함하는 정상 또는 병리학적 생리학적 조건에 대해 반응하는 gRNA를 포괄한다.
본 발명의 양태는, 세포 내의 관심 유전자좌에서 표적 서열에 혼성화할 수 있는 RNA 가이드 서열; 및 에스코트 RNA 압타머 서열을 포함하는 에스코트된 가이드 RNA(egRNA)를 포함하는 비-천연 발생 또는 조작된 조성물을 제공하며, 에스코트 압타머는 세포 상에서 또는 세포 내에서 압타머 리간드에 대한 결합 친화성을 갖거나, 에스코트 압타머는 세포 상에서 또는 세포 내에서 국소화된 압타머 이펙터에 반응성이며, 압타머 리간드 또는 이펙터의 세포 상에서 또는 세포 내에서의 존재는 공간적으로 또는 시간적으로 제한된다.
에스코트 압타머는 예를 들어, 세포 내에서 압타머 리간드 또는 이펙터와의 상호작용에 반응하여 배좌를 변화시킬 수 있다.
에스코트 압타머는 압타머 리간드에 대한 특이적 결합 친화성을 가질 수 있다.
압타머 리간드는 세포의 위치 또는 구간에, 예를 들어 세포의 막 상에 또는 막 내에 국소화될 수 있다. 이에 따라 에스코트 압타머의 압타머 리간드에 대한 결합은, 세포 표면 리간드인 압타머 리간드의 결합을 통해, egRNA를 세포 내의 관심 위치, 예컨대 세포 내부로 유도할 수 있다. 이러한 방식으로, 세포 내에서 공간적으로 제한된 각종 위치, 예컨대 세포 핵 또는 미토콘드리아가 표적화될 수 있다.
일단 의도된 변경이 예컨대 유전자의 의도된 복제물을 편집함으로써 세포의 게놈 내에 도입된 경우, 그 세포에서 연속된 CRISPR/Cpf1 발현은 더이상 필요하지 않다. 실제로 지속된 발현은, 원하지 않은 게놈 부위, 등에서 표적외 효과의 경우에, 특정 경우에는 바람직하지 않을 것이다. 이에 따라 시간-제한된 발현이 유용할 것이다. 유도성 발현은 하나의 시도를 제공하지만, 부가적으로 본 출원인은 CRISPR 벡터 그 자체 내에 있는 비-코딩 가이드 표적 서열의 이용에 의존하는 자가-비활성화 Cpf1 CRISPR-Cas 시스템을 조작하였다. 이에 따라, 발현이 시작된 후, CRISPR 시스템은 그 자신의 파괴를 일으킬 것이지만, 파괴가 완료되기 전에, 이는 표적 유전자의 게놈 복제물을 편집할 시간이 있을 것이다(이는, 이배체 세포에서 정상의 점 돌연변이를 이용하여, 많아야 두 개의 편집물을 필요로 한다) 간단하게, 자가-비활성화 Cpf1 CRISPR-Cas 시스템은 추가의 RNA(즉, 가이드 RNA)를 포함하며, 이는 CRISPR 효소 자체에 대한 코딩 서열을 표적하거나 다음 (a) 내지 (d) 중 하나 이상에서 존재하는 독특한 서열에 상보적인 하나 이상의 비-코딩 가이드 표적 서열을 표적한다: (a) 비-코딩 RNA 요소의 발현을 유도하는 프로모터 내, (b) Cas9 유전자의 발현을 유도하는 프로모터 내, (c) Cpf1 코딩 서열에서 ATG 번역 시작 코돈의 100 bp 내, (d) 예를 들어 AAV 게놈에서, 바이러스 전달 벡터의 역위 말단 반복부(iTR) 내.
egRNA는 RNA 가이드 서열에 에스코트 RNA 서열을 RNA 가이드 서열에 작동 가능하게 연결하는, RNA 압타머 연결 서열을 포함할 수 있다.
구현예에서, egRNA는 하나 이상의 하나 이상의 광불안정성 결합 또는 비-천연 발생 잔기를 포함할 수 있다.
일 양태에서, 에스코트 RNA 압타머 서열은, 셀 내에 존재하거나 존재하지 않을 수 있는, 표적 miRNA에 상보적일 수 있어서, 표적 miRNA가 존재하는 경우에만 에스코트 RNA 압타머 서열의 표적 miRNA로의 결합이 존재하며, 이는 세포 내에서 RNA-유도된 침묵화 복합체 (RISC)에 의해 egRNA의 절단하는 결과를 초래한다.
구현예에서, 에스코트 RNA 압타머 서열은 예를 들어 길이 10 내지 200 개 뉴클레오티드일 수 있으며, egRNA는 일 초과의 에스코트 RNA 압타머 서열을 포함할 수 있다.
본 명세서 어느 부분에서 설명된 바와 같은 임의의 RNA 가이드 서열이 본 명세서에서 설명된 egRNA에 사용될 수 있음이 이해되어야 한다. 본 발명의 특정 구현예에서, 가이드 RNA 또는 성숙 crRNA는 직접 반복부 서열 및 가이드 서열 또는 스페이서 서열을 포함하거나, 본질적으로 이루어지거나, 이루어진다. 특정 구현예에서, 가이드 RNA 또는 성숙 crRNA는 가이드 서열 또는 스페이서 서열에 연결된 직접 반복부 서열을 포함하거나, 본질적으로 이루어지거나, 이루어진다. 특정 구현예에서, 가이드 RNA 또는 성숙 crRNA는 19 개 nt의 부분적인 직접 반복부에 뒤이은 23 내지 25 개 nt의 가이드 서열 또는 스페이서 서열을 포함한다. 특정 구현예에서, 이펙터 단백질은 FnCpf1 이펙터 단백질로, 검출가능한 DNA 절단을 달성하기 위하여 16 개 nt 이상의 가이드 서열 및 시험관 내에서 효율적인 DNA 절단을 달성하기 위하여 최소 17 개 nt 이상의 가이드 서열을 요구한다. 특정 구현예에서, 직접 반복부 서열은 가이드 서열 또는 스페이서 서열로부터 상류(즉, 5')에 위치된다. 바람직한 구현예에서, FnCpf1 가이드 RNA의 씨드 서열 (즉, 표적 유전자좌에서 서열에 대한 혼성화 및/또는 인식에 매우 중요한 서열)은 가이드 서열 또는 스페이서 서열의 5' 말단에서 대략적으로 처음 5 개 nt 내에 존재한다.
egRNA는 비-천연 발생 또는 조작된 Cpf1 CRISPR-Cas 복합체 조성물 내에, 하나 이상의 돌연변이를 포함할 수 있는 Cpf1과 함께 포함될 수 있으며, 예를 들어 돌연변이는 Cpf1이 하나 이상의 돌연변이를 갖지 않은 Cpf1의 뉴클레아제 활성의 5% 이하를 갖도록 하고, 예를 들어 하나 이상의 돌연변이를 갖지 않는 Cpf1에 비하여 97% 이상 또는 100%의 감소된 뉴클레아제 활성을 갖는다. Cpf1은 또한 하나 이상의 핵 국소화 서열을 포함할 수 있다. 감소된 뉴클레아제 활성과 같은 조절된 활성을 갖는 돌연변이된 Cpf1 효소는 본 명세서 다른 곳에 설명되어 있다.
조작된 Cpf1 CRISPR-Cas 조성물은 세포, 예컨대 진핵 세포, 포유 동물 세포 또는 인간 세포에서 제공될 수 있다.
구현예에서, 본 명세서에 설명된 조성물은 적어도 3개의 기능적 도메인을 갖는 Cpf1 CRISPR-Cas 복합체를 포함하고, 이들 중 적어도 하나는 Cpf1과 회합되고, 이들 중 적어도 2개는 egRNA와 회합된다.
본 발명은 조성물 및 방법을 제공하며 이에 의해 gRNA-매개된 유전자 편집 활성이 조정될 수 있다. 본 발명은 gRNA 증가 및/또는 세포 내로 전달된 RNA의 양의 증가에 의해 절단 효율을 증가시키는 gRNA 이차 구조를 제공한다. gRNA는 광불안정성 또는 유도성 뉴클레오티드를 포함할 수 있다.
gRNA, 예를 들어 바이러스 또는 비-바이러스 기술을 이용하여 전달된 gRNA의 효과를 증가시키기 위하여, 출원인은 2차 구조를 그의 안정성을 증진시키고 유전자 편집을 개선하는 gRNA 내로 부가하였다. 별개로, 유효 전달의 결여를 극복하기 위하여, 본 출원인은 세포 침투 RNA 압타머를 이용하여 gRNA를 변형시켰고; 압타머는 세포 표면 수용체에 결합하고, gRNA의 세포 내로의 엔트리(entry)를 촉진시킨다. 특히, 세포-침투 압타머는, 세포-특이적 전달을 매개하기 위하여 특이적 세포 수용체를 표적하도록 설계될 수 있다. 출원인은 또한 유도가능한 가이드를 생성하였다.
유도성 시스템의 광 반응성은 크립토크롬-2 및 CIB1의 활성화 및 결합을 통해 달성될 수 있다. 청색 광 자극은 크립토크롬-2에서의 활성화 배좌 변화를 유도하여, 그의 결합 파트너 CIB1의 채용을 결과로서 초래한다. 이러한 결합은 빠르고 가역적이어서, 펄스 자극 후 15 초 미만 내에 포화를 달성하고자극 종료 후 15 분 미만 내에 기저수준으로 되돌아간다. 이들 신속한 결합 역학은, 유도제의 흡수 및 제거보다는, 전사/번역 및 전사물/단백질 분해 속도에 의해서만 일시적으로 결합된 시스템을 결과로서 초래한다. 크립토크롬-2 활성화는 또한 매우 민감하여, 낮은 광 강도 자극의 이용을 허용하고 광독성의 위험을 완화시킨다. 나아가, 온전한 포유 동물 뇌와 같은 맥락에서, 가변성 광 강도가 자극된 영역의 크기를 제어하는데 사용될 수 있어서, 벡터 전달 단독이 제공할 수 있는 것보다 더욱 큰 정확성을 가능하게 한다.
본 발명은 가이드를 유도하기 위한 전자기 복사, 음향 에너지 또는 열 에너지와 같은 에너지 공급원을 포괄한다. 유리하게는, 전자기 복사는 가시광선 성분이다. 바람직한 구현예에서, 광은 파장 약 450 nm 내지 약 495 nm을 갖는 청색광이다. 특히 바람직한 구현예에서, 파장은 약 488 nm이다. 또 다른 바람직한 구현예에서, 광 자극은 펄스를 통한 것이다. 광력은 약 0 내지 9 mW/cm2의 범위일 수 있다. 바람직한 구현예에서, 15초마다 0.25초만큼 낮은 자극 패러다임이 최대 활성화를 결과로 초래하여야 한다.
본 발명의 실시에 연관되는 세포는 원핵 세포 또는 진핵 세포일 수 있으며, 유리하게는 동물 세포, 식물 세포 또는 효모 세포, 더욱 유리하게는 포유류 세포일 수 있다.
화학 또는 에너지 감수성 가이드는 화학원의 결합에 의한, 또는 가이드로서 작용하는 것을 가능하게 하는 에너지에 의한 도입시 배좌 변화될 수 있으며, Cpf1 CRISPR-Cas 시스템 또는 복합체 작용을 갖는다. 본 발명은 가이드 작용 및 Cpf1 CRISPR-Cas 시스템 또는 복합체 작용을 갖도록 화학원 또는 에너지를 적용하고; 선택적으로 게놈 유전자좌의 발현이 변경됨을 추가로 결정하는 것을 포함할 수 있다.
이러한 화학 유도성 시스템의 몇가지 상이한 설계가 존재한다: 1. 아브시스 산(ABA)에 의해 유도가능한 ABIPYL계 시스템(예를 들어, http://stke.sciencemag.org/cgi/content/abstract/sigtrans;4/164/rs2 참조), 2. 라파마이신에 의해 유도가능한 FKBP-FRB 계 시스템(또는 라파마이신을 기반으로 한 관련 화학 물질)(예를 들어, http://www.nature.com/nmeth/journal/v2/n6/full/nmeth763.html 참조), 3. 지베렐린 (GA)에 의해 유도가능한 GID1-GAI 계 시스템(예를 들어, http://www.nature.com/nchembio/journal/v8/n5/full/nchembio.922.html 참조).
본 발명에 의해 고려되는 또 다른 시스템은 준-세포 국소화에서의 변화를 기초로 한 화학 유도성 시스템이다. 출원인은 또한, 폴리펩티드가 5 개 이상의 전사 활성인자-유사 이펙터(TALE)를 포함하는 DNA 결합 도메인을 포함하고, 적어도 하나 이상의 이펙터 도메인에 연결된 관심 게놈 유전자좌를 표적하도록 특이적으로 명령된 적어도 하나 이상의 절반-단량체가 화학 또는 에너지 민감성 단백질에 추가로 연결된 시스템을 개발하였다. 본 단백질은, 화학 또는 에너지 민감 단백질로의 화학 또는 에너지 전달의 결합시, 전체 폴리펩티드의 준-세포성 국소화에서의 변화를 일으킬 것이다(즉, 전체 폴리펩티드의 세포질에서 세포의 핵 내로의 수송) 이러한 전체 폴리펩티드의, 이펙터 도메인에 대한 기질의 결여로 인하여 그의 활성이 격리된, 하나의 준-세포 구획 또는 세포소기관으로부터, 기질이 존재하는 또 다른 곳으로의 수송은 전체 폴리펩티드가 그의 원하는 기질(즉, 포유 동물 핵 내 게놈 DNA)과 접촉되는 것을 가능하게 할 수 있으며, 표적 유전자 발현의 활성화 또는 억제를 결과로서 초래할 것이다.
이러한 시스템의 유형은, 이펙터 도메인이 뉴클레아제인 경우, 세포 내에서 관심 게놈 유전자좌의 절단을 유도하는데 사용될 수도 있을 것이다.
화학 유도성 시스템은 4-히드로실타목시펜(4OHT)에 의해 유도가능한 에스트로겐 수용체 (ER)을 기반으로 한 시스템일 수 있다(예를 들어, http://www.pnas.org/content/104/3/1027.abstract 참조) ERT2로 명명되는 에스트로겐 수용체의 돌연변이된 리간드-결합 도메인은 4-히드록시타목시펜의 결합시 세포의 핵 내로 전위된다. 추가의 본 발명의 구현예에서, 임의의 핵 수용체, 갑상샘 호르몬 수용체, 레티노산 수용체, 에스트로겐 수용체, 에스트로겐-연관 수용체, 글루코코르티코이드 수용체, 프로게스테론 수용체, 안드로겐 수용체의 임의의 천연 발생 또는 조작된 유도체가 ER 계 유도성 시스템에 유사한 유도성 시스템에서 사용될 수 있다.
또 다른 유도성 시스템은, 에너지, 열 또는 라디오파에 의해 유도가능한 일과성 수용체 전위 (TR) 이온 통로 기반 시스템을 이용하는 설계에 기초한다(예를 들어, http://www.sciencemag.org/content/336/6081/604 참조). 이들 TRP 패밀리의 단백질은, 광과 열을 포함한 상이한 자극에 응답한다. 이러한 단백질이 광 또는 열에 의해 활성화되는 경우, 이온 통로가 열려 칼슘과 같은 이온의 세포질막 내로의 도입이 가능하게 될 것이다. 이러한 유입 이온은 Cpf1 CRISPR-Cas 복합체의 시스템의 기타 성분들 또는 가이드를 포함하는 폴리펩티드에 연결된 세포내 이온 상호작용하는 파트너에 결합될 것이며, 그 결합은 폴리펩티드의 준-세포성 국소화의 변화를 유도할 것이며, 이는 전체 폴리펩티드가 세포의 핵으로 도입되도록 이끈다. 일단 핵 내에서, Cpf1 CRISPR-Cas 복합체의 기타 성분 및 가이드 단백질은 활성이며 세포 내에서 표적 유전자 발현을 조정한다.
이러한 유형의 시스템은 세포 내에서 관심 게놈 유전자좌의 절단을 유도하는데 사용될 수도 있을 것이며; 이와 관련하여, Cpf1 효소는 뉴클레아제임에 주목해야 한다. 광은 레이저 또는 기타 형태의 에너지원으로 생성될 수 있을 것이다. 열은 에너지원으로부터, 또는 라디오파 형태로 전달되는 에너지원으로부터 에너지를 흡수한 후 열을 방출하는 나노입자로부터 초래되는 온도의 상승에 의해 생성될 수 있을 것이다.
광 활성화는 유리한 구현예일 수 있는 한편, 때때로 이는 광이 피부 또는 기타 기관을 침투할 수 없는 생체 내 적용에서는 특히 불리할 수 있다. 이러한 경우, 에너지 활성화의 기타 방법, 특히 전계 에너지 및/또는 유사한 효과를 갖는 초음파가 고려된다.
전계 에너지는 바람직하게는 당 기술 분야에서 실질적으로 설명된 바와 같이, 생체 내 조건 하에서 약 1 Volt/cm 내지 약 10 kVolt/cm의 하나 이상의 전기 펄스를 이용하여, 투여된다. 펄스 대신 또는 펄스에 추가하여, 전계는 연속적인 방식으로 전달될 수 있다. 전기 펄스는 1 μs 내지 500 밀리초 사이, 바람직하게는 1 μs 내지 100 밀리초에서 적용될 수 있다. 전계는 연속적으로 또는 약 5 분 동안 펄스 방식으로 적용될 수 있다.
본 명세서에서 사용된 바와 같은, '전계 에너지'는 세포가 노출되는 전기 에너지이다. 바람직하게는, 전계는 생체 내 조건 하에서 약 1 Volt/cm 내지 약 10 kVolts/cm 이상의 강도를 갖는다(WO97/49450 참조).
본 명세서에서 사용된 바와 같은, 용어 "전계"는 가변 용량 및 전압에서 하나 이상의 펄스를 포함하며, 이는 지수적 및/또는 구형파 및/또는 변조파 및/또는 변조된 구형파 형태를 포함한다. 전계 및 전력에 대한 참조는 세포 환경에서 전기 전위의 차이의 존재를 참조로 포함하는 것으로 여겨져야 한다. 그러한 환경은 해당 분야에서 알려진 바와 같은 정전기, 교류(AC), 직류(DC) 등에 의해 설정될 수 있다. 전계는 균일하거나, 불균일하거나 다를 수 있으며, 시간 의존성 방식으로 강도 및/또는 방향에서 변할 수 있다.
전계의 단일 또는 다수의 응용, 및 초음파의 단일 또는 다수의 응용 또한, 임의의 순서 및 임의의 조합으로 가능하다. 초음파 및/또는 전계는 단일 또는 다수의 응용으로서, 또는 펄스(박동성 전달)로서 전달될 수 있다.
전기천공은 시험관 내 및 생체 내 절차 모두에서 사용되어 외래 물질을 살아있는 세포 내로 도입시킨다. 시험관내 응용을 이용하여, 살아있는 세포의 샘플은 관심 약제와 먼저 혼합되고, 평행판과 같은 전극 사이에 위치된다. 이후, 전극은 전계를 세포/임플란트 혼합물에 적용시킨다. 시험관 내 전기천공은, 시스템을 세포/임플란트 혼합물에 전계를 적용한다. 시험관 내 전기 천공을 수행하는 시스템의 예로는, Electro Cell Manipulator ECM600 생성물, 및 Electro Square Porator T820를 포함하며, 이들 모두는 Genetronics, Inc의 BTX 부에서 제조되었다(미국 특허 5,869,326 참조).
알려진 전기천공 기술(시험관 내 생체 내 모두)은 처리 영역 주위에 위치된 전극에, 간단한 고전압 펄스를 적용함으로써 작용한다. 전극들 사이에 생성된 전계는 세포 막이 일시적으로 다공성이 되도록 유발하고, 그 결과 관심 약제의 분자가 세포 내로 들어간다. 알려진 전기천공 응용에서, 이러한 전계는, 약 1000 V/cm로 약 100.mu.s의 기간 동안의 단일 구형파 펄스를 포함한다. 그러한 펄스는, 예를 들어 Electro Square Porator T820의 알려진 응용에서 생성될 수 있다.
바람직하게는, 전계는 시험관 내 조건 하에서 약 1 V/cm 내지 약 10 kV/cm의 강도를 갖는다. 따라서, 전계는 1 V/cm, 2 V/cm, 3 V/cm, 4 V/cm, 5 V/cm, 6 V/cm, 7 V/cm, 8 V/cm, 9 V/cm, 10 V/cm, 20 V/cm, 50 V/cm, 100 V/cm, 200 V/cm, 300 V/cm, 400 V/cm, 500 V/cm, 600 V/cm, 700 V/cm, 800 V/cm, 900 V/cm, 1 kV/cm, 2 kV/cm, 5 kV/cm, 10 kV/cm, 20 kV/cm, 50 kV/cm 이상의 강도를 가질 수 있다. 시험관 내 조건 하에서, 더욱 바람직하게는 약 05 kV/cm 내지 약 40 kV/cm 바람직하게는 전계는 시험관 내 조건 하에서, 약 1 V/cm 내지 약 10 kV/cm의 강도를 갖는다. 그러나, 전계 강도는 표적 부위에 전달되는 펄스의 수가 증가되는 경우 낮아질 수 있다. 이에 따라, 더욱 낮은 장 강도에서 전계의 박동성 전달이 고려된다.
바람직하게는, 전계의 적용은 동일한 강도 및 전기용량의 이중 펄스와 같은 다중 펄스 형태 또는 가변하는 강도 및/또는 전기용량의 순차적 펄스의 형태이다. 본 명세서에서 사용된 바와 같은 용어 "펄스"는 가변성 전기용량 및 전압에서 하나 이상의 전기 펄스를 포함하며, 지수적 형태 및/또는 구형파 및/또는 변조파/구형파 형태를 포함한다.
바람직하게는, 전기 펄스는 지수적 파형, 구형파 형태, 변조파 형태 및 변조된 구형파로부터 선택된 파형으로서 전달된다.
바람직한 구현예는 낮은 전압의 직류를 사용한다. 따라서, 본 출원인은 1 V/cm 내지 20V/cm의 전계 강도로 100 밀리초 이상, 바람직하게는 15 분 이상의 기간 동안 세포, 조직 또는 조직 덩어리에 적용되는 전계의 이용을 개시한다.
초음파는 약 005 W/cm2 내지 약 100 W/cm2의 전력 수준에서 유리하게 투여된다. 진단용 또는 치료용 초음파 또는 이들의 조합이 사용될 수 있다.
본 명세서에서 사용된 바와 같은 용어 "초음파"는 그 주파수가 너무 높아서 인간 청력 범위를 넘는 기계적 진동으로 이루어지는 에너지의 형성을 의미한다. 초음파 스펙트럼의 주파수 하한치는 일반적으로 약 20 kHz로 여겨질 수 있다. 초음파의 대부분의 진단적 응용은 1 내지 15 MHz' 범위 내의 주파수를 사용한다(문헌 [Ultrasonics in Clinical Diagnosis, P N T Wells, ed, 2nd Edition, Publ Churchill Livingstone [Edinburgh, London & NY, 1977]]).
초음파는 진단 및 치료적 응용 모두에서 사용된다. 진단 도구로서 사용되는 경우("진단적 초음파"), 초음파는 750 mW/cm2 이하의 에너지 밀도가 사용되어 왔지만, 약 100 mW/cm2 이하(FDA 권장)의 에너지 밀도 범위로 통상적으로 사용된다. 물리치료에서, 초음파는 약 3 내지 4 W/cm2 이하(WHO 권장)의 범위에서 에너지원으로서 통상적으로 사용된다. 다른 치료 응용에서, 보다 높은 강도의 초음파가 예를 들어, HIFU 100 W/cm에서 1 kW/cm2 이하(또는 더 높음)로 짧은 기간 동안 사용될 수 있다. 본 명세서에서 사용된 바와 같은 용어 "초음파"는 진단, 치료 및 집속 초음파를 포괄하는 것으로 의도된다.
집속 초음파(FUS)는 침입성 프로브 없이 열 에너지가 전달되는 것을 가능하게 한다(문헌 [Morocz et al 1998 Journal of Magnetic Resonance Imaging Vol.8, No. 1, pp.136-142]). 집속 초음파의 또 다른 형태는 고강도 집속 초음파(HIFU)로 이는 문헌[Moussatov et al in Ultrasonics (1998) Vol.36, No8, pp893-900] 및 문헌[TranHuuHue et al in Acustica (1997) Vol.83, No.6, pp1103-1106]에서 검토되었다.
바람직하게는, 진단용 초음파와 치료용 초음파의 조합이 이용된다. 이 조합은 제한하고자 의도되지 않지만, 숙련자는 초음파의 임의의 각종 조합이 사용될 수 있음을 이해할 것이다. 추가적으로 에너지 밀도, 초음파 주파수 및 노출 기간은 변화될 수 있다.
바람직하게는 초음파 에너지원에 대한 노출은 약 0.05 내지 약 100 Wcm-2의 전력 밀도에서이다. 더더욱 바람직하게는, 초음파 에너지원에 대한 노출은 약 1 내지 15 Wcm-2의 전력 밀도에서이다.
바람직하게는 초음파 에너지원에 대한 노출은 약 0.015 내지 약 10.0 MHz의 주파수에서이다. 더욱 바람직하게는 초음파 에너지원에 대한 노출은 약 0.02 내지 약 5.0 MHz 또는 약 6.0 MHz의 주파수에서이다. 가장 바람직하게는, 초음파는 3 MHz의 주파수에서 적용된다.
바람직하게는 노출은 약 10 밀리초 내지 약 60 분의 기간 동안이다. 바람직하게는 노출은 약 1 초 내지 약 5 분의 기간 동안이다. 더욱 바람직하게는, 초음파는 약 2 분 동안 적용된다. 그러나, 파괴될 특정 표적 세포에 따라, 노출은 더욱 긴 기간, 예를 들어 15 분 동안일 수 있다.
유리하게는, 표적 조직은 약 0.05 Wcm-2 내지 약 10 Wcm-2의 음향 전력 밀도에서, 약 0.015 내지 약 10 MHz(WO98/52609)의 범위의 주파수로 초음파 에너지원에 노출된다. 그러나, 예를 들어 100 Wcm-2 초과의 음향 전력 밀도에, 그러나 예를 들어 감소된 기간, 밀리초 범위 이하에서의 기간 1000 Wcm-2 동안에서의 초음파 에너지원에 대한 노출 또한 가능한 대안이다.
바람직하게는 초음파의 적용은 다수의 펄스 형태이며; 이에 따라서 연속파 및 펄스파 모두 (초음파의 박동성 전달) 임의의 조합으로 사용될 수 있다. 예를 들어, 연속파 초음파, 이어서 펄스파 초음파, 또는 그 역도 적용될 수 있다. 이는 임의의 횟수로, 임의의 순서 및 조합으로 반복될 수 있다. 펄스파 초음파는 연속파 초음파 백그라운드에 대하여 적용될 수 있고, 임의의 수의 펄스가 임의의 수의 군에서 사용될 수 있다.
바람직하게 초음파는 펄스파 초음파를 포함할 수 있다. 매우 바람직한 구현예에서, 초음파는 연속파로서 0.7 Wcm-2 또는 1.25 Wcm-2의 전력 밀도에서 적용된다. 펄스파 초음파가 사용된 경우 더욱 높은 전력 밀도가 사용될 수 있다.
초음파의 사용은 광과 같이 표적에 정확하게 집중될 수 있기 때문에 유리하다. 또한, 초음파는, 광과 달리 조직 내로 더욱 깊이 집중될 수 있기 때문에 유리하다. 따라서, 전체-조직 침투(이로 제한되지는 않지만, 예컨대 간엽) 또는 전체 기관(이로 제한되지는 않지만, 예컨대 간 전체 또는 전체 근육, 예컨대 심장) 치료에 더욱 적합하다. 또 다른 중요한 장점은, 초음파는 비-침입성 자극이어서 광범위한 진단 및 치료 적용에 사용된다는 것이다. 예로서, 초음파는 의학 영상 기술, 및 추가적으로 정형외과적 치료에서 공지이다. 나아가, 대상 척추동물에 초음파를 적용하기 적합한 기기는 널리 입수가능하며 이들의 이용은 당 기술 분야에서 공지이다.
본 발명의 신속한 전사 반응 및 내생의 표적화는 전사 역학의 연구에 이상적인 시스템으로 된다. 예를 들어, 본 발명은 표적 유전자의 유도된 발현시 변이체 생산의 역학을 연구하기 위하여 사용될 수 있다. 전사 사이클의 다른 말단에서, mRNA 분해 연구는 강한 세포외 자극에 반응하여 종종 수행되어, 과다한 유전자에서 발현 수준을 변화시킨다. 본 발명은 내생의 표적의 전사를 가역적으로 유도하는데 이용될 수 있으며, 이후 점 자극이 중단될 수 있으며, 독특한 표적의 분해 역학이 추적될 수 있다.
본 발명의 시간적 정확도는 실험 개입과 협력하여 유전적 조절을 타이밍할 힘을 제공할 수 있다. 예를 들어, 장기 강화작용(LTP)에 연관되는 것으로 의심되는 표적은, 단지 LTP를 유도하기 위한 자극 동안이지만, 기관형 또는 분해된 뉴런성 배양물 내에서 조절될 수 있어서, 세포의 정상 발달 간섭을 회피한다. 유사하게, 질병 표현형을 나타내는 세포 모델에서, 특정 치료의 유효성에 연관된 것으로 의심되는 표적은 치료 동안에만 조정될 수 있다. 역으로, 유전적 표적은 병리학적 자극 동안에만 조정될 수 있다. 외부 실험 자극에 대한 유전적 신호의 타이밍이 연관된 임의의 수의 실험은 본 발명의 이용으로부터의 잠재적인 이익을 얻을 수 있다.
생체 내 정황은 본 발명이 유전자 발현을 제어하도록 하는 균등하게 풍부한 기회를 제공한다. 광유도성은 공간적 정확도에 대한 잠재성을 제공한다. 광학센서(optrode) 기술의 발전을 이용하여, 자극성 광섬유 리드(lead)를 정확한 뇌 영역에 위치시킬 수 있다. 자극 영역 크기는 이후 광 강도에 의해 조절될 수 있다. 이는 본 발명의 Cas9 CRISPR-Cas 시스템 또는 복합체의 전달과 함께 수행될 수 있거나, 유전자이식 Cas9 동물의 경우에는 본 발명의 가이드 RNA가 전달될 수 있고, 광학센서 기술은 정확한 뇌 영역에서 유전자 발현의 조절을 가능하게 할 수 있다. 명백한 Cas9 발현 생물은 본 발명의 가이드 RNA가 그에 투여되도록 할 수 있으며 그 후 극도로 정밀한 레이저 유도 국소 유전자 발현 변화가 존재할 수 있다.
숙주 세포의 배양을 위한 배양 매질은 조직 배양을 위해 일반적으로 사용되는 매질, 예컨대 특히 M199-얼(earle) 염기, 이글(Eagle) MEM(E-MEM), 둘베코 MEM(DMEM), SC-UCM102, UP-SFM(GIBCO BRL), EXCELL302(Nichirei), EX-CELL293-S(Nichirei), TFBM-01(Nichirei), ASF104를 포함한다. 특이적 세포 유형에 대한 적합한 배양 매질은 미국 균주 은행(ATCC) 또는 유럽 균주 은행(EACC)에서 찾을 수 있다. 배양 매질은 아미노산, 예컨대 L-글루타민, 염, 항진균제 또는 항균제 예컨대 Fungizone®, 페니실린-스트렙토마이신, 동물 혈청 등으로 보충될 수 있다. 세포 배양 매질은 선택적으로 무혈청일 수 있다.
본 발명은 또한 생체 내에서 소중한 시간적 정확도를 또한 제공할 수 있다. 본 발명은 발생의 특정 단계 동안 유전자 발현을 변경하는데 사용될 수 있다. 본 발명은 특정 실험 영역에 유전자 신호를 타이밍하는데 사용될 수 있다. 예를 들어, 학습에 연루된 유전자는 온전한 설치류 또는 영장류 뇌의 정확한 영역에서 학습 자극 동안에만 과잉발현되거나 억제될 수 있다. 추가하여, 본 발명은 질병 발생의 특정 단계 동안에만 유전자 발현 변경을 유도하는데 사용될 수 있다. 예를 들어, 종양형성유전자는, 종양이 특정 크기 또는 전이 단계에 도달할 때만 과잉발현될 수 있다. 역으로, 알츠하이머의 발생시 의심되는 단백질은 동물의 생애에서 규정된 시점에서, 특정 뇌 영역 내에서만 무너질 수 있다. 이들 실시예가 본 발명의 잠재적인 적용들을 철저히 열거하지는 않지만, 이들은 본 발명이 강력한 기술일 수 있는 영역들 일부를 강조한다.
본 발명에 따른 효소는 보호된 가이드 RNA와 조합하여 사용될 수 있다
일 양태에서, 본 발명의 목적은 가이드 RNA의 표적 DNA로의 결합 특이성의 열역학적 조절을 통하여, Cpf1 제공된 개별적인 가이드 RNA의 특이성을 추가로 증진시키는 것이다. 이는, 표적외 게놈에 비하여 표적된 게놈 유전자조에 대한 열역학적 장점을 제공하기 위하여, 가이드 서열의 미스매치, 신장 또는 절단을 도입하여 게놈 표적 및 그의 잠재적인 표적외 유전자좌 사이에서 공유되는 상보적 염기 대 미스매치된 염기의 수를 증가/감소시키는 일반적인 시도이다.
일 양태에서, 본 발명은 이차 구조에 의해 변형되는 가이드 서열을 제공하여 Cpf1 CRISPR-Cas 시스템의 특이성을 증가시키고, 이로 인해 이차 구조는 엑소뉴클레아제 활성에 대해 보호될 수 있고 가이드 서열에 대한 3' 부가를 가능하게 한다.
일 양태에서, 본 발명은 "보호자 RNA"의 가이드 서열로의 혼성화를 제공하며, "보호자 RNA"는 가이드 RNA(gRNA)의 5' 말단에 상보적인 RNA 가닥으로, 이에 의해 부분적으로 이중 가닥인 gRNA를 생성한다. 본 발명의 구현예에서, 미스매치된 염기의 완전히 상보적인 보호자 서열을 이용한 보호는 표적 DNA가 3' 말단에서 미스매치된 염기쌍에 결합하는 가능성을 감소시킨다. 본 발명의 구현예에서, 연장된 길이를 포함하는 부가 서열이 또한 존재할 수 있다.
게놈 표적을 매칭하는 가이드 RNA(gRNA) 연장부는 gRNA 보호를 제공하고, 특이성을 증진시킨다. 개별적인 게놈 표적에 대한 스페이서 씨드의 말단에 대해 원위의 매칭 서열을 갖는 gRNA의 연장부는 증진된 특이성을 제공하는 것으로 생각된다. 특이성을 증진시키는 매칭 gRNA 연장부가 세포 내에서 절단 없이 관찰되었다. 이들 안정한 길이의 연장부를 수반하는 gRNA 구조의 예측은 안정한 형태가 보호 상태에서 발생함을 보여주며, 여기서 연장부는 스페이서 연장 및 스페이서 씨드에서의 상보적 서열로 인하여 gRNA 씨드를 갖는 닫힌 루프를 형성한다. 이들 결과는 보호된 가이드 개념이 20mer 스페이서-결합 영역의 원위의 게놈 표적 서열을 매칭하는 서열을 포함한다는 것을 실증한다. 열역학적 예측을 사용하여, 보호된 gRNA 상태를 결과로서 초래하는, 완전히 매칭하거나 부분적으로 매칭하는 가이드 연장부를 예측할 수 있다. 이는 보호된 gRNA의 개념을 X와 Z 사이의 상호작용으로 확장시키며, 여기서 X는 일반적으로 17 내지 20 개 nt의 길이이고, Z는 1 내지 30 개 nt의 길이이다. 열역학적 예측은 Z에 대한 최적 연장 상태를 결정하는데 사용될 수 있고, Z에 적은 수의 미스매치를 잠재적으로 도입하여 X와 Z 사이의 보호된 배좌의 형태를 촉진한다. 본 출원 명세서에 걸쳐, 용어 "X" 및 씨드 길이(SL)는 표적 DNA에 대해 결합할 수 있는 뉴클레오티드의 수를 나타내는 노출된 길이 (EpL)와 상호교환 가능하게 사용되며; 용어 "Y" 및 보호자 길이 (PL)는 보호자의 길이를 나타내기 위하여 상호교환 가능하게 사용되고; 용어 "Z", "E", "E'" 및 EL은 표적 서열이 그에 의해 연장된 뉴클레오티드의 수를 나타내는 연장된 길이(ExL)에 상응하여 상호교환 가능하게 사용된다.
연장된 길이 (ExL)에 상응하는 연장 서열은 보호된 가이드 서열의 3' 말단에서 가이드 서열에 선택적으로 직접 부착될 수 있다. 연장 서열은 2 내지 12 개 뉴클레오티드 길이일 수 있다. 바람직하게는 ExL은 0, 2, 4, 6, 8, 10 또는 12 개의 뉴클레오티드로서 표시될 수 있다. 바람직한 구현예에서, ExL은 길이 0 또는 4 개의 뉴클레오티드로서 표시된다. 더욱 바람직한 구현예에서, ExL은 길이 4 개의 뉴클레오티드이다. 연장 서열은 표적 서열에 대해 상보적이거나 상보적이 아닐 수 있다.
연장 서열은 보호된 가이드 서열의 5' 말단에서 가이드 서열에 또한 및 보호 서열의 3' 말단에 선택적으로 추가적으로 직접 부착될 수 있다. 그 결과, 연장 서열은 보호된 서열 및 보호 서열 사이에서 링크 서열로서의 역할을 한다. 이론에 구속되지 않으면서, 그러한 링크는 보호 서열의 보호된 서열로의 개선된 결합을 위해 보호 서열을 보호된 서열 가까이에 위치시킬 수 있다.
gRNA 미스매치의 gRNA 원위 말단으로의 부가는 증진된 특이성을 증명할 수 있다. Y에서 보호되지 않은 원위 미스매치의 도입 또는 원위 미스매치(Z)를 이용한 gRNA의 연장은 증진된 특이성을 증명할 수 있다. 언급된 바와 같은 이러한 개념은 보호된 gRNA에서 사용된 X, Y, 및 Z 성분에 결부된다. 보호되지 않은 미스매치 개념은 보호된 가이드 RNA에 대해 설명된 X, Y 및 Z의 개념에 대해 추가로 일반화될 수 있다.
이론에 결부시키려 하지 않고, 완전히 상보적인 보호자 서열로 미스매치된 염기를 보호하는 것은 3' 말단에서 미스매치된 염기쌍으로의 표적 DNA의 결합 가능성을 감소시킬 수 있다. 이중-가닥 DNA 표적이 풀림에 따라, Cfp1은 결국 가이드 서열 상보성에 대하여 PAM-원위, 표적의 3' 말단을 질의하려는 시도를 한다. 그러나, 보호된 가이드 RNA(pgRNA)의 3' 말단이 이중-가닥이기 때문에, 2가지의 가능한 결과가 존재할 수 있다: (1) 가이드 RNA-보호자 RNA에서 가이드 RNA-표적 DNA 가닥으로의 교환이 발생할 것이며, 가이드는 표적에 완전히 결합하거나, (2) 가이드 RNA는 표적에 완전히 결합하는데 실패할 것이다. Cpf1 표적 절단은 Cas9-촉매화된 DSB를 활성화하는데 가이드 RNA: 표적 DNA 결합을 필요로 하는 다단계 역학 반응이기 때문에, 여기서 Cpf1 절단은 가이드 RNA가 적절히 결합하지 않는 경우 발생하지 않는다.
일 양태에서, 본 발명은 증진된 Cas9Cas9 특이성을 제공하며, 여기서 보호된 가이드 RNA(pgRNA)의 이중 가닥 3' 말단은 두 개의 가능한 결과를 허용한다: (1) 가이드 RNA-보호자 RNA에서 가이드 RNA-표적 DNA 가닥으로의 교환이 발생할 것이며, 가이드는 표적에 완전히 결합하거나, (2) 가이드 RNA는 표적에 완전히 결합하는데 실패할 것이고, Cas9 표적 절단은 Cas9-촉매화된 DSB를 활성화하는데 가이드 RNA: 표적 DNA 결합을 필요로 하는 다단계 역학 반응이기 때문에, 여기서 Cas9 절단은 가이드 RNA가 적절히 결합하지 않는 경우 발생하지 않는다. 특정 구현예에 따라, 보호된 가이드 RNA는 천연 발생 CRISPR-Cas 시스템에 비하여 표적 결합의 특이성을 개선시킨다. 특정 구현예에 따라, 보호된 변형된 가이드 RNA는 천연 발생 CRISPR-Cas에 비하여 안정성을 개선시킨다. 특정 구현예에 따라, 보호자 서열은 3 개 내지 120 개의 뉴클레오티드 길이를 갖고, 가이드 또는 보호자의 또 다른 서열에 대해 상보적인 3 이상의 연속 뉴클레오티드를 포함한다. 특정 구현예에 따라, 보호자 서열은 헤어핀(hairpin)을 형성한다. 특정 구현예에 따라, 가이드 RNA는 보호된 서열 및 노출된 서열을 추가로 포함한다. 특정 구현예에 따라, 노출된 서열은 1 내지 19 개의 뉴클레오티드이다. 더욱 특히, 노출된 서열은 표적 서열에 대해 75% 이상, 90% 이상 또는 약 100% 상보적이다. 특정 구현예에 따라, 가이드 서열은 보호자 가닥에 대해 90% 이상 또는 약 100% 상보적이다. 특정 구현예에 따라, 가이드 서열은 표적 서열에 대해 75% 이상, 90% 이상 또는 약 100% 상보적이다. 특정 구현예에 따라, 가이드 RNA는 연장 서열을 추가로 포함한다. 더욱 특히, 연장 서열은 보호된 가이드 서열의 3' 말단에 작동 가능하게 연결되고, 보호된 가이드 서열의 3' 말단에 선택적으로 직접 연결된다. 특정 구현예에 따라, 연장 서열은 1-12 개 뉴클레오티드이다. 특정 구현예에 따라, 연장 서열은 보호된 가이드 서열의 3' 말단 및 보호된 가이드 서열의 5' 말단에서 가이드 서열에 작동 가능하게 연결되고, 보호된 가이드 서열의 3' 말단 및 보호자 서열의 3' 말단에 선택적으로 직접적으로 연결되고, 여기서 연장 서열은 보호된 서열 및 보호자 가닥 사이의 연결 서열이다. 특정 구현예에 따라, 연장 서열은 보호자 가닥에 100% 상보적이지 않으며, 선택적으로 95% 이상, 90% 이상, 80% 이상, 70% 이상, 60% 이상, 50% 이상 보호자 서열에 상보적이지 않다. 특정 구현예에 따라, 가이드 서열은 가이드 서열의 말단에 부착된 미스매치를 추가로 포함하고, 여기서 미스매치는 열역학적으로 특이성을 최적화한다.
일 양태에서, 본 발명은 Cas9 단백질 및 세포 내에서 유전자 생성물을 인코딩하는 DNA 분자를 표적화하는 보호된 가이드를 포함하는, 조작된, 비-천연 발생 CRISPR-Cas 시스템을 제공하며, 이로 인해 보호된 가이드 RNA는 유전자 생성물을 인코딩하는 DNA 분자를 표적화하고, Cas9 단백질은 유전자 생성물을 인코딩하는 DNA 분자를 절단하고, 이로 인해 유전자 산물의 발현이 변경되며; 여기서 Cas9 단백질 및 보호된 가이드 RNA는 함께 자연적으로 발생하지 않는다. 본 발명은 직접 반복부 서열에 3' 융합된 가이드 서열을 포함하는 보호된 가이드 RNA를 포괄한다. 일부 구현예에서, Cpf1 효소는 아시다미노코커스 종 BV3L6, 라크노스피라세아에 박테리움 또는 파란시셀라 노비시다 Cpf1이며, 이들 유기체로부터 유래된 돌연변이된 Cpf1을 포함할 수 있다. 효소는 추가로 Cpf1 동족체 또는 오솔로그일 수 있다. 일부 구현예에서, Cfp1 효소를 인코딩하는 뉴클레오티드 서열은 진핵 세포에서의 발현을 위해 코돈-최적화된다. 일부 구현예에서, Cpf1 효소는 표적 서열의 위치에서 하나 또는 2개의 가닥의 절단을 유도한다. 일부 구현예에서, 제1 조절 요소는 폴리머라제 III 프로모터이다. 일부 구현예에서, 제2 조절 요소는 폴리머라제 II 프로모터이다.
유리한 벡터는 렌티바이러스 및 아데노-연관 바이러스를 포함하며, 이러한 벡터의 유형은 또한 특정 유형의 세포를 표적화하기 위해 선택될 수 있다.
Cpf1 효소의 돌연변이에 관련하여, 효소가 FnCas9가 아닌 경우, 돌연변이는 본 명세서 어느 부분에서 설명된 바와 같을 수 있으며; 임의의 치환 아미노산에 대한 보존적 치환 또한 고려된다. 일 양태에서, 본 발명은 CRISPR 효소가 적어도 하나 이상, 또는 적어도 둘 이상의 돌연변이를 포함하고, 여기서 적어도 하나 이상의 돌연변이 또는 적어도 둘 이상의 돌연변이는 본 명세서 어느 부분에서 설명된 바와 같을 수 있는, 본 명세서에서 논의된 임의의 또는 각각의 또는 모든 구현예에 대해 제공한다.
추가의 양태에서, 본 발명은 CRISPR-Cpf1 시스템 또는 그의 작용 부분 내에 피팅(fitting)되거나 그에 결합되는 잠재적인 화합물을 확인 또는 설계하는 컴퓨터-보조된 방법 또는 그 역의 경우(요망하는 화합물에의 결합을 위해 CRISPR-Cas 시스템 또는 그의 작용 부분을 확인 또는 설계하는 컴퓨터-보조된 방법), 또는 잠재적인 CRISPRCpf1 시스템을 확인 또는 설계하는 컴퓨터-보조된 방법(예를 들어, 결정 구조 데이터 또는 Cpf1 오솔로그의 데이터에 기초하여, 조작되어질 수 있는 CRISPR-Cpf1 시스템의 예측 영역에 대하여, 또는 활성화제 또는 억제제와 같은 작용기가 CRISPR-Cpf1 시스템에 부착될 수 있는 경우에 대하여, 또는 Cpf1 절단에 대하여, 또는 닉카제 설계에 대하여)을 포함하며, 상기 방법은
하기 단계 (a) 내지 (e)의, 컴퓨터 시스템, 예를 들어 프로세서, 데이터 저장 시스템, 입력 디바이스, 및 출력 디바이스를 포함하는 프로그램된 컴퓨터를 이용하는 단계:
(a) 예를 들어, CRISPR-Cpf1 시스템 결합 도메인에서 또는 대안적으로 또는 부가적으로 Cpf1 오솔로그들 중에서의 분산에 기초하여 변화하는 도메인에서 또는 Cpf1에 대해서 또는 닉카제에 대해서, 또는 작용기에 대해서, 선택적으로 CRISPR-Cpf1 시스템 복합체(들)로부터의 구조 정보를 이용하여, CRISPR-Cpf1 결정 구조로부터 또는 그에 대한 원자의 서브세트(subset)의 3차원 좌표를 포함하는 데이터를, 상기 입력 디바이스를 통하여 프로그램된 컴퓨터 내로 입력하여, 데이터 세트를 생성하는 단계;
(b) 상기 프로세서를 이용하여 상기 데이터 세트를, 예를 들어 CRISPR-Cpf1 시스템에 결합하거나 추정적으로 결합하는 화합물 또는 CRISPR-Cpf1 시스템에 결합하는 것이 바람직한 화합물의 구조 또는 Cpf1 오솔로그(예를 들어, Cpf1에 대하여 또는 Cpf1 오솔로그들 중에서 변화하는 도메인 또는 영역)에 대하여 또는 CRISPR-Cpf1 결정 구조에 대하여 또는 닉카제에 대하여 또는 작용기에 대하여, 상기 컴퓨터 데이터 저장 시스템 내에 저장된 구조의 컴퓨터 데이터베이스에 비교하는 단계;
(c) 상기 데이터베이스로부터, 컴퓨터 방법을 이용하여, 구조(들)- 예를 들어, 요망되는 구조에 결합할 수 있는 CRISPR-Cpf1 구조, 특정 CRISPR-Cpf1 구조에 결합할 수 있는 요망되는 구조, 예를 들어 CRISPR-Cpf1 결정 구조의 다른 부분 및/또는 Cpf1 오솔로그, 절단된 Cpf1, 신규 닉카제 또는 특정 작용기로부터의 데이터에 기초하여 조작될 수 있는 CRISPR-Cpf1 시스템의 부분, 또는 작용기 또는 작용기-CRISPR-Cpf1 시스템을 부착하기 위한 위치를 선택하는 단계;
(d) 컴퓨터 방법을 이용하여 선택된 구조(들)의 모델을 구축하는 단계; 및
(e) 상기 출력 디바이스로 선택된 구조(들)를 출력하는 단계;
및 선택적으로 하나 이상의 선택된 구조(들)를 합성하는 단계;
및 상기 합성된 선택된 구조(들)를 CRISPR-Cpf1 시스템으로서 또는 CRISPR-Cpf1 시스템 내에서 선택적으로 추가로 시험하는 단계;
상기 방법은 다음 단계를 포함한다: CRISPR-Cpf1 결정 구조 중 둘 이상의 원자, 예를 들어 본 명세서의 CRISPR-Cpf1 결정 구조의 결정 구조 표 중 둘 이상의 원자의 좌표 또는 CRISPR-Cpf1 결정 구조의 적어도 하위-도메인의 좌표를 제공하는 단계("선택된 좌표"), 결합 분자를 포함하는 후보물의 구조 또는 예를 들어 CRISPRCpf1 결정 구조의 다른 부분으로부터 및/또는 Cpf1 오솔로그로부터의 데이터에 기초하여 조작될 수 있는 CRISPR-Cpf1 시스템의 부분의 구조, 또는 작용기의 구조를 제공하는 단계, 및 후보물의 구조를 선택된 좌표에 피팅하여, 이에 의해 요망되는 구조에 결합할 수 있는 CRISPR-Cpf1 구조, 특정 CRISPR-Cpf1 구조에 결합할 수 있는 요망하는 구조, 조작될 수 있는 CRISPR-Cpf1 시스템의 부분, 절단된 Cpf1, 신규 닉카제, 또는 특정 작용기, 또는 작용기 또는 작용기-CRISPR-Cpf1 시스템을 부착하기 위한 위치를 포함하는 생성물 데이터를 그의 출력과 함께, 수득하는 단계; 및 선택적으로 상기 생성물 데이터로부터의 화합물(들)을 합성하는 단계 및 추가로 상기 합성된 화합물(들)을 CRISPR-Cpf1 시스템으로서 또는 CRISPR-Cpf1 시스템 내에서 시험하는 것을 선택적으로 포함하는 단계.
시험은 상기 합성된 선택된 구조(들)로부터 초래되는 CRISPR-Cpf1 시스템을, 예를 들어 결합 또는 요망하는 작용의 수행에 대하여 분석하는 것을 포함할 수 있다.
상기 방법에서 출력은 데이터 전달, 예를 들어 전기 통신, 전화, 화상 회의, 대중 전달매체, 예를 들어 프레젠테이션, 예컨대 컴퓨터 프레젠테이션(예를 들어, 파워포인트), 인터넷, 이메일, 문서 통신 예컨대 컴퓨터 프로그램(예를 들어, 워드) 문서 등을 통한 정보의 전달을 포함할 수 있다. 이에 따라, 본 발명은 본 명세서에서 참조된 결정 구조에 따른 원자 좌표 데이터로, 상기 데이터는 CRISPR-Cpf1 또는 그의 하나 이상의 하위-도메인의 3차원 구조를 정의하는 데이터, 또는 CRISPR-Cpf1에 대한 구조 인자 데이터로, 상기 구조 인자 데이터는 본 명세서에서 참조된 결정 구조의 원자 좌표 데이터로부터 유도가능한 데이터를 담은 컴퓨터 가독성 매체를 또한 포함한다. 컴퓨터 가독성 매체는 상기 방법의 임의의 데이터를 또한 포함할 수 있다. 본 발명은 다음 중 어느 하나를 포함하는 전술된 방법에서와 같이 이론적 설계를 생성 또는 수행하기 위한 컴퓨터 시스템 방법을 추가로 포괄한다: 본 명세서에서 참조된 결정 구조에 따른 원자 좌표 데이터로서, 상기 데이터는 CRISPR-Cpf1 또는 그의 하나 이상의 하위-도메인의 3차원 구조를 정의하는 데이터, 또는 CRISPR-Cpf1에 대한 구조 인자 데이터로서, 상기 구조 인자 데이터는 본 명세서에서 참조된 결정 구조의 원자 좌표 데이터로부터 유도가능한 데이터. 본 발명은 사용자에게 컴퓨터 시스템 또는 매체 또는 CRISPR-Cpf1 또는 그의 하나 이상의 하위-도메인의 3차원 구조, 또는 CRISPR-Cpf1에 대한 구조 인자 데이터를 제공하는 것을 포함하는 비즈니스의 실행 방법을 추가로 포괄하며, 상기 구조 인자는 본 명세서에서 참조된 결정 구조의 원자 좌표 데이터, 또는 본 멍세서의 컴퓨터 매체 또는 본 명세서의 데이터 전달로부터 유도가능하고, 상기 구조는 그 안에 설명되어 있다.
"결합 부위" 또는 "활성 부위"는 결합 공동 또는 영역에서의 부위(예컨대, 원자, 아미노산 잔기의 작용기 또는 그러한 복수의 원자 및/또는 기)를 포함하거나, 본질적으로 이루어지거나, 이루어지며, 이는 결합에 연루되는 핵산 분자와 같은 화합물에 결합될 수 있다.
"피팅"은 자동 또는 반자동 수단에 의해, 후보 분자의 하나 이상의 원자 및 본 발명의 구조의 하나 이상의 원자 간의 상호 작용을 결정하고, 그러한 상호작용이 어느 정도까지 안정한지 계산하는 것을 의미한다. 상호작용은 하전, 입체배치 고려 등에 의해 유발되는, 인력과 척력을 포함한다. 피팅을 위한 각종 컴퓨터-기반 방법이 추가로 설명된다.
평균 제곱근(또는 rms) 편차"라 함은, 본 발명자들은 평균으로부터의 편차의 제곱의 산술 평균의 제곱근을 의미한다.
"컴퓨터 시스템"이라 함은, 원자 좌표 데이터를 분석하는데 사용되는 하드웨어 수단, 소프트웨어 수단 및 데이터 저장 수 단이다. 본 발명의 컴퓨터-기반 시스템의 최소 하드웨어 수단은 통상적으로 중앙 처리 장치(CPU), 입력 장치, 출력 장치 및 데이터 저장 수단을 포함한다. 바람직하게는 구조 데이터를 시각화하기 위해 디스플레이 또는 모니터가 제공된다. 데이터 저장 수단은 RAM 또는 본 발명의 컴퓨터 가독성 매체에 접근하기 위한 수단일 수 있다. 그러한 시스템의 예는 유닉스, 윈도우 또는 애플 운영 시스템을 가동하는 컴퓨터 및 태블릿 디바이스이다.
"컴퓨터 가독성 매체"라 함은, 컴퓨터에 의해 직접적으로 또는 간접적으로 가독되고 접근될 수 있는 임의의 매체 또는 매체들을 의미하여, 예를 들어 매체는 상기 언급된 컴퓨터 시스템에서의 이용에 적합하다. 그러한 매체는 이로 제한되지는 않지만, 자성 저장 매체, 예컨대 플로피 디스크, 하드 디스크 저장 매체 및 자성 테이프; 광학 디스크 또는 CD-ROM과 같은 광학 저장 매체; RAM 및 ROM과 같은 전기 저장 매체; 썸 드라이브 디바이스; 클라우드 저장 디바이스 및 자성/광학 저장 매체와 같은 이들 카테고리의 혼성물을 포함한다.
본 발명은 본 명세서에서 설명된 최적화된 작용성 CRISPR-Cas 효소 시스템에서 본 명세서에서 상기 설명된 보호된 가이드의 이용을 포괄한다.
가이드 조작을 통한 RISC의 형성
일부 구현예에서, 가이드는 본 명세서에서 설명된 바와 같은 보호된 가이드(예를 들어, pgRNA) 또는 에스코트된 가이드(예를 들어, esgRNA)일 수 있다. 이들 모두는, 일부 구현예에서, RISC를 이용한다. RISC는 RNAi의 주요 성분이다. RISC(RNA-유도된 침묵화 복합체)는 다중단백질(multiprotein), 특히 리보뉴클레오단백질인 복합체로, 이는 이중-가닥 RNA(dsRN) 단편, 예컨대 짧은 간섭 RNA(siRNA) 또는 마이크로RNA(miRNA)의 한 가닥을 포함하며, 이는 RISC에 대한 주형으로서 작용하여 상보적 메신저 RNA(mRNA) 전사물을 인식한다. mRNA는 이에 따라 RISC의 성분 중 하나에 의해 절단된다.
그와 같이, RISC의 형성은 일부 구현예에서 유리하다. 이로 제한되지는 않지만, 보호된 및/또는 에스코트된 가이드 RNA를 포함하는 본 발명의 각종 양태에 따른 가이드 RNA는 RISC의 형성을 촉진하는 RNA 뉴클레오티드를 포함하도록, 예를 들어 세포 내에서 제공될 수 있거나 예를 들어 이미 발현될 수 있는 siRNA 또는 miRNA와 조합하여, 조정될 수 있다. 이는 예를 들어, 가이드를 제거 또는 분해하기 위한 자가-비활성화 시스템으로서 유용할 수 있다.
따라서, 가이드 RNA는 표적 miRNA 또는 siRNA에 상보적인 서열을 포함할 수 있으며, 세포 내에서 존재할 수 있거나 존재할 수 없다. 이러한 방식으로, 예를 들어 발현을 통해(세포에 의해 또는 인간 개재를 통해), miRNA 또는 siRNA가 존재하는 경우라면, RNA 서열의 miRNA 또는 siRNA로의 결합이 존재하며, 이는 가이드 RNA의 절단, 세포 내에서 RNA-유도된 침묵화 복합체(RISC)를 결과로서 초래한다. 따라서, 일부 구현예에서, 가이드 RNA는 표적 miRNA 또는 siRNA에 상보적인 RNA 서열을 포함하고, 가이드 RNA 서열의 표적 miRNA 또는 siRNA로의 결합은 세포 내에서 RNA-유도된 침묵화 복합체(RISC)에 의한 가이드 RNA의 절단을 결과로서 초래한다.
이는 보호되고 에스코트된 가이드 모두에 대한 특정 참조를 이용하여 하기에서 추가로 설명된다.
보호된 가이드의 이용을 통한 RISC 형성
예를 들어, 보호된 가이드는 하기 양태에서 설명될 수 있다: (a) 보호자 서열, (b) 직접 반복부 및 (c) 진핵 세포에서 표적 서열에 혼성화될 수 있는 가이드 서열을 포함하는 보호된 가이드 RNA(pgRNA) 폴리뉴클레오티드 서열을 갖는 클러스터링되고 규칙적으로 산재된 짧은 팔린드로믹 반복부(CRISPR)-CRISPR 연결된(Cas)(CRISPR-Cas) 시스템을 포함하는 조작된, 비-천연 발생 조성물로서, (a), (b) 및 (c)가 5'에서 3' 배향으로 배열되며, 여기서 보호자 서열은 표적 서열에 대해 비-상보적인 둘 이상의 뉴클레오티드를 포함하며, 여기서 전사된 경우, 가이드 서열은 CRISPR 복합체의 표적 서열로의 서열-특이적 결합을 유도하며, 여기서 CRISPR 복합체는 (1) 표적 서열로 혼성화된 가이드 서열과 복합체화된 Cpf1 단백질을 포함하며, 여기서 폴리뉴클레오티드 서열 및/또는 하나 이상의 가이드RNA가 변형되는 조작된, 비-천연 발생 조성물.
일 양태에서, 이러한 보호된 가이드 시스템이 sgRNA에 대한 5' 연장을 위한 이차 구조 보호에 사용된다. 예를 들어, 출원인은 miRNA 결합 부위가 도입되도록 gRNA를 연장하여 miRNA 결합 부위가 RISC 복합체 기구에 의해 가공되고 절단된 경우에만 gRNA가 활성이 되도록 한다. 엑소뉴클레아제 가공은 5' 말단에서 시작하고 sgRNf 방향으로 절단될 것이기 때문에, 이는 이차 구조 보호 없이는 가능하지 않을 것이다. 부가된 miRNA 부위의 5'에 작은 이차 구조 루프를 부가함으로써, miRNA는 엑소뉴클레아제 되씹음(chew back)으로부터 보호될 수 있다.
에스코트된 가이드의 이용을 통한 RISC 형성
또 다른 예에서, 에스코트된 가이드가 설명될 수 있다. 특히, miRNA 유도성 esgRNA가 고려된다. 여기서 에스코트 RNA 압타머 서열은 표적 miRNA에 상보적이어서, 표적 miRNA가 RNA-유도된 침묵화 복합체(RISC) 내에 혼입된 세포 내에 존재하는 경우, 에스코트 RNA 압타머 서열의 표적 miRNA로의 결합이 존재하며, 이는 세포 내에서 RNA-유도된 침묵화 복합체(RISC)에 의한 esgRNA의 절단을 결과로서 초래한다.
대안적인 구현예에서, RISC 복합체가 miRNA 결합 부위에 접근할 수 있도록 설계된 esgRNA의 3' 말단에서, 광범위한 종류의 일차 및 이차 구조가 제공될 수 있다. esgRNA는 보호자 서열에 대하여 3'에 제1 및 제2 링커 서열을 가질 수 있다. 대안적인 구현예에서, 링커 1 및 링커 2는 예를 들어, 각각 독립적으로 0, 1, 2 개, 3 개 또는 4 개의 뉴클레오티드 길이일 수 있으며, 길이 0, 1 또는 2 개의 뉴클레오티드의 보호자 서열을 갖는다.
예시적인 구현예에서, esgRNA 표적화의 도입은 HEK293 세포 시스템에서 miR-122를 이용하여 예시될 수 있으며, 여기서 miR-122는 자연적으로 발현되지 않는다. 외생의 miR-122 부재 하에서, 보호된 esgRNA는 표적된 EMX1.3 뉴클레아제 활성을 매개하지 않았다. 외생의 miR-122가 부가된 경우(100 ng/웰), 표적된 EMX1.3 절단이 관찰되었다(겔 상에서의 전기영동 변이체로서 볼 수 있는 구분된 절단 인공 산물로서) 이는 고도로 발현된 내생의 miRNA가 시스템 내에서 활용되어 유전적으로 유도가능한 sgRNA를 제공할 수 있음을 증명한다. 임의의 miRNA는, miRNA122 대신, 쉽게 결정되는 상응하는 서열과 함께 사용될 수 있다.
예를 들어, sgRNA는 내생의 표적 miRNA에 대해 상보적인 "에스코트" RNA 압타머 서열에 연결될 수 있다. 표적 miRNA는 세포 내에서 RNA-유도된 침묵화 복합체(RISC)를 형성할 수 있다. 표적 miRNA가 세포 내에 존재하는 경우, 에스코트 RNA 압타머 서열의 표적 miRNA로의 결합이 존재하며, 이는 세포 내에서 RNA-유도된 침묵화 복합체(RISC)에 의한 esgRNA의 절단을 결과로서 초래한다. 에스코트의 절단은 활성 sgRNA를 방출한다.
예를 들어, 보호된 가이드가 하기 양태에서 설명될 수 있다:
세포 내의 관심 유전자좌에서 표적 서열에 혼성화할 수 있는 RNA 가이드 서열; 및
에스코트 RNA 압타머 서열을 포함하는 에스코트된 단일 CRISPR-Cas9 가이드 RNA(esgRNA)를 포함하는 비-천연 발생 또는 조작된 조성물로서,
여기서 에스코트 RNA 압타머 서열은 세포 상에서 또는 세포 내에서 압타머 리간드에 대한 결합 친화성을 포함하거나, 에스코트 RNA 압타머 서열은 세포 상에서 또는 세포 내에서 국소화된 압타머 이펙터에 반응성이며,
압타머 리간드 또는 이펙터의 세포 상에서 또는 세포 내에서의 존재가 공간적으로 또는 시간적으로 제한되는 비-천연 발생 또는 조작된 조성물.
에스코트 RNA 압타머 서열은 표적 miRNA에 상보적일 수 있으며, 이는 세포 내에 존재하거나 존재하지 않을 수 있어서, 표적 miRNA가 존재하는 경우에만 에스코트 RNA 압타머 서열의 표적 miRNA로의 결합이 존재하며, 이는 세포 내에서 RNA-유도된 침묵화 복합체(RISC)에 의해 esgRNA의 절단을 결과로서 초래한다. 따라서, 일부 구현예에서, 에스코트 RNA 압타머 서열은 표적 miRNA에 상보적이고, 에스코트 RNA 압타머 서열의 표적 miRNA로의 결합은 세포 내에서 RNA-유도된 침묵화 복합체(RISC)에 의한 esgRNA의 절단을 결과로서 초래한다.
키트 및 조성물
일 양태에서, 본 발명은 상기 방법 및 조성물에서 개시된 임의의 하나 이상의 요소를 함유하는 키트 또는 조성물(집합하여 "키트"로 지칭)을 제공한다. 일부 구현예에서, 키트는 본 명세서에 교시된 바와 같은 벡터 시스템 및 키트를 사용하기 위한 안내서를 포함한다. 요소는 개별적으로 또는 조합되어 제공될 수 있으며, 임의의 적합한 용기, 예컨대 바이알, 병, 또는 튜브에 제공될 수 있다. 키트는 본 명세서에 기재된 바와 같은 gRNA 및 비결합 보호자(protector) 가닥을 포함할 수 있다. 키트는 가이드 서열에 적어도 부분적으로 결합된 보호자 가닥을 지니는 gRNA(즉, pgRNA)를 포함할 수 있다. 따라서, 키트는 본 명세서에 기재된 바와 같은 부분적 이중 가닥 뉴클레오티드 서열의 형태로 pgRNA를 포함할 수 있다. 일부 구현예에서, 키트는 하나 이상의 언어, 예를 들어 하나 초과의 언어로 적힌 안내서를 포함한다. 안내서는 본 명세서에 기재된 적용 및 방법에 특이적일 수 있다.
일부 구현예에서, 본 명세서에서 설명된 하나 이상의 요소를 이용하는 공정에서의 사용을 위한 하나 이상의 시약을 포함한다. 시약은 임의의 적합한 용기 내에 제공될 수 있다. 예를 들어, 키트는 하나 이상의 반응 또는 저장 완충액을 제공할 수 있다. 시약은 특정 분석에서 사용가능한 형태로, 또는 사용 전에 하나 이상의 기타 성분의 첨가를 필요로 하는 형태로 제공될 수 있다 (예를 들어, 농축 또는 동결건조된 형태로). 완충액은 임의의 완충액일 수 있으며, 이로 제한되지는 않지만, 탄산나트륨 완충액, 중탄산나트륨 완충액, 보레이트 완충액, 트리스(Tris) 완충액, MOPS 완충액, HEPES 완충액, 및 이들의 조합일 수 있다. 일부 구현예에서, 완충액은 알칼리성이다. 일부 구현예에서, 완충액은 약 7 내지 약 10의 pH를 갖는다. 일부 구현예에서, 키트는, 가이드 서열 및 조절 요소에 작동 가능하게 연결되도록, 하나 이상의 벡터 내로의 삽입을 위한 가이드 서열에 상응하는 올리고뉴클레오티드를 포함한다. 일부 구현예에서, 키트는 상동성 재조합 주형 폴리뉴클레오티드를 포함한다. 일부 구현예에서, 키트는, 본 명세서에서 설명된, 하나 이상의 벡터 및/또는 하나 이상의 폴리뉴클레오티드를 포함한다. 키트는 유리하게는 본 발명의 시스템의 모든 요소를 제공하는 것을 가능하게 할 수 있다.
일 양태에서, 본 발명은 CRISPR 시스템의 하나 이상의 요소를 사용하는 방법을 제공한다. 본 발명의 CRISPR 복합체는 표적 폴리뉴클레오티드를 변형시키기 위한 효과적인 수단을 제공한다. 본 발명의 CRISPR 복합체는 다수의 세포 유형에서 표적 폴리뉴클레오티드를 변형시키는(예를 들어, 결실시키는, 삽입하는, 전위시키는, 불활성화시키는, 활성화시키는) 것을 포함하는 광범위한 다양한 유용성을 갖는다. 이와 같이, 본 발명의 CRISPR 복합체는, 예를 들어 유전자 치료법, 약물 스크리닝, 질병 진단, 및 예후에서 광범위한 적용을 갖는다. 예시적인 CRISPR 복합체는 표적 폴리뉴클레오티드 내에서 표적 서열에 혼성화된 가이드 서열과 복합체화된 CRISPR 이펙터 단백질을 포함한다. 특정 구현예에서, 직접 반복부 서열은 가이드 서열에 연결된다.
일 구현예에서, 본 발명은 표적 폴리뉴클레오티드를 절단하는 방법을 제공한다. 본 발명은 표적 폴리뉴클레오티드에 결합하는 CRISPR 복합체를 사용하여 표적 폴리뉴클레오티드를 변형시키는 것을 포함하고 상기 표적 폴리뉴클레오티드의 절단을 달성한다. 통상적으로, 본 발명의 CRISPR 복합체는 세포 내로 도입된 경우, 게놈 서열에서 파손(예를 들어, 단일 또는 이중 가닥 파손)이 형성된다. 예를 들어, 본 방법은 세포 내에서 질병 유전자를 절단하는 데 사용될 수 있다.
CRISPR 복합체에 의해 형성된 파손은 에러 발생이 일어나기 쉬운 비-상동성 말단 접합(NHEJ) 경로 또는 고-충실도 상동성-유도 수복(HDR)과 같은 수복 공정에 의해 수복될 수 있다. 이들 수복 공정 동안, 외인성 폴리뉴클레오티드 주형은 게놈 서열 내로 도입될 수 있다. 일부 방법에서, HDR 공정이 게놈 서열을 변형하는데 사용된다. 예를 들어, 상류 서열 및 하류 서열에 의해 측접된 통합될 서열을 포함하는 외인성 폴리뉴클레오티드 주형은 세포 내로 도입된다. 상류 및 하류 서열은 염색체 내 통합 부위의 어느 한 측면과의 서열 유사성을 공유한다.
바람직한 경우, 공여자 폴리뉴클레오티드는 DNA, 예를 들어 DNA 플라스미드, 세균 인공 염색체(BAC), 효모 인공 염색체(YAC), 바이러스 벡터, DNA의 선형 조각, PCR 단편, 네이키드(naked) 핵산, 또는 리포좀 또는 폴록사머와 같이 전달 비히클로 복합체화된 핵산일 수 있다.
외생의 폴리뉴클레오티드 주형은 통합될 서열(예를 들어, 돌연변이된 유전자)을 포함한다. 통합을 위한 서열은 세포에 대해 내생 또는 외인성 서열일 수 있다. 통합될 서열의 예로는 단백질 또는 비-코딩 RNA(예를 들어, 마이크로RNA)를 인코딩하는 폴리뉴클레오티드를 포함한다. 따라서, 통합을 위한 서열은 적절한 제어 서열 또는 서열들에 작동 가능하게 연결될 수 있다. 대안적으로, 통합될 서열은 조절 작용을 제공할 수 있다.
외생의 폴리뉴클레오티드 주형 내 상류 및 하류 서열이 선택되어 관심 염색체 서열과 공여자 폴리뉴클레오티드 사이의 재조합을 촉진한다. 상류 서열은 통합을 위해 표적된 부위의 게놈 서열 상류와의 서열 유사성을 공유하는 핵산 서열이다. 유사하게, 하류 서열은 통합을 위한 표적된 부위의 하류의 염색체 서열과 서열 상동성을 공유하는 핵산 서열이다. 외생의 폴리뉴클레오티드 주형 내 상류 및 하류 서열은 표적된 게놈 서열과 75%, 80%, 85%, 90%, 95%, 또는 100%의 서열 동일성을 가질 수 있다. 바람직하게는 외인성 폴리뉴클레오티드 주형 내 상류 및 하류 서열은 표적된 게놈 서열과 약 95%, 96%, 97%, 98%, 99%, 또는 100%의 서열 동일성을 갖는다. 일부 방법에서, 외인성 폴리뉴클레오티드 주형 내 상류 및 하류 서열은 표적된 게놈 서열과 99% 또는 100%의 서열 동일성을 갖는다.
상류 또는 하류 서열은 약 20 bp 내지 약 2500 bp, 예를 들어, 약 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, 2000, 2100, 2200, 2300, 2400, 또는 2500 bp를 포함할 수 있다. 일부 방법에서, 예시적인 상류 또는 하류 서열은 약 200 bp 내지 약 2000 bp, 약 600 bp 내지 약 1000 bp, 또는 더욱 구체적으로는 약 700 bp 내지 약 1000 bp를 갖는다.
일부 방법에서, 외인성 폴리뉴클레오티드 주형은 마커를 추가로 포함할 수 있다. 그러한 마커는 표적된 통합을 스크리닝하기 쉽게 만들 수 있다. 적합한 마커의 예로는 제한 부위, 형광 단백질 또는 선택성 마커를 포함한다. 본 발명의 외인성 RNA 주형은 재조합 기술을 이용하여 구축될 수 있다(예를 들어, 문헌 [Sambrook et al., 2001 및 Ausubel et al., 1996] 참조)
외생의 폴리뉴클레오티드 주형을 통합함으로써 표적 폴리뉴클레오티드를 변형하기 위한 예시적인 방법에서, 이중 가닥 파손은 CRISPR복합체에 의해 게놈 서열 내로 도입되고, 그 파손은 그 주형이 게놈 내로 통합되도록 하는 외인성 폴리뉴클레오티드 주형을 이용한 상동성 재조합을 통해 수복된다.
다른 구현예에서, 본 발명은 진핵 세포 내에서 폴리뉴클레오티드의 발현을 변형하는 방법을 제공한다. 방법은 폴리뉴클레오티드에 결합하는 CRISPR 복합체를 이용함으로써 표적 폴리뉴클레오티드의 발현 증가 또는 감소를 포함한다.
일부 방법에서, 표적 폴리뉴클레오티드는 세포 내 발현의 변형을 달성하도록 비활성화될 수 있다. 예를 들어, 세포 내에서 CRISPR 복합체의 표적 서열에의 결합시, 표적 폴리뉴클레오티드는 서열이 전사되지 않거나, 코딩된 단백질이 생산되지 않도록, 또는 서열이 야생형 서열이 작용하는 것과 같이 작용하지 않도록 비활성화된다. 예를 들어, 단백질 또는 마이크로RNA 코딩 서열은, 단백질이 생산되지 않도록 비활성화될 수 있다.
일부 방법에서, 제어 서열은 제어 서열로서 더 이상 작용하지 않도록 비활성화될 수 있다. 본 명세서에서 사용된 바와 같은, "제어 서열"은 핵산 서열의 전사, 번역, 또는 접근성에 영향을 미치는 임의의 핵산 서열을 지칭한다. 제어 서열의 예로는, 프로모터, 전사 종결자, 및 인핸서를 포함한다. 비활성화된 표적 서열은 결실 돌연변이(즉, 하나 이상의 뉴클레오티드의 결실), 삽입 돌연변이(즉, 하나 이상의 뉴클레오티드의 삽입), 또는 논센스 돌연변이(즉, 정지 코돈이 도입되도록 하는, 하나의 뉴클레오티드의 또 다른 뉴클레오티드로의 치환)를 포함할 수 있다. 일부 방법에서, 표적 서열의 비활성화는 표적 서열의 "낙아웃"을 결과로서 초래한다.
CRISPR Cas 시스템의 예시적인 사용 방법
본 발명은 비-천연 발생 또는 조작된 조성물, 또는 상기 조성물의 성분을 인코딩하는 하나 이상의 폴리뉴클레오티드, 또는 상기 조성물의 성분을 인코딩하는 하나 이상의 폴리뉴클레오티드를 포함하는 벡터 또는 전달 시스템의, 생체 내, 생체 외 또는 시험관 내에서 표적 세포를 변형시키는데 있어서의 이용을 제공하며, 세포를 변경시키는 방식으로 수행되어, 일단 변형되면, CRISPR 변형된 세포의 자손 또는 세포주가 변경된 표현형을 보유하도록 한다. 변형된 세포 및 자손은, 원하는 세포 유형으로의 CRISPR 시스템의 생체 외 또는 생체 내 적용을 갖는, 식물 또는 동물과 같은 다세포 생물의 일부일 수 있다. CRISPR 발명은 치료 처리 방법일 수 있다. 치료 처리 방법은 유전자 또는 게놈 편집 또는 유전자 치료법을 포함할 수 있다.
FISH와 같은 검출 방법에 있어서 비활성화된 CRISPR Cpf1 효소의 용도
일 양태에서, 본 발명은 본 명세서에 기재된 촉매적으로 비활성인 Cas 단백질, 바람직하게는 비활성화된 Cpf1(dCpf1)을 포함하는 조작된 비-천연 발생 CRISPR-Cas 시스템, 및 제자리 형광 혼성화(fluorescence in situ hybridization; FISH)와 같은 검출 방법에 있어서 이 시스템의 용도를 제공한다. DNA 이중-가닥 파손을 생성하는 능력을 결여한 dCpf1은 향상된 녹색 형광 단백질(eEGFP)과 같은 형광 단백질과 같은 마커와 융합될 수 있고, 작은 가이드 RNA와 공동발현되어 협동원체성(pericentric), 동원체성 및 텔로머릭(teleomeric) 반복부를 생체내에서 표적화할 수 있다. dCpf1 시스템은 인간 게놈에서 반복 서열 및 개별 유전자 모두를 시각화하는 데 사용될 수 있다. 표지화된 dCpf1 CRISPR-Cas 시스템의 이러한 새로운 적용은 세포의 이미지화 및 작용적 핵 구조, 특히 작은 핵 부피 또는 복합체 3-D 구조를 갖는 경우의 연구에 중요할 수 있다. (문헌[Chen B, Gilbert LA, Cimini BA, Schnitzbauer J, Zhang W, Li GW, Park J, Blackburn EH, Weissman JS, Qi LS, Huang B. 2013. Dynamic imaging of genomic loci in living human cells by an optimized CRISPR/Cas system. Cell 155(7):1479-91. doi: 10.1016/j.cell.2013.12.001.])
DNA의 변형/검출을 위한 CRISPR Cpf1의 용도
CRISPR Cpf1 시스템 및 그의 이용 방법은 그의 기원과 관계 없이 DNA의 표적화 및 선택적으로 유전자 변형을 위하여 흥미로운 것이다. 따라서, DNA는 원핵, 진핵 또는 바이러스 DNA일 수 있다. 세포 내측 또는 외측에서 진핵 DNA를 표적화하기 위한 상이한 응용이 본원의 다른 곳에 상세화되어 있다. 특정 구현예에서, Cpf1 시스템은 미생물, 예컨대 원핵 DNA를 표적화하기 위해 사용된다. 이것은 유기체, 예컨대 효모 또는 진균에서의 관심 분자의 재조합 생성의 맥락에서 흥미로운 것일 수 있다. 이러한 맥락에서, 본 발명은 숙주 세포에서 관심 화합물의 재조합 생성을 위한 방법을 예상하며, 이는 숙주 세포, 예컨대 효모, 진균 또는 박테리아를 유전자 변형시켜, 상기 화합물의 생성을 보장하기 위한 Cpf1 시스템의 이용을 포함한다. 본 출원은 추가로 이들 방법에 의해 수득되는 화합물을 예상한다. 추가로 또는 대안적으로, 이것은 박테리아 또는 바이러스 DNA의 검출 및/또는 변형의 맥락에서 흥미로운 것일 수 있다. 특정 구현예에서, 상기 방법은 박테리아 또는 바이러스 DNA의 특이적인 검출 및/또는 변형을 포함한다.
오염 DNA의 분해를 위한 CRISPR Cpf1의 용도
특정 구현예에서, Cpf1 이펙터 단백질을 사용하여, 오염 DNA를 표적화하고, 절단한다. 예를 들어, 특정 구현예에서, 진핵 DNA는 시료 중 오염물질이며, 진핵생물의 조직 또는 유체 시료에서 예를 들어, 비-진핵, 예컨대, 바이러스 또는 박테리아 DNA의 검출이 관심 대상이다. 진핵 DNA의 표적화는 진핵생물(예를 들어, 인간) 특이적 가이드 서열을 사용함으로써 보장된다. 이들 방법은 진핵 DNA를 표적화하기 이전에 시료에 존재하는 세포를 용해시키는 것으로 수반하거나, 이를 수반하지 않을 수 있다. 진핵 DNA의 선택적 절단 후에, 이것은 해당 분야에 알려져 있는 방법에 의해 시료 내에 존재하는 무손상 DNA로부터 분리될 수 있다. 따라서, 본 발명은 시료로부터 진핵(예를 들어, 인간) DNA를 선택적으로 제거하는 방법을 제공하며, 이 방법은 진핵 DNA를 본원에 기재된 CRISPR-Cpf1 시스템으로 선택적으로 절단하는 것을 포함한다. 또한, 진핵 DNA의 선택적인 표적화를 허용하는 본원에 기재된 CRISPR-Cpf1 시스템의 하나 이상의 성분을 포함하는 이들 방법을 수행하기 위한 키트가 본원에 제공된다. 유사하게, 오염 DNA의 종-특이적인 제거가 보장될 수 있음이 예상된다.
CRISPR Cas 시스템 또는 복합체(예를 들어, Cpf1-RNA 복합체)를 이용한 표적 변형
일 양태에서, 본 발명은, 생체 내, 생체 외 또는 시험관 내일 수 있는 진핵 세포 내에서 표적 폴리뉴클레오티드를 변형하는 방법을 제공한다. 일부 구현예에서, 본 방법은 인간 또는 비-인간 동물로부터 세포 또는 세포 집단을 샘플링하는 단계 및 세포 또는 세포들을 변형하는 단계를 포함한다. 배양은 생체 외 임의의 단계에서 일어날 수 있다. 세포 또는 세포들은 비-인간 동물 또는 식물 내로 재도입될 수 있다. 재도입된 세포들의 경우, 세포는 줄기 세포인 것이 특히 바람직하다.
일 양태에서, 본 발명은 진핵 세포 내의 표적 폴리뉴클레오티드의 변형 방법을 제공한다. 일부 구현예에서, CRISPR 복합체가 표적 폴리뉴클레오티드에 결합하도록 허용하는 것을 포함하여, 상기 표적 폴리뉴클레오티드를 절단시켜, 이에 의해 표적 폴리뉴클레오티드를 변형시키고, 여기서 CRISPR 복합체는 상기 표적 폴리뉴클레오티드 내에서 표적 서열에 혼성화된 가이드 서열을 포함하는 보호된 가이드 RNA와 복합체화된 Cpf1 효소를 포함한다. 일부 구현예에서, 상기 절단은 상기 Cpf1 효소에 의해 표적 서열의 위치에서 1개의 또는 2개의 가닥을 절단하는 것을 포함한다. 일부 구현예에서, 상기 절단은 표적 유전자의 전사 감소를 초래한다. 일부 구현예에서, 방법은 상기 절단된 표적 폴리뉴클레오티드를, 비-상동성 말단 접합 (NHEJ)에 기초한 유전자 삽입 메커니즘에 의해 더욱 구체적으로 외생의 주형 폴리뉴클레오티드를 이용하여 수복하는 것을 추가로 포함하며, 상기 수복은 상기 표적 폴리뉴클레오티드의 하나 이상의 뉴클레오티드의 삽입, 결실, 또는 치환을 포함하는 돌연변이를 결과로서 초래한다. 일부 구현예에서, 상기 돌연변이는 표적 서열을 포함하는 유전자로부터 발현된 단백질에서 하나 이상의 아미노산 변화를 결과로서 초래한다. 일부 구현예에서, 본 방법은 하나 이상의 벡터를 상기 진핵 세포로 전달하는 것을 추가로 포함하며, 여기서 하나 이상의 벡터는 Cpf1 효소, 직접 반복부 서열에 연결된 가이드 서열을 포함하는 보호된 가이드 RNA 중 하나 이상의 발현을 유도한다. 일부 구현예에서, 상기 벡터는 대상체에서 진핵 세포로 전달된다. 일부 구현예에서, 상기 변형은 세포 배양물 내 상기 진핵 세포에서 일어난다. 일부 구현예에서, 방법은 상기 변형 전에 대상체로부터 상기 진핵 세포를 분리하는 것을 추가로 포함한다. 일부 구현예에서, 본 방법은 상기 진핵 세포 및/또는 그로부터 유도된 세포를 상기 대상체로 되돌리는 것을 추가로 포함한다.
실제로, 본 발명이 임의의 양태에서, CRISPR 복합체는 표적 서열에 혼성화된 또는 혼성화될 수 있는 가이드 서열과 복합체화된 CRISPR 효소를 포함할 수 있다. 유사한 고려사항 및 조건이 표적 폴리뉴클레오티드를 변형시키는 방법에 대해 상기와 같이 적용된다.
따라서, 본 명세서에서 설명된 임의의 비-천연 발생 CRISPR 효소는 하나 이상의 변형을 포함하고, 이로 인해 효소는 소정의 개선된 능력을 갖는다. 특히, 임의의 효소는 가이드 RNA와의 CRISPR 복합체를 형성할 수 있다. 그러한 복합체가 형성된 경우, 가이드 RNA는 표적 폴리뉴클레오티드 서열에 결합할 수 있고, 효소는 표적 유전자좌를 변형시킬 수 있다. 추가적으로, CRISPR 복합체 내 효소는 비변형된 효소에 비하여, 하나 이상의 표적외 유전자좌를 변형시키는 감소된 능력을 갖는다.
추가적으로, 본 명세서에서 설명된 변형된 CRISPR 효소는 효소를 포괄하고, 이로 인해 CRISPR 복합체 내에서 효소는 비변형된 효소에 비하여, 하나 이상의 표적 유전자좌를 변형시킬 수 있는 증가된 능력을 갖는다. 그러한 작용은 개별적으로 제공될 수 있거나 하나 이상의 표적외 유전자좌를 변형시키는 감소된 능력인 상기 설명된 작용과 함께 제공될 수 있다. 임의의 그러한 효소에는 본 명세서에서 설명된 바와 같이 CRISPR 효소에 대한 추가의 임의의 변형, 예컨대 하나 이상의 연관된 상동성 작용 도메인에 의해 제공된 임의의 활성과 조합된, 뉴클레아제 활성 등을 감소시키는 임의의 추가의 돌연변이가 제공될 수 있다.
본 발명의 유리한 구현예에서, 변형된 CRISPR 효소는 비변형된 효소에 비하여 하나 이상의 표적외 유전자좌를 변형시키는 감소된 능력 및 비변형된 효소에 비하여 하나 이상의 표적외 유전자좌를 변형시키는 증가된 능력이 있다. 효소에 대한 추가의 변형과 조합하여, 현저히 증진된 특이성이 달성될 수 있다. 예를 들어, 그러한 유리한 구현예의 하나 이상의 추가의 돌연변이와의 조합이 제공되며, 여기서 하나 이상의 추가적인 돌연변이는 하나 이상의 촉매적으로 활성인 도메인이다. 그러한 추가의 촉매적 돌연변이는 본 명세서에 어느 부분에서 상술된 바와 같이 닉카제 작용성을 부여할 수 있다. 그러한 효소에서, 증진된 특이성은 효소 활성 면에서 개선된 특이성으로 인해 달성될 수 있다.
표적외 효과를 감소시키는 변형 및/또는 상기 설명된 바와 같은 표적상 효과를 증진시키는 변형은 RuvC-III과 HNH 도메인 사이에 위치된 양으로 하전된 영역/홈에 위치된 아미노산 잔기에 만들어질 수 있다. 상기 설명된 임의의 작용적 효과는 상기 언급된 홈 내에서 아미노산의 변형에 의해 달성될 수 있지만, 그 홈에 인접하여 또는 홈 밖에서의 아미노산의 변형에 의해 달성될 수 있다.
본 명세서에서 설명된 바와 같은 변형된 CRISPR 효소 내로 조작될 수 있는 추가의 작용기로는 하기가 포함된다. 1. 단백질 삼차 또는 이차 구조에 영향을 미치지 않으면서 DNA:단백질 상호작용을 붕괴시키는 변형된 CRISPR 효소. 이는 RNA:DNA 이중나선의 임의의 부분에 접촉하는 잔기를 포함한다. 2. DNA 결합에 반응하여(표적상 또는 표적외) 뉴클레아제 절단에 필수적인 배좌로 Cpf1을 유지시키는 내부-단백질 상호작용을 약하게 하는 변형된 CRISPR 효소. 예를 들어: 온건하게 억제하지만, HNH 도메인(자를 수 있는 인산염에 위치됨)의 뉴클레아제 배좌를 여전히 허용하는 변형. 3. DNA 결합에 반응하여 (표적상 또는 표적외) 뉴클레아제 활성에 필수적인 배좌로 Cpf1을 유지시키는 내부-단백질 상호작용을 강하게 하는 변형된 CRISPR 효소. 예를 들어: 온건하게 억제하지만, HNH 도메인(자를 수 있는 인산염에 위치됨)의 뉴클레아제 배좌를 여전히 허용하는 변형. 임의의 그러한 추가적인 작용성 증진은 본 명세서 어느 부분에서 상세하게 설명된 바와 같은 CRISPR 효소의 임의의 다른 변형과 조합하여 상술될 수 있다.
본 명세서에 설명된 개선된 작용성은 임의의 CRISPR 효소, 예컨대 Cpf1 효소에 만들어질 수 있다. 그러나, 본 명세서에 설명된 임의의 작용기는 다수의 오솔로그로부터의 단편을 포함하는 키메라 효소를 포함하여, 다른 오솔로그로부터의 Cpf1 효소로 조작될 수 있음이 이해될 것이다.
핵산, 아미노산 및 단백질, 조절 서열, 벡터 등
본 발명은 표적 DNA 서열에 결합하는 핵산을 사용한다. 이는, 핵산이 단백질보다 생산이 훨씬 더 쉽고 더 저렴하기 때문에 유리하며, 특이성은 상동성이 구해지는 스트레치의 길이에 따라 변화될 수 있다. 다수의 핑거의 복합체 3-D 위치선정은, 예를 들어 요구되지 않는다. 용어 "폴리뉴클레오티드", "뉴클레오티드", "뉴클레오티드 서열", "핵산" 및 "올리고뉴클레오티드"는 상호교환 가능하게 사용된다. 그것들은 임의의 길이의 뉴클레오티드, 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 중 어느 하나, 또는 그의 유사체의 중합체 형태를 지칭한다. 폴리뉴클레오티드는 임의의 3차원 구조를 가질 수 있으며, 기지의 또는 미지의 임의의 기능을 수행할 수 있다. 다음은 폴리뉴클레오티드의 비제한적인 예이다: 유전자 또는 유전자 단편의 코딩 또는 비-코딩 영역, 연결 분석으로부터 정의된 유전자좌들(유전자좌), 엑손, 인트론, 전령 RNA(mRNA), 운반 RNA, 리보솜 RNA, 짧은 간섭 RNA(siRNA), 짧은 헤어핀 RNA(shRNA), 마이크로-RNA(miRNA), 리보자임, cDNA, 재조합 폴리뉴클레오티드, 분지형 폴리뉴클레오티드, 플라스미드, 벡터, 임의의 서열의 분리된 DNA, 임의의 서열의 분리된 RNA, 핵산 프로브 및 프라이머. 또한, 상기 용어는 합성 백본이 있는 핵산-유사 구조를 포괄하며, 예를 들어, 문헌 [Eckstein, 1991; Baserga et al., 1992; Milligan, 1993; WO 97/03211; WO 96/39154; Mata, 1997; Strauss-Soukup, 1997; 및 Samstag, 1996]을 참조한다. 폴리뉴클레오티드는 하나 이상의 변형된 뉴클레오티드, 예를 들어, 메틸화 뉴클레오티드 및 뉴클레오티드 유사체를 포함할 수 있다. 뉴클레오티드 구조에 대한 변형이 존재한다면, 중합체의 조립 전에 또는 후에 부여될 수 있다. 뉴클레오티드의 서열은 비뉴클레오티드 성분에 의해 단속될 수 있다. 폴리뉴클레오티드는 중합 후에, 예를 들어, 표지화 성분과의 컨쥬게이션에 의해 추가로 변형될 수 있다. 본 명세서에 사용되는 바와 같이, 용어 "야생형"은 해당 분야의 숙련자에 의해 이해되는 해당 분야의 용어이며, 그것이 돌연변이체 또는 변이체로부터 구별되는 정도로 천연에서 발생하는 것과 같은 통상적인 형태의 유기체, 균주, 유전자 또는 특징을 의미한다. "야생형"은 기준선일 수 있다. 본 명세서에 사용되는 바와 같이, 용어 "변이체"는 천연에서 발생하는 것에서 벗어난 패턴을 갖는 특질의 표현을 의미하는 것으로 이해해야 한다. 용어 "비-천연 발생" 또는 "조작된"은 상호교환 가능하게 사용되며, 인간의 손의 개입을 나타낸다. 상기 용어는 핵산 분자 또는 폴리펩티드에 대하여 언급되는 경우, 핵산 분자 또는 폴리펩티드에 그들이 천연에서 천연적으로 회합되어 있고, 천연에서 관찰되는 적어도 하나의 다른 성분이 적어도 실질적으로 없음을 의미한다. "상보성"은 통상의 왓슨-크릭 염기쌍 형성 또는 기타 비-통상적 유형에 의해 다른 핵산 서열과 수소 결합(들)을 형성하는 핵산의 능력을 지칭한다. 상보성 백분율은 제2 핵산 서열과 수소 결합(예를 들어, 왓슨-크릭 염기쌍 형성)을 형성할 수 있는 핵산 분자 내의 잔기의 백분율을 나타낸다(예를 들어, 10 개 중 5, 6, 7, 8, 9, 10 개는 50%, 60%, 70%, 80%, 90% 및 100% 상보성임). "완전한 상보성"은 핵산 서열의 모든 연속 잔기가 동일한 수의 제2 핵산 서열 내의 연속 잔기와 수소 결합할 것임을 의미한다. 본 명세서에 사용되는 바와 같이, "실질적인 상보성"은 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50 개 이상의 뉴클레오티드의 영역에 걸쳐 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% 또는 100%인 상보성 정도를 지칭하거나, 엄격한 조건 하에서 혼성화하는 2 개의 핵산을 지칭한다. 본 명세서에 사용되는 바와 같이, 혼성화를 위한 "엄격한 조건"은 표적 서열에 대하여 상보성을 갖는 핵산 서열이 대개 표적 서열과 혼성화하며, 비-표적 서열에는 실질적으로 혼성화하지 않는 조건을 지칭한다. 엄격한 조건은 일반적으로 서열-의존적이며, 다수의 요인에 따라 달라진다. 일반적으로, 서열이 길수록, 서열이 그의 표적 서열에 특이적으로 혼성화하는 온도가 더 높아진다. 엄격한 조건의 비제한적인 예는 문헌[Tijssen (1993), Laboratory Techniques In Biochemistry And Molecular Biology-Hybridization With Nucleic Acid Probes Part I, Second Chapter "Overview of principles of hybridization and the strategy of nucleic acid probe assay", Elsevier, N.Y]에 상세히 기재되어 있다. 폴리뉴클레오티드 서열이 언급될 때, 상보성 또는 부분 상보성 서열도 생각된다. 이들은 바람직하게 높은 엄격성 조건하에 기준 서열에 혼성화할 수 있다. 일반적으로, 혼성화 속도를 최대화하기 위해서, 상대적으로 낮은 엄격성 혼성화 조건이 선택된다: 열 융점(Tm)보다 약 20 내지 25℃ 낮은 온도. Tm은 특정 표적 서열의 50%가 규정된 이온 세기와 pH에서 용액 중에서 완전히 상보성인 프로브와 혼성화하는 온도이다. 일반적으로, 혼성화된 서열의 적어도 약 85%의 뉴클레오티드 상보성을 요구하기 위해서, 높은 엄격성 세척 조건은 Tm보다 약 5 내지 15℃ 낮도록 선택된다. 혼성화된 서열의 적어도 약 70%의 뉴클레오티드 상보성을 요구하기 위해서, 중등의 엄격성 세척 조건은 Tm보다 약 15 내지 30℃ 낮도록 선택된다. 아주 관대한(매우 낮은 엄격성) 세척 조건은 Tm보다 50℃ 정도 낮을 수 있으며, 이것은 혼성화된 서열들 간에 높은 수준의 미스매칭을 허용한다. 해당 분야의 숙련자는 표적 서열과 프로브 서열 간 상동성의 특정 수준으로부터 검출 가능한 혼성화 신호의 결과에 영향을 미치기 위해서 혼성화 및 세척 단계에서 다른 물리화학적 변수들도 변경될 수 있다는 것을 인정할 것이다. 바람직한 높은 엄격성 조건은 42℃에서 50% 포름아미드, 5×SSC, 및 1% SDS 인큐베이션, 또는 65℃에서 5×SSC 및 1% SDS 인큐베이션과 65℃에서 0.2×SSC 및 0.1% SDS 세척을 포함한다. "혼성화"는 하나 이상의 폴리뉴클레오티드가 반응하여, 복합체를 형성하고, 이 복합체는 뉴클레오티드 잔기의 염기 사이의 수소 결합을 통해 안정화되는 반응을 지칭한다. 수소 결합은 왓슨 크릭 염기쌍 형성, 훅스타인 결합 또는 임의의 다른 서열 특이적 방식으로 발생할 수 있다. 복합체는 이중나선 구조를 형성하는 2 개의 가닥, 다중 가닥 복합체를 형성하는 3 개 이상의 가닥, 단일의 자가 혼성화 가닥 또는 이들의 임의의 조합을 포함할 수 있다. 혼성화 반응은 PCR의 개시 또는 효소에 의한 폴리뉴클레오티드의 절단과 같은 보다 광범위한 과정에서 하나의 단계를 이룰 수 있다. 주어진 서열과 혼성화할 수 있는 서열은 주어진 서열의 "상보물"로 지칭된다. 본 명세서에서 사용된 용어 "게놈 유전자좌" 또는 "유전자좌"(복수의 유전자좌)는 염색체에서 유전자 또는 DNA 서열의 특정 위치이다. "유전자"는 유기체에서 활동하는 기능적 역할을 가진 RNA 사슬 또는 폴리펩티드를 인코딩하는 DNA 또는 RNA의 스트레치로서, 이에 따라, 살아있는 유기체에서 유전의 분자 단위를 말한다. 본 발명의 목적을 위해서, 유전자는 이러한 조절 서열이 코딩 서열 및/또는 전사된 서열에 인접하든 아니든 유전자 산물의 생성을 조절하는 영역을 포함하는 것으로 간주될 수 있다. 따라서, 반드시 제한되는 것은 아니지만, 유전자는 프로모터 서열, 종결자, 리보솜 결합 부위 및 내부 리보솜 진입 부위와 같은 번역 조절 서열, 인핸서, 사일런서, 인슐레이터, 경계 요소, 복제 원점, 매트릭스 부착 부위 및 유전자좌 조절 영역을 포함한다. 본 명세서에서 사용된 "게놈 유전자좌의 발현" 또는 "유전자 발현"은 유전자로부터의 정보가 기능적 유전자 산물의 합성에서 사용되는 과정이다. 유전자 발현의 산물은 주로 단백질이지만, rRNA 유전자 또는 tRNA 유전자와 같은 비-단백질 코딩 유전자에서는 이 산물은 기능적 RNA이다. 유전자 발현 과정은 생존을 위한 기능적 산물들을 생성하기 위해서 모든 알려진 생명체, 즉 진핵생물(다세포 유기체 포함), 원핵생물(박테리아 및 고세균) 및 바이러스에 의해서 사용된다. 본 명세서에서 사용된 유전자 또는 핵산의 "발현"은 세포 유전자 발현뿐만 아니라 클로닝 시스템 및 임의의 다른 맥락에서 핵산(들)의 전사 및 번역을 포괄한다. 본 명세서에서 사용된 "발현"은 또한 폴리뉴클레오티드가 DNA 주형으로부터(예컨대, mRNA 또는 다른 RNA 전사물로) 전사되는 과정 및/또는 전사된 mRNA가 이어서 펩티드, 폴리펩티드, 또는 단백질로 번역되는 과정을 말한다. 전사물 및 인코딩된 폴리펩티드는 집합적으로 "유전자 산물"이라고 언급될 수 있다. 폴리뉴클레오티드가 게놈 DNA로부터 유래된다면, 발현은 진핵 세포에서 mRNA의 스플라이싱을 포함할 수 있다. 용어 "폴리펩티드", "펩티드" 및 "단백질"은 본 명세서에서 임의의 길이의 아미노산의 중합체를 지칭하기 위해 상호교환 가능하게 사용된다. 중합체는 선형 또는 분지형일 수 있으며, 그것은 변형된 아미노산을 포함할 수 있고, 그것은 비-아미노산에 의해 단속될 수 있다. 또한, 상기 용어는 변형된 아미노산 중합체; 예를 들어, 이황화 결합 형성, 글리코실화, 지질화(lipidation), 아세틸화, 인산화 또는 임의의 기타 조작, 예를 들어, 표지화 성분과의 컨쥬게이션을 포함한다. 본 명세서에서 사용되는 바와 같이, 용어 "아미노산"은 글리신 및 D 또는 L 광학 이성질체 및 아미노산 유사체 및 펩티드모방체를 포함하는 천연 및/또는 비천연 또는 합성 아미노산을 포함한다. 본 명세서에서 사용된 용어 "도메인" 또는 "단백질 도메인"은 단백질 사슬의 나머지 부분과 독립적으로 존재하며 기능할 수 있는 단백질 서열의 일부를 말한다. 본 발명의 양태들에서 설명된 대로, 서열 동일성은 서열 상동성과 연관된다. 상동성 비교는 눈으로, 또는 더 일반적으로는 쉽게 이용 가능한 서열 비교 프로그램의 도움으로 수행될 수 있다. 이들 상업적으로 이용 가능한 컴퓨터 프로그램은 둘 이상의 서열 사이의 상동성 백분율(%)을 계산할 수 있고, 또한 둘 이상의 아미노산 또는 핵산 서열에 의해서 공유된 서열 동일성을 계산할 수 있다.
본 발명의 일 양태에서, 용어 "가이드 RNA"는 추정 또는 확인된 crRNA 서열 또는 가이드 서열을 포함하는 폴리뉴클레오티드 서열을 지칭한다.
본 명세서에 사용되는 바와 같이, 용어 "야생형"은 당업자에 의해 이해되는 당업계의 용어이며, 이것이 돌연변이체 또는 변이체 형태로부터 구별되는 정도로 천연에서 발생하는 것과 같은 통상적인 형태의 유기체, 균주, 유전자 또는 특징을 의미한다. "야생형"은 기준선일 수 있다.
본 명세서에 사용되는 바와 같이, 용어 "변이체"는 천연에서 발생하는 것에서 벗어난 패턴을 갖는 특질의 표현을 의미하는 것으로 이해되어야 한다.
용어 "비-천연 발생" 또는 "조작된"은 상호교환 가능하게 사용되며, 인간의 손의 개입을 나타낸다. 상기 용어는 핵산 분자 또는 폴리펩티드에 대하여 말하는 경우, 핵산 분자 또는 폴리펩티드에 이들이 천연에서 천연적으로 회합되어 있고, 천연에서 관찰되는 적어도 하나의 기타 다른 성분이 적어도 실질적으로 없음을 의미한다. 모든 양태 및 구현예에서, 이들 용어가 포함되는지 아닌지의 여부에 관계없이, 바람직하게는 이는 선택적일 수 있으며, 이에 따라 바람직하게는 포함되거나 또는 바람직하게는 포함되지 않을 수 있는 것으로 이해될 것이다. 추가로, 용어 "비-천연 발생" 및 "조작된"은 상호교환 가능하게 사용될 수 있으며, 따라서 단독으로 또는 조합되어 사용될 수 있고 하나 또는 다른 것들이 함께 언급된 것들을 대체할 수 있다. 특히, "비-천연 발생" 또는 "비-천연 발생 및/또는 조작된" 대신에 "조작된"이 바람직하다.
서열 상동성은 본 분야에 알려진 다수의 컴퓨터 프로그램, 예를 들어 BLAST 또는 FASTA 등의 임의의 것에 의해서 생성될 수 있다. 이러한 정렬을 수행하기 위한 적합한 컴퓨터 프로그램은 GCG 위스콘신 베스트핏(Wisconsin Bestfit) 패키지이다(University of Wisconsin, U.S.A; 문헌[Devereux et al., 1984, Nucleic Acids Research 12:387]). 서열 비교를 수행할 수 있는 다른 소프트웨어의 예들은, 이로 제한되지는 않지만 BLAST 패키지 (상기 문헌[Ausubel et al., 1999] - 18장 참조), FASTA (문헌[Atschul et al., 1990, J. Mol. Biol., 403-410]) 및 GENEWORKS 비교 도구 묶음을 포함한다. BLAST와 FASTA는 모두 오프라인과 온라인 검색을 위해 이용할 수 있다(상기 문헌[Ausubel et al., 1999], 페이지 7-58 내지 7-60 참조). 그러나, GCG 베스트핏 프로그램을 사용하는 것이 바람직하다. 서열 상동성 백분율(%)은 연속 서열에 걸쳐서 계산될 수 있는데, 즉 하나의 서열이 다른 서열과 정렬되고, 하나의 서열에서 각 아미노산 또는 뉴클레오티드가 다른 서열에서 상응하는 아미노산 또는 뉴클레오티드와 한번에 하나의 잔기씩 직접 비교된다. 이것은 "비갭"(ungapped) 정렬이라고 불린다. 통상적으로, 이러한 비갭 정렬은 상대적으로 짧은 수의 잔기에 걸쳐서만 수행된다. 이것은 매우 간단하고 일관된 방법이지만, 예를 들어 다른 동일한 쌍의 서열에서, 하나의 삽입 또는 결실이 이후의 아미노산 잔기를 정렬되지 않도록 할 수 있다는 것을 고려하지 않으므로, 전반적 정렬이 수행될 때는 잠재적으로 상동성%에 상당한 감소가 있게 된다. 결론적으로, 대부분의 서열 비교 방법은 전체 상동성 또는 동일성 점수에 과도한 패널티 부과 없이 가능한 삽입과 결실을 고려하는 최적 정렬을 생성하도록 설계된다. 이것은 국소 상동성 또는 동일성을 최대화하도록 시도하도록 서열 정렬에 "갭"을 삽입함으로써 달성된다. 그러나, 이런 더 복잡한 방법은 정렬에서 발생한 각 갭에 "갭 패널티"를 배정하며, 이로써 동일한 수의 동일한 아미노산에 대해, 가능한 적은 갭을 가진 서열 정렬 - 비교된 두 서열 간의 더 높은 연관성 반영 - 이 많은 갭을 가진 것보다 더 높은 점수를 달성할 수 있다. "친화성 갭 점수"가 통상적으로 사용되는데, 이것은 갭의 존재에는 상대적으로 높은 점수를 매기고, 갭의 각 연속 잔기에는 더 적은 패널티를 매긴다. 이것은 가장 흔히 사용되는 갭 점수배정 시스템이다. 높은 갭 패널티는 당연히 갭이 적을수록 최적화된 정렬을 생성할 수 있다. 대부분의 정렬 프로그램은 갭 패널티의 변형을 허용한다. 그러나, 서열 비교에 이러한 소프트웨어를 사용할 때 디폴트 값을 사용하는 것이 바람직하다. 예를 들어, GCG 위스콘신 베스트핏 패키지를 사용할 때, 아미노산 서열에 대한 디폴트 갭 패널티는 갭에 대해 -12 및 각 연장에 대해 -4이다. 따라서, 최대 상동성%의 계산은 먼저 갭 패널티를 고려한 최적 정렬의 생성을 요구한다. 이러한 정렬을 수행하기 위한 적합한 컴퓨터 프로그램은 GCG 위스콘신 베스트핏 패키지이다(문헌[Devereux et al., 1984 Nuc. Acids Research 12 p387]). 서열 비교를 수행할 수 있는 다른 소프트웨어의 예들은, 이로 제한되지는 않지만, BLAST 패키지(문헌[Ausubel et al., 1999 Short Protocols in Molecular Biology, 4th Ed. Chapter 18] 참조), FASTA(문헌[Altschul et al., 1990 J. Mol. Biol. 403-410]) 및 GENEWORKS 비교 도구 묶음을 포함한다. BLAST와 FASTA는 모두 오프라인과 온라인 검색으로 이용할 수 있다(문헌[Ausubel et al., 1999, Short Protocols in Molecular Biology, pages 7-58 to 7-60] 참조). 그러나, 일부 응용에는, GCG 베스트핏 프로그램을 사용하는 것이 바람직하다. BLAST 2 서열이라고 불리는 새로운 도구도 단백질 및 뉴클레오티드 서열을 비교하는데 이용할 수 있다 (문헌[FEMS Microbiol Lett. 1999 174(2): 247-50]; 문헌[FEMS Microbiol Lett. 1999 177(1): 187-8] 및 National Institutes for Health 웹사이트에서 National Center for Biotechnology 웹사이트 참조). 최종 상동성%는 동일성에 관하여 측정될 수 있지만, 통상적으로 정렬 과정 자체는 양단간의 쌍 비교에 기초하지 않는다. 대신, 축척된 유사성 점수 행렬이 일반적으로 사용되는데, 이것은 화학적 유사성 또는 진화적 거리에 기초하여 각 쌍-방식 비교에 점수를 배정한다. 흔히 사용되는 이러한 행렬의 예는 BLOSUM62 행렬로서, 이것은 BLAST 프로그램 묶음의 디폴트 행렬이다. GCG 위스콘신 프로그램은 일반적으로 공개된 디폴트 값이나 제공되는 경우에는 사용자 지정 기호 비교표(추가의 상세한 설명을 위해 사용자 매뉴얼 참조)를 사용한다. 일부 응용에는, GCG 패키지에 대한 공개된 디폴트 값을 사용하거나, 또는 다른 소프트웨어의 경우에는 BLOSUM62와 같은 디폴트 행렬을 사용하는 것이 바람직하다. 대안적으로, 상동성 백분율은 CLUSTAL과 유사한 알고리즘에 기초한, DNASIS™ (Hitachi Software)의 다중 정렬 특징을 사용하여 계산될 수 있다(문헌[Higgins DG & Sharp PM (1988), Gene 73(1), 237-244]). 일단 소프트웨어가 최적 정렬을 생성하면, 상동성%, 바람직하게는 서열 동일성%를 계산하는 것이 가능하다. 이 소프트웨어는 통상적으로 서열 비교의 일부로서 이것을 행하고, 수치 결과를 생성한다. 서열은 또한 침묵성 변화를 생성하여 기능적으로 동등한 물질을 야기하는 아미노산 잔기의 결실, 삽입 또는 치환을 가질 수 있다. 아미노산 특성 (예컨대, 잔기의 극성, 전하, 용해성, 소수성, 친수성 및/또는 양친매성)의 유사성을 기초로 의도적인 아미노산 치환이 만들어질 수 있으며, 따라서 작용기에 있어서 아미노산을 함께 그룹화하는데 유용하다. 아미노산은 그것의 측쇄만의 특성에 기초하여 그룹화될 수 있다. 그러나, 돌연변이 데이터를 포함하는 것도 역시 더 유용하다. 이렇게 유도된 아미노산 세트는 구조적 이유로 보존될 수 있다. 이들 세트는 벤다이어그램의 형태로 설명될 수 있다(문헌[Livingstone C.D. and Barton G.J. (1993) "Protein sequence alignments: a strategy for the hierarchical analysis of residue conservation" Comput. Appl. Biosci. 9: 745-756])(문헌[Taylor W.R. (1986) "The classification of amino acid conservation" J. Theor. Biol. 119; 205-218]). 보존적 치환은, 예를 들어 일반적으로 용인된 벤다이어그램 아미노산 그룹화를 설명한 아래 표에 따라서 이루어질 수 있다.
Figure pat00020
용어 "대상체", "개인", 및 "환자"는 본 명세서에서 상호교환 가능하게 사용되어 척추동물, 바람직하게는 포유동물, 더 바람직하게는 인간을 지칭한다. 포유동물은 이로 제한되지는 않지만 뮤린, 유인원, 인간, 농장 동물, 경기용 동물, 및 반려동물을 포함한다. 생체 내에서 수득된 또는 시험관 내에서 배양된 생물학적 개체의 조직, 세포 및 이들의 자손 또한 포함된다.
용어 "치료제", "치료 가능제" 또는 "처리제"는 상호교환 가능하게 사용되며, 대상체로의 투여에 몇 가지 유익한 효과를 부여하는 분자 또는 화합물을 지칭한다. 유익한 효과는 진단 결정의 가능화; 질병, 증상, 장애, 또는 병리학적 질환의 개선; 질병, 증상, 장애 또는 질환의 개시의 감소 또는 예방; 및 일반적으로 질병, 증상, 장애 또는 병리학적 질환의 대응을 포함한다.
본 명세서에서 사용된 바와 같이, "치료" 또는 "치료하는" 또는 "완화" 또는 "개선하는"은 상호교환 가능하게 사용된다. 이들 용어는 이로 제한되지는 않지만 치료 이익 및/또는 예방 이익을 포함하는, 유익하거나 원하는 결과를 수득하기 위한 접근을 지칭한다. 치료적 이익이라 함은, 치료 하에 있는 하나 이상의 질병, 질환, 또는 증상에서의 임의의 치료 관련 개선 또는 이에 대한 효과를 의미한다. 예방적 이익을 위해, 조성물은 특정 질병, 질환, 또는 증상 발전의 위험에 있는 대상체에, 또는 질병, 질환, 또는 증상이 아직 표명되지 않을 수 있다 하더라도 질병의 하나 이상의 생리학적 증상이 보고되는 대상체에게 투여될 수 있다.
용어 "유효량" 또는 "치료적 유효량"은 유익하거나 원하는 결과를 발생시키기에 충분한 제제의 양을 지칭한다. 치료적 유효량은, 치료될 대상체 및 질병 상태, 대상체의 체중 및 연령, 질병 상태의 심각도, 투여 방법 등 중 하나 이상에 따라 달라질 수 있으며, 이는 당업자에 의해 쉽게 결정될 수 있다. 용어는 또한 본 명세서에서 기재된 임의의 하나의 이미지화 방법에 의한 검출을 위한 이미지를 제공할 용량에 적용된다. 특정 용량은, 선택된 특정 제제, 이후 따르는 투약 섭생, 기타 다른 화합물과 조합되어 투여되는지의 여부, 투여 타이밍, 영상화될 조직, 및 용량이 운반되는 물리적 전달 시스템 중 하나 이상에 따라 달라질 수 있다.
본 발명의 일부 양태는 하나 이상의 벡터를 포함하는 벡터 시스템, 또는 이러한 벡터에 관한 것이다. 벡터는 원핵 또는 진핵 세포에서 CRISPR 전사물(예를 들어, 핵산 전사물, 단백질,또는 효소)의 발현을 위해 설계될 수 있다. 예를 들어, CRISPR 전사물은 박테리아 세포, 예컨대 에스케리키아 콜라이, 곤충 세포(배큘로바이러스 발현 벡터 사용), 효모 세포,또는 포유동물 세포에서 발현될 수 있다. 적합한 숙주 세포는 문헌[Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990)]에 추가로 논의되어 있다. 대안적으로, 재조합 발현 벡터는, 예를 들어 T7 프로모터 조절 서열 및 T7 중합효소를 사용하여 시험관 내에서 전사되고 번역될 수 있다.
본 발명의 구현예는, 아미노산의 경우 유사한 것으로의 치환, 예컨대 염기성을 염기성으로, 산성을 산성으로, 극성을 극성으로 등등의 치환을 일으킬 수 있는 상동성 치환(치환 및 대체는 모두 본 명세서에서 기존 아미노산 잔기 또는 뉴클레오티드의 대안적인 잔기 또는 뉴클레오티드로의 교환을 의미하도록 사용됨)을 포함할 수 있는 서열(폴리뉴클레오티드 또는 폴리펩티드 모두)을 포함한다. 비-상동성 치환, 즉 한 부류의 잔기로부터 다른 부류의 잔기로의 치환, 또는 대안적으로 오르니틴(이후 Z로 언급), 디아미노부티르산 오르니틴(이후 B로 언급), 노르류신 오르니틴(이후 O로 언급), 피리일알라닌, 티에닐알라닌, 나프틸알라닌 및 페닐글리신과 같은 비천연 아미노산의 포함을 수반하는 치환이 일어날 수 있다. 변이체 아미노산 서열은 글리신 또는 β-알라닌 잔기와 같은 아미노산 스페이서에 더하여 메틸, 에틸 또는 프로필기와 같은 알킬기를 포함하는 서열의 임의의 두 아미노산 잔기 사이에 삽입될 수 있는 적합한 스페이서 기를 포함할 수 있다. 펩토이드 형태로 하나 이상의 아미노산 잔기의 존재를 포함하는 추가의 형태의 변형도 해당 분야의 숙련자에게 잘 이해될 수 있다. 의심을 피하기 위해서, "펩토이드 형태"는 α-탄소 치환기가 α-탄소가 아니라 잔기의 질소 원자에 존재하는 변이체 아미노산 잔기를 말하기 위해서 사용된다. 펩토이드 형태로 펩티드를 제조하는 과정은 해당 분야에, 예를 들어 문헌[Simon RJ et al., PNAS (1992) 89(20), 9367-9371] 및 문헌[Horwell DC, Trends Biotechnol. (1995) 13(4), 132-134]에 공지되어 있다.
상동성 모델링: 다른 Cpf1 오솔로그에서의 해당 잔기는 문헌 [Zhang et al., 2012 (Nature; 490(7421): 556-60) and Chen et al., 2015 (PLoS Comput Biol; 11(5): e1004248)]의 방법 - 도메인-모티프 계면에 의해 매개된 상호작용을 예측하는 계산상 단백질-단백질 상호작용 (PPI) 방법에 의해 확인될 수 있다. PrePPI(예측 PPI)는 구조 기준 PPI 예측 방법으로, 베이지안(Bayesian) 통계 프레임워크를 이용하여 비-구조적 증거와 구조적 증거를 조합한다. 이 방법은 문의되는 단백질의 쌍을 취하고, 구조적 정렬을 이용하여 그의 실험적으로 결정된 구조 또는 상동성 모델 중 어느 하나에 상응하는 구조적 대표물을 확인하는 것을 포함한다. 구조적 정렬은 전반적인 및 국소의 기하 관계를 고려함으로써 가까운 구조적 이웃 및 먼 구조적 이웃 모두를 확인하는데 추가로 사용된다. 구조적 대표물의 두 이웃이 단백질 데이터 뱅크에 보고된 복합체를 형성할 때마다, 이는 두 개의 문의되는 단백질 사이의 상호작용을 모델링하기 위한 주형을 정의한다. 복합체의 모델은 대표 구조물을 주형 내에서 그의 상응하는 구조적 이웃에 겹쳐놓음으로써 창출된다. 이러한 접근은 문헌[Dey et al., 2013 (Prot Sci; 22: 359-66)]에 추가로 기재되어 있다.
본 발명의 목적을 위하여, 증폭은 타당한 충실도로 표적 서열을 복제할 수 있는 폴리머라제 및 프라이머를 사용하는 임의의 방법을 의미한다. 증폭은 천연 또는 재조합 DNA 폴리머라제, 예를 들어, TaqGold™, T7 DNA 폴리머라제, 대장균(에스케리키아 콜라이) DNA 폴리머라제의 클레나우(Klenow) 단편 및 역전사효소에 의해 수행될 수 있다. 바람직한 증폭 방법은 PCR이다.
본 발명의 양태는 가이드 RNA 및 (선택적으로 변형된 또는 돌연변이된) CRISPR 효소(예를 들어, Cpf1)에 대한 비시스트로닉(bicistronic) 벡터에 관한 것이다. 가이드 RNA 및 (선택적으로 변형된 또는 돌연변이된) CRISPR 효소에 대한 비시스트로닉 발현 벡터가 바람직하다. 일반적으로 그리고 특히 이 구현예에서, (선택적으로 변형된 또는 돌연변이된) CRISPR 효소는 바람직하게 CBh 프로모터에 의해서 유도된다. RNA는 바람직하게 Pol III 프로모터, 예를 들어, U6 프로모터에 의해 유도된다. 이상적으로 2 개가 조합된다.
일부 구현예에서, 가이드 RNA에서 루프가 제공된다. 이는 스템 루프 도는 테트라 루프일 수 있다. 이 루프는 바람직하게 GAAA이지만, 이 서열에만 제한되는 것은 아니며, 또는 실제로 단지 4 bp 길이에만 제한되는 것도 아니다. 실제로, 헤어핀 구조에서 사용하기 위한 바람직한 루프 형성 서열은 4 개 뉴클레오티드 길이이고, 가장 바람직하게 서열 GAAA를 가진다. 그러나, 더 길거나 짧은 루프 서열도 사용될 수 있으며, 대안적인 서열도 사용될 수 있다. 서열은 바람직하게 뉴클레오티드 트리플렛(예를 들어, AAA), 및 추가의 뉴클레오티드(예를 들어, C 또는 G)를 포함한다. 루프 형성 서열의 예들은 CAAA 및 AAAG를 포함한다. 본 명세서에 개시된 임의의 방법을 실시하는데 있어서, 적합한 벡터가, 이로 제한되지는 않지만, 미세주입, 전기천공, 소노포레이션(sonoporation), 바이오리스틱스, 칼슘 포스페이트-매개 트랜스펙션, 양이온 트랜스펙션, 리포좀 트랜스펙션, 덴드리머 트랜스펙션, 열 충격 트랜스펙션, 뉴클레오펙션 트랜스펙션, 마그네토펙션, 리포펙션, 임페일펙션, 광학 트랜스펙션, 핵산의 전용 제제-증진 흡수, 및 리포좀, 면역리포좀, 비로좀 또는 인공 비리온을 통한 전달을 포함하는 해당 분야에 알려진 하나 이상의 방법을 통해서 세포 또는 배아에 도입될 수 있다. 일부 방법에서, 벡터는 미세주입에 의해서 배아에 도입될 수 있다. 벡터 또는 벡터들은 배아의 핵 또는 세포질에 미세주입될 수 있다. 일부 방법에서, 벡터 또는 벡터들은 뉴클레오펙션에 의해서 세포 내로 도입될 수 있다.
벡터는 원핵 또는 진핵 세포에서 CRISPR 전사물(예를 들어, 핵산 전사물, 단백질 또는 효소)의 발현을 위해 설계될 수 있다. 예를 들어, CRISPR 전사물은 박테리아 세포, 예컨대 대장균, 곤충 세포(배큘로바이러스 발현 벡터 사용), 효모 세포 또는 포유류 세포에서 발현될 수 있다. 적절한 숙주 세포는 문헌[Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990)]에 추가로 논의되어 있다. 대안적으로, 재조합 발현 벡터는 예를 들어, T7 프로모터 조절 서열 및 T7 폴리머라제를 사용하여 시험관내에서 전사되고 번역될 수 있다.
벡터는 원핵생물, 또는 원핵 세포에 도입되고, 그에서 증식될 수 있다. 일부 구현예에서, 원핵생물은 진핵 세포로 도입될 벡터 또는 진핵 세포로 도입되는 벡터의 생성에서 중간체 벡터(예를 들어, 바이러스 벡터 패키징 시스템의 일부로서 플라스미드 증폭)로서 벡터의 복사(copy)를 증폭시키기 위해서 사용된다. 일부 구현예에서, 원핵생물은 벡터의 복사를 증폭시키고, 하나 이상의 핵산을 발현하기 위해, 예를 들어, 숙주 세포 또는 숙주 생물로의 전달을 위한 하나 이상의 단백질의 공급원을 제공하기 위해 사용된다. 원핵생물에서의 단백질의 발현은 종종 융합 또는 비-융합 단백질 중 어느 하나의 발현을 유도하는 구성성 또는 유도성 프로모터를 함유하는 벡터를 사용하여 대장균에서 실시된다. 융합 벡터는 거기에서 인코딩된 단백질에, 예컨대 재조합 단백질의 아미노 말단에 수많은 아미노산을 부가한다. 이러한 융합 벡터는 다음과 같은 하나 이상의 목적을 제공할 수 있다: (i) 재조합 단백질의 발현의 증가; (ii) 재조합 단백질의 용해도의 증가; 및 (iii) 친화성 정제에서 리간드로 작용함으로써 재조합 단백질의 정제의 보조. 종종, 융합 발현 벡터에서, 단백질분해 절단 부위는 융합 모이어티와 재조합 단백질의 연접부에 도입되어, 융합 단백질의 정제 이후에 융합 모이어티로부터 재조합 단백질의 분리를 가능하게 한다. 이러한 효소 및 그들의 동족 인식 서열은 인자 Xa, 트롬빈 및 엔테로키나아제를 포함한다. 예시적인 융합 발현 벡터는 pGEX(파마시아 바이오테크 인코포레이티드(Pharmacia Biotech Inc); 문헌[Smith and Johnson, 1988. Gene 67: 31-40]), pMAL(미국 매사추세츠주 비벌리 소재의 뉴 잉글랜드 바이오랩스(New England Biolabs)) 및 pRIT5(미국 뉴저지주 피스카타웨이 소재의 파마시아(Pharmacia))를 포함하며, 이는 각각 글루타티온 S-트랜스퍼라제(GST), 말토스 E 결합 단백질 또는 단백질 A를 표적 재조합 단백질에 융합시킨다. 적절한 유도성 비-융합 대장균 발현 벡터의 예는 pTrc(문헌[Amrann et al., (1988) Gene 69:301-315]) 및 pET 11d(문헌[Studier et al., GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990) 60-89])를 포함한다. 일부 구현예에서, 벡터는 효모 발현 벡터이다. 효모 사카로마이세스 세레비시에(Saccharomyces cerevisiae)에서의 발현을 위한 벡터의 예에는 pYepSec1(문헌[Baldari, et al., 1987. EMBO J. 6: 229-234]), pMFa(문헌[Kuijan and Herskowitz, 1982. Cell 30: 933-943]), pJRY88(문헌[Schultz et al., 1987. Gene 54: 113-123]), pYES2(미국 캘리포니아주 샌 디에고 소재의 인비트로겐 코포레이션) 및 picZ(미국 캘리포니아주 샌 디에고 소재의 인비트로겐 코포레이션)가 포함된다. 일부 구현예에서, 벡터는 배큘로바이러스 발현 벡터를 사용하여 곤충 세포에서 단백질 발현을 유도한다. 배양된 곤충 세포 (예를 들어, SF9 세포)에서 단백질의 발현에 이용 가능한 배큘로바이러스 벡터는 pAc 시리즈(문헌[Smith, et al., 1983. Mol. Cell. Biol. 3: 2156-2165]) 및 pVL 시리즈(문헌[Lucklow and Summers, 1989. Virology 170: 31-39])를 포함한다.
일부 구현예에서, 벡터는 포유 동물 발현 벡터를 사용하여 포유 동물 세포에서 하나 이상의 서열의 발현을 유도할 수 있다. 포유 동물 발현 벡터의 예는 pCDM8(문헌[Seed, 1987. Nature 329: 840]) 및 pMT2PC(문헌[Kaufman, et al., 1987. EMBO J. 6: 187-195])를 포함한다. 포유 동물 세포에서 사용되는 경우, 발현 벡터의 제어 작용은 통상적으로 하나 이상의 조절 요소에 의해 제공된다. 예를 들어, 통상적으로 사용되는 프로모터는 폴리오마, 아데노바이러스 2, 사이토메갈로바이러스, 유인원 바이러스 40 및 본 명세서에 개시되고 당업계에 공지되어 있는 기타의 것으로부터 유래된다. 원핵 및 진핵 세포 둘 모두를 위한 다른 적절한 발현 시스템에 대하여, 예를 들어, 문헌[Sambrook, et al., MOLECULAR CLONING: A LABORATORY MANUAL. 2nd ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989]의 16 및 17장을 참조한다.
일부 구현예에서, 재조합 포유류 발현 벡터는 특정 세포 유형에서 우선적으로 핵산의 발현을 유도할 수 있다(예를 들어, 핵산을 발현하기 위하여 조직-특이적 조절 요소가 사용됨). 조직-특이적 조절 요소는 해당 분야에 공지되어 있다. 적절한 조직-특이적 프로모터의 비제한적인 예에는 알부민 프로모터(간-특이적; 문헌[Pinkert, et al., 1987. Genes Dev. 1: 268-277]), 림프-특이적 프로모터(문헌[Calame and Eaton, 1988. Adv. Immunol. 43: 235-275]), 특히, T 세포 수용체 (문헌[Winoto and Baltimore, 1989. EMBO J. 8: 729-733]) 및 면역글로불린의 프로모터 (문헌[Baneiji, et al., 1983. Cell 33: 729-740]; 문헌[Queen and Baltimore, 1983. Cell 33: 741-748]), 뉴런-특이적 프로모터 (예를 들어, 신경섬유 프로모터; 문헌[Byrne and Ruddle, 1989. Proc. Natl. Acad. Sci. USA 86: 5473-5477]), 췌장-특이적 프로모터(문헌[Edlund, et al., 1985. Science 230: 912-916]) 및 유선-특이적 프로모터(예를 들어, 유장(milk whey) 프로모터; 미국 특허 4,873,316 및 유럽 출원 공보 264,166)가 포함된다. 발생-조절 프로모터, 예를 들어, 뮤린 hox 프로모터(문헌[Kessel and Gruss, 1990. Science 249: 374-379]) 및 α-태아단백질 프로모터(문헌[Campes and Tilghman, 1989. Genes Dev. 3: 537-546])도 또한 포함된다. 이들 원핵 및 진핵 벡터와 관련하여, 미국 특허 6,750,059가 언급되며, 그의 내용은 본 명세서에 그 전체로서 참고문헌으로 통합된다. 본 발명의 다른 구현예들은 바이러스 벡터의 사용에 관한 것일 수 있으며, 이에 관해서는 미국 특허 출원 13/092,085가 언급되며, 그의 내용은 본 명세서에 그 전체로서 참고문헌으로 통합된다. 조직-특이적 조절 요소는 해당 분야에 공지이며, 이에 관해서는 미국 특허 7,776,321이 언급되며, 그의 내용은 본 명세서에 그 전체로서 참고문헌으로 통합된다. 일부 구현예에서, 조절 요소는 CRISPR 시스템의 하나 이상의 요소에 작동 가능하게 연결되어 CRISPR 시스템의 하나 이상의 요소의 발현을 유도한다. 일반적으로, SPIDR(스페이서 산재된 직접 반복부)로도 알려져 는 CRISPR(클러스터링되고 규칙적으로 산재된 짧은 팔린드로믹 반복부)은 통상 특정 박테리아 종에 특이적인 DNA 유전자좌의 패밀리를 구성한다. CRISPR 유전자좌는 대장균에서 인식되는 별개의 부류의 산재된 짧은 서열 반복부(SSR) 및 관련 유전자를 포함한다(문헌[Ishino et al., J. Bacteriol., 169:5429-5433 [1987]]; 및 문헌[Nakata et al., J. Bacteriol., 171:3553-3556 [1989]]). 유사한 산재된 SSR이 할로페락스 메디테라네이(Haloferax mediterranei), 스트렙토코커스 피오게네스, 아나바에나(Anabaena) 및 마이코박테리움 튜베르큘로시스(Mycobacterium tuberculosis)에서 확인되었다(문헌[Groenen et al., Mol. Microbiol., 10:1057-1065 [1993]]; 문헌[Hoe et al., Emerg. Infect. Dis., 5:254-263 [1999]]; 문헌[Masepohl et al., Biochim. Biophys. Acta 1307:26-30 [1996]]; 및 문헌[Mojica et al., Mol. Microbiol., 17:85-93 [1995]] 참조). CRISPR 유전자좌는 통상적으로 SRSR(규칙적으로 산재된 짧은 반복부(short regularly spaced repeat))로 명명된 반복부의 구조가 다른 SSR과 상이하다(문헌[Janssen et al., OMICS J. Integ. Biol., 6:23-33 [2002]]; 및 문헌[Mojica et al., Mol. Microbiol., 36:244-246 [2000]]). 일반적으로, 반복부는 실질적으로 고정된 길이를 갖는 독특한 개재 서열에 의해 규칙적으로 산재된 클러스터에 존재하는 짧은 요소이다(상기 문헌[Mojica et al., [2000]]). 반복 서열이 균주들 간에 고도로 보존되어 있지만, 산재된 반복부의 수와 스페이서 영역의 서열은 통상적으로 균주마다 상이하다 (문헌[van Embden et al., J. Bacteriol., 182:2393-2401 [2000]]). CRISPR 유전자좌는 40 개가 넘는 원핵생물에서 확인되며(예를 들어, Jansen 등의 Mol. Microbiol., 43:1565-1575 [2002]; 및 Mojica 등의 [2005] 참조), 에로피룸(Aeropyrum), 피로박쿨룸(Pyrobaculum), 설포로부스(Sulfolobus), 아캐오글로부스(Archaeoglobus), 할로카르쿨라(Halocarcula), 메타노박테리움, 메타노코커스, 메타노사르시나(Methanosarcina), 메타노피루스(Methanopyrus), 피로코커스, 피크로필루스(Picrophilus), 써모플라즈마, 코리네박테리움, 마이코박테리움, 스트렙토마이세스, 아퀴펙스, 포르피로모나스, 클로로비움, 써머스(Thermus), 바실러스, 리스테리아, 스태필로코커스, 클로스트리디움, 써모언에어로박터, 마이코플라즈마, 푸소박테리움, 아자르쿠스(Azarcus), 크로모박테리움, 네이세리아, 니트로소모나스, 데술포비브리오(Desulfovibrio), 게오박터(Geobacter), 마익소코커스(Myxococcus), 캄필로박터, 올리넬라(Wolinella), 아시네토박터, 어위니아, 에스케리키아, 레지오넬라, 메틸로코커스, 파스퉤렐라(Pasteurella), 포토박테리움, 살모넬라, 크산토모나스, 여시니아, 트레포모나, 및 써모토가(Thermotoga)를 포함하지만, 이로 제한되지는 않는다.
일반적으로, 본 출원에서 사용되는 바와 같은 "핵산-표적화 시스템"은 핵산-표적화 CRISPR-회합된("Cas") 유전자(또한, 본 명세서에서 이펙터 단백질로 지칭됨)의 발현 또는 활성을 유도하는 데 수반된 기타 다른 요소 및 전사물을 종합적으로 지칭하며, 이는 핵산-표적화 Cas(이펙터) 단백질 및 가이드 RNA를 인코딩하는 서열 또는 핵산-표적화 CRISPR 유전자좌로부터의 전사물 및 기타 다른 서열을 포함한다. 일부 구현예에서, 핵산-표적화 시스템의 하나 이상의 요소는 제V형 핵산-표적화 CRISPR 시스템으로부터 유도된다. 일부 구현예에서, 핵산-표적화 시스템의 하나 이상의 요소는 내인성 핵산-표적화 CRISPR 시스템을 포함하는 특정 유기체로부터 유도된다. 일반적으로, 핵산-표적화 시스템은 표적 서열의 부위에서 핵산-표적화 복합체의 형성을 촉진하는 요소에 의해 특징지어진다. 핵산-표적화 복합체의 형성의 맥락에서, "표적 서열"은 가이드 서열이 이에 대해 상보성을 갖도록 설계되는 서열을 지칭하며, 여기서 표적 서열과 가이드 RNA 사이의 혼성화는 DNA-표적화 복합체의 형성을 촉진한다. 혼성화를 유발하고 핵산-표적화 복합체의 형성을 촉진하기에 충분한 상보성이 있다면, 완전한 상보성이 반드시 요구되지는 않는다. 표적 서열은 RNA 폴리뉴클레오티드를 포함할 수 있다. 일부 구현예에서, 표적 서열은 세포의 핵 내 또는 세포질 내에 위치된다. 일부 구현예에서, 표적 서열은 진핵 세포의 세포소기관 내, 예를 들어 미토콘드리아 또는 엽록체에 있을 수 있다. 표적 서열을 포함하는 표적화된 유전자좌 내로의 재조합을 위해 사용될 수 있는 서열 또는 주형은 "편집 주형" 또는 "편집 RNA" 또는 "편집 서열"로 지칭된다. 본 발명의 양태에서, 외인성 주형 RNA는 편집 주형으로서 지칭될 수 있다. 본 발명의 일 양태에서 재조합은 상동성 재조합이다.
통상적으로, 내인성 핵산-표적화 시스템의 맥락에서, 핵산-표적화 복합체(표적 서열에 혼성화되고, 하나 이상의 핵산-표적화 이펙터 단백질과 복합체화된 가이드 RNA를 포함함)의 형성은 표적 서열 내 또는 가까이에서(예를 들어, 이로부터 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 개 이상의 염기쌍) 하나 또는 2 개의 DNA 가닥의 절단을 초래한다. 일부 구현예에서, 핵산-표적화 시스템의 하나 이상의 요소의 발현을 유도하는 하나 이상의 벡터가 숙주 세포 내로 도입되어 핵산-표적화 시스템의 요소의 발현이 하나 이상의 표적 부위에서 핵산-표적화 복합체의 형성을 유도하도록 한다. 예를 들어, 핵산-표적화 이펙터 단백질 및 가이드 RNA는 각각 별개의 벡터 상에서 별개의 조절 요소에 작동 가능하게 연결될 수 있다. 대안적으로, 동일하거나 상이한 조절 요소로부터 발현된 둘 이상의 요소가 단일 벡터 내에 조합될 수 있으며, 핵산-표적화 시스템의 임의의 성분을 제공하는 하나 이상의 추가적인 벡터는 첫번째 벡터에 포함되지 않는다. 단일 벡터 내에서 조합되는 핵산-표적화 시스템 요소는, 예컨대 제2 요소에 대해 3'(이의 "하류") 또는 제2 요소에 대해 5'(이의 "상류)에 위치되는 하나의 요소와 같이, 임의의 적합한 배향으로 배열될 수 있다. 일 요소의 코딩 서열은 제2 요소의 코딩 서열의 동일하거나 반대의 가닥 상에 위치될 수 있거나, 동일하거나 상이한 방향으로 배향된다. 일부 구현예에서, 단일 프로모터는 하나 이상의 인트론 서열 내에 임베딩된 가이드 RNA 및 핵산-표적화 이펙터 단백질을 인코딩하는 전사물의 발현을 유도할 수 있다(예를 들어, 상이한 인트론 내에서 각각, 적어도 하나의 인트론 내에서 둘 이상, 또는 단일 인트론 내에서 모두). 일부 구현예에서, 핵산-표적화 이펙터 단백질 및 가이드 RNA는 동일한 프로모터에 작동 가능하게 연결되고 발현된다.
가이드 서열은 임의의 표적 서열을 표적화하도록 선택될 수 있다. 일부 구현예에서, 표적 서열은 유전자 전사물 또는 mRNA 내 서열이다.
일부 구현예에서, 표적 서열은 세포의 게놈 내 서열이다.
일부 구현예에서, 가이드 서열은 가이드 서열 내 이차 구조의 정도를 감소시키도록 선택된다. 이차 구조는 임의의 적합한 폴리뉴클레오티드 폴딩 알고리즘에 의해 결정될 수 있다. 일부 프로그램은 최소 깁스 자유 에너지 계산을 기반으로 한다. 이러한 한 알고리즘의 예는 mFold이며, 이는 문헌[Zuker and Stiegler, Nucleic Acids Res. 9 (1981), 133-148]에 기재된 바와 같다. 또 다른 예의 폴딩 알고리즘은, 비엔나 대학의 이론 화학 연구소에서 개발된, 중심 구조 예측 알고리즘을 사용하는, 온라인 웹서버 RNAfold이다(예를 들어, 문헌[A.R. Gruber et al., 2008, Cell 106(1): 23-24]; 및 [PA Carr and GM Church, 2009, Nature Biotechnology 27(12): 1151-62] 참조). 추가의 알고리즘은 미국 출원 일련 번호 TBA(대리인 도켓 44790.11.2022; 브로드 레퍼런스 BI-2013/004A)에서 찾을 수 있으며; 이는 본 명세서에 참고로 포함된다.
일부 구현예에서, 재조합 주형이 또한 제공된다. 재조합 주형은 본 명세서에 기재된 바와 같은 또 다른 벡터의 성분일 수 있으며, 별개의 벡터 내에 포함되거나, 별개의 폴리뉴클레오티드로서 제공될 수 있다. 일부 구현예에서, 재조합 주형은 상동성 재조합에서, 예컨대 핵산-표적화 복합체의 일부로서 핵산-표적화 이펙터 단백질에 의해 닉킹되거나 절단된 표적 서열 내에 또는 그 가까이에서 주형으로서의 역할을 하도록 설계된다. 주형 폴리뉴클레오티드는 임의의 적합한 길이를 가질 수 있으며, 예컨대 길이가 약 10, 15, 20, 25, 50, 75, 100, 150, 200, 500, 1000 개 이상의 뉴클레오티드, 또는 이를 초과할 수 있다. 일부 구현예에서, 주형 폴리뉴클레오티드는 표적 서열을 포함하는 폴리뉴클레오티드의 일부에 상보적이다. 최적으로 정렬된 경우, 주형 폴리뉴클레오티드는 표적 서열의 하나 이상의 뉴클레오티드(예를 들어, 약 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100 개 이상 또는 이를 초과하는 뉴클레오티드)와 중첩될 수 있다. 일부 구현예에서, 표적 서열 및 표적 서열을 포함하는 폴리뉴클레오티드의 경우, 표적 서열로부터 주형 폴리뉴클레오티드의 최근접 뉴클레오티드는 약 1, 5, 10, 15, 20, 25, 50, 75, 100, 200, 300, 400, 500, 1000, 5000, 10000 개 이상의 뉴클레오티드 내에 속한다.
일부 구현예에서, 핵산-표적화 이펙터 단백질은 하나 이상의 이종성 단백질 도메인(예를 들어, 핵산-표적화 이펙터 단백질에 추가적으로, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 개 이상 또는 이를 초과하는 도메인)을 포함하는 융합 단백질의 일부이다. 일부 구현예에서, CRISPR 이펙터 단백질은 하나 이상의 이종성 단백질 도메인(예를 들어, CRISPR 효소에 추가적으로, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 개 이상 또는 이를 초과하는 도메인)을 포함하는 융합 단백질의 일부이다. CRISPR 효소 융합 단백질은 임의의 추가의 단백질 서열 및 선택적으로 임의의 2 개 도메인 사이의 링커 서열을 포함할 수 있다. CRISPR 효소에 융합될 수 있는 단백질 도메인의 예는 제한 없이, 에피토프 태그, 리포터 유전자 서열 및 하기의 활성 중 하나 이상을 갖는 단백질 도메인을 포함한다: 메틸라제 활성, 데메틸라제 활성, 전사 활성화 활성, 전사 억제 활성, 전사 방출 인자 활성, 히스톤 변형 활성, RNA 절단 활성, 및 핵산 결합 활성. 에피토프 태그의 비제한적인 예는 히스티딘(His) 태그, V5 태그, FLAG 태그, 인플루엔자 헤마글루티닌(HA) 태그, Myc 태그, VSV-G 태그 및 티오레독신(Trx) 태그를 포함한다. 리포터 유전자의 예는, 이로 한정되지 않지만, 글루타티온-S-트랜스퍼라제(GST), 호스라디시(horseradish) 과산화효소(HRP), 클로람페니콜 아세틸트랜스퍼라제(CAT) 베타-갈락토시다제, 베타-글루쿠로니다제, 루시퍼라제, 녹색 형광 단백질(GFP), HcRed, DsRed, 청록색 형광 단백질(CFP), 황색 형광 단백질(YFP) 및 청색 형광 단백질(BFP)을 포함하는 자가형광 단백질을 포함한다. CRISPR 효소는 DNA 분자에 결합하거나, 이로 제한되지는 않지만, 말토스 결합 단백질(MBP), S-태그, Lex A DNA 결합 도메인(DBD) 융합물, GAL4 DNA 결합 도메인 융합물 및 단순 포진 바이러스(HSV) BP16 단백질 융합체물을 포함하는 다른 세포 분자에 결합하는 단백질 또는 단백질의 단편을 인코딩하는 유전자 서열에 융합될 수 있다. CRISPR 효소를 포함하는 융합 단백질의 부분을 형성할 수 있는 추가의 도메인은 본 명세서에 참고 문헌으로 포함되는 US20110059502에 기재되어 있다. 일부 구현예에서, 태그가 부착된 CRISPR 효소를 사용하여 표적 서열의 위치를 확인한다.
DNA/RNA 또는 DNA/DNA 또는 RNA/RNA 또는 단백질/RNA에 대한 선택사항
일부 구현예에서, CRISPR 시스템의 성분은 다양한 형태, 예컨대 DNA/RNA 또는 RNA/RNA 또는 단백질 RNA의 조합으로 전달될 수 있다. 예를 들어, Cpf1은 DNA-코딩 폴리뉴클레오티드 또는 RNA--코딩 폴리뉴클레오티드로서 또는 단백질로서 전달될 수 있다. 가이드는 DNA-코딩 폴리뉴클레오티드 또는 RNA로서 전달될 수 있다. 혼합된 형태의 전달을 포함하여, 모든 가능한 조합이 생각된다.
일부 구현예에서, 이러한 모든 조합(DNA/RNA 또는 DNA/DNA 또는 RNA/RNA 또는 단백질/RNA). 일부 구현예에서, Cpf1이 단백질 형태로 전달되는 경우, 이를 하나 이상의 가이드/들과 함께 사전-조립하는하는 것이 가능하다.
나노클루(nanoclew)
추가로, CRISPR 시스템은, 예를 들어 문헌[Sun W et al, Cocoon-like self-degradable DNA nanoclew for anticancer drug delivery., J Am Chem Soc. 2014 Oct 22;136(42):14722-5. doi: 10.1021/ja5088024. Epub 2014 Oct 13.]; 또는 [Sun W et al, Self-Assembled DNA Nanoclews for the Efficient Delivery of CRISPR-Cpf1 for Genome Editing., Angew Chem Int Ed Engl. 2015 Oct 5;54(41):12029-33. doi: 10.1002/anie.201506030. Epub 2015 Aug 27.]에 기재된 바와 같은 나노클루를 사용하여 전달될 수 있다.
본 발명의 실시는 달리 나타내지 않는 한, 당업계의 기술 내에 있는 면역학, 생화학, 화학, 분자 생물학, 미생물학, 세포 생물학, 유전체학 및 재조합 DNA의 통상의 기술을 사용한다. 문헌[Sambrook, Fritsch and Maniatis, MOLECULAR CLONING: A LABORATORY MANUAL, 2nd edition (1989)]; 문헌[CURRENT PROTOCOLS IN MOLECULAR BIOLOGY (F. M. Ausubel, et al. eds., (1987))]; 시리즈 문헌[METHODS IN ENZYMOLOGY (Academic Press, Inc.): PCR 2: A PRACTICAL APPROACH (M.J. MacPherson, B.D. Hames and G.R. Taylor eds. (1995))], 문헌[Harlow and Lane, eds. (1988) ANTIBODIES, A LABORATORY MANUAL] 및 문헌[ANIMAL CELL CULTURE (R.I. Freshney, ed. (1987))]을 참조한다.
유전적 및 후생적 조건의 모델
본 발명의 방법은, 예컨대 관심 돌연변이의 모델 또는 질병 모델을 통하여, 질병 모델로서 사용될 수 있는 식물, 동물 또는 세포를 형성하고/형성하거나 관심 유전적 또는 후생적 질환을 연구하는 데 사용될 수 있다. 본 명세서에서 사용된 바와 같이 "질병"은 대상체에서 질병, 장애 또는 징후를 지칭한다. 예를 들어, 본 발명의 방법은 질병과 연관된 하나 이상의 핵산 서열에서의 변형을 포함하는 동물 또는 세포, 또는 질병과 연관된 하나 이상의 핵산 서열의 발현이 변경된 식물, 동물 또는 세포를 만드는데 사용될 수 있다. 그러한 핵산 서열은 질병 연관 단백질 서열을 인코딩할 수 있거나, 질병 연관 제어 서열일 수 있다. 이에 따라, 본 발명의 구현예에서, 식물, 대상체, 환자, 생물 또는 세포는 비-인간 대상, 환자, 생물 또는 세포일 수 있는 것으로 이해된다. 따라서, 본 발명은 본 발명에 의해 생산된, 식물, 동물 또는 세포, 또는 그의 자손을 제공한다. 그 자손은 생산된 식물 또는 동물의 클론일 수 있거나, 추가의 바람직한 특성을 그의 자손에게 유전자 이입(introgress)하기 위해 동일 종의 다른 개체와의 교잡에 의한 유성 생식으로부터의 것일 수 있다. 세포는 다세포 생물, 특히 동물 또는 식물의 경우 생체 내 또는 생체 외일 수 있다. 세포가 배양된 경우, 적절한 배양 조건이 맞추어지고 바람직하게는 세포가 이러한 목적을 위해 적합하게 조정되는 경우 세포주가 수립될 수 있다(예를 들어, 줄기 세포). 본 발명에 의해 생산된 박테리아 세포주가 또한 고려된다. 이에 따라, 세포주 또한 고려된다.
일부 방법에서, 질병 모델은 동물 또는 세포에서 돌연변이의 효과 및 질병 연구에서 흔히 사용되는 기준을 이용하여 질병의 발생 및/또는 진전을 연구하는데 사용될 수 있다. 대안적으로, 그러한 질병 모델은 약학 활성 화합물의 질병에 대한 효과를 연구하는데 유용하다.
일부 방법에서, 질병 모델은 잠재적인 유전자 치료 전략의 효능을 평가하는데 사용될 수 있다. 즉, 질병-연관 유전자 또는 폴리뉴클레오티드는 질병 발생 및/또는 진전이 저해 또는 감소되도록 변형될 수 있다. 특히, 방법은 변경된 단백질이 생산되고, 그 결과 동물 또는 세포가 변경된 반응을 갖도록 질병 연관 유전자 또는 폴리뉴클레오티드를 변형시키는 것을 포함한다. 따라서, 일부 방법에서, 유전학적으로 변형된 동물은, 유전자 치료법 이벤트의 효과가 평가될 수 있도록, 질병이 발생되기 쉬운 동물에 비교될 수 있다.
또 다른 구현예에서, 본 발명은, 질병 유전자와 연관된 세포 신호화 이벤트를 조절하는 생물학적 활성제의 개발 방법을 제공한다. 본 방법은 하나 이상의 CRISPR 효소, 및 가이드 서열에 연결된 직접 반복부 서열의 발현을 유도하는 하나 이상의 벡터를 포함하는 세포와 시험 화합물을 접촉시키는 단계; 및 예를 들어 세포 내에 포함된 질병 유전자 내 돌연변이와 연관된 세포 신호화 이벤트의 감소 또는 증강을 나타내는 판독값에서의 변화를 검출하는 단계를 포함한다.
세포 모델 또는 동물 모델은 세포 작용 변화를 스크리닝하기 위한 본 발명의 방법과 조합되어 구축될 수 있다. 그러한 모델은 본 발명의 CRISPR 복합체에 의해 변형된 게놈 서열의 관심 세포 작용에 대한 효과를 연구하는데 사용될 수 있다. 예를 들어, 세포 작용 모델은 변형된 게놈 서열의 세포내 신호화 또는 세포외 신호화에 대한 효과를 연구하는데 사용될 수 있다. 대안적으로, 세포 작용 모델은 변형된 게놈 서열의 감각 인지에 대한 효과를 연구하는데 사용될 수 있다. 그러한 일부 모델에서, 모델 내 신호화 생화학 경로와 연관된 하나 이상의 게놈 서열은 변형된다.
몇몇 질병 모델은 특히 연구되어 왔다. 이들은 새로운 자폐증 위험 유전자 CHD8, KATNAL2, 및 SCN2A; 및 증후군성 자폐증 (엔젤만(Angelman) 증후군) 유전자 UBE3A를 포함한다. 이들 유전자 및 결과의 자폐증 모델은 물론 바람직하지만, 유전자 및 상응하는 모델에 걸친 본 발명의 광범위한 적용성을 나타내는 역할을 한다. 신호화 생화학 경로와 연관된 하나 이상의 게놈 서열의 변경된 발현은, 시험 모델 세포와 대조구 세포들이 후보물질과 접촉되는 경우, 시험 모델 세포와 대조구 세포들 간의 상응 유전자의 mRNA 수준에서의 차이에 대한 분석에 의해 결정될 수 있다. 대안적으로, 신호화 생화학 경로와 연관된 서열의 차등 발현은 인코딩된 폴리뉴클레오티드 또는 유전자 생성물의 수준에서의 차이를 검출함으로써 결정된다.
mRNA 전사물 또는 상응하는 폴리뉴클레오티드의 수준에서 약제-유도된 변경을 분석하기 위하여, 샘플 내 포함된 핵산을 먼저 해당 분야의 표준 방법에 따라 추출한다. 예를 들어, mRNA는 문헌 [Sambrook et al. (1989)]에 설명된 절차에 따라 각종 용균 효소 또는 화학 용액을 이용하여 분리될 수 있거나, 제조자에 의해 제공된 첨부 안내서에 따라 핵산-결합 수지에 의해 추출될 수 있다. 추출된 핵산 샘플 내에 포함된 mRNA는 이후 당 분야에서 공지된 방법 또는 본 명세서에서 예시된 방법에 기초한, 증폭 절차 또는 통상의 혼성화 분석(예를 들어, 노던 블롯 분석)에 의해 검출된다.
본 발명의 목적을 위하여, 증폭은 타당한 충실도로 표적 서열을 복제할 수 있는 폴리머라제 및 프라이머를 사용하는 임의의 방법을 의미한다. 증폭은 천연 또는 재조합 DNA 폴리머라제, 예를 들어, TaqGold™, T7 DNA 폴리머라제, 대장균 DNA 폴리머라제의 클레나우 단편 및 역전사효소에 의해 수행될 수 있다. 바람직한 증폭 방법은 PCR이다. 특히, 분리된 RNA는 신호화 생화학 경로와 연관된 서열의 발현 수준을 정량화하기 위하여 정량적 폴리머라제 연쇄반응과 연결된 역전사 분석 (RT-PCR) 처리될 수 있다.
유전자 발현의 검출은 증폭 분석에서 실시간으로 수행될 수 있다. 일 양태에서, 증폭된 생성물은 이로 제한되지는 않지만 DNA 삽입제 및 DNA 홈 결합제를 포함하는 형광 DNA-결합제로 직접 시각화될 수 있다. 이중-가닥 DNA 분자 내로 혼입된 삽입제의 양은 통상적으로 증폭된 DNA 생성물의 양에 비례하기 때문에, 증폭된 생성물의 양은 해당 분야의 통상적인 광학 시스템을 이용하여 삽입된 염료의 형광을 정량화함으로써 편리하게 결정될 수 있다. 본 적용에 적합한 DNA-결합 염료는 SYBR 녹색, SYBR 청색, DAPI, 프리디늄 요오드, 회스트(Hoeste), SYBR 금색, 에티디윰 브로마이드, 아크리딘, 프로플라빈, 아크리딘 오렌지, 아크리플라빈, 플루오르쿠마린, 엘립티신, 다우노마이신, 클로로퀸, 디스타마이신 D, 크로모마이신, 호미디윰, 미트라마이신, 루테늄 폴리피리딜스, 안트라마이신 등을 포함한다.
또 다른 양태에서, 서열 특이적 프로브와 같은 기타 형광 표지는, 증폭된 생성물의 검출 및 정량화를 촉진하기 위하여 증폭 반응에서 사용될 수 있다. 프로브-기준 정량적 증폭은 원하는 증폭 생성물의 서열-특이적 검출에 의존한다. 이는 형광, 표적-특이적 프로브 (예를 들어, TaqMan® 프로브)를 이용하여, 그 결과 특이성 및 감도를 증가시킨다. 프로브-기준 정량적 증폭의 수행 방법은 당 기술 분야에서 잘 확립되어 있으며, 미국 특허 5,210,015에 교시되어 있다.
그러나 또 다른 양태에서, 신호화 생화학 경로와 연관된 서열과 상동성을 공유하는 혼성화 프로브를 이용하는 통상의 혼성화 분석이 수행될 수 있다. 통상적으로, 프로브는, 혼성화 반응에서 시험 대상체로부터 유래된 생물학적 샘플 내에 포함된 신호화 생화학 경로와 연관된 서열과 안정한 복합체를 형성하는 것을 가능하게 한다. 안티센스가 프로브 핵산으로서 사용된 경우, 샘플 내에 제공된 표적 폴리뉴클레오티드는 그 안티센스 핵산의 서열에 상보적이도록 선택됨을 해당 분야의 숙련자는 이해할 것이다. 역으로, 뉴클레오티드 프로브가 센스 핵산인 경우, 표적 폴리뉴클레오티드는 센스 핵산의 서열에 상보적이도록 선택된다.
혼성화는 각종 엄격성 조건 하에서 수행될 수 있다. 본 발명의 실시에 적합한 혼성화 조건은 프로브와 신호화 생화학 경로와 연관된 서열 간의 인식 상호작용이 충분히 특이적이고 충분히 안정적이도록 하는 것이다. 혼성화 반응의 엄격성을 증가시키는 조건은 해당 기술 분야에서 공지 및 공개되어 있다. 예를 들어, 문헌[(Sambrook, et al., (1989); Nonradioactive In Situ Hybridization Application Manual, Boehringer Mannheim, second edition)] 참조. 혼성화 분석은, 이로 제한되지는 않지만 니트로셀룰로오스, 유리, 규소, 및 각종 유전자 어레이를 포함하는 임의의 고체 기재 상에 고정화된 프로브를 이용하여 형성될 수 있다. 바람직한 혼성화 분석은 미국 특허 5,445,934에 기재된 바와 같은 고밀도 유전자 칩 상에서 수행된다.
혼성화 분석 동안 형성된 프로브-표적 복합체의 편리한 검출을 위하여, 뉴클레오티드 프로브는 검출가능한 표지에 컨쥬게이트된다. 본 발명에서의 이용에 적합한 검출가능한 표지는 광화학, 생화학, 분광학 면역 화학, 전기, 광학 또는 화학적 수단에 의해 검출가능한 임의의 조성물을 포함한다. 광범위한 종류의 적절한 검출가능한 표지는 해당 분야에서 알려져 있으며, 이는 형광 또는 화학발광 표지, 방사성 동위원소 표지, 효소 또는 기타 리간드를 포함한다. 바람직한 구현예에서, 형광 표지 또는 효소 태그, 예컨대 디곡시제닌, ß-갈락토시다제, 우레아제, 알칼리성 포스파타제 또는 퍼옥시다제, 아비딘/비오틴 복합체가 바람직하게 사용될 것이다.
혼성화 또는 강도를 검출 또는 정량화하는데 사용되는 검출 방법은 통상적으로 상기 선택된 표지에 따라 달라질 것이다. 예를 들어, 방사성표지는 사진 필름 또는 포스포이미저(phosphoimager)를 이용하여 검출될 수 있다. 형광 마커는 방출된 광을 검출하기 위한 광검출기를 이용하여 검출 및 정량화될 수 있다. 효소 표지는 통상적으로 효소에 기재를 제공하고, 효소의 작용에 의해 기재 상에 생성된 반응 생산물을 측정하여 검출되고; 최종적으로 비색성 표지는 착색된 표지를 단순히 시각화함으로써 검출된다.
신호화 생화학 경로와 연관된 서열의 발현에서의 약제-유도된 변화는 상응하는 유전자 생성물을 검사함으로써 결정될 수도 있다. 단백질 수준의 결정은 통상적으로, a) 생물학적 샘플 내에 포함된 단백질을, 신호화 생화학 경로와 연관된 단백질에 특이적으로 결합하는 약제와 접촉시키는 단계; 및 b) 그렇게 형성된 어떤 약제:단백질 복합체를 확인하는 확인하는 단계를 포함한다. 이러한 구현예의 일 양태에서, 신호화 생화학 경로와 연관된 단백질에 특이적으로 결합하는 약제는 항체, 바람직하게는 단일클론성 항체이다.
반응은 그 약제를, 시험 샘플로부터 유래된 신호화 생화학 경로와 연관된 단백질의 샘플과, 그 약제와 신호화 생화학 경로와 연관된 단백질간에 복합체가 형성되는 것을 가능하게 하는 조건 하에서, 접촉시킴으로써 수행된다. 복합체의 형성은 해당 기술 분야의 표준 절차에 따라 직접적으로 또는 간접적으로 검출될 수 있다. 직접 검출 방법에서, 약제에는 검출가능한 표지가 공급되고, 미반응된 약제는 복합체로부터 제거될 수 있으며; 따라서 남아있는 표지의 양은 형성된 복합체의 양을 나타낸다. 그러한 방법의 경우, 엄격한 세척 조건 동안에도 약제에 부착된 채로 잔류하는 표지를 선택하는 것이 바람직하다. 표지는 결합 반응을 간섭하지 않는 것이 바람직하다. 대안에서, 간접적 검출 절차는, 화학적으로 또는 효소적으로 도입된 표지를 함유하는 약제를 사용할 수 있다. 바람직한 표지는 일반적으로 결합 또는 그 결과의 약제:폴리펩티드 복합체의 안정성을 간섭하지 않는다. 그러나, 표지는 통상적으로 효과적인 결합 및 그에 따라 검출가능한 신호를 생성하기 위하여 항체에 접근가능하도록 설계된다.
단백질 수준을 검출하는데 적합한 광범위한 각종 표지는 당 기술 분야에서 알려져 있다. 비제한적인 예로는 방사성동위원소, 효소, 콜로이드성 금속, 형광 화합물, 생물발광 화합물, 및 화학발광 화합물이 포함된다.
결합 반응 동안 형성된 약제:폴리펩티드 복합체의 양은 표준 정량 분석에 의해 정량화될 수 있다. 상기 예시된 바와 같이, 약제:폴리펩티드 복합체의 형성은 결합 부위에서 유지된 표지의 양에 의해 직접적으로 측정될 수 있다. 대안에서, 신호화 생화학 경로와 연관된 단백질은, 특정 약제 상의 결합 부위에 대해 표지된 유사체와 경쟁하는 그의 능력에 대해 시험된다. 이러한 경쟁적 분석에서, 포착된 표지의 양은 시험 샘플에 존재하는 신호화 생화학 경로와 연관된 단백질 서열의 양에 역비례한다.
상기 개괄된 일반 원칙을 기준으로 한 다수의 단백질 분석 기술은 해당 기술분야에서 이용가능하다. 그들은 이로 제한되지는 않지만, 방사성면역분석, ELISA(효소 결합 면역흡착 분석), "샌드위치" 면역분석, 면역방사계 분석, 제위치 면역분석(예를 들어, 콜로이드성 금, 효소 또는 방사성동위원소 표지를 이용), 웨스턴 블롯 분석, 면역침강 분석, 면역형광 분석, 및 SDS-PAGE를 포함한다.
신호화 생화학 경로와 연관된 단백질을 특이적으로 인식 또는 결합하는 항체는 상기 언급된 단백질 분석을 수행하는 것이 바람직하다. 바람직한 경우, 번역후 변형의 특이적 유형(예를 들어, 신호화 생물학 경로 유도성 변형)을 인식하는 항체가 사용될 수 있다. 번역후 변형은 이로 제한되지는 않지만, 글리코실화, 지질화, 아세틸화 및 인산화를 포함한다. 이들 항체는 판매업체로부터 구매할 수 있다. 예를 들어, 티로신-포스포릴화 단백질을 특이적으로 인식하는 항-포스포티로신 항체가 Invitrogen 및 Perkin Elmer를 포함하는 다수의 판매사로부터 입수가능하다. 항-포스포티로신 항체는, 특히 ER 스트레스에 반응하여 그의 티로신 잔기 상에서 별도로 포스포릴화된 단백질을 검출하는데 있어서 특히 이용가능하다. 그러한 단백질은 이로 제한되지는 않지만, 진핵성 번역 개시 인자 2 알파(eIF-2α)가 포함된다. 대안적으로, 이들 항체는 통상의 다클론성 또는 단일클론성 항체 기술을 이용하여, 숙주 동물 또는 항체-생산 세포를 바람직한 번역후 변형을 나타내는 표적 단백질로 면역화함으로써 생성될 수 있다.
본 방법을 실시하는데 있어서, 상이한 신체 조직에서, 상이한 세포 유형에서, 및/또는 상이한 하위세포 구조물에서 신호화 생화학 경로와 연관된 단백질의 발현 패턴을 식별하는 것이 바람직할 수 있다. 이들 연구는, 특정 조직, 세포 유형 또는 하위 구조 내에서 우선적으로 발현되는 단백질 마커에 결합할 수 있는 조직-특이적, 세포-특이적 또는 하위세포 구조 특이적 항체를 이용하여 수행될 수 있다.
신호화 생화학 경로와 연관된 유전자의 변경된 발현은 또한 제어 세포에 대하여 유전자 생성물의 활성에서의 변화를 시험함으로써 결정될 수 있다. 신호화 생화학 경로와 연관된 단백질의 활성에서의 약제-유도된 변화에 대한 분석은, 연구 중에 있는 생물학적 활성 및/또는 신호 형질도입 경로에 의존할 것이다. 예를 들어, 단백질이 키나아제인 경우, 하류 기재(들)를 포스포릴화하는 그의 능력에서의 변화는 해당 기술에서 알려진 각종 분석에 의해 결정될 수 있다. 대표적인 분석으로는 이로 제한되지 않지만, 포스포릴화 단백질을 인식하는 포스포릴화 항-포스포티로신 항체와 같은 항체를 이용하는 면역블롯팅 및 면역침강이 포함된다. 추가적으로, 키나아제 활성은, AlphaScreen™ (Perkin Elmer로부터 입수가능) 및 eTag™ 분석(문헌[Chan-Hui, et al. (2003) Clinical Immunology 111: 162-174])와 같은 고처리량(high throughput) 화학발광 분석에 의해 검출될 수 있다.
신호화 생화학 경로와 연관된 단백질이 세포 내 pH 조건의 동요를 일으키는 신호화 캐스케이드(cascade) 반응의 일부인 경우, 형광 pH 염료와 같은 pH 민감성 분자가 리포터 분자로서 사용될 수 있다. 또 다른 예에서, 신호화 생화학 경로와 연관된 단백질이 이온 채널인 경우, 막 전위 및/또는 세포내 이온 농도에서의 동요는 모니터링될 수 있다. 다수의 상용 키트 및 고속 처리 장치는 이온 채널의 조절제에 대한 신속하고 강건한 스크리닝에 특히 적합하다. 대표적인 기기로는 FLIPRTM(Molecular Devices, Inc.) 및 VIPR(Aurora Biosciences)가 포함된다. 이들 기기는 마이크로플레이트의 1000 개가 넘는 샘플 웰 내 반응들을 검출할 수 있고, 1초 또는 심지어 밀리초(minisecond) 내의 실시간 측정 및 작용 데이터를 제공할 수 있다.
본 명세서에 개시된 임의의 방법의 실시에 있어서, 적합한 벡터가, 이로 제한되지는 않지만, 미세주입, 전기천공, 소노포레이션(sonoporation), 바이오리스틱스, 칼슘 포스페이트-매개 트랜스펙션, 양이온 트랜스펙션, 리포좀 트랜스펙션, 덴드리머 트랜스펙션, 열 충격 트랜스펙션, 뉴클레오펙션 트랜스펙션, 마그네토펙션, 리포펙션, 임페일펙션, 광학 트랜스펙션, 핵산의 전용 제제-증진 흡수, 및 리포좀, 면역리포좀, 비로좀 또는 인공 비리온을 통한 전달을 포함하는 해당 분야에 알려진 하나 이상의 방법을 통해서 세포 또는 배아에 도입될 수 있다. 일부 방법에서, 벡터는 미세주입에 의해 배아 내로 도입된다. 벡터 또는 벡터들은 핵 내로 또는 배아의 세포질 내로 미세주입될 수 있다. 일부 방법들에서, 벡터 또는 벡터들은 뉴클레오펙션(nucleofection)에 의해 세포 내로 도입될 수 있다.
CRISPR 복합체의 표적 폴리뉴클레오티드는 진핵 세포에 대해 내생 또는 외인성 임의의 폴리뉴클레오티드일 수 있다. 예를 들어, 표적 폴리뉴클레오티드는 진핵 세포의 핵 내에 존재하는 폴리뉴클레오티드일 수 있다. 표적 폴리뉴클레오티드는 유전자 생성물을 코딩하는 서열(예를 들어, 단백질) 또는 비-코딩 서열(예를 들어, 조절 폴리뉴클레오티드 또는 정크 DNA)일 수 있다.
표적 폴리뉴클레오티드의 예는 신호화 생화학 경로, 예를 들어 신호화 생화학 경로와 연관된 서열, 예를 들어 신호화 생화학 경로-연관 유전자 또는 폴리뉴클레오티드를 포함한다. 표적 폴리뉴클레오티드의 예는 질병 연관 유전자 또는 폴리뉴클레오티드를 포함한다. "질병-연관된" 유전자 또는 폴리뉴클레오티드는, 비-질병 대조군의 조직 또는 세포에 비하여 질병-발생된 조직으로부터 유도된 세포에서의 비정상 수준 또는 비정상 형태의 전사 또는 번역 생성물을 산출하는 임의의 유전자 또는 폴리뉴클레오티드를 지칭한다. 이는 비정상적으로 높은 수준으로 발현된 유전자일 수 있고; 비정상적으로 낮은 수준으로 발현되는 유전자일 수 있으며, 여기서 변경된 발현은 질병의 발생 및/또는 진전과 상관관계가 있다. 질병-연관 유전자는 또한, 질병의 병인론에 책임이 있는 유전자(들)와의 연결 불균형 상태 또는 직접적으로 책임이 있는 유전자 가공 돌연변이(들) 또는 유전 변이를 지칭한다. 전사된 또는 번역된 생성물은 공지되거나 공지되지 않은 것일 수 있으며, 정상 또는 비정상 수준일 수 있다.
CRISPR 복합체의 표적 폴리뉴클레오티드는 진핵 세포에 대해 내인성 또는 외인성인 임의의 폴리뉴클레오티드일 수 있다. 예를 들어, 표적 폴리뉴클레오티드는 진핵 세포의 핵 내에 존재하는 폴리뉴클레오티드일 수 있다. 표적 폴리뉴클레오티드는 유전자 생성물(예를 들어, 단백질)을 코딩하는 서열 또는 비-코딩 서열(예를 들어, 조절 폴리뉴클레오티드 또는 정크 DNA)일 수 있다. 이론에 의해 구애되고자 하지 않지만, 표적 서열은 PAM(프로토스페이서 인접 모티프)와 연관되어야 하는 것으로 여겨지며; 이는 CRISPR 복합체에 의해 인식된 짧은 서열이다. PAM에 대한 정확한 서열 및 길이 요구사항은 사용된 CRISPR 효소에 따라 다르지만, PAM은 프로토스페이서(즉, 표적 서열)에 인접한 통상적으로 2-5 개의 염기쌍 서열이다. PAM 서열의 예는 하기 예의 섹션에서 제공되며, 숙련자는 주어진 CRISPR 효소와의 이용을 위한 추가의 PAM 서열을 확인할 수 있을 것이다. 추가로, PAM 상호작용 (PI) 도메인의 조작은 PAM 특이성의 프로그래밍을 허용할 수 있으며, 표적 부위 인식 충실도를 개선하고, Cas, 예를 들어 Cpf1 게놈 조작 플랫폼의 다능성을 증가시킨다. Cas 단백질, 예컨대 Cpf1 단백질은 그들의 PAM 특이성을, 예를 들어 문헌 [Kleinstiver BP et al. Engineered CRISPR-Cas9 Nucleases with altered PAM specificities. Nature. 2015 Jul 23;523(7561):481-5. doi: 10.1038/nature14592]에 설명된 바와 같이 변경시키도록 조작될 수 있다.
CRISPR 복합체의 표적 폴리뉴클레오티드는 다수의 질병-연관 유전자 및 폴리뉴클레오티드뿐만 아니라, 신호화 생화학 경로-연관 유전자 및 폴리뉴클레오티드를 포함할 수 있으며, 이는 각각 브로드 레퍼런스 BI-2011/008/WSGR 도켓 번호 44063-701.101 및 BI-2011/008/WSGR 도켓 번호 44063-701.102를 갖는, 미국 가출원 61/736,527 및 61/748,427(이들 둘은 각각 "SYSTEMS METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION"라는 명칭으로 2012년 12월 12일 및 2013년 1월 2일에 출원됨), 및 "DELIVERY, ENGINEERING AND OPTIMIZATION OF SYSTEMS, METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION AND THERAPEUTIC APPLICATIONS"라는 명칭으로 2013년 12월 12일에 출원된 PCT 출원 PCT/US2013/074667에 열거된 바와 같으며, 이들의 모든 내용은 본 명세서에 전체가 참고로 포함된다.
표적 폴리뉴클레오티드의 예로는 신호화 생화학 경로, 예를 들어 신호화 생화학 경로-연관 유전자 또는 폴리뉴클레오티드와 연관된 서열을 포함한다. 표적 폴리뉴클레오티드의 예로는 질병 연관 유전자 또는 폴리뉴클레오티드가 포함된다. "질병-연관된" 유전자 또는 폴리뉴클레오티드는, 비-질병 대조구의 조직 또는 세포에 비하여 질병-발생된 조직으로부터 유도된 세포에서의 비정상 수준 또는 비정상 형태의 전사 또는 번역 생성물을 산출하는 임의의 유전자 또는 폴리뉴클레오티드를 지칭한다. 이는 비정상적으로 높은 수준으로 발현된 유전자일 수 있고; 비정상적으로 낮은 수준으로 발현되는 유전자일 수 있으며, 여기서 변경된 발현은 질병의 발생 및/또는 진전에 상관한다. 질병-연관 유전자는 또한, 질병의 병인론에 책임이 있는 유전자(들)과의 연결 불균형 상태 또는 직접적으로 책임이 있는 유전자 가공 돌연변이(들) 또는 유전적 변이를 또한 지칭한다. 전사된 또는 번역된 생성물은 기지 또는 미지일 수 있으며, 정상 또는 비정상 수준일 수 있다.
게놈 와이드(Genome Wide) 낙-아웃 스크리닝
본 명세서에 설명된 CRISPR 단백질 및 시스템은 효율적이며 비용효과적인 작용성 게놈 스크리닝을 수행하는데 사용될 수 있다. 그러한 스크리닝은 CRISPR 이펙터 단백질 기반 게놈 와이드 라이브러리를 이용할 수 있다. 그러한 스크리닝 및 라이브러리는 유전자의 작용을 결정하는데 제공될 수 있고, 세포 경로 유전자가 관련되고, 유전자 발현에서 임의의 변경은 어떠하게 특정 생물학적 공정을 결과로서 초래할 수 있다. 본 발명의 장점은 CRISPR 시스템이 표적외 결합 및 그 결과로 인한 부작용을 회피한다는 것이다. 이는 표적 DNA에 대한 고도의 서열 특이성을 갖도록 배열된 시스템을 이용하여 달성된다. 본 발명의 바람직한 구현예에서, CRISPR 이펙터 단백질 복합체는 Cpf1 이펙터 단백질 복합체이다.
본 발명의 구현예에서, 게놈 와이드 라이브러리는 본 명세서에서 설명된 바와 같이, 복수의 Cpf1 가이드 RNA를 포함할 수 있으며, 이는 진핵 세포의 집단 내 복수의 게놈 유전자좌에서 복수의 표적 서열을 표적화할 수 있는 가이드 서열을 포함한다. 세포의 집단은 배아 줄기(ES) 세포의 집단일 수 있다. 게놈 유전자좌 내 표적 서열은 비코딩 서열일 수 있다. 비코딩 서열은 인트론, 조절 서열, 스플라이스 부위, 3' UTR, 5' UTR, 또는 폴리아데닐화 신호일 수 있다. 하나 이상의 유전자 생성물의 유전자 작용은 상기 표적화에 의해 변경될 수 있다. 표적화는 유전자 작용의 낙아웃을 결과로서 초래할 수 있다. 유전자 생성물의 표적화는 하나 초과의 가이드 RNA를 포함할 수 있다. 유전자 생성물은 유전자 당, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개의 가이드 RNA, 바람직하게는 3 내지 4 개의 가이드 RNA에 의해 표적될 수 있다. 표적외 변형은 Cpf1 이펙터 단백질 복합체에 의해 생성된 엇갈린 이중 가닥 파손을 이용함으로써 또는 CRISPR-Cpf1 시스템에서 사용된 것과 유사한 방법을 이용함으로써 최소화될 수 있다(예를 들어, 본 명세서에 참조로 포함된 문헌[DNA targeting specificity of RNA-guided Cas9 nucleases. Hsu, P., Scott, D., Weinstein, J., Ran, FA., Konermann, S., Agarwala, V., Li, Y., Fine, E., Wu, X., Shalem, O., Cradick, TJ., Marraffini, LA., Bao, G., & Zhang, F. Nat Biotechnol doi:10.1038/nbt.2647 (2013)] 참조). 표적화는 약 100 개 이상의 서열일 수 있다. 표적화는 약 1000 개 이상의 서열일 수 있다. 표적화는 약 20,000 개 이상의 서열일 수 있다. 표적화는 전체 게놈일 수 있다. 표적화는 관련 또는 바람직한 경로에 집중된 일단의 표적 서열들일 수 있다. 경로는 면역 경로일 수 있다. 경로는 세포 분열 경로일 수 있다.
본 발명의 일 양태는 복수의 게놈 유전자좌에서 복수의 표적 서열을 표적화할 수 있는 가이드 서열을 포함할 수 있는 복수의 Cpf1 가이드 RNA를 포함할 수 있는 게놈 와이드 라이브러리를 포함하며, 여기서 상기 표적화는 유전자 작용의 낙아웃을 결과로서 초래한다. 이러한 라이브러리는 생물의 게놈 내 각각 및 모든 유전자를 표적화하는 가이드 RNA를 잠재적으로 포함할 수 있다.
본 발명의 일부 구현예예서, 생물 또는 대상체는 진핵 생물(인간을 포함하는 포유 동물 포함) 또는 비-인간 진핵 생물 또는 비-인간 동물 또는 비-인간 포유 동물이다. 일부 구현예에서, 생물 또는 대상체는 비-인간 동물이며, 예를 들어 곤충과 같은 절지 동물일 수 있거나, 선충일 수 있다. 본 발명의 일부 방법에서, 생물 또는 대상체는 식물이다. 본 발명의 일부 방법에서, 생물 또는 대상체는 포유 동물 또는 비-인간 포유 동물이다. 비-인간 포유 동물은, 예를 들어 설치류 (바람직하게는 마우스), 유제류, 또는 영장류일 수 있다. 본 발명의 일부 방법에서, 생물 또는 대상체는 미세조류를 포함하는 조류, 또는 균류이다.
유전자 작용의 낙아웃은: I. Cpf1 이펙터 단백질, 및 II. 하나 이상의 가이드 RNA를 포함하는 조작된, 비-천연 발생 Cpf1 이펙터 단백질 시스템을 포함하는 하나 이상의 벡터의 벡터 시스템을, 세포 집단 내 각각의 세포로 도입시키는 단계로서, 여기서 성분 I 및 성분 II는 시스템의 동일하거나 상이한 벡터일 수 있는 단계, 성분 I 및 II를 각각의 세포로 통합하는 단계로서, 여기서 성분 I 및 성분 II는 시스템의 동일하거나 상이한 벡터인 단계; 성분 I 및 II를 각각의 세포로 통합하는 단계로서, 여기서 가이드 서열은 각각의 세포 내 독특한 유전자를 표적화하고, 여기서 Cpf1 이펙터 단백질은 조절 요소에 작동 가능하게 연결되고, 전사된 경우, 가이드 서열을 포함하는 가이드 RNA가 Cpf1 이펙터 단백질 시스템의 독특한 유전자의 게놈 유전자좌 내의 표적 서열로의 서열-특이적 결합을 유도하는 단계; Cpf1 이펙터 단백질에 의해 게놈 유전자좌의 절단을 유도하는 단계; 및 세포 집단의 각각의 세포에서 다수의 독특한 유전자에서 상이한 낙아웃 돌연변이를 확인하여, 이에 의해 유전자 낙아웃 세포 라이브러리를 생성하는 단계를 포함할 수 있다. 본 발명은 세포 집단이 진핵 세포의 집단인 것을 포함하며, 바람직한 구현예에서, 세포들의 집단은 배아 줄기(ES) 세포의 집단이다.
하나 이상의 벡터는 플라스미드 벡터이다. 벡터는 Cpf1 이펙터 단백질, gRNA, 및 선택적으로 표적 서열 내로의 선별 마커를 포함하는 단일 벡터일 수 있다. 이론에 구애되지는 않지만, 단일 벡터를 통하여 Cpf1 이펙터 단백질 및 gRNA를 동시에 전달하는 능력은, Cpf1 이펙터 단백질을 발현하는 세포주를 먼저 생성할 필요 없이, 임의의 관심 세포 유형에의 적용을 가능하게 한다. 조절 요소는 유도성 프로모터일 수 있다. 유도성 프로모터는 독시사이클린 유도성 프로모터일 수 있다. 본 발명의 일부 방법에서, 가이드 서열의 발현은 T7 프로모터의 제어 하에 있으며, T7 폴리머라제의 발현에 의해 유도된다. 상이한 낙아웃 돌연변이의 확인은 전체 엑솜 시퀀싱에 의할 수 있다. 낙아웃 돌연변이는 100 개 이상의 독특한 유전자에서 달성될 수 있다. 낙아웃 돌연변이는 1000 개 이상의 독특한 유전자에서 달성될 수 있다. 낙아웃 돌연변이는 20,000 개 이상의 독특한 유전자에서 달성될 수 있다. 낙아웃 돌연변이는 전체 게놈에서 달성될 수 있다. 낙아웃 돌연변이는 특정 생리학적 경로 또는 조건에서 작용하는 복수의 독특한 유전자에서 달성될 수 있다. 경로 또는 조건은 면역 경로 또는 조건일 수 있다. 경로 또는 조건은 세포 분열 경로 또는 조건일 수 있다.
본 발명은 본 명세서에서 언급된 게놈 와이드 라이브러리를 포함하는 키트를 또한 제공한다. 키트는 본 발명의 라이브러리를 포함하는 벡터 또는 플라스미드를 포함하는 단일 용기를 포함할 수 있다. 키트는 또한 본 발명의 라이브러리로부터의 가이드 서열을 포함하는 독특한 Cpf1 이펙터 단백질 시스템 가이드 RNA의 선택을 포함하는 패널을 포함할 수 있으며, 여기서 선택은 특정 생리학적 조건을 나타낸다. 본 발명은, 표적화가 약 100 개 이상의 서열, 약 1000 개 이상의 서열 또는 약 20,000 개 이상의 서열 또는 전체 게놈인 것을 포함한다. 추가로, 일단의 표적 서열은, 면역 경로 또는 세포 분열과 같은 관련 또는 바람직한 경로에 집중될 수 있다.
본 발명의 추가의 양태에서, Cpf1 이펙터 단백질은 하나 이상의 돌연변이를 포함할 수 있고, 작용 도메인에 대한 융합 또는 융합 없이 일반적인 DNA 결합 단백질로서 사용될 수 있다. 돌연변이는 인공적으로 도입된 돌연변이 또는 작용의 획득 돌연변이 또는 작용의 손실 돌연변이일 수 있다. 돌연변이가 본 명세서에 기재된 바와 같이 특징화된다. 본 발명의 일 양태에서, 작용 도메인은 VP64일 수 있는 전사 활성화 도메인일 수 있다. 본 발명의 일 양태에서, 작용 도메인은 KRAB 또는 SID4X일 수 있는 전사 억제제 도메인일 수 있다. 다른 양태에서, 본 발명은 이로 제한되지는 않지만, 전사 활성화제, 억제제, 재조합효소, 트랜스포사제, 히스톤 리모델러, 데메틸라제, DNA 메틸트랜스퍼라제, 크립토크롬, 광 유도성/제어성 도메인 또는 화학적으로 유도성/제어성 도메인을 포함하는 도메인에 융합되는 돌연변이된 Cpf1 이펙터 단백질 효소에 관한 것이다. 본 발명의 일부 방법은 표적된 유전자의 발현의 유도를 포함할 수 있다. 일 구현예에서, 진핵 세포의 집단에서 복수의 게놈 유전자좌의 복수의 표적 서열을 표적화함에 의한 발현 유도는 작용 도메인의 이용에 의한다.
Cpf1이펙터 단백질 복합체를 이용하는 본 발명의 실시에서 CRISPR-Cpf1 시스템에 사용되는 방법이 유용하며, 하기가 참고된다:
Genome-Scale CRISPR-Cas9 Knockout Screening in Human Cells. Shalem, O., Sanjana, NE., Hartenian, E., Shi, X., Scott, DA., Mikkelson, T., Heckl, D., Ebert, BL., Root, DE., Doench, JG., Zhang, F. Science Dec 12. (2013). [Epub ahead of print]; Published in final edited form as: Science. 2014 Jan 3; 343(6166): 84-87.
Shalem 등은 게놈-와이드 규모에서 유전자 작용을 질의하기 위한 새로운 방식을 이용한다. 그들의 연구는 64,751 개의 독특한 가이드 서열을 이용하여 18,080 개 유전자를 표적화시킨 게놈-규모의 CRISPR-Cas9 낙아웃(GeCKO) 라이브러리의 전달이 인간 세포에서 음성 및 양성 선택 스크리닝 둘 모두를 가능하게 하는 것을 보여주었다. 먼저, 상기 저자는 암 및 만능성 줄기 세포에서 세포 생존력에 필수적인 유전자를 확인하기 위한 GeCKO 라이브러리의 사용을 보여주었다. 다음으로, 흑색종 모델에서, 상기 저자는 유전자의 소실이 돌연변이 단백질 키나아제 BRAF를 억제하는 치료제인 베무라페닙(vemurafenib)에 대한 내성과 관련된 유전자를 스크리닝하였다. 그들의 연구는 가장 높은 순위의 후보물질이 이전에 확인된 유전자 NF1 및 MED12뿐만 아니라 새로운 히트(hit) NF2, CUL3, TADA2B, 및 TADA1을 포함한 것을 나타내었다. 상기 저자는 동일한 유전자를 표적으로 하는 독립적 가이드 RNA와 높은 비율의 히트 확인 사이에 높은 수준의 일치를 관찰하였고, 따라서 Cas9를 이용한 게놈-규모 스크리닝의 가망성을 입증하였다.
미국 특허 공개 번호 US20140357530; 및 PCT 특허 공보 WO2014093701을 참조하며, 이들은 본 명세서에 참고문헌으로 통합된다. 또한 명칭이 "Researchers identify potential alternative to CRISPR-Cas genome editing tools: New Cas enzymes shed light on evolution of CRISPR-Cas systems"인 2015년 10월 22일의 NIH 공식 발표가 참고되며, 이는 참고로 포함된다.
작용성 변경 및 스크리닝
또 다른 양태에서, 본 발명은 유전자의 작용성 평가 및 스크리닝 방법을 제공한다. 작용성 도메인을 정확하게 전달하거나, 유전자를 활성화 또는 억제하거나 관심 특정 유전자놔 상에서 메틸화 부위를 정확하게 변경시킴으로써 후성적 상태를 변경시키기 위한 본 발명의 CRISPR 시스템의 사용은, 생체 외 또는 생체내에서 복수의 가이드 RNA(gRNA)를 포함하는 라이브러리의 투여 또는 발현을 포함하는 세포의 풀(pool) 중 게놈에 적용되는 라이브러리와 함께이거나 단일 세포 또는 세포 집단에 적용되는 하나 이상의 가이드 RNA와 함께일 수 있으며, 여기서 스크리닝은 Cpf1 이펙터 단백질의 사용을 추가로 포함하고, Cpf1 이펙터 단백질을 포함하는 CRISPR 복합체는 변형되어 이종 작용성 도메인을 포함한다. 일 양태에서, 본 발명은 숙주로의 투여 또는 라이브러리의 숙주에서의 생체 내 발현을 포함하는 게놈의 스크리닝 방법을 제공한다. 일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같이, 숙주로 투여되거나 숙주 내에서 발현되는 활성화제를 추가로 포함하는 방법을 제공한다. 일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같은 방법을 제공하며, 여기서 활성화제는 Cpf1 이펙터 단백질에 부착된다. 일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같은 방법을 제공하며, 여기서 활성화제는 Cpf1 이펙터 단백질의 N 말단 또는 C 말단에 부착된다. 일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같은 방법을 제공하며, 여기서 활성화제는 gRNA 루프에 부착된다. 일 양태에서, 본 발명은 숙주에 투여되거나 숙주에서 발현되는 억제제를 추가로 포함하는, 본 명세서에서 논의된 바와 같은 방법을 제공한다. 일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같은 방법을 제공하며, 여기서 스크리닝은 유전자좌에서의 유전자 활성화, 유전자 억제, 또는 절단에 영향을 미치거나 검출하는 것을 포함한다.
일 양태에서, 본 발명은 효율적인 표적상 활성을 제공하고, 표적외 활성은 최소화한다. 일 양태에서, 본 발명은 Cpf1 이펙터 단백질에 의한 효율적인 표적상 절단을 제공하고, Cpf1 이펙터 단백질에 의한 표적외 절단은 최소화한다. 일 양태에서, 본 발명은 DNA 절단 없이, 유전자좌에서의 Cpf1 이펙터 단백질의 가이드 특이적 결합을 제공한다. 따라서, 일 양태에서, 본 발명은 표적-특이적 유전자 조절을 제공한다. 일 양태에서, 본 발명은 DNA 절단 없이 유전자좌에서 Cpf1 이펙터 단백질의 가이드 특이적 결합을 제공한다. 따라서, 일 양태에서, 본 발명은 단일 Cpf1 이펙터 단백질을 사용하여 하나의 유전자좌에서의 절단 및 상이한 유전자좌에서의 유전자 조절을 제공한다. 일 양태에서, 본 발명은 하나 이상의 Cpf1 이펙터 단백질 및/또는 효소를 사용하여 다수의 표적의 직교(orthogonal) 활성화 및/또는 억제 및/또는 절단을 제공한다.
일 양태에서, 본 발명은 Cpf1 이펙터 단백질 복합체 또는 이의 성분(들) 또는 이에 대해 코딩하는 핵산 분자(들)의 전달을 포함하는, 본 명세서에서 논의된 바와 같은 방법을 제공하며, 여기서 상기 핵산 분자(들)는 조절 서열(들)에 작동 가능하게 연결되고 생체 내에서 발현된다. 일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같은 방법을 제공하며, 여기서 생체 내 발현은 렌티바이러스, 아데노바이러스, 또는 AAV를 통한 것이다. 일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같은 방법을 제공하며, 여기서 전달은 입자, 나노입자, 지질 또는 세포 투과 펩티드 (CPP)를 통한 것이다.
일 양태에서, 본 발명은 Cpf1 이펙터 단백질을 포함하는 CRISPR 복합체의 쌍을 제공하며, 이들 각각은 세포에서 관심 게놈 유전자좌에서 표적 서열에 혼성화할 수 있는 가이드 서열을 포함하는 가이드 RNA(gRNA)를 포함하며, 여기서 각 gRNA의 적어도 하나의 루프는 하나 이상의 어댑터 단백질에 결합하는 별개의 RNA 서열(들)의 삽입에 의해 변형되고, 여기서 어댑터 단백질은 하나 이상의 작용성 도메인과 회합되고, 여기서 각각의 Cpf1 이펙터 단백질 복합체의 각각의 gRNA는 DNA 절단 활성을 갖는 작용성 도메인을 포함한다. 일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같은 페어링된(paired) Cpf1 이펙터 단백질 복합체를 제공하며, 여기서 DNA 절단 활성은 Fok1 뉴클레아제로 인한 것이다.
일 양태에서, 본 발명은 Cpf1 이펙터 단백질 복합체의 세포 또는 이의 성분(들) 또는 이를 코딩하는 핵산 분자(들)로의 전달을 포함하는, 관심 게놈 유전자좌에서 표적 서열을 절단하는 방법을 제공하며, 여기서 상기 핵산 분자(들)는 조절 서열(들)에 작동 가능하게 연결되고 생체내 발현된다. 일 양태에서, 본 발명은 상기 논의된 바와 같은 방법을 제공하고, 여기서 전달은 렌티바이러스, 아데노바이러스, 또는 AAV를 통한 것이다. 일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같은 방법 또는 본 명세서에서 논의된 바와 같은 페이링된 Cpf1 이펙터 단백질 복합체를 제공하며, 여기서 쌍의 제1 복합체에 대한 표적 서열은 이중 가닥 DNA의 제1 가닥 상에 있고, 쌍의 제2 복합체에 대한 표적 서열은 이중 가닥 DNA의 제2 가닥 상에 있다. 일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같은 방법 또는 본 명세서에서 논의된 바와 같은 페어링된 Cpf1 이펙터 단백질 복합체를 제공하며, 여기서 제1 및 제2 복합체의 표적 서열은 서로 근접하여 있어서, DNA는 상동성 직접 수복을 촉진하는 방식으로 절단된다. 일 양태에서, 본 명세서의 방법은 세포 내로 주형 DNA를 도입하는 것을 추가로 포함할 수 있다. 일 양태에서, 본 명세서의 방법 또는 본 명세서의 페어링된 Cpf1 이펙터 단백질 복합체는, 각각의 Cpf1 이펙터 단백질 복합체가 돌연변이되어, 돌연변이되지 않은 Cpf1 이펙터 효소의 뉴클레아제 활성의 약 5% 이하를 갖도록 하는 Cpf1 이펙터 효소를 갖는 것을 포함할 수 있다.
일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같은 라이브러리, 방법 또는 복합체를 제공하며, 여기서 gRNA는 적어도 하나의 비-코딩 작용성 루프를 갖도록 변형되고, 예를 들어 여기서 적어도 하나의 비-코딩 작용성 루프는 반복적이고; 예를 들어 여기서 적어도 하나의 비-코딩 작용성 루프는 Alu를 포함한다.
일 양태에서, 본 발명은 유전자 생성물의 발현을 변경 또는 변형하는 방법을 제공한다. 상기 방법은 유전자 생성물을 인코딩하는 DNA 분자를 함유 및 발현하는 세포 내로 Cpf1 이펙터 단백질 및 그 DNA 분자를 표적화하는 가이드 RNA를 포함하는 조작된 비-천연 발생 CRISPR 시스템을 도입시키는 것을 포함할 수 있으며, 이로 인해 가이드 RNA는 유전자 생성물을 인코딩하는 DNA 분자를 표적화하고, Cpf1 이펙터 단백질은 유전자 생성물을 인코딩하는 DNA 분자를 절단하고, 이로 인해 유전자 생성물의 발현이 변경되고; 여기서 Cpf1 이펙터 단백질 및 가이드 RNA는 함께 자연적으로 발생하지 않는다. 본 발명은 직접 반복부 서열에 연결된 가이드 서열을 포함하는 가이드 RNA를 포괄한다.
일부 구현예에서, 하나 이상의 작용 도메인은 Cpf1 이펙터 단백질과 연관된다. 일부 구현예에서, 예를 들어, 문헌 [Konnerman et al. (Nature 517, 583-588, 29 January 2015)]의 변형된 가이드와 함께 사용된 바와 같이, 하나 이상의 작용 도메인은 어댑터 단백질과 연관된다. 일부 구현예에서, 하나 이상의 작용 도메인은 데드 gRNA(dRNA)와 연관된다. 일부 구현예에서, 활성 Cpf1 이펙터 단백질과의 dRNA 복합체는 유전자좌 상에서 작용 도메인에 의한 유전자 조절을 유도하는 한편, gRNA는 또 다른 유전자좌에서 활성 Cpf1 이펙터 단백질에 의한 DNA 절단을 유도하며, 예를 들어, 이는 문헌[Dahlman et al., 2015, Orthogonal gene control with a catalytically active Cas9 nuclease, Nat. Biotechnol. 33(11):1159-61]에 의한 CRISPR-Cas9 시스템에서 유사하게 기재된 바와 같다. 일부 구현예에서, dRNA는 표적외 조절에 비하여 관심 유전자좌에 대한 조절의 선택성을 최대화하도록 선택된다. 일부 구현예에서, dRNA는 표적 유전자 조절을 최대화하고 표적 절단은 최소화하도록 선택된다.
하기 논의의 목적을 위하여, 작용 도메인에 대한 기준은 Cpf1 이펙터 단백질과 연관된 작용 도메인 또는 어댑터 단백질과 연관된 작용 도메인일 수 있다.
본 발명의 실시에 있어서, gRNA의 루프는, Cpf1 단백질과의 충돌 없이, 구별된 RNA 루프(들) 또는 구별된 서열(들)에 결합될 수 있는 어댑터 단백질을 채용할 수 있는 구별된 RNA 루프(들) 또는 구별된 서열(들)의 삽입에 의해, 연장될 수 있다. 어댑터 단백질은 이로 제한되지는 않지만, 박테리오파지 코트 단백질의 다양성 내에 존재하는 직교 RNA-결합 단백질/압타머 조합을 포함할 수 있다. 그러한 코트 단백질의 리스트는, 이로 제한되지는 않지만: Qβ, F2, GA, fr, JP501, M12, R17, BZ13, JP34, JP500, KU1, M11, MX1, TW18, VK, SP, FI, ID2, NL95, TW19, AP205, φCb5, φCb8r, φCb12r, φCb23r, 7s 및 PRR1을 포함한다. 이들 어댑터 단백질 또는 직교 RNA 결합 단백질은 이펙터 단백질 또는 하나 이상의 작용 도메인을 포함하는 융합물을 추가로 채용할 수 있다. 일부 구현예에서, 작용 도메인은 트랜스포사제 도메인, 인테그라제 도메인, 재조합효소 도메인, 리졸바제 도메인, 인버타제 도메인, 프로테아제 도메인, DNA 메틸트랜스퍼라제 도메인, DNA 하이드록시메틸라제 도메인, DNA 데메틸라제 도메인, 히스톤 아세틸라제 도메인, 히스톤 데아세틸라제 도메인, 뉴클레아제 도메인, 억제제 도메인, 활성화제 도메인, 핵 국소화 서열 도메인, 전사-조절 단백질(또는 전사 복합체 채용) 도메인, 세포 섭취 활성 연관 도메인, 핵산 결합 도메인, 항원 제시 도메인, 히스톤 변형 효소, 히스톤 변형 효소의 리크루터; 히스톤 변형 효소의 저해제, 히스톤 메틸트랜스퍼라제, 히스톤 데메틸라제, 히스톤 키나아제, 히스톤 포스파타제, 히스톤 리보실라제, 히스톤 데리보실라제, 히스톤 유비퀴티나제, 히스톤 데유비퀴티나제, 히스톤 비오티나제 및 히스톤 꼬리 프로테아제로 이루어진 군으로부터 선택될 수 있다. 일부 바람직한 구현예에서, 작용 도메인은 전사 활성화 도메인, 예컨대 제한없이, VP64, p65, MyoD1, HSF1, RTA, SET7/9 또는 히스톤 아세틸트랜스퍼라제이다. 일부 구현예에서, 작용 도메인은 전사 억제 도메인, 바람직하게는 KRAB이다. 일부 구현예에서, 전사 억제 도메인은 SID, 또는 SID의 연쇄체(예를 들어, SID4X)이다. 일부 구현예에서, 작용 도메인은 후생적 변형 도메인으로, 후생적 변형 효소가 제공되도록 한다. 일부 구현예에서, 작용 도메인은 활성화 도메인으로, 이는 P65 활성화 도메인일 수 있다.
일부 구현예에서, 하나 이상의 작용 도메인은 NLS(핵 국소화 서열) 또는 NES(핵외 수송 신호)이다. 일부 구현예에서, 하나 이상의 작용 도메인은 전사 활성화 도메인으로, VP64, p65, MyoD1, HSF1, RTA, SET7/9 및 히스톤 아세틸트랜스퍼라제를 포함한다. CRISPR 효소와 연관된 것들에 대하여 활성화(또는 활성화제) 도메인에 대한 기타 참조는 임의의 기지의 전사 활성화 도메인을 포함하며, 특히 VP64, p65, MyoD1, HSF1, RTA, SET7/9 또는 히스톤 아세틸트랜스퍼라제.
일부 구현예에서, 하나 이상의 작용 도메인은 전사 억제제 도메인이다. 일부 구현예에서, 전사 억제제 도메인은 KRAB 도메인이다. 일부 구현예에서, 전사 억제제 도메인은 NuE 도메인, NcoR 도메인, SID 도메인 또는 SID4X 도메인이다.
일부 구현예에서, 하나 이상의 작용적 도메인은 메틸라제 활성, 데메틸라제 활성, 전사 활성화 활성, 전사 억제 활성, 전사 방출 인자 활성, 히스톤 변형 활성, RNA 절단 활성, DNA 절단 활성, DNA 통합 활성 또는 핵산 결합 활성을 포함하는 하나 이상의 활성을 갖는다.
히스톤 변형 도메인 또한 일부 구현예에서 바람직하다. 예시적인 히스톤 변형 도메인이 하기에서 논의된다. 트랜스포사제 도메인, HR(상동성 재조합) 기구 도메인, 재조합효소 도메인, 및/또는 인테그라제 도메인이 본 발명의 작용 도메인으로서 또한 바람직하다. 일부 구현예에서, DNA 통합 활성은 HR 기구 도메인, 인테그라제 도메인, 재조합효소 도메인 및/또는 트랜스포사제 도메인을 포함한다. 히스톤 아세틸트랜스퍼라제가 일부 구현예에서 바람직하다.
일부 구현예에서, DNA 절단 활성은 뉴클레아제로 인한 것이다. 일부 구현예에서, 뉴클레아제는 Fok1 뉴클레아제를 포함한다. 문헌 ["Dimeric CRISPR RNA-guided FokI nucleases for highly specific genome editing", Shengdar Q. Tsai, Nicolas Wyvekens, Cyd Khayter, Jennifer A. Foden, Vishal Thapar, Deepak Reyon, Mathew J. Goodwin, Martin J. Aryee, J. Keith Joung Nature Biotechnology 32(6): 569-77 (2014) 참조]은 연장된 서열을 인식하고, 인간 세포에서 고효율로 내인성 유전자를 편집할 수 있는, 이량체성 RNA-가이드된 FokI 뉴클레아제에 관한 것이다.
일부 구현예에서, 하나 이상의 작용 도메인은 Cpf1 이펙터 단백질에 부착되어, sgRNA 및 표적에 대한 결합시, 작용 도메인은 그 작용 도메인이 그에 귀속된 작용으로 작용하는 것을 가능하게 하는 공간 배향으로 존재하도록 한다.
일부 구현예에서, 하나 이상의 작용 도메인은 어댑터 단백질에 부착되며, Cpf1 이펙터 단백질의 gRNA 및 표적에 대한 결합시, 작용 도메인은 그 작용 도메인이 그에 귀속된 작용으로 작용하는 것을 가능하게 하는 공간 배향으로 존재하도록 한다.
일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같은 조성물을 제공하며, 여기서 하나 이상의 작용 도메인은, 본 명세서에서 논의된 바와 같은, 링커, 선택적으로 GlySer 링커를 통해 Cpf1 이펙터 단백질 또는 어댑터 단백질에 부착된다.
내생의 전사 억제는 종종 크로마틴 변형 효소, 예컨대 히스톤 메틸트랜스퍼라제(HMT) 데아세틸라제(HDAC)에 의해 매개된다. 억제성 히스톤 이펙터 도메인은 알려져 있으며, 예시적인 리스트가 하기 제공된다. 예시적인 표에서, 효율적인 바이러스성 패키징을 촉진하도록 작은 크기의 단백질 및 작용 절단물이 선호되었다(예를 들어, AAV를 통해). 그러나, 일반적으로 도메인은 HDACs, 히스톤 메틸트랜스퍼라제(HMTs), 및 히스톤 아세틸트랜스퍼라제(HAT) 억제제, 뿐 아니라 HDAC 및 HMT 채용 단백질을 포함할 수 있다. 작용 도메인은 일부 구현예에서, HDAC 이펙터 도메인, HDAC 리크루터 이펙터 도메인, 히스톤 메틸트랜스퍼라제(HMT) 이펙터 도메인, 히스톤 메틸트랜스퍼라제(HMT) 리크루터 이펙터 도메인, 또는 히스톤 아세틸트랜스퍼라제 억제제 이펙터 도메인일 수 있거나, 이들을 포함할 수 있다.
Figure pat00021
따라서, 본 발명의 억제제 도메인은 히스톤 메틸트랜스퍼라제(HMT), 히스톤 데아세틸라제(HDAC), 히스톤 아세틸트랜스퍼라제(HAT) 억제제, 및 HDAC 및 HMT 채용 단백질로부터 선택될 수 있다.
HDAC 도메인은 상기 표의 임의의 것들, 즉, HDAC8, RPD3, MesoLo4, HDAC11, HDT1, SIRT3, HST2, CobB, HST2, SIRT5, Sir2A, 또는 SIRT6일 수 있다.
일부 구현예에서, 작용 도메인은 HDAC 리크루터 이펙터 도메인일 수 있다. 바람직한 예로는 하기 표의 것들, 즉 MeCP2, MBD2b, Sin3a, NcoR, SALL1, RCOR1이 포함된다. NcoR은 본 실시예에서 예시되며, 바람직하지만, 동일 부류의 다른 것들 또한 유용할 것으로 생각된다.
Figure pat00022
일부 구현예에서, 작용 도메인은 메틸트랜스퍼라제 (HMT) 이펙터 도메인일 수 있다. 바람직한 예로는 하기 표 안의 것들, 즉 NUE, vSET, EHMT2/G9A, SUV39H1, dim-5, KYP, SUVR4, SET4, SET1, SETD8, 및 TgSET8이 포함된다. NUE는 본 실시예에서 예시되며, 바람직하지만, 동일 부류의 다른 것들 또한 유용할 것으로 생각된다.
Figure pat00023
일부 구현예에서, 작용 도메인은 히스톤 메틸트랜스퍼라제(HMT) 리크루터 이펙터 도메인일 수 있다. 바람직한 예로는 하기 표의 것들, 즉 Hp1a, PHF19, 및 NIPP1을 포함한다.
Figure pat00024
일부 구현예에서, 작용 도메인은 히스톤 아세틸트랜스퍼라제 억제제 이펙터 도메인일 수 있다. 바람직한 예로는 하기 표의 SET/TAF-1β가 포함된다.
Figure pat00025
프로모터 또는 프로모터-근위 요소에 추가하여, 내인성 (조절) 제어 요소(예컨대, 인핸서 및 사일런서)를 표적화하는 것 또한 바람직하다. 따라서, 본 발명은 프로모터의 표적화에 추가하여 내인성 제어 요소(인핸서 및 사일런서 포함)를 표적화하는데 사용될 수도 있다. 이들 제어 요소는 전사 출발 부위(TSS)의 상류 및 하류에 위치될 수 있으며, 이는 TSS로부터 200bp로부터 시작하여 100kb 까지 멀어진다. 일부 경우에서, 단일 제어 요소는 다수의 표적 유전자의 전사에 영향을 미칠 수 있다. 단일 제어 요소의 표적화는 따라서 다수의 유전자의 전사를 동시에 제어하는데 사용될 수 있을 것이다.
한편 추정적인 제어 요소의 표적화(예를 들어, 추정적인 제어 요소의 영역을 또한 요소 주위에서 200bp 내지 100kB까지 타일링(tiling)함으로써)는 그러한 요소를 확인하는 (관심 유전자의 전사를 측정함으로써) 또는 신규 제어 요소를 검출하는(예를 들어, 관심 유전자의 TSS의 100kb 상류 및 하류를 타일링함으로써) 수단으로서 사용될 수 있다. 추가적으로, 추정적인 제어 요소의 표적화는 질병의 유전적 원인을 이해하는 맥락에서 유용할 수 있다. 질병 표현형과 연관된 많은 돌연변이 및 일반 SNP 변이체는 코딩 영역 외부에 위치된다. 본 명세서에서 설명된 활성화 또는 저해 시스템 중 어느 하나를 이용한 그러한 영역의 표적화에 이어, a) 추정적인 표적의 세트(예를 들어, 제어 요소의 최근접부에 위치된 유전자의 세트) 또는 b) 예를 들어, RNAseq 또는 마이크로어레이에 의한, 전체-트랜스크립톰(whole-transcriptome) 판독 중 어느 하나의 전사 판독에 뒤따를 수 있다. 이는 질병 표현형과 관련된 가능성 있는 후보 유전자의 확인을 가능하게 할 것이다. 그러한 후보 유전자는 신규 약물 표적으로서 유용할 수 있다.
히스톤 아세틸트랜스퍼라제(HAT) 억제제가 본 명세서에 언급된다. 그러나, 대안적인 일부 구현예에서 하나 이상의 작용 도메인이 아세틸트랜스퍼라제, 바람직하게는 히스톤 아세틸트랜스퍼라제를 포함하는 것이다. 이들은 후생유전학(epigenomics) 분야, 예를 들어 후생유전자에서 정보를 얻는 방법에서 유용하다. 표적화 후생유전자 서열은 후생유전자 표적 서열로 유도되는 가이드를 포함할 수 있다. 후생유전자 표적화는 일부 구현예에서, 프로모터, 사일런서 또는 인핸서 서열을 포함할 수 있다.
본 명세서에서 설명된 바와 같이 후생유전자 서열을 표적하기 위한 Cpf1 이펙터 단백질, 바람직하게는 데드-Cpf1 이펙터 단백질, 더욱 바람직하게는 데드-FnCpf1 이펙터 단백질에 연결된 작용 도메인의 이용은 프로모터, 사일런서 또는 인핸서를 활성화 또는 억제하는데 사용될 수 있다.
아세틸트랜스퍼라제의 예는 알려져 있지만, 일부 구현예에서, 히스톤 아세틸트랜스퍼라제를 포함할 수 있다. 일부 구현예에서, 히스톤 아세틸트랜스퍼라제는 인간 아세틸트랜스퍼라제 p300의 촉매 중심을 포함할 수 있다[문헌 (Gjerbasch & Reddy, Nature Biotech, 2015년 4월 6일)].
일부 바람직한 구현예에서, 작용 도메인은 데드-Cpf1 이펙터 단백질에 연결되어 프로모터 또는 인핸서와 같은 후생유전자 서열을 표적 및 활성화한다. 그러한 프로모터 또는 인핸서로 유도된 하나 이상의 가이드는 또한 CRISPR 효소의 그러한 프로모터 또는 인핸서로의 결합을 유도하기 위해 제공될 수 있다.
용어 "연관된"이 작용 도메인의 Cpf1 이펙터 단백질 또는 어댑터 단백질로의 연결에 관하여 본 명세서에서 사용된다. 이는 어떻게 하나의 분자가 다른 하나에 대해서, 예를 들어 어댑터 단백질과 작용 도메인 사이에서 또는 Cpf1 이펙터 단백질과 작용 도메인 사이에서 '연관되는"지에 관련하여 사용되며, 이러한 연관은 항체가 에피토프를 인식하는 방식에서의 인식이라는 면에서 생각될 수 있다. 대안적으로, 하나의 단백질은, 둘 예를 들어 다른 서브유닛에 융합되는 하나의 서브유닛의 융합을 통해 또 다른 단백질과 연관될 수 있다. 융합은 예를 들어 각각의 단백질 또는 서브유닛을 인코딩하는 뉴클레오티드 서열을 함께 스플라이싱을 통해, 통상적으로 하나의 아미노산 서열의 다른 아미노산 서열로의 부가에 의해 일어난다. 대안적으로, 이는 본질적으로 두 개의 분자간의 결합 또는 직접 연결, 예컨대 융합 단백질로서 생각될 수 있다. 어쨌든, 융합 단백질은 관심의 두 서브유닛 사이(즉, 효소와 작용 도메인 또는 어댑터 단백질와 작용 도메인 사이)의 링커를 포함할 수 있다. 따라서, 일부 구현예에서, Cpf1 이펙터 단백질 또는 어댑터 단백질은 거기 결합함으로써 작용 도메인과 연관된다. 다른 구현예에서, Cpf1 이펙터 단백질 또는 어댑터 단백질은 작용 도메인과 함께 연관되는데, 이는 이들 둘이 함께, 선택적으로 중간체 링커를 통해 융합되기 때문이다.
작용 도메인의 부착 또는 융합 단백질은 링커, 예를 들어 유연성 글리신-세린(GlyGlyGlySer) 또는 (GGGS)3 또는 강성 알파-나선형 링커 예컨대 (Ala(GluAlaAlaAlaLys)Ala)를 통한 것일 수 있다. 단백질 또는 펩티드 도메인을 분리하는데 (GGGGS)3과 같은 링커가 본 명세서에서 바람직하게 사용된다. (GGGGS)3는 상대적으로 긴 링커 (15 개 아미노산)이기 때문에 바람직하다. 글리신 잔기가 가장 유연하며, 세린 잔기는 링커가 단백질의 외부 상에 존재하는 경우를 증진시킨다. (GGGGS)6 (GGGGS)9 또는 (GGGGS)12가 대안으로서 바람직하게 사용될 수 있다. 기타 바람직한 대안은 (GGGGS)1, (GGGGS)2, (GGGGS)4, (GGGGS)5, (GGGGS)7, (GGGGS)8, (GGGGS)10, 또는 (GGGGS)11이다. 대안적인 링커가 이용가능하지만, Cpf1의 두 부분을 함께 모으고 이에 따라 Cpf1 활성을 재구성하기 위한 최대의 기회를 가능하게 하기에는, 고도로 유연한 링커가 가장 잘 작용하는 것으로 생각된다. 한가지 대안은, 뉴클레오플라스민의 NLS가 링커로서 사용될 수 있다는 것이다. 예를 들어, 링커는 Cpf1와 임의의 작용 도메인 사이에서 사용될 수도 있다. 또다시, (GGGGS)3 링커가 여기서 사용될 수 있거나, (또는 그에 따라 6, 9, 또는 12 개의 반복 버전) 뉴클레오플라스민의 NLS가 Cpf1와 작용 도메인 사이에서 링커로서 사용될 수 있다.
포화(saturating) 돌연변이 유발
본 명세서에 기재된 Cpf1 이펙터 단백질 시스템(들)은, 예를 들어 유전자 발현, 약물 내성 및 질병의 전환에 요구되는 작용 요소의 개별 취약성 및 임계 최소 특징의 결정을 위해 세포 표현형과 함께 게놈 유전자좌의 포화 또는 딥 스캐닝 돌연변이 유발을 수행하는데 사용될 수 있다. 포화 또는 딥 스캐닝 돌연변이 유발이라 함은 모든 또는 본질적으로 모든 DNA 염기가 게놈 유전자좌 내에서 절단됨을 의미한다. Cpf1 이펙터 단백질 가이드 RNA의 라이브러리는 세포의 집단 내로 도입될 수 있다. 라이브러리가 도입될 수 있어서, 각각의 세포는 단일 가이드 RNA(gRNA)를 수령하게 된다. 라이브러리가 본 명세서에서 설명된 바와 같은 바이러스 벡터의 형질도입에 의해 도입되는 경우, 낮은 감염 다중도(MOI)가 사용된다. 라이브러리는 게놈 유전자좌에서 (프로토스페서 인접 모티프)(PAM) 서열의 상류에 있는 모든 서열을 표적화하는 gRNA를 포함할 수 있다. 라이브러리는 게놈 유전자좌 내의 모든 1000 개의 베이스 염기쌍에 대해 PAM의 상류에서 100 개 이상의 비-중복 게놈 서열을 포함할 수 있다. 라이브러리는 하나 이상의 상이한 PAM 서열의 상류에서 서열을 표적화하는 gRNA를 포함할 수 있다. Cpf1 이펙터 단백질 시스템은 하나 초과의 Cpf1 단백질을 포함할 수 있다. 본 명세서에서 기재된 바와 같은, 상이한 PAM 서열을 인식하는 오솔로그 또는 조작된 Cpf1 이펙터 단백질을 포함하는, 임의의 Cpf1 이펙터 단백질이 사용될 수 있다. gRNA에 대한 표적외 부위의 빈도는 500 개 미만일 수 있다. 표적외 점수는 최저 표적외 부위를 갖는 gRNA를 선택하기 위해 생성될 수 있다. gRNA 표적 부위에서의 절단과 연관되는 것으로 결정된 임의의 표현형은 gRNA의 표적화를 단일 시험에서 동일한 부위를 이용함으로써 확인될 수 있다. 표적 부위의 확인은 본 명세서에서 설명된 바와 같은, 변형된 Cpf1 이펙터 단백질, 및 관심 게놈 부위를 표적화하는 두 개의 gRNA를 이용함으로써 수행될 수도 있다. 이론에 구애되고자 하지는 않지만, 표현형에서의 변화가 확인 실험에서 관찰된다면, 표적 부위가 제대로 확인된 것이다.
게놈 유전자좌는 하나 이상의 연속적인 게놈 영역을 포함할 수 있다. 하나 이상의 연속적인 게놈 영역은 전체에 달하는 게놈을 포함할 수 있다. 하나 이상의 연속적인 게놈 영역은 게놈의 작용 요소를 포함할 수 있다. 작용 요소는 비-코딩 영역, 코딩 유전자, 인트론성 영역, 프로모터, 또는 인핸서 내에 있을 수 있다. 하나 이상의 연속적인 게놈 영역은 1 kb 이상, 바람직하게는 50 kb 이상의 게놈 DNA를 포함할 수 있다. 하나 이상의 연속적인 게놈 영역은 전사 인자 결합 부위를 포함할 수 있다. 하나 이상의 연속적인 게놈 영역은 DN나제 I 과민성의 영역을 포함할 수 있다. 하나 이상의 연속적인 게놈 영역은 전사 인핸서 또는 억제제 요소를 포함할 수 있다. 하나 이상의 연속적인 게놈 영역은 후생적 시그니쳐(signature)에 대해 풍부화된 부위를 포함할 수 있다. 하나 이상의 연속적인 게놈 영역은 후생적 인슐레이터(insulator)를 포함할 수 있다. 하나 이상의 연속적인 게놈 영역은 물리적으로 상호작용하는 둘 이상의 연속적인 게놈 영역을 포함할 수 있다. 상호작용하는 게놈 영역은 '4C 기술'에 의해 결정될 수 있다. 4C 기술은, 본 명세서에 그 전체로 참고문헌으로 통합된, 문헌[Zhao et al. ((2006) Nat Genet 38, 1341-7)] 및 미국 특허 8,642,295호에 기재된 바와 같이, 선택 DNA 단편과 물리적으로 상호작용하는 DNA 세그먼트에 대해 비편향된 방식으로 전체 게놈의 스크리닝을 가능하게 한다. 후생적 시그니쳐는 히스톤 아세틸화, 히스톤 메틸화, 히스톤 유비퀴틴화, 히스톤 포스포릴화, DNA 메틸화 또는 그의 결여일 수 있다.
포화 또는 딥 스캐닝 돌연변이 유발을 위한 Cpf1 이펙터 단백질 시스템(들)은 세포의 집단에서 사용될 수 있다. Cpf1 이펙터 단백질 시스템(들)은, 이로 제한되지는 않지만, 포유 동물 및 식물 세포를 포함하는, 진핵 세포에서 사용될 수 있다. 세포의 집단은 원핵 세포일 수 있다. 진핵 세포의 집단은 배아 줄기 (ES) 세포, 뉴런 세포, 상피 세포, 면역 세포, 내분비 세포, 근육 세포, 적혈구, 림프구, 식물 세포 또는 효모 세포의 집단일 수 있다.
일 양태에서, 본 발명은 표현형에서의 변화와 연관된 작용 요소에 대한 스크리닝 방법을 제공한다. 라이브러리는 Cpf1 이펙터 단백질을 함유하도록 조정된 세포 집단 내로 도입될 수 있다. 세포는 표현형을 기준으로 둘 이상의 군으로 분류될 수 있다. 표현형은 유전자, 세포 성장, 또는 세포 생육력의 발현일 수 있다. 각 군에 존재하는 가이드 RNA의 상대적 표시가 결정되며, 이로 인해 표현형에서의 변화와 연관된 게놈 부위는 각 군에 존재하는 가이드 RNA의 표시에 의해 결정될 수 있다. 표현형에서의 변화는 관심 유전자의 발현에서의 변화일 수 있다. 관심 유전자는 상향조절, 하향조절, 또는 낙아웃될 수 있다. 세포는 고발현 군과 저발현 군으로 분류될 수 있다. 세포 집단은 표현형을 결정하는데 사용되는 리포터 작제물을 포함할 수 있다. 리포터 작제물은 검출가능한 마커를 포함할 수 있다. 세포는 검출가능한 마커의 이용에 의해 분류될 수 있다.
또 다른 양태에서, 본 발명은 화학 화합물에 대한 내성과 연관된 게놈 부위의 스크리닝 방법을 제공한다. 화학 화합물은 약물 또는 살충제일 수 있다. 라이브러리는 Cpf1 이펙터 단백질을 함유하도록 조절된 세포 집단 내로 도입될 수 있으며, 여기서 집단의 세포 각각은 단지 하나의 가이드 RNA를 함유하며, 세포 집단은 화학 화합물로 처리되며; 가이드 RNA의 표시는 초기 시점에 비하여, 이후의 시점에서 화학 화합물로 처리 후에 결정되며, 이로 인해 화학 화합물에 대한 내성과 연관된 부위는 가이드 RNA의 풍부화에 의해 결정된다. gRNA의 표시는 딥 시퀀싱 방법에 의해 결정될 수 있다.
Cpf1 이펙터 단백질 복합체를 이용하는 본 발명의 실시에 있어서 CRISPR-Cas9 시스템에서 사용되는 방법이 유용하고, Cas9-매개된 동일계내 포화 돌연변이유발에의한 BCL11A 인핸서 절제(BCL11A enhancer dissection by Cas9-mediated in situ saturating mutagenesis)라는 명칭의 논문이 언급된다. 논문[Canver, M.C., Smith, E.C., Sher, F., Pinello, L., Sanjana, N.E., Shalem, O., Chen, D.D., Schupp, P.G., Vinjamur, D.S., Garcia, S.P., Luc, S., Kurita, R., Nakamura, Y., Fujiwara, Y., Maeda, T., Yuan, G., Zhang, F., Orkin, S.H., & Bauer, D.E. DOI:10.1038/nature15521, 2015년 9월 16일 간행]은 참고문헌으로 본 명세서에 통합되고, 아래 간략히 논의된다:
Canver외 다수의 문헌은, 이전에 태아 헤모글로빈 (HbF) 수준과 연관된 인핸서로서, 그의 마우스 오솔로그가 적혈구 BCL11A 발현에 필요한 것으로 확인된, 인간 및 마우스 BCL11A 적혈구 인핸서의 현장 포화 돌연변이 유발을 수행하기 위하여 신규 풀화된(pooled) CRISPR-Cas9 가이드 RNA 라이브러리를 수반한다. 이 시도는 이들 인핸서의 임계 최소 특징 및 개별 취약성을 밝혔다. 일차 인간 조상 및 마우스 유전자이식의 편집을 통해, 저자는 BCL11A 적혈구 인핸서를 HbF 재도입을 위한 표적으로서 확인하였다. 저자는 치료적 게놈 편집을 알려주는 상세한 인핸서 맵을 생성하였다.
세포 또는 생물을 변형시키기 위하여 Cpf1 시스템을 이용하는 방법
일부 구현예에서 본 발명은 세포 또는 생물을 변형시키는 방법을 포함한다. 세포는 원핵 세포 또는 진핵 세포일 수 있다. 세포는 포유 동물 세포일 수 있다. 포유 동물 세포는 많은 경우 비-인간 영장류, 소, 돼지, 설치류 또는 마우스 세포일 수 있다. 세포는 가금류, 어류 또는 새우와 같은 비-포유 동물 진핵 세포일 수 있다. 세포는 식물일 수도 있다. 식물 세포는 카사바, 옥수수, 수수, 밀 또는 쌀과 같은 작물 식물의 것일 수 있다. 식물 세포는 또한 조류, 나무 또는 채소일 수 있다. 본 발명에 의해 세포에 도입된 변형은, 세포 및 세포의 자손이 항체, 전분, 알코올 또는 기타 바람직한 세포 산출물과 같은 생물학적 생성물의 개선된 생산에 대해 변경되도록 할 수 있다. 본 발명에 의해 세포에 도입된 변형은, 세포 및 세포의 자손이 생산된 생물학적 생성물을 변화시키는 변경을 포함하도록 할 수 있다.
세포를 패키징하는 것은 통상적으로 숙주 세포를 감염시킬 수 있는 바이러스 입자를 형성하는 데 사용된다. 이러한 세포는, 아데노바이러스를 패키징하는 293 세포를 포함하고, 레트로바이러스를 패키징하는 ψ2 세포 또는 PA317 세포를 포함한다. 유전자 치료법에서 사용되는 바이러스 벡터는 보통 핵산 벡터를 바이러스 입자로 패키징하는 세포주를 생성함으로써 생성된다. 벡터는 통상적으로 숙주로의 패키징 및 후속 통합에 요구되는 최소 바이러스 서열을 함유하고, 기타 다른 바이러스 서열은 발현될 폴리뉴클레오티드(들)에 있어서 발현 카세트에 의해 대체된다. 누락된 바이러스 작용은 통상적으로 패키징 세포주에 의해 트랜스로 공급된다. 예를 들어, 유전자 치료법에서 사용되는 AAV 벡터는 통상적으로 숙주 게놈으로의 패키징 및 통합에 요구되는, AAV 게놈 유래의 ITR 서열만을 가진다. 바이러스 DNA는 세포주에서 패키징되고, 이는 기타 다른 AAV 유전자를 인코딩하는 헬퍼 플라스미드, 즉 rep 및 cap를 함유하지만, ITR 서열은 결여되어 있다. 세포주는 또한 헬퍼로서 아데노바이러스로 감염될 수 있다. 헬퍼 바이러스는 AAV 벡터의 복제 및 헬퍼 플라스미드로부터 AAV 유전자의 발현을 촉진시킨다. 헬퍼 플라스미드는 ITR 서열의 결여로 인하여 상당한 양으로 패키징되지 않는다. 아데노바이러스로 인한 오염은, 예를 들어 아데노바이러스가 AAV보다 더 민감한 열 처리에 의해 감소될 수 있다.
또 다른 구현예에서, 코컬(Cocal) 수포성바이러스 외피 위형(pseudotyped) 레트로바이러스 벡터 입자가 고려된다(예를 들어, Fred Hutchinson Cancer Research Center에 수여된 미국 특허 공개 20120164118 참조). 코컬 바이러스는 수포성바이러스 속에 속하고, 포유동물에서 수포성 구내염의 원인 물질이다. 코컬 바이러스는 원래 트리니다드에서 진드기로부터 분리되었고(문헌[Jonkers et al., Am. J. Vet. Res. 25:236-242 (1964)]), 트리니다드, 브라질 및 아르헨티나에서, 곤충, 소 및 말에서 감염이 확인되었다. 포유동물을 감염시키는 다수의 수포성바이러스가 자연적으로 감염된 절지동물로부터 분리되었으며, 이는 이들이 매개체 전염성임을 제안한다. 수포성바이러스에 대한 항체는 그 바이러스가 풍토성이며 실험실-획득된 시골 지역에 사는 사람들 중에는 흔하며; 인간에서의 감염은 보통 독감-유사 증상을 초래한다. 코컬 바이러스 외피 당단백질은 VSV-G 인디아나와 아미노산 수준에서 71.5%의 동일성을 공유하고, 수포성바이러스의 외피 유전자의 계통발생적 비교는 코컬 바이러스가 수포성 바이러스 중 VSV-G 인디아나 균주가 혈청학적으로는 구분되지만 가장 가깝게 관련됨을 나타낸다. 문헌[Jonkers et al., Am. J. Vet. Res. 25:236-242 (1964)] 및 [Travassos da Rosa et al., Am. J. Tropical Med. & Hygiene 33:999-1006 (1984)]. 코컬 수포성바이러스 외피 위형 레트로바이러스 벡터 입자는, 예를 들어 렌티바이러스, 알파레트로바이러스, 베타레트로바이러스, 감마레트로바이러스, 델타레트로바이러스, 및 엡실론레트로바이러스 벡터 입자를 포함할 수 있으며, 이는 레트로바이러스 Gag, Pol, 및/또는 하나 이상의 액세서리 단백질(들) 및 코컬 수포성바이러스 외피 단백질을 포함할 수 있다. 이들 구현예의 특정 양태 내에서, Gag, Pol, 및 액세서리 단백질은 렌티바이러스 및/또는 감마레트로바이러스성이다. 본 발명은 CRISPR 시스템을 인코딩하는 외인성 핵산 분자를 함유하거나 이로 본질적으로 이루어지는 AAV, 예를 들어 프로모터, CRISPR-회합된(Cas) 단백질을 인코딩하는 핵산 분자(추정적 뉴클레아제 또는 헬리카제 단백질), 예를 들어 Cpf1 및 종결자를 포함하거나 이로 본질적으로 이루어지는 제1 카세트, 및 둘 이상의 유리하게는 벡터의 패키징 크기 한계 이하로, 예를 들어 (제1 카세트를 포함하여) 총 5 개의, 프로모터, 가이드 RNA(gRNA)를 인코딩하는 핵산 분자 및 종결자를 포함하거나 이로 본질적으로 이루어지는 카세트를 포함하거나 이로 이루어지는 다수의 카세트(예를 들어, 각각의 카세트는 프로모터-gRNA1-종결자, 프로모터-gRNA2-종결자 ... 프로모터-gRNA(N)-종결자(여기서, N은 벡터의 패키징 크기 한계의 상한치로 삽입될 수 있는 수임)로서 도식적으로 표시됨), 또는 둘 이상의 개별적인 rAAV를 제공하며, 이들 각각은 CRISPR 시스템의 하나 이상의 카세트를 함유하고, 예를 들어 제1 rAAV는 프로모터, Cas를 인코딩하는 핵산 분자, 예를 들어 Cas (Cpf1) 및 종결자를 포함하거나 이로 본질적으로 이루어지는 제1 카세트를 함유하며, 제2 rAAV는 프로모터, 가이드 RNA(gRNA)를 인코딩하는 핵산 분자 및 종결자를 포함하거나 이로 본질적으로 이루어지는 다수의, 즉 4 개의 카세트를 함유한다(예를 들어, 각각의 카세트는 프로모터-gRNA1-종결자, 프로모터-gRNA2-종결자 ... 프로모터-gRNA(N)-종결자(여기서, N은 벡터의 패키징 크기 한계의 상한치로 삽입될 수 있는 수임)로서 도식적으로 표시됨). rAAV는 DNA 바이러스이기 때문에, AAV 또는 rAAV에 관한 본 명세서에서의 논의에서 핵산 분자는 유리하게는 DNA이다. 프로모터는 일부 구현예에서 유리하게는 인간 Synapsin I 프로모터이다(hSyn). 핵산의 세포로의 전달을 위한 추가적인 방법은 당업자들에게 알려져 있다. 예를 들어, 본 명세서에 참고로 포함된 US20030087817을 참조한다.
일부 구현예에서, 숙주 세포는 본 명세서에 기재된 하나 이상의 벡터로 일시적으로 또는 비-일시적으로 트랜스펙션된다. 일부 구현예에서, 세포는 대상체에서 자연적으로 발생하기 때문에 트랜스펙션된다. 일부 구현예에서, 트랜스펙션된 세포는 대상체로부터 취한다. 일부 구현예에서, 세포는 대상체로부터 취한 세포로부터 유래되며, 예컨대 세포주이다. 조직 배양을 위한 매우 다양한 세포주가 당업계에 알려져 있다. 세포주의 예로는 이로 제한되지 않지만, C8161, CCRF-CEM, MOLT, mIMCD-3, NHDF, HeLa-S3, Huh1, Huh4, Huh7, HUVEC, HASMC, HEKn, HEKa, MiaPaCell, Panc1, PC-3, TF1, CTLL-2, C1R, Rat6, CV1, RPTE, A10, T24, J82, A375, ARH-77, Calu1, SW480, SW620, SKOV3, SK-UT, CaCo2, P388D1, SEM-K2, WEHI-231, HB56, TIB55, Jurkat, J45.01, LRMB, Bcl-1, BC-3, IC21, DLD2, Raw264.7, NRK, NRK-52E, MRC5, MEF, Hep G2, HeLa B, HeLa T4, COS, COS-1, COS-6, COS-M6A, BS-C-1 원숭이 신장 상피세포, BALB/ 3T3 마우스 배아 섬유아세포, 3T3 Swiss, 3T3-L1, 132-d5 인간 태아 섬유아세포; 10.1 마우스 섬유아세포, 293-T, 3T3, 721, 9L, A2780, A2780ADR, A2780cis, A172, A20, A253, A431, A-549, ALC, B16, B35, BCP-1 세포, BEAS-2B, bEnd.3, BHK-21, BR 293, BxPC3, C3H-10T1/2, C6/36, Cal-27, CHO, CHO-7, CHO-IR, CHO-K1, CHO-K2, CHO-T, CHO Dhfr -/-, COR-L23, COR-L23/CPR, COR-L23/5010, COR-L23/R23, COS-7, COV-434, CML T1, CMT, CT26, D17, DH82, DU145, DuCaP, EL4, EM2, EM3, EMT6/AR1, EMT6/AR10.0, FM3, H1299, H69, HB54, HB55, HCA2, HEK-293, HeLa, Hepa1c1c7, HL-60, HMEC, HT-29, Jurkat, JY 세포, K562 세포, Ku812, KCL22, KG1, KYO1, LNCap, Ma-Mel 1-48, MC-38, MCF-7, MCF-10A, MDA-MB-231, MDA-MB-468, MDA-MB-435, MDCK II, MDCK II, MOR/0.2R, MONO-MAC 6, MTD-1A, MyEnd, NCI-H69/CPR, NCI-H69/LX10, NCI-H69/LX20, NCI-H69/LX4, NIH-3T3, NALM-1, NW-145, OPCN / OPCT 세포주, Peer, PNT-1A / PNT 2, RenCa, RIN-5F, RMA/RMAS, Saos-2 세포, Sf-9, SkBr3, T2, T-47D, T84, THP1 세포주, U373, U87, U937, VCaP, Vero 세포, WM39, WT-49, X63, YAC-1, YAR, 및 이들의 유전자이식 변형들을 포함한다. 세포주는 당업자에게 알려진 다양한 공급원으로부터 입수가능하다(예를 들어, 미국 균주 은행(American Type Culture Collection; ATCC)(미국 버지니아주 매나서스 소재) 참조). 일부 구현예에서, 본 명세서에 기재된 하나 이상의 벡터로 트랜스펙션된 세포는 하나 이상의 벡터-유래된 서열을 포함하는 신규 세포주를 구축하는 데 사용된다. 일부 구현예에서, 본 명세서에 기재된 바와 같은 CRISPR 시스템의 성분으로 일시적으로 트랜스펙션되고(예컨대, 하나 이상의 벡터의 일시 트랜스펙션, 또는 RNA를 이용한 트랜스펙션에 의해), CRISPR 복합체의 활성을 통하여 변형된 세포는 변형을 포함하지만 임의의 기타 다른 외인성 서열은 결여한 세포를 포함하는 새로운 세포주를 수립하는 데 사용된다. 일부 구현예에서, 본 명세서에 기재된 하나 이상의 벡터를 이용하여 일시적으로 또는 비-일시적으로 트랜스펙션된 세포, 또는 이러한 세포로부터 유래된 세포주는 하나 이상의 시험 화합물을 평가하는 데 사용된다.
일부 구현예에서, 본 명세서에 기재된 하나 이상의 벡터가 비-인간 유전자이식 동물 또는 유전자이식 식물을 생산하는 데 사용된다. 일부 구현예에서, 유전자이식 동물은 포유동물, 예컨대 마우스, 래트 또는 토끼다. 유전자이식 동물 및 식물의 생산 방법은 당업계에 알려져 있으며, 일반적으로 본 명세서에 기재된 바와 같은 세포 트랜스펙션의 방법을 이용하여 시작된다. 또 다른 구현예에서, 바늘의 어레이를 갖는 유체 전달 장치(예를 들어, Fred Hutchinson Cancer Research Center에게 수여된 미국 특허 공개 20110230839 참조)는 고체 조직으로 CRISPR Cas의 전달을 위해 고려될 수 있다. 고체 조직으로의 유체의 전달을 위한 미국 특허 공개 20110230839의 장치는 어레이 내에 배열된 다수의 바늘; 다수의 바늘의 각각과 소통하는 각 유체의 다수의 저장소; 및 다수의 저장소의 각각과 작동 가능하게 커플링되고 저장소 내의 유체 압력 제어를 위해 설계된 다수의 액츄에이터를 포함할 수 있다. 특정 구현예에서 다수의 액츄에이터 각각은 다수의 플런저 중 하나인 다수의 저장소 각각에서 받아지는 다수의 플런저 각각의 제1 말단을 포함할 수 있으며, 특정 추가 구현예에서 다수의 플런저 중의 플런저는 제2 말단 각각과 함께 작동 가능하게 커플링되어 동시에 누를 수 있다. 특정한 또 다른 구현예는 선택적으로 가변적인 비율로 다수의 플런저 모두를 누르도록 설계된 플런저 드라이버를 포함할 수 있다. 다른 구현예에서 다수의 액츄에이터 각각은 제1 말단 및 제2 말단을 갖는 다수의 유체 전달 라인 중 하나를 포함할 수 있으며, 다수의 유체 전달 라인 각각의 제1 말단은 다수의 저장소 각각에 커플링된다. 다른 구현예에서 장치는 유체 압력원을 포함할 수 있으며, 각각의 다수의 액츄에이터는 유체 압력원 및 다수의 저장소 각각 사이에 커플링된 유체를 포함한다. 추가 구현예에서 유체 압력원은 적어도 하나의 컴프레서, 진공 어큐뮬레이터, 연동 펌프, 마스터 실린더, 미세유체 펌프 및 밸브를 포함할 수 있다. 또 다른 구현예에서, 각각의 다수의 바늘은 이의 길이에 따라 분포된 다수의 포트를 포함할 수 있다.
일 양태에서, 본 발명은 원핵 또는 진핵 세포 내에서 표적 폴리뉴클레오티드를 변형하는 방법을 제공한다. 일부 구현예에서, 본 방법은 핵산-표적화 복합체가 표적 폴리뉴클레오티드에 결합하도록 허용하는 것을 포함하여, 상기 표적 폴리뉴클레오티드를 절단시켜, 이에 의해 표적 폴리뉴클레오티드를 변형시키고, 여기서 핵산-표적화 복합체는 상기 표적 폴리뉴클레오티드 내에서 표적 서열에 혼성화된 가이드 RNA와 복합체화된 핵산-표적화 이펙터 단백질를 포함한다.
CRISPR 복합체 성분은 (예를 들어, 미국 특허 8,106,022; 8,313,772에 개시된 접근으로부터 적합화된) 전달 모이어티와의 컨쥬게이션 또는 회합에 의해 전달될 수 있다. 핵산 전달 전략은, 예를 들어 가이드 RNA, 또는 메신저 RNA 또는 CRISPR 복합체 성분을 인코딩하는 코딩 DNA의 전달을 개선시키는 데 사용될 수 있다. 예를 들어, RNA는 안정성을 개선시키고/개선시키거나, 면역자극을 감소시키고/감소시키거나, 특이성을 개선시키기 위해 변형된 RNA 뉴클레오티드를 혼입시킬 수 있다(문헌[Deleavey, Glen F. et al., 2012, Chemistry & Biology, Volume 19, Issue 8, 937 - 954]; [Zalipsky, 1995, Advanced Drug Delivery Reviews 16: 157-182]; [Caliceti and Veronese, 2003, Advanced Drug Delivery Reviews 55: 1261-1277] 참조). 보다 소수성이고 비-음이온성이도록 gRNA를 변형시키기 위해 적합화될 수 있고, 이에 의해 세포 진입을 개선시킬 수 있는 가역성 전하 중화 포스포트리에스테르 백본 변형과 같은 보다 효율적인 전달을 위하여, 핵산, 예컨대 gRNA를 변형시키는 데 사용될 수 있는 다양한 작제물이 기재되었다(문헌[Meade BR et al., 2014, Nature Biotechnology 32,1256-1261]). 추가의 대안적인 구현예에서, 선택된 RNA 모티프는 세포 트랜스펙션을 매개하는 데 유용할 수 있다(문헌[Magalhaes M., et al., Molecular Therapy (2012); 20 3, 616-624]). 유사하게, 압타머는, 예를 들어 압타머를 gRNA에 추가함으로써 CRISPR 복합체 성분의 전달을 위해 적합화될 수 있다(문헌[Tan W. et al., 2011, Trends in Biotechnology, December 2011, Vol. 29, No. 12]).
일부 구현예에서, 트리안테나(triantennary) N-아세틸 갈락토사민(GalNAc)의 올리고뉴클레오티드 성분으로의 컨쥬게이션은 전달, 예를 들어 세포 유형, 예를 들어 간세포를 선택하기 위한 전달을 개선하는 데 사용될 수 있다(본 명세서에 참고로 포함된, WO2014118272; 문헌[Nair, JK et al., 2014, Journal of the American Chemical Society 136 (49), 16958-16961] 참조). 이는 당-기반 입자인 것으로 여겨질 수 있으며, 기타 다른 입자 전달 시스템 및/또는 제형에 대한 추가의 상세한 내용이 본 명세서에서 제공된다. 따라서, GalNAc는 본 명세서에 기재된 기타 다른 입자들의 의미에서 입자로서 여겨질 수 있어서, 일반 용도 및 기타 다른 고려사항들, 예를 들어 상기 입자의 전달은 GalNAc 입자에도 역시 적용된다. 용액-상 컨쥬게이션 전략이, 예를 들어 PFP(펜타플루오로페닐) 에스테르로서 활성화된 트리안테나 GalNAc 클러스터(분자량 약 2000)를 5'-헥실아미노 변형된 올리고뉴클레오티드(5'-HA ASO, 분자량 약 8000 Da; 문헌[Østergaard et al., Bioconjugate Chem., 2015, 26 (8), pp 1451-1455]) 상에서 부착시키는 데 사용될 수 있다. 유사하게, 폴리(아크릴레이트) 중합체는 생체 내 핵산 전달에 대해 기재되었다(본 명세서에 참고로 포함된, WO2013158141 참조). 추가의 대안적인 구현예에서, 천연 발생 혈청 단백질과의 사전-혼합 CRISPR 나노입자(또는 단백질 복합체)가, 전달을 개선하기 위하여 사용될 수 있다(문헌[Akinc A et al, 2010, Molecular Therapy vol. 18 no. 7, 1357-1364]).
일부 구현예에서, 단백질 CRISPR 성분의 전달은 작용 펩티드, 예를 들어 생체 내 작용성을 개선시키기 위하여, 예컨대 단백질 소수성을 변화시키는 펩티드의 단백질로의 첨가로 촉진될 수 있다. CRISPR 성분 단백질은 후속적인 화학 반응을 촉진하기 위하여 유사하게 변형될 수 있다. 예를 들어, 아미노산은 클릭 화학(click chemistry)을 거치는 기를 갖는 단백질에 첨가될 수 있다(문헌[
Figure pat00026
I. et al., 2015, Nature Protocols 10,780-791]). 이러한 종류의 구현예에서, 클릭 화학 기는 매우 다양한 대안적인 구조물, 예컨대 안정성을 위해 폴리(에틸렌 글리콜), 세포 침투 펩티드, RNA 압타머, 지질, 또는 GalNAc와 같은 탄수화물을 첨가하는 데 사용될 수 있다. 추가의 대안에서, CRISPR 성분 단백질은, 예를 들어 세포 침투 펩티드를 단백질에 첨가함으로써(문헌[Kauffman, W. Berkeley et al., 2015, Trends in Biochemical Sciences, Volume 40, Issue 12, 749 - 764]; [Koren and Torchilin, 2012, Trends in Molecular Medicine, Vol. 18, No. 7] 참조), 변형되어 세포 진입을 위해 단백질을 적합화할 수 있다(문헌[Svensen et al., 2012, Trends in Pharmacological Sciences, Vol. 33, No. 4] 참조). 추가의 대안적인 구현예에서, 환자 또는 대상체는 CRISPR 성분의 이후 전달을 촉진하는 화합물 또는 제형으로 예비처리될 수 있다.
스크리닝 기법은, 예를 들어 화학물질 라이브러리를 스크리닝함으로써 전달 인핸서를 확인하는 데 이용가능하다(문헌[Gilleron J. et al., 2015, Nucl. Acids Res. 43 (16): 7984-8001]). CRISPR 성분에 대한 효과적인 전달 비히클을 확인하기 위해 이용될 수 있는 전달 비히클, 예컨대 지질 나노입자의 효율을 평가하기 위한 접근들이 또한 기재되어 왔다(문헌[Sahay G. et al., 2013, Nature Biotechnology 31, 653-658] 참조).
Cpf1 이펙터 단백질 복합체는 식물에서 사용될 수 있다
Cpf1 이펙터 단백질 시스템(들)(예를 들어, 단일 또는 다중화)은 작물 유전체학에서의 최근의 진전과 함께 사용될 수 있다. 본 명세서에 기재된 시스템은 효율적 및 비용 효과적으로 식물 유전자 또는 게놈 측정 또는 편집 또는 조작(예를 들어, 식물 유전자 또는 게놈의 신속한 조사 및/또는 선택 및/또는 측정 및/또는 비교 및/또는 조작 및/또는 형질전환)을 실행하는 데 사용될 수 있으며; 예를 들어 특성(들) 또는 특징(들)을 형성, 확인, 발생, 최적화 또는 식물(들)에게 부여 또는 식물 게놈을 형질전환한다. 따라서 식물, 특성 또는 특징의 새로운 조합을 갖는 새로운 식물 또는 향상된 특성을 갖는 새로운 식물의 개선된 생산이 있을 수 있다. 그러한 Cpf1 이펙터 단백질 시스템(들)은 식물에 대하여 부위-유도된 통합(SDI) 또는 유전자 편집(GE) 또는 임의의 근접 역전 브리딩(NRB) 또는 역전 브리딩(RB) 기법에서 사용될 수 있다. 본 명세서에 기재된 Cpf1 이펙터 단백질 시스템의 이용 양태는 식물에서 CRISPR-Cas(예를 들어, CRISPR-Cas9) 시스템의 사용과 유사할 수 있으며, 아리조나 대학 웹사이트 "CRISPR-PLANT"(http://www.genome.arizona.edu/crispr/)(Penn State 및 AGI 후원)가 언급된다. 본 발명의 구현예는 식물에서 또는 RNAi 또는 유사한 게놈 편집 기술이 이미 사용된 곳에서 게놈 편집에 사용될 수 있다; 예를 들어, 문헌 [Nekrasov, "Plant genome editing made easy: targeted mutagenesis in model and crop plants using the CRISPR-Cas system," Plant Methods 2013, 9:39 (doi:10.1186/1746-4811-9-39)]; 문헌 [Brooks, "Efficient gene editing in tomato in the first generation using the CRISPR-Cas9 system," Plant Physiology September 2014 pp 114.247577]; 문헌 [Shan, "Targeted genome modification of crop plants using a CRISPR-Cas system," Nature Biotechnology 31, 686-688 (2013)]; 문헌 [Feng, "Efficient genome editing in plants using a CRISPR/Cas system," Cell Research (2013) 23:1229-1232. doi:10.1038/cr.2013.114; 2013년 8월 20일 온라인 간행됨]; 문헌 [Xie, "RNA-guided genome editing in plants using a CRISPR-Cas system," Mol Plant. 2013 Nov;6(6):1975-83. doi: 10.1093/mp/sst119. 2013년 8월 17일 전자출판]; 문헌 [Xu, "Gene targeting using the Agrobacterium tumefaciens-mediated CRISPR-Cas system in rice," Rice 2014, 7:5 (2014)]; 문헌 [Zhou et al., "Exploiting SNPs for biallelic CRISPR mutations in the outcrossing woody perennial Populus reveals 4-coumarate: CoA ligase specificity and Redundancy," New Phytologist (2015) (Forum) 1-4 (www.newphytologist.com에서만 온라인으로만 이용가능)]; 문헌 [Caliando et al, "Targeted DNA degradation using a CRISPR device stably carried in the host genome, NATURE COMMUNICATIONS 6:6989, DOI: 10.1038/ncomms7989, www.nature.com/naturecommunications DOI: 10.1038/ncomms7989]; 미국 특허 6,603,061 - Agrobacterium-Mediated Plant Transformation Method; 미국 특허 7,868,149 - Plant Genome Sequences and Uses Thereof, 및 미국 2009/0100536 - Transgenic Plants with Enhanced Agronomic Traits 참조, 이들 각각의 내용 및 개시 내용 모두는 그 전체로 본 명세서에 참고문헌으로 포함된다. 본 발명의 실시에서, 문헌 [Morrell et al "Crop genomics: advances and applications," Nat Rev Genet. 2011 Dec 29;13(2):85-96]의 내용 및 개시 내용; 이들 각각은, 본 명세서의 구현예가 식물에 대하여 어떻게 사용되는지를 포함하여, 본 명세서에서 참고문헌으로 통합된다. 따라서, 동물 세포에 대한 본 명세서의 참고문헌 또한 달리 명백하지 않은 경우, 식물 세포에 또한 적절한 변형을 가하여 적용될 수 있고; 본 명세서에서 감소된 표적외 효과를 갖는 효소 및 그러한 효소를 사용하는 시스템은, 본 명세서에서 언급된 것들을 포함하여, 식물 응용분야에서 사용될 수 있다.
Cpf1-CRISPR 시스템의 식물 및 효모에의 적용
정의
일반적으로, "식물"이라는 용어는 특징적으로 세포 분열에 의해 성장하고, 엽록소를 함유하고, 셀룰로오스로 구성된 세포벽을 갖는, 식물계의 임의의 각종 광합성, 진핵성, 단세포 또는 다세포 생물에 관한 것이다. 식물이라는 용어는 단자엽 식물 및 쌍자엽 식물을 포함한다. 구체적으로, 식물은 제한 없이 다음을 포함하고자 한다: 속씨 식물 및 겉씨 식물, 예컨대 아카시아, 알팔파, 아마란스, 사과, 살구, 아티초크, 물푸레나무, 아스파라거스, 아보카도, 바나나, 보리, 콩, 비트, 자작나무, 너도밤나무, 블랙베리, 블루베리, 브로콜리, 방울 양배추(Brussel’s sprout), 양배추, 카놀라, 칸탈루프, 당근, 카사바, 콜리플라워, 삼나무, 곡물, 셀러리, 밤, 체리, 중국 배추, 감귤류, 클레멘타인, 클로버, 커피, 옥수수, 목화, 동부, 오이, 사이프러스, 가지, 느릅나무, 꽃상추, 유칼립투스, 회향, 무화과, 전나무, 제라늄, 포도, 자몽, 땅콩, 꽈리, 검 헴록(gum hemlock), 히코리(hickory), 케일, 키위, 콜라비, 낙엽송, 상추, 대파, 레몬, 라임, 로커스트(locust), 소나무, 공작고사리(maidenhair), 메이즈, 망고, 단풍나무, 멜론, 기장, 버섯, 겨자, 견과류, 참나무, 귀리, 기름야자, 오크라(okra), 양파, 오렌지, 장식용 식물 또는 꽃 또는 나무, 파파야, 야자, 파슬리, 파스닙(parsnip), 콩, 복숭아, 땅콩, 배, 피트(peat), 후추, 감, 나무콩, 소나무, 파인애플, 플랜테인(plantain), 자두, 석류, 감자, 펌프킨(pumpkin), 라디키오(radicchio), 무, 유채, 라스베리, 쌀, 호밀, 수수, 홍화, 갯버들, 대두, 시금치, 가문비 나무, 호박, 딸기, 사탕무, 사탕수수, 해바라기, 고구마, 스위트콘, 귤, 녹차, 담배, 토마토, 나무, 라이밀(triticale), 잔디풀(turf grass), 순무, 포도나무, 호두, 물냉이, 수박, 밀, 참마(yam), 주목나무, 주키니(zucchini). 식물이라는 용어는, 뿌리, 잎 및 기타 고등 식물을 특징짓는 기타 기관이 적어서 주로 일차적으로 연합된 광독립영양생물인, 조류를 또한 포함한다.
본 명세서에 설명된 바와 같은 Cpf1 시스템을 이용하는 게놈 편집 방법은 바람직한 특성을 본질적으로 임의의 식물에 수여하는데 사용될 수 있다. 광범위한 종류의 식물 및 식물 세포 시스템은, 본 개시 내용의 핵산 구조물과 상기 언급된 각종 형질전환 방법을 이용하여 본 명세서에 설명된 바람직한 생리학적 및 작물학적 특징들에 대해, 조작될 수 있다. 바람직한 구현예에서, 조작을 위한 표적 식물 및 식물 세포는, 이로 제한되지는 않지만, 단자엽성 및 쌍자엽성 식물을 포함하며, 예컨대 곡류 작물(예를 들어, 밀, 메이즈, 쌀, 기장, 보리), 과실 작물(예를 들어, 토마토, 사과, 배, 딸기, 오렌지), 사료 작물(예를 들어, 알팔파), 뿌리 채소 작물(예를 들어, 당근, 감자, 사탕무, 참마), 옆채류 작물(예를 들어, 상추, 시금치)을 포함하는 작물; 화훼 식물(예를 들어, 페튜니아, 장미, 국화), 침엽수 및 소나무(예를 들어, 소나무, 전나무, 가문비나무); 식물환경정화에서 사용되는 식물(예를 들어, 중금속 축적 식물); 유료작물(oil crop)(예를 들어, 해바라기, 유채씨) 및 실험용 목적으로 사용되는 식물(예를 들어, 아라비돕시스). 따라서, 본 방법 및 CRISPR-Cas 시스템은 광범위한 식물에 걸쳐 사용될 수 있으며, 예를 들어 다음 목에 속하는 쌍자엽 식물이 있고: 마그니오랄레스(Magniolales), 일리시알레스(Illiciales), 녹나무목(Laurales), 후추목(Piperales), 아리스토키알레스(Aristochiales), 수련목(Nymphaeales), 미나리아재비목(Ranunculales), 파프베랄레스(Papeverales), 사라세니아세(Sarraceniaceae), 트로코덴드랄레스(Trochodendrales), 하마멜리달레스(Hamamelidales), 유코미알레스(Eucomiales), 레이트네리알레스(Leitneriales), 마이리칼레스(Myricales), 참나무목(Fagales), 카수아리날레스(Casuarinales), 석죽목(Caryophyllales), 바탈레스(Batales), 마디풀목(Polygonales), 갯질경이목(Plumbaginales), 오이과목(Dilleniales), 테알레스(Theales), 아욱목(Malvales), 쐐기풀목(Urticales), 오예목(Lecythidales), 제비꽃목(Violales), 버드나무목(Salicales), 십자화목(Capparales), 진달래목(Ericales), 디아펜살레스(Diapensales), 에베날레스(Ebenales), 앵초목(Primulales), 장미목(Rosales), 콩목(Fabales), 포도스테말레스(Podostemales), 할로라갈레스(Haloragales), 도금양목(Myrtales), 층층나무목(Cornales), 프로테아목(Proteales), 산 탈레스(San tales), 라플레시알레스(Rafflesiales), 노박덩굴목(Celastrales), 대극목(Euphorbiales), 갈매나무목(Rhamnales), 무환자나무목(Sapindales), 저그란달레스(Juglandales), 쥐손이풀목(Geraniales), 원지목(Polygalales), 움벨랄레스(Umbellales), 용담목(Gentianales), 꽃고비목(Polemoniales), 꿀풀목(Lamiales), 질경이목(Plantaginales), 현삼목(Scrophulariales), 초롱꽃목(Campanulales), 꼭두서니목(Rubiales), 산토끼꽃목(Dipsacales), 및 국화목(Asterales); 본 방법 및 CRISPR-Cas 시스템은 다음 목에 속하는 것과 같은 단자엽 식물과 함께 사용될 수 있으며: 택사목(Alismatales), 자러폰목(Hydrocharitales), 나자달레스(Najadales), 트리우리달레스(Triuridales), 닭의 장풀목(Commelinales), 에리오카우랄레스(Eriocaulales), 레스티오날레스(Restionales), 벼목(Poales), 준칼레스(Juncales), 사초목(Cyperales), 타이팔레스(Typhales), 브로멜리알레스(Bromeliales), 생강목(Zingiberales), 아레칼레스(Arecales), 사이클란탈레스(Cyclanthales), 판다너스목(Pandanales), 천남성목(Arales), 릴리알레스(Lilliales), 및 난목(Orchid ales), 또는 나자식물문(Gymnospermae)에 속하는 식물, 예를 들어 구과목(Pinales), 은행목(Ginkgoales), 소철목(Cycadales), 아라우카리알레스(Araucariales), 쿠페르살레스(Cupressales) 및 네탈레스(Gnetales) 목에 속하는 것들.
본 명세서에 설명된 Cpf1 CRISPR 시스템 및 사용 방법은 다음의 쌍자엽, 단자엽 또는 나자식물속의 비제한적인 리스트에 포함되는 광범위한 식물 종에 걸쳐 사용될 수 있다: 아트로파(Atropa), 알세오다프네(Alseodaphne), 아나카디움(Anacardium), 땅콩속(Arachis), 베일스미에디아(Beilschmiedia), 배추속(Brassica), 카르타무스(Carthamus), 댕댕이덩굴속(Cocculus), 파두속(Croton), 오이속(Cucumis), 감귤속(Citrus), 수박속(Citrullus), 고추속(Capsicum), 카사란터스(Catharanthus), 코코스(Cocos), 커피나무속(Coffea), 호박속(Cucurbita), 당근속(Daucus), 두그에티아(Duguetia), 에쉬솔지아(Eschscholzia), 피쿠스속(Ficus), 딸기속(Fragaria), 글라우시움(Glaucium), 글리신(Glycine), 고시피움(Gossypium), 해바라기속(Helianthus), 히비어(Hevea), 사리풀속(Hyoscyamus), 상추속(Lactuca), 란돌피아(Landolphia), 아마속(Linum), 릿시(Litsea), 토마토속(Lycopersicon), 루피너스(Lupinus), 마니호트(Manihot), 마요라나(Majorana), 말루스(Malus), 개자리속(Medicago), 담배속(Nicotiana), 올리아(Olea), 파르테늄(Parthenium), 양귀비속(Papaver), 페르세아(Persea), 파세올루스(Phaseolus), 피스타시아(Pistacia), 피섬(Pisum), 파이루스(Pyrus), 살구속(Prunus), 라파누스(Raphanus), 피마자속(Ricinus), 세네시오(Senecio), 방기속(Sinomenium), 스테파니아(Stephania), 시나피스(Sinapis), 가지속(Solanum), 테오브로마(Theobroma), 트리폴리움(Trifolium), 트리고넬라(Trigonella), 나비나물속(Vicia), 빙카속(Vinca), 빌리스(Vilis), 및 비냐(Vigna); 및 다음의 속: 파속(Allium), 쇠풀속(Andropogon), 아라그로스티스(Aragrostis), 아스파라거스(Asparagus), 아베나속(Avena), 시노돈(Cynodon), 엘라에이스(Elaeis), 페스투카(Festuca), 페스툴로리움(Festulolium), 헤테로칼리스(Heterocallis), 호르데움(Hordeum), 렘나(Lemna), 롤리움(Lolium), 무사(Musa), 벼속(Oryza), 수수속(Panicum), 파네세툼(Pannesetum), 플레움(Phleum), 포아(Poa), 세칼레(Secale), 소검(Sorghum), 트리티쿰(Triticum), 옥수수속(Zea), 침엽수속(Abies), 컨닝하미아(Cunninghamia), 마황속(Ephedra), 가문비나무속(Picea), 피누스(Pinus), 및 미송속(Pseudotsuga).
Cpf1 CRISPR 시스템 및 이용 방법은 광범위한 범위의 "조류" 또는 "조류 세포"에 걸쳐 사용될 수도 있다; 예를 들어, 홍조 식물(홍조류), 녹조 식물(녹조류), 갈조 식물(갈조류), 규조 식물(규조류), 유스티그마토파이타(Eustigmatophyta) 및 와편모조류를 포함하는 몇몇 진핵성 문 뿐만 아니라 원핵성 남조문(남조류)로부터 선택된 조류를 포함한다. 용어 "조류"는 예를 들어 다음으로부터 선택된 조류를 포함한다: 암포라(Amphora), 아나베나(Anabaena), 아닉스트로데스미스(Anikstrodesmis), 보트리오코커스(Botryococcus), 센털돌말속(Chaetoceros), 클라미도모나스(Chlamydomonas), 클로렐라(Chlorella), 클로로코쿰(Chlorococcum), 시클로텔라(Cyclotella), 실린드로테카(Cylindrotheca), 두날리엘라(Dunaliella), 에밀리아나(Emiliana), 유글레나(Euglena), 헤마토코쿠스(Hematococcus), 이소크리시스(Isochrysis), 모노크리시스(Monochrysis), 모노라피디움(Monoraphidium), 나노클로리스(Nannochloris), 나노클로롭시스(Nannnochloropsis), 나비쿨라(Navicula), 네프로클로리스(Nephrochloris), 네프로셀미스(Nephroselmis), 니트치아(Nitzschia), 노듈리아(Nodularia), 노스톡(Nostoc), 오오크로모나스(Oochromonas), 오오시스티스(Oocystis), 오실라토리아(Oscillartoria), 파블로바(Pavlova), 페오닥틸럼(Phaeodactylum), 플레이토모나스(Playtmonas), 플웨로크리시스(Pleurochrysis), 포르히라(Porhyra), 슈도아나바에나(Pseudoanabaena), 피라미모나스(Pyramimonas), 스티코코커스(Stichococcus), 시네코코커스(Synechococcus), 시네코시스티스(Synechocystis), 테트라셀미스(Tetraselmis), 탈라시오시라(Thalassiosira), 및 트리코데스뮴(Trichodesmium).
식물의 부분, 즉 "식물 조직"은 본 발명의 방법에 따라 처리되어 개선된 식물을 생산할 수 있다. 식물 조직은 또한 식물 세포를 포함한다. 본 명세서에서 사용된 바와 같은 용어 "식물 세포"는, 온전한 전체 식물로, 또는 배양 매질 또는 버퍼 중 현탁액 내 또는 완충액 또는 매질 또는 한천 상, 시험관 내 조직 배양에서 성장한 분리된 형태 중 어느 하나, 또는 예를 들어 식물 조직, 식물 기관 또는 전체 식물과 같은 고도의 조직화된 단위의 일부로서, 살아있는 식물의 개별 단위를 지칭한다.
"원형질"이라는 용어는, 예를 들어 기계적 또는 효소적 수단을 이용하여 그의 보호성 세포 벽이 완전히 또는 부분적으로 제거된 식물 세포를 지칭하며, 그 결과 살아있는 식물의 온전한 생화학 컴피턴트 단위가 결과로서 초래되며, 이는 적절한 성장 조건 하에서 그의 세포 벽을 재형성하고, 번식 및 재생하여 전체 식물로 성장할 수 있다.
용어 "형질전환"은, 식물 숙주가 아그로박테리아 또는 각종 화학적 또는 물리적 방법 중 하나를 이용하여 DNA의 도입에 의해 유전적으로 변형되도록 만드는 공정을 대체로 지칭한다. 본 명세서에 사용된 바와 같은 용어 "식물 숙주"는, 식물의 임의의 세포, 조직, 기관 또는 자손을 포함하는 식물을 지칭한다. 많은 적합한 식물 조직 또는 식물 세포가 형질전환될 수 있으며, 이로 제한되지는 않지만, 원형질, 체세포배(somatic embryo), 화분, 잎, 묘목, 줄기, 가피(calli), 기는 줄기(stolon), 미소괴경, 및 싹을 포함할 수 있다. 식물 조직은 또한, 유성 또는 무성으로 생성된 여부를 떠나, 그러한 식물, 씨드, 자손, 번식체의 임의의 클론, 및 절단물 또는 씨드와 같은 이들의 임의의 후손을 지칭한다.
본 명세서에 사용된 바와 같은 용어 "형질전환된"은, 외래 DNA 분자, 예컨대 작제물이 그 안으로 도입된 세포, 조직, 기관 또는 생물을 지칭한다. 도입된 DNA 분자는 수령 세포, 조직, 기관 또는 생물의 게놈 DNA 내로 통합될 수 있어서, 도입된 DNA 분자가 이후의 자손에게 전달되도록 한다. 이들 구현예에서, "형질전환된" 또는 "유전자이식" 세포 또는 식물은, 교배에서 부모로서 그러한 형질전환된 식물을 이용하고, 도입된 DNA분자의 존재로부터 초래되는 변경된 표현형을 나타내는, 그 세포 또는 식물의 자손 및 육종 계획으로부터 생산된 자손을 또한 포함할 수 있다. 바람직하게는, 유전자이식 식물은 생식력이 있으며, 유성 생식을 통하여 도입된 DNA를 자손에게 전달할 수 있다.
용어 "자손", 예컨대 유전자이식 식물의 자손은, 식물 또는 유전자이식 식 식물로부터 태어난, 얻은, 또는 유래된 것이다. 도입된 DNA 분자는 수령 세포 내로 일시적으로 도입될 수도 있어서, 도입된 DNA 분자가 이후의 자손에 의해 유전되지 않아 "유전자이식"이라고 여겨지지는 않는다. 이에 따라, 본 명세서에서 사용된 바와 같은, "비-유전자이식" 식물 또는 식물 세포는 그의 게놈 내로 안정하게 통합된 외래 DNA를 함유하지 않는 것이다.
본 명세서에 사용된 바와 같은 용어 "식물 프로모터"는, 그의 기원이 식물 세포인지 아닌지의 여부를 떠나, 식물 세포에서 전사를 개시할 수 있는 프로모터이다. 예시적인 적합한 식물 프로모터는, 이로 제한되지는 않지만, 식물, 식물 바이러스 및 박테리아, 예컨대 식물 세포에서 발현되는 유전자를 포함하는 아그로박테리움 또는 리조비움으로부터 수득되는 것들이다.
본 명세서에 사용된 바와 같은 용어 "균류(fungal) 세포"는 균류 계 내에서 임의의 유형의 진핵 세포를 지칭한다. 균류 계 내의 문(phyla)은 자낭균문, 담자균문, 블라스토클라디아균문(Blastocladiomycota), 호상균문, 글로메로균문(Glomeromycota), 미포자충문 및 네오칼리마스트릭스균문(Neocallimastigomycota)를 포함한다. 균류 세포는 효모, 곰팡이, 섬유성 균류이다. 일부 구현예에서, 균류 세포는 효모 세포이다.
본 명세서에 사용된 바와 같은 용어 "효모 세포"는 자낭균류 및 담자균류 문 내의 임의의 균류 세포를 지칭한다. 효모 세포는 출아 효모 세포, 분열 효모 세포, 및 곰팡이 세포를 포함할 수 있다. 이들 생물에 제한되지 않으면서, 실험실 및 산업적 환경에서 사용되는 많은 유형의 효모는 자낭균문의 일부이다. 일부 구현예에서, 효모 세포는 사카로마이세스 세레비시에, 클루이베로마이세스 마르시아누스(Kluyveromyces marxianus), 또는 이삿첸키아 오리엔탈리스(Issatchenkia orientalis) 세포이다. 다른 효모 세포는 제한 없이, 칸디다 종(예를 들어, 칸디다 알비칸스(Candida albicans)), 야로이아 종(예를 들어, 야로이아 리폴리티카(Yarrowia lipolytica)), 피키아 종(예를 들어, 피키아 파스토리스(Pichia pastoris)), 클루이베로마이세스 종(예를 들어, 클루이베로마이세스 락티스(Kluyveromyces lactis) 및 클루이베로마이세스 마르시아누스), 뉴로스포라 종 (예를 들어, 뉴로스포라 크라사(Neurospora crassa)), 푸사리움 종 (예를 들어, 푸사리움 옥시스포룸(Fusarium oxysporum)), 및 이삿첸키아 종 (예를 들어, 이삿첸키아 오리엔탈리스, a.k.a. 피키아 쿠드리아바제빌(Pichia kudriavzevii) 및 칸디다 아시도써모필룸(Candida acidothermophilum))을 포함할 수 있다. 일부 구현예에서, 균류 세포는 섬유성 균류 세포이다. 본 명세서에 사용된 바와 같은 용어 "섬유성 균류 세포"는 섬유 상으로 자라는 임의의 유형의 균류 세포, 균사 또는 균사체를 지칭한다. 섬유성 균류 세포의 예로는 이로 제한되지 않지만, 누룩곰팡이 종 (Aspergillus spp.)(예를 들어, 아스페르길루스 나이거(Aspergillus niger)), 트리코더마 종(Trichoderma spp.)(예를 들어, 트리코더마 리세이(Trichoderma reesei)), 리조푸스 종(Rhizopus spp.)(예를 들어, 리조푸스 오리재(Rhizopus oryzae)), 및 모르티에렐라 종(Mortierella spp.)(예를 들어, 모르티에렐라 이사벨리나)가 포함될 수 있다.
일부 구현예에서, 균류 세포는 산업용 균주이다. 본 명세서에서 사용된 바와 같은 "산업용 균주"는 산업적 공정, 예를 들어 상업적 또는 산업적 규모에서의 생성물의 생산으로부터 사용 또는 분리된 균주 세포의 임의의 균주를 지칭한다. 산업용 균주는 산업적 공정에서 통상적으로 사용되는 균류 종을 지칭할 수 있거나, 비-산업적 목적에도 사용될 수 있는(예를 들어, 실험실 연구) 균류 종의 분리물을 지칭할 수 있다. 산업적 공정의 예는 (예를 들어, 식품 또는 음료 제품의 생산에서) 발효, 증류, 생물연료 생산, 화합물의 생산 및 폴리펩티드의 생산을 포함할 수 있다. 산업용 균주의 예는 제한 없이, JAY270 및 ATCC4124를 포함할 수 있다.
일부 구현예에서, 균류 세포는 배수체 세포이다. 본 명세서에서 사용된 바와 같은 "배수체" 세포는 그의 게놈이 하나 초과의 복사물로 존재하는 임의의 세포를 지칭할 수 있다. 배수체 세포는 자연에서 배수체 상태로 발견되는 세포의 유형을 지칭할 수 있거나, 배수체 상태로 존재하도록 유도된 세포를 지칭할 수 있다(예를 들어, 특이적 조절, 변경, 비활성화, 활성화, 또는 감수분열의 변형, 세포질 분열, 또는 DNA 복제를 통해). 배수체 세포는 그의 전체 게놈이 배수체인 세포를 지칭할 수 있거나, 특정한 관심 게놈 유전자좌 내 배수체인 세포를 지칭할 수 있다. 이론에 구애되고자 하지는 않지만, 가이드RNA의 풍부함은 반수체 세포보다 배수체 세포의 게놈 조작에서 종종 더욱 비율제한적인 성분일 수 있으며, 이에 따라 본 명세서에서 설명된 Cpf1 CRISPR 시스템을 사용하는 방법은 특정 균류 세포 유형의 이용을 활용할 수 있는 것으로 생각된다.
일부 구현예에서, 균류 세포는 이배체이다. 본 명세서에서 사용된 바와 같은 "이배체" 세포는 그의 게놈이 두 개의 복사물로 존재하는 임의의 세포를 지칭할 수 있다. 이배체 세포는 자연에서 이배체 상태로 발견되는 세포의 유형을 지칭할 수 있거나, 이배체 상태로 존재하도록 유도된 세포를 지칭할 수 있다 (예를 들어, 특이적 조절, 변경, 비활성화, 활성화, 또는 감수분열의 변형, 세포질 분열, 또는 DNA 복제를 통해). 예를 들어, 사카로마이세스 세레비시에 균주 S228C는 반수체 또는 이배체 상태로 유지될 수 있다. 이배체 세포는 그의 전체 게놈이 이배체인 세포를 지칭할 수 있거나, 특정한 관심 게놈 유전자좌 내 이배체인 세포를 지칭할 수 있다. 일부 구현예에서, 균류 세포는 반수체 세포이다. 본 명세서에서 사용된 바와 같은 "반수체" 세포는 그의 게놈이 하나의 복사물로 존재하는 임의의 세포를 지칭할 수 있다. 반수체 세포는 자연에서 반수체 상태로 발견되는 세포의 유형을 지칭할 수 있거나, 반수체 상태로 존재하도록 유도된 세포를 지칭할 수 있다 (예를 들어, 특이적 조절, 변경, 비활성화, 활성화, 또는 감수분열의 변형, 세포질 분열, 또는 DNA 복제를 통해). 예를 들어, 사카로마이세스 세레비시에 균주 S228C는 반수체 또는 이배체 상태로 유지될 수 있다. 반수체 세포는 그의 전체 게놈이 반수체인 세포를 지칭할 수 있거나, 특정한 관심 게놈 유전자좌 내 반수체인 세포를 지칭할 수 있다.
본 명세서에서 사용된 바와 같은 "효모 발현 벡터"는 RNA 및/또는 폴리펩타이드를 인코딩하는 하나 이상의 서열을 함유하는 핵산을 지칭하며, 핵산(들)의 발현을 제어하는 임의의 바람직한 요소뿐만 아니라, 효모 세포 내부의 발현 벡터의 복제 및 유지를 가능하게 하는 임의의 요소를 추가로 함유할 수 있다. 많은 적합한 효모 발현 벡터 및 그의 특징은 해당 기술 분야에 알려져 있다; 예를 들어, 각종 벡터 및 기술이 문헌 [Yeast Protocols, 2nd edition, Xiao, W., ed. (Humana Press, New York, 2007) 및 Buckholz, R.G. and Gleeson, M.A. (1991) Biotechnology (NY) 9(11): 1067-72]에 예시되어 있다. 효모 벡터는 제한 없이, 동원체 (CEN) 서열, 자율 증식 서열 (ARS), 프로모터, 예컨대, 관심 서열 또는 유전자에 작동 가능하게 연결된, RNA 폴리머라제 III 프로모터, RNA 폴라머라제 III 종결자와 같은 종결자, 복제 기원, 및 마커 유전자 (예를 들어, 영양요구성, 항생성, 또는 다른 선택가능한 마커)를 함유할 수 있다. 효모에서의 이용을 위한 발현 벡터의 예로는, 플라스미드, 효모 인공 염색체, 2μ 플라스미드, 효모 편입형 플라스미드, 효모 자가증식형 플라스미드, 셔틀 벡터, 및 에피솜 유사 플라스미드를 포함할 수 있다.
식물 및 식물 세포의 게놈 내 Cpf1 CRISPR 시스템 성분의 안정한 통합
특정 구현예에서, Cpf1 CRISPR 시스템의 성분을 인코딩하는 폴리뉴클레오티드가 식물 세포의 게놈 내로 안정한 통합을 위해 유도되는 것이 고려된다. 이들 구현예에서, 형질전환 벡터 또는 발현 시스템의 설계는, 가이드 RNA 및/또는 Cpf1 유전자가 언제, 어디에서 어떤 조건에서 발현되는지에 따라 조절될 수 있다.
특정 구현예에서, Cpf1 CRISPR 시스템의 성분을 식물 세포의 게놈 DNA 내로 도입하는 것이 고려된다. 추가적으로 또는 대안적으로, 안정한 통합을 위한 Cpf1 CRISPR 시스템의 성분을 식물 세포소기관, 예컨대 이로 제한되지는 않지만 색소체, 미토콘드리아 또는 엽록체의 DNA 내로 도입하는 것이 고려된다.
식물 세포의 게놈 내로의 안정한 통합을 위한 발현 시스템은 하나 이상의 다음 요소를 함유할 수 있다: RNA 및/또는 Cpf1 효소를 식물 세포에서 발현하는데 사용될 수 있는 프로모터 요소; 발현을 증진시키기 위한 5' 미번역된 영역; 특정 세포 내 발현을 추가로 증진시키기 위한 인트론 요소, 예컨대 단자엽 세포; 가이드 RNA 및/또는 Cpf1 유전자 서열 및 다른 바람직한 요소를 삽입하기 위한 편리한 제한 부위를 제공하기 위한 다중-클로닝 부위; 및 발현된 전사물의 효율적인 종결을 제공하기 위한 3' 미번역된 영역.
발현 시스템의 요소는 플라스미드 또는 형질전환 벡터와 같은 원형, 또는 선형 이중 가닥 DNA와 같은 비-원형 중 어느 하나인 하나 이상의 발현 작제물 상에 있을 수 있다.
특정 구현예에서, Cfp1 CRISPR 발현 시스템은 적어도,
식물에서 표적 서열과 혼성화하는 가이드 RNA(gRNA)를 인코딩하는 뉴클레오티드 서열로, 여기서 가이드 또는 RNA는 가이드 서열 및 직접 반복부 서열을 포함하는 서열, 및
Cpf1 단백질을 인코딩하는 뉴클레오티드 서열
을 포함하며, 여기서 성분 (a) 또는 성분 (b)는 동일하거나 상이한 작제물 상에 위치되며, 이로 인해 상이한 뉴클레오티드 서열은 식물 세포 내에서 동일하거나 상이한 조절 요소의 제어 하에 있을 수 있다.
Cpf1 CRISPR 시스템의 성분을 함유하는 DNA 작제물(들), 및 적용가능한 경우, 주형 서열은 각종 통상의 기술에 의해 식물의 게놈, 식물 일부, 또는 식물 세포 내로 도입될 수 있다. 공정은 일반적으로 적합한 숙주 세포 또는 숙주 조직을 선택하는 단계, 작제물(들)을 숙주 세포 또는 숙주 조직 내로 도입하는 단계, 식물 세포 또는 그로부터의 식물을 재생하는 단계를 포함한다.
특정 구현예에서, DNA 작제물은, 이로 제한되지는 않지만 예컨대 식물 세포 원형질체의 전기천공, 미세주입, 에어로졸 빔 주사 기술을 이용하여 식물 세포 내로 도입될 수 있거나, DNA 작제물은 DNA 유전자 총(particle bombardment)과 같은 바이오리스틱 방법을 이용하여 식물 조직에 직접 도입될 수 있다(문헌 [Fu et al., Transgenic Res. 2000 Feb;9(1):11-9] 참조). 유전자 총의 기초는 관심 유전자/들로 코팅된 입자를 세포를 향해 가속화하는 것으로, 이는 그 입자에 의한 원형질의 침투 및 통상적으로 게놈 내로의 안정한 통합을 결과로서 초래한다. (예를 들어, 문헌 [Klein et al, Nature (1987), Klein et ah, Bio/Technology (1992), Casas et ah, Proc. Natl. Acad. Sci. USA (1993).] 참조).
특정 구현예에서, Cpf1 CRISPR 시스템의 성분을 함유하는 DNA 작제물은 아그로박테리움-매개된 형질전환에 의해 식물 내로 도입될 수 있다. DNA 작제물은 적합한 T-DNA 측부배치 영역과 함께 조합될 수 있으며, 통상의 아그로박테리움 투메파시엔스 숙주 벡터 내로 도입될 수 있다. 외래 DNA는 식물을 감염시킴으로써 또는 하나 이상의 Ti (종양-유도) 플라스미드를 함유하는, 아그로박테리움 박테리아와 함께 식물 원형질체를 인큐베이션함으로써 식물의 게놈 내로 통합될 수 있다 (예를 들어, 문헌 [Fraley et al., (1985), Rogers et al., (1987) and U.S. Pat. No. 5,563,055] 참조).
식물 프로모터
식물 세포 내 적절한 발현을 보장하기 위하여, 본 명세서에서 설명된 Cpf1 CRISPR 시스템의 성분은 통상적으로 식물 프로모터, 즉 식물 세포 내 작동가능한 프로모터의 제어 하에 위치된다. 상이한 유형의 프로모터들의 이용이 고려된다.
구조적 식물 프로모터는, 오픈 리딩 프레임(open reading frame)(ORF)를 발현할 수 있는 프로모터로, 이는 식물의 모든 또는 거의 모든 발생 단계 동안, 모든 또는 거의 모든 식물 조직을 제어한다 ("구조적 발현"으로도 지칭됨).
구조적 프로모터의 비제한적인 일 예는 콜리플라워 모자이크 바이러스 35S 프로모터이다. "조절된 프로모터"는 구조적으로는 아니지만 시간적으로 및/또는 공간적으로 조절된 방식으로 유전자 발현을 유도하며, 조직-특이적, 조직-선호된 및 유도성 프로모터를 포함하는 프로모터를 지칭한다. 상이한 프로모터는 상이한 조직 또는 세포 유형에서, 또는 상이한 발생 단계에서, 또는 상이한 환경 조건에 반응하여 유전자의 발현을 유도할 수 있다. 특정 구현예에서, 하나 이상의 Cpf1 CRISPR 성분은 구조적 프로모터, 예컨대 콜리플라워 모자이크 바이러스 35S 프로모터의 제어 하에 발현된다. 조직-선호된 프로모터는 특정 식물 조직 내에서 소정의 세포 유형 내, 예를 들어, 잎 또는 뿌리 내의 맥관 세포 또는 씨드의 특정 세포 내 증진된 발현을 표적화하는데 사용될 수 있다. Cpf1 CRISPR 시스템에서의 이용을 위한 특정 프로모터의 예는 문헌 [Kawamata et al., (1997) Plant Cell Physiol 38:792-803; Yamamoto et al., (1997) Plant J 12:255-65; Hire et al, (1992) Plant Mol Biol 20:207-18,Kuster et al, (1995) Plant Mol Biol 29:759-72, 및 Capana et al., (1994) Plant Mol Biol 25:681-91]에서 발견된다.
유도성이며 유전자 편집 또는 유전자 발현의 시공간적 제어를 가능하게 하는 프로모터의 예는 에너지의 형태를 이용할 수 있다. 에너지의 형태는 이로 제한되지는 않지만, 소리 에너지, 전자기 방사, 화학 에너지 및/또는 열 에너지를 포함할 수 있다. 유도성 시스템의 예로는 테트라사이클린 유도성 프로모터(Tet-온 또는 Tet-오프), 소분자 2-혼성체 전사 활성화 시스템(FKBP, ABA, 등), 또는 광 유도성 시스템(피토크롬, LOV 도메인, 또는 크립토크롬), 예컨대 서열-특이적 방식으로 전사 활성화에서의 변화를 유도하는 광 유도성 전사 이펙터(LITE)가 포함된다. 광 유도성 시스템의 성분은 Cpf1 CRISPR 효소, 광-반응성 시토크롬 이형이량체(예를 들어, 애기장대로부터), 및 전사 활성화/억제 도메인을 포함할 수 있다. 유도성 DNA 결합 단백질 및 그의 사용 방법의 추가적인 예는 US 61/736465 및 US 61/721,283에 제공되며, 이들은 그 전체로 본 명세서에 참고문헌으로 통합된다.
특정 구현예에서, 일시적 또는 유도성 발현은 예를 들어, 화학-조절된 프로모터를 이용함으로써 달성될 수 있으며, 즉 이에 인해 외인성 화학물질의 적용이 유전자 발현을 유도한다. 유전자 발현의 조정은 화학물질-억제성 프로모터에 의해 수득될 수도 있으며, 여기서 화학물질의 적용은 유전자 발현을 억제한다. 화학-유도성 프로모터는, 이로 제한되지는 않지만, 벤젠 술폰아미드 제초제 약해경감제에 의해 활성화되는, 메이즈 ln2-2 프로모터 [문헌 (De Veylder et al., (1997) Plant Cell Physiol 38:568-77)], 발아전 처리(pre-emergent) 제초제로서 사용된 소수성 친전자성 화합물에 의해 활성화된, 메이즈 GST 프로모터 (GST-ll-27, WO93/01294), 및 살리실산에 의해 활성화된 담배 PR-1 프로모터 [문헌 (Ono et al., (2004) Biosci Biotechnol Biochem 68:803-7)]를 포함한다. 항생체, 예컨대 테트라사이클린-유도성 및 테트라사이클린-억제성 프로모터에 의해 조절되는 프로모터[문헌 (Gatz et al., (1991) Mol Gen Genet 227:229-37; 미국 특허 5,814,618 및 5,789,156) 또한 본 명세서에서 사용될 수 있다.
특정 식물 세포소기관으로의 전위 및/또는 거기에서의 발현
발현 시스템은 특정 식물 세포소기관으로의 전위를 위한 및/또는 식물 세포소기관에서의 발현을 위한 요소를 포함할 수 있다.
엽록체 표적화
특정 구현예에서, Cpf1 CRISPR 시스템은 엽록체 유전자를 특이적으로 변형시키거나, 엽록체에서의 발현을 보장하는데 사용되는 것으로 생각된다. 이러한 목적을 위해, 엽록체 형질전환 방법 또는 Cpf1 CRISPR 시스템 성분의 엽록체로의 구획화를 이용한다. 예를 들어, 색소체 게놈 내 유전적 변형의 도입은 화분을 통한 유전자 흐름과 같은 생물안전성 문제를 감소시킬 수 잇다.
엽록체 형질전환 방법은 해당 기술 분야에 알려져 있으며, 유전자 총법, PEG 처리, 및 미세주입을 포함한다. 추가적으로, 형질전환 카세트를 핵 게놈으로부터 색소체로의 전위를 수반하는 방법이 WO2010061186에 설명된 바와 같이 사용될 수 있다.
대안적으로, 하나 이상의 Cpf1 CRISPR 시스템 성분을 식물 엽록체로 표적화하는 것이 고려된다. 이는 발현 작제물 내로, Cpf1 단백질을 인코딩하는 서열의 5' 영역에 작동 가능하게 연결된, 엽록체 이동 펩티드(chloroplast transit peptide) (CTP) 또는 색소체 이동 펩티드를 인코딩하는 서열을 통합시킴으로써 달성된다. CTP는 엽록체 내로의 전위 동안 가공 단계에서 제거된다. 발현된 단백질의 엽록체 표적화는 숙련자에게 공지이다(예를 들어, 문헌 [Protein Transport into Chaloroplasts, 2010, Annual Review of Plant Biology,Vol. 61: 157-180] 참조). 그러한 구현예에서, 가이드 RNA를 식물 엽록체로 표적화하는 것 또한 바람직하다. 엽록체 국소화 서열을 이용하여 가이드 RNA를 엽록체 내로 전위하는데 사용될 수 있는 방법 및 작제물이 예를 들어 20040142476에 설명되어 있으며, 이는 본 명세서에 참고문헌으로 통합된다. 작제물의 그러한 변이는 본 발명의 발현 시스템 내로 통합되어 Cpf1-가이드 RNA를 효율적으로 전위시킬 수 있다.
CRISPR-Cpf1 시스템을 인코딩하는 폴리뉴클레오티드의 조류 세포 내 도입
유전자이식 조류(또는 유채와 같은 다른 식물)는 채소유 또는 생물연료 예컨대 알코올(특히 메탄올 및 에탄올) 또는 다른 생성물의 생산에서 특히 유용할 수 있다. 이들은 오일 또는 생물연료 산업에서의 이용을 위해 높은 수준의 오일 또는 알코올을 발현 또는 과잉 발현하도록 조작될 수 있다.
US 8945839호는 Cas9를 이용하여 미세조류(클라미도모나스 레인하티(Chlamydomonas reinhardtii) 세포) 종을 조작하는 방법을 설명한다. 유사한 도구를 사용하여, 본 명세서에 기재된 Cpf1 CRISPR9 시스템의 방법은 클라미도모나스 종 및 다른 조류 상에 적용될 수 있다. 특정 구현예에서, Cpf1 및 가이드 RNA는, Hsp70A-Rbc S2 또는 Beta2 -튜불린과 같은 구조 프로모터의 제어 하에서 Cpf1를 발현하는 벡터를 이용하여 발현된 조류 내에 도입된다. 가이드 RNA는 T7 프로모터를 함유하는 벡터를 사용하여 선택적으로 전달된다. 대안적으로, Cas9 mRNA 및 시험관 내 전사된 가이드 RNA는 조류 세포로 전달될 수 있다. 전기천공 프로토콜은 진아트 클라미도모나스 조작 키트(GeneArt Chlamydomonas Engineering kit)로부터 권장된 표준 프로토콜과 같이, 숙련자에게 이용가능하다.
특정 구현예에서, 본 명세서에서 사용된 엔도뉴클레아제는 스플릿 Cpf1 효소이다. 스플릿 Cpf1 효소는 WO 2015086795에 Cas9에 대하여 기재된 바와 같은 표적된 게놈 변형을 위한 조류 내에서 우선적으로 사용된다. Cpf1 스플릿 시스템의 이용은 게놈 표적화의 유도 방법에 특히 적합하며, 조류 세포 내 Cpf1 과잉발현의 잠재적인 독성 효과를 회피한다. 특정 구현예에서, 상기 Cpf1 스플릿 도메인(RuvC 및 HNH 도메인)은 동시에 또는 순차적으로 세포 내로 도입될 수 있어서, 상기 스플릿 Cpf1 도메인(들)은 조류 세포 내에서 표적 핵산 서열을 가공한다. 야생형 Cpf1에 비하여 스플릿 Cpf1의 감소된 크기는 CRISPR 시스템의 세포로 전달하는 다른 방법들, 예컨대 본 명세서에 설명된 바와 같은 세포 침투 펩티드의 이용을 가능하게 한다. 이 방법은 유전적으로 변형된 조류를 생성하는데 특히 유익하다.
효모 세포 내에서 Cpf1 성분을 인코딩하는 폴리뉴클레오티드의 도입
특정 구현예에서, 본 발명은 효모 세포의 게놈 편집을 위한 Cpf1 CRISPR 시스템의 이용에 관한 것이다. Cpf1 CRISPR 시스템 성분을 인코딩하는 폴리뉴클레오티드를 도입하는데 사용될 수 있는 효모 세포를 형질전환하는 방법은 당업자에게 공지이며, 문헌 [Kawai et al., 2010, Bioeng Bugs. 2010 Nov-Dec; 1(6): 395-403)]에 개관되어 있다. 비제한적인 예로는 리튬 아세테이트 처리에 의해 (이는 캐리어(carrier) DNA 및 PEG 처리를 추가로 포함할 수 있음), 총 또는 전기천공에 의한 효모 세포의 형질전환을 포함한다.
식물 및 식물 세포 내에서 Cpf1 CRISP 시스템 성분의 일시적 발현
특정 구현예에서, 가이드 RNA 및/또는 Cpf1 유전자는 식물 세포 내에서 일시 발현된다고 생각된다. 이들 구현예에서, Cpf1 CRISPR 시스템은, 가이드 RNA 및 Cpf1 단백질 모두가 세포 내에 존재하는 때에만 표적 유전자의 변형을 보장할 수 있어서, 게놈 변형은 추가로 제어될 수 있다. Cpf1 효소의 발현이 일시적임에 따라, 그러한 식물 세포로부터 생성된 식물은 통상적으로 외래 DNA를 함유하지 않는다. 특정 구현예에서 Cpf1 효소는 식물 세포에 의해 안정하게 발현되고, 가이드 서열이 일시적으로 발현된다.
특정 구현예에서, Cpf1 CRISPR 시스템 성분은 식물 바이러스 벡터를 이용하여 식물 세포 내로 도입될 수 있다(문헌[Scholthof et al. 1996, Annu Rev Phytopathol. 1996;34:299-323]). 추가의 특정 구현예에서, 상기 바이러스 벡터는 DNA 바이러스로부터의 벡터이다. 예를 들어, 제미니바이러스(geminivirus) (예를 들어, 양배추 잎말림 바이러스, 콩 황색 왜소 바이러스, 밀 왜소 바이러스, 토마토 잎말림 바이러스, 메이즈 줄무늬병 바이러스, 담배 잎말림 바이러스, 또는 토마토 골든 모자이크 바이러스) 또는 나노바이러스(예를 들어, 누에콩 괴사성 황색 바이러스). 다른 특정 구현예에서, 상기 바이러스 벡터는 RNA 바이러스로부터의 벡터이다. 예를 들어, 토브라바이러스(tobravirus)(예를 들어, 담배 얼룩 바이러스, 담배 모자이크 바이러스), 포텍스바이러스(potexvirus)(예를 들어, 감자 바이러스 X), 또는 호르데이(hordeivirus) (예를 들어, 보리 반엽 모자이크 바이러스). 식물 바이러스의 복제 게놈은 비-통합 벡터이다
특정 구현예에서, Cpf1 CRISPR 작제물의 일시 발현에 사용된 벡터는 예를 들어, pEAQ 벡터이고, 이는 원형질체 내에서 아그로박테리움-매개 일시 발현에 대해 조절된다(문헌[Sainsbury F. et al., Plant Biotechnol J. 2009 Sep;7(7):682-93]). 게놈 위치의 정확한 표적화는, 변형된 양배추 잎말림 바이러스(CaLCuV) 벡터를 이용하여, CRISPR 효소를 발현하는 안정한 유전자이식 식물에서 gRNA를 발현하는 것을 증명하였다(문헌[Scientific Reports 5, Article number: 14926 (2015), doi:10.1038/srep14926)].
특정 구현예에서, 가이드 RNA 및/또는 Cpf1 유전자를 인코딩하는 이중-가닥 DNA 단편은 식물 세포 내로 일시적으로 도입될 수 있다. 그러한 구현예에서, 도입된 이중-가닥 DNA 단편은 세포를 변형하기에는 충분하지만, 고려된 기간이 지나거나 일 회 이상의 세포 분열 후에는 지속되지 않는 양으로 제공된다. 식물에서 직접 DNA 전달 방법은 당업자에게 알려져 있다(예를 들어, 문헌[Davey et al. Plant Mol Biol. 1989 Sep;13(3):273-85.] 참조).
다른 구현예에서, Cpf1단백질을 인코딩하는 RNA 폴리뉴클레오티드가 식물 세포 내로 도입되고, 이는 이후 번역되고 숙주 세포에 의해 가공되어(하나 이상의 가이드 RNA 존재 하에서) 세포를 변형시키기에는 충분한 양이지만 고려된 기간이 지나거나 일 회 이상의 세포 분열 후에는 지속되지 않는 양의 단백질을 생성한다. 일시 발현을 위하여 mRNA를 식물 원형질체로 도입하는 방법은 숙련자에게 알려져 있다(예를 들어, 문헌 [Gallie, Plant Cell Reports (1993), 13;119-122] 참조).
상기 설명된 상이한 방법들의 조합이 또한 고려된다.
Cpf1 CRISPR 성분의 식물 세포로의 전달
특정 구현예에서, Cpf1 CRISPR 시스템의 하나 이상의 성분을 식물 세포로 직접 전달하는 것이 유익하다. 이는 그중에서도 비-유전자이식 식물의 생성에 유익하다(하기 참조). 특정 구현예에서, 하나 이상의 Cpf1 성분이 식물 또는 식물 세포 외부에서 제조되고 세포로 전달된다. 예를 들어 특정 구현예에서, Cpf1 단백질은 식물 세포로의 도입 전에 시험관 내에서 제조된다. Cpf1 단백질은 당업자에게 알려진 각종 방법에 의해 제조될 수 있으며, 재조합 생산을 포함한다. 발현 후, Cpf1 단백질이 분리되고, 필요에 따라 재접힘되고, 정제 및 선택적으로 처리되어 임의의 정제 태그, 예컨대 His-태그를 제거할수 있다. 조생의, 부분적으로 정제된, 또는 더욱 완전하게 정제된 Cpf1 단백질이 일단 수득되면, 단백질은 식물 세포로 도입될 수 있다.
특정 구현예에서, Cpf1 단백질은 관심 유전자를 표적화하는 가이드 RNA와 혼합되어 사전-조립된 리보뉴클레오단백질을 형성한다.
개별적인 성분 또는 사전-조립된 리보뉴클레오단백질은 전기 천공을 통해, Cpf1-연관된 유전자 생성물 코팅된 입자를 이용한 충격에 의해, 화학적 트랜스펙션에 의해, 또는 세포막을 지나 운송하기 위한 일부 다른 수단에 의해 식물 세포 내로 도입될 수 있다. 예를 들어, 사전-조립된 CRISPR 리보뉴클레오단백질을 이용한 식물 원형질체의 트랜스펙션은, 식물 게놈이 표적된 변형을 보장하는 것으로 증명되었다(이는 문헌 [Woo et al. Nature Biotechnology, 2015; DOI: 10.1038/nbt.3389]에 설명된 바와 같음).
특정 구현예에서, Cpf1 CRISPR 시스템 성분은 나노입자를 이용하여 식물 세포 내로 도입된다. 단백질 또는 핵산으로서, 또는 이의 조합 중 어느 하나인 성분은 나노입자 위에 업로드(upload)되거나, 나노입자 내에 패키지되고, 식물에 적용될 수 있다(예를 들어, WO 2008042156 및 US 20130185823에 설명된 것과 같음). 특히, 본 발명의 구현예는, WO2015089419에 설명된 바와 같이, Cpf1 단백질을 인코딩하는 DNA 분자(들), 가이드 RNA 및/또는 분리된 가이드 RNA를 인코딩하는 DNA 분자로 업로드된 또는 그로 패킹된 나노입자를 포함한다.
Cpf1 CRISPR 시스템의 하나 이상의 성분을 식물 세포 내로 도입하는 추가의 수단은 세포 침투 펩티드(CPP)의 이용에 의한 것이다. 따라서, 특히 본 발명에서 구현예는 Cpf1 단백질에 연결된 세포 침투 펩티드를 포함하는 조성물을 포함한다. 본 발명의 특정 구현예에서, Cpf1 단백질 및/또는 가이드 RNA는 하나 이상의 CPP에 커플링되어 이들을 식물 원형질체 내부로 효과적으로 운송한다; 또한 문헌[Ramakrishna(20140Genome Res. 2014 Jun;24(6):1020-7 for Cas9 in human cells)]을 참조한다. 다른 구현예에서, Cpf1 유전자 및/또는 가이드 RNA는 식물 원형질체 전달을 위한 하나 이상의 CPP에 커플링되는 하나 이상의 원형 또는 비원형 DNA 분자(들)에 의해 인코딩된다. 식물 원형질체는 이후 식물 세포로, 그리고 추가로 식물에 재생된다. CPP는, 단백질로부터 유도된 또는 수용체 독립적인 방식으로 세포막을 지나 생물분자를 운송할 수 있는 키메라 서열로부터 유도된 어느 하나인, 일반적으로 35 개 미만의 아미노산의 짧은 펩티드로서 설명된다. CPP는 양이온 펩티드, 소수성 서열을 갖는 펩티드, 양친매성 펩티드, 프롤린-풍부 및 항균성 서열을 갖는 펩티드, 및 키메라 또는 이분(bipartite) 펩티드(문헌 [Pooga and Langel 2005])일 수 있다. CPP는 생물학적 막을 침투할 수 있고, 그와 같이 각종 생물 분자의 세포막을 거친 세포질 내로의 이동을 촉발하고, 그의 세포내 여정을 개선시키고, 이에 따라 생물 분자의 표적과의 상호작용을 촉진한다. CPP의 예로는, 특히: Tat, HIV 유형1에 의한 바이러스 복제에 요구되는 핵 전사 활성화제 단백질, 페네트라틴, 카포시(Kaposi) 섬유아세포 성장 인자(FGF) 신호 펩티드 서열, 인테그린 β3 신호 펩티드 서열; 폴리아르기닌 펩티드 Arg 서열, 구아닌 풍부-분자 수송체, 스위트 애로우(sweet arrow) 펩티드, 등이 포함된다.
유전적으로 변형된 비-유전자이식 식물을 제조하기 위한 Cpf1 CRISPR의 용도
특정 구현예에서, 본 명세서에서 설명된 방법은, 식물의 게놈 내 외래 DNA의 존재를 회피하기 위해서, 내인성 유전자를 변형하거나, CRISPR 성분을 인코딩하는 것들을 포함하는, 임의의 외래 유전자의 식물 게놈 내로의 영구 도입 없이 그의 발현을 변형하는데에 사용된다. 이는 비-유전자이식 식물에 대한 조절 요구사항이 덜 엄격함에 따라 유익할 수 있다.
특정 구현예에서, 이는 Cpf1 CRISPR 성분의 일시 발현에 의해 보장된다. 특정 구현예에서 하나 이상의 CRISPR 성분은, 본 명세서에서 설명된 방법에 따른 관심 유전자의 변형을 일관되고 꾸준히 보장하기에 충분한 Cpf1 단백질 및 가이드 RNA를 생산하는 하나 이상의 바이러스 벡터 상에서 발현된다.
특정 구현예에서, Cpf1 CRISPR 작제물의 일시 발현은 식물 원형질체 내에서 보장되며, 이에 따라 게놈 내로 통합되지는 않는다. 발현의 제한된 범위는 Cpf1 CRISPR 시스템이 본 명세서에서 설명된 바와 같이 표적 유전자의 변형을 보장하는 것을 가능하게하기에 충분할 수 있다.
특정 구현예에서, Cpf1 CRISPR 시스템의 상이한 성분은, 개별적으로 또는 혼합물로, 본 명세서에서 설명된 바와 같은 나노입자 또는 CPP분자와 같은 미립자 전달 분자의 도움과 함께, 식물 세포, 원형질체 또는 식물 조직 내로 도입된다.
Cpf1 CRISPR 성분의 발현은, Cpf1 뉴클레아제 및 선택적으로 주형 DNA의 도입의 직접 활성에 의해 또는 본 명세서에서 설명된 바와 같은 Cpf1 CRISPR 시스템을 이용하여 표적된 유전자의 변형 중 어느 하나에 의해 게놈의 표적된 변형을 유도할 수 있다. 본 명세서에 상기 설명된 상이한 전략은, Cpf1 CRISPR 성분의 식물 게놈 내로의 도입을 필요로 하지 않으면서 Cpf1-매개된 표적된 게놈 편집을 가능하게 한다. 식물 세포 내로 일시적으로 도입된 성분은 교배시 통상적으로 제거된다.
식물 게놈-선택성 마커에서의 변형 검출
특정 구현예에서, 방법이 식물 게놈의 내인성 표적 유전자의 변형을 수반하는 경우, 식물, 식물 일부 또는 식물 세포가 Cpf1 CRISPR 시스템으로 감염 또는 트랜스펙션된 후, 유전자 표적화 또는 표적된 돌연변이 유발이 표적 부위에서 발생했는지의 여부를 확인하는 임의의 적합한 방법이 사용된다. 방법이 이식유전자의 도입을 수반하는 경우, 형질전환된 식물 세포, 캘러스(callus), 조직 또는 식물은, 이식유전자의 존재에 대해 또는 이식유전자에 의해 인코딩된 특성에 대해 조작된 식물 재료를 선택 또는 스크리닝함으로써 확인 및 분리될 수 있다. 물리적 및 생화학적 방법을, 삽입된 유전자 작제물 또는 내인성 DNA 변형을 함유하는 식물 또는 식물 세포 형질전환체를 확인하는데 사용할 수 있다. 이들 방법은 이로 제한되지는 않지만: 1) 재조합 DNA 삽입물 또는 변형된 내인성 유전자의 구조를 검출 및 결정하기 위한 서던 분석 또는 PCR 증폭; 2) 유전자 작제물의 RNA 전사물을 검출 및 검사하기 위한 노던 블롯, S1 RN아제 보호, 프라이머-연장 또는 역전사제-PCR 증폭; 3) 그러한 유전자 생성물이 유전자 작제물에 의해 인코딩되거나 발현이 유전적 변형에 의해 영향을 받는 경우, 효소 또는 리보자임 활성을 검출하기 위한 효소적 분석; 4) 유전자 작제물 또는 내인성 유전자 생성물이 단백질인 경우, 단백질 겔 전기 영동, 웨스턴 블롯 기술, 면역 침강, 또는 효소-결합 면역분석. 추가의 기술, 예컨대 현장 혼성화, 효소 염색, 및 면역염색 또한 재조합 작제물의 발현이 존재 또는 발현을 검출 또는 특정 식물 기관 및 조직 내 내인성 유전자의 변형을 검출하는데 사용될 수 있다. 이들 모든 분석의 실시 방법은 당업자에게 공지이다.
추가적으로(또는 대안적으로), Cpf1 CRISPR 성분을 인코딩하는 발현 시스템은, 초기 단계에서 및 대규모에서, Cpf1 CRISPR 시스템을 함유 및/또는 그에 의해 변형된 세포를 분리 또는 효율적으로 선택하는 수단을 제공하는, 통상적으로 하나 이상의 선택가능한 또는 검출가능한 마커를 포함하도록 설계된다.
아그로박테리움-매개된 형질전환의 경우, 마커 카세트는 측부배치되는 T-DNA 경계들에 인접하거나 그 사이에 있을 수 있으며, 바이너리 벡터 내에 함유될 수 있다. 또 다른 구현예에서, 마커 카세트는 T-DNA의 외부에 있을 수 있다. 선택가능한 마커 카세트는 발현 카세트로서 동일한 T-DNA 경계 내에 또는 그에 인접할 수 있거나, 바이너리 벡터 상의 제2 T-DNA 내 어느 부분엔가 있을 수 있다(예를 들어, 2 T-DNA 시스템).
유전자 총법의 경우 또는 원형질체 형질전환과 함께, 발현 시스템은 하나 이상의 분리된 선형 단편을 포함할 수 있거나, 세균 복제 요소, 세균 선택가능한 마커 또는 다른 검출가능한 요소를 함유할 수 있는 더욱 큰 작제물의 일부일 수 있다. 가이드 및/또는 Cpf1을 인코딩하는 폴리뉴클레오티드를 포함하는 발현 카세트(들)은 마커 카세트에 물리적으로 연결될 수 있거나, 마커 카세트를 인코딩하는 제2 핵산 분자와 함께 혼합될 수 있다. 마커 카세트는 형질전환된 세포의 효율적인 선발을 가능하게 하는 검출가능한 또는 선택가능한 마커를 발현하는데 필수적인 요소들로 구성된다.
선택가능한 마커에 기초한 세포에 대한 선택 절차는 마커 유전자의 성질에 따라 달라질 것이다. 특정 구현예에서, 선택가능한 마커, 즉 마커의 발현을 기초로 한 세포의 직접 선택을 가능하게 하는 마커가 이용된다. 선택가능한 마커는 양성 또는 음성 선택을 부여할 수 있으며, 외부 기재의 존재에 대해 조건적 또는 비-조건적이다(문헌 [Miki et al. 2004, 107(3): 193-232]). 가장 흔하게는, 항생제 또는 제초제 저항성 유전자가 마커로서 사용되며, 이로 인해 선택은 마커 유전자가 그에 대한 저항성을 부여하는 항생제 또는 제초제의 억제량을 함유하는 매질 상에서 조작된 식물 재료를 성장시킴으로서 수행된다. 그러한 유전자의 예로는, 하이그로마이신(hpt) 및 카나마이신(nptII)와 같은 항생제에 대한 저항성을 부여하는 유전자, 및 포스피노트리신(bar) 및 클로로설푸론(als)과 같은 제초제에 대한 저항성을 부여하는 유전자이다.
형질전환된 식물 및 식물 세포는 또한 가시성 마커, 통상적으로 착색된 기재 (예를 들어, β-글루쿠로니다제, 루시퍼라제, B 또는 C1 유전자)를 가공할 수 있는 효소의 활성을 스크리닝함으로써 확인될 수 있다. 그러한 선택 및 스크리닝 방법은 당업자에게 공지이다.
식물 배양 및 재생
특정 구현예에서, 변형된 게놈을 갖고, 본 명세서에서 설명된 임의의 방법에 의해 생산되거나 수득된 식물 세포는 배양되어, 형질전환된 또는 변형된 유전자형을 갖고, 이에 따라 바람직한 표현형을 갖는 전체 식물을 재생할 수 있다. 통상의 재생 기술은 당업자에게 공지이다. 그러한 재생 기술의 특정 예는 조직 배양 성장 매질 내 특정 식물 호르몬의 조작에 따라 달라지며, 통상적으로 바람직한 뉴클레오티드 서열과 함께 도입된 살생물제 및/또는 제초제 마커에 따라 의존한다. 추가의 특정 구현예에서, 식물 재생은 배양된 원형질체, 식물 캘러스, 외식편(explant), 기관, 화분, 배아, 또는 그의 일부로부터 수득된다(예를 들어, 문헌 [Evans et al. (1983), Handbook of Plant Cell Culture, Klee et al (1987) Ann. Rev. of Plant Phys.] 참조).
특정 구현예에서, 본 명세서에서 설명된 바와 같은 형질전환된 또는 개선된 식물은 자가수분될 수 있어서 본 발명의 개선된 동형접합성 식물을 위한 씨드를 제공하거나(DNA 변형을 위한 동형접합성), 비-유전자이식 식물 또는 상이한 개선된 식물과 교잡되어 동형접합성 식물을 위한 씨드를 제공한다. 재조합 DNA가 식물 세포 내로 도입된 경우, 그러한 교배의 결과 식물은 재조합 DNA 분자를 위한 동형접합성인 식물이다. 개선된 식물로부터의 교배에 의해 수득된 그리고 (재조합 DNA일 수 있는) 유전적 변형을 포함하는 그러한 동형접합성 및 이형접합성 식물 모두 본 명세서에서 "자손"으로서 지칭된다. 자손 식물은 원래의 유전자이식 식물로부터 전해내려온 식물이고 본 발명에서 제공된 방법에 의해 도입된 게놈 변형 또는 재조합 DNA 분자를 함유한다. 대안적으로, 유전적으로 변형된 식물은 Cpf1 효소를 이용하여 앞서 설명된 방법들 중 하나에 의해 수득될 수 있으며, 이에 의해 외래의 DNA가 게놈 내로 통합되지 않는다. 추가의 번식에 의해 수득된 그러한 식물의 자손은 유전적 변형을 또한 함유할 수 있다. 번식은 상이한 작물에 대해 흔히 사용되는 임의의 번식 방법에 의해 수행된다(예를 들어, 문헌 [Allard, Principles of Plant Breeding, John Wiley & Sons, NY, U. of CA, Davis, CA, 50-98 (1960)]).
증진된 작물학적 특성을 갖는 식물의 재생
본 명세서에 제공된 Cpf1 기반 CRISPR 시스템은, 표적된 이중-가닥 또는 단일-가닥 파손을 도입 및/또는 유전자 활성화제 및/또는 억제제 시스템을 도입하는데 사용될 수 있고, 제한없이 유전자 표적화, 유전자 대체, 표적된 돌연변이유발, 표적된 결실 또는 삽입, 표적된 역전 및/또는 표적된 전위에 사용될 수 있다. 단일 세포 내 다수의 변형을 달성하기 위해 유도된 다수의 표적화 RNA의 공동발현에 의해, 다중화된 게놈 변형이 보장될 수 있다. 이 기술은, 증진된 영양 품질, 질병에 대해 증가된 저항성 및 생물 스트레스 및 비생물 스트레스에 대한 저항성, 및 상업적으로 가치있는 식물 생성물 또는 이종성 화합물의 증가된 생산을 포함하는, 개선된 특징을 갖는 식물의 고-정밀 조작에 사용될 수 있다.
특정 구현예에서, 본 명세서에서 설명된 바와 같은 Cpf1 CRISPR 시스템은 내인성 DNA 서열에서 표적된 이중-가닥 파손(DSB)을 도입하는데 사용된다. DSB는 세포 DNA 수복 경로를 활성화하고, 이는 파손 부위 가까이에서 바람직한 DNA 서열을 달성하도록 매일 수 있다. 내인성 유전자의 비활성화가 바람직한 특성을 부여 또는 그에 기여할 수 있는 경우 이는 유익하다. 특정 구현예에서, 주형 서열을 갖는 상동성 재조합은 관심 유전자를 도입하기 위하여, DSB의 부위에서 촉진된다.
특정 구현예에서, Cpf1 CRISPR 시스템은, 내인성 식물 유전자의 활성화 및/또는 억제를 위한 작용 도메인에 융합 또는 그에 작동 가능하게 연결되는, 일반적인 핵산 결합 단백질로서 사용될 수 있다. 예시적인 작용 도메인은 이로 제한되지는 않지만, 번역 개시제, 번역 활성화제, 번역 억제제, 뉴클레아제, 특히 리보뉴클레아제, 스플라이세오좀, 비즈, 광 유도성/제어성 도메인 또는 화학적으로 유도성/제어성 도메인을 포함할 수 있다. 통상적으로 이들 구현예에서, Cpf1 단백질은 일 이상의 돌연변이를 포함하여, 이는 하나 이상의 돌연변이를 갖지 않는 Cpf1 단백질의 활성의 단지 5% 미만을 갖도록 하며; 가이드 RNA는 표적 서열에 혼성화할 수 있는 가이드 서열을 포함한다.
본 명세서에서 설명된 바와 같은 방법은 일반적으로, 야생형 식물에 비하여 하나 이상의 바람직한 특성들을 갖는 "개선된 식물"의 세대를 결과로서 초래한다. 특정 구현예에서, 식물, 식물 세포 또는 수득된 식물 일부는 유전자이식 식물로, 식물의 세포의 전부 또는 일부의 게놈 내로 혼입된 외인성 DNA 서열이다. 특정 구현예에서, 비-유전자이식성의 유전적으로 변형된 식물, 식물 일부 또는 세포가 수득되며, 외인성 DNA 서열은 식물 중의 임의의 식물 세포의 게놈 내로 통합된다. 그러한 구현예에서, 개선된 식물은 비-유전자이식성이다. 내인성 유전자의 변형만이 보장되고, 외래 유전자는 식물 게놈 내로 도입 또는 유지되지 않는 경우, 결과의 유전적으로 변형된 작물은 외래 유전자를 함유하지 않고, 이에 따라 기본적으로 비-유전자이식성으로 간주될 수 있다. 식물 게놈 편집을 위한 Cpf1 CRISPR 시스템의 상이한 응용이 하기에서 더욱 상세하게 설명된다:
a) 농업적 관심 특성을 부여하는 하나 이상의 외래 유전자의 도입
본 발명은 게놈 편집 또는 관심의 표적 유전자좌에서 또는 그에 연관된 서열을 변형하는 방법을 제공하며, 여기서 방법은 Cpf1 이펙터 단백질 복합체를 식물 세포 내로 도입하는 단계를 포함하며, 이로 인해 Cpf1 이펙터 단백질 복합체는 효과적으로 작용하여, 예를 들어 외래 관심 유전자를 인코딩하는, DNA 삽입물을 식물 세포의 게놈 내로 통합시킨다. 바람직한 구현예에서, DNA 삽입물의 통합은 외생적으로 도입된 DNA 주형 또는 수복 주형을 갖는 HR에 의해 촉진된다. 통상적으로 외생적으로 도입된 DNA 주형 또는 수복 주형은, Cpf1 이펙터 단백질 복합체 또는 일 성분 또는 복합체의 성분의 발현을 위한 폴리뉴클레오티드 벡터와 함께 전달된다.
본 명세서에서 제공된 Cpf1 CRISPR 시스템은 표적된 유전자 전달을 가능하게 한다. 관심 유전자 발현의 효율은 게놈 내로의 통합의 위치에 의해 큰 정도로 결정된다는 것이 더욱 명백하게 되었다. 본 방법은 외래 유전자의 게놈 내 바람직한 위치로의 표적된 통합을 가능하게 한다. 위치는 이전에 생성된 이벤트의 정보를 기준으로 선택될 수 있다. 본 방법은 외래 유전자의 게놈 내 바람직한 위치 내로의 표적된 통합을 가능하게 한다. 위치는 이전에 생성된 이벤트의 정보에 기초하여 선택될 수 있거나, 본 명세서에 어느 부분에서 개시된 방법에 의해 선택될 수 있다.
특정 구현예에서, 본 명세서에서 제공된 방법은: (a) 직접 반복부 및 가이드 서열을 포함하는, 가이드 RNA를 포함하는 Cpf1 CRISPR 복합체를 세포 내로 도입하는 단계로, 여기서 가이드 서열은 식물 세포에 대해 내생인 표적 서열에 혼성화하는 단계; (b) 가이드 서열이 표적 서열에 혼성화하고, 가이드 서열이 표적되는 서열에서 또는 그 근처에서 이중 가닥 파손을 유도하는 경우 가이드 RNA와 복합체화하는 Cpf1 이펙터 분자를 식물 세포 내로 도입하는 단계; 및 (c) 관심 유전자를 인코딩하는 HDR 수복 주형을 인코딩하고 HDR의 결과로서 DS 파손의 위치 내로 도입된 뉴클레오티드 서열을 세포 내로 도입하는 단계를 포함한다. 특정 구현예에서, 도입 단계는 Cpf1 이펙터 단백질, 가이드 RNA 및 수복 주형을 인코딩하는 하나 이상의 폴리뉴클레오티드를 식물 세포로 전달하는 것을 포함할 수 있다. 특정 구현예에서, 폴리뉴클레오티드는 DNA 바이러스(예를 들어, 제미니바이러스) 또는 RNA 바이러스(예를 들어, 토브라바이러스)에 의해 세포 내로 전달된다. 특정 구현예에서, 도입 단계는 수복 주형, 가이드 RNA 및 Cpf1 이펙터 단백질을 인코딩하는 하나 이상의 폴리뉴클레오티드 서열을 함유하는 T-DNA를 식물 세포로 전달하는 것을 포함하며, 여기서 전달은 아그로박테리움을 통한 것이다. Cpf1 이펙터 단백질을 인코딩하는 핵산 서열은 프로모터, 예컨대 구조적 프로모터(예를 들어, 콜리플라워 모자이크 바이러스 35S 프로모터) 또는 세포 특이적 또는 유도성 프로모터에 작동 가능하게 연결될 수 있다. 특정 구현예에서, 폴리뉴클레오티드는 미립자가속 충격(microprojectile bombardment)에 의해 도입된다. 특정 구현예에서, 본 방법은 도입 단계 후, 본 방법은 수복 주형, 즉 관심 유전자가 도입되었는지의 여부를 결정하기 위하여, 식물 세포를 스크리닝하는 것을 추가로 포함한다. 특정 구현예에서, 본 방법은 식물 세포로부터 식물을 재생하는 단계를 포함한다. 추가의 구현예에서, 본 방법은 식물을 교배육종하여 유전적으로 원하는 식물 혈통을 수득한다. 관심 특성을 인코딩하는 외래 유전자의 예가 하기 열거된다.
b) 농업적 관심 특성을 수여하는 내인성 유전자의 편집
본 발명은 게놈 편집 또는 관심의 표적 유전자좌에서 또는 그에 연관된 서열을 변형하는 방법을 제공하며, 여기서 방법은 Cpf1 이펙터 단백질 복합체를 식물 세포 내로 도입하는 단계를 포함하며, 이로 인해 Cpf1 복합체는 식물의 내인성 유전자의 발현을 변형시킨다. 이는 상이한 방식으로 전달될 수 있으며, 특정 구현예에서, 내인성 유전자의 발현의 제거가 바람직하고, 유전자 발현을 변형시키기 위하여 Cpf1 CRISPR 복합체는 내인성 유전자를 표적화하고 절단하는데 사용된다. 이들 구현예에서, 본 명세서에서 제공된 방법은 (a) 직접 반복부 및 가이드 서열을 포함하는, 가이드 RNA를 포함하는 Cpf1 CRISPR 복합체를 식물 세포 내로 도입하는 단계로, 여기서 가이드 서열은 식물 세포의 게놈에서 관심 유전자 내 표적 서열에 혼성화하는 단계; 및 (b) 가이드 RNA에의 결합시 표적 서열에 혼성화되는 가이드 서열을 포함하고, 가이드 서열이 표적되는 서열에서 또는 그 근처에서 이중 가닥 파손을 이중 가닥 파손을 보장하는 Cpf1 이펙터 단백질을 세포 내로 도입하는 단계; 특정 구현예에서, 도입 단계는 가이드 RNA 및 Cpf1 이펙터 단백질을 인코딩하는 하나 이상의 폴리뉴클레오티드를 식물 세포로 전달하는 것을 포함할 수 있다.
특정 구현예에서, 폴리뉴클레오티드는 DNA 바이러스(예를 들어, 제미니바이러스) 또는 RNA 바이러스(예를 들어, 토브라바이러스)에 의해 세포 내로 전달된다. 특정 구현예에서, 도입 단계는 가이드 RNA 및 Cpf1 이펙터 단백질을 인코딩하는 하나 이상의 폴리뉴클레오티드 서열을 함유하는 T-DNA를 식물 세포로 전달하는 것을 포함하며, 여기서 전달은 아그로박테리움을 통한 것이다. Cpf1 CRISPR 시스템의 성분을 인코딩하는 폴리뉴클레오티드 서열은 프로모터, 예컨대 구조적 프로모터(예를 들어, 콜리플라워 모자이크 바이러스 35S 프로모터) 또는 세포 특이적 또는 유도성 프로모터에 작동 가능하게 연결될 수 있다. 특정 구현예에서, 폴리뉴클레오티드는 미립자가속 충격에 의해 도입된다. 특정 구현예에서, 도입 단계 후, 본 방법은 수복 주형, 즉 관심 유전자의 발현이 변형되었는지의 여부를 결정하기 위하여, 식물 세포를 스크리닝하는 것을 추가로 포함한다. 특정 구현예에서, 본 방법은 식물 세포로부터 식물을 재생하는 단계를 포함한다. 추가의 구현예에서, 본 방법은 식물을 교배육종하여 유전적으로 원하는 식물 혈통을 수득하는 것을 포함한다.
상기 설명된 방법의 특정 구현예에서, 질병 감수성 유전자 또는 식물의 방어 유전자의 음성 조절자(예를 들어, Mlo 유전자)의 표적된 돌연변이에 의해 질병 저항성 작물이 수득된다. 특정 구현예에서, 아세토락테이트 합성효소(ALS) 및 프로토포피리노겐 옥시다제(PPO)를 인코딩하는 것들과 같은 식물 유전자에서의 특정 뉴클레오티드의 표적된 치환에 의해 제초제-내성 작물이 생성된다. 특정 구현예에서, 비생물 스트레스 저항성의 음성 조절자를 인코딩하는 유전자의 표적된 돌연변이에 의한 가뭄 및 염 내성 작물, 왁시(Waxy) 유전자의 표적된 돌연변이에 의한 저 아밀로오스 곡물, 호분층에서 주요 리파제의 표적된 돌연변이에 의해 감소된 산패취를 갖는 기타 쌀 또는 곡물, 등. 특정 구현예에서, 관심 특성을 인코딩하는 내생 유전자의 더욱 광범위한 리스트가 하기 열거된다.
c) 농업적 관심 특성을 수여하는 Cpf1 CRISPR 시스템에 의한 내인성 유전자의 조절
본 명세서는 또한, 본 명세서에서 제공된 Cpf1 단백질을 이용하여 내인성 유전자 발현을 조절(즉, 활성화 또는 억제)하는 방법을 제공한다. 그러한 방법은 Cpf1 복합체에 의해 식물 게놈으로 표적되는 구별된 RNA 서열(들)을 이용한다. 더욱 특히, 구별된 RNA 서열(들)은 둘 이상의 어댑터 단백질(예를 들어, 압타머)에 결합하고, 이에 의해 각각의 어댑터 단백질은 하나 이상의 작용 도메인과 연관되고, 여기서 어댑터 단백질에 연관된 하나 이상의 작용 도메인 중 적어도 하나는, 메틸라제 활성, 데메틸라제 활성, 전사 활성화 활성, 전사 억제 활성, 전사 방출 인자 활성, 히스톤 변형 활성, DNA 통합 활성 RNA 절단 활성, DNA 절단 활성 또는 핵산 결합 활성의 하나 이상의 활성을 갖는다; 작용 도메인은 바람직한 특성을 수득하기 위하여 내인성 식물 유전자의 발현을 조절하는데 사용된다. 통상적으로, 이들 구현예에서, Cpf1 이펙터 단백질은 하나 이상의 돌연변이를 가져서, 하나 이상의 돌연변이를 갖지 않는 Cpf1 이펙터 단백질의 뉴클레아제 활성의 5% 미만을 갖는다.
특정 구현예에서, 본 명세서에서 제공된 방법은: (a) 직접 반복부 및 가이드 서열을 포함하는, 가이드 RNA를 포함하는 Cpf1 CRISPR 복합체를 세포 내로 도입하는 단계로, 여기서 가이드 서열은 식물 세포에 대해 내생인 표적 서열에 혼성화하는 단계; 및 (b) 가이드 서열이 표적 서열에 혼성화하는 경우 가이드 RNA와 복합체화하는 Cpf1 이펙터 분자를 식물 세포 내로 도입하는 단계를 포함하고, 여기서 가이드 RNA가 작용 도메인에 결합하는 구별된 RNA 서열(압타머)를 포함하도록 변형되고/거나 Cpf1 이펙터 단백질이 작용 도메인에 연결된다는 것에서 변형된다. 특정 구현예에서, 도입 단계는 (변형된) 가이드 RNA 및 (변형된) Cpf1 이펙터 단백질을 인코딩하는 하나 이상의 폴리뉴클레오티드를 식물 세포로 전달하는 것을 포함할 수 있다. 이들 방법에서의 이용을 위한 Cpf1 CRISPR 시스템의 성분의 상세한 내용은 본 명세서 어느 부분에서 설명되어 있다.
특정 구현예에서, 폴리뉴클레오티드는 DNA 바이러스(예를 들어, 제미니바이러스) 또는 RNA 바이러스(예를 들어, 토브라바이러스)에 의해 세포 내로 전달된다. 특정 구현예에서, 도입 단계는 가이드 RNA 및 Cpf1 이펙터 단백질을 인코딩하는 하나 이상의 폴리뉴클레오티드 서열을 함유하는 T-DNA를 식물 세포로 전달하는 것을 포함하며, 여기서 전달은 아그로박테리움을 통한 것이다. Cpf1 CRISPR 시스템의 하나 이상의 성분을 인코딩하는 핵산 서열은 프로모터, 예컨대 구조적 프로모터(예를 들어, 콜리플라워 모자이크 바이러스 35S 프로모터) 또는 세포 특이적 또는 유도성 프로모터에 작동 가능하게 연결될 수 있다. 특정 구현예에서, 폴리뉴클레오티드는 미립자가속 충격에 의해 도입된다. 특정 구현예에서, 본 방법은 도입 단계 후, 본 방법은 관심 유전자의 발현이 변형되었는지의 여부를 결정하기 위하여, 식물 세포를 스크리닝하는 것을 추가로 포함한다. 특정 구현예에서, 본 방법은 식물 세포로부터 식물을 재생하는 단계를 포함한다. 추가의 구현예에서, 본 방법은 식물을 교배육종하여 유전적으로 원하는 식물 혈통을 수득한다. 관심 특성을 인코딩하는 외래 유전자의 예가 하기 열거된다. 특정 구현예에서, 관심 특성을 인코딩하는 내생 유전자의 더욱 광범위한 리스트가 하기 열거된다.
c) 농업적 관심 특성을 수여하는 Cpf1 CRISPR 시스템에 의한 내인성 유전자의 조절
본 명세서는 또한, 본 명세서에서 제공된 Cpf1 단백질을 이용하여 내인성 유전자 발현을 조절(즉, 활성화 또는 억제)하는 방법을 제공한다. 그러한 방법은 Cpf1 복합체에 의해 식물 게놈으로 표적되는 구별된 RNA 서열(들)을 이용한다. 더욱 특히, 구별된 RNA 서열(들)은 둘 이상의 어댑터 단백질(예를 들어, 압타머)에 결합하고, 이에 의해 각각의 어댑터 단백질은 하나 이상의 작용 도메인과 연관되고, 여기서 어댑터 단백질에 연관된 하나 이상의 작용 도메인 중 적어도 하나는, 메틸라제 활성, 데메틸라제 활성, 전사 활성화 활성, 전사 억제 활성, 전사 방출 인자 활성, 히스톤 변형 활성, DNA 통합 활성 RNA 절단 활성, DNA 절단 활성 또는 핵산 결합 활성의 하나 이상의 활성을 갖는다; 작용 도메인은 바람직한 특성을 수득하기 위하여 내인성 식물 유전자의 발현을 조절하는데 사용된다. 통상적으로, 이들 구현예에서, Cpf1 이펙터 단백질은 하나 이상의 돌연변이를 가져서, 하나 이상의 돌연변이를 갖지 않는 Cpf1 이펙터 단백질의 뉴클레아제 활성의 5% 미만을 갖는다.
특정 구현예에서, 본 명세서에서 제공된 방법은: (a) 직접 반복부 및 가이드 서열을 포함하는, 가이드 RNA를 포함하는 Cpf1 CRISPR 복합체를 세포 내로 도입하는 단계로, 여기서 가이드 서열은 식물 세포에 대해 내생인 표적 서열에 혼성화하는 단계; 및 (b) 가이드 서열이 표적 서열에 혼성화하는 경우 가이드 RNA와 복합체화하는 Cpf1 이펙터 분자를 식물 세포 내로 도입하는 단계를 포함하고, 여기서 가이드 RNA가 작용 도메인에 결합하는 구별된 RNA 서열(압타머)를 포함하도록 변형되고/거나 Cpf1 이펙터 단백질이 작용 도메인에 연결된다는 것에서 변형된다. 특정 구현예에서, 도입 단계는 (변형된) 가이드 RNA 및 (변형된) Cpf1 이펙터 단백질을 인코딩하는 하나 이상의 폴리뉴클레오티드를 식물 세포로 전달하는 것을 포함할 수 있다. 이들 방법에서의 이용을 위한 Cpf1 CRISPR 시스템의 성분의 상세한 내용은 본 명세서 어느 부분에서 설명되어 있다.
특정 구현예에서, 폴리뉴클레오티드는 DNA 바이러스(예를 들어, 제미니바이러스) 또는 RNA 바이러스(예를 들어, 토브라바이러스)에 의해 세포 내로 전달된다. 특정 구현예에서, 도입 단계는 가이드 RNA 및 Cpf1 이펙터 단백질을 인코딩하는 하나 이상의 폴리뉴클레오티드 서열을 함유하는 T-DNA를 식물 세포로 전달하는 것을 포함하며, 여기서 전달은 아그로박테리움을 통한 것이다. Cpf1 CRISPR 시스템의 하나 이상의 성분을 인코딩하는 핵산 서열은 프로모터, 예컨대 구조적 프로모터(예를 들어, 콜리플라워 모자이크 바이러스 35S 프로모터) 또는 세포 특이적 또는 유도성 프로모터에 작동 가능하게 연결될 수 있다. 특정 구현예에서, 폴리뉴클레오티드는 미립자가속 충격에 의해 도입된다. 특정 구현예에서, 본 방법은 도입 단계 후, 본 방법은 관심 유전자의 발현이 변형되었는지의 여부를 결정하기 위하여, 식물 세포를 스크리닝하는 것을 추가로 포함한다. 특정 구현예에서, 본 방법은 식물 세포로부터 식물을 재생하는 단계를 포함한다. 추가의 구현예에서, 본 방법은 식물을 교배육종하여 유전적으로 원하는 식물 혈통을 수득한다. 관심 특성을 인코딩하는 외래 유전자의 예가 하기 열거된다. 특정 구현예에서, 관심 특성을 인코딩하는 내생 유전자의 더욱 광범위한 리스트가 하기 열거된다.
배수체 식물을 변형하기 위한 Cpf1의 이용
많은 식물들은 배수체이며, 이는 그들이 그들의 게놈의 복제 카피를 -때때로 밀에서와 같이 많게는 6 개- 실시한다는 의미이다. Cpf1 CRISPR 이펙터 단백질을 이용하는, 본 발명에 따른 방법은 "다중화된" 것이어서 유전자의 모든 카피에 영향을 미치거나 수십 개의 유전자를 한번에 표적할 수 있다. 예를 들어, 특정 구현예에서, 본 발명의 방법은 질병에 대한 방어를 억제하는 원인이 되는 상이한 유전자들에서의 기능적 돌연변이의 손실을 동시에 보장하는데 사용된다. 특정 구현예에서, 본 발명의 방법은 밀 식물 세포에서 TaMLO-Al, TaMLO-Bl 및 TaMLO-Dl 핵산 서열의 발현을 동시에 억제하는데 사용되며, 그로부터 밀 식물을 재생하여, 그 밀 식물이 밀 흰가루병에 저항성인 것을 보장한다(예를 들어, WO2015109752 참조).
작물학적 특성을 수여하는 예시적인 유전자
본 명세서에서 상기 설명된 것과 같이 특정 구현예에서, 본 발명은, 하나 이상의 식물 발현성 유전자(들)을 포함하는 관심 DNA의 삽입을 위해 본 명세서에서 설명된 것과 같은 Cpf1 CRISPR 시스템의 이용을 포괄한다. 추가의 특정 구현예에서, 본 발명은 본 명세서에서 설명된 바와 같은 Cpf1 시스템을 하나 이상의 식물 발현된 유전자(들)의 부분적 또는 완전한 결실을 위해 사용하는 도구 및 방법을 포함한다. 다른 추가의 구현예에서, 본 발명은 하나 이상의 뉴클레오티드의 돌연변이, 치환, 삽입에 의해 하나 이상의 식물 발현된 유전자들의 변형을 보장하기 위하여 본 명세서에서 설명된 바와 같은 Cpf1 시스템을 사용하는 도구 및 방법을 포함한다. 다른 특정 구현예에서, 본 발명은 식물 발현된 유전자의 발현을 유도하는 하나 이상의 조절 요소의 특정 변형에 의해 하나 이상의 상기 유전자의 발현의 변형을 보장하기 위하여 본 명세서에서 설명된 것과 같은 Cpf1 CRISPR 시스템의 이용을 포함한다.
특정 구현예에서, 본 발명은 외인성 유전자 및/또는 내인성 유전자의 표적화 및 예컨대 하기 열거되는 이들의 조절 요소의 도입을 수반하는 방법을 포함한다:
1. 해충 또는 질병에 대한 저항성을 수여하는 유전자:
· 식물 질병 저항성 유전자. 식물은 특정 병원균 균주에 대해 저항성인 식물을 조작하기 위하여 클로닝된 저항성 유전자로 형질전환될 수 있다. 예를 들어, 문헌 [Jones et al., Science 266:789 (1994) (cloning of the tomato Cf- 9 gene for resistance to Cladosporium fulvum)]; 문헌 [Martin et al., Science 262:1432 (1993) (tomato Pto gene for resistance to Pseudomonas syringae pv. tomato encodes a protein kinase)]; 문헌 [Mindrinos et al., Cell 78:1089 (1994) (Arabidopsmay be RSP2 gene for resistance to Pseudomonas syringae)] 참조.
· 해충, 예컨대 콩 시스트(cyst) 선충에 대한 저항성을 수여하는 유전자. 예를 들어, PCT 출원 WO 96/30517; PCT 출원 WO 93/19181 참조.
· 바실러스 투린지엔시스(Bacillus thuringiensis) 단백질, 예를 들어, 문헌 [Geiser et al., Gene 48:109 (1986)] 참조.
· 렉틴류, 예를 들어, 문헌 [Van Damme et al., Plant Molec. Biol. 24:25 (1994) 참조.
· 비타민-결합 단백질, 예컨대 아비딘, 해충에 대하여 살유충제로서 아비딘 및 아비딘 상동체의 이용을 교시하는 PCT 출원 US93/06487 참조.
· 효소 억제제, 예컨대 프로테아제 또는 프로테이나제 억제제 또는 아밀라제 억제제. 예를 들어, 문헌 [Abe et al., J. Biol. Chem. 262:16793 (1987), Huub et al., Plant Molec. Biol. 21:985 (1993)), Sumitani et al., Biosci. Biotech. Biochem. 57:1243 (1993) 및 미국 특허5,494,813] 참조.
· 곤충-특이적 호르몬 또는 페로몬, 예컨대 엑디스테로이드 또는 유충 호르몬, 그의 변이체, 그에 기초한 모방체, 또는 그의 작용제 또는 길항제. 예를 들어 문헌 [Hammock et al., Nature 344:458 (1990)] 참조.
· 곤충-특이적 펩티드 또는 뉴로펩티드로, 이들은 발현시 영향받은 해충의 생리학을 붕괴시킨다. 예를 들어 문헌 [Regan, J. Biol. Chem. 269:9 (1994) 및 Pratt et al., Biochem. Biophys. Res. Comm. 163:1243 (1989)]. 또한, 미국 특허 5,266,317호 참조.
· 뱀, 말벌, 또는 임의의 기타 생물에 의해 자연적으로 생산되는 곤충-특이적 독소. 예를 들어, 문헌 [Pang et al., Gene 116: 165 (1992)] 참조.
· 모노테르펜, 세스퀴테르펜, 스테로이드, 하이드록삼산, 페닐프로파노이드 유도체 또는 또 다른 살충 활성을 갖는 비단백질 분자의 초집적에 원인이 되는 효소
· 생물학적 활성 분자의 번역후 변형을 포함하는, 변형에 관련된 효소; 예를 들어, 천연 또는 합성 여부를 떠나, 당분해 효소, 단백분해 효소, 지질분해 효소, 뉴클레아제, 시클라아제, 트랜스아미나제, 에스테라제, 가수분해효소, 포스파타제, 키나아제, 포스포릴라제, 폴리머라제, 엘라스타제, 키티나제 및 글루카나제. PCT 출원 WO93/02197호, 문헌 [Kramer et al., Insect Biochem. Molec. Biol. 23:691 (1993) 및 Kawalleck et al., Plant Molec. Biol. 21 :673 (1993)] 참조.
· 단일 형질도입을 자극하는 분자. 예를 들어, 문헌 [Botella et al., Plant Molec. Biol. 24:757 (1994), 및 Griess et al., Plant Physiol. 104:1467 (1994)] 참조.
· 바이러스-침입성 단백질 또는 그로부터 유도된 복합 독소. 문헌 [Beachy et al., Ann. rev. Phytopathol. 28:451 (1990)] 참조.
· 병원균 또는 기생충에 의해 자연적으로 생산되는 발생-저지성 단백질. 문헌 [Lamb et al., Bio/Technology 10:1436 (1992) 및 Toubart et al., Plant J. 2:367 (1992)] 참조.
· 식물에 의해 자연적으로 생산되는 발생-저지성 단백질. 예를 들어, 문헌 [Logemann et al., Bio/Technology 10:305 (1992)].
· 식물에서, 병원균은 종종 숙주-특이적이다. 예를 들어, 일부 푸사리움 종은 토마토 시듬을 유발하지만 토마토만을 공격하고, 다른 푸사리움 종은 밀만을 공격한다. 식물은 대부분의 병원균에 저항하는 기존 및 유도된 방어를 갖는다. 특히 병원균은 식물보다 더욱 높은 빈도로 번식하기 때문에, 식물 재생에 걸친 돌연변이 및 재조합 이벤트는 민감성을 유발하는 유전적 변동성을 일으킨다. 식물에서는 비숙주 저항성이 있을 수 있으며, 예를 들어, 숙주 및 병원균은 비상용성이거나, 통상적으로 많은 유전자에 의해 제어되는, 모든 종류의 병원균에 대하여 부분 저항성 및/또는 다른 종류에 대해서는 아니지만 일부 종류의 병원균에 대해 완전한 저항성일 수 있다. 그러한 저항성은 통상적으로 일부 유전자에 의해 제어된다. CRISP-Cpf1 시스템의 성분 및 방법을 이용하여, 새로운 도구가 이제 존재하여 여기서 예측되는 특정 돌연변이를 유도한다. 따라서, 저항성 유전자의 공급원들의 게놈이 분석될 수 있고, 바람직한 특징 또는 특성을 갖는 식물에서, Cpf1 CRISPR 시스템의 방법 및 성분을 이용하여 저항성 유전자의 발생 증가를 유도할 수 있다. 본 발명의 시스템은 이를 이전의 돌연변이유발제보다 더욱 정확하게 수행할 수 있고, 이에 따라 식물 육종 계획을 가속화 및 개선시킨다.
2. 식물 질병에 관련된 유전자, 예컨대 WO 2013046247호에 열거된 것들:
· 쌀 질병: 벼도열병, 벼개씨무늬병균, 벼문고병, 벼키다리병; 밀 질병: 밀 흰가루병, 푸사리움 그라미네아룸(Fusarium graminearum), F. 아베나세움(F. avenaceum), F. 컬모룸(F. culmorum), 마이크로도키움 니발(Microdochium nivale), 푹시니아 스트리포르미스(Puccinia striiformis), P. 그라미니스(P. graminis), P 레콘디타(P. recondita), 마이크로넥트리엘라 니발(Micronectriella nivale), 티풀라 종(Typhula sp.), 우스틸라고 트리티시(Ustilago tritici), 틸레티아 카리에스(Tilletia caries), 슈도세르코스포렐라 헤르포트리코이데스(Pseudocercosporella herpotrichoides), 마이코스패렐라 그라미니콜라(Mycosphaerella graminicola), 스타고노스포라 노도룸(Stagonospora nodorum), 밀황갈색반점병균; 보리 질병: 보리흰가루병, 푸사리움 그라미네아룸, F. 아베나세움, F. 컬모룸, 마이크로도키움 니발, 푹시니아 스트리포르미스, P. 그라미니스, P. 호르데이(P. hordei), 우스틸라고 누다(Ustilago nuda), 린코스포리움 세칼리스(Rhynchosporium secalis), 피레노포라 테레스(Pyrenophora teres), 코크클리오볼루스 사티버스(Cochliobolus sativus), 피레노포라 그라미니아(Pyrenophora graminea), 리족토니아 솔라니(Rhizoctonia solani); 옥수수 질병: 우스틸라고 마이디스(Ustilago maydis), 코클리오볼루스 헤테로스트로푸스(Cochliobolus heterostrophus), 글로에오세르코스포라 소르기(Gloeocercospora sorghi), 푹시니아 폴리소라(Puccinia polysora), 세르코스포라 지-마이디스(Cercospora zeae-maydis), 리족토니아 솔라니;
· 감귤류 질병: 검은점무늬병, 더뎅이병균, 페니실리움 디지타툼(Penicillium digitatum), P. 이탈리쿰(P. italicum), 파이토프토라 파라시티카(Phytophthora parasitica), 파이토프토라 시트로프토라(Phytophthora citrophthora); 사과 질병: 모닐리니아 말리(Monilinia mali), 발사 세라토스페르마(Valsa ceratosperma), 포도스페라 류코트리카(Podosphaera leucotricha), 알타나리아 알타나타(Alternaria alternata) 사과 병원형, 벤투리아 이나에쿨리스(Venturia inaequalis), 콜레토트리쿰 아쿠타툼(Colletotrichum acutatum), 파이토프토라 켁토룸(Phytophtora cactorum);
· 배 질병: 벤츄리아 나쉬콜라(Venturia nashicola), V. 피리나(V. pirina), 알타나리아 알타나타 일본 배 병원형, 김노스포란지움 하레아눔(Gymnosporangium haraeanum), 파이토프토라 켁토룸(Phytophtora cactorum);
· 복숭아 질병: 모닐리니아 프룩티콜라(Monilinia fructicola), 크라도스포리움 카르포필룸(Cladosporium carpophilum), 포모프시스 종(Phomopsis sp.);
· 포도 질병: 엘시노 암페리나(Elsinoe ampelina), 글로메레라 싱귤라타(Glomerella cingulata), 우니눌라 네카토(Uninula necator), 파코스포라 암페롭시디스(Phakopsora ampelopsidis), 기그나디아 비드웰리(Guignardia bidwellii), 플라스모파라 비티콜라(Plasmopara viticola);
· 감 질병: 글로스포리움 카키(Gloesporium kaki), 세르코스포라 카키(Cercospora kaki), 미코스페렐라 나위(Mycosphaerela nawae);
· 박 질병: 콜레토트리쿰 라제나리움(Colletotrichum lagenarium), 스파에로테카 푸리지니아(Sphaerotheca fuliginea), 마이코스페렐라 멜로니스(Mycosphaerella melonis), 푸사리움 옥시스포룸(Fusarium oxysporum), 슈도페로노스포라 쿠벤시스(eudoperonospora cubensis), 파이토프토라 종(Phytophthora sp.), 피티움 종(Pythium sp.);
· 토마토 질병: 알터나리아 솔라니(Alternaria solani), 크라도스포리움 풀붐(Cladosporium fulvum), 파이토프토라 인페스탄스(Phytophthora infestans);
· 가지 질병: 포모프시스 벡산스(Phomopsis vexans), 에리시페 시코라세아룸(Erysiphe cichoracearum);
배추과 식물 질병: 알터나리아 자포니카(Alternaria japonica), 세르코스포렐라 블라시카(Cercosporella brassicae), 플라스모디오포라 블라시카(Plasmodiophora brassicae), 페로노스포라 파라시티카(Peronospora parasitica);
· 파 질병: 푹시니아 알리(Puccinia allii), 페로노스포라 디스트럭터(Peronospora destructor);
· 콩 질병: 콩자주무늬병, 엘시노 글리신(Elsinoe glycines), 디아포르테 파세오로룸 변이체 소제(Diaporthe phaseolorum var. sojae), 셉토리아 글리신(Septoria glycines), 세르코스포라 소지나(Cercospora sojina), 파콥소라 파키리지(Phakopsora pachyrhizi), 파이토프토라 소제(Phytophthora sojae), 리족토니아 솔라니, 코리네스포라 카시이콜라(Corynespora casiicola), 스크레로티니아 스크레로티오룸(Sclerotinia sclerotiorum);
· 강낭콩 질병: 콜레트리쿰 린뎀티아눔(Colletrichum lindemthianum);
· 땅콩 질병: 세르코스포라 페르소나타(Cercospora personata), 세르코스포라 아라키디콜라(Cercospora arachidicola), 스크레로티움 롤프시(Sclerotium rolfsii);
· 완두콩 질병 완두콩: 에리시페 피시(Erysiphe pisi);
· 감자 질병: 알터나리아 솔라니, 파이토프토라 인페스탄, 파이토프토라 에리스로셉티카(Phytophthora erythroseptica), 스폰고스포라 서브테라니언 f. sp. 서브테라니언(Spongospora subterranean, f. sp. Subterranean);
· 딸기 질병: 스페로데카 휴물리(Sphaerotheca humuli), 글로메렐라 싱굴라타;
· 차 질병: 엑소바시디움 레티큘라툼(Exobasidium reticulatum), 엘시노 류코스필라(Elsinoe leucospila), 페스탈로티옵시스 sp.(Pestalotiopsis sp.), 콜레토트리쿰 데아-시넨시스(Colletotrichum theae-sinensis);
· 담배 질병: 알터나리아 론지페(Alternaria longipes), 에리시페 시코라세아룸, 콜레토트리쿰 타바쿰(Colletotrichum tabacum), 페로노스포라 타바시나(Peronospora tabacina), 파이토프토라 니코티아나(Phytophthora nicotianae);
· 유채 질병: 스클레로티니아 스클레로티오룸(Sclerotinia sclerotiorum), 리족토니아 솔라니;
· 목화 질병: 리족토니아 솔라니;
· 비트 질병: 세르코스포라 베티콜라(Cercospora beticola), 타나테포러스 쿠쿠메리스(Thanatephorus cucumeris), 타나테포러스 쿠쿠메리스, 아파노미세스 코클리오이데스(Aphanomyces cochlioides);
· 장미 질병: 디플로카폰 로제(Diplocarpon rosae), 스페로데카 판노사(Sphaerotheca pannosa), 페로노스포라 스파르사(Peronospora sparsa);
· 국화 및 국화과의 질병: 브레미아 락투카(Bremia lactuca), 셉토리아 크리산데미-인디시(Septoria chrysanthemi-indici), 푸시니아 호리아나(Puccinia horiana);
· 다양한 식물들의 질병: 피티움 아파니더마텀(Pythium aphanidermatum), 피티움 데바리아눔(Pythium debarianum), 피티움 그라미니콜라(Pythium graminicola), 피티움 이레귤라레(Pythium irregulare), 피티움 얼티멈(Pythium ultimum), 보트리티스 시네레아(Botrytis cinerea), 스클레로티니아 스클레로티오룸(Sclerotinia sclerotiorum);
· 무 질병: 알터나리아 브라시시콜라(Alternaria brassicicola);
· 잔디 질병: 스클레로티니아 호메오카르파(Sclerotinia homeocarpa), 리족토니아 솔라니;
· 바나나 질병: 미코스페렐라 피지엔시스(Mycosphaerella fijiensis), 미코스페렐라 뮤시콜라(Mycosphaerella musicola);
· 해바라기 질병: 플라스모파라 할스테니(Plasmopara halstedii);
· 종자 질병 또는 아스페르길루스 종(Aspergillus spp.), 페니실리움 종(Penicillium spp.), 푸사리움 종(Fusarium spp.), 지베렐라 종 (Gibberella spp.), 트리코더마 종(Tricoderma spp.), 티엘라비옵시스 종(Thielaviopsis spp.), 라이조푸스 종(Rhizopus spp.), 뮤코 종(Mucor spp.), 코르티시움 종(Corticium spp.), 로마 종(Rhoma spp.), 리족토니아 종(Rhizoctonia spp.), 디플로디아 종(Diplodia spp.) 또는 이러한 것들로부터 기인된 다양한 식물들의 성장 초기 단계에서의 질병;
· 폴리믹사 종((Polymixa spp.), 올피디윰 종 (Olpidium spp.), 등에 의해 매개된 각종 식물의 바이러스 질병.
3. 제초제에 대한 저항성을 수여하는 유전자의 예:
· 생장점 또는 분열조직을 억제하는 제초제, 예컨대 이미다졸리논 또는 설포닐우레아에 대한 저항성, 예를 들어, 각각 문헌 [Lee et al., EMBO J. 7:1241 (1988), 및 Miki et al., Theor. Appl. Genet. 80:449 (1990)].
· 글리포세이트 내성(각각, 예를 들어, 돌연변이체 5-엔올피루빌시키메이트-3-포스페이트 신타제(EPSP) 유전자, aroA 유전자 및 글리포세이트 아세틸 트랜스퍼라제(GAT) 유전자에 의해 수여된 저항성), 또는 예컨대 글리포시네이트(스트렙토마이세스 하이그로스코피쿠스(Streptomyces hygroscopicu) 및 스트렙토마이세스 비리디크로모게네스(Streptomyces viridichromogenes)를 포함하는, 스트렙토마이신 종으로부터의, 포스피노트리신 아세틸 트랜스퍼라제(PAT) 유전자)에 의한 기타 포스포노 화합물에 대한 저항성, ACC아제 억제제-인코딩 유전자에 의한 피리디녹시 또는 페녹시 프로피온산에 대한 저항성. 예를 들어, 미국 특허 4,940,835 및 미국 특허 6,248,876, 미국 특허 4,769,061, 유럽 특허 0 333 033 및 미국 특허 4,975,374 참조. 또한, 유럽 특허 0242246, 문헌 [DeGreef et al., Bio/Technology 7:61 (1989), Marshall et al., Theor. Appl. Genet. 83:435 (1992)], Castle 등에게 부여된 WO 2005012515 및 WO 2005107437 참조.
· 광합성을 억제하는 제초제에 대한 저항성, 예컨대 트라이아진(psbA 및 gs+ 유전자) 또는 벤조니트릴(니트릴라제 유전자), 및 글루타티온 S-트랜스퍼라제 문헌 [Przibila et al., Plant Cell 3:169 (1991)], 미국 특허 4,810,648, 및 문헌 [Hayes et al., Biochem. J. 285: 173 (1992)] 참조.
· 제초제를 해독하는 효소를 인코딩하는 유전자 또는 억제에 대해 저항성인 돌연변이체 글루타민 신타제 효소, 예를 들어 미국 특허 연번 11/760,602. 또는 해독 효소는 포스피노트리신 아세틸트랜스퍼라제를 인코딩하는 효소(예컨대, 스트렙토마이세스 종으로부터의 바(bar) 또는 팻(pat) 단백질). 포스피노트리신 아세틸트랜스퍼라제는 예를 들어 미국 특허 5,561,236; 5,648,477; 5,646,024; 5,273,894; 5,637,489; 5,276,268; 5,739,082; 5,908,810 및 7,112,665에 설명되어 있다.
· 하이드록시페닐피루베이트다이옥시게나제(HPPD) 억제제, 즉, 자연발생하는 HPPD 저항성 효소, 또는 돌연변이된 또는 키메라 HPPD 효소를 인코딩하는 유전자로, 이는 WO 96/38567, WO 99/24585, 및 WO 99/24586, WO 2009/144079, WO 2002/046387, 또는 미국 특허 6,768,044에 설명된 바와 같음.
4. 비생물 스트레스 내성에 관련된 유전자의 예:
· 식물 세포 또는 식물에서 폴리(ADP-리보오스) 폴리머라제(PARP) 유전자의 발현 및/또는 활성을 감소시킬 수 있는 이식유전자로, WO 00/04173 또는 WO 2006/045633에 설명된 바와 같음.
· 식물 세포 또는 식물에서 PARG 인코딩 유전자의 발현 및/또는 활성을 감소시킬 수 있는 이식유전자로, WO 2004/090140에 설명된 바와 같음.
· 니코틴아미다제, 니코티네이트 포스포리보실트랜스퍼라제, 니코틴산 모노뉴클레오티드 아데닐 트랜스퍼라제, 니코틴아미드 아데닌 디뉴클레오티드 신써타제(synthetase) 또는 니코틴 아미드 포스포리보실트랜스퍼라제를 포함하는 니코틴아미드 아데닌 디뉴클레오티드 샐비지(salvage) 합성 경로의 식물-작용성 효소를 코딩하는 이식유전자로, 예를 들어, EP 04077624.7, WO 2006/133827, PCT/EP 07/002,433, EP 1999263, 또는 WO 2007/107326에 설명된 바와 같음.
· 탄수화물 생합성에 관련된 효소는 예를 들어, 다음에 설명된 것들이 포함되고: EP 0571427, WO 95/04826, EP 0719338, WO 96/15248, WO 96/19581, WO 96/27674, WO 97/11188, WO 97/26362, WO 97/32985, WO 97/42328, WO 97/44472, WO 97/45545, WO 98/27212, WO 98/40503, WO99/58688, WO 99/58690, WO 99/58654, WO 00/08184, WO 00/08185, WO 00/08175, WO 00/28052, WO 00/77229, WO 01/12782, WO 01/12826, WO 02/101059, WO 03/071860, WO 2004/056999, WO 2005/030942, WO 2005/030941, WO 2005/095632, WO 2005/095617, WO 2005/095619, WO 2005/095618, WO 2005/123927, WO 2006/018319, WO 2006/103107, WO 2006/108702, WO 2007/009823, WO 00/22140, WO 2006/063862, WO 2006/072603, WO 02/034923, EP 06090134.5, EP 06090228.5, EP 06090227.7, EP 07090007.1, EP 07090009.7, WO 01/14569, WO 02/79410, WO 03/33540, WO 2004/078983, WO 01/19975, WO 95/26407, WO 96/34968, WO 98/20145, WO 99/12950, WO 99/66050, WO 99/53072, 미국 특허 6,734,341, WO 00/11192, WO 98/22604, WO 98/32326, WO 01/98509, WO 01/98509, WO 2005/002359, 미국 특허 5,824,790, 미국 특허 6,013,861, WO 94/04693, WO 94/09144, WO 94/11520, WO 95/35026 또는 WO 97/20936, 또는 EP 0663956, WO 96/01904, WO 96/21023, WO 98/39460, 및 WO 99/24593에 기술된 바와 같은, 특히 이눌린 및 레반-유형의 폴리프룩토스의 생산, WO 95/31553, US 2002031826, 미국 특허 6,284,479, 미국 특허 5,712,107, WO 97/47806, WO 97/47807, WO 97/47808 및 WO 00/14249에 개시된 바와 같은, 알파-1,4-글루칸스의 생산, WO 00/73422에 개시된 바와 같은, 알파-1,6 분지된 알파-1,4-글루칸스의 생산, 예를 들어 WO 00/47727, WO 00/73422, EP 06077301.7, 미국 특허 5,908,975 및 EP 0728213에 개시된 바와 같은, 알테난의 생산, 예를 들어 WO 2006/032538, WO 2007/039314, WO 2007/039315, WO 2007/039316, JP 2006304779, 및 WO 2005/012529에 개시된 바와 같은, 히알루로난의 생산에 관련된 효소가 포함된다.
· 가뭄 저항성을 개선시키는 유전자. 예를 들어, WO 2013122472는 작용성 유비퀴틴 단백질 리가제 단백질(UPL) 단백질, 더욱 구체적으로 UPL3의 부재 또는 감소된 수준은 상기 식물의 가뭄에 대한 개선된 저항성 또는 물에 대한 감소된 요구를 이끔을 개시한다. 증가된 가뭄 내성을 갖는 유전자이식 식물의 다른 예들은 예를 들어, US 2009/0144850, US 2007/0266453, 및 WO 2002/083911에 개시된다. US 2009/0144850는 DR02 핵산의 변경된 발현으로 인해, 가뭄 내성 표현형을 나타내는 식물을 설명한다. US 2007/0266453은 DR03 핵산의 변경된 발현으로 인해, 가뭄 내성 표현형을 나타내는 식물을 설명하고, WO 2002/083911는 공변 세포(guard cell)에서 발현되는 ABC 수송체의 감소된 활성으로 인해, 가뭄 스트레스에 대해 증가된 내성을 갖는 식물을 설명한다. 또 다른 예는 Kasuga와 공동저자(1999)에 의한 연구로, 이들은 유전자이식 식물에서 DREB1 A를 인코딩하는 cDNA의 과잉발현이 정상의 생장 조건 하에서 많은 스트레스 내성 유전자의 발현을 활성화하였고, 가뭄, 염 부하(salt loading), 및 동결에 대해 개선된 내성을 결과로서 초래하였음을 설명한다. 그러나, DREB1A의 발현은 또한 정상의 생장 조건 하에서 심한 성장 지연을 결과로서 초래하였다 (문헌 [Kasuga (1999) Nat Biotechnol 17(3) 287-291]).
추가의 구체적인 구현예에서, 작물 식물은 특이적 식물 특성에 영향을 미침으로써 개선될 수 있다. 예를 들어, 살충제-저항성 식물의 개발, 식물에서의 질병 저항성의 개선, 식물 곤충 및 선충 저항성의 개선, 기생성 잡초에 대한 식물 저항성의 개선, 식물 가뭄 내성의 개선, 식물 영양 가치 개선, 식물 스트레스 내성의 개선, 자가-수분 회피, 식물 여물 소화성 바이오매스(biomass), 곡물 수율에 의함. 몇몇 특이적 비제한적 예가 하기에 제공된다.
단일한 유전자의 표적된 돌연변이에 추가하여, 다수의 유전자의 표적된 돌연변이, 염색체 단편의 결실, 이식유전자의 부위-특이적 통합, 생체 내 부위-유도된 돌연변이 및 식물에서 정밀 유전자 치환 또는 대립 형질 교체를 가능하게 하도록 Cpf1CRISPR 복합체가 설계될 수 있다. 따라서, 본 명세서에 설명된 방법은 유전자 발견 및 확인, 돌연변이 및 동종유전자이식(cisgenic) 육종, 및 잡종 육종에서 광범위한 응용을 갖는다. 이들 응용은 제초제 저항성, 질병 저항성, 비생물 스트레스 내성, 고수율 및 우수한 품질과 같은 각종 개선된 작물학적 특성을 갖는 유전적으로 변형된 작물의 새로운 세대의 생산을 촉진시킨다.
웅성불임 식물의 창출을 위한 Cpf1 유전자의 이용
잡종 식물은 근친교배된 식물에 비하여 통상적으로 유리한 작물학적 특성을 갖는다. 그러나, 자가-수분 식물의 경우, 잡종의 생성은 어려울 수 있다. 상이한 식물 유형에서, 식물 생식력, 더욱 구체적으로 웅성 생식력에 중요한 유전자가 확인되었다. 예를 들어, 메이즈에서, 생식력에 중요한 둘 이상의 유전자가 확인되었다(2014년 인도 자이푸르에서 10월 9-10일 개최된 신규 식물 육종 분자 기술 기술 개발 및 규제에 대한 아미타브 모한티 국제 회의 (Amitabh Mohanty International Conference on New Plant Breeding Molecular Technologies Technology Development And Regulation); 문헌 [ Svitashev et al. Plant Physiol. 2015 Oct;169(2):931-45]; 문헌 [Djukanovic et al. Plant J. 2013 Dec;76(5):888-99]). 본 명세서에 제공된 방법은, 쉽게 교배하여 잡종을 생성할 수 있는 웅성 불임 식물을 생산하기 위하여 웅성 생식력에 요구되는 유전자를 표적화하는데 사용될 수 있다. 특정 구현예에서, 본 명세서에 제공된 Cpf1 CRISPR 시스템은 시토크롬 P450-유사 유전자 (MS26) 또는 메가뉴클레아제 유전자 (MS45)의 표적된 돌연변이에 사용되어, 그에 의해 메이즈 식물에 대한 웅성 불임을 수여한다. 그렇게 유전적으로 변경된 메이즈 식물은 잡종 육종 계획에 사용될 수 있다.
식물에서 생식성 단계의 증가
특정 구현예에서, 본 명세서에서 제공된 방법은, 벼와 같은 식물의 생식력을 연장시키는데 사용된다. 예를 들어, 유전자에서 돌연변이를 생성하기 위한 Ehd3과 같은 벼 생식력 단계 유전자가 표적될 수 있으며, 묘목이 연장된 재생 식물 생식력 단계를 위해 선택될 수 있다(CN 104004782에 설명된 바와 같음).
관심 작물에서 유전적 변이를 생성하기 위한 Cpf1의 이용
작물 식물에서 야생의 생식질(germplasm) 및 유전적 변형의 이용가능성은 작물 개선 프로그램에 대한 해결의 열쇠지만, 작물 식물로부터의 생식질에서 이용가능한 다양성은 제한된다. 본 발명은 관심 생식질에서 다양한 유전적 변이를 생성하는 방법을 생각한다. Cpf1 CRISPR 시스템의 이러한 적용에서, 식물 게놈에서의 상이한 위치를 표적화하는 가이드 RNA의 라이브러리가 제공되고, 이는 Cpf1 이펙터 단백질과 함께 식물 세포 내로 도입된다. 이러한 방식으로, 게놈-규모 점 돌연변이 및 유전자 낙아웃의 모음이 생성될 수 있다. 특정 구현예에서, 방법은 그렇게 수득된 세포로부터의 식물 또는 식물 부분을 재생하고, 관심 특성에 대해 세포를 스크리닝하는 것을 포함한다. 표적 유전자는 코딩 및 비코딩 영역 모두를 포함할 수 있다. 특정 구현예에서, 특성은 스트레스 내성이고, 방법은 스트레스-내성 작물 변이의 생성 방법이다.
과일-숙성에 영향을 미치는 Cpf1의 이용
숙성은 과실 및 채소의 성숙 과정에서 정상 상(phase)이다. 시작된 후 단지 며칠만에, 이는 먹지 못하는 과실 또는 채소가 된다. 이 과정은 농부와 소비자 모두에게 심각한 손실을 가져온다. 특정 구현예에서, 본 발명의 방법은 에틸렌 생산을 감소시키는데 사용된다. 이는 다음 중 하나 이상에 의해 보장된다: a. ACC 신타제 유전자 발현의 저해. ACC (1-아미노시클로프로판-1-카르복실산) 신타제는 에틸렌 생합성에서의 최종 단계에서 두번째인, S-아데노실메티오닌 (SAM)의 ACC로의 전환의 원인이 되는 효소이다. 신타제 유전자의안티센스("거울-이미지") 또는 절단된 카피가 식물의 게놈 내로 삽입된 경우 효소 발현은 방해된다.; b. ACC 데아미나아제 유전자의 삽입. 효소를 코딩하는 유전자는, 일반의 비병원균성 토양 세균인 슈도모나스 클로라피스(Pseudomonas chlororaphis)로부터 선택된다. 이는 ACC를 상이한 화합물로 전환하고, 이에 의해 에틸렌 생산에 이용가능한 ACC의 양을 감소시킨다; c. SAM 가수분해효소 유전자의 삽입. 이러한 시도는 ACC 데아미나아제와 유사하며, 여기서 에틸렌 생산은, 그의 전구체 대사산물의 양이 감소된 경우 방해된다; 이 경우, SAM은 호모세린으로 전환된다. 이 효소를 코딩하는 유전자는 대장균 T3 박테리오파지로부터 수득되고, d. ACC 옥시다제 유전자 발현의 저해. ACC 옥시다제는 ACC의 에틸렌으로의 산화를 촉매하는 효소이며, 에틸렌 생합성 경로에서 최종 단계이다. 본 명세서에서 설명된 방법을 이용하여, ACC 옥시다제 유전자의 하향 조절은 에틸렌 생산의 억제를 결과로서 초래하며, 이에 의해 과실 숙성을 지연시킨다. 특정 구현예에서, 상기 설명된 변형에 추가적으로 또는 대안적으로, 본 명세서에서 설명된 방법은, 과실에 의해 수득된 에틸렌 신호로 간섭되도록, 에틸렌 수용체를 변형시키는데 사용된다. 특정 구현예에서, 에틸렌 결합 단백질을 인코딩하는 ETR1 유전자의 발현은 변형, 더욱 구체적으로는 저해된다. 특정 구현예에서, 상기 설명된 변형에 대해 추가적으로 또는 대안적으로, 본 명세서에서 설명된 방법은, 식물 세포벽의 온전성을 유지하는 성분인 펙틴의 분해에 원인이 되는 효소인, 폴리갈락투로나제 (PG)를 인코딩하는 유전자의 발현을 변형시키는데 사용된다. 펙틴 분해는 숙성 과정의 출발에서 일어나서, 과실의 연화를 초래한다. 따라서, 특정 구현예에서, 본 명세서에서 설명된 방법은 PG 유전자 내에 돌연변이를 도입하거나, PG 유전자의 활성화를 억제하는데 사용되어, 그에 의해 생산되는 PG 효소의 양을 감소시켜 펙틴 분해를 지연시킨다.
이에 따라 특정 구현예에서, 방법은 상기 설명된 바와 같은 식물 세포의 게놈의 하나 이상의 변형 및 그로부터의 식물의 재생을 보장하기 위한 Cpf1 CRISPR 시스템의 이용을 포함한다. 특정 구현예에서, 식물은 토마토 식물이다.
식물의 저장 수명 증가
특정 구현예에서, 본 발명의 방법은 식물 또는 식물 부분의 저장 수명에 영향을 미치는 화합물의 생산에 관련된 유전자들을 변형시키는데 사용된다. 더욱 구체적으로, 변형은 감자 괴경에서 환원당의 축적을 방지하는 유전자에서 일어난다. 고온 공정시, 이들 환원당은 유리 아미노산과 반응하여 갈변, 쓴맛 생성물 및 잠재적인 발암물질인 아크릴아미드의 상승된 수준을 결과로서 초래한다. 특정 구현예에서, 본 명세서에서 제공된 방법은, 수크로오스를 글루코오스와 프룩토오스로 분해시키는 단백질을 인코딩하는, 액포성 인버타제 유전자 (VInv)의 발현을 감소 또는 저해시키는데 사용된다(문헌 [Clasen et al. DOI: 10.1111/pbi.12370]).
부가가치 특성을 보장하기 위한 Cpf1 CRISPR 시스템의 이용
특정 구현예에서, Cpf1 CRISPR 시스템은 영양적으로 개선된 농업 작물을 생산하는데 사용된다. 특정 구현예에서, 본 명세서에서 제공된 방법은 조정되어, "기능성 식품", 즉 그가 함유하는 전통적인 영양소를 뛰어넘는 건강상 이익을 제공할 수 있는 변형된 식품 또는 식품 성분 및/또는 "뉴트라슈티컬(nutraceutical)", 즉 식품 또는 식품의 부분으로 여겨질 수 있고, 질병의 예방 및 치료를 포함하는, 건강상 이익을 제공하는 성분을 생성한다. 특정 구현예에서, 뉴트라슈티컬은 암, 당뇨병, 심혈관 질병, 및 고혈압 중 하나 이상의 치료 및/또는 예방에 유용하다.
영양적으로 개선된 작물의 예는 다음을 포함한다 (문헌 [Newell-McGloughlin, Plant Physiology, July 2008, Vol. 147, pp. 939-953]):
변형된 단백질 품질, 함량 및/또는 아미노산 조성이 예컨대 바히아그라스(Bahiagrass) (문헌 [Luciani et al. 2005, Florida Genetics Conference Poster]), 카놀라 (Roesler et al., 1997, Plant Physiol 113 75-81), 메이즈 (문헌 [Cromwell et al, 1967, 1969 J Anim Sci 26 1325-1331, O’Quin et al. 2000 J Anim Sci 78 2144-2149, Yang et al. 2002, Transgenic Res 11 11-20, Young et al. 2004, Plant J 38 910-922]), 감자 (문헌 [Yu J and Ao, 1997 Acta Bot Sin 39 329-334; Chakraborty et al. 2000, Proc Natl Acad Sci USA 97 3724-3729; Li et al. 2001, Chin Sci Bull 46 482-484]), 쌀 (문헌 [Katsube et al. 1999, Plant Physiol 120 1063-1074]), 대두 (문헌 [Dinkins et al. 2001, Rapp 2002, In Vitro Cell Dev Biol Plant 37 742-747]), 고구마 (문헌 [Egnin and Prakash 1997, In Vitro Cell Dev Biol 33 52A])에 대해 설명되었다.
필수 아미노산 함량이, 예컨대, 카놀라 (문헌 [Falco et al. 1995, Bio/Technology 13 577-582]), 루핀(Lupin) (문헌 [White et al. 2001, J Sci Food Agric 81 147-154]), 메이즈 (문헌 [Lai and Messing, 2002, Agbios 2008 GM crop database (March 11, 2008)]), 감자 (문헌 [Zeh et al. 2001, Plant Physiol 127 792-802]), 수수 (문헌 [Zhao et al. 2003, Kluwer Academic Publishers, Dordrecht, The Netherlands, pp 413-416]), 대두 (문헌 [Falco et al. 1995 Bio/Technology 13 577-582; Galili et al. 2002 Crit Rev Plant Sci 21 167-204])에 대해 설명되었다.
예컨대 카놀라 (문헌 [Dehesh et al. (1996) Plnt J 9 167-172 [PubMed]; Del Vecchio (1996) INFORM International News on Fats, Oils and Related Materials 7 230-243; Roesler et al. (1997) Plant Physiol 113 75-81 [PMC free article] [PubMed]; Froman and Ursin (2002, 2003) Abstracts of Papers of the American Chemical Society 223 U35; James et al. (2003) Am J Clin Nutr 77 1140-1145 [PubMed]; Agbios (2008, 상기]); 면화 (문헌 [Chapman et al. (2001). J Am Oil Chem Soc 78 941-947; Liu et al. (2002) J Am Coll Nutr 21 205S-211S [PubMed]; O'Neill (2007) Australian Life Scientist. http://www.biotechnews.com.au/index.php/id;866694817;fp;4;fpid;2 (June 17, 2008]), 아마인 (문헌 [Abbadi et al., 2004, Plant Cell 16: 2734-2748]), 메이즈 (문헌 [Young et al., 2004, Plant J 38 910-922]), 야자유 (문헌 [Jalani et al. 1997, J Am Oil Chem Soc 74 1451-1455; Parveez, 2003, AgBiotechNet 113 1-8]), 쌀 (문헌 [Anai et al., 2003, Plant Cell Rep 21 988-992]), 대두 (문헌 [Reddy and Thomas, 1996, Nat Biotechnol 14 639-642; Kinney and Kwolton, 1998, Blackie Academic and Professional, London, pp 193-213]), 해바라기 (문헌 [Arcadia, Biosciences 2008])에 대한 오일 및 지방산.
탄수화물, 예컨대 치커리에 대해 설명된 프룩탄(Fructans) (문헌 [Smeekens (1997) Trends Plant Sci 2 286-287, Sprenger et al. (1997) FEBS Lett 400 355-358, Sevenier et al. (1998) Nat Biotechnol 16 843-846]), 메이즈 (문헌 [Caimi et al. (1996) Plant Physiol 110 355-363]), 감자 (문헌 [Hellwege et al. ,1997 Plant J 12 1057-1065]), 사탕무 (문헌 [Smeekens et al. 1997, 상기]), 감자에 대해 설명된 것과 같은, 이눌린 (문헌 [Hellewege et al. 2000, Proc Natl Acad Sci USA 97 8699-8704]), 쌀에 대해 설명된 것과 같은, 전분 (문헌 [Schwall et al. (2000) Nat Biotechnol 18 551-554, Chiang et al. (2005) Mol Breed 15 125-143]),
카놀라 (문헌 [Shintani and DellaPenna (1998) Science 282 2098-2100]), 메이즈 (문헌 [Rocheford et al. (2002). J Am Coll Nutr 21 191S-198S, Cahoon et al. (2003) Nat Biotechnol 21 1082-1087, Chen et al. (2003) Proc Natl Acad Sci USA 100 3525-3530]), 겨자씨 (문헌 [Shewmaker et al. (1999) Plant J 20 401-412]), 감자 (문헌 [Ducreux et al., 2005, J Exp Bot 56 81-89]), 쌀 (문헌 [Ye et al. (2000) Science 287 303-305]), 딸기 (문헌 [Agius et al. (2003), Nat Biotechnol 21 177-181]), 토마토 (문헌 [Rosati et al. (2000) Plant J 24 413-419, Fraser et al. (2001) J Sci Food Agric 81 822-827, Mehta et al. (2002) Nat Biotechnol 20 613-618, Diaz de la Garza et al. (2004) Proc Natl Acad Sci USA 101 13720-13725, Enfissi et al. (2005) Plant Biotechnol J 3 17-27, DellaPenna (2007) Proc Natl Acad Sci USA 104 3675-3676])에 대해 설명된 것과 같은, 비타민 및 카로티노이드.
사과 (스틸벤(stilbene), 문헌 [Szankowski et al. (2003) Plant Cell Rep 22: 141-149]), 알팔파 (레스베라트롤(resveratrol), 문헌 [Hipskind and Paiva (2000) Mol Plant Microbe Interact 13 551-562]), 키위 (레스베라트롤, 문헌 [Kobayashi et al. (2000) Plant Cell Rep 19 904-910]), 메이즈 및 대두 (플라보노이드, Yu et al. (2000) Plant Physiol 124 781-794), 감자 (안토시아닌 및 알칼로이드 글리코시드, 문헌 [Lukaszewicz et al. (2004) J Agric Food Chem 52 1526-1533]), 쌀 (플라보노이드 & 레스베라트롤, 문헌 [Stark-Lorenzen et al. (1997) Plant Cell Rep 16 668-673, Shin et al. (2006) Plant Biotechnol J 4 303-315]), 토마토 (+레스베라트롤, 클로로겐산, 플라보노이드, 스틸벤; 문헌 [Rosati et al. (2000) 상기, Muir et al. (2001) Nature 19 470-474, Niggeweg et al. (2004) Nat Biotechnol 22 746-754, Giovinazzo et al. (2005) Plant Biotechnol J 3 57-69]), 밀 (카페인산 및 페룰산, 레스베라트롤; 문헌 [United Press International (2002)])에 대해 설명된 것과 같은 기능성 이차 대사산물; 및
알팔파 (피타제(phytase), 문헌 [Austin-Phillips et al. (1999) http://www.molecularfarming.com/nonmedical.html]), 상추 (철, 문헌 [Goto et al. (2000) Theor Appl Genet 100 658-664]), 쌀 (철, 문헌 [Lucca et al. (2002) J Am Coll Nutr 21 184S-190S]), 메이즈, 대두 및 밀 (피타제, [Drakakaki et al. (2005) Plant Mol Biol 59 869-880, Denbow et al. (1998) Poult Sci 77 878-881, Brinch-Pedersen et al. (2000) Mol Breed 6 195-206])에 설명된 것과 같은 무기질 이용성.
특정 구현예에서, 부가가치 특성은 식물에 존재하는 화합물의 생각되는 건강상 이익에 관한 것이다. 예를 들어, 특정 구현예에서 본 발명의 방법을 하나 이상의 하기 화합물의 합성을 유도/증가 또는 이들의 변형을 보장하도록 적용함으로써 부가가치 작물이 수득된다:
카로티노이드, 예컨대 당근에 존재하는, 세포에 대한 손상을 일으킬 수 있는 자유 라디칼을 중화하는 α-카로틴, 또는 각종 과실 및 채소에 존재하는 자유 라디칼을 중화하는 β-카로틴
녹색 채소에 존재하는, 건강한 시력의 유지에 기여하는 루테인
토마토 및 토마토 제품에 존재하는, 전립선 암의 위험을 감소시키는 것으로 여겨지는 리코펜
감귤류 및 메이즈에 존재하는, 건강한 시력이 유지에 기여하는 제아잔틴
밀기울에 존재하는, 유방 및/또는 대장암의 위험을 감소시킬 수 있는 불용성 섬유질 및 귀리에 존재하는 β-글루칸, 차전자(Psylium) 및 통곡물에 존재하는, 심혈관 질병 (CVD)의 위험을 감소시킬 수 있는 수용성 섬유질과 같은 식이 섬유
CVD의 위험을 감소시킬 수 있고 정신 및 시각 기능을 개선할 수 있는 ω-3 지방산과 같은 지방산, 신체 조성을 개선할 수 있고, 소정 암의 위험을 감소시킬 수 있는 컨쥬게이트된 리놀레산, 및 암과 CVD의 염증 위험을 감소시킬 수 있고, 신체 조성을 개선시킬 수 있는 GLA
밀에 존재하는, 산화방지-유사 활성을 갖고, 퇴행성 질병의 위험을 감소시킬 수 있는 하이드록시신나메이트와 같은 플라보노이드, 과실 및 채소에 존재하는 자유 라디칼을 중화하고, 암의 위험을 감소시킬 수 있는 플라보노이드, 카테킨 및 탄닌
십자화과 채소 (브로콜리, 케일), 고추냉이에 존재하는, 자유 라디칼을 중화하고, 암의 위험을 감소시킬 수 있는, 설포라판과 같은 글루시놀레이트, 인돌, 이소티오시아네이트
포도에 존재하는 퇴행성 질병, 심장병, 및 암의 위험을 감소시킬 수 있고 장수 효과를 가질 수 있는 스틸벤과 같은 페놀수지류(Phenolics), 및 채소 및 감귤류에 존재하는, 산화방지-유사 활성을 갖고, 퇴행성 질병, 심장병 및 안질환의 위험을 감소시킬 수 있는 카페인산 및 페룰산, 및 카카오에 존재하는, 산화방지-유사 활성을 갖고, 퇴행성 질병 및 심장병의 위험을 감소시킬 수 있는 에피카테킨
메이즈, 콩, 밀 및 목질유에 존재하는, 혈중 콜레스테롤 수준을 낮춤으로써 관상동맥 심장 질환의 위험을 낮출 수 있는 식물 스타놀/스테롤
돼지감자, 샬롯(shallot), 양파 분말에 존재하는, 위장 건강을 개선할 수 있는 프룩탄, 이눌린, 프룩토-올리고당
대두에 존재하는, LDL 콜레스테롤을 낮출 수 있는 사포닌
대두에 존재하는, 심장병의 위험을 감소시킬 수 있는 대두 단백질
대두에 존재하는, 일과성 열감(hot flash)과 같은 갱년기 증후군을 감소시킬 수 있고, 골다공증 및 CVD를 감소시킬 수 있는 이소플라보논과 같은 피토에스트로겐 및 아마, 호밀 및 채소에 존재하는, 심장병 및 일부 암에 대해 보호할 수 있고, LDL 콜레스테롤, 총 콜레스테롤을 낮출 수 있는 리그난.
양파, 마늘, 올리브, 대파 및 봄양파(scallon)에 존재하는, 다이알릴 설파이드와 같은 설파이드 및 티올, 및 십자화과 채소에 존재하는, LDL 콜레스테롤을 낮출수 있고, 건강한 면역 시스템의 유지를 도울 수 있는 알릴 메틸 트리설파이드, 디티오티온류
크랜베리, 코코아에 존재하는, 요로 건강을 개선할 수 있고, CVD 및 고혈압의 위험을 감소시킬 수 있는 프로안토시아니딘과 같은 탄닌
추가적으로, 본 발명의 방법은 단백질/전분 작용성, 유통 기한, 맛/미관, 섬유 품질(fiber quality), 및 알레르겐, 항영양소(antinutrient), 및 독소 감소 특성의 변형을 또한 고려한다.
이에 따라, 본 발명은 영양적 부가가치를 갖는 식물을 생산하는 방법을 포함하며, 상기 방법은 식물 세포 내로 본 명세서에 설명된 Cpf1 CRISPR 시스템을 이용하여 부가된 영양가의 성분의 생산에 관련된 효소를 인코딩하는 유전자를 도입하는 단계, 상기 식물 세포로부터 식물을 재생하는 단계를 포함하고, 상기 식물은 부가된 영양가의 상기 성분의 증가된 발현을 특징으로 한다. 특정 구현예에서, Cpf1 CRISPR 시스템은, 예를 들어 화합물의 대사를 제어하는 하나 이상의 전사 인자를 변형시킴으로써 이들 화합물의 내인성 합성을 변형시키는데 사용된다. 관심 유전자를 식물 세포 내로 도입 및/또는 Cpf1 CRISPR 시스템을 이용하여 내인성 유전자를 변형시키는 방법이 본 명세서에서 상기 설명된다.
부가 가치된 특성을 수여하도록 변형된 식물에서의 변형의 일부 특정 예는: 예를 들어, 식물을 스테아릴-ACP 불포화화제로 형질전환하여 식물의 스테아르산 함량을 증가시키도록 함으로써, 변형된 지방산 대사를 갖는 식물. 문헌 [Knultzon et al., Proc. Natl. Acad. Sci. U.S.A. 89:2624 (1992)] 참조. 또 다른 예는, 예를 들어 클로닝 및 이후 낮은 수준의 피틴산에 의해 특징된 메이즈 돌연변이체의 원인이 될 수 있는 단일 대립형질과 연관된 DNA를 재도입함으로써 피테이트(phytate) 함량을 감소시키는 것을 포함한다. 문헌 [Raboy et al, Maydica 35:383 (1990)] 참조.
유사하게, 메이즈 호분층에서 플라보노이드의 생산을 강한 프로모터의 제어 하에서 조절하는, 메이즈(제아 메이스(Zea mays)) Tfs C1 및 R의 발현은, 아마도 전체 경로를 활성화함으로써 애기장대과 (애기장대)에서 안토시아닌의 높은 축적 속도를 결과로서 일으켰다(문헌 [Bruce et al., 2000, Plant Cell 12:65-80]). DellaPenna (문헌[Welsch et al., Annu Rev Plant Biol 57: 711-738])는 Tf RAP2.2 및 그의 상호작용 파트너인 SINAT2가 아라비돕시스 잎에서 카로티노이드생성을 증가시켰음을 발견하였다. Tf Dof1의 발현은 탄소 골격 생산, 아미노산 함량의 현저한 증가, 및 유전자이식 아라비돕시스에서 Glc 수준의 감소를 위한 효소를 인코딩하는 유전자의 상향 조절을 유도하였고 (문헌 [Yanagisawa, 2004 Plant Cell Physiol 45: 386-391]), DOF Tf AtDof1.1 (OBP2)는 아라비돕시스에서 글루코시놀레이트 생합성 경로에서의 모든 경로를 상향조절하였다 (문헌 [Skirycz et al., 2006 Plant J 47: 10-24]).
식물에서 알레르겐의 감소
특정 구현예에서, 본 명세서에서 제공된 방법은 알레르겐의 수준이 감소된 식물을 생성하는데 사용되어, 그를 소비자에게 더욱 안전하게 만든다. 특정 구현예에서, 본 방법은 식물 알레르겐의 생산에 원인이 되는 하나 이상의 유전자의 발현을 변형시키는 것을 포함한다. 예를 들어, 특정 구현예에서, 본 방법은 식물 세포, 예컨대 라이그래스(ryegrass) 식물 세포 내에서 Lol p5의 하향 조절 및 상기 식물의 화분의 알레르겐성을 감소시키기 위하여 그로부터 식물을 재생하는 것을 포함한다(문헌 [Bhalla et al. 1999, Proc. Natl. Acad. Sci. USA Vol. 96: 11676-11680]).
땅콩 알러지 및 콩과에 대한 알러지는 일반적으로 실제의 심각한 건강 문제이다. 본 발명의 Cpf1 이펙터 단백질 시스템은 이러한 콩과의 알레르겐성 단백질을 인코딩하는 유전자를 확인 및 이후 편집 또는 침묵화하는 데 사용될 수 있다. 이러한 유전자 및 단백질에 대해 제한 없이, Nicolaou외 다수는 땅콩, 대두, 렌틸, 완두콩, 루핀, 그린 빈스, 및 녹두에 있는 알레르겐성 단백질을 확인한다. 문헌[Nicolaou et al., Current Opinion in Allergy and Clinical Immunology 2011;11(3):222]을 참조한다.
관심의 내인성 유전자에 대한 스크리닝 방법
본 명세서에서 제공된 방법은 추가된 영양적 가치의 성분의 생산에 관련된 효소를 인코딩하는 가치있는 유전자, 또는 일반적으로 종, 문 및 계에 걸쳐, 관심의 작물 특성에 영향을 미치는 유전자의 확인을 추가로 가능하게 한다. 예를 들어 본 명세서에서 설명된 바와 같은 Cpf1 CRISPR 시스템을 이용하여 식물에서 대사 경로의 효소를 인코딩하는 유전자를 선택적으로 표적화함으로써, 식물의 특정 영양적 양태에 원인이 있는 유전자가 확인될 수 있다. 유사하게, 바람직한 작물학적 특성에 영향을 미칠 수 있는 유전자를 선택적으로 표적화함으로써, 관련 유전자가 확인될 수 있다. 따라서, 본 발명은 특정 영양적 가치 및/또는 작물학적 특성을 갖는 화합물의 생산에 관련된 효소를 인코딩하는 유전자에 대한 스크리닝 방법을 포함한다.
식물 및 효모에서 Cpf1 CRISPR 시스템의 추가의 응용
생물연료 생산에서 Cpf1 CRISPR 시스템의 이용
본 명세서에서 설명된 것과 같은 용어 "생물연료(biofuel)"는 식물 및 식물-유도된 자원으로부터 제조된 대안적인 연료이다. 재생성 생물연료는, rm 에너지가 탄소 고정 과정을 통해 수득되거나 바이오매스의 이용 또는 전환을 통하여 만들어진 유기 물질로부터 추출될 수 있다. 이러한 바이오매스는 생물연료에 대해 직접 사용될 수 있거나, 열 전환, 화학 전환 및 생화학 전환에 의한 성분을 함유하는 편리한 에너지로 전환될 수 있다. 이러한 바이오매스는 고체, 액체, 또는 가스 형태의 연료를 결과로서 초래할 수 있다. 생물연료에는 두 가지 유형: 바이오에탄올 및 바이오디젤이 존자한다. 바이오에탄올은 셀룰로오스의 당 발효 공정에 의해 주로 생산되며 (전분), 이는 메이즈 및 사탕수수로부터 대부분 유도된다. 한편, 바이오디젤은 유채씨, 야자 및 대두와 같은 유료 작물로부터 주로 생산된다. 생물연료는 주로 교통에 사용된다.
생물연료 생산을 위한 식물 특성의 증진
특정 구현예에서, 본 명세서에서 설명된 바와 같은 Cpf1 CRISPR 시스템을 이용하는 본 방법은, 발효를 위한 당의 더욱 효율적인 방출을 위해 주요 가수분해제에 의한 접근을 촉진하기 위하여, 세포벽의 특성을 변경하는데 사용된다. 특정 구현예에서, 셀룰로오스 및/또는 리그닌의 생합성이 변형된다. 셀룰로오스는 세포벽의 주 성분이다. 셀룰로오스 및 리그닌의 생합성은 공동조절된다. 식물에서 리그닌의 비를 감소시킴으로써 셀룰로오스의 비가 증가될 수 있다. 특정 구현예에서, 본 명세서에서 설명된 방법은, 발효가능한 탄수화물을 증가시키기 위하여 식물에서 리그닌 생합성을 하향조절하는데 사용된다. 더욱 특히, 본 명세서에서 설명된 방법은, WO 2008064289 A2에 개시된 바와 같은, 4-쿠마레이트 3-수산화효소(C3H), 페닐알라닌 암모니아-리아제(PAL), 신나메이트 4-수산화효소(C4H), 하이드록시신나모일 트랜스퍼라제(HCT), 카페인산 O-메틸트랜스퍼라제(COMT), 카페오일 CoA 3-O-메틸트랜스퍼라제(CCoAOMT), 페룰레이트 5-수산화효소(F5H), 신나밀 알코올 탈수소효소(CAD), 신나모일 CoA-환원효소(CCR), 4-쿠마레이트-CoA 리가제(4CL), 모노리그놀-리그닌-특이적 글리코실트랜스퍼라제, 및 알데히드 탈수소효소(ALDH)로 이루어진 군으로부터 선택된 적어도 제1 리그닌 생합성 유전자를 하향조절하는데 사용된다.
특정 구현예에서, 본 명세서에서 설명된 방법은 발효 동안 더욱 낮은 수준의 아세트산을 생산하는 식물 무리(mass)를 생산하는데 사용된다 (WO 제200096488호 또한 참조). 더욱 구체적으로, 본 명세서에 개시된 방법은 상동체에서 CaslL로 돌연변이를 생성하여 다당류 아세틸화를 감소시키는데 사용된다.
생물연료 생산을 위한 효모의 변형
특정 구현예에서, 본 명세서에서 제공된 Cpf1 효소는 재조합 미생물에 의한 바이오에탄올 생산에 사용된다. 예를 들어, Cpf1은 미생물, 예컨대 효모를 조작하여 발효성 당으로부터의 생물연료 또는 생체고분자를 생성하고, 선택적으로 발효성 당 공급원으로서 농업 폐기물로부터 유도된 식물-유래 리그노셀룰로오스를 분해시키는데 사용될 수 있다. 더욱 구체적으로는, 본 발명은, Cpf1 CRISPR 복합체가 생물연료 생산에 요구되는 외래 유전자를 미생물 내로 도입 및/또는 생물연료 합성을 방해할 수 있는 원인의 내인성 유전자를 변형시키는데 사용되는 방법을 제공한다. 더욱 구체적으로, 본 방법은 피루베이트의 에탄올 또는 또 다른 관심 생성물로의 전환에 관련된 효소를 인코딩하는 하나 이상의 뉴클레오티드 서열을 효모와 같은 미생물 내로 도입하는 것을 포함한다. 특정 구현예에서 본 방법은, 미생물이 셀룰로오스를 분해하는 것을 허용하는 하나 이상의 효소, 예컨대 셀룰라아제의 도입을 보장하도록 한다. 추가의 구현예에서, Cpf1 CRISPR 복합체는 생물연료 생산 경로와 경쟁하는 내인성 대사 경로를 변형하는데 사용된다.
따라서, 더욱 구체적인 구현예에서, 본 명세서에서 설명된 방법은 다음과 같이 미생물을 변형시키는데 사용된다:
- 상기 미생물이 상기 핵산을 발현, 상기 식물 세포벽 분해 효소를 생산 및 분해할 수 있도록, 하나 이상의 이종성 핵산을 도입 또는 식물 세포벽 분해 효소를 인코딩하는 하나 이상의 내인성 핵산의 발현을 증가;
- 상기 숙주 세포가 상기 핵산을 발현할 수 있도록 하는, 하나 이상의 이종성 핵산을 도입 또는 아세트알데히드를 에탄올로 전환시키는 효소를 인코딩하는 하나 이상의 이종성 핵산과 선택적으로 조합된, 피루베이트를 아세트알데히드로 전환하는 효소를 인코딩하는 하나 이상의 내인성 핵산의 발현을 증가; 및/또는
- 상기 숙주 세포 내 대사 경로에서 효소를 인코딩하는 하나 이상의 핵산을 변형시키고, 여기서 상기 경로는 피루베이트로부터 아세트알데히드 또는 아세트알데히드로부터 에탄올 외의 대사산물을 생산하고, 여기서 상기 변형은 상기 대사산물의 감소된 생산울 결과로서 초래하거나, 또는 상기 효소의 억제제를 인코딩하는 하나 이상의 뉴클레오티드를 도입.
채소유 또는 생물연료의 생산을 위한 조류 및 식물의 변형
유전자이식 조류 또는 유채와 같은 기타 식물은 특히 채소유 또는 예를 들어 알코올 (특히 메탄올 및 에탄올)과 같은 생물연료의 생산에 유용할 수 있다. 이들은 오일 또는 생물연료 산업에서의 이용을 위한 오일 또는 알코올을 높은 수준으로 발현 또는 과잉발현하도록 조작될 수 있다.
본 발명의 특정 구현예에 따르면, Cpf1 CRISPR 시스템은 바이오연료 생산에 유용한 지질-풍부 규조류를 생성하는 데 사용된다.
특정 구현예에서, 조류 세포에 의해 생산된 지질의 품질 및/또는 지질의 품질의 변형에 관련된 유전자를 특이적으로 변형하는 것이 고려된다. 지방산 합성의 경로에 관련된 효소를 인코딩하는 유전자의 예는, 예를 들어 아세틸-CoA 카르복실라제, 지방산 신타제, 3-케토아실_아실-캐리어 단백질 신타제 III, 글리세롤-3-포스페이트 탈수소효소 (G3PDH), 에노일-아실 캐리어 단백질 환원효소 (에노일-ACP-환원효소), 글리세롤-3-포스페이트 아실트랜스퍼라제, 리소포스파티딕아실 트랜스퍼라제 또는 디아실글리세롤 아실트랜스퍼라제, 인지질:디아실글리세롤 아실트랜스퍼라제, 포스파티데이트 포스파타제, 지방산 티오에스테라제, 예컨대 팔미토일 단백질 티오에스테라제, 또는 말릭 효소 활성을 갖는 단백질을 인코딩할 수 있다. 추가의 구현예에서, 지질 축적이 증가된 규조류를 생성하는 것이 고려된다. 이는 지질 이화작용을 감소시키는 유전자를 표적화함으로써 달성될 수 있다. 트리아실글리세롤 및 유리 지방산 모두의 활성화에 관련된 유전자, 및 아실-CoA 합성효소, 3-케토아실-CoA 티올라제, 아실-CoA 옥시다제 활성 및 포스포글루코뮤타제와 같은 지방산의 β-산화에 직접 관련된 유전자는 본 발명의 방법에서의 이용에 특히 중요하다. Cpf1 CRISPR 시스템 및 본 명세서에서 설명된 방법은 그들의 지질 함량을 증가시키기 위하여 규조류에서의 그러한 유전자를 특이적으로 활성화하는데 사용될 수 있다.
미세조류와 같은 유기체는 합성 생물학에서 널리 사용된다. Stovicek외 다수(문헌[Metab. Eng. Comm., 2015; 2:13])는, 산업적 생산에 강력한 균주를 효과적으로 생산하기 위하여, 산업용 효모, 예를 들어 사카로마이세스 세레비자에(Saccharomyces cerevisae)의 게놈 편집을 기재한다. Stovicek는 효모가 내인성 유전자의 대립유전자 및 이종성 유전자에서의 낙 둘 다를 동시에 파괴하기에 코돈-최적화된 CRISPR-Cas9 시스템을 사용하였다. Cas9 및 gRNA는 게놈 또는 에피좀 2μ-기반 벡터 위치로부터 발현되었따. 저자는 또한, 유전자 파괴 효율이 Cas9 및 gRNA 발현 수준의 최적화에 의해 개선될 수 있음을 나타내었다. Hlavova외 다수(Biotechnol. Adv. 2015)는 삽입 돌연변이유발 및 스크리닝을 위해 핵 및 엽록체 유전자를 표적화하는 CRISPR와 같은 기법을 사용하여 미세조류의 종 또는 균주의 발생을 논의한다. Stovicek 및 Hlavovaa의 방법은 본 발명의 Cpf1 이펙터 단백질 시스템에 적용될 수 있다.
US 8945839는 Cas9를 사용하여 미세조류(클라미도모나스 레인하티(Chlamydomonas reinhardtii) 세포) 종을 조작하는 방법을 설명한다. 유사한 도구를 사용하여, 본 명세서에서 기재된 Cpf1 CRISPR 시스템의 방법은 클라미도모나스 종 및 기타 다른 조류 상에 적용될 수 있다. 특정 구현예에서, Cpf1 및 가이드 RNA는, Hsp70A-Rbc S2 또는 Beta2 -튜불린과 같은 구조 프로모터의 제어 하에서 Cpf1을 발현하는 벡터를 사용하여 발현된 조류 내에 도입된다. 가이드 RNA는 T7 프로모터를 함유하는 벡터를 사용하여 전달될 것이다. 대안적으로, Cpf1 mRNA 및 시험관 내 전사된 가이드 RNA는 조류 세포로 전달될 수 있다. 전기천공 프로토콜은 진아트(GeneArt) 클라미도모나스 조작 키트로부터 권장된 표준 프로토콜을 따른다.
지방산 생산이 가능한 미생물의 생성에서 Cpf1의 사용
특정 구현예에서, 본 발명의 방법은 지방산, 예컨대 지방산 메틸 에스테르("FAME") 및 지방산 에틸 에스테르("FAEE")의 생산이 가능한 유전적으로 조작된 미생물의 생성에 사용된다.
통상적으로, 숙주 세포는 매질 중에 존재하는, 알코올과 같은 탄소원으로부터, 티오에스테라제를 인코딩하는 유전자, 아실-CoA 신타제를 인코딩하는 유전자, 및 에스테르 신타제를 인코딩하는 유전자의 발현 또는 과잉발현에 의해, 지방 에스테르를 생산하기 위해 조작될 수 있다. 따라서, 본 명세서에서 제공된 방법은 티오에스테라제 유전자, 아실-CoA 신타제를 인코딩하는 유전자 및 에스테르 신타제를 인코딩하는 유전자를 과잉발현 또는 도입하도록 미생물을 변형시키는데 사용된다. 특정 구현예에서, 티오에스테라제 유전자는 tesA, 'tesA, tesB,fatB, fatB2,fatB3,fatAl, 또는 fatA로부터 선택된다. 특정 구현예에서, 아실-CoA 신타제를 인코딩하는 유전자는 fadDJadK, BH3103, pfl-4354, EAV15023, fadDl, fadD2, RPC_4074, fadDD35, fadDD22, faa39, 또는 동일한 특성을 갖는 효소를 인코딩하는 확인된 유전자로부터 선택된다. 특정 구현예에서, 에스테르 신타제를 인코딩하는 유전자는 호호바(시몬지아 차이넨시스(Simmondsia chinensis), 아시네토박터 종 ADP(Acinetobacter sp. ADP), 알카니보랙스 보르쿠멘시스(Alcanivorax borkumensis), 녹농균(슈도모나스 아에루기노사(Pseudomonas aeruginosa), 푼디박터 자덴시스(Fundibacter jadensis), 애기장대, 또는 알칼리제네스 유트로푸스(Alkaligenes eutrophus), 또는 이들의 변이체로부터의 신타제/아실-CoA:디아실글리세릴 아실트랜스퍼라제를 인코딩하는 유전자이다. 추가적으로 또는 대안적으로, 본 명세서에서 제공된 방법은 아실-CoA 탈수소효소를 인코딩하는 유전자, 외막 단백질 수용체를 인코딩하는 유전자, 및 지방산 생합성의 전사 조절제를 인코딩하는 유전자 중 하나 이상의, 상기 미생물에서의 발현을 감소시키는 데 사용된다.
특정 구현예에서, 이들 유전자 중 하나 이상은, 예컨대 돌연변이의 도입에 의해 비활성화된다. 특정 구현예에서, 아실-CoA 탈수소효소를 인코딩하는 유전자는 fadE이다. 특정 구현예에서, 지방산 생합성의 전사 조절제를 인코딩하는 유전자는 DNA 전사 억제제, 예를 들어 fabR를 인코딩한다.
추가적으로 또는 대안적으로, 상기 미생물은 피루베이트 포르메이트 리아제를 인코딩하는 유전자, 락테이트 탈수소효소를 인코딩하는 유전자 중 하나 이상, 또는 이들 모두의 발현을 감소시키도록 변형된다. 특정 구현예에서, 피루베이트 포르메이트 리아제를 인코딩하는 유전자는 pflB이다. 특정 구현예에서, 락테이트 탈수소효소를 인코딩하는 유전자는 IdhA이다. 특정 구현예에서, 이들 유전자 중 하나 이상은, 예컨대 그 안에 돌연변이의 도입에 의해 비활성화된다.
특정 구현예에서, 미생물은 에스케리케아(Escherichia), 바실러스, 락토바실러스, 로도코커스(Rhodococcus), 시네코코커스(Synechococcus), 시네코이스티스(Synechoystis), 슈도모나스, 아스페르길루스, 트리코더마, 뉴로스포라, 푸사리움, 후미콜라, 리조무코, 플루이베로마이세스, 피키아, 무코, 미셀리오프토라, 페니실리움, 파네로차에테(Phanerochaete), 플레우로투스(Pleurotus), 트라메테스(Trametes), 크리소스포리움(Chrysosporium), 사카로마이세스, 스테노트로파모나스(Stenotrophamonas), 스키로사카로마이세스, 야로이아, 또는 스트렙토마이세스 속으로부터 선택된다.
유기산 생산을 할 수 있는 미생물의 생성에서의 Cpf1의 이용
본 명세서에서 제공된 방법은, 더욱 구체적으로는 펜토오스 또는 헥소오스 당으로부터의, 유기산 생산이 가능한 미생물을 조작하는데 추가로 사용된다. 특정 구현예에서, 방법은 외인성 LDH 유전자를 미생물 내로 도입하는 것을 포함한다. 특정 구현예에서, 상기 미생물 내 유기산 생산은, 관심 유기산 외의 대사산물을 생산하는 내인성 대사 경로에 관련된 단백질을 인코딩하는 내인성 유전자를 비활성화시킴으로써 추가적으로 또는 선택적으로 증가되고/증가되거나, 여기서 내인성 대사 경로는 유기산을 소비한다. 특정 구현예에서, 변형은 관심 유기산 외의 대사산물의 생산이 감소됨을 보장한다. 특정 구현예에 따라, 본 방법은 하나 이상의 조작된 유전자 결실 및/또는 유기산이 소비되는 내인성 경로의 또는 관심 유기산 외의 대사산물을 생산하는 내인성 경로에 관련된 생성물을 인코딩하는 유전자의 비활성화를 도입하는데 사용된다. 특정 구현예에서, 하나 이상의 조작된 결실 또는 비활성화는 피루베이트 데카르복실라제(pdc), 푸마레이트 환원효소, 알코올 탈수소효소(adh), 아세트알데히드 탈수소효소, 포스포에놀피루베이트 카르복실라제(ppc), D-락테이트 탈수소효소(d-ldh), L-락테이트 탈수소효소(l-ldh), 락테이트 2-모노옥시게나제로 이루어지는 군으로부터 선택된 효소를 인코딩하는 하나 이상의 유전자에 있다.
추가의 구현예에서, 하나 이상의 조작된 유전자 결실 및/또는 비활성화는 피루베이트 데카르복실라제(pdc)를 인코딩하는 내인성 유전자에 있다.
추가의 구현예에서, 미생물은 젖산을 생산하도록 조작되고, 하나 이상의 조작된 유전자 결실 및/또는 비활성화는 락테이트 탈수소효소를 인코딩하는 내인성 유전자에 있다. 추가적으로 또는 대안적으로, 미생물은 시토크롬 B2-의존성 L-락테이트 탈수소효소와 같은 시토크롬-의존성 락테이트 탈수소효소를 인코딩하는 내인성 유전자의 비활성화 또는 하나 이상의 조작된 유전자 결실을 포함한다.
효모 균주를 활용하여 개선된 자일로스 또는 셀로비오스의 재생에서의 Cpf1의 이용
특정 구현예에서, Cpf1 CRISPR 시스템은 효모 균주를 활용하여 개선된 자일로스 또는 셀로비오스를 선택하도록 적용될 수 있다. 에러 발생이 일어나기 쉬운 PCR이 사용되어 자일로스 활용 또는 셀로비오스 활용 경로에 관련된 하나(또는 초과)의 유전자를 증폭할 수 있다. 자일로스 활용 경로 및 셀로비오스 활용 경로에 관련된 유전자들의 예로는, 이로 제한됨이 없이, 문헌 [Ha, S.J., et al. (2011) Proc. Natl. Acad. Sci. USA 108(2):504-9 and Galazka, J.M., et al. (2010) Science 330(6000):84-6]에 기재된 것들을 포함한다. 결과로서 초래된 이중-가닥 DNA 분자는 각각, 선택된 유전자에서 랜덤 돌연변이를 포함하며, 이는 Cpf1 CRISPR 시스템의 성분을 이용하여 효모 균주(예를 들어, S288C) 내로 공동형질전환될 수 있고, 균주는 증진된 자일로스 또는 셀로비오스 활용능을 이용하여 선택될 수 있으며, 이는 WO 제2015138855호에 설명된 바와 같다.
이소프레노이드 생합성에서의 이용을 위한 개선된 효모 균주의 생성에서 Cpf1의 이용
Tadas Jakociunas 등은 빵 효모인 사카로마이세스 세레비시에에서 하나의 형질전환 단계에서 5 개에 달하는 상이한 게놈 유전자좌의 게놈 조적을 위한 멀티플렉스 CRISPR/Cas9 시스템의 성공적인 적용을 설명하였으며 (문헌 [Metabolic Engineering Volume 28, March 2015, Pages 213-222]), 이는 산업적으로 중요한 이소프레노이드 생합성 경로를 위한 열쇠인, 높은 메발로네이트 생산을 갖는 균주를 결과로서 초래한다. 특정 구현예에서, Cpf1 CRISPR 시스템은, 이소프레노이드 합성에서의 이용을 위해 추가적인 높은 생산 효모 균주를 확인하기 위하여 본 명세서에서 설명된 바와 같은 멀티플렉스 게놈 조작 방법에 적용될 수 있다.
효모 균주를 생산하는 젖산의 생성에서의 Cpf1의 이용
또 다른 구현예에서, 멀티플렉스 Cpf1 CRISPR 시스템의 성공적인 적용이 포함된다. Vratislav Stovicek 등 (문헌 [Metabolic Engineering Communications, Volume 2, December 2015, Pages 13-22])와 유사하게, 개선된 젖산-생산 균주가 설계될 수 있고, 단일 형질전환 이벤트에서 수득될 수 있다. 구체적인 구현예에서, Cpf1 CRISPR 시스템은 이종성 락테이트 탈수소효소 유전자를 삽입하는 동시에 두 개의 내인성 유전자 PDC1 및 PDC5 유전자 붕괴하는데 사용된다.
식물에서 Cpf1 CRISPR 시스템의 추가의 응용
특정 구현예에서, CRISPR 시스템 및 바람직하게는 본 명세서에서 설명된 바와 같은 Cpf1 CRISPR 시스템은 유전적 요소 동력학의 시각화에 사용될 수 있다. 예를 들어, CRISPR 이미징은 반복적 또는 비반복적 게놈 서열을 시각화, 텔로미어(telomere) 길이 변화 및 텔로미어 이동의 보고, 및 세포 주기에 걸친 유전자좌의 동력학을 감독할 수 있다(문헌 [Chen et al., Cell, 2013]). 이들 방법은 또한 식물에 적용될 수 있다.
CRISPR 시스템, 및 바람직하게는 본 명세서에서 설명된 바와 같은 Cpf1 CRISPR 시스템의 기타 응용은 시험관 내 및 생체 내 표적된 유전자 붕괴 양성-선택 스크리닝이다(문헌 [Malina et al., Genes and Development, 2013]). 이들 방법은 또한 식물에 적용될 수 있다.
특정 구현예에서, 비활성 Cpf1 엔도뉴클레아제의 히스톤-변형 효소와의 융합은 복합체 후생유전자에서의 사용자 변경을 도입할 수 있다 (문헌 [Rusk et al., Nature Methods, 2014]). 이들 방법은 또한 식물에 적용될 수 있다.
특정 구현예에서, CRISPR 시스템, 및 바람직하게는 본 명세서에서 설명된 바와 같은 Cpf1 CRISPR 시스템은 염색질의 특이적 부분을 정제하고, 연관된 단백질을 확인하기 위하여 사용될 수 있으며, 이에 따라 전사에서 이들의 조절 역할을 해명한다(문헌 [Waldrip et al., Epigenetics, 2014]). 이들 방법은 또한 식물에 적용될 수 있다.
특정 구현예에서, 본 발명은, 바이러스 DNA 및 RNA를 모두 절단할 수 있음에 따라, 식물체에서 바이러스 제거를 위한 치료법으로서 사용될 수 있다. 인체에서의 이전의 연구들은 단일 가닥 RNA 바이러스인 C형 간염 (문헌 [A. Price, et al., Proc. Natl. Acad. Sci, 2015]) 및 이중 가닥 DNA바이러스인 B형 간염 (문헌 [V. Ramanan, et al., Sci. Rep, 2015])을 표적화하는데 CRISPR 활용의 성공을 증명하였다. 이들 방법은 또한 식물에서 Cpf1 CRISPR 시스템을 이용하여 조정될 수 있다.
특정 구현예에서, 본 발명은 게놈 복잡성을 변경하는데 사용될 수 있다. 추가의 특정 구현예에서, CRISPR 시스템, 및 바람직하게는 본 명세서에서 설명된 바와 같은 Cpf1 CRISPR 시스템은 염색체 수를 붕괴 또는 변경시키는데 사용될 수 있으며, 하나의 부모로부터의 염색체만을 함유할 수 있는 반수체 식물을 재생할 수 있다. 그러한 식물은 염색체 이중복제되도록 유도되어, 단지 동형접합성 대립형질만을 함유하는 이배체 식물로 전환될 수 있다(문헌 [Karimi-Ashtiyani et al., PNAS, 2015; Anton et al., Nucleus, 2014]). 이들 방법은 또한 식물에 적용될 수 있다.
특정 구현예에서, 본 명세서에서 설명된 바와 같은 Cpf1 CRISPR 시스템은 자가-절단에 사용될 수 있다. 이러한 구현예에서, Cpf1 효소 및 gRNA의 프로모터는 구조적 프로모터일 수 있으며, 제2 gRNA는 동일한 형질전환 카세트 내로 도입되지만, 유도성 프로모터에 의해 제어된다. 이러한 제2 gRNA는 비작용적 Cpf1를 창출하기 위하여 Cpf1 유전자에서 부위-특이적 절단을 유도하도록 지정될 수 있다. 추가의 특정 구현예에서, 제2 gRNA는 형질전환 카세트의 양 말단 상에서의 절단을 유도하며, 숙주 게놈으로부터의 카세트의 제거를 결과로서 초래한다. 이 시스템은 Cas 효소에 대한 세포 노출의 제어된 기간을 제공하며, 추가로 표적외 편집을 최소화한다. 나아가, CRISPR/Cas 카세트의 양 말단의 절단은 2-대립형질 돌연변이를 갖는 이식유전자가 없는 T0 식물을 생성하는데 사용될 수 있다(Cas9에 대하여 기재된 바와 같이, 예를 들어 문헌 [Moore et al., Nucleic Acids Research, 2014; Schaeffer et al., Plant Science, 2015]). Moore 등의 방법은 본 명세서에서 설명된 Cpf1 CRISPR 시스템에 적용될 수 있다.
Sugano외 다수(문헌[Plant Cell Physiol. 2014 Mar;55(3):475-81. doi: 10.1093/pcp/pcu014. Epub 2014 Jan 18])는, 육상 식물 진화를 연구하기 위한 모델 종으로서 떠오른, 우산이끼 마르찬티아 폴리모파 L(Marchantia polymorpha L.)에서의 표적화된 돌연변이유발에 CRISPR-Cas9의 적용을 보고한다. 마르찬티아 폴리모파의 U6 프로모터가 확인되고, 클로닝되어 gRNA를 발현하였다. gRNA의 표적 서열은 마르찬티아 폴리모파에서 옥신 반응 인자 1(ARF1)을 인코딩하는 유전자를 파괴하도록 설계되었다. 아그로박테리움-매개 형질전환을 사용하여, Sugano외 다수는 마르찬티아 폴리모파의 배우체 생성에서 안정적인 돌연변이체를 분리하였다. 생체내에서 CRISPR-Cas9-기반 부위-특이적 돌연변이유발은, 콜리플라워 모자이크 바이러스 35S 또는 마르찬티아 폴리모파 EF1α 프로모터 중 어느 하나를 사용하여 Cas9를 발현하도록 달성되었다. 옥신-저항성 표현형을 나타내는 분리된 돌연변이체 개체는 키메라가 아니었다. 나아가, 안정적인 돌연변이체는 T1 식물의 무성 생식에 의해 생산되었다. arf1 겹대립형질(multiple allele)은 CRIPSR-Cas9-기반의 표적화된 돌연변이유발을 사용하여 용이하게 수립되었다. Sugano외 다수의 방법은 본 발명의 Cpf1 이펙터 단백질 시스템에 적용될 수 있다.
Kabadi외 다수(문헌[Nucleic Acids Res. 2014 Oct 29;42(19):e147. doi: 10.1093/nar/gku749. Epub 2014 Aug 13])는, 편리한 골든 게이트 클로닝 방법에 의하여 벡터 내로 혼입된 독립된 RNA 중합효소 III 프로모터로부터, Cas9 변이체, 리포터 유전자 및 최대 4 개의 sgRNA를 발현시키기 위하여 단일 렌티바이러스 시스템을 개발하였다. 각각의 sgRNA는 효율적으로 발현되었고, 불사화된 일차 인간 세포에서 멀티플렉스 유전자 편집 및 지속된 전사 활성화를 매개할 수 있다. Kabadi외 다수의 방법은 본 발명의 Cpf1 이펙터 단백질 시스템에 적용될 수 있다.
Ling외 다수(문헌[BMC Plant Biology 2014, 14:327])는, pGreen 또는 pCAMBIA 백본뿐만 아니라, gRNA를 기반으로 한 CRISPR-Cas9 바이너리 벡터 세트를 개발하였다. 이러한 도구 키트(toolkit)는 최소한 하나의 클로닝 단계에서 메이즈(maize)-코돈 최적화된 Cas9 및 하나 이상의 gRNA를 품고 있는 최종 작제물을 고효율로 생성하기 위해, BsaI 외의 제한 효소를 필요로 하지 않는다. 도구 키트는 메이즈 원형질, 유전자이식 메이즈 계통, 및 유전자이식 아라비돕시스 계통을 사용하여 확인되었으며, 높은 효율 및 특이성을 보이는 것으로 나타났다. 더욱 중요하게는, 이러한 도구 키트를 사용하여, 3 개의 아라비돕시스 유전자의 표적화된 돌연변이가 T1 세대의 유전자이식 묘목에서 검출되었다. 또한, 다중-유전자 돌연변이가 그 다음 세대로 유전될 수 있었다. 식물에서 멀티플렉스 게놈 편집을 위한 도구 키트로서, (가이드 RNA) 모듈 벡터 세트. Lin외 다수의 도구 박스는 본 발명의 Cpf1 이펙터 단백질 시스템에 적용될 수 있다.
CRISPR-Cpf1를 통한 표적화된 식물 게놈 편집을 위한 프로토콜이 또한, 문헌[Methods in Molecular Biology pp 239-255 10 February 2015] 시리즈 중 1284권에서 이용가능하다. 아라비돕시스 탈리아나 및 니코티아나 벤타미아나(Nicotiana benthamiana) 원형질 s 모델 세포 시스템을 사용하여, 식물 코돈 최적화된 Cas9(pcoCas9) 매개된 게놈 편집을 위한 이중 gRNA를 설계, 구축, 및 평가하는 상술된 절차가 기재된다. 전체 식물에서의 표적화된 게놈 변형의 생성에 CRISPR-Cas9 시스템을 적용하는 전략 또한 논의된다. 그 챕터에 기재된 프로토콜이 본 발명의 Cpf1 이펙터 단백질 시스템에 적용될 수 있다.
Ma외 다수(문헌[Mol Plant. 2015 Aug 3;8(8):1274-84. doi: 10.1016/j.molp.2015.04.007)]는, 단자엽 및 쌍자엽 식물에서 편리하며 고효율 멀티플렉스 게놈 편집을 위해, 식물 코돈 최적화된 Cas9 유전자를 이용한, 강력한 CRISPR-Cas9 벡터 시스템을 보고한다. Ma외 다수는, 골든 게이트 결찰 또는 깁슨 조립에 의한 일 회전의 클로닝에서 바이너리 CRISPR-Cas9 벡터 내로 조립될 수 있는, 다중 sgRNA 발현 카세트를 신속히 생성하기 위한 PCR-기반 절차를 설계하였다. 시스템을 이용하여, Ma외 다수는 평균 돌연변이율 85.4%로, 대개 이중대립형질(biallelic) 및 동형접합성 상태로, 쌀에서 46 개의 표적 부위를 편집하였다. Ma외 다수는, 유전자 패밀리의 다수의(최대 8 개) 멤버, 생합성 경로에서의 다수의 유전자, 또는 단일 유전자에서 다수의 부위의 동시 표적화에 의해 T0 쌀 및 T1 아라비돕시스 식물에서 기능 손실 유전자 돌연변이의 예를 제공한다. Ma외 다수의 방법은 본 발명의 Cpf1 이펙터 단백질 시스템에 적용될 수 있다.
Lowder외 다수(문헌[Plant Physiol. 2015 Aug 21. pii: pp.00636.2015])는 또한, 멀티플렉스 게놈 편집 및 식물에서 발현된, 침묵화된, 또는 비-코딩 유전자의 전사 조절을 가능하게 하는 CRISPR-Cas9 도구 박스를 개발하였다. 이 도구 박스는 골든 게이트 및 게이트웨이 클로닝 방법을 사용하여 단자엽 및 쌍자엽에 대한 빠르고 효율적인 조립 작용 CRISPR-Cas9 T-DNA 작제물에 대한 프로토콜 및 시약을 연구자에게 제공한다. 이는 다중화된 유전자 편집 및 식물 내인성 유전자의 전사 활성화 또는 억제를 포함하는, 능력들의 완전한 세트가 함께 제공된다. T-DNA 기반 형질전환 기술은 현대 식물 생명공학, 유전학, 분자 생물학 및 생리학의 기초가 된다. 이와 같이, 출원인은 Cas9(WT, 닉카제 또는 dCas9) 및 gRNA(들)의 관심 T-DNA 목적지-벡터 내로의 조립 방법을 개발하였다. 조립 방법은 골든 게이트 조립 및 멀티사이트 게이트웨이 재조합 모두를 기초로 한다. 3 개의 모듈이 조립에 요구된다. 제1 모듈은 Cas9 진입 벡터로, 이는 attL1 및 attR5 부위에 측접된 무-프로모터 Cas9 또는 이의 유도체 유전자를 함유한다. 제2 모듈은 gRNA 진입 벡터로, 이는 attL5 및 attL2 부위에 측접된 진입 gRNA 발현 카세트를 함유한다. 제3 모듈은 Cas9 발현을 위해 선택된 프로모터를 제공하는 attR1-attR2-함유 목적지 T-DNA 벡터를 포함한다. Lower외 다수의 도구 박스는 본 발명의 Cpf1 이펙터 단백질 시스템에 적용될 수 있다.
유리한 구현예에서, 식물은 나무일 수 있다. 본 발명은 또한 본 명세서에서 개시된 CRISPR Cas 시스템을 초본경에 이용할 수 있다(예를 들어, 문헌[Belhaj et al., Plant Methods 9: 39] 및 [Harrison et al., Genes & Development 28: 1859-1872] 참조). 특히 유리한 구현예에서, 본 발명의 CRISPR Cas 시스템은 나무에서 단일 뉴클레오티드 다형성(SNP)을 표적화할 수 있다(예를 들어, 문헌[Zhou et al., New Phytologist, Volume 208, Issue 2, pages 298-301, October 2015] 참조). Zhou외 다수의 연구에서, 저자는, 케이스 연구로서 4-쿠마레이트:CoA 리가제(4CL) 유전자 패밀리를 사용하여 다년생 목본 사시나무속(Populus)에서 CRISPR Cas 시스템을 적용하고, 표적화된 2 개의 4CL 유전자에 대해 100% 돌연변이 효율을 달성하였으며, 검사한 모든 형질전환체는 이중대립형질 변형을 가졌다. Zhou외 다수의 연구에서, CRISPR-Cas9 시스템은 단일 뉴클레오티드 다형성(SNP)에 대해 고도로 민감하였으며, 제3의 4CL 유전자에 대한 절단은 표적 서열 내 SNP로 인해 삭제되었다. 이러한 방법은 본 발명의 Cpf1 이펙터 단백질 시스템에 적용될 수 있다.
Zhou외 다수의 방법(문헌[New Phytologist, Volume 208, Issue 2, pages 298-301, October 2015])은 본 발명에 다음과 같이 적용될 수 있다. 리그닌 및 플라보노이드 생합성에 연관된, 2 개의 4CL 유전자, 즉 4CL1 및 4CL2는 각각 CRISPR-Cas9 편집에 대해 표적화된다. 형질전환에 일상적으로 사용되는 포퓰러스 트레뮬라 (Populus tremula) × alba 클론 717-1B4는 게놈-시퀀싱된 포퓰러스 트리코카르파(Populus trichocarpa)로부터 분기된다. 따라서, 기준 게놈으로부터 설계된 4CL1 및 4CL2 gRNA는 인-하우스 717 RNA-Seq 데이터로 질의되어 Cas 효율을 제한할 수 있는 SNP의 부재를 보장한다. 4CL1의 게놈 복제물인, 4CL5에 대해 설계된 제3 gRNA 또한 포함된다. 상응하는 717 서열은 PAM 가까이/내의 각각의 대립형질에서 하나의 SNP를 포함하며, 이들 모두는 4CL5-gRNA에 의한 표적화를 제거하는 것으로 예상된다. 세 개의 gRNA 표적 부위 모두는 제1 엑손 내에 위치된다. 717 형질전환의 경우, gRNA는 바이너리 벡터 내 CaMV 35S 프로모터의 제어 하에, 인간 코돈-최적화된 Cas와 함께 개자리(Medicago) U6.6 프로모터로부터 발현된다. Cas-만의 벡터를 이용한 형질전환은 대조군으로서 제공될 수 있다. 무작위로 선택된 4CL1 및 4CL2 계통은 앰플리콘-시퀀싱 처리된다. 그 데이터는 이후 가공되고, 이중대립형질 돌연변이는 모든 경우에서 확인된다. 이러한 방법은 본 발명의 Cpf1 이펙터 단백질 시스템에 적용될 수 있다.
식물에서, 병원균은 종종 숙주-특이적이다. 예를 들어, 푸사리움 옥시스포룸(Fusarium oxysporum) f. sp. 리코페르시시(lycopersici)는 토마토의 시듬을 유발하지만 토마토만을 공격하고, F. 옥시스포룸 f. 다이안티 푸치니아 그라미니스(dianthii Puccinia graminis) f. sp. 트리티시(tritici)는 밀만 공격한다. 식물은 대부분의 병원균에 견디는 기존 및 유도된 방어를 갖는다. 식물 세대에 걸친 돌연변이 및 재조합 사건은, 특히 병원균이 식물보다 더욱 높은 빈도로 번식함에 따라, 감수성이 증가되는 유전적 변동성을 일으킨다. 식물에서는, 비-숙주 저항성이 존재할 수 있으며, 예를 들어 숙주 및 병원균은 비양립성이다. 통상적으로 많은 유전자에 의해 제어되는, 수평 저항성, 예를 들어 병원균의 모든 종족에 대하여 부분 저항성, 및 통상적으로 몇몇 유전자에 의해 제어되는, 수직 저항성, 예를 들어 다른 종족은 아니지만 일부 종족의 병원균에 대해 완전한 저항성이 또한 존재할 수 있다. 유전자 대 유전자 수준에서, 식물 및 병원균은 함께 진화하며, 하나의 균형에서의 유전적 변화는 다른 하나에서 변화를 일으킨다. 따라서, 자연적 변동성을 사용하여, 품종 개량자는, 산출량, 품질, 균일성, 강인성(hardiness), 저항성에 대해 가장 유용한 유전자를 조합한다. 저항성 유전자 공급원은 천연 또는 외래의 변종들, 토종(Heirloom Varieties), 야생 근연 식물, 및 유도된 돌연변이, 예를 들어 돌연변이원성 제제를 이용한 식물 재료 처리를 포함한다. 본 발명을 사용하여, 식물 품종 개량자는 돌연변이를 유도하는 새로운 도구를 제공받는다. 따라서, 당업자는 저항성 유전자의 게놈을 분석할 수 있고, 원하는 특징 또는 특성을 갖는 변종들에서, 이전의 돌연변이원성 제제보다 더욱 정확하고, 이에 따라 식물 품종 개량 프로그램을 가속화하고 개선하는 저항성 유전자의 증가를 유도하기 위하여 본 발명을 이용할 수 있다.
개선된 식물 및 효모 세포
본 발명은 또한 본 명세서에서 제공된 방법에 의해 수득가능하거나 수득된 식물 및 효모 세포를 제공한다. 본 명세서에서 설명된 방법에 의해 수득된 개선된 식물은, 예를 들어 식물 해충, 제초제, 가뭄, 저온 또는 고온, 과다한 물, 등에 대한 내성을 보장하는 유전자의 발현을 통해 식물 또는 사료 생산에 유용할 수 있다.
본 명세서에서 설명된 방법에 의해 수득된 개선된 식물은 특히 작물이며, 야생형에서 정상적으로 보일 수 있는 것보다 더 많은 예를 들어 단백질, 탄수화물, 영양소 또는 비타민 수준의 발현을 통해 식물 또는 사료 생산에 유용할 수 있다. 이와 관련하여, 개선된 식물, 특히 콩 종류 및 괴경이 바람직하다.
개선된 조류 또는 유채와 같은 기타 식물은, 예를 들어 채소유 또는 알코올(특히 메탄올 및 에탄올)과 같은 생물연료의 생산에 특히 유용할 수 있다. 이들은 오일 또는 생물연료 산업에서의 이용을 위한 알코올을 높은 수준으로 발현 또는 과잉발현하도록 조작될 수 있다.
본 발명은 또한 식물의 개선된 부분을 위해 제공된다. 식물 부분은 이로 제한되지는 않지만, 잎, 줄기, 뿌리, 괴경, 씨드, 배젖, 배주, 및 화분을 포함한다. 여기서 고려되는 식물 부분은 자생성, 비자생성, 재생성, 및/또는 비재생성일 수 있다.
본 발명의 방법에 따라 생성된 식물 세포 및 식물을 제공하는 것 또한 본 발명은 고려한다. 전통적인 육종 방법에 의해 생산된, 배우체, 씨드, 접합성 또는 체세포성 중 하나의, 배아, 유전적 변형을 포함하는 식물의 자손 또는 잡종 또한 본 발명의 범주 내에 포함된다. 그러한 식물은 표적 서열 대신 또는 표적 서열에 삽입된 이종성 또는 외래의 DNA 서열을 함유할 수 있다. 대안적으로, 그러한 식물은 하나 이상의 뉴클레오티드에서 단지 하나의 변경(돌연변이, 결실, 삽입, 치환)을 함유할 수 있다. 그와 같이, 그러한 식물은 그들의 조상 식물과 특정 변형의 존재에 의해서만 상이할 것이다.
따라서, 본 발명은 본 발명에 의해 생산된, 식물, 동물 또는 세포, 또는 그의 자손을 제공한다. 그 자손은 생산된 식물 또는 동물의 클론일 수 있거나, 추가의 바람직한 특성을 그의 자손에게 유전자 이입(introgress)하기 위해 동일 종의 다른 개체와의 교잡에 의한 유성 생식으로부터의 것일 수 있다. 세포는 다세포 생물, 특히 동물 또는 식물의 경우 생체 내 또는 생체 외일 수 있다.
Cpf1 이펙터 단백질 복합체는 비-인간 유기체 / 동물에서 사용될 수 있다
일 양태에서, 본 발명은 비-인간 진핵 유기체; 바람직하게는 기재된 임의의 구현예들에 따른 진핵 숙주 세포를 포함하는, 다세포성 진핵 유기체를 제공한다. 다른 양태에서, 본 발명은 진핵 유기체; 바람직하게는 기재된 임의의 구현예들에 따른 진핵 숙주 세포를 포함하는, 다세포성 진핵 유기체를 제공한다. 이들 양태의 일부 구현예에서 유기체는 동물; 예를 들어 포유동물일 수 있다. 또한, 유기체는 곤충과 같은 절지동물일 수 있다. 유기체는 또한 식물일 수 있다. 추가로, 유기체는 균류일 수 있다.
본 발명은 예를 들어, 농장 및 생산 동물과 같은 기타 농학적 응용으로 연장될 수도 있다. 예를 들어, 돼지는, 특히 재생 의학에서 생물의학적 모델로서 이들이 매력적이도록 하는 많은 특징들을 갖는다. 구체적으로, 심각한 중증 복합형 면역 부전 (SCID)을 갖는 돼지는 재생 의학인, 이종장기이식(또한 본 명세서의 다른 곳에 논의되어 있음) 및 종양 발생에 유용한 모델을 제공할 수 있으며, 인간 SCID 환자에 대한 치료법 개발을 도울 것이다. Lee 등(문헌 [Proc Natl Acad Sci U S A. 2014 May 20;111(20):7260-5])은 리포터-가이드된 전사 활성화제-유사 이펙터 뉴클레아제(TALEN) 시스템을 체세포에서 고효율로 재조합 활성화 유전자(RAG) 2의 생성된 표적된 변형에 활용하였으며, 이는 침범된 두 대립형질 모두 일부를 포함하였다. Cpf1 이펙터 단백질은 유사한 시스템에 적용될 수 있다.
Lee 등의 방법은 (문헌 [Proc Natl Acad Sci U S A. 2014 May 20;111(20):7260-5]) 하기와 같이 유사하게 본 발명에 적용될 수 있다. 돌연변이된 돼지는 태아 섬유아세포 내 RAG2의 표적된 변형에 이어 SCNT 및 배아 이송하여 생산된다. CRISPR Cas 및 리포터를 코딩하는 작제물 및 수령체를 태아-유래 섬유아세포 내로 전기천공시킨다. 48시간 이후, 녹색 형광 단백질을 발현하는 트랜스펙션된 세포를 96 개 웰 플레이트의 각 웰 내로, 웰 당 단일 세포의 견적된 희석으로 분류한다. RAG2의 표적된 변형은 임의의 CRISPR Cas 절단 부위에 측부배치되는 게놈 DNA 단편을 증폭함으로써 스크리닝되고, 이어서 PCR 생성물을 시퀀싱한다. 스크리닝 및 부위외(off-site) 돌연변이를 확인한 후, RAG2의 표적된 돌연변이를 갖는 세포는 SCNT에 사용된다. 난자의 인접 세포질의 일부와 함께, 중기 II 플레이트를 아마도 함유하는 극체 (polar body)가 제거되고, 공여자 세포는 위란강(perivitelline) 내에 위치된다. 재구축된 배아는 이후 전기천공되어 공여자 세포를 난자와 함께 융합시키고, 화학적으로 활성화시킨다. 활성화된 배아는 0.5 μM 스크립태드(Scriptaid) (S7817; Sigma-Aldrich)와 함께 돼지 접합자 매질 3 (PZM3) 내에서 14-16 시간 동안 인큐베이션된다. 이후 배아는 세척되어 스크립태드를 제거하고, 이들이 대리 돼지의 난관 내로 이동될때까지, PZM3 내에서 배양된다.
본 발명은 다른 동물, 예컨대 소의 SNP를 변형하는데 또한 적용가능하다. Tan 등 (문헌 [Proc Natl Acad Sci U S A. 2013 Oct 8; 110(41): 16526-16531])은 플라스미드, rAAV, 및 올리고뉴클레오티드 주형을 이용하는, 전사 활성화제-유사 (TAL) 이펙터 뉴클레아제 (TALEN)- 및 클러스터링되고 규칙적으로 산재된 짧은 팔린드로믹 반복부 (CRISPR)/Cas9- 자극된 상동성-유도된 수복 (HDR)을 포함하도록, 가축 유전자 편집 도구 박스를 확장시켰다. 유전자 특이적 gRNA 서열은 (문헌 [Mali P, et al. (2013) RNA-Guided Human Genome Engineering via Cas9. Science 339(6121):823-826])의 방법을 따라 Church lab gRNA 벡터 (Addgene ID: 41824) 내로 클로닝되었다. Cas9 뉴클레아제는 hCas9 플라스미드 (Addgene ID: 41815)의 공동-트랜스펙션 또는 RCIScript-hCas9로부터의 합성된 mRNA 중 어느 하나에 의해 제공되었다. 이러한 RCIScript-hCas9는 hCas9 플라스미드 (hCas9 cDNA 포함)로부터 XbaI-AgeI 단편을 부-클로닝함으로써 RCIScript 플라스미드 내로 구축되었다.
Heo 등 (문헌 [Stem Cells Dev. 2015 Feb 1;24(3):393-402. doi: 10.1089/scd.2014.0278. Epub 2014 Nov 3])은 소 다능성 세포 및 클러스터링되고 규칙적으로 산재된 짧은 팔린드로믹 반복부 (CRISPR)/Cas9 뉴클레아제를 이용하여 게놈 내에서 매우 효율적인 유전자 표적화를 보고하였다. 먼저, Heo 등은 야마나카(yamanaka) 인자의 이소성(ectopic) 발현 및 GSK3β 및 MEK 억제제 (2i) 처리에 의해 소 체세포 섬유아세포로부터의 유도된 다능성 줄기 세포 (iPSC)를 생성한다. Heo 등은 이들 소 iPSC가 기형종에서 유전자 발현 및 발생가능성 면에서, 나이브(naive) 다능성 줄기 세포와 매우 유사함을 관찰하였다. 또한, 소 NANOG 좌에 특이적이었던, CRISPR-Cas9 뉴클레아제는 소 iPSCs 및 배아에서 소 게놈의 매우 효율적인 편집을 보여주었다.
Igenity®는 소와 같은 동물의 프로파일 분석을 제공하여 경제적으로 중요한 경제적 특성들의 특성, 예컨대 도체(carcass) 조성, 도체 품질, 모성 및 번식 특성, 및 평균 일일 체중증가를 수행 및 전송한다. 종합적인 Igenity® 프로파일의 분석은 DNA 마커를 이용하여 시작한다 (가장 빈번하게 단일 뉴클레오티드 다형성 또는 SNP). Igenity® 프로파일 뒤의 모든 마커는 대학, 연구 조직, 및 USDA와 같은 정부 기관을 포함한 연구 기관에서 독립적인 과학자들에 의해 발견되었다. 마커는 그 후 Igenity®에서 확인 집단으로 분석된다. Igenity®는, 종종 양식동물(seedstock), 소-송아지, 가축사육장 및/또는 소고기 산업 포장 부문로부터의 산업 파트너와 함께 작업하여 흔히 입수가능하지 않은 표현형들을 수집하기 위하여, 다양한 생산 환경 및 생물학적 유형을 대표하는 다수의 다중 리소스 집단을 이용한다. 소 게놈 데이터베이스는 널리 이용가능하며, 예를 들어 NAGRP 소 게놈 코디네이션 프로그램(Cattle Genome Coordination Program) (http://www.animalgenome.org/cattle/maps/db.html)이 있다. 이에 따라, 본 발명은 소 SNP를 표적화하는데 적용될 수 있다. 본 기술 분야의 숙련자는 SNP를 표적화하기 위해 상기 프로토콜을 사용할 수 있으며, 예를 들어, Tan 등 또는 Heo 등에 기재된 바와 같이 소 SNP에 이들을 적용할 수 있다.
Qingjian Zou 등 (문헌 [Journal of Molecular Cell Biology Advance Access published October 12, 2015])은 개 미오스타틴(Myostatin) (MSTN) 유전자 (골격 근육량의 음성 조절자)의 제1 엑손을 표적함으로써 개에서 증가된 근육량을 증명하였다. 먼저, Cas9 벡터를 이용한 sgRNA 표적화 MSTN의 개 배아 섬유아세포 (CEF) 내로의 공동트랜스펙션을 이용하여, sgRNA의 효율이 입증되었다. 그 후, MSTN KO 개는 Cas9 mRNA 및 MSTN sgRNA의 혼합물과 함께 정상 형태학을 갖는 배아를 미세주입 및 동일한 암컷 개의 난관 내로 접합자의 자가이식에 의해 생성되었다. 낙아웃 강아지는, 그의 야생형 한배 새끼(littermate) 자매와 비교시 허벅지에서 명백한 근육질 표현형을 나타내었다. 이는 또한 본 명세서에서 제공된 Cpf1 CRISPR 시스템을 사용하여 실행될 수 있다.
가축-돼지
가축에 있는 바이러스 표적은 일부 구현예에서 예를 들어 돼지 마크로파지 상에 있는 돼지 CD163을 포함할 수 있다. CD163은 PRRSv에 의한 감염과 연관된다 (바이러스 세포 엔트리를 통한 것으로 생각됨) (돼지 생식기 호흡 증후군(Porcine Reproductive and Respiratory Syndrome) 바이러스, 아테리바이러스(arterivirus)). 특히 돼지 폐포(alveolar) 마크로파지 (폐에서 발견됨)의, PRRSv에 의한 감염은, 일반 식용 돼지에서 번식 장애, 체중 손실 및 높은 사망률을 포함하여, 고통을 유발하는 이전에는 불치의 돼지 증후군 ("돼지 괴질" 또는 "청이병(blue ear disease)"을 결과로서 초래한다. 유행성 폐렴, 뇌수막염 및 귀 부종과 같은 기회 감염은 마크로파지 활성의 손실을 통한 면역 부전으로 인하여 종종 나타난다. 이는 또한 증가된 항생제 이용 및 재정적 손실로 인해, 중요한 경제적 및 환경적 영향을 갖는다 (년간 $660m으로 주정됨).
미주리 대학에서 Genus Plc와 함께 공동작업한 Kristin M Whitworth 및 Dr Randall Prather 등에 의해 보고된 바와 같이 (문헌 [Nature Biotech 3434, 2015년 12월 7일 온라인 간행]), CD163은 CRISPR-Cas9를 이용하여 표적되고, 편집된 돼지의 자손은 PRRSv에 노출된 경우 저항성이었다. 둘 다 CD163의 엑손 7에 돌연변이를 갖는, 하나의 파운더(founder) 수컷과 하나의 파운더 암컷을 사육하여 자손을 생산하였다. 파운더 수컷은 하나의 대립형질 상의 엑손 7에서 11-bp 결실을 소유하였으며, 이는 도메인 5의 아미노산 45에서 프레임시프트 돌연변이 및 미스센스 번역, 및 이후 아미노산 64에서 때이른 정지 코돈을 을 결과로서 초래한다. 다른 대립형질은 엑손 7에서 2-bp의 추가 및 앞선 인트론에서 377-bp의 결실을 가졌으며, 이는 도메인 5의 처음 49개 아미노산의 발현에 이어서, 아미노산 85에서 때이른 정지 코드가 뒤따르는 결과를 초래하는 것으로 예측되었다. 암퇘지는, 번역된 경우 도메인 5의 처음 48개 아미노산을 발현시키고, 이어서 아미노산 70에서 때이른 정지 코돈이 뒤따르는 것으로 예측되는 하나의 대립형질에서 7bp 추가를 가졌다. 암퇘지의 다른 대립형질은 증폭가능하지 않았다. 선택된 자손은 널 동물 (CD163-/-), 즉 CD163 낙아웃인 것으로 예측되었다
따라서, 일부 구현예에서, 돼지 폐포 마크로파지는 CRISPR 단백질에 의해 표적될 수 있다. 일부 구현예에서, 돼지 CD163은 CRISPR 단백질에 의해 표적될 수 있다. 일부 구현예에서, 돼지 CD163은 DSB의 유도를 통해 또는 삽입 또는 결실을 통하여 낙아웃될 수 있어서, 예를 들어 상기 설명된 하나 이상의 것들을 포함하는, 엑손 7의 표적화 결실 또는 변형, 또는 유전자의 다른 영역에서 예를 들어 엑손 5의 결실 또는 변형을 표적한다.
편집된 돼지 및 그의 자손, 예를 들어 CD163 낙아웃 돼지가 또한 고려된다. 이는 가축, 사육 또는 모델링 목적을 위한 것일 수 있다 (즉, 돼지 모델). 유전자 낙아웃을 포함하는 정액이 또한 제공된다.
CD163은 스캐빈저(scavenger) 수용체 시스테인-풍부 (SRCR) 상과(superfamily)의 멤버(member)이다. 시험관 내 연구에 기초하여, 단백질의 SRCR 도메인 5는 바이러스 게놈의 패키징 해체(unpackaging) 및 방출의 원인이 되는 도메인이다. 그와 같이, SRCR 상과의 기타 멤버는 또한 다른 바이러스에 대한 저항성을 평가하기 위하여 표적될 수 있다. PRRSV는 또한 포유동물 아테리바이러스 군의 멤버이며, 이는 또한 뮤린의 락테이트 탈수소효소-상승 바이러스, 원숭이 출혈열 바이러스 및 말 동맥염 바이러스를 포함한다. 아테리바이러스는 마이크로파지 친화성(tropism) 및 중증 질병 및 지속적 감염 둘 모두를 유발하는 능을 포함하는, 중요한 발병 특성을 공유한다. 따라서, 아테리바이러스, 및 특히 뮤린의 락테이트 탈수소효소-상승 바이러스, 원숭이 출혈열 바이러스 및 말 동맥염 바이러스는, 예를 들어 돼지 CD163 또는 다른 종에서 그의 상동체를 통하여 표적될 수 있으며, 뮤린, 원숭이 및 말 모델 및 낙아웃이 또한 제공된다.
실제로, 이러한 시도는 인간, 예컨대 독감 C 및 H1N1, H1N2, H2N1, H3N1, H3N2, 및 H2N3로서 알려진 독감 A의 하위유형을 포함하는 돼지 독감 바이러스 (SIV) 균주, 및 상기 언급된 폐렴, 뇌수막염 및 부종와 같이 인간에게 전달될 수 있는, 기타 가축 질병을 유발하는 바이러스 또는 박테리아로 연장될 수 있다.
RNA-가이드된 Cpf1 이펙터 단백질 복합체를 이용한 치료적 표적화
명백할 것이지만, 본 시스템은 임의의 관심 폴리뉴클레오티드 서열을 표적화하는데 사용될 수 있다. 본 발명은 세포를 생체 내, 생체 외 또는 시험관 내에서 표적 세포의 변형에서의 이용을 위한 비-천연 발생 또는 조작된 조성물, 또는 상기 조성물의 성분들을 인코딩하는 하나 이상의 폴리뉴클레오티드, 또는 상기 조성물의 성분을 인코딩하는 하나 이상의 폴리뉴클레오티드를 포함하는 벡터 또는 전달 시스템을 제공하고, 일단 변형되면 CRISPR 변형된 세포의 자손 또는 세포주가 변경된 표현형을 보유하도록 표적 세포를 변경하는 방식으로 수행될 수 있다. 변형된 세포 및 자손은 CRISPR 시스템의 바람직한 세포 유형에의 생체 외 또는 생체 내 적용을 갖는 식물 또는 동물과 같은 다세포성 생물의 일부일 수 있다. CRISPR 발명은 치료적 처리 방법일 수 있다. 치료적 처리 방법은 유전자 또는 게놈 편집, 또는 유전자 치료법을 포함할 수 있다.
박테리아, 균류 및 기생 병원균과 같은 병원균 처리
본 발명은 박테리아, 균류 및 기생 병원균을 처리하는데 적용될 수도 있다. 대부분의 연구 노력은 신규 항생제의 개발에 집중하며, 일단 개발되면, 그럼에도 불구하고 이는 약물 저항성의 동일한 문제의 대상이 될 것이다. 본 발명은 그러한 어려움들을 극복하는 신규 CRISPR-기반 대안을 제공한다. 나아가, 기존의 항생제와 달리, CRISPR-기반 치료는 병원균 특이적으로 제조될 수 있어서, 유익한 박테리아는 회피하면서 표적 병원균의 박테리아 세포 사멸을 유도한다.
Jiang 등 (문헌 ["RNA-guided editing of bacterial genomes using CRISPR-Cas 시스템s," Nature Biotechnology vol. 31, p. 233-9, March 2013])은 CRISPR-Cas9 시스템을 사용하여 S. 뉴모니애 및 대장균을 돌연변이 또는 사멸시킨다. 정확한 돌연변이를 게놈 내로 도입한 이 작업은 돌연변이되지 않은 세포를 사멸시키기 위하여 표적된 게놈 부위에서의 이중-RNA:Cas9-유도된 절단에 의존하였으며, 선택가능한 마커 또는 대항-선택 시스템에 대한 필요를 피하였다. CRISPR 시스템은 항생제 저항성을 역전하고, 균주들 간의 저항성의 전달을 제거하는데 사용된다. Bickard 등은, 독성 유전자를 표적하도록 재프로그램화된 Cas9가 독성인 S. 아우레우스를 사멸시키지만, 비독성 S. 아우레우스는 사멸시키지 않았음을 보였다. 항생제 저항성 유전자를 표적화하는 뉴클레아제의 재프로그램화는, 항생제 저항성 유전자를 품은 스태필로코커스 플라스미드를 파괴하고, 플라스미드-유래 저항성 유전자의 확산에 대해 면역화되었다. (문헌 [Bikard et al., "Exploiting CRISPR-Cas 뉴클레아제s to produce sequence-specific antimicrobials," Nature Biotechnology vol. 32, 1146-1150, doi:10.1038/nbt.3043, 2014년 10월 5일 온라인 간행], 참조) Bikardss는, CRISPR-Cas9 항균제가 마우스 피부 콜로니화 모델에서 S. 아우레우스를 사멸시키도록 생체 내에서 작용함을 보였다. 유사하게, Yosef 등은 CRISPR 시스템을 사용하여 β-락탐 항생제에 대한 저항성을 수여하는 효소를 인코딩하는 유전자를 표적하였다 (문헌 [Yousef et al., "Temperate and lytic bacteriophages programmed to sensitize and kill antibiotic-resistant bacteria," Proc. Natl. Acad. Sci. USA, vol. 112, p. 7267-7272, doi: 10.1073/pnas.1500107112, 2015년 5월 18일 온라인 간행] 참조).
CRISPR 시스템은 다른 유전학적 시도에 대해 저항성인 기생충의 게놈을 편집하는데 사용될 수 있다. 예를 들어, CRISPR-Cas9 시스템은 플라스모듐 요엘리(Plasmodium yoelii) 게놈 내로 이중-가닥 파손을 도입하는 것을 보였다 (문헌 [Zhang et al., "Efficient Editing of Malaria Parasite Genome Using the CRISPR/Cas9 시스템," mBio. vol. 5, e01414-14, Jul-Aug 2014, 참조). Ghorbal 등 (문헌 ["Genome editing in the human malaria parasite Plasmodium falciparumusing the CRISPR-Cas9 시스템," Nature Biotechnology, vol. 32, p. 819-821, doi: 10.1038/nbt.2925, 2014년 6월 1일 온라인 간행됨)은, 각각 유전자 사일런싱 및 아르테미시닌(artemisinin)에 대해 최근 알려진 저항성 추정적 역할을 갖는 두 개의 유전자 orc1 및 kelch13의 서열을 변형시켰다. 적절한 부위에서 변경된 기생충은 변형에 대한 직접 선택은 없음에도 불구하고 매우 높은 효율로 회수되어, 중립성 또는 심지어는 유해한 돌연변이가 이 시스템을 이용하여 생성될 수 있음을 나타낸다. CRISPR-Cas9는 톡소플라즈마 곤디를 포함한 다른 병원균성 기생충의 게놈을 변형시키는데도 사용될 수 있다 (문헌 [Shen et al., "Efficient gene disruption in diverse strains of Toxoplasma gondii using CRISPR/CAS9," mBio vol. 5:e01114-14, 2014; 및 Sidik et al., "Efficient Genome Engineering of Toxoplasma gondii Using CRISPR/Cas9," PLoS One vol. 9, e100450, doi: 10.1371/journal.pone.0100450, 2014년 6월 27일 온라인 간행됨] 참조).
Vyas 등 (문헌 ["A Candida albicans CRISPR system permits genetic engineering of essential genes and gene families," Science Advances, vol. 1, e1500248, DOI: 10.1126/sciadv.1500248, 2015년 4월 3일)은 CRISPR 시스템을 이용하여 C. 알비칸스에서의 유전적 조작에 대한 오랜 장애를 극복하였으며, 몇몇 상이한 유전자의 두 개의 카피 모두를 단일 실험에서 효율적으로 돌연변이시켰다. 일부 메카니즘이 약물 저항성에 기여하는 생물에서, Vyas는 부모의 임상적 분리물 Can90에 의해 나타나는 플루코나졸 또는 시클로헥시미드에 대한 초저항성을 더이상 나타내지 않는 동형접합성 이중 돌연변이체를 생산하였다. Vyas는 조건적 대립형질을 만듬으로써 C. 알비칸스의 필수 유전자에서의 동형접합성 기능 손실 돌연변이를 또한 수득하였다. 리보좀성 RNA 가공에 대해 요구되는 DCR1의 널 대립형질은 저온에서 치명적이지만 고온에서는 생존성이다. Vyas는 논센스 돌연변이를 도입하고, 16℃에서 성장하는데 실패한 dcr1/dcr1 돌연변이체를 분리한 수복 주형을 사용하였다.
염색체 유전자좌의 붕괴에 의해 P.팔시파룸에서의 이용을 위한 본 발명의 CRISPR 시스템. Ghorbal 등 (문헌 ["Genome editing in the human malaria parasite Plasmodium falciparum using the CRISPR-Cas9 시스템", Nature Biotechnology, 32, 819-821 (2014), DOI: 10.1038/nbt.2925, 2014년 6월 1일)은 CRISPR 시스템을 사용하여 특정 유전자 낙아웃 및 단일-뉴클레오티드 치환을 말라리아 게놈에서 도입하였다. CRISPR-Cas9 시스템을 P. 팔시파룸에 맞춰 조정하기 위하여, Ghorbal 등은 DSM1에 대한 저항성을 주는, 약물-선택성 마커 ydhodh를 또한 운반하는 pUF1-Cas9 에피솜 내 플라스모이드성(plasmoidal) 조절 요소의 제어 하에서, P. 팔시파룸 다이하이드로오로테이트(dihydroorotate) 탈수소효소 (PfDHODH) 억제제를 위한, 그리고 sgRNAdml 전사를 위한 발현 벡터를 생성하였으며, 동일 플라스미드 pL7 상에서 상동성 재조합 수복을 위해 공여자 DNA 주형 및 가이드 RNA를 배치하는 P. 팔시파룸 U6 소핵 (sn) RNA 조절 요소를 이용하였다. Zhang C. 등 (문헌 ["Efficient editing of malaria parasite genome using the CRISPR/Cas9 system", MBio, 2014 Jul 1; 5(4):E01414-14, doi: 10.1128/MbIO.01414-14]) 및 Wagner 등 (문헌 ["Efficient CRISPR-Cas9-mediated genome editing in Plasmodium falciparum, Nature Methods 11, 915-918 (2014), DOI: 10.1038/nmeth.3063]) 또한 참조.
HIV와 같은 바이러스 병원균같은 병원균의 치료
Cas-매개된 게놈 편집은 체세포 조직 내로 보호성 돌연변이를 도입하여 비유전적 또는 복합 질병과 싸우는데 사용될 수 있다. 예를 들어, 림프구 내 CCR5 수용체의 NHEJ-매개된 비활성화 (문헌 [Lombardo et al., Nat Biotechnol. 2007 Nov; 25(11):1298-306])는 HIV 감염을 회피하기 위한 실용적 전략일 수 있는 한편, PCSK9 (문헌 [Cohen et al., Nat Genet. 2005 Feb; 37(2):161-5]) 또는 안지오포이에틴(angiopoietin) (문헌 [Musunuru et al., N Engl J Med. 2010 Dec 2; 363(23):2220-7])의 결실은 스타틴-저항성 고콜레스테롤혈증 또는 고지혈증에 대한 치료 효과를 제공할 수 있다. 이들 표적은 siRNA-매개된 단백질 낙아웃을 이용하여 다루어질 수도 있으며, NHEJ-매개된 유전자 비활성화의 독특한 장점은 치료를 지속할 필요 없이 영구 치료 이익을 달성하는 능력이다. 모든 유전자 치료에서처럼, 각각의 제안된 치료적 이용이 양호한 이익-위험 비율을 갖도록 수립되는 것이 물론 중요할 것이다.
수복 주형과 함께 가이드 RNA 및 Cas9를 인코딩하는 플라스미드 DNA의 티로신혈증의 성체 마우스 모델의 간 내로의 유체역학적 전달은 돌연변이체 Fah 유전자를 수정할 수 있고, 250 개의 세포 중 약 1 개의 야생형 Fah 단백질의 발현을 구제할 수 있는 것으로 나타났다 (문헌 [Nat Biotechnol. 2014 Jun; 32(6):551-3]). 추가적으로, 임상 시험은 CCR5 수용체의 생체 외 낙아웃에 의해 HIV 감염과 싸우기 위해 ZF 뉴클레아제를 성공적으로 사용하였다. 모든 환자에서, HIV DNA 수준은 감소하였으며, 4 명의 환자 중 한 명에서 HIV RNA는 검출가능하지 않게 되었다 (문헌 [Tebas et al., N Engl J Med. 2014 Mar 6; 370(10):901-10]). 이들 둘 모두의 결과는 신규 치료 플랫폼으로서 프로그램가능한 뉴클레아제의 가능성을 증명하였다.
또 다른 구현예에서, HIV tat/rev에 의해 공유된 일반 엑손을 표적화하는 siRNA, 핵소체-국소화 TAR 유인체(decoy), 및 항-CCR5-특이적 망치머리형 리보자임을 갖는 자가-비활성화 렌티바이러스성 벡터 (예를 들어, 문헌 [DiGiusto et al. (2010) Sci Transl Med 2:36ra43] 참조)가 사용되고/거나 본 발명의 CRISPR-Cas 시스템에 대해 조정될 수 있다. 환자 중량 kg 당 최소 2.5 × 106 CD34+ 세포가 수집될 수 있고, 이들은 2 μmol/L-글루타민, 줄기 세포 인자 (100 ng/ml), Flt-3 리간드 (Flt-3L) (100 ng/ml), 및 트롬보포이에틴 (10 ng/ml) (CellGenix)을 함유하는 X-VIVO 15 매질 (Lonza) 내에서 2 × 106 세포/ml의 밀도로 16 시간 내지 20 시간 동안 예비자극되었다. 예비자극된 세포는 피브로넥틴으로 코팅된 75-cm2 조직 배양 플라스크 내에서 16 시간 내지 24 시간 동안, 감염 다중도 5로 렌티바이러스를 이용하여 형질도입될 수 있다 (25 mg/cm2) (RetroNectin,Takara Bio Inc.).
해당 기술 분야의 지식 및 본 개시 내용의 교시를 이용하여, 숙련자는 CCR5를 표적화하고 낙아웃하는 CRISPR-Cas9 시스템과 HSC를 접촉시키는 것을 포함하는 HIV/AIDS와 같은 면역결핍 상태에 관련된 HSC를 수정할 수 있다. 입자를 함유하는 CCR5-및-Cpf1 단백질을 표적 및 낙아웃하는 가이드 RNA (및 유리하게는 이중 가이드 시도, 예를 들어, 한 쌍의 상이한 가이드 RNA; 예를 들어, 두 개의 임상적으로 관련된 유전자인 B2M 및 CCR5의 가이드 RNAs 표적화, 일차적으로 인간 CD4+ T 세포 및 CD34+ 조혈성 줄기 및 선조 세포 (HSSPC))는 HSC와 접촉된다. 이렇게 접촉된 세포는 투여될 수 있으며; 선택적으로 처리/확장될 수 있다; Cartier 참조. 또한, 문헌 ([Kiem, "Hematopoietic stem cell-based gene therapy for HIV disease," Cell Stem Cell. Feb 3, 2012; 10(2): 137-147; 그에 언급된 문헌과 함께 본 명세서에 참고로서 포함됨; Mandal et al, "Efficient Ablation of Genes in Human Hematopoietic Stem and effector Cells using CRISPR/Cas9," Cell Stem Cell, Volume 15, Issue 5, p643-652, 6 November 2014; 그에 언급된 문헌과 함께 본 명세서에 참고로서 포함됨]) 참조. CRISPR-Cpf1 시스템을 이용하여 HIV/AIDS와 싸우기 위한 또 다른 수단으로서, 문헌 ([Ebina, "CRISPR/Cas9 system to suppress HIV-1 expression by editing HIV-1 integrated proviral DNA" SCIENTIFIC REPORTS | 3 : 2510 | DOI: 10.1038/srep02510, 그에 언급된 문헌과 함께 본 명세서에 참고로서 포함됨])이 또한 언급될 수 있다.
HIV 치료를 위한 게놈 편집에 대한 근거는, 바이러스에 대한 세포성 공동-수용체인, CCR5에서 기능 손실 돌연변이에 대해 동형접합성인 개인들이 감염에 대해 고도로 저항성이며, 그렇지 않으면 건강하다는 관찰로부터 유래되며, 이는 게놈 편집을 이용한 이러한 돌연변이의 모방은 안전하며 효과적인 치료 전략일 수 있음을 제안한다 (문헌 [Liu, R., et al. Cell 86, 367-377 (1996)]). 이러한 아이디어는, HIV 감염된 환자가 CCR5 돌연변이의 기능 손실에 대해 동형접합성인 공여자로부터 동종이계성(allogeneic) 골수 이식을 받은 경우, 검출가능하지 않은 수준의 HIV 및 정상 CD4 T-세포 수의 회복을 결과로서 초래한다는 것을 임상적으로 입증하였다 (문헌 [Hutter, G., et al. The New England journal of medicine 360, 692-698 (2009)]). 비용 및 잠재적인 이식편 대 숙주 질병으로 인해, 골수 이식은 대부분의 HIV 환자에게 현실적인 치료 전략은 아니지만, 환자 자신의 T-세포를 CCR5로 전환하는 HIV 치료는 바람직하다.
HIV의 인간화 마우스 모델에서 CCR5를 낙아웃하기 위한 ZFNs 및 NHEJ를 이용하는 초기 연구는, CCR5 편집된 CD4 T세포의 장기이식이 개선된 바이러스 부하 및 CD4 T-세포 수를 개선하였음을 보였다 (문헌 [Perez, E.E., et al. Nature biotechnology 26, 808-816 (2008)]). 중요하게는, 이들 모델은 또한 HIV 감염이 CCR5 널 세포의 선택하는 결과를 초래하였음을 나타내어, 편집이 적합성 장점을 수여함을 제안하며, 적은 수의 편집된 세포들이 치료 효과를 내는 것을 잠재적으로 가능하게 한다.
이러한 및 다른 유망한 임상전 연구의 결과로서, 환자 T 세포 내에서 CCR5를 낙아웃하는 게놈 편집 치료는 이제 인간에서 시험되었다 (문헌 [Holt, N., et al. Nature biotechnology 28, 839-847 (2010); Li, L., et al. Molecular therapy : the journal of the American Society of Gene Therapy 21, 1259-1269 (2013)]). 최근 임상 시험 제 I기에서, HIV를 갖는 환자로부터의 CD4+ T 세포는 제거되고, CCR5 유전자를 낙아웃하도록 설계된 ZFN을 이용하여 편집되어, 환자 내로 다시 자가이식되었다 (문헌 [Tebas, P., et al. The New England journal of medicine 370, 901-910 (2014)]).
또 다른 연구 (문헌 [Mandal et al., Cell Stem Cell, Volume 15, Issue 5, p643-652, 6 November 2014])에서, CRISPR-Cas9는, 인간 CD4+ T 세포 및 CD34+ 조혈성 줄기 및 선조 세포 (HSPCs)에서 두 개의 임상 관련 유전자 B2M 및 CCR5를 표적하였다. 단일 RNA 가이드의 이용은 HSPC에서 매우 효율적인 돌연변이 유발을 이끌었으나 T 세포에서는 그렇지 않았다. 이중 가이드 시도는 두 세포 유형 모두에서 개선된 유전자 결실 효능을 시도하였다. CRISPR-Cas9를 이용하여 게놈 편집 처리된 HSPC는 다혈통(multilineage) 능을 보유하였다. 예측된 표적상 및 표적외 돌연변이는 HSPC에서 표적 포착 시퀀싱을 통해 검사되었으며, 낮은 수준의 표적외 돌연변이유발이 단지 하나의 부위에서 관찰되었다. 이들은 CRISPR-Cas9가 최소의 표적외 돌연변이유발을 이용하여 HSPC에서 유전자를 효율적으로 제거할 수 있음을 증명하며, 이는 조혈 세포-기반 치료에 대한 넓은 적용성을 갖는다.
Wang 등 (문헌 [PLoS One. 2014 Dec 26;9(12):e115987. doi: 10.1371/journal.pone.0115987])은 Cas9 및 CCR5 가이드 RNA를 발현하는 렌티바이러스 벡터를 이용하여, CRISPR 연관 단백질 9 (Cas9) 및 단일 가이드 RNA (가이드 RNA)를 통해 CCR5를 사일런스화하였다. Wang 등은 Cas9 및 CCR5 가이드 RNA를 발현하는 렌티바이러스 벡터의 HIV-1 민감성 인간 CD4+ 세포 내로의 일 회전 형질도입은 높은 빈도의 CCR5 유전자 붕괴를 산출함으로 나타내었다. CCR5 유전자-붕괴된 세포는 전달된/파운더 (T/F) HIV-1 분리물을 포함하는, R5-지향성 HIV-1에 저항성일 뿐만 아니라, R5-지향성 HIV-1 감염 동안 CCR5 유전자-붕괴되지 않은 세포에 대해 선택적인 장점을 또한 갖는다. 형질도입 후 84일이 지나서도 안정하게 형질도입된 세포 내에서 이들 CCR5 가이드 RNA에 대해 고도로 상동성인 잠재적인 표적외 부위에서의 게놈 돌연변이는 T7 엔조뉴클레아제 I 분석에 의해 검출되지 않았다.
Fine 등 (문헌 [Sci Rep. 2015 Jul 1;5:10777. doi: 10.1038/srep10777])은, 세포 내에서 함께 스플라이스되어 부위-특이적 DNA 절단이 가능한 작용성 단백질을 형성하는 스트렙토코커스 피오게네스 Cas9 (SpCas9)의 일부를 발현하는 2-카세트 시스템을 확인하였다. 특정 CRISPR 가이드 가닥을 이용하여, Fine 등은 단일 Cas9로서 및 Cas9 닉카제의 쌍으로서 인간 HEK-293T 세포에서 HBB와 CCR5 유전자를 절단하는데 있어서 본 시스템의 효능을 증명하였다. 트랜스-스플라이스된 SpCas9 (tsSpCas9)는 표준 트랜스펙션 도스에서 야생형 SpCas9 (wtSpCas9)와 비교시 뉴클레아제 활성의 약 35%를 나타내었지만, 더 낮은 수준에서 실질적으로 더 감소된 활성을 가졌다. wtSpCas9에 비하여 tsSpCas9의 크게 감소된 오픈 리딩 프레임 길이는 잠재적으로 더욱 복잡하고 긴 유전 요소가, 조직-특이적 프로모터, 다중화된 가이드 RNA 발현, 및 SpCas9에 대한 이펙터 도메인 융합물을 포함하는 AAV 벡터 내로 패키지되는 것을 가능하게 한다.
Li 등 (문헌 [J Gen Virol. 2015 Aug;96(8):2381-93. doi: 10.1099/vir.0.000139. Epub 2015 Apr 8])은 CRISPR-Cas9가 세포주 내에서 CCR5 유전자좌의 편집을 효율적으로 매개할 수 있어서, 세포 표면 상에서 CCR5의 낙아웃을 결과로서 초래함을 증명하였다. 다음세대 시퀀싱은 각종 돌연변이가 CCR5의 예측된 절단 부위 주위에 도입되었음을 밝혀주었다. 세 개의 가장 효과적인 가이드 RNA 각각의 경우, 현저한 표적외 효과는 15 개의 최고-점수 가능 부위에서 검출되지 않았다. CRISPR-Cas9 성분을 운반하는 키메라 Ad5F35 아데노바이러스를 구축함으로써, Li 등은 일차적인 CD4+ T-림프구를 효율적으로 형질도입하였으며, CCR 발현을 붕괴시키고, 양성으로 형질도입된 세포는 HIV-1 저항성을 받았다.
당업자는 본 발명의 CRISPR Cas 시스템으로 CCR5를 표적하기 위하여, 예를 들어, 문헌 [Holt, N., et al. Nature biotechnology 28, 839-847 (2010), Li, L., et al. Molecular therapy : the journal of the American Society of Gene Therapy 21, 1259-1269 (2013), Mandal et al., Cell Stem Cell, Volume 15, Issue 5, p643-652, 6 November 2014, Wang et al. (PLoS One. 2014 Dec 26;9(12):e115987. doi: 10.1371/journal.pone.0115987), Fine et al. (Sci Rep. 2015 Jul 1;5:10777. doi: 10.1038/srep10777) 및 Li et al. (J Gen Virol. 2015 Aug;96(8):2381-93. doi: 10.1099/vir.0.000139. Epub 2015 Apr 8)]의 상기 연구들을 활용할 수 있다.
바이러스성 병원균, 예컨대 HBV와 같은 병원균의 처리
본 발명은 또한 간염 B 바이러스 (HBV)를 치료하기 위하여 적용될 수 있다. 그러나, CRISPR Cas 시스템은 RNAi의 결점, 예컨대 내인성 작은 RNA 경로를 예를 들어 도스 및 서열을 최적화함으로써 과포화하는(oversatring) 위험을 회피하도록 조정되어야만 한다 (예를 들어, 문헌 [Grimm et al., Nature vol. 441, 26 May 2006] 참조). 예를 들어, 인간 당 약 1 내지 10×1014 개의 입자와 같은 낮은 도스가 고려된다. 또 다른 구현예에서, HBV를 향한 CRISPR Cas 시스템은 리포좀, 예컨대 안정한 핵산-지질 입자(SNALP) 내로 투여될 수 있다 (예를 들어, 문헌 [Morrissey et al., Nature Biotechnology, Vol. 23, No. 8, August 2005] 참조). SNALP 내 HBV RNA로 표적되는 CRISPR Cas의 약 1, 3 또는 5 mg/kg/일의 일일 정맥내 투여가 고려된다. 일일 처리는 약 3일 넘게, 그 후 약 5주 동안 주 1회일 수 있다. 또 다른 구현예에서, Chen 등의 시스템 (문헌 [Gene Therapy (2007) 14, 11-19])은 본 발명의 CRISPR Cas 시스템에 이용 및/또는 조정될 수 있다. Chen 등은 shRNA를 전달하기 위해 이중-가닥 아데노연관 바이러스 8-위형(pseudotyped) 벡터 (dsAAV2/8)를 이용한다. HBV-특이적 shRNA를 갖는, dsAAV2/8 벡터의 단일 투여 (마우스 당 1×1012 벡터 게놈)는 HBV 유전자이식 마우스의 간에서 HBV 단백질, mRNA 및 복제형 DNA의 꾸준한 수준을 효과적으로 저해하여, 순환에서 HBV 로드에서의 2-3 log10 이하에 달하는 감소를 초래한다. 현저한 HBV 저해는 벡터 투여 후 적어도 120일 동안 유지되었다. shRNA의 치료 효과는 표적 서열 의존성이었으며, 인터페론의 활성화를 수반하지 않았다. 본 발명의 경우, HBV를 향한 CRISPR Cas 시스템은 AAV 벡터, 예컨대 dsAAV2/8 내로 클로닝되고, 예를 들어 인간 당 약 1×1015 벡터 게놈 내지 약 1×1016 벡터 게놈의 용량으로 인간에게 투여될 수 있다. 또 다른 구현예에서, Wooddell 등 (문헌 [Molecular Therapy vol. 21 no. 5, 973-985 May 2013])의 방법은 본 발명의 CRISPR Cas 시스템에 사용 및/또는 조절될 수 있다. Woodell 등은 간세포-표적된, N-아세틸갈락토사민-컨쥬게이트된 멜리틴-유사 펩티드와, 응집 인자 VII (F7)를 표적화하는 간-지향성 콜레스테롤-컨쥬게이트된 siRNA (chol-siRNA)와의 단순 공동주입이 마우스 및 비-인간 영장류에서 임상 화학에서의 변화 또는 시토카인의 유도 없이 효율적인 F7 낙다운을 결과로서 초래한다. HBV 감염의 일시 및 이식유전자 마우스 모델을 이용하여, Wooddell 등은 강한 chol-siRNA 표적화 보존된 HBV 서열과 NAG-MLP의 단일 공동 주입이 긴 기간의 효과를 갖는 바이러스 RNA, 단백질, 및 바이러스 DNA의 멀티로그(multilog) 억제를 결과로서 초래하였음을 보여준다. 예를 들어, 약 6 mg/kg의 NAG-MLP 및 6 mg/kg의 HBV 특이적 CRISPR Cas의 정맥내 공동주입이 본 발명을 위해 고려될 수 있다. 대안적으로, 약 3 mg/kg의 NAG-MLP 및 3 mg/kg의 HBV 특이적 CRISPR Cas가 1일에 전달될 수 있고, 이어서 2주 후 약 약 2-3 mg/kg의 NAG-MLP 및 2-3 mg/kg의 HBV 특이적 CRISPR Cas의 투여가 뒤따른다.
Lin 등 (문헌 [Mol Ther Nucleic Acids. 2014 Aug 19;3:e186. doi: 10.1038/mtna.2014.38])은 유전형 A에 대해 8 개의 gRNA를 설계하였다. HBV-특이적 gRNA를 이용하여, CRISPR-Cas9 시스템은 HBV-발현 벡터로 트랜스펙션된 Huh-7 세포에서 HBV 코어 및 표면 단백질의 생산을 현저히 감소시켰다. 8 개의 스크리닝된 gRNA들 중, 두 개의 효과적인 것들을 확인하였다. 보존된 HBV 서열을 표적화하는 하나의 gRNA는 상이한 유전형에 대하여 작용하였다. 유체역학-HBV 지속 마우스 모델을 이용하여, Lin 등은 이 시스템이 간 내 HBV 게놈-함유 플라스미드를 절단하고, 그의 생체 내 소제(clearance)를 촉진하여, 혈청 표면 항원 수준의 감소를 결과로서 초래함을 추가로 증명하였다. 이들 데이터는, CRISPR-Cas9 시스템이 시험관 내 생체 내 모두에서 HBV-발현 주형을 붕괴시킬 수 있음을 제안하며, 지속적인 HBV 감염을 근절하는 그의 능력을 표시한다.
Liu 등 (문헌 [J Gen Virol. 2015 Aug;96(8):2252-61. doi: 10.1099/vir.0.000159. Epub 2015 Apr 22])은 상이한 HBV 유전형의 보존된 영역을 표적한 8 개의 가이드 RNA(gRNA)를 설계하였으며, 이는 시험관 내 및 생체 내 모두에서 HBV 복제를 현저히 저해시켜 CRISPR-Cas9 시스템을 이용하여 HBV DNA 주형을 붕괴시키는 가능성을 조사할 수 있었다. HBV-특이적 gRNA/Cpf1 시스템은 세포 내에서 상이한 유전형의 HBV의 복제를 저해할 수 있을 것이며, 바이러스성 DNA는 단일 gRNA/Cpf1 시스템에 의해 현저히 감소되었으며, 상이한 gRNA/Cpf1 시스템의 조합에 의해 소제되었다.
Wang 등 (문헌 [World J Gastroenterol. 2015 Aug 28;21(32):9554-65. doi: 10.3748/wjg.v21.i32.9554])은 유전형 A-D의 HBV에 대하여 15 개의 gRNA를 설계하였다. HBV의 조절 영역을 커버하는 상기 두 개의 gRNA (이중-gRNA)의 11 개 조합이 선택되었다. HBV (유전형 A-D) 복제의 저해에 대한 각각의 gRNA 및 11 개의 이중-gRNA의 효율은 배양물 상등액 내 HBV 표면 항원 (HBsAg) 또는 e 항원 (HBeAg)의 측정에 의해 검사하였다. HBV-발현 벡터의 파괴는 이중-gRNA 및 HBV-발현 벡터로 공동-트랜스펙션된 HuH7 세포 내에서 중합효소 연쇄 반응 (PCR) 및 시퀀싱 방법을 이용하여 검사되었으며, cccDNA의 파괴는 KCl 제조, 플라스미드-안전 ATP-의존성 DN아제 (PSAD) 소화, 회전환 증폭 및 정량 PCR 조합된 방법을 이용하여 HepAD38 세포에서 검사되었다. 이들 gRNA의 세포독성은 미토콘드리아 테트라졸륨 분석에 의해 평가되었다. 모든 gRNA는 배양물 상등액 내 HBsAg 또는 HBeAg 생산을 현저히 감소시킬 수 있었으며, 이는 gRNA가 맞서는 영역에 따라 좌우되었다. 이중 gRNA는 모두 유전형 A-D의 HBV에 대해 HBsAg 및/또는 HBeAg 생산을 효율적으로 억제하였으며, HBsAG 및/또는 HBeAg 생산 저해에 있어 이중 gRNAdml 효능은, 단일 gRNA를 단독으로 사용한 것에 비하여 현저히 증가되었다. 추가로, PCR 직접 시퀀싱에 의해, 출원인은 이들 이중 gRNA가 gRNA를 사용한 두 개의 절단 부위 사이의 단편을 제거함으로써 HBV 발현 주형을 특이적으로 파괴할 수 있었음을 확인하였다. 가장 중요하게는, gRNA-5 및 gRNA-12 조합은 HBsAg 및/또는 HBeAg 생산을 효율적으로 저해할 수 있었을 뿐 아니라, HepAD38 세포 내에서 cccDNA 저장소를 파괴할 수 있었다.
Karimova 등 (문헌 [Sci Rep. 2015 Sep 3;5:13734. doi: 10.1038/srep13734])은 Cas9 닉카제에 의한 특이적이고 효과적인 절단에 대해 표적된 HBV 게놈의 S 및 X 영역에서 교차-유전형 보존된 HBV 서열을 확인하였다. 이러한 시도는 리포터 세포주에서 에피좀성 cccDNA 및 염색체로 통합된 HBV 표적 부위 뿐만 아니라, 만성적으로 및 신규 감염된 간암 세포주 내 HBV 복제를 방해하였다.
해당 분야의 숙련자는 본 발명의 CRISPR Cas 시스템을 이용한 HBV 표적화를 위해 상기 연구, 예를 들어 Lin 등 (Mol Ther Nucleic Acids. 2014 Aug 19;3:e186. doi: 10.1038/mtna.2014.38), Dong 등 (Antiviral Res. 2015 Jun;118:110-7. doi: 10.1016/j.antiviral.2015.03.015. Epub 2015 Apr 3), Liu 등 (J Gen Virol. 2015 Aug;96(8):2252-61. doi: 10.1099/vir.0.000159. Epub 2015 Apr 22), Wang 등 (World J Gastroenterol. 2015 Aug 28;21(32):9554-65. doi: 10.3748/wjg.v21.i32.9554) 및 Karimova 등 (Sci Rep. 2015 Sep 3;5:13734. doi: 10.1038/srep13734)의 상기 연구를 이용할 수 있다.
본 발명은 또한 병원균, 예를 들어 박테리아, 균류 및 기생 병원균을 처리하는 데 적용될 수 있다. 대부분의 연구 노력은 새로운 항생제의 개발에 집중하며, 일단 개발되면, 그럼에도 불구하고 이는 약물 저항성의 동일한 문제의 대상이 될 것이다. 본 발명은 그러한 어려움들을 극복하는 신규 CRISPR-기반 대안을 제공한다. 나아가, 기존의 항생제와 달리, CRISPR-기반 치료는 병원균 특이적으로 제조될 수 있어서, 유익한 박테리아는 회피하면서 표적 병원균의 박테리아 세포 사멸을 유도한다.
Jiang외 다수(문헌["RNA-guided editing of bacterial genomes using CRISPR-Cas systems", Nature Biotechnology vol. 31, p. 233-9, March 2013])는, CRISPR-Cas9 시스템을 사용하여 S. 뉴모니아에 및 에스케리키아 콜라이를 돌연변이 또는 사멸시킨다. 정확한 돌연변이를 게놈 내로 도입한 이 작업은 돌연변이되지 않은 세포를 사멸시키기 위하여 표적화된 게놈 부위에서의 이중-RNA:Cas9-유도된 절단에 의존하였으며, 선택가능한 마커 또는 대항-선택 시스템에 대한 필요를 피하였다. CRISPR 시스템은 항생제 저항성을 역전하고, 균주들 간의 저항성의 전달을 제거하는 데 사용되었다. Bickard외 다수는, 독성 유전자를 표적화하도록 재프로그램화된 Cas9가 독성인 S. 아우레우스(S. aureus)를 사멸시키지만, 비독성 S. 아우레우스는 사멸시키지 않았음을 나타내었다. 항생제 저항성 유전자를 표적화하는 뉴클레아제의 재프로그램화는, 항생제 저항성 유전자를 품은 스태필로코커스 플라스미드를 파괴하고, 플라스미드-유래 저항성 유전자의 확산에 대해 면역화되었다. (문헌[Bikard et al., “Exploiting CRISPR-Cas nucleases to produce sequence-specific antimicrobials,” Nature Biotechnology vol. 32, 1146-1150, doi:10.1038/nbt.3043, 2014년 10월 5일 온라인 발행] 참조) Bikard는 CRISPR-Cas9 항균제가 마우스 피부 콜로니화 모델에서 S. 아우레우스를 사멸시키도록 생체내에서 작용함을 나타내었다. 유사하게, Yosef외 다수는 CRISPR 시스템을 사용하여 β-락탐 항생제에 대한 저항성을 수여하는 효소를 인코딩하는 유전자를 표적화하였다(문헌[Yousef et al., "Temperate and lytic bacteriophages programmed to sensitize and kill antibiotic-resistant bacteria", Proc. Natl. Acad. Sci. USA, vol. 112, p. 7267-7272, doi: 10.1073/pnas.1500107112, 2015년 5월 18일 온라인 발행] 참조).
CRISPR 시스템은 기타 다른 유전학적 접근에 대해 저항성인 기생충의 게놈을 편집하는 데 사용될 수 있다. 예를 들어, CRISPR-Cas9 시스템은 플라스모듐 요엘리(Plasmodium yoelii) 게놈 내로 이중-가닥 파손을 도입하는 것을 나타내었다(문헌[Zhang et al., "Efficient Editing of Malaria Parasite Genome Using the CRISPR/Cas9 System", mBio. vol. 5, e01414-14, Jul-Aug 2014] 참조). Ghorbal외 다수(문헌["Genome editing in the human malaria parasite Plasmodium falciparumusing the CRISPR-Cas9 system", Nature Biotechnology, vol. 32, p. 819-821, doi: 10.1038/nbt.2925, 2014년 6월 1일 온라인 발행])는, 각각 유전자 침묵화 및 아르테미시닌(artemisinin)에 대해 최근 알려진 저항성 추정적 역할을 갖는 2 개의 유전자 orc1kelch13의 서열을 변형시켰다. 적절한 부위에서 변경된 기생충은 변형에 대한 직접 선택은 없음에도 불구하고 매우 높은 효율로 회수되어, 중립성 또는 심지어는 유해한 돌연변이가 이 시스템을 사용하여 생성될 수 있음을 나타낸다. CRISPR-Cas9는 또한 톡소플라즈마 곤디(Toxoplasma gondii)를 포함한 기타 다른 병원균성 기생충의 게놈을 변형시키는 데 사용된다(문헌[Shen et al., "Efficient gene disruption in diverse strains of Toxoplasma gondii using CRISPR/CAS9", mBio vol. 5:e01114-14, 2014]; 및 [Sidik et al., "Efficient Genome Engineering of Toxoplasma gondii Using CRISPR/Cas9", PLoS One vol. 9, e100450, doi: 10.1371/journal.pone.0100450, 2014년 6월 27일 온라인 발행] 참조).
Vyas외 다수(문헌["A Candida albicans CRISPR system permits genetic engineering of essential genes and gene families,” Science Advances, vol. 1, e1500248, DOI: 10.1126/sciadv.1500248, April 3, 2015])는, CRISPR 시스템을 이용하여 C. 알비칸스(C. albicans)에서의 유전적 조작에 대한 오랜 장애를 극복하였으며, 몇몇 상이한 유전자의 2 개의 복재물 모두를 단일 실험에서 효율적으로 돌연변이시켰다. 몇몇 메카니즘이 약물 저항성에 기여하는 유기체서, Vyas는 부모의 임상적 분리물 Can90에 의해 나타나는 플루코나졸 또는 시클로헥시미드에 대한 초저항성을 더 이상 나타내지 않는 동형접합성 이중 돌연변이체를 생산하였다. Vyas는 또한 조건적 대립형질을 형성함으로써 C. 알비칸스의 필수 유전자에서의 동형접합성 기능 손실 돌연변이를 수득하였다. 리보좀 RNA 가공에 대해 요구되는 DCR1의 널 대립형질은 저온에서 치명적이지만 고온에서는 생존성이다. Vyas는 논센스 돌연변이를 도입하고, 16℃에서 성장하는 데 실패한 dcr1/dcr1 돌연변이체를 분리한 수복 주형을 사용하였다.
유전적 또는 후생적 양태를 갖는 질병의 치료
본 발명의 CRISPR-Cas 시스템은 TALEN 및 ZFN을 이용하여 제한된 성공으로 이전에 시도되었고, Cas9 시스템에 대한 잠재적인 표적으로서 확인된 유전적 돌연변이를 수정하는데 사용될 수 있으며, 유전자 치료법으로 질병을 치료적으로 다루기 위하여 유전자좌를 표적하기 위해 Cas9 시스템을 사용하는 방법을 설명하는 Editas Medicine의 공개된 출원에서와 같으며, Gluckmann 등의 WO 2015/048577호 CRISPR-RELATED METHODS AND COMPOSITIONS; Glucksmann 등의 WO 2015/070083호 CRISPR-RELATED METHODS AND COMPOSITIONS WITH GOVERNING gRNAS를 포함한다.
연구자들은 유전자 치료를 광범위한 질병을 치료하는데 사용할 수 있는지의 여부를 숙고하고 있다. Cpf1 이펙터 단백질을 기반으로 한 본 발명의 CRISPR 시스템은 추가의 예시된 표적된 영역 및 하기 전달 방법들에 제한되지만 이들을 포함하는, 그러한 치료적 이용을 고려한다. 본 시스템을 이용하여 유용하게 치료될 수 있는 증상 또는 질병의 일부 예는 본 명세서에 포함된 유전자 및 참고문헌의 예에 포함되고, 또한 그러한 증상들과 현재 연관된 것들도 또한 거기 제공된다. 예시된 유전자 및 증상은 빠짐없이 완전한 것은 아니다.
순환계 질병 치료
본 발명은 또한 본 명세서에 설명된 신규 CRISPR-Cas 시스템, 구체적으로 CRISPR 이펙터 단백질 시스템을 혈액 또는 조혈 줄기 세포로 전달하는 것을 고려한다. Wahlgren 등의 혈장 엑소좀 (문헌 [Nucleic Acids Research, 2012, Vol. 40, No. 17 e130])은 이전에 설명되었으며, CRISPR Cas 시스템을 혈액으로 전달하는데 사용될 수 있다. 본 발명의 핵산-표적화 시스템은 지중해빈혈 및 겸상 세포 질병과 같은 이상헤모글로빈증의 치료를 또한 고려한다. 예를 들어, 본 발명의 CRISPR Cas 시스템에 의해 표적될 수 있는 잠재적 표적에 대한, 국제 특허 공개 WO 2013/126794호 참조.
Drakopoulou의 문헌 ["Review Article, The Ongoing Challenge of Hematopoietic Stem Cell-Based Gene Therapy for β-Thalassemia," Stem Cells International, Volume 2011, Article ID 987980, 10 pages, doi:10.4061/2011/987980]은 전체를 명시된 것 같은 그가 언급하는 문헌들과 함께 본 명세서에 참고문헌으로 통합되며, 이는 β-글로빈 또는 γ-글로빈에 대한 유전자를 전달하는 렌티바이러스를 이용하여 HSC를 변형시키는 것을 논의한다. 렌티바이러스 이용에 대조적으로, 해당 분야의 지식 및 본 개시 내용에서의 교시를 이용하여, 숙련자는 β-지중해빈혈에 대하여 돌연변이를 표적화하고 수정하는 CRISPR-Cas 시스템을 이용하여 HSC를 수정할 수 있고 (예를 들어, β-글로빈 또는 γ-글로빈, 유리하게는 비-겸상적혈구화 β-글로빈 또는 γ-글로빈에 대한 코딩 서열을 전달하는 적합한 HDR 주형을 이용); 구체적으로 가이드 RNA는 β-지중해빈혈을 일으키는 돌연변이를 표적할 수 있고, HDR은 β-글로빈 또는 γ-글로빈의 적절한 표현에 대한 코딩을 제공할 수 있다. 돌연변이-및-Cas 단백질 함유 입자를 표적화하는 가이드 RNA는 돌연변이를 운반하는 HSC와 접촉된다. 입자는 또한 적합한 HDR 주형을 함유하여 β-글로빈 또는 γ-글로빈의 적절한 발현을 위해 돌연변이를 수정할 수 있거나; 또는 HSC는 HDR 주형을 함유 또는 전달하는 제2 입자 또는 벡터와 접촉될 수 있다. 그렇게 접촉된 세포는 투여될 수 있고; 선택적으로 처리/확장될 수 있다; Cartier 참조. 이러한 면에서, 문헌 [Cavazzana, "Outcomes of Gene Therapy for β-Thalassemia Major via Transplantation of Autologous Hematopoietic Stem Cells Transduced Ex Vivo with a Lentiviral βA-T87Q-globin Vector." tif2014.org/abstractFiles/Jean%20Antoine%20Ribeil_Abstract.pdf; Cavazzana-Calvo, "Transfusion independence and HMGA2 activation after gene therapy of human β-thalassaemia", Nature 467, 318-322 (16 September 2010) doi:10.1038/nature09328; Nienhuis, "Development of Gene Therapy for Thalassemia, Cold Spring Harbor Perspectives in Medicine, doi: 10.1101/cshperspect.a011833 (2012), LentiGlobin BB305, a lentiviral vector containing an engineered β-globin gene (βA-T87Q); 및 Xie et al., "Seamless gene correction of β-thalassaemia mutations in patient-specific iPSCs using CRISPR/Cas9 and piggyback" Genome Research gr.173427.114 (2014) http://www.genome.org/cgi/doi/10.1101/gr.173427.114 (Cold Spring Harbor Laboratory Press)]이 언급되며; 이는 인간 β-지중해빈혈을 포함하는 Cavazzana 연구의 주제 및 Xie 연구의 주제로, 이들 모두는 그 안에서 언급된 모든 문헌 또는 그와 연관된 문헌 모두와 함께 본 명세서에 참고문헌으로 통합된다. 본 발명에서, HDR 주형은 HSC가 조작된 β-글로빈 유전자 (예를 들어, βA-T87Q), 또는 Xie에서와 같이 β-글로빈을 발현하도록 제공될 수 있다.
Xu 등 (문헌 [Sci Rep. 2015 Jul 9;5:12065. doi: 10.1038/srep12065])은 TALEN 및 CRISPR-Cas9를 설계하여 글로빈 유전자 내에서 인트론2 돌연변이 부위인 IVS2-654를 직접 표적한다. Xu 등은 IVS2-654 유전자좌에서 TALEN 및 CRISPR-Cas9를 이용하여 이중-가닥 파손 (DSB)의 상이한 빈도를 관찰하였으며, TALEN은 돼지Bac 트랜스포손 공여자와 조합된 경우 CRISPR-Cas9에 비교하여 더욱 높은 상동성 유전자 표적화 효율을 매개하였다. 추가적으로, 더욱 명백한 표적외 이벤트는 TALEN에 비하여 CRISPR-Cas9의 경우에 관찰되었다. 최종적으로, TALEN-수정된 iPSC 클론이 OP9 공동-배양 시스템을 이용하여 적혈모세포 분화를 위해 선택되었고, 미수정된 세포 외에 HBB의 상대적으로 더욱 높은 전사를 검출하였다.
Song 등(문헌 [Stem Cells Dev. 2015 May 1;24(9):1053-65. doi: 10.1089/scd.2014.0347. Epub 2015 Feb 5])은 CRISPR/Cas9를 사용하여 β-Thal iPSC를 수정하였고; 인간 배아 줄기 세포 (hESS)가 표적외 효과는 보이지 않음과 같이 유전자-수정된 세포는 정상 핵형 및 전체 다능성을 나타낸다. 그 다음, Song 등은 유전자-수정된 β-Thal iPSC의 분화 효율을 평가하였다. Song 등은 조혈성 분화 동안, 유전자-수정된 β-Thal iPSC가 증가된 배양체 비율 및 각종 조혈성 선조 세포 퍼센트를 나타내었음을 발견하였다. 더욱 중요하게는, 유전자-수정된 β-Thal iPSC 계통이 HBB 발현을 복구하고, 수정되지 않은 기에 비하여 반응성 산소 종을 감소시켰다. Song 등의 연구는 β-Thal iPSC의 조혈성 분화가, CRISPR-Cas9 시스템에 의해 일단 수정되면, 크게 개선됨을 제안하였다. 여기 설명된 CRISPR-Cas 시스템, 예를 들어 Cpf1 이펙터 단백질을 포함하는 시스템을 활용하여 유사한 방법들이 수행될 수 있다.
겸상 적혈구성 빈혈은 적혈 세포가 낫-모양이 되는 상염색체 열성 유전 질병이다. 이는 β-글로빈 유전자에서 염색체 11의 단완에 위치하는 단일 염기 치환에 의해 생성한다. 결과로서, 발린은 겸상 헤모글로빈 (HbS)의 생산을 발생시키는 글루탐산 대신 발린이 생산된다. 이는 왜곡된 형태의 적혈구의 형성을 야기한다. 비정상적인 모양에 의해, 작은 혈관이 차단되어, 뼈, 비장 및 피부 조직에 심각한 손상을 발생시킨다. 이는 통증의 에피소드, 빈번한 감염 및 손-발 증후군 또는 심지어는 다수 기관 부전을 이끌어낼 수 있다. 왜곡된 적혈구는 또한 용혈에 더 민감하여, 심각한 빈혈증을 이끌어낸다. β-지중해빈혈의 경우에서와 같이, 겸상 적혈구 빈혈증은 CRISPR-Cas 시스템으로 HSC를 변형시켜 편집될 수 있다. 시스템은 이의 DNA를 절단한 후 이를 자체 수복하도록 하여 세포의 게놈의 특이적 편집을 가능하게 한다. Cas 단백질은 돌연변이 점으로 RNA 가이드에 의해 삽입되고 유도된 후 이 지점에서 DNA를 절단한다. 동시에, 건강한 버전의 서열이 삽입된다. 이 서열은 세포 자신의 수복 시스템에 의해 사용되어 유도된 절단을 고친다. 이 방식에서, CRISPR-Cas는 이전에 수득된 줄기 세포에서 돌연변이의 편집을 가능하게 한다. 당 분야의 지식 및 이 내용에서의 기재를 이용하여, 숙련자는 (예를 들어, β-글로빈, 유리하게는 비-겸상 β-글로빈에 대한 코딩 서열을 전달하는 적합한 HDR 주형을 가지고) 돌연변이를 표적화하고 편집하는 CRISPR-Cas 시스템을 사용하여 겸상 적혈구 빈혈증에 관한 HSC를 편집할 수 있으며; 특히, 가이드 RNA는 겸상 세포 빈혈증을 발생시키는 돌연변이를 표적화할 수 있고, HDR은 β-글로빈의 적절한 발현에 대한 코딩을 제공할 수 있다. 돌연변이-및-Cas 단백질 함유 입자를 표적화하는 가이드 RNA는 돌연변이를 운반하는 HSC와 접촉된다. 입자는 또한 적합한 HDR 주형을 함유할 수 있어서 β-글로빈의 적절한 발현을 위한 돌연변이를 수정할 수 있거나; HSC는 HDR 주형을 함유 또는 전달하는 제2 입자 또는 벡터와 접촉될 수 있다. 이렇게 접촉된 세포는 투여될 수 있으며; 선택적으로 처리/확장될 수 있다; Cartier 참조. HDR 주형은 HSC가 조작된 β-글로빈 유전자 (예를 들어, βA-T87Q), 또는 Xie에서와 같이 β-글로빈을 발현하도록 제공할 수 있다.
자세히 설명되는 바와 같이, 이것이 인용하는 문헌과 함께 본 명세서에 참고로서 통합된 Williams의 문헌 ["Broadening the Indications for Hematopoietic Stem Cell Genetic Therapies," Cell Stem Cell 13:263-264 (2013)]은, 신경 탈수초화를 야기하는, 리소솜 축적 질환, 이염성 백질 이영양증 질병 (MLD), 아릴술파타제 A (ARSA)의 결핍에 의해 야기되는 유전 질병을 갖는 환자로부터의 HSC/P 세포 내로의 렌티바이러스-매개 유전자의 이동; 및 위스코트-알드리치 증후군 (WAS)을 갖는 환자 (혈액 세포 계통에서의 세포골격 기능을 조절하여 회귀성 감염, 자가면역 증상 및 과도한 출혈 및 백혈병과 림프종의 증가된 위험을 초래하는 비정상적으로 작고 기능부전인 혈소판을 갖는 혈소판감소증에 걸리는, 결함있는 WAS 단백질, 작은 GTPase CDC42의 이펙터를 갖는 환자)의 HSC로의 렌티바이러스-매개 유전자 이동을 보고한다. 렌티바이러스의 사용과 달리, 당 분야에서의 지식 및 본원 상세한 설명에서의 개시를 가지고, 숙련자는 (예를 들어, ARSA에 대한 코딩 서열을 전달하는 적절한 HDR 주형으로) 돌연변이 (아실술파타제 A (ARSA)의 결핍)를 표적으로 하고 편집하는 CRISPR-Cas 시스템을 사용하여 MLD (아실술파타제 A (ARSA)의 결핍)에 관하여 HSC를 편집할 수 있다; 특히, 가이드 RNA는 MLD (결핍성 ARSA)를 일으키는 돌연변이를 표적할 수 있고, HDR은 ARSA의 적절한 발현을 위한 코딩을 제공할 수 있다. 돌연변이-및-Cas 단백질 함유 입자를 표적화하는 가이드 RNA는 돌연변이를 운반하는 HSC와 접촉된다. 입자는 또한 ARSA의 적절한 발현을 위해 돌연변이를 편집하는데 충분한 HDR 주형을 함유할 수 있거나; HSC는 HDR 주형을 함유 또는 전달하는 제2 입자 또는 벡터와 접촉될 수 있다. 그렇게 접촉된 세포는 투여될 수 있고; 선택적으로 처리/확장될 수 있다; Cartier 참조. 렌티바이러스의 사용과 달리, 당 분야에서의 지식 및 본원 상세한 설명에서의 개시를 가지고, 숙련자는 (예를 들어, WAS 단백질에 대한 코딩 서열을 전달하는 적절한 HDR 주형으로) 돌연변이(WAS 단백질의 결핍)를 표적으로 하고 편집하는 CRISPR-Cas 시스템을 사용하여 WAS에 관하여 HSC를 편집할 수 있으며; 특히, 가이드 RNA는 WAS(결핍성 WAS 단백질)를 일으키는 돌연변이를 표적할 수 있고, HDR은 WAS 단백질의 적당한 발현을 위한 코딩을 제공할 수 있다. 돌연변이-및-Cpf1 단백질 함유 입자를 표적화하는 가이드 RNA는 돌연변이를 운반하는 HSC와 접촉된다. 입자는 또한 WAS 단백질의 적절한 발현을 위해 돌연변이를 편집하는데 충분한 HDR 주형을 함유할 수 있거나; HSC는 HDR 주형을 함유 또는 전달하는 제2 입자 또는 벡터와 접촉될 수 있다. 그렇게 접촉된 세포는 투여될 수 있고; 선택적으로 처리/확장될 수 있다; Cartier 참조.
자세히 설명되는 바와 같이, 이것이 인용하는 문헌과 함께 본 명세서에 참고로서 통합된 Watts의 문헌 ["Hematopoietic Stem Cell Expansion and Gene Therapy" Cytotherapy 13(10):1164-1171. doi:10.3109/14653249.2011.620748 (2011)]은 혈액학적 질환, HIV/AIDS를 포함하는 면역결핍, 및 SCID-X1, ADA-SCID, β-지중해빈혈, X-관련 CGD, 위스코트-알드리치 증후군, 판코니 빈혈증, 부신백질이영양증 (ALD), 및 이염성 백질 이영양증 (MLD)을 포함하는, 리소솜 축적병과 같은 그외 유전 장애를 포함하는 많은 장애에 대한 매우 매력적인 치료 옵션으로서 조혈 줄기 세포 (HSC) 유전자 치료, 예를 들어, 바이러스-매개 조혈 줄기 세포 (HSC) 유전자 치료법을 논의한다.
Cellectis로 양도된 미국 특허 공개 제20110225664호, 제20110091441호, 제20100229252호, 제20090271881호 및 제20090222937호는 CREI 변이체에 관한 것으로, 여기서 2 개의 I-CreI 단량체 중 적어도 하나는 적어도 2 개의 치환을 가지고 있으며, LAGLIDADG 코어 도메인의 2 개의 작용성 서브도메인 각각에서의 하나는 I-CreI의 위치 26 내지 40 및 44 내지 77에 각각 위치하며, 상기 변이체는 공동 사이토카인 수용체 감마 사슬 유전자 또는 감마 C 유전자로도 명명된 인간 인터류킨-2 수용체 감마 사슬(IL2RG) 유전자으로부터 DNA 표적 서열을 절단할 수 있다. 표적 서열 미국 특허 공개 제20110225664호, 제20110091441호, 제20100229252호, 제20090271881호 및 제20090222937호에서 확인된 표적 서열이 본 발명의 핵산-표적화 시스템에서 사용될 수 있다.
중증 복합형 면역 결핍증 (SCID)은 림프구 B에서의 작용성 결함과 항상 관련되는 림프구 T 성숙에서의 결함으로부터 야기한다 (문헌 [Cavazzana-Calvo et al., Annu. Rev. Med., 2005, 56, 585-602; Fischer et al., Immunol. Rev., 2005, 203, 98-109]). 전체 발생은 75 000명의 출생 중 1명으로 평가된다. 치료되지 않은 SCID를 갖는 환자는 다수의 기회적 미생물 감염이 걸릴수 있으며, 일반적으로 1년 이후 생존하지 않는다. SCID는 가족 기증자로부터 동종 이계 조혈 줄기 세포 이송에 의해 치료될 수 있다. 기증자와의 조직적합성은 광범위하게 변할 수 있다. SCID 형태 중 하나인 아데노신 디아미나아제(ADA) 결핍의 경우, 환자는 재조합 아데노신 데아미나아제 효소의 주입에 의해 치료될 수 있다.
ADA 유전자가 SCID 환자에서 돌연변이 된 것으로 보여진 이후로 (문헌 [Giblett et al., Lancet, 1972, 2, 1067-1069]), SCID와 관련된 여러 다른 유전자가 확인되었다 (문헌 [Cavazzana-Calvo et al., Annu. Rev. Med., 2005, 56, 585-602; Fischer et al., Immunol. Rev., 2005, 203, 98-109]). SCID에 대한 4 개의 주요 원인이 있다: (i) SCID의 가장 빈번한 형태인, SCID-X1 (X-관련 SCID 또는 X-SCID)은 IL2RG 유전자에서의 돌연변이에 의해 발생하며, 이는 성숙 T 림프구 및 NK 세포의 부재를 야기한다. IL2RG는 적어도 5 개 인터류킨 수용체 복합체의 공통 성분인 감마 C 단백질을 인코딩한다 (문헌 [Noguchi, et al., Cell, 1993, 73, 147-157]). 이들 수용체는 JAK3 키나아제를 통해 여러 표적을 활성화시키며 (문헌 [Macchi et al., Nature, 1995, 377, 65-68]), 불활성화는 감마 C 불활성화로서 동일한 증후군을 야기한다; (ii) ADA 유전자에서의 돌연변이는 퓨린 대사에서의 결함을 야기하며, 결국 B, T 및 NK 세포의 유사 부재를 야기한다; (iii) V(D)J 재조합은 면역글로불린 및 T 림프구 수용체(TCR)의 성숙에서의 필수 단계이다. 이 공정에 관련된 3 개 유전자인 재조합 활성화 유전자 1 및 2(RAG1 및 RAG2) 및 아르테미스 (Artemis)에서의 돌연변이는 성숙 T 및 B 림프구의 부재를 야기한다; 및 (iv) 소수의 경우를 나타내고는 있지만 T 세포 특이 신호화에 관련된 CD45와 같은 다른 유전자에서의 돌연변이가 또한 보고되었다 (문헌 [Cavazzana-Calvo et al., Annu. Rev. Med., 2005, 56, 585-602; Fischer et al., Immunol. Rev., 2005, 203, 98-109]). 그들의 유전적 기반이 확인된 때로부터, 상이한 SCID 형태는 두가지 주요 이유로 인해 유전자 치료 시도에 대한 통상적인 예가 된다 (문헌 [Fischer et al., Immunol. Rev., 2005, 203, 98-109]). 첫번째로는, 모든 혈액 질환에서와 같이, 생체 외 치료가 고려될 수 있다. 조혈성 줄기 세포 (HSC)는 골수로부터 회복될 수 있으며, 그의 다능성 특성을 수 회의 세포 분열 동안 유지한다. 따라서, 이들은 시험관 내에서 처리될 수 있으며, 이후 환자에게 다시 주사될 수 있어서, 여기서 이들은 골수를 다시 채운다. 두번째로, 림프구의 성숙은 SCID 환자에서 손상되기 때문에, 편집된 세포는 선택적 장점을 갖는다. 따라서, 적은 수의 편집된 세포가 작용성 면역계를 회복할 수 있다. 이러한 가설은 (i) SCID 환자에서 돌연변이의 복귀와 연관된 면역 기능의 부분적 복구에 의해 (문헌 [Hirschhorn et al., Nat. Genet., 1996, 13, 290-295; Stephan et al., N. Engl. J. Med., 1996, 335, 1563-1567; Bousso et al., Proc. Natl., Acad. Sci. USA, 2000, 97, 274-278; Wada et al., Proc. Natl. Acad. Sci. USA, 2001, 98, 8697-8702; Nishikomori et al., Blood, 2004, 103, 4565-4572]), (ii) 조혈 세포에서 시험관 내 SCID-X1 결핍의 편집 (문헌 [Candotti et al., Blood, 1996, 87, 3097-3102; Cavazzana-Calvo et al., Blood, 1996, Blood, 88, 3901-3909; Taylor et al., Blood, 1996, 87, 3103-3107; Hacein-Bey et al., Blood, 1998, 92, 4090-4097]), (iii) 동물 모델에서 생체 내 SCID-X1 (문헌 [Soudais et al., Blood, 2000, 95, 3071-3077; Tsai et al., Blood, 2002, 100, 72-79]), JAK-3 (문헌 [Bunting et al., Nat. Med., 1998, 4, 58-64; Bunting et al., Hum. Gene Ther., 2000, 11, 2353-2364]) 및 RAG2 (문헌 [Yates et al., Blood, 2002, 100, 3942-3949]) 결핍의 편집, 및 (iv) 유전자 치료 임상 시험의 결과 (문헌 [Cavazzana-Calvo et al., Science, 2000, 288, 669-672; Aiuti et al., Nat. Med., 2002; 8, 423-425; Gaspar et al., Lancet, 2004, 364, 2181-2187])에 의해 여러번 입증되었다.
더 칠드런스 메디칼 센터 코포레이션(the Children's Medical Center Corporation) 및 더 프레지던트 앤드 펠로우즈 오브 하바드 칼리지(the President and Fellows of Harvard College)로 양도된 미국 특허 공개 제20110182867호는 RNAi 및 항체와 같은 BCL11a 발현 또는 활성의 억제제를 통해 조혈성 선조 세포에서의 태아 헤모글로빈 발현(HbF)을 조절하기 위한 방법 및 용도에 관한 것이다. BCL11a와 같은 미국 특허 공개 제20110182867호에 개시된 표적은 태아 헤모글로빈 발현을 조절하기 위한 본 발명의 CRISPR Cas 시스템에 의해 표적될 수 있다. 또한 추가 BCL11a 표적에 대해 Bauer 등 (문헌 [Science 11 October 2013: Vol. 342 no. 6155 pp. 253-257]) 및 Xu 등 (문헌 [Science 18 November 2011: Vol. 334 no. 6058 pp. 993-996])을 참조.
해당 분야의 지식 및 본 개시 내용의 교시를 이용하여, 숙련자는 유전적 조혈 장애, 예를 들어, β-지중해빈혈, 혈우병, 또는 유전적 리소좀 축적병에 대해 HSC를 편집할 수 있다.
뇌, 중추 신경 및 면역 체계 질병의 치료
본 발명은 또한 CRISPR-Cas 시스템의 뇌 또는 뉴런으로의 전달을 고려한다. 예를 들어, RNA 간섭 (RNAi)은 헌팅턴 병의 질병-원인 유전자인, HTT의 발현을 감소시킴으로써 이러한 장애에 대해 치료능을 제공하며 (예를 들어, 문헌 [McBride et al., Molecular Therapy vol. 19 no. 12 Dec. 2011, pp. 2152-2162] 참조), 따라서 출원인은 이것이 CRISPR-Cas 시스템에 사용 및/또는 조정될 수 있는 것으로 상정한다. CRISPR-Cas 시스템은 알고리즘을 이용하여 생성되어 안티센스 서열의 표적외 부위를 표적화하는 능을 감소시킬 수 있다. CRISPR-Cas 서열은 마우스, 붉은털 원숭이(rhesus) 또는 인간 헌팅턴의 엑손 52에서의 서열 중 하나를 표적화하고, AAV와 같은 바이러스 벡터 내에서 발현될 수 있다. 인간을 포함하여, 동물은 반구 당 약 3 회의 미세주입을 이용하여 주사될 수 있다 (총 6회 주사): 첫번째는 두측에서 (rostral) 전교련 (anterior commissure)에 대해 1 mm (12 ㎕)이고, 남은 두 주사 (각각, 12 ㎕ 및 10 ㎕)는 첫번째 주사에 대해 미측으로 3 및 6 mm 간격으로, 약 1 ㎕/분의 속도로 AAV 1e12 vg/ml를 이용하며, 바늘은 추가의 5분 동안 제자리에 두어 주입물이 바늘 끝으로부터 분산되는 것을 허용하였다.
DiFiglia 등 (문헌 [PNAS, October 23, 2007, vol. 104, no. 43, 17204-17209])은 Htt를 표적화하는 siRNA의 성인 선조체 내로의 단일 투여는 돌연변이체 Htt를 사일런스시키고, 뉴런성 병리학을 약화시키고, HD의 신속한-발병, 바이러스 유전자이식 마우스 모델에서 관찰된 비정상의 거동 표현형을 지연시킬 수 있음을 관찰하였다. DiFiglia는 10μM로, 2 ㎕의 Cy3-표지된 cc-siRNA-Htt 또는 컨쥬게이트되지 않은 siRNA-Htt를 마우스의 선조체 내로 주사하였다. Htt로 표적된 CRISPR Cas의 유사한 용량이 본 발명에서 인간의 경우 고려될 수 있으며, 예를 들어 Htt로 표적된 10 μM CRISPR Cas의 약 5-10 ml가 선조체 내로 주사될 수 있다.
또 다른 예에서, Boudreau 등 (문헌 [Molecular Therapy vol. 17 no. 6 June 2009])은 htt-특이적 RNAi 바이러스를 발현하는 재조합 AAV 혈청형 2/1 벡터 5 ㎕ (4×1012의 바이러스 게놈/ml)를 선조체 내로 주사한다. Htt로 표적된 CRISPR Cas의 유사한 용량이 본 발명에서 인간의 경우에 고려될 수 있으며, 예를 들어 약 10-20 ml의 (4×1012의 바이러스 게놈/ml) Htt로 표적된 CRISPR Cas가 선조체 내로 주사될 수 있다.
또 다른 예에서, HTT로 표적된 CRISPR Cas는 연속 투여될 수 있다 (예를 들어, 문헌 [Yu et al., Cell 150, 895-908, August 31, 2012] 참조). Yu 등은 삼투압 펌프를 이용하여 ss-siRNA 또는 인산염 완충 식염수 (PBS) (Sigma Aldrich)를 28일 동안 300 mg/일 전달하기 위하여 0.25 ml/시간 (Model 2004)를 전달하고, 0.5 ㎕/시간 (Model 2002)을 전달하도록 설계된 펌프를 사용하여 14 일 동안 75 mg/일의 양성 대조구 MOE ASO를 전달하는데 사용하였다. 펌프 (Durect Corporation)는 멸균 PBS 내에서 희석된 ss-siRNA 또는 MOE로 충전되었으며, 이후 임플랜테이션(implantation) 전 37℃에서 24 시간 또는 48 시간 (Model 2004) 인큐베이션하였다. 마우스들을 2.5% 이소플루오란으로 마취시키고, 두개골의 기부에 중간선 절단을 하였다. 정위법 가이드를 이용하여, 삽입관을 우측 뇌실 내로 임플랜트하고, Loctite 접착제로 고정시켰다. Alzet 삼투압 미니 펌프에 부착된 카테테르를 삽입관에 부착시키고, 펌프를 중간견갑골 영역에 피하에 위치시켰다. 절단은 5.0 나일론 봉합사를 이용하여 밀폐되었다. 유사한 용량의 Htt로 표적된 CRISPR Cas가 본 발명에서 인간의 경우에 대해 고려될 수 있으며, 예를 들어, 약 500 내지 1000 g/일의 Htt로 표적된 CRISPR Cas가 투여될 수 있다.
연속 주입의 또 다른 예에서, Stiles 등 (문헌 [Experimental Neurology 233 (2012) 463-471])은 티타늄 바늘 끝을 이용하여 뇌실질내 카테테르를 우측 피곡(putamen) 내로 임플랜트하였다. 카테테르를 SynchroMed® II 펌프 (미네소타주 미네아폴리스 소재, Medtronic Neurological)로 연결하여 배에 피하 임플랜트하였다. 6 μL/일의 인산염 완충 식염수 주입 7일 후, 펌프를 시험 물품으로 다시 충전하고 7일 동안 연속 전달을 위해 프로그램하였다. 약 2.3 내지 11.52 mg/d의 siRNA를 약 0.1에서 0.5 μL/분의 가변 주입 속도로 주입시켰다. 유사한 용량의 Htt로 표적된 CRISPR Cas가 본 발명에서 인간의 경우에 대해 고려될 수 있으며, 예를 들어, 약 20 내지 200 mg/일의, Htt로 표적된 CRISPR Cas가 투여될 수 있다. 또 다른 예에서, Sangamo에게 수여된 미국 특허 공개 20130253040은 또한 헌팅턴병을 치료하기 위해 TALES로부터 본 발명의 핵산-표적화 시스템에 대하여 적합화될 수 있다.
본 발명의 추가 양태는 라포라병과 연관된 것으로 확인된 EMP2A 및 EMP2B 유전자에서 결함을 편집하기 위해 CRISPR-Cas 시스템을 사용하는 것에 관한 것이다. 라포라병은 청소년기에 간질성 발작으로서 시작할 수 있는 진행성 마이오클로누스 간질을 특징으로 하는 상염색체 열성 질환이다. 질병의 몇몇 경우에서 아직 확인되지 않은 유전자의 돌연변이에 의해 초래될 수 있다. 질병은 발작, 근경련, 걷기 어려움, 치매, 및 결국 사망을 초래한다. 질병의 진행에 대해 효과적으로 주어지는 치료법은 현재 없다. 간질과 연관된 다른 유전 이상은 또한 CRISPR-Cas 시스템에 의해 표적화될 수 있으며 근본적인 유전학은 문헌 [Genetics of Epilepsy and Genetic Epilepsies, edited by Giuliano Avanzini, Jeffrey L. Noebels, Mariani Foundation Paediatric Neurology:20; 2009]에 추가로 기술된다.
T 세포 수용체(TCR) 유전자를 불활성화시키는 데 관련된, Sangamo BioSciences, Inc.로 양도된 미국 특허 공개 제20110158957호의 방법은 또한 본 발명의 CRISPR Cas 시스템으로 변형될 수 있다. 다른 예에서, Sangamo BioSciences, Inc.로 양도된 미국 특허 공개 제20100311124호 및 Cellectis로 양도된 미국 특허 공개 제20110225664호의 방법은 둘 다 글루타민 합성효소 유전자 발현 유전자를 불활성화시키는 데 관련된 것으로서, 또한 본 발명의 CRISPR Cas 시스템으로 변형될 수 있다.
청각 질병의 치료
본 발명은 또한 하나 또는 두 귀로 CRISPR-Cas 시스템을 전달하는 것을 고려한다.
연구자는 유전자 치료가 현재 난청 치료-즉, 달팽이관 이식을 원조하기 위해 사용될 수 있는지를 조사하였다. 난청은 종종 청각 뉴런으로 신호를 전달할 수 없는 손실되거나 손상된 모세포에 의해 발생된다. 이러한 경우에서, 달팽이관 이식은 신경 세포로 소리에 대한 반응 및 전기 신호 전달을 위해 사용될 수 있다. 그러나 더 적은 성장 인자가 손상된 모세포에 의해 방출되므로 달팽이관으로부터 이들 뉴런이 종종 악화되고 철회된다.
미국 특허 출원 제20120328580호는 예를 들어, 주사기, 예를 들어, 단일-용량 주사기를 사용하여 약학적 조성물을 귀(예를 들어, 귀 투여), 예컨대 달팽이관의 관내강(luminae)으로(예를 들어, 중앙계, Sc 정전계(vestibulae), 및 고실계) 주입을 기재한다. 예를 들어, 본원에 기재된 하나 이상의 화합물은 고막내 주입(예를 들어, 중이 내로), 및/또는 외이, 중이 및/또는 내이 내로 주입에 의해 투여될 수 있다. 이러한 방법은 예를 들어, 인간 귀로 스테로이드 및 항체의 투여를 위해 당 분야에서 관례적으로 사용된다. 주입은 예를 들어, 귀의 내창 또는 달팽이관 캡슐을 통해 실시될 수 있다. 다른 내이 투여 방법이 당 분야에서 공지되었다(예를 들어, 문헌 [Salt and Plontke, Drug Discovery Today, 10:1299-1306, 2005]).
다른 모드의 투여에서, 약학적 조성물은 카테터 또는 펌프를 통해 원 위치 투여될 수 있다. 카테테르 또는 펌프는, 예를 들어, 달팽이관 관내강 또는 귀의 내창 및/또는 결장의 루멘으로 약학적 조성물을 향하게 한다. 본원에서 기재된 하나 이상의 화합물을 귀, 예를 들어 인간 귀로 투여하기 위해 적합한 예시적인 약물 전달 장치 및 방법이 McKenna 등의 문헌(미국 공개 번호 제2006/0030837호) 및 Jacobsen 등의 문헌(미국 특허 제7,206,639호)에 기재되어 있다. 몇몇 구현예에서, 카테테르 또는 펌프는 수술 과정 동안, 예를 들어, 환자의 귀 (예를 들어, 외이, 중이, 및/또는 내이)에 위치될 수 있다. 몇몇 구현예에서, 카테테르 또는 펌프는 수술 과정 필요 없이, 예를 들어, 환자의 귀 (예를 들어, 외이, 중이, 및/또는 내이)에 위치될 수 있다.
대안적으로 또는 더하여, 본원에 기재된 하나 이상의 화합물이 달팽이관 이식 또는 외이에 착용하는 보청기와 같은 기계 장치와의 조합으로 투여될 수 있다. 본 발명과 함께 사용하기에 적합한 예시적인 달팽이관 이식은 Edge 등의 문헌에 의해 설명된다(미국 공개 번호 제2007/0093878호).
몇몇 구현예에서, 상기 기재된 투여 모드는 임의의 순서로 조합될 수 있으며 동시에 또는 배치될 수 있다.
대안적으로 또는 더하여, 본 발명은 예를 들어, CDER Data Standards Manual, 버전 넘버 004(fda.give/cder/dsm/DRG/drg00301.htm에서 이용 가능함)에 기재된 바와 같은, 임의의 미국 식품의약국(Food and Drug Administration) 승인 방법에 따라 투여될 수 있다.
일반적으로, 미국 특허 출원 제20120328580호에 기재된 세포 치료 방법이 실험관내 내이의 성숙 세포 유형(예를 들어, 모세포)에 대해 또는 이를 향해 세포의 완전한 부분적 분화를 촉진하기 위해 사용될 수 있다. 그런 다음 이러한 방법으로부터 야기된 세포는 이러한 치료가 필요한 환자에게 이식되거나 주입될 수 있다. 적합한 세포 유형을 확인하고 선별하기 위한 방법을 포함하는 이들 방법을 실시하기 위해 요구되는 세포 배양 방법, 선택된 세포의 완전한 또는 부분적 분화를 촉진하는 방법, 완전히 또는 부분적으로 분화된 세포 유형을 확인하기 위한 방법, 및 완전히 또는 부분적으로 분화된 세포를 이식하는 방법이 하기에 기재된다.
본 발명에서 사용하기에 적합한 세포는, 본원에 기재된 하나 이상의 화합물과 예를 들어 실험관내 접촉했을 때, 내이의 성숙 세포, 예를 들어, 모세포(예를 들어, 내부 및/또는 외부 모세포) 내로 완전하게 또는 부분적으로 분화딜 수 있는 세포를 포함하나, 이로 제한되지 않는다. 모세포로 분화될 수 있는 예시적인 세포는 줄기 세포(예를 들어, 내이 줄기 세포, 성인 줄기 세포, 골수 유래 줄기 세포, 배아 줄기 세포, 간엽 줄기 세포, 피부 줄기 세포, iPS 세포, 및 지방 유래 줄기 세포), 선조 세포(예를 들어, 내이 선조 세포), 지지 세포(예를 들어, 다이테르스 세포, 주상 세포, 내부 지골 세포, 덮개(tectal) 세포 및 헨젠 세포), 및/또는 생식 세포를 포함하나, 이로 제한되지 않는다. 내이 감각 세포의 대체를 위한 줄기 세포의 사용이 Li 등의 문헌(미국 공개 번호 2005/0287127호) 및 Li 등의 문헌(미국 특허 연번 11/953,797호)에 기재되어 있다. 내이 감각 세포의 대체를 위한 골수 유래 줄기 세포의 사용이 Edge 등의 PCT/US2007/084654호에 기재되어 있다. iPS 세포는 예를 들어, 문헌[Takahashi et al., Cell, Volume 131, Issue 5, Pages 861-872 (2007); Takahashi 및 Yamanaka, Cell 126, 663-76 (2006); Okita et al., Nature 448, 260-262 (2007); Yu, J. et al., Science 318(5858):1917-1920 (2007); Nakagawa et al., Nat. Biotechnol. 26:101-106 (2008); 및 Zaehres 및 Scholer, Cell 131(5):834-835 (2007)]에 기재되어 있다. 이러한 적합한 세포는 하나 이상의 조직 특이 유전자의 존재를 분석(예를 들어, 정성적 또는 정량적)하여 확인될 수 있다. 예를 들어, 유전자 발현은 하나 이상의 조직-특이적 유전자의 단백질 산물을 탐지하여 탐지될 수 있다. 단백질 탐지 기술은 적절한 항원에 대한 항체를 사용하는 염색 단백질(예를 들어, 세포 추출물 또는 전체 세포를 사용함)을 수반한다. 이러한 경우에서, 적절한 항원은 조직-특이적 유전자 발현의 단백질 산물이다. 원칙적으로 제1 항체(즉, 항원에 결합하는 항체)가 표지될 수 있지만, 제1 항체(예를 들어, 항-IgG)로 향하는 제2 항체를 사용하는 것이 좀더 일반적(및 시각화를 개선함)이다. 이러한 제2 항체는 형광 색소 또는 비색 반응을 위한 적절한 효소 또는 (전자 현미경을 위한) 금 비드 또는 비오틴-아비딘 시스템과 컨쥬게이트되어, 1차 항체의 위치가 인식될 수 있으므로 항원이 인식될 수 있다.
본 발명의 CRISPR Cas 분자는 미국 공개 출원, 제20110142917호로부터 변형된 조성물을 가지고, 외이로 약학적 조성물을 직접 적용하여 귀로 전달될 수 있다. 몇몇 구현예에서 약학적 조성물은 이도(ear canal)에 적용된다. 귀로의 전달은 또한 청각 또는 귀 전달으로서 언급될 수 있다.
몇몇 구현예에서 본 발명의 RNA 분자는 리포좀 또는 리포펙틴 제형 등으로 전달되며 당 분야의 숙련자에게 널리 공지된 방법에 의해 제조될 수 있다. 이러한 방법은, 예를 들어, 본원에 참조로서 통합된 미국 특허 제5,593,972호, 제5,589,466호, 및 제5,580,859호에 기재되어 있다.
특별히 포유류 세포로 siRNA의 증강되고 개선된 전달을 목표로 하는 전달 시스템이 개발되었으며(예를 들어, 문헌[Shen et al FEBS Let. 2003, 539:111-114; Xia et al., Nat. Biotech. 2002, 20:1006-1010; Reich et al., Mol. Vision. 2003, 9: 210-216; Sorensen et al., J. Mol. Biol. 2003, 327: 761-766; Lewis et al., Nat. Gen. 2002, 32: 107-108 및 Simeoni et al., NAR 2003, 31, 11: 2717-2724]을 참조), 본 발명에 적용될 수 있다. siRNA는 최근에 영장류에서의 유전자 발현의 저해에 성공적으로 사용되었으며(예를 들어. 문헌[Tolentino et al., Retina 24(4):660] 참조), 이는 또한 본 발명에 적용될 수 있다.
Qi 등은 본 발명의 핵산 표적화 시스템에 적용될 수 있는 신규한 단백질 전달 기술에 의해 온전한 내창을 통해 내이로 효율적인 siRNA 트랜스펙션을 위한 방법을 기재했다(예를 들어, 문헌[Qi et al., Gene Therapy (2013), 1-9]을 참조). 특히, 온전한 내창 투과를 통해 내부 및 외부 모세포, 팽대부릉(crista ampullaris), 난형낭반 및 구형낭반을 포함하는 내이의 세포 내로 Cy3-표지 siRNA를 트랜스펙션시킬 수 있는, TAT 이중 가닥 RNA-결합 도메인(TAT-DRBDs)이 다양한 내이 질병의 치료 및 청각 기능의 보존을 위한 생체내 이중 가닥 siRNA 전달에 성공적이었다. 10 mM RNA의 약 40㎕가 귀에 투여하기 위한용량으로서 고려될 수 있다.
Rejali 등의 문헌(Hear Res. 2007 Jun;228(1-2):180-7)에 따라, 달팽이관 이식이 나선 신경절 뉴런의 우수한 보존에 의해 개선될 수 있으며, 이는 이식에 의한 전기 자극의 표적이고 뇌 유래 신경영양성 인자(BDNF)가 실험적으로 청각을 잃은 귀에서 나선 신경절 생존을 증가시킴이 이전에 보여졌다. Rejali 등은 BDNF 유전자 삽입을 갖는 바이러스 벡터에 의해 형질도입된 섬유아세포의 코팅을 포함하는 달팽이관 이식 전극의변형된 설계를 시험했다. 이 유형의 생체외 유전자 이송을 완수하기 위해, Rejali 등은 BDNF 유전자 카세트 삽입을 갖는 아데노바이러스로 기니아피그 섬유아세포를 형질도입시키고, 이 세포들이 BDNF를 분비하는 것을 밝힌 후 BDNF-분비 세포를 아가로스 겔을 통해 달팽이관 이식 전극에 부착시키고 고실계에 전극을 이식했다. Rejali 등은 BDNF 발현 전극이 대조 전극과 비교했을 때 이식 48일 후에 달팽이관의 기저 회전에서 상당히 많은 나선 신경절 뉴런을 보존할 수 있었음을 밝혔으며 나선 신경절 뉴런 생존을 증강시키기 위해 생체외 유전자 이송과 달팽이관 이식 치료법을 조합하는 가능성을 밝혔다. 이러한 시스템은 귀로의 전달을 위한 본 발명의 핵산 표적화 시스템에 적용될 수 있다.
Mukherjea 등은 손상으로부터 OHC의 보호 및 청각 뇌 줄기 반응(ABRs)에서의 감소된 역치 시프트에 의해 입증되는 바와 같이, 짧은 간섭(si) RNA를 사용한 NOX3의 낙다운이 시스플라틴 이독성을 폐지하는 것을 기록했다(문헌 [Antioxidants & Redox Signaling, Volume 13, Number 5, 2010]). 상이한 용량의 siNOX3 (0.3, 0.6, 및 0.9 ㎍)이 래트에 투여되고 NOX3 발현이 실시간 RT-PCR로 평가됐다. 사용된 NOX3 siRNA의 가장 낮은 용량(0.3 ㎍)은 스크램블드 siRNA의 고막투과 투여 또는 비처리된 달팽이관과 비교했을 때 NOX3 mRNA의 임의의 저해를 보이지 않았다. 그러나, 고용량의 NOX3 siRNA (0.6 및 0.9 ㎍)의 투여는 대조 스크램블드 siRNA에 비하여 NOX3 발현을 감소시켰다. 이러한 시스템은 인간으로의 투여를 위해 약 2 mg 내지 약 4 mg 용량의 CRISPR Cas를 고막투과 투여하기 위한 본 발명의 CRISPR Cas 시스템에 적용될 수 있다.
Jung 등은 iRNA의 적용 후 소낭에서의 Hes5 수준이 감소하고 이러한 소낭에서의 다수의 모세포가 대조 치료 후보다 상당히 더 큰 것을 입증했다(문헌 [Molecular Therapy, vol. 21 no. 4, 834-841 apr. 2013]). 데이터는 siRNA 기술이 내이에서의 수복 및 재생을 유도하는데 유용할 수 있고 Notch 신호화 경로가 특이 유전자 발현 저해에 대한 잠재적으로 유용한 표적임을 제시한다. Jung 등은 8 ㎍의 Hes5 siRNA를 2 ㎕ 부피로 주입했으며, 이는 귀의 전정 상피에 대한 동결건조된 siRNA에 멸균된 일반 식염수를 첨가하여 제조되었다. 이러한 시스템은 인간으로의 투여를 위한 약 1 내지 약 30 mg 용량으로 CRISPR Cas을 귀의 전정 상피에 투여하기 위해 본 발명의 핵산 표적화 시스템에 적용될 수 있다.
안질환의 치료
본 발명은 또한 하나 또는 두 눈으로 CRISPR-Cas 시스템을 전달하는 것을 고려한다.
본 발명의 또 다른 양태에서, CRISPR-Cas 시스템은 문헌 [Genetic Diseases of the Eye, Second Edition, edited by Elias I. Traboulsi, Oxford University Press, 2012]에 추가 기재된 여러 유전적 돌연변이로부터 발생한 안구 결함을 편집하기 위해 사용될 수 있다.
눈으로의 투여에서, 렌티바이러스 벡터, 상세하게는 말 전염성 빈혈증 바이러스(EIAV)가 특히 바람직하다.
다른 구현예에서, 말 전염성 빈혈증 바이러스(EIAV)에 근거한 최소한의 비-영장류 렌티바이러스 벡터가 또한 특히 안구 유전자 치료에서 고려되었다(예를 들어, 문헌[Balagaan, J Gene Med 2006; 8:275-285, Published online 21 November 2005 in Wiley InterScience (www.interscience.wiley.com). DOI: 10.1002/jgm.845] 참조). 벡터는 표적 유전자의 발현을 구동하는 사이토메갈로 바이러스 (CMV) 프로모터를 갖는 것이 고려된다. 전방내, 망막하, 안내 및 유리체내 주입이 모두 고려된다(예를 들어, 문헌[Balagaan, J Gene Med 2006; 8:275-285, Published online 21 November 2005 in Wiley InterScience (www.interscience.wiley.com). DOI: 10.1002/jgm.845] 참조). 안내 주입은 수술 현미경의 도움으로 실행될 수 있다. 망막하 및 유리체내 주입에서, 눈은 온화한 손가락 압력에 의해 탈출될 수 있으며 기반부는 현미경용 유리 슬라이드 커버슬립으로 덮인 각막 상에 커플링 배지 용액을 떨어뜨리는 것으로 구성된 콘텍트 렌즈 시스템을 사용하여 시각화되었다. 망막하 주입에서, 5-㎕ 해밀턴 주사기에 고정된 10-mm 34-게이지 바늘의 끝부분이, 망막하 공간에서 바늘의 구멍이 보일 때까지, 우세한 적도 공막(equatorial sclera)을 통해 접선으로 후두극을 향해 직접 시각화 하에서 진전될 수 있다. 그런 다음, 2 ㎕의 벡터 상청액을 주입하여 우세한 수포성 망막 분리를 생성할 수 있으며, 따라서 이는 망막하 벡터 투여를 확인하는 것이다. 이러한 접근법은 RPE에 의해 흡수될 때까지, 일반적으로 48시간의 과정 내에 벡터 상청액이 망막하 공간에서 보유되도록 하는 자가-밀봉 공막절단을 창출한다. 이 과정은 하위 망막 분리를 생성하기 위해 하위 반구에서 반복될 수 있다. 이 기술은 벡터 현탁액으로 대략 70% 의 감각신경 망막 및 RPE의 노출을 야기한다. 유리체내 주입에서, 바늘 끝은 공막을 통해 각공막 경계 1 mm 뒤로 전진될 수 있으며 2 ㎕의 벡터 현탁액은 유리체강으로 주입된다. 전방내 주입에서, 바늘 끝은 각공막 경계 천자를 통해, 중앙 각막을 향해 진전될 수 있으며, 2 ㎕의 벡터 현탁액이 주입될 수 있다. 전방내 주입에서, 바늘 끝은 각공막 경계 천자를 통해, 중앙 각막을 향해 진전될 수 있으며, 2 ㎕의 벡터 현탁액이 주입될 수 있다. 이들 벡터는 1.0-1.4×1010 또는 1.0-1.4×109 형질도입 유닛(TU)/ml의 역가로 주입될 수 있다.
다른 구현예에서, 망 형태의 노인성 황반변성의 치료를 위한 망막하 주입을 통해 전달되는 혈관형성 억제 단백질 엔도스타틴 및 안지오스타틴을 발현하는 단백질 말 전염성 빈혈증 바이러스-기반 렌티바이러스 유전자 치료 벡터인 RetinoStat®이 또한 고려된다 (예를 들어, 문헌[Binley et al., HUMAN GENE THERAPY 23:980-991 (September 2012)] 참조). 이러한 벡터는 본 발명의 CRISPR-Cas 시스템을 위해 변형될 수 있다. 각각의 눈은 총 100 ㎕의 부피로 눈 당 1.1 x 105 형질도입 유닛(TU/eye)의 용량의 RetinoStat®으로 치료될 수 있다.
다른 구현예에서, E1-제거, 부분적 E3-제거, E4-제거 아데노바이러스 벡터가 눈으로의 전달을 위해 고려될 수 있다. 후기 혈관신생 노인성 황반변성 (AMD)을 갖는 28명의 환자에게 인간 안료 상피-유래 인자(AdPEDF.ll)를 발현하는 E1-제거, 부분적 E3-제거, E4-제거 아데노바이러스 벡터의 단일 초자체내 주입이 주어졌다(예를 들어, 문헌 [Campochiaro et al., Human Gene Therapy 17:167-176 (February 2006)] 참조). 106 내지 109.5 입자 유닛(PU) 범위의 용량이 조사되었으며 AdPEDF.ll에 관련된 심각한 부작용 및 용량-제한 독성이 없었다(예를 들어, 문헌[Campochiaro et al., Human Gene Therapy 17:167-176 (February 2006)]을 참조하라). 아데노바이러스 벡터-매개 안구 유전자 이송이 안구 장애의 치료를 위해 실행가능한 접근법을 나타낼 수 있으며 CRISPR Cas 시스템에 적용될 수 있다.
다른 구현예에서, RXi Pharmaceuticals의 sd-rxRNA® 시스템이 눈으로의 CRISPR Cas의 전달을 위해 사용되고 그리고/또는 조정될 수 있다. 이 시스템에서, 3 ㎍의 sd-rxRNA의 단일 유리체내 투여는 14일 동안 PPIB mRNA 수준의 서열-특이적 감소를 야기한다. sd-rxRNA® 시스템이 본 발명의 핵산-표적화 시스템에 적용될 수 있으며, 인간에게 투여된 약 3 내지 20 mg 용량의 CRISPR을 고려하는 것이다.
Millington-Ward 등은 RNAi 표적 부위 상의 변성 위치에서 뉴클레오티드 변경에 기인한 억제에 저항하는 RNA 간섭 (RNAi)-기반 로돕신 억제제 및 코돈-변형 로돕신 대체 유전자를 전달하기 위해 아데노-연관 바이러스 (AAV) 벡터를 기재한다 (문헌[Molecular Therapy, vol. 19 no. 4, 642-649 apr. 2011]). 6.0 x 108 vp 또는 1.8 x 1010 vp의 AAV의 주입이 Millington-Ward 등에 의해 눈으로 망막하 주입된다. Millington-Ward 등의 AAV 벡터는 본 발명의 CRISPR Cas 시스템에 적용될 수 있으며, 인간에게 약 2 x 1011내지 약 6 x 1013 vp 용량으로 투여되는 것을 고려한 것이다.
Dalkara 등은 또한 눈의 유리액으로 비-상해 주입 후에 망막 도처에 결함 유전자의 야생형 버전을 전달하는 AAV 벡터를 만들기 위해 생체내 유도 진화에 관한 것이다(문헌 [Sci Transl Med 5, 189ra76 (2013)]). Dalkara는 AAV1, 2, 4, 5, 6, 8, 및 9로부터 cap 유전자의 DNA 셔플링에 의해 작제된 칠량체 펩티드 디스플레이 라이브러리 및 AAV 라이브러리를 기재한다. CAG 또는 Rho 프로모터 하에서 GFP를 발현하는 rcAAV 라이브러리 및 rAAV 벡터는 패키징되었으며 디옥시리보뉴클레아제-저항 게놈 역가는 정량 PCR을 통해 수득된다. 라이브러리가 풀링되었으며, 두 라운드의 진화가 실행되었으며, 각각 초기 라이브러리 다양화 및 그 이후의 3 개의 생체내 선별 단계로 구성된다. 각각의 이러한 단계에서, P30 rho-GFP 마우스에게 약 1×1012 vg/ml의 게놈 역가를 갖는 2 ml의 이오딕사놀-정제된, 인산염-완충 식염수(PBS)-투석 라이브러리로 유리체내로 주입되었다. Dalkara 등의 AAV 벡터는 본 발명의 핵산-표적화 시스템에 적용될 수 있으며, 약 1 × 1015 내지 약 1 × 1016 vg/ml의 용량으로 인간에게 투여하는 것을 고려하는 것이다.
또 다른 구현예에서, 로돕신 유전자는 색소성 망막염 (RP)의 치료를 위해 표적화될 수 있으며, Sangamo BioSciences, Inc.로 양도된 미국 특허 공개 제20120204282호의 시스템은 본 발명의 CRISPR Cas 시스템에 따라 변형될 수 있다.
다른 구현예에서, 인간 로돕신 유전자로부터 표적 서열을 절단하는 방법에 대한, Cellectis로 양도된 미국 특허 공개 제20130183282호의 방법은 또한 본 발명의 핵산-표적화 시스템으로 변형될 수 있다.
Academia Sinica로 양도된 미국 특허 공개 제20130202678호는 눈에서 망막하 또는 유리체내 공간으로 Puf-A 유전자 (눈 조직의 망막 신경절 및 색소 세포에서 발현되고 독특한 항-세포사멸 활성을 나타냄)의 전달에 관하여 망막증 및 시력-위협 안과학적 장애를 치료하기 위한 방법에 관한 것이다. 특히, 바람직한 표적은 zgc:193933, prdm1a, spata2, tex10, rbb4, ddx3, zp2.2, Blimp-1 및 HtrA2이며, 이들 모두는 본 발명의 핵산-표적화 시스템에 의해 표적화될 수 있다.
Wu는 DNA 절단을 유도했을 때, 마우스에서 백내장을 일으키는 단일 염기쌍 돌연변이로 Cas9을 이끌어내는 가이드 RNA를 설계했다(Cell Stem Cell,13:659-62, 2013). 그런 다음, 다른 야생형 대립 형질 또는 올리고를 사용하여 돌연변이체 마우스에서 파손된 대립 형질의 서열을 고치고 백내장-발생 유전 결함을 고치는 접합체 수복 메커니즘이 주어졌다.
미국 특허 공개 제20120159653호는 황반변성(MD)과 연관된 세포, 동물 및 단백질을 유전적으로 변형시키기 위해 아연 핑거 뉴클레아제를 사용하는 것을 기재한다. 황반변성(MD)은 노인의 시각 장애의 일차 원인이나, 또한 유아기와 같이 어린 발명 연령을 갖는 스타르가르트 질병, 소르스비 기저부(Sorsby fundus), 및 치명적인 소아 신경병성 질병과 같은 소아 질병의 특정 증상이기도 하다. 황반변성은 망막으로의 손상 때문에 시계 중심의 시야 손실(망막황반)을 야기한다. 현재 존재하는 동물 모델은 인간에서 관찰된 바와 같은 질병의 주요 특징을 나타내지 않는다. MD와 연관된 단백질을 인코딩하는 돌연변이 유전자를 포함하는 가능한 동물 모델은 또한 매우 다양한 표현형을 생산하며, 이는 인간 질병 및 치료법 개발로 번역되어 문제가 생기게 한다.
미국 특허 공개 제20120159653호의 일 양태는 본 발명의 핵산-표적화 시스템에 적용될 수 있는 MD와 연관된 단백질을 인코딩하는 임의의 염색체 서열의 편집에 관한 것이다. MD와 연관된 단백질은 통상적으로 MD 장애에 대한 MD와 연관된 단백질의 실험적 연관성에 근거하여 선택된다. 예를 들어, MD와 연관된 단백질의 생산 비율 또는 순환 농도가 MD 장애가 결여된 집단에 비하여 MD 장애를 갖는 집단에서 상승하거나 저해될 수 있다. 단백질 수준에서의 분화는 웨스턴 블롯, 면역 조직화학적 염색, 효소 결합 면역 흡착 분석(ELISA), 및 질량 분석을 포함하는 프로테오믹 기술을 사용하여 평가될 수 있으나, 이로 제한되지 않는다. 대안적으로, MD와 연관된 단백질은 DNA 마이크로어레이 분석, 유전자 발현 (SAGE)의 연속 분석, 및 정량 실시간 중합효소 연쇄반응(Q-PCR)을 포함하는 게놈 기술을 사용하여 단백질을 인코딩하는 유전자의 유전자 발현 프로파일을 수득함으로써 확인될 수 있으나, 이로 제한되지 않는다.
비-제한적인 예로서, MD와 연관된 단백질은 하기 단백질을 포함하나, 이로 제한되지 않는다: (ABCA4) ATP-결합 카세트, 서브-패밀리 A (ABC1), 멤버 4 ACHM1 색맹 (간상체 적색맹) 1 ApoE 아포지단백질 E (ApoE) C1QTNF5 (CTRP5) C1q 및 종양 괴사 인자 관련 단백질 5 (C1QTNF5) C2 보체 성분 2 (C2) C3 보체 성분 (C3) CCL2 케모카인 (C-C 모티프) 리간드 2 (CCL2) CCR2 케모카인 (C-C 모티프) 수용체 2 (CCR2) CD36 분화 클러스터 36 CFB 보체 인자 B CFH 보체 인자 CFH H CFHR1 보체 인자 H-관련 1 CFHR3 보체 인자 H-관련3 CNGB3 환형 뉴클레오티드 게이트 채널 베타 3 CP 세룰로플라스민 (CP) CRP C 반응성 단백질 (CRP) CST3 시스타틴 C 또는 시스타틴 3 (CST3) CTSD 카텝신 D (CTSD) CX3CR1 케모카인 (C-X3-C 모티프) 수용체 1 ELOVL4 (매우 긴 지방산 4의 신장(Elongation of very long chain fatty acids 4)) ERCC6 (절제 수복 교차-상보(excision repair cross-complementing)) 설치류 수복 결핍, FBLN5 피불린-5 FBLN5 피불린 5 FBLN6 피불린 6 FSCN2 파신(fascin) (FSCN2) HMCN1 헤미센트린(Hemicentrin) 1 HMCN1 헤미센틴(hemicentin) 1 HTRA1 HtrA 세린 펩티다아제 1 (HTRA1) HTRA1 HtrA 세린 펩티다아제 1 IL-6 인터류킨 6 IL-8 인터류킨 8 LOC387715 가설 단백질 PLEKHA1 플레크스트린 상동성 도메인-함유 패밀리 A 멤버 1 (PLEKHA1) PROM1 프로미닌 1(PROM1 또는 CD133) PRPH2 페리페린-2 RPGR 색소성 망막염 GTPase 조절자 세르핀G1 세르핀 펩티다아제 저해제, 클레이드 G, 멤버 1 (C1-저해제) TCOF1 트리클 TIMP3 메탈로프로테이나아제 저해제 3 (TIMP3) TLR3 톨-유사 수용체 3.
염색체 서열이 편집된 MD와 연관된 단백질의 동일성은 편집될 수 있고 변화될 것이다. 바람직한 구현예에서, 염색체 서열이 편집된 MD와 연관된 단백질은 ATP-결합 카세트, ABCR 유전자에 의해 인코딩되는 서브-패밀리 A (ABC1) 멤버 4 단백질 (ABCA4), APOE 유전자에 의해 인코딩되는 아포지단백질 E 단백질 (APOE), CCL2 유전자에 의해 인코딩되는 케모카인 (C-C 모티프) 리간드 2 단백질 (CCL2), CCR2 케모카인 (C-C 모티프) 수용체 2 단백질 (CCR2), CP 유전자에 의해 인코딩되는 세룰로플라스민 단백질 (CP), CTSD 유전자에 의해 인코딩되는 카텝신 D 단백질 (CTSD), 또는 TIMP3 유전자에 의해 인코딩되는 메탈로프로테이나아제 저해제 3 단백질 (TIMP3)일 수 있다. 예시적인 구현예에서, 유전적으로 변형된 동물은 래트이며, MD 와 연관된 단백질을 인코딩하는 편집된 염색체 서열은 하기 것일 수 있다: (ABCA4) ATP 결합 카세트, NM_000350 서브-패밀리 A (ABC1), 멤버 4 APOE 아포지단백질 E NM_138828 (APOE) CCL2 케모카인 (C-C NM_031530 모티프) 리간드 2 (CCL2) CCR2 케모카인 (C-C NM_021866 모티프) 수용체 2 (CCR2) CP 세룰로플라스민 (CP) NM_012532 CTSD 카텝신 D (CTSD) NM_134334 TIMP3 메탈로프로테이나아제 NM_012886 저해제 3 (TIMP3). 동물 또는 세포는 MD와 연관된 단백질을 인코딩하는 1, 2, 3, 4, 5, 6, 7개 또는 그 이상의 방해된 염색체 서열을 포함할 수 있다.
편집되거나 통합된 염색체 서열은 MD와 연관된 변형된 단백질을 인코딩하기 위해 변형될 수 있다. MD-관련 염색체 서열에서의 여러 돌연변이는 MD와 연관되었다. MD와 연관된 염색체 서열에서의 돌연변이의 비-제한적인 예는, ABCR 단백질에서, E471K (즉, 위치 471의 글루타메이트가 리신으로 변화함), R1129L (즉, 위치 1129의 아르기닌이 류신으로 변화함), T1428M (즉, 위치 1428의 트레오닌이 메티오닌으로 변화함), R1517S (즉, 위치 1517의 아르기닌이 세린으로 변화함), I1562T (즉, 위치 1562의 이소류신이 트레오닌으로 변화함), 및 G1578R (즉, 위치 1578의 글리신이 아르기닌으로 변화함); CCR2 단백질에서, V64I (즉, 발린 위치 192 이소류신으로 변화함); CP 단백질에서, G969B (즉, 위치 969의 글리신이 아스파라긴 또는 아스파테이트로 변화함); TIMP3 단백질에서, S156C (즉, 위치 156의 세린이 시스테인으로 변화함), G166C (즉, 위치 166의 글리신이 시스테인으로 변화함), G167C (즉, 위치 167의 글리신이 시스테인으로 변화함), Y168C (즉, 위치 168의 티로신이 시스테인으로 변화함), S170C (즉, 위치 170의 세린이 시스테인으로 변화함), Y172C (즉, 위치 172의 티로신이 시스테인으로 변화함) 및 S181C (즉, 위치 181의 세린이 시스테인으로 변화함)을 포함하는, MD를 발생할 수 있는 것들을 포함한다. MD-연관 유전자 및 질환에서의 유전자 변이체의 다른 연관성이 당 분야에 공지되어 있다.
순환 및 근육 질병의 치료
본 발명은 본 명세서에 설명된 CRISPR-Cas 시스템, 예를 들어 Cpf1 이펙터 단백질 시스템을 심장에 전달하는 것을 또한 고려한다. 심장에서, 선호되는 유전자 이송을 보이는 심근 열대성 아데나-연관 바이러스(AAVM), 특히 AAVM41이 바람직하다(예를 들어, 문헌[Lin-Yanga et al., PNAS, March 10, 2009, vol. 106, no. 10]을 참조하라). 투여는 전신성 또는 국소적일 수 있다. 약 1-10 x 1014 용량의 벡터 게놈이 전신성 투여를 위해 고려된다. 또한, 예를 들어, 문헌[Eulalio et al. (2012) Nature 492: 376 및 Somasuntharam et al. (2013) Biomaterials 34: 7790]을 참고하라.
예를 들어, 미국 특허 공개 제20110023139호는 세포, 동물 및 심혈관 질병에 연관된 단백질을 유전적으로 변형시키기 위한 아연 핑거 뉴클레아제의 사용을 기재한다. 심혈관 질환은 일반적으로 고혈압, 심장마비, 심부전, 및 뇌졸중 및 TIA를 포함한다. 심혈관 질병에 관련된 임의의 염색체 서열 또는 심혈관 질병에 관련된 임의의 염색체 서열에 의해 인코딩된 단백질은 본 기재에서 기재된 방법에서 사용될 수 있다. 심혈관-관련 단백질은 통상적으로 심혈관 질병의 발병에 대한 심혈관-관련 단백질의 실험 연관성에 근거하여 선별된다. 예를 들어, 심혈관-관련 단백질의 생산 비율 또는 순환 농도는 심혈관 장애가 결여된 집단에 비하여 심혈관 장애를 갖는 집단에서 상승되거나 감소될 수 있다. 단백질 수준에서의 차이는 웨스턴 블롯, 면역 조직화학적 염색, 효소 결합 면역 흡착 분석 (ELISA), 및 질량 분석을 포함하는 프로테오믹스 기술을 사용하여 평가될 수 있으나, 이에 제한되지 않는다. 대안적으로, 심혈관-관련 단백질은 DNA 마이크로어레이 분석, 유전자 발현의 연속 분석(SAGE), 및 정량 실시간 폴리머라제 캐스케이드(Q-PCR)을 포함하는 게놈 기술을 사용하여 단백질을 인코딩하는 유전자의 유전자 발현 프로파일을 수득함으로써 식별될 수 있으나, 이에 제한되지 않는다.
간 및 신장 질병의 치료
본 발명은 본 명세서에서 설명된 CRISPR-Cas 시스템, 예를 들어 Cpf1 이펙터 단백질 시스템을 간 및/또는 신장으로의 전달을 또한 고려한다. 치료적 핵산의 세포 취득을 유도하기 전달 전략은 바이러스-기반, 지질-기반 또는 복합체-기반 전달과 같은 벡터 시스템 또는 물리력, 또는 나노캐리어를 포함한다. 적은 가능성의 임상 관련성을 갖는 초기 적용으로부터, 유체역학적 고압 주사를 이용하여 핵산이 체계적으로 신세포에 어드레스된 경우, 넓은 범위의 유전자 치료적 바이러스 및 비-바이러스 캐리어가 생체 내에서 상이한 동물 신장 질병 모델에서 전사 후 이벤트를 표적하도록 이미 적용된 바 있다 (문헌 [Csaba Revesz and Peter Hamar (2011). Delivery Methods to Target RNAs in the Kidney, Gene Therapy Applications, Prof. Chunsheng Kang (Ed.), ISBN: 978-953-307-541-9, InTech, http://www.intechopen.com/books/gene-therapy-applications/delivery-methods-to-target-rnas-inthe-kidney로부터 사용가능]). 신장으로의 전달 방법은 아라키돈산 대사의 12/15-리폭시게나아제 (12/15-LO) 경로를 표적화하는 작은 간섭 RNA (siRNA)의 생체 내 전달이 제1형 당뇨병의 스트렙토조토신 주사된 당뇨성 신경병증 (DN) 및 신손상을 개선할 수 있는지의 여부를 연구한, 문헌 ([Yuan et al. (Am J Physiol Renal Physiol 295: F605-F617, 2008])에 포함된 것들을 포함할 수 있다. 신장에서 더욱 큰 생체 내 접근 및 siRNA 발현을 달성하기 위하여, Yuan 등은 콜레스테롤과 컨쥬게이트된 이중가닥 12/15-LO siRNA 올리고뉴클레오티드를 사용하였다. 약 400 ㎍의 siRNA를 마우스 내로 피하 주사하였다. Yuang 등의 방법이, 콜레스테롤과 컨쥬게이트된 CRISPR Cas의 1-2g을 신장으로의 전달을 위해 인간으로의 피하 주사를 고려하여 본 발명의 CRISPR Cas 시스템에 적용될 수 있다.
Molitoris 등 (문헌 [J Am Soc Nephrol 20: 1754-1764, 2009])은 신장 내에서 올리고뉴클레오티드 재흡수 부위로서, 근위요세관 세포 (PTC)를 이용하여 세포사멸 경로에서 중추적 단백질인, p53으로 표적된 신손상을 방지하기 위한 siRNA의 효능을 시험하였다. 허혈 손상 후 4시간에 정맥주사된 p53으로의 네이키드 합성 siRNA는 PTC 및 신장 작용을 최대로 보호하였다. Molitoris 등의 데이터는 siRNA의 근위요세관 세포로의 신속한 전달이 정맥 투여에 뒤따름을 나타낸다. 도스-반응 분석을 위해, siP53을 주어진 동일한 4 개의 시점에서 33; 1, 3, 또는 5mg/kg의 도스로 래트에 주사하여, 각각 1.32; 4, 12, 및 20 mg/kg의 누적 도스를 결과로서 초래하였다. 시험된 모든 siRNA 도스는 더욱 높은 도스를 이용하여 1일에 SCr 감소 효과를 생산하였으며, PBS-처리된 허혈성 대조구 래트에 비하여 대략 5 일에 걸쳐 유효하였다. 12 및 20 mg/kg의 누적 도스는 최선의 보호 효과를 제공하였다. Molitoris 등의 방법은 본 발명의 핵산-표적화 시스템에 적용될 수 있으며, 이는 신장으로의 전달을 위해 인간에게 12 및 20 mg/kg의 누적 도스를 고려한다.
Thompson 등 (문헌 [Nucleic Acid Therapeutics, Volume 22, Number 4, 2012])은 설치류 및 비인간 영장류에서 정맥 투여에 뒤이은 합성의 작은 간섭 RNA I5NP의 독성학적 및 약물역학적 특성을 보고한다. 15NP는 RNA 간섭 (RNAi) 경로를 통해 작용하도록 설계되어 세포사멸 전구 단백질인 p53의 발현을 일시적으로 억제시키고, 주요 심장 외과 수술 동안 발생할 수 있는 급성 신장 손상과 같은 급성 허혈/재관류 손상으로부터 세포를 보호하도록 개발되고 있으며, 신장 이식 후에 발생할 수 있는 이식편 작용을 지연시킬 수 있다. 설치류에서 800mg/kg I5NP의 도스, 및 비인간 영장류에서 1,000 mg/kg I5NP가 부작용을 이끌어내는데 요구되었으며, 이는 원숭이에서 보체의 하위-임상 활성화 및 약간 증가된 혈액 응고 시간을 포함한 혈액에 대한 효과를 유도하기 위하여 분리되었다. 래트에서, I5NP의 래트 유사체를 이용시 관찰된 추가의 부작용은 없었으며, 이는 그 효과가 I5NP의 의도된 약물학적 활성에 관련된 독성이라기보다는 합성 RNA 이중나선의 클래스 효과를 나타내기 쉬움을 표시한다. 이들을 합하여, 이들 데이터는 급성 허혈/재관류 손상 후에 신장 작용의 보존을 위해 I5NP의 정맥 내 투여의 임상 시험을 지지한다. 원숭이에서 없는 것으로 관찰된 부작용 수준 (NOAEL)은 500 mg/kg이었다. 심혈관, 호흡 및 신경학적 파라미터에 대한 효과는, 25 mg/kg 이하의 도스 수준으로 정맥 내 투여 후에 원숭이에서 관찰되지 않았다. 따라서, 인간 신장으로의 CRISPR Cas의 정맥 내 투여에 대해 유사한 용량이 고려될 수 있다.
Shimizu 등 (문헌 [J Am Soc Nephrol 21: 622-633, 2010])은 폴리(에틸렌 글리콜)-폴리(L-리신)-기반 비히클을 통해 siRNA의 신사구체로의 전달을 표적화하는 시스템을 개발하였다. siRNA/나노캐리어 복합체는, 유창 내피를 지나 이동하여 메산지움(mesangium)으로의 그의 접근을 가능하게 할 수 있는 크기인, 대략적으로 직경 10 내지 20 nm였다. 형광-표지된 siRNA/나노캐리어 복합체의 복강내 주사 후, Shimizu 등은 연장된 기간 동안 혈액 순환 내 siRNA를 검출하였다. 미토겐-활성화된 단백질 키나아제 1 (MAPK1) siRNA/나노캐리어 복합체의 반복된 복강내 투여는 사구체 신염의 마우스 모델에서 사구체 MAPK1 mRNA 및 단백질 발현을 저해하였다. siRNA 축적의 연구를 위해, PIC 나노캐리어와 복합체화된 Cy5-표지된 siRNA (0.5 ml, 5 nmol의 siRNA 함량), 네이키드 Cy5-표지된 siRNA (0.5 ml, 5 nmol), 또는 HVJ-E 내에 캡슐화된 Cy5-표지된 siRNA (0.5 ml, 5 nmol의 siRNA 함량)를 BALBc 마우스들에게 투여하였다. Shimizu 등의 방법은 본 발명의 핵산-표적화 시스템에 적용될 수 있으며, 이는 인간으로의 복강내 투여 및 신장으로의 전달을 위해 약 1-2 리터 내에서 나노캐리어와 복합체화된 CRISPR Cas의 약 10-20 μmol 도스를 고려한다.
상피 및 폐 질병의 치료
본 발명은 또한 본 명세서에 설명된 CRISPR-Cas 시스템, 예를 들어 Cpf1 이펙터 단백질 시스템을 하나 또는 둘 모두의 폐에 전달하는 것을 고려한다.
AAV-2-기저 벡터가 CF 기도로 CFTR 전달을 위해 원래 제안되었지만, AAV-1, AAV-5, AAV-6, 및 AAV-9와 같은 다른 혈청형이 다양한 폐 상피 모델에서 개선된 유전자 이송 효율을 나타낸다(예를 들어, 문헌[Li et al., Molecular Therapy, vol. 17 no. 12, 2067-2077 Dec 2009]을 참조하라). 생체내 AAV-1 형질도입된 뮤린 기관 기도가 AAV-5와 동일한 효율을 갖지만, 내피 AAV-1 실험관내 형질도입 인간 기도 상피 세포에서 AAV-2 및 AAV-5보다 100배까지 더 효율적일 수 있음이 입증되었다. 다른 연구는 실험관내 인간 기도 상피(HAE)로의 유전자 전달에서 AAV-5가 AAV-2보다 50배 더 효율적이고 생체내 마우스 폐 기도 상피에서는 상당히 더 효율적임을 보였다. AAV-6은 또한 실험관내 인간 기도 상피 세포 및 생체내 뮤린 기도에서 AAV-2보다 더 효율적임을 보였다. 더 최근의 분리체인 AAV-9는 9개월에 걸쳐 탐지된 유전자 발현을 갖는 생체내 뮤린 코 및 치조 상피에서 AAV-5보더 더 우수한 유전자 이송 효율을 나타냄을 보였으며, 이는 AAV가 CFTR 유전자 전달 벡터를 위해 요망되는 특성인 생체내 장기간 유전자 발현이 가능하게 할 수 있음을 제안한다. 더욱이, AAV-9는 CFTR 발현의 손실 및 최소 면역 결과를 갖는 뮤린 폐로 재투여될 수 있음을 입증하였다. CF 및 비-CF HAE 배양은 몇 시간 동안 100 μl의 AAV 벡터가 정점 표면 상에 접종될 수 있다 (예를 들어, 문헌[Li et al., Molecular Therapy, vol. 17 no. 12, 2067-2077 Dec 2009]을 참조하라). MOI는 바이러스 농도 및 실험 목적에 의존하여 1 x 103 내지 4 x 105 벡터 게놈/세포로 변한다. 상기 인용된 벡터는 본 발명의 전달 및/또는 투여를 위해 고려된다.
Zamora 등은 RNA 간섭 치료제의 인간 감염 질병의 치료 및 또한 호흡기 세포융합 바이러스(RSV)-감염 폐 이식 수령인에서 항바이러스 약물의 무작위 시험으로의 적용의 예를 보고했다(Am J Respir Crit Care Med Vol 183. pp 531-538, 2011). Zamora 등은 RSV 호흡관 감염을 갖는 LTX 수령자에서 임의, 이중-맹검, 플라시보조절 시험을 실시했다. 환자는 RSV에 대해 표준 관리를 받았다. 에어로졸화 ALN-RSV01 (0.6 mg/kg) 또는 위약이 3일 동안 매일 투여됐다. 이 연구는 RSV를 표적화하는 RNAi 치료제가 RSV 감염을 갖는 LTX 수령자에 안전하게 투여될 수 있음을 입증한다. ALN-RSV01의 3회 일일 용량은 호흡관 증상 또는 폐 기능의 장애의 임의의 악화를 야기하지 않았으며 사이토카인 또는 CRP의 유도와 같은 임의의 전신성 염증전 효과를 나타내지 않았다. 약동학은 흡인 후 낮은 일시적인 전신성 노출만을 보였으며, 이는 정맥내 또는 흡입으로 투여된 ALN-RSV01이 엑소뉴클레아제 매개 소화 및 신장 배출을 통해 순환으로부터 신속하게 청소됨을 보이는 임상전 동물 데이터와 일치하는 것이다. Zamora 등의 방법은 본 발명의 핵산-표적화 시스템에 적용될 수 있으며 에어로졸화 CRISPR Cas는 예를 들어, 0.6 mg/kg의 용량으로, 본 발명에 대해 고려될 수 있다.
Schwank 등 (문헌 [Cell Stem Cell, 13:653-58, 2013])은 인간 줄기 세포에서 낭포성 섬유증과 연관된 결함을 편집하기 위해 CRISPR-Cas9를 사용하였다. 이 팀의 표적은 이온 채널을 위한 유전자인, 낭포성 섬유증 막투과 전도체 수용체(CFTR). CFTR에서의 결실은 낭포성 섬유증 환자에서 단백질의 미스폴딩을 발생시킨다. 낭포성 섬유증을 갖는 2명의 아동으로부터의 세포 시료로부터 발생된 배양된 장 줄기 세포를 사용하여, Schwank 등은 삽입될 수복 서열을 함유하는 공여 플라스미드와 함께 CRISPR을 사용하여 편집할 수 있었다. 그런 다음, 연구자들은 세포를 장 "오르가노이드," 또는 소형 소화관으로 성장시켰으며, 이들이 정상적으로 작용함을 보였다. 이러한 경우에서, 클론성 오르가노이드의 대략 절반이 적절한 유전 편집을 겪었다.
근육계의 질병 치료
본 발명은 또한 근육(들)에 본 명세서에 기재된 CRISPR-Cas 시스템, 예를 들어 Cpf1 이펙터 단백질 시스템을 전달하는 것을 고려한다.
Bortolanza 등은 안면견갑상완근 이영양증 (FSHD)의 발병 후 FRG1 마우스에서의 RNA 간섭 발현 카셋트의 전신 전달이 독성의 징조 없이 용량-의존성 장기간 FRG1 낙다운을 이끌어냄을 보였다(Molecular Therapy vol. 19 no. 11, 2055-2064 Nov. 2011). Bortolanza 등은 5 x 1012 vg의 rAAV6-sh1fRG1의 단일 정맥내 주입이 FRG1 마우스의 근육 조직병리학 및 근육 기능을 구제함을 발견했다. 상세하게는, 200 μl 생리학적 용액 중 2 x 1012 또는 5 x 1012 vg의 벡터가 25-게이지 Terumo 주사기를 사용하여 꼬리 정맥으로 주입되었다. Bortolanza 등의 방법은 CRISPR Cas를 발현하는 AAV에 적용될 수 있으며 약 2 x 1015 또는 2 x 1016 vg 용량의 벡터로 인간에게 투여될 수 있다.
Dumonceaux 등은 미오스타틴 수용체 AcvRIIb mRNA(sh-AcvRIIb)에 대한 RNA 간섭의 기술을 사용하여 미오스타틴 경로를 저해한다(Molecular Therapy vol. 18 no. 5, 881-887 May 2010). 유사-디스트로핀의 복구는 벡터화 U7 엑손-스키핑 기술(U7-DYS)에 의해 매개되었다. sh-AcvrIIb 작제물 단독, U7-DYS 작제물 단독, 또는 두 작제물의 조합을 나르는 아데노-관련 벡터는 mdx 마우스의 전경골근(TA) 근육으로 주입되었다. 주입은 1011 AAV 바이러스 게놈으로 실행되었다. Dumonceaux 등의 방법은 CRISPR Cas를 발현하는 AAV에 적용될 수 있으며 인간에게 예를 들어, 약 1014 내지 약 1015 vg 용량의 벡터로 주입될 수 있다.
Kinouchi 등은 아텔로콜라겐(ATCOL)을 갖는 화학적으로 비변형된 siRNA의 나노입자 형성을 통해 정상 또는 질병에 걸린 마우스의 골격으로의 생체내 siRNA 전달의 효능을 보고한다(Gene Therapy (2008) 15, 1126-1130). 마우스 골격근 또는 정맥내로 골격근 성장의 음성 조절자인 미오스타틴을 표적화하는 siRNA의 ATCOL-매개 국소 적용은 적용 몇 주 후 내에 근육량의 증가를 초래했다. 이들 결과는 siRNA의 ATCOL-매개 적용이 근위축증을 포함하는 질병에 대한 미래의 치료적 용도를 위한 강력한 도구임을 시사한다. MstsiRNA(최종 농도, 10 mM)는 제조업자의 지시에 따라 ATCOL(국소 투여를 위한 최종 농도, 0.5%)(AteloGene, Kohken, Tokyo, Japan)와 혼합되었다. 넴뷰탈(25 mg/kg, i.p.)에 의한 마우스(20-주령 수컷 C57bL/6)의 마취 후, Mst-siRNA/ATCOL 복합체는 교근 및 대퇴이두근 근육으로 주입되었다. Kinouchi 등의 방법은 CRISPR Cas에 적용될 수 있으며 인간에게, 예를 들어, 40 μM 용액의 약 500 내지 1000 ml의 용량으로 근육에 주입된다. Hagstrom 등은 포유류의 다리 근육을 통해 근육 세포(근섬유)로 핵산의 유효하고 반복가능한 전달이 가능한 혈관내, 비바이러스 방법을 기재한다(Molecular Therapy Vol. 10, No. 2, August 2004). 과정은 지혈대 또는 혈압 측정용 커프스에 의해 일시적으로 분리된 다리의 말단 정맥으로 네이키드 플라스미드 DNA 또는 siRNA의 주입을 포함한다. 근섬유로의 핵산 전달은 근육 조직으로 핵산 용액이 유출되기에 충분한 부피로 이의 신속한 주입을 가능하게 한다. 골력근에서의 높은 수준의 트랜스유전자 발현은 최소 독성을 갖는 작은 동물 및 큰 동물 모두에서 달성된다. 다리 근육으로의 siRNA 전달 증거 또한 수득되었다. 붉은털 원숭이로의 플라스미드 DNA 정맥내 주입에서, 삼방활전은 각각 단일 주사기로 로딩된 2 개의 주사기 펌프(모델 PHD 2000; Harvard Instruments)에 연결되었다. 파파베린 주입 5분 후, pDNA (40 내지 100 ml 식염수 중 15.5 내지 25.7 mg)는 1.7 또는 2.0 ml/s의 비율로 주입되었다. 이는 본 발명의 CRISPR Cas를 발현하는 플라스미드 DNA를 위해 인간에 대해 800 내지 2000 ml 식염수 약 300 내지 500 mg의 주입으로 규모가 커질 수 있다. 래트으로의 아데노바이러스 벡터 주입에서, 2 x 109 전염성 입자는 3 ml의 생리 식염수(NSS)로 주입되었다. 이는 본 발명의 CRISPR Cas를 발현하는 플라스미드 DNA를 위해 인간에 대해 10의 NSS로 주입되는 약 1 x 1013 전염성 입자의 주입으로 규모가 커질 수 있다. siRNA에서, 래트는 12.5 μg의 siRNA로 대복재 정맥에 주입되었으며 영장류는 대복재 정맥에 750 μg의 siRNA가 주입되었다. 이는 본 발명의 CRISPR Cas를 위해 예를 들어, 인간의 대복재 정맥으로 약 15 내지 약 50 mg의 주입으로 규모가 커질 수 있다.
또한, 예를 들어, 듀크대의 공개된 출원 WO2013163628 A2호 (돌연변이된 유전자의 유전적 편집(Genetic Correction of Mutated Genes))를 참조하며, 이는 예를 들어 디스트로핀 유전자에서의 돌연변이로 인한 근육 변성을 결과로서 일으키는 열성의 치명적인 X-관련 장애인, 뒤시엔느 근 이영양증 ("DMD")의 원인이 되는 것들과 같은, 뉴클레아제 매개된 비-상동성 말단 접합을 통해 편집될 수 있는 절단된 유전자 생성물 및 때이른 정지 코돈을 유발하는 예를 들어 프레임시프트 돌연변이를 편집하고자 하는 노력을 설명한다. DMD를 유발하는 디스트로핀 돌연변이의 대다수는 리딩 프레임을 방해하고, 디스트로핀 유전자에서 때이른 번역 종료를 유발하는 엑손의 결실이다. 디스트로핀은 근세포 온전성 및 작용을 조절하는데 원인이 되는 세포막의 디스트로글리칸 복합체에 구조 안정성을 제공하는 세포질성 단백질이다. 본 명세서에서 상호가능하게 사용된 바와 같은 디스트로핀 유전자 또는 "DMD 유전자"는 유전자좌 Xp21에서 2.2 메가염기이다. 일차 전사는 약 14 kb인 성숙 mRNA를 이용하여 약 2,400 kb로 측정된다. 79 엑손은 3500 개가 넘는 아미노산인 단백질을 코딩한다. 엑손 51은 DMD 환자에서 종종 프레임-방해 결실에 인접하며, 올리고뉴클레오티드-기반 엑손 스키핑(skipping)에 대한 임상 시험에서 표적된다. 엑손 51 스키핑 화합물 에텝리르신에 대한 임상 시험은 기저선에 비하여 평균 47%의 디스트로핀 양성 섬유를 가져, 48 주에 걸쳐 중요한 작용적 이익을 보고하였다. 엑손 51에서 돌연변이는 NHEJ-기반 게놈 편집에 의해 영구 편집에 이상적으로 적합화된다.
Cellectis에게 수여된 미국 특허 제20130145487호의 방법은, 인간 디스트로핀 유전자 (DMD)로부터의 표적 서열을 절단하는 메가뉴클레아제 변이체에 관한 것으로, 이는 또한 본 발명의 핵산-표적화 시스템에 대해 변형될 수 있다.
피부병의 치료
본 발명은 또한 피부로의 본 명세서에 기재된 CRISPR-Cas 시스템, 예를 들어 Cpf1 이펙터 단백질 시스템의 전달을 고려한다.
Hickerson 등의 문헌은 인간 및 뮤린 피부로 자가-전달(sd)-siRNA를 전달하기 위한 전동 마이크로니들 어레이 스킨 전달 장치에 관한 것이다(Molecular Therapy-Nucleic Acids (2013) 2, e129). siRNA-기반 피부 치료제가 임상으로 바뀌기 위한 주된 도전은 효과적인 전달 시스템의 개발이다. 다양한 피부 전달 기술에서의 상당한 노력이 쏟아졌으나 제한된 성공만을 거두었다. 피부가 siRNA로 치료되는 임상 연구에서, 피하 주사 주입과 연관된 강렬한 통증이 추가 환자의 등록을 불가능하게 하였으며, 이는 개선되며 좀더 "환자-친화적인"(즉, 적은 통증 또는 무통증) 전달 접근법에 대한 요구를 강조하는 것이다. 마이크로니들은 초기 장벽인 각질층을 거쳐 siRNA를 포함하는 대전하 카고를 전달하는 효과적인 방식을 대표하며, 일반적으로 통상적인 피하 주사보다 통증이 덜한 것으로 간주된다. Hickerson 등에 의해 사용된 동력화 마이크로니들 어레이(MMNA) 장치를 포함하는, 동력화 "스탬프 유형" 마이크로니들 장치는 무모 마우스 연구에서 안전함을 보였으며 (i) 미용 산업에서의 광범위한 사용 및 (ii) 모든 지원자들이 독감 예방주사보다 훨씬 적은 통증으로 장치를 사용함을 발견한 제한된 시험에 의해 입증된 바와 같이 적은 통증 또는 무통증을 초래하며, 이는 이 장치를 사용하는 siRNA 전달이 피하 주사 주입을 사용한 이전 임상 시험에 경험했던 것보다 훨씬 더 적은 통증을 야기할 수 있음을 제안하는 것이다. MMNA 장치(Bomtech Electronic Co(Seoul, South Korea)에 의해 Triple-M 또는 Tri-M로서 판매됨)는 마우스 및 인간 피부로의 siRNA 전달을 위해 적응되었다. sd-siRNA 용액(300 μl까지의 0.1 mg/ml RNA)은 0.1 mm 깊이로 세팅된 일회용 Tri-M 니들 카트리지(Bomtech)의 챔버 내로 도입되었다. 인간 피부를 치료하기 위해, 익명인 데이터의 피부(수술 과정 후 즉시 수득됨)는 치료 전에 수동으로 늘리고 코르크 플랫폼에 핀으로 고정시켰다. 모든 피내 주입은 28-게이지 0.5-인치 바늘을 갖는 인슐린 주사기를 사용해 실행되었다. Hickerson 등의 MMNA 장치 및 방법은 본 발명의 CRISPR Cas, 예를 들어, 피부에 300 μl까지의 용량으로 0.1 mg/ml CRISPR Cas를 전달하기 위해 사용되고 그리고/또는 적응될 수 있다.
Leachman 등의 문헌은 피부에 제1 짧은 간섭 RNA(siRNA)-기반 치료제를 사용하여 장애성 발바닥 각피증을 포함하는 상염색체 우성 증후군인 흔하지 않은 피부 장애 선천성 경조증(PC)의 치료를 위한 Ib상 임상 시험에 관한 것이다(Molecular Therapy, vol. 18 no. 2, 442-446 Feb. 2010). TD101로 명명된 이 siRNA는 야생형 K6a mRNA 없이 케라틴 6a(K6a) N171K 돌연변이체 mRNA를 특이적으로 그리고 강력하게 표적화한다.
Zheng 등은 구형의 핵산 나노입자 접합체(SNA-NCs)인 고도로 지향적인 공유적으로 고정화된 siRNA의 밀집된 쉘로 싸인 금 코어는 적용 후 몇 시간 내에 실험관내 각질세포, 마우스 피부 및 인간 표피를 거의 100% 자유롭게 투과함을 보였다(PNAS, July 24, 2012, vol. 109, no. 30, 11975-11980). Zheng 등은 60시간 동안 25 nM의 표피 성장 인자 수용체(EGFR) SNA-NC의 단일 적용이 인간 피부에서의 효과적인 유전자 낙다운을 입증함을 설명했다. 유사한 용량이 피부로의 투여를 위해 SNA-NC에 고정된 CRISPR Cas에 대해 고려될 수 있다.
일반적 유전자 치료 고려사항
질병-연관 유전자 및 폴리뉴클레오티드 및 질병 특이 정보의 예는 월드 와이드 웹 상에서 입수 가능한 존스홉킨스대학교(Johns Hopkins University)(미국 메릴랜드주 볼티모어 소재)의 맥쿠식-네이선스 유전의학 연구소(McKusick-Nathans Institute of Genetic Medicine) 및 국립 생명 기술 정보 센터(National Center for Biotechnology Information), 국립 의학 도서관(National Library of Medicine)(미국 메릴랜드주 베데스다 소재)로부터 입수할 수 있다.
이들 유전자 및 경로에서의 돌연변이는 작용에 영향을 미치는 부적절한 양의 단백질 또는 부적절한 단백질의 생산을 초래할 수 있다. 유전자, 질병 및 단백질의 추가 예는 2012년 12월 12일 출원된 US 가출원 61/736,527로부터 참고로 본 명세서에 포함다. 이러한 유전자, 단백질 및 경로는 본 발명의 CRISPR 복합체의 표적 폴리뉴클레오티드일 수 있다. 본 발명의 구현예는 또한 유전자를 낙아웃시키고, 유전자를 증폭하며 DNA 반복 불안정성 및 신경학적 장애와 연관된 특정 돌연변이를 수복하는 것에 관련된 방법 및 조성물에 관한 것이다(문헌[Robert D. Wells, Tetsuo Ashizawa, Genetic Instabilities and Neurological Diseases, Second Edition, Academic Press, Oct 13, 2011 - Medical]). 탠덤 반복 서열의 특이적 양태는 20 개 초과의 인간 질병에 원인임이 발견되었다(문헌[New insights into repeat instability: role of RNA·DNA hybrids. McIvor EI, Polak U, Napierala M. RNA Biol. 2010 Sep-Oct;7(5):551-8]). 본 발명의 이펙터 단백질 시스템은 게놈 불안정성의 이들 결함을 편집하기 위해 활용될 수 있다.
본 발명의 여러 추가 양태는 국립 보건원의 웹사이트에서 토픽 서브섹션 유전 장애(Genetic Disorders)(웹사이트 health.nih.gov/topic/GeneticDisorders) 하에 추가 기재된 광범위한 유전 질병과 연관된 결함을 편집하는 것에 관한 것이다. 유전 뇌 질병은 부신백질 이영양증, 뇌량(Corpus Callosum)의 무발육(agenesis), 에카르디(Aicardi) 증후군, 알퍼스(Alpers) 병, 알츠하이머병, 바쓰(Barth) 증후군, 바텐(Batten)병, CADASIL, 소뇌 변성, 파브리병, 게르스트만-슈트로이슬러-샤인커(Gerstmann-Straussler-Scheinker)병, 헌팅턴병 및 기타 다른 삼중 암호 반복(triplet repeat) 장애, 라이(Leigh)병, 레시-니한(Lesch-Nyhan) 증후군, 멘케스(Menkes)병, 미토콘드리아 근병증(Mitochondrial Myopathies) 및 NINDS 거대후두각(Colpocephaly)을 포함할 수 있으나, 이로 제한되지 않는다. 이들 질병은 국립보건원의 웹사이트에서 서브섹션 유전 뇌 장애(Genetic Brain Disorders) 하에 추가 기재되어 있다.
Cas9 개발 및 사용
본 발명은 하기 문헌들에서 설명된 바와 같이, 특히 세포 및 생물에서 CRISPR 단백질 복합체의 전달 및 RNA 가이드된 엔도뉴클레아제의 이용에 관한 것과 같이, CRISPR-Cas9 개발 및 이용의 양태를 기반으로 추가로 예시 및 연장될 수 있다:
Multiplex genome engineering using CRISPR/Cas systems. Cong, L., Ran, F.A., Cox, D., Lin, S., Barretto, R., Habib, N., Hsu, P.D., Wu, X., Jiang, W., Marraffini, L.A., & Zhang, F. Science Feb 15;339(6121):819-23 (2013);
RNA-guided editing of bacterial genomes using CRISPR-Cas systems. Jiang W., Bikard D., Cox D., Zhang F, Marraffini LA. Nat Biotechnol Mar;31(3):233-9 (2013);
One-Step Generation of Mice Carrying Mutations in Multiple Genes by CRISPR/Cas-Mediated Genome Engineering. Wang H., Yang H., Shivalila CS., Dawlaty MM., Cheng AW., Zhang F., Jaenisch R. Cell May 9;153(4):910-8 (2013);
Optical control of mammalian endogenous transcription and epigenetic states. Konermann S, Brigham MD, Trevino AE, Hsu PD, Heidenreich M, Cong L, Platt RJ, Scott DA, Church GM, Zhang F. Nature. Aug 22;500(7463):472-6. doi: 10.1038/Nature12466. Epub 2013 Aug 23 (2013);
Double Nicking by RNA-Guided CRISPR Cas9 for Enhanced Genome Editing Specificity. Ran, FA., Hsu, PD., Lin, CY., Gootenberg, JS., Konermann, S., Trevino, AE., Scott, DA., Inoue, A., Matoba, S., Zhang, Y., & Zhang, F. Cell Aug 28. pii: S0092-8674(13)01015-5 (2013-A);
DNA targeting specificity of RNA-guided Cas9 nucleases. Hsu, P., Scott, D., Weinstein, J., Ran, FA., Konermann, S., Agarwala, V., Li, Y., Fine, E., Wu, X., Shalem, O., Cradick, TJ., Marraffini, LA., Bao, G., & Zhang, F. Nat Biotechnol doi:10.1038/nbt.2647 (2013);
Genome engineering using the CRISPR-Cas9 system. Ran, FA., Hsu, PD., Wright, J., Agarwala, V., Scott, DA., Zhang, F. Nature Protocols Nov;8(11):2281-308 (2013-B);
Genome-Scale CRISPR-Cas9 Knockout Screening in Human Cells. Shalem, O., Sanjana, NE., Hartenian, E., Shi, X., Scott, DA., Mikkelson, T., Heckl, D., Ebert, BL., Root, DE., Doench, JG., Zhang, F. Science Dec 12. (2013). [Epub ahead of print];
Crystal structure of cas9 in complex with guide RNA and target DNA. Nishimasu, H., Ran, FA., Hsu, PD., Konermann, S., Shehata, SI., Dohmae, N., Ishitani, R., Zhang, F., Nureki, O. Cell Feb 27, 156(5):935-49 (2014);
Genome-wide binding of the CRISPR endonuclease Cas9 in mammalian cells. Wu X., Scott DA., Kriz AJ., Chiu AC., Hsu PD., Dadon DB., Cheng AW., Trevino AE., Konermann S., Chen S., Jaenisch R., Zhang F., Sharp PA. Nat Biotechnol. Apr 20. doi: 10.1038/nbt.2889 (2014);
CRISPR-Cas9 Knockin Mice for Genome Editing and Cancer Modeling. Platt RJ, Chen S, Zhou Y, Yim MJ, Swiech L, Kempton HR, Dahlman JE, Parnas O, Eisenhaure TM, Jovanovic M, Graham DB, Jhunjhunwala S, Heidenreich M, Xavier RJ, Langer R, Anderson DG, Hacohen N, Regev A, Feng G, Sharp PA, Zhang F. Cell 159(2): 440-455 DOI: 10.1016/j.cell.2014.09.014(2014);
Development and Applications of CRISPR-Cas9 for Genome Engineering, Hsu PD, Lander ES, Zhang F., Cell. Jun 5;157(6):1262-78 (2014).
Genetic screens in human cells using the CRISPR/Cas9 system, Wang T, Wei JJ, Sabatini DM, Lander ES., Science. January 3; 343(6166): 80-84. doi:10.1126/science.1246981 (2014);
Rational design of highly active sgRNAs for CRISPR-Cas9-mediated gene inactivation, Doench JG, Hartenian E, Graham DB, Tothova Z, Hegde M, Smith I, Sullender M, Ebert BL, Xavier RJ, Root DE., (published online 3 September 2014) Nat Biotechnol. Dec;32(12):1262-7 (2014);
In vivo interrogation of gene function in the mammalian brain using CRISPR-Cas9, Swiech L, Heidenreich M, Banerjee A, Habib N, Li Y, Trombetta J, Sur M, Zhang F., (published online 19 October 2014) Nat Biotechnol. Jan;33(1):102-6 (2015);
Genome-scale transcriptional activation by an engineered CRISPR-Cas9 complex, Konermann S, Brigham MD, Trevino AE, Joung J, Abudayyeh OO, Barcena C, Hsu PD, Habib N, Gootenberg JS, Nishimasu H, Nureki O, Zhang F., Nature. Jan 29;517(7536):583-8 (2015).
A split-Cas9 architecture for inducible genome editing and transcription modulation, Zetsche B, Volz SE, Zhang F., (published online 02 February 2015) Nat Biotechnol. Feb;33(2):139-42 (2015);
Genome-wide CRISPR Screen in a Mouse Model of Tumor Growth and Metastasis, Chen S, Sanjana NE, Zheng K, Shalem O, Lee K, Shi X, Scott DA, Song J, Pan JQ, Weissleder R, Lee H, Zhang F, Sharp PA. Cell 160, 1246-1260, March 12, 2015 (multiplex screen in mouse), and
In vivo genome editing using Staphylococcus aureus Cas9, Ran FA, Cong L, Yan WX, Scott DA, Gootenberg JS, Kriz AJ, Zetsche B, Shalem O, Wu X, Makarova KS, Koonin EV, Sharp PA, Zhang F., (published online 01 April 2015), Nature. Apr 9;520(7546):186-91 (2015) ;
Shalem et al., "High-throughput functional genomics using CRISPR-Cas9," Nature Reviews Genetics 16, 299-311 (May 2015).
Xu et al., "Sequence determinants of improved CRISPR sgRNA design," Genome Research 25, 1147-1157 (August 2015).
Parnas et al., "A Genome-wide CRISPR Screen in Primary Immune Cells to Dissect Regulatory Networks," Cell 162, 675-686 (July 30, 2015).
Ramanan et al., CRISPR/Cas9 cleavage of viral DNA efficiently suppresses hepatitis B virus," Scientific Reports 5:10833. doi: 10.1038/srep10833 (June 2, 2015)
Nishimasu et al., "Crystal Structure of Staphylococcus aureus Cas9," Cell 162, 1113-1126 (Aug. 27, 2015)
Zetsche et al. (2015), "Cpf1 is a single RNA-guided endonuclease of a class 2 CRISPR-Cas system," Cell 163, 759-771 (Oct. 22, 2015) doi: 10.1016/j.cell.2015.09.038. Epub Sep. 25, 2015
Shmakov et al. (2015), "Discovery and Functional Characterization of Diverse Class 2 CRISPR-Cas Systems," Molecular Cell 60, 385-397 (Nov. 5, 2015) doi: 10.1016/j.molcel.2015.10.008. Epub Oct 22, 2015
Gao et al, "Engineered Cpf1 Enzymes with Altered PAM Specificities," bioRxiv 091611; doi: http://dx.doi.org/10.1101/091611 (Dec. 4, 2016).
이들 각각은 본 명세서에 참고문헌으로 통합되고, 본 발명의 실시에서 고려될 수 있으며, 아래 간략히 설명된다:
Cong 등은 스트렙토코커스 써모필러스 Cas9 및 또한 스트렙토코커스 피오게네스 Cas9 둘 모두를 기초로 하여 진핵 세포에서 사용하기 위해 II형 CRISPR/Cas 시스템을 조작하였고, Cas9 뉴클레아제가 짧은 RNA에 의해 유도되어 인간 및 마우스 세포에서 DNA의 정밀한 절단을 유도할 수 있는 것을 입증하였다. 이들의 연구는 닉킹 효소로 전환됨에 따라 Cas9가 최소의 돌연변이유발 활성을 갖는 진핵 세포에서 상동성-유도된 수복을 촉진하는데 이용될 수 있음을 추가로 보여준다. 또한, 그들의 연구는 다수의 가이드 서열이 단일의 CRISPR 어레이로 인코딩되어 포유류 게놈 내의 내인성 게놈 유전자좌 위치에서 몇몇의 동시 편집을 가능하게 할 수 있음을 입증하였으며, 이는 RNA-안내된 뉴클레아제 기술의 용이한 프로그램화가능성 및 폭넓은 응용 가능성을 입증한다. 세포에서 서열 특이적 DNA 절단을 프로그램화하기 위해 RNA를 이용하는 이러한 능력은 게놈 조작 도구의 새로운 부류를 규정하였다. 이들 연구는 다른 CRISPR 유전자좌가 포유류 세포로 이식될 수 있고, 또한 포유류 게놈 절단을 매개할 수 있음을 추가로 보여준다. 중요하게는, CRISPR/Cas 시스템의 여러 양태가 그의 효능 및 다능성을 증가시키기 위해 추가로 개선될 수 있음이 예견될 수 있다.
Jiang 등은 스트렙토코커스 뉴모니애 및 에스케리키아 콜라이의 게놈에서 정밀한 돌연변이를 도입시키기 위해 이중-RNA와 복합체화된 클러스터링되고 규칙적으로 산재된 짧은 팔린드로믹 반복부(CRISPR)-회합된 Cas9 엔도뉴클레아제를 이용하였다. 상기 접근법은 돌연변이되지 않은 세포를 사멸시키기 위해 표적화된 게놈 부위에서의 이중-RNA:Cas9-유도된 절단에 의존하며, 선별 마커 또는 반대-선택 시스템의 필요를 회피한다. 상기 연구는 편집 주형에서 수행되는 단일- 및 다중 뉴클레오티드 변화를 만들기 위해 짧은 CRISPR RNA(crRNA)의 서열을 변화시킴에 의한 이중-RNA:Cas9 특이성의 재프로그램화를 보고하였다. 상기 연구는 2 개의 crRNA의 동시 사용이 멀티플렉스 돌연변이유발을 가능하게 하는 것을 보여준다. 또한, 상기 접근법이 리컴비니어링(recombineering)과 병용하여 이용된 경우, 스트렙토코커스 뉴모니애에서 기재된 접근법을 이용하여 회수된 세포의 거의 100%가 요망되는 돌연변이를 함유하였고, 에스케리키아 콜라이에서, 회수된 65%가 돌연변이를 함유하였다.
Wang 등 (2013)은 배아 줄기 세포에서의 순차적인 재조합 및/또는 많은 시간이 걸리는, 단일 돌연변이를 갖는 마우스의 이종교배에 의한 전통적으로 다수의 단계로 생성된 다수의 유전자에서의 돌연변이를 함유한 마우스들의 일-단계 생성을 위해 CRISPR-Cas 시스템을 사용하였다. CRISPR-Cas 시스템은 작용적으로 중복인 유전자 및 상위 유전자 상호작용의 생체 내 연구를 크게 촉진할 것이다.
Konermann 등 (2013) 은 DNA-결합 도메인 기반 CRISPR Cas9 효소 및 또한 전사 활성화제 유사 이펙터의 광학적 및 화학적 조절을 가능하게 하는 다능성이고 강력한 기술에 대한 해당 분야의 요구를 다루었다.
Ran 등 (2013-A)은 표적화된 이중-가닥 파손을 도입시키기 위해 쌍을 형성하는 가이드 RNA와 Cas9 닉카제 돌연변이체를 병용한 접근법을 기재하였다. 이는 가이드 서열에 의해 특정 게놈 유전자좌로 표적되는 미생물 CRISPR-Cas 시스템으로부터의 Cas9 뉴클레아제의 문제를 다루며, 이는 DNA 표적으로의 특정 미스매치를 용인할 수 있고, 이에 의해 바람직하지 않은 표적외 돌연변이유발을 촉진할 수 있다. 게놈 내의 개별의 닉은 높은 정확도로 수복되므로, 적절한 오프셋 가이드 RNA를 통한 동시 닉킹이 이중-가닥 파손에 필요하고, 표적 절단을 위한 특이적으로 인식된 염기의 수를 연장시킨다. 상기 저자는 쌍을 형성한 닉킹을 이용하는 것이 세포주에서 50 내지 1,500배까지 표적외 활성을 감소시킬 수 있고, 표적에 대한 절단 효율을 희생시키지 않고 마우스 접합체에서 유전자 낙아웃을 촉진하는 것을 입증하였다. 이러한 다능성 전략은 높은 특이성을 필요로 하는 매우 다양한 게놈 편집 응용을 가능하게 한다.
Hsu 등 (2013)은 표적 부위의 선택을 알아내고, 표적외 효과를 피하기 위해 인간 세포에서 SpCas9 표적화 특이성을 특성화하였다. 상기 연구는 293T 및 293FT 세포에서 100 개 초과의 예측 게놈 표적외 유전자좌에서 SpCas9-유도된 삽입-결실 돌연변이 수준 및 700 개 초과의 가이드 RNA 변이체를 평가하였다. 상기 저자는 SpCas9가 미스매치의 수, 위치 및 분포에 민감한 서열-의존성 방식으로 상이한 위치에서 가이드 RNA와 표적 DNA 사이의 미스매치를 용인하는 것을 보고하였다. 상기 저자는 SpCas9-매개 절단이 DNA 메틸화에 의해 영향을 받지 않고, SpCas9 및 gRNA의 용량을 적정하여 표적외 변형을 최소화시킬 수 있음을 추가로 나타내었다. 또한, 포유류 게놈 조작 응용을 용이하게 하기 위해, 상기 저자는 표적 서열의 선택 및 확인뿐만 아니라 표적외 분석을 안내하기 위해 웹-기반 소프트웨어 도구를 제공한 것을 보고하였다.
Ran 등(2013-B)은 포유류 세포에서 비-상동성 말단 연결(NHEJ) 또는 상동성-유도 수복(HDR)뿐만 아니라 하류 작용성 연구를 위한 변형된 세포주의 생성을 통한 Cas9-매개 게놈 편집을 위한 일련의 도구를 기재하였다. 표적외 절단을 최소화시키기 위해, 상기 저자는 쌍을 형성한 가이드 RNA와 함께 Cas9 닉카제 돌연변이체를 이용한 이중-닉킹 전략을 추가로 기재하였다. 상기 저자에 의해 제공된 프로토콜은 표적 부위의 선택, 절단 효율의 평가 및 표적외 활성의 분석을 위한 가이드를 실험적으로 유래하였다. 상기 연구는 표적 설계로 시작하여, 유전자 변형은 1 내지 2주만큼 적은 기간 내에 달성될 수 있고, 변형된 클론성 세포주가 2 내지 3주 내에 유래될 수 있음을 나타내었다.
Shalem 등은 게놈-와이드 규모에서 유전자 작용을 질의하기 위한 새로운 방식을 기재한다. 그들의 연구는 64,751 개의 독특한 가이드 서열을 이용하여 18,080 개 유전자를 표적화시킨 게놈-규모의 CRISPR-Cas9 낙아웃(GeCKO) 라이브러리의 전달이 인간 세포에서 음성 및 양성 선택 스크리닝 둘 모두를 가능하게 하는 것을 보여주었다. 먼저, 상기 저자는 암 및 만능성 줄기 세포에서세포 생존력에 필수적인 유전자를 확인하기 위한 GeCKO 라이브러리의 사용을 보여주었다. 다음으로, 흑색종 모델에서, 상기 저자는 유전자의 소실이 돌연변이 단백질 키나제 BRAF를 억제하는 치료제인 베무라페닙(vemurafenib)에 대한 내성과 관련된 유전자를 스크리닝하였다. 그들의 연구는 가장 높은 순위의 후보물질이 이전에 확인된 유전자 NF1 및 MED12뿐만 아니라 새로운 히트(hit) NF2, CUL3, TADA2B, 및 TADA1을 포함한 것을 나타내었다. 상기 저자는 동일한 유전자를 표적으로 하는 독립적 가이드 RNA와 높은 비율의 히트 확인 사이에 높은 수준의 일치를 관찰하였고, 따라서 Cas9를 이용한 게놈-규모 스크리닝의 가망성을 입증하였다.
Nishimasu 등은 2.5 A°해상도로 sgRNA 및 그의 표적 DNA와의 복합체에서 스트렙토코커스 피오게네스 Cas9의 결정 구조를 보고하였다. 상기 구조는 그들의 계면에서 양으로 하전된 홈에서 sgRNA:DNA 이형이중가닥을 수용하는 표적 인식 및 뉴클레아제 엽으로 구성된 2엽 구조를 나타내었다. 인식 엽이 sgRNA 및 DNA 결합에 필수적인 반면, 뉴클레아제 엽은 각각 표적 DNA의 상보적 및 비-상보적 가닥의 절단을 위해 적절하게 위치된 HNH 및 RuvC 뉴클레아제 도메인을 함유한다. 뉴클레아제 엽은 또한 프로토스페이서 인접 모티프(PAM)와의 상호작용을 담당하는 카르복실-말단 도메인을 함유한다. 이러한 고-해상도 구조 및 수반하는 기능 분석은 Cas9에 의한 RNA-안내된 DNA 표적화의 분자 메카니즘을 나타내었고, 이에 따라 새로운 다능성 게놈-편집 기술의 합리적 설계를 용이하게 한다.
Wu 등은 마우스 배아 줄기 세포(mESC)에서 단일 가이드 RNA(sgRNA)가 로딩된 스트렙토코커스 피오게네스 유래의 촉매적 비활성 Cas9(dCas9)의 게놈-와이드 결합 부위를 맵핑하였다. 저자는 4 개의 sgRNA 각각이 NGG 프로토스페이서 인접 모티프(PAM) 및 sgRNA 내의 5-뉴클레오티드 씨드 영역을 종종 특징으로 하는 수십 내지 수천 개의 게놈 부위에 대하여 표적 dCas9를 시험한 것을 보여주었다. 염색질 비접근성은 씨드 서열과 일치하는 다른 부위로의 dCas9 결합을 감소시키고; 따라서 표적외 부위의 70%가 유전자와 회합된다. 상기 저자는 촉매적 활성 Cas9로 트랜스펙션된 mESC 내의 295 개의 dCas9 결합 부위의 표적화된 시퀀싱에 의해, 백그라운드 수준 초과로 돌연변이된 단지 하나의 부위가 확인된 것을 나타내었다. 상기 저자는 씨드 매치가 결합을 촉발하나, 표적 DNA와의 광범위한 쌍형성이 절단에 필요한 Cas9 결합 및 절단을 위한 2-상태 모델을 제안하였다.
Platt 등은 Cre-의존성 Cas9 낙인 마우스를 수립하였다. 저자는 뉴런, 면역 세포, 및 상피 세포에서 가이드 RNA의 아데노-연관 바이러스 (AAV)-, 렌티바이러스-, 또는 입자-매개된 전달을 이용하여 생체 내 및 생체 외 게놈 편집을 증명하였다.
Hsu 등 (2014)은 요거트부터 세포의 유전적 스크리닝을 포함하는 게놈 편집까지 CRISPR-Cas9 전력를 일반적으로 논의하는 리뷰 기사이다.
Wang 등 (2014)은 게놈-규모 렌티바이러스 단일 가이드 RNA (sgRNA) 라이브러리를 이용하는 양성 및 음성 선택 모두에 적합한 풀화된(pooled) 기능 손실 유전학적 스크리닝 시도에 관한 것이다.
Doench 등은 6 개의 내인성 마우스 및 3 개의 내인성 인간 유전자의 패널의 모든 가능한 표적 부위에 걸쳐 타일링하는(tiling) sgRNA의 풀을 만들고, 항체 염색 및 유세포분석기에 의해 표적 유전자의 널 대립형질을 생산하는 그의 능력을 정량적으로 평가하였다. 저자들은 PAM 개선된 활성의 최적화를 보였으며, sgRNA의 설계를 위한 온라인 도구를 또한 제공하였다.
Swiech 등은 AAV-매개된 SpCas9 게놈 편집이 뇌 내 유전자 작용의 역전 유전적 구조를 가능하게 할 수 있음을 증명하였다.
Konermann 등 (2015)은 다수의 이펙터 도메인, 예를 들어 전사 활성화제, 예를 들어 작용적 및 후생유전자적 조절제를 링커 없이 또는 링커와 함께 줄기 또는 테트라루프와 같은 가이드 상에서 적절한 위치에 부착시키는 능력을 논의한다.
Zetsche 등은 Cas9 효소가 둘로 분열될 수 있고, 이에 따라 활성화를 위한 Cas9 조립이 제어될 수 있음을 증명한다.
Chen 등은 마우스들에서 게놈-와이드 생체 내 CRISPR-Cas9 스크린은 폐 전이를 조절하는 유전자를 드러냄을 증명함에 의한 멀티플렉스 스크리닝에 관한 것이다.
Ran 등 (2015)은 SaCas9 및 게놈을 편집하는 그의 능력에 관한 것으로, 생화학 분석으로부터 추론할 수 없음을 증명한다.
Shalem 등 (2015)은, 촉매적으로 비활성인 Cas9 (dCas9) 융합물이 발현을 합성적으로 저해 (CRISPRi) 또는 활성 (CRISPRa)하는데 사용되는 방법을 설명하며, 이는 배열되고 풀화된 스크린을 포함하는, 게놈-규모 스크린을 위해 Cas9를 이용하는 진전, 비활성 게놈 유전자좌를 비활성화하는 낙아웃 시도 및 전사 활성을 조절하는 전략을 보여준다.
Xu 등 (2015)은 CRISPR-기반 스크린에서 단일 가이드 RNA (sgRNA) 효율에 기여하는 DNA 서열 특징을 평가하였다. 저자들은 CRISPR/Cas9 낙아웃 및 절단 부위에서 뉴클레오티드 선호성을 탐구하였다. 저자들은 또한 CRISPRi/a에 대한 서열 선호성이 CRISPR/Cas9 낙아웃에 대한 선호와 실질적으로 상이함을 발견하였다.
Parnas 등 (2015)은 박테리아성 지질다당류 (LPS)에 의해 종양 괴사 인자 (Tnf)의 유도를 제어하는 유전자를 확인하기 위하여 게놈-와이드 풀화된 CRISPR-Cas9 라이브러리를 수지상 세포 (DC) 내로 도입하였다. Tlr4 신호화의 알려진 조절자 및 이전에 알려지지 않은 후보물질들이 확인되었으며, LPS에 대한 정규 반응에 대한 구별된 효과를 갖는 세 개의 작용 모듈로 확인되었다.
Ramanan 등 (2015)은 감염된 세포에서 바이러스 에피좀성 DNA (cccDNA)의 절단을 증명하였다. HBV 게놈은 공유결합 폐환형 DNA (cccDNA)로도 명명되는 3.2kb의 이중-가닥 에피좀 DNA 종으로서 감염된 간세포의 핵에 존재하고, 그의 복제가 현재 치료법에 의해 억제되지 않는 HBV 생애 주기에서 주요 성분이다. HBV의 고도로 보존된 영역을 특이적으로 표적화하는 sgRNA가 바이러스 복제 및 고갈된 cccDNA를 저해함을 보여주었다.
Nishimasu 등 (2015)은 5'-TTGAAT-3' PAM 및 5'-TTGGGT-3' PAM을 함유하는 단일 가이드 RNA (sgRNA) 및 그의 이중-가닥 DNA 표적과 함께 복합체화되는 SaCas9의 결정 구조를 보고하였다. SpCas9 와 SaCas9의 구조 비교는 구조적 보존 및 다양성 모두에서 강조표시하였으며, 이는 그들의 구별되는 PAM 특이성 및 오솔로그성 sgRNA 인식을 설명한다.
Canver 등 (2015)은 비-코딩 게놈 요소의 CRISPR-Cas9-기반 작용 연구를 증명하였다. 저자인 우리는 풀화된 CRISPR-Cas9 가이드 RNA 라이브러리를 개발하여 인간 및 마우스 BCL11A 인핸서의 현장 포화 돌연변이를 수행하였으며, 이는 인핸서의 중요한 특징을 발견하였다.
Zetsche 등 (2015)은 Cas9와 구분되는 특징을 갖는 프란시셀라 노비시다 U112로부터의 클래스 2 CRISPR 뉴클레아제인 Cpf1의 특징을 보고하였다. Cpf1은 tracrRNA를 결여한 단일 RNA-가이드 엔도뉴클레아제는 T-풍부 프로토스페이서-인접 모티프를 활용하며, 엇갈린 DNA 이중-가닥 파손을 통해 DNA를 절단한다.
Shmakov 등 (2015)은 3 개의 구별되는 클래스 2 CRISPR-Cas 시스템을 보고하였다. 두 시스템의 CRISPR 효소 (C2c1 및 C2c3)는 Cpf1의 먼 친척인 관련된 RuvC-유사 엔도뉴클레아제 도메인을 함유한다. Cpf1와 달리, C2c1는 DNA 절단에 대해 crRNA 및 tracrRNA 모두에 따라 달라진다. 제3의 효소 (C2c2)는 두 개의 예측된 HEPN RN아제 도메인을 함유하고, tracrRNA 독립적이다.
Slaymaker 등 (2016)은 스트렙토코커스 피오게네스 Cas9 (SpCas9)의 특이성을 개선시키기 위하여 구조-가이드된 단백질 조작의 이용을 보고하였다. 저자는 감소된 표적외 효과를 갖고 강한 표적상 절단을 유지하는 "증진된 특이성" SpCas9 (eSpCas9) 변이체를 개발하였다.
또한, 문헌 ["Dimeric CRISPR RNA-guided FokI nucleases for highly specific genome editing", Shengdar Q. Tsai, Nicolas Wyvekens, Cyd Khayter, Jennifer A. Foden, Vishal Thapar, Deepak Reyon, Mathew J. Goodwin, Martin J. Aryee, J. Keith Joung Nature Biotechnology 32(6): 569-77 (2014)]은, 연장된 서열을 인식하고 인간 세포에서 높은 효율을 갖는 내인성 유전자를 편집할 수 있는 이량체성 RNA-가이드된 FokI 뉴클레아제에 관한 것이다.
미국 특허 제8,697,359호, 제8,771,945호, 제8,795,965호, 제8,865,406호, 제8,871,445호, 제8,889,356호, 제8,889,418호, 제8,895,308호, 제8,895,308호, 제8,906,616호, 제8,932,814호, 제8,945,839호, 제8,993,233호 및 제8,895,308999,641호; 미국 특허 공개 US 2014-0310830호(미국 출원 제14/105,031호), US 2014-0287938 A1호(미국 출원 제14/213,991호), US 2014-0273234 A1호(미국 출원 제14/293,674호), US2014-0273232 A1호(미국 출원 제14/290,575호), US 2014-0273231호(미국 출원 제14/259,420호), US 2014-0256046 A1호(미국 출원 제14/226,274호), US 2014-0248702 A1호(미국 출원 제14/258,458호), US 2014-0242700 A1호(미국 출원 제14/222,930호), US 2014-0242699 A1호(미국 출원 제14/183,512호), US 2014-0242664 A1호(미국 출원 제14/104,990호), US 2014-0234972 A1호(미국 출원 제14/183,471호), US 2014-0227787 A1호(미국 출원 제14/256,912호), US 2014-0189896 A1호(미국 출원 제14/105,035호), US 2014-0186958호(미국 출원 제14/105,017호), US 2014-0186919 A1호(미국 출원 제14/104,977호), US 2014-0186843 A1호(미국 출원 제14/104,900호), US 2014-0179770 A1호(미국 출원 제14/104,837호) 및 US 2014-0179006 A1호(미국 출원 제14/183,486호), US 2014-0170753호(미국 출원 제14/183,429호) US 2015-0184139호 (미국 출원 제14/324,960호); 제14/054,414호; 유럽 특허 출원 EP 2 771 468호(EP13818570.7호), EP 2 764 103호(EP13824232.6호) 및 EP 2 784 162호(EP14170383.5호); PCT 특허 공개 WO 2014/093661호(PCT/US2013/074743호), WO 2014/093694호(PCT/US2013/074790호), WO 2014/093595호(PCT/US2013/074611호), WO 2014/093718호(PCT/US2013/074825호), WO 2014/093709호(PCT/US2013/074812호), WO 2014/093622호(PCT/US2013/074667호), WO 2014/093635호(PCT/US2013/074691호), WO 2014/093655호(PCT/US2013/074736호), WO 2014/093712호(PCT/US2013/074819호), WO2014/093701호(PCT/US2013/074800호) 및 WO2014/018423호(PCT/US2013/051418호), WO 2014/204723호 (PCT/US2014/041790호), WO 2014/204724호 (PCT/US2014/041800호), WO 2014/204725호 (PCT/US2014/041803호), WO 2014/204726호 (PCT/US2014/041804호), WO 2014/204727호 (PCT/US2014/041806호), WO 2014/204728호 (PCT/US2014/041808호), WO 2014/204729호 (PCT/US2014/041809호), WO 2015/089351호 (PCT/US2014/069897호), WO 2015/089354호 (PCT/US2014/069902호), WO 2015/089364호 (PCT/US2014/069925호), WO 2015/089427호 (PCT/US2014/070068호), WO 2015/089462호 (PCT/US2014/070127호), WO 2015/089419호 (PCT/US2014/070057호), WO 2015/089465호 (PCT/US2014/070135호), WO 2015/089486호 (PCT/US2014/070175호), PCT/US2015/051691호, PCT/US2015/051830호. 또한, 각각 2013년 1월 30일; 2013년 3월 15일; 2013년 3월 28일; 2013년 4월 20일; 2013년 5월 6일 및 2013년 5월 28일에 출원된 미국 가출원 제61/758,468호; 제61/802,174호; 제61/806,375호; 제61/814,263호; 제61/819,803호 및 제61/828,130호에 대하여 참조가 이루어진다. 또한, 2013년 6월 17일에 출원된 미국 가출원 제61/836,123호에 대하여 참조가 이루어진다. 또한, 각각 2013년 6월 17일에 출원된 미국 가출원 제61/835,931호, 제61/835,936호, 제61/835,973호, 제61/836,080호, 제61/836,101호, 및 제61/836,127호에 대하여 참조가 이루어진다. 추가로, 2013년 8월 5일에 출원된 미국 가출원 제61/862,468호 및 제61/862,355호; 2013년 8월 28일에 출원된 제61/871,301호; 2013년 9월 25일에 출원된 제61/960,777호 및 2013년 10월 28일에 출원된 제61/961,980호에 대하여 참조가 이루어진다. 추가로, 2014년 10월 28일에 출원된 PCT/US2014/62558호, 각각 2013년 12월 12일에 출원된 미국 가출원 제61/915,148호, 제61/915,150호, 제61/915,153호, 제61/915,203호, 제61/915,251호, 제61/915,301호, 제61/915,267호, 제61/915,260호, 및 제61/915,397호; 각각 2013년 1월 29일, 및 2013년 2월 25일에 출원된 제61/757,972호 및 제61/768,959호; 모두 2014년 1월 11일 출원된 제62/010,888호 및 제62/010,879호; 각각 2014년 6월 10일 출원된 제62/010,329호, 제62/010,439호 및 제62/010,441호; 각각 2014년 2월 12일 출원된 제61/939,228호 및 제61/939,242호; 2014년 4월 15일 출원된 제61/980,012호; 2014년 4월 17일 출원된 62/038,358; 각각 2014년 9월 25일 출원된 제62/055,484호, 제62/055,460호 및 제62/055,487호; 및 2014년 10월 27일 출원된 62/069,243호에 대하여 참조가 이루어진다. PCT 출원, 특히 미국을 지정한 2014년 6월 10일 출원된 PCT/US14/41806호에 대하여 참조가 이루어진다. 2014년 1월 22일 출원된 미국 가출원 제61/930,214호에 대하여 참조가 이루어진다. PCT 출원, 특히 미국을 지정한 2014년 6월 10일 출원된 PCT/US14/41806호에 대하여 참조가 이루어진다.
미국 출원 제62/180,709호, 17-Jun-15, PROTECTED GUIDE RNAS (PGRNAS); 미국 출원 제62/091,455호, 12-Dec-14 출원, PROTECTED GUIDE RNAS (PGRNAS); 미국 출원 제62/096,708호, 24-Dec-14, PROTECTED GUIDE RNAS (PGRNAS); 미국 출원 제62/091,462호, 12-Dec-14, 제62/096,324호, 23-Dec-14, 제62/180,681호, 17-Jun-2015, 및 제62/237,496호, 5-Oct-2015, DEAD GUIDES FOR CRISPR TRANSCRIPTION FACTORS; 미국 출원 제62/091,456호, 12-Dec-14 및 제62/180,692호, 17-Jun-2015, ESCORTED AND FUNCTIONALIZED GUIDES FOR CRISPR-Cas SYSTEMS; 미국 출원 제62/091,461호, 12-Dec-14, DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-Cas SYSTEMS AND COMPOSITIONS FOR GENOME EDITING AS TO HEMATOPOETIC STEM CELLS (HSCs); 미국 출원 제62/094,903호, 19-Dec-14, UNBIASED IDENTIFICATION OF DOUBLE-STRAND BREAKS AND GENOMIC REARRANGEMENT BY GENOME-WISE INSERT CAPTURE SEQUENCING; 미국 출원 제62/096,761호, 24-Dec-14, ENGINEERING OF SYSTEMS, METHODS AND OPTIMIZED ENZYME AND GUIDE SCAFFOLDS FOR SEQUENCE MANIPULATION; 미국 출원 제62/098,059호, 30-Dec-14, 제62/181,641호, 18-Jun-2015, 및 제62/181,667호, 18-Jun-2015, RNA-TARGETING SYSTEM; 미국 출원 제62/096,656호, 24-Dec-14 및 제62/181,151호, 17-Jun-2015, CRISPR HAVING OR ASSOCIATED WITH DESTABILIZATION DOMAINS; 미국 출원 제62/096,697호, 24-Dec-14, CRISPR HAVING OR ASSOCIATED WITH AAV; 미국 출원 제62/098,158, 30-Dec-14, ENGINEERED CRISPR COMPLEX INSERTIONAL TARGETING SYSTEMS; 미국 출원 제62/151,052호, 22-Apr-15, CELLULAR TARGETING FOR EXTRACELLULAR EXOSOMAL REPORTING; 미국 출원 제62/054,490, 24-Sep-14, DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-Cas SYSTEMS AND COMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING PARTICLE DELIVERY COMPONENTS; 미국 출원 제61/939,154호, 12-FEB-14, SYSTEMS, METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH OPTIMIZED FUNCTIONAL CRISPR-Cas SYSTEMS; 미국 출원 제62/055,484호, 25-Sep-14, SYSTEMS, METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH OPTIMIZED FUNCTIONAL CRISPR-Cas SYSTEMS; 미국 출원 제62/087,537호, 4-Dec-14, SYSTEMS, METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH OPTIMIZED FUNCTIONAL CRISPR-Cas SYSTEMS; 미국 출원 제62/054,651호, 24-Sep-14, DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-Cas SYSTEMS AND COMPOSITIONS FOR MODELING COMPETITION OF MULTIPLE CANCER MUTATIONS IN VIVO; 미국 출원 제62/067,886호, 23-Oct-14, DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-Cas SYSTEMS AND COMPOSITIONS FOR MODELING COMPETITION OF MULTIPLE CANCER MUTATIONS IN VIVO; 미국 출원 제62/054,675호, 24-Sep-14 및 제62/181,002호, 17-Jun-2015, DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-Cas SYSTEMS AND COMPOSITIONS IN NEURONAL CELLS/TISSUES; 미국 출원 제62/054,528호, 24-Sep-14, DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-Cas SYSTEMS AND COMPOSITIONS IN IMMUNE DISEASES OR DISORDERS; 미국 출원 제62/055,454호, 25-Sep-14, DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-Cas SYSTEMS AND COMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING CELL PENETRATION PEPTIDES (CPP); 미국 출원 제62/055,460호, 25-Sep-14, MULTIFUNCTIONAL-CRISPR COMPLEXES AND/OR OPTIMIZED ENZYME LINKED FUNCTIONAL-CRISPR COMPLEXES; 미국 출원 제62/087,475호, 4-Dec-14 및 제62/181,690호, 18-Jun-2015, FUNCTIONAL SCREENING WITH OPTIMIZED FUNCTIONAL CRISPR-Cas SYSTEMS; 미국 출원 제62/055,487호, 25-Sep-14, FUNCTIONAL SCREENING WITH OPTIMIZED FUNCTIONAL CRISPR-Cas SYSTEMS; 미국 출원 제62/087,546, 4-Dec-14 및 제62/181,687호, 18-Jun-2015, MULTIFUNCTIONAL CRISPR COMPLEXES AND/OR OPTIMIZED ENZYME LINKED FUNCTIONAL-CRISPR COMPLEXES; 및 미국 출원 제62/098,285호, 30-Dec-14, CRISPR MEDIATED IN VIVO MODELING AND GENETIC SCREENING OF TUMOR GROWTH AND METASTASIS를 참조한다.
미국 출원 제62/181,659호, 18-Jun-2015 및 제62/207,318호, 19-Aug-2015, ENGINEERING AND OPTIMIZATION OF SYSTEMS, METHODS, ENZYME AND GUIDE SCAFFOLDS OF CAS9 OTHOLOGES AND VARIANTS FOR SEQUENCE MANIPULATION를 참조한다. 미국 출원 제62/181,663호, 18-Jun-2015 및 제62/245,264호, 22-Oct-2015, NOVEL CRISPR ENZYMES AND SYSTEMS, 미국 출원 제62/181,675호, 18-Jun-2015, 제62/285,349호, 22-Oct-2015, 제62/296,522호, 17-Feb-2016, 및 제62/320,231호, 8-Apr-2016, NOVEL CRISPR ENZYMES AND SYSTEMS, 미국 출원 제62/232,067호, 24-Sep-2015, 미국 출원 제14/975,085호, 18-Dec-2015, 유럽 출원 제16150428.7호, 미국 출원 제62/205,733, 16-Aug-2015, 미국 출원 제62/201,542호, 5-Aug-2015, 미국 출원 제62/193,507, 16-Jul-2015, 및 미국 출원 제62/181,739호, 18-Jun-2015, (각각의 명칭) NOVEL CRISPR ENZYMES AND SYSTEMS 및 미국 출원 제62/245,270호, 22-Oct-2015, NOVEL CRISPR ENZYMES AND SYSTEMS을 참조한다. 미국 출원 제61/939,256호, 12-Feb-2014, 및 WO 2015/089473호 (PCT/US2014/070152), 12-Dec-2014, (각각의 명칭) ENGINEERING OF SYSTEMS, METHODS AND OPTIMIZED GUIDE COMPOSITIONS WITH NEW ARCHITECTURES FOR SEQUENCE MANIPULATION을 참조한다. PCT/US2015/045504호, 15-Aug-2015, 미국 출원 제62/180,699호, 17-Jun-2015, 및 미국 출원 제62/038,358호, 17-Aug-2014, (각각의 명칭) GENOME EDITING USING CAS9 NICKASES를 또한 참조한다.
이들 특허, 특허 공보 및 출원 각각, 및 거기에 또는 그들 절차 중에 인용된 모든 문헌("출원 인용 문헌") 및 상기 출원 인용 문헌에 인용되거나 참조된 모든 문헌은 상기 출원 인용 문헌에 또는 상기 출원 인용 문헌의 임의의 문헌 및 본원에 참조로서 포함된 임의의 문헌에서 언급된 임의의 제품에 대한 임의의 지침서, 설명서, 제품 명세서, 및 제품 시이트와 함께, 참조로서 본원에 포함되며, 본 발명의 실시에 이용될 수 있다. 모든 문헌(예를 들어, 이들 특허, 특허 공보 및 출원 및 출원 인용 문헌)은 각각의 개별적 문헌이 참조로서 포함하는 것이 구체적으로 그리고 개별적으로 표시된 것과 동일한 정도로 참조로서 본원에 포함된다.
본 발명은 하기 실시예에서 추가로 예시될 것이며, 실시예는 단지 예시의 목적으로 제공된 것이고 어떠한 방식으로 본 발명을 제한하는 것으로 의도되지 않는다.
실시예
실시예 1: AsCpf1 PAM 인식의 유도된 진화
Cpf1은 부류 2 제V형 CRISPR 이펙터이다. 이는 단일 RNA-가이드된 엔도뉴클레아제이며, 엇갈린 이중-가닥 파손을 통해 DNA를 절단한다. 다중화 게놈 편집이 효율적이다. Cpf1은 PAM의 원위를 절단한다: 18 및 23 bp 하류(문헌[Zetsche et al. (2015) Cell; 163: 759-771]).
야생형 AsCpf1(예컨대 AsCpf1 및 LbCpf1)은 PAM 서열 TTTV(여기서, V는 A, C 또는 G임)를 인식한다.
대안적인 PAM 서열은 PAM 레퍼토리 및 이에 따라, 가능한 표적 서열의 양을 넓힐 것이다. 더욱이 더 짧은 PAM 서열은 마찬가지로 가능한 표적 서열의 양을 증가시킬 것이다. 인간 게놈은 41% GC, 59% AT(29.5% T)를 함유한다. 연속적인 3개의 T의 가능성은 = 0.0257(2.57%)이다. 대략 40 개 염기마다 TTT를 얻을 것이다. 연속적인 4개의 T의 가능성은 0.00758이다. 그래서, 게놈 내의 임의의 주어진 시작 위치에서 TTTV의 가능성은 1.81%이다. 대략 55개 염기마다 TTTV를 얻을 것이다.
AsCpf1(아시다미노코커스 종 BV3L6, UniProtKB/Swiss-Prot 수탁 번호 U2UMQ6.1; 유전자은행 수탁 번호 961512548)의 돌연변이유발을 통하여, PAM 인식이 확장될 수 있다. Cpf1의 PI(PAM 상호작용) 및 REC1 도메인은 DNA에 결합되는 경우 PAM 서열에 매우 근접하여 존재한다(도 1). 도 2 및 도 3에 기재된 바와 같은 방법에 따라, 전체 PAM 근위 영역에 걸쳐 있는 점 돌연변이를 생성하고, 대안적인 PAM 인식에 대하여 평가하였다. 돌연변이체 Cpf1 라이브러리를 생성하였으며, 여기서, 상이한 Cpf1 돌연변이체를 에스케리키아 콜라이에서 발현할 수 있는 CamR 플라스미드 상에 인코딩하였다(pACYS Cpf1 플라스미드). 또한, 플라스미드는 DNA 표적 유전자좌로 결합할 수 있는 기능적 CPRISPR/Cpf1 복합체의 재구성을 위하여 직접 반복부가 측접한 스페이서 서열을 함유하였다. 라이브러리를 에스케리키아 콜라이에 형질전환시켜, Cpf1 돌연변이체 라이브러리를 함유하는 에스케리키아 콜라이를 생성하였다.
PAM 서열이 측접한 표적 서열을 포함하며, AmpR 마커를 추가로 포함하는 제2 플라스미드를 돌연변이체 Cpf1 에스케리키아 콜라이 라이브러리에 형질전환시켰다. 이를 다수의 대안적인 PAM 서열에 대하여 병행하여 수행하였다.
라이브러리 복잡도는 32,256이었다(84 개 위치*32 개 코돈*12 개 PAM).
Cam/Amp 배지에서의 선택을 허용하여, 특정 Cpf1 돌연변이체에 의해 인식되는 대안적인 PAM 서열을 확인하였다. PAM 서열이 특정 Cpf1 돌연변이체에 의해 인식되었다면, AmpR 함유 플라스미드를 절단하였으며, Amp 내성이 소실되었다. 따라서, 특정 PAM 서열을 인식하는 라이브러리의 구성원의 특이적인 고갈이 존재하였다. Cpf1 돌연변이체를 함유하며, 스크린에서 고갈된 플라스미드의 시퀀싱에 의해, 대안적인 PAM 서열을 인식하는 특정 Cpf1 돌연변이체가 확인되었다.
상기 기재된 방법은 야생형 AsCpf1으로 검증하였다(도 4). 실제로, 야생형 AsCpf1에 의해 인식되는 PAM 서열(TTTC)이 Cam/Amp 배지 상에서의 박테리아 성장을 유지할 수 없는 것이 입증되었다.
이어서, 상기 기재된 방법을 돌연변이체 AsCpf1 라이브러리에 적용하였다. 대조군으로서, PAM 서열이 없는 스크린에서 상이한 Cpf1 돌연변이체의 표현(도 5a)에 의해, 특정 돌연변이체의 유의미한 과다표시 또는 과소표시가 입증된 한편, 야생형 Cpf1에 의해 인식되는 PAM 서열이 있는 스크린에서 상이한 Cpf1 돌연변이체의 표현(도 5b)에 의해, 유의미한 과소표시(또는 야생형 Cpf1의 고갈)가 입증되었다. 다양한 대안적인 PAM 서열에 대한 상이한 Cpf1 돌연변이체의 표현은 도 6에 나타나 있다. 도 6(및 도 7 내지 도 10에 추가로 상술됨)으로부터, 다양한 Cpf1 돌연변이체가 비-정규 PAM 서열을 인식하는 것이 명백해진다.
도 7은 S542R 돌연변이를 갖는 AsCpf1 돌연변이체가 적어도 PAM 서열 TCCC를 인식할 수 있음을 보여준다. 도 8은 S542R을 갖는 AsCpf1 돌연변이체가 적어도 PAM 서열 TTCC 돌연변이를 인식할 수 있음을 보여준다. S542R은 TCCC 및 TTCC의 인식을 허용한다(PAM의 3번째 위치에 C를 허용한다).
도 9는 다양한 K548 돌연변이를 갖는 AsCpf1 돌연변이체가 적어도 PAM 서열 TATC를 인식할 수 있는 것을 보여준다. 적어도 돌연변이체 K548A, K548G, K548L, K548R, K548I, K548N, K548C, K548Q, K548H, K548F, K548S, K548T, K548W, K548Y, K548V는 PAM 서열 TATC를 인식할 수 있다. 도 10은 다양한 K548 돌연변이를 갖는 AsCpf1 돌연변이체가 적어도 PAM 서열 TGTC를 인식할 수 있는 것을 보여준다. 적어도 돌연변이체 K548G, K548R, K548C, K548Q, K548H, K548S, K548T, K548W, K548Y, K548V는 PAM 서열 TGTC를 인식할 수 있다. K548은 PAM의 2번째 염기에 대한 티민 엄격성을 제공한다. 많은 대안적인 아미노산이 TATC 또는 TGTC PAM의 인식을 허용한다.
추가의 대안적인 PAM 서열을 인식하는 추가의 AsCpf1 돌연변이체(데이터 미도시)가 확인되었다: 167A(NTTV 또는 TTV를 인식), 604A(TTTV를 인식), 607A(TCCC를 인식).
시험관내 절단 실험(본질적으로 문헌[Zetsche et al. (2015), Cell 163:1-13]에 기재된 바와 같음)을 수행하였으며, 여기서, AsCpf1을 발현하는 포유류 세포로부터의 용해물을 시험관에서 표적 부위 앞의 8-bp 무작위화된 PAM을 함유하는 플라스미드 라이브러리와 인큐베이션시켰다. 표적화 가능한 PAM을 함유하는 PAM 라이브러리의 구성원은 절단된 한편, 모든 다른 PAM은 온전하게 남아 있었다. 미절단된 PAM을 시퀀싱하고, 음성 대조군과 비교하였다. 대조군에 비하여 고갈된 PAM은 Cpf1이 절단할 수 있는 것들을 나타내었다 -- 고갈된 PAM 서열의 집합 세트에 대한 서열 로고는 도 13에 나타나 있다.
Cpf1 단백질의 구조적 고려사항 및 gRNA 및 표적 서열과의 그의 상호작용에 기초하여, AsCpf1(아시다미노코커스 종 BV3L6)의 하기의 아미노산 잔기가 PAM 서열의 물리적으로 근처에서(즉, PAM의 1.4 nm 이내에서) 관찰되었다: Y11, Q12, V13, S14, K15, T16, L17, Q34, F36, E39, D40, R43, H46, Y47, L50, I54, I57, Y58, I111, A126, E127, I128, Y129, K130, G131, L132, F133, K134, A135, E136, A157, L158, L159, R160, S161, F162, D163, K164, F165, T166, T167, Y168, F169, S170, G171, F172, Y173, E174, N175, R176, K177, N178, K532, L533, N534, F535, Q536, M537, P538, T539, L540, A541, S542, G543, W544, D545, V546, N547, K548, E549, K550, N551, N552, G553, A554, I555, L556, L565, G566, I567, M568, P569, K570, Q571, K572, G573, R574, Y575, K592, M593, Y594, Y595, D596, Y597, F598, P599, D600, A601, A602, K603, M604, I605, P606, K607, C608, S609, T610, Q611, L612, K613, A614, V615, T616, A617, H618, F619, Q620, I626, L627, L628, S629, N630, N631, F632, I633, E634, P635, L636, E637, I638, I642, Y643, D644, L645, N646, N647, P648, E649, E651, P652, K653, K654, F655, Q656, W676, F679, T680, D682, F683, L684, S685, K686, Y687, T688, K689, T690, T691, S692, I693, L707, Y711, L714, N715, P716, L717, L718, Y719, H720, I721, S722, K739, W765, L768, F769, N773, T777, S778, I779, K780, L781, N782, G783, Q784, A785, E786, F871, H872, V873, P874, I875, T876, L877, N878, Y879, Q880, A881, A882, N883, S884 및 Q1048.
이들 잔기 중 하나 이상의 돌연변이는 PAM 인식에 영향을 미치는 것으로 예상된다.
하기의 아미노산 잔기를 돌연변이유발을 위해 선택하였으며, 이에 따라, 하기의 표시된 돌연변이된 아미노산 잔기를 갖는 돌연변이된 Cpf1 단백질을 초래하였다: K130, G131, L132, F133, K134, A135, E136, F162, D163, K164, F165, T166, T167, Y168, F169, S170, G171, F172, Y173, E174, N175, R176, K177, Q536, M537, P538, T539, L540, A541, S542, G543, W544, D545, V546, N547, K548, E549, K550, N551, N552, K570, Q571, K572, G573, Y595, D596, Y597, F598, P599, D600, A601, A602, K603, M604, I605, P606, K607, C608, S609, T610, Q611, L612, K613, A614, V615, N630, N631, F632, N646, N647, P648, E649, K650, E651, P652, K653, F683, L684, S685, K686, Y687, T688, K689 또는 T690.
하기의 PAM 서열을 AsCpf1 돌연변이체 라이브러리를 사용하여 박테리아 PAM 스크린에서 스크리닝하였다: TATC, TGTC, TATT, TTCC, TCCC, TTAC, TCTT 및 TTGC.
하기의 표는 추정의 PAM이 가정되는(우측 열) 박테리아 PAM 스크린(중간 열)에서 확인된 바와 같이, 표기된 돌연변이체(AsCpf1)와 회합되는 것으로 관찰되는 PAM 서열을 나타낸다. 정거도 표기된 PAM 서열은 표기된 돌연변이체에 의해 인식된다. 생성하고 시험한 돌연변이체는 볼드체로 나타나 있다. 다른 돌연변이체의 PAM 서열을 생성된 돌연변이체에 대한 PAM 서열의 지식 및 구조적 고려사항에 기초하여 가정한다.
Figure pat00027
Figure pat00028
전체 PAM 선호도를 평가하기 위하여, S542R/K607R(본원에서 이후에 "RR"), S542R/K548V(본원에서 이후에 "RV") 및 S542R/K548V/N552R(본원에서 이후에 "RVR")을 포함하는 변이체를 시험관내 PAM 확인 검정에 의해 야생형과 비교하였다. AsCpf1(또는 변이체)을 발현하는 HEK293 세포로부터의 세포 용해물을 시험관내 전사된 crRNA 및 축퇴성 서열(5'-NNNNNNNN-표적)이 앞에 있는 불변 표적을 함유하는 플라스미드 DNA의 라이브러리와 인큐베이션시켰다. 각 Cpf1 변이체에 있어서, 절단 반응의 10회의 반복실험을 수행하였으며, 각각을 상이한 기간 동안 인큐베이션시켜, 절단 역학을 결정하였다.
야생형 AsCpf1은 TTTV PAM에서 가장 활성이었으며(도 13c), 낮은 절단 속도가 NTTV, TCTV, TTCV 및 TTTT에 대하여 관찰되었이며, 이는 HEK293 세포에서의 관찰과 일치한다.
도 13은 시험관내 절단 검정에서 결정되는 바와 같은 S542R/K607R AsCpf1 돌연변이체에 대한 (N)YCV, 예컨대 TYCV, VYCV 또는 YCV PAM 서열의 확인을 보여준다. 유사하게, 시험관내 절단 검정에 의해, AsCpf1 돌연변이체 S542R/K548V에 대한 PAM 서열을 AYV, TYV 및 TGYV로 확인하였다. 이러한 돌연변이체는 또한, 야생형 AsCpf1보다 효율이 더 크지만, 특이성이 감소되어, 정규 PAM TTTV를 인식하는 것으로 관찰되었다. 도 13c는 야생형 및 RR 및 RVR 변이체에 대한 모든 4-염기 PAM 모티프에 대한 정규화된 절단 속도를 보여준다. RVR 변이체는 TATV PAM에서 가장 높은 활성을 가졌으며, 이는 이러한 PAM에서 야생형에 대하여 활성이 거의 없거나 없는 것과 비교된다. 이들 PAM은 인간 게놈의 비-반복 영역에서 Cpf1의 표적화 범위를 증가시키고(도 13d), 표적화될 수 없는 게놈 DNA 스트레치의 크기를 감소시킨다(도 13e).
실시예 2 - 절단된 가이드
HEK293FT 세포를 24-웰 플레이트에서 웰마다 400 ng의 AS 또는 LbCpf1 인코딩 플라스미드 및 100 ng의 U6::crRNA PCR 단편으로 트랜스펙션시켰다. 길이가 24 nt(전체 길이) 내지 14 nt이며, 3'으로부터 절단된, DNMT1-3 또는 DNMT1-4를 표적화하는 가이드를 사용하였다. 24 nt 내지 19 nt 길이의 가이드는 두 효소 모두에서 유사한 활성을 보였다. 18 nt 가이드를 사용하여 활성이 다소 감소되었으며, 17 nt 내지 15 nt의 가이드를 사용하여 추가로 감소되었다. 15 nt 미만의 가이드를 사용하여 활성이 거의 관찰되지 않거나, 활성이 관찰되지 않았다(도 11b 내지 도 11e).
실시예 3 - 부분적으로 결합하는 가이드.
HEK293FT 세포를 24-웰 플레이트에서 웰마다 400 ng의 AS 또는 LbCpf1 인코딩 플라스미드 및 100 ng의 U6::crRNA PCR 단편으로 트랜스펙션시켰다. 모두 길이가 24 nt인 DNMT1-3 또는 DNMT1-4를 표적화하는 가이드를 사용하였다. 매치되는 뉴클레오티드의 수는 24 nt(전체 길이)로부터 14 nt까지 달라졌으며, 매치되는 뉴클레오티드는 PAM에 가장 가까이 존재하며, 매치되지 않는 뉴클레오티드는 3' 말단에 존재한다.
24 nt 내지 19 nt와 매치되는 가이드에 의해, 두 효소 모두에서 유사한 활성이 나타났다. 18 nt와 매치되는 가이드를 사용하여 활성이 다소 감소되었다. 17 nt 내지 15 nt와 매치되는 가이드는 검출 가능한 활성을 거의 보이지 않거나, 보이지 않았다. 15 nt 미만과 매치되는 가이드에 대하여 활성이 검출 가능하지 않았다(도 12b 내지 도 12e).
실시예 4 - 포유류 세포에서의 Cpf1 돌연변이체의 확인.
상이한 Cpf1 돌연변이체(본질적으로 문헌[Zetsche et al. (2015), Cell, 163:759-771]에 기재된 바와 같은 아시다미노코커스 종 BV3L6)를 진핵 발현 벡터(일 예로서, S542/K607R 돌연변이를 갖는 AsCpf1을 평가하기 위해 사용되는 발현 벡터는 도 17에 제공되어 있으며; 다른 Cpf1 돌연변이체를 위하여 유사한 발현 벡터를 설계하였음)에서 클로닝하고, HEK293T 세포에 트랜스펙션시켰으며, 삽입결실 백분율의 검출에 기초하여 유전자 편집을 평가하였다. 하기의 Cpf1 돌연변이체를 생성하였으며, 단일의 또는 다수의 점 돌연변이(즉, 단일의 또는 다수의 아미노산 돌연변이)를 포함하였다. 또한, 나열된 아미노산 돌연변이 주변의 및 이를 포함하는 시험되는 PAM 서열 및 Cpf1 핵산 서열이 표에 나타나 있다(위치 539 내지 552).
Figure pat00029
Figure pat00030
Figure pat00031
Figure pat00032
Figure pat00033
도 14의 표기된 표적 서열 번호에 상응하는 표적 서열은 하기 표에 나타나 있다(모든 표적 서열에 대하여, 결과가 도 14에 나타나 있지 않다).
Figure pat00034
HEK 세포에서 삽입결실 활성%를 도 14에 나타낸 바와 같이, 다양한 PAM 서열과 회합된 표적 서열에 대하여(가이드 RNA 표적 부위를 DNMT1 유전자 내에서 선택하였음) 또는 도 15에 나타낸 바와 같이, AsCpf1 S542R/K607R 돌연변이체에 있어서, 표기된 YCN PAM 서열과 회합된 상이한 표적 유전자의 다양한 표적 서열에 대하여 평가하였다. 표기된 Cpf1 돌연변이체의 삽입결실%를 야생형 Cpf1 또는 음성 대조군(Cpf1이 트랜스펙션되지 않음)의 삽입결실%와 비교하였다.
도 14의 상이한 표적 서열 및 표적 유전자, 및 S542R/K607R 돌연변이체에 대한 컨센서스 PAM 서열 YCN을 야기하는 측접하는 PAM 서열은 하기 표에 나타나 있다.
Figure pat00035
Figure pat00036
Figure pat00037
RR 및 RVR 변이체의 게놈-와이드 편집 특이성을 BLISS(동소에서의 이중-가닥 파손 표지화 및 시퀀싱)를 사용하여 평가하였으며, 이는 게놈에 걸쳐 DNA 이중-가닥 파손(DSB)을 정량화한다. 변이체를 야생형과 비교하기 위하여, 분석은 모든 3가지 효소에 의해 신뢰성 있게 절단될 수 있는 PAM을 갖는 표적 부위에 제한되었으며; TTTV는 이러한 기준을 만족시키는 유일한 PAM이었지만, 그것은 RR 변이체에 대하여 더 낮은 활성을 갖는다. 평가된 4가지 표적 부위 중 3가지(VEGFA, GRIN2B 및 DNMT1)에 있어서, 야생형 또는 변이체에 있어서, BLISS-확인된 유전자좌 중 임의의 것의 딥 시퀀싱으로부터 표적외 활성이 검출되지 않았다(도 19a). 제4 표적 부위(EMX1)에 있어서, BLISS에 의해, 검출 가능한 삽입결실을 갖는 6개의 표적외 부위가 확인되었으며, 6개의 부위 모두는 TTCA PAM을 가지고, 가이드의 처음 19 bp에 1개 이하의 미스매치를 가졌다. 야생형에 비하여 두 변이체 모두는 이들 표적외 부위에서 증가된 활성을 가졌으며, 이는 TTCA PAM을 인식하는 그들의 증가된 능력과 일치한다. 반면, 알려져 있는 TTTV 표적외 부위를 갖는 상이한 부위를 표적화하는 경우, 변이체는 감소된 표적외 활성을 나타내었으며(도 19b), 이는 또한, PAM 선호도와 일치하다. 종합하여, 이들 결과는 변이체가 야생형 AsCpf1과 유사한 높은 수준의 편집 특이성을 보유하는 것을 나타낸다.
예를 들어, 양으로 하전된 또는 극성 잔기와 표적 DNA 간의 비-특이적인 접촉을 제거함으로써 특이성이 개선될 수 있는지 여부를 시험하였다. 비-표적 DNA 가닥과 상호작용하는 것으로 가정된 단백질의 틈 내에 위치한 K949A를 RR 및 RVR 변이체와 병용하여 시험하였으며, K949A는 평가되는 모든 표적외 부위에서 절단을 감소시키면서, 높은 수준의 표적상 활성을 유지하였다(도 19c).
Cpf1-과 효소가 강력한 서열 및 구조적 상동성을 갖기 때문에, AsCpf1 내의 S542, K548, N552 및 K607 위치는 다른 Cpf1 오솔로그에서 명백한 관련성을 갖는다. 결정 구조에 기초하여, LbCpf1은 예를 들어, 각각 돌연변이 G532R/K595R 및 G532R/K538V/Y542R에 의해 TYCV/CCCC 및 TATV PAM을 인식하도록 유사하게 조작될 수 있다.
Figure pat00038
Figure pat00039
Figure pat00040
Figure pat00041
293FT 세포에서 Cpf1 절단 활성
인간 발현을 위해 코돈 최적화된 Cpf1 단백질을 N-말단 핵 국소화 태그와 함께 합성하고 Genscript에 의해 pcDNA3.1 발현 플라스미드 내로 클로닝하였다. crRNA 서열의 발현을 유도하는 U6 프로모터로 구성된 PCR 앰플리콘을 Herculase II(Agilent Technologies)를 사용하여 생성하였다. 400 ng의 Cpf1 발현 플라스미드 및 100 ng의 crRNA PCR 생성물을 Lipofectamine 2000 시약(Life Technologies)을 사용하여 75% 내지 90% 컨플루언시로 HEK293FT 세포의 24-웰 플레이트 내로 트랜스펙션시켰다. QuickExtract™ DNA Extraction Solution(Epicentre)을 사용하여 게놈 DNA를 수확하였다.
293FT 세포에서 Cpf1 삽입결실 패턴을 특성화하기 위한 딥 시퀀싱
Cpf1 절단의 활성을 평가하기 위하여 기재된 바와 같이, HEK293FT 세포를 트랜스펙션시키고 수확하였다. DNMT 표적을 측접하는 게놈 영역을 2 라운드 PCR 영역을 사용하여 증폭시켜 Illumina P5 어댑터뿐만 아니라 표적 앰플리콘에 특유의 샘플-특이적 바코드를 첨가하였다. PCR 생성물을 2% E-겔(Invitrogen) 상에서 수행하고, 제조자의 권장 프로토콜에 따라서 QiaQuick Spin Column(Qiagen)을 사용하여 겔-추출하였다. 샘플을 풀링하고 Qubit 2.0 Fluorometer(Life Technologies)에 의해 정량화하였다. 제조된 cDNA 라이브러리를 MiSeq(Illumina) 상에서 시퀀싱하였다. Geneious 6.0.3 Read Mapper의 Python 실행을 사용하여 삽입결실을 매핑하였다.
실시예5 - 예시적인 방법
라이브러리 작제. T7 프로모터에 의해 구동되는 인간 코돈-최적화된 AsCpf1을 변형된 pACYC 백본 내로 클로닝하고, 적합한 침묵 돌연변이를 통해 선택된 PAM-근위 AsCpf1 잔기에 측접하는 독특한 제한 부위를 도입하였다. 각 잔기에 있어서, 돌연변이유발 삽입물을 돌연변이된 코돈이 축퇴성 NNK 염기 혼합물(여기서, K는 G 또는 T임)에 의해 대체된 짧은 상보성 올리고뉴클레오티드로서 합성하였다(Integrated DNA Technologies). 또한, 스크린 판독 동안 시퀀싱 오류를 편집하기 위하여 비-돌연변이 이웃 코돈에서 침묵 돌연변이의 독특한 조합을 생성함으로써 각 축퇴성 코돈 위치에 바코드를 붙였다. 변이체 라이브러리를 카세트 돌연변이유발에 의해 조립하고, 미니-프렙(mini-preped)하고, 풀링하고, 이소프로판올로 침전시켰다.
에스케리키아 콜라이 음성 선별 스크린. NovaBlue(DE3) 에스케리키아 콜라이(Novagen)를 변이체 라이브러리로 형질전환시키고, 25 μg/mL의 클로람페니콜을 함유하는 LB 아가에 플레이팅하였다. 생존하는 콜로니를 긁어내고, 25 μg/mL 클로람페니콜을 갖는 ZymoBroth에서 0.4 내지 0.4의 OD까지 배양하고, Mix & Go 키트(Zymo)를 사용하여 컴피턴트가 되게 하였다. 스크리닝되는 각 돌연변이체 PAM에 있어서, 컴피턴트 에스케리키아 콜라이 풀을 돌연변이체 PAM을 함유하는 표적 플라스미드 100 ng으로 형질전환시키고, 얼음에서 15 내지 30분 인큐베이션시키고, 421에서 30초 동안 열 충격을 가하고, IPTG의 부재 하에 100 μg/mL의 앰피실린 및 25 μg/mL의 클로람페니콜을 함유하는 LB 아가(Affymetrix) 상에 플레이팅하였다. 에스케리키아 콜라이를 표적 부위가 결여된 pUC19로 형질전환시킴으로써 음성 대조군을 수득하였다. 생존하는 콜로니로부터 플라스미드 DNA를 미디-프렙(midi-prep)(Qiagen)에 의해 단리하였다. 돌연변이를 함유하는 영역을 Illumina 어댑터를 함유하는 맞춤 프라이머로 증폭시키고, 600-사이클 MiSeq 키트(Illumina)를 사용하여 쌍형성-말단을 시퀀싱하였다. 판독물을 코돈 바코드를 침묵화시키기 위한 완벽한 매치; 3개의 NNK 염기의 각각에 대하여 적어도 30의 Phred 품질(Q 점수); 및 적용 가능한 경우 정방향 및 역방향 판독 간의 일관성을 요구함으로써 필터링하였다. 각 변이체에 대한 판독 계수를 정규화시켜, TAG(정지) 코돈의 평균 존재비가 음성 대조군과 동등한 것을 추정하였다.
시험관내 PAM 확인 검정. AsCpf1 변이체를 인코딩하는 플라스미드를 하기 기재된 바와 같이 HEK293T 세포 내로 트랜스펙션시켰다. 세포 용해물을 ETDA-미함유 컴플리트 프로테아제 억제제 칵테일(cOmplete Protease Inhibitor Cocktail)(Roche)이 보충된 용해 완충액(20 mM HEPES, 100 mM KCl, 5 mM MgCl2, 1 mM DTT, 5% 글리세롤, 0.1% 트리톤 X-100)으로 제조하였다. crRNA를 제조처의 권고된 프로토콜에 따라 맞춤 올리고뉴클레오티드 및 HiScribe T7 시험관내 전사 키트(NEB)를 사용하여 시험관내에서 전사시켰다. PAM 라이브러리에 있어서, 33 bp 표적 부위 앞의 축퇴성 8 bp 서열을 pUC19의 MCS 내로 클로닝하고, 라이브러리를 AatII 및 LguI으로 분해하고, 겔 추출한 다음, 사용하였다. 각 시험관내 절단 반응은 총 10 μL의 부피에 있어서 1 μL 10x CutSmart 완충액(NEB), 25 ng PAM 라이브러리, 250 ng 시험관내 전사된 crRNA, 0.5 μL의 세포 용해물 및 물로 이루어져 있다. 반응물을 37℃에서 인큐베이션시키고, 50 μL 완충액 PB(Qiagen)를 첨가함으로써 켄칭시킨 다음, 컬럼 정제하였다. 정제된 DNA를 Illumina 어댑터를 함유하는 맞춤 프라이머를 사용하여 총 29 사이클에 걸쳐 2 라운드의 PCR로 증폭시키고, 75-사이클 NextSeq 키트(Illumina)로 시퀀싱하였다. 각 Cpf1 변이체에 있어서, 개별 시험관내 절단 반응을 1.15분, 4분, 10분, 15분, 20분, 30분, 40분, 90분 및 175분 동안 수행하였다. 축퇴성 서열의 미변형 라이브러리를 0분 시점으로서 사용하였다. 음성 대조군을 미변형 HEK293T 세포로부터의 용해물을 사용하여 10분에 취하였다.
PAM 절단 역학의 컴퓨터 분석. 도 23 및 도 24도 또한 참조한다. 시퀀싱 판독물을 Phred 품질(8개의 축퇴성 PAM 염기 전부에 대하여 30 이상)에 의해 필터링한다. 각 절단 반응을 위하여, 48개 PAM 서열의 각각에 대한 고갈 비를 (절단 반응에서의 정규화된 판독물 계수) / (음성 대조군에서의 정규화 판독물 계수)로서 계산하였다. 이어서, 각 고갈 비를 야생형 AsCpf1 또는 변이체에 의해 절단되지 않는 모든 NNNNVRRT 서열의 고갈 비 중간값으로 나누었다. 각 Cpf1 변이체에 있어서 시점에 걸친 각 PAM 서열(총 48개)의 고갈 비를 비-선형 최소 제곱을 사용하여 지수적 감소 모델 x(t)= c 0 + ce -kt 에 핏팅시켰으며, 여기서, x(t)는 시간 t에서의 고길 비이며, 용어 c 0 ≤ 0.2, c k(분-1의 속도 상수)는 파라미터이다. 각 변이체이 있어서, 각 4-염기 PAM의 절단 비 k를 상기 PAM에 상응하는 256개 8-염기 서열의 절단 비 중간값으로서 계산하였으며; 예를 들어, TTTA의 절단 비를 형태 NNNNTTTA의 256개 서열의 절단 비 중간값으로 계산하였다.
세포 배양 및 트랜스펙션. 인간 배아 신장 293 및 Neuro2a 세포주를 37℃에서 5% CO2 인큐베이션과 함께, 10% FBS(Gibco)가 보충된 둘베코의 변형 이글스 배지에서 유지하였다. 세포를 트랜스펙션 하루 전에 24- 또는 96-웰 플레이트(Corning)에 24-웰마다 대략 1.2 x 105개 세포 또는 96-웰마다 2.4 x 104개 세포의 밀도로 씨딩하고, 제조처의 권고된 프로토콜에 따라 Lipofectamine 2000(Life Technologies)을 사용하여 50 내지 80% 컨플루언시에서 트랜스펙션시켰다. 세포 용해물에 있어서, 24-웰마다 500 ng의 Cpf1 플라스미드를 전달하였다. HEK293T 세포에서의 삽입결실 분석을 위하여, 24-웰마다 총 400 ng의 Cpf1 플라스미드 + 100 ng의 crRNA 플라스미드 또는 96-웰마다 100 ng의 Cas9 + 50 ng의 crRNA 플라스미드를 전달하였다. Neuro2a 세포에서의 BLISS 및 삽입결실 분석을 위하여, 24-웰마다 Cpf1 및 crRNA 둘 모두가 있는 500 ng의 플라스미드를 전달하였다. 모든 삽입결실 및 BLISS 실험은 23 개 뉴클레오티드의 가이드 길이를 사용하였다.
삽입결실 정량화. 모든 삽입결실 비를 표적화된 딥 시퀀싱(Illumina)에 의해 정량화하였다. 삽입결실 라이브러리 제조를 위하여, 세포를 트랜스펙션 대략 3일 후에 수집하고, 펠렛화된 세포를 QuickExtract(24-웰마다 80 μL 또는 96-웰마다 20 μL) 중에 재현탁화시킨 다음, 65℃에서 15분, 68℃에서 15분 및 98℃에서 10분 동안 인큐베이션시킴으로써 QuickExtract DNA 추출 키트(Epicentre)를 사용하여 게놈 DNA를 추출하였다. 딥 시퀀싱을 위한 앰플리콘을 2 라운드의 PCR을 사용하여 생성하여, Illumina 핸들(handle)을 부착하였다. 절단 부위 근처의 50 내지 70 bp 창의 끝을 기술하는 스트링과의 정확한 매치에 대하여 각 앰플리콘을 검색함으로써 삽입결실을 컴퓨터로 계수하였다. 이어서, 이들 스트링 간의 bp의 거리를 참조 게놈 내의 상응하는 거리와 비교하고, 2가지 거리가 상이하면, 앰플리콘을 삽입결실로서 계수하였다. 각 시료에 있어서, 삽입결실 비를 (삽입결실을 갖는 판독물의 수)/(총 판독물의 수)로서 계산하였다. 총 1000개 미만의 판독물을 갖는 시료를 배제하였다. 음성 대조군 데이터가 나타나 있지 않으며, 삽입결실 백분율은 백그라운드를 제한 최대 우도 추정을 나타낸다. 특히, 총 R개의 판독물을 갖는 시료에 있어서, 이 중 n = R은 삽입결실이며, 위양성율 0 ≤ α ≤ 1(음성 대조군에 의해 결정시)이며, 진(true) 삽입결실 비는 max{0,[((n/R)-α]/(1-α)}로 추산하였다.
Cpf1 표적화 범위의 컴퓨터 분석. 반복부 및 낮은 복잡도 영역이 표시된 완전한 GRCh38 인간 게놈 어셈블리 및 코딩 서열을 Ensembl로부터 다운로드하고, 도 28에 기재된 바와 같이 분석하였다.
BLISS. 모든 BLISS 실험 및 분석을 이전에 기재된 바와 같이 수행하였다. Cpf1의 엇갈린 절단 부위에 대한 데이터 분석을 이전의 분석으로부터 약간 변형시켜, 감도를 증가시켰다. 이전에, DSB 핫스폿, 동원체 및 말단소체에서 백그라운드 DSB로부터 진정한 뉴클레아제 유도된 사건을 구별하기 위하여, 컷오프를 -6bp 미만으로 중첩된 쌍별 판독물의 분획에 기초하여 사용하였다. 이러한 컷오프를 Cas9 표적외 분석으로부터의 실험 데이터에 기초하여 0.95로 설정하였다. Cpf1의 엇갈린 절단 부위에 의해 생성되는 변이를 수용하기 위하여, 이러한 컷오프를 0.85로 완화시킴으로써 진정한 Cpf1 표적외에 대한 더 큰 감도가 관찰될 수 있음이 관찰되었다. 모든 다른 분석, 예컨대 가이드 상동성 점수 계산은 기재된 바와 같았다.
시료 크기 및 통계학. 각 측정에 대한 시료 크기는 박테리아 콜로니 계수에 있어서 n = 3(도 19c); 조합 돌연변이유발(도 20a) 및 BLISS 유전자좌의 삽입결실 분석(도 21a)에 있어서 n = 4; 및 모든 다른 삽입결실 데이터에 있어서, n = 2 또는 n = 3이었다. 모든 도면에서 오차 막대는 평균의 표준 오차를 보여준다.
플라스미드 및 가이드 서열. 이러한 연구에 사용되는 플라스미드 및 가이드 서열의 목록을 표 20 및 표 21에서 찾을 수 있다.
실시예 6 - 변경된 PAM 특이성을 갖는 조작된 Cpf1 변이체
crRNA 및 표적 DNA와의 복합체에서의 AsCpf1의 결정 구조에 기초하여, PAM 듀플렉스의 근위의 AsCpf1의 60개 잔기는 표적화된 돌연변이유발을 위하여 선택하였다(도 19a 및 표 17). 카세트 돌연변이유발을 사용하여 각 위치에서 코돈을 무작위화시킴으로써 이들 잔기에서 대부분의 단일 아미노산 치환을 인코딩하는 AsCpf1 변이체의 플라스미드 라이브러리를 구축하였다. 코돈 무작위화의 이용은 오류-유발 PCR보다 더 큰 돌연변이 범위가 획득되게 하며, 추가로 주형 서열에 의해 야기되는 표상의 편향을 방지한다.
에스케리키아 콜라이에서 플라스미드 간섭-기반의 고갈 스크린을 사용하여 비-정규 PAM에서 절단 활성을 갖는 이러한 라이브러리 내의 변이체를 확인하였다(도 19a). 검정에서, 클로람페니콜과 함께 유지되는 플라스미드로부터의 각각 crRNA 및 Cpf1의 변이체를 발현하는 에스케리키아 콜라이의 풀을 앰피실린 내성 유전자 및 돌연변이된 PAM을 갖는 표적 부위를 지니는 제2 플라스미드로 형질전환시켰다. 성공적인 표적 절단은 앰피실린 내성의 소실 및 이후에 앰피실린 선별 배지에서 성장시키는 경우 세포사를 초래하였다. 생존하는 박테리아에서 원래의 라이브러리를 Cpf1-함유 플라스미드 DNA의 서열과 비교함으로써, 돌연변이된 PAM의 이들의 신규한 절단 활성의 결과로서 고갈된 변이체를 결정하였다.
이러한 접근법을 효율적으로 사용하여, 야생형(WT) AsCpf1로부터 비-정규 PAM 활성을 갖는 변이체를 구별하기 위하여, 야생형 AsCpf1이 최소의 활성을 가졌던 PAM 서열을 사용하여, 신규한 변이체에 의한 역학적 활성 범위를 결정하였다. 성공적인 플라스미드 간섭으로 인한 에스케리키아 콜라이 사멸에 의해 결정되는 바와 같이, PAM 내의 치환 돌연변이에 대한 야생형 AsCpf1의 감수성을 평가하여, 단일의 뉴클레오티드 치환을 갖는 PAM(즉, NTTV, TNTV 및 TTNV, 여기서, V는 C이도록 임의적으로 선택되었음)에 집중하였다.
NTTC 및 TCTC PAM으로 형질전환시키는 경우, 야생형 AsCpf1을 발현하는 에스케리키아 콜라이는 앰피실린 배지에서 무시할 수 있는 생존을 가졌으며(도 19c), 이는 이들 PAM 서열이 AsCpf1-매개의 DNA 플라스미드 절단을 지지하며, 변이체 라이브러리를 스크리닝하기 위하여 사용할 수 없음을 나타낸다. 대조적으로, 단일의 돌연변이(TATC, TGTC, TTAC, TTCC 및 TTGC)를 갖는 다른 5개의 PAM은 주목할만한 생존률을 가졌다. AsCpf1 변이체 라이브러리를 이들 5가지 PAM에서, 그리고 이중 돌연변이(TCCC)를 갖는 추가의 PAM에서 활성에 대하여 스크리닝하였다(도 19d).
딥 시퀀싱 판독 후에, 표적화된 잔기 위치에서 가능한 변이체의 약 86%를 pUC19-형질전환된 음성 대조군에서 적어도 15회의 판독에서 나타내어, 신규한 PAM 및 표적으로 형질전환된 상응하는 시료에서의 이들의 고갈의 평가를 가능하게 하였다. TATC, TGTC, TTCC 및 TCCC PAM에 있어서, 라이브러리 내의 적어도 하나의 AsCpf1 변이체가 고도로 고갈되었다(15배 이상)(도 19d 및 표 18). TATC 및 TGTC에 있어서, 고갈된 변이체의 다수는 PAM 듀플렉스와 수소 결합을 형성하는 보존된 잔기인 Lys548에 존재하였다. 다수의 힛트가 또한 TTCC 및 TCCC에 대하여 관찰되었으며, 비-보존적 잔기인 Ser542에서의 아르기닌 치환이 가장 현저하였다.
HEK293T 세포에서의 스크린에서 확인된 변이체의 활성을 2개의 유전자(DNMT1VEGFA) 내의 내인성 부위에 이들을 표적화시킴으로써 세포에서 평가하였다(도 20a 도 22a). 시험한 대부분의 변이체는 상응하는 PAM을 갖는 표적 부위에서 삽입결실을 생성하였으며; 특히, K548V는 TATC 표적 부위에서 가장 활성인 한편, S542R은 2개의 TTCC 표적 부위뿐 아니라 TCCC 부위에 대하여 활성을 현저하게 증가시켰다. 최고의 단일 아미노산 돌연변이를 이중 및 삼중 돌연변이체로 조합하여, 활성을 추가로 개선시켰다(도 20a 도 22b). 가장 높은 활성을 갖는 변이체, S542R/K607R(이하에서 RR로 지칭) 및 S542R/K548V/N552R(이하에서 RVR로 지칭)을 추가의 조사를 위해 선택하였다.
이전에 기재된 시험관내 PAM 확인 검정을 조정함으로써 야생형 AsCpf1과 비교하여 RR 및 RVR 변이체의 전체 PAM 선호도를 평가하였다(도 20b). AsCpf1(또는 조작된 변이체)을 발현하는 HEK293T 세포로부터의 세포 용해물을 시험관내 전사된 crRNA 및 축퇴성 서열이 앞에 있는 불변 표적(5'-NNNNNNNN-표적)을 함유하는 플라스미드 DNA의 라이브러리와 인큐베이션시켰다. 온전한 기질을 증폭시키고 딥 시퀀싱하고, 음성 대조군과 비교함으로써 성공적으로 절단된 서열을 결정하였다. 각 Cpf1 변이체에 있어서, 9개의 반응을 병행하여 수행하였으며, 각각을 상이한 시간 동안 인큐베이션시켜, 절단 역학을 결정하였다(방법 및 도 23 및 도 24 참조).
예상되는 바와 같이, 야생형 AsCpf1이 TTTV PAM에서 가장 활성이고(도 20c 및 도 20d), TTTT에서 더 낮은 활성을 가졌으며, 이는 TTTV로서 이전에 보고된 야생형 PAM의 정의를 뒷받침한다. 야생형은 또한, NTTV, TCTV 및 TTCV를 포함하는 다른 서열도 낮은 비로 절단하였으며, 이는 HEK293T 세포(도 25) 및 에스케리키아 콜라이에서의 본 발명자들의 관찰과 일치한다. 대조적으로, RR 및 RVR 변이체는 각각 TYCV(여기서 Y는 C 또는 T일 수 있음) 및 TATV PAM에서 가장 큰 활성을 가졌으며, 이는 이들 PAM에서 야생형에 대하여 활성이 거의 없거나 없는 것과 비교된다(도 20c 및 도 20d). 변이체 PAM은 엄격하게 야생형의 것으로 정의되지 않았다: RR 변이체는 또한 ACCC 및 CCCC PAM(그리고 더 적은 정도로 VYCV)을 절단하였으며, RVR 변이체는 또한 RATR PAM(여기서, R은 A 또는 G일 수 있음)을 절단하였다.
신규한 PAM 활성의 강건성을 평가하기 위하여, HEK293T 세포 내의 내인성 표적 부위의 다양한 패널에 걸쳐 이들의 바람직한 PAM에서 RR 및 RVR 변이체의 활성을 조사하였다(즉, 각각 TYCV 및 TATV)(도 20e 도 26). RR 및 RVR 변이체는 각각 20개의 TYCV 부위 중 14개(70%) 및 23개의 TATV 부위 중 18개(78%)에 대하여 50% 초과의 삽입결실을 달성하였으며, 이는 이들 부위의 대부분에서 야생형 AsCpf1에 대한 활성이 거의 없거나 없는 것과 비교된다(두 변이체 모두에 있어서 p < 0.0001). 비교에 의해, 야생형 AsCpf1은 23개 TTTV 부위 중 8개(35%)에 있어서 50% 초과의 삽입결실을 달성하였다. 이들 데이터는 그들의 각각의 바람직한 PAM에서, 변이체가 야생형 뉴클레아제와 유사하거나, 이보다 약간 더 큰 활성을 갖는 것을 뒷받침한다(도 20e). RR 변이체는 또한 마우스 Neuro2a 세포에서 상당한 편집 비를 나타내었다(9개의 TYCV 부위 중 6개에 있어서 20% 초과의 삽입결실)(도 27).
RR 변이체가 시험관내에서 TYCV보다 더 낮은 비이지만, VYCV PAM을 절단하는 것으로 관찰되었기 때문에, RR 변이체의 활성을 HEK293T 세포에서 VYCV 부위의 개별 패널에서 시험하였다(도 25). 평가되는 4가지 유전자(CFTR, DNMT1, EMX1VEGFA)에 걸쳐, RR 변이체는 36개의 VYCV 부위 중 24개(67%)에 대하여 20% 초과의 삽입결실을 달성하였으며, 이는 필요한 경우, VYCV PAM을 갖는 표적 부위도 또한 RR 변이체를 사용한 편집을 위해 고려될 수 있음을 뒷받침한다.
인간 게놈 내의 PAM 서열의 분포의 컴퓨터 분석을 수행하여, CRISPR-Cpf1 시스템의 표적화 범위에 대한 Cpf1 PAM 변이체의 영향을 정량화하였다(도 20f 및 도 28). 가장 활성인 PAM만을 고려하는 경우, 변이체 및 야생형은 집단적으로 Cpf1의 표적화 범위를 인간 코딩 서열에서 약 11 bp당 하나의 표적 부위(야생형 단독에 비하여 3배 증가에 상응)까지 확장시켰으며, 가장 가까운 절단 부위까지의 거리 중간값을 3 bp로 감소시켰다. 더욱이, 효율적으로 절단 가능한 PAM의 더욱 광범위하게 정의되는 세트(특히, 바람직한 PAM + MCCC 및 RATR, 여기서 M은 A 또는 C일 수 있음)를 고려하는 경우, 표적화 범위는 2 bp의 가장 가까운 절단 부위까지의 거리 중간값과 함께, 인간 코딩 서열에서 약 7 bp당 하나의 부위로 추가로 확장된다.
RR 및 RVR 변이체의 게놈-와이드 편집 특이성을, 게놈에 걸친 DNA 이중-가닥 파손(DSB)을 정량화하는 BLISS(동소에서의 이중-가닥 파손 표지화 및 시퀀싱)를 사용하여 평가하였다. 변이체를 야생형과 공평하게 비교하기 위하여, 3가지 모두의 효소에 의해 신뢰성 있게 절단될 수 있는 PAM을 지니는 표적 부위를 선택하였으며, TTTV가 이러한 기준을 만족시키는 유일한 PAM이었지만, 이는 RR 변이체에 대하여 더 낮은 활성을 갖는다. 평가된 4개의 표적 부위 중 3개(VEGFA, GRIN2B DNMT1)에 있어서, 임의이 뉴클레아제에 대한 BLISS-확인된 유전자좌(도 21a)의 딥 시퀀싱으로부터 표적외 활성이 검출되지 않았다. 4번째 표적 부위(EMX1)에 있어서, BLISS에 의해 검출 가능한 삽입결실을 갖는 6개의 표적외 부위가 확인되었으며; 6개 부위 모두는 TTCA PAM 및 가이드의 처음 19개 뉴클레오티드 내에 1개 이하의 미스매치를 가졌다. 예상되는 바와 같이, 두 변이체 모두는 야생형에 비하여 이들 표적외 부위에서 증가된 활성을 가졌으며, 이는 그들이 TTCA PAM을 인식하는 능력의 증가와 일치한다. 반면, 알려져 있는 TTTV 표적외 부위를 갖는 RPL32P3 유전자 내의 부위를 표적화하는 경우, 변이체가 감소된 표적외 활성을 나타내었으며(도 21b), 이는 또한 PAM 선호도와 일치한다. 종합하여, 이들 결과는 변이체가 야생형 AsCpf1과 유사한 높은 수준의 편집 특이성을 보유하는 것을 나타낸다.
양으로 하전되거나 극성 잔기와 표적 DNA 간의 비-특이적인 접촉을 제거함으로써 AsCpf1의 특이성이 개선될 수 있는지 여부를 조사하였다. K949A를 이것이 단백질의 틈 내에 위치하며, 비-표적 DNA 가닥과 상호작용하는 것으로 가정되기 때문에, 후보로서 표적화시켰다(도 29). K949A는 RR 및 RVR 변이체와 조합되는 경우, 평가되는 모든 표적외 부위에서 절단을 감소시키면서(도 21c), 높은 수준의 표적상 활성을 유지하였다(도 21d).
Cpf1-과 엔도뉴클레아제가 강력한 서열 및 구조적 유사성을 갖기 때문에, AsCpf1 내의 S542, K548, N552 및 K607은 다른 Cpf1 오솔로스에서 명백한 상응성을 갖는다(도 30 및 표 19). 서열 정렬 및 결정 구조에 기초하여, 각각 돌연변이 G532R/K595R 및 G532R/K538V/Y542R을 도입함으로써 LbCpf1이 또한, TYCV 및 TATV PAM을 인식하도록 조작될 수 있음을 가정하였다(도 31a). 이들 돌연변이를 예측된 방식으로 LbCpf1의 PAM 특이성을 변경시켰으며(도 31b 및 도 32), 이는 그들이 일반적으로 Cpf1 오솔로그 전체에 걸쳐 적용 가능할 수 있음을 뒷받침한다.
Figure pat00042
Figure pat00043
Figure pat00044
Figure pat00045
Figure pat00046
Figure pat00047
Figure pat00048
Figure pat00049
Figure pat00050
Figure pat00051
Figure pat00052
Figure pat00053
* *
본 발명은 하기 번호가 매겨진 단락에 의해 추가로 기재된다:
1. PAM 인식에 영향을 미치는 하나 이상의 돌연변이를 포함하는 돌연변이된 Cpf1 폴리펩티드.
2. 단락 1에 있어서, 상기 돌연변이된 Cpf1 폴리펩티드는 상응하는 야생형 Cpf1에 의해 인식되지 않는 PAM 서열을 인식하는, 돌연변이된 Cpf1 폴리펩티드.
3. 하나 이상의 돌연변이를 갖는 돌연변이된 Cpf1 폴리펩티드로서, 상기 돌연변이된 Cpf1 단백질은 상응하는 야생형 Cpf1에 의해 인식되지 않는 PAM 서열을 인식하는, 돌연변이된 Cpf1 폴리펩티드.
4. 하나 이상의 돌연변이를 가지며, N 이외의 4개 미만의 뉴클레오티드로 구성된 PAM을 인식하는 돌연변이된 Cpf1 폴리펩티드로서, 단 상기 돌연변이된 Cpf1은 돌연변이된 FnCpf1이 아닌, 돌연변이된 Cpf1 폴리펩티드.
5. 서열 YCN, (T)YCV, AYV, TYV, RYN 또는 RCN을 갖거나 서열 TNYC 또는 TNYS를 갖는 PAM을 인식하는 돌연변이된 Cpf1 폴리펩티드로서, 단 상기 PAM은 TTTV가 아니고/아니거나 상기 PAM은 TTTC가 아니고/아니거나 상기 PAM은 TCTS가 아니고, 바람직하게는 상기 PAM은 서열 (T)YCV 또는 RYN; AYV 또는 TYV; YCN 또는 RCN을 갖거나 이를 포함하는, 돌연변이된 Cpf1 폴리펩티드.
6. 서열 YCN, YCV, AYV, TYV, RYN, RCN, TGYV, NTTN, TTN, TRTN, TYTV, TYCT, TYCN, TRTN, NTTN, TACT, TYCC, TRTC, TATV, NTTV, TTV, TSTG, TVTS, TYYS, TCYS, TBYS, TCYS, TNYS, TYYS, TNTN, TSTG, TTCC, TCCC, TATC, TGTG, TCTG, TYCV 또는 TCTC를 갖거나 이를 포함하는 PAM을 인식하는 돌연변이된 Cpf1 폴리펩티드.
7. 단락 1 내지 단락 6 중 어느 한 단락에 있어서, 상기 돌연변이된 Cpf1은 돌연변이된 AsCpf1 또는 돌연변이된 LbCpf1인, 돌연변이된 Cpf1.
8. 돌연변이된 Cpf1, 바람직하게는 단락 1 내지 단락 7 중 어느 한 단락에 따른 돌연변이된 Cpf1으로서, 상기 돌연변이된 Cpf1은 AsCpf1의 위치 11, 12, 13, 14, 15, 16, 17, 34, 36, 39, 40, 43, 46, 47, 50, 54, 57, 58, 111, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 532, 533, 534, 535, 536, 537, 538, 539, 540, 541, 542, 543, 544, 545, 546, 547, 548, 549, 550, 551, 552, 553, 554, 555, 556, 565, 566, 567, 568, 569, 570, 571, 572, 573, 574, 575, 592, 593, 594, 595, 596, 597, 598, 599, 600, 601, 602, 603, 604, 605, 606, 607, 608, 609, 610, 611, 612, 613, 614, 615, 616, 617, 618, 619, 620, 626, 627, 628, 629, 630, 631, 632, 633, 634, 635, 636, 637, 638, 642, 643, 644, 645, 646, 647, 648, 649, 651, 652, 653, 654, 655, 656, 676, 679, 680, 682, 683, 684, 685, 686, 687, 688, 689, 690, 691, 692, 693, 707, 711, 714, 715, 716, 717, 718, 719, 720, 721, 722, 739, 765, 768, 769, 773, 777, 778, 779, 780, 781, 782, 783, 784, 785, 786, 871, 872, 873, 874, 875, 876, 877, 878, 879, 880, 881, 882, 883, 884 또는 1048에 하나 이상의 돌연변이된 아미노산 잔기; 바람직하게는 위치 130, 131, 132, 133, 134, 135, 136, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 536, 537, 538, 539, 540, 541, 542, 543, 544, 545, 546, 547, 548, 549, 550, 551, 552, 570, 571, 572, 573, 595, 596, 597, 598, 599, 600, 601, 602, 603, 604, 605, 606, 607, 608, 609, 610, 611, 612, 613, 614, 615, 630, 631, 632, 646, 647, 648, 649, 650, 651, 652, 653, 683, 684, 685, 686, 687, 688, 689 또는 690에 하나 이상의 돌연변이된 아미노산 잔기; 더욱 바람직하게는 위치 539, 542, 547, 548, 550, 551, 552, 167, 604 및/또는 607, 또는 AsCpf1 오솔로그(orthologue), 동족체(homologue) 또는 변이체의 상응하는 위치에 하나 이상의 돌연변이된 아미노산 잔기, 바람직하게는 위치 542 또는 542 및 607에 돌연변이된 아미노산 잔기로서, 상기 돌연변이가 바람직하게는 542R 및 607R, 예컨대 S542R 및 K607R인 돌연변이된 아미노산 잔기; 또는 바람직하게는 위치 542 및 548(및 선택적으로 552)에 돌연변이된 아미노산 잔기로서, 상기 돌연변이가 바람직하게는 542R 및 548V(및 선택적으로 552R), 예컨대 S542R 및 K548V(및 선택적으로 N552R)인 돌연변이된 아미노산 잔기; 또는 LbCpf1의 위치 532, 538, 542 및/또는 595, 또는 AsCpf1 오솔로그, 동족체 또는 변이체의 상응하는 위치에, 바람직하게는 위치 532 또는 532 및 595에 돌연변이된 아미노산 잔기로서, 상기 돌연변이가 바람직하게는 532R 및 595R, 예컨대 G532R 및 K595R인 돌연변이된 아미노산 잔기; 또는 바람직하게는 위치 532 및 538(및 선택적으로 542)에 돌연변이된 아미노산 잔기로서, 상기 돌연변이가 바람직하게는 532R 및 538V(및 선택적으로 542R), 예컨대 G532R 및 K538V(및 선택적으로 Y542R)인 돌연변이된 아미노산 잔기, 가장 바람직하게는 상기 돌연변이가 AsCpf1의 S542R 및 K607R, S542R 및 K548V, 또는 S542R, K548V 및 N552R인 돌연변이된 아미노산 잔기를 포함하는, 돌연변이된 Cpf1.
9. 단락 1 내지 단락 8 중 어느 한 단락에 있어서, Cpf1 촉매 활성 및/또는 Cpf1 안정성에 영향을 미치는 변형 또는 돌연변이를 추가로 포함하는, 돌연변이된 Cpf1 폴리펩티드.
10. 단락 1 내지 단락 9 중 어느 한 단락에 있어서, 기능적 도메인을 가진 융합 단백질에 포함되어 있는, 돌연변이된 Cpf1 폴리펩티드.
11. 단락 10에 있어서, 상기 기능적 도메인은 활성인자 도메인, 억제인자 도메인, 재조합효소, 트랜스포사제(transposase), 히스톤 리모델러(remodeler), DNA 메틸트랜스퍼라제, 크립토크롬(cryptochrome), 광 유도성/제어성 도메인 또는 화학 유도성/제어성 도메인을 포함하는, 돌연변이된 Cpf1 폴리펩티드.
12. 단락 1 내지 단락 11 중 어느 한 단락에 있어서, DNA 이중 가닥 파손(break)을 유도할 수 없는, 돌연변이된 Cpf1 폴리펩티드.
13. 단락 1 내지 단락 12 중 어느 한 단락에 있어서, 닉카제(nickase)인, 돌연변이된 Cpf1 폴리펩티드.
14. 단락 1 내지 단락 13 중 어느 한 단락에 있어서, 촉매적 비활성 Cpf1 폴리펩티드인, 돌연변이된 Cpf1 폴리펩티드.
15. 단락 1 내지 단락 14 중 어느 한 단락에 있어서, DNA 단일 가닥 파손을 유도할 수 없는, 돌연변이된 Cpf1 폴리펩티드.
16. 단락 1 내지 단락 15 중 어느 한 단락에 따른 돌연변이된 Cpf1 폴리펩티드를 인코딩하는 폴리뉴클레오티드.
17. 단락 16에 있어서, 관심 세포 내 발현을 위해 코돈 최적화된, 폴리뉴클레오티드.
18. 단락 16 또는 단락 17에 있어서, 상기 폴리뉴클레오티드는 하나 이상의 NLS를 인코딩하는 하나 이상의 서열을 추가로 포함하는, 폴리뉴클레오티드.
19. 단락 16 내지 단락 18 중 어느 단락에 따른 폴리뉴클레오티드를 포함하는 벡터.
20. 단락 19에 있어서, 발현 벡터인, 벡터.
21. 단락 19 또는 단락 20에 있어서, 유도성, 조건적 또는 구성적 발현 벡터인, 벡터.
22. 하나 이상의 벡터를 포함하는 벡터 시스템으로서, 상기 하나 이상의 벡터는 단락 16 내지 단락 18 중 어느 한 단락에 따른 폴리뉴클레오티드를 포함하고, 동일한 벡터 또는 상이한 벡터 상에 가이드를 인코딩하는 하나 이상의 폴리뉴클레오티드를 포함하는, 벡터 시스템.
23. 단락 22에 있어서, 상기 하나 이상의 벡터는 발현 벡터인, 벡터 시스템.
24. 단락 1 내지 단락 15 중 어느 한 단락에 따른 돌연변이된 Cpf1 폴리펩티드 및 가이드를 포함하는 복합체.
25. 단락 22 내지 단락 24 중 어느 한 단락에 있어서, 상기 가이드는 가이드 서열 및 직접 반복부 서열을 포함하는, 벡터 시스템 또는 복합체.
26. 단락 22 내지 단락 25 중 어느 한 단락에 있어서, 상기 가이드는 3' 가이드 서열 및 5' 직접 반복부 서열을 포함하는 폴리뉴클레오티드 서열을 포함하는, 복합체의 벡터 시스템.
27. 단락 22 내지 단락 26 중 어느 한 단락에 있어서, 상기 가이드 서열은 표적 DNA 서열에 혼성화할 수 있는, 벡터 시스템 또는 복합체.
28. 단락 22 내지 단락 27 중 어느 한 단락에 있어서, 상기 가이드 서열은 기능성, 특이성 및/또는 안정성을 변경하기 위해 변형되는, 벡터 시스템 또는 복합체.
29. 단락 22 내지 단락 28 중 어느 한 단락에 있어서, 상기 돌연변이된 Cpf1은 상기 가이드에 결합할 수 있는, 벡터 시스템 또는 복합체.
30. 단락 22 내지 단락 29 중 어느 한 단락에 있어서, 상기 돌연변이된 Cpf1은 상기 가이드와 복합체를 형성할 수 있고, 상기 복합체는 상기 표적 DNA 유전자좌로의 결합 시에 표적 DNA 유전자좌를 변형시키거나 표적화할 수 있는, 벡터 시스템 또는 복합체.
31. 단락 22 내지 단락 30 중 어느 한 단락에 있어서, 상기 돌연변이된 Cpf1은 상기 가이드와 복합체를 형성하고, 표적 DNA 유전자좌로의 상기 복합체의 서열 특이적 결합을 초래할 수 있는, 벡터 시스템 또는 복합체.
32. 단락 1 내지 단락 31 중 어느 한 단락에 따른 폴리펩티드, 폴리뉴클레오티드, 벡터, 벡터 시스템 또는 복합체를 포함하는 전달 시스템.
33. 단락 32에 있어서, 상기 전달 시스템은 리포좀, 입자, 엑소좀, 미세소포, 유전자총 또는 바이러스 전달 시스템인, 전달 시스템.
34. 단락 1 내지 단락 33 중 어느 한 단락에 따른 돌연변이된 Cpf1 폴리펩티드, 폴리뉴클레오티드, 벡터, 벡터 시스템, 복합체 또는 전달 시스템을 포함하는 숙주 세포.
35. 단락 1 내지 단락 15 중 어느 한 단락에 따른 돌연변이된 Cpf1 폴리펩티드를 발현하거나, 이를 발현할 수 있는 숙주 세포.
36. 단락 34 또는 단락 35에 있어서, 원핵 또는 진핵 숙주 세포인, 숙주 세포.
37. 단락 34 내지 단락 36 중 어느 한 단락에 있어서, 단리된 숙주 세포인, 숙주 세포.
38. 단락 1 내지 단락 37 중 어느 한 단락에 따른 돌연변이된 Cpf1 폴리펩티드, 폴리뉴클레오티드, 벡터, 벡터 시스템, 복합체, 전달 시스템 또는 숙주 세포를 포함하는 조성물.
39. 단락 1 내지 단락 38 중 어느 한 단락에 따른 돌연변이된 Cpf1 폴리펩티드, 폴리뉴클레오티드, 벡터, 벡터 시스템, 복합체, 전달 시스템, 숙주 세포 또는 조성물을 포함하는 키트.
40. 단락 1 내지 단락 38 중 어느 한 단락에 따른 돌연변이된 Cpf1 폴리펩티드, 폴리뉴클레오티드, 벡터, 벡터 시스템, 복합체, 전달 시스템, 숙주 세포 또는 조성물을 포함하는 유전자이식 유기체.
41. 단락 1 내지 단락 15 중 어느 한 단락에 따른 돌연변이된 Cpf1 폴리펩티드를 발현하거나 이를 발현할 수 있는 유전자이식 유기체.
42. 표적 DNA 유전자좌를 변형시키거나 표적화하는 방법으로서, 단락 1 내지 단락 33 중 어느 한 단락에 따른 폴리펩티드, 폴리뉴클레오티드, 벡터, 벡터 시스템, 전달 시스템 또는 복합체를 상기 유전자좌로 전달하는 단계를 포함하는, 방법.
43. 표적 DNA 유전자좌를 변형시키거나 표적화하는 방법으로서, 단락 38에 따른 조성물을 상기 유전자좌로 전달하는 단계를 포함하는, 방법.
44. 표적 DNA 유전자좌를 변형시키거나 표적화하는 방법으로서, 단락 1 내지 단락 15 중 어느 한 단락에 따른 돌연변이된 Cpf1 폴리펩티드 또는 상기 돌연변이된 Cpf1을 인코딩하는 폴리뉴클레오티드, 및 가이드 또는 가이드 RNA를 인코딩하는 폴리뉴클레오티드를 상기 유전자좌로 전달하는 단계로서, 상기 돌연변이된 Cpf1 폴리펩티드는 상기 가이드와 복합체를 형성하고, 상기 표적 DNA 유전자좌는 상기 표적 DNA 유전자좌로의 상기 복합체의 결합 시에 변형되거나 표적화되는 단계를 포함하는, 방법.
45. 단락 42 내지 단락 44 중 어느 한 단락에 있어서, 상기 표적 유전자좌를 변형시키거나 표적화하는 단계는 DNA 가닥 파손을 유도하는 것을 포함하는, 방법.
46. 단락 42 내지 단락 45 중 어느 한 단락에 있어서, 상기 표적 유전자좌를 변형시키거나 표적화하는 단계는 DNA 이중 가닥 파손을 유도하는 것을 포함하는, 방법.
47. 단락 42 내지 단락 46 중 어느 한 단락에 있어서, 상기 표적 유전자좌를 변형시키거나 표적화하는 단계는 하나 이상의 유전자의 유전자 발현을 변경시키는 것을 포함하는, 방법.
48. 단락 42 내지 단락 47 중 어느 한 단락에 있어서, 상기 표적 유전자좌를 변형시키거나 표적화하는 단계는 상기 표적 DNA 유전자좌의 후생적 변형을 포함하는, 방법.
49. 단락 42 내지 단락 48 중 어느 한 단락에 있어서, 관심 게놈 유전자좌에서의 하나 이상의 표적 서열의 조작에 의해 세포, 세포주 또는 유기체를 변형시키는, 방법.
50. 단락 49의 방법으로부터의 세포 또는 그의 자손으로서, 상기 세포는 상기 방법이 적용되지 않은 세포에 존재하지 않는 변형을 포함하는, 세포 또는 그의 자손.
51. 단락 50에 있어서, 상기 방법이 적용되지 않은 세포는 이상을 포함하고, 상기 방법으로부터의 상기 세포는 대처 또는 편집된 이상을 갖는, 세포 또는 그의 자손.
52. 단락 50의 세포 또는 그의 자손으로부터의 세포 생성물로서, 상기 생성물은 상기 방법이 적용되지 않은 세포로부터의 세포 생성물에 대해 성질이 또는 양이 변형된, 세포 생성물.
53. 단락 52에 있어서, 상기 방법이 적용되지 않은 세포는 이상을 포함하고, 상기 세포 생성물은 상기 방법에 의해 대처 또는 편집된 이상을 반영하는, 세포 생성물.
54. (a) - PAM 인식에 영향을 미치는 하나 이상의 돌연변이를 갖는 돌연변이된 Cpf1 폴리펩티드 후보를 포함하거나 이를 발현하고,
- gRNA를 포함하거나 이를 발현하고,
- DNA 표적 서열에 연결된 특정 PAM 서열을 포함하는 폴리뉴클레오티드로서, 상기 폴리뉴클레오티드는 선별 마커를 추가로 포함하고, 상기 DNA 표적 서열은 상기 gRNA와 혼성화할 수 있는 폴리뉴클레오티드를 포함하는 숙주 세포를 제공하는 단계,
(b) 상기 선별 마커의 활성에 기초하여 PAM 인식에 영향을 미치는 하나 이상의 돌연변이를 갖는 돌연변이된 Cpf1 폴리펩티드를 확인하는 단계를 포함하는,
PAM 인식에 영향을 미치는 하나 이상의 돌연변이를 갖는 돌연변이된 Cpf1 폴리펩티드를 확인하는 방법.
55. 단락 54에 있어서,
(a1) PAM 인식에 영향을 미치는 하나 이상의 돌연변이를 갖는 돌연변이된 Cpf1 폴리펩티드 후보 및 gRNA를 포함하거나 이를 발현하는 숙주 세포를 제공하는 단계;
(b1) 상기 gRNA가 혼성화할 수 있는 DNA 표적 서열에 연결된 특정 PAM 서열을 포함하는 폴리뉴클레오티드를 상기 숙주 세포에 도입시키는 단계로서, 상기 폴리뉴클레오티드가 선별 마커를 추가로 포함하는 단계; 또는
(a2) DNA 표적 서열에 연결된 특정 PAM 서열을 포함하는 폴리뉴클레오티드를 포함하는 숙주 세포를 제공하는 단계로서, 상기 폴리뉴클레오티드가 선별 마커를 추가로 포함하는 단계;
(b2) PAM 인식에 영향을 미치는 하나 이상의 돌연변이를 갖는 돌연변이된 Cpf1 폴리펩티드 후보 또는 이를 발현하는 폴리뉴클레오티드, 및 상기 DNA 표적 서열과 혼성화할 수 있는 gRNA 또는 이를 발현하는 폴리뉴클레오티드를 상기 숙주 세포에 도입시키는 단계;
(c) 상기 선별 마커의 활성에 기초하여 PAM 인식에 영향을 미치는 하나 이상의 돌연변이를 갖는 돌연변이된 Cpf1 폴리펩티드를 확인하는 단계를 포함하는, 방법.
56. 단락 54 또는 단락 55에 있어서, 상기 특정 PAM 서열은 상응하는 야생형 Cpf1에 의해 인식되지 않는, 방법.
57. 단락 54 또는 단락 56에 있어서, 상기 숙주 세포는 원핵 또는 진핵 숙주 세포인, 방법.
58. 단락 54 내지 단락 57 중 어느 한 단락에 있어서, 상기 선별 마커는 양성 또는 음성 선별 마커인, 방법.
59. 단락 54 내지 단락 58 중 어느 한 단락에 있어서, 상기 선별 마커는 항생제 내성 유전자인, 방법.
60. 단락 54 내지 단락 59 중 어느 한 단락에 있어서, 상기 돌연변이된 Cpf1 폴리펩티드는 촉매적으로 활성인, 방법.
61. 단락 54 내지 단락 58 중 어느 한 단락에 있어서, 단계 (a), (a1) 또는 (a2)에서 상기 숙주 세포는 숙주 세포 라이브러리인, 방법.
62. 단락 61에 있어서, 상기 숙주 세포 라이브러리는 PAM 인식에 영향을 미치는 하나 이상의 돌연변이를 갖는 돌연변이된 Cpf1 폴리펩티드 후보의 라이브러리를 포함하는, 방법.
63. 단락 61에 있어서, 상기 숙주 세포 라이브러리는 폴리뉴클레오티드의 PAM 라이브러리를 포함하는, 방법.
64. 단락 54 내지 단락 63 중 어느 한 단락에 있어서, 단계 (a) 또는 (b1)에서 상기 폴리뉴클레오티드는 폴리뉴클레오티드의 PAM 라이브러리인, 방법.
65. 단락 54 내지 단락 63 중 어느 한 단락에 있어서, 단계 (a) 또는 (b2)에서 PAM 인식에 영향을 미치는 하나 이상의 돌연변이를 갖는 상기 돌연변이된 Cpf1 폴리펩티드 후보는 Cpf1 돌연변이체 라이브러리인, 방법.
66. 단락 54 내지 단락 65 중 어느 한 단락에 따른 방법에 의해 확인된 돌연변이된 Cpf1 폴리펩티드.
67. 단락 66에 따른 돌연변이된 폴리펩티드를 인코딩하는 폴리뉴클레오티드.
68. 바람직하게는 시험관내 또는 생체외에서 DNA 표적 유전자좌를 변형시키거나 표적화하기 위한 단락 1 내지 단락 38, 단락 66 및 단락 67 중 어느 한 단락에 따른 폴리펩티드, 폴리뉴클레오티드, 벡터, 벡터 시스템, 복합체, 전달 시스템, 숙주 세포 또는 조성물의 용도.
69. 바람직하게는 시험관내 또는 생체외에서의 게놈 편집을 위한 단락 1 내지 단락 38, 단락 66 및 단락 67 중 어느 한 단락에 따른 폴리펩티드, 폴리뉴클레오티드, 벡터, 벡터 시스템, 복합체, 전달 시스템 또는 숙주 세포의 용도.
70. DNA 표적 유전자좌의 변형 또는 표적화에 사용하기 위한 단락 1 내지 단락 38, 단락 66 및 단락 67 중 어느 한 단락에 따른 폴리펩티드, 폴리뉴클레오티드, 벡터, 벡터 시스템, 복합체, 전달 시스템, 숙주 세포 또는 조성물.
71. 게놈 편집에 사용하기 위한 단락 1 내지 단락 38, 단락 66 및 단락 67 중 어느 한 단락에 따른 폴리펩티드, 폴리뉴클레오티드, 벡터, 벡터 시스템, 복합체, 전달 시스템, 숙주 세포 또는 조성물.
72. 치료법에 사용하기 위한 단락 1 내지 단락 38, 단락 66 및 단락 67 중 어느 한 단락에 따른 폴리펩티드, 폴리뉴클레오티드, 벡터, 벡터 시스템, 복합체, 전달 시스템, 숙주 세포 또는 조성물.
73. 약제의 제조를 위한 단락 1 내지 단락 38, 단락 66 및 단락 67 중 어느 한 단락에 따른 폴리펩티드, 폴리뉴클레오티드, 벡터, 벡터 시스템, 복합체, 전달 시스템, 숙주 세포 또는 조성물의 용도.
74. a) 직접 반복부 서열에 연결된 가이드 서열을 포함하는 가이드를 포함하는 하나 이상의 제V형 클러스터링되고 규칙적으로 산재된 짧은 팔린드로믹 반복부(CRISPR)-CRISPR 회합된(Cas)(CRISPR-Cas) 폴리뉴클레오티드 서열로서, 상기 가이드 서열이 표적 서열과 혼성화할 수 있는 하나 이상의 제V형 CRISPR-Cas 폴리뉴클레오티드 서열, 또는 하나 이상의 제V형 CRISPR-Cas 폴리뉴클레오티드 서열을 인코딩하는 하나 이상의 뉴클레오티드 서열, 및
b) Cpf1 이펙터 단백질, 또는 Cpf1 이펙터 단백질을 인코딩하는 하나 이상의 뉴클레오티드 서열을 포함하는 조작된 비-천연 발생 CRISPR-Cas 시스템으로서,
상기 하나 이상의 가이드 서열은 상기 표적 서열에 혼성화하고, 상기 표적 서열은 프로토스페이서 인접 모티프(PAM)의 3'이며, 상기 가이드는 상기 Cpf1 이펙터 단백질과 복합체를 형성하고; 상기 Cpf1 이펙터는 단락 1 내지 단락 15 중 어느 한 단락의 돌연변이된 Cpf1 폴리펩티드를 포함하는, 조작된 비-천연 발생 CRISPR-Cas 시스템.
75. a) 직접 반복부 서열에 연결된 가이드 서열을 포함하는 가이드 RNA를 포함하는 하나 이상의 제V형 클러스터링되고 규칙적으로 산재된 짧은 팔린드로믹 반복부(CRISPR)-CRISPR 회합된(Cas)(CRISPR-Cas) 폴리뉴클레오티드 서열을 인코딩하는하나 이상의 뉴클레오티드 서열에 작동 가능하게 연결된 제1 조절 요소로서, 상기 가이드 서열이 표적 서열과 혼성화할 수 있는, 제1 조절 요소,
b) Cpf1 이펙터 단백질을 인코딩하는 뉴클레오티드 서열에 작동 가능하게 연결된 제2 조절 요소를 포함하는, 단락 1의 비-천연 발생 CRISPR-Cas 시스템을 인코딩하는 하나 이상의 벡터를 포함하는 조작된 비-천연 발생 CRISPR-Cas 벡터 시스템으로서,
성분 (a) 및 (b)는 상기 시스템의 동일한 또는 상이한 벡터 상에 위치되고,
전사될 때, 상기 하나 이상의 가이드 서열은 상기 표적 서열에 혼성화하고, 상기 표적 서열은 프로토스페이서 인접 모티프(PAM)의 3'이며, 상기 가이드는 상기 Cpf1 이펙터 단백질과 복합체를 형성하고; 상기 Cpf1 이펙터는 단락 1 내지 단락 15 중 어느 한 단락의 돌연변이된 Cpf1 폴리펩티드를 포함하는, 조작된 비-천연 발생 CRISPR-Cas 벡터 시스템.
76. 관심 유전자에 의해 인코딩되는 변형된 관심 특질을 가지는 식물을 생성하는 방법으로서, 상기 방법이 식물 세포를 단락 74 또는 단락 75에 따른 시스템과 접촉시키거나 상기 식물 세포에 단락 44에 따른 방법을 적용시켜, 이에 의해 상기 관심 유전자를 변형 또는 도입하는 단계, 및 상기 식물 세포로부터 식물을 재생시키는 단계를 포함하는, 방법.
77. 식물에서 관심 특질을 확인하는 방법으로서, 상기 관심 특질이 관심 유전자에 의해 인코딩되고, 상기 방법이 식물 세포를 단락 74 또는 단락 75에 따른 시스템과 접촉시키거나 상기 식물 세포에 단락 44에 따른 방법을 적용시켜, 이에 의해 상기 관심 유전자를 확인하는 단계를 포함하는, 방법.
78. 단락 77에 있어서, 상기 확인된 관심 유전자를 식물 세포 또는 식물 세포주 또는 식물 생식질에 도입하는 단계, 및 이로부터 식물을 생성하여, 이에 의해 상기 식물이 관심 유전자를 함유하는 단계를 추가로 포함하는, 방법.
79. 단락 78에 있어서, 상기 식물은 관심 특질을 나타내는, 방법.
80. 단락 74 또는 단락 75에 따른 시스템을 포함하는 입자.
81. 단락 80에 있어서, 상기 입자는 가이드와 복합체화된 Cpf1 이펙터 단백질을 함유하는, 입자.
82. 단락 74, 단락 75 또는 단락 44에 있어서, 상기 복합체, 가이드 또는 단백질은 적어도 하나의 당 모이어티, 선택적으로 N-아세틸 갈락토사민(GalNAc), 특히 트리안테나 GalNAc에 컨쥬게이트되는, 시스템 또는 방법.
83. 단락 74, 단락 75 또는 단락 44에 있어서, 상기 Mg2+의 농도는 약 1 mM 내지 약 15 mM인, 시스템 또는 방법.
84. 단락 74, 단락 75 또는 단락 44에 있어서, 상기 Cpf1 이펙터 단백질은 시티딘 데아미나제에 융합되는, 시스템 또는 방법.
85. 단락 84에 있어서, 상기 시티딘 데아미나제는 상기 Cpf1 이펙터 단백질의 카복시 말단에 융합되는, 시스템 또는 방법.
86. 단락 84 또는 단락 85에 있어서, 상기 Cpf1 이펙터 단백질 또는 상기 시티딘 데아미나제는 우라실 DNA 글리코실라제 억제제에 추가로 융합되는, 시스템 또는 방법.
87. 단락 84 내지 단락 86 중 어느 한 단락에 있어서, 상기 Cpf1 이펙터 단백질은 촉매적 비활성 Nuc 도메인을 포함하는, 시스템 또는 방법.
88. 단락 84 내지 단락 87 중 어느 한 단락에 있어서, 상기 Cpf1 이펙터 단백질은 촉매적 비활성 RuvC 도메인을 포함하는, 시스템 또는 방법.
89. 단락 84 내지 단락 88 중 어느 한 단락에 있어서, 상기 가이드는 상기 Cpf1 이펙터 단백질과 복합체를 형성하고, 상기 복합체는 표적 DNA에 결합하도록 지시하고, 상기 시티딘 데아미나제는 상기 표적 DNA의 비-표적화된 가닥에서 C를 U로 전환시키는, 시스템 또는 방법.
90. 단락 74에 있어서, 상이한 가이드 서열을 각각 포함하는 복수의 가이드 RNA를 포함하는 시스템으로서, 상기 복수의 가이드 서열은 복수의 상이한 표적 서열과 혼성화할 수 있는, 시스템.
91. 단락 75에 있어서, 상기 하나 이상의 벡터는 상이한 가이드 서열을 각각 포함하는 복수의 가이드 RNA를 인코딩하고, 상기 복수의 가이드 서열은 복수의 상이한 표적 서열과 혼성화할 수 있는, 시스템.
92. 단락 44에 있어서, 상이한 핵산 성분을 복수의 상이한 관심 표적 유전자좌의 각각에 전달하는 단계를 포함하는, 방법.
93. 단락 74, 단락 75 또는 단락 44에 있어서, 상기 Cpf1 이펙터 단백질은 촉매적 비활성 RuvC 도메인을 포함하는 데드(dead) Cpf1인, 시스템 또는 방법.
94. 단락 93에 있어서, 상기 Cpf1 이펙터 단백질은 메틸라제 활성, 데메틸라제 활성, 전사 활성화 활성, 전사 억제 활성, 전사 방출 인자 활성, 히스톤 변형 활성, RNA 절단 활성, DNA 절단 활성 또는 핵산 결합 활성을 갖는 이종성 기능적 도메인에 융합되는, 시스템 또는 방법.
95. 단락 93에 있어서, 상기 Cpf1 이펙터 단백질은 전사 활성화 도메인 또는 전사 억제 도메인에 융합되는, 시스템 또는 방법.
* * *
본 발명의 바람직한 구현예가 본 명세서에 나타내어져 있고 기재되었지만, 이러한 구현예가 단시 예로서 제공된 것임이 당업자에게 자명할 것이다. 이제 본 발명을 벗어나지 않으면서 수많은 변형, 변경, 및 치환이 당업자에게 일어날 것이다. 본 명세서에 기재된 본 발명의 구현예에 대한 다양한 대안이 본 발명을 실시함에 있어서 이용될 수 있음이 이해되어야 한다. 하기 청구항이 본 발명의 범주를 규정하고, 이들 청구항의 범주 내의 방법 및 구조 및 이들의 균등물은 이에 의해 포괄되로 의도된다.

Claims (1)

  1. 본원 발명의 상세한 설명에 기재된 모든 발명.
KR1020227024312A 2016-04-19 2017-04-19 신규한 crispr 효소 및 시스템 KR20220104837A (ko)

Applications Claiming Priority (10)

Application Number Priority Date Filing Date Title
US201662324820P 2016-04-19 2016-04-19
US62/324,820 2016-04-19
US201662351558P 2016-06-17 2016-06-17
US62/351,558 2016-06-17
US201662360765P 2016-07-11 2016-07-11
US62/360,765 2016-07-11
US201662410196P 2016-10-19 2016-10-19
US62/410,196 2016-10-19
PCT/US2017/028420 WO2017184768A1 (en) 2016-04-19 2017-04-19 Novel crispr enzymes and systems
KR1020187033343A KR102424476B1 (ko) 2016-04-19 2017-04-19 신규한 crispr 효소 및 시스템

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020187033343A Division KR102424476B1 (ko) 2016-04-19 2017-04-19 신규한 crispr 효소 및 시스템

Publications (1)

Publication Number Publication Date
KR20220104837A true KR20220104837A (ko) 2022-07-26

Family

ID=58739338

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020187033343A KR102424476B1 (ko) 2016-04-19 2017-04-19 신규한 crispr 효소 및 시스템
KR1020227024312A KR20220104837A (ko) 2016-04-19 2017-04-19 신규한 crispr 효소 및 시스템

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020187033343A KR102424476B1 (ko) 2016-04-19 2017-04-19 신규한 crispr 효소 및 시스템

Country Status (8)

Country Link
US (1) US20210155911A1 (ko)
EP (1) EP3445848A1 (ko)
KR (2) KR102424476B1 (ko)
CN (1) CN110382692A (ko)
AU (2) AU2017253089B2 (ko)
CA (1) CA3026055A1 (ko)
SG (2) SG10202010311SA (ko)
WO (1) WO2017184768A1 (ko)

Families Citing this family (101)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013066438A2 (en) 2011-07-22 2013-05-10 President And Fellows Of Harvard College Evaluation and improvement of nuclease cleavage specificity
US10704021B2 (en) 2012-03-15 2020-07-07 Flodesign Sonics, Inc. Acoustic perfusion devices
US9163284B2 (en) 2013-08-09 2015-10-20 President And Fellows Of Harvard College Methods for identifying a target site of a Cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9228207B2 (en) 2013-09-06 2016-01-05 President And Fellows Of Harvard College Switchable gRNAs comprising aptamers
US9322037B2 (en) 2013-09-06 2016-04-26 President And Fellows Of Harvard College Cas9-FokI fusion proteins and uses thereof
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US20150165054A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting caspase-9 point mutations
EP3092049A1 (en) 2014-01-08 2016-11-16 Flodesign Sonics Inc. Acoustophoresis device with dual acoustophoretic chamber
EP3957735A1 (en) 2014-03-05 2022-02-23 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating usher syndrome and retinitis pigmentosa
US11141493B2 (en) 2014-03-10 2021-10-12 Editas Medicine, Inc. Compositions and methods for treating CEP290-associated disease
US11339437B2 (en) 2014-03-10 2022-05-24 Editas Medicine, Inc. Compositions and methods for treating CEP290-associated disease
EP3553176A1 (en) 2014-03-10 2019-10-16 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating leber's congenital amaurosis 10 (lca10)
EP3122880B1 (en) 2014-03-26 2021-05-05 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating sickle cell disease
US10077453B2 (en) 2014-07-30 2018-09-18 President And Fellows Of Harvard College CAS9 proteins including ligand-dependent inteins
CA2963820A1 (en) 2014-11-07 2016-05-12 Editas Medicine, Inc. Methods for improving crispr/cas-mediated genome-editing
GB201506509D0 (en) 2015-04-16 2015-06-03 Univ Wageningen Nuclease-mediated genome editing
JP2018522249A (ja) 2015-04-24 2018-08-09 エディタス・メディシン、インコーポレイテッド Cas9分子/ガイドrna分子複合体の評価
US11377651B2 (en) 2016-10-19 2022-07-05 Flodesign Sonics, Inc. Cell therapy processes utilizing acoustophoresis
US11708572B2 (en) 2015-04-29 2023-07-25 Flodesign Sonics, Inc. Acoustic cell separation techniques and processes
JP7030522B2 (ja) 2015-05-11 2022-03-07 エディタス・メディシン、インコーポレイテッド 幹細胞における遺伝子編集のための最適化crispr/cas9システムおよび方法
WO2016201047A1 (en) 2015-06-09 2016-12-15 Editas Medicine, Inc. Crispr/cas-related methods and compositions for improving transplantation
US10648020B2 (en) 2015-06-18 2020-05-12 The Broad Institute, Inc. CRISPR enzymes and systems
EP3786294A1 (en) 2015-09-24 2021-03-03 Editas Medicine, Inc. Use of exonucleases to improve crispr/cas-mediated genome editing
EP3365357B1 (en) 2015-10-23 2024-02-14 President and Fellows of Harvard College Evolved cas9 proteins for gene editing
US11597924B2 (en) 2016-03-25 2023-03-07 Editas Medicine, Inc. Genome editing systems comprising repair-modulating enzyme molecules and methods of their use
WO2017180694A1 (en) 2016-04-13 2017-10-19 Editas Medicine, Inc. Cas9 fusion molecules gene editing systems, and methods of use thereof
US11214789B2 (en) 2016-05-03 2022-01-04 Flodesign Sonics, Inc. Concentration and washing of particles with acoustics
CA3032822A1 (en) 2016-08-02 2018-02-08 Editas Medicine, Inc. Compositions and methods for treating cep290 associated disease
AU2017306676B2 (en) 2016-08-03 2024-02-22 President And Fellows Of Harvard College Adenosine nucleobase editors and uses thereof
AU2017308889B2 (en) 2016-08-09 2023-11-09 President And Fellows Of Harvard College Programmable Cas9-recombinase fusion proteins and uses thereof
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
SG11201903089RA (en) 2016-10-14 2019-05-30 Harvard College Aav delivery of nucleobase editors
JP2019535287A (ja) * 2016-11-22 2019-12-12 インテグレイテツド・デイー・エヌ・エイ・テクノロジーズ・インコーポレイテツド Crispr/cpf1システム及び方法
WO2018119359A1 (en) 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
WO2018165504A1 (en) 2017-03-09 2018-09-13 President And Fellows Of Harvard College Suppression of pain by gene editing
US11542496B2 (en) 2017-03-10 2023-01-03 President And Fellows Of Harvard College Cytosine to guanine base editor
EP3596217A1 (en) 2017-03-14 2020-01-22 Editas Medicine, Inc. Systems and methods for the treatment of hemoglobinopathies
IL306092A (en) 2017-03-23 2023-11-01 Harvard College Nucleic base editors that include nucleic acid programmable DNA binding proteins
WO2018195545A2 (en) 2017-04-21 2018-10-25 The General Hospital Corporation Variants of cpf1 (cas12a) with altered pam specificity
EP3615672A1 (en) 2017-04-28 2020-03-04 Editas Medicine, Inc. Methods and systems for analyzing guide rna molecules
EP3622070A2 (en) 2017-05-10 2020-03-18 Editas Medicine, Inc. Crispr/rna-guided nuclease systems and methods
WO2018209320A1 (en) 2017-05-12 2018-11-15 President And Fellows Of Harvard College Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation
US11603544B2 (en) 2017-06-05 2023-03-14 Fred Hutchinson Cancer Center Genomic safe harbors for genetic therapies in human stem cells and engineered nanoparticles to provide targeted genetic therapies
EP3635104A1 (en) 2017-06-09 2020-04-15 Editas Medicine, Inc. Engineered cas9 nucleases
WO2019014564A1 (en) 2017-07-14 2019-01-17 Editas Medicine, Inc. SYSTEMS AND METHODS OF TARGETED INTEGRATION AND GENOME EDITING AND DETECTION THEREOF WITH INTEGRATED PRIMING SITES
JP2020534795A (ja) 2017-07-28 2020-12-03 プレジデント アンド フェローズ オブ ハーバード カレッジ ファージによって支援される連続的進化(pace)を用いて塩基編集因子を進化させるための方法および組成物
JP2020532967A (ja) 2017-08-23 2020-11-19 ザ ジェネラル ホスピタル コーポレイション 変更されたPAM特異性を有する遺伝子操作されたCRISPR−Cas9ヌクレアーゼ
WO2019139645A2 (en) 2017-08-30 2019-07-18 President And Fellows Of Harvard College High efficiency base editors comprising gam
WO2019041296A1 (zh) * 2017-09-01 2019-03-07 上海科技大学 一种碱基编辑系统及方法
US11795443B2 (en) 2017-10-16 2023-10-24 The Broad Institute, Inc. Uses of adenosine base editors
US10253365B1 (en) 2017-11-22 2019-04-09 The Regents Of The University Of California Type V CRISPR/Cas effector proteins for cleaving ssDNAs and detecting target DNAs
JP2021505187A (ja) * 2017-12-11 2021-02-18 エディタス・メディシン、インコーポレイテッド 遺伝子編集のためのcpf1関連方法及び組成物
BR112020009889A2 (pt) 2017-12-14 2020-11-03 Flodesign Sonics, Inc. acionador e controlador de transdutor acústico
CN111836903A (zh) * 2017-12-22 2020-10-27 博德研究所 基于crispr效应系统的多重诊断
CN109957569B (zh) * 2017-12-22 2022-10-25 苏州齐禾生科生物科技有限公司 基于cpf1蛋白的碱基编辑系统和方法
CA3088052A1 (en) * 2018-01-11 2019-07-18 KWS SAAT SE & Co. KGaA Optimized plant crispr/cpf1 systems
EP3765614A1 (en) 2018-03-14 2021-01-20 Editas Medicine, Inc. Systems and methods for the treatment of hemoglobinopathies
CN108486146B (zh) * 2018-03-16 2021-02-19 中国农业科学院作物科学研究所 LbCpf1-RR突变体用于CRISPR/Cpf1系统在植物基因编辑中的应用
WO2019217943A1 (en) * 2018-05-11 2019-11-14 Beam Therapeutics Inc. Methods of editing single nucleotide polymorphism using programmable base editor systems
RU2703532C1 (ru) * 2018-06-15 2019-10-21 ФБУН Центральный НИИ эпидемиологии Роспотребнадзора Система для активации цитидиндезаминаз APOBEC/AID человека и/или урацил-ДНК-гликозилазы UNG человека и ее применение для элиминации ккз ДНК вируса гепатита B из клеток человека, в частности из гепатоцитов
KR20210040943A (ko) 2018-06-26 2021-04-14 매사추세츠 인스티튜트 오브 테크놀로지 Crispr 이펙터 시스템 기반 증폭 방법, 시스템, 및 진단
WO2020006067A1 (en) 2018-06-26 2020-01-02 The Broad Institute, Inc. Crispr double nickase based amplification compositions, systems, and methods
EP3830301A1 (en) 2018-08-01 2021-06-09 Mammoth Biosciences, Inc. Programmable nuclease compositions and methods of use thereof
WO2020081267A2 (en) * 2018-10-04 2020-04-23 The Regents Of The University Of Colorado, A Body Corporate Engineered chimeric nucleic acid guided nuclease constructs and uses thereof
EP3861012A4 (en) * 2018-10-04 2022-10-19 The Regents of the University of Colorado, a Body Corporate GENE ENGINEERED CHIMERIC NUCLEIC ACID-LIKE NUCLEASES, COMPOSITIONS, METHODS OF MANUFACTURE AND SYSTEMS FOR GENE EDITING
WO2020124050A1 (en) 2018-12-13 2020-06-18 The Broad Institute, Inc. Tiled assays using crispr-cas based detection
WO2020142754A2 (en) 2019-01-04 2020-07-09 Mammoth Biosciences, Inc. Programmable nuclease improvements and compositions and methods for nucleic acid amplification and detection
WO2020142730A1 (en) * 2019-01-04 2020-07-09 Stellate Biotherapeutics, Inc. Targeted genome modification using circular single-stranded dna
AU2020226864B2 (en) * 2019-02-22 2023-09-28 Integrated Dna Technologies, Inc. Lachnospiraceae Bacterium ND2006 Cas12a mutant genes and polypeptides encoded by same
WO2020186231A2 (en) 2019-03-14 2020-09-17 The Broad Institute, Inc. Crispr effector system based multiplex diagnostics
JP2022526908A (ja) 2019-03-19 2022-05-27 ザ ブロード インスティテュート,インコーポレーテッド 編集ヌクレオチド配列を編集するための方法および組成物
US20220220468A1 (en) * 2019-05-17 2022-07-14 Beth Israel Deaconess Medical Center, Inc. Compositions and methods for homology directed repair
BR112021026832A2 (pt) 2019-07-02 2022-05-10 Hutchinson Fred Cancer Res Vetores ad35 recombinantes e aprimoramentos da terapia gênica relacionada
US20220333208A1 (en) 2019-09-03 2022-10-20 The Broad Institute, Inc. Crispr effector system based multiplex cancer diagnostics
EP4045651A1 (en) * 2019-10-14 2022-08-24 KWS SAAT SE & Co. KGaA Mad7 nuclease in plants and expanding its pam recognition capability
CA3157707A1 (en) * 2019-10-17 2021-04-22 Pairwise Plants Services, Inc. Variants of cas12a nucleases and methods of making and use thereof
WO2021081384A1 (en) * 2019-10-25 2021-04-29 Greenvenus, Llc Synthetic nucleases
US11844800B2 (en) 2019-10-30 2023-12-19 Massachusetts Institute Of Technology Methods and compositions for predicting and preventing relapse of acute lymphoblastic leukemia
CN110747187B (zh) * 2019-11-13 2022-10-21 电子科技大学 识别TTTV、TTV双PAM位点的Cas12a蛋白、植物基因组定向编辑载体及方法
AU2020399638A1 (en) 2019-12-08 2022-06-16 Editas Medicine, Inc. Modified cells and methods for the treatment of hemoglobinopathies
AU2020431316A1 (en) * 2020-02-28 2022-10-20 Huigene Therapeutics Co., Ltd. Type VI-E and type VI-F CRISPR-Cas system and uses thereof
AU2021267940A1 (en) 2020-05-08 2022-12-08 President And Fellows Of Harvard College Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence
CN111904973B (zh) * 2020-07-27 2021-12-03 中国农业科学院兰州兽医研究所 ssc-miR-122在制备调节猪繁殖与呼吸综合征病毒复制的药物中的应用
WO2022051418A1 (en) 2020-09-01 2022-03-10 64-X, Inc. Mammalian cells and methods for engineering the same
CN112111470B (zh) * 2020-09-10 2022-06-14 武汉大学 一种R-环结合蛋白GST-His6-1/2×HBD及全基因组R-环的检测方法
CN112111471B (zh) * 2020-09-25 2022-05-03 中国科学院微生物研究所 广谱识别PAM序列的FnCpf1突变体及其应用
CN116334037A (zh) * 2020-11-11 2023-06-27 山东舜丰生物科技有限公司 新型Cas酶和系统以及应用
CN112195164B (zh) * 2020-12-07 2021-04-23 中国科学院动物研究所 工程化的Cas效应蛋白及其使用方法
US20240076712A1 (en) * 2021-01-08 2024-03-07 Wuhan University Compositions and methods for instant nucleic acid detection
JP2024506608A (ja) * 2021-02-08 2024-02-14 エメンドバイオ・インコーポレイテッド Omni-103 crisprヌクレアーゼ
US20220333097A1 (en) * 2021-04-07 2022-10-20 Battelle Memorial Institute Rapid design, build, test, and learn technologies for identifying and using non-viral carriers
WO2022217086A1 (en) 2021-04-09 2022-10-13 Vor Biopharma Inc. Photocleavable guide rnas and methods of use thereof
CA3222023A1 (en) 2021-06-01 2022-12-08 Arbor Biotechnologies, Inc. Gene editing systems comprising a crispr nuclease and uses thereof
WO2023283585A2 (en) 2021-07-06 2023-01-12 Vor Biopharma Inc. Inhibitor oligonucleotides and methods of use thereof
AU2022324093A1 (en) 2021-08-02 2024-02-08 Vor Biopharma Inc. Compositions and methods for gene modification
CA3226886A1 (en) 2021-08-02 2023-02-09 Editas Medicine, Inc. Systems and methods for the treatment of hemoglobinopathies
KR102356172B1 (ko) * 2021-08-24 2022-02-08 (주)코미코 내플라즈마성 코팅막의 제조방법
WO2023049926A2 (en) 2021-09-27 2023-03-30 Vor Biopharma Inc. Fusion polypeptides for genetic editing and methods of use thereof
WO2024073751A1 (en) 2022-09-29 2024-04-04 Vor Biopharma Inc. Methods and compositions for gene modification and enrichment
CN116286734B (zh) * 2022-11-29 2024-04-02 武汉大学 野生型LbCas12a蛋白的突变体及SNP检测用途

Family Cites Families (115)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4217344A (en) 1976-06-23 1980-08-12 L'oreal Compositions containing aqueous dispersions of lipid spheres
US4235871A (en) 1978-02-24 1980-11-25 Papahadjopoulos Demetrios P Method of encapsulating biologically active materials in lipid vesicles
US4186183A (en) 1978-03-29 1980-01-29 The United States Of America As Represented By The Secretary Of The Army Liposome carriers in chemotherapy of leishmaniasis
US4261975A (en) 1979-09-19 1981-04-14 Merck & Co., Inc. Viral liposome particle
US4485054A (en) 1982-10-04 1984-11-27 Lipoderm Pharmaceuticals Limited Method of encapsulating biologically active materials in multilamellar lipid vesicles (MLV)
US4501728A (en) 1983-01-06 1985-02-26 Technology Unlimited, Inc. Masking of liposomes from RES recognition
US5049386A (en) 1985-01-07 1991-09-17 Syntex (U.S.A.) Inc. N-ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)Alk-1-YL-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4946787A (en) 1985-01-07 1990-08-07 Syntex (U.S.A.) Inc. N-(ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4897355A (en) 1985-01-07 1990-01-30 Syntex (U.S.A.) Inc. N[ω,(ω-1)-dialkyloxy]- and N-[ω,(ω-1)-dialkenyloxy]-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4797368A (en) 1985-03-15 1989-01-10 The United States Of America As Represented By The Department Of Health And Human Services Adeno-associated virus as eukaryotic expression vector
US4774085A (en) 1985-07-09 1988-09-27 501 Board of Regents, Univ. of Texas Pharmaceutical administration systems containing a mixture of immunomodulators
DE122007000007I2 (de) 1986-04-09 2010-12-30 Genzyme Corp Genetisch transformierte Tiere, die ein gewünschtes Protein in Milch absondern
US4837028A (en) 1986-12-24 1989-06-06 Liposome Technology, Inc. Liposomes with enhanced circulation time
US4873316A (en) 1987-06-23 1989-10-10 Biogen, Inc. Isolation of exogenous recombinant proteins from the milk of transgenic mammals
US5703055A (en) 1989-03-21 1997-12-30 Wisconsin Alumni Research Foundation Generation of antibodies through lipid mediated DNA delivery
US5143854A (en) 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US5264618A (en) 1990-04-19 1993-11-23 Vical, Inc. Cationic lipids for intracellular delivery of biologically active molecules
WO1991017424A1 (en) 1990-05-03 1991-11-14 Vical, Inc. Intracellular delivery of biologically active substances by means of self-assembling lipid complexes
US5210015A (en) 1990-08-06 1993-05-11 Hoffman-La Roche Inc. Homogeneous assay system using the nuclease activity of a nucleic acid polymerase
US5173414A (en) 1990-10-30 1992-12-22 Applied Immune Sciences, Inc. Production of recombinant adeno-associated virus vectors
US5587308A (en) 1992-06-02 1996-12-24 The United States Of America As Represented By The Department Of Health & Human Services Modified adeno-associated virus vector capable of expression from a novel promoter
US5593972A (en) 1993-01-26 1997-01-14 The Wistar Institute Genetic immunization
US5543158A (en) 1993-07-23 1996-08-06 Massachusetts Institute Of Technology Biodegradable injectable nanoparticles
US6007845A (en) 1994-07-22 1999-12-28 Massachusetts Institute Of Technology Nanoparticles and microparticles of non-linear hydrophilic-hydrophobic multiblock copolymers
WO1996039154A1 (en) 1995-06-06 1996-12-12 Isis Pharmaceuticals, Inc. Oligonucleotides having phosphorothioate linkages of high chiral purity
US5985662A (en) 1995-07-13 1999-11-16 Isis Pharmaceuticals Inc. Antisense inhibition of hepatitis B virus replication
US5985309A (en) 1996-05-24 1999-11-16 Massachusetts Institute Of Technology Preparation of particles for inhalation
US5855913A (en) 1997-01-16 1999-01-05 Massachusetts Instite Of Technology Particles incorporating surfactants for pulmonary drug delivery
US5846946A (en) 1996-06-14 1998-12-08 Pasteur Merieux Serums Et Vaccins Compositions and methods for administering Borrelia DNA
US5944710A (en) 1996-06-24 1999-08-31 Genetronics, Inc. Electroporation-mediated intravascular delivery
US5869326A (en) 1996-09-09 1999-02-09 Genetronics, Inc. Electroporation employing user-configured pulsing scheme
GB9907461D0 (en) 1999-03-31 1999-05-26 King S College London Neurite regeneration
GB9710049D0 (en) 1997-05-19 1997-07-09 Nycomed Imaging As Method
GB9720465D0 (en) 1997-09-25 1997-11-26 Oxford Biomedica Ltd Dual-virus vectors
CA2307016A1 (en) 1997-10-24 1999-05-06 Life Technologies, Inc. Recombinational cloning using nucleic acids having recombination sites
US6750059B1 (en) 1998-07-16 2004-06-15 Whatman, Inc. Archiving of vectors
US6534261B1 (en) 1999-01-12 2003-03-18 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
US7868149B2 (en) 1999-07-20 2011-01-11 Monsanto Technology Llc Plant genome sequence and uses thereof
US6603061B1 (en) 1999-07-29 2003-08-05 Monsanto Company Agrobacterium-mediated plant transformation method
GB0024550D0 (ko) 2000-10-06 2000-11-22 Oxford Biomedica Ltd
WO2002032396A2 (en) 2000-10-16 2002-04-25 Massachusetts Institute Of Technology Lipid-protein-sugar particles for delivery of nucleic acids
WO2003045304A2 (en) 2001-09-26 2003-06-05 Mayo Foundation For Medical Education And Research Mutable vaccines
GB0125216D0 (en) 2001-10-19 2001-12-12 Univ Strathclyde Dendrimers for use in targeted delivery
US20090100536A1 (en) 2001-12-04 2009-04-16 Monsanto Company Transgenic plants with enhanced agronomic traits
JP2005512598A (ja) 2001-12-21 2005-05-12 オックスフォード バイオメディカ (ユーケー) リミテッド Eiavなどのレンチウイルス発現ベクターを使用するトランスジェニック生物の作製方法
ATE485031T1 (de) 2002-06-28 2010-11-15 Protiva Biotherapeutics Inc Verfahren und vorrichtung zur herstellung von liposomen
GB0220467D0 (en) 2002-09-03 2002-10-09 Oxford Biomedica Ltd Composition
EP2567693B1 (en) 2003-07-16 2015-10-21 Protiva Biotherapeutics Inc. Lipid encapsulated interfering RNA
NZ592917A (en) 2003-09-15 2012-12-21 Protiva Biotherapeutics Inc Stable polyethyleneglycol (PEG) dialkyloxypropyl (DAA) lipid conjugates
US20050123596A1 (en) 2003-09-23 2005-06-09 Kohane Daniel S. pH-triggered microparticles
GB0325379D0 (en) 2003-10-30 2003-12-03 Oxford Biomedica Ltd Vectors
US7745651B2 (en) 2004-06-07 2010-06-29 Protiva Biotherapeutics, Inc. Cationic lipids and methods of use
US7799565B2 (en) 2004-06-07 2010-09-21 Protiva Biotherapeutics, Inc. Lipid encapsulated interfering RNA
JP4772045B2 (ja) 2004-07-16 2011-09-14 アメリカ合衆国 Cmv/r核酸コンストラクトを含むaidsに対するワクチン
GB0422877D0 (en) 2004-10-14 2004-11-17 Univ Glasgow Bioactive polymers
EP1940734A2 (en) 2005-08-10 2008-07-09 Northwestern University Composite particles
WO2007048046A2 (en) 2005-10-20 2007-04-26 Protiva Biotherapeutics, Inc. Sirna silencing of filovirus gene expression
EP1950294B1 (en) 2005-10-28 2012-01-18 Mitsubishi Tanabe Pharma Corporation Novel cell penetrating peptide
US8101741B2 (en) 2005-11-02 2012-01-24 Protiva Biotherapeutics, Inc. Modified siRNA molecules and uses thereof
GB0526211D0 (en) 2005-12-22 2006-02-01 Oxford Biomedica Ltd Viral vectors
US7915399B2 (en) 2006-06-09 2011-03-29 Protiva Biotherapeutics, Inc. Modified siRNA molecules and uses thereof
JP2008078613A (ja) 2006-08-24 2008-04-03 Rohm Co Ltd 窒化物半導体の製造方法及び窒化物半導体素子
US8642295B2 (en) 2007-01-11 2014-02-04 Erasmus University Medical Center Circular chromosome conformation capture (4C)
US8349554B2 (en) 2007-08-14 2013-01-08 Fred Hutchinson Cancer Research Center Needle array assembly and method for delivering therapeutic agents
WO2009082607A2 (en) 2007-12-04 2009-07-02 Alnylam Pharmaceuticals, Inc. Targeting lipids
CN101970051A (zh) 2007-12-31 2011-02-09 纳诺科尔治疗公司 用于治疗心力衰竭的rna干扰
US8907061B2 (en) 2008-01-11 2014-12-09 Lawrence Livermore National Security, Llc. Nanolipoprotein particles and related methods and systems for protein capture, solubilization, and/or purification
WO2009127060A1 (en) 2008-04-15 2009-10-22 Protiva Biotherapeutics, Inc. Novel lipid formulations for nucleic acid delivery
JP2011523557A (ja) 2008-06-04 2011-08-18 メディカル リサーチ カウンシル ペプチド
US8999945B2 (en) 2008-06-30 2015-04-07 Silenseed Ltd Methods, compositions and systems for local delivery of drugs
WO2010004594A1 (en) 2008-07-08 2010-01-14 S.I.F.I. Societa' Industria Farmaceutica Italiana S.P.A. Ophthalmic compositions for treating pathologies of the posterior segment of the eye
JP2012507562A (ja) 2008-10-30 2012-03-29 ダビド リウ 微小球性多孔質生体適合性足場並びにその製造方法及び装置
MX2011004859A (es) 2008-11-07 2011-08-03 Massachusetts Inst Technology Lipidoides de aminoalcohol y usos de los mismos.
US8734816B2 (en) 2009-01-05 2014-05-27 Stc.Unm Porous nanoparticle supported lipid bilayer nanostructures
EP2427577A4 (en) 2009-05-04 2013-10-23 Hutchinson Fred Cancer Res PSEUDOTYPED RETROVIRAL VECTORS WITH COCAL VESICULOVIRUS SHELL
CA2767127A1 (en) 2009-07-01 2011-01-06 Protiva Biotherapeutics, Inc. Novel lipid formulations for delivery of therapeutic agents to solid tumors
CA2767129C (en) 2009-07-01 2015-01-06 Protiva Biotherapeutics, Inc. Compositions and methods for silencing apolipoprotein b
US8927807B2 (en) 2009-09-03 2015-01-06 The Regents Of The University Of California Nitrate-responsive promoter
US8889394B2 (en) 2009-09-07 2014-11-18 Empire Technology Development Llc Multiple domain proteins
MX2012009178A (es) 2010-02-24 2012-11-30 Arrowhead Res Corp Composiciones para liberacion dirigida de arnsi.
US8372951B2 (en) 2010-05-14 2013-02-12 National Tsing Hua University Cell penetrating peptides for intracellular delivery
CN102946907A (zh) 2010-05-28 2013-02-27 牛津生物医学(英国)有限公司 慢病毒载体向脑的递送
US9193827B2 (en) 2010-08-26 2015-11-24 Massachusetts Institute Of Technology Poly(beta-amino alcohols), their preparation, and uses thereof
US20120190609A1 (en) 2010-08-30 2012-07-26 Martin Bader Method for producing a lipid particle, the lipid particle itself and its use
US9405700B2 (en) 2010-11-04 2016-08-02 Sonics, Inc. Methods and apparatus for virtualization in an integrated circuit
EP2691443B1 (en) 2011-03-28 2021-02-17 Massachusetts Institute of Technology Conjugated lipomers and uses thereof
AU2012236099A1 (en) 2011-03-31 2013-10-03 Moderna Therapeutics, Inc. Delivery and formulation of engineered nucleic acids
US20120295960A1 (en) 2011-05-20 2012-11-22 Oxford Biomedica (Uk) Ltd. Treatment regimen for parkinson's disease
US20140328759A1 (en) 2011-10-25 2014-11-06 The University Of British Columbia Limit size lipid nanoparticles and related methods
US20140308304A1 (en) 2011-12-07 2014-10-16 Alnylam Pharmaceuticals, Inc. Lipids for the delivery of active agents
EP2791160B1 (en) 2011-12-16 2022-03-02 ModernaTX, Inc. Modified mrna compositions
MX2014001965A (es) 2012-04-18 2014-03-31 Arrowhead Res Corp Polimeros de poli(acrilato) para suministro de acido nucleico in vivo.
PT3494997T (pt) 2012-07-25 2019-12-05 Massachusetts Inst Technology Proteínas de ligação a adn indutíveis e ferramentas de perturbação do genoma e aplicações destas
US8614194B1 (en) 2012-07-25 2013-12-24 Kaohsiung Medical University Anionic cell penetrating peptide and its use for intracellular delivery
EP2931899A1 (en) 2012-12-12 2015-10-21 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions, methods, knock out libraries and applications thereof
DK2898075T3 (en) 2012-12-12 2016-06-27 Broad Inst Inc CONSTRUCTION AND OPTIMIZATION OF IMPROVED SYSTEMS, PROCEDURES AND ENZYME COMPOSITIONS FOR SEQUENCE MANIPULATION
PT2921557T (pt) * 2012-12-12 2016-10-19 Massachusetts Inst Technology Engenharia de sistemas, métodos e composições guia otimizadas para a manipulação de sequências
ES2658401T3 (es) * 2012-12-12 2018-03-09 The Broad Institute, Inc. Suministro, modificación y optimización de sistemas, métodos y composiciones para la manipulación de secuencias y aplicaciones terapéuticas
CA3081054A1 (en) 2012-12-17 2014-06-26 President And Fellows Of Harvard College Rna-guided human genome engineering
WO2014118272A1 (en) 2013-01-30 2014-08-07 Santaris Pharma A/S Antimir-122 oligonucleotide carbohydrate conjugates
US9693958B2 (en) 2013-03-15 2017-07-04 Cureport, Inc. Methods and devices for preparation of lipid nanoparticles
US20160082126A1 (en) 2013-05-13 2016-03-24 Tufts University Nanocomplexes for delivery of saporin
WO2014186348A2 (en) 2013-05-14 2014-11-20 Tufts University Nanocomplexes of modified peptides or proteins
US20140356956A1 (en) 2013-06-04 2014-12-04 President And Fellows Of Harvard College RNA-Guided Transcriptional Regulation
US11306328B2 (en) 2013-07-26 2022-04-19 President And Fellows Of Harvard College Genome engineering
LT3066201T (lt) 2013-11-07 2018-08-10 Editas Medicine, Inc. Su crispr susiję būdai ir kompozicijos su valdančiomis grnr
MX2016007327A (es) 2013-12-12 2017-03-06 Broad Inst Inc Suministro, uso y aplicaciones terapeuticas de sistemas y composiciones crispr-cas para dirigirlos a trastornos y enfermedades usando componentes para suministro de particulas.
WO2015089354A1 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Compositions and methods of use of crispr-cas systems in nucleotide repeat disorders
US10077453B2 (en) 2014-07-30 2018-09-18 President And Fellows Of Harvard College CAS9 proteins including ligand-dependent inteins
US11172675B2 (en) 2014-12-22 2021-11-16 Oro Agri Inc. Nano particulate delivery system
GB201506509D0 (en) * 2015-04-16 2015-06-03 Univ Wageningen Nuclease-mediated genome editing
US9790490B2 (en) * 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
SI3310764T1 (sl) 2015-06-19 2023-06-30 Massachusetts Institute Of Technology Z alkenilom substituirani 2,5-piperazindioni in njihova uporaba v sestavkih za dostavo sredstva subjektu ali celici
CA2999916C (en) 2015-09-23 2021-07-20 Massachusetts Institute Of Technology Compositions and methods for modified dendrimer nanoparticle vaccine delivery
US20190264186A1 (en) * 2016-01-22 2019-08-29 The Broad Institute Inc. Crystal structure of crispr cpf1

Also Published As

Publication number Publication date
KR102424476B1 (ko) 2022-07-25
CA3026055A1 (en) 2017-10-26
AU2023241391A1 (en) 2023-10-26
SG11201810179RA (en) 2018-12-28
EP3445848A1 (en) 2019-02-27
US20210155911A1 (en) 2021-05-27
AU2017253089B2 (en) 2023-07-20
SG10202010311SA (en) 2020-11-27
AU2017253089A1 (en) 2018-12-06
CN110382692A (zh) 2019-10-25
WO2017184768A1 (en) 2017-10-26
KR20210111370A (ko) 2021-09-13

Similar Documents

Publication Publication Date Title
KR102424476B1 (ko) 신규한 crispr 효소 및 시스템
US20220162584A1 (en) Cpf1 complexes with reduced indel activity
JP7454494B2 (ja) 標的化された核酸編集のためのcrispr/cas-アデニンデアミナーゼ系の組成物、系及び方法
AU2017257274B2 (en) Novel CRISPR enzymes and systems
KR102575342B1 (ko) 표적외 효과를 감소시키는 crispr 효소 돌연변이
AU2016278990B2 (en) Novel CRISPR enzymes and systems
WO2017106657A1 (en) Novel crispr enzymes and systems
EP3500671A1 (en) Novel crispr enzymes and systems
WO2016205749A9 (en) Novel crispr enzymes and systems
WO2020236972A2 (en) Non-class i multi-component nucleic acid targeting systems
EP4081260A1 (en) Programmable dna nuclease-associated ligase and methods of use thereof
EP4214224A1 (en) T-dna mediated genetic modification
WO2021146641A1 (en) Small type ii-d cas proteins and methods of use thereof
EP4085145A1 (en) Guided excision-transposition systems
TWI837592B (zh) 新型crispr酶以及系統

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right