KR20240116827A - 신규한 crispr 효소, 방법, 시스템 및 이의 용도 - Google Patents

신규한 crispr 효소, 방법, 시스템 및 이의 용도 Download PDF

Info

Publication number
KR20240116827A
KR20240116827A KR1020247023120A KR20247023120A KR20240116827A KR 20240116827 A KR20240116827 A KR 20240116827A KR 1020247023120 A KR1020247023120 A KR 1020247023120A KR 20247023120 A KR20247023120 A KR 20247023120A KR 20240116827 A KR20240116827 A KR 20240116827A
Authority
KR
South Korea
Prior art keywords
sequence
cas9
strain
cas9 protein
nucleic acid
Prior art date
Application number
KR1020247023120A
Other languages
English (en)
Inventor
베른트 제체
데이비드 에이. 본
루이스 바레라
Original Assignee
빔 테라퓨틱스, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 빔 테라퓨틱스, 인크. filed Critical 빔 테라퓨틱스, 인크.
Publication of KR20240116827A publication Critical patent/KR20240116827A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/22Vectors comprising a coding region that has been codon optimised for expression in a respective host

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Epidemiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Virology (AREA)
  • Peptides Or Proteins (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

본 발명은 핵산 표적화 및 조작을 위해 인간 세포에 대해 최적화된 재조합적으로 조작된 신규한 Cas9 효소를 제조하고 사용하기 위한 신규한 시스템, 방법 및 조성물을 제공한다. 본 발명은 인간 세포에서 사용하기 위해 코돈 최적화되고 재조합적으로 생산된 스트렙토코커스 에쿠이누스 ATCC 33317, 엔테로코커스 히라에 균주 F1129E, 스트렙토코커스 에쿠이누스 균주 AG46, 스타필로코커스 시뮬란스 균주 19, 스트렙토코커스 인터메디우스 B196 균주 G1552, 스트렙토코커스 상귀니스 SK330, 스트렙토코커스 종 C150, 스트렙토코커스 오랄리스 아종 오랄리스 균주 RH_1735_08, 스트렙토코커스 오랄리스 SK313, 스타필로코커스 와르네리 균주 691, 스타필로코커스 스키우리 균주 SNUC 2430, 스트렙토코커스 갈롤리티쿠스 균주 AM24-4, 락토바실러스 쿨라베르겐시스 균주 Biut2 및 스트렙토코커스 수이스 균주 LSS83 세균으로부터의 신규한 Cas9 효소의 발견에 기초하고 있다. 일부 실시형태에서, 신규한 Cas9 효소는 염기 편집에 사용될 수 있다. 일부 실시형태에서, 신규한 조작된 Cas9 효소는 인간 질환을 치료하는 데 사용된다.

Description

신규한 CRISPR 효소, 방법, 시스템 및 이의 용도
관련 출원에 대한 상호참조
본 출원은 2021년 12월 17일자로 출원된 미국 특허 가출원 제63/291,252호에 대한 우선권을 주장하며, 이 기초출원의 내용은 모든 목적을 위해 참조에 의해 본 명세서에 원용된다.
서열 목록의 참조에 의한 통합
2022년 11월 10일자로 생성되었으며 크기가 239킬로바이트인 "BEM-013WO1_SL.xml"라는 파일의 내용 전체가 참조에 의해 본 명세서에 원용된다.
원핵생물의 클러스터링된 규칙적으로 간격을 둔 짧은 회문 반복서열(Clustered, Regularly Interspaced Short Palindromic repeat: CRISPR) 및 CRISPR 연관 단백질(CRISPR-Cas) 시스템으로부터의 효소는 진핵생물에서 사용하기 위한 재프로그래밍 가능하고 매우 특이적인 게놈 편집 도구로 활용되었다. 게놈 편집 및 절단 외에도, CRISPR-Cas9는 효과기 분자를 게놈의 특정 부위에 위치시키는 데 사용될 수 있어, 다양한 메커니즘을 통해 유전적 및 후성유전적 조절과 전사적 조절을 가능하게 한다.
그러나, 다양한 게놈 및 게놈 표적에는 효과적인 유전 공학을 위한 다양한 도구가 필요하며, 다양한 서열을 인식하고 표적화할 수 있는 신규한 Cas 단백질의 발견 및 조작을 통해 CRISPR 툴박스(CRISPR toolbox)를 확장시킬 필요성이 남아 있다.
CRISPR-Cas9 시스템은 유전자를 넉아웃시키거나 유전자의 발현을 변형시키는 데 사용될 수 있지만, 소정의 종류의 유전자 편집은 유전자 내의 단일 염기를 편집하는 것과 같은 표적 유전자에 대한 정확한 변형이 필요하다. 이러한 정확한 변형은 여전히 과제로 남아 있으며, 광범위한 표적 유전자에서 정확한 게놈 변형을 수행하기 위해서는 다양한 유전자 편집 툴킷이 필요하다.
고유한 프로토스페이서 인접 모티프(protospacer adjacent motif: PAM)에 대한 특이성을 갖는 신규한 Cas9 효소의 식별은 유전자 편집에 사용할 수 있는 도구의 확장을 가능하게 한다. 본 발명은 특히 스트렙토코커스 에쿠이누스(Streptococcus equinus) ATCC 33317, 엔테로코커스 히라에(Enterococcus hirae) 균주 F1129E, 스트렙토코커스 에쿠이누스 균주 AG46, 스타필로코커스 시뮬란스(Staphylococcus simulans) 균주 19, 스트렙토코커스 인터메디우스(Streptococcus intermedius) B196 균주 G1552, 스트렙토코커스 상귀니스(Streptococcus sanguinis) SK330, 스트렙토코커스 종 C150, 스트렙토코커스 오랄리스(Streptococcus oralis) 아종 오랄리스 균주 RH_1735_08, 스트렙토코커스 오랄리스 SK313, 스타필로코커스 와르네리(Staphylococcus warneri) 균주 691, 스타필로코커스 스키우리(Staphylococcus stiuri) 균주 SNUC 2430, 스트렙토코커스 갈롤리티쿠스(Streptococcus gallolyticus) 균주 AM24-4, 락토바실러스 쿨라베르겐시스(Lactobacillus kullabergensis) 균주 Biut2 및 스트렙토코커스 수이스(Streptococcus suis) 균주 LSS83으로부터 단리되는 조작된 비자연 발생적 신규한 Cas9 효소를 제공한다.
본 발명은 부분적으로 특정 PAM 서열을 인식하는 다양한 세균으로부터 발견된 신규한 Cas9 효소가 진핵동물 세포(예를 들어, 인간, 식물 등)에서 발현되도록 조작될 수 있다는 놀라운 발견에 기초한다. 따라서, 기재된 Cas9 효소 및 이의 변이체는 진핵생물에서 기능적이다. 여기에 제공된 예는 표적 다양한 게놈 부위를 표적화하기 위해 다양한 PAM 인식 서열을 갖는 인간 세포에서 조작된 비천연 Cas9 효소의 사용을 보여준다. 예를 들어, 스트렙토코커스 에쿠이누스 ATCC 33317로부터 조작된 Cas9는 컨센서스 PAM 서열 5'-NRGNR-3'를 인식하고, 엔테로코커스 히라에 균주 F1129E는 컨센서스 PAM 서열 5'-NRG-3'를 인식하고, 스트렙토코커스 에쿠이누스 균주 AG46, 스타필로코커스 와르네리 균주 691 및 스타필로코커스 스키우리 균주 SNUC 2430은 컨센서스 PAM 서열 5'-NNGR-3'를 인식하고, 스타필로코커스 시뮬란스 균주 19는 컨센서스 PAM 서열 5'-NNGRRT-3'를 인식하고, 스트렙토코커스 인터메디우스 B196 균주 G1552는 컨센서스 PAM 서열 5'-NNAAAA-3'를 인식하고, 스트렙토코커스 상귀니스 SK330은 컨센서스 PAM 서열 5'-NGGNG-3'를 인식하고, 스트렙토코커스 종 C150은 컨센서스 PAM 서열 5'-NNGNRG-3'를 인식하고, 스트렙토코커스 오랄리스 아종 오랄리스 균주 RH_1735_08은 컨센서스 PAM 서열 5'-NNAAAC-3'를 인식하고, 스트렙토코커스 오랄리스 SK313은 컨센서스 PAM 서열 5'-NNRAAG-3'를 인식하고, 스트렙토코커스 갈롤리티쿠스 균주 AM24-4는 컨센서스 PAM 서열 5'-NNAYAA-3'를 인식하고, 락토바실러스 쿨라베르겐시스 균주 Biut2는 컨센서스 PAM 서열 5'-NNGAAA-3'를 인식하고, 스트렙토코커스 수이스 균주는 컨센서스 PAM 서열 5'-NNAAA-3'를 인식한다(H = A, C 또는 T; R = A 또는 G).
일 양태에서, 스트렙토코커스 에쿠이누스 ATCC 33317 Cas9, 엔테로코커스 히라에 균주 F1129E Cas9, 스트렙토코커스 에쿠이누스 균주 AG46 Cas9, 스타필로코커스 시뮬란스 균주 19 Cas9, 스트렙토코커스 인터메디우스 B196 균주 G1552, 스트렙토코커스 상귀니스 SK330 Cas9, 스트렙토코커스 종 C150 Cas9, 스트렙토코커스 오랄리스 아종 오랄리스 균주 RH_1735_08 Cas9, 스트렙토코커스 오랄리스 SK313 Cas9, 스타필로코커스 와르네리 균주 691 Cas9, 스타필로코커스 스키우리 균주 SNUC 2430 Cas9, 스트렙토코커스 갈롤리티쿠스 균주 AM24-4 Cas9, 락토바실러스 쿨라베르겐시스 균주 Biut2 Cas9 및 스트렙토코커스 수이스 균주 LSS83 Cas9로부터 변형된 조작된 비자연 발생적 Cas9 단백질이 본 명세서에 제공된다.
일부 실시형태에서, 스트렙토코커스 에쿠이누스 ATCC 33317 Cas9 단백질은 다음과 적어도 80%의 서열 동일성을 갖는다:
.
일부 실시형태에서, 엔테로코커스 히라에 균주 F1129E Cas9 단백질은 다음과 적어도 80%의 서열 동일성을 갖는다:
.
일부 실시형태에서, 스트렙토코커스 에쿠이누스 균주 AG46 Cas9 단백질은 다음과 적어도 80%의 서열 동일성을 갖는다:
.
일부 실시형태에서, 스타필로코커스 시뮬란스 균주 19 Cas9 단백질은 다음과 적어도 80%의 서열 동일성을 갖는다:
.
일부 실시형태에서, 스트렙토코커스_인터메디우스_B196_균주_G1552 Cas9 단백질은 다음과 적어도 80%의 서열 동일성을 갖는다:
.
일부 실시형태에서, 스트렙토코커스 상귀니스 SK330 Cas9 단백질은 다음과 적어도 80%의 서열 동일성을 갖는다:
.
일부 실시형태에서, 스트렙토코커스 종 C150 Cas9 단백질은 다음과 적어도 80%의 서열 동일성을 갖는다:
.
일부 실시형태에서, 스트렙토코커스 오랄리스 아종 오랄리스 균주 RH_1735_08 Cas9 단백질은 다음과 적어도 80%의 서열 동일성을 갖는다:
.
일부 실시형태에서, 스트렙토코커스 오랄리스 SK313 Cas9 단백질은 다음과 적어도 80%의 서열 동일성을 갖는다:
.
일부 실시형태에서, 스타필로코커스 와르네리 균주 691 Cas9 단백질은 다음과 적어도 80%의 서열 동일성을 갖는다:
.
일부 실시형태에서, 스타필로코커스 스키우리 균주 SNUC 2430 Cas9 단백질은 다음과 적어도 80%의 서열 동일성을 갖는다:
.
일부 실시형태에서, 스트렙토코커스 갈롤리티쿠스 균주 AM24-4 Cas9 단백질은 다음과 적어도 80%의 서열 동일성을 갖는다:
.
일부 실시형태에서, 락토바실러스 쿨라베르겐시스 균주 Biut2 Cas9 단백질은 다음과 적어도 80%의 서열 동일성을 갖는다:
.
일부 실시형태에서, 스트렙토코커스 수이스 균주 LSS83 Cas9 단백질은 다음과 적어도 80%의 서열 동일성을 갖는다:
.
일부 실시형태에서, Cas9 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 14와 적어도 85%, 적어도 90%, 적어도 92%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
일부 실시형태에서, Cas9 단백질은 핵 국재화 서열(Nuclear localization Signal: NLS) 및/또는 FLAG, HIS 또는 HA 태그를 추가로 포함한다.
일부 실시형태에서, 스트렙토코커스 에쿠이누스 ATCC 33317 Cas9(Seq2Cas9)는 다음과 적어도 80% 동일한 아미노산 서열을 갖는다:
.
일부 실시형태에서, 엔테로코커스 히라에 균주 F1129E Cas9(EhiCas9)는 다음과 적어도 80% 동일한 아미노산 서열을 갖는다:
.
일부 실시형태에서, 스트렙토코커스 에쿠이누스 균주 AG46(SeqCas9)는 다음과 적어도 80% 동일한 아미노산 서열을 갖는다:
.
일부 실시형태에서, 스타필로코커스 시뮬란스 균주 19(SsiCas9)는 다음과 적어도 80% 동일한 아미노산 서열을 갖는다:
.
일부 실시형태에서, 스트렙토코커스 인터메디우스 B196 균주 G1552(SinCas9)는 다음과 적어도 80% 동일한 아미노산 서열을 갖는다:
.
일부 실시형태에서, 스트렙토코커스 상귀니스 SK330 Cas9는 다음과 적어도 80% 동일한 아미노산 서열을 갖는다:
.
일부 실시형태에서, 스트렙토코커스 종 C150 Cas9는 다음과 적어도 80% 동일한 아미노산 서열을 갖는다:
.
일부 실시형태에서, 스트렙토코커스 오랄리스 아종 오랄리스 균주 RH_1735_08 Cas9는 다음과 적어도 80% 동일한 아미노산 서열을 갖는다:
.
일부 실시형태에서, 스트렙토코커스 오랄리스 SK313 Cas9는 다음과 적어도 80% 동일한 아미노산 서열을 갖는다:
.
일부 실시형태에서, 스트렙토코커스 오랄리스 SK313 Cas9는 다음과 적어도 80% 동일한 아미노산 서열을 갖는다:
.
일부 실시형태에서, 스타필로코커스 와르네리 균주 691 Cas9는 다음과 적어도 80% 동일한 아미노산 서열을 갖는다:
.
일부 실시형태에서, 스트렙토코커스 갈롤리티쿠스 균주 AM24-4 Cas9는 다음과 적어도 80% 동일한 아미노산 서열을 갖는다:
.
일부 실시형태에서, 락토바실러스 쿨라베르겐시스 균주 Biut2 Cas9는 다음과 적어도 80% 동일한 아미노산 서열을 갖는다:
.
일부 실시형태에서, 스트렙토코커스 수이스 균주 LSS83 Cas9는 다음과 적어도 80% 동일한 아미노산 서열을 갖는다:
.
일부 실시형태에서, Cas9 단백질의 아미노산 서열은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 14에 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개 또는 적어도 10개의 돌연변이를 포함한다.
일부 실시형태에서, 돌연변이는 아미노산 치환이다.
일부 실시형태에서, Cas9 단백질은 닉케이스(nickase) 활성을 갖는다.
일부 실시형태에서, 적어도 하나의 돌연변이는 불활성 Cas9(dCas9)를 생성한다.
일부 실시형태에서, Cas9 단백질은 PAM 상호작용, HNH 및/또는 RuvC 도메인에 적어도 하나의 아미노산 돌연변이를 포함한다.
일부 실시형태에서, Cas9 단백질은 핵 국재화 서열(NLS) 및/또는 FLAG, HIS 또는 HA 태그를 추가로 포함한다.
일 양태에서, 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 14과 적어도 80%의 동일성을 갖는 Cas9 단백질을 포함하는 조작된 비자연 발생적 Cas9 융합 단백질이 본 명세서에 제공되되, Cas9 단백질은 히스톤 데메틸레이스, 전사 활성화 인자 또는 데아미네이스에 융합된다.
일부 실시형태에서, Cas9 단백질은 사이토신 데아미네이스 또는 아데노신 데아미네이스에 융합된다.
일부 실시형태에서, Cas9 단백질은 아데노신 데아미네이스에 융합되며, 다음과 적어도 80% 동일한 아미노산 서열을 갖는다:
(a)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
(i)
(j)
(k)
(l)
(m)
(n)
일부 실시형태에서, Cas9 단백질은 사이토신 데아미네이스에 융합된다.
일부 실시형태에서, 스트렙토코커스 에쿠이누스 ATCC 33317 Cas9 단백질은 5'-NRGNR-3'를 포함하는 PAM 컨센서스 서열을 인식한다.
일부 실시형태에서, 엔테로코커스 히라에 균주 F1129E는 5'-NRG-3'를 포함하는 PAM 컨센서스 서열을 인식한다.
일부 실시형태에서, 스트렙토코커스 에쿠이누스 균주 AG46은 5'-NNGR-3'를 포함하는 PAM 컨센서스 서열을 인식한다.
일부 실시형태에서, 스타필로코커스 와르네리 균주 691은 5'-NNGR-3'를 포함하는 PAM 컨센서스 서열을 인식한다.
일부 실시형태에서, 스타필로코커스 스키우리 균주 SNUC 2430은 5'-NNGR-3'를 포함하는 PAM 컨센서스 서열을 인식한다.
일부 실시형태에서, 스타필로코커스 시뮬란스 균주 19는 5'-NNGRRT-3'를 포함하는 PAM 컨센서스 서열을 인식한다.
일부 실시형태에서, 스트렙토코커스 인터메디우스 B196 균주 G1552는 5'-NNAAAA-3'를 포함하는 컨센서스 PAM 서열을 인식한다.
일부 실시형태에서, 스트렙토코커스 상귀니스 SK330은 5'-NGGNG-3'를 포함하는 컨센서스 PAM 서열을 인식한다.
일부 실시형태에서, 스트렙토코커스 종 C150은 5'-NNGNRG-3'를 포함하는 컨센서스 PAM 서열을 인식한다.
일부 실시형태에서, 스트렙토코커스 오랄리스 아종 오랄리스 균주 RH_1735_08은 5'-NNAAAC-3'를 포함하는 컨센서스 PAM 서열을 인식한다.
일부 실시형태에서, 스트렙토코커스 오랄리스 SK313은 5'-NNRAAG-3'를 포함하는 컨센서스 PAM 서열을 인식한다.
일부 실시형태에서, 스트렙토코커스 갈롤리티쿠스 균주 AM24-4는 5'-NNAYAA-3'를 포함하는 컨센서스 PAM 서열을 인식한다.
일부 실시형태에서, 락토바실러스 쿨라베르겐시스 균주 Biut2는 5'-NNGAAA-3'를 포함하는 컨센서스 PAM 서열을 인식한다.
일부 실시형태에서, 스트렙토코커스 수이스 균주는 5'-NNAAA-3'를 포함하는 컨센서스 PAM 서열을 인식한다(H = A, C 또는 T; R = A 또는 G).
일부 실시형태에서, Cas9 단백질을 암호화하는 핵산이 제공된다.
일부 실시형태에서, 핵산은 포유동물 세포에서의 발현에 대해 코돈 최적화된다.
일부 실시형태에서, 핵산은 인간 세포에서의 발현에 대해 코돈 최적화된다.
일부 실시형태에서, Cas9 단백질을 포함하는 진핵동물 세포가 제공된다.
일부 실시형태에서, 세포는 인간 세포이다. 일부 실시형태에서, 세포는 식물 세포이다.
일 양태에서, 세포를 본 명세서에 기재된 바와 같은 Cas9 및 RNA 가이드 또는 RNA 가이드를 암호화하는 핵산과 접촉시키는 단계를 포함하는 진핵동물 세포에서 표적 핵산을 절단하는 방법이 제공되되, RNA 가이드는 직접 반복 서열 및 표적 핵산에 혼성화될 수 있는 스페이서 서열을 포함하고, Cas9 단백질은 RNA 가이드에 결합할 수 있으며 RNA 가이드와 상보적인 표적 핵산 서열에 절단을 일으킬 수 있다.
일 양태에서, 세포를 본 명세서에 기재된 바와 같은 Cas9 및 RNA 가이드 또는 RNA 가이드를 암호화하는 핵산과 접촉시키는 단계를 포함하는 진핵동물 세포에서 표적 핵산의 발현을 변경시키는 방법이 제공되되, RNA 가이드는 직접 반복 서열 및 표적 핵산에 혼성화될 수 있는 스페이서 서열을 포함하고, Cas9 단백질은 RNA 가이드에 결합할 수 있으며 RNA 가이드와 상보적인 표적 핵산 서열에 절단을 일으킬 수 있다.
일 양태에서, 세포를 본 명세서에 기재된 바와 같은 Cas9 및 RNA 가이드 또는 RNA 가이드를 암호화하는 핵산과 접촉시키는 단계를 포함하는 진핵동물 세포에서 표적 핵산의 발현을 변경시키는 방법이 제공되되, RNA 가이드는 직접 반복 서열 및 표적 핵산에 혼성화될 수 있는 스페이서 서열을 포함하고, Cas9 단백질은 RNA 가이드에 결합할 수 있으며 RNA 가이드와 상보적인 표적 핵산 서열을 편집할 수 있다.
일 양태에서, 세포를 본 명세서에 기재된 바와 같은 Cas9 및 RNA 가이드 또는 RNA 가이드를 암호화하는 핵산과 접촉시키는 단계를 포함하는 진핵동물 세포에서 표적 핵산을 변형시키는 방법이 제공되되, RNA 가이드는 직접 반복 서열 및 표적 핵산에 혼성화될 수 있는 스페이서 서열을 포함하고, Cas9 단백질은 RNA 가이드에 결합할 수 있으며 RNA 가이드와 상보적인 표적 핵산 서열을 편집할 수 있다.
일부 실시형태에서, Cas9 단백질은 불활성 Cas9(dCas9)이다.
일부 실시형태에서, dCas9는 데아미네이스에 융합된다.
일부 실시형태에서, RNA 가이드는 crRNA 및 tracrRNA를 포함한다.
일부 실시형태에서, RNA 가이드는 sgRNA를 포함한다.
일부 실시형태에서, Seq2Cas9와 함께 사용하기 위한 sgRNA는 5'- GUUUUAGUACUCUGUAAUUUU GAAA AAAAUUACAGAAUCUACUAAAACAAGGCAAAAUGCCGUGUUUAUCUCGUCAACUUGUUGACGAGAUUUUUUU-3'(서열번호 43)와 적어도 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함한다.
일부 실시형태에서, EhiCas9와 함께 사용하기 위한 sgRNA는 5'- GUUUUAGAGCUAUGUUG GAAA CAACAUAGCGAGUUAAAAUAAGGCAUUGUCCGUUAUCAGCUUUUAAAGCAAGCACUGUCUCGGUGCUUUUUU-3'(서열번호 44)와 적어도 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함한다.
일부 실시형태에서, SeqCas9와 함께 사용하기 위한 sgRNA는 5'- GUUUUUGUACUCUCAAGAUUU GAAA AAAUCUUGCAGAGCCUACAAAGAUAAGGCUUCAUGCCGAAUUCAAGCACCCCAUGUUUACAUGGGGUGCUUUU-3'(서열번호 45)와 적어도 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함한다.
일부 실시형태에서, SsiCas9와 함께 사용하기 위한 sgRNA는 5'- GUUUUAGUACUCUGUAAUUUU GAAA AAAAUUACAGAAUCUACUAAAACAAGGCAAAAUGCCGUGUUUAUCUCGUCAACUUGUUUGGCGAGAUUUUUUUU-3'(서열번호 46)와 적어도 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함한다.
일부 실시형태에서, SinCas9와 함께 사용하기 위한 sgRNA는 5'- GUUUUUGUACUCUCAAGAUUU GAAA AAAUCUUGCAGAAGCUACAAAGAUAAGGCUUCAUGCCGAAAUCAACACCCUGUCUAUGACGGGGUGUUUU-3'(서열번호 47)와 적어도 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함한다.
일부 실시형태에서, SsaCas9와 함께 사용하기 위한 sgRNA는 5'- GUUUUAGAGCUGUGUUGU GAAA ACAACACAGCAAGUUAAAAUAAGGCUUUGUCCGUACACAACUUGAAAAAGUGCGCACCGAUUCGGUGCUUUUUU-3'(서열번호 48)와 적어도 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함한다.
일부 실시형태에서, Ssc2Cas9와 함께 사용하기 위한 sgRNA는 5'- GUUUUUGUACUCUCAAGAUUU GAAA AAAUCUUGCAGAAGCUACAAAGAUAAGGCUUCAUGCCGAAAUCAACACCCUGUCAUUUUAUGGCAGGGUGUUUU-3'(서열번호 49)와 적어도 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함한다.
일부 실시형태에서, Sor2Cas9와 함께 사용하기 위한 sgRNA는 5'- GUUUUUGUACUCUCAAGAUUU GAAA AAAUCUUGCAGAAGCUACAAAGAUAAGGCUUCAUGCCGAAUUCAACACCCUGUCAUUUAUGGCGGGGUGUUUU-3'(서열번호 50)와 적어도 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함한다.
일부 실시형태에서, SorCas9와 함께 사용하기 위한 sgRNA는 5'- GUUUUUGUACUCUCAAGAUUU GAAA AAAUCUUGUAGAAGCUACAAAGAUAAGGCUUCAUGCCGAAUUCAACACCCUGUCAUUUAUGGCGGGGUGUUUCGUUUU-3'(서열번호 51)와 적어도 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함한다.
일부 실시형태에서, SwaCas9와 함께 사용하기 위한 sgRNA는 5'- GUUUUAGUACUCUGUAAUUUU GAAAAAAAUUACAGAAUCUACUGAAACAAGACUAUAUGUCGUGUUUAUCCCACUAAUUUAUUAGUGGGAUUUUUU-3'(서열번호 52)와 적어도 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함한다.
일부 실시형태에서, SscCas9와 함께 사용하기 위한 sgRNA는 5'- GUUUUAGUACUCUGUAAUUUU GAAAAAAAUUACAGAAUCUACUAAAACAAGGCAAAAUGCCGUGUUUAUCUCGUCAACUUGUUGACGAGAUUUUUUU-3'(서열번호 53)와 적어도 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함한다.
일부 실시형태에서, SgaCas9와 함께 사용하기 위한 sgRNA는 5'- GUUUUUGUACUCUCAAGAUUU GAAA AAAUCUUGCUGAGCCUACAAAGAUAAGGCUUUAUGCCGAAUUCAAGCACCCCAUGUUUUGACAUGGGGUGCUUUU-3'(서열번호 54)와 적어도 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함한다.
일부 실시형태에서, LkuCas9와 함께 사용하기 위한 sgRNA는 5'- GUUUUAGAUGAUUGUUAGAUC GAAA GAUCUAACAACCAGAUUUUAAAAUCAAACAAUGUAUCUUUGAUACUAAGUUUCAACGCGGUAUUAUUACCGUCCUGCCUCAGCUCUAUAGCGGAGGUUUUUU-3'(서열번호 55)와 적어도 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함한다.
일부 실시형태에서, SsuCas9와 함께 사용하기 위한 sgRNA는 5'- GUUUUUGUACUCUCAAGAUUU GAAA AAAUCUUGCAGAGCCUACAAAGAUAAGGCUUUAUGCCGAAAUCAAGCACCCCGUUUCGUACGGGGUGCUUUU-3'(서열번호 56)와 적어도 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함한다.
이전의 실시형태에서, 서열번호 43 내지 56의 경우: 직접 반복부 (이탤릭체 및 밑줄), 테트라루프(이탤릭체), tracrRNA(밑줄)이다.
일부 실시형태에서, crRNA는 약 16개 내지 26개의 뉴클레오타이드 길이의 가이드 서열을 포함한다.
일부 실시형태에서, crRNA는 약 18개 내지 24개의 뉴클레오타이드 길이의 가이드 서열을 포함한다.
일부 실시형태에서, 표적 핵산의 절단(break)은 단일 가닥 또는 이중 가닥 절단이다.
일부 실시형태에서, 표적 핵산의 절단은 단일 가닥 절단이다.
일부 실시형태에서, Cas9 단백질은 표적 핵산 서열의 두 가닥 모두를 절단하는 뉴클레이스이다. 일부 실시형태에서, Cas9는 표적 핵산 서열의 한 가닥을 절단하는 닉케이스이다.
일부 실시형태에서, 표적 핵산은 프로토스페이서 인접 모티프(PAM) 서열에 대해 5'이다.
일부 실시형태에서, Cas9는 진핵동물 세포에서 발현을 위해 프로모터 서열에 작동 가능하게 연결되고, 가이드 RNA는 진핵동물 세포에서 발현을 위해 프로모터 서열에 작동 가능하게 연결된다.
일부 실시형태에서, 진핵동물 세포는 인간 세포이다.
일부 실시형태에서, 프로모터 서열 진핵동물 또는 바이러스 프로모터이다.
일 양태에서, RNA 가이드 또는 RNA 가이드를 암호화하는 핵산(여기서, RNA 가이드는 직접 반복 서열 및 표적 핵산에 혼성화될 수 있는 스페이서 서열을 포함함); 및 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 14와 적어도 80%의 서열 동일성을 갖는 코돈 최적화된 CRISPR 관련(Cas) 단백질을 포함하는 조작된 비자연 발생적 CRISPR-Cas 시스템이 본 명세서에 제공되되, Cas 단백질은 RNA 가이드에 결합할 수 있으며 RNA 가이드와 상보적인 표적 핵산 서열에 절단을 일으킬 수 있다.
일 양태에서, RNA 가이드 또는 RNA 가이드를 암호화하는 핵산(여기서, RNA 가이드는 직접 반복 서열 및 표적 핵산에 혼성화될 수 있는 스페이서 서열을 포함함); 및 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 14와 적어도 80%의 서열 동일성을 갖는 코돈 최적화된 CRISPR 관련(Cas) 단백질을 포함하는 조작된 비자연 발생적 CRISPR-Cas 시스템이 본 명세서에 제공되되; Cas 단백질은 데아미네이스에 융합되고, Cas 단백질 융합체는 RNA 가이드에 결합할 수 있으며 RNA 가이드와 상보적인 표적 핵산 서열을 편집할 수 있다.
일 실시형태에서, Cas9 단백질은 불활성 Cas9(dCas9)이다.
일 실시형태에서, RNA 가이드는 crRNA 및 tracrRNA를 포함한다.
일 실시형태에서, RNA 가이드는 sgRNA를 포함한다.
일 실시형태에서, Cas 단백질은 진핵동물 세포에서 발현을 위해 프로모터 서열에 작동 가능하게 연결되고, 가이드 RNA는 진핵동물 세포에서 발현을 위해 프로모터 서열에 작동 가능하게 연결된다.
일 실시형태에서, 진핵동물 세포는 인간 세포이다.
일 실시형태에서, 프로모터 서열은 진핵동물 프로모터 서열이다.
일 실시형태에서, 본 명세서에 기재된 시스템을 암호화하는 핵산이 제공된다.
일 실시형태에서, 본 명세서에 기재된 시스템을 포함하는 벡터가 제공된다.
일 실시형태에서, 벡터는 플라스미드 벡터 또는 바이러스 벡터이다.
일 실시형태에서, 바이러스 벡터는 아데노 관련 바이러스(AAV) 벡터 또는 렌티바이러스 벡터이다.
일 실시형태에서, 바이러스 벡터는 AAV 벡터이다.
일 실시형태에서, 하나 초과의 AAV 벡터가 패키징 시스템에 사용된다.
일 실시형태에서, 장애 또는 질환의 치료를 필요로 하는 대상체에서 장애 또는 질환을 치료하는 방법은 본 명세서에 기재된 시스템을 대상체에게 투여하는 단계를 포함하되, 가이드 RNA는 병태 또는 질환과 연관된 표적 핵산의 적어도 10개의 뉴클레오타이드와 상보적이고; Cas 단백질은 가이드 RNA와 회합하고; 가이드 RNA는 표적 핵산에 결합하고; Cas 단백질은 표적 핵산의 절단을 유발하고, 선택적으로 Cas9는 데아미네이스에 융합된 불활성 Cas9(dCas9)이고, 표적 핵산에서 하나 이상의 염기 편집을 초래하여 장애 또는 질환을 치료한다.
일부 실시형태에서, 가이드 RNA는 약 18개 내지 24개의 뉴클레오타이드와 상보적이다.
일부 실시형태에서, 가이드 RNA는 20개의 뉴클레오타이드와 상보적이다.
일부 실시형태에서, 염기 편집기는 융합 단백질을 포함한다.
일부 실시형태에서, 염기 편집기는 아데노신 데아미네이스 도메인 또는 사이티딘 데아미네이스 도메인을 포함한다.
일부 실시형태에서, 폴리뉴클레오타이드의 핵염기를 편집하는 방법이 본 명세서에 제공되며, 해당 방법은 폴리뉴클레오타이드를 하나 이상의 가이드 RNA와 복합체를 이루는 염기와 접촉시키는 단계를 포함하되, 염기 편집기는 아데노신 데아미네이스 도메인을 포함하고, 하나 이상의 가이드 RNA는 염기 편집기를 표적화하여 폴리뉴클레오타이드의 A·T에서 G·C로의 변경을 초래한다.
일부 실시형태에서, 폴리뉴클레오타이드의 핵염기를 편집하는 방법이 본 명세서에 제공되되, 해당 방법은 폴리뉴클레오타이드를 하나 이상의 가이드 RNA와 복합체를 이루는 염기 편집기와 접촉시키는 단계를 포함하되, 염기 편집기는 사이티딘 데아미네이스 도메인을 포함하고, 하나 이상의 가이드 RNA는 염기 편집기를 표적화하여 폴리뉴클레오타이드의 C·G에서 T·A로의 변경을 초래한다.
일부 실시형태에서, 편집은 표적 폴리뉴클레오타이드 서열에서 50% 미만의 indel 형성을 초래한다.
일부 실시형태에서, 편집은 점 돌연변이를 생성한다.
정의
본 발명을 더욱 쉽게 이해하기 위해, 소정의 용어가 먼저 아래에 정의된다. 다음 용어 및 기타 용어에 대한 추가적인 정의는 본 명세서 전반에 걸쳐 제시되어 있다.
단수형: "단수형" 관사는 관사의 문법적 대상 중 하나 또는 하나 이상(즉, 적어도 하나)을 지칭하기 위해 본 명세서에서 사용된다. 예로서, "요소"는 하나의 요소 또는 하나 이상의 요소를 의미한다.
대략 또는 약: 본 명세서에서 사용되는 하나 이상의 관심 값에 적용되는 용어 "대략" 또는 "약"은 명시된 참조 값과 유사한 값을 지칭한다. 소정의 실시형태에서, 용어 "대략" 또는 "약"은 달리 명시되지 않거나 문맥으로부터 달리 명백하지 않는 한 명시된 참조 값의 어느 방향(크거나 또는 작음)으로 25%, 20%, 19%, 18%, 17%, 16%, 15%, 14%, 13%, 12%, 11%, 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 1% 이하 내에 속하는 값의 범위를 지칭한다(이러한 수치가 가능한 값의 100%를 초과하는 경우는 제외).
연관된: 하나의 존재, 수준 및/또는 형태가 다른 하나의 것들과 상관관계가 있는 경우, 2개의 이벤트 또는 독립체(entity)는 본 명세서에 사용된 용어와 서로 "연관된다". 예를 들어, 특정 독립체(예를 들어, 폴리펩타이드)는 이의 존재, 수준 및/또는 형태가 질환, 장애 또는 병태의 발생률 및/또는 이에 대한 민감성과 상관관계가 있는 경우(예를 들어, 관련 집단 전반에 걸쳐), 특정 질환, 장애 또는 병태와 연관이 있는 것으로 간주된다. 일부 실시형태에서, 2개 이상의 독립체가 직접 또는 간접적으로 상호작용하는 경우, 이들은 서로 물리적으로 "연관"되어 서로 물리적으로 근접해 있으며 그 상태를 유지한다. 일부 실시형태에서, 서로 물리적으로 연관된 2개 이상의 독립체는 서로 공유적으로 연결되어 있고; 일부 실시형태에서, 서로 물리적으로 연관된 2개 이상의 독립체는 물리적으로 서로 공유적으로 연결되지 않지만, 예를 들어, 수소 결합, 반데르발스 상호작용, 소수성 상호작용, 자기작용(magnetism) 및 이들의 조합에 의해 비공유적으로 연관된다.
염기 편집기: "염기 편집기(base editor: BE)" 또는 "핵염기 편집기(nucleobase editor: NBE)"는 폴리뉴클레오타이드에 결합하며 핵염기 변형 활성을 갖는 작용제를 의미한다. 다양한 실시형태에서, 염기 편집기는 핵염기 변형 폴리펩타이드(예를 들어, 데아미네이스) 및 가이드 폴리뉴클레오타이드(예를 들어, 가이드 RNA)와 함께 폴리뉴클레오타이드 프로그래밍 가능 뉴클레오타이드 결합 도메인을 포함한다. 다양한 실시형태에서, 작용제는 염기 편집 활성을 갖는 단백질 도메인, 즉, 핵산 분자(예를 들어, DNA) 내의 염기(예를 들어, A, T, C, G 또는 U)를 변형시킬 수 있는 도메인을 포함하는 생체 분자 복합체이다. 일부 실시형태에서, 폴리뉴클레오타이드 프로그래밍 가능 DNA 결합 도메인은 데아미네이스 도메인에 융합되거나 연결된다. 일 실시형태에서, 작용제는 염기 편집 활성을 갖는 하나 이상의 도메인을 포함하는 융합 단백질이다. 또 다른 실시형태에서, 염기 편집 활성을 갖는 단백질 도메인은 (예를 들어, 가이드 RNA 상의 RNA 결합 모티프 및 데아미네이스에 융합된 RNA 결합 도메인을 통해) 가이드 RNA에 연결된다. 일부 실시형태에서, 염기 편집 활성을 갖는 도메인은 핵산 분자 내의 염기를 탈아미노화시킬 수 있다. 일부 실시형태에서, 염기 편집기는 DNA 분자 내의 하나 이상의 염기를 탈아미노화시킬 수 있다. 일부 실시형태에서, 염기 편집기는 DNA 내의 사이토신(C) 또는 아데노신(A)을 탈아미노화시킬 수 있다. 일부 실시형태에서, 염기 편집기는 DNA 내의 사이토신(C) 및 아데노신(A)을 탈아미노화시킬 수 있다. 일부 실시형태에서, 염기 편집기는 사이티딘 염기 편집기(cytidine base editor: CBE)이다. 일부 실시형태에서, 염기 편집기는 아데노신 염기 편집기(ABE)이다. 일부 실시형태에서, 염기 편집기는 아데노신 염기 편집기(ABE) 및 사이티딘 염기 편집기(CBE)이다. 일부 실시형태에서, 염기 편집기는 아데노신 데아미네이스에 융합된 뉴클레이스 불활성 Cas9(dCas9)이다. 일부 실시형태에서, 염기 편집기는 염기 절단 복구(base excision repair)의 저해제, 예를 들어, UGI 도메인 또는 dISN 도메인에 융합된다. 일부 실시형태에서, 융합 단백질은 데아미네이스에 융합된 Cas9 닉케이스 및 UGI 또는 dISN 도메인과 같은 염기 절단 복구의 저해제를 포함한다. 다른 실시형태에서, 염기 편집기는 무염기성 염기 편집기이다. 염기 편집기에 대한 자세한 내용은 각각 전체가 참조에 의해 본 명세서에 원용되어 있는 국제 PCT 출원 제PCT/2017/045381(WO2018/027078)호 및 제PCT/US2016/058344(WO2017/070632)호에 기술되어 있다. 또한, 전체 내용이 참조에 의해 본 명세서에 원용되어 있는 문헌[Komor, A.C., et al., "Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage" Nature 533, 420-424 (2016); Gaudelli, N.M., et al., "Programmable base editing of A·T to G·C in genomic DNA without DNA cleavage" Nature 551, 464-471 (2017); Komor, A.C., et al., "Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity" Science Advances 3:eaao4774 (2017), 및 Rees, H.A., et al., "Base editing: precision chemistry on the genome and transcriptome of living cells." Nat Rev Genet. 2018 Dec;19(12):770-788. doi: 10.1038/s41576-018-0059-1]을 참조한다.
염기 편집 활성: "염기 편집 활성"은 폴리뉴클레오타이드 내의 염기를 화학적으로 변경시키는 작용을 의미한다. 일 실시형태에서, 첫 번째 염기는 두 번째 염기로 전환된다. 일 실시형태에서, 염기 편집 활성은, 예를 들어, 표적 C·G를 T·A로 전환시키는 사이티딘 데아미네이스 활성이다. 또 다른 실시형태에서, 염기 편집 활성은, 예를 들어, A·T를 G·C로 전환시키는 아데노신 또는 아데닌 데아미네이스 활성이다. 또 다른 실시형태에서, 염기 편집 활성은, 예를 들어, 표적 C·G를 T·A로 전환시키는 사이토신 또는 사이티딘 데아미네이스 활성과, 예를 들어, A·T를 G·C로 전환시키는 아데노신 또는 아데닌 데아미네이스 활성이다.
염기 편집기 시스템: 용어 "염기 편집기 시스템"은 표적 뉴클레오타이드 서열의 핵염기를 편집하기 위한 시스템을 지칭한다. 다양한 실시형태에서, 염기 편집기(BE) 시스템은 (1) 표적 뉴클레오타이드 서열에서 핵염기를 탈아미노화시키기 위한 폴리뉴클레오타이드 프로그래밍 가능 뉴클레오타이드 결합 도메인(예를 들어, Cas9), 데아미네이스 도메인 및 사이티딘 데아미네이스 도메인; 및 (2) 폴리뉴클레오타이드 프로그래밍 가능 뉴클레오타이드 결합 도메인과 함께 하나 이상의 가이드 폴리뉴클레오타이드(예를 들어, 가이드 RNA)를 포함한다. 다양한 실시형태에서, 염기 편집기(BE) 시스템은 아데노신 데아미네이스 또는 사이티딘 데아미네이스로부터 선택되는 핵염기 편집기 도메인 및 핵산 서열 특이적 결합 활성을 갖는 도메인을 포함한다. 일부 실시형태에서, 염기 편집기 시스템은 (1) 표적 뉴클레오타이드 서열에서 하나 이상의 핵염기를 탈아미노화시키기 위한 폴리뉴클레오타이드 프로그래밍 가능 DNA 결합 도메인 및 데아미네이스 도메인을 포함하는 염기 편집기(BE); 및 (2) 폴리뉴클레오타이드 프로그래밍 가능 DNA 결합 도메인과 함께 하나 이상의 가이드 RNA를 포함한다. 일부 실시형태에서, 폴리뉴클레오타이드 프로그래밍 가능 뉴클레오타이드 결합 도메인은 폴리뉴클레오타이드 프로그래밍 가능 DNA 결합 도메인이다. 일부 실시형태에서, 염기 편집기는 사이티딘 염기 편집기(CBE)이다. 일부 실시형태에서, 염기 편집기는 아데닌 또는 아데노신 염기 편집기(ABE)이다. 일부 실시형태에서, 염기 편집기는 아데닌 또는 아데노신 염기 편집기(ABE) 또는 사이티딘 염기 편집기(CBE)이다.
일부 실시형태에서, 폴리뉴클레오타이드 프로그래밍 가능 뉴클레오타이드 결합 도메인은 데아미네이스 도메인과 비공유적으로 상호작용하거나 회합함으로써 데아미네이스 도메인을 표적 뉴클레오타이드 서열로 표적화할 수 있다. 예를 들어, 일부 실시형태에서, 핵염기 편집 구성요소, 예를 들어, 데아미네이스 구성요소는 폴리뉴클레오타이드 프로그래밍 가능 뉴클레오타이드 결합 도메인의 일부인 추가적인 이종 부분 또는 도메인과 상호작용하거나, 회합하거나, 복합체를 형성할 수 있는 추가적인 이종 부분 또는 도메인을 포함할 수 있다. 일부 실시형태에서, 추가적인 이종 부분은 폴리펩타이드에 결합하거나, 이와 상호작용하거나, 회합하거나, 복합체를 형성할 수 있다. 일부 실시형태에서, 추가적인 이종 부분은 폴리뉴클레오타이드에 결합하거나, 이와 상호작용하거나, 회합하거나 복합체를 형성할 수 있다. 일부 실시형태에서, 추가적인 이종 부분은 가이드 폴리뉴클레오타이드에 결합할 수 있다. 일부 실시형태에서, 추가적인 이종 부분은 폴리펩타이드 링커에 결합할 수 있다. 일부 실시형태에서, 추가적인 이종 부분은 폴리뉴클레오타이드 링커에 결합할 수 있다. 추가적인 이종 부분은 단백질 도메인일 수 있다. 일부 실시형태에서, 추가적인 이종 부분은 K 상동성(K Homology: KH) 도메인, MS2 코팅 단백질 도메인, PP7 코팅 단백질 도메인, SfMu Com 코팅 단백질 도메인, 스테릴(steril) 알파 모티프, 텔로머레이스 Ku 결합 모티프 및 Ku 단백질, 텔로머레이스 Sm7 결합 모티프 및 Sm7 단백질 또는 RNA 인식 모티프일 수 있다.
생물학적 활성: 본 명세서에서 사용되는 "생물학적 활성"이라는 어구는 생물학적 시스템, 특히 유기체에서 활성을 갖는 임의의 작용제의 특성을 지칭한다. 예를 들어, 유기체에게 투여될 때 해당 유기체에 생물학적 효과를 갖는 작용제는 생물학적 활성이 있는 것으로 간주된다. 특정 실시형태에서, 펩타이드가 생물학적으로 활성인 경우, 펩타이드의 적어도 하나의 생물학적 활성을 공유하는 해당 펩타이드의 부분은 전형적으로 "생물학적 활성" 부분으로 지칭된다.
절단: 본 명세서에서 사용되는 바와 같이, 절단은 본 명세서에 기재된 CRISPR 시스템의 뉴클레이스에 의해 생성된 표적 핵산의 절단(break)을 지칭한다. 일부 실시형태에서, 절단 이벤트는 이중 가닥 DNA 절단이다. 일부 실시형태에서, 절단 이벤트는 단일 가닥 DNA 절단이다. 일부 실시형태에서, 절단 이벤트는 단일 가닥 RNA 절단이다. 일부 실시형태에서, 절단 이벤트는 이중 가닥 RNA 절단이다.
상보적: 본 명세서에서 사용되는 바와 같이, 상보적은 A 염기가 T와 쌍을 이루고 C 염기가 G와 쌍을 이루거나 두 번째 핵산 가닥의 염기와 비전통적인 염기 페어링을 하도록 Watson-Crick 염기 페어링을 형성하는 핵산 가닥을 지칭한다. 즉, 이는 적절한 조건하에서 서로 혼성화되는 핵산을 지칭한다.
클러스터링된 규칙적으로 간격을 둔 짧은 회문 반복서열(CRISPR) 연관(Cas) 시스템: 본 명세서에서 사용되는 바와 같이, CRISPR-Cas9 시스템은 CRISPR 효과기, RNA 가이드 및 CRISPR 유전자좌로부터의 기타 서열 및 전사체를 암호화하는 서열을 포함하여 CRISPR 효과기의 발현 또는 이의 활성을 지시하는 데 관여하는 핵산 및/또는 단백질을 지칭한다. 일부 실시형태에서, CRISPR 시스템은 조작된 비자연 발생적 CRISPR 시스템이다. 일부 실시형태에서, CRISPR 시스템의 구성요소는 시스템의 하나 이상의 구성요소, 단백질 형태의 구성요소(들) 또는 이들의 조합을 암호화하는 핵산(들)(예를 들어, 벡터)을 포함할 수 있다.
CRISPR 어레이: 본 명세서에서 사용되는 용어 "CRISPR 어레이"는 첫 번째 CRISPR 반복부의 첫 번째 뉴클레오타이드로 시작하여 마지막(말단) CRISPR 반복부의 마지막 뉴클레오타이드로 끝나는 CRISPR 반복부와 스페이서를 포함하는 핵산(예를 들어, DNA) 분절을 지칭한다. 전형적으로, CRISPR 어레이 내 각 스페이서는 두 개의 반복부 사이에 위치한다. 본 명세서에서 사용되는 용어 "CRISPR 반복부" 또는 "CRISPR 직접 반복부" 또는 "직접 반복부"는 CRISPR 어레이 내에서 서열 변화가 거의 없거나 전혀 없는 여러 개의 짧은 직접 반복 서열을 지칭한다.
CRISPR 연관 단백질(Cas): 본 명세서에서 사용되는 용어 "CRISPR 연관 단백질", "CRISPR 효과기", "효과기" 또는 "CRISPR 효소"는 효소적 활성을 수행하거나 RNA 가이드에 의해 지정된 핵산의 표적 부위에 결합하는 단백질을 지칭한다. 다른 실시형태에서, CRISPR 효과기는 엔도뉴클레이스 활성, 닉케이스 활성, 엑소뉴클레이스 활성, 유전자전위효소 활성 및/또는 절단 활성을 갖는다. 본 명세서에 제공된 임의의 Cas9 단백질은 자연 발생적 Cas9 단백질 및 이의 비자연 발생적 변이체를 포함한다는 것이 이해되어야 한다.
crRNA: 본 명세서에서 사용되는 용어 "CRISPR RNA" 또는 "crRNA"는 특정 핵산 서열을 표적화하기 위해 CRISPR 효과기에 의해 사용되는 가이드 서열을 포함하는 RNA 분자를 지칭한다. 전형적으로, crRNA는 표적 인식을 매개하는 서열 및 tracrRNA와 이중체를 형성하는 서열을 포함한다. 일부 실시형태에서, crRNA: tracrRNA 이중체는 CRISPR 효과기에 결합한다.
생체외: 본 명세서에서 사용되는 용어 "생체외"는 다세포 유기체 내부가 아닌 외부에서 성장하는 세포 또는 조직에서 발생하는 이벤트를 지칭한다.
기능적 등가물 또는 유사체: 본 명세서에서 사용되는 용어 "기능적 등가물" 또는 "기능적 유사체"는 아미노산 서열의 기능적 유도체의 맥락에서, 원래 서열의 것과 실질적으로 유사한 생물학적 활성(기능 또는 구조적)을 유지하는 분자를 의미한다. 기능적 유도체 또는 등가물은 천연 유도체이거나 합성적으로 제조될 수 있다. 예시적인 기능적 유도체는 단백질의 생물학적 활성이 보존된다는 전제하에 하나 이상의 아미노산의 치환, 결실 또는 첨가를 갖는 아미노산 서열을 포함한다. 아미노산을 치환하면 바람직하게는 치환된 아미노산과 유사한 화학물리적 특성을 갖는다. 바람직한 유사한 화학물리적 특성은 전하의 유사성, 벌키성(bulkiness), 소수성, 친수성 등을 포함한다.
반감기: 본 명세서에서 사용되는 용어 "반감기"는 단백질 농도 또는 활성과 같은 양이 기간의 시작 시 측정된 값의 절반으로 떨어지는 데 필요한 시간이다.
개선하다, 증가하다 또는 감소하다: 본 명세서에서 사용되는 용어 "개선하다", "증가하다" 또는 "감소하다" 또는 문법적 동등어는 본 명세서에 기재된 치료 시작 전 동일한 개체에서의 측정값 또는 본 명세서에 기재된 치료 부재 시 대조군 대상체(또는 여러 대조군 대상체)에서의 측정값과 같은 기준 측정값에 상대적인 값을 나타낸다. "대조군 대상체"는 치료 중인 대상체와 대략 동일한 연령인 치료 중인 대상체와 동일한 형태의 질환을 앓고 있는 대상체이다.
저해: 본 명세서에서 사용되는 용어 "저해", "저해하다" 및 "저해하는"은 관심 단백질 또는 유전자의 활성 및/또는 발현을 줄이거나 감소시키는 과정 또는 방법을 지칭한다. 전형적으로, 단백질 또는 유전자를 저해하는 것은 단백질 또는 유전자의 발현 또는 관련 활성을 적어도 10% 이상, 예를 들어, 20%, 30%, 40% 또는 50%, 60%, 70%, 80%, 90% 이상 감소시키는 것 또는 본 명세서에 기재되거나 당업계에서 인식되는 하나 이상의 방법에 의해 측정 시 1배, 2배, 3배, 4배, 5배, 10배, 50배, 100배 이상의 발현 또는 관련 활성의 감소를 지칭한다.
혼성화: 본 명세서에서 사용되는 용어 "혼성화"는 2개 이상의 핵산이 Watson-Crick 페어링, Hoogstein 결합 또는 두 핵산의 염기 사이의 다른 서열 특이적 결합에 의한 수소 결합을 통해 서로 결합하는 반응을 지칭한다. 또 다른 서열과 혼성화할 수 있는 서열은 서열의 "상보체"라고 하며, "상보적"이거나 "상보성"을 나타낸다고 한다.
Indel: 본 명세서에서 사용되는 용어 "indel"은 핵산 서열 내 염기의 삽입 또는 결실을 지칭한다. 이는 일반적으로 돌연변이를 초래하며, 유전적 변이의 일반적인 형태이다.
시험관내: 본 명세서에서 사용되는 용어 "시험관내"는 다세포 유기체 내부가 아닌 인공 환경, 예를 들어, 시험관 또는 반응 용기, 세포 배양물 등에서 발생하는 이벤트를 지칭한다.
생체내: 본 명세서에서 사용되는 용어 "생체내"는 인간 및 비인간 동물과 같은 다세포 유기체 내에서 발생하는 이벤트를 지칭한다. 세포 기반 시스템의 맥락에서, 해당 용어는 (예를 들어, 시험관내 시스템과 반대되는) 살아있는 세포 내에서 발생하는 이벤트를 지칭하는 데 사용될 수 있다.
링커: 용어 "링커"는 2개 이상의 독립체를 연결하는 데 사용되는 임의의 수단, 독립체 또는 모이어티를 지칭한다. 일부 실시형태에서, 링커는 공유 링커이다. 일부 실시형태에서, 링커는 비공유 링커이다. 공유 링커의 예는 공유 결합 또는 연결될 단백질 또는 도메인 중 하나 이상에 공유적으로 부착된 링커 모이어티를 포함한다. 일부 실시형태에서, 링커는 비공유 결합, 예를 들어, 백금 원자와 같은 금속 중심을 통한 유기금속 결합이다. 연결은 영구적이거나 가역적일 수 있다. 공유 연결의 경우, 탄산 유도체를 포함하는 아마이드기, 에터, 유기 및 무기 에스터를 포함하는 에스터, 아미노, 우레탄, 우레아 등과 같은 다양한 작용기가 사용될 수 있다. 연결을 제공하기 위해, 도메인은 산화, 수산화, 치환, 환원 등에 의해 변형되어 커플링을 위한 부위를 제공할 수 있다. 접합 방법은 당업자에게 잘 알려져 있으며, 본 발명에 사용하기 위해 포함된다. 링커 모이어티는 화학적 링커 모이어티 또는, 예를 들어, 펩타이드 링커 모이어티(링커 서열)를 포함하지만 이에 제한되지 않는다. RNA 결합 도메인 및 효과기 도메인의 기능을 현저하게 감소시키지 않는 변형이 바람직하다는 것이 이해될 것이다.
돌연변이: 본 명세서에서 사용되는 용어 "돌연변이"는 당업계에서 일반적인 의미를 가지며, 예를 들어, 점 돌연변이, 치환, 삽입, 결실, 역위 및 결실을 포함한다.
올리고뉴클레오타이드: 본 명세서에서 사용되는 용어 "올리고뉴클레오타이드"는 일반적으로 단일 가닥 또는 이중 가닥 DNA의 약 5개 내지 약 100개의 뉴클레오타이드의 폴리뉴클레오타이드를 지칭한다. 올리고뉴클레오타이드는 "올리고머" 또는 "올리고"로도 알려져 있으며, 유전자로부터 단리되거나 화학적으로 합성될 수 있다.
PAM: 용어 "PAM" 또는 "프로토스페이서 인접 모티프"는 CRISPR-Cas9와 같은 CRISPR 시스템에 의한 절단에 대해 표적화된 핵산 영역을 따르는 짧은 핵산 서열(일반적으로 2개 내지 6개의 염기쌍 길이)을 지칭한다. PAM은 Cas 뉴클레이스를 절단하는 데 필요하며, 일반적으로 절단 부위로부터 하류에 있는 3개 내지 4개의 뉴클레오타이드에서 발견된다.
폴리펩타이드: 본 명세서에서 사용되는 용어 "폴리펩타이드"는 펩타이드 결합을 통해 함께 연결된 아미노산의 순차적 사슬을 지칭한다. 해당 용어는 임의의 길이의 아미노산 사슬을 지칭하는 데 사용되지만, 당업자는 해당 용어가 긴 사슬에 제한되지 않고 펩타이드 결합을 통해 함께 연결된 2개의 아미노산을 포함하는 최소 사슬을 지칭할 수 있다는 것을 이해할 것이다. 당업자에게 공지된 바와 같이, 폴리펩타이드는 가공되고/되거나 변형될 수 있다. 본 명세서에서 사용되는 용어 "폴리펩타이드" 및 "펩타이드"는 상호교환적으로 사용된다.
예방하다: 본 명세서에서 사용되는 용어 "예방하다" 또는 "예방"은 질환, 장애 및/또는 병태의 발생과 관련하여 사용될 때 질환, 장애 및/또는 병태가 발생할 위험을 줄이는 것을 의미한다.
단백질: 본 명세서에서 사용되는 용어 "단백질"은 별개의 단위로 기능하는 하나 이상의 폴리펩타이드를 지칭한다. 단일 폴리펩타이드가 별개의 기능 단위이며 별개의 기능 단위를 형성하기 위해 다른 폴리펩타이드와의 영구적 또는 일시적인 물리적 회합을 필요로 하지 않는 경우, 용어 "폴리펩타이드" 및 "단백질"은 상호교환적으로 사용될 수 있다. 별개의 기능적 단위가 서로 물리적으로 회합하는 하나 초과의 폴리펩타이드로 구성되는 경우, 용어 "단백질"은 물리적으로 커플링되어 별개의 단위로서 함께 기능하는 다중 폴리펩타이드를 지칭한다.
참조: "참조(reference)" 독립체, 시스템, 양, 조건의 세트 등은 본 명세서에 기재된 바와 같은 테스트 독립체, 시스템, 양, 조건의 세트 등이 비교되는 대상이다. 예를 들어, 일부 실시형태에서, "참조" 항체는 본 명세서에 기재된 바와 같이 조작되지 않은 대조군 항체이다.
RNA 가이드: 용어 RNA 가이드는 본 명세서에 기재된 단백질의 표적 핵산에 대한 표적화를 용이하게 하는 RNA 분자를 지칭한다. 예시적인 "RNA 가이드" 또는 "가이드 RNA"는 crRNA 또는 동족 tracrRNA와 조합된 crRNA를 포함하지만 이에 제한되지 않는다. 후자는 독립적인 RNA일 수 있거나 링커(sgRNA)를 사용하여 단일 RNA로 융합될 수 있다. 일부 실시형태에서, RNA 가이드는 화학적 또는 생화학적 변형을 포함하도록 조작되고, 일부 실시형태에서, RNA 가이드는 하나 이상의 뉴클레오타이드를 포함할 수 있다.
대상체: 본 명세서에서 사용되는 용어 "대상체"는 진단, 예후 또는 요법이 요구되는 임의의 대상을 의미한다. 예를 들어, 대상체는 포유동물, 예를 들어, 인간 또는 비인간 영장류(예컨대, 유인원, 원숭이, 오랑우탄 또는 침팬지), 개, 고양이, 기니피그, 토끼, 래트, 마우스, 말, 소 또는 암소일 수 있다.
sgRNA: 용어 "sgRNA" 또는 "단일 가이드 RNA"는 (i) 가이드 서열(crRNA 서열) 및 (ii) Cas9 뉴클레이스 동원 서열(tracrRNA)을 포함하는 단일 가이드 RNA를 지칭한다.
실질적인 동일성: 어구 "실질적인 동일성"은 아미노산 또는 핵산 서열 간의 비교를 지칭하기 위해 본 명세서에서 사용된다. 당업자에 의해 이해되는 바와 같이, 2개의 서열은 일반적으로 상응하는 위치에 동일한 잔기를 포함하는 경우 "실질적으로 동일한" 것으로 간주된다. 당업계에 잘 알려져 있는 바와 같이, 아미노산 또는 핵산 서열은 뉴클레오타이드 서열의 경우 BLASTN 및 아미노산 서열의 경우 BLASTP, gapped BLAST 및 PSI-BLAST와 같은 상업용 컴퓨터 프로그램에서 이용 가능한 것들을 포함하여 임의의 다양한 알고리즘을 사용하여 비교될 수 있다. 예시적인 이러한 프로그램은 문헌[Altschul, et al., Basic local alignment search tool, J. Mol. Biol., 215(3): 403-410, 1990; Altschul, et al., Methods in Enzymology; Altschul et al., Nucleic Acids Res. 25:3389-3402, 1997; Baxevanis et al., Bioinformatics : A Practical Guide to the Analysis of Genes and Proteins, Wiley, 1998; 및 Misener, et al., (eds.), Bioinformatics Methods and Protocols (Methods in Molecular Biology, Vol. 132), Humana Press, 1999]에 기술되어 있다. 동일한 서열을 식별하는 것 외에도, 위에 언급된 프로그램은 전형적으로 동일성의 정도에 대한 표시를 제공한다. 일부 실시형태에서, 2개의 서열은 상응하는 잔기의 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상이 잔기의 관련 신장부(stretch)에 걸쳐 동일한 경우 실질적으로 동일한 것으로 간주된다. 일부 실시형태에서, 관련 신장부는 완전한 서열이다. 일부 실시형태에서, 관련 신장부는 적어도 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 125개, 150개, 175개, 200개, 225개, 250개, 275개, 300개, 325개, 350개, 375개, 400개, 425개, 450개, 475개, 500개 이상 잔기이다.
표적 핵산: 본 명세서에서 사용되는 용어 "표적 핵산"은 CRISPR-Cas9 시스템이 결합하는 임의의 길이의 뉴클레오타이드(올리고뉴클레오타이드 또는 폴리뉴클레오타이드), 데옥시리보뉴클레오타이드, 리보뉴클레오타이드 또는 이들의 유사체를 지칭한다. 표적 핵산은 3차원 구조를 가질 수 있고, 코딩 또는 논코딩 영역을 포함할 수 있고, 엑손, 인트론, mRNA, tRNA, rRNA, siRNA, shRNA, miRNA, 리보자임, cDNA, 플라스미드, 벡터, 외인성 서열, 내인성 서열을 포함할 수 있다. 표적 핵산은 변형된 뉴클레오타이드를 포함할 수 있으며, 메틸화된 뉴클레오타이드 또는 뉴클레오타이드 유사체를 포함할 수 있다. 표적 핵산은 비핵산 구성요소와 함께 산재될 수 있다. 표적 핵산은 단일-, 이중- 또는 다중 가닥 DNA 또는 RNA, 게놈 DNA, cDNA, DNA-RNA 하이브리드, 또는 퓨린 및 피리미딘 염기를 포함하는 중합체 또는 다른 천연, 화학적으로 또는 생화학적으로 변형된, 비천연 또는 유도체화된 뉴클레오타이드 염기에 제한되지 않는다.
치료학적 유효량: 본 명세서에서 사용되는 용어 "치료학적 유효량"은 임의의 의학적 치료에 적용할 수 있는 합리적인 이익/위험 비로 치료될 대상체에게 치료적 효과를 부여하는 치료용 분자(예를 들어, 본 명세서에 기재된 조작된 항체)의 양을 지칭한다. 치료적 효과는 객관적(즉, 일부 테스트 또는 마커에 의해 측정 가능함) 또는 주관적(즉, 대상체가 효과의 징후를 나타내거나 느낌)일 수 있다. 특히, "치료학적 유효량"은, 예컨대, 질환과 관련된 증상을 개선하거나, 질환의 발병을 예방하거나 지연시키고/시키거나 또한 질환의 증상의 중증도 또는 빈도를 줄임으로써 특정 질환 또는 병태를 치료, 개선 또는 예방하거나, 검출 가능한 치료적 또는 예방적 효과를 나타내는 데 효과적인 치료용 분자 또는 조성물의 양을 지칭한다. 치료학적 유효량은 다중 단위 용량을 포함할 수 있는 투여 양생법으로 투여될 수 있다. 임의의 특정 치료용 분자의 경우, 치료학적 유효량(및/또는 효과적인 투여 양생법 내의 적절한 단위 용량)은, 예를 들어, 투여 경로, 다른 약제와의 병용에 따라 달라질 수 있다. 또한, 임의의 특정 대상체에 대한 특정 치료학적 유효량(및/또는 단위 용량)은 치료 중인 장애 및 장애의 중증도; 사용되는 특정 약제의 활성; 사용되는 특정 조성물; 대상체의 연령, 체중, 전반적인 건강 상태, 성별 및 식이; 사용된 특정 치료용 분자의 투여 시간, 투여 경로 및/또는 배설 또는 대사 속도; 치료 기간; 및 의학 분야에서 잘 알려진 것과 같은 요인 등을 포함하는 다양한 요인에 따라 달라질 수 있다.
tracrRNA: 본 명세서에서 사용되는 용어 "tracrRNA" 또는 "트랜스 활성화 crRNA"는 CRISPR 연관 단백질이 특정 표적 핵산에 결합하는 데 필요한 구조를 형성하는 서열을 포함하는 RNA를 지칭한다.
치료: 본 명세서에서 사용되는 용어 "치료"(또한 "치료하다" 또는 "치료하는")는 특정 질환, 장애 및/또는 병태의 하나 이상의 증상 또는 특징을 부분적으로 또는 완전히 완화, 개선, 경감, 저해하거나, 이의 발병을 지연시키거나, 이의 중증도를 감소시키고/시키거나 이의 발생률을 감소시키는 치료용 분자(예를 들어, 본 명세서에 기재된 CRISPR-Cas 치료용 단백질 또는 시스템)의 임의의 투여를 지칭한다. 이러한 치료는 관련 질환, 장애 및/또는 병태의 징후를 나타내지 않는 대상체 및/또는 질환, 장애 및/또는 병태의 초기 징후만을 나타내는 대상체에 대한 것일 수 있다. 대안적으로 또는 추가적으로, 이러한 치료는 관련 질환, 장애 및/또는 병태의 하나 이상의 확립된 징후를 나타내는 대상체에 대한 것일 수 있다.
도면은 설명을 위한 것으로 제한하려는 것이 아니다.
도 1a는 인간 코돈 최적화된 스트렙토코커스 에쿠이누스 ATCC 33317 Cas9에 의해 인식되는 컨센서스 PAM 모티프를 보여주는 그래프이다. 도 1b는 인간 코돈 최적화된 엔테로코커스 히라에 균주 F1129E Cas9에 의해 인식되는 컨센서스 PAM 모티프를 보여주는 그래프이다. 도 1c는 인간 코돈 최적화된 스트렙토코커스 에쿠이누스 균주 AG46 Cas9에 의해 인식되는 컨센서스 PAM 모티프를 보여주는 그래프이다. 도 1d는 인간 코돈 최적화된 스타필로코커스 시뮬란스 균주 19에 의해 인식되는 컨센서스 PAM 모티프를 보여주는 그래프이다. 도 1e는 인간 코돈 최적화된 스트렙토코커스 인터메디우스 B196 균주 G1552에 의해 인식되는 컨센서스 PAM 모티프를 보여주는 그래프이다. 도 1f는 인간 코돈 최적화된 스트렙토코커스 상귀니스 SK330에 의해 인식되는 컨센서스 PAM 모티프를 보여주는 그래프이다. 도 1g는 인간 코돈 최적화된 스트렙토코커스 종 C150에 의해 인식되는 컨센서스 PAM 모티프를 보여주는 그래프이다. 도 1h는 인간 코돈 최적화된 스트렙토코커스 오랄리스 아종 오랄리스 균주 RH_1735_08에 의해 인식되는 컨센서스 PAM 모티프를 보여주는 그래프이다. 도 1i는 스트렙토코커스 오랄리스 SK313에 의해 인식되는 컨센서스 PAM 모티프를 보여주는 그래프이다. 도 1j는 스타필로코커스 와르네리 균주 691에 의해 인식되는 컨센서스 PAM 모티프를 보여주는 그래프이다. 도 1k는 스타필로코커스 스키우리 균주 SNUC 2430에 의해 인식되는 컨센서스 PAM 모티프를 보여주는 그래프이다. 도 1l은 스트렙토코커스 갈롤리티쿠스 균주 AM24-4에 의해 인식되는 컨센서스 PAM 모티프를 보여주는 그래프이다. 도 1m은 락토바실러스 쿨라베르겐시스 균주 Biut2에 의해 인식되는 컨센서스 PAM 모티프를 보여주는 그래프이다. 도 1n은 스트렙토코커스 수이스 균주에 의해 인식되는 컨센서스 PAM 모티프를 보여주는 그래프이다(N = A, T, G 또는 C; H = A, C 또는 T; R = A 또는 G).
도 2a는 Geneious 소프트웨어를 사용하여 인간 코돈 최적화된 스트렙토코커스 에쿠이누스 ATCC 33317(Seq2Cas9)에 대한 sgRNA의 예측된 RNA 접힘 구조를 보여주는 개략도이다. 도 2a는 서열번호 198을 포함하는 sgRNA를 도시한다. 도 2b는 Geneious 소프트웨어를 사용하여 인간 코돈 최적화된 엔테로코커스 히라에 균주 F1129E Cas9(EhiCas9)에 대한 sgRNA의 예측된 RNA 접힘 구조를 보여주는 개략도이다. 도 2b는 서열번호 44를 포함하는 sgRNA를 도시한다. 도 2c는 Geneious 소프트웨어를 사용하여 인간 코돈 최적화된 스트렙토코커스 에쿠이누스 균주 AG46 Cas9(SeqCas9)에 대한 sgRNA의 예측된 RNA 접힘 구조를 보여주는 개략도이다. 도 2c는 서열번호 46을 포함하는 sgRNA를 도시한다. 도 2d는 Geneious 소프트웨어를 사용하여 인간 코돈 최적화된 스타필로코커스 시뮬란스 균주 19(SsiCas9)에 대한 sgRNA의 예측된 RNA 접힘 구조를 보여주는 개략도이다. 도 2d는 서열번호 45를 포함하는 sgRNA를 도시한다. 도 2e는 Geneious 소프트웨어를 사용하여 인간 코돈 최적화된 스트렙토코커스 인터메디우스 B196 균주 G1552(SinCas9)에 대한 sgRNA의 예측된 RNA 접힘 구조를 보여주는 개략도이다. 도 2e는 서열번호 47을 포함하는 sgRNA를 도시한다. 도 2f는 Geneious 소프트웨어를 사용하여 인간 코돈 최적화된 스트렙토코커스 상귀니스 SK330(SsaCas9)에 대한 sgRNA의 예측된 RNA 접힘 구조를 보여주는 개략도이다. 도 2f는 서열번호 48을 포함하는 sgRNA를 도시한다. 도 2g는 Geneious 소프트웨어를 사용하여 인간 코돈 최적화된 스트렙토코커스 종 C150(Ssc2Cas9)에 대한 sgRNA의 예측된 RNA 접힘 구조를 보여주는 개략도이다. 도 2g는 서열번호 49를 포함하는 sgRNA를 도시한다. 도 2h는 Geneious 소프트웨어를 사용하여 인간 코돈 최적화된 스트렙토코커스 오랄리스 아종 오랄리스 균주 RH_1735_08 (Sor2Cas9)에 대한 sgRNA의 예측된 RNA 접힘 구조를 보여주는 개략도이다. 도 2h는 서열번호 50을 포함하는 sgRNA를 도시한다. 도 2i는 Geneious 소프트웨어를 사용하여 인간 코돈 최적화된 스트렙토코커스 오랄리스 SK313(SorCas9)에 대한 sgRNA의 예측된 RNA 접힘 구조를 보여주는 개략도이다. 도 2i는 서열번호 51을 포함하는 sgRNA를 도시한다. 도 2j는 Geneious 소프트웨어를 사용하여 인간 코돈 최적화된 스타필로코커스 와르네리 균주 691(SwaCas9)에 대한 sgRNA의 예측된 RNA 접힘 구조를 보여주는 개략도이다. 도 2j는 서열번호 52를 포함하는 sgRNA를 도시한다. 도 2k는 Geneious 소프트웨어를 사용하여 인간 코돈 최적화된 스타필로코커스 스키우리 균주 SNUC 2430에 대한 sgRNA의 예측된 RNA 접힘 구조를 보여주는 개략도이다. 도 2k는 서열번호 53을 포함하는 sgRNA를 도시한다. 도 2l은 Geneious 소프트웨어를 사용하여 인간 코돈 최적화된 스트렙토코커스 갈롤리티쿠스 균주 AM24-4(SgaCas9)에 대한 sgRNA의 예측된 RNA 접힘 구조를 보여주는 개략도이다. 도 2l은 서열번호 54를 포함하는 sgRNA를 도시한다. 도 2m은 Geneious 소프트웨어를 사용하여 인간 코돈 최적화된 락토바실러스 쿨라베르겐시스 균주 Biut2(LkuCas9)에 대한 sgRNA의 예측된 RNA 접힘 구조를 보여주는 개략도이다. 도 2m은 서열번호 55를 포함하는 sgRNA를 도시한다. 도 2n은 Geneious 소프트웨어를 사용하여 인간 코돈 최적화된 스트렙토코커스 수이스 균주 LSS83에 대한 sgRNA의 예측된 RNA 접힘 구조를 보여주는 개략도이다. 도 2n은 서열번호 56을 포함하는 sgRNA를 도시한다.
도 3a는 Seq2Cas9 D10A 돌연변이체의 N-말단에 융합된 ABE를 포함하는 염기 편집기로 달성된 아데닌에서 구아닌 염기(A에서 G)로의 전환 백분율의 결과를 보여주는 그래프이다. A에서 G로의 전환 백분율(y-축)은 PAM 컨센서스 모티프에 상응하는 서열에 인접한 A 풍부 게놈 테스트 부위(x-축; 표 8)를 표적화하는 다양한 가이드 RNA에 대해 플로팅되었다(도 1a 참조).
도 3b는 EhiCas9 D10A 돌연변이체의 N-말단에 융합된 ABE를 포함하는 염기 편집기로 달성된 아데닌에서 구아닌 염기(A에서 G)로의 전환 백분율의 결과를 보여주는 그래프이다. A에서 G로의 전환 백분율(y-축)은 PAM 컨센서스 모티프에 상응하는 서열에 인접한 A 풍부 게놈 테스트 부위(x-축; 표 9)를 표적화하는 다양한 가이드 RNA에 대해 플로팅되었다(도 1b 참조).
도 3c는 SeqCas9 D10A 돌연변이체의 N-말단에 융합된 ABE를 포함하는 염기 편집기로 달성된 아데닌에서 구아닌 염기(A에서 G)로의 전환 백분율의 결과를 보여주는 그래프이다. A에서 G로의 전환 백분율(y-축)은 PAM 컨센서스 모티프에 상응하는 서열에 인접한 A 풍부 게놈 테스트 부위(x-축; 표 10)를 표적화하는 다양한 가이드 RNA에 대해 플로팅되었다(도 1c 참조).
도 3d는 SsiCas9 D10A 돌연변이체의 N-말단에 융합된 ABE를 포함하는 염기 편집기로 달성된 아데닌에서 구아닌 염기(A에서 G)로의 전환 백분율의 결과를 보여주는 그래프이다. A에서 G로의 전환 백분율(y-축)은 PAM 컨센서스 모티프에 상응하는 서열에 인접한 A 풍부 게놈 테스트 부위(x-축; 표 11)를 표적화하는 다양한 가이드 RNA에 대해 플로팅되었다(도 1d 참조).
도 3e는 SinCas9 D9A 돌연변이체의 N-말단에 융합된 ABE를 포함하는 염기 편집기로 달성된 아데닌에서 구아닌 염기(A에서 G)로의 전환 백분율의 결과를 보여주는 그래프이다. A에서 G로의 전환 백분율(y-축)은 PAM 컨센서스 모티프에 상응하는 서열에 인접한 A 풍부 게놈 테스트 부위(x-축; 표 12)를 표적화하는 다양한 가이드 RNA에 대해 플로팅되었다(도 1e 참조).
도 3f는 SsaCas9 D11A 돌연변이체의 N-말단에 융합된 ABE를 포함하는 염기 편집기로 달성된 아데닌에서 구아닌 염기(A에서 G)로의 전환 백분율의 결과를 보여주는 그래프이다. A에서 G로의 전환 백분율(y-축)은 PAM 컨센서스 모티프에 상응하는 서열에 인접한 A 풍부 게놈 테스트 부위(x-축; 표 13)를 표적화하는 다양한 가이드 RNA에 대해 플로팅되었다(도 1f 참조).
도 3g는 Ssc2Cas9 D9A 돌연변이체의 N-말단에 융합된 ABE를 포함하는 염기 편집기로 달성된 아데닌에서 구아닌 염기(A에서 G)로의 전환 백분율의 결과를 보여주는 그래프이다. A에서 G로의 전환 백분율(y-축)은 PAM 컨센서스 모티프에 상응하는 서열에 인접한 A 풍부 게놈 테스트 부위(x-축; 표 14)를 표적화하는 다양한 가이드 RNA에 대해 플로팅되었다(도 1g 참조).
도 3h는 Sor2Cas9 D9A 돌연변이체의 N-말단에 융합된 ABE를 포함하는 염기 편집기로 달성된 아데닌에서 구아닌 염기(A에서 G)로의 전환 백분율의 결과를 보여주는 그래프이다. A에서 G로의 전환 백분율(y-축)은 PAM 컨센서스 모티프에 상응하는 서열에 인접한 A 풍부 게놈 테스트 부위(x-축; 표 15)를 표적화하는 다양한 가이드 RNA에 대해 플로팅되었다(도 1h 참조).
도 3i는 SorCas9 D9A 돌연변이체의 N-말단에 융합된 ABE를 포함하는 염기 편집기로 달성된 아데닌에서 구아닌 염기(A에서 G)로의 전환 백분율의 결과를 보여주는 그래프이다. A에서 G로의 전환 백분율(y-축)은 PAM 컨센서스 모티프에 상응하는 서열에 인접한 A 풍부 게놈 테스트 부위(x-축; 표 16)를 표적화하는 다양한 가이드 RNA에 대해 플로팅되었다(도 1i 참조).
도 3j는 SwaCas9 돌연변이체의 N-말단에 융합된 ABE를 포함하는 염기 편집기로 달성된 아데닌에서 구아닌 염기(A에서 G)로의 전환 백분율의 결과를 보여주는 그래프이다. A에서 G로의 전환 백분율(y-축)은 PAM 컨센서스 모티프에 상응하는 서열에 인접한 A 풍부 게놈 테스트 부위(x-축; 표 17)를 표적화하는 다양한 가이드 RNA에 대해 플로팅되었다(도 1j 참조).
도 3k는 SscCas9 돌연변이체의 N-말단에 융합된 ABE를 포함하는 염기 편집기로 달성된 아데닌에서 구아닌 염기(A에서 G)로의 전환 백분율의 결과를 보여주는 그래프이다. A에서 G로의 전환 백분율(y-축)은 PAM 컨센서스 모티프에 상응하는 서열에 인접한 A 풍부 게놈 테스트 부위(x-축; 표 18)를 표적화하는 다양한 가이드 RNA에 대해 플로팅되었다(도 1k 참조).
도 3l은 SgaCas9 돌연변이체의 N-말단에 융합된 ABE를 포함하는 염기 편집기로 달성된 아데닌에서 구아닌 염기(A에서 G)로의 전환 백분율의 결과를 보여주는 그래프이다. A에서 G로의 전환 백분율(y-축)은 PAM 컨센서스 모티프에 상응하는 서열에 인접한 A 풍부 게놈 테스트 부위(x-축; 표 19)를 표적화하는 다양한 가이드 RNA에 대해 플로팅되었다(도 1l 참조).
도 3m은 LkuCas9 돌연변이체의 N-말단에 융합된 ABE를 포함하는 염기 편집기로 달성된 아데닌에서 구아닌 염기(A에서 G)로의 전환 백분율의 결과를 보여주는 그래프이다. A에서 G로의 전환 백분율(y-축)은 PAM 컨센서스 모티프에 상응하는 서열에 인접한 A 풍부 게놈 테스트 부위(x-축; 표 20)를 표적화하는 다양한 가이드 RNA에 대해 플로팅되었다(도 1m 참조).
도 3n은 SsuCas9 돌연변이체의 N-말단에 융합된 ABE를 포함하는 염기 편집기로 달성된 아데닌에서 구아닌 염기(A에서 G)로의 전환 백분율의 결과를 보여주는 그래프이다. A에서 G로의 전환 백분율(y-축)은 PAM 컨센서스 모티프에 상응하는 서열에 인접한 A 풍부 게놈 테스트 부위(x-축; 표 21)를 표적화하는 다양한 가이드 RNA에 대해 플로팅되었다(도 1n 참조).
클러스터링된 규칙적으로 간격을 둔 짧은 회문 반복서열(CRISPR)은 세균 및 고세균에서 적응 면역계로 처음 발견된 후 살아있는 세포 및 유기체에서 표적화된 DNA 절단을 생성하도록 조작되었다. 세포 DNA 복구 과정 동안, 다양한 DNA 변화가 도입될 수 있다. 다양하고 확장되는 CRISPR 툴박스는 프로그래밍 가능한 게놈 편집, 후생유전자 편집 및 전사체 조절을 가능하게 한다.
CRISPR-Cas 시스템은 이들의 Cas 유전자 구성과 성분 단백질의 서열 및 구조를 기반으로 한 3가지 주요 유형(I, II 및 III)을 포함한다. 3가지 CRISPR 시스템 각각은 다음의 고유한 Cas 유전자를 특징으로 한다: 유형 I의 표적 분해 뉴클레이스/헬리케이스인 Cas3; 유형 II의 RNA 결합 및 표적 분해 뉴클레이스인 Cas9; 여러 기능을 위한 유형 III의 대형 단백질인 Cas10. 3가지 CRISPR 유형은 관련 효과기 복합체도 다르다. 유형 I Cas 시스템은 캐스케이드 효과기 복합체와 회합되고, 유형 II 효과기 복합체는 단일 Cas9 및 하나 이상의 RNA 분자로 이루어지고, 유형 III 간섭 복합체는 유형 III-A(DNA를 표적화하는 Csm 복합체) 및 유형 III-B(RNA를 표적화하는 Cmr 복합체)로 더 나뉜다. Cas 단백질은 모든 CRISPR-Cas 시스템에서 효과기 복합체의 중요한 구성요소이다.
현재의 게놈 편집 기술은 DNA 절단을 위한 단일 단백질 효과기 뉴클레이스, 특히 CRISPR RNA(crRNA)와 tracrRNA를 모두 필요로 하며 HNH 및 RuvC 뉴클레이스 도메인을 모두 포함하는 이중 RNA 가이드된 뉴클레이스인 Cas9와 crRNA만을 필요로 하며 단일 RuvC 도메인을 포함하는 단일 RNA 가이드된 뉴클레이스인 Cas12a를 포함하는 클래스 II CRISPR-Cas 시스템에 중점을 두고 있다.
본 발명의 다양한 양태는 다음 부분에서 자세히 설명된다. 부문의 사용은 본 발명을 제한하는 것을 의미하지 않는다. 각 부문은 본 발명의 임의의 양태에 적용될 수 있다. 본 출원에서, "또는"의 사용은 달리 명시되지 않는 한 "및/또는"을 의미한다.
조작된 비자연 발생적 Cas9 단백질
스트렙토코커스 에쿠이누스 ATCC 33317(Seq2Cas9), 엔테로코커스 히라에 균주 F1129E(EhiCas9), 스트렙토코커스 에쿠이누스 균주 AG46(SeqCas9), 스타필로코커스 시뮬란스 균주 19(SsiCas9), 스트렙토코커스 인터메디우스 B196 균주 G1552(SinCas9), 스트렙토코커스 상귀니스 SK330(SsaCas9), 스트렙토코커스 종 C150(Ssc2Cas9), 스트렙토코커스 오랄리스 아종 오랄리스 균주 RH_1735_08(Sor2Cas9), 스트렙토코커스 오랄리스 SK313(SorCas9), 스타필로코커스 와르네리 균주 691(SwaCas9), 스타필로코커스 스키우리 균주 SNUC 2430(SscCas9), 스트렙토코커스 갈롤리티쿠스 균주 AM24-4(SgaCas9), 락토바실러스 쿨라베르겐시스 균주 Biut2(LkuCas9) 및 스트렙토코커스 수이스 균주 LSS83(SsuCas9)로부터 얻은 WT Cas9로부터 변형된 조작된 비자연 발생적 Cas9 단백질이 본 명세서에 기재된다.
일부 실시형태에서, 본 명세서에 기재된 조작된 비자연 발생적 Cas9 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 14와 적어도 60%(예를 들어, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상) 동일한 아미노산 서열을 포함한다. 일부 실시형태에서, Cas9 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 14와 80% 동일하다. 일부 실시형태에서, Cas9 단백질의 아미노산 서열은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 14와 동일하다. 예시적인 Cas9 아미노산 서열은 아래 표 1에 제공되어 있다.
일부 실시형태에서, Cas9 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 14와 관련하여 하나 이상의 돌연변이를 포함한다. 예를 들어, Cas9 단백질의 아미노산 서열은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 14에 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개의 돌연변이를 포함한다. 다양한 돌연변이가 당업계에 공지되어 이으며, 예를 들어, 아미노산 치환을 포함한다.
일부 실시형태에서, Cas9의 2개 이상의 촉매 도메인(RuvC1, RuvCII, RuvCIII)이 핵산 절단 활성이 결여되어 있는 불활성 또는 "활성이 없는" Cas9(dCas9)를 생성하도록 돌연변이된다. 일부 실시형태에서, 하나 이상의 돌연변이가 PAM 상호작용, HNH 및 또는 RuvC 도메인에 있다. 일부 실시형태에서, Cas9는 돌연변이되지 않은 형태에 대해 DNA 절단 활성을 약 25%, 15%, 10%, 5%, 1%, 0.1%, 0.01% 미만 또는 그 이하로 감소시키도록 돌연변이된다.
일부 실시형태에서, Cas9의 닉케이스 돌연변이체 버전이 제공된다. 일부 실시형태에서, 닉케이스 돌연변이체는 RuvC 및/또는 HNH 도메인에 하나 이상의 아미노산 치환을 갖는다. SpCas9(스트렙토코커스 피오게네스)와 관련하여 다양한 닉케이스 돌연변이가 공지되어 있으며, 예를 들어, 야생형 SpCas9의 10번, 12번, 17번, 762번, 840번, 854번, 863번, 982번, 983번, 984번, 986번, 987번 아미노산 위치 중 하나 이상의 돌연변이를 포함한다. 예를 들어, SpCas9의 D10A에 해당하는 아스파르트산에서 알라닌으로의 치환은 닉케이스의 생성을 초래한다. 일부 실시형태에서, 본 명세서에 기재된 Cas9는 닉케이스의 생성을 초래하는 하나 이상의 돌연변이를 갖는다. 일부 실시형태에서, 본 명세서에 기재된 Cas9는 SpCas9의 10번, 12번, 17번, 762번, 840번, 854번, 863번, 982번, 983번, 984번, 986번, 987번 아미노산 중 하나 이상에 해당하는 아미노산 위치에 하나 이상의 돌연변이를 갖는다.
일부 실시형태에서, 돌연변이는 Seq2Cas9의 RuvC 도메인에 있는 아스파르트산에서 알라닌으로의 치환(D10A)이다. 일부 실시형태에서, 돌연변이는 EhiCas9의 RuvC 도메인에 있는 아스파르트산에서 알라닌으로의 치환(D10A)이다. 일부 실시형태에서, 돌연변이는 SeqCas9의 RuvC 도메인에 있는 아스파르트산에서 알라닌으로의 치환(D10A)(예를 들어, SpCas9에 있는 D10A에 상응함)이다. 일부 실시형태에서, 돌연변이는 SsiCas9의 RuvC 도메인에 있는 아스파르트산에서 알라닌으로의 치환(D10A)이다. 일부 실시형태에서, 돌연변이는 SinCas9의 RuvC 도메인에 있는 아스파르트산에서 알라닌으로의 치환(D9A)이다. 일부 실시형태에서, 돌연변이는 SsaCas9의 RuvC 도메인에 있는 아스파르트산에서 알라닌으로의 치환(D11A)이다. 일부 실시형태에서, 돌연변이는 Ssc2Cas9의 RuvC 도메인에 있는 아스파르트산에서 알라닌으로의 치환(D9A)이다. 일부 실시형태에서, 돌연변이는 Sor2Cas9의 RuvC 도메인에 있는 아스파르트산에서 알라닌으로의 치환(D9A)이다. 일부 실시형태에서, 돌연변이는 SorCas9의 RuvC 도메인에 있는 아스파르트산에서 알라닌으로의 치환(D9A)이다. 일부 실시형태에서, 돌연변이는 SwaCas9의 RuvC 도메인에 있는 아스파르트산에서 알라닌으로의 치환(D10A)이다. 일부 실시형태에서, 돌연변이는 SscCas9의 RuvC 도메인에 있는 아스파르트산에서 알라닌으로의 치환(D10A)이다. 일부 실시형태에서, 돌연변이는 SgaCas9의 RuvC 도메인에 있는 아스파르트산에서 알라닌으로의 치환(D10A)이다. 일부 실시형태에서, 돌연변이는 LkuCas9의 RuvC 도메인에 있는 아스파르트산에서 알라닌으로의 치환(D13A)이다. 일부 실시형태에서, 돌연변이는 SsuCas9의 RuvC 도메인에 있는 아스파르트산에서 알라닌으로의 치환(D10A)이다.
일부 실시형태에서, 돌연변이는 Seq2Cas9의 RuvC 도메인에 있는 아스파르트산에서 글리신으로의 치환(D10G)이다. 일부 실시형태에서, 돌연변이는 EhiCas9의 RuvC 도메인에 있는 아스파르트산에서 글리신으로의 치환(D10G)이다. 일부 실시형태에서, 돌연변이는 SeqCas9의 RuvC 도메인에 있는 아스파르트산에서 글리신으로의 치환(D10G)(예를 들어, SpCas9에 있는 D10G에 상응함)이다. 일부 실시형태에서, 돌연변이는 SsiCas9의 RuvC 도메인에 있는 아스파르트산에서 글리신으로의 치환(D10G)이다. 일부 실시형태에서, 돌연변이는 SinCas9의 RuvC 도메인에 있는 아스파르트산에서 글리신으로의 치환(D9G)이다. 일부 실시형태에서, 돌연변이는 SsaCas9의 RuvC 도메인에 있는 아스파르트산에서 글리신으로의 치환(D11G)이다. 일부 실시형태에서, 돌연변이는 Ssc2Cas9의 RuvC 도메인에 있는 아스파르트산에서 글리신으로의 치환(D9G)이다. 일부 실시형태에서, 돌연변이는 Sor2Cas9의 RuvC 도메인에 있는 아스파르트산에서 글리신으로의 치환(D9G)이다. 일부 실시형태에서, 돌연변이는 SorCas9의 RuvC 도메인에 있는 아스파르트산에서 글리신으로의 치환(D9G)이다. 일부 실시형태에서, 돌연변이는 SwaCas9의 RuvC 도메인에 있는 아스파르트산에서 글리신으로의 치환(D10G)이다. 일부 실시형태에서, 돌연변이는 SscCas9의 RuvC 도메인에 있는 아스파르트산에서 글리신으로의 치환(D10G)이다. 일부 실시형태에서, 돌연변이는 SgaCas9의 RuvC 도메인에 있는 아스파르트산에서 글리신으로의 치환(D10G)이다. 일부 실시형태에서, 돌연변이는 LkuCas9의 RuvC 도메인에 있는 아스파르트산에서 글리신으로의 치환(D13G)이다. 일부 실시형태에서, 돌연변이는 SsuCas9의 RuvC 도메인에 있는 아스파르트산에서 글리신으로의 치환(D10G)이다.
일부 실시형태에서, 본 명세서에 기재된 이러한 하나 이상의 돌연변이는 Cas9를 불활성 또는 Cas9의 "활성이 없는" 버전(dCas9)으로의 전환한다. 따라서, 일부 실시형태에서, Cas9 단백질은 DNA 이중체의 두 가닥 모두를 절단하는 Cas9의 능력을 저해하는 하나 이상의 돌연변이를 포함한다.
일부 실시형태에서, 가이드 RNA와 공동 발현될 때, 활성이 없는 Cas9는 전사적 신장, RNA 폴리머레이스 결합 또는 전사 인자 결합을 특이적으로 방해할 수 있는 DNA 인식 복합체를 생성한다. 일부 실시형태에서, 활성이 없는 Cas9는 다양한 기능의 효과기 단백질을 특정 핵산 표적 부위에 특이적으로 표적화하는 데 사용된다.
일부 실시형태에서, 조작된 비자연 발생적 Cas9는 인간 세포에 대해 코돈 최적화된다. 조작된 비자연 발생적 Cas9는 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 14와 적어도 80%(예를 들어, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상) 동일하다.
핵 국재화 신호(NLS) 및 링커를 갖는 예시적인 Cas9 아미노산 서열은 아래 표 2에 제공되어 있다.
일부 실시형태에서, 재조합 조작된 비자연 발생적 인간 코돈 최적화된 Cas9는 서열번호 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27 또는 28과 적어도 60%, 70%, 80%, 85%, 90%, 95%, 97%, 98%, 99%의 서열 동일성을 갖는 서열을 포함한다. 일부 실시형태에서, 재조합 조작된 비자연 발생적 인간 코돈 최적화된 Cas9는 서열번호 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27 또는 28과 적어도 60%, 70%, 80%, 85%, 90%, 95%, 97%, 98%, 99%의 서열 동일성을 갖는 서열을 포함한다. 일부 실시형태에서, 재조합 조작된 비자연 발생적 인간 코돈 최적화된 Cas9는 서열번호 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27 또는 28과 적어도 60%, 70%, 80%, 85%, 90%, 95%, 97%, 98%, 99%의 서열 동일성을 갖는 서열을 포함한다. 일부 실시형태에서, 재조합 조작된 비자연 발생적 인간 코돈 최적화된 Cas9는 서열번호 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27 또는 28과 적어도 60%, 70%, 80%, 85%, 90%, 95%, 97%, 98%, 99%의 서열 동일성을 갖는 서열을 포함한다.
다양한 종은 특정 유기체에서 코돈에 대한 tRNA 종의 존재비에 상응하는 mRNA의 코돈을 활용함으로써 메신저 RNA(mRNA)의 번역 효율과 상관관계가 있는 코돈 편향(즉, 유기체에 의한 코돈 사용의 차이)을 나타낸다. 소프트웨어의 사용을 포함하여 당업계의 다양한 방법이 컴퓨터 최적화를 위해 사용될 수 있다. 일부 실시형태에서, 코돈 최적화는 천연 아미노산 서열을 유지하면서 숙주 세포의 유전자에서 더 빈번하게 사용되거나 가장 빈번하게 사용되는 코돈을 갖는 천연 서열 중 적어도 하나의 코돈(예를 들어, 1개, 2개, 3개, 4개, 5개, 10개, 15개, 20개, 25개, 50개 이상의 코돈)을 대체함으로써 관심 숙주 세포에서의 향상된 발현을 위한 핵산 서열의 변형을 지칭한다.
일부 실시형태에서, 본 명세서에 기재된 Cas9 단백질은 코돈 최적화된다. 이러한 유형의 최적화는 당업계에 공지되어 있으며, 동일한 단백질을 암호화하면서 의도된 숙주 유기체 또는 세포의 코돈 선호도를 모방하기 위해 외래 유래 DNA의 돌연변이를 수반한다. 따라서, 코돈은 변경되지만 암호화된 단백질은 변경되지 않는다. 코돈 최적화는 가용성 단백질 수준을 개선시키고, 주어진 종에서 활성 및 편집 효율을 증가시킨다. 코돈 최적화는 또한 번역 및 단백질 발현을 증가시킨다.
일부 실시형태에서, Cas9 단백질은 진핵동물 세포에서의 발현을 위해 코돈 최적화된다. 일부 실시형태에서, Cas9 단백질은 인간 세포에서의 발현을 위해 코돈 최적화된다.
프로토스페이서 인접 모티프(PAM)
각각의 Cas 엔도뉴클레이스는 비표적화된, 즉, 상보적인 DNA 가닥에 프로토스페이서 인접 모티프(PAM)로 알려진 특정 서열이 있는 경우에만 표적 서열에 결합한다. 상이한 세균 종으로부터 단리된 Cas 뉴클레이스는 상이한 PAM 서열을 인식한다. 예를 들어, 스트렙토코커스 에쿠이누스 ATCC 33317로부터 조작된 Cas9는 컨센서스 PAM 서열 5'-NRGNR-3'(여기서 "N"은 임의의 뉴클레오타이드 염기일 수 있고, R은 A 또는 G임)의 상류를 절단하고, 엔테로코커스 히라에 균주 F1129E는 컨센서스 PAM 서열 5'-NRG-3'를 인식하고, 스트렙토코커스 에쿠이누스 균주 AG46, 스타필로코커스 와르네리 균주 691 및 스타필로코커스 스키우리 균주 SNUC 2430은 컨센서스 PAM 서열 5'-NNGR-3'를 인식하고, 스타필로코커스 시뮬란스 균주 19는 컨센서스 PAM 서열 5'-NNGRRT-3'를 인식하고, 스트렙토코커스 인터메디우스 B196 균주 G1552는 컨센서스 PAM 서열 5'-NNAAAA-3'를 인식하고, 스트렙토코커스 상귀니스 SK330은 컨센서스 PAM 서열 5'-NGGNG-3'를 인식하고, 스트렙토코커스 종 C150은 컨센서스 PAM 서열 5'-NNGNRG-3'를 인식하고, 스트렙토코커스 오랄리스 아종 오랄리스 균주 RH_1735_08은 컨센서스 PAM 서열 5'-NNAAAC-3'를 인식하고, 스트렙토코커스 오랄리스 SK313은 컨센서스 PAM 서열 5'-NNRAAG-3'를 인식하고, 스트렙토코커스 갈롤리티쿠스 균주 AM24-4는 컨센서스 PAM 서열 5'-NNAYAA-3'를 인식하고, 락토바실러스 쿨라베르겐시스 균주 Biut2는 컨센서스 PAM 서열 5'-NNGAAA-3'를 인식하고, 스트렙토코커스 수이스 균주는 표적에서 컨센서스 PAM 서열 5'-NNAAA-3'(N = 임의의 뉴클레오타이드 염기; H = A, C 또는 T; R = A 또는 G)를 인식한다. 따라서, 상이한 Cas 단백질에 의해 표적화될 수 있는 게놈의 위치는 고유한 PAM 서열의 위치에 의해 제한된다.
일부 실시형태에서, 표적 핵산은 PAM 서열의 5' 또는 상류에 있다. 따라서, 본 명세서에 기재된 Cas9 단백질은 고유한 PAM 서열의 존재하에 활성, 예를 들어, 결합, 절단, 변형 또는 변경된 유전자 발현을 나타낸다.
일부 실시형태에서, 본 명세서에 기재된 Cas9 단백질은 임의의 다른 PAM 서열과 결합하거나 활성을 나타내지 않는다.
RNA 가이드
RNA 가이드는 표적 서열과 상보성을 갖는 폴리뉴클레오타이드 서열을 포함한다. RNA 가이드는 표적 핵산 서열과 혼성화되고, CRISPR 복합체의 표적 핵산에 대한 서열 특이적 결합을 지시한다. 일부 실시형태에서, RNA 가이드는 표적 핵산 서열과 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%의 상보성을 갖는다.
일부 실시형태에서, RNA 가이드는 약 5개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개, 30개, 35개, 40개, 45개, 50개, 75개 이상의 뉴클레오타이드 길이이다. 일부 실시형태에서, RNA 가이드는 약 18개 내지 24개의 뉴클레오타이드 길이이다. 일부 실시형태에서, RNA 가이드는 표적 핵산 서열의 약 18개 내지 24개의 뉴클레오타이드와 상보적이다. 예를 들어, RNA 가이드는 표적 핵산 서열의 약 18개, 19개, 20개, 21개, 22개, 23개 또는 24개의 뉴클레오타이드와 상보적이다. 일부 실시형태에서, RNA 가이드는 약 18개 내지 22개의 뉴클레오타이드와 상보적이다. 일부 실시형태에서, RNA 가이드는 약 18개 내지 21개의 뉴클레오타이드와 상보적이다. 일부 실시형태에서, RNA 가이드는 약 18개 내지 20개의 뉴클레오타이드와 상보적이다. 일부 실시형태에서, RNA 가이드는 표적 핵산 서열의 20개의 뉴클레오타이드와 상보적이다.
RNA 가이드는 임의의 표적 서열을 표적화하도록 설계될 수 있다. 최적의 정렬은 Needleman-Wunsch 알고리즘, Smith-Waterman 알고리즘, Burrows-Wheeler 알고리즘, ClustlW, ClustlX, BLAST, Novoalign, SOAP, Maq 및 ELAND를 포함하는 서열을 정렬하기 위한 임의의 알고리즘을 사용하여 결정된다.
일부 실시형태에서, RNA 가이드는 세포 게놈 내의 고유한 표적 서열에 대해 표적화된다. 일부 실시형태에서, RNA 가이드는 PAM 서열이 결여되도록 설계된다. 일부 실시형태에서, RNA 가이드 서열은 mFold 또는 Geneious를 포함하는 접힘 알고리즘을 사용하여 최적의 2차 구조를 갖도록 설계된다. 일부 실시형태에서, RNA 가이드의 발현은, 예를 들어, 호르몬 유도성, 테트라사이클린 또는 독시사이클린 유도성, 아라비노스 유도성 또는 광 유도성인 유도성 프로모터하에 있을 수 있다.
일부 실시형태에서, CRISPR 시스템은 하나 이상의 RNA 가이드, 예를 들어, crRNA, tracrRNA 및/또는 sgRNA를 포함한다. 따라서, 일부 실시형태에서, RNA 가이드는 crRNA를 포함한다. 일부 실시형태에서, RNA 가이드는 tracrRNA를 포함한다. 일부 실시형태에서, RNA 가이드는 sgRNA를 포함한다. 일부 실시형태에서, CRISPR 시스템은 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 15개 이상의 RNA 가이드를 포함하는 다중 RNA 가이드를 포함한다.
일부 실시형태에서, RNA 가이드는 crRNA를 포함한다. 일부 실시형태에서, CRISPR 시스템은 2개 내지 15개의 crRNA를 포함하는 다중 crRNA를 포함한다. 일부 실시형태에서, crRNA는 직접 반복 서열, 스페이서 서열 및 직접 반복 서열을 포함하는 전구체 crRNA(pre-crRNA)이다. 일부 실시형태에서, crRNA는 절단된 직접 반복 서열을 포함하는 가공되거나 성숙한 crRNA이다.
일부 실시형태에서, CRISPR 연관 단백질은 가공되거나 성숙한 crRNA를 형성하기 위해 pre-crRNA를 절단한다.
일부 실시형태에서, CRISPR 연관 단백질은 성숙한 crRNA와 복합체를 형성하고, 스페이서 서열은 표적 핵산의 상보적인 서열에 대한 복합체를 표적화한다. 일부 실시형태에서, RNA 가이드는 직접 반복 서열 및 적절한 조건하에서 표적 핵산에 혼성화될 수 있는 스페이서 서열을 포함한다.
일부 실시형태에서, crRNA의 스페이서 길이는 약 15개 내지 50개의 뉴클레오타이드 범위일 수 있다. 일부 실시형태에서, RNA 가이드의 스페이서 길이는 적어도 16개의 뉴클레오타이드, 적어도 17개의 뉴클레오타이드, 적어도 18개의 뉴클레오타이드, 적어도 19개의 뉴클레오타이드, 적어도 20개의 뉴클레오타이드, 적어도 21개의 뉴클레오타이드 또는 적어도 22개의 뉴클레오타이드이다. 일부 실시형태에서, 스페이서 길이는 15개 내지 17개의 뉴클레오타이드(예를 들어, 15개, 16개 또는 17개의 뉴클레오타이드), 17개 내지 20개의 뉴클레오타이드(예를 들어, 17개, 18개, 19개 또는 20개의 뉴클레오타이드), 20개 내지 24개의 뉴클레오타이드(예를 들어, 20개, 21개, 22개, 23개 또는 24개의 뉴클레오타이드), 23개 내지 25개의 뉴클레오타이드(예를 들어, 23개, 24개 또는 25개의 뉴클레오타이드), 24개 내지 27개의 뉴클레오타이드, 27개 내지 30개의 뉴클레오타이드, 30개 내지 45개의 뉴클레오타이드(예를 들어, 30개, 31개, 32개, 33개, 34개, 35개, 36개, 37개, 38개, 39개, 40개, 41개, 42개, 43개, 44개 또는 45개의 뉴클레오타이드), 30개 또는 35개 내지 40개의 뉴클레오타이드, 41개 내지 45개의 뉴클레오타이드, 45개 내지 50개의 뉴클레오타이드(예를 들어, 45개, 46개, 47개, 48개, 49개 또는 50개의 뉴클레오타이드) 또는 그 이상이다.
일부 실시형태에서, RNA 가이드는 약 16개 내지 26개의 뉴클레오타이드 길이의 직접 반복부(direct repeat: DR) 서열을 포함한다. 예를 들어, 일부 실시형태에서, DR은 약 16개의 뉴클레오타이드 길이이다. 일부 실시형태에서, DR은 약 17개의 뉴클레오타이드 길이이다. 일부 실시형태에서, DR은 약 18개의 뉴클레오타이드 길이이다. 일부 실시형태에서, DR은 약 19개의 뉴클레오타이드 길이이다. 일부 실시형태에서, DR은 약 20개의 뉴클레오타이드 길이이다. 일부 실시형태에서, DR은 약 21개의 뉴클레오타이드 길이이다. 일부 실시형태에서, DR은 약 22개의 뉴클레오타이드 길이이다. 일부 실시형태에서, DR은 약 23개의 뉴클레오타이드 길이이다. 일부 실시형태에서, DR은 약 24개의 뉴클레오타이드 길이이다. 일부 실시형태에서, DR은 약 25개의 뉴클레오타이드 길이이다. 일부 실시형태에서, DR은 약 26개의 뉴클레오타이드 길이이다.
일부 실시형태에서, crRNA는 뉴클레오타이드 가이드 서열 및 DR 서열을 포함한다. 뉴클레오타이드 가이드 서열은 약 18개 내지 24개의 뉴클레오타이드 길이일 수 있다. 따라서, 일부 실시형태에서, 뉴클레오타이드 가이드 서열은 약 18개의 뉴클레오타이드 길이이다. 일부 실시형태에서, 뉴클레오타이드 가이드 서열은 약 19개의 뉴클레오타이드 길이이다. 일부 실시형태에서, 뉴클레오타이드 가이드 서열은 약 20개의 뉴클레오타이드 길이이다. 일부 실시형태에서, 뉴클레오타이드 가이드 서열은 약 21개의 뉴클레오타이드 길이이다. 일부 실시형태에서, 뉴클레오타이드 가이드 서열은 약 22개의 뉴클레오타이드 길이이다. 일부 실시형태에서, crRNA는 약 22개의 뉴클레오타이드 길이의 뉴클레오타이드 가이드 서열 및 약 22개의 뉴클레오타이드 길이의 직접 반복부를 포함한다.
일부 실시형태에서, crRNA 서열은 CRISPR 연관 단백질과 복합체를 형성하고 임의의 실질적인 뉴클레이스 활성 없이 특정 표적에 결합할 수 있는 "활성이 없는 crRNA", "활성이 없는 가이드" 또는 "활성이 없는 가이드 서열"로 변형될 수 있다.
일부 실시형태에서, crRNA는 당 포스페이트 백본 또는 염기에서 화학적으로 변형될 수 있다. 일부 실시형태에서, crRNA는 뉴클레이스 저항성 또는 염기 페어링을 개선시키기 위해 2'O-메틸, 2'-F 또는 잠금 핵산을 사용하여 변형될 수 있다. 일부 실시형태에서, crRNA는 2-티오우리디엔 또는 N6-메틸아데노신과 같은 변형된 염기를 포함할 수 있다.
일부 실시형태에서, crRNA는 다른 올리고뉴클레오타이드, 펩타이드, 단백질, 태그, 염료 또는 폴리에틸렌 글리콜과 접합된다.
일부 실시형태에서, crRNA는 3차원 구조로 인해 특정 표적 분자에 결합할 수 있는 압타머 또는 리보스위치 서열을 포함할 수 있다.
일부 실시형태에서, 트랜스 활성화 RNA(tracrRNA)는 Cas9 단백질과의 복합체 형성을 용이하게 하기 위해 crRNA와 회합된다. 일부 실시형태에서, tracrRNA 서열은 약 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 25개, 30개, 40개, 50개, 60개, 70개, 80개, 90개, 100개 이상의 뉴클레오타이드 길이이다. 일부 실시형태에서, tracrRNA는 약 70개의 뉴클레오타이드 길이이다.
일부 실시형태에서, tracrRNA 및 crRNA에는 단일 가이드 RNA(sgRNA)라고 불리는 단일 전사체에 포함되어 있다. 일부 실시형태에서, sgRNA는 tracrRNA와 sgRNA 사이에 루프를 포함한다.
일부 실시형태에서, 루프 형성 서열은 3개, 4개, 5개 이상의 뉴클레오타이드 길이이다. 일부 실시형태에서, 루프는 서열 GAAA, AAAG, CAAA, AAAC, UUUU, UUAUAU, UUA, UUU 및/또는 AAUCA를 갖는다. 일부 실시형태에서, 루프는 서열 GAAA를 갖는다. 일부 실시형태에서, 루프는 서열 AAAG를 갖는다. 일부 실시형태에서, 루프는 서열 CAAA를 갖는다. 일부 실시형태에서, 루프는 서열 AAAC를 갖는다. 일부 실시형태에서, 루프는 서열 AAUCA를 갖는다. 일부 실시형태에서, 루프는 서열 UUUU를 갖는다. 일부 실시형태에서, 루프는 서열 UUAUAU를 갖는다. 일부 실시형태에서, 루프는 서열 UUA를 갖는다. 일부 실시형태에서, 루프는 서열 UUU를 갖는다. 일부 실시형태에서, 루프는 서열 AAUCA를 갖는다.
일부 실시형태에서, tracrRNA 및 crRNA는 헤어핀 루프를 형성한다. 일부 실시형태에서, sgRNA는 적어도 2개 이상의 헤어핀을 갖는다. 일부 실시형태에서, sgRNA는 2개, 3개, 4개 또는 5개의 헤어핀을 갖는다.
일부 실시형태에서, sgRNA는 6개의 뉴클레오타이드를 포함하는 폴리T 서열을 포함하는 전사 종결 서열을 포함한다.
일부 실시형태에서, sgRNA는 Seq2Cas9에 대한 5'- GUUUUAGUACUCUGUAAUUUU GAAA AAAAUUACAGAAUCUACUAAAACAAGGCAAAAUGCCGUGUUUAUCUCGUCAACUUGUUGACGAGAUUUUUUU-3'(서열번호 43)와 적어도 80%의 동일성을 갖는 서열을 포함하고,
일부 실시형태에서, sgRNA는 EhiCas9에 대한 5'- GUUUUAGAGCUAUGUUG GAAA CAACAUAGCGAGUUAAAAUAAGGCAUUGUCCGUUAUCAGCUUUUAAAGCAAGCACUGUCUCGGUGCUUUUUU-3'(서열번호 44)와 적어도 80%의 동일성을 갖는 서열을 포함하고,
일부 실시형태에서, sgRNA는 SeqCas9에 대한 5'- GUUUUUGUACUCUCAAGAUUU GAAA AAAUCUUGCAGAGCCUACAAAGAUAAGGCUUCAUGCCGAAUUCAAGCACCCCAUGUUUACAUGGGGUGCUUUU-3'(서열번호 45)와 적어도 80%의 동일성을 갖는 서열을 포함하고,
일부 실시형태에서, sgRNA는 SsiCas9에 대한 5'- GUUUUAGUACUCUGUAAUUUU GAAA AAAAUUACAGAAUCUACUAAAACAAGGCAAAAUGCCGUGUUUAUCUCGUCAACUUGUUUGGCGAGAUUUUUUUU-3'(서열번호 46)와 적어도 80%의 동일성을 갖는 서열을 포함하고,
일부 실시형태에서, sgRNA는 SinCas9에 대한 5'- GUUUUUGUACUCUCAAGAUUU GAAA AAAUCUUGCAGAAGCUACAAAGAUAAGGCUUCAUGCCGAAAUCAACACCCUGUCUAUGACGGGGUGUUUU-3'(서열번호 47)와 적어도 80%의 동일성을 갖는 서열을 포함하고,
일부 실시형태에서, sgRNA는 SsaCas9에 대한 5'- GUUUUAGAGCUGUGUUGU GAAA ACAACACAGCAAGUUAAAAUAAGGCUUUGUCCGUACACAACUUGAAAAAGUGCGCACCGAUUCGGUGCUUUUUU-3'(서열번호 48)와 적어도 80%의 동일성을 갖는 서열을 포함하고,
일부 실시형태에서, sgRNA는 Ssc2Cas9에 대한 5'- GUUUUUGUACUCUCAAGAUUU GAAA AAAUCUUGCAGAAGCUACAAAGAUAAGGCUUCAUGCCGAAAUCAACACCCUGUCAUUUUAUGGCAGGGUGUUUU-3'(서열번호 49)와 적어도 80%의 동일성을 갖는 서열을 포함하고,
일부 실시형태에서, sgRNA는 Sor2Cas9에 대한 5'- GUUUUUGUACUCUCAAGAUUU GAAA AAAUCUUGCAGAAGCUACAAAGAUAAGGCUUCAUGCCGAAUUCAACACCCUGUCAUUUAUGGCGGGGUGUUUU-3'(서열번호 50)와 적어도 80%의 동일성을 갖는 서열을 포함하고,
일부 실시형태에서, sgRNA는 SorCas9에 대한 5'- GUUUUUGUACUCUCAAGAUUU GAAA AAAUCUUGUAGAAGCUACAAAGAUAAGGCUUCAUGCCGAAUUCAACACCCUGUCAUUUAUGGCGGGGUGUUUCGUUUU-3'(서열번호 51)와 적어도 80%의 동일성을 갖는 서열을 포함하고,
일부 실시형태에서, sgRNA는 SwaCas9에 대한 5'- GUUUUAGUACUCUGUAAUUUU GAAA AAAAUUACAGAAUCUACUGAAACAAGACUAUAUGUCGUGUUUAUCCCACUAAUUUAUUAGUGGGAUUUUUU-3'(서열번호 52)와 적어도 80%의 동일성을 갖는 서열을 포함하고,
일부 실시형태에서, sgRNA는 SscCas9에 대한 5'- GUUUUAGUACUCUGUAAUUUU GAAA AAAAUUACAGAAUCUACUAAAACAAGGCAAAAUGCCGUGUUUAUCUCGUCAACUUGUUGACGAGAUUUUUUU-3'(서열번호 53)와 적어도 80%의 동일성을 갖는 서열을 포함하고,
일부 실시형태에서, sgRNA는 SgaCas9에 대한 5'- GUUUUUGUACUCUCAAGAUUU GAAA AAAUCUUGCUGAGCCUACAAAGAUAAGGCUUUAUGCCGAAUUCAAGCACCCCAUGUUUUGACAUGGGGUGCUUUU-3'(서열번호 54)와 적어도 80%의 동일성을 갖는 서열을 포함하고,
일부 실시형태에서, sgRNA는 LkuCas9에 대한 5'- GUUUUAGAUGAUUGUUAGAUC GAAA GAUCUAACAACCAGAUUUUAAAAUCAAACAAUGUAUCUUUGAUACUAAGUUUCAACGCGGUAUUAUUACCGUCCUGCCUCAGCUCUAUAGCGGAGGUUUUUU-3'(서열번호 55)와 적어도 80%의 동일성을 갖는 서열을 포함하고, 그리고
일부 실시형태에서, sgRNA는 SsuCas9에 대한 5'- GUUUUUGUACUCUCAAGAUUU GAAA AAAUCUUGCAGAGCCUACAAAGAUAAGGCUUUAUGCCGAAAUCAAGCACCCCGUUUCGUACGGGGUGCUUUU-3'(서열번호 56)와 적어도 80%의 동일성을 갖는 서열을 포함한다.
서열번호 43 내지 56의 경우: 직접 반복부 (이탤릭체 및 밑줄), 테트라루프(이탤릭체), tracrRNA(밑줄).
가이드 RNA는 Cas9의 5' 말단에 추가된다. 일부 실시형태에서, sgRNA는 서열번호 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55 또는 56과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 동일성을 갖는 서열을 포함한다. 일부 실시형태에서, sgRNA는 서열번호 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55 또는 56과 동일한 서열을 포함한다.
일부 실시형태에서, tracrRNA는 동일한 전사체의 crRNA 서열과 함께 포함되지 않은 별도의 전사체이다.
Cas9 융합 단백질
일부 실시형태에서, Cas9 효소는 하나 이상의 이종 단백질 도메인에 융합된다. 일부 실시형태에서, Cas9 효소는 약 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 이상의 단백질 도메인에 융합된다. 일부 실시형태에서, 이종 단백질 도메인은 Cas9 효소의 C-말단에 융합된다. 일부 실시형태에서, 이종 단백질 도메인은 Cas9 효소의 N-말단에 융합된다. 일부 실시형태에서, 이종 단백질 도메인은 Cas9 효소의 C-말단과 N-말단 사이에 내부적으로 융합된다. 일부 실시형태에서, 내부 융합은 Cas9 RuvCI, RuvC II, RuvCIII, HNH, REC I 또는 PAM 상호작용 도메인 내에서 이루어진다.
Cas9 단백질은 또 다른 단백질 도메인에 직접 또는 간접적으로 연결될 수 있다. 일부 실시형태에서, 적합한 CRISPR 시스템은 Cas9 단백질과 이종 단백질을 연결하는 링커 또는 스페이서를 포함한다. 아미노산 링커 또는 스페이서는 일반적으로 가요성이거나 2개의 단백질 모이어티 사이에 알파 나선과 같은 구조를 삽입하도록 설계된다. 링커 또는 스페이서는 상대적으로 짧을 수 있거나 더 길 수 있다. 전형적으로, 링커 또는 스페이서는, 예를 들어, 1개 내지 100개(예를 들어, 1개 내지 100개, 5개 내지 100개, 10개 내지 100개, 20개 내지 100 30개 내지 100개, 40개 내지 100개, 50개 내지 100개, 60개 내지 100개, 70개 내지 100개, 80개 내지 100개, 90개 내지 100개, 5개 내지 55개, 10개 내지 50개, 10개 내지 45개, 10개 내지 40개, 10개 내지 35개, 10개 내지 30개, 10개 내지 25개, 10개 내지 20개)의 아미노산 길이를 포함한다. 일부 실시형태에서, 링커 또는 스페이서는 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개 또는 100개 이상의 아미노산 길이이다. 전형적으로, 더 긴 링커는 입체 장애를 감소시킬 수 있다. 일부 실시형태에서, 링커는 글리신과 세린 잔기의 혼합물을 포함할 것이다. 일부 실시형태에서, 링커는 추가적으로 트레오닌, 프롤린 및/또는 알라닌 잔기를 포함할 수 있다.
일부 실시형태에서, Cas9 단백질은 효소적 활성, 후성유전자 변형 활성, RNA 절단 활성, 핵산 결합 활성, 전사 조절 활성을 갖는 세포 국재화 신호, 에피토프 태그, 리포터 유전자 및 단백질 도메인에 융합된다. 일부 실시형태에서, Cas9 단백질은 핵 국재화 서열(NLS), FLAG 태그, HIS 태그 및/또는 HA 태그에 융합된다.
적합한 융합 파트너는 메틸트랜스퍼레이스 활성, 데메틸레이스 활성, 아세틸트랜스퍼레이스 활성, 데아세틸레이스 활성, 카이네이스 활성, 포스파테이스 활성, 유비퀴틴 라이게이스 활성, 탈유비퀴틴화 활성, 아데닐화 활성, 탈아데닐화 활성, SUMO화 활성, 탈SUMO화 활성, 리보실화 활성, 탈리보실화 활성, 미리스토일화 활성, 탈미리스토일화 활성, 인테그레이스 활성, 유전자 전위효소 활성, 재조합효소 활성, 폴리머레이스 활성, 라이게이스 활성, 헬리케이스 활성 또는 뉴클레이스 활성을 제공하는 폴리펩타이드를 포함하지만 이에 제한되지 않으며, 이들 중 어느 것도 DNA 또는 DNA 연관 폴리펩타이드(예를 들어, 히스톤 또는 DNA 결합 단백질)를 변형시킬 수 있다. 일부 실시형태에서, Cas9 단백질은 히스톤 데메틸레이스, 전사 활성화 인자 또는 데아미네이스에 융합된다.
추가의 적합한 융합 파트너는 경계 요소(예를 들어, CTCF), 주변 동원(예를 들어, Lamin A, Lamin B 등)을 제공하는 단백질 및 이의 단편 및 단백질 도킹 요소(예를 들어, FKBP/FRB, Pill/Abyl 등)를 포함하지만 이에 제한되지 않는다.
특정 실시형태에서, Cas9는, 예를 들어, 염기 편집에 사용하기 위한 사이티딘 또는 아데노신 데아미네이스 도메인에 융합된다. 일부 실시형태에서, 용어 "사이티딘 데아미네이스" 및 "사이토신 데아미네이스"는 상호교환적으로 사용될 수 있다. 소정의 실시형태에서, 사이티딘 데아미네이스 도메인은 본 명세서에 기재된 임의의 사이티딘 데아미네이스와 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 가질 수 있다. 일부 실시형태에서, 사이티딘 데아미네이스 도메인은 사이티딘 데아미네이스 활성(예를 들어, C에서 U로의 전환)을 갖는다. 소정의 실시형태에서, 아데노신 데아미네이스 도메인은 본 명세서에 기재된 임의의 아데노신 데아미네이스와 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 가질 수 있다. 일부 실시형태에서, 아데노신 데아미네이스 도메인은 아데노신 데아미네이스 활성(예를 들어, A에서 I로의 전환)을 갖는다. 일부 실시형태에서, 용어 "아데노신 데아미네이스" 및 "아데닌 데아미네이스"는 상호교환적으로 사용될 수 있다.
일부 실시형태에서, 사이티딘 데아미네이스는 아포지방단백질 B mRNA 편집 복합체(APOBEC) 패밀리 데아미네이스의 전부 또는 일부를 포함할 수 있다. APOBEC는 진화적으로 보존된 사이티딘 데아미네이스의 패밀리이다. 이 패밀리의 구성원은 C에서 U로의 편집 효소이다. APOBEC 유사 단백질의 N-말단 도메인은 촉매 도메인인 반면, C-말단 도메인은 유사촉매 도메인이다. 보다 구체적으로, 촉매 도메인은 아연 의존적 사이티딘 데아미네이스 도메인이며, 사이티딘 탈아미노화에 중요하다. APOBEC 패밀리 구성원은 APOBEC1, APOBEC2, APOBEC3A, APOBEC3B, APOBEC3C, APOBEC3D(현재 "APOBEC3E"는 이를 지칭함), APOBEC3F, APOBEC3G, APOBEC3H, APOBEC4 및 활성화 유도성(사이티딘 또는 사이토신) 데아미네이스를 포함한다. 일부 실시형태에서, 융합 단백질에 혼입된 데아미네이스는 APOBEC1 데아미네이스의 전부 또는 일부를 포함한다. 일부 실시형태에서, 융합 단백질에 혼입된 데아미네이스는 APOBEC2 데아미네이스의 전부 또는 일부를 포함한다. 일부 실시형태에서, 융합 단백질에 혼입된 데아미네이스는 APOBEC3 데아미네이스의 전부 또는 일부를 포함한다. 일부 실시형태에서, 융합 단백질에 혼입된 데아미네이스는 APOBEC3A 데아미네이스의 전부 또는 일부를 포함한다. 일부 실시형태에서, 융합 단백질에 혼입된 데아미네이스는 APOBEC3B 데아미네이스의 전부 또는 일부를 포함한다. 일부 실시형태에서, 융합 단백질에 혼입된 데아미네이스는 APOBEC3C 데아미네이스의 전부 또는 일부를 포함한다. 일부 실시형태에서, 융합 단백질에 혼입된 데아미네이스는 APOBEC3D 데아미네이스의 전부 또는 일부를 포함한다. 일부 실시형태에서, 융합 단백질에 혼입된 데아미네이스는 APOBEC3E 데아미네이스의 전부 또는 일부를 포함한다. 일부 실시형태에서, 융합 단백질에 혼입된 데아미네이스는 APOBEC3F 데아미네이스의 전부 또는 일부를 포함한다. 일부 실시형태에서, 융합 단백질에 혼입된 데아미네이스는 APOBEC3G 데아미네이스의 전부 또는 일부를 포함한다. 일부 실시형태에서, 융합 단백질에 혼입된 데아미네이스는 APOBEC3H 데아미네이스의 전부 또는 일부를 포함한다. 일부 실시형태에서, 융합 단백질에 혼입된 데아미네이스는 APOBEC4 데아미네이스의 전부 또는 일부를 포함한다. 일부 실시형태에서, 융합 단백질에 혼입된 데아미네이스는 활성화 유도성 데아미네이스(AID)의 전부 또는 일부를 포함한다. 일부 실시형태에서, 융합 단백질에 혼입된 데아미네이스는 사이티딘 데아미네이스 1(CDA1)의 전부 또는 일부를 포함한다. 융합 단백질은 임의의 적합한 유기체(예를 들어, 인간 또는 래트)로부터의 데아미네이스를 포함할 수 있음을 이해하여야 한다. 일부 실시형태에서, 융합 단백질의 데아미네이스 도메인은 인간, 침팬지, 고릴라, 원숭이, 소, 개, 래트 또는 마우스로부터 유래된다. 일부 실시형태에서, 융합 단백질의 데아미네이스 도메인은 래트로부터 유래된다(예를 들어, 래트 APOBEC1). 일부 실시형태에서, 데아미네이스 도메인은 인간 APOBEC1이다. 일부 실시형태에서, 데아미네이스 도메인은 pmCDA1이다. 예시적인 사이티딘 데아미네이스의 서열이 아래에 제공된다.
pmCDA1(페트로미존 마리누스(Petromyzon marinus))
인간 AID:
인간 AID:
마우스 AID:
개 AID:
소 AID:
래트 AID:
clAID(카니스 루푸스 파밀리아리스(Canis lupus familiaris)):
btAID(보스 타우러스(Bos taurus)):
mAID(무스 무스쿨러스(Mus musculus)):
rAPOBEC-1(라투스 노르베기쿠스(Rattus norvegicus)):
maAPOBEC-1(메소크리세투스 아우라투스(Mesocricetus auratus)):
ppAPOBEC-1(폰고 피그마에투스(Pongo pygmaeus)):
ocAPOBEC1(오리크톨라구스 쿠니쿨루스(Oryctolagus cuniculus)):
mdAPOBEC-1(모노델피스 도메스티카(Monodelphis domestica)):
ppAPOBEC-2(폰고 피그마에투스):
btAPOBEC-2(보스 타우러스):
mAPOBEC-3-(1)(무스 무스쿨러스):
마우스 APOBEC-3-(2):
래트 APOBEC-3:
hAPOBEC-3A(호모 사피엔스):
hAPOBEC-3F(호모 사피엔스):
레서스 마카크 APOBEC-3G:
침팬지 APOBEC-3G:
녹색 원숭이 APOBEC-3G:
인간 APOBEC-3G:
인간 APOBEC-3F:
인간 APOBEC-3B:
래트 APOBEC-3B:
소 APOBEC-3B:
침팬지 APOBEC-3B:
인간 APOBEC-3C:
고릴라 APOBEC-3C
인간 APOBEC-3A:
레서스 마카크 APOBEC-3A:
소 APOBEC-3A:
인간 APOBEC-3H:
레서스 마카크 APOBEC-3H:
인간 APOBEC-3D:
인간 APOBEC-1:
마우스 APOBEC-1:
래트 APOBEC-1:
인간 APOBEC-2:
마우스 APOBEC-2:
래트 APOBEC-2:
소 APOBEC-2:
페트로미존 마리누스 CDA1(pmCDAl):
인간 APOBEC3G D316R D317R:
인간 APOBEC3G 사슬 A:
인간 APOBEC3G 사슬 A D120R D121R:
hAPOBEC-4(호모 사피엔스):
mAPOBEC-4(무스 무스쿨러스):
rAPOBEC-4(라투스 노르베기쿠스):
mfAPOBEC-4(마카카 파스시쿨라리스(Macaca fascicularis)):
pmCDA-1(페트로미존 마리누스):
pmCDA-2(페트로미존 마리누스):
pmCDA-5(페트로미존 마리누스):
yCD(사카로마이세스 세레비시아에(Saccharomyces cerevisiae)):
rAPOBEC-1(델타 177-186):
rAPOBEC-1(델타 202-213):
마우스 APOBEC-3:
일부 실시형태에서, 아데노신 데아미네이스는 아데노신 데아미네이스 ADAR의 전부 또는 일부(예를 들어, ADAR1 또는 ADAR2)를 포함할 수 있다. 또 다른 실시형태에서, 아데노신 데아미네이스는 아데노신 데아미네이스 ADAT의 전부 또는 일부를 포함할 수 있다. 일부 실시형태에서, 아데노신 데아미네이스는 다음 돌연변이: D108N, A106V, D147Y, E155V, L84F, H123Y, I157F 중 하나 이상 또는 또 다른 아데노신 데아미네이스의 상응하는 돌연변이를 포함하는 대장균(Escherichia coli)으로부터의 ADAT(EcTadA)의 전부 또는 일부를 포함할 수 있다. 아데노신 데아미네이스는 임의의 적합한 유기체(예를 들어, 대장균)로부터 유래될 수 있다. 일부 실시형태에서, 아데노신 데아미네이스는 대장균, 스타필로코커스 아우레우스(Staphylococcus aureus), 살모넬라 타이피(Salmonella typhi), 쉬와넬라 푸트레파시엔스(Shewanella putrefaciens), 헤모필루스 인플루엔자에(Haemophilus influenzae), 카울로박터 크레센투스(Caulobacter crescentus) 또는 바실러스 서브틸리스(Bacillus subtilis)로부터 유래된다. 일부 실시형태에서, 아데노신 데아미네이스는 대장균으로부터 유래된다. 일부 실시형태에서, 아데닌 데아미네이스는 본 명세서에 제공된 임의의 돌연변이(예를 들어, ecTadA의 돌연변이)에 상응하는 하나 이상의 돌연변이를 포함하는 자연 발생적 아데노신 데아미네이스이다. 임의의 상동성 단백질의 상응하는 잔기는, 예를 들어, 서열 정렬 및 상동성 잔기의 결정에 의해 확인될 수 있다. 이에 따라, 본 명세서에 기재된 임의의 돌연변이(예를 들어, ecTadA에서 확인된 임의의 돌연변이)에 상응하는 임의의 자연 발생적 아데노신 데아미네이스(예를 들어, ecTadA에 대한 상동성을 가짐)의 돌연변이가 생성될 수 있다. 특정 실시형태에서, TadA는 전체가 참조에 의해 본 명세서에 원용되어 있는 PCT/US2017/045381(WO 2018/027078)에 기술되어 있는 TadA 중 어느 하나이다. 표 3에 나타낸 바와 같은 단일 가닥 DNA에 대해 바람직한 아데노신 데아미네이스 활성을 갖는 돌연변이는 진화 및 선택의 라운드를 통해 확인되었다(예를 들어, TadA*7.10 = 7번째 진화 라운드로부터의 변이체 10).
일부 실시형태에서, TadA는 단량체 또는 이량체(예를 들어, 야생형 대장균 TadA의 이종이량체 및 조작된 TadA 변이체)로 제공된다. 일부 실시형태에서, 아데노신 데아미네이스는 아래 표 4에 나타낸 바와 같은 8세대 TadA*8 변이체이다.
일부 실시형태에서, 아데노신 데아미네이스는 아래 참조 서열에 나타낸 바와 같은 TadA 변이체의 21번, 23번, 25번, 38번, 51번, 54번, 70번, 71번, 72번, 72번, 94번, 124번, 133번, 138번, 139번, 146번 및 158번으로부터 선택되는 아미노산 위치에 변경을 포함하는 9세대 TadA*9 변이체이다:
일 실시형태에서, 아데노신 데아미네이스 변이체는 위의 TadA 참조 서열의 21번, 23번, 25번, 38번, 51번, 54번, 70번, 71번, 72번, 94번, 124번, 133번, 138번, 139번, 146번 및 158번으로부터 선택되는 2개 이상의 아미노산 위치에 변경을 포함한다. 또 다른 실시형태에서, 아데노신 데아미네이스 변이체는 서열번호 1의 R21N, R23H, E25F, N38G, L51W, P54C, M70V, Q71M, N72K, Y73S, M94V, P124W, T133K, D139L, D139M, C146R 및 A158K로부터 선택되는 1개 이상(예를 들어, 2개, 3개, 4개)의 변경을 포함한다. 다른 실시형태에서, 아데노신 데아미네이스 변이체는 다음 변경: Y147T, Y147R, Q154S, Y123H 및 Q154R 중 하나 이상을 추가로 포함한다. 또 다른 실시형태에서, 아데노신 데아미네이스 변이체는 위의 TadA 참조 서열에 비해서 다음으로부터 선택되는 변경의 조합을 포함한다: E25F + V82S + Y123H, T133K + Y147R + Q154R; E25F + V82S + Y123H + Y147R + Q154R; L51W + V82S + Y123H + C146R + Y147R + Q154R; Y73S + V82S + Y123H + Y147R + Q154R; P54C + V82S + Y123H + Y147R + Q154R; N38G + V82T + Y123H + Y147R + Q154R; N72K + V82S + Y123H + D139L + Y147R + Q154R; E25F + V82S + Y123H + D139M + Y147R + Q154R; Q71M + V82S + Y123H + Y147R + Q154R; E25F + V82S + Y123H + T133K + Y147R + Q154R; E25F + V82S + Y123H + Y147R + Q154R; V82S + Y123H + P124W + Y147R + Q154R; L51W + V82S + Y123H + C146R + Y147R + Q154R; P54C + V82S + Y123H + Y147R + Q154R; Y73S + V82S + Y123H + Y147R + Q154R; N38G + V82T + Y123H + Y147R + Q154R; R23H + V82S + Y123H + Y147R + Q154R; R21N + V82S + Y123H + Y147R + Q154R; V82S + Y123H + Y147R + Q154R + A158K; N72K + V82S + Y123H + D139L + Y147R + Q154R; E25F + V82S + Y123H + D139M + Y147R + Q154R; M70V + V82S + M94V + Y123H + Y147R + Q154R; Q71M + V82S + Y123H + Y147R + Q154R; E25F + I76Y+ V82S + Y123H + Y147R + Q154R; I76Y + V82T + Y123H + Y147R + Q154R; N38G + I76Y + V82S + Y123H + Y147R + Q154R; R23H + I76Y + V82S + Y123H + Y147R + Q154R; P54C + I76Y + V82S + Y123H + Y147R + Q154R; R21N + I76Y + V82S + Y123H + Y147R + Q154R; I76Y + V82S + Y123H + D138M + Y147R + Q154R; Y72S + I76Y + V82S + Y123H + Y147R + Q154R; E25F + I76Y + V82S + Y123H + Y147R + Q154R; I76Y + V82T + Y123H + Y147R + Q154R; N38G + I76Y + V82S + Y123H + Y147R + Q154R; R23H + I76Y + V82S + Y123H + Y147R + Q154R; P54C + I76Y + V82S + Y123H + Y147R + Q154R; R21N + I76Y + V82S + Y123H + Y147R + Q154R; I76Y + V82S + Y123H + D138M + Y147R + Q154R; Y72S + I76Y + V82S + Y123H + Y147R + Q154R; 및 V82S + Q154R; N72K_V82S + Y123H + Y147R + Q154R; Q71M_V82S + Y123H + Y147R + Q154R; V82S + Y123H + T133K + Y147R + Q154R; V82S + Y123H + T133K + Y147R + Q154R + A158K; M70V + Q71M + N72K + V82S + Y123H + Y147R + Q154R; N72K_V82S + Y123H + Y147R + Q154R; Q71M_V82S + Y123H + Y147R + Q154R; M70V + V82S + M94V + Y123H + Y147R + Q154R; V82S + Y123H + T133K + Y147R + Q154R; V82S + Y123H + T133K + Y147R + Q154R + A158K; 및 M70V + Q71M + N72K + V82S + Y123H + Y147R + Q154R. 일부 실시형태에서, 데아미네이스 또는 다른 폴리펩타이드 서열은, 예를 들어, 융합 단백질의 구성요소로 포함될 때 메티오닌이 결여되어 있다. 이로 인해 위치의 넘버링이 변경될 수 있다. 그러나, 당업자라면 이러한 상응하는 돌연변이가 동일한 돌연변이, 예를 들어, Y73S와 Y72S 및 D139M과 D138M를 지칭한다는 것을 이해할 것이다.
일부 실시형태에서, Cas9는 SV40 대형 T 항원의 NLS, 뉴클레오플라스민, c-myc, hRNPA1 M9, 임포틴-알파로부터의 IBB 도메인, 근종 T 단백질의 NLS, 인간 p53, c-abl IV, 인플루엔자 바이러스 NS1, 간염 바이러스 델타 항원, 마우스 M×1, 인간 폴리(ADP-리보스) 폴리머레이스, 스테로이드 호르몬 수용체(인간) 글루코코르티코이드를 포함하는 핵 국재화 서열에 융합된다.
일부 실시형태에서, Cas9 단백질은 헤마글루티닌(HA) 태그, 히스티딘(His) 태그, FLAG 태그, Myc 태그, V5 태그, VSV-G 태그, SNAP 태그, 티오레독신(Trx) 태그를 포함하지만 이에 제한되지 않는 에피토프 태그에 융합된다.
일부 실시형태에서, Cas9는 리포터 유전자의 향상된 버전 또는 슈퍼폴딩 GFP뿐만 아니라 다른 변형된 버전을 포함하여 글루타티온-S-트랜스퍼레이스(GST), 서양고추냉이 과산화효소(HRP), 클로람페니콜 트랜스퍼레이스(CAT), HcRed, DsRed, 청록색 형광 단백질, 황색 형광 단백질 및 청색 형광 단백질, 녹색 형광 단백질(GFP)을 포함하지만 이에 제한되지 않는 리포터 유전자에 융합된다.
일부 실시형태에서, 조작된 Cas9 단백질의 혈청 반감기는 인간 혈청 알부민 단백질, 트랜스페린 단백질, 인간 IgG 및/또는 카복시 말단 펩타이드(CTP, 융모 성선자극 호르몬 β 사슬의 것)와 같은 시알릴화된 펩타이드와 같은 이종 단백질과의 융합에 의해 증가된다.
일부 실시형태에서, 조작된 Cas9 단백질의 혈청 반감기는 제미닌, 유비퀴틴, FKBP12-L106P 및/또는 다이하이드로폴레이트 리덕테이스를 포함하지만 이에 제한되지 않는 불안정화 도메인과의 융합에 의해 감소된다.
증가되거나 감소된 안정성을 제공하는 적합한 융합 파트너는 데그론 서열을 포함하지만 이에 제한되지 않는다. 당업자는 데그론이 이들이 일부인 단백질의 안정성을 제어하는 아미노산 서열이라는 것을 쉽게 이해할 수 있다. 예를 들어, 데그론 서열을 포함하는 단백질의 안정성은 데그론 서열의 적어도 부분적으로 제어된다. 일부 경우에, 적합한 데그론은 실험적 통제와 관계없이(즉, 데그론은 약물 유도성, 온도 유도성 등이 아님) 단백질 안정성에 영향을 미치도록 구성적이다. 일부 경우에, 데그론은 변이체 Cas9 폴리펩타이드가 목적하는 조건에 따라 "켜짐(on)"(즉, 안정적) 또는 "꺼짐(off)(즉, 불안정적, 분해됨)으로 바뀔 수 있도록 제어 가능한 안정성을 갖는 변이체 Cas9 폴리펩타이드를 제공한다. 예를 들어, 데그론이 온도 민감성 데그론인 경우, 변이체 Cas9 폴리펩타이드는 임계 온도 미만(예를 들어, 42℃, 41℃, 40℃, 39℃, 38℃, 37℃, 36℃, 35℃, 34℃, 33℃, 32℃, 31℃, 30℃ 등)에서는 기능적(즉, "켜짐", 안정적)이지만, 임계 온도 이상에서는 비기능적(즉, "꺼짐", 분해됨)일 수 있다. 또 다른 예로서, 데그론이 약물 유도성 데그론인 경우, 약물의 존재 또는 부재는 단백질을 "꺼짐"(즉, 불안정적) 상태에서 "켜짐"(즉, 안정적) 상태로 또는 그 반대로의 전환할 수 있다. 예시적인 약물 유도성 데그론은 FKBP12 단백질로부터 유래된다. 데그론의 안정성은 데그론에 결합하는 소분자의 존재 또는 부재에 의해 제어된다.
적합한 데그론의 예는 Shield-1, DHFR, 옥신(auxin) 및/또는 온도에 의해 제어되는 데그론을 포함하지만 이에 제한되지 않는다. 적합한 데그론의 비제한적인 예는 당업계에 공지되어 있다(예를 들어, 문헌[Dohmen et al., Science, 1994. 263(5151): p. 1273-1276: Heat-inducible degron: a method for constructing temperature-sensitive mutants; Schoeber et al., Am J Physiol Renal Physiol. 2009 Jan;296(l):F204-11: Conditional fast expression and function of multimeric TRPV5 channels using Shield-1; Chu et al., Bioorg Med Chem Lett. 2008 Nov 15;18(22):5941-4: Recent progress with FKBP-derived destabilizing domains; Kanemaki, Pflugers Arch. 2012 Dec 28: Frontiers of protein expression control with conditional degrons; Yang et al., Mol Cell. 2012 Nov 30;48(4):487-8: Titivated for destruction: the methyl degron; Barbour et al., Biosci Rep. 2013 Jan 18;33(1).: Characterization of the bipartite degron that regulates ubiquitin-independent degradation of thymidylate synthase; 및 Greussing et al., J Vis Exp. 2012 Nov 10;(69): Monitoring of ubiquitin-proteasome activity in living cells using a Degron (dgn)-destabilized green fluorescent protein (GFP)-based reporter protein]; 이들 모두는 전체가 참조에 의해 본 명세서에 원용되어 있음).
예시적인 데그론 서열은 세포 및 동물 모두에서 잘 특성 규명되고 테스트되었다. 따라서, 활성이 없는 Cas9를 데그론 서열에 융합시키면 "조정 가능한" 그리고 "유도성" 활성이 없는 Cas9 폴리펩타이드가 생성된다.
본 명세서에 기재된 임의의 융합 파트너는 임의의 바람직한 조합으로 사용될 수 있다. 이 점을 설명하기 위한 하나의 비제한적인 예로서, Cas9 융합 단백질은 검출을 위한 YFP 서열, 안정성을 위한 데그론 서열 및 표적 DNA의 전사를 증가시키기 위한 전사 활성화 인자 서열을 포함할 수 있다. 또한, dCas9 융합 단백질에 사용될 수 있는 융합 파트너의 수는 무제한이다. 일부 경우에, Cas9 융합 단백질은 1개 이상(예를 들어, 2개 이상, 3개 이상, 4개 이상 또는 5개 이상)의 이종 서열을 포함한다.
표적 핵산
표적 핵산은 단일-, 이중- 또는 다중 가닥 DNA 또는 RNA인 DNA 분자, RNA 분자, 게놈 DNA, cDNA, DNA-RNA 하이브리드 또는 퓨린 및 피리미딘 염기를 포함하는 중합체 또는 데옥시리보뉴클레오타이드, 리보뉴클레오타이드 또는 이들의 유사체인 기타 천연, 화학적 또는 생화학적으로 변형된, 비천연 또는 유도체화된 뉴클레오타이드 염기이다. 표적 핵산은 3차원 구조를 가질 수 있고, 코딩 또는 논코딩 영역을 포함할 수 있고, 엑손, 인트론, mRNA, tRNA, rRNA, siRNA, shRNA, miRNA, 리보자임, cDNA, 플라스미드, 벡터, 외인성 서열, 내인성 서열을 포함할 수 있다. 표적 핵산은 변형된 뉴클레오타이드를 포함할 수 있고, 메틸화된 뉴클레오타이드 또는 뉴클레오타이드 유사체를 포함할 수 있다. 일부 실시형태에서, 표적 핵산은 비핵산 성분과 함께 산재될 수 있다.
표적 핵산은 CRISPR-Cas9 시스템에 의해 인식되며 Cas9에 결합한다. 일부 실시형태에서, 이는 Cas9의 결합으로 인해 변형 또는 절단되거나 발현이 변경되었다. 표적 핵산은 인식 가능한 특정 PAM 모티프, 예를 들어, 5'-NGG-3', 5'-NAGHC-3', 5'-NRHRRH-3' 또는 5'-NNAAA-3'(H = A, C 또는 T; R = A 또는 G)를 포함한다.
재조합 유전자 기술
본 개시내용에 따르면, 당업계의 기술 내에서 통상적인 분자 생물학, 미생물학 및 재조합 DNA 기법이 사용될 수 있다. 이러한 기법은 문헌에 기술되어 있다(예를 들어, 문헌[Sambrook, Fritsch & Maniatis, Molecular Cloning: A Laboratory Manual, Second Edition (1989) Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.; DNA Cloning: A Practical Approach, Volumes I and II (D. N. Glover ed. 1985); Oligonucleotide Synthesis (M. J. Gait ed. 1984); Nucleic Acid Hybridization (B. D. Hames & S. J. Higgins eds. (1985)); Transcription And Translation (B. D. Hames & S. J. Higgins, eds. (1984)); Animal Cell Culture (R. I. Freshney, ed. (1986)); Immobilized Cells and Enzymes (IRL Press, (1986)); B. Perbal, A Practical Guide To Molecular Cloning (1984); F. M. Ausubel et al. (eds.), Current Protocols in Molecular Biology, John Wiley & Sons, Inc. (1994)] 참조).
본 명세서에 기재된 조작된 Cas9 효소와 같은 폴리펩타이드를 암호화하는 핵산과 같은 유전자의 재조합 발현은 폴리펩타이드를 암호화하는 핵산을 포함하는 발현 벡터의 구축을 포함할 수 있다. 일단 폴리뉴클레오타이드가 얻어지면, 폴리펩타이드의 생산을 위한 벡터가 당업계에 공지된 기법을 사용하는 재조합 DNA 기술에 의해 생산될 수 있다. 폴리펩타이드 코딩 서열 및 적절한 전사 및 번역 제어 신호를 포함하는 발현 벡터를 구축하기 위해 공지된 방법이 사용될 수 있다. 이들 방법은, 예를 들어, 시험관내 재조합 DNA 기법, 합성 기법 및 생체내 유전자 재조합을 포함한다.
발현 벡터는 통상적인 기법에 의해 숙주 세포로 전달될 수 있고, 형질감염된 세포는 이어서 폴리펩타이드를 생산하기 위해 통상적인 기법에 의해 배양될 수 있다.
일부 실시형태에서, DNA 표적화 RNA 및/또는 Cas9 단백질을 암호화하는 뉴클레오타이드 서열은 제어 요소, 예를 들어, 프로모터와 같은 전사 제어 요소에 작동 가능하게 연결된다. 전사 제어 요소는 진핵동물 세포, 예를 들어, 포유동물 세포; 또는 원핵생물 세포(예를 들어, 세균 또는 고세균 세포)에서 기능적일 수 있다. 일부 실시형태에서, 진핵동물 세포는 인간 세포이다. 일부 실시형태에서, DNA 표적화 RNA 및/또는 신규한 Cas9 단백질을 암호화하는 뉴클레오타이드 서열은 원핵생물 및 진핵동물 세포 모두에서 암호화된 뉴클레오타이드 서열의 발현을 가능하게 하는 다중 제어 요소에 작동 가능하게 연결된다.
프로모터는 구성적으로 활성인 프로모터(즉, 구성적으로 활성/"켜짐" 상태인 프로모터)일 수 있고, 유도성 프로모터일 수 있고(즉, 활성/"켜짐" 또는 불활성/"꺼짐" 상태인 프로모터는 외부 자극, 예를 들어, 특정 온도, 화합물 또는 단백질의 존재에 의해 제어됨), 공간적으로 제한된 프로모터(즉, 전사 제어 요소, 인핸서 등)(예를 들어, 조직 특이적 프로모터, 세포 유형 특이적 프로모터 등)일 수 있고, 일시적으로 제한된 프로모터일 수 있다(즉, 프로모터는 배아 발달의 특정 단계 동안 또는 생물학적 과정, 예를 들어, 마우스에서의 모낭 주기 동안 "켜짐" 상태 또는 "꺼짐" 상태에 있다).
적합한 프로모터는 바이러스로부터 유래될 수 있으므로 바이러스 프로모터로 지칭될 수 있거나, 원핵생물 또는 진핵동물 유기체를 포함하는 임의의 유기체로부터 유래될 수 있다. 적합한 프로모터는 임의의 RNA 폴리머레이스(예를 들어, pol I, pol II, pol III)에 의한 발현을 유도하는 데 사용될 수 있다. 예시적인 프로모터는 SV40 초기 프로모터, 마우스 유방 종양 바이러스 긴 말단 반복부(LTR) 프로모터; 아데노바이러스 주요 후기 프로모터(Ad MLP); 단순 포진 바이러스(HSV) 프로모터, 사이토메갈로바이러스(CMV) 프로모터, 예컨대, CMV 급초기 프로모터 영역(CMVIE), 라우스 육종 바이러스(RSV) 프로모터, 인간 U6 소핵 프로모터(U6)(Miyagishi et al., Nature Biotechnology 20, 497 - 500 (2002)), 향상된 U6 프로모터(예를 들어, 문헌[Xia et al., Nucleic Acids Res. 2003 Sep 1;31(17)]) 및/또는 인간 HI 프로모터(HI)를 포함하지만 이에 제한되지 않는다.
유도성 프로모터의 예는 T7 RNA 폴리머레이스 프로모터, T3 RNA 폴리머레이스 프로모터, 아이소프로필-베타-D-티오갈락토피라노사이드(IPTG) 조절 프로모터, 락토스 유도성 프로모터, 열충격 프로모터, 테트라사이클린 조절 프로모터(예를 들어, Tet-ON, Tet-OFF 등), 스테로이드 조절 프로모터, 금속 조절 프로모터, 에스트로겐 수용체 조절 프로모터 등을 포함하지만 이에 제한되지 않는다. 따라서, 유도성 프로모터는 독시사이클린, RNA 폴리머레이스, 예를 들어, T7 RNA 폴리머레이스, 에스트로겐 수용체 및/또는 에스트로겐 수용체 융합체를 포함하지만 이에 제한되지 않는 분자에 의해 조절될 수 있다.
일부 실시형태에서, 프로모터는 공간적으로 제한된 프로모터(즉, 세포 유형 특이적 프로모터, 조직 특이적 프로모터 등)이므로, 다세포 유기체에서 프로모터는 특정 세포의 서브세트에서 활성(즉, "켜짐")이다. 공간적으로 제한된 프로모터는 인핸서, 전사 제어 요소, 제어 서열 등으로 지칭될 수 있다. 임의의 편리한 공간적으로 제한된 프로모터가 사용될 수 있으며, 적합한 프로모터(예를 들어, 뇌 특이적 프로모터, 뉴런의 서브세트에서 발현을 유도하는 프로모터, 생식세포계열에서 발현을 유도하는 프로모터, 폐에서 발현을 유도하는 프로모터, 근육에서 발현을 유도하는 프로모터, 췌장의 섬 세포에서 발현을 유도하는 프로모터 등)의 선택은 유기체에 따라 달라질 것이다. 따라서, 공간적으로 제한된 프로모터는 유기체에 따라 매우 다양한 조직 및 세포 유형에서 대상 부위 지정 폴리펩타이드를 암호화하는 핵산의 발현을 조절하는 데 사용될 수 있다. 일부 공간적으로 제한된 프로모터는 또한 프로모터가 배아 발생의 특정 단계 동안 또는 생물학적 과정의 특정 단계(예를 들어, 모낭 주기) 동안 "켜짐" 상태 또는 "꺼짐" 상태에 있도록 일시적으로 제한된다.
설명의 목적으로, 공간적으로 제한된 프로모터의 예는 뉴런 특이적 프로모터, 지방세포 특이적 프로모터, 심근세포 특이적 프로모터, 평활근 특이적 프로모터, 광수용체 특이적 프로모터 등을 포함하지만 이에 제한되지 않는다. 뉴런 특이적인 공간적으로 제한된 프로모터는 뉴런 특이적 에놀레이스(NSE) 프로모터, 방향족 아미노산 데카복실레이스(AADC) 프로모터, 뉴로필라멘트 프로모터, 시냅신 프로모터, thy-1 프로모터, 세로토닌 수용체 프로모터, 타이로신 하이드록실레이스 프로모터(TH), GnRH 프로모터, L7 프로모터, DNMT 프로모터, 엔케팔린 프로모터, 마이엘린 염기성 단백질(MBP) 프로모터, Ca2+-칼모듈린 의존적 단백질 카이네이스 II-알파(CamKIIa) 프로모터 및/또는 CMV 인핸서/혈소판 유래 성장 인자-β 프로모터를 포함하지만 이에 제한되지 않는다.
지방세포 특이적인 공간적으로 제한된 프로모터는 aP2 유전자 프로모터/인핸서, 예를 들어, 인간 aP2 유전자의 -5.4kb에서 +21bp까지의 영역, 글루코스 트랜스포터-4(GLUT4) 프로모터, 지방산 전위효소(FAT/CD36) 프로모터, 스테아로일-CoA 불포화효소-1(SCD1) 프로모터, 렙틴 프로모터 및 아디포넥틴 프로모터, 아딥신 프로모터 및/또는 레시스틴 프로모터를 포함하지만 이에 제한되지 않는다.
심근세포 특이적인 공간적으로 제한된 프로모터는 다음 유전자: 미오신 경쇄-2, a-미오신 중쇄, AE3, 심장 트로포닌 C 및/또는 심장 액틴으로부터 유래되는 제어 서열을 포함하지만 이에 제한되지 않는다.
평활근 특이적인 공간적으로 제한된 프로모터는 SM22a 프로모터, 스무텔린 프로모터 및/또는 a-평활근 액틴 프로모터를 포함하지만 이에 제한되지 않는다.
광수용체 특이적인 공간적으로 제한된 프로모터는 로돕신 프로모터, 로돕신 카이네이스 프로모터, 베타 포스포다이에스터레이스 유전자 프로모터, 색소성 망막염 유전자 프로모터, 광수용체간 레티노이드 결합 단백질(IRBP) 유전자 인핸서 및/또는 IRBP 유전자 프로모터를 포함하지만 이에 제한되지 않는다.
CRISPR-Cas9의 유전자 편집 사용
본 명세서에 기재된 CRISPR-Cas9 시스템은 유전자 침묵 이벤트 또는 목적하는 표적 유전자의 발현에서 발현의 변경(예를 들어, 증가 또는 감소)을 초래할 수 있는 유전자 편집에 사용될 수 있다. 따라서, 일부 실시형태에서, 본 명세서에 기재된 CRISPR-Cas9 시스템은 표적 핵산의 발현을 변경시키는 방법에 사용된다. 일부 실시형태에서, 본 명세서에 기재된 CRISPR-Cas9 시스템은 목적하는 표적 세포에서 표적 핵산을 변형시키는 방법에 사용된다. 일부 실시형태에서, 본 발명은 유전자 발현에서 목적하는 변형을 달성하기 위해 진핵동물 세포에서 표적 핵산의 부위 특이적 변형을 위한 방법을 제공한다.
일부 실시형태에서, 본 발명은 RNA 가이드 또는 RNA 가이드를 암호화하는 핵산(여기서, RNA 가이드는 직접 반복 서열 및 표적 핵산에 혼성화될 수 있는 스페이서 서열을 포함함); 및 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 14와 적어도 80%의 서열 동일성을 갖는 코돈 최적화된 CRISPR 관련(Cas) 단백질을 포함하는 조작된 비자연 발생적 CRISPR-Cas 시스템을 제공하되, Cas 단백질은 RNA 가이드에 결합할 수 있으며 RNA 가이드와 상보적인 표적 핵산 서열에 절단을 일으킬 수 있다.
일부 실시형태에서, 본 발명은 RNA 가이드 또는 RNA 가이드를 암호화하는 핵산(여기서, RNA 가이드는 직접 반복 서열 및 표적 핵산에 혼성화될 수 있는 스페이서 서열을 포함함); 및 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 14와 적어도 80%의 서열 동일성을 갖는 코돈 최적화된 CRISPR 관련(Cas) 단백질을 포함하는 조작된 비자연 발생적 CRISPR-Cas 시스템을 제공하되; Cas 단백질은 데아미네이스에 융합되고, Cas 단백질 융합체는 RNA 가이드에 결합할 수 있으며 RNA 가이드와 상보적인 표적 핵산 서열을 편집할 수 있다.
일부 실시형태에서, 본 발명은 세포를 본 명세서에 기재된 Cas9 및 RNA 가이드 또는 RNA 가이드를 암호화하는 핵산과 접촉시키는 단계를 포함하는 진핵동물 세포에서 표적 핵산의 발현을 변경시키는 방법을 제공하되, RNA 가이드는 직접 반복 서열 및 표적 핵산에 혼성화될 수 있는 스페이서 서열을 포함하고, Cas9 단백질은 RNA 가이드에 결합할 수 있으며 RNA 가이드와 상보적인 표적 핵산 서열에 절단을 일으킬 수 있다.
일부 실시형태에서, 본 발명은 세포를 본 명세서에 기재된 Cas9 및 RNA 가이드 또는 RNA 가이드를 암호화하는 핵산과 접촉시키는 단계를 포함하는 진핵동물 세포에서 표적 핵산의 발현을 변경시키는 방법을 제공하되, RNA 가이드는 직접 반복 서열 및 표적 핵산에 혼성화될 수 있는 스페이서 서열을 포함하고, Cas9 단백질은 RNA 가이드에 결합할 수 있으며 RNA 가이드와 상보적인 표적 핵산 서열을 편집할 수 있다.
일부 실시형태에서, 본 발명은 세포를 본 명세서에 기재된 Cas9 및 RNA 가이드 또는 RNA 가이드를 암호화하는 핵산과 접촉시키는 단계를 포함하는 진핵동물 세포에서 표적 핵산을 변형시키는 방법을 제공하되, RNA 가이드는 직접 반복 서열 및 표적 핵산에 혼성화될 수 있는 스페이서 서열을 포함하고, Cas9 단백질은 RNA 가이드에 결합할 수 있으며 RNA 가이드와 상보적인 표적 핵산 서열을 편집할 수 있다.
따라서, 일부 실시형태에서, Cas 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 14와 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%의 동일성을 갖는다. 일부 실시형태에서, Cas 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 14와 동일하다.
CRISPR-Cas9 시스템 및 방법에 사용하기에 적합한 가이드 RNA, Cas9 돌연변이 및 융합 단백질은 본 개시내용의 전반에 걸쳐 설명된 바와 같다.
일 양태에서, 방법은 CRISPR-Cas9를 표적 핵산에 결합시키는 단계 및 표적 핵산을 절단하는 단계를 포함한다. 일부 실시형태에서, CRISPR-Cas9 시스템은 이중 가닥 절단을 도입하여 표적 DNA 또는 RNA 이중체를 절단한다. 일부 실시형태에서, CRISPR-Cas9 시스템은 단일 가닥 절단 또는 닉(nick)을 도입하여 표적 DNA 또는 RNA를 절단한다.
일부 실시형태에서, CRISPR-Cas9 방법 또는 시스템은 부위 특이적 방식으로 표적 DNA를 변형시키는 효과기와의 융합 단백질을 포함하며, 여기서 변형 활성은 메틸트랜스퍼레이스 활성, 데메틸레이스 활성, 아세틸트랜스퍼레이스 활성, 데아세틸레이스 활성, 카이네이스 활성, 포스파테이스 활성, 유비퀴틴 라이게이스 활성, 탈유비퀴틴화 활성, 아데닐화 활성, 탈아데닐화 활성, SUMO화 활성, 탈SUMO화 활성, 리보실화 활성, 탈리보실화 활성, 미리스토일화 활성, 탈미리스토일화 활성, 인테그레이스 활성, 유전자 전위효소 활성, 재조합효소 활성, 폴리머레이스 활성, 라이게이스 활성, 헬리케이스 활성 또는 뉴클레이스 활성을 포함하고, 이들 중 어느 것도 DNA 또는 DNA 연관 폴리펩타이드(예를 들어, 히스톤 또는 DNA 결합 단백질)를 변형시킬 수 있다.
일부 실시형태에서, CRISPR-Cas9 방법 또는 시스템은 아데노신 또는 사이토신 염기를 변형시키고 부위 특이적 염기 편집기로 기능할 수 있는 데아미네이스 효소를 포함하여 뉴클레오타이드 염기를 화학적으로 변형시킴으로써 DNA 서열을 편집할 수 있는 효소와의 융합 단백질을 포함한다. 예를 들어, 일반적으로 RNA를 기질로 사용하는 APOBEC1 사이티딘 데아미네이스는 Cas9에 융합될 때 단일 가닥 및 이중 가닥 DNA로 표적화되어 사이티딘을 우리딘으로 직접 전환할 수 있고, ADAR 효소는 아데노신을 이노신으로 탈아미노화시킬 수 있다. 따라서, 데아미네이스를 사용한 '염기 편집'은 하나의 표적 DNA 염기의 또 다른 염기로의 프로그래밍 가능한 전환을 가능하게 한다. 다양한 염기 편집기가 당업계에 공지되어 있으며, 본 명세서에 기재된 방법 및 시스템에 사용될 수 있다. 예시적인 염기 편집기는, 예를 들어, 내용이 본 명세서에 원용되어 있는 문헌[Rees and Liu Nature Review Genetics, 2018, 19(12): 770-788]에 기술되어 있다. 따라서, 일부 실시형태에서, 본 명세서에 기재된 Cas9 효소(Seq2Cas9, EhiCas9, SeqCas9, SsiCas9, SinCas9, SsaCas9, Ssc2Cas9, Sor2Cas9, SorCas9, SwaCas9, SscCas9, SgaCas9, LkuCas9 및 SsuCas9)는 핵염기 편집기의 구성요소이다. 일부 실시형태에서, 염기 편집기는 아데닌 데아미네이스 TadA8 또는 TadA9이다.
일부 실시형태에서, 염기 편집으로 인해 유전자를 침묵시키기 위한 종결 코돈이 도입된다. 일부 실시형태에서, 염기 편집으로 인해 아미노산 서열을 변경시킴으로써 단백질 기능이 변경된다.
일부 실시형태에서, CRISPR-Cas9 방법 또는 시스템은 히스톤과의 융합에 의한 표적 DNA의 후성유전자 변형을 포함한다. 일부 실시형태에서, CRISPR-Cas9 시스템은 판독(reader), 수식효소(writer) 또는 탈수식 효소(eraser) 단백질과 같은 후성유전자 변형 효소와의 융합에 의한 표적 DNA의 후성유전자 변형을 포함한다. 일부 실시형태에서, CRISPR-Cas9 시스템은 표적 DNA의 선택된 영역에서 히스톤 변형 패턴을 변경하기 위해 히스톤 변형 효소와의 융합을 포함한다. 히스톤 변형은 메틸화, 아세틸화, 유비퀴틴화, 인산화를 포함하여 다양한 방식으로 발생할 수 있으며, 다양한 조합으로 발생하여 DNA의 구조적 변화를 일으킬 수 있다. 일부 실시형태에서, 히스톤 변형은 전사 억제 또는 활성화로 이어진다.
일부 실시형태에서, CRISPR-Cas9 방법 또는 시스템은 전사 활성화 인자 단백질 또는 전사 억제인자 단백질, 소분자/약물 반응성 전사 조절인자, 유도성 전사 조절인자와의 융합을 통해 전사를 증가 또는 감소시킴으로써 표적 DNA의 전사를 조절한다. 일부 실시형태에서, CRISPR-Cas9 시스템은 결합으로 인해 유전자 발현이 증가되거나 감소되는 표적 코딩 mRNA(즉, 단백질 암호화 유전자)의 발현을 제어하는 데 사용된다.
일부 실시형태에서, CRISPR-Cas9 방법 또는 시스템은 프로모터 또는 인핸서와 같은 유전적 조절 요소를 편집함으로써 유전자 조절을 제어하는 데 사용된다.
일부 실시형태에서, CRISPR-Cas9 방법 또는 시스템은 tRNA, rRNA, snoRNA, siRNA, miRNA 및 긴 ncRNA를 비롯한 표적 논코딩 RNA의 발현을 제어하는 데 사용된다.
일부 실시형태에서, CRISPR-Cas9 방법 또는 시스템은 염색질 루프 구조의 표적화 엔지니어링에 사용된다. 조절 게놈 영역 사이의 염색질 루프의 표적화 엔지니어링은 내인성 염색질 구조를 조작하고 새로운 인핸서-프로모터 연결의 형성을 가능하게 하여 유전적 결함을 극복하거나 또는 비정상적인 인핸서-프로모터 연결을 저해하는 수단을 제공한다.
일부 실시형태에서, CRISPR-Cas9는 살아있는 세포 이미징에 사용된다. 형광 표지된 Cas9는 동원체(centromere) 및 텔로미어와 같은 반복적인 게놈 영역을 표적화하여 세포 주기 전반에 걸쳐 천연 염색질 유전자좌를 추적하고, 3D 핵 공간에서 전사적으로 활성 및 불활성인 영역의 차분 위치(differential positioning)를 결정한다.
일부 실시형태에서, CRISPR-Cas9 방법 또는 시스템은 유익한 임상 변이체 또는 억제인자 돌연변이의 삽입에 의한 병원성 돌연변이의 교정에 사용된다.
핵염기 편집기
Cas9를 포함하는 폴리뉴클레오타이드의 표적 뉴클레오타이드 서열을 편집, 변형 또는 변경시키기 위한 신규한 염기 편집기 또는 핵염기 편집기가 본 명세서에 개시된다. 폴리뉴클레오타이드 프로그래밍 가능 뉴클레오타이드 결합 도메인(예를 들어, Cas9) 및 핵염기 편집 도메인(예를 들어, 아데노신 데아미네이스)을 포함하는 핵염기 편집기 또는 염기 편집기가 본 명세서에 기재된다. 폴리뉴클레오타이드 프로그래밍 가능 뉴클레오타이드 결합 도메인(예를 들어, Cas9)은 결합된 가이드 폴리뉴클레오타이드(예를 들어, gRNA)와 결합할 때 표적 폴리뉴클레오타이드 서열(즉, 결합된 가이드 핵산의 염기와 표적 폴리뉴클레오타이드 서열의 염기 사이의 상보적인 염기 페어링을 통해)에 특이적으로 결합할 수 있어 염기 편집기를 편집하고자 하는 표적 핵산 서열에 위치시킨다. 일부 실시형태에서, 표적 폴리뉴클레오타이드 서열은 단일 가닥 DNA 또는 이중 가닥 DNA를 포함한다. 일부 실시형태에서, 표적 폴리뉴클레오타이드 서열은 RNA를 포함한다. 일부 실시형태에서, 표적 폴리뉴클레오타이드 서열은 DNA-RNA 하이브리드를 포함한다. 인간 질환과 관련하여 알려진 대부분의 유전적 변화는 점 돌연변이이기 때문에, 정확한 점 돌연변이를 보다 효율적이고 명확하게 만들 수 있는 방법이 필요하다. 본 명세서에 제공된 바와 같은 염기 편집 시스템은 이중 가닥 DNA 절단을 생성하지 않고, 공여체 DNA 주형을 필요로 하지 않고, 과도한 확률론적 삽입 및 결실을 유도하지 않고 게놈 편집을 제공하는 새로운 방식을 제공한다.
본 명세서에 제공된 염기 편집기는 상당한 비율의 indel을 생성하지 않고 특정 뉴클레오타이드 염기를 변형시킬 수 있다. 본 명세서에서 사용되는 용어 "indel(들)"은 핵산 내의 뉴클레오타이드 염기의 삽입 또는 결실을 지칭한다. 이러한 삽입 또는 결실은 유전자의 코딩 영역 내에서 프레임 시프트 돌연변이를 유발할 수 있다. 일부 실시형태에서, 표적 뉴클레오타이드 서열에서 다수의 삽입 또는 결실(즉, indel)을 생성하지 않고 핵산 내의 특정 뉴클레오타이드를 효율적으로 변형(예를 들어, 돌연변이 또는 탈아미노화)시키는 염기 편집기를 생성하는 것이 바람직하다. 소정의 실시형태에서, 본 명세서에 제공된 임의의 염기 편집기는 indel에 비해 더 많은 비율의 의도된 변형(예를 들어, 점 돌연변이 또는 탈아미노화)을 생성할 수 있다.
일부 실시형태에서, 본 명세서에 제공된 임의의 염기 편집기 시스템은 표적 폴리뉴클레오타이드 서열에서 50% 미만, 40% 미만, 30% 미만, 20% 미만, 19% 미만, 18% 미만, 17% 미만, 16% 미만, 15% 미만, 14% 미만, 13% 미만, 12% 미만, 11% 미만, 10% 미만, 9% 미만, 8% 미만, 7% 미만, 6% 미만, 5% 미만, 4% 미만, 3% 미만, 2% 미만, 1% 미만, 0.9% 미만, 0.8% 미만, 0.7% 미만, 0.6% 미만, 0.5% 미만, 0.4% 미만, 0.3% 미만, 0.2% 미만, 0.1% 미만, 0.09% 미만, 0.08% 미만, 0.07% 미만, 0.06% 미만, 0.05% 미만, 0.04% 미만, 0.03% 미만, 0.02% 미만 또는 0.01% 미만의 indel 형성을 초래한다.
본 개시내용의 일부 양태는 본 명세서에 제공된 임의의 염기 편집기가 의도되지 않은 점 돌연변이와 같은 의도되지 않은 돌연변이를 상당수 생성하지 않고 핵산(예를 들어, 대상체 게놈 내의 핵산)에서 점 돌연변이와 같은 의도된 돌연변이를 효율적으로 생성할 수 있다는 인식에 기초하고 있다. 일부 실시형태에서, 본 명세서에 제공된 임의의 염기 편집기는 적어도 0.01%의 의도된 돌연변이(즉, 적어도 0.01%의 염기 편집 효율)를 생성할 수 있다. 일부 실시형태에서, 본 명세서에 제공된 임의의 염기 편집기는 적어도 0.01%, 1%, 2%, 3%, 4%, 5%, 10%, 15%, 20%, 25%, 30%, 40%, 45%, 50%, 60%, 70%, 80%, 90%, 95% 또는 99%의 의도된 돌연변이를 생성할 수 있다.
일부 실시형태에서, 본 명세서에 제공된 염기 편집기는 1:1 이상인 의도된 점 돌연변이 대 indel의 비를 생성할 수 있다. 일부 실시형태에서, 본 명세서에 제공된 염기 편집기는 적어도 1.5:1, 적어도 2:1, 적어도 2.5:1, 적어도 3:1, 적어도 3.5:1, 적어도 4:1, 적어도 4.5:1, 적어도 5:1, 적어도 5.5:1, 적어도 6:1, 적어도 6.5:1, 적어도 7:1, 적어도 7.5:1, 적어도 8:1, 적어도 8.5:1, 적어도 9:1, 적어도 10:1, 적어도 11:1, 적어도 12:1, 적어도 13:1, 적어도 14:1, 적어도 15:1, 적어도 20:1, 적어도 25:1, 적어도 30:1, 적어도 40:1, 적어도 50:1, 적어도 100:1, 적어도 200:1, 적어도 300:1, 적어도 400:1, 적어도 500:1, 적어도 600:1, 적어도 700:1, 적어도 800:1, 적어도 900:1 또는 적어도 1000:1 이상인 의도된 점 돌연변이 대 indel의 비를 생성할 수 있다.
의도된 돌연변이 및 indel의 수는, 예를 들어, 전체 내용이 참조에 의해 본 명세서에 원용되어 있는 국제 PCT 출원 제PCT/2017/045381(WO2018/027078)호 및 제PCT/US2016/058344(WO2017/070632)호; 문헌[Komor, A.C., et al., "Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage" Nature 533, 420-424 (2016); Gaudelli, N.M., et al., "Programmable base editing of A·T to G·C in genomic DNA without DNA cleavage" Nature 551, 464-471 (2017); 및 Komor, A.C., et al., "Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity" Science Advances 3:eaao4774 (2017)]에 기술되어 있는 바와 같은 임의의 적합한 방법을 사용하여 결정될 수 있다.
일부 실시형태에서, indel 빈도를 계산하기 위해, 시퀀싱 리드는 indel이 발생할 수 있는 창(window)의 양쪽 측면에 있는 2개의 10bp 서열과 정확하게 일치하는지에 대해 스캔된다. 정확히 일치하는 것이 없으면, 리드는 분석으로부터 제외된다. 이 indel 창의 길이가 참조 서열과 정확히 일치하면, 리드는 indel을 포함하지 않는 것으로 분류된다. indel 창이 참조 서열보다 2개 이상의 염기만큼 길거나 짧으면, 시퀀싱 리드는 각각 삽입 또는 결실로 분류된다. 일부 실시형태에서, 본 명세서에 제공된 염기 편집기는 핵산 영역에서 indel의 형성을 제한할 수 있다. 일부 실시형태에서, 영역은 염기 편집기에 의해 표적화되는 뉴클레오타이드에 있거나, 염기 편집기에 의해 표적화되는 뉴클레오타이드의 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개의 뉴클레오타이드 내의 영역이다.
표적 뉴클레오타이드 영역에서 형성된 indel의 수는 핵산(예를 들어, 세포 게놈 내의 핵산)이 염기 편집기에 노출되는 시간의 양에 따라 달라질 수 있다. 일부 실시형태에서, indel의 수 또는 비율은 표적 뉴클레오타이드 서열(예를 들어, 세포 게놈 내의 핵산)을 염기 편집기에 노출시킨지 적어도 1시간, 적어도 2시간, 적어도 6시간, 적어도 12시간, 적어도 24시간, 적어도 36시간, 적어도 48시간, 적어도 3일, 적어도 4일, 적어도 5일, 적어도 7일, 적어도 10일 또는 적어도 14일 후에 결정된다. 본 명세서에 기재된 바와 같은 염기 편집기의 특징은 임의의 융합 단백질 또는 본 명세서에 제공된 융합 단백질을 사용하는 방법에 적용될 수 있음을 이해하여야 한다.
치료적 적용
본 명세서에 기재된 CRISPR-Cas9 방법 또는 시스템은 다양한 치료적 적용을 가질 수 있다. 따라서, 일부 실시형태에서, 장애 또는 질환의 치료를 필요로 하는 대상체에서 장애 또는 질환을 치료하는 방법이 제공되며, 해당 방법은 본 명세서에 기재된 바와 같은 Cas9를 포함하는 CRISPR-Cas9 시스템을 대상체에게 투여하는 단계를 포함하되, 가이드 RNA는 병태 또는 질환과 연관된 표적 핵산의 적어도 10개의 뉴클레오타이드와 상보적이고; Cas 단백질은 가이드 RNA와 회합하고; 가이드 RNA는 표적 핵산에 결합하고; Cas 단백질은 표적 핵산의 절단을 유발하고, 선택적으로 Cas9는 데아미네이스에 융합된 불활성 Cas9(dCas9)이고, 표적 핵산에서 하나 이상의 염기 편집을 초래하여 장애 또는 질환을 치료한다.
일부 실시형태에서, CRISPR-Cas9 방법 또는 시스템은 다양한 질환 및 장애, 예를 들어, 유전적 장애(예를 들어, 단일 유전성 질환), 뉴클레이스 활성에 의해 치료될 수 있는 질환 및 다양한 암 등을 치료하는 데 사용될 수 있다.
일부 실시형태에서, 본 명세서에 기재된 CRISPR 방법 또는 시스템은 표적 핵산을 변형시키기 위해(예를 들어, 하나 이상의 핵산 잔기를 삽입, 결실 또는 돌연변이시킴으로써) 표적 핵산을 편집하는 데 사용될 수 있다. 예를 들어, 일부 실시형태에서, 본 명세서에 기재된 CRISPR 시스템은 바람직한 핵산 서열을 포함하는 외인성 공여체 주형 핵산(예를 들어, DNA 분자 또는 RNA 분자)을 포함한다. 본 명세서에 기재된 CRISPR 시스템으로 유도된 절단 이벤트가 해결되면, 세포의 분자 기구는 절단 이벤트를 복구하고/하거나 해결하는 데 외인성 공여체 주형 핵산을 이용할 것이다. 대안적으로, 세포의 분자 기구는 절단 이벤트를 복구하고/하거나 해결하는 데 내인성 주형을 이용할 수 있다. 일부 실시형태에서, 본 명세서에 기재된 CRISPR 시스템은 삽입, 결실 및/또는 점 돌연변이를 초래하는 표적 핵산을 변경하는 데 사용될 수 있다. 일부 실시형태에서, 삽입은 무흔(scarless) 삽입이다(즉, 의도된 핵산 서열의 표적 핵산으로의 삽입은 절단 이벤트의 해결 시 의도되지 않은 핵산 서열을 추가적으로 생성하지 않는다). 공여체 주형 핵산은 이중 가닥 또는 단일 가닥 핵산 분자(예를 들어, DNA 또는 RNA)일 수 있다. 일부 실시형태에서, 본 명세서에 기재된 CRISPR 방법 또는 시스템은 핵염기 편집기를 포함한다. 예를 들어, 일부 실시형태에서, 본 명세서에 기재된 Cas9 단백질은 핵염기 편집 활성을 갖는 폴리펩타이드에 융합된다.
일 양태에서, 본 명세서에 기재된 CRISPR 방법 또는 시스템은 RNA, 독성 RNA 및/또는 돌연변이된 RNA(예를 들어, 스플라이싱 결함 또는 절단)의 과발현에 의해 유발된 질환을 치료하는 데 사용될 수 있다.
일부 실시형태에서, 본 명세서에 기재된 CRISPR 방법 또는 시스템은 다양한 질환을 유발하는 RNA 의존적 기능에 영향을 미치는 트랜스 작용(trans-acting) 돌연변이를 표적화할 수 있다.
일부 실시형태에서, 본 명세서에 기재된 CRISPR 방법 또는 시스템은 또한 스플라이싱 결함 및 질환을 유발할 수 있는 시스 작용(cis-acting) 스플라이싱 코드를 파괴하는 돌연변이를 표적화하는 데 사용될 수 있다.
본 명세서에 기재된 CRISPR 방법 또는 시스템은 특히 RNA 바이러스에 대한 항바이러스 활성을 위해 추가로 사용될 수 있다. CRISPR 연관 단백질은 바이러스 RNA 서열을 표적화하도록 선택된 적합한 RNA 가이드를 사용하여 바이러스 RNA를 표적화할 수 있다.
본 명세서에 기재된 CRISPR 방법 또는 시스템은 또한 대상체(예를 들어, 인간 대상체)에서 암을 치료하는 데 사용될 수 있다. 예를 들어, 본 명세서에 기재된 CRISPR 연관 단백질은 암세포에서 세포 사멸을 유도(예를 들어, 세포자멸사를 통해)하기 위해 비정상(예를 들어, 점 돌연변이를 포함하거나 대안적으로 스플라이싱됨)이며 암세포에서 발견되는 RNA 분자를 표적화하는 crRNA로 프로그래밍될 수 있다.
또한, 본 명세서에 기재된 CRISPR 방법 또는 시스템은 또한 대상체에서 감염성 질환을 치료하는 데 사용될 수 있다. 예를 들어, 본 명세서에 기재된 CRISPR 연관 단백질은 감염원 세포에서 세포 사멸을 표적화하고 유도하기 위해 감염원(예를 들어, 세균, 바이러스, 기생충 또는 원생동물)에 의해 발현되는 RNA 분자를 표적화하는 crRNA로 프로그래밍될 수 있다. CRISPR 시스템은 또한 세포내 감염원이 숙주 대상체의 세포를 감염시키는 질환을 치료하는 데 사용될 수 있다. 감염원 유전자에 의해 암호화된 RNA 분자를 표적화하도록 CRISPR 연관 단백질을 프로그래밍함으로써, 감염원에 감염된 세포가 표적화되어 세포 사멸이 유도될 수 있다.
또한, 시험관내 RNA 감지 검정이 특정 RNA 기질을 검출하는 데 사용될 수 있다. CRISPR 연관 단백질은 살아있는 세포에서 RNA 기반 감지에 사용될 수 있다. 적용의 예는, 예를 들어, 질환 특이적 RNA의 감지에 의한 진단이다.
폴리뉴클레오타이드 서열을 표적 DNA 서열에 삽입하는 것이 바람직한 적용에서, 삽입될 공여체 서열을 포함하는 폴리뉴클레오타이드도 세포에 제공된다. "공여체 서열" 또는 "공여체 폴리뉴클레오타이드"는 폴리펩타이드를 부위 지정 변형시킴으로써 유도되는 절단 부위에 삽입되는 핵산 서열을 의미한다. 공여체 폴리뉴클레오타이드는 그것과 상동성을 갖는 게놈 서열 사이의 상동성 지정 복구를 지원하기 위해, 절단 부위의 게놈 서열과 충분한 상동성, 예를 들어, 절단 부위 옆, 예를 들어, 절단 부위의 약 50개 이하의 염기 내, 예를 들어, 약 30개의 염기 내, 약 15개의 염기 내, 약 10개의 염기 내, 약 5개의 염기 내에 있거나 절단 부위 바로 옆에 있는 뉴클레오타이드 서열과, 예를 들어, 70%, 80%, 85%, 90%, 95% 또는 100%의 상동성을 포함할 것이다. 공여체와 게놈 서열 사이의 대략 25개, 50개, 100개 또는 200개의 뉴클레오타이드 또는 200개 초과의 뉴클레오타이드(또는 10개 내지 200개의 뉴클레오타이드 또는 그 이상의 임의의 정수 값)의 서열 상동성이 상동성 지정 복구를 지원할 것이다. 공여체 서열은, 예를 들어, 10개 이상의 뉴클레오타이드, 50개 이상의 뉴클레오타이드, 100개 이상의 뉴클레오타이드, 250개 이상의 뉴클레오타이드, 500개 이상의 뉴클레오타이드, 1000개 이상의 뉴클레오타이드, 5000개 이상의 뉴클레오타이드 등의 임의의 길이일 수 있다.
공여체 서열은 전형적으로 이것이 대체하는 게놈 서열과 동일하지 않다. 오히려, 상동성 지정 복구를 지원하기에 충분한 상동성이 존재하는 한, 공여체 서열은 게놈 서열과 관련하여 적어도 하나 이상의 단일 염기 변화, 삽입, 결실, 역위 또는 재배열을 포함할 수 있다. 일부 실시형태에서, 공여체 서열은 2개의 상동성 영역이 측접하는 비상동성 서열을 포함하여, 표적 DNA 영역과 2개의 측접 서열 사이의 상동성 지정 복구로 인해 표적 영역에 비상동성 서열이 삽입된다. 공여체 서열은 또한 관심 DNA 영역과 상동성이 아니며 관심 DNA 영역에 삽입되도록 의도되지 않은 서열을 포함하는 벡터 백본을 포함할 수 있다. 일반적으로, 공여체 서열의 상동성 영역(들)은 재조합이 요구되는 게놈 서열과 적어도 50%의 서열 동일성을 가질 것이다. 소정의 실시형태에서, 60%, 70%, 80%, 90%, 95%, 98%, 99% 또는 99.9%의 서열 동일성이 존재한다. 공여체 폴리뉴클레오타이드의 길이에 따라 1% 내지 100%의 서열 동일성 사이의 임의의 값이 존재할 수 있다.
공여체 서열은 게놈 서열, 예를 들어, 제한 부위, 뉴클레오타이드 다형성, 선별 마커(예를 들어, 약물 저항성 유전자, 형광 단백질, 효소 등) 등과 비교하여 소정의 서열 차이를 포함할 수 있으며, 이는 절단 부위에 공여체 서열이 성공적으로 삽입되었는지 평가하기 위해 사용될 수 있거나 일부 경우에 다른 목적을 위해(예를 들어, 표적화된 게놈 유전자좌에서의 발현을 보여주기 위해) 사용될 수 있다. 일부 경우에, 코딩 영역에 위치하는 경우, 이러한 뉴클레오타이드 서열 차이는 아미노산 서열을 변경하지 않거나 아미노산 변화를 침묵시킬 것이다(즉, 단백질의 구조 또는 기능에 영향을 미치지 않는 변화). 대안적으로, 이러한 서열 차이는 마커 서열의 제거를 위해 나중에 활성화될 수 있는 FLP, loxP 서열 등과 같은 측접 재조합 서열을 포함할 수 있다.
공여체 서열은 단일 가닥 DNA, 단일 가닥 RNA, 이중 가닥 DNA 또는 이중 가닥 RNA로서 세포에 제공될 수 있다. 이는 선형 또는 원형 형태로 세포에 도입될 수 있다. 선형 형태로 도입되는 경우, 공여체 서열의 말단은 당업자에게 공지된 방법에 의해 (예를 들어, 핵산외 분해로부터) 보호될 수 있다. 예를 들어, 하나 이상의 다이데옥시뉴클레오타이드 잔기가 선형 분자의 3' 말단에 추가되고/되거나 자가 상보적 올리고뉴클레오타이드가 한쪽 또는 양쪽 말단에 결찰된다. 외인성 폴리뉴클레오타이드를 분해로부터 보호하기 위한 추가적인 방법은 말단 아미노기(들)의 첨가 및, 예를 들어, 포스포로티오에이트, 포스포르아미데이트와 같은 변형된 뉴클레오타이드간 연결 및 O-메틸 리보스 또는 데옥시리보스 잔기의 사용을 포함하지만 이에 제한되지 않는다. 선형 공여체 서열의 말단을 보호하는 것에 대한 대안으로서, 재조합에 영향을 주지 않고 분해될 수 있는 상동성 영역의 외부에 추가적인 길이의 서열이 포함될 수 있다. 공여체 서열은, 예를 들어, 복제 기원, 프로모터 및 항생제 저항성을 암호화하는 유전자와 같은 추가적인 서열을 갖는 벡터 분자의 일부로서 세포 내로 도입될 수 있다. 더욱이, 공여체 서열은 네이키드 핵산으로서, 리포솜 또는 폴록사머와 같은 작용제와 복합체화된 핵산으로서 도입될 수 있거나, DNA 표적화 RNA를 암호화하는 핵산 및/또는 부위 지정 변형 폴리펩타이드 및/또는 공여체 폴리뉴클레오타이드에 대해 위에 기재된 바와 같이 바이러스(예를 들어, 아데노바이러스, AAV)에 의해 전달될 수 있다.
위에 기재된 방법에 따라, 관심 DNA 영역은 생체외에서 절단되고 변형될 수 있고, 즉 "유전자 변형"될 수 있다. 일부 실시형태에서, 선별 마커가 관심 DNA 영역에 삽입되었을 때, 유전적으로 변형된 세포를 나머지 집단으로부터 분리함으로써 세포 집단은 유전자 변형을 포함하는 세포 집단으로 농축될 수 있다. 농축 전, "유전적으로 변형된" 세포는 세포 집단의 약 1% 이상(예를 들어, 2% 이상, 3% 이상, 4% 이상, 5% 이상, 6% 이상, 7% 이상, 8% 이상, 9% 이상, 10% 이상, 15% 이상 또는 20% 이상)만을 구성할 수 있다. "유전적으로 변형된" 세포의 분리는 사용된 선별 마커에 적절한 임의의 편리한 분리 기법에 의해 달성될 수 있다. 예를 들어, 형광 마커가 삽입된 경우에 세포는 형광 활성화 세포 분류에 의해 분리될 수 있는 반면, 세포 표면 마커가 삽입된 경우에 세포는 친화성 분리 기법, 예를 들어, 자성 분리, 친화성 크로마토그래피, 고체 매트릭스에 부착된 친화성 시약을 사용한 "패닝" 또는 기타 편리한 기법에 의해 이종 집단으로부터 분리될 수 있다. 정확한 분리를 제공하는 기법은 다중 색상 채널, 낮은 각도 및 둔광 산란 검출 채널, 임피던스 채널 등과 같은 다양한 정도의 정교함을 가질 수 있는 형광 활성화 세포 분류기를 포함한다. 세포는 죽은 세포와 관련된 염료(예를 들어, 프로피듐 아이오다이드)를 사용함으로써 죽은 세포에 대해 선택될 수 있다. 유전적으로 변형된 세포의 생존률에 지나치게 해를 끼치지 않는 임의의 기법이 사용될 수 있다. 변형된 DNA를 포함하는 세포에 대해 고도로 농축된 세포 조성물은 이러한 방식으로 달성된다. "고도로 농축된"은 유전적으로 변형된 세포가 세포 조성물의 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 예를 들어, 세포 조성물의 약 95% 이상 또는 98% 이상일 것임을 의미한다. 즉, 조성물은 유전적으로 변형된 세포의 실질적으로 순수한 조성물일 수 있다.
본 명세서에 기재된 방법에 의해 생산된 유전적으로 변형된 세포는 즉시 사용될 수 있다. 대안적으로, 세포는 액체 질소 온도에서 동결되어 장기간 동안 보관될 수 있으며, 해동되어 재사용될 수 있다. 이러한 경우에, 세포는 일반적으로 10% 다이메틸설폭사이드(DMSO), 50% 혈청, 40% 완충 배지 또는 이러한 동결 온도에서 세포를 보존하기 위해 당업계에서 일반적으로 사용되는 어떤 다른 이러한 용액에서 동결되고, 동결된 배양된 세포를 해동시키기 위해 당업계에 일반적으로 알려져 있는 방식으로 해동될 것이다.
유전적으로 변형된 세포는 다양한 배양 조건하에 시험관내에서 배양될 수 있다. 세포는 배양을 통해 확장될 수 있으며, 즉, 이들의 증식을 촉진하는 조건하에서 성장할 수 있다. 배양 배지는 액체 또는 반고체, 예를 들어, 함유 아가, 메틸셀룰로스 등일 수 있다. 세포 집단은 일반적으로 송아지 태아 혈청(약 5% 내지 10%), L-글루타민, 티올, 특히 2-머캅토에탄올 및 항생제, 예를 들어, 페니실린 및 스트렙토마이신이 보충된 이스코브의 변형된 DMEM 또는 RPMI 1640과 같은 적절한 영양 배지에 현탁될 수 있다. 배양물은 조절 T 세포가 반응하는 성장 인자를 포함할 수 있다. 본 명세서에 정의된 바와 같은 성장 인자는 막횡단 수용체에 대한 특정 효과를 통해 배양물 또는 온전한 조직에서 세포의 생존, 성장 및/또는 분화를 촉진할 수 있는 분자이다. 성장 인자는 폴리펩타이드 및 비폴리펩타이드 인자를 포함한다.
이러한 방식으로 유전적으로 변형된 세포는, 예를 들어, 질환을 치료하거나 항바이러스, 항병원성 또는 항암 치료제로서 유전자 요법과 같은 목적을 위해, 농업에서 유전적으로 변형된 유기체를 생산하기 위해 또는 생물학적 연구를 위해 대상체에게 이식될 수 있다. 대상체는 신생아, 청소년 또는 성인일 수 있다. 특히 관심 있는 것은 포유동물 대상체이다. 본 방법으로 치료될 수 있는 포유동물 종은 개 및 고양이; 말; 소; 양; 등 및 영장류, 특히 인간을 포함한다. 동물 모델, 특히 작은 포유동물(예를 들어, 마우스, 래트, 기니피그, 햄스터, 토끼목(예를 들어, 토끼) 등)이 실험적 조사에 사용될 수 있다.
세포는, 예를 들어, 이식되는 조직의 성장 및/또는 조직화를 지원하기 위해 단독으로 또는 적합한 기질 또는 매트릭스와 함께 대상체에게 제공될 수 있다. 일반적으로, 적어도 1×103개의 세포, 예를 들어, 5×103개의 세포, 1×104개의 세포, 5×104개의 세포, 1×105개의 세포, 1×106개의 세포 또는 그 이상이 투여될 것이다. 세포는 임의의 다음 경로: 비경구, 피하, 정맥내, 두개내, 척수내, 안구내 또는 척수액 내를 통해 대상체에게 도입될 수 있다. 세포는 주사, 카테터 등에 의해 도입될 수 있다. 세포는 또한 트랜스제닉 동물(예를 들어, 트랜스제닉 마우스)을 생성할 목적으로 배아(예를 들어, 배반포)에 도입될 수 있다.
대상체에 대한 치료제의 투여 횟수는 다양할 수 있다. 유전적으로 변형된 세포를 대상체에게 도입하는 것은 일회성 이벤트일 수 있지만; 소정의 상황에서, 이러한 치료는 제한된 기간 동안 개선을 유도할 수 있고, 지속적인 일련의 반복된 치료가 필요할 수 있다. 다른 상황에서, 효과가 관찰되기 전 유전적으로 변형된 세포의 다중 투여가 필요할 수 있다. 정확한 프로토콜은 치료 중인 개별 대상체의 질환 또는 병태, 질환의 병기 및 매개변수에 따라 달라진다.
본 발명의 다른 양태에서, DNA 표적화 RNA 및/또는 부위 지정 변형 폴리펩타이드 및/또는 공여체 폴리뉴클레오타이드는, 예를 들어, 질환을 치료하거나 항바이러스, 항병원성 또는 항암 치료제로서 유전자 요법과 같은 목적을 위해, 농업에서 유전적으로 변형된 유기체를 생산하기 위해 또는 생물학적 연구를 위해 생체내에서 세포 DNA를 변형시키는 데 사용될 수 있다. 이러한 생체내 실시형태에서, DNA 표적화 RNA 및/또는 부위 지정 변형 폴리펩타이드 및/또는 공여체 폴리뉴클레오타이드는 개체에게 직접 투여된다. DNA 표적화 RNA 및/또는 부위 지정 변형 폴리펩타이드 및/또는 공여체 폴리뉴클레오타이드는 펩타이드, 소분자 및 핵산을 대상체에게 투여하기 위한 당업계에 잘 알려진 다수의 방법에 의해 투여될 수 있다. DNA 표적화 RNA 및/또는 부위 지정 변형 폴리펩타이드 및/또는 공여체 폴리뉴클레오타이드는 다양한 제형에 포함될 수 있다. 보다 구체적으로, 본 발명의 DNA 표적화 RNA 및/또는 부위 지정 변형 폴리펩타이드 및/또는 공여체 폴리뉴클레오타이드는 적절한 약제학적으로 허용 가능한 담체 또는 희석제와 조합하여 약제학적 조성물로 제형화될 수 있다.
약제학적 제제는 약제학적으로 허용 가능한 비히클에 존재하는 하나 이상의 DNA 표적화 RNA 및/또는 부위 지정 변형 폴리펩타이드 및/또는 공여체 폴리뉴클레오타이드를 포함하는 조성물이다. "약제학적으로 허용 가능한 비히클"은 미국 연방 또는 주 정부의 규제 기관에 의해 승인되거나 미국 약전 또는 인간과 같은 포유동물에 사용하기 위해 일반적으로 인정되는 기타 약전에 등재된 비히클일 수 있다. 용어 "비히클"은 본 발명의 화합물을 포유동물에게 투여하기 위해 함께 제형화되는 희석제, 보조제, 부형제 또는 담체를 지칭한다. 이러한 약제학적 비히클은 지질, 예를 들어, 리포솜, 예를 들어, 리포솜 덴드리머; 액체, 예컨대, 물 및 땅콩유, 대두유, 광유, 참깨유 등과 같은 석유, 동물, 식물 또는 합성 기원의 것들을 포함하는 오일, 식염수; 아카시아검, 젤라틴, 전분 페이스트, 활석, 케라틴, 콜로이드성 실리카, 우레아 등일 수 있다. 또한, 보조제, 안정하제, 증점제, 윤활제 및 착색제가 사용될 수 있다. 약제학적 조성물은 정제, 캡슐, 분말, 과립, 연고, 용액, 좌약, 주사제, 흡입제, 겔, 마이크로스피어 및 에어로졸과 같은 고체, 반고체, 액체 또는 기체 형태의 제제로 제형화될 수 있다. 이와 같이, DNA 표적화 RNA 및/또는 부위 지정 변형 폴리펩타이드 및/또는 공여체 폴리뉴클레오타이드의 투여는 경구, 협측, 직장, 비경구, 복강내, 피내, 경피, 기관내, 안구내 투여 등을 포함하는 다양한 방식으로 달성될 수 있다. 활성제는 투여 후 전신적일 수 있거나, 국소 투여, 벽내 투여의 사용 또는 이식 부위에서 활성 용량을 유지하는 역할을 하는 이식물의 사용에 의해 국부화될 수 있다. 활성제는 즉각적인 활성을 위해 제형화될 수 있거나 지속 방출을 위해 제형화될 수 있다.
일부 병태, 특히 중추신경계 병태의 경우, 혈액 뇌 장벽(blood-brain barrier: BBB)을 통과하도록 작용제를 제형화하는 것이 필요할 수 있다. 혈액 뇌 장벽(BBB)을 통한 약물 전달을 위한 전략 중 하나는 만니톨 또는 류코트리엔과 같은 삼투압 수단 또는 브래디키닌과 같은 혈관활성 물질을 생화학적으로 사용함으로써 BBB를 파괴를 수반한다. 뇌종양에 대한 특정 작용제를 표적으로 하기 위해 BBB 개방을 사용할 가능성도 옵션이다. BBB 파괴제는 조성물이 혈관내 주사에 의해 투여되는 경우 본 발명의 치료적 조성물과 함께 공동 투여될 수 있다. BBB를 통과하기 위한 다른 전략은 카베올린-1 매개성 통과세포외배출(transcytosis), 포도당 및 아미노산 운반체와 같은 담체 매개성 수송체, 인슐린 또는 트랜스페린에 대한 수용체 매개성 통과세포외배출 및 p-당단백질과 같은 활성 유출 수송체를 포함하는 내인성 수송 시스템의 사용을 수반할 수 있다. 활성 수송 모이어티는 또한 혈관 내피 벽을 가로지르는 수송을 용이하게 하기 위해 본 발명에 사용하기 위한 치료적 화합물에 접합될 수 있다.
대안적으로, BBB 너머로의 치료제의 약물 전달은 국부 전달, 예를 들어, 척수강내 전달에 의해 이루어질 수 있다.
전형적으로, DNA 표적화 RNA 및/또는 부위 지정 변형 폴리펩타이드 및/또는 공여체 폴리뉴클레오타이드의 유효량이 제공된다. 생체외 방법과 관련하여 위에 논의된 바와 같이, 생체내에서 DNA 표적화 RNA 및/또는 부위 지정 변형 폴리펩타이드 및/또는 공여체 폴리뉴클레오타이드의 유효량 또는 유효 용량은 음성 대조군, 예를 들어, 빈 벡터 또는 관련 없는 폴리펩타이드와 접촉된 세포에 비해 2개의 상동성 서열 사이에서 관찰되는 재조합 양의 2배 이상의 증가를 유도하는 양이다. 재조합의 양은, 예를 들어, 위에 기재되고 당업계에 공지된 바와 같은 임의의 편리한 방법에 의해 측정될 수 있다. 투여될 DNA 표적화 RNA 및/또는 부위 지정 변형 폴리펩타이드 및/또는 공여체 폴리뉴클레오타이드의 유효량 또는 유효 용량의 계산은 당업자의 기술 내에 있으며 당업자에게 일상적일 것이다. 투여될 최종 양은 투여 경로 및 치료될 장애 또는 병태의 성질에 따라 달라질 것이다.
특정 환자에게 요구되는 유효량은 다양한 요인에 따라 달라질 것이며, 그 중 몇몇 요인은 환자마다 다를 것이다. 유능한 임상의는 필요에 따라 질환 병태를 중단시키거나 이의 진행을 역전시키기 위해 환자에게 투여할 치료제의 유효량을 결정할 수 있을 것이다. LD50 동물 데이터 및 작용제에 대해 이용 가능한 기타 정보를 사용하여, 임상의는 투여 경로에 따라 개체에 대한 최대 안전 용량을 결정할 수 있다. 예를 들어, 정맥내로 투여된 용량은 치료적 조성물이 투여되는 유체의 양이 더 많을 경우 경막내로 투여된 용량보다 클 수 있다. 유사하게는, 신체로부터 빠르게 제거되는 조성물은 치료적 농도를 유지하기 위해 더 높은 용량 또는 반복된 용량으로 투여될 수 있다. 숙련된 임상의는 일반적인 기술을 이용하여 일상적인 임상 시험 과정에서 특정 치료제의 복용량을 최적화할 수 있을 것이다.
약제에 포함시키기 위해, DNA 표적화 RNA 및/또는 부위 지정 변형 폴리펩타이드 및/또는 공여체 폴리뉴클레오타이드는 적합한 상업적 공급원으로부터 얻을 수 있다. 일반적인 제안으로서, 용량당 비경구로 투여되는 DNA 표적화 RNA 및/또는 부위 지정 변형 폴리펩타이드 및/또는 공여체 폴리뉴클레오타이드의 총 약제학적 유효량은 용량 반응 곡선에 의해 측정될 수 있는 범위 내에 있을 것이다.
DNA 표적화 RNA 및/또는 부위 지정 변형 폴리펩타이드 및/또는 공여체 폴리뉴클레오타이드에 기반한 요법, 즉, 치료적 투여에 사용되는 DNA 표적화 RNA 및/또는 부위 지정 변형 폴리펩타이드 및/또는 공여체 폴리뉴클레오타이드의 제제는 멸균되어야 한다. 멸균은 멸균 여과막(예를 들어, 0.2㎛ 막)을 통한 여과에 의해 쉽게 달성된다. 치료적 조성물은 일반적으로 멸균 접근 포트를 갖는 용기, 예를 들어, 피하 주사 바늘로 관통할 수 있는 마개가 있는 정맥내 용액 백 또는 바이알에 배치된다. DNA 표적화 RNA 및/또는 부위 지정 변형 폴리펩타이드 및/또는 공여체 폴리뉴클레오타이드에 기반한 요법은 단위 또는 다중 용량 용기, 예를 들어, 밀봉된 앰풀 또는 바이알에 수용액으로 또는 재구성을 위한 동결건조된 제형으로 보관될 수 있다. 동결건조된 제형의 예로서, 10㎖ 바이알에 화합물의 멸균 여과된 1%(w/v) 수용액 5㎖을 채우고, 생성된 혼합물은 동결건조된다. 수액은 정균 주사용수를 사용하여 동결건조된 화합물을 재구성함으로써 제조된다.
약제학적 조성물은 목적하는 제형에 따라 약제학적으로 허용 가능한 무독성 희석제의 담체를 포함할 수 있으며, 이는 동물 또는 인간 투여용 약제학적 조성물을 제형화하는 데 일반적으로 사용되는 비히클로서 정의된다. 희석제는 조합물의 생물학적 활성에 영향을 미치지 않도록 선택된다. 이러한 희석제의 예는 증류수, 완충수, 생리학적 식염수, PBS, 링거액, 덱스트로스 용액 및 행크 용액이다. 또한, 약제학적 조성물 또는 제형은 다른 담체, 보조제 또는 무독성, 비치료적, 비면역원성 안정화제, 부형제 등을 포함할 수 있다. 조성물은 또한 pH 조절제 및 완충제, 독성 조절제, 습윤제 및 세제와 같은 생리학적 조건을 근사화하는 추가적인 물질을 포함할 수 있다.
조성물은 또한, 예를 들어, 항산화제와 같은 임의의 다양한 안정화제를 포함할 수 있다. 약제학적 조성물이 폴리펩타이드를 포함하는 경우, 폴리펩타이드는 폴리펩타이드의 생체내 안정성을 향상시키거나 그렇지 않으면 약리학적 특성을 향상시키는(예를 들어, 폴리펩타이드의 반감기를 증가시키고, 독성을 감소시키고, 용해도 또는 흡수를 향상시키는) 잘 알려진 다양한 화합물과 복합체를 형성할 수 있다. 이러한 변형제 또는 착화제의 예는 설페이트, 글루코네이트, 시트레이트 및 포스페이트를 포함한다. 조성물의 핵산 또는 폴리펩타이드는 또한 이들의 생체내 속성을 향상시키는 분자와 복합체를 형성할 수 있다. 이러한 분자는, 예를 들어, 탄수화물, 폴리아민, 아미노산, 다른 펩타이드, 이온(예를 들어, 소듐, 포타슘, 칼슘, 마그네슘, 망가니즈) 및 지질을 포함한다.
약제학적 조성물은 예방적 및/또는 치료적 치료를 위해 투여될 수 있다. 활성 성분의 독성 및 치료적 효능은, 예를 들어, LD50(집단의 50%에 치명적인 용량) 및 ED50(집단의 50%에 치료학적으로 유효한 용량)을 결정하는 것을 포함하는 세포 배양물 및/또는 실험 동물에서의 표준 약제학적 절차에 따라 결정될 수 있다. 독성 효과와 치료적 효과 사이의 용량 비는 치료 지수이며, 이는 LD50/ED50 비로 표현될 수 있다. 큰 치료 지수를 나타내는 요법이 바람직하다.
세포 배양 및/또는 동물 연구로부터 얻은 데이터는 인간을 위한 다양한 투여량을 공식화하는 데 사용될 수 있다. 활성 성분의 투여량은 전형적으로 독성이 낮은 ED50을 포함하는 순환 농도의 범위 내에 있다. 투여량은 사용된 투여 형태 및 이용된 투여 경로에 따라 이러한 범위 내에서 달라질 수 있다.
약제학적 조성물을 제형화하는 데 사용되는 성분은 바람직하게는 고순도이고, 잠재적으로 해로운 오염물질이 실질적으로 없다(예를 들어, 적어도 국가 식품(National Food: NF) 등급, 일반적으로 적어도 분석적 등급, 보다 전형적으로 적어도 약제학적 등급). 더욱이, 생체내 사용을 위한 조성물은 일반적으로 무균이다. 주어진 화합물이 사용 전 합성되어야 하는 경우, 생성된 제품은 전형적으로 임의의 잠재적으로 독성이 있는 물질, 특히 합성 또는 정제 과정 중에 존재할 수 있는 임의의 내독소가 실질적으로 없다. 비경구 투여를 위한 조성물은 또한 무균이고, 실질적으로 등장성이며, GMP 조건하에서 제조된다.
전달 시스템
본 명세서에 기재된 CRISPR 시스템 또는 이의 구성요소, 이의 핵산 분자 및/또는 이의 구성요소를 암호화하거나 제공하는 핵산 분자, CRISPR 연관 단백질 또는 RNA 가이드는 벡터, 예를 들어, 플라스미드 및 전달 벡터와 같은 다양한 전달 시스템에 의해 전달될 수 있다. 예시적인 실시형태가 아래 설명된다. CRISPR 시스템(예를 들어, 본 명세서에 기재된 핵염기 편집기를 포함하는 Cas9 포함)은 바이러스 벡터에 포함된 핵산에 암호화될 수 있다. 바이러스 벡터는 렌티바이러스, 아데노바이러스, 레트로바이러스 및 아데노 관련 바이러스(AAV)를 포함할 수 있다. 바이러스 벡터는 용도에 따라 선택될 수 있다. 예를 들어, AAV는 약한 면역원성으로 인해 생체내 유전자 전달에 일반적으로 사용된다. 아데노바이러스는 이들이 유도하는 강력한 면역원성 반응 때문에 일반적으로 백신으로 사용된다. 바이러스 벡터의 패키징 용량은 벡터에 패키징될 수 있는 염기 편집기의 크기를 제한할 수 있다. 예를 들어, AAV의 패키징 용량은 두 개의 145 염기의 역 말단 반복부(ITR)를 포함하여 약 4.5kb이다.
AAV는 파보바이러스 패밀리에 속하는 작은 단일 가닥 DNA 의존적 바이러스이다. 4.7kb 야생형(wt) AAV 게놈은 각각 4개의 복제 단백질과 3개의 캡시드 단백질을 암호화하는 2개의 유전자로 구성되며, 양쪽 측면에 145bp의 역 말단 반복부(ITR)가 있다. 비리온은 3개의 캡시드 단백질인 Vp1, Vp2 및 Vp3으로 구성되며, 동일한 오픈 리딩 프레임으로부터 1:1:10 비로 생성되지만 차등 스플라이싱(Vp1) 및 대안적 번역 시작 부위(각각 Vp2 및 Vp3)로부터 생성된다. Vp3은 비리온에서 가장 풍부한 서브유닛이며, 바이러스의 향성을 정의하는 세포 표면의 수용체 인식에 참여한다. 바이러스 감염성에서 기능하는 포스포리페이스 도메인은 Vp1의 고유한 N 말단에서 확인되었다.
wt AAV와 유사하게, 재조합 AAV(rAAV)는 시스 작용 145bp ITR을 이용하여 벡터 이식유전자 카세트를 측접시켜 외래 DNA의 패키징을 위해 최대 4.5kb를 제공한다. 감염 후, rAAV는 본 발명의 융합 단백질을 발현할 수 있고, 원형의 머리-꼬리 연쇄체(concatemer)에 에피솜적으로 존재함으로써 숙주 게놈에 통합되지 않고 지속될 수 있다. 시험관내 및 생체내에서 이 시스템을 사용한 rAAV 성공의 수많은 예가 있지만, 제한된 패키징 용량은 유전자의 코딩 서열의 길이가 wt AAV 게놈 이상일 때 AAV 매개성 유전자 전달의 사용을 제한하였다.
AAV 벡터의 작은 패키징 용량으로 인해 이 크기를 초과하는 다수의 유전자 전달 및/또는 큰 생리학적 조절 요소의 사용이 어려워진다. 이러한 문제는, 예를 들어, 전달될 단백질(들)을 2개 이상의 단편으로 분할함으로써 해결될 수 있되, N-말단 단편은 스플릿 인테인(split intein)-N에 융합되고 C-말단 단편은 스플릿 인테인-C에 융합된다. 그런 다음, 이들 단편은 2개 이상의 AAV 벡터에 패키징된다. 본 명세서에서 사용되는 바와 같이, "인테인"은 측접하는 N-말단과 C-말단 엑스테인(예를 들어, 연결될 단편)을 결찰시키는 자기 스플라이싱 단백질 인트론(예를 들어, 펩타이드)을 지칭한다. 이종 단백질 단편을 연결하기 위한 소정의 인테인의 사용은, 예를 들어, 문헌[Wood et al., J. Biol. Chem. 289(21); 14512-9 (2014)]에 기술되어 있다. 예를 들어, 별도의 단백질 단편에 융합되는 경우, 인테인 IntN과 IntC는 서로를 인식하고, 스스로 스플라이싱하며 동시에 이들이 융합된 단백질 단편에 측접하는 N-말단과 C-말단 엑스테인을 결찰시켜 2개의 단백질 단편으로부터 전장 단백질을 재구성한다. 다른 적합한 인테인은 당업자에게 명백할 것이다.
일부 실시형태에서, 본 발명의 CRISPR 시스템은 길이가 다양할 수 있다. 일부 실시형태에서, 단백질 단편은 2개의 아미노산 내지 약 1000개의 아미노산 길이 범위이다. 일부 실시형태에서, 단백질 단편은 약 5개의 아미노산 내지 약 500개의 아미노산 길이 범위이다. 일부 실시형태에서, 단백질 단편은 약 20개의 아미노산 내지 약 200개의 아미노산 길이 범위이다. 일부 실시형태에서, 단백질 단편은 약 10개의 아미노산 내지 약 100개의 아미노산 길이 범위이다. 다른 길이의 적합한 단백질 단편은 당업자에게 명백할 것이다.
일부 실시형태에서, 뉴클레이스(예를 들어, Cas9)의 일부 또는 단편은 인테인에 융합된다. 뉴클레이스는 인테인의 N-말단 또는 C-말단에 융합될 수 있다. 일부 실시형태에서, 융합 단백질의 일부 또는 단편은 인테인에 융합되고 AAV 캡시드 단백질에 융합된다. 인테인, 뉴클레이스 및 캡시드 단백질은 임의의 배열로 함께 융합될 수 있다(예를 들어, 뉴클레이스-인테인-캡시드, 인테인-뉴클레이스-캡시드, 캡시드-인테인-뉴클레이스 등). 일부 실시형태에서, 인테인의 N-말단은 융합 단백질의 C-말단에 융합되고, 인테인의 C-말단은 AAV 캡시드 단백질의 N-말단에 융합된다.
일 실시형태에서, 이중 AAV 벡터는 대형 이식유전자 발현 카세트를 2개의 분리된 반쪽(5' 및 3' 말단 또는 머리 및 꼬리)으로 분할함으로써 생성되며, 여기서 카세트의 각 절반은 단일 AAV 벡터(5kb 미만)에 패키징된다. 그런 다음, 전장 이식유전자 발현 카세트의 재조립은 두 이중 AAV 벡터에 의한 동일한 세포의 동시 감염에 이어 (1) 5'와 3' 게놈 사이의 상동성 재조합(HR)(이중 AAV 중첩 벡터); (2) 5' 및 3' 게놈의 ITR 매개성 꼬리-머리 연쇄체화(이중 AAV 트랜스 스플라이싱 벡터); 또는 (3) 이들 2개의 메커니즘의 조합(이중 AAV 하이브리드 벡터)에 의해 달성된다. 생체내 이중 AAV 벡터의 사용은 전장 단백질의 발현을 초래한다. 이중 AAV 벡터 플랫폼의 사용은 크기가 4.7kb를 초과하는 이식유전자에 대한 효율적이고 실행 가능한 유전자 전달 전략을 나타낸다.
본 명세서에 기재된 Cas9를 포함하는 CRISPR 시스템을 설계하기 위해 개시된 전략은 바이러스 벡터로 패키징될 수 있는 CRISPR 시스템을 생성하는 데 유용할 수 있다. 염기 편집기의 전달을 위해 RNA 또는 DNA 바이러스 기반 시스템을 사용하면 배양 또는 숙주에서 특정 세포에 바이러스를 표적화하고 바이러스 페이로드를 핵 또는 숙주 세포 게놈으로 전달하는 고도로 진화된 과정을 활용한다. 바이러스 벡터는 배양 중인 세포, 환자(생체내)에게 직접 투여될 수 있거나 시험관내에서 세포를 처리하는 데 사용될 수 있고, 변형된 세포는 환자(생체외)에게 선택적으로 투여될 수 있다. 통상적인 바이러스 기반 시스템은 유전자 전달을 위한 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노 관련 및 단순 포진 바이러스 벡터를 포함할 수 있다. 레트로바이러스, 렌티바이러스 및 아데노 관련 바이러스 유전자 전달 방법을 사용하면 숙주 게놈에의 통합이 가능하며, 종종 삽입된 이식유전자의 장기간 발현이 발생한다. 추가적으로, 높은 형질도입 효율이 많은 다양한 세포 유형 및 표적 조직에서 관찰된다.
레트로바이러스의 향성은 외래 외피 단백질을 통합하여 표적 세포의 잠재적 표적 집단을 확장시킴으로써 변경될 수 있다. 렌티바이러스 벡터는 비분열 세포를 형질도입하거나 감염시킬 수 있고 전형적으로 높은 바이러스 역가를 생성할 수 있는 레트로바이러스 벡터이다. 따라서, 레트로바이러스 유전자 전달 시스템의 선택은 표적 조직에 따라 달라진다. 레트로바이러스 벡터는 최대 6kb 내지 10kb의 외래 서열에 대한 패키징 용량을 갖는 시스 작용 긴 말단 반복부로 구성된다. 최소 시스 작용 LTR은 벡터의 복제 및 패키징에 충분하며, 이는 이후에 영구적인 이식유전자 발현을 제공하기 위해 치료용 유전자를 표적 세포에 통합시키는 데 사용된다. 널리 사용되는 레트로바이러스 벡터는 뮤린 백혈병 바이러스(MuLV), 긴팔 원숭이 백혈병 바이러스(GaLV), 유인원 면역 결핍 바이러스(SIV), 인간 면역 결핍 바이러스(HIV) 및 이들의 조합을 기반으로 하는 것들을 포함한다(예를 들어, 문헌[Buchscher et al., J. Virol. 66:2731-2739 (1992); Johann et al., J. Virol. 66:1635-1640 (1992); Sommnerfelt et al., Virol. 176:58-59 (1990); Wilson et al., J. Virol. 63:2374-2378 (1989); Miller et al., J. Virol. 65:2220-2224 (1991)]; PCT/US94/05700 참조).
레트로바이러스 벡터, 특히 렌티바이러스 벡터는 표적 세포로의 효율적인 통합을 위해 주어진 길이보다 작은 폴리뉴클레오타이드 서열을 요구할 수 있다. 예를 들어, 9kb보다 긴 길이의 레트로바이러스 벡터는 더 작은 크기에 비해 바이러스 역가가 낮을 수 있다. 일부 양태에서, 본 개시내용의 CRISPR 시스템(예를 들어, 본 명세서에 개시된 Cas9 포함)은 레트로바이러스 벡터를 통해 표적 세포로의 효율적인 패키징 및 전달을 가능하게 하기에 충분한 크기를 갖는다. 일부 경우에, Cas9는 가이드 핵산 및/또는 표적화 가능한 뉴클레이스 시스템의 다른 구성요소와 함께 발현되는 경우에도 효율적인 팩킹 및 전달이 가능하도록 하는 크기이다.
일시적인 발현이 바람직한 적용에서, 아데노바이러스 기반 시스템이 사용될 수 있다. 아데노바이러스 기반 벡터는 많은 세포 유형에서 매우 높은 형질도입 효율이 가능하며, 세포 분열이 필요하지 않다. 이러한 벡터를 사용하면, 높은 역가 및 발현 수준이 얻어졌다. 이 벡터는 비교적 간단한 시스템에서 대량으로 생산될 수 있다. 아데노 관련 바이러스("AAV") 벡터는 또한, 예를 들어, 핵산 및 펩타이드의 시험관내 생산에서 그리고 생체내 및 생체외 유전자 요법 절차에서 세포에 표적 핵산을 형질도입하는 데 사용될 수 있다(예를 들어, 문헌[West et al., Virology 160:38-47 (1987); 미국 특허 제4,797,368호; WO 93/24641; Kotin, Human Gene Therapy 5:793-801 (1994); Muzyczka, J. Clin. Invest. 94:1351 (1994)] 참조). 재조합 AAV 벡터의 구축은 미국 특허 제5,173,414호; 문헌[Tratschin et al., Mol. Cell. Biol. 5:3251-3260 (1985); Tratschin, et al., Mol. Cell. Biol. 4:2072-2081 (1984); Hermonat & Muzyczka, PNAS 81:6466-6470 (1984); 및 Samulski et al., J. Virol. 63:03822-3828 (1989)]을 포함한 다수의 간행물에 기술되어 있다.
따라서, 본 명세서에 기재된 CRISPR 시스템(예를 들어, 본 명세서에 개시된 Cas9 포함)은 바이러스 벡터와 함께 전달될 수 있다. 염기 편집기 시스템의 하나 이상의 구성요소는 하나 이상의 바이러스 벡터에 암호화될 수 있다. 예를 들어, 염기 편집기 및 가이드 핵산은 단일 바이러스 벡터에 암호화될 수 있다. 다른 경우에, 염기 편집기 및 가이드 핵산은 상이한 바이러스 벡터에 암호화된다. 두 경우 모두, 염기 편집기 및 가이드 핵산은 각각 프로모터 및 종결자에 작동 가능하게 연결될 수 있다.
바이러스 벡터에 암호화된 구성요소의 조합은 선택된 바이러스 벡터의 카고 크기 제한에 의해 결정될 수 있다.
염기 편집기의 비바이러스 전달
CRISPR에 대한 비바이러스 전달 접근법도 이용 가능하다. 비바이러스 핵산 벡터의 중요한 카테고리 중 하나는 유기 또는 무기일 수 있는 나노입자이다. 나노입자는 당업계에 잘 알려져 있다. 임의의 적합한 나노입자 디자인이 게놈 편집 시스템 구성요소 또는 이러한 구성요소를 암호화하는 핵산을 전달하는 데 사용될 수 있다. 예를 들어, 유기(예를 들어, 지질 및/또는 중합체) 나노입자는 본 개시내용의 소정의 실시형태에서 전달 비히클로 사용하기에 적합할 수 있다. 나노입자 제형 및/또는 유전자 전달에 사용하기 위한 예시적인 지질은 표 5(아래)에 나타나 있다.
표 6은 유전자 전달 및/또는 나노입자 제형에 사용하기 위한 예시적인 중합체를 나열하고 있다.
표 7은 본 명세서에 기재된 Cas9를 암호화하는 폴리뉴클레오타이드에 대한 전달 방법을 요약하고 있다.
또 다른 양태에서, 게놈 편집 시스템 구성요소 또는 이러한 구성요소를 암호화하는 핵산, 예를 들어, 생물학적 활성을 갖는 폴리펩타이드(예를 들어, 핵염기 편집기)에 선택적으로 융합된 Cas9 또는 이의 변이체와 같은 핵산 결합 단백질 및 관심 게놈 핵산 서열을 표적화하는 gRNA의 전달은 리보핵단백질(RNP)을 세포에 전달함으로써 달성될 수 있다. RNP는 표적화 gRNA와의 복합체로 핵산 결합 단백질, 예를 들어, Cas9를 포함한다. RNP는, 예를 들어, 문헌[Zuris, J.A. et al., 2015, Nat. Biotechnology, 33(1):73-80]에 보고된 바와 같은 전기천공, 뉴클레오펙션 또는 양이온성 지질 매개성 방법과 같은 공지된 방법을 사용하여 세포에 전달될 수 있다. RNP는 CRISPR 염기 편집 시스템, 특히 1차 세포와 같이 형질감염시키기 어려운 세포에 사용하기에 유리하다. 또한, RNP는 또한 세포 내 단백질 발현에서 발생할 수 있는 어려움을 완화시킬 수 있으며, 특히 CRISPR 플라스미드에 사용될 수 있는 진핵동물 프로모터, 예를 들어, CMV 또는 EF1A가 잘 발현되지 않는 경우 더욱 그렇다. 유리하게는, RNP의 사용은 외래 DNA를 세포에 전달할 것을 필요로 하지 않는다. 더욱이, 핵산 결합 단백질 및 gRNA 복합체를 포함하는 RNP는 시간이 지남에 따라 분해되기 때문에, RNP의 사용은 표적외 효과를 제한할 가능성이 있다. 플라스미드 기반 기법과 유사한 방식으로, RNP를 사용하여 결합 단백질(예를 들어, Cas9 변이체)을 전달하고 및 직접 상동성 지정 복구(HDR)를 지시할 수 있다.
CRISPR 시스템(예를 들어, 본 명세서에 기재된 Cas9를 포함함)을 유도하는 데 사용되는 프로모터는 AAV ITR을 포함할 수 있다. 이는 벡터에서 공간을 차지할 수 있는 추가적인 프로모터 요소의 필요성을 제거하는 데 유리할 수 있다. 확보된 추가적인 공간은 가이드 핵산 또는 선별 마커와 같은 추가적인 요소의 발현을 유도하는 데 사용될 수 있다. ITR 활성은 상대적으로 약하므로 선택된 뉴클레이스의 과발현으로 인한 잠재적인 독성을 줄이는 데 사용될 수 있다.
임의의 적합한 프로모터가 Cas9 및 적절한 경우 가이드 핵산의 발현을 유도하는 데 사용될 수 있다. 편재적 발현의 경우, 사용될 수 있는 프로모터는 CMV, CAG, CBh, PGK, SV40, 페리틴 중쇄 또는 경쇄 등을 포함한다. 뇌 또는 기타 CNS 세포 발현의 경우, 적합한 프로모터는 모든 뉴런의 경우 시냅신I, 흥분성 뉴런의 경우 CaMKIIalpha, GABA성 뉴런의 경우 GAD67 또는 GAD65 또는 VGAT 등을 포함할 수 있다. 간 세포 발현의 경우, 적합한 프로모터는 알부민 프로모터를 포함한다. 폐 세포 발현의 경우, 적합한 프로모터는 SP-B를 포함할 수 있다. 내피 세포의 경우, 적합한 프로모터는 ICAM을 포함할 수 있다. 조혈 세포의 경우, 적합한 프로모터는 IFNbeta 또는 CD45를 포함할 수 있다. 조골세포의 경우, 적합한 프로모터는 OG-2를 포함할 수 있다.
일부 경우에, 본 개시내용의 Cas9는 별도의 프로모터가 동일한 핵산 분자 내에서 염기 편집기 및 상용성 가이드 핵산의 발현을 유도할 수 있도록 하기에 충분히 작은 크기를 갖는다. 예를 들어, 벡터 또는 바이러스 벡터는 염기 편집기를 암호화하는 핵산에 작동 가능하게 연결된 제1 프로모터 및 가이드 핵산에 작동 가능하게 연결된 제2 프로모터를 포함할 수 있다.
가이드 핵산의 발현을 유도하는 데 사용되는 프로모터는 U6 또는 H1과 같은 Pol III 프로모터를 포함할 수 있다. gRNA 아데노 관련 바이러스(AAV)를 발현시키기 위한 Pol II 프로모터 및 인트론성 카세트의 사용.
하나 이상의 가이드 핵산이 있거나 없는 본 명세서에 기재된 Cas9는 아데노 관련 바이러스(AAV), 렌티바이러스, 아데노바이러스 또는 기타 플라스미드 또는 바이러스 벡터 유형을 사용, 특히, 예를 들어, 미국 특허 제8,454,972호(아데노바이러스에 대한 제형, 용량), 미국 특허 제8,404,658호(AAV에 대한 제형, 용량) 및 미국 특허 제5,846,946호(DNA 플라스미드에 대한 제형, 용량) 및 렌티바이러스, AAV 및 아데노바이러스와 관련된 임상 시험에 관한 임상 시험 및 간행물로부터의 제형 및 용량을 사용하여 전달될 수 있다. 예를 들어, AAV의 경우, 투여 경로, 제형 및 용량은 미국 특허 제8,454,972호 및 AAV와 관련된 임상 시험에서와 같을 수 있다. 아데노바이러스의 경우, 투여 경로, 제형 및 용량은 미국 특허 제8,404,658호 및 아데노바이러스와 관련된 임상 시험에서와 같을 수 있다. 플라스미드 전달의 경우, 투여 경로, 제형 및 용량은 미국 특허 제5,846,946호 및 플라스미드와 관련된 임상 연구에서와 같을 수 있다. 용량은 평균 70㎏의 개체(예를 들어, 성인 남성)를 기준으로 하거나 이에 대해 추정될 수 있으며, 다양한 체중과 종의 환자, 대상체, 포유동물에 대해 적합화될 수 있다. 투여 빈도는 연령, 성별, 전반적인 건강 상태, 환자 또는 대상체의 다른 병태 및 해결하려는 특정 병태 또는 증상을 포함한 일반적인 요인에 따라 의료 또는 수의 종사자(예를 들어, 의사, 수의사)의 영역 내에 있다. 바이러스 벡터는 관심 조직에 주입될 수 있다. 세포 유형 특이적 염기 편집의 경우, 염기 편집기 및 선택적 가이드 핵산의 발현은 세포 유형 특이적 프로모터에 의해 유도될 수 있다.
생체내 전달의 경우, AAV는 다른 바이러스 벡터에 비해 유리할 수 있다. 일부 경우에, AAV는 낮은 독성을 허용하며, 이는 면역 반응을 활성화시킬 수 있는 세포 입자의 초원심분리가 필요하지 않은 정제 방법 때문일 수 있다. 일부 경우에, AAV는 숙주 게놈에 통합되지 않기 때문에 삽입 돌연변이유발 가능성을 낮춘다.
AAV는 4.5Kb 또는 4.75Kb의 패키징 제한을 갖는다. 4.5Kb 또는 4.75Kb보다 큰 작제물은 바이러스 생산을 크게 감소시킬 수 있다. 예를 들어, SpCas9는 상당히 크고, 유전자 자체가 4.1Kb를 초과하여 AAV에 패키징하기 어렵다. 따라서, 본 개시내용의 실시형태는 기존의 Cas9보다 길이가 더 짧은 개시된 Cas9를 이용하는 것을 포함한다.
AAV는 AAV1, AAV2, AAV5 또는 이들의 임의의 조합일 수 있다. 표적화할 세포와 관련하여 AAV의 유형을 선택할 수 있고; 예를 들어, 뇌 또는 신경 세포를 표적화하기 위해 AAV 혈청형 1, 2, 5 또는 하이브리드 캡시드 AAV1, AAV2, AAV5 또는 이들의 임의의 조합을 선택할 수 있고; 심장 조직을 표적화하기 위해 AAV4를 선택할 수 있다. AAV8은 간으로의 전달에 유용하다. 이들 세포에 관한 소정의 AAV 혈청형의 표는 문헌[Grimm, D. et al, J. Virol. 82: 5887-5911 (2008)]에서 찾을 수 있다.
렌티바이러스는 유사분열 및 유사분열 후 세포 모두에서 유전자를 감염시키고 발현시키는 능력을 갖는 복합 레트로바이러스이다. 가장 일반적으로 공지된 렌티바이러스는 다른 바이러스의 외피 당단백질을 사용하여 광범위한 세포 유형을 표적으로 하는 인간 면역결핍 바이러스(HIV)이다.
렌티바이러스는 다음과 같이 제조될 수 있다. pCasES10(렌티바이러스 전달 플라스미드 백본을 포함함)을 클로닝한 후, 형질감염 전날 T-75 플라스크에 낮은 계대(p=5)의 HEK293FT를 50% 컨플루언스까지 10% 소태아 혈청을 함유한 항생제가 없는 DMEM에 시딩한다. 20시간 후, 배지는 OptiMEM(무혈청) 배지로 변경하고, 4시간 후에 형질감염을 수행한다. 세포를 10㎍의 렌티바이러스 전달 플라스미드(pCasES10)와 다음 패키징 플라스미드: 5㎍의 pMD2.G(VSV-g 슈도형) 및 7.5㎍의 psPAX2(gag/pol/rev/tat)로 형질감염시킨다. 형질감염은 양이온성 지질 전달제(50㎕ 리포펙타민 2000 및 100㎕ Plus 시약)를 사용하여 4㎖ OptiMEM에서 수행할 수 있다. 6시간 후, 배지를 10% 소태아 혈청을 함유한 항생제가 없는 DMEM으로 변경한다. 이러한 방법은 세포 배양 중에 혈청을 사용하지만, 무혈청 방법이 바람직하다.
렌티바이러스는 다음과 같이 정제될 수 있다. 48시간 후에 바이러스 상청액을 수거한다. 상청액에서 먼저 찌꺼기를 제거하고, 0.45㎛의 낮은 단백질 결합(PVDF) 필터를 통해 여과한다. 그런 다음, 이를 초원심분리기에서 24,000rpm으로 2시간 동안 회전시킨다. 바이러스 펠릿을 4℃에서 밤새 50㎕의 DMEM에 재현탁시킨다. 그런 다음, 이를 분취하고, 즉시 -80℃에서 동결시킨다.
또 다른 실시형태에서, 말 감염성 빈혈 바이러스(equine infectious anemia virus: EIAV)에 기반한 최소 비영장류 렌티바이러스 벡터도 상정된다. 또 다른 실시형태에서, 망막하 주사를 통해 전달되는 것으로 상정되는 혈관신생 억제성 단백질인 엔도스타틴 및 안지오스타틴을 발현하는 말 감염성 빈혈 바이러스 기반 렌티바이러스 유전자 요법 벡터인 RetinoStat®가 상정된다. 또 다른 실시형태에서, 자가 불활성화 렌티바이러스 벡터의 사용이 상정된다.
시스템의 임의의 RNA, 예를 들어, 가이드 RNA 또는 Cas9 암호화 mRNA는 RNA의 형태로 전달될 수 있다. Cas9 암호화 mRNA는 시험관내 전사를 사용하여 생성될 수 있다. 예를 들어, Cas9 mRNA는 다음 요소: T7 프로모터, 선택적 코작(kozak) 서열(GCCACC), 뉴클레이스 서열 및 베타 글로빈-폴리A 꼬리로부터의 3' UTR과 같은 3' UTR을 포함하는 PCR 카세트를 사용하여 합성될 수 있다. 카세트는 T7 폴리머레이스에 의한 전사에 사용될 수 있다. 가이드 폴리뉴클레오타이드(예를 들어, gRNA)는 또한 T7 프로모터, 이어서 "GG" 서열 및 가이드 폴리뉴클레오타이드 서열을 포함하는 카세트로부터 시험관내 전사를 사용하여 전사될 수 있다.
발현을 향상시키고 가능한 독성을 감소시키기 위해, Cas9 서열 및/또는 가이드 핵산은, 예를 들어, 슈도-U 또는 5-메틸-C를 사용하여 하나 이상의 변형된 뉴클레오사이드를 포함하도록 변형될 수 있다.
일부 실시형태의 개시내용은 세포 또는 유기체를 변형시키는 방법을 포함한다. 세포는 원핵생물 세포 또는 진핵생물 세포일 수 있다. 세포는 포유동물 세포일 수 있다. 포유동물 세포는 비인간 영장류, 소, 돼지, 설치류 또는 마우스 세포일 수 있다. 본 개시내용 염기 편집기, 조성물 및 방법에 의해 세포에 도입된 변형은 항체, 전분, 알코올 또는 다른 목적하는 세포 생산물(output)과 같은 생물학적 산물의 개선된 생산을 위해 세포 및 세포의 자손이 변경되도록 하는 것일 수 있다. 본 개시내용의 방법에 의해 세포에 도입된 변형은 세포 및 세포의 자손이 생산된 생물학적 산물을 변화시키는 변경을 포함하도록 하는 것일 수 있다.
시스템은 하나 이상의 상이한 벡터를 포함할 수 있다. 양태에서, Cas9는 목적하는 세포 유형, 우선적으로 진핵생물 세포, 바람직하게는 포유동물 세포 또는 인간 세포의 발현을 위해 코돈 최적화된다.
일반적으로, 코돈 최적화는 천연 서열의 적어도 하나의 코돈(예를 들어, 약 1개, 2개, 3개, 4개, 5개, 10개, 15개, 20개, 25개, 50개 또는 그 이상의 코돈)을 천연 아미노산 서열을 유지하면서 해당 숙주 세포의 유전자에서 더 빈번하게 또는 가장 빈번하게 사용되는 코돈으로 대체함으로써 관심 숙주 세포에의 향상된 발현을 위해 핵산 서열을 변형시키는 과정을 지칭한다. 다양한 종은 특정 아미노산의 소정의 코돈에 대해 특정 편향을 나타낸다. 코돈 편향(유기체 간 코돈 사용의 차이)은 종종 메신저 RNA(mRNA)의 번역 효율과 상관관계가 있으며, 이는 무엇보다도 번역되는 코돈의 특성과 특정 전달 RNA(tRNA) 분자의 가용성에 따라 달라지는 것으로 여겨진다. 세포에서 선택된 tRNA의 우세는 일반적으로 펩타이드 합성에서 가장 빈번하게 사용되는 코돈을 반영한다. 따라서, 유전자는 코돈 최적화를 기반으로 주어진 유기체에서 최적의 유전자 발현을 위해 맞춤화될 수 있다. 코돈 사용 표는, 예를 들어, www.kazusa.orjp/codon/(2002년 7월 9일 방문)에서 이용 가능한 "코돈 사용 데이터베이스"에서 쉽게 입수할 수 있으며, 이러한 표는 다양한 방식으로 적합화될 수 있다. 문헌[Nakamura, Y., et al. "Codon usage tabulated from the international DNA sequence databases: status for the year 2000" Nucl. Acids Res. 28:292 (2000)]을 참조한다. 발현 특정 숙주 세포에서의 발현을 위해 특정 서열을 최적화하는 코돈에 대한 컴퓨터 알고리즘도 이용 가능하며, 예컨대, Gene Forge(Aptagen; 펜실베니아 자코부스 소재)도 이용 가능하다. 일부 실시형태에서, 조작된 뉴클레이스를 암호화하는 서열의 하나 이상의 코돈(예를 들어, 1개, 2개, 3개, 4개, 5개, 10개, 15개, 20개, 25개, 50개 이상 또는 모든 코돈)은 특정 아미노산에 대해 가장 빈번하게 사용되는 코돈에 해당한다.
패키징 세포는 전형적으로 숙주 세포를 감염시킬 수 있는 바이러스 입자를 형성하는 데 사용된다. 이러한 세포는 아데노바이러스를 패키징하는 293 세포 및 레트로바이러스를 패키징하는 psi.2 세포 또는 PA317 세포를 포함한다. 유전자 요법에 사용되는 바이러스 벡터는 일반적으로 핵산 벡터를 바이러스 입자에 패키징하는 세포주를 생산함으로써 생성된다. 벡터는 전형적으로 패키징 및 숙주로의 후속 통합에 필요한 최소 바이러스 서열을 포함하며, 다른 바이러스 서열은 발현될 폴리뉴클레오타이드(들)에 대한 발현 카세트로 대체된다. 누락된 바이러스 기능은 전형적으로 패키징 세포주에 의해 트랜스로(in trans) 공급된다. 예를 들어, 유전자 요법에 사용되는 AAV 벡터는 전형적으로 패키징 및 숙주 게놈으로의 통합에 필요한 AAV 게놈으로부터의 ITR 서열만을 보유한다. 바이러스 DNA는 다른 AAV 유전자, 즉, rep 및 cap를 암호화하는 헬퍼 플라스미드를 포함하지만 ITR 서열이 결여되어 있는 세포주에 패키징될 수 있다. 세포주는 또한 헬퍼로서 아데노바이러스에 감염될 수도 있다. 헬퍼 바이러스는 AAV 벡터의 복제 및 헬퍼 플라스미드로부터의 AAV 유전자의 발현을 촉진할 수 있다. 일부 경우에, 헬퍼 플라스미드는 ITR 서열의 결여로 인해 충분한 양으로 패키징되지 않는다. 아데노바이러스에 의한 오염은, 예를 들어, 아데노바이러스가 AAV보다 더 민감한 열 처리에 의해 감소될 수 있다.
약제학적 조성물
본 개시내용의 다른 양태는 CRISPR 시스템(예를 들어, 본 명세서에 개시된 Cas9 포함)을 포함하는 약제학적 조성물을 지칭한다. 본 명세서에서 사용되는 용어 "약제학적 조성물"은 약제학적 용도로 제형화되는 조성물을 지칭한다. 일부 실시형태에서, 약제학적 조성물은 약제학적으로 허용 가능한 담체를 추가로 포함한다. 일부 실시형태에서, 약제학적 조성물은 추가적인 작용제(예를 들어, 특정 전달, 반감기를 증가를 위한 것 또는 다른 치료용 화합물)를 포함한다.
본 명세서에서 사용되는 용어 "약제학적으로 허용 가능한 담체"는 신체의 한 부위(예를 들어, 전달 부위)에서 또 다른 부위(예를 들어, 기관, 조직 또는 신체의 일부)로의 화합물의 운반 또는 수송에 관여하는 액체 또는 고체 충전제, 희석제, 부형제, 제조 보조제(예를 들어, 윤활제, 활석 마그네슘, 칼슘 또는 아연 스테아레이트 또는 스테아르산) 또는 용매 캡슐화 물질과 같은 약제학적으로 허용 가능한 물질, 조성물 또는 비히클을 의미한다. 약제학적으로 허용 가능한 담체는 제형의 다른 성분과 상용성이 있고 대상체의 조직에 해를 끼치지 않는다는(예를 들어, 생리학적으로 적합, 멸균, 생리학적 pH 등) 의미에서 "허용 가능"하다.
약제학적으로 허용 가능한 담체로서 작용할 수 있는 물질의 일부 비제한적인 예는 다음을 포함한다: (1) 당, 예컨대, 락토스, 포도당 및 수크로스; (2) 전분, 예컨대, 옥수수 전분 및 감자 전분; (3) 셀룰로스 및 이의 유도체, 예컨대, 소듐 카복시메틸 셀룰로스, 메틸셀룰로스, 에틸 셀룰로스, 미세결정질 셀룰로스 및 셀룰로스 아세테이트; (4) 분말 트래거캔트; (5) 맥아; (6) 젤라틴; (7) 윤활제, 예컨대, 마그네슘 스테아레이트, 소듐 라우릴 설페이트 및 활석; (8) 부형제, 예컨대, 코코아 버터 및 좌약 왁스; (9) 오일, 예컨대, 땅콩유, 면실유, 홍화유, 참깨유, 올리브유, 옥수수유 및 대두유; (10) 글리콜, 예컨대, 프로필렌 글리콜; (11) 폴리올, 예컨대, 글리세린, 소르비톨, 만니톨 및 폴리에틸렌 글리콜(PEG); (12) 에스터, 예컨대, 에틸 올리에이트 및 에틸 라우레이트; (13) 아가; (14) 완충제, 예컨대, 마그네슘 하이드록사이드 및 알루미늄 하이드록사이드; (15) 알긴산; (16) 무발열원수; (17) 등장성 식염수; (18) 링거액; (19) 에틸 알코올; (20) pH 완충 용액; (21) 폴리에스터, 폴리카보네이트 및/또는 폴리무수물; (22) 증량제, 예컨대, 폴리펩타이드 및 아미노산; (23) 혈청 알코올, 예컨대, 에탄올; 및 (23) 약제학적 제형에 사용되는 기타 무독성 상용 물질. 습윤제, 착색제, 방출제, 코팅제, 감미제, 향미제, 향료, 방부제 및 항산화제도 제형에 존재할 수 있다. "부형제", "담체", "약제학적으로 허용 가능한 담체", "비히클" 등과 같은 용어는 본 명세서에서 상호교환적으로 사용된다.
약제학적 조성물은 제형의 pH를 약 5.0 내지 약 8.0의 범위와 같은 생리학적 pH를 반영하는 미리 결정된 수준으로 유지하기 위해 1종 이상의 pH 완충 화합물을 포함할 수 있다. 수성 액체 제형에 사용되는 pH 완충 화합물은 아미노산 또는 아미노산의 혼합물, 예컨대, 히스티딘 또는 히스티딘과 글리신의 혼합물과 같은 아미노산의 혼합물일 수 있다. 대안적으로, pH 완충 화합물은 바람직하게는 제형의 pH를 약 5.0 내지 약 8.0의 범위와 같은 미리 결정된 수준으로 유지하고 칼슘 이온을 킬레이트화하지 않는 작용제이다. 이러한 pH 완충 화합물의 예시적인 예는 이미다졸 및 아세테이트 이온을 포함하지만 이에 제한되지 않는다. pH 완충 화합물은 제형의 pH를 미리 결정된 수준으로 유지하는 데 적합한 임의의 양으로 존재할 수 있다.
약제학적 조성물은 또한 하나 이상의 삼투 조절제, 즉, 제형의 삼투 특성(예를 들어, 긴장성, 삼투질 농도 및/또는 삼투압)을 수용자 개인의 혈류 및 혈액 세포에 허용 가능한 수준으로 조절하는 화합물을 포함할 수 있다. 삼투 조절제는 칼슘 이온을 킬레이트화하지 않는 작용제일 수 있다. 삼투 조절제는 제형의 삼투 특성을 조절하는 당업자에게 공지되거나 당업자가 이용 가능한 임의의 화합물일 수 있다. 당업자는 본 발명의 제형에 사용하기 위한 주어진 삼투 조절제의 적합성을 경험적으로 결정할 수 있다. 삼투 조절제의 적합한 유형의 예시적인 예는 염, 예컨대, 소듐 클로라이드 및 소듐 아세테이트; 당, 예컨대, 수크로스, 덱스트로스 및 만니톨; 아미노산, 예컨대, 글리신; 및 이러한 작용제 및/또는 작용제의 유형 중 하나 이상의 혼합물을 포함하지만 이에 제한되지 않는다. 삼투 조절제(들)는 제형의 삼투 특성을 조절하기에 충분한 임의의 농도로 존재할 수 있다.
일부 실시형태에서, 약제학적 조성물은, 예를 들어, 유전자 편집을 위해 대상체에게 전달하기 위해 제형화된다. 본 명세서에 기재된 약제학적 조성물을 투여하기에 적합한 경로는 제한 없이 국소, 피하, 경피, 피내, 병변내, 관절내, 복강내, 방광내, 경점막, 치은, 치아내, 달팽이관내, 경고막, 기관내, 경막외, 경막내, 근육내, 정맥내, 혈관내, 골내, 안구주위, 종양내, 뇌내 및 뇌실내 투여를 포함한다.
일부 실시형태에서, 본 명세서에 기재된 약제학적 조성물은 병든 부위에 국부적으로 투여된다. 일부 실시형태에서, 본 명세서에 기재된 약제학적 조성물은 주사, 카테터, 좌약, 또는 시알라스틱(sialastic) 막 또는 섬유와 같은 막을 포함하는 다공성, 비다공성 또는 젤라틴성 물질인 이식물에 의해 대상체에게 투여된다.
다른 실시형태에서, 본 명세서에 기재된 약제학적 조성물은 제어 방출 시스템으로 전달된다. 일 실시형태에서, 펌프가 사용될 수 있다(예를 들어, 문헌[Langer, 1990, Science 249: 1527-1533; Sefton, 1989, CRC Crit. Ref. Biomed. Eng. 14:201; Buchwald et al., 1980, Surgery 88:507; Saudek et al., 1989, N. Engl. J. Med. 321:574] 참조). 또 다른 실시형태에서, 중합체 물질이 사용될 수 있다(예를 들어, 문헌[Medical Applications of Controlled Release (Langer and Wise eds., CRC Press, Boca Raton, Fla., 1974); Controlled Drug Bioavailability, Drug Product Design and Performance (Smolen and Ball eds., Wiley, New York, 1984); Ranger and Peppas, 1983, Macromol. Sci. Rev. Macromol. Chem. 23:61] 참조. 또한, 문헌[Levy et al., 1985, Science 228: 190; During et al., 1989, Ann. Neurol. 25:351; Howard et al, 1989, J. Neurosurg. 71: 105]도 참조). 다른 제어 방출 시스템도, 예를 들어, 상기 Langer에 논의되어 있다.
일부 실시형태에서, 약제학적 조성물은 대상체, 예를 들어, 인간에게 정맥내 또는 피하 투여하기 위해 적합화된 조성물로서 일상적인 절차에 따라 제형화된다. 일부 실시형태에서, 주사 투여용 약제학적 조성물은 가용화제로서 사용되는 멸균 등장성 용액과 주사 부위의 통증을 완화시키기 위한 리그노카인과 같은 국소 마취제이다. 일반적으로, 성분은 개별적으로 공급되거나, 예를 들어, 활성제의 양이 표시되어 있는 앰풀 또는 사셰와 같은 완전 밀폐된 용기에 건조 동결건조된 분말 또는 무수 농축액으로서 함께 혼합되어 공급된다. 주입 방식으로 의약품이 투여되는 경우, 멸균된 약제학적 등급의 물 또는 식염수가 들어 있는 주입 병과 함께 제공될 수 있다. 약제학적 조성물이 주사에 의해 투여되는 경우, 투여 전에 성분이 혼합될 수 있도록 멸균 주사용수 또는 식염수 앰풀이 제공될 수 있다.
전신 투여용 약제학적 조성물은 액체, 예를 들어, 멸균 식염수, 젖산 링거액 또는 행크 용액일 수 있다. 또한, 약제학적 조성물은 고체 형태일 수 있고, 사용 직전에 재용해되거나 현탁될 수 있다. 동결건조된 형태도 상정된다. 약제학적 조성물은 리포솜 또는 미세결정과 같은 지질 입자 또는 소포 내에 포함될 수 있으며, 이 또한 비경구 투여에 적합하다. 입자는 조성물이 그 안에 포함되어 있는 한 단일층 또는 복수층과 같은 임의의 적합한 구조일 수 있다. 화합물은 낮은 수준(5몰% 내지 10몰%)의 양이온성 지질인 융해성 지질 다이올레오일포스파티딜에탄올아민(DOPE)을 포함하는 "안정화된 플라스미드-지질 입자"(stabilized plasmid-lipid particle: SPLP)에 포획되고, 폴리에틸렌글리콜(PEG) 코팅에 의해 안정화될 수 있다(Zhang Y. P. et ah, Gene Ther. 1999, 6: 1438-47). N-[1-(2,3-다이올레오일옥시)프로필]-N,N,N-트라이메틸-암모늄메틸설페이트 또는 "DOTAP"와 같은 양으로 하전된 지질이 이러한 입자 및 소포에 특히 바람직하다. 이러한 지질 입자의 제조는 잘 알려져 있다. 예를 들어, 각각 참조에 의해 본 명세서에 원용되어 있는 미국 특허 제4,880,635호; 제4,906,477호; 제4,911,928호; 제4,917,951호; 제4,920,016호; 및 제4,921,757호를 참조한다.
본 명세서에 기재된 약제학적 조성물은, 예를 들어, 단위 용량으로 투여되거나 패키징될 수 있다. 본 개시내용의 약제학적 조성물과 관련하여 사용될 때 용어 "단위 용량"은 대상체에 대한 단위 투여량으로 적합한 물리적으로 별개의 단위를 지칭하며, 각 단위는 필요한 희석제와 관련하여 목적하는 치료적 효과를 생성하도록 계산된 미리 결정된 양의 활성 물질을 포함하는 단위; 즉, 담체 또는 비히클이다.
또한, 약제학적 조성물은 (a) 동결건조된 형태의 본 발명의 화합물을 함유하는 용기 및 (b) 약제학적으로 허용 가능한 희석제를 함유하는 제2 용기(예를 들어, 동결건조된 본 발명의 화합물의 재구성 또는 희석에 사용되는 멸균 용기)를 포함하는 약제학적 키트로서 제공될 수 있다. 선택적으로 이러한 용기(들)에는 의약품 또는 생물학적 제품의 제조, 사용 또는 판매를 규제하는 정부 기관에 의해 규정된 형식의 통지문이 포함될 수 있으며, 이는 인간 투여를 위한 제조, 사용 또는 판매 기관의 승인을 반영한다.
또 다른 양태에서, 위에 기재된 질환의 치료에 유용한 물질을 포함하는 제품이 포함된다. 일부 실시형태에서, 제품은 용기 및 라벨을 포함한다. 적합한 용기는, 예를 들어, 병, 바이알, 주사기 및 시험관을 포함한다. 용기는 유리 또는 플라스틱과 같은 다양한 물질로 만들어질 수 있다. 일부 실시형태에서, 용기는 본 명세서에 기재된 질환을 치료하는 데 효과적인 조성물을 담으며, 멸균 접근 포트를 가질 수 있다. 예를 들어, 용기는 피하 주사 바늘로 뚫을 수 있는 마개가 있는 정맥내 주사액 백 또는 바이알일 수 있다. 조성물 내 활성제는 본 발명의 화합물이다. 일부 실시형태에서, 용기 위 또는 이와 관련된 라벨은 조성물이 선택한 질환을 치료하는 데 사용된다는 것을 나타낸다. 제품은 인산 완충 식염수, 링거액 또는 덱스트로스 용액과 같은 약제학적으로 허용 가능한 완충액을 포함하는 제2 용기를 추가로 포함할 수 있다. 이는 다른 완충액, 희석제, 필터, 바늘, 주사기 및 사용 지침이 포함된 패키지 삽입물을 포함하여 상업적 및 사용자 관점에서 바람직한 다른 물질을 추가로 포함할 수 있다.
일부 실시형태에서, 약제학적 조성물의 일부로서 CRISPR 시스템(예를 들어, 본 명세서에 기재된 Cas9 포함)이 제공된다. 일부 실시형태에서, 약제학적 조성물은 본 명세서에 제공된 임의의 융합 단백질(예를 들어, LubCas9를 포함하는 본 명세서에 기재된 핵염기 편집기 포함)을 포함한다. 일부 실시형태에서, 약제학적 조성물은 본 명세서에 제공된 임의의 복합체를 포함한다. 일부 실시형태에서, 약제학적 조성물은 gRNA 및 양이온성 지질과 복합체를 형성하는 RNA 가이드된 뉴클레이스(예를 들어, Cas9)를 포함하는 리보핵단백질 복합체를 포함한다. 일부 실시형태에서, 약제학적 조성물은 gRNA, 핵산 프로그래밍 가능 DNA 결합 단백질, 양이온성 지질 및 약제학적으로 허용 가능한 부형제를 포함한다. 약제학적 조성물은 선택적으로 하나 이상의 추가적인 치료적으로 활성인 물질을 포함할 수 있다.
키트
일 양태에서, 본 발명은 위의 방법 및 조성물에 개시된 요소 중 임의의 중 하나 이상을 포함하는 키트를 제공한다. 일부 실시형태에서, 키트는 벡터 시스템 및 키트를 사용하기 위한 지침을 포함한다. 일부 실시형태에서, 벡터 시스템은 가이드 서열을 삽입하기 위한 하나 이상의 삽입 부위를 포함하되, 발현될 때 가이드 서열은 진핵동물 세포의 표적 서열에 대한 CRISPR 복합체의 서열 특이적 결합을 지시하고, CRISPR 복합체는 (1) 표적 서열에 혼성화되는 가이드 서열 및 (2) tracrRNA 서열에 혼성화되는 서열과 복합체를 이루는 CRISPR 효소; 및/또는 (b) 핵 국재화 서열을 포함하는 상기 CRISPR 효소를 암호화하는 효소 코딩 서열에 작동 가능하게 연결되는 제2 조절 요소를 포함한다. 요소는 개별적으로 또는 조합하여 제공될 수 있으며, 바이알, 병 또는 튜브와 같은 임의의 적합한 용기에 제공될 수 있다. 일부 실시형태에서, 키트는 하나 이상의 언어로, 예를 들어, 하나 초과의 언어로 된 지침을 포함한다.
일부 실시형태에서, 키트는 핵염기 편집기를 포함한다. 예를 들어, 일부 실시형태에서, 키트는 본 명세서에 기재된 Cas9 효소(ScoCas9, Seq2Cas9, EhiCas9, SeqCas9, SsiCas9, SinCas9, SsaCas9, Ssc2Cas9, Sor2Cas9, SorCas9, SwaCas9, SscCas9, SgaCas9, LkuCas9 및 SsuCas9)를 포함하는 핵염기 편집기를 포함한다.
일부 실시형태에서, 키트는 본 명세서에 기재된 요소 중 하나 이상을 사용하는 과정에 사용하기 위한 하나 이상의 시약을 포함한다. 시약은 임의의 적합한 용기에 제공될 수 있다. 예를 들어, 키트는 하나 이상의 반응 또는 보관 완충액을 제공할 수 있다. 시약은 특정 검정에 사용할 수 있는 형태 또는 사용 전 하나 이상의 다른 구성요소의 첨가를 필요로 하는 형태(예를 들어, 농축액 또는 동결건조된 형태)로 제공될 수 있다. 완충액은 소듐 카보네이트 완충액, 소듐 바이카보네이트 완충액, 보레이트 완충액, Tris 완충액, MOPS 완충액, HEPES 완충액 및 이들의 조합을 포함하지만 이에 제한되지 않는 임의의 완충액일 수 있다. 일부 실시형태에서, 완충액은 알칼리성이다. 일부 실시형태에서, 완충액은 pH가 약 7 내지 약 10이다. 일부 실시형태에서, 키트는 가이드 서열과 조절 요소에 작동 가능하게 연결하기 위해 벡터에 삽입하기 위한 가이드 서열에 상응하는 하나 이상의 올리고뉴클레오타이드를 포함한다. 일부 실시형태에서, 키트는 상동성 재조합 주형 폴리뉴클레오타이드를 포함한다.
본 명세서에 언급된 모든 간행물, 특허 출원, 특허 및 기타 참고문헌은 전체가 참조에 의해 원용된다. 또한, 물질, 방법 및 실시예는 예시일 뿐 제한하려는 의도는 아니다. 달리 정의하지 않는 한, 본 명세서에 사용된 모든 기술 및 과학 용어는 본 발명이 속하는 기술분야의 통상의 기술자가 일반적으로 이해하는 것과 동일한 의미를 갖는다. 본 명세서에 기재된 것과 유사하거나 등가인 방법 및 물질이 본 발명의 실시 또는 테스트에 사용될 수 있지만, 적합한 방법 및 물질이 본 명세서에 기재되어 있다.
실시예
다음 실시예는 본 발명을 제조하고 실시하는 바람직한 방식 중 일부를 설명한다. 그러나, 이러한 실시예는 단지 예시를 위한 것이며, 본 발명의 범위를 제한하려는 것이 아님을 이해하여야 한다.
실시예 1. 신규한 Cas9 효소에 대한 스크리닝, 신규한 Cas9 효소의 발견 및 최적화
본 실시예는 신규한 Cas9 효소의 발견하기 위한 스크리닝을 기술한다. 본 명세서에 기재된 바와 같이, 이 스크리닝을 사용하여 스트렙토코커스 에쿠이누스 ATCC 33317, 엔테로코커스 히라에 균주 F1129E, 스트렙토코커스 에쿠이누스 균주 AG46, 스타필로코커스 시뮬란스 균주 19, 스트렙토코커스 인터메디우스 B196 균주 G1552, 스트렙토코커스 상귀니스 SK330, 스트렙토코커스 종 C150, 스트렙토코커스 오랄리스 아종 오랄리스 균주 RH_1735_08, 스트렙토코커스 오랄리스 SK313, 스타필로코커스 와르네리 균주 691, 스타필로코커스 스키우리 균주 SNUC 2430, 스트렙토코커스 갈롤리티쿠스 균주 AM24-4, 락토바실러스 쿨라베르겐시스 균주 Biut2 및 스트렙토코커스 수이스 균주 LSS83 세균으로부터 신규한 Cas9 효소를 단리하고 최적화하였다.
신규한 PAM 서열을 인식하는 새로운 Cas9 효소를 발견하기 위한 검색에서, 생물정보학 스크리닝을 사용하여 CRISPR의 표적화 범위를 확장시키기 위한 추가적인 효소를 검색하였다. 스크리닝에는 라크노스피라 종(Lachnospira 종) LubCas9 또는 스트렙토코커스 콘스텔라투스(Streptococcus constellatus) ScoCas9로부터의 Cas9 시드 서열을 이용하였다. BLAST 히트(hit)를 고려하기 위해 e-값 임계값이 1e-6인 BLAST의 tblastn 변이체를 사용하여 생물정보학을 수행하였다. 간략하게는, 테스트를 위해 선택된 유전자좌는 다른 종으로부터의 Cas9 단백질의 존재하에 온전하게 남아 있는 유전자좌였다. CRISPR 어레이 내의 3개의 스페이서보다 크고, Cas9의 5'에 있는 1kb의 내인성 서열보다 크고, CRISPR 어레이의 3'에 있는 300nt보다 큰 유전자좌를 선택하였다. 이 접근법을 사용하여, 상이한 세균 종으로부터 신규한 Cas9 효소를 확인하고, 인간 세포에서의 발현을 위해 코돈 최적화하였다. 그런 다음, 신규한 조작된 Cas9 효소를 재조합적으로 생산하고 테스트하였다.
실시예 2. 스트렙토코커스 에쿠이누스 ATCC 33317, 엔테로코커스 히라에 균주 F1129E, 스트렙토코커스 에쿠이누스 균주 AG46, 스타필로코커스 시뮬란스 균주 19, 스트렙토코커스 인터메디우스 B196 균주 G1552, 스트렙토코커스 상귀니스 SK330, 스트렙토코커스 종 C150, 스트렙토코커스 오랄리스 아종 오랄리스 균주 RH_1735_08, 스트렙토코커스 오랄리스 SK313, 스타필로코커스 와르네리 균주 691, 스타필로코커스 스키우리 균주 SNUC 2430, 스트렙토코커스 갈롤리티쿠스 균주 AM24-4, 락토바실러스 쿨라베르겐시스 균주 Biut2 및 스트렙토코커스 수이스 균주 LSS83 세균으로부터의 신규한 Cas9 효소에 대한 3' PAM 컨센서스 모티프의 확인
본 실시예는 스트렙토코커스 에쿠이누스 ATCC 33317, 엔테로코커스 히라에 균주 F1129E, 스트렙토코커스 에쿠이누스 균주 AG46, 스타필로코커스 시뮬란스 균주 19, 스트렙토코커스 인터메디우스 B196 균주 G1552, 스트렙토코커스 상귀니스 SK330, 스트렙토코커스 종 C150, 스트렙토코커스 오랄리스 아종 오랄리스 균주 RH_1735_08, 스트렙토코커스 오랄리스 SK313, 스타필로코커스 와르네리 균주 691, 스타필로코커스 스키우리 균주 SNUC 2430, 스트렙토코커스 갈롤리티쿠스 균주 AM24-4, 락토바실러스 쿨라베르겐시스 균주 Biut2 및 스트렙토코커스 수이스 균주 LSS83 세균으로부터 단리된 인간 코돈 최적화된 Cas9에 대한 프로토스페이서 인접 모티프(PAM) 서열의 확인을 예시한다.
인간 코돈 최적화된 Cas9를 시험관내 PAM 식별 검정을 사용하여 PAM 서열 인식에 대해 테스트하였다. 무작위화된 PAM 서열을 보유하는 플라스미드의 라이브러리를 상이한 세균으로부터 단리된 Cas9와 인큐베이션하였다. 절단되지 않은 플라스미드를 정제하고 시퀀싱하여 절단된 특정 PAM 모티프를 확인하였다. 예를 들어, 스트렙토코커스 에쿠이누스 ATCC 33317로부터 조작된 Cas9는 컨센서스 PAM 서열 5'-NRGNR-3'를 인식하고(도 1a), 엔테로코커스 히라에 균주 F1129E는 컨센서스 PAM 서열 5'-NRG-3'를 인식하고(도 1b), 스트렙토코커스 에쿠이누스 균주 AG46(도 1c), 스타필로코커스 와르네리 균주 691(도 1j) 및 스타필로코커스 스키우리 균주 SNUC 2430(도 1k)은 컨센서스 PAM 서열 5'-NNGR-3'를 인식하고, 스타필로코커스 시뮬란스 균주 19는 컨센서스 PAM 서열 5'-NNGRRT-3'를 인식하고(도 1d), 스트렙토코커스 인터메디우스 B196 균주 G1552는 컨센서스 PAM 서열 5'-NNAAAA-3'를 인식하고(도 1e), 스트렙토코커스 상귀니스 SK330은 컨센서스 PAM 서열 5'-NGGNG-3'를 인식하고(도 1f), 스트렙토코커스 종 C150은 컨센서스 PAM 서열 5'-NNGNRG-3'를 인식하고(도 1g), 스트렙토코커스 오랄리스 아종 오랄리스 균주 RH_1735_08은 컨센서스 PAM 서열 5'-NNAAAC-3'를 인식하고(도 1h), 스트렙토코커스 오랄리스 SK313은 컨센서스 PAM 서열 5'-NNRAAG-3'를 인식하고(도 1i), 스트렙토코커스 갈롤리티쿠스 균주 AM24-4는 컨센서스 PAM 서열 5'-NNAYAA-3'를 인식하고(도 1l), 락토바실러스 쿨라베르겐시스 균주 Biut2는 컨센서스 PAM 서열 5'-NNGAAA-3'를 인식하고(도 1m) 및 스트렙토코커스 수이스 균주는 컨센서스 PAM 서열 5'-NNAAA-3'를 인식한다(도 1n)(H = A, C 또는 T; R = A 또는 G).
실시예 3. 스트렙토코커스 콘스텔라투스, 샤르페아 종(Sharpea spp.) 단리주 RUG017, 베일로넬라 파르불라(Veillonella parvula), 에자키엘라 페루엔시스(Ezakiella peruensis), 락토바실러스 퍼멘툼(Lactobacillus fermentum) 균주 AF15-40LB 및 펩토니필루스 종 마르세유(Peptoniphilus sp. Marseille)-P3761 세균으로부터의 신규한 Cas9 효소에 대한 sgRNA의 RNA 접힘 구조 예측
본 실시예는 신규한 Cas9 효소와 함께 사용하기 위한 crRNA 및 tracrRNA를 포함하는 예시적인 sgRNA의 예측된 RNA 접힘 구조를 보여준다.
Cas9 Crispr 유전자좌를 이종으로 발현하는 대장균 균주로부터 유래된 RNA에 대해 소형 RNA 시퀀싱을 수행하였다. 간략하게는, 먼저 트리졸에 대장균을 재현탁시킨 다음 3회의 1분 주기 동안 균질기에서 지르코니아/실리카 비드로 세균을 균질화하여 정지상(stationary phase) 세균으로부터 RNA를 단리하였다. 균질화된 샘플로부터 총 RNA를 정제하고, DNAse를 처리하고, T4 폴리뉴클레오타이드 카이네이스로 3' 탈인산화시키고, rRNA를 제거하였다. rRNA 고갈된 RNA로부터 RNA 라이브러리를 준비하고, 작은 RNA에 대해 크기를 선택하였다.
RNA 시퀀싱의 경우, 전사체는 대장균 폴리(A) 폴리머레이스로 폴리-A 꼬리를 첨가하고, T4 RNA 라이게이스 1을 사용하여 5' RNA 어댑터와 결찰시키고, 역전사시킨 후, 바코드 프라이머로 cDNA를 PCR 증폭시키고, MiSeq에서 시퀀싱하였다. 각 샘플로부터의 리드를 회합된 바코드를 기반으로 확인하였으며, BWA를 사용하여 참조 서열에 정렬시켰다. Picard 도구를 사용하여 전사체 서열을 추출하기 위해 페어드 엔드(Paired-end) 정렬을 사용하였으며, 서열은 Geneious 소프트웨어를 사용하여 분석하였다.
RNA 접힘은 Geneious 11.1.2 소프트웨어로부터의 예측을 기반으로 하였다. 단일 sgRNA 전사체는 crRNA를 부위 특이적 Cas9 활성을 가이드하는 데 필요한 이중 RNA 구조를 모방하는 tracrRNA에 융합시킨다. 스트렙토코커스 에쿠이누스 ATCC 33317로부터의 키메라 Seq2Cas9와 함께 사용하기 위한 sgRNA에 대한 예측된 RNA 접힘 구조는 도 2a에 도시되어 있고, 엔테로코커스 히라에 균주 F1129E로부터의 EhiCas9와 함께 사용하기 위한 sgRNA에 대한 것은 도 2b에 도시되어 있고, 스트렙토코커스 에쿠이누스 균주 AG46으로부터의 SeqCas9와 함께 사용하기 위한 sgRNA에 대한 것은 도 2c에 도시되어 있고, 스타필로코커스 시뮬란스 균주 19로부터의 SsiCas9와 함께 사용하기 위한 sgRNA에 대한 것은 도 2d에 도시되어 있고, 스트렙토코커스 인터메디우스 B196 균주 G1552로부터의 SinCas9와 함께 사용하기 위한 sgRNA에 대한 것은 도 2e에 도시되어 있고, 스트렙토코커스 상귀니스 SK330으로부터의 SsaCas9와 함께 사용하기 위한 sgRNA에 대한 것은 도 2f에 도시되어 있고, 스트렙토코커스 종 C150으로부터의 Ssc2Cas9와 함께 사용하기 위한 sgRNA에 대한 것은 도 2g에 도시되어 있고, 스트렙토코커스 오랄리스 아종 오랄리스 균주 RH_1735_08로부터의 Sor2Cas9와 함께 사용하기 위한 sgRNA에 대한 것은 도 2h에 도시되어 있고, 스트렙토코커스 오랄리스 아종 오랄리스 균주 RH_1735_08로부터의 Sor2Cas9와 함께 사용하기 위한 sgRNA에 대한 것은 도 2i에 도시되어 있고, 스타필로코커스 와르네리 균주 691로부터의 SwaCas9와 함께 사용하기 위한 sgRNA에 대한 것은 도 2j에 도시되어 있고, 스타필로코커스 스키우리 균주 SNUC 2430으로부터의 SsiCas9와 함께 사용하기 위한 sgRNA에 대한 것은 도 2k에 도시되어 있고, 스트렙토코커스 갈롤리티쿠스 균주 AM24-4로부터의 SgaCas9와 함께 사용하기 위한 sgRNA에 대한 것은 도 2l에 도시되어 있고, 락토바실러스 쿨라베르겐시스 균주 Biut2로부터의 LkuCas9와 함께 사용하기 위한 sgRNA에 대한 것은 도 2m에 도시되어 있고, 스트렙토코커스 수이스 균주 LSS83으로부터의 SsuCas9와 함께 사용하기 위한 sgRNA에 대한 것은 도 2n에 도시되어 있다.
실시예 4. 아데닌 염기 편집기(ABE) 또는 사이티딘 염기 편집기(CBE)의 N-말단 융합을 갖는 Cas9 효소에 의한 염기 편집
본 실시예는 아데닌 염기 편집기(ABE) 또는 사이티딘 염기 편집기(CBE)에 융합된 Cas9 효소의 염기 전환 효율을 예시한다.
간략하게는, 96-웰당 25,000개의 HEK293T 세포를 플레이팅하였다. 100ng의 Cas9 발현 플라스미드 및 100ng의 가이드 발현 플라스미드를 플레이팅 24시간 후에 형질감염시켰다. 세포를 형질감염 5일 후에 수거하고, DNA를 추출하였다.
HEK293T 세포에서 딥 시퀀싱을 수행하여 A에서 G로의 전환을 특성 규명하였다. 2라운드의 PCR 영역을 사용하여 예시적인 표적을 증폭시켜 Illumina 어댑터뿐만 아니라 고유한 바코드를 표적 앰플리콘에 추가하였다. PCR 산물을 2% 겔에서 전개시키고, 겔을 추출하였다. 샘플을 풀링하여 정량화하고, cDNA 라이브러리를 준비하고 MiSeq에서 시퀀싱하였다. A에서 G로의 전환 퍼센트는 N-말단뿐만 아니라 C-말단 TadA8 융합 작제물에 대한 딥 시퀀싱에 의해 결정하였다.
표 8은 Seq2Cas9와 함께 사용된 예시적인 가이드 RNA 서열을 보여준다. 도 3a는 Seq2Cas9 D10A 돌연변이체의 N-말단에 융합된 ABE를 포함하는 염기 편집기를 사용하여 달성된 아데닌에서 구아닌 염기(A에서 G)로의 전환 백분율의 결과를 보여주는 그래프이다.
표 9는 EhiCas9와 함께 사용된 예시적인 가이드 RNA 서열을 보여준다. 도 3b는 EhiCas9 D10A 돌연변이체의 N-말단에 융합된 ABE를 포함하는 염기 편집기를 사용하여 달성된 indel 빈도 및 아데닌에서 구아닌 염기(A에서 G)로의 전환 백분율의 결과를 보여주는 그래프이다.
표 10은 SeqCas9와 함께 사용된 예시적인 가이드 RNA 서열을 보여준다. 도 3c는 SeqCas9 D10A 돌연변이체의 N-말단에 융합된 ABE를 포함하는 염기 편집기를 사용하여 달성된 아데닌에서 구아닌 염기(A에서 G)로의 전환 백분율의 결과를 보여주는 그래프이다.
표 11은 SsiCas9와 함께 사용된 예시적인 가이드 RNA 서열을 보여준다. 도 3d는 SsiCas9 D10A 돌연변이체의 N-말단에 융합된 ABE를 포함하는 염기 편집기를 사용하여 달성된 아데닌에서 구아닌 염기(A에서 G)로의 전환 백분율의 결과를 보여주는 그래프이다.
표 12는 SinCas9와 함께 사용된 예시적인 가이드 RNA 서열을 보여준다. 도 3e는 SinCas9 D9A 돌연변이체의 N-말단에 융합된 ABE를 포함하는 염기 편집기를 사용하여 달성된 아데닌에서 구아닌 염기(A에서 G)로의 전환 백분율의 결과를 보여주는 그래프이다.
표 13은 SsaCas9와 함께 사용된 예시적인 가이드 RNA 서열을 보여준다. 도 3f는 SsaCas9 D11A 돌연변이체의 N-말단에 융합된 ABE를 포함하는 염기 편집기를 사용하여 달성된 아데닌에서 구아닌 염기(A에서 G)로의 전환 백분율의 결과를 보여주는 그래프이다.
표 14는 Ssc2Cas9와 함께 사용된 예시적인 가이드 RNA 서열을 보여준다. 도 3g는 Ssc2Cas9 D9A 돌연변이체의 N-말단에 융합된 ABE를 포함하는 염기 편집기를 사용하여 달성된 indel 빈도 및 아데닌에서 구아닌 염기(A에서 G)로의 전환 백분율의 결과를 보여주는 그래프이다.
표 15는 Sor2Cas9와 함께 사용된 예시적인 가이드 RNA 서열을 보여준다. 도 3h는 Sor2Cas9 D9A 돌연변이체의 N-말단에 융합된 ABE를 포함하는 염기 편집기를 사용하여 달성된 indel 빈도 및 아데닌에서 구아닌 염기(A에서 G)로의 전환 백분율의 결과를 보여주는 그래프이다.
표 16은 SorCas9와 함께 사용된 예시적인 가이드 RNA 서열을 보여준다. 도 3i는 SorCas9 D9A 돌연변이체의 N-말단에 융합된 ABE를 포함하는 염기 편집기를 사용하여 달성된 아데닌에서 구아닌 염기(A에서 G)로의 전환 백분율의 결과를 보여주는 그래프이다.
표 17은 SwaCas9와 함께 사용된 예시적인 가이드 RNA 서열을 보여준다. 도 3j는 SwaCas9 돌연변이체의 N-말단에 융합된 ABE를 포함하는 염기 편집기를 사용하여 달성된 아데닌에서 구아닌 염기(A에서 G)로의 전환 백분율의 결과를 보여주는 그래프이다.
표 18은 SscCas9와 함께 사용된 예시적인 가이드 RNA 서열을 보여준다. 도 3k는 SscCas9 돌연변이체의 N-말단에 융합된 ABE를 포함하는 염기 편집기를 사용하여 달성된 아데닌에서 구아닌 염기(A에서 G)로의 전환 백분율의 결과를 보여주는 그래프이다.
표 19는 SgaCas9와 함께 사용된 예시적인 가이드 RNA 서열을 보여준다. 도 3l은 SgaCas9 돌연변이체의 N-말단에 융합된 ABE를 포함하는 염기 편집기를 사용하여 달성된 아데닌에서 구아닌 염기(A에서 G)로의 전환 백분율의 결과를 보여주는 그래프이다.
표 20은 LkuCas9와 함께 사용된 예시적인 가이드 RNA 서열을 보여준다. 도 3m은 LkuCas9 돌연변이체의 N-말단에 융합된 ABE를 포함하는 염기 편집기를 사용하여 달성된 아데닌에서 구아닌 염기(A에서 G)로의 전환 백분율의 결과를 보여주는 그래프이다.
표 21은 SsuCas9와 함께 사용된 예시적인 가이드 RNA 서열을 보여준다. 도 3n은 SsuCas9 돌연변이체의 N-말단에 융합된 ABE를 포함하는 염기 편집기를 사용하여 달성된 아데닌에서 구아닌 염기(A에서 G)로의 전환 백분율의 결과를 보여주는 그래프이다.
표 23은 염기 편집 기능을 위한 예시적인 Cas9 아데노신 또는 아데닌에 대한 서열을 개시하고 있다.
등가물 및 범위
당업자는 단지 일상적인 실험을 사용하여 본 명세서에 기술된 본 발명의 특정 실시형태에 대한 많은 등가물을 인식하거나 확인할 수 있을 것이다. 본 발명의 범위는 상기 설명에 제한되는 것이 아니라, 다음의 청구범위에 제시된 바와 같다.
서열목록 전자파일 첨부

Claims (125)

  1. 스트렙토코커스 에쿠이누스(Streptococcus equinus) ATCC 33317 Cas9, 엔테로코커스 히라에(Enterococcus hirae) 균주 F1129E Cas9, 스트렙토코커스 에쿠이누스 균주 AG46 Cas9, 스타필로코커스 시뮬란스(Staphylococcus simulans) 균주 19 Cas9, 스트렙토코커스 인터메디우스(Streptococcus intermedius) B196 균주 G1552 Cas9, 스트렙토코커스 상귀니스(Streptococcus sanguinis) SK330 Cas9, 스트렙토코커스 종 C150 Cas9, 스트렙토코커스 오랄리스(Streptococcus oralis) 아종 오랄리스 균주 RH_1735_08 Cas9, 스트렙토코커스 오랄리스 SK313 Cas9, 스타필로코커스 와르네리(Staphylococcus warneri) 균주 691 Cas9, 스타필로코커스 스키우리(Staphylococcus stiuri) 균주 SNUC 2430 Cas9, 스트렙토코커스 갈롤리티쿠스(Streptococcus gallolyticus) 균주 AM24-4 Cas9, 락토바실러스 쿨라베르겐시스(Lactobacillus kullabergensis) 균주 Biut2 Cas9 또는 스트렙토코커스 수이스(Streptococcus suis) 균주 LSS83 Cas9로부터 변형된 조작된 비자연 발생적 신규한 Cas9 효소.
  2. 제1항에 있어서, 상기 스트렙토코커스 에쿠이누스 ATCC 33317 Cas9는 다음과 적어도 80%의 서열 동일성을 갖는, Cas9 단백질:
  3. 제1항에 있어서, 상기 엔테로코커스 히라에 균주 F1129E Cas9는 다음과 적어도 80%의 서열 동일성을 갖는, Cas9 단백질:
  4. 제1항에 있어서, 상기 스트렙토코커스 에쿠이누스 균주 AG46 Cas9는 다음과 적어도 80%의 서열 동일성을 갖는, Cas9 단백질:
  5. 제1항에 있어서, 상기 스타필로코커스 시뮬란스 균주 19 Cas9는 다음과 적어도 80%의 서열 동일성을 갖는, Cas9 단백질:
  6. 일부 실시형태에서, 스트렙토코커스 인터메디우스 B196 균주 G1552 Cas9 단백질은 다음과 적어도 80%의 서열 동일성을 갖는, Cas9 단백질:
  7. 제1항에 있어서, 상기 스트렙토코커스 상귀니스 SK330 Cas9는 다음과 적어도 80%의 서열 동일성을 갖는, Cas9 단백질:

  8. 제1항에 있어서, 상기 스트렙토코커스 종 C150 Cas9는 다음과 적어도 80%의 서열 동일성을 갖는, Cas9 단백질:
  9. 제1항에 있어서, 상기 스트렙토코커스 오랄리스 아종 오랄리스 균주 RH_1735_08 Cas9는 다음과 적어도 80%의 서열 동일성을 갖는, Cas9 단백질:
  10. 제1항에 있어서, 상기 스트렙토코커스 오랄리스 SK313 Cas9는 다음과 적어도 80%의 서열 동일성을 갖는, Cas9 단백질:
  11. 제1항에 있어서, 상기 스타필로코커스 와르네리 균주 691 Cas9는 다음과 적어도 80%의 서열 동일성을 갖는, Cas9 단백질:
  12. 제1항에 있어서, 상기 스타필로코커스 스키우리 균주 SNUC 2430 Cas9는 다음과 적어도 80%의 서열 동일성을 갖는, Cas9 단백질:
  13. 제1항에 있어서, 상기 스트렙토코커스 갈롤리티쿠스 균주 AM24-4 Cas9는 다음과 적어도 80%의 서열 동일성을 갖는, Cas9 단백질:
  14. 제1항에 있어서, 상기 락토바실러스 쿨라베르겐시스 균주 Biut2 Cas9는 다음과 적어도 80%의 서열 동일성을 갖는, Cas9 단백질:
  15. 제1항에 있어서, 상기 스트렙토코커스 수이스 균주 LSS83 Cas9는 다음과 적어도 80%의 서열 동일성을 갖는, Cas9 단백질:
  16. 제1항 내지 제15항 중 어느 한 항에 있어서, 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 14와 적어도 85%, 적어도 90%, 적어도 92%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일한 아미노산 서열을 포함하는, Cas9 단백질.
  17. 제1항 내지 제16항 중 어느 한 항에 있어서, 핵 국재화 서열(nuclear localization sequence: NLS) 및/또는 FLAG, HIS 또는 HA 태그 및/또는 데아미네이스를 추가로 포함하는, Cas9 단백질.
  18. 제17항에 있어서, 상기 스트렙토코커스 에쿠이누스 ATCC 33317 Cas9는 다음과 적어도 80% 동일한 아미노산 서열을 갖는, Cas9 단백질:
  19. 제17항에 있어서, 상기 엔테로코커스 히라에 균주 F1129E Cas9는 다음과 적어도 80% 동일한 아미노산 서열을 갖는, Cas9 단백질:
  20. 제17항에 있어서, 상기 스트렙토코커스 에쿠이누스 균주 AG46 Cas9는 다음과 적어도 80% 동일한 아미노산 서열을 갖는, Cas9 단백질:
  21. 제17항에 있어서, 상기 스트렙토코커스 인터메디우스 B196 균주 G1552 Cas9는 다음과 적어도 80% 동일한 아미노산 서열을 갖는, Cas9 단백질:
  22. 제17항에 있어서, 상기 스타필로코커스 시뮬란스 균주 19 Cas9는 다음과 적어도 80% 동일한 아미노산 서열을 갖는, Cas9 단백질:
  23. 제17항에 있어서, 상기 스트렙토코커스 상귀니스 SK330 Cas9는 다음과 적어도 80% 동일한 아미노산 서열을 갖는, Cas9 단백질:
  24. 제17항에 있어서, 상기 스트렙토코커스 종 C150 Cas9는 다음과 적어도 80% 동일한 아미노산 서열을 갖는, Cas9 단백질:
  25. 제17항에 있어서, 상기 스트렙토코커스 오랄리스 아종 오랄리스 균주 RH_1735_08 Cas9는 다음과 적어도 80% 동일한 아미노산 서열을 갖는, Cas9 단백질:
  26. 제17항에 있어서, 상기 스트렙토코커스 오랄리스 SK313 Cas9는 다음과 적어도 80% 동일한 아미노산 서열을 갖는, Cas9 단백질:
  27. 제17항에 있어서, 상기 스타필로코커스 와르네리 균주 691 Cas9는 다음과 적어도 80% 동일한 아미노산 서열을 갖는, Cas9 단백질:
  28. 제17항에 있어서, 상기 스타필로코커스 스키우리 균주 SNUC 2430 Cas9는 다음과 적어도 80% 동일한 아미노산 서열을 갖는, Cas9 단백질:
  29. 제17항에 있어서, 상기 스트렙토코커스 갈롤리티쿠스 균주 AM24-4 Cas9는 다음과 적어도 80% 동일한 아미노산 서열을 갖는, Cas9 단백질:
  30. 제17항에 있어서, 상기 락토바실러스 쿨라베르겐시스 균주 Biut2 Cas9는 다음과 적어도 80% 동일한 아미노산 서열을 갖는, Cas9 단백질:
  31. 제17항에 있어서, 상기 스트렙토코커스 수이스 균주 LSS83 Cas9는 다음과 적어도 80% 동일한 아미노산 서열을 갖는, Cas9 단백질:
  32. 제1항 내지 제31항 중 어느 한 항에 있어서, 상기 Cas9 단백질의 아미노산 서열은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 14에 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개 또는 적어도 10개의 돌연변이를 포함하는, Cas9 단백질.
  33. 제32항에 있어서, 상기 돌연변이는 아미노산 치환인, Cas9 단백질.
  34. 제1항 내지 제33항 중 어느 한 항에 있어서, 상기 Cas9 단백질은 닉케이스 활성을 갖는, Cas9 단백질.
  35. 제32항에 있어서, 상기 적어도 하나의 돌연변이는 불활성 Cas9(dCas9)를 초래하는, Cas9 단백질.
  36. 제1항 내지 제35항 중 어느 한 항에 있어서, 상기 Cas9 단백질은 PAM 상호작용, HNH 및/또는 RuvC 도메인에 적어도 하나의 아미노산 돌연변이를 포함하는, Cas9 단백질.
  37. 조작된 비자연 발생적 Cas9 융합 단백질로서, 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 14와 적어도 80%의 동일성을 갖는 Cas9 단백질을 포함하되, 상기 Cas9 단백질은 히스톤 데메틸레이스, 전사 활성화 인자 또는 데아미네이스에 융합되는, Cas9 단백질.
  38. 제37항에 있어서, 상기 Cas9 단백질은 사이토신 데아미네이스 또는 아데노신 데아미네이스에 융합되는, Cas9 단백질.
  39. 제38항에 있어서, 상기 Cas9 단백질은 아데노신 데아미네이스에 융합되며, 다음과 적어도 80% 동일한 아미노산 서열을 갖는, Cas9 단백질:
    (a)

    (b)

    (c)

    (d)

    (e)

    (f)

    (g)

    (h)

    (i)

    (j)

    (k)

    (l)

    (m)

    (n)
    .
  40. 제38항에 있어서, 상기 Cas9 단백질은 사이토신 데아미네이스에 융합되는, Cas9 단백질.
  41. 제2항에 있어서, 상기 Cas9 단백질은 5'-NRGNR-3'를 포함하는 PAM 서열을 인식하는, Cas9 단백질.
  42. 제3항에 있어서, 상기 Cas9 단백질은 5'-NRG-3'를 포함하는 PAM 서열을 인식하되, H는 아데닌, 사이토신 또는 티민인, Cas9 단백질.
  43. 제4항, 제11항 및 제12항 중 어느 한 항에 있어서, 상기 Cas9 단백질은 5'-NNGR-3'를 포함하는 PAM 서열을 인식하되, H는 아데닌, 사이토신 또는 티민이고, R은 아데닌 또는 구아닌인, Cas9 단백질.
  44. 제5항에 있어서, 상기 Cas9 단백질은 5'-NNGRRT-3'를 포함하는 PAM 서열을 인식하는, Cas9 단백질.
  45. 제6항에 있어서, 상기 Cas9 단백질은 5'-NNAAAA-3'를 포함하는 PAM 서열을 인식하는, Cas9 단백질.
  46. 제7항에 있어서, 상기 Cas9 단백질은 5'-NGGNG-3'를 포함하는 PAM 서열을 인식하는, Cas9 단백질.
  47. 제8항에 있어서, 상기 Cas9 단백질은 5'-NNGNRG-3'를 포함하는 PAM 서열을 인식하는, Cas9 단백질.
  48. 제9항에 있어서, 상기 Cas9 단백질은 5'-NNAAAC-3'를 포함하는 PAM 서열을 인식하는, Cas9 단백질.
  49. 제10항에 있어서, 상기 Cas9 단백질은 5'-NNRAAG-3'를 포함하는 PAM 서열을 인식하는, Cas9 단백질.
  50. 제13항에 있어서, 상기 Cas9 단백질은 5'-NNAYAA-3'를 포함하는 PAM 서열을 인식하는, Cas9 단백질.
  51. 제13항에 있어서, 상기 Cas9 단백질은 5'-NNGAAA-3'를 포함하는 PAM 서열을 인식하는, Cas9 단백질.
  52. 제13항에 있어서, 상기 Cas9 단백질은 5'-NNAAA-3'(H = A, C 또는 T; R = A 또는 G)를 포함하는 PAM 서열을 인식하는, Cas9 단백질.
  53. 제1항 내지 제52항 중 어느 한 항의 Cas9 단백질을 암호화하는 핵산.
  54. 제53항에 있어서, 상기 핵산은 포유동물 세포에서의 발현을 위해 코돈 최적화되는, 핵산.
  55. 제53항에 있어서, 상기 핵산은 인간 세포에서의 발현을 위해 코돈 최적화되는, 핵산.
  56. 제1항 내지 제52항 중 어느 한 항의 Cas9 단백질을 포함하는 진핵동물 세포.
  57. 제56항에 있어서, 상기 세포는 인간 세포인, 진핵동물 세포.
  58. 진핵동물 세포에서 표적 핵산을 절단하는 방법으로서,
    상기 세포를 제1항 내지 제52항 중 어느 한 항의 Cas9 및 RNA 가이드 또는 상기 RNA 가이드를 암호화하는 핵산과 접촉시키는 단계를 포함하되, 상기 RNA 가이드는 직접 반복 서열 및 표적 핵산에 혼성화될 수 있는 스페이서 서열을 포함하고, 그리고
    상기 Cas9 단백질은 상기 RNA 가이드에 결합할 수 있으며 상기 RNA 가이드와 상보적인 상기 표적 핵산 서열에 절단을 일으킬 수 있는, 방법.
  59. 진핵동물 세포에서 표적 핵산의 발현을 변경시키는 방법으로서,
    상기 세포를 제1항 내지 제52항 중 어느 한 항의 Cas9 및 RNA 가이드 또는 상기 RNA 가이드를 암호화하는 핵산과 접촉시키는 단계를 포함하되, 상기 RNA 가이드는 직접 반복 서열 및 표적 핵산에 혼성화될 수 있는 스페이서 서열을 포함하고, 그리고
    상기 Cas9 단백질은 상기 RNA 가이드에 결합할 수 있으며 상기 RNA 가이드와 상보적인 상기 표적 핵산 서열에 절단을 일으킬 수 있는, 방법.
  60. 진핵동물 세포에서 표적 핵산의 발현을 변경시키는 방법으로서,
    상기 세포를 제1항 내지 제52항 중 어느 한 항의 Cas9 및 RNA 가이드 또는 상기 RNA 가이드를 암호화하는 핵산과 접촉시키는 단계를 포함하되, 상기 RNA 가이드는 직접 반복 서열 및 표적 핵산에 혼성화될 수 있는 스페이서 서열을 포함하고, 그리고
    상기 Cas9 단백질은 상기 RNA 가이드에 결합할 수 있으며 상기 RNA 가이드와 상보적인 표적 핵산 서열을 편집할 수 있는, 방법.
  61. 진핵동물 세포에서 표적 핵산을 변형시키는 방법으로서,
    상기 세포를 제1항 내지 제52항 중 어느 한 항의 Cas9 및 RNA 가이드 또는 상기 RNA 가이드를 암호화하는 핵산과 접촉시키는 단계를 포함하되, 상기 RNA 가이드는 직접 반복 서열 및 표적 핵산에 혼성화될 수 있는 스페이서 서열을 포함하고, 그리고
    상기 Cas9 단백질은 상기 RNA 가이드에 결합할 수 있으며 상기 RNA 가이드와 상보적인 표적 핵산 서열을 편집할 수 있는, 방법.
  62. 제60항 또는 제61항에 있어서, 상기 Cas9 단백질은 불활성 Cas9(dCas9)인, 방법.
  63. 제62항에 있어서, 상기 dCas9는 데아미네이스에 융합되는, 방법.
  64. 제59항 내지 제63항 중 어느 한 항에 있어서, 상기 RNA 가이드는 crRNA 및 tracrRNA를 포함하는, 방법.
  65. 제59항 내지 제64항 중 어느 한 항에 있어서, 상기 RNA 가이드는 sgRNA를 포함하는, 방법.
  66. 제65항에 있어서, Seq2Cas9와 함께 사용하기 위한 상기 sgRNA는 5'-GUUUUAGUACUCUGUAAUUUUGAAAAAAAUUACAGAAUCUACUAAAACAAGGCAAAAUGCCGUGUUUAUCUCGUCAACUUGUUGACGAGAUUUUUUU-3'(서열번호 43)와 적어도 약 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함하는, 방법.
  67. 제65항에 있어서, EhiCas9와 함께 사용하기 위한 상기 sgRNA는 5'- GUUUUAGAGCUAUGUUGGAAACAACAUAGCGAGUUAAAAUAAGGCAUUGUCCGUUAUCAGCUUUUAAAGCAAGCACUGUCUCGGUGCUUUUUU-3'(서열번호 44)와 적어도 약 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함하는, 방법.
  68. 제65항에 있어서, SeqCas9와 함께 사용하기 위한 상기 sgRNA는 5'- GUUUUUGUACUCUCAAGAUUUGAAAAAAUCUUGCAGAGCCUACAAAGAUAAGGCUUCAUGCCGAAUUCAAGCACCCCAUGUUUACAUGGGGUGCUUUU-3'(서열번호 45)와 적어도 약 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함하는, 방법.
  69. 제65항에 있어서, SsiCas9와 함께 사용하기 위한 상기 sgRNA는 5'- GUUUUAGUACUCUGUAAUUUUGAAAAAAAUUACAGAAUCUACUAAAACAAGGCAAAAUGCCGUGUUUAUCUCGUCAACUUGUUUGGCGAGAUUUUUUUU-3'(서열번호 46)와 적어도 약 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함하는, 방법.
  70. 제65항에 있어서, SinCas9와 함께 사용하기 위한 상기 sgRNA는 5'-GUUUUUGUACUCUCAAGAUUUGAAAAAAUCUUGCAGAAGCUACAAAGAUAAGGCUUCAUGCCGAAAUCAACACCCUGUCUAUGACGGGGUGUUUU-3'(서열번호 47)와 적어도 약 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함하는, 방법.
  71. 제65항에 있어서, SsaCas9와 함께 사용하기 위한 상기 sgRNA는 5'-GUUUUAGAGCUGUGUUGUGAAAACAACACAGCAAGUUAAAAUAAGGCUUUGUCCGUACACAACUUGAAAAAGUGCGCACCGAUUCGGUGCUUUUUU-3'(서열번호 48)와 적어도 약 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함하는, 방법.
  72. 제65항에 있어서, Ssc2Cas9와 함께 사용하기 위한 상기 sgRNA는 5'-GUUUUUGUACUCUCAAGAUUUGAAAAAAUCUUGCAGAAGCUACAAAGAUAAGGCUUCAUGCCGAAAUCAACACCCUGUCAUUUUAUGGCAGGGUGUUUU-3'(서열번호 49)와 적어도 약 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함하는, 방법.
  73. 제65항에 있어서, Sor2Cas9와 함께 사용하기 위한 상기 sgRNA는 5'-GUUUUUGUACUCUCAAGAUUUGAAAAAAUCUUGCAGAAGCUACAAAGAUAAGGCUUCAUGCCGAAUUCAACACCCUGUCAUUUAUGGCGGGGUGUUUU-3'(서열번호 50)와 적어도 약 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함하는, 방법.
  74. 제65항에 있어서, SorCas9와 함께 사용하기 위한 상기 sgRNA는 5'-GUUUUUGUACUCUCAAGAUUUGAAAAAAUCUUGUAGAAGCUACAAAGAUAAGGCUUCAUGCCGAAUUCAACACCCUGUCAUUUAUGGCGGGGUGUUUCGUUUU-3'(서열번호 51)와 적어도 약 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함하는, 방법.
  75. 제65항에 있어서, SwaCas9와 함께 사용하기 위한 상기 sgRNA는 5'-GUUUUAGUACUCUGUAAUUUUGAAAAAAAUUACAGAAUCUACUGAAACAAGACUAUAUGUCGUGUUUAUCCCACUAAUUUAUUAGUGGGAUUUUUU-3'(서열번호 52)와 적어도 약 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함하는, 방법.
  76. 제65항에 있어서, SscCas9와 함께 사용하기 위한 상기 sgRNA는 5'-GUUUUAGUACUCUGUAAUUUUGAAAAAAAUUACAGAAUCUACUAAAACAAGGCAAAAUGCCGUGUUUAUCUCGUCAACUUGUUGACGAGAUUUUUUU-3'(서열번호 53)와 적어도 약 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함하는, 방법.
  77. 제65항에 있어서, SgaCas9와 함께 사용하기 위한 상기 sgRNA는 5'-GUUUUUGUACUCUCAAGAUUUGAAAAAAUCUUGCUGAGCCUACAAAGAUAAGGCUUUAUGCCGAAUUCAAGCACCCCAUGUUUUGACAUGGGGUGCUUUU-3'(서열번호 54)와 적어도 약 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함하는, 방법.
  78. 제65항에 있어서, LkuCas9와 함께 사용하기 위한 상기 sgRNA는 5'-GUUUUAGAUGAUUGUUAGAUCGAAAGAUCUAACAACCAGAUUUUAAAAUCAAACAAUGUAUCUUUGAUACUAAGUUUCAACGCGGUAUUAUUACCGUCCUGCCUCAGCUCUAUAGCGGAGGUUUUUU-3'(서열번호 55)와 적어도 약 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함하는, 방법.
  79. 제65항에 있어서, SsuCas9와 함께 사용하기 위한 상기 sgRNA는 5'-GUUUUUGUACUCUCAAGAUUUGAAAAAAUCUUGCAGAGCCUACAAAGAUAAGGCUUUAUGCCGAAAUCAAGCACCCCGUUUCGUACGGGGUGCUUUU-3'(서열번호 56)와 적어도 약 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함하는, 방법.
  80. 제64항에 있어서, 상기 crRNA는 약 16개 내지 26개의 뉴클레오타이드 길이의 가이드 서열을 포함하는, 방법.
  81. 제64항에 있어서, 상기 crRNA는 약 18개 내지 24개의 뉴클레오타이드 길이의 가이드 서열을 포함하는, 방법.
  82. 제58항 또는 제59항에 있어서, 상기 표적 핵산의 절단은 단일 가닥 또는 이중 가닥 절단인, 방법.
  83. 제82항에 있어서, 상기 표적 핵산의 절단은 단일 가닥 절단인, 방법.
  84. 제60항 또는 제61항에 있어서, 상기 Cas9 단백질은 상기 표적 핵산 서열의 두 가닥을 모두 절단하는 뉴클레이스이거나 상기 표적 핵산 서열의 한 가닥을 절단하는 닉케이스인, 방법.
  85. 제58항 내지 제84항 중 어느 한 항에 있어서, 상기 표적 핵산은 프로토스페이서 인접 모티프(PAM) 서열에 대해 5'인, 방법.
  86. 제58항 내지 제85항 중 어느 한 항에 있어서, 상기 Cas9는 진핵동물 세포에서 발현을 위해 프로모터 서열에 작동 가능하게 연결되고, 상기 가이드 RNA는 진핵동물 세포에서 발현을 위해 프로모터 서열에 작동 가능하게 연결되는, 방법.
  87. 제86항에 있어서, 상기 진핵동물 세포는 인간 세포인, 방법.
  88. 제86항에 있어서, 상기 프로모터 서열은 진핵동물 또는 바이러스 프로모터인, 방법.
  89. 조작된 비자연 발생적 CRISPR-Cas 시스템으로서,
    RNA 가이드 또는 상기 RNA 가이드를 암호화하는 핵산으로서, 상기 RNA 가이드는 직접 반복 서열 및 표적 핵산에 혼성화될 수 있는 스페이서 서열을 포함하는, 상기 RNA 가이드 또는 핵산; 및
    CRISPR 관련(Cas) 단백질로서, 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 14와 적어도 80%의 서열 동일성을 갖되, 상기 Cas 단백질은 상기 RNA 가이드에 결합할 수 있으며 상기 RNA 가이드와 상보적인 표적 핵산 서열에 절단을 일으킬 수 있는, 상기 CRISPR 관련(Cas) 단백질
    을 포함하는, 시스템.
  90. 조작된 비자연 발생적 CRISPR-Cas 시스템으로서,
    RNA 가이드 또는 상기 RNA 가이드를 암호화하는 핵산으로서, 상기 RNA 가이드는 직접 반복 서열 및 표적 핵산에 혼성화될 수 있는 스페이서 서열을 포함하는, 상기 RNA 가이드 또는 핵산; 및
    서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 14와 적어도 80%의 서열 동일성을 갖는 CRISPR 관련(Cas) 단백질
    을 포함하되; 상기 Cas 단백질은 데아미네이스에 융합되고, 상기 Cas 단백질 융합체는 상기 RNA 가이드에 결합할 수 있으며 상기 RNA 가이드와 상보적인 표적 핵산 서열을 편집할 수 있는, 시스템.
  91. 제90항에 있어서, 상기 Cas9 단백질은 불활성 Cas9(dCas9)인, 시스템.
  92. 제89항 내지 제91항 중 어느 한 항에 있어서, 상기 RNA 가이드는 crRNA 및 tracrRNA를 포함하는, 시스템.
  93. 제89항 내지 제92항 중 어느 한 항에 있어서, 상기 RNA 가이드는 sgRNA를 포함하는, 시스템.
  94. 제93항에 있어서, Seq2Cas9와 함께 사용하기 위한 상기 sgRNA는 5'-GUUUUAGUACUCUGUAAUUUUGAAAAAAAUUACAGAAUCUACUAAAACAAGGCAAAAUGCCGUGUUUAUCUCGUCAACUUGUUGACGAGAUUUUUUU-3'(서열번호 43)와 적어도 약 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함하는, 시스템.
  95. 제93항에 있어서, EhiCas9와 함께 사용하기 위한 상기 sgRNA는 5'-GUUUUAGAGCUAUGUUGGAAACAACAUAGCGAGUUAAAAUAAGGCAUUGUCCGUUAUCAGCUUUUAAAGCAAGCACUGUCUCGGUGCUUUUUU-3'(서열번호 44)와 적어도 약 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함하는, 시스템.
  96. 제93항에 있어서, SeqCas9와 함께 사용하기 위한 상기 sgRNA는 5'-GUUUUUGUACUCUCAAGAUUUGAAAAAAUCUUGCAGAGCCUACAAAGAUAAGGCUUCAUGCCGAAUUCAAGCACCCCAUGUUUACAUGGGGUGCUUUU-3'(서열번호 45)와 적어도 약 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함하는, 시스템.
  97. 제93항에 있어서, SsiCas9와 함께 사용하기 위한 상기 sgRNA는 5'-GUUUUAGUACUCUGUAAUUUUGAAAAAAAUUACAGAAUCUACUAAAACAAGGCAAAAUGCCGUGUUUAUCUCGUCAACUUGUUUGGCGAGAUUUUUUUU-3'(서열번호 46)와 적어도 약 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함하는, 시스템.
  98. 제93항에 있어서, SinCas9와 함께 사용하기 위한 상기 sgRNA는 5'-GUUUUUGUACUCUCAAGAUUUGAAAAAAUCUUGCAGAAGCUACAAAGAUAAGGCUUCAUGCCGAAAUCAACACCCUGUCUAUGACGGGGUGUUUU-3'(서열번호 47)와 적어도 약 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함하는, 시스템.
  99. 제93항에 있어서, SsaCas9와 함께 사용하기 위한 상기 sgRNA는 5'-GUUUUAGAGCUGUGUUGUGAAAACAACACAGCAAGUUAAAAUAAGGCUUUGUCCGUACACAACUUGAAAAAGUGCGCACCGAUUCGGUGCUUUUUU-3'(서열번호 48)와 적어도 약 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함하는, 시스템.
  100. 제93항에 있어서, Sor2Cas9와 함께 사용하기 위한 상기 sgRNA는 5'-GUUUUUGUACUCUCAAGAUUUGAAAAAAUCUUGCAGAAGCUACAAAGAUAAGGCUUCAUGCCGAAAUCAACACCCUGUCAUUUUAUGGCAGGGUGUUUU-3'(서열번호 49)와 적어도 약 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함하는, 시스템.
  101. 제93항에 있어서, Ssc2Cas9와 함께 사용하기 위한 상기 sgRNA는 5'-GUUUUUGUACUCUCAAGAUUUGAAAAAAUCUUGCAGAAGCUACAAAGAUAAGGCUUCAUGCCGAAAUCAACACCCUGUCAUUUUAUGGCAGGGUGUUUU-3'(서열번호 50)와 적어도 약 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함하는, 시스템.
  102. 제93항에 있어서, Sor2Cas9와 함께 사용하기 위한 상기 sgRNA는 5'-GUUUUUGUACUCUCAAGAUUUGAAAAAAUCUUGCAGAAGCUACAAAGAUAAGGCUUCAUGCCGAAUUCAACACCCUGUCAUUUAUGGCGGGGUGUUUU-3'(서열번호 51)와 적어도 약 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함하는, 시스템.
  103. 제93항에 있어서, SwaCas9와 함께 사용하기 위한 상기 sgRNA는 5'-GUUUUAGUACUCUGUAAUUUUGAAAAAAAUUACAGAAUCUACUGAAACAAGACUAUAUGUCGUGUUUAUCCCACUAAUUUAUUAGUGGGAUUUUUU-3'(서열번호 52)와 적어도 약 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함하는, 시스템.
  104. 제93항에 있어서, SscCas9와 함께 사용하기 위한 상기 sgRNA는 5'-GUUUUAGUACUCUGUAAUUUUGAAAAAAAUUACAGAAUCUACUAAAACAAGGCAAAAUGCCGUGUUUAUCUCGUCAACUUGUUGACGAGAUUUUUUU-3'(서열번호 53)와 적어도 약 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함하는, 시스템.
  105. 제93항에 있어서, SgaCas9와 함께 사용하기 위한 상기 sgRNA는 5'-GUUUUUGUACUCUCAAGAUUUGAAAAAAUCUUGCUGAGCCUACAAAGAUAAGGCUUUAUGCCGAAUUCAAGCACCCCAUGUUUUGACAUGGGGUGCUUUU-3'(서열번호 54)와 적어도 약 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함하는, 시스템.
  106. 제93항에 있어서, LkuCas9와 함께 사용하기 위한 상기 sgRNA는 5'-GUUUUAGAUGAUUGUUAGAUCGAAAGAUCUAACAACCAGAUUUUAAAAUCAAACAAUGUAUCUUUGAUACUAAGUUUCAACGCGGUAUUAUUACCGUCCUGCCUCAGCUCUAUAGCGGAGGUUUUUU-3'(서열번호 55)와 적어도 약 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함하는, 시스템.
  107. 제93항에 있어서, SsuCas9와 함께 사용하기 위한 상기 sgRNA는 5'-GUUUUUGUACUCUCAAGAUUUGAAAAAAUCUUGCAGAGCCUACAAAGAUAAGGCUUUAUGCCGAAAUCAAGCACCCCGUUUCGUACGGGGUGCUUUU -3'(서열번호 56)와 적어도 약 80%의 동일성을 갖는 서열을 포함하는 스캐폴드를 포함하는, 시스템.
  108. 제89항 내지 제97항 중 어느 한 항에 있어서, 상기 Cas 단백질을 암호화하는 핵산은 진핵동물 세포에서 발현을 위해 프로모터 서열에 작동 가능하게 연결되고, 상기 가이드 RNA는 진핵동물 세포에서 발현을 위해 프로모터 서열에 작동 가능하게 연결되는, 시스템.
  109. 제108항에 있어서, 상기 진핵동물 세포는 인간 세포인, 시스템.
  110. 제108항에 있어서, 상기 프로모터 서열은 진핵동물 프로모터 서열인, 시스템.
  111. 제89항 내지 제110항 중 어느 한 항의 시스템을 암호화하는 핵산.
  112. 제89항 내지 제110항 중 어느 한 항의 시스템을 포함하는 벡터.
  113. 제112항에 있어서, 상기 벡터는 플라스미드 벡터 또는 바이러스 벡터인, 벡터.
  114. 제113항에 있어서, 상기 바이러스 벡터는 아데노 관련 바이러스(AAV) 벡터 또는 렌티바이러스 벡터인, 벡터.
  115. 제114항에 있어서, 상기 바이러스 벡터는 AAV 벡터인, 벡터.
  116. 제115항에 있어서, 상기 하나 초과의 AAV 벡터는 제89항 내지 제110항의 시스템을 패키징하는 데 사용되는, 벡터.
  117. 장애 또는 질환의 치료를 필요로 하는 대상체에서 장애 또는 질환을 치료하는 방법으로서, 제89항 내지 제110항 중 어느 한 항의 시스템을 상기 대상체에게 투여하는 단계를 포함하되.
    상기 가이드 RNA는 상기 병태 또는 질환과 연관된 표적 핵산의 적어도 10개의 뉴클레오타이드와 상보적이고;
    상기 Cas 단백질은 상기 가이드 RNA와 회합하고;
    상기 가이드 RNA는 상기 표적 핵산에 결합하고;
    상기 Cas 단백질은 상기 표적 핵산의 절단을 유발하고, 선택적으로 상기 Cas9는 데아미네이스에 융합된 불활성 Cas9(dCas9)이며, 상기 표적 핵산에서 하나 이상의 염기 편집을 초래하여 장애 또는 질환을 치료하는, 방법.
  118. 제117항에 있어서, 상기 가이드 RNA는 약 18개 내지 24개의 뉴클레오타이드와 상보적인, 방법.
  119. 제118항에 있어서, 상기 가이드 RNA는 20개의 뉴클레오타이드와 상보적인, 방법.
  120. 제37항 내지 제40항 중 어느 한 항의 융합 단백질을 포함하는 염기 편집기.
  121. 제120항에 있어서, 아데노신 데아미네이스 도메인 또는 사이티딘 데아미네이스 도메인을 포함하는, 염기 편집기.
  122. 폴리뉴클레오타이드의 핵염기를 편집하는 방법으로서, 상기 폴리뉴클레오타이드를 하나 이상의 가이드 RNA와 복합체를 형성하는 제120항의 염기 편집기와 접촉시키는 단계를 포함하되, 상기 염기 편집기는 아데노신 데아미네이스 도메인을 포함하고, 상기 하나 이상의 가이드 RNA는 상기 염기 편집기를 표적화하여 상기 폴리뉴클레오타이드에서 A·T에서 G·C로의 변경을 초래하는, 방법.
  123. 폴리뉴클레오타이드의 핵염기를 편집하는 방법으로서, 상기 폴리뉴클레오타이드를 하나 이상의 가이드 RNA와 복합체를 형성하는 제120항의 염기 편집기와 접촉시키는 단계를 포함하되, 상기 염기 편집기는 사이티딘 데아미네이스 도메인을 포함하고, 상기 하나 이상의 가이드 RNA는 상기 염기 편집기를 표적화하여 상기 폴리뉴클레오타이드에서 C·G에서 T·A로의 변경을 초래하는, 방법.
  124. 제122항 또는 제123항에 있어서, 상기 편집은 상기 표적 폴리뉴클레오타이드 서열에서 50% 미만의 indel의 형성을 초래하는, 방법.
  125. 제122항 내지 제124항 중 어느 한 항에 있어서, 상기 편집은 점 돌연변이를 생성하는, 방법.
KR1020247023120A 2021-12-17 2022-12-16 신규한 crispr 효소, 방법, 시스템 및 이의 용도 KR20240116827A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163291252P 2021-12-17 2021-12-17
US63/291,252 2021-12-17
PCT/US2022/081728 WO2023114953A2 (en) 2021-12-17 2022-12-16 Novel crispr enzymes, methods, systems and uses thereof

Publications (1)

Publication Number Publication Date
KR20240116827A true KR20240116827A (ko) 2024-07-30

Family

ID=85172990

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020247023120A KR20240116827A (ko) 2021-12-17 2022-12-16 신규한 crispr 효소, 방법, 시스템 및 이의 용도

Country Status (4)

Country Link
KR (1) KR20240116827A (ko)
AU (1) AU2022413670A1 (ko)
CA (1) CA3240917A1 (ko)
WO (1) WO2023114953A2 (ko)

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4880635B1 (en) 1984-08-08 1996-07-02 Liposome Company Dehydrated liposomes
US4797368A (en) 1985-03-15 1989-01-10 The United States Of America As Represented By The Department Of Health And Human Services Adeno-associated virus as eukaryotic expression vector
US4921757A (en) 1985-04-26 1990-05-01 Massachusetts Institute Of Technology System for delayed and pulsed release of biologically active substances
US4920016A (en) 1986-12-24 1990-04-24 Linear Technology, Inc. Liposomes with enhanced circulation time
JPH0825869B2 (ja) 1987-02-09 1996-03-13 株式会社ビタミン研究所 抗腫瘍剤包埋リポソ−ム製剤
US4917951A (en) 1987-07-28 1990-04-17 Micro-Pak, Inc. Lipid vesicles formed of surfactants and steroids
US4911928A (en) 1987-03-13 1990-03-27 Micro-Pak, Inc. Paucilamellar lipid vesicles
US5173414A (en) 1990-10-30 1992-12-22 Applied Immune Sciences, Inc. Production of recombinant adeno-associated virus vectors
US5587308A (en) 1992-06-02 1996-12-24 The United States Of America As Represented By The Department Of Health & Human Services Modified adeno-associated virus vector capable of expression from a novel promoter
US5846946A (en) 1996-06-14 1998-12-08 Pasteur Merieux Serums Et Vaccins Compositions and methods for administering Borrelia DNA
WO2006020071A2 (en) 2004-07-16 2006-02-23 The Government Of The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services Vaccines against aids comprising cmv/r-nucleic acid constructs
CA2711179A1 (en) 2007-12-31 2009-07-16 Nanocor Therapeutics, Inc. Rna interference for the treatment of heart failure
US9405700B2 (en) 2010-11-04 2016-08-02 Sonics, Inc. Methods and apparatus for virtualization in an integrated circuit
EP4269577A3 (en) 2015-10-23 2024-01-17 President and Fellows of Harvard College Nucleobase editors and uses thereof
GB2568182A (en) 2016-08-03 2019-05-08 Harvard College Adenosine nucleobase editors and uses thereof
JP2020513824A (ja) * 2017-03-24 2020-05-21 キュアバック アーゲー Crispr関連タンパク質をコードする核酸、及びその使用

Also Published As

Publication number Publication date
AU2022413670A1 (en) 2024-07-04
CA3240917A1 (en) 2023-06-22
WO2023114953A3 (en) 2023-07-27
WO2023114953A2 (en) 2023-06-22

Similar Documents

Publication Publication Date Title
KR102618864B1 (ko) 합성 가이드 분자, 그와 관련된 조성물 및 방법
CN105899658B (zh) 针对hbv和病毒性疾病以及障碍的crispr-cas系统和组合物的递送、用途和治疗应用
KR20220123398A (ko) 합성 가이드 rna, 이의 조성물, 방법 및 용도
WO2020168135A1 (en) Compositions and methods for treating alpha-1 antitrypsin deficiency
WO2023078314A1 (en) Novel crispr-cas12i systems and uses thereof
US20230279373A1 (en) Novel crispr enzymes, methods, systems and uses thereof
US20240167008A1 (en) Novel crispr enzymes, methods, systems and uses thereof
KR20240116827A (ko) 신규한 crispr 효소, 방법, 시스템 및 이의 용도
US20240252550A1 (en) Genetic modification of hepatocytes
WO2023138685A9 (en) Novel crispr-cas12i systems and uses thereof
WO2023196772A1 (en) Novel rna base editing compositions, systems, methods and uses thereof
KR20240037299A (ko) Crispr/cas 편집 시스템용 가이드 rna
AU2022285744A9 (en) Circular guide rnas for crispr/cas editing systems
WO2024108092A1 (en) Prime editor delivery by aav
CN117916373A (zh) 用于crispr/cas编辑系统的引导rna
WO2023212594A2 (en) SINGLE pegRNA-MEDIATED LARGE INSERTIONS