KR20230021657A - Ruvc 도메인을 포함하는 효소 - Google Patents

Ruvc 도메인을 포함하는 효소 Download PDF

Info

Publication number
KR20230021657A
KR20230021657A KR1020227042270A KR20227042270A KR20230021657A KR 20230021657 A KR20230021657 A KR 20230021657A KR 1020227042270 A KR1020227042270 A KR 1020227042270A KR 20227042270 A KR20227042270 A KR 20227042270A KR 20230021657 A KR20230021657 A KR 20230021657A
Authority
KR
South Korea
Prior art keywords
seq
sequence
endonuclease
identity
nos
Prior art date
Application number
KR1020227042270A
Other languages
English (en)
Inventor
브라이언 토마스
크리스토퍼 브라운
로즈 캔터
오드라 데보토
크리스티나 버터필드
리사 알렉산더
다니엘라 에스에이 골츠먼
제이슨 리우
레베카 라모테
디에고 에스피노사
메간 스톨리
그렉 코스트
Original Assignee
메타지노미, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 메타지노미, 인크. filed Critical 메타지노미, 인크.
Publication of KR20230021657A publication Critical patent/KR20230021657A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Abstract

본 개시 내용은 구별되는 도메인 특징을 갖는 엔도뉴클레아제 효소, 및 상기 효소 또는 그의 변이체를 사용하는 방법을 제공한다.

Description

RUVC 도메인을 포함하는 효소
관련 출원
본 출원은 "ENZYMES WITH RUVC DOMAINS"라는 명칭으로 2020년 5월 8일자로 출원된 미국 가출원 제63/022,320호, "ENZYMES WITH RUVC DOMAINS"라는 명칭으로 2020년 5월 29일자로 출원된 미국 가출원 제63/032,464호, 및 "ENZYMES WITH RUVC DOMAINS"라는 명칭으로 2020년 11월 19일자로 출원된 미국 가출원 제63/116,155호, 및 "ENZYMES WITH RUVC DOMAINS"라는 명칭으로 2021년 4월 27일자로 출원된 미국 가출원 제63/180,570호에 우선권을 주장하며, 이들 모두는 그 전체가 본원에 참고로 포함된다.
배경
관련 클러스터링된 규칙적 간격의 짧은 회문 반복부(CRISPR: Clustered Regularly Interspaced Short Palindromic Repeats) 가이드 리보핵산(RNA)과 함께 Cas 효소는 원핵생물 면역계의 만연한(박테리아의 ~45%, 고세균의 ~84%) 성분인 것으로 보이며, CRISPR-RNA 가이드된 핵산 절단에 의해 감염성 바이러스 및 플라스미드와 같은 비자기 핵산으로부터 이러한 미생물을 보호한다. CRISPR RNA 요소를 코딩하는 데옥시리보핵산(DNA) 요소는 구조와 길이가 상대적으로 보존될 수 있지만 CRISPR 관련(Cas) 단백질은 다양한 핵산 상호작용 도메인을 포함하여 매우 다양하다. CRISPR DNA 요소는 일찍이 1987년에 관찰되었지만 CRISPR/Cas 복합체의 프로그래밍 가능한 엔도뉴클레아제 절단 능력은 비교적 최근에 인식되어 다양한 DNA 조작 및 유전자 편집 응용 분야에서 재조합 CRISPR/Cas 시스템을 사용하게 되었다.
서열 목록
본 출원은 ASCII 형식으로 전자적으로 제출된 서열 목록을 포함하며 이로써 그 전체가 참고로 포함된다. 2020년 5월 29일자로 생성된 상기 ASCII 사본은 55921_712_601_SL.txt이고 크기는 24,659,439 바이트이다.
요약
일부 측면에서, 본 개시 내용은 다음을 포함하는 조작된 뉴클레아제 시스템을 제공한다: (a) RuvC_III 도메인 및 HNH 도메인을 포함하는 엔도뉴클레아제로서, 엔도뉴클레아제는 미배양 미생물로부터 유래되며, 엔도뉴클레아제는 클래스 2, II형 Cas 엔도뉴클레아제인 엔도뉴클레아제; 및 (b) (i) 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및 (ii) 엔도뉴클레아제에 결합하도록 구성된 tracr 리보핵산 서열을 포함하는 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조. 일부 실시 양태에서, RuvC_III 도메인은 서열 번호 1827-3637 중 어느 하나에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 88%, 적어도 90%, 적어도 92%, 적어도 95%, 또는 적어도 98% 서열 동일성을 갖는 서열을 포함한다.
일부 측면에서, 본 개시 내용은 다음을 포함하는 조작된 뉴클레아제 시스템을 제공한다: (a) 서열 번호 1827-3637 중 어느 하나에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 88%, 적어도 90%, 적어도 92%, 적어도 95%, 또는 적어도 98% 서열 동일성을 갖는 RuvC_III 도메인을 포함하는 엔도뉴클레아제; 및 (b) (i) 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및 (ii) 엔도뉴클레아제에 결합하도록 구성된 tracr 리보핵산 서열을 포함하는 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조.
일부 측면에서, 본 개시 내용은 다음을 포함하는 조작된 뉴클레아제 시스템을 포함한다: (a) 서열 번호 5512-5537을 포함하는 프로토스페이서 인접 모티프(PAM: protospacer adjacent motif) 서열에 결합하도록 구성된 엔도뉴클레아제로서, 엔도뉴클레아제는 클래스 2, II형 Cas 엔도뉴클레아제인 엔도뉴클레아제; 및 (b) (i) 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및 (ii) 엔도뉴클레아제에 결합하도록 구성된 tracr 리보핵산 서열을 포함하는 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조.
일부 실시 양태에서, 엔도뉴클레아제는 미배양 미생물로부터 유래된다. 일부 실시 양태에서, 엔도뉴클레아제는 상이한 PAM 서열에 결합하도록 조작되지 않았다. 일부 실시 양태에서, 엔도뉴클레아제는 Cas9 엔도뉴클레아제, Cas14 엔도뉴클레아제, Cas12a 엔도뉴클레아제, Cas12b 엔도뉴클레아제, Cas 12c 엔도뉴클레아제, Cas12d 엔도뉴클레아제, Cas12e 엔도뉴클레아제, Cas13a 엔도뉴클레아제, Cas13b 엔도뉴클레아제, Cas13c 엔도뉴클레아제, 또는 Cas 13d 엔도뉴클레아제가 아니다. 일부 실시 양태에서, 엔도뉴클레아제는 Cas9 엔도뉴클레아제에 대해 80% 미만의 동일성을 갖는다. 일부 실시 양태에서, 엔도뉴클레아제는 HNH 도메인을 추가로 포함한다. 일부 실시 양태에서, tracr 리보핵산 서열은 서열 번호 5476-5511 및 서열 번호 5538 중 어느 하나로부터 선택된 약 60 내지 90개의 연속 뉴클레오티드에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함한다.
일부 측면에서, 본 개시 내용은 다음을 포함하는 조작된 뉴클레아제 시스템을 제공한다: (a) (i) 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및 (ii) 엔도뉴클레아제에 결합하도록 구성된 tracr 리보핵산 서열로서, 서열 번호 5476-5511 및 서열 번호 5538 중 어느 하나로부터 선택된 약 60 내지 90개의 연속 뉴클레오티드에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함하는 tracr 리보핵산 서열을 포함하는 조작된 가이드 리보핵산 구조; 및 (b) 조작된 가이드 리보핵산에 결합하도록 구성된 클래스 2, II형 Cas 엔도뉴클레아제. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 5512-5537을 포함하는 군으로부터 선택된 프로토스페이서 인접 모티프(PAM) 서열에 결합하도록 구성된다.
일부 실시 양태에서, 조작된 가이드 리보핵산 구조는 적어도 2개의 리보핵산 폴리뉴클레오티드를 포함한다. 일부 실시 양태에서, 조작된 가이드 리보핵산 구조는 가이드 리보핵산 서열 및 tracr 리보핵산 서열을 포함하는 하나의 리보핵산 폴리뉴클레오티드를 포함한다.
일부 실시 양태에서, 가이드 리보핵산 서열은 원핵생물, 박테리아, 고세균, 진핵생물, 진균, 식물, 포유동물, 또는 인간 게놈 서열에 상보적이다. 일부 실시 양태에서, 가이드 리보핵산 서열은 15-24 뉴클레오티드 길이이다. 일부 실시 양태에서, 엔도뉴클레아제는 엔도뉴클레아제의 N- 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS: nuclear localization sequence)을 포함한다. 일부 실시 양태에서, NLS는 서열 번호 5597-5612로부터 선택된 서열을 포함한다.
일부 실시 양태에서, 조작된 뉴클레아제 시스템은 5'에서 3'으로 다음을 포함하는 단일 또는 이중 가닥 DNA 복구 주형을 추가로 포함한다: 표적 데옥시리보핵산 서열 5'에 적어도 20 뉴클레오티드의 서열을 포함하는 제1 상동성 아암(arm), 적어도 10 뉴클레오티드의 합성 DNA 서열, 및 표적 서열 3'에 적어도 20 뉴클레오티드의 서열을 포함하는 제2 상동성 아암. 일부 실시 양태에서, 제1 또는 제2 상동성 아암은 적어도 40, 80, 120, 150, 200, 300, 500, 또는 1,000 뉴클레오티드의 서열을 포함한다.
일부 실시 양태에서, 시스템은 Mg2+의 공급원을 추가로 포함한다.
일부 실시 양태에서, 엔도뉴클레아제 및 tracr 리보핵산 서열은 동일한 문(phylum) 내의 별개의 박테리아 종으로부터 유래된다. 일부 실시 양태에서, 엔도뉴클레아제는 더마박터(dermabacter) 속에 속하는 박테리아로부터 유래된다. 일부 실시 양태에서, 엔도뉴클레아제는 우미균(Verrucomicrobia) 문, 칸디다투스 페레그리니박테리아(Candidatus Peregrinibacteria) 문, 또는 칸디다투스 멜라이나박테리아(Candidatus Melainabacteria) 문에 속하는 박테리아로부터 유래된다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 5592-5595 중 어느 하나에 대해 적어도 90% 동일성을 갖는 16S rRNA 유전자를 포함하는 박테리아로부터 유래된다.
일부 실시 양태에서, HNH 도메인은 서열 번호 5638-5460 중 어느 하나에 대해 적어도 70% 또는 적어도 80% 동일성을 갖는 서열을 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 1-1826 또는 그에 대해 적어도 55% 동일성을 갖는 그의 변이체를 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 1827-1830 또는 서열 번호 1827-2140으로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다.
일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 3638-3641 또는 서열 번호 3638-3954로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 5615-5632로 이루어진 군으로부터 선택된 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 또는 적어도 5개의 펩티드 모티프를 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 1-4 또는 서열 번호 1-319로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다.
일부 실시 양태에서, 가이드 RNA 구조는 서열 번호 5461-5464, 서열 번호 5476-5479, 또는 서열 번호 5476-5489로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 가이드 RNA 구조는 줄기 및 루프로 이루어진 헤어핀을 포함하는 것으로 예측되는 RNA 서열을 포함하고, 여기서 줄기는 적어도 10개, 적어도 12개, 또는 적어도 14개 염기쌍 리보뉴클레오티드, 및 루프의 4개 염기쌍 내의 비대칭 돌출을 포함한다.
일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 5512-5515 또는 서열 번호 5527-5530으로 이루어진 군으로부터 선택된 서열을 포함하는 PAM에 결합하도록 구성된다.
일부 실시 양태에서: (a) 엔도뉴클레아제는 서열 번호 1827에 대해 적어도 70%, 적어도 80%, 또는 적어도 90% 동일한 서열을 포함하고; (b) 가이드 RNA 구조는 서열 번호 5461 또는 서열 번호 5476 중 적어도 하나에 대해 적어도 70%, 적어도 80%, 또는 적어도 90% 동일한 서열을 포함하고; (c) 엔도뉴클레아제는 서열 번호 5512 또는 서열 번호 5527을 포함하는 PAM에 결합하도록 구성된다. 일부 실시 양태에서: (a) 엔도뉴클레아제는 서열 번호 1828에 대해 적어도 70%, 적어도 80%, 또는 적어도 90% 동일한 서열을 포함하고; (b) 가이드 RNA 구조는 서열 번호 5462 또는 서열 번호 5477 중 적어도 하나에 대해 적어도 70%, 적어도 80%, 또는 적어도 90% 동일한 서열을 포함하고; (c) 엔도뉴클레아제는 서열 번호 5513 또는 서열 번호 5528을 포함하는 PAM에 결합하도록 구성된다. 일부 실시 양태에서: (a) 엔도뉴클레아제는 서열 번호 1829에 대해 적어도 70%, 적어도 80%, 또는 적어도 90% 동일한 서열을 포함하고; (b) 가이드 RNA 구조는 서열 번호 5463 또는 서열 번호 5478 중 적어도 하나에 대해 적어도 70%, 적어도 80%, 또는 적어도 90% 동일한 서열을 포함하고; (c) 엔도뉴클레아제는 서열 번호 5514 또는 서열 번호 5529를 포함하는 PAM에 결합하도록 구성된다. 일부 실시 양태에서: (a) 엔도뉴클레아제는 서열 번호 1830에 대해 적어도 70%, 적어도 80%, 또는 적어도 90% 동일한 서열을 포함하고; (b) 가이드 RNA 구조는 서열 번호 5464 또는 서열 번호 5479 중 적어도 하나에 대해 적어도 70%, 적어도 80%, 또는 적어도 90% 동일한 서열을 포함하고; (c) 엔도뉴클레아제는 서열 번호 5515 또는 서열 번호 5530을 포함하는 PAM에 결합하도록 구성된다.
일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 2141-2142 또는 서열 번호 2141-2241로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 3955-3956 또는 서열 번호 3955-4055로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 5632-5638로 이루어진 군으로부터 선택된 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 또는 적어도 5개의 펩티드 모티프를 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 320-321 또는 서열 번호 320-420으로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 가이드 RNA 구조는 서열 번호 5465, 서열 번호 5490-5491 또는 서열 번호 5490-5494로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 가이드 RNA 구조는 적어도 8개, 적어도 10개, 또는 적어도 12개의 염기쌍 리보뉴클레오티드를 포함하는 헤어핀을 포함하는 tracr 리보핵산 서열을 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 5516 및 서열 번호 5531로 이루어진 군으로부터 선택된 서열을 포함하는 PAM에 결합하도록 구성된다. 일부 실시 양태에서: (a) 엔도뉴클레아제는 서열 번호 2141에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고, (b) 가이드 RNA 구조는 서열 번호 5490에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고; (c) 엔도뉴클레아제는 서열 번호 5531을 포함하는 PAM에 결합하도록 구성된다. 일부 실시 양태에서: (a) 엔도뉴클레아제는 서열 번호 2142에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고, (b) 가이드 RNA 구조는 서열 번호 5465 또는 서열 번호 5491에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고; (c) 엔도뉴클레아제는 서열 번호 5516을 포함하는 PAM에 결합하도록 구성된다.
일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 2245-2246으로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 4059-4060으로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 5639-5648로 이루어진 군으로부터 선택된 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 또는 적어도 5개의 펩티드 모티프를 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 424-425로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 가이드 RNA 구조는 서열 번호 5498-5499 및 서열 번호 5539로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 가이드 RNA 구조는 가이드 리보핵산 서열의 적어도 8 뉴클레오티드 및 tracr 리보핵산 서열의 적어도 8 뉴클레오티드를 포함하는 중단되지 않은 염기쌍 영역을 갖는 헤어핀을 포함하는 것으로 예측되는 가이드 리보핵산 서열을 포함하고, 여기서 tracr 리보핵산 서열은 5'에서 3'으로 제1 헤어핀 및 제2 헤어핀을 포함하고, 여기서 제1 헤어핀은 제2 헤어핀보다 더 긴 줄기를 갖는다.
일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 2242-2244 또는 서열 번호 2247-2249로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 4056-4058 및 서열 번호 4061-4063으로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 5639-5648로 이루어진 군으로부터 선택된 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 또는 적어도 5개의 펩티드 모티프를 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 421-423 또는 서열 번호 426-428로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 가이드 RNA 구조는 서열 번호 5466-5467, 서열 번호 5495-5497, 서열 번호 5500-5502, 및 서열 번호 5539 로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 가이드 RNA 구조는 가이드 리보핵산 서열의 적어도 8 뉴클레오티드 및 tracr 리보핵산 서열의 적어도 8 뉴클레오티드를 포함하는 중단되지 않은 염기쌍 영역을 갖는 헤어핀을 포함하는 것으로 예측되는 가이드 리보핵산 서열을 포함하고, 여기서 tracr 리보핵산 서열은 5'에서 3'으로, 제1 헤어핀 및 제2 헤어핀을 포함하고, 여기서 제1 헤어핀은 제2 헤어핀보다 더 긴 줄기를 갖는다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 5517-5518 또는 서열 번호 5532-5534로 이루어진 군으로부터 선택된 서열을 포함하는 PAM에 결합하도록 구성된다. 일부 실시 양태에서, (a) 엔도뉴클레아제는 서열 번호 2247에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고; (b) 가이드 RNA 구조는 서열 번호 5500에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고; (c) 엔도뉴클레아제는 서열 번호 5517 또는 서열 번호 5532를 포함하는 PAM에 결합하도록 구성된다. 일부 실시 양태에서, (a) 엔도뉴클레아제는 서열 번호 2248에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고; (b) 가이드 RNA 구조는 서열 번호 5501에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고; (c) 엔도뉴클레아제는 서열 번호 5518 또는 서열 번호 5533을 포함하는 PAM에 결합하도록 구성된다. 일부 실시 양태에서: (a) 엔도뉴클레아제는 서열 번호 2249에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고; (b) 가이드 RNA 구조는 서열 번호 5502에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고; (c) 엔도뉴클레아제는 서열 번호 5534를 포함하는 PAM에 결합하도록 구성된다.
일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 2253 또는 서열 번호 2253-2481로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 4067 또는 서열 번호 4067-4295로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 5649에 따른 펩티드 모티프를 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 432 또는 서열 번호 432-660으로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 가이드 RNA 구조는 서열 번호 5468 또는 서열 번호 5503으로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 5519로 이루어진 군으로부터 선택된 서열을 포함하는 PAM에 결합하도록 구성된다. 일부 실시 양태에서: (a) 엔도뉴클레아제는 서열 번호 2253에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고; (b) 가이드 RNA 구조는 서열 번호 5468 또는 서열 번호 5503에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고; (c) 엔도뉴클레아제는 서열 번호 5519를 포함하는 PAM에 결합하도록 구성된다.
일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 2482-2489로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 4296-4303으로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 661-668로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 2490-2498로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 4304-4312로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 669-677로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 가이드 RNA 구조는 서열 번호 5504로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다.
일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 2499 또는 서열 번호 2499-2750으로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 4313 또는 서열 번호 4313-4564로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 5650-5667로 이루어진 군으로부터 선택된 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 또는 적어도 5개의 펩티드 모티프를 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 678 또는 서열 번호 678-929로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 가이드 RNA 구조는 서열 번호 5469 또는 서열 번호 5505에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 5520 또는 서열 번호 5535를 포함하는 PAM에 결합하도록 구성된다. 일부 실시 양태에서: (a) 엔도뉴클레아제는 서열 번호 2499에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고; (b) 가이드 RNA 구조는 서열 번호 5469 또는 서열 번호 5505에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고; (c) 엔도뉴클레아제는 서열 번호 5520 또는 서열 번호 5535를 포함하는 PAM에 결합하도록 구성된다.
일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 2751 또는 서열 번호 2751-2913으로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 4565 또는 서열 번호 4565-4727로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 5668-5678로 이루어진 군으로부터 선택된 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 또는 적어도 5개의 펩티드 모티프를 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 930 또는 서열 번호 930-1092로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 가이드 RNA 구조는 서열 번호 5470 또는 서열 번호 5506에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 5521 또는 서열 번호 5536으로 이루어진 군으로부터 선택된 서열을 포함하는 PAM에 결합하도록 구성된다. 일부 실시 양태에서: (a) 엔도뉴클레아제는 서열 번호 2751에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고; (b) 가이드 RNA 구조는 서열 번호 5470 또는 서열 번호 5506에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고; (c) 엔도뉴클레아제는 서열 번호 5521 또는 서열 번호 5536을 포함하는 PAM에 결합하도록 구성된다.
일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 2914 또는 서열 번호 2914-3174로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 4728 또는 서열 번호 4728-4988로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 5676-5678로 이루어진 군으로부터 선택된 적어도 1개, 적어도 2개, 또는 적어도 3개의 펩티드 모티프를 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 1093 또는 서열 번호 1093-1353으로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 가이드 RNA 구조는 서열 번호 5471, 서열 번호 5507, 및 서열 번호 5540-5542로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 가이드 RNA 구조는 5개 미만의 염기쌍 리보뉴클레오티드를 포함하는 적어도 2개의 헤어핀을 포함하는 것으로 예측되는 tracr 리보핵산 서열을 포함한다. 일부 실시 양태에서 엔도뉴클레아제는 서열 번호 5522를 포함하는 PAM에 결합하도록 구성된다. 일부 실시 양태에서: (a) 엔도뉴클레아제는 서열 번호 2914에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고; (b) 가이드 RNA 구조는 서열 번호 5471 또는 서열 번호 5507에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고; (c) 엔도뉴클레아제는 서열 번호 5522를 포함하는 PAM에 결합하도록 구성된다.
일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 3175 또는 서열 번호 3175-3330으로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 4989 또는 서열 번호 4989-5146으로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 5679-5686으로 이루어진 군으로부터 선택된 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 또는 적어도 5개의 펩티드 모티프를 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 1354 또는 서열 번호 1354-1511로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 가이드 RNA 구조는 서열 번호 5472 또는 서열 번호 5508로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 5523 또는 서열 번호 5537로 이루어진 군으로부터 선택된 서열을 포함하는 PAM에 결합하도록 구성된다. 일부 실시 양태에서: (a) 엔도뉴클레아제는 서열 번호 3175에 대해 적어도 70%, 80%, 또는 90 % 동일한 서열을 포함하고; (b) 가이드 RNA 구조는 서열 번호 5472 또는 서열 번호 5508에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고; (c) 엔도뉴클레아제는 서열 번호 5523 또는 서열 번호 5537을 포함하는 PAM에 결합하도록 구성된다.
일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 3331 또는 서열 번호 3331-3474로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 5147 또는 서열 번호 5147-5290으로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 5674-5675 및 서열 번호 5687-5693으로 이루어진 군으로부터 선택된 적어도 1, 적어도 2개, 적어도 3개, 적어도 4개, 또는 적어도 5개의 펩티드 모티프를 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 1512 또는 서열 번호 1512-1655로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 가이드 RNA 구조는 서열 번호 5473 또는 서열 번호 5509로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 5524를 포함하는 PAM에 결합하도록 구성된다. 일부 실시 양태에서: (a) 엔도뉴클레아제는 서열 번호 3331에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고; (b) 가이드 RNA 구조는 서열 번호 5473 또는 서열 번호 5509에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고; (c) 엔도뉴클레아제는 서열 번호 5524를 포함하는 PAM에 결합하도록 구성된다.
일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 3475 또는 서열 번호 3475-3568로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 5291 또는 서열 번호 5291-5389로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 5694-5699로 이루어진 군으로부터 선택된 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 또는 적어도 5개의 펩티드 모티프를 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 1656 또는 서열 번호 1656-1755로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 가이드 RNA 구조는 서열 번호 5474 또는 서열 번호 5510에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 5525를 포함하는 PAM에 결합하도록 구성된다. 일부 실시 양태에서: (a) 엔도뉴클레아제는 서열 번호 3475에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고; (b) 가이드 RNA 구조는 서열 번호 5474 또는 서열 번호 5510에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고; (c) 엔도뉴클레아제는 서열 번호 5525를 포함하는 PAM에 결합하도록 구성된다.
일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 3569 또는 서열 번호 3569-3637로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 5390 또는 서열 번호 5390-5460으로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 5700-5717로 이루어진 군으로부터 선택된 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 또는 적어도 5개의 펩티드 모티프를 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 1756 또는 서열 번호 1756-1826으로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 가이드 RNA 구조는 서열 번호 5475 또는 서열 번호 5511에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 5526을 포함하는 PAM에 결합하도록 구성된다. 일부 실시 양태에서: (a) 엔도뉴클레아제는 서열 번호 3569에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고; (b) 가이드 RNA 구조는 서열 번호 5475 또는 서열 번호 5511에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고; (c) 엔도뉴클레아제는 서열 번호 5526을 포함하는 PAM에 결합하도록 구성된다. 일부 실시 양태에서, 서열 동일성은 스미스-워터맨(Smith-Waterman) 상동성 검색 알고리즘의 매개변수를 사용하여 BLASTP, CLUSTALW, MUSCLE, MAFFT, 또는 CLUSTALW에 의해 결정된다. 일부 실시 양태에서, 서열 동일성은 단어 길이(W) 3, 기대치(E) 10의 매개변수, 및 존재 11, 확장 1에서의 갭 비용을 설정하는 BLOSUM62 스코어링 매트릭스를 사용하고 조건부 구성 스코어 매트릭스 조정을 사용하는 BLASTP 상동성 검색 알고리즘에 의해 결정된다.
일부 측면에서, 본 개시 내용은 (a) 표적 DNA 분자 내의 표적 서열에 상보적인 뉴클레오티드 서열을 포함하는 DNA표적화 세그먼트; 및 (b) 혼성화하여 이중 가닥 RNA(dsRNA) 이중체를 형성하는 2개의 상보적인 뉴클레오티드 스트레치를 포함하는 단백질 결합 세그먼트를 포함하는 조작된 가이드 리보핵산 폴리뉴클레오티드를 제공하며, 여기서 2개의 상보적인 뉴클레오티드 스트레치는 개재 뉴클레오티드로 서로 공유적으로 연결되며, 조작된 가이드 리보핵산 폴리뉴클레오티드는 서열 번호 1827-3637 중 어느 하나에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 88%, 적어도 90%, 적어도 92%, 적어도 95%, 또는 적어도 98% 서열 동일성을 갖는 RuvC_III 도메인을 포함하는 엔도뉴클레아제 복합체를 형성하고 표적 DNA 분자의 표적 서열에 복합체를 표적화하도록 구성된다. 일부 실시 양태에서, DNA 표적화 세그먼트는 2개의 상보적인 뉴클레오티드 스트레치 모두의 5'에 위치한다.
일부 실시 양태에서: (a) 단백질 결합 세그먼트는 서열 번호 5476-5479 또는 서열 번호 5476-5489로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 88%, 적어도 90%, 적어도 92%, 적어도 95%, 또는 적어도 98% 동일성을 갖는 서열을 포함하거나; (b) 단백질 결합 세그먼트는 (서열 번호 5490-5491 또는 서열 번호 5490-5494) 및 서열 번호 5538 로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 적어도 80%, 또는 적어도 90% 동일성을 갖는 서열을 포함하거나; (c) 단백질 결합 세그먼트는 서열 번호 5498-5499로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 적어도 80%, 또는 적어도 90% 동일성을 갖는 서열을 포함하거나; (d) 단백질 결합 세그먼트는 서열 번호 5495-5497 및 서열 번호 5500-5502로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 적어도 80%, 또는 적어도 90% 동일성을 갖는 서열을 포함하거나; (e) 단백질 결합 세그먼트는 서열 번호 5503에 대해 적어도 70%, 적어도 80%, 또는 적어도 90% 동일성을 갖는 서열을 포함하거나; (f) 단백질 결합 세그먼트는 서열 번호 5504에 대해 적어도 70%, 적어도 80%, 또는 적어도 90% 동일성을 갖는 서열을 포함하거나; (g) 단백질 결합 세그먼트는 서열 번호 5505에 대해 적어도 70%, 적어도 80%, 또는 적어도 90% 동일성을 갖는 서열을 포함하거나; (h) 단백질 결합 세그먼트는 서열 번호 5506에 대해 적어도 70%, 적어도 80%, 또는 적어도 90% 동일성을 갖는 서열을 포함하거나; (i) 단백질 결합 세그먼트는 서열 번호 5507에 대해 적어도 70%, 적어도 80%, 또는 적어도 90% 동일성을 갖는 서열을 포함하거나; (j) 단백질 결합 세그먼트는 서열 번호 5508에 대해 적어도 70%, 적어도 80%, 또는 적어도 90% 동일성을 갖는 서열을 포함하거나; (k) 단백질 결합 세그먼트는 서열 번호 5509에 대해 적어도 70%, 적어도 80%, 또는 적어도 90% 동일성을 갖는 서열을 포함하거나; (l) 단백질 결합 세그먼트는 서열 번호 5510에 대해 적어도 70%, 적어도 80%, 또는 적어도 90% 동일성을 갖는 서열을 포함하거나; (m) 단백질 결합 세그먼트는 서열 번호 5511에 대해 적어도 70%, 적어도 80%, 또는 적어도 90% 동일성을 갖는 서열을 포함한다.
일부 실시 양태에서: (a) 가이드 리보핵산 폴리뉴클레오티드는 줄기 및 루프를 포함하는 헤어핀을 포함하는 RNA 서열을 포함하고, 여기서 줄기는 적어도 10개, 적어도 12개, 또는 적어도 14개의 염기쌍 리보뉴클레오티드, 및 루프의 4개 염기 쌍 내의 비대칭 돌기를 포함하고; (b) 가이드 리보핵산 폴리뉴클레오티드는 적어도 8개, 적어도 10개, 또는 적어도 12개의 염기쌍 리보뉴클레오티드를 포함하는 헤어핀을 포함하는 것으로 예측되는 tracr 리보핵산 서열을 포함하고; (c) 가이드 리보핵산 폴리뉴클레오티드는 가이드 리보핵산 서열의 적어도 8 뉴클레오티드 및 tracr 리보핵산 서열의 적어도 8 뉴클레오티드를 포함하는 중단되지 않은 염기쌍 영역을 갖는 헤어핀을 포함하는 것으로 예측되는 가이드 리보핵산 서열을 포함하고, 여기서 tracr 리보핵산 서열은 5'에서 3'으로, 제1 헤어핀 및 제2 헤어핀을 포함하고, 여기서 제1 헤어핀은 제2 헤어핀보다 더 긴 줄기를 갖고; 또는 (d) 가이드 리보핵산 폴리뉴클레오티드는 5개 미만의 염기쌍 리보뉴클레오티드를 포함하는 적어도 2개의 헤어핀을 포함하는 것으로 예측되는 tracr 리보핵산 서열을 포함한다.
일부 측면에서, 본 개시 내용은 본원에 기재된 임의의 조작된 가이드 리보핵산 폴리뉴클레오티드를 코딩하는 데옥시리보핵산 폴리뉴클레오티드를 제공한다.
일부 측면에서, 본 개시 내용은 유기체에서의 발현을 위해 최적화된 조작된 핵산 서열을 포함하는 핵산을 제공하며, 여기서 핵산은 RuvC_III 도메인 및 HNH 도메인을 포함하는 클래스 2, II형 Cas 엔도뉴클레아제를 코딩하고, 엔도뉴클레아제는 미배양 미생물로부터 유래된다.
일부 측면에서, 본 개시 내용은 유기체에서의 발현을 위해 최적화된 조작된 핵산 서열을 포함하는 핵산을 제공하며, 여기서 핵산은 서열 번호 1827-3637 중 어느 하나에 대해 적어도 70% 서열 동일성을 갖는 RuvC_III 도메인을 포함하는 엔도뉴클레아제를 코딩한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 3638-5460 중 어느 하나에 대해 적어도 70% 또는 적어도 80% 서열 동일성을 갖는 HNH 도메인을 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 5572-5591 또는 그에 대해 적어도 70% 서열 동일성을 갖는 그의 변이체를 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 엔도뉴클레아제의 N- 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS)을 코딩하는 서열을 포함한다. 일부 실시 양태에서, NLS는 서열 번호 5597-5612로부터 선택된 서열을 포함한다.
일부 실시 양태에서, 유기체는 원핵생물, 박테리아, 진핵생물, 진균, 식물, 포유동물, 설치류, 또는 인간이다. 일부 실시 양태에서, 유기체는 이. 콜라이(E. coli)이고: (a) 핵산 서열은 서열 번호 5572-5575로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일성을 갖거나; (b) 핵산 서열은 서열 번호 5576-5577로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일성을 갖거나; (c) 핵산 서열은 서열 번호 5578-5580으로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일성을 갖거나; (d) 핵산 서열은 서열 번호 5581에 대해 적어도 70%, 80%, 또는 90% 동일성을 갖거나; (e) 핵산 서열은 서열 번호 5582에 대해 적어도 70%, 80%, 또는 90% 동일성을 갖거나; (f) 핵산 서열은 서열 번호 5583에 대해 적어도 70%, 80%, 또는 90% 동일성을 갖거나; (g) 핵산 서열은 서열 번호 5584에 대해 적어도 70%, 80%, 또는 90% 동일성을 갖거나; (h) 핵산 서열은 서열 번호 5585에 대해 적어도 70%, 80%, 또는 90% 동일성을 갖거나; (i) 핵산 서열은 서열 번호 5586에 대해 적어도 70%, 80%, 또는 90% 동일성을 갖거나; (j) 핵산 서열은 서열 번호 5587에 대해 적어도 70%, 80%, 또는 90% 동일성을 갖는다. 일부 실시 양태에서, 유기체는 인간이고, (a) 핵산 서열은 서열 번호 5588 또는 서열 번호 5589에 대해 적어도 70%, 80%, 또는 90% 동일성을 갖거나; (b) 핵산 서열은 서열 번호 5590 또는 서열 번호 5591과 적어도 70%, 80%, 또는 90% 동일성을 갖는다.
일부 측면에서, 본 개시 내용은 RuvC_III 도메인 및 HNH 도메인을 포함하는 클래스 2, II형 Cas 엔도뉴클레아제를 코딩하는 핵산 서열을 포함하는 벡터를 제공하며, 여기서 엔도뉴클레아제는 미배양 미생물로부터 유래된다.
일부 측면에서, 본 개시 내용은 본원에 기재된 임의의 핵산을 포함하는 벡터를 제공한다. 일부 실시 양태에서, 벡터는 (a) 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및 (b) 엔도뉴클레아제에 결합하도록 구성된 tracr 리보핵산 서열을 포함하는 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조를 코딩하는 핵산을 추가로 포함한다. 일부 실시 양태에서, 벡터는 플라스미드, 미니서클, CELiD, 아데노 관련 바이러스(AAV: adeno-associated virus) 유래 비리온, 또는 렌티바이러스이다.
일부 측면에서, 본 개시 내용은 본원에 기재된 임의의 벡터를 포함하는 세포를 제공한다.
일부 측면에서, 본 개시 내용은 본원에 기재된 임의의 세포를 배양하는 단계를 포함하는 엔도뉴클레아제의 제조 방법을 제공한다.
일부 측면에서, 본 개시 내용은 이중 가닥 데옥시리보핵산 폴리뉴클레오티드에 결합하거나, 이를 절단, 마킹(marking), 또는 변형하는 방법으로서, (a) 엔도뉴클레아제 및 이중 가닥 데옥시리보핵산 폴리뉴클레오티드에 결합하도록 구성된 조작된 가이드 리보핵산 구조와 복합체를 형성하는 클래스 2, II형 Cas 엔도뉴클레아제와 이중 가닥 데옥시리보핵산 폴리뉴클레오티드를 접촉시키는 단계를 포함하며; (b) 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 프로토스페이서 인접 모티프(PAM)를 포함하고; PAM은 서열 번호 5512-5526 또는 서열 번호 5527-5537로 이루어진 군으로부터 선택된 서열을 포함하는 것인 방법을 제공한다. 일부 실시 양태에서, 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 조작된 가이드 리보핵산 구조의 서열에 상보적인 서열을 포함하는 제1 가닥 및 PAM을 포함하는 제2 가닥을 포함한다. 일부 실시 양태에서, PAM은 조작된 가이드 리보핵산 구조의 서열에 상보적인 서열의 3' 말단에 바로 인접한다.
일부 실시 양태에서, 클래스 2, II형 Cas 엔도뉴클레아제는 Cas9 엔도뉴클레아제, Cas14 엔도뉴클레아제, Cas12a 엔도뉴클레아제, Cas12b 엔도뉴클레아제, Cas 12c 엔도뉴클레아제, Cas12d 엔도뉴클레아제, Cas12e 엔도뉴클레아제, Cas13a 엔도뉴클레아제, Cas13b 엔도뉴클레아제, Cas13c 엔도뉴클레아제, 또는 Cas 13d 엔도뉴클레아제가 아니다. 일부 실시 양태에서, 클래스 2, II형 Cas 엔도뉴클레아제는 미배양 미생물로부터 유래된다. 일부 실시 양태에서, 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 진핵생물, 식물, 진균, 포유동물, 설치류, 또는 인간 이중 가닥 데옥시리보핵산 폴리뉴클레오티드이다.
일부 실시 양태에서: (a) PAM은 서열 번호 5512-5515 및 서열 번호 5527-5530으로 이루어진 군으로부터 선택된 서열을 포함하거나; (b) PAM은 서열 번호 5516 또는 서열 번호 5531을 포함하거나; (c) PAM은 서열 번호 5539를 포함하거나; (d) PAM은 서열 번호 5517 또는 서열 번호 5518을 포함하거나; (e) PAM은 서열 번호 5519를 포함하거나; (f) PAM은 서열 번호 5520 또는 서열 번호 5535를 포함하거나; (g) PAM은 서열 번호 5521 또는 서열 번호 5536을 포함하거나; (h) PAM은 서열 번호 5522를 포함하거나; (i) PAM은 서열 번호 5523 또는 서열 번호 5537을 포함하거나; (j) PAM은 서열 번호 5524를 포함하거나; (k) PAM은 서열 번호 5525를 포함하거나; (l) PAM은 서열 번호 5526을 포함한다.
일부 측면에서, 본 개시 내용은 표적 핵산 유전자좌를 변형시키는 방법을 제공하며, 방법은 본원에 기재된 임의의 조작된 뉴클레아제 시스템을 표적 핵산 유전자좌에 전달하는 단계를 포함하며, 엔도뉴클레아제는 조작된 가이드 리보핵산 구조와 복합체를 형성하도록 구성되고, 복합체는 복합체가 표적 핵산 유전자좌에 결합할 때 복합체가 표적 핵산 유전자좌를 변형시키도록 구성된다. 일부 실시 양태에서, 표적 핵산 유전자좌를 변형시키는 단계는 표적 핵산 유전자좌에 결합하거나, 이를 닉킹(nicking), 절단 또는 마킹하는 단계를 포함한다. 일부 실시 양태에서, 표적 핵산 유전자좌는 데옥시리보핵산(DNA) 또는 리보핵산(RNA)을 포함한다. 일부 실시 양태에서, 표적 핵산은 게놈 DNA, 바이러스 DNA, 바이러스 RNA, 또는 박테리아 DNA를 포함한다. 일부 실시 양태에서, 표적 핵산 유전자좌는 시험관 내에 있다. 일부 실시 양태에서, 표적 핵산 유전자좌는 세포 내에 있다. 일부 실시 양태에서, 세포는 원핵생물 세포, 박테리아 세포, 진핵생물 세포, 진균 세포, 식물 세포, 동물 세포, 포유동물 세포, 설치류 세포, 영장류 세포, 또는 인간 세포이다.
일부 실시 양태에서, 조작된 뉴클레아제 시스템을 표적 핵산 유전자좌에 전달하는 단계는 본원에 기재된 임의의 핵산 또는 본원에 기재된 임의의 벡터를 전달하는 단계를 포함한다. 일부 실시 양태에서, 조작된 뉴클레아제 시스템을 표적 핵산 유전자좌에 전달하는 단계는 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임을 포함하는 핵산을 전달하는 단계를 포함한다. 일부 실시 양태에서, 핵산은 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임이 작동가능하게 연결된 프로모터를 포함한다. 일부 실시 양태에서, 표적 핵산 유전자좌로의 조작된 뉴클레아제 시스템은 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임을 포함하는 캡핑된 mRNA를 전달하는 단계를 포함한다. 일부 실시 양태에서, 표적 핵산 유전자좌로의 조작된 뉴클레아제 시스템은 번역된 폴리펩티드를 전달하는 단계를 포함한다. 일부 실시 양태에서, 표적 핵산 유전자좌로의 조작된 뉴클레아제 시스템은 리보핵산(RNA) pol III 프로모터에 작동가능하게 연결된 조작된 가이드 리보핵산 구조를 코딩하는 데옥시리보핵산(DNA)을 전달하는 단계를 포함한다. 일부 실시 양태에서, 엔도뉴클레아제는 표적 유전자좌에서 또는 이에 근접하여 단일 가닥 파손 또는 이중 가닥 파손을 유도한다.
일부 측면에서, 본 개시 내용은 다음을 포함하는 조작된 뉴클레아제 시스템을 제공한다: (a) 서열 번호 5718-5846 또는 6257 중 어느 하나에 대해 적어도 75% 서열 동일성을 갖는 서열을 포함하는 엔도뉴클레아제; 및 (b) (i) 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 리보핵산 서열; 및 (ii) 상기 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열을 포함하는 상기 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조. 일부 측면에서, 본 개시 내용은 다음을 포함하는 조작된 뉴클레아제 시스템을 제공한다: (a) 서열 번호 5847-5861 또는 6258-6278을 포함하는 프로토스페이서 인접 모티프(PAM) 서열에 결합하도록 구성된 엔도뉴클레아제로서, 클래스 2, II형 Cas 엔도뉴클레아제인 엔도뉴클레아제; 및 (b) (i) 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 리보핵산 서열; 및 (ii) 상기 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열을 포함하는 상기 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조. 일부 실시 양태에서, 상기 엔도뉴클레아제는 미배양 미생물로부터 유래된다. 일부 실시 양태에서, 상기 엔도뉴클레아제는 상이한 PAM 서열에 결합하도록 조작되지 않았다. 일부 실시 양태에서, 상기 엔도뉴클레아제는 Cas9 엔도뉴클레아제, Cas14 엔도뉴클레아제, Cas12a 엔도뉴클레아제, Cas12b 엔도뉴클레아제, Cas 12c 엔도뉴클레아제, Cas12d 엔도뉴클레아제, Cas12e 엔도뉴클레아제, Cas13a 엔도뉴클레아제, Cas13b 엔도뉴클레아제, Cas13c 엔도뉴클레아제, 또는 Cas 13d 엔도뉴클레아제가 아니다. 일부 실시 양태에서, 상기 엔도뉴클레아제는 Cas9 엔도뉴클레아제에 대해 80% 미만의 동일성을 갖는다. 일부 실시 양태에서, 상기 리보핵산 서열은 (a) 서열 번호 5886-5887, 5891, 5893, 또는 5894 중 어느 하나; 또는 (b) 서열 번호 5862-5885, 5888-5890, 5892, 5895-5896, 또는 6279-6301 중 어느 하나의 비-축퇴 뉴클레오티드에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함한다. 일부 측면에서, 본 개시 내용은 다음을 포함하는 조작된 뉴클레아제 시스템을 제공한다: (a) (i) 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 리보핵산 서열; 및 (ii) 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열로서, (a) 서열 번호 5886-5887, 5891, 5893, 또는 5894 중 어느 하나; 또는 (b) 서열 번호 5862-5885, 5888-5890, 5892, 5895-5896, 또는 6279-6301 중 어느 하나의 비-축퇴 뉴클레오티드에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함하는 리보핵산 서열을 포함하는 조작된 가이드 리보핵산 구조; 및 상기 조작된 가이드 리보핵산에 결합하도록 구성된 클래스 2, II형 Cas 엔도뉴클레아제. 일부 실시 양태에서, 엔도뉴클레아제는 서열 번호 5847-5861 또는 6258-6278을 포함하는 군으로부터 선택된 프로토스페이서 인접 모티프(PAM) 서열에 결합하도록 구성된다. 일부 실시 양태에서, 상기 가이드 리보핵산 서열은 15-24 뉴클레오티드 길이 또는 19-24 뉴클레오티드 길이이다. 일부 실시 양태에서, 상기 엔도뉴클레아제는 상기 엔도뉴클레아제의 N- 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS)을 포함한다. 일부 실시 양태에서, 상기 NLS는 서열 번호 5597-5612로부터 선택된 서열을 포함한다. 일부 실시 양태에서, 시스템은 5'에서 3'으로 다음을 포함하는 단일 또는 이중 가닥 DNA 복구 주형을 추가로 포함한다: 상기 표적 데옥시리보핵산 서열 5'에 적어도 20 뉴클레오티드의 서열을 포함하는 제1 상동성 아암, 적어도 10 뉴클레오티드의 합성 DNA 서열, 및 상기 표적 서열 3'에 적어도 20 뉴클레오티드의 서열을 포함하는 제2 상동성 아암. 일부 실시 양태에서, 상기 제1 또는 제2 상동성 아암은 적어도 40, 80, 120, 150, 200, 300, 500, 또는 1,000 뉴클레오티드의 서열을 포함한다. 일부 실시 양태에서, 상기 서열 동일성은 스미스-워터맨 상동성 검색 알고리즘의 매개변수를 이용한 BLASTP, CLUSTALW, MUSCLE, MAFFT, 또는 CLUSTALW에 의해 결정된다. 일부 실시 양태에서, 상기 서열 동일성은 단어 길이(W) 3, 기대치(E) 10의 매개변수를 사용하고, 존재 11, 확장 1에서 갭 비용을 설정하는 BLOSUM62 스코어링 매트릭스를 사용하고, 조건부 구성 스코어 매트릭스 조정을 사용하는 상기 BLASTP 상동성 검색 알고리즘에 의해 결정된다.
일부 측면에서, 본 개시 내용은 (a) 표적 DNA 분자 내의 표적 서열에 상보적인 뉴클레오티드 서열을 포함하는 DNA표적화 세그먼트; 및 (b) 혼성화하여 이중 가닥 RNA(dsRNA) 이중체를 형성하는 2개의 상보적인 뉴클레오티드 스트레치를 포함하는 단백질 결합 세그먼트를 포함하는 조작된 가이드 리보핵산 폴리뉴클레오티드를 제공하며, 여기서 상기 2개의 상보적인 뉴클레오티드 스트레치는 개재 뉴클레오티드로 서로 공유적으로 연결되며, 상기 조작된 가이드 리보핵산 폴리뉴클레오티드는 서열 번호 5718-5846 또는 6257 중 어느 하나에 대해 적어도 75% 서열 동일성을 갖는 서열을 포함하는 엔도뉴클레아제와 복합체를 형성하고 상기 표적 DNA 분자의 상기 표적 서열에 상기 복합체를 표적화하도록 구성된다. 일부 실시 양태에서, 상기 DNA 표적화 세그먼트는 상기 2개의 상보적인 뉴클레오티드 스트레치 모두의 5'에 위치한다.
일부 측면에서, 본 개시 내용은 본원에 기재된 임의의 조작된 가이드 리보핵산 폴리뉴클레오티드를 코딩하는 데옥시리보핵산 폴리뉴클레오티드를 제공한다.
일부 측면에서, 본 개시 내용은 유기체에서의 발현을 위해 최적화된 조작된 핵산 서열을 포함하는 핵산을 제공하며, 여기서 상기 핵산은 서열 번호 5718-5846 또는 6257 중 어느 하나에 대해 적어도 75% 서열 동일성을 갖는 서열을 포함하는 엔도뉴클레아제를 코딩한다. 일부 실시 양태에서, 상기 엔도뉴클레아제는 상기 엔도뉴클레아제의 N- 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS)을 코딩하는 서열을 포함한다. 일부 실시 양태에서, 상기 NLS는 서열 번호 5597-5612로부터 선택된 서열을 포함한다. 일부 실시 양태에서, 상기 유기체는 원핵생물, 박테리아, 진핵생물, 진균, 식물, 포유동물, 설치류, 또는 인간이다.
일부 측면에서, 본 개시 내용은 본원에 기재된 임의의 핵산을 포함하는 벡터를 제공한다. 일부 실시 양태에서, 벡터는 (a) 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 리보핵산 서열; 및 (b) 상기 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열을 포함하는 상기 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조를 코딩하는 핵산을 추가로 포함한다. 일부 실시 양태에서, 벡터는 플라스미드, 미니서클, CELiD, 아데노 관련 바이러스(AAV) 유래 비리온, 또는 렌티바이러스이다.
일부 측면에서, 본 개시 내용은 본원에 기재된 임의의 벡터를 포함하는 세포를 제공한다.
일부 측면에서, 본 개시 내용은 본원에 기재된 임의의 세포를 배양하는 단계를 포함하는 엔도뉴클레아제의 제조 방법을 제공한다.
일부 측면에서, 본 개시 내용은 이중 가닥 데옥시리보핵산 폴리뉴클레오티드에 결합하거나, 이를 절단, 마킹, 또는 변형하는 방법으로서, 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드를 상기 엔도뉴클레아제 및 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드에 결합하도록 구성된 조작된 가이드 리보핵산 구조와 복합체를 형성하는 클래스 2, II형 Cas 엔도뉴클레아제와 접촉시키는 단계를 포함하며; 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 프로토스페이서 인접 모티프(PAM)를 포함하고; 상기 PAM은 서열 번호 5847-5861 또는 6258-6278로 이루어진 군으로부터 선택된 서열을 포함하는 것인 방법을 제공한다. 일부 실시 양태에서, 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 상기 조작된 가이드 리보핵산 구조의 서열에 상보적인 서열을 포함하는 제1 가닥 및 상기 PAM을 포함하는 제2 가닥을 포함한다. 일부 실시 양태에서, 상기 PAM은 상기 조작된 가이드 리보핵산 구조의 상기 서열에 상보적인 상기 서열의 3' 말단에 바로 인접한다. 일부 실시 양태에서, 상기 클래스 2, II형 Cas 엔도뉴클레아제는 Cas9 엔도뉴클레아제, Cas14 엔도뉴클레아제, Cas12a 엔도뉴클레아제, Cas12b 엔도뉴클레아제, Cas 12c 엔도뉴클레아제, Cas12d 엔도뉴클레아제, Cas12e 엔도뉴클레아제, Cas13a 엔도뉴클레아제, Cas13b 엔도뉴클레아제, Cas13c 엔도뉴클레아제, 또는 Cas 13d 엔도뉴클레아제가 아니다. 일부 실시 양태에서, 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 진핵생물, 식물, 진균, 포유동물, 설치류, 또는 인간 이중 가닥 데옥시리보핵산 폴리뉴클레오티드이다.
일부 측면에서, 본 개시 내용은 표적 핵산 유전자좌를 변형시키는 방법을 제공하며, 상기 방법은 본원에 기재된 임의의 조작된 뉴클레아제 시스템을 상기 표적 핵산 유전자좌에 전달하는 단계를 포함하며, 여기서 상기 엔도뉴클레아제는 상기 조작된 가이드 리보핵산 구조와 복합체를 형성하도록 구성되고, 상기 복합체는 상기 복합체가 상기 표적 핵산 유전자좌에 결합할 때 상기 복합체가 상기 표적 핵산 유전자좌를 변형시키도록 구성된다. 일부 실시 양태에서, 상기 표적 핵산 유전자좌는 상기 표적 핵산 유전자좌에 결합하거나, 이를 닉킹, 절단, 또는 마킹하는 단계를 포함한다. 일부 실시 양태에서, 상기 표적 핵산 유전자좌는 데옥시리보핵산(DNA) 또는 리보핵산(RNA)을 포함한다. 일부 실시 양태에서, 상기 표적 핵산은 게놈 DNA, 바이러스 DNA, 바이러스 RNA, 또는 박테리아 DNA를 포함한다. 일부 실시 양태에서, 상기 표적 핵산 유전자좌는 시험관 내에 있다. 일부 실시 양태에서, 상기 표적 핵산 유전자좌는 세포 내에 있다. 일부 실시 양태에서, 상기 세포는 원핵생물 세포, 박테리아 세포, 진핵생물 세포, 진균 세포, 식물 세포, 동물 세포, 포유동물 세포, 설치류 세포, 영장류 세포, 또는 인간 세포이다. 일부 실시 양태에서, 상기 표적 핵산 유전자좌로의 상기 조작된 뉴클레아제 시스템은 본원에 기재된 임의의 핵산 또는 본원에 기재된 임의의 벡터를 전달하는 단계를 포함한다. 일부 실시 양태에서, 상기 조작된 뉴클레아제 시스템을 상기 표적 핵산 유전자좌에 전달하는 단계는 상기 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임을 포함하는 핵산을 전달하는 단계를 포함한다. 일부 실시 양태에서, 상기 핵산은 상기 엔도뉴클레아제를 코딩하는 상기 오픈 리딩 프레임이 작동가능하게 연결된 프로모터를 포함한다. 일부 실시 양태에서, 상기 조작된 뉴클레아제 시스템을 상기 표적 핵산 유전자좌에 전달하는 단계는 상기 엔도뉴클레아제를 코딩하는 상기 오픈 리딩 프레임을 포함하는 캡핑된 mRNA를 전달하는 단계를 포함한다. 일부 실시 양태에서, 상기 조작된 뉴클레아제 시스템을 상기 표적 핵산 유전자좌에 전달하는 단계는 번역된 폴리펩티드를 전달하는 단계를 포함한다. 일부 실시 양태에서, 상기 조작된 뉴클레아제 시스템을 상기 표적 핵산 유전자좌에 전달하는 단계는 리보핵산(RNA) pol III 프로모터에 작동가능하게 연결된 상기 조작된 가이드 리보핵산 구조를 코딩하는 데옥시리보핵산(DNA)을 전달하는 단계를 포함한다. 일부 실시 양태에서, 상기 엔도뉴클레아제는 상기 표적 유전자좌에서 또는 이에 근접하여 단일 가닥 파손 또는 이중 가닥 파손을 유도한다.
일부 측면에서, 본 개시 내용은 세포에서 TRAC 유전자좌를 편집하는 방법으로서, 상기 세포에 (a) RNA 가이드된 엔도뉴클레아제; 및 (b) 조작된 가이드 RNA를 접촉시키는 단계를 포함하며, 상기 조작된 가이드 RNA는 상기 엔도뉴클레아제와 복합체를 형성하도록 구성되고 상기 조작된 가이드 RNA는 상기 TRAC 유전자좌의 영역에 혼성화하도록 구성된 스페이서 서열을 포함하고, 상기 조작된 가이드 RNA는 서열 번호 5950-5958 또는 5959-5965 중 어느 하나의 적어도 19, 적어도 20, 적어도 21, 적어도 22, 적어도 23, 또는 적어도 24개의 연속 뉴클레오티드에 대해 적어도 80% 동일성, 적어도 82% 동일성, 적어도 84% 동일성, 적어도 86% 동일성, 적어도 88% 동일성, 적어도 90% 동일성, 적어도 91% 동일성, 적어도 92% 동일성, 적어도 93% 동일성, 적어도 94% 동일성, 적어도 95% 동일성, 적어도 96% 동일성, 적어도 97% 동일성, 적어도 98% 동일성, 적어도 99% 동일성, 또는 적어도 100% 동일성을 갖는 표적화 서열을 포함하는 것인 방법을 제공한다. 일부 실시 양태에서, 상기 RNA 가이드된 엔도뉴클레아제는 클래스 II, II형 Cas 엔도뉴클레아제이다. 일부 실시 양태에서, 상기 RNA 가이드된 엔도뉴클레아제는 서열 번호 2242 또는 서열 번호 2244에 대해 적어도 75% 동일성, 적어도 80% 동일성, 적어도 82% 동일성, 적어도 84% 동일성, 적어도 86% 동일성, 적어도 88% 동일성, 적어도 90% 동일성, 적어도 91% 동일성, 적어도 92% 동일성, 적어도 93% 동일성, 적어도 94% 동일성, 적어도 95% 동일성, 적어도 96% 동일성, 적어도 97% 동일성, 적어도 98% 동일성, 적어도 99% 동일성, 또는 적어도 100% 동일성을 갖는 서열을 포함하는 RuvCIII 도메인을 포함한다. 일부 실시 양태에서, 상기 RNA 가이드된 엔도뉴클레아제는 HNH 도메인을 추가로 포함한다. 일부 실시 양태에서, 상기 RNA 가이드된 엔도뉴클레아제는 서열 번호 421 또는 서열 번호 423에 대해 적어도 75% 동일성, 적어도 80% 동일성, 적어도 82% 동일성, 적어도 84% 동일성, 적어도 86% 동일성, 적어도 88% 동일성, 적어도 90% 동일성, 적어도 91% 동일성, 적어도 92% 동일성, 적어도 93% 동일성, 적어도 94% 동일성, 적어도 95% 동일성, 적어도 96% 동일성, 적어도 97% 동일성, 적어도 98% 동일성, 적어도 99% 동일성, 또는 적어도 100% 동일성을 갖는 서열을 포함한다. 일부 실시 양태에서, 상기 조작된 가이드 RNA는 서열 번호 5950-5958 중 어느 하나의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함하고 상기 엔도뉴클레아제는 서열 번호 421에 대해 적어도 75% 동일성을 갖는 서열을 포함한다. 일부 실시 양태에서, 상기 조작된 가이드 RNA는 서열 번호 5959-5965 중 어느 하나의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함하고 상기 엔도뉴클레아제는 서열 번호 423에 대해 적어도 75% 동일성을 갖는 서열을 포함한다. 일부 실시 양태에서, 상기 조작된 가이드 RNA는 서열 번호 5953-5957 중 어느 하나의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함한다. 일부 실시 양태에서, 상기 조작된 가이드 RNA는 서열 번호 5960-5961 또는 5963-5964 중 어느 하나의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함한다.
일부 측면에서, 본 개시 내용은 세포에서 TRBC 유전자좌를 편집하는 방법으로서, 상기 세포에 (a) RNA 가이드된 엔도뉴클레아제; 및 (b) 조작된 가이드 RNA를 접촉시키는 단계를 포함하며, 상기 조작된 가이드 RNA는 상기 엔도뉴클레아제와 복합체를 형성하도록 구성되고 상기 조작된 가이드 RNA는 상기 TRBC 유전자좌의 영역에 혼성화하도록 구성된 스페이서 서열을 포함하고, 상기 조작된 가이드 RNA는 5966-6004 또는 6005-6025 중 어느 하나의 적어도 19, 적어도 20, 적어도 21, 적어도 22, 적어도 23, 또는 적어도 24개의 연속 뉴클레오티드에 대해 적어도 80% 동일성, 적어도 82% 동일성, 적어도 84% 동일성, 적어도 86% 동일성, 적어도 88% 동일성, 적어도 90% 동일성, 적어도 91% 동일성, 적어도 92% 동일성, 적어도 93% 동일성, 적어도 94% 동일성, 적어도 95% 동일성, 적어도 96% 동일성, 적어도 97% 동일성, 적어도 98% 동일성, 적어도 99% 동일성, 또는 적어도 100% 동일성을 갖는 표적화 서열을 포함하는 것인 방법을 제공한다. 일부 실시 양태에서, 상기 RNA 가이드된 엔도뉴클레아제는 클래스 II, II형 Cas 엔도뉴클레아제이다. 일부 실시 양태에서, 상기 RNA 가이드된 엔도뉴클레아제는 서열 번호 2242 또는 서열 번호 2244에 대해 적어도 75% 동일성, 적어도 80% 동일성, 적어도 82% 동일성, 적어도 84% 동일성, 적어도 86% 동일성, 적어도 88% 동일성, 적어도 90% 동일성, 적어도 91% 동일성, 적어도 92% 동일성, 적어도 93% 동일성, 적어도 94% 동일성, 적어도 95% 동일성, 적어도 96% 동일성, 적어도 97% 동일성, 적어도 98% 동일성, 적어도 99% 동일성, 또는 적어도 100% 동일성을 갖는 서열을 포함하는 RuvCIII 도메인을 포함한다. 일부 실시 양태에서, 상기 RNA 가이드된 엔도뉴클레아제는 HNH 도메인을 추가로 포함한다. 일부 실시 양태에서, 상기 RNA 가이드된 엔도뉴클레아제는 서열 번호 421 또는 서열 번호 423에 대해 적어도 75% 동일성, 적어도 80% 동일성, 적어도 82% 동일성, 적어도 84% 동일성, 적어도 86% 동일성, 적어도 88% 동일성, 적어도 90% 동일성, 적어도 91% 동일성, 적어도 92% 동일성, 적어도 93% 동일성, 적어도 94% 동일성, 적어도 95% 동일성, 적어도 96% 동일성, 적어도 97% 동일성, 적어도 98% 동일성, 적어도 99% 동일성, 또는 적어도 100% 동일성을 갖는 서열을 포함한다. 일부 실시 양태에서, 상기 조작된 가이드 RNA는 서열 번호 5966-6004 중 어느 하나의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함하고 상기 엔도뉴클레아제는 서열 번호 421에 대해 적어도 75% 동일성을 갖는 서열을 포함한다. 일부 실시 양태에서, 상기 조작된 가이드 RNA는 서열 번호 6005-6025 중 어느 하나의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함하고 상기 엔도뉴클레아제는 서열 번호 423에 대해 적어도 75% 동일성을 갖는 서열을 포함한다. 일부 실시 양태에서, 상기 조작된 가이드 RNA는 서열 번호 5970, 5971, 5983, 또는 5984 중 어느 하나의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함한다. 일부 실시 양태에서, 상기 조작된 가이드 RNA는 서열 번호 6006, 6010, 6011, 또는 6012 중 어느 하나의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함한다.
일부 측면에서, 본 개시 내용은 세포에서 GR(NR3C1) 유전자좌를 편집하는 방법으로서, 상기 세포에 (a) RNA 가이드된 엔도뉴클레아제; 및 (b) 조작된 가이드 RNA를 접촉시키는 단계를 포함하며, 상기 조작된 가이드 RNA는 상기 엔도뉴클레아제와 복합체를 형성하도록 구성되고 상기 조작된 가이드 RNA는 상기 GR(NR3C1) 유전자좌의 영역에 혼성화하도록 구성된 스페이서 서열을 포함하고, 상기 조작된 가이드 RNA는 서열 번호 6026-6090 또는 6091-6121중 어느 하나의 적어도 19, 적어도 20, 적어도 21, 적어도 22, 적어도 23, 또는 적어도 24개의 연속 뉴클레오티드에 대해 적어도 80% 동일성, 적어도 82% 동일성, 적어도 84% 동일성, 적어도 86% 동일성, 적어도 88% 동일성, 적어도 90% 동일성, 적어도 91% 동일성, 적어도 92% 동일성, 적어도 93% 동일성, 적어도 94% 동일성, 적어도 95% 동일성, 적어도 96% 동일성, 적어도 97% 동일성, 적어도 98% 동일성, 적어도 99% 동일성, 또는 적어도 100% 동일성을 갖는 표적화 서열을 포함하는 것인 방법을 제공한다. 일부 실시 양태에서, 상기 RNA 가이드된 엔도뉴클레아제는 클래스 II, II형 Cas 엔도뉴클레아제이다. 일부 실시 양태에서, 상기 RNA 가이드된 엔도뉴클레아제는 서열 번호 2242 또는 서열 번호 2244에 대해 적어도 75% 동일성, 적어도 80% 동일성, 적어도 82% 동일성, 적어도 84% 동일성, 적어도 86% 동일성, 적어도 88% 동일성, 적어도 90% 동일성, 적어도 91% 동일성, 적어도 92% 동일성, 적어도 93% 동일성, 적어도 94% 동일성, 적어도 95% 동일성, 적어도 96% 동일성, 적어도 97% 동일성, 적어도 98% 동일성, 적어도 99% 동일성, 또는 적어도 100% 동일성을 갖는 서열을 포함하는 RuvCIII 도메인을 포함한다. 일부 실시 양태에서, 상기 RNA 가이드된 엔도뉴클레아제는 HNH 도메인을 추가로 포함한다. 일부 실시 양태에서, 상기 RNA 가이드된 엔도뉴클레아제는 서열 번호 421 또는 서열 번호 423에 대해 적어도 75% 동일성을 갖는 서열을 포함한다. 일부 실시 양태에서, 상기 조작된 가이드 RNA는 서열 번호 6026-6090 중 어느 하나의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함하고 상기 엔도뉴클레아제는 서열 번호 421에 대해 적어도 75% 동일성을 갖는 서열을 포함한다. 일부 실시 양태에서, 상기 조작된 가이드 RNA는 서열 번호 6091-6121 중 어느 하나의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함하고 상기 엔도뉴클레아제는 서열 번호 423에 대해 적어도 75% 동일성을 갖는 서열을 포함한다. 일부 실시 양태에서, 상기 조작된 가이드 RNA는 서열 번호 6027-6028, 6029, 6038, 6043, 6049, 6076, 6080, 6081, 또는 6086 중 어느 하나의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함한다. 일부 실시 양태에서, 상기 조작된 가이드 RNA는 서열 번호 6092, 6115, 또는 6119 중 어느 하나의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함한다.
일부 측면에서, 본 개시 내용은 세포에서 AAVS1 유전자좌를 편집하는 방법으로서, 상기 세포에 (a) RNA 가이드된 엔도뉴클레아제; 및 (b) 조작된 가이드 RNA를 접촉시키는 단계를 포함하며, 상기 조작된 가이드 RNA는 상기 엔도뉴클레아제와 복합체를 형성하도록 구성되고 상기 조작된 가이드 RNA는 상기 AAVS1 유전자좌의 영역에 혼성화하도록 구성된 스페이서 서열을 포함하고, 상기 조작된 가이드 RNA는 서열 번호 6122-6152 중 어느 하나의 적어도 19, 적어도 20, 적어도 21, 적어도 22, 적어도 23, 또는 적어도 24개의 연속 뉴클레오티드에 대해 적어도 80% 동일성, 적어도 82% 동일성, 적어도 84% 동일성, 적어도 86% 동일성, 적어도 88% 동일성, 적어도 90% 동일성, 적어도 91% 동일성, 적어도 92% 동일성, 적어도 93% 동일성, 적어도 94% 동일성, 적어도 95% 동일성, 적어도 96% 동일성, 적어도 97% 동일성, 적어도 98% 동일성, 적어도 99% 동일성, 또는 적어도 100% 동일성을 갖는 표적화 서열을 포함하는 것인 방법을 제공한다. 일부 실시 양태에서, 상기 RNA 가이드된 엔도뉴클레아제는 클래스 II, II형 Cas 엔도뉴클레아제이다. 일부 실시 양태에서, 상기 RNA 가이드된 엔도뉴클레아제는 서열 번호 2242 또는 서열 번호 2244에 대해 적어도 75% 동일성, 적어도 80% 동일성, 적어도 82% 동일성, 적어도 84% 동일성, 적어도 86% 동일성, 적어도 88% 동일성, 적어도 90% 동일성, 적어도 91% 동일성, 적어도 92% 동일성, 적어도 93% 동일성, 적어도 94% 동일성, 적어도 95% 동일성, 적어도 96% 동일성, 적어도 97% 동일성, 적어도 98% 동일성, 적어도 99% 동일성, 또는 적어도 100% 동일성을 갖는 서열을 포함하는 RuvCIII 도메인을 포함한다. 일부 실시 양태에서, 상기 RNA 가이드된 엔도뉴클레아제는 HNH 도메인을 추가로 포함한다. 일부 실시 양태에서, 상기 RNA 가이드된 엔도뉴클레아제는 서열 번호 421 또는 서열 번호 423에 대해 적어도 75% 동일성, 적어도 80% 동일성, 적어도 82% 동일성, 적어도 84% 동일성, 적어도 86% 동일성, 적어도 88% 동일성, 적어도 90% 동일성, 적어도 91% 동일성, 적어도 92% 동일성, 적어도 93% 동일성, 적어도 94% 동일성, 적어도 95% 동일성, 적어도 96% 동일성, 적어도 97% 동일성, 적어도 98% 동일성, 적어도 99% 동일성, 또는 적어도 100% 동일성을 갖는 서열을 포함한다. 일부 실시 양태에서, 상기 조작된 가이드 RNA는 서열 번호 6122, 6125-6126, 6128, 6131, 6133, 6136, 6141, 6143, 또는 6148 중 어느 하나의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함한다.
일부 측면에서, 본 개시 내용은 세포에서 TIGIT 유전자좌를 편집하는 방법으로서, 상기 세포에 (a) RNA 가이드된 엔도뉴클레아제; 및 (b) 조작된 가이드 RNA를 접촉시키는 단계를 포함하며, 상기 조작된 가이드 RNA는 상기 엔도뉴클레아제와 복합체를 형성하도록 구성되고 상기 조작된 가이드 RNA는 상기 TIGIT 유전자좌의 영역에 혼성화하도록 구성된 스페이서 서열을 포함하고, 상기 조작된 가이드 RNA는 서열 번호 6153-6181 중 어느 하나의 적어도 19, 적어도 20, 적어도 21, 적어도 22, 적어도 23, 또는 적어도 24개의 연속 뉴클레오티드에 대해 적어도 80% 동일성, 적어도 82% 동일성, 적어도 84% 동일성, 적어도 86% 동일성, 적어도 88% 동일성, 적어도 90% 동일성, 적어도 91% 동일성, 적어도 92% 동일성, 적어도 93% 동일성, 적어도 94% 동일성, 적어도 95% 동일성, 적어도 96% 동일성, 적어도 97% 동일성, 적어도 98% 동일성, 적어도 99% 동일성, 또는 적어도 100% 동일성을 갖는 표적화 서열을 포함하는 것인 방법을 제공한다. 일부 실시 양태에서, 상기 RNA 가이드된 엔도뉴클레아제는 클래스 II, II형 Cas 엔도뉴클레아제이다. 일부 실시 양태에서, 상기 RNA 가이드된 엔도뉴클레아제는 서열 번호 421 또는 서열 번호 423에 대해 적어도 75% 동일성, 적어도 80% 동일성, 적어도 82% 동일성, 적어도 84% 동일성, 적어도 86% 동일성, 적어도 88% 동일성, 적어도 90% 동일성, 적어도 91% 동일성, 적어도 92% 동일성, 적어도 93% 동일성, 적어도 94% 동일성, 적어도 95% 동일성, 적어도 96% 동일성, 적어도 97% 동일성, 적어도 98% 동일성, 적어도 99% 동일성, 또는 적어도 100% 동일성을 갖는 서열을 포함한다. 일부 실시 양태에서, 상기 RNA 가이드된 엔도뉴클레아제는 서열 번호 2242 또는 서열 번호 2244에 대해 적어도 75% 동일성, 적어도 80% 동일성, 적어도 82% 동일성, 적어도 84% 동일성, 적어도 86% 동일성, 적어도 88% 동일성, 적어도 90% 동일성, 적어도 91% 동일성, 적어도 92% 동일성, 적어도 93% 동일성, 적어도 94% 동일성, 적어도 95% 동일성, 적어도 96% 동일성, 적어도 97% 동일성, 적어도 98% 동일성, 적어도 99% 동일성, 또는 적어도 100% 동일성을 갖는 서열을 포함하는 RuvCIII 도메인을 포함한다. 일부 실시 양태에서, 상기 RNA 가이드된 엔도뉴클레아제는 HNH 도메인을 추가로 포함한다. 일부 실시 양태에서, 상기 조작된 가이드 RNA는 서열 번호 66155, 6159, 616, 또는 6172 중 어느 하나의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함한다.
일부 측면에서, 본 개시 내용은 세포에서 CD38 유전자좌를 편집하는 방법으로서, 상기 세포에 (a) RNA 가이드된 엔도뉴클레아제; 및 (b) 조작된 가이드 RNA를 접촉시키는 단계를 포함하며, 상기 조작된 가이드 RNA는 상기 엔도뉴클레아제와 복합체를 형성하도록 구성되고 상기 조작된 가이드 RNA는 상기 CD38 유전자좌의 영역에 혼성화하도록 구성된 스페이서 서열을 포함하고, 상기 조작된 가이드 RNA는 서열 번호 6182-6248 또는 6249-6256 중 어느 하나의 적어도 19, 적어도 20, 적어도 21, 적어도 22, 적어도 23, 또는 적어도 24개의 연속 뉴클레오티드에 대해 적어도 80% 동일성, 적어도 82% 동일성, 적어도 84% 동일성, 적어도 86% 동일성, 적어도 88% 동일성, 적어도 90% 동일성, 적어도 91% 동일성, 적어도 92% 동일성, 적어도 93% 동일성, 적어도 94% 동일성, 적어도 95% 동일성, 적어도 96% 동일성, 적어도 97% 동일성, 적어도 98% 동일성, 적어도 99% 동일성, 또는 적어도 100% 동일성을 갖는 표적화 서열을 포함하는 것인 방법을 제공한다. 일부 실시 양태에서, 상기 RNA 가이드된 엔도뉴클레아제는 클래스 II, II형 Cas 엔도뉴클레아제이다. 일부 실시 양태에서, 상기 RNA 가이드된 엔도뉴클레아제는 서열 번호 2242 또는 서열 번호 2244에 대해 적어도 75% 동일성, 적어도 80% 동일성, 적어도 82% 동일성, 적어도 84% 동일성, 적어도 86% 동일성, 적어도 88% 동일성, 적어도 90% 동일성, 적어도 91% 동일성, 적어도 92% 동일성, 적어도 93% 동일성, 적어도 94% 동일성, 적어도 95% 동일성, 적어도 96% 동일성, 적어도 97% 동일성, 적어도 98% 동일성, 적어도 99% 동일성, 또는 적어도 100% 동일성을 갖는 서열을 포함하는 RuvCIII 도메인을 포함한다. 일부 실시 양태에서, 상기 RNA 가이드된 엔도뉴클레아제는 HNH 도메인을 추가로 포함한다. 일부 실시 양태에서, 상기 RNA 가이드된 엔도뉴클레아제는 서열 번호 421 또는 서열 번호 423에 대해 적어도 75% 동일성, 적어도 80% 동일성, 적어도 82% 동일성, 적어도 84% 동일성, 적어도 86% 동일성, 적어도 88% 동일성, 적어도 90% 동일성, 적어도 91% 동일성, 적어도 92% 동일성, 적어도 93% 동일성, 적어도 94% 동일성, 적어도 95% 동일성, 적어도 96% 동일성, 적어도 97% 동일성, 적어도 98% 동일성, 적어도 99% 동일성, 또는 적어도 100% 동일성을 갖는 서열을 포함한다. 일부 실시 양태에서, 상기 조작된 가이드 RNA는 서열 번호 6182-6248 중 어느 하나의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함하고 상기 엔도뉴클레아제는 서열 번호 421에 대해 적어도 75% 동일성을 갖는 서열을 포함한다. 일부 실시 양태에서, 상기 조작된 가이드 RNA는 서열 번호 6249-6256 중 어느 하나의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함하고 상기 엔도뉴클레아제는 서열 번호 423에 대해 적어도 75% 동일성을 갖는 서열을 포함한다. 일부 실시 양태에서, 상기 조작된 가이드 RNA는 서열 번호 6182-6183, 6189, 6191, 6208, 6210, 6211, 또는 6215 중 어느 하나의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함한다. 일부 실시 양태에서, 상기 조작된 가이드 RNA는 서열 번호 6251의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함한다.
상기 세포에서 특정 유전자좌를 편집하기 위한 임의의 방법의 일부 실시 양태에서, 상기 세포는 말초 혈액 단핵 세포, T 세포, NK 세포, 조혈 줄기 세포(HSCT: hematopoietic stem cell) 또는 B 세포, 또는 이들의 조합이다.
일부 측면에서, 본 개시 내용은 (a) 표적 DNA 분자 내의 표적 서열에 상보적인 뉴클레오티드 서열을 포함하는 DNA표적화 세그먼트; 및 (b) 혼성화하여 이중 가닥 RNA(dsRNA) 이중체를 형성하는 2개의 상보적인 뉴클레오티드 스트레치를 포함하는 단백질 결합 세그먼트를 포함하는 조작된 가이드 리보핵산 폴리뉴클레오티드를 제공하며, 여기서 상기 2개의 상보적인 뉴클레오티드 스트레치는 개재 뉴클레오티드로 서로 공유적으로 연결되며, 상기 조작된 가이드 리보핵산 폴리뉴클레오티드는 클래스 2, II형 Cas 엔도뉴클레아제와 복합체를 형성하고 상기 복합체를 상기 표적 DNA 분자의 상기 표적 서열에 표적화하도록 구성되고, 상기 DNA 표적화 세그먼트는 서열 번호 5950-5965, 5966-6025, 6026-6121, 6122-6152, 6153-6181, 또는 6182-6256중 어느 하나의 적어도 19, 적어도 20, 적어도 21, 적어도 22, 적어도 23, 또는 적어도 24개의 연속 뉴클레오티드에 대해 적어도 80% 동일성, 적어도 82% 동일성, 적어도 84% 동일성, 적어도 86% 동일성, 적어도 88% 동일성, 적어도 90% 동일성, 적어도 91% 동일성, 적어도 92% 동일성, 적어도 93% 동일성, 적어도 94% 동일성, 적어도 95% 동일성, 적어도 96% 동일성, 적어도 97% 동일성, 적어도 98% 동일성, 적어도 99% 동일성, 또는 적어도 100% 동일성을 갖는 서열을 포함한다. 일부 실시 양태에서, 상기 단백질 결합 세그먼트는 서열 번호 5466 또는 6304 중 어느 하나에 대해 적어도 85% 동일성을 갖는 서열을 포함한다.
일부 측면에서, 본 개시 내용은 (a) RNA 가이드된 엔도뉴클레아제; (b) 상기 RNA 가이드된 엔도뉴클레아제에 결합하도록 구성된 제97항에 따른 조작된 가이드 리보핵산 폴리뉴클레오티드; 및 (c) 키메라 항원 수용체(CAR: chimeric antigen receptor)를 코딩하는 서열에 인접해 있는 제1 및 제2 상동성 아암을 포함하는 단일 또는 이중 가닥 DNA 복구 주형을 포함하는 편집된 면역 세포를 생성하기 위한 시스템을 제공한다. 일부 실시 양태에서, 상기 세포는 말초 혈액 단핵 세포, T 세포, NK 세포, 조혈 줄기 세포(HSCT), 또는 B 세포, 또는 이들의 임의의 조합이다. 일부 측면에서, 상기 RNA 가이드된 엔도뉴클레아제는 클래스 II, II형 Cas 엔도뉴클레아제이다. 일부 측면에서, 상기 RNA 가이드된 엔도뉴클레아제는 서열 번호 2242 또는 서열 번호 2244에 대해 적어도 75% 동일성, 적어도 80% 동일성, 적어도 82% 동일성, 적어도 84% 동일성, 적어도 86% 동일성, 적어도 88% 동일성, 적어도 90% 동일성, 적어도 91% 동일성, 적어도 92% 동일성, 적어도 93% 동일성, 적어도 94% 동일성, 적어도 95% 동일성, 적어도 96% 동일성, 적어도 97% 동일성, 적어도 98% 동일성, 적어도 99% 동일성, 또는 적어도 100% 동일성을 갖는 서열을 포함하는 RuvCIII 도메인을 포함한다. 일부 측면에서, 상기 RNA 가이드된 엔도뉴클레아제는 HNH 도메인을 추가로 포함한다. 일부 측면에서, 상기 RNA 가이드된 엔도뉴클레아제는 서열 번호 421 또는 서열 번호 423에 대해 적어도 75% 동일성, 적어도 80% 동일성, 적어도 82% 동일성, 적어도 84% 동일성, 적어도 86% 동일성, 적어도 88% 동일성, 적어도 90% 동일성, 적어도 91% 동일성, 적어도 92% 동일성, 적어도 93% 동일성, 적어도 94% 동일성, 적어도 95% 동일성, 적어도 96% 동일성, 적어도 97% 동일성, 적어도 98% 동일성, 적어도 99% 동일성, 또는 적어도 100% 동일성을 갖는 서열을 포함한다.
본 개시 내용의 추가적인 측면 및 이점은 본 개시 내용의 단지 예시적인 실시 양태가 제시되고 설명되는 다음의 상세한 설명으로부터 당업자에게 쉽게 명백해질 것이다. 이해되는 바와 같이, 본 개시 내용은 다른 실시 양태 및 여러가지 실시 양태가 가능하며, 그 몇몇 세부사항은 모두 본 발명에서 벗어나지 않고 다양한 명백한 측면에서 변형될 수 있다. 따라서, 도면과 설명은 본질적으로 예시적인 것으로 간주되어야 하며 제한적인 것으로 간주되어서는 안 된다.
참고에 의한 포함
본 명세서에 언급된 모든 간행물, 특허 및 특허 출원은 각각의 개별 간행물, 특허 또는 특허 출원이 구체적이고 개별적으로 참고로 포함되는 것으로 표시된 것과 동일한 정도로 본원에 참고로 포함된다.
본 발명의 새로운 특징은 특히 첨부된 청구범위에 제시되어 있다. 본 발명의 특징 및 장점은 본 발명의 원리가 활용되는 예시적인 실시 양태를 설명하는 다음의 상세한 설명 및 첨부 도면(또한 본원에서 "도면" 및 "도 ")을 참고함으로써 더 잘 이해될 것이며, 그 중
[도 1]은 상이한 클래스 및 유형의 CRISPR/Cas 유전자좌의 전형적인 구성을 도시한다.
[도 2]는 천연 클래스 2/II형 crRNA/tracrRNA 쌍의 구조를 둘 다 결합된 하이브리드 sgRNA와 비교하여 도시한다.
[도 3]은 MG1 패밀리로부터의 효소를 코딩하는 CRISPR 유전자좌의 구성을 보여주는 개략도를 도시한다.
[도 4]는 MG2 패밀리로부터의 효소를 코딩하는 CRISPR 유전자좌의 구성을 보여주는 개략도를 도시한다.
[도 5]는 MG3 패밀리로부터의 효소를 코딩하는 CRISPR 유전자좌의 구성을 보여주는 개략도를 도시한다.
[도 6]은 본 개시 내용의 효소(MG1-1) 대 스태필로코쿠스 아우레우스(Staphylococcus aureus)로부터의 Cas9(서열 번호5613)의 구조 기반 정렬을 도시한다. 기능에 대해 예측되는 필수 잔기는 서열 아래에 표시되어 있다. 보존된 잔기는 검은색으로 강조 표시되어 있다.
[도 7]은 본 개시 내용의 효소(MG2-1) 대 스태필로코쿠스 아우레우스로부터의 Cas9(서열 번호5613)의 구조 기반 정렬을 도시한다. 기능에 대해 예측되는 필수 잔기는 서열 아래에 표시되어 있다. 보존 잔기는 검은색으로 강조 표시되어 있다.
[도 8]은 본 개시 내용의 효소(MG3-1) 대 악티노마이세스 나에슬룬디(Actinomyces naeslundii)로부터의 Cas9(서열 번호 5614)의 구조 기반 정렬을 도시한다. 기능에 대해 예측되는 필수 잔기는 서열 아래에 표시되어 있다. 보존 잔기는 검은색으로 강조 표시되어 있다.
[도 9a, 9b, 9c 9d, 9e, 9f, 9g, 및 9h]는 MG1 패밀리 효소 MG1-1 내지 MG1-6(서열 번호 5, 6, 9, 1, 2, 및 3)의 구조 기반 정렬을 도시한다. 기능에 대해 예측되는 필수 잔기는 서열 아래에 표시되어 있다. 보존 잔기는 검은색으로 강조 표시되어 있다.
[도 10]은 다양한 길이의 표적화 서열을 함유하는 상응하는 sgRNA와 복합체를 형성하는 MG1-4에 의한 DNA의 시험관 내 절단을 도시한다.
[도 11]은 상응하는 sgRNA와 함께 MG1-4를 사용한 이. 콜라이 게놈 DNA의 세포 내 절단을 도시한다. 표적 또는 비표적 스페이서와 함께 MG1-4로 형질전환된 세포의 희석 시리즈를 나타낸다(상단). 하단 패널은 정량화된 데이터를 보여주며, 여기서 왼쪽 막대는 비표적 sgRNA를 나타내고 오른쪽 막대는 표적 sgRNA를 나타낸다.
[도 12]는 인간 게놈에서 다양한 위치를 표적화하는 다양한 상이한 표적화 서열을 함유하는 상응하는 sgRNA와 함께 실시예 11에 기재된 MG1-4 또는 MG1-6 구축물로 HEK 세포를 형질감염시킴으로써 생성된 세포 내 삽입-결실 형성을 도시한다.
[도 13]은 다양한 길이의 표적화 서열을 함유하는 상응하는 sgRNA와 복합체를 형성하는 MG3-6에 의한 DNA의 시험관 내 절단을 도시한다.
[도 14]는 상응하는 sgRNA와 함께 MG3-7을 사용한 이. 콜라이 게놈 DNA의 세포 내 절단을 도시한다. 표적 또는 비표적 스페이서와 함께 MG3-7로 형질전환된 세포의 희석 시리즈를 나타낸다(상단). 하단 패널은 정량화된 데이터를 보여주며, 여기서 왼쪽 막대는 비표적 sgRNA를 나타내고 오른쪽 막대는 표적 sgRNA를 나타낸다.
[도 15]는 인간 게놈에서 다양한 위치를 표적화하는 다양한 상이한 표적화 서열을 함유하는 상응하는 sgRNA와 함께 실시예 13에 기재된 MG3-7 구축물로 HEK 세포를 형질감염시킴으로써 생성된 세포 내 삽입-결실 형성을 도시한다.
[도 16]은 다양한 길이의 표적화 서열을 함유하는 상응하는 sgRNA와 복합체를 형성하는 MG15-1에 의한 DNA의 시험관 내 절단을 도시한다.
[도 17, 18, 19, 및 20]은 다양한 MG 패밀리 뉴클레아제 및 이들의 상응하는 tracrRNA 또는 sgRNA를 함유하는 TXTL 추출물의 존재 하에 PAM 벡터 라이브러리 절단의 결과를 나타내는 아가로스 겔을 도시한다.
[도 21, 22, 23, 24, 25, 및 26]은 본원에 기재된 MG 효소의 상응하는 sgRNA의 예측된 구조(예를 들어, 실시예 7에서와 같이 예측됨)를 도시한다.
[도 27, 28, 29, 30, 31, 32 및 33]은 본원에 기재된 바와 같이(예를 들어, 실시예 6에 기재된 바와 같이) NGS를 통해 유도된 PAM 서열의 seqLogo 표현을 도시한다.
[도 34]는 상응하는 sgRNA와 함께 MG2-7을 사용한 이. 콜라이 게놈 DNA의 세포 내 절단을 도시한다. 표적 또는 비표적 스페이서와 함께 MG2-7로 형질전환된 세포의 희석 시리즈를 나타낸다(상단). 하단 패널은 정량화된 데이터를 보여주며, 여기서 오른쪽 막대는 비표적 sgRNA를 나타내고 왼쪽 막대는 표적 sgRNA를 나타낸다.
[도 35]는 상응하는 sgRNA와 함께 MG14-1을 사용한 이. 콜라이 게놈 DNA의 세포 내 절단을 도시한다. 표적 또는 비표적 스페이서와 함께 MG14-1로 형질전환된 세포의 희석 시리즈를 나타낸다(상단). 하단 패널은 정량화된 데이터를 보여주며, 여기서 오른쪽 막대는 비표적 sgRNA를 나타내고 왼쪽 막대는 표적 sgRNA를 나타낸다.
[도 36]은 상응하는 sgRNA와 함께 MG15-1을 사용한 이. 콜라이 게놈 DNA의 세포 내 절단을 도시한다. 표적 또는 비표적 스페이서와 함께 MG15-1로 형질전환된 세포의 희석 시리즈를 나타낸다(상단). 하단 패널은 정량화된 데이터를 보여주며, 여기서 오른쪽 막대는 비표적 sgRNA를 나타내고 왼쪽 막대는 표적 sgRNA를 나타낸다.
[도 37-39]는 인간 게놈에서 다양한 위치를 표적화하는 다양한 상이한 표적화 서열을 함유하는 상응하는 sgRNA와 함께 실시예 11에 기재된 MG1-4, MG1-6 및 MG1-7 구축물로 HEK 세포를 형질감염시킴으로써 생성된 세포 내 삽입-결실 형성을 도시한다.
[도 40-42]는 인간 게놈의 다양한 위치를 표적화하는 다양한 상이한 표적화 서열을 함유하는 상응하는 sgRNA와 함께 실시예 13에 기재된 MG3-6, MG3-7 및 MG3-8 구축물로 HEK 세포를 형질감염시킴으로써 생성된 세포 내 삽입-결실 형성을 도시한다.
[도 43]은 인간 게놈에서 다양한 위치를 표적화하는 다양한 상이한 표적화 서열을 함유하는 상응하는 sgRNA와 함께 실시예 14에 기재된 MG14-1 구축물로 HEK 세포를 형질감염시킴으로써 생성된 세포 내 삽입-결실 형성을 도시한다.
[도 44]는 인간 게놈에서 다양한 위치를 표적화하는 다양한 상이한 표적화 서열을 함유하는 상응하는 sgRNA와 함께 실시예 17에 기재된 MG18-1 구축물로 HEK 세포를 형질감염시킴으로써 생성된 세포 내 삽입-결실 형성을 도시한다.
[도 45]는 본원에 기재된 뉴클레아제의 환경 분포를 도시한다. 단백질 길이는 선택된 단백질 패밀리의 대표에 대해 표시되어 있다. 색상은 각 단백질이 식별된 환경 또는 환경 유형을 나타낸다.
[도 46]은 본원에 기재된 뉴클레아제의 예측된 촉매 잔기를 도시한다. 단백질 길이는 선택된 단백질 패밀리의 대표에 대해 표시되어 있다. 색상은 각 단백질에 대해 예측된 촉매 잔기 수를 나타낸다. 본원에 기재된 이펙터 효소에 대해, HNH 및 RuvC 도메인과 일치하는 6개의 촉매 잔기를 검색하였다.
[도 47]은 본원에 기재된 뉴클레아제의 후보 활성 대 단백질 길이를 도시한다.
[도 48]은 본원에 기재된 뉴클레아제에 대해 예측된 촉매 잔기 수를 도시한다.
[도 49]는 본원에 기재된 선택 뉴클레아제의 다양한 특성 정보의 표를 보여준다.
[도 50-54]는 본원에 기재된 바와 같이(예를 들어, 실시예 6에 기재된 바와 같이) NGS를 통해 유도된 PAM 서열의 seqLogo 표현을 도시한다.
[도 55]는 MG3-6 및 MG3-8을 사용한 TRAC에서의 가이드 RNA 스크린을 보여준다. 상단 패널(MG3-6)의 경우 x축 번호는 서열 번호 5950-5958에 상응하는 스페이서를 나타내고; 하단 패널(MG3-8)의 경우 x축 번호는 서열 번호 5959-5965에 상응하는 스페이서를 나타낸다.
[도 56]은 다양한 코어 서열, 길이 및 용량의 가이드 RNA와 MG3-6의 활성(삽입-결실 %)을 보여준다.
[도 57]은 다양한 서열 및 길이의 가이드 RNA와 MG3-8의 활성(삽입-결실 %)을 보여준다.
[도 58]은 TRAC 가이드 6과 MG3-6 및 TRAC 가이드 8과 MG3-8의 활성(삽입-결실 %)을 보여준다.
[도 59]는 유동 세포측정법에 의한 T 세포 수용체 발현에 대한 TRAC6 가이드 RNA와 MG3-6의 효과를 보여준다. 편집 후 생존능에는 변화가 없었다.
[도 60]은 더 많은 양의 gRNA로 증가된 TRAC 편집 효율을 보여준다.
[도 61]은 어떻게 TCR 발현이 제거되고 CAR 발현으로 대체될 수 있는지를 보여준다.
[도 62]는 MG3-6과의 표적화된 CAR 통합을 보여준다.
[도 63]은 NR3C1 유전자의 다양한 엑손을 표적화하는 다양한 가이드 RNA와 MG3-6에 의한 GR(NR3Cl) 편집을 보여준다.
[도 64]는 NR3C1 유전자의 다양한 엑손을 표적화하는 다양한 가이드 RNA와 MG3-8에 의한 GR(NR3Cl) 편집을 보여준다.
[도 65]는 2개의 MG3-6 배치 및 다양한 가이드 RNA를 이용한 GR 편집을 비교한다.
[도 66]은 유전자 편집을 사용하여 동종이계 CAR-NK세포를 생성할 수 있는 과정을 보여준다.
[도 67]은 TRAC 6 가이드 RNA와 MG3-6을 사용한 TRAC 편집을 보여준다.
[도 68]은 유동 세포측정법에 의한 CD56+ NK 세포에서 MG3-6에 의한 CAR 발현(Y축)을 보여준다.
[도 69]는 다양한 가이드 RNA와 함께 MG3-6 및 MG3-8을 사용한 1차 NK 세포에서의 CD38 편집을 보여준다.
[도 70]은 다양한 가이드 RNA와 함께 MG3-6 및 MG3-8에 의한 조혈 줄기 세포에서의 TRAC 편집을 보여준다.
[도 71]은 2개의 상이한 완충액을 사용한 TRAC 가이드 6과 MG3-6에 의한 B 세포에서의 TRAC 편집을 나타낸다.
[도 72]는 실시예 25의 방법에 의해 결정된 MG48-1(A) 및 MG48-3(B)에 대한 컨센서스 PAM 서열을 보여준다.
[도 73]은 MG48-1(A) 및 MG48-3(B)에 대해 실시예 25의 방법에 의해 수행된 바와 같이, 강조된 시퀀싱된 tracr 영역을 이용한 RNAseq 맵핑을 예시한다.
서열 목록에 대한 간략한 설명
본원과 함께 제출된 서열 목록은 본 개시 내용에 따른 방법, 조성물 및 시스템에서 사용하기 위한 예시적인 폴리뉴클레오티드 및 폴리펩티드 서열을 제공한다. 아래는 그 안의 서열에 대한 예시적인 설명이다.
MG1
서열 번호 1-319는 MG1 뉴클레아제의 전장 펩티드 서열을 나타낸다.
서열 번호 1827-2140은 상기 MG1 뉴클레아제의 RuvC_III 도메인의 펩티드 서열을 나타낸다.
서열 번호 3638-3955는 상기 MG1 뉴클레아제의 HNH 도메인의 펩티드를 나타낸다.
서열 번호 5476-5479는 상기 MG1 뉴클레아제와 동일한 유전자좌(예를 들어, 각각 서열 번호1-4와 동일한 유전자좌)로부터 유래된 MG1 tracrRNA의 뉴클레오티드 서열을 나타낸다.
서열 번호 5461-5464는 MG1 뉴클레아제(예를 들어, 각각 서열 번호1-4)와 함께 기능하도록 조작된 sgRNA의 뉴클레오티드 서열을 나타내며, 여기서 N은 표적화 서열의 뉴클레오티드를 나타낸다.
서열 번호 5572-5575는 MG1 패밀리 효소(서열 번호 1-4)에 대한 이. 콜라이 코돈 최적화된 코딩 서열에 대한 뉴클레오티드 서열을 나타낸다.
서열 번호 5588-5589는 MG1 패밀리 효소(서열 번호 1 및 3)에 대한 인간 코돈 최적화된 코딩 서열에 대한 뉴클레오티드 서열을 나타낸다.
서열 번호 5616-5632는 MG1 패밀리 효소의 특징인 펩티드 모티프를 나타낸다.
MG2
서열 번호 320-420은 MG2 뉴클레아제의 전장 펩티드 서열을 나타낸다.
서열 번호 2141-2241은 상기 MG2 뉴클레아제의 RuvC_III 도메인의 펩티드 서열을 나타낸다.
서열 번호 3955-4055는 상기 MG2 뉴클레아제의 HNH 도메인의 펩티드를 나타낸다.
서열 번호 5490-5494는 상기 MG2 뉴클레아제와 동일한 유전자좌(예를 들어, 각각 서열 번호 320, 321, 323, 325 및 326과 동일한 유전자좌)로부터 유래된 MG2 tracrRNA의 뉴클레오티드 서열을 나타낸다.
서열 번호 5465는 MG2 뉴클레아제(예를 들어, 상기 서열 번호 321)와 기능하도록 조작된 sgRNA의 뉴클레오티드 서열을 나타낸다.
서열 번호 5572-5575는 MG2 패밀리 효소에 대한 이. 콜라이 코돈 최적화된 코딩 서열에 대한 뉴클레오티드 서열을 나타낸다.
서열 번호 5631-5638은 MG2 패밀리 효소의 특징인 펩티드 서열을 나타낸다.
MG3
서열 번호 421-431은 MG3 뉴클레아제의 전장 펩티드 서열을 나타낸다.
서열 번호 2242-2252는 상기 MG3 뉴클레아제의 RuvC_III 도메인의 펩티드 서열을 나타낸다.
서열 번호 4056-4066은 상기 MG3 뉴클레아제의 HNH 도메인의 펩티드를 나타낸다.
서열 번호 5495-5502는 상기 MG3 뉴클레아제와 동일한 유전자좌(예를 들어, 각각 서열 번호 421-428과 동일한 유전자좌)로부터 유래된 MG3 tracrRNA의 뉴클레오티드 서열을 나타낸다.
서열 번호 5466-5467은 MG3 뉴클레아제(예를 들어, 서열 번호 421-423)와 함께 기능하도록 조작된 sgRNA의 뉴클레오티드 서열을 나타낸다.
서열 번호 5578-5580은 MG3 패밀리 효소에 대한 이. 콜라이 코돈 최적화된 코딩 서열에 대한 뉴클레오티드 서열을 나타낸다.
서열 번호 5639-5648은 MG3 패밀리 효소의 특징인 펩티드 서열을 나타낸다.
MG4
서열 번호 432-660은 MG4 뉴클레아제의 전장 펩티드 서열을 나타낸다.
서열 번호 2253-2481은 상기 MG4 뉴클레아제의 RuvC_III 도메인의 펩티드 서열을 나타낸다.
서열 번호 4067-4295는 상기 MG4 뉴클레아제의 HNH 도메인의 펩티드를 나타낸다.
서열 번호 5503은 상기 MG4 뉴클레아제와 동일한 유전자좌로부터 유래된 MG4 tracrRNA의 뉴클레오티드 서열을 나타낸다.
서열 번호 5468은 MG4 뉴클레아제와 기능하도록 조작된 sgRNA의 뉴클레오티드 서열을 나타낸다.
서열 번호 5649는 MG4 패밀리 효소의 특징인 펩티드 서열을 나타낸다.
MG6
서열 번호 661-668은 MG6 뉴클레아제의 전장 펩티드 서열을 나타낸다.
서열 번호 2482-2489는 상기 MG6 뉴클레아제의 RuvC_III 도메인의 펩티드 서열을 나타낸다.
서열 번호 4296-4303은 상기 MG3 뉴클레아제의 HNH 도메인의 펩티드를 나타낸다.
MG7
서열 번호 669-677은 MG7 뉴클레아제의 전장 펩티드 서열을 나타낸다.
서열 번호 2490-2498은 상기 MG7 뉴클레아제의 RuvC_III 도메인의 펩티드 서열을 나타낸다.
서열 번호 4304-4312는 상기 MG3 뉴클레아제의 HNH 도메인의 펩티드를 나타낸다.
서열 번호 5504는 상기 MG7 뉴클레아제와 동일한 유전자좌로부터 유래된 MG7 tracrRNA의 뉴클레오티드 서열을 나타낸다.
MG14
서열 번호 678-929는 MG14 뉴클레아제의 전장 펩티드 서열을 나타낸다.
서열 번호 2499-2750은 상기 MG14 뉴클레아제의 RuvC_III 도메인의 펩티드 서열을 나타낸다.
서열 번호 4313-4564는 상기 MG14 뉴클레아제의 HNH 도메인의 펩티드를 나타낸다.
서열 번호 5505는 상기 MG14 뉴클레아제와 동일한 유전자좌로부터 유래된 MG14 tracrRNA의 뉴클레오티드 서열을 나타낸다.
서열 번호 5581은 MG14 패밀리 효소에 대한 이. 콜라이 코돈 최적화된 코딩 서열에 대한 뉴클레오티드 서열을 나타낸다.
서열 번호 5650-5667은 MG14 패밀리 효소의 특징인 펩티드 서열을 나타낸다.
MG15
서열 번호 930-1092는 MG15 뉴클레아제의 전장 펩티드 서열을 나타낸다.
서열 번호 2751-2913은 상기 MG15 뉴클레아제의 RuvC_III 도메인의 펩티드 서열을 나타낸다.
서열 번호 4565-4727은 상기 MG15 뉴클레아제의 HNH 도메인의 펩티드를 나타낸다.
서열 번호 5506은 상기 MG15 뉴클레아제와 동일한 유전자좌로부터 유래된 MG15 tracrRNA의 뉴클레오티드 서열을 나타낸다.
서열 번호 5470은 MG15 뉴클레아제와 함께 기능하도록 조작된 sgRNA의 뉴클레오티드 서열을 나타낸다.
서열 번호 5582는 MG15 패밀리 효소에 대한 이. 콜라이 코돈 최적화된 코딩 서열에 대한 뉴클레오티드 서열을 나타낸다.
서열 번호 5668-5675는 MG15 패밀리 효소의 특징인 펩티드 서열을 나타낸다.
MG16
서열 번호 1093-1353은 MG16 뉴클레아제의 전장 펩티드 서열을 나타낸다.
서열 번호 2914-3174는 상기 MG16 뉴클레아제의 RuvC_III 도메인의 펩티드 서열을 나타낸다.
서열 번호 4728-4988은 상기 MG16 뉴클레아제의 HNH 도메인의 펩티드를 나타낸다.
서열 번호 5507은 상기 MG3 뉴클레아제와 동일한 유전자좌로부터 유래된 MG16 tracrRNA의 뉴클레오티드 서열을 나타낸다.
서열 번호 5471은 MG16 뉴클레아제와 함께 기능하도록 조작된 sgRNA의 뉴클레오티드 서열을 나타낸다.
서열 번호 5583은 MG16 패밀리 효소에 대한 이. 콜라이 코돈 최적화된 코딩 서열에 대한 뉴클레오티드 서열을 나타낸다.
서열 번호 5676-5678은 MG16 패밀리 효소의 특징인 펩티드 서열을 나타낸다.
MG18
서열 번호 1354-1511은 MG18 뉴클레아제의 전장 펩티드 서열을 나타낸다.
서열 번호 3175-3330은 상기 MG18 뉴클레아제의 RuvC_III 도메인의 펩티드 서열을 나타낸다.
서열 번호 4989-5146은 상기 MG18 뉴클레아제의 HNH 도메인의 펩티드를 나타낸다.
서열 번호 5508은 상기 MG18 뉴클레아제와 동일한 유전자좌로부터 유래된 MG18 tracrRNA의 뉴클레오티드 서열을 나타낸다.
서열 번호 5472는 MG18 뉴클레아제와 함께 기능하도록 조작된 sgRNA의 뉴클레오티드 서열을 나타낸다.
서열 번호 5584는 MG18 패밀리 효소에 대한 이. 콜라이 코돈 최적화된 코딩 서열에 대한 뉴클레오티드 서열을 나타낸다.
서열 번호 5679-5686은 MG18 패밀리 효소의 특징인 펩티드 서열을 나타낸다.
MG21
서열 번호 1512-1655는 MG21 뉴클레아제의 전장 펩티드 서열을 나타낸다.
서열 번호 3331-3474는 상기 MG21 뉴클레아제의 RuvC_III 도메인의 펩티드 서열을 나타낸다.
서열 번호 5147-5290은 상기 MG21 뉴클레아제의 HNH 도메인의 펩티드를 나타낸다.
서열 번호 5509는 상기 MG21 뉴클레아제와 동일한 유전자좌로부터 유래된 MG21 tracrRNA의 뉴클레오티드 서열을 나타낸다.
서열 번호 5473은 MG21 뉴클레아제와 함께 기능하도록 조작된 sgRNA의 뉴클레오티드 서열을 나타낸다.
서열 번호 5585는 MG21 패밀리 효소에 대한 이. 콜라이 코돈 최적화된 코딩 서열에 대한 뉴클레오티드 서열을 나타낸다.
서열 번호 5687-5692 및 5674-5675는 MG21 패밀리 효소의 특징인 펩티드 서열을 나타낸다.
MG22
서열 번호 1656-1755는 MG22 뉴클레아제의 전장 펩티드 서열을 나타낸다.
서열 번호 3475-3568은 상기 MG22 뉴클레아제의 RuvC_III 도메인의 펩티드 서열을 나타낸다.
서열 번호 5291-5389는 상기 MG22 뉴클레아제의 HNH 도메인의 펩티드를 나타낸다.
서열 번호 5510은 상기 MG22 뉴클레아제와 동일한 유전자좌로부터 유래된 MG22 tracrRNA의 뉴클레오티드 서열을 나타낸다.
서열 번호 5474는 MG22 뉴클레아제와 함께 기능하도록 조작된 sgRNA의 뉴클레오티드 서열을 나타낸다.
서열 번호 5586은 MG22 패밀리 효소에 대한 이. 콜라이 코돈 최적화된 코딩 서열에 대한 뉴클레오티드 서열을 나타낸다.
서열 번호 5694-5699는 MG22 패밀리 효소의 특징인 펩티드 서열을 나타낸다.
MG23
서열 번호 1756-1826은 MG23 뉴클레아제의 전장 펩티드 서열을 나타낸다.
서열 번호 3569-3637은 상기 MG23 뉴클레아제의 RuvC_III 도메인의 펩티드 서열을 나타낸다.
서열 번호 5390-5460은 상기 MG23 뉴클레아제의 HNH 도메인의 펩티드를 나타낸다.
서열 번호 5511은 상기 MG23 뉴클레아제와 동일한 유전자좌로부터 유래된 MG23 tracrRNA의 뉴클레오티드 서열을 나타낸다.
서열 번호 5475는 MG23 뉴클레아제와 함께 기능하도록 조작된 sgRNA의 뉴클레오티드 서열을 나타낸다.
서열 번호 5587은 MG23 패밀리 효소에 대한 이. 콜라이 코돈 최적화된 코딩 서열에 대한 뉴클레오티드 서열을 나타낸다.
서열 번호 5700-5717은 MG23 패밀리 효소의 특징인 펩티드 서열을 나타낸다.
MG40
서열 번호 5718-5750은 MG40 뉴클레아제의 전장 펩티드 서열을 나타낸다.
서열 번호 5847-5852는 MG 40 뉴클레아제와 관련된 프로토스페이서 인접 모티프를 나타낸다.
서열 번호 5862-5873은 MG40 뉴클레아제와 함께 기능하도록 조작된 sgRNA의 뉴클레오티드 서열을 나타낸다.
MG47
서열 번호 5751-5768은 MG47 뉴클레아제의 전장 펩티드 서열을 나타낸다.
서열 번호 5853-5854는 MG47 뉴클레아제와 관련된 프로토스페이서 인접 모티프를 나타낸다.
서열 번호 5878-5881은 MG47 뉴클레아제와 함께 기능하도록 조작된 sgRNA의 뉴클레오티드 서열을 나타낸다.
MG48
서열 번호 5769-5804는 MG48 뉴클레아제의 전장 펩티드 서열을 나타낸다.
서열 번호 5855-5856은 MG48 뉴클레아제와 관련된 프로토스페이서 인접 모티프를 나타낸다.
서열 번호 5886, 5890 및 5893은 상기 MG48 뉴클레아제와 동일한 유전자좌로부터 유래된 MG48 tracrRNA의 뉴클레오티드 서열을 나타낸다.
서열 번호 5887, 5891 및 5894는 본원에 기재된 MG48 뉴클레아제와 관련된 CRISPR 반복부를 나타낸다.
서열 번호 5888-5889, 5892 및 5895-5896은 MG48 뉴클레아제와 함께 기능하도록 설계된 추정 sgRNA를 나타낸다.
MG49
서열 번호 5805-5823은 MG49 뉴클레아제의 전장 펩티드 서열을 나타낸다.
서열 번호 5857-5858은 MG49 뉴클레아제와 관련된 프로토스페이서 인접 모티프를 나타낸다.
서열 번호 5862-5873은 MG40 뉴클레아제와 함께 기능하도록 조작된 sgRNA의 뉴클레오티드 서열을 나타낸다.
서열 번호 5876-5877은 MG49 뉴클레아제와 함께 기능하도록 조작된 sgRNA의 뉴클레오티드 서열을 나타낸다.
MG50
서열 번호 5824-5826은 MG50 뉴클레아제의 전장 펩티드 서열을 나타낸다.
서열 번호 5859는 MG50 뉴클레아제와 관련된 프로토스페이서 인접 모티프를 나타낸다.
서열 번호 5884-5885는 MG50 뉴클레아제와 함께 기능하도록 조작된 sgRNA의 뉴클레오티드 서열을 나타낸다.
MG51
서열 번호 5827-5830은 MG51 뉴클레아제의 전장 펩티드 서열을 나타낸다.
서열 번호 5860은 MG51 뉴클레아제와 관련된 프로토스페이서 인접 모티프를 나타낸다.
서열 번호 5882-5883은 MG51 뉴클레아제와 함께 기능하도록 조작된 sgRNA의 뉴클레오티드 서열을 나타낸다.
MG52
서열 번호 5831-5846은 MG52 뉴클레아제의 전장 펩티드 서열을 나타낸다.
서열 번호 5861은 MG52 뉴클레아제와 관련된 프로토스페이서 인접 모티프를 나타낸다.
서열 번호 5874-5875는 MG42 뉴클레아제와 함께 기능하도록 조작된 sgRNA의 뉴클레오티드 서열을 나타낸다.
상세 설명
본 발명의 다양한 실시 양태가 본원에 제시되고 설명되었지만, 그러한 실시 양태가 단지 예로서 제공된다는 것은 당업자에게 명백할 것이다. 본 발명에서 벗어나지 않으면서 당업자에게는 다양한 변형, 변경 및 대체가 발생할 수 있다. 본원에 기재된 본 발명의 실시 양태에 대한 다양한 대안이 이용될 수 있음을 이해해야 한다.
본원에 개시된 일부 방법의 실시는 달리 지시되지 않는 한, 면역학, 생화학, 화학, 분자 생물학, 미생물학, 세포 생물학, 게놈학 및 재조합 DNA의 기술을 사용한다. 예를 들어 문헌[Sambrook and Green, Molecular Cloning: A Laboratory Manual, 4th Edition (2012); the series Current Protocols in Molecular Biology (F. M. Ausubel, et al. eds.); the series Methods In Enzymology (Academic Press, Inc.), PCR 2: A Practical Approach (M.J. MacPherson, B.D. Hames and G.R. Taylor eds. (1995)), Harlow and Lane, eds. (1988) Antibodies, A Laboratory Manual, and Culture of Animal Cells: A Manual of Basic Technique and Specialized Applications, 6th Edition (R.I. Freshney, ed. (2010), 이는 전체가 본원에 참고로 포함됨]을 참조한다.
본원에 사용되는 바와 같이, 단수형 "a", "an" 및 "the"는 문맥상 명백하게 달리 지시하지 않는 한 복수형도 포함하는 것으로 의도된다. 또한, 용어 "포함하는(including)", "포함한다(includes)", "갖는(having)", "갖는다(has)", "가진(with)" 또는 이들의 변형어가 상세한 설명 및/또는 청구범위에서 사용되는 경우 이러한 용어는 "포함하는(comprising)"이라는 용어와 유사한 방식으로 포괄적인 것으로 의도된다.
용어 "약" 또는 "대략"은 당업자에 의해 결정되는 특정 값에 대한 허용 가능한 오차 범위 내를 의미하며, 이는 부분적으로 값이 측정 또는 결정되는 방법, 즉 측정 시스템의 한계에 따라 결정될 것이다. 예를 들어, "약"은 해당 분야의 관행에 따라 1 이상의 표준 편차 이내를 의미할 수 있다. 대안적으로, "약"은 주어진 값의 최대 20%, 최대 15%, 최대 10%, 최대 5%, 또는 최대 1%의 범위를 의미할 수 있다.
본원에서 사용되는 바와 같이, "세포"는 일반적으로 생물학적 세포를 의미한다. 세포는 살아있는 유기체의 기본적인 구조적, 기능적 및/또는 생물학적 단위일 수 있다. 세포는 하나 이상의 세포를 가진 임의의 유기체로부터 기원할 수 있다. 일부 비제한적 예는 다음을 포함한다: 원핵생물 세포, 진핵생물 세포, 박테리아 세포, 고세균 세포, 단세포 진핵생물 유기체의 세포, 원생동물 세포, 식물의 세포(예를 들어, 농작물, 과일, 야채, 곡물, 콩, 옥수수, 메이즈, 밀, 씨앗, 토마토, 쌀, 카사바, 사탕 수수, 호박, 건초, 감자, 면, 대마초, 담배, 현화 식물, 침엽수, 겉씨 식물, 양치류, 클럽 모스, 붕어마름, 우산이끼, 이끼로부터의 세포), 조류 세포(예를 들어, 보트리코쿠스 브라우니(Botryococcus braunii), 클라미도모나스 레인하르드티(Chlamydomonas reinhardtii), 나노클로롭시스 가디타나(Nannochloropsis gaditana), 클로렐라 피레노이도사(Chlorella pyrenoidosa), 사르가쑴 파텐스 씨. 아가르드(Sargassum patens C. Agardh 등), 해조류(예를 들어, 켈프), 진균 세포(예를 들어, 효모 세포, 버섯의 세포), 동물 세포, 무척추동물의 세포(예를 들어, 초파리, 자포동물, 극피동물, 선충류 등), 척추동물의 세포(예를 들어, 어류, 양서류, 파충류, 조류, 포유류), 포유동물의 세포(예를 들어, 돼지, 소, 염소, 양, 설치류, 래트, 마우스, 비인간 영장류, 인간 등) 등등. 때때로 세포는 자연 유기체에서 기원하지 않는다(예를 들어, 세포는 합성으로 만들어진 것일 수 있으며 때로는 인공 세포라고 함).
본원에 사용되는 바와 같이 용어 "뉴클레오티드"는 일반적으로 염기-당-인산염 조합을 의미한다. 뉴클레오티드는 합성 뉴클레오티드를 포함할 수 있다. 뉴클레오티드는 합성 뉴클레오티드 유사체를 포함할 수 있다. 뉴클레오티드는 핵산 서열(예를 들어, 데옥시리보핵산(DNA) 및 리보핵산(RNA))의 단량체 단위일 수 있다. 뉴클레오티드라는 용어는 리보뉴클레오시드 삼인산인 아데노신 삼인산(ATP), 우리딘 삼인산(UTP), 시토신 삼인산(CTP), 구아노신 삼인산(GTP) 및 데옥시리보뉴클레오시드 삼인산 예컨대 dATP, dCTP, dITP, dUTP, dGTP, dTTP, 또는 이들의 유도체를 포함할 수 있다. 그러한 유도체는 예를 들어 [αS]dATP, 7-데아자-dGTP 및 7-데아자-dATP, 및 이들을 함유하는 핵산 분자에 뉴클레아제 저항성을 부여하는 뉴클레오티드 유도체를 포함할 수 있다. 본원에서 사용되는 바와 같이 용어 뉴클레오티드는 디데옥시리보뉴클레오시드 삼인산(ddNTP) 및 이들의 유도체를 지칭할 수 있다. 디데옥시리보뉴클레오시드 삼인산의 예시적인 예는 ddATP, ddCTP, ddGTP, ddITP, 및 ddTTP를 포함할 수 있지만 이에 제한되지 않는다. 뉴클레오티드는 비표지되거나 예컨대 광학적으로 검출 가능한 모이어티(예를 들어, 형광단)를 포함하는 모이어티를 사용하여, 검출 가능하게 표지될 수 있다. 표지는 또한 양자점으로 수행될 수 있다. 검출 가능한 표지는 예를 들어 방사성 동위원소, 형광 표지, 화학발광 표지, 생물발광 표지 및 효소 표지를 포함할 수 있다. 뉴클레오티드의 형광 표지는 플루오레세인, 5-카르복시플루오레세인(FAM), 2'7'-디메톡시-4'5-디클로로-6-카르복시플루오레세인(JOE), 로다민, 6-카르복시로다민(R6G), N,N,N',N'-테트라메틸-6-카르복시로다민(TAMRA), 6-카르복시-X-로다민(ROX), 4-(4'디메틸아미노페닐아조) 벤조산(DABCYL), 캐스케이드 블루, 오레곤 그린, 텍사스 레드, 시아닌 및 5-(2'-아미노에틸)아미노나프탈렌-1-설폰산(EDANS)을 포함할 수 있지만 이에 제한되지는 않는다. 형광 표지된 뉴클레오티드의 구체적인 예는 [R6G]dUTP, [TAMRA]dUTP, [R110]dCTP, [R6G]dCTP, [TAMRA]dCTP, [JOE]ddATP, [R6G]ddATP, [FAM]ddCTP, [R110]ddCTP, [TAMRA]ddGTP, [ROX]ddTTP, [dR6G]ddATP, [dR110]ddCTP, [dTAMRA]ddGTP, 및 [dROX]ddTTP(미국 캘리포니아주 포스터 시티 소재의 Perkin Elmer로부터 입수 가능함); 플루오로링크 데옥시뉴클레오티드, 플루오로링크 Cy3-dCTP, 플루오로링크 Cy5-dCTP, 플루오로링크 플루오르 X-dCTP, 플루오로링크 Cy3-dUTP, 및 플루오로링크 Cy5-dUTP(미국 일리노이주 알링턴 하이츠 소재의 Amersham으로부터 입수 가능함); 플루오레세인-15-dATP, 플루오레세인-12-dUTP, 테트라메틸-로다민-6-dUTP, IR770-9-dATP, 플루오레세인-12-ddUTP, 플루오레세인-12-UTP, 및 플루오레세인-15-2'-dATP(미국 인디애나주 인디애나폴리스 소재의 Boehringer Mannheim으로부터 입수 가능함); 및 염색체 표지된 뉴클레오티드, BODIPY-FL-14-UTP, BODIPY-FL-4-UTP, BODIPY-TMR-14-UTP, BODIPY-TMR-14-dUTP, BODIPY-TR-14-UTP, BODIPY-TR-14-dUTP, 캐스케이드 블루-7-UTP, 캐스케이드 블루-7-dUTP, 플루오레세인-12-UTP, 플루오레세인-12-dUTP, 오레곤 그린 488-5-dUTP, 로다민 그린 -5-UTP, 로다민 그린-5-dUTP, 테트라메틸로다민-6-UTP, 테트라메틸로다민-6-dUTP, 텍사스 레드-5-UTP, 텍사스 레드-5-dUTP, 및 텍사스 레드-12-dUT(미국 오리건 주 유진 소재의 Molecular Probes로부터 입수 가능함)를 포함할 수 있다. 뉴클레오티드는 또한 화학적 변형에 의해 표지되거나 표시될 수 있다. 화학적으로 변형된 단일 뉴클레오티드는 비오틴-dNTP일 수 있다. 비오티닐화된 dNTP의 일부 비제한적 예는 비오틴-dATP(예를 들어, bio-N6-ddATP, 비오틴-14-dATP), 비오틴-dCTP(예를 들어, 비오틴-11-dCTP, 비오틴-14-dCTP), 및 비오틴-dUTP(예를 들어, 비오틴-11-dUTP, 비오틴-16-dUTP, 비오틴-20-dUTP)를 포함할 수 있다.
용어 "폴리뉴클레오티드", "올리고뉴클레오티드" 및 "핵산"은 일반적으로 단일, 이중, 또는 다중 가닥 형태의 임의 길이의 중합체 형태의 뉴클레오티드, 데옥시리보뉴클레오티드 또는 리보뉴클레오티드, 또는 이들의 유사체를 지칭한다. 폴리뉴클레오티드는 세포에 대해 외인성 또는 내인성일 수 있다. 폴리뉴클레오티드는 무세포 환경에 존재할 수 있다. 폴리뉴클레오티드는 유전자 또는 이의 단편일 수 있다. 폴리뉴클레오티드는 DNA일 수 있다. 폴리뉴클레오티드는 RNA일 수 있다. 폴리뉴클레오티드는 임의의 3차원 구조를 가질 수 있으며 임의의 기능을 수행할 수 있다. 폴리뉴클레오티드는 하나 이상의 유사체(예를 들어, 변경된 백본, 당 또는 핵염기)를 포함할 수 있다. 존재하는 경우, 뉴클레오티드 구조에 대한 변형은 중합체 조립 전 또는 후에 부여될 수 있다. 유사체의 일부 비제한적 예는 다음을 포함한다: 5-브로모우라실, 펩티드 핵산, 제노 핵산, 모르폴리노, 잠김 핵산, 글리콜 핵산, 트레오스 핵산, 디데옥시뉴클레오티드, 코르디세핀, 7-데아자-GTP, 형광단(예를 들어, 당에 연결된 로다민 또는 플루오레세인), 티올 함유 뉴클레오티드, 비오틴 연결된 뉴클레오티드, 형광 염기 유사체, CpG 섬, 메틸-7-구아노신, 메틸화된 뉴클레오티드, 이노신, 티오우리딘, 슈도우리딘, 디히드로우리딘, 퀘오신, 및 와이오신. 폴리뉴클레오티드의 비제한적 예는 유전자 또는 유전자 단편의 코딩 또는 비코딩 영역, 연관 분석에서 정의된 유전자좌(유전자좌들), 엑손, 인트론, 전령 RNA(mRNA), 전달 RNA(tRNA), 리보솜 RNA(rRNA), 짧은 간섭 RNA(siRNA), 짧은 헤어핀 RNA(shRNA), 마이크로 RNA(miRNA), 리보자임, cDNA, 재조합 폴리뉴클레오티드, 분지형 폴리뉴클레오티드, 플라스미드, 벡터, 임의의 서열의 단리된 DNA, 임의의 서열의 단리된 RNA, 무세포 DNA(cfDNA) 및 무세포 RNA(cfRNA)를 포함하는 무세포 폴리뉴클레오티드, 핵산 프로브 및 프라이머를 포함한다. 뉴클레오티드의 서열은 비뉴클레오티드 성분에 의해 중단될 수 있다.
용어 "형질감염" 또는 "형질감염된"은 일반적으로 비-바이러스 또는 바이러스 기반 방법에 의해 핵산을 세포로 도입하는 것을 지칭한다. 핵산 분자는 완전한 단백질 또는 이의 기능적 부분을 코딩하는 유전자 서열일 수 있다. 예를 들어 문헌[Sambrook et al., 1989, Molecular Cloning: A Laboratory Manual, 18.1-18.88]을 참조한다.
용어 "펩티드", "폴리펩티드" 및 "단백질"은 일반적으로 펩티드 결합(들)에 의해 결합된 적어도 2개의 아미노산 잔기의 중합체를 지칭하기 위해 본원에서 상호교환적으로 사용된다. 이 용어는 특정 길이의 중합체를 의미하지 않으며 펩티드가 재조합 기술, 화학적 또는 효소 합성을 사용하여 생산되는지 또는 자연적으로 발생하는지를 의미하거나 구별하고자 의도되지도 않는다. 용어는 자연 발생 아미노산 중합체 뿐만 아니라 적어도 하나의 변형된 아미노산을 포함하는 아미노산 중합체에 적용된다. 일부 경우에, 중합체는 비아미노산에 의해 중단될 수 있다. 용어는 전체 길이의 단백질 및 2차 및/또는 3차 구조(예를 들어, 도메인)가 있거나 없는 단백질을 포함하여 임의 길이의 아미노산 사슬을 포함한다. 용어는 또한 예를 들어 이황화 결합 형성, 글리코실화, 지질화, 아세틸화, 인산화, 산화, 및 표지 성분과의 접합과 같은 임의의 다른 조작에 의해 변형된 아미노산 중합체를 포함한다. 본원에서 사용되는 바와 같이 용어 "아미노산" 및 "아미노산들"은 일반적으로 변형된 아미노산 및 아미노산 유사체를 포함하지만 이에 제한되지 않는 천연 및 비천연 아미노산을 지칭한다. 변형된 아미노산은 천연 아미노산 및 비천연 아미노산을 포함할 수 있으며, 이들은 아미노산에 자연적으로 존재하지 않는 기 또는 화학 모이어티를 포함하도록 화학적으로 변형되었다. 아미노산 유사체는 아미노산 유도체를 지칭할 수 있다. "아미노산"이라는 용어는 D-아미노산과 L-아미노산을 모두 포함한다.
본원에서 사용되는 바와 같이, "비천연"은 일반적으로 천연 핵산 또는 단백질에서 발견되지 않는 핵산 또는 폴리펩티드 서열을 지칭할 수 있다. 비천연은 친화성 태그를 지칭할 수 있다. 비천연은 융합을 지칭할 수 있다. 비천연은 돌연변이, 삽입 및/또는 결실을 포함하는 자연 발생 핵산 또는 폴리펩티드 서열을 지칭할 수 있다. 비천연 서열은 비천연 서열이 융합된 핵산 및/또는 폴리펩티드 서열에 의해 또한 나타날 수 있는 활성(예를 들어, 효소 활성, 메틸트랜스퍼라제 활성, 아세틸트랜스퍼라제 활성, 키나아제 활성, 유비퀴틴화 활성 등)을 나타내고/거나 이를 코딩할 수 있다. 비천연 핵산 또는 폴리펩티드 서열은 유전 공학에 의해 자연 발생 핵산 또는 폴리펩티드 서열(또는 그의 변이체)에 연결되어 키메라 핵산 및/또는 폴리펩티드를 코딩하는 키메라 핵산 및/또는 폴리펩티드 서열을 생성할 수 있다.
본원에서 사용되는 바와 같이, 용어 "프로모터"는 일반적으로 유전자의 전사 또는 발현을 제어하고 RNA 전사가 개시되는 뉴클레오티드 또는 뉴클레오티드의 영역에 인접하거나 그와 중첩되어 위치될 수 있는 조절 DNA 영역을 지칭한다. 프로모터는 종종 전사 인자라고 지칭되는 단백질 인자에 결합하는 특정 DNA 서열을 포함할 수 있으며, 이는 유전자 전사를 유도하는 DNA에 대한 RNA 중합효소의 결합을 촉진한다. '코어 프로모터'라고도 하는 '기본 프로모터'는 일반적으로 작동가능하게 연결된 폴리뉴클레오티드의 전사 발현을 촉진하는 데 필요한 모든 기본 요소를 포함하는 프로모터를 지칭할 수 있다. 반드시 그런 것은 아니지만 일반적으로 진핵생물 기본 프로모터는 TATA 상자 및/또는 CAAT 상자를 포함한다.
본원에서 사용되는 바와 같이, 용어 "발현"은 일반적으로 핵산 서열 또는 폴리뉴클레오티드가 DNA 주형으로부터(예를 들어, mRNA 또는 다른 RNA 전사체로) 전사되는 과정 및/또는 이어서 전사된 RNA가 펩티드, 폴리펩티드, 또는 단백질로 번역되는 과정을 지칭한다. 전사체 및 코딩된 폴리펩티드는 총체적으로 "유전자 산물"로 지칭될 수 있다. 폴리뉴클레오티드가 게놈 DNA로부터 유래된 경우, 발현은 진핵생물 세포에서 mRNA의 스플라이싱을 포함할 수 있다.
본원에 사용되는 바와 같이, "작동가능하게 연결된", "작동가능한 연결", "작동적으로 연결된" 또는 그의 문법적 동의어는 일반적으로 유전적 요소, 예를 들어 프로모터, 인핸서, 폴리아데닐화 서열 등의 병치를 지칭하며, 여기서 요소는 예상된 방식으로 작동하도록 허용하는 관계에 있다. 예를 들어, 프로모터 및/또는 인핸서 서열을 포함할 수 있는 조절 요소는 조절 요소가 코딩 서열의 전사 개시를 돕는다면 코딩 영역에 작동적으로 연결된다. 이 기능적 관계가 유지되기만 한다면 조절 요소와 코딩 영역 사이에 개입 잔기가 있을 수 있다.
본원에서 사용되는 바와 같이 "벡터"는 일반적으로 폴리뉴클레오티드를 포함하거나 폴리뉴클레오티드와 회합하고 세포로의 폴리뉴클레오티드의 전달을 매개하는데 사용될 수 있는 거대분자 또는 거대분자의 회합을 지칭한다. 벡터의 예는 플라스미드, 바이러스 벡터, 리포솜, 및 기타 유전자 전달 비히클을 포함한다. 벡터는 일반적으로 표적에서 유전자의 발현을 용이하게 하기 위해 유전자에 작동적으로 연결된 유전적 요소, 예를 들어 조절 요소를 포함한다.
본원에 사용되는 바와 같이, "발현 카세트" 및 "핵산 카세트"는 일반적으로 함께 발현되거나 발현을 위해 작동가능하게 연결된 핵산 서열 또는 요소의 조합을 지칭하기 위해 상호교환적으로 사용된다. 일부 경우에, 발현 카세트는 이들이 발현을 위해 작동가능하게 연결된 조절 요소와 유전자 또는 유전자들의 조합을 지칭한다.
DNA 또는 단백질 서열의 "기능적 단편"은 일반적으로 전장 DNA 또는 단백질 서열의 생물학적 활성과 실질적으로 유사한 생물학적 활성(기능적 또는 구조적)을 유지하는 단편을 지칭한다. DNA 서열의 생물학적 활성은 전장 서열에 기인하는 것으로 알려진 방식으로 발현에 영향을 미치는 능력일 수 있다.
본원에 사용되는 바와 같이, "조작된" 대상은 일반적으로 대상이 인간의 개입에 의해 변형되었음을 나타낸다. 비제한적 예에 따르면: 핵산은 그 서열을 자연에서 발생하지 않는 서열로 변경함으로써 변형될 수 있고; 핵산은 이를 자연에서 연관되지 않은 핵산에 결찰시켜 결찰된 생성물이 원래 핵산에 존재하지 않는 기능을 가지도록 함으로써 변형될 수 있고; 조작된 핵산은 자연에 존재하지 않는 서열로 시험관 내에서 합성될 수 있고; 단백질은 아미노산 서열을 자연에 존재하지 않는 서열로 변경하여 변형될 수 있고; 조작된 단백질은 새로운 기능이나 속성을 획득할 수 있다. "조작된" 시스템은 적어도 하나의 조작된 구성요소를 포함한다.
본원에 사용되는 바와 같이, "합성" 및 "인공"은 자연 발생 인간 단백질에 대해 낮은 서열 동일성(예를 들어, 50% 미만의 서열 동일성, 25% 미만의 서열 동일성, 10% 미만의 서열 동일성, 5% 미만의 서열 동일성, 1% 미만의 서열 동일성)을 갖는 단백질 또는 이의 도메인을 지칭한다. 예를 들어, VPR 및 VP64 도메인은 합성 트랜스활성화 도메인이다.
본원에서 사용되는 바와 같이, 용어 "tracrRNA" 또는 "tracr 서열"은 일반적으로 야생형의 예시적인 tracrRNA 서열(예를 들어, 에스. 피오게네스, 에스. 아우레우스 등으로부터의 tracrRNA 또는 서열 번호 5476-5511)에 대해 적어도 약 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 또는 100% 서열 동일성 및/또는 서열 유사성을 갖는 핵산을 지칭할 수 있다. tracrRNA는 야생형의 예시적인 tracrRNA 서열(예를 들어, 에스. 피오게네스, 에스. 아우레우스 등으로부터의 tracrRNA)에 대해 최대 약 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 100% 서열 동일성 및/또는 서열 유사성을 갖는 핵산을 지칭할 수 있다. tracrRNA는 결실, 삽입, 또는 치환과 같은 뉴클레오티드 변화, 변이체, 돌연변이, 또는 키메라를 포함할 수 있는 tracrRNA의 변형된 형태를 지칭할 수 있다. tracrRNA는 적어도 6개의 연속 뉴클레오티드의 스트레치에 걸쳐 야생형의 예시적인 tracrRNA(예를 들어, 에스. 피오게네스, 에스 아우레우스 등으로부터의 tracrRNA) 서열에 대해 적어도 약 60% 동일할 수 있는 핵산을 지칭할 수 있다. 예를 들어, tracrRNA 서열은 적어도 6개의 연속 뉴클레오티드의 스트레치에 걸쳐 야생형의 예시적인 tracrRNA(예를 들어, 에스. 피오게네스, 에스 아우레우스 등으로부터의 tracrRNA) 서열에 대해 적어도 약 60% 동일, 적어도 약 65% 동일, 적어도 약 70% 동일, 적어도 약 75% 동일, 적어도 약 80% 동일, 적어도 약 85% 동일, 적어도 약 90% 동일, 적어도 약 95% 동일, 적어도 약 98% 동일, 적어도 약 99% 동일, 또는 100% 동일할 수 있다. II형 tracrRNA 서열은 인접한 CRISPR 배열에서 반복 서열의 일부에 대해 상보성을 갖는 영역을 식별함으로써 게놈 서열에서 예측될 수 있다.
본원에서 사용되는 바와 같이, "가이드 핵산"은 일반적으로 또 다른 핵산에 혼성화할 수 있는 핵산을 지칭할 수 있다. 가이드 핵산은 RNA일 수 있다. 가이드 핵산은 DNA일 수 있다. 가이드 핵산은 핵산의 서열에 부위 특이적으로 결합하도록 프로그래밍될 수 있다. 표적화될 핵산 또는 표적 핵산은 뉴클레오티드를 포함할 수 있다. 가이드 핵산은 뉴클레오티드를 포함할 수 있다. 표적 핵산의 일부는 가이드 핵산의 일부에 상보적일 수 있다. 가이드 핵산에 상보적이고 혼성화하는 이중 가닥 표적 폴리뉴클레오티드의 가닥을 상보 가닥이라 부를 수 있다. 상보적 가닥에 상보적이어서 가이드 핵산에 상보적이지 않을 수 있는 이중 가닥 표적 폴리뉴클레오티드의 가닥을 비상보적 가닥이라고 부를 수 있다. 가이드 핵산은 폴리뉴클레오티드 사슬을 포함할 수 있으며 "단일 가이드 핵산"으로 불릴 수 있다. 가이드 핵산은 2개의 폴리뉴클레오티드 사슬을 포함할 수 있으며 "이중 가이드 핵산"으로 불릴 수 있다. 달리 명시되지 않는 한, 용어 "가이드 핵산"은 단일 가이드 핵산 및 이중 가이드 핵산 모두를 지칭하여 포괄적일 수 있다. 가이드 핵산은 "핵산 표적화 세그먼트" 또는 "핵산 표적화 서열"로 지칭될 수 있는 세그먼트를 포함할 수 있다. 핵산 표적화 세그먼트는 "단백질 결합 세그먼트" 또는 "단백질 결합 서열" 또는 "Cas 단백질 결합 세그먼트"로 지칭될 수 있는 부분 세그먼트를 포함할 수 있다.
2개 이상의 핵산 또는 폴리펩티드 서열과 관련하여, 용어 "서열 동일성" 또는 "퍼센트 동일성"은 일반적으로 서열 비교 알고리즘을 사용하여 측정되는 바와 같이, 국소 또는 전체 비교 창에 걸쳐 최대 일치를 위해 비교 및 정렬될 때, 동일하거나 동일한 아미노산 잔기 또는 뉴클레오티드의 특정 백분율을 갖는 2개(예를 들어, 쌍별 정렬) 또는 그 이상(예를 들어, 다중 서열 정렬)의 서열을 지칭한다. 폴리펩티드 서열에 대한 적합한 서열 비교 알고리즘은 예를 들어 30개 잔기보다 긴 폴리펩티드 서열에 대해 단어 길이(W) 3, 기대치 I 10의 매개변수, 존재 11, 확장 1에서 갭 비용을 설정하는 BLOSUM62 스코어링 매트릭스를 사용하고 조건부 구성 스코어 매트릭스 조정을 사용하는 BLASTP; 30개 잔기 미만의 폴리펩티드 서열에 대해 단어 길이(W) 2, 기대치(E) 1000000의 매개변수, 및 갭 개방에 11, 갭 확장에 1에서 갭 비용을 설정하는 PAM30 스코어링 매트릭스를 사용하는 BLASTP(이들은 https://blast.ncbi.nlm.nih.gov에서 사용 가능한 BLAST 제품군의 BLASTP에 대한 기본 매개변수임); 매개변수를 사용한 CLUSTALW; 매치 2, 미스매치 -1, 및 의 갭 -1의 매개변수를 사용한 스미스-워터맨 상동성 검색 알고리즘; 기본 매개변수를 사용한 MUSCLE; 매개변수 retree 2 및 최대 반복회수 1000를 사용한 MAFFT; 기본 매개변수를 사용한 Novafold; 기본 매개변수를 사용한 HMMER hmmalign을 포함한다.
본 개시 내용에는 하나 이상의 보존적 아미노산 치환을 갖는 본원에 기재된 임의의 효소의 변이체가 포함된다. 이러한 보존적 치환은 폴리펩티드의 3차원 구조 또는 기능을 방해하지 않고 폴리펩티드의 아미노산 서열에서 이루어질 수 있다. 보존적 치환은 유사한 소수성, 극성, 및 R 사슬 길이를 갖는 아미노산을 서로 치환함으로써 달성될 수 있다. 추가로 또는 대안적으로, 상이한 종으로부터의 상동 단백질의 정렬된 서열을 비교함으로써, 코딩된 단백질의 기본 기능을 변경하지 않고 종 간에 돌연변이된 아미노산 잔기(예를 들어, 비보존 잔기)를 찾아 보존적 치환을 식별할 수 있다. 이러한 보존적으로 치환된 변이체는 본원에 기재된 엔도뉴클레아제 단백질 서열(예를 들어, 본원에 기술된 MG1, MG2, MG3, MG4, MG6, MG7, MG14, MG15, MG16, MG18, MG21, MG22, 또는 MG23 패밀리 엔도뉴클레아제) 중 어느 하나에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 동일성을 갖는 변이체를 포함할 수 있다. 일부 실시 양태에서, 이러한 보존적으로 치환된 변이체는 기능적 변이체이다. 이러한 기능적 변이체는 엔도뉴클레아제의 중요한 활성 부위 잔기의 활성이 방해받지 않도록 치환된 서열을 포함할 수 있다. 일부 실시 양태에서, 본원에 기재된 임의의 단백질의 기능적 변이체는 [도 6, 7, 8, 9a, 9b, 9c, 9d, 9e, 9f, 9g 또는 9h]에서 언급된 보존된 또는 기능적 잔기 중 적어도 하나의 치환이 결여되어 있다. 일부 실시 양태에서, 본원에 기재된 임의의 단백질의 기능적 변이체는 [도 6, 7, 8, 9a, 9b, 9c, 9d, 9e, 9f, 9g 또는 9h]에 언급된 보존된 또는 기능적 잔기 모두의 치환이 결여되어 있다.
기능적으로 유사한 아미노산을 제공하는 보존적 치환표는 다양한 참고문헌에서 입수할 수 있다(예를 들어, Creighton, Proteins: Structures and Molecular Properties (W H Freeman & Co.; 2판(1993년 12월)) 참조). 다음 8개 군 각각은 서로에 대해 보존적 치환인 아미노산을 포함한다.
1) 알라닌(A), 글리신(G);
2) 아스파르트산(D), 글루탐산(E);
3) 아스파라긴(N), 글루타민(Q);
4) 아르기닌(R), 리신(K);
5) 이소류신(I), 류신(L), 메티오닌(M), 발린(V);
6) 페닐알라닌(F), 티로신(Y), 트립토판(W);
7) 세린(S), 트레오닌(T); 및
8) 시스테인(C), 메티오닌(M)
본원에서 사용되는 바와 같이, 용어 "RuvC_III 도메인"은 일반적으로 RuvC 엔도뉴클레아제 도메인(RuvC 뉴클레아제 도메인은 3개의 불연속 세그먼트, RuvC_I, RuvC_II 및 RuvC_III로 구성됨)의 세 번째 불연속 세그먼트를 지칭한다. RuvC 도메인 또는 이의 세그먼트는 일반적으로 알려진 도메인 서열에 대한 정렬, 주석이 달린 도메인이 있는 단백질에 대한 구조적 정렬 또는 알려진 도메인 서열(예를 들어, RuvC_III의 경우 Pfam HMM PF18541)을 기반으로 구축된 은닉 마르코프 모델(HMM: Hidden Markov Model)과 비교하여 식별할 수 있다.
본원에서 사용되는 바와 같이, 용어 "HNH 도메인"은 일반적으로 특징적인 히스티딘 및 아스파라긴 잔기를 갖는 엔도뉴클레아제 도메인을 지칭한다. HNH 도메인은 일반적으로 알려진 도메인 서열에 대한 정렬, 주석이 달린 도메인이 있는 단백질에 대한 구조적 정렬 또는 알려진 도메인 서열(예를 들어, 도메인 HNH의 경우 Pfam HMM PF01844)을 기반으로 구축된 은닉 마르코프 모델(HMM)과 비교하여 식별할 수 있다.
개요
고유한 기능 및 구조를 갖는 새로운 Cas 효소의 발견은 데옥시리보핵산(DNA) 편집 기술을 추가로 방해하여 속도, 특이성, 기능, 및 사용 용이성을 개선할 가능성을 제공할 수 있다. 미생물에서 클러스터링된 규칙적 간격의 짧은 회문 반복부(CRISPR) 시스템의 예상 출현율과 미생물 종의 순전한 다양성에 비해 문헌에는 기능적으로 특성화된 CRISPR/Cas 효소가 비교적 적다. 이것은 부분적으로 엄청난 수의 미생물 종이 실험실 조건에서 쉽게 배양되지 않을 수 있기 때문이다. 많은 수의 미생물 종을 대표하는 자연 환경 적소의 메타게노믹 시퀀싱은 알려진 새로운 CRISPR/Cas 시스템의 수를 크게 늘리고 새로운 올리고뉴클레오티드 편집 기능의 발견을 가속화할 수 있는 잠재력을 제공할 수 있다. 이러한 접근법의 결실에 대한 최근의 예는 천연 미생물 군집의 메타게놈 분석에서 CasX/CasY CRISPR 시스템의 2016년 발견으로 입증된다.
CRISPR/Cas 시스템은 미생물에서 적응 면역계로 기능하는 것으로 기술된 RNA 지시되는 뉴클레아제 복합체이다. 자연적인 맥락에서, CRISPR/Cas 시스템은 일반적으로 두 부분 (i) RNA 기반 표적화 요소를 코딩하는, 동일하게 짧은 스페이서 서열로 분리된 짧은 반복 서열(30-40bp)의 배열; 및 (ii) 보조 단백질/효소와 함께 RNA 기반 표적화 요소에 의해 지시되는 뉴클레아제 폴리펩티드를 코딩하는 Cas를 코딩하는 ORF를 포함하는 CRISPR(clustered regular interspaced short palindromic repeats) 오페론 또는 유전자좌에서 발견된다. 특정 표적 핵산 서열의 효율적인 뉴클레아제 표적화는 일반적으로 (i) 표적(표적 시드)의 처음 6-8개 핵산과 crRNA 가이드 사이의 상보적 혼성화; 및 (ii) 표적 시드의 정의된 부근 내에 프로토스페이서 인접 모티프(PAM) 서열의 존재(PAM은 일반적으로 숙주 게놈 내에서 일반적으로 나타나지 않는 서열임) 둘 다를 필요로 한다. 시스템의 정확한 기능과 구성에 따라 CRISPR-Cas 시스템은 일반적으로 공유된 기능적 특성과 진화적 유사성을 기반으로 2개 클래스, 5개 유형 및 16개 하위 유형으로 구성된다.
클래스 I CRISPR-Cas 시스템은 큰 다중 서브유닛 이펙터 복합체를 가지며 I형, III형 및 IV형을 포함한다.
I형 CRISPR-Cas 시스템은 구성요소 측면에서 중간 정도의 복잡성으로 간주된다. I형 CRISPR-Cas 시스템에서, RNA 표적화 요소의 배열은 반복 요소에서 가공되는 긴 전구체 crRNA(pre-crRNA)로 전사되어 짧고 성숙한 crRNA를 방출하여 핵산 표적에 프로토스페이서 인접 모티프(PAM)라고 하는 적합한 짧은 컨센서스 서열이 뒤따를 때 뉴클레아제 복합체를 핵산 표적으로 안내한다. 이 가공은 Cascade라고 불리는 큰 엔도뉴클레아제 복합체의 엔도리보뉴클레아제 서브유닛(Cas6)을 통해 발생하며, 이는 crRNA-지시 뉴클레아제 복합체의 뉴클레아제(Cas3) 단백질 구성요소도 포함한다. Cas I 뉴클레아제는 주로 DNA 뉴클레아제로 기능한다.
III형 CRISPR 시스템은 Csm 또는 Cmr 단백질 서브유닛을 포함하는 RAMP(repeat-associated mysterious protein)과 함께 Cas10으로 알려진 중심 뉴클레아제의 존재를 특징으로 할 수 있다. I형 시스템에서와 마찬가지로 성숙한 crRNA는 Cas6 유사 효소를 사용하여 pre-crRNA로부터 가공된다. I형 및 II형 시스템과 달리 III형 시스템은 DNA-RNA 이중체(예를 들어, DNA 가닥이 RNA 중합효소의 주형으로 사용됨)를 표적화하고 절단하는 것으로 보인다.
IV형 CRISPR-Cas 시스템은 고도로 감소된 큰 서브유닛 뉴클레아제(csf1), Cas5(csf3) 및 Cas7(csf2) 군의 RAMP 단백질에 대한 2개의 유전자, 및 일부 경우에, 예측된 작은 서브유닛에 대한 유전자를 보유하고, 이러한 시스템은 일반적으로 내인성 플라스미드에서 발견된다.
클래스 II CRISPR-Cas 시스템은 일반적으로 단일 폴리펩티드 다중도메인 뉴클레아제 이펙터를 가지며 II형, V형 및 VI형을 포함한다.
II형 CRISPR-Cas 시스템은 구성요소 측면에서 가장 단순한 것으로 간주된다. II형 CRISPR-Cas 시스템에서 CRISPR 배열을 성숙한 crRNA로 가공하는데 특별한 엔도뉴클레아제 서브유닛이 필요하지 않고 오히려 배열 반복 서열에 상보적인 영역이 있는 작은 트랜스 코딩된 crRNA(tracrRNA)가 필요하다. tracrRNA는 해당 이펙터 뉴클레아제(예를 들어, Cas9) 및 반복 서열과 상호작용하여 전구체 dsRNA 구조를 형성하며, 이는 내인성 RNAse III에 의해 절단되어 tracrRNA 및 crRNA 둘 다로 로드된 성숙한 이펙터 효소를 생성한다. Cas II 뉴클레아제는 DNA 뉴클레아제로 알려져 있다. 2형 이펙터는 일반적으로 RuvC 유사 뉴클레아제 도메인의 접힘 내에 삽입된 관련 없는 HNH 뉴클레아제 도메인과 함께 RNase H 접힘을 채택하는 RuvC 유사 엔도뉴클레아제 도메인으로 이루어진 구조를 나타낸다. RuvC-유사 도메인은 표적(예를 들어, crRNA 상보적) DNA 가닥의 절단을 담당하는 반면, HNH 도메인은 치환된 DNA 가닥의 절단을 담당한다.
V형 CRISPR-Cas 시스템은 RuvC 유사 도메인을 포함하는 II형 이펙터와 유사한 뉴클레아제 이펙터(예를 들어, Cas12) 구조를 특징으로 한다. II형과 유사하게 대부분의(전부는 아님) V형 CRISPR 시스템은 tracrRNA를 사용하여 pre-crRNA를 성숙한 crRNA로 가공한다. 그러나 pre-crRNA를 여러 crRNA로 절단하기 위해 RNAse III이 필요한 II형 시스템과 달리, V형 시스템은 pre-crRNA를 절단하기 위해 이펙터 뉴클레아제 자체를 사용할 수 있다. II형 CRISPR-Cas 시스템과 마찬가지로 V형 CRISPR-Cas 시스템은 또한 DNA 뉴클레아제로 알려져 있다. II형 CRISPR-Cas 시스템과 달리, 일부 V형 효소(예를 들어, Cas12a)는 이중 가닥 표적 서열의 첫 번째 crRNA 지시된 절단에 의해 활성화되는 강력한 단일 가닥 비특이적 데옥시리보뉴클레아제 활성을 갖는 것으로 보인다.
VI형 CRIPSR-Cas 시스템은 RNA 가이드된 RNA 엔도뉴클레아제를 갖는다. RuvC 유사 도메인 대신에, VI형 시스템(예를 들어, Cas13)의 단일 폴리펩티드 이펙터는 2개의 HEPN 리보뉴클레아제 도메인을 포함한다. II형 및 V형 시스템과 달리 VI 형 시스템은 또한 pre-crRNA를 crRNA로 가공하기 위해 tracrRNA가 필요하지 않은 것으로 보인다. 그러나 V형 시스템과 유사하게, 일부 VI형 시스템(예를 들어, C2C2)은 표적 RNA의 첫 번째 crRNA 지시된 절단에 의해 활성화되는 강력한 단일 가닥 비특이적 뉴클레아제(리보뉴클레아제) 활성을 보유하는 것으로 보인다.
더 단순한 구조로 인해, 클래스 II CRISPR-Cas는 designer 뉴클레아제/게놈 편집 응용 프로그램으로서 조작 및 개발에 가장 널리 채택되었다.
시험관 내 사용을 위한 이러한 시스템의 초기 적응 형태 중 하나는 문헌[Jinek et al. Science. 2012 Aug 17;337(6096):816-21, 이는 전체가 본원에 참고로 포함됨)에서 찾아볼 수 있다. Jinek 연구는 (i) 에스. 피오게네스 SF370으로부터 단리된 재조합적으로 발현되고 정제된 전장 Cas9(예를 들어, 클래스 II, II형 Cas 효소), (ii) 3' tracr 결합 서열이 뒤따르는 절단하고자 하는 표적 DNA 서열에 상보적인 ~20 nt 5' 서열을 보유하는 정제된 성숙한 ~42 nt crRNA(전체 crRNA는 T7 프로모터 서열을 보유하는 합성 DNA 주형으로부터 시험관 내에서 전사됨); (iii) T7 프로모터 서열을 보유하는 합성 DNA 주형으로부터 시험관 내에서 전사된 정제된 tracrRNA, 및 (iv) Mg2+를 포함한 시스템을 최초로 기술하였다. Jinek은 나중에 (ii)의 crRNA가 링커(예를 들어, GAAA)에 의해 (iii)의 5' 말단에 결합되어 자체적으로 Cas9를 표적에 안내할 수 있는 단일의 융합된 합성 가이드 RNA(sgRNA)를 형성하는 개선된 조작된 시스템을 기술하였다(도 2의 상단 패널과 하단 패널 비교).
-- Mali 연구자들(Science. 2013 Feb 15; 339(6121): 823-826, 이는 전체가 본원에 참고로 포함됨)은 나중에 (i) C-말단 핵 국소화 서열(예를 들어, SV40 NLS) 및 적합한 폴리아데닐화 신호(예를 들어, TK pA 신호)를 갖는 적합한 포유동물 프로모터 하에 코돈 최적화 Cas9(예를 들어, 클래스 II, II형 Cas 효소)를 코딩하는 ORF; 및 (ii) 적합한 중합효소 III 프로모터(예를 들어, U6 프로모터) 하에 sgRNA(G로 시작하는 5' 서열에 이어서 3' tracr 결합 서열에 결합된 20 nt의 상보적 표적 핵산 서열, 링커 및 tracrRNA를 가짐)를 코딩하는 ORF를 코딩하는 DNA 벡터를 제공하여 포유동물 세포에서 사용하기 위해 이 시스템을 조정하였다.
MG 효소
한 측면에서, 본 개시 내용은 메타게노믹 시퀀싱을 통해 발견된 조작된 뉴클레아제 시스템을 제공한다. 일부 경우에, 메타게노믹 시퀀싱이 샘플에서 수행된다. 일부 경우에, 다양한 환경에서 샘플을 수집할 수 있다. 이러한 환경은 인간 마이크로바이옴, 동물 마이크로바이옴, 고온 환경, 저온 환경일 수 있다. 이러한 환경에는 퇴적물이 포함될 수 있다. 본원에 기재된 조작된 뉴클레아제 시스템의 이러한 환경 유형의 예는 [도 45]에서 찾을 수 있다.
MG1 효소
한 측면에서, 본 개시 내용은 (a) 엔도뉴클레아제를 포함하는 조작된 뉴클레아제 시스템을 제공한다. 일부 경우에, 엔도뉴클레아제는 Cas 엔도뉴클레아제이다. 일부 경우에, 엔도뉴클레아제는 II형, 클래스 II Cas 엔도뉴클레아제이다. 엔도뉴클레아제는 RuvC_III 도메인을 포함할 수 있으며, 여기서 상기 RuvC_III 도메인은 서열 번호 1827-2140 중 어느 하나에 대해 적어도 약 70% 서열 동일성을 갖는다. 일부 경우에, 엔도뉴클레아제는 RuvC_III 도메인을 포함할 수 있으며, 여기서 RuvC_III 도메인은 서열 번호 1827-2140 중 어느 하나에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 동일성을 갖는다. 일부 경우에, 엔도뉴클레아제는 서열 번호 1827-2140 중 어느 하나에 대해 실질적으로 동일한 RuvC_III 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 1827-1831 중 어느 하나에 대해 적어도 약 70% 서열 동일성을 갖는 RuvC_III 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 1827-1831 중 어느 하나에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 동일성을 갖는 RuvC_III 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 1827-1831 중 어느 하나에 대해 실질적으로 동일한 RuvC_III 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 1827에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 동일성을 갖는 RuvC_III 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 1828에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 동일성을 갖는 RuvC_III 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 1829에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 동일성을 갖는 RuvC_III 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 1830에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 동일성을 갖는 RuvC_III 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 1831에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 동일성을 갖는 RuvC_III 도메인을 포함할 수 있다.
엔도뉴클레아제는 서열 번호 3638-3955 중 어느 하나에 대해 적어도 약 70% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 3638-3955 중 어느 하나에 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 3638-3955 중 어느 하나에 대해 실질적으로 동일한 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 3638-3955 중 어느 하나에 대해 적어도 약 70% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 3638-3955 중 어느 하나에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 3638-3955 중 어느 하나에 대해 실질적으로 동일한 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 3638-3641 중 어느 하나에 대해 적어도 약 70% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 3638-3641 중 어느 하나에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 3638-3641 중 어느 하나에 대해 실질적으로 동일한 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 3638 중 어느 하나에 대해 적어도 약 70% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 3638 중 어느 하나에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 3638 중 어느 하나에 대해 실질적으로 동일한 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 3639 중 어느 하나에 대해 적어도 약 70% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 3639 중 어느 하나에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 3639 중 어느 하나에 대해 실질적으로 동일한 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 3640 중 어느 하나에 대해 적어도 약 70% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 3640 중 어느 하나에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 3640 중 어느 하나에 대해 실질적으로 동일한 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 3641 중 어느 하나에 대해 적어도 약 70% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 3641 중 어느 하나에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 3641 중 어느 하나에 대해 실질적으로 동일한 HNH 도메인을 포함할 수 있다.
일부 경우에, 엔도뉴클레아제는 서열 번호 1-6 또는 9-319 중 어느 하나에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체를 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 1-6 또는 9-319 중 어느 하나에 대해 실질적으로 동일할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호1-4 중 어느 하나에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체를 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 1-4 중 어느 하나에 실질적으로 동일할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 5615, 5616, 또는 5617 중 어느 하나에 대해 실질적으로 동일한 펩티드 모티프를 포함할 수 있다.
일부 경우에, 엔도뉴클레아제는 하나 이상의 핵 국소화 서열(NLS)을 갖는 변이체를 포함할 수 있다. NLS는 상기 엔도뉴클레아제의 N- 또는 C-말단에 근접할 수 있다. NLS는 서열 번호 1-6 또는 9-319 중 어느 하나, 또는 서열 번호 1-319 중 어느 하나에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체의 N-말단 또는 C-말단에 첨부될 수 있다. NLS는 SV40 대형 T 항원 NLS일 수 있다. NLS는 c-myc NLS일 수 있다. NLS는 서열 번호 5593-5608 중 어느 하나에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 99% 동일성을 갖는 서열을 포함할 수 있다. NLS는 서열 번호 5593-5608 중 어느 하나에 대해 실질적으로 동일한 서열을 포함할 수 있다. NLS는 아래 표 1의 임의의 서열 또는 이들의 조합을 포함할 수 있다.
[표 1]
Figure pct00001
일부 경우에, 엔도뉴클레아제는 재조합(예를 들어, 이. 콜라이에서의 발현에 이은 에피토프 태그 정제와 같은 적합한 방법에 의해 클로닝, 발현 및 정제)될 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 5592-5595 중 어느 하나에 대해 적어도 약 90% 동일성을 갖는 16S rRNA 유전자를 갖는 박테리아로부터 유래될 수 있다. 엔도뉴클레아제는 서열 번호 5592-5595 중 어느 하나에 대해 적어도 약 80%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 16S rRNA 유전자를 갖는 종으로부터 유래될 수 있다. 엔도뉴클레아제는 서열 번호 5592-5595 중 어느 하나에 대해 실질적으로 동일한 16S rRNA 유전자를 갖는 종으로부터 유래될 수 있다. 엔도뉴클레아제는 우미균 문 또는 칸디다투스 페레그리니박테리아 문에 속하는 박테리아로부터 유래될 수 있다.
일부 경우에, 서열 동일성은 스미스-워터맨 상동성 검색 알고리즘의 매개변수를 사용하여 BLASTP, CLUSTALW, MUSCLE, MAFFT, Novafold, 또는 CLUSTALW에 의해 결정될 수 있다. 서열 동일성은 단어 길이(W) 3, 기대치(E) 10의 매개변수를 사용하고, 존재 11, 확장 1에서 갭 비용을 설정하는 BLOSUM62 스코어링 매트릭스를 사용하고, 조건부 구성 스코어 매트릭스 조정을 사용하는 BLASTP 알고리즘에 의해 결정될 수 있다.
일부 경우에, 상기 시스템은 (b) 원하는 절단 서열에 상보적인 5' 표적화 영역을 보유하는 엔도뉴클레아제와 복합체를 형성할 수 있는 적어도 하나의 조작된 합성 가이드 리보핵산(sgRNA)을 포함할 수 있다. 일부 경우에, 5' 표적화 영역은 엔도뉴클레아제와 호환되는 PAM 서열을 포함할 수 있다. 일부 경우에, 표적화 영역의 가장 5' 뉴클레오티드는 G일 수 있다. 일부 경우에, 5' 표적화 영역은 15-23 뉴클레오티드 길이일 수 있다. 가이드 서열 및 tracr 서열은 별도의 리보핵산(RNA) 또는 단일 리보핵산(RNA)으로서 공급될 수 있다. 가이드 RNA는 표적화 영역 3'에 crRNA tracrRNA 결합 서열을 포함할 수 있다. 가이드 RNA는 crRNA tracrRNA 결합 영역 3'에 4-뉴클레오티드 링커가 선행하는 tracrRNA 서열을 포함할 수 있다. sgRNA는 5'에서 3'으로 세포에서 표적 서열에 혼성화할 수 있는 비천연 가이드 핵산 서열; 및 tracr 서열을 포함할 수 있다. 일부 경우에, 비천연 가이드 핵산 서열 및 tracr 서열은 공유적으로 연결된다.
일부 경우에, tracr 서열은 특정 서열을 가질 수 있다. tracr 서열은 천연 tracrRNA 서열의 적어도 약 60-100(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 적어도 약 80% 서열 동일성을 가질 수 있다. tracr 서열은 서열 번호 5476-5489 중 어느 하나의 적어도 약 60-100(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 적어도 약 80% 서열 동일성을 가질 수 있다. 일부 경우에, tracrRNA는 서열 번호 5476-5489 중 어느 하나의 적어도 약 60-90(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 가질 수 있다. 일부 경우에, tracrRNA는 서열 번호 5476-5489 중 어느 하나의 적어도 약 60-100(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 실질적으로 동일할 수 있다. tracrRNA는 서열 번호 5476-5489 중 임의의 것을 포함할 수 있다.
일부 경우에, 엔도뉴클레아제와 복합체를 형성할 수 있는 적어도 하나의 조작된 합성 가이드 리보핵산(sgRNA)은 서열 번호 5461-5464 중 어느 하나에 대해 적어도 약 80% 동일성을 갖는 서열을 포함할 수 있다. sgRNA는 서열 번호 5461-5464 중 어느 하나에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 서열을 포함할 수 있다. sgRNA는 서열 번호 5461-5464 중 어느 하나에 대해 실질적으로 동일한 서열을 포함할 수 있다.
일부 경우에, 상기 시스템은 표적 DNA 유전자좌에서 절단을 위한 제1 영역 및 제2 영역을 표적화하는 2개의 상이한 sgRNA를 포함할 수 있으며, 여기서 제2 영역은 제1 영역에 대해 3'에 있다. 일부 경우에, 상기 시스템은 5'에서 3'으로 다음을 포함하는 단일 또는 이중 가닥 DNA 복구 주형을 포함할 수 있다: 제1 영역의 5'에 적어도 약 20(예를 들어, 적어도 약 40, 80, 120, 150, 200, 300, 500, 또는 1kb) 뉴클레오티드의 서열을 포함하는 제1 상동성 아암, 적어도 약 10 뉴클레오티드의 합성 DNA 서열, 및 제2 영역의 3'에 적어도 약 20(예를 들어, 적어도 약 40, 80, 120, 150, 200, 300, 500, 또는 1kb) 뉴클레오티드의 서열을 포함하는 제2 상동성 아암.
또 다른 측면에서, 본 개시 내용은 표적 핵산 유전자좌를 변형시키는 방법을 제공한다. 방법은 본원에 개시된 효소 및 적어도 하나의 합성 가이드 RNA(sgRNA)를 포함하는 본원에 개시된 임의의 비천연 시스템을 표적 핵산 유전자좌에 전달하는 단계를 포함할 수 있다. 효소는 적어도 하나의 sgRNA와 복합체를 형성할 수 있고, 복합체가 표적 핵산 유전자좌에 결합할 때 표적 핵산 유전자좌를 변형시킬 수 있다. 상기 유전자좌에 효소를 전달하는 단계는 시스템 또는 시스템을 코딩하는 핵산으로 세포를 형질감염시키는 단계를 포함할 수 있다. 상기 유전자좌에 뉴클레아제를 전달하는 단계는 시스템 또는 시스템을 코딩하는 핵산으로 세포를 전기천공하는 단계를 포함할 수 있다. 상기 유전자좌에 뉴클레아제를 전달하는 단계는 관심의 유전자좌를 포함하는 핵산과 함께 완충액에서 시스템을 인큐베이션하는 단계를 포함할 수 있다. 일부 경우에, 표적 핵산 유전자좌는 데옥시리보핵산(DNA) 또는 리보핵산(RNA)을 포함한다. 표적 핵산 유전자좌는 게놈 DNA, 바이러스 DNA, 바이러스 RNA, 또는 박테리아 DNA를 포함할 수 있다. 표적 핵산 유전자좌는 세포 내에 있을 수 있다. 표적 핵산 유전자좌는 시험관 내에 있을 수 있다. 표적 핵산 유전자좌는 진핵생물 세포 또는 원핵생물 세포 내에 있을 수 있다. 세포는 동물 세포, 인간 세포, 박테리아 세포, 고세균 세포, 또는 식물 세포일 수 있다. 효소는 관심의 표적 유전자좌에서 또는 그 근위에서 단일 또는 이중 가닥 파손을 유도할 수 있다.
표적 핵산 유전자좌가 세포 내에 있을 수 있는 경우, 효소는 서열 번호 1827-2140 중 어느 하나에 대해 적어도 약 75%(예를 들어, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%) 동일성을 갖는 RuvC_III 도메인을 갖는 효소를 코딩하는 오픈 리딩 프레임을 함유하는 핵산으로서 공급될 수 있다. 상기 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임을 함유하는 데옥시리보핵산(DNA)은 서열 번호 5572-5575 중 임의의 것 또는 서열 번호 5572-5575 중 어느 하나에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체에 대해 실질적으로 동일한 서열을 포함할 수 있다. 일부 경우에, 핵산은 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임이 작동가능하게 연결된 프로모터를 포함한다. 프로모터는 CMV, EF1a, SV40, PGK1, Ubc, 인간 베타 액틴, CAG, TRE, 또는 CaMKIIa 프로모터일 수 있다. 엔도뉴클레아제는 상기 엔도뉴클레아제를 코딩하는 상기 오픈 리딩 프레임을 함유하는 캡핑된 mRNA로서 공급될 수 있다. 엔도뉴클레아제는 번역된 폴리펩티드로서 공급될 수 있다. 적어도 하나의 조작된 sgRNA는 리보핵산(RNA) pol III 프로모터에 작동가능하게 연결된 상기 적어도 하나의 조작된 sgRNA를 코딩하는 유전자 서열을 함유하는 데옥시리보핵산(DNA)으로서 공급될 수 있다. 일부 경우에, 유기체는 진핵생물일 수 있다. 일부 경우에, 유기체는 진균일 수 있다. 일부 경우에, 유기체는 인간일 수 있다.
일부 경우에, 본 개시 내용은 본원에 개시된 시스템 또는 본원에 기재된 핵산을 포함하는 발현 카세트를 제공할 수 있다. 일부 경우에, 발현 카세트 또는 핵산은 벡터로서 공급될 수 있다. 일부 경우에, 발현 카세트, 핵산, 또는 벡터는 세포에 공급될 수 있다. 일부 경우에, 세포는 서열 번호 5592-5595 중 어느 하나와 적어도 약 90%(예를 들어, 적어도 약 99%) 동일성을 갖는 16S rRNA 유전자를 갖는 박테리아의 세포이다.
MG2 효소
한 측면에서, 본 개시 내용은 (a) 엔도뉴클레아제를 포함하는 조작된 뉴클레아제 시스템을 제공한다. 일부 경우에, 엔도뉴클레아제는 Cas 엔도뉴클레아제이다. 일부 경우에, 엔도뉴클레아제는 II형, 클래스 II Cas 엔도뉴클레아제이다. 엔도뉴클레아제는 RuvC_III 도메인을 포함할 수 있으며, 여기서 상기 RuvC_III 도메인은 서열 번호 2141-2241 중 어느 하나에 대해 적어도 약 70% 서열 동일성을 갖는다. 일부 경우에, 엔도뉴클레아제는 RuvC_III 도메인을 포함할 수 있으며, 여기서 RuvC_III 도메인은 서열 번호 2141-2241 중 어느 하나에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 동일성을 갖는다. 일부 경우에, 엔도뉴클레아제는 서열 번호 2141-2142 중 어느 하나에 대해 실질적으로 동일한 RuvC_III 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 2141-2142 중 어느 하나에 대해 적어도 약 70% 서열 동일성을 갖는 RuvC_III 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 2141-2142 중 어느 하나에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 동일성을 갖는 RuvC_III 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 2141-2142 중 어느 하나에 대해 실질적으로 동일한 RuvC_III 도메인을 포함할 수 있다.
엔도뉴클레아제는 서열 번호 3955-4055 중 어느 하나에 대해 적어도 약 70% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 3955-4055 중 어느 하나에 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 3955-4055 중 어느 하나에 대해 실질적으로 동일한 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 3955-3956 중 어느 하나에 대해 적어도 약 70% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 3955-3956 중 어느 하나에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 3955-3956 중 어느 하나에 대해 실질적으로 동일한 HNH 도메인을 포함할 수 있다.
일부 경우에, 엔도뉴클레아제는 서열 번호 320-420 중 어느 하나에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체를 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 320-420 중 어느 하나에 대해 실질적으로 동일할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 320-321 중 어느 하나에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체를 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 320-321 중 어느 하나에 실질적으로 동일할 수 있다.
일부 경우에, 엔도뉴클레아제는 하나 이상의 핵 국소화 서열(NLS)을 갖는 변이체를 포함할 수 있다. NLS는 상기 엔도뉴클레아제의 N- 또는 C-말단에 근접할 수 있다. NLS는 서열 번호 320-420 중 어느 하나, 또는 서열 번호 320-420 중 어느 하나에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체의 N-말단 또는 C-말단에 첨부될 수 있다. NLS는 SV40 대형 T 항원 NLS일 수 있다. NLS는 c-myc NLS일 수 있다. NLS는 서열 번호 5593-5608 중 어느 하나에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 99% 동일성을 갖는 서열을 포함할 수 있다. NLS는 서열 번호 5593-5608 중 어느 하나에 대해 실질적으로 동일한 서열을 포함할 수 있다. NLS는 표 1의 임의의 서열 또는 이들의 조합을 포함할 수 있다.
일부 경우에, 서열 동일성은 스미스-워터맨 상동성 검색 알고리즘의 매개변수를 사용하여 BLASTP, CLUSTALW, MUSCLE, MAFFT, Novafold, 또는 CLUSTALW에 의해 결정될 수 있다. 서열 동일성은 단어 길이(W) 3, 기대치(E) 10의 매개변수를 사용하고, 존재 11, 확장 1에서 갭 비용을 설정하는 BLOSUM62 스코어링 매트릭스를 사용하고, 조건부 구성 스코어 매트릭스 조정을 사용하는 BLASTP 알고리즘에 의해 결정될 수 있다.
일부 경우에, 상기 시스템은 (b) 원하는 절단 서열에 상보적인 5' 표적화 영역을 보유하는 엔도뉴클레아제와 복합체를 형성할 수 있는 적어도 하나의 조작된 합성 가이드 리보핵산(sgRNA)을 포함할 수 있다. 일부 경우에, 5' 표적화 영역은 엔도뉴클레아제와 호환되는 PAM 서열을 포함할 수 있다. 일부 경우에, 표적화 영역의 가장 5' 뉴클레오티드는 G일 수 있다. 일부 경우에, 5' 표적화 영역은 15-23 뉴클레오티드 길이일 수 있다. 가이드 서열 및 tracr 서열은 별도의 리보핵산(RNA) 또는 단일 리보핵산(RNA)으로서 공급될 수 있다. 가이드 RNA는 표적화 영역 3'에 crRNA tracrRNA 결합 서열을 포함할 수 있다. 가이드 RNA는 crRNA tracrRNA 결합 영역 3'에 4-뉴클레오티드 링커가 선행하는 tracrRNA 서열을 포함할 수 있다. sgRNA는 5'에서 3'으로 세포에서 표적 서열에 혼성화할 수 있는 비천연 가이드 핵산 서열; 및 tracr 서열을 포함할 수 있다. 일부 경우에, 비천연 가이드 핵산 서열 및 tracr 서열은 공유적으로 연결된다.
일부 경우에, tracr 서열은 특정 서열을 가질 수 있다. tracr 서열은 천연 tracrRNA 서열의 적어도 약 60-100(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 적어도 약 80% 서열 동일성을 가질 수 있다. tracr 서열은 서열 번호 5490-5494 중 어느 하나의 적어도 약 60-100(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 적어도 약 80% 서열 동일성을 가질 수 있다. 일부 경우에, tracrRNA는 서열 번호 5490-5494 중 어느 하나의 적어도 약 60-90(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 가질 수 있다. 일부 경우에, tracrRNA는 서열 번호 5490-5494 중 어느 하나의 적어도 약 60-100(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 실질적으로 동일할 수 있다. tracrRNA는 서열 번호 5490-5494 중 임의의 것을 포함할 수 있다.
일부 경우에, 엔도뉴클레아제와 복합체를 형성할 수 있는 적어도 하나의 조작된 합성 가이드 리보핵산(sgRNA)은 서열 번호 5465에 대해 적어도 약 80% 동일성을 갖는 서열을 포함할 수 있다. sgRNA는 서열 번호 5465에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 서열을 포함할 수 있다. sgRNA는 서열 번호 5465에 대해 실질적으로 동일한 서열을 포함할 수 있다.
일부 경우에, 상기 시스템은 표적 DNA 유전자좌에서 절단을 위한 제1 영역 및 제2 영역을 표적화하는 2개의 상이한 sgRNA를 포함할 수 있으며, 여기서 제2 영역은 제1 영역에 대해 3'에 있다. 일부 경우에, 상기 시스템은 5'에서 3'으로 다음을 포함하는 단일 또는 이중 가닥 DNA 복구 주형을 포함할 수 있다: 제1 영역의 5'에 적어도 약 20(예를 들어, 적어도 약 40, 80, 120, 150, 200, 300, 500, 또는 1kb) 뉴클레오티드의 서열을 포함하는 제1 상동성 아암, 적어도 약 10 뉴클레오티드의 합성 DNA 서열, 및 제2 영역의 3'에 적어도 약 20(예를 들어, 적어도 약 40, 80, 120, 150, 200, 300, 500, 또는 1kb) 뉴클레오티드의 서열을 포함하는 제2 상동성 아암.
또 다른 측면에서, 본 개시 내용은 관심의 표적 핵산 유전자좌를 변형시키는 방법을 제공한다. 방법은 본원에 개시된 효소 및 적어도 하나의 합성 가이드 RNA(sgRNA)를 포함하는 본원에 개시된 임의의 비천연 시스템을 표적 핵산 유전자좌에 전달하는 단계를 포함할 수 있다. 효소는 적어도 하나의 sgRNA와 복합체를 형성할 수 있고, 복합체가 관심의 표적 핵산 유전자좌에 결합할 때 관심의 표적 핵산 유전자좌를 변형시킬 수 있다. 상기 유전자좌에 효소를 전달하는 단계는 시스템 또는 시스템을 코딩하는 핵산으로 세포를 형질감염시키는 단계를 포함할 수 있다. 상기 유전자좌에 뉴클레아제를 전달하는 단계는 시스템 또는 시스템을 코딩하는 핵산으로 세포를 전기천공하는 단계를 포함할 수 있다. 상기 유전자좌에 뉴클레아제를 전달하는 단계는 관심의 유전자좌를 포함하는 핵산과 함께 완충액에서 시스템을 인큐베이션하는 단계를 포함할 수 있다. 일부 경우에, 표적 핵산 유전자좌는 데옥시리보핵산(DNA) 또는 리보핵산(RNA)을 포함한다. 표적 핵산 유전자좌는 게놈 DNA, 바이러스 DNA, 바이러스 RNA, 또는 박테리아 DNA를 포함할 수 있다. 표적 핵산 유전자좌는 세포 내에 있을 수 있다. 표적 핵산 유전자좌는 시험관 내에 있을 수 있다. 표적 핵산 유전자좌는 진핵생물 세포 또는 원핵생물 세포 내에 있을 수 있다. 세포는 동물 세포, 인간 세포, 박테리아 세포, 고세균 세포, 또는 식물 세포일 수 있다. 효소는 관심의 표적 유전자좌에서 또는 그 근위에서 단일 또는 이중 가닥 파손을 유도할 수 있다.
표적 핵산 유전자좌가 세포 내에 있을 수 있는 경우, 효소는 서열 번호 2141-2241 중 어느 하나에 대해 적어도 약 75%(예를 들어, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%) 동일성을 갖는 RuvC_III 도메인을 갖는 효소를 코딩하는 오픈 리딩 프레임을 함유하는 핵산으로서 공급될 수 있다. 상기 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임을 함유하는 데옥시리보핵산(DNA)은 서열 번호 5576-5577 중 임의의 것 또는 서열 번호 5576-5577 중 어느 하나에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체에 대해 실질적으로 동일한 서열을 포함할 수 있다. 일부 경우에, 핵산은 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임이 작동가능하게 연결된 프로모터를 포함한다. 프로모터는 CMV, EF1a, SV40, PGK1, Ubc, 인간 베타 액틴, CAG, TRE, 또는 CaMKIIa 프로모터일 수 있다. 엔도뉴클레아제는 상기 엔도뉴클레아제를 코딩하는 상기 오픈 리딩 프레임을 함유하는 캡핑된 mRNA로서 공급될 수 있다. 엔도뉴클레아제는 번역된 폴리펩티드로서 공급될 수 있다. 적어도 하나의 조작된 sgRNA는 리보핵산(RNA) pol III 프로모터에 작동가능하게 연결된 상기 적어도 하나의 조작된 sgRNA를 코딩하는 유전자 서열을 함유하는 데옥시리보핵산(DNA)으로서 공급될 수 있다. 일부 경우에, 유기체는 진핵생물일 수 있다. 일부 경우에, 유기체는 진균일 수 있다. 일부 경우에, 유기체는 인간일 수 있다.
MG3 효소
한 측면에서, 본 개시 내용은 (a) 엔도뉴클레아제를 포함하는 조작된 뉴클레아제 시스템을 제공한다. 일부 경우에, 엔도뉴클레아제는 Cas 엔도뉴클레아제이다. 일부 경우에, 엔도뉴클레아제는 II형, 클래스 II Cas 엔도뉴클레아제이다. 엔도뉴클레아제는 RuvC_III 도메인을 포함할 수 있으며, 여기서 상기 RuvC_III 도메인은 서열 번호 2242-2251 중 어느 하나에 대해 적어도 약 70% 서열 동일성을 갖는다. 일부 경우에, 엔도뉴클레아제는 RuvC_III 도메인을 포함할 수 있으며, 여기서 RuvC_III 도메인은 서열 번호 2242-2251 중 어느 하나에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 동일성을 갖는다. 일부 경우에, 엔도뉴클레아제는 서열 번호 2242-2251 중 어느 하나에 대해 실질적으로 동일한 RuvC_III 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 2242-2244 중 어느 하나에 대해 적어도 약 70% 서열 동일성을 갖는 RuvC_III 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 2242-2244 중 어느 하나에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 동일성을 갖는 RuvC_III 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 2242-2244 중 어느 하나에 대해 실질적으로 동일한 RuvC_III 도메인을 포함할 수 있다.
엔도뉴클레아제는 서열 번호 4056-4066 중 어느 하나에 대해 적어도 약 70% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 4056-4066 중 어느 하나에 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 4056-4066 중 어느 하나에 대해 실질적으로 동일한 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 4056-4058 중 어느 하나에 대해 적어도 약 70% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 4056-4058 중 어느 하나에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 4056-4058 중 어느 하나에 대해 실질적으로 동일한 HNH 도메인을 포함할 수 있다.
일부 경우에, 엔도뉴클레아제는 서열 번호 421-431 중 어느 하나에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체를 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 421-431 중 어느 하나에 대해 실질적으로 동일할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 421-423 중 어느 하나에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체를 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 421-423 중 어느 하나에 실질적으로 동일할 수 있다.
일부 경우에, 엔도뉴클레아제는 하나 이상의 핵 국소화 서열(NLS)을 갖는 변이체를 포함할 수 있다. NLS는 상기 엔도뉴클레아제의 N- 또는 C-말단에 근접할 수 있다. NLS는 서열 번호 421-431 중 어느 하나, 또는 서열 번호 421-431 중 어느 하나에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체의 N-말단 또는 C-말단에 첨부될 수 있다. NLS는 SV40 대형 T 항원 NLS일 수 있다. NLS는 c-myc NLS일 수 있다. NLS는 서열 번호 5593-5608 중 어느 하나에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 99% 동일성을 갖는 서열을 포함할 수 있다. NLS는 서열 번호 5593-5608 중 어느 하나에 대해 실질적으로 동일한 서열을 포함할 수 있다. NLS는 표 1의 임의의 서열 또는 이들의 조합을 포함할 수 있다.
일부 경우에, 서열 동일성은 스미스-워터맨 상동성 검색 알고리즘의 매개변수를 사용하여 BLASTP, CLUSTALW, MUSCLE, MAFFT, Novafold, 또는 CLUSTALW에 의해 결정될 수 있다. 서열 동일성은 단어 길이(W) 3, 기대치(E) 10의 매개변수를 사용하고, 존재 11, 확장 1에서 갭 비용을 설정하는 BLOSUM62 스코어링 매트릭스를 사용하고, 조건부 구성 스코어 매트릭스 조정을 사용하는 BLASTP 알고리즘에 의해 결정될 수 있다.
일부 경우에, 상기 시스템은 (b) 원하는 절단 서열에 상보적인 5' 표적화 영역을 보유하는 엔도뉴클레아제와 복합체를 형성할 수 있는 적어도 하나의 조작된 합성 가이드 리보핵산(sgRNA)을 포함할 수 있다. 일부 경우에, 5' 표적화 영역은 엔도뉴클레아제와 호환되는 PAM 서열을 포함할 수 있다. 일부 경우에, 표적화 영역의 가장 5' 뉴클레오티드는 G일 수 있다. 일부 경우에, 5' 표적화 영역은 15-23 뉴클레오티드 길이일 수 있다. 가이드 서열 및 tracr 서열은 별도의 리보핵산(RNA) 또는 단일 리보핵산(RNA)으로서 공급될 수 있다. 가이드 RNA는 표적화 영역 3'에 crRNA tracrRNA 결합 서열을 포함할 수 있다. 가이드 RNA는 crRNA tracrRNA 결합 영역 3'에 4-뉴클레오티드 링커가 선행하는 tracrRNA 서열을 포함할 수 있다. sgRNA는 5'에서 3'으로 세포에서 표적 서열에 혼성화할 수 있는 비천연 가이드 핵산 서열; 및 tracr 서열을 포함할 수 있다. 일부 경우에, 비천연 가이드 핵산 서열 및 tracr 서열은 공유적으로 연결된다.
일부 경우에, tracr 서열은 특정 서열을 가질 수 있다. tracr 서열은 천연 tracrRNA 서열의 적어도 약 60-100(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 적어도 약 80% 서열 동일성을 가질 수 있다. tracr 서열은 서열 번호 5495-5502 중 어느 하나의 적어도 약 60-100(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 적어도 약 80% 서열 동일성을 가질 수 있다. 일부 경우에, tracrRNA는 서열 번호 5495-5502 중 어느 하나의 적어도 약 60-90(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 가질 수 있다. 일부 경우에, tracrRNA는 서열 번호 5495-5502 중 어느 하나의 적어도 약 60-100(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 실질적으로 동일할 수 있다. tracrRNA는 서열 번호 5495-5502 중 임의의 것을 포함할 수 있다.
일부 경우에, 엔도뉴클레아제와 복합체를 형성할 수 있는 적어도 하나의 조작된 합성 가이드 리보핵산(sgRNA)은 서열 번호 5466-5467 중 어느 하나에 대해 적어도 약 80% 동일성을 갖는 서열을 포함할 수 있다. sgRNA는 서열 번호 5466-5467 중 어느 하나에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 서열을 포함할 수 있다. sgRNA는 서열 번호 5466-5467 중 어느 하나에 대해 실질적으로 동일한 서열을 포함할 수 있다.
일부 경우에, 상기 시스템은 표적 DNA 유전자좌에서 절단을 위한 제1 영역 및 제2 영역을 표적화하는 2개의 상이한 sgRNA를 포함할 수 있으며, 여기서 제2 영역은 제1 영역에 대해 3'에 있다. 일부 경우에, 상기 시스템은 5'에서 3'으로 다음을 포함하는 단일 또는 이중 가닥 DNA 복구 주형을 포함할 수 있다: 제1 영역의 5'에 적어도 약 20(예를 들어, 적어도 약 40, 80, 120, 150, 200, 300, 500, 또는 1kb) 뉴클레오티드의 서열을 포함하는 제1 상동성 아암, 적어도 약 10 뉴클레오티드의 합성 DNA 서열, 및 제2 영역의 3'에 적어도 약 20(예를 들어, 적어도 약 40, 80, 120, 150, 200, 300, 500, 또는 1kb) 뉴클레오티드의 서열을 포함하는 제2 상동성 아암.
또 다른 측면에서, 본 개시 내용은 관심의 표적 핵산 유전자좌를 변형시키는 방법을 제공한다. 방법은 본원에 개시된 효소 및 적어도 하나의 합성 가이드 RNA(sgRNA)를 포함하는 본원에 개시된 임의의 비천연 시스템을 표적 핵산 유전자좌에 전달하는 단계를 포함할 수 있다. 효소는 적어도 하나의 sgRNA와 복합체를 형성할 수 있고, 복합체가 관심의 표적 핵산 유전자좌에 결합할 때 관심의 표적 핵산 유전자좌를 변형시킬 수 있다. 상기 유전자좌에 효소를 전달하는 단계는 시스템 또는 시스템을 코딩하는 핵산으로 세포를 형질감염시키는 단계를 포함할 수 있다. 상기 유전자좌에 뉴클레아제를 전달하는 단계는 시스템 또는 시스템을 코딩하는 핵산으로 세포를 전기천공하는 단계를 포함할 수 있다. 상기 유전자좌에 뉴클레아제를 전달하는 단계는 관심의 유전자좌를 포함하는 핵산과 함께 완충액에서 시스템을 인큐베이션하는 단계를 포함할 수 있다. 일부 경우에, 표적 핵산 유전자좌는 데옥시리보핵산(DNA) 또는 리보핵산(RNA)을 포함한다. 표적 핵산 유전자좌는 게놈 DNA, 바이러스 DNA, 바이러스 RNA, 또는 박테리아 DNA를 포함할 수 있다. 표적 핵산 유전자좌는 세포 내에 있을 수 있다. 표적 핵산 유전자좌는 시험관 내에 있을 수 있다. 표적 핵산 유전자좌는 진핵생물 세포 또는 원핵생물 세포 내에 있을 수 있다. 세포는 동물 세포, 인간 세포, 박테리아 세포, 고세균 세포, 또는 식물 세포일 수 있다. 효소는 관심의 표적 유전자좌에서 또는 그 근위에서 단일 또는 이중 가닥 파손을 유도할 수 있다.
표적 핵산 유전자좌가 세포 내에 있을 수 있는 경우, 효소는 서열 번호 2242-2251 중 어느 하나에 대해 적어도 약 75%(예를 들어, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%) 동일성을 갖는 RuvC_III 도메인을 갖는 효소를 코딩하는 오픈 리딩 프레임을 함유하는 핵산으로서 공급될 수 있다. 상기 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임을 함유하는 데옥시리보핵산(DNA)은 서열 번호 5578-5580 중 임의의 것 또는 서열 번호 5578-5580 중 어느 하나에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체에 대해 실질적으로 동일한 서열을 포함할 수 있다. 일부 경우에, 핵산은 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임이 작동가능하게 연결된 프로모터를 포함한다. 프로모터는 CMV, EF1a, SV40, PGK1, Ubc, 인간 베타 액틴, CAG, TRE, 또는 CaMKIIa 프로모터일 수 있다. 엔도뉴클레아제는 상기 엔도뉴클레아제를 코딩하는 상기 오픈 리딩 프레임을 함유하는 캡핑된 mRNA로서 공급될 수 있다. 엔도뉴클레아제는 번역된 폴리펩티드로서 공급될 수 있다. 적어도 하나의 조작된 sgRNA는 리보핵산(RNA) pol III 프로모터에 작동가능하게 연결된 상기 적어도 하나의 조작된 sgRNA를 코딩하는 유전자 서열을 함유하는 데옥시리보핵산(DNA)으로서 공급될 수 있다. 일부 경우에, 유기체는 진핵생물일 수 있다. 일부 경우에, 유기체는 진균일 수 있다. 일부 경우에, 유기체는 인간일 수 있다.
MG4 효소
한 측면에서, 본 개시 내용은 (a) 엔도뉴클레아제를 포함하는 조작된 뉴클레아제 시스템을 제공한다. 일부 경우에, 엔도뉴클레아제는 Cas 엔도뉴클레아제이다. 일부 경우에, 엔도뉴클레아제는 II형, 클래스 II Cas 엔도뉴클레아제이다. 엔도뉴클레아제는 RuvC_III 도메인을 포함할 수 있으며, 여기서 상기 RuvC_III 도메인은 서열 번호 2253-2481 중 어느 하나에 대해 적어도 약 70% 서열 동일성을 갖는다. 일부 경우에, 엔도뉴클레아제는 RuvC_III 도메인을 포함할 수 있으며, 여기서 RuvC_III 도메인은 서열 번호 2253-2481 중 어느 하나에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 동일성을 갖는다. 일부 경우에, 엔도뉴클레아제는 서열 번호 2253-2481 중 어느 하나에 대해 실질적으로 동일한 RuvC_III 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 2253-2481 중 어느 하나에 대해 적어도 약 70% 서열 동일성을 갖는 RuvC_III 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 2253-2481 중 어느 하나에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 동일성을 갖는 RuvC_III 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 2253-2481 중 어느 하나에 대해 실질적으로 동일한 RuvC_III 도메인을 포함할 수 있다.
엔도뉴클레아제는 서열 번호 4067-4295 중 어느 하나에 대해 적어도 약 70% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 4067-4295 중 어느 하나에 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 4067-4295 중 어느 하나에 대해 실질적으로 동일한 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 4067-4295 중 어느 하나에 대해 적어도 약 70% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 4067-4295 중 어느 하나에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 4067-4295 중 어느 하나에 대해 실질적으로 동일한 HNH 도메인을 포함할 수 있다.
일부 경우에, 엔도뉴클레아제는 서열 번호 432-660 중 어느 하나에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체를 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 432-660 중 어느 하나에 대해 실질적으로 동일할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 432-660 중 어느 하나에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체를 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 432-660 중 어느 하나에 실질적으로 동일할 수 있다.
일부 경우에, 엔도뉴클레아제는 하나 이상의 핵 국소화 서열(NLS)을 갖는 변이체를 포함할 수 있다. NLS는 상기 엔도뉴클레아제의 N- 또는 C-말단에 근접할 수 있다. NLS는 서열 번호 432-660 중 어느 하나, 또는 서열 번호 432-660 중 어느 하나에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체의 N-말단 또는 C-말단에 첨부될 수 있다. NLS는 SV40 대형 T 항원 NLS일 수 있다. NLS는 c-myc NLS일 수 있다. NLS는 서열 번호 5593-5608 중 어느 하나에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 99% 동일성을 갖는 서열을 포함할 수 있다. NLS는 서열 번호 5593-5608 중 어느 하나에 대해 실질적으로 동일한 서열을 포함할 수 있다. NLS는 표 1의 임의의 서열 또는 이들의 조합을 포함할 수 있다.
일부 경우에, 서열 동일성은 스미스-워터맨 상동성 검색 알고리즘의 매개변수를 사용하여 BLASTP, CLUSTALW, MUSCLE, MAFFT, Novafold, 또는 CLUSTALW에 의해 결정될 수 있다. 서열 동일성은 단어 길이(W) 3, 기대치(E) 10의 매개변수를 사용하고, 존재 11, 확장 1에서 갭 비용을 설정하는 BLOSUM62 스코어링 매트릭스를 사용하고, 조건부 구성 스코어 매트릭스 조정을 사용하는 BLASTP 알고리즘에 의해 결정될 수 있다.
일부 경우에, 상기 시스템은 (b) 원하는 절단 서열에 상보적인 5' 표적화 영역을 보유하는 엔도뉴클레아제와 복합체를 형성할 수 있는 적어도 하나의 조작된 합성 가이드 리보핵산(sgRNA)을 포함할 수 있다. 일부 경우에, 5' 표적화 영역은 엔도뉴클레아제와 호환되는 PAM 서열을 포함할 수 있다. 일부 경우에, 표적화 영역의 가장 5' 뉴클레오티드는 G일 수 있다. 일부 경우에, 5' 표적화 영역은 15-23 뉴클레오티드 길이일 수 있다. 가이드 서열 및 tracr 서열은 별도의 리보핵산(RNA) 또는 단일 리보핵산(RNA)으로서 공급될 수 있다. 가이드 RNA는 표적화 영역 3'에 crRNA tracrRNA 결합 서열을 포함할 수 있다. 가이드 RNA는 crRNA tracrRNA 결합 영역 3'에 4-뉴클레오티드 링커가 선행하는 tracrRNA 서열을 포함할 수 있다. sgRNA는 5'에서 3'으로 세포에서 표적 서열에 혼성화할 수 있는 비천연 가이드 핵산 서열; 및 tracr 서열을 포함할 수 있다. 일부 경우에, 비천연 가이드 핵산 서열 및 tracr 서열은 공유적으로 연결된다.
일부 경우에, tracr 서열은 특정 서열을 가질 수 있다. tracr 서열은 천연 tracrRNA 서열의 적어도 약 60-100(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 적어도 약 80% 서열 동일성을 가질 수 있다. tracr 서열은 서열 번호 5503의 적어도 약 60-100(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 적어도 약 80% 서열 동일성을 가질 수 있다. 일부 경우에, tracrRNA는 서열 번호 5503의 적어도 약 60-90(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 가질 수 있다. 일부 경우에, tracrRNA는 서열 번호 5503의 적어도 약 60-100(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 실질적으로 동일할 수 있다. tracrRNA는 서열 번호 5503을 포함할 수 있다.
일부 경우에, 엔도뉴클레아제와 복합체를 형성할 수 있는 적어도 하나의 조작된 합성 가이드 리보핵산(sgRNA)은 서열 번호 5468에 대해 적어도 약 80% 동일성을 갖는 서열을 포함할 수 있다. sgRNA는 서열 번호 5468에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 서열을 포함할 수 있다. sgRNA는 서열 번호 5468에 대해 실질적으로 동일한 서열을 포함할 수 있다.
일부 경우에, 상기 시스템은 표적 DNA 유전자좌에서 절단을 위한 제1 영역 및 제2 영역을 표적화하는 2개의 상이한 sgRNA를 포함할 수 있으며, 여기서 제2 영역은 제1 영역에 대해 3'에 있다. 일부 경우에, 상기 시스템은 5'에서 3'으로 다음을 포함하는 단일 또는 이중 가닥 DNA 복구 주형을 포함할 수 있다: 제1 영역의 5'에 적어도 약 20(예를 들어, 적어도 약 40, 80, 120, 150, 200, 300, 500, 또는 1kb) 뉴클레오티드의 서열을 포함하는 제1 상동성 아암, 적어도 약 10 뉴클레오티드의 합성 DNA 서열, 및 제2 영역의 3'에 적어도 약 20(예를 들어, 적어도 약 40, 80, 120, 150, 200, 300, 500, 또는 1kb) 뉴클레오티드의 서열을 포함하는 제2 상동성 아암.
또 다른 측면에서, 본 개시 내용은 관심의 표적 핵산 유전자좌를 변형시키는 방법을 제공한다. 방법은 본원에 개시된 효소 및 적어도 하나의 합성 가이드 RNA(sgRNA)를 포함하는 본원에 개시된 임의의 비천연 시스템을 표적 핵산 유전자좌에 전달하는 단계를 포함할 수 있다. 효소는 적어도 하나의 sgRNA와 복합체를 형성할 수 있고, 복합체가 관심의 표적 핵산 유전자좌에 결합할 때 관심의 표적 핵산 유전자좌를 변형시킬 수 있다. 상기 유전자좌에 효소를 전달하는 단계는 시스템 또는 시스템을 코딩하는 핵산으로 세포를 형질감염시키는 단계를 포함할 수 있다. 상기 유전자좌에 뉴클레아제를 전달하는 단계는 시스템 또는 시스템을 코딩하는 핵산으로 세포를 전기천공하는 단계를 포함할 수 있다. 상기 유전자좌에 뉴클레아제를 전달하는 단계는 관심의 유전자좌를 포함하는 핵산과 함께 완충액에서 시스템을 인큐베이션하는 단계를 포함할 수 있다. 일부 경우에, 표적 핵산 유전자좌는 데옥시리보핵산(DNA) 또는 리보핵산(RNA)을 포함한다. 표적 핵산 유전자좌는 게놈 DNA, 바이러스 DNA, 바이러스 RNA, 또는 박테리아 DNA를 포함할 수 있다. 표적 핵산 유전자좌는 세포 내에 있을 수 있다. 표적 핵산 유전자좌는 시험관 내에 있을 수 있다. 표적 핵산 유전자좌는 진핵생물 세포 또는 원핵생물 세포 내에 있을 수 있다. 세포는 동물 세포, 인간 세포, 박테리아 세포, 고세균 세포, 또는 식물 세포일 수 있다. 효소는 관심의 표적 유전자좌에서 또는 그 근위에서 단일 또는 이중 가닥 파손을 유도할 수 있다.
표적 핵산 유전자좌가 세포 내에 있을 수 있는 경우, 효소는 서열 번호 2253-2481 중 어느 하나에 대해 적어도 약 75%(예를 들어, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%) 동일성을 갖는 RuvC_III 도메인을 갖는 효소를 코딩하는 오픈 리딩 프레임을 함유하는 핵산으로서 공급될 수 있다. 일부 경우에, 핵산은 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임이 작동가능하게 연결된 프로모터를 포함한다. 프로모터는 CMV, EF1a, SV40, PGK1, Ubc, 인간 베타 액틴, CAG, TRE, 또는 CaMKIIa 프로모터일 수 있다. 엔도뉴클레아제는 상기 엔도뉴클레아제를 코딩하는 상기 오픈 리딩 프레임을 함유하는 캡핑된 mRNA로서 공급될 수 있다. 엔도뉴클레아제는 번역된 폴리펩티드로서 공급될 수 있다. 적어도 하나의 조작된 sgRNA는 리보핵산(RNA) pol III 프로모터에 작동가능하게 연결된 상기 적어도 하나의 조작된 sgRNA를 코딩하는 유전자 서열을 함유하는 데옥시리보핵산(DNA)으로서 공급될 수 있다. 일부 경우에, 유기체는 진핵생물일 수 있다. 일부 경우에, 유기체는 진균일 수 있다. 일부 경우에, 유기체는 인간일 수 있다.
MG6 효소
한 측면에서, 본 개시 내용은 (a) 엔도뉴클레아제를 포함하는 조작된 뉴클레아제 시스템을 제공한다. 일부 경우에, 엔도뉴클레아제는 Cas 엔도뉴클레아제이다. 일부 경우에, 엔도뉴클레아제는 II형, 클래스 II Cas 엔도뉴클레아제이다. 엔도뉴클레아제는 RuvC_III 도메인을 포함할 수 있으며, 여기서 상기 RuvC_III 도메인은 서열 번호 2482-2489 중 어느 하나에 대해 적어도 약 70% 서열 동일성을 갖는다. 일부 경우에, 엔도뉴클레아제는 RuvC_III 도메인을 포함할 수 있으며, 여기서 RuvC_III 도메인은 서열 번호 2482-2489 중 어느 하나에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 동일성을 갖는다. 일부 경우에, 엔도뉴클레아제는 서열 번호 2482-2489 중 어느 하나에 대해 실질적으로 동일한 RuvC_III 도메인을 포함할 수 있다.
엔도뉴클레아제는 서열 번호 4296-4303 중 어느 하나에 대해 적어도 약 70% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 4296-4303 중 어느 하나에 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 4056-4066 중 어느 하나에 대해 실질적으로 동일한 HNH 도메인을 포함할 수 있다.
일부 경우에, 엔도뉴클레아제는 서열 번호 661-668 중 어느 하나에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체를 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 661-668 중 어느 하나에 대해 실질적으로 동일할 수 있다.
일부 경우에, 엔도뉴클레아제는 하나 이상의 핵 국소화 서열(NLS)을 갖는 변이체를 포함할 수 있다. NLS는 상기 엔도뉴클레아제의 N- 또는 C-말단에 근접할 수 있다. NLS는 서열 번호 661-668 중 어느 하나, 또는 서열 번호 661-668 중 어느 하나에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체의 N-말단 또는 C-말단에 첨부될 수 있다. NLS는 SV40 대형 T 항원 NLS일 수 있다. NLS는 c-myc NLS일 수 있다. NLS는 서열 번호 5593-5608 중 어느 하나에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 99% 동일성을 갖는 서열을 포함할 수 있다. NLS는 서열 번호 5593-5608 중 어느 하나에 대해 실질적으로 동일한 서열을 포함할 수 있다. NLS는 표 1의 임의의 서열 또는 이들의 조합을 포함할 수 있다.
일부 경우에, 서열 동일성은 스미스-워터맨 상동성 검색 알고리즘의 매개변수를 사용하여 BLASTP, CLUSTALW, MUSCLE, MAFFT, Novafold, 또는 CLUSTALW에 의해 결정될 수 있다. 서열 동일성은 단어 길이(W) 3, 기대치(E) 10의 매개변수를 사용하고, 존재 11, 확장 1에서 갭 비용을 설정하는 BLOSUM62 스코어링 매트릭스를 사용하고, 조건부 구성 스코어 매트릭스 조정을 사용하는 BLASTP 알고리즘에 의해 결정될 수 있다.
일부 경우에, 상기 시스템은 (b) 원하는 절단 서열에 상보적인 5' 표적화 영역을 보유하는 엔도뉴클레아제와 복합체를 형성할 수 있는 적어도 하나의 조작된 합성 가이드 리보핵산(sgRNA)을 포함할 수 있다. 일부 경우에, 5' 표적화 영역은 엔도뉴클레아제와 호환되는 PAM 서열을 포함할 수 있다. 일부 경우에, 표적화 영역의 가장 5' 뉴클레오티드는 G일 수 있다. 일부 경우에, 5' 표적화 영역은 15-23 뉴클레오티드 길이일 수 있다. 가이드 서열 및 tracr 서열은 별도의 리보핵산(RNA) 또는 단일 리보핵산(RNA)으로서 공급될 수 있다. 가이드 RNA는 표적화 영역 3'에 crRNA tracrRNA 결합 서열을 포함할 수 있다. 가이드 RNA는 crRNA tracrRNA 결합 영역 3'에 4-뉴클레오티드 링커가 선행하는 tracrRNA 서열을 포함할 수 있다. sgRNA는 5'에서 3'으로 세포에서 표적 서열에 혼성화할 수 있는 비천연 가이드 핵산 서열; 및 tracr 서열을 포함할 수 있다. 일부 경우에, 비천연 가이드 핵산 서열 및 tracr 서열은 공유적으로 연결된다.
일부 경우에, tracr 서열은 특정 서열을 가질 수 있다. tracr 서열은 천연 tracrRNA 서열의 적어도 약 60-100(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 적어도 약 80% 서열 동일성을 가질 수 있다.
일부 경우에, 상기 시스템은 표적 DNA 유전자좌에서 절단을 위한 제1 영역 및 제2 영역을 표적화하는 2개의 상이한 sgRNA를 포함할 수 있으며, 여기서 제2 영역은 제1 영역에 대해 3'에 있다. 일부 경우에, 상기 시스템은 5'에서 3'으로 다음을 포함하는 단일 또는 이중 가닥 DNA 복구 주형을 포함할 수 있다: 제1 영역의 5'에 적어도 약 20(예를 들어, 적어도 약 40, 80, 120, 150, 200, 300, 500, 또는 1kb) 뉴클레오티드의 서열을 포함하는 제1 상동성 아암, 적어도 약 10 뉴클레오티드의 합성 DNA 서열, 및 제2 영역의 3'에 적어도 약 20(예를 들어, 적어도 약 40, 80, 120, 150, 200, 300, 500, 또는 1kb) 뉴클레오티드의 서열을 포함하는 제2 상동성 아암.
또 다른 측면에서, 본 개시 내용은 관심의 표적 핵산 유전자좌를 변형시키는 방법을 제공한다. 방법은 본원에 개시된 효소 및 적어도 하나의 합성 가이드 RNA(sgRNA)를 포함하는 본원에 개시된 임의의 비천연 시스템을 표적 핵산 유전자좌에 전달하는 단계를 포함할 수 있다. 효소는 적어도 하나의 sgRNA와 복합체를 형성할 수 있고, 복합체가 관심의 표적 핵산 유전자좌에 결합할 때 관심의 표적 핵산 유전자좌를 변형시킬 수 있다. 상기 유전자좌에 효소를 전달하는 단계는 시스템 또는 시스템을 코딩하는 핵산으로 세포를 형질감염시키는 단계를 포함할 수 있다. 상기 유전자좌에 뉴클레아제를 전달하는 단계는 시스템 또는 시스템을 코딩하는 핵산으로 세포를 전기천공하는 단계를 포함할 수 있다. 상기 유전자좌에 뉴클레아제를 전달하는 단계는 관심의 유전자좌를 포함하는 핵산과 함께 완충액에서 시스템을 인큐베이션하는 단계를 포함할 수 있다. 일부 경우에, 표적 핵산 유전자좌는 데옥시리보핵산(DNA) 또는 리보핵산(RNA)을 포함한다. 표적 핵산 유전자좌는 게놈 DNA, 바이러스 DNA, 바이러스 RNA, 또는 박테리아 DNA를 포함할 수 있다. 표적 핵산 유전자좌는 세포 내에 있을 수 있다. 표적 핵산 유전자좌는 시험관 내에 있을 수 있다. 표적 핵산 유전자좌는 진핵생물 세포 또는 원핵생물 세포 내에 있을 수 있다. 세포는 동물 세포, 인간 세포, 박테리아 세포, 고세균 세포, 또는 식물 세포일 수 있다. 효소는 관심의 표적 유전자좌에서 또는 그 근위에서 단일 또는 이중 가닥 파손을 유도할 수 있다.
표적 핵산 유전자좌가 세포 내에 있을 수 있는 경우, 효소는 서열 번호 2482-2289 중 어느 하나에 대해 적어도 약 75%(예를 들어, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%) 동일성을 갖는 RuvC_III 도메인을 갖는 효소를 코딩하는 오픈 리딩 프레임을 함유하는 핵산으로서 공급될 수 있다. 일부 경우에, 핵산은 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임이 작동가능하게 연결된 프로모터를 포함한다. 프로모터는 CMV, EF1a, SV40, PGK1, Ubc, 인간 베타 액틴, CAG, TRE, 또는 CaMKIIa 프로모터일 수 있다. 엔도뉴클레아제는 상기 엔도뉴클레아제를 코딩하는 상기 오픈 리딩 프레임을 함유하는 캡핑된 mRNA로서 공급될 수 있다. 엔도뉴클레아제는 번역된 폴리펩티드로서 공급될 수 있다. 적어도 하나의 조작된 sgRNA는 리보핵산(RNA) pol III 프로모터에 작동가능하게 연결된 상기 적어도 하나의 조작된 sgRNA를 코딩하는 유전자 서열을 함유하는 데옥시리보핵산(DNA)으로서 공급될 수 있다. 일부 경우에, 유기체는 진핵생물일 수 있다. 일부 경우에, 유기체는 진균일 수 있다. 일부 경우에, 유기체는 인간일 수 있다.
MG7 효소
한 측면에서, 본 개시 내용은 (a) 엔도뉴클레아제를 포함하는 조작된 뉴클레아제 시스템을 제공한다. 일부 경우에, 엔도뉴클레아제는 Cas 엔도뉴클레아제이다. 일부 경우에, 엔도뉴클레아제는 II형, 클래스 II Cas 엔도뉴클레아제이다. 엔도뉴클레아제는 RuvC_III 도메인을 포함할 수 있으며, 여기서 상기 RuvC_III 도메인은 서열 번호 2490-2498 중 어느 하나에 대해 적어도 약 70% 서열 동일성을 갖는다. 일부 경우에, 엔도뉴클레아제는 RuvC_III 도메인을 포함할 수 있으며, 여기서 RuvC_III 도메인은 서열 번호 2490-2498 중 어느 하나에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 동일성을 갖는다. 일부 경우에, 엔도뉴클레아제는 서열 번호 2490-2498 중 어느 하나에 대해 실질적으로 동일한 RuvC_III 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 2490-2498 중 어느 하나에 대해 적어도 약 70% 서열 동일성을 갖는 RuvC_III 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 2490-2498 중 어느 하나에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 동일성을 갖는 RuvC_III 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 2490-2498 중 어느 하나에 대해 실질적으로 동일한 RuvC_III 도메인을 포함할 수 있다.
엔도뉴클레아제는 서열 번호 4304-4312 중 어느 하나에 대해 적어도 약 70% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 4304-4312 중 어느 하나에 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 4304-4312 중 어느 하나에 대해 실질적으로 동일한 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 4304-4312 중 어느 하나에 대해 적어도 약 70% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 4304-4312 중 어느 하나에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 4304-4312 중 어느 하나에 대해 실질적으로 동일한 HNH 도메인을 포함할 수 있다.
일부 경우에, 엔도뉴클레아제는 서열 번호 669-677 중 어느 하나에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체를 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 669-677 중 어느 하나에 대해 실질적으로 동일할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 669-677 중 어느 하나에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체를 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 669-677 중 어느 하나에 실질적으로 동일할 수 있다.
일부 경우에, 엔도뉴클레아제는 하나 이상의 핵 국소화 서열(NLS)을 갖는 변이체를 포함할 수 있다. NLS는 상기 엔도뉴클레아제의 N- 또는 C-말단에 근접할 수 있다. NLS는 서열 번호 669-677 중 어느 하나, 또는 서열 번호 669-677 중 어느 하나에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체의 N-말단 또는 C-말단에 첨부될 수 있다. NLS는 SV40 대형 T 항원 NLS일 수 있다. NLS는 c-myc NLS일 수 있다. NLS는 서열 번호 5593-5608 중 어느 하나에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 99% 동일성을 갖는 서열을 포함할 수 있다. NLS는 서열 번호 5593-5608 중 어느 하나에 대해 실질적으로 동일한 서열을 포함할 수 있다. NLS는 표 1의 임의의 서열 또는 이들의 조합을 포함할 수 있다.
일부 경우에, 서열 동일성은 스미스-워터맨 상동성 검색 알고리즘의 매개변수를 사용하여 BLASTP, CLUSTALW, MUSCLE, MAFFT, Novafold, 또는 CLUSTALW에 의해 결정될 수 있다. 서열 동일성은 단어 길이(W) 3, 기대치(E) 10의 매개변수를 사용하고, 존재 11, 확장 1에서 갭 비용을 설정하는 BLOSUM62 스코어링 매트릭스를 사용하고, 조건부 구성 스코어 매트릭스 조정을 사용하는 BLASTP 알고리즘에 의해 결정될 수 있다.
일부 경우에, 상기 시스템은 (b) 원하는 절단 서열에 상보적인 5' 표적화 영역을 보유하는 엔도뉴클레아제와 복합체를 형성할 수 있는 적어도 하나의 조작된 합성 가이드 리보핵산(sgRNA)을 포함할 수 있다. 일부 경우에, 5' 표적화 영역은 엔도뉴클레아제와 호환되는 PAM 서열을 포함할 수 있다. 일부 경우에, 표적화 영역의 가장 5' 뉴클레오티드는 G일 수 있다. 일부 경우에, 5' 표적화 영역은 15-23 뉴클레오티드 길이일 수 있다. 가이드 서열 및 tracr 서열은 별도의 리보핵산(RNA) 또는 단일 리보핵산(RNA)으로서 공급될 수 있다. 가이드 RNA는 표적화 영역 3'에 crRNA tracrRNA 결합 서열을 포함할 수 있다. 가이드 RNA는 crRNA tracrRNA 결합 영역 3'에 4-뉴클레오티드 링커가 선행하는 tracrRNA 서열을 포함할 수 있다. sgRNA는 5'에서 3'으로 세포에서 표적 서열에 혼성화할 수 있는 비천연 가이드 핵산 서열; 및 tracr 서열을 포함할 수 있다. 일부 경우에, 비천연 가이드 핵산 서열 및 tracr 서열은 공유적으로 연결된다.
일부 경우에, tracr 서열은 특정 서열을 가질 수 있다. tracr 서열은 천연 tracrRNA 서열의 적어도 약 60-100(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 적어도 약 80% 서열 동일성을 가질 수 있다. tracr 서열은 서열 번호 5504의 적어도 약 60-100(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 적어도 약 80% 서열 동일성을 가질 수 있다. 일부 경우에, tracrRNA는 서열 번호 5504의 적어도 약 60-90(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 가질 수 있다. 일부 경우에, tracrRNA는 서열 번호 5504의 적어도 약 60-100(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 실질적으로 동일할 수 있다. tracrRNA는 서열 번호 5504를 포함할 수 있다.
일부 경우에, 상기 시스템은 표적 DNA 유전자좌에서 절단을 위한 제1 영역 및 제2 영역을 표적화하는 2개의 상이한 sgRNA를 포함할 수 있으며, 여기서 제2 영역은 제1 영역에 대해 3'에 있다. 일부 경우에, 상기 시스템은 5'에서 3'으로 다음을 포함하는 단일 또는 이중 가닥 DNA 복구 주형을 포함할 수 있다: 제1 영역의 5'에 적어도 약 20(예를 들어, 적어도 약 40, 80, 120, 150, 200, 300, 500, 또는 1kb) 뉴클레오티드의 서열을 포함하는 제1 상동성 아암, 적어도 약 10 뉴클레오티드의 합성 DNA 서열, 및 제2 영역의 3'에 적어도 약 20(예를 들어, 적어도 약 40, 80, 120, 150, 200, 300, 500, 또는 1kb) 뉴클레오티드의 서열을 포함하는 제2 상동성 아암.
또 다른 측면에서, 본 개시 내용은 관심의 표적 핵산 유전자좌를 변형시키는 방법을 제공한다. 방법은 본원에 개시된 효소 및 적어도 하나의 합성 가이드 RNA(sgRNA)를 포함하는 본원에 개시된 임의의 비천연 시스템을 표적 핵산 유전자좌에 전달하는 단계를 포함할 수 있다. 효소는 적어도 하나의 sgRNA와 복합체를 형성할 수 있고, 복합체가 관심의 표적 핵산 유전자좌에 결합할 때 관심의 표적 핵산 유전자좌를 변형시킬 수 있다. 상기 유전자좌에 효소를 전달하는 단계는 시스템 또는 시스템을 코딩하는 핵산으로 세포를 형질감염시키는 단계를 포함할 수 있다. 상기 유전자좌에 뉴클레아제를 전달하는 단계는 시스템 또는 시스템을 코딩하는 핵산으로 세포를 전기천공하는 단계를 포함할 수 있다. 상기 유전자좌에 뉴클레아제를 전달하는 단계는 관심의 유전자좌를 포함하는 핵산과 함께 완충액에서 시스템을 인큐베이션하는 단계를 포함할 수 있다. 일부 경우에, 표적 핵산 유전자좌는 데옥시리보핵산(DNA) 또는 리보핵산(RNA)을 포함한다. 표적 핵산 유전자좌는 게놈 DNA, 바이러스 DNA, 바이러스 RNA, 또는 박테리아 DNA를 포함할 수 있다. 표적 핵산 유전자좌는 세포 내에 있을 수 있다. 표적 핵산 유전자좌는 시험관 내에 있을 수 있다. 표적 핵산 유전자좌는 진핵생물 세포 또는 원핵생물 세포 내에 있을 수 있다. 세포는 동물 세포, 인간 세포, 박테리아 세포, 고세균 세포, 또는 식물 세포일 수 있다. 효소는 관심의 표적 유전자좌에서 또는 그 근위에서 단일 또는 이중 가닥 파손을 유도할 수 있다.
표적 핵산 유전자좌가 세포 내에 있을 수 있는 경우, 효소는 서열 번호 2490-2498 중 어느 하나에 대해 적어도 약 75%(예를 들어, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%) 동일성을 갖는 RuvC_III 도메인을 갖는 효소를 코딩하는 오픈 리딩 프레임을 함유하는 핵산으로서 공급될 수 있다. 일부 경우에, 핵산은 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임이 작동가능하게 연결된 프로모터를 포함한다. 프로모터는 CMV, EF1a, SV40, PGK1, Ubc, 인간 베타 액틴, CAG, TRE, 또는 CaMKIIa 프로모터일 수 있다. 엔도뉴클레아제는 상기 엔도뉴클레아제를 코딩하는 상기 오픈 리딩 프레임을 함유하는 캡핑된 mRNA로서 공급될 수 있다. 엔도뉴클레아제는 번역된 폴리펩티드로서 공급될 수 있다. 적어도 하나의 조작된 sgRNA는 리보핵산(RNA) pol III 프로모터에 작동가능하게 연결된 상기 적어도 하나의 조작된 sgRNA를 코딩하는 유전자 서열을 함유하는 데옥시리보핵산(DNA)으로서 공급될 수 있다. 일부 경우에, 유기체는 진핵생물일 수 있다. 일부 경우에, 유기체는 진균일 수 있다. 일부 경우에, 유기체는 인간일 수 있다.
MG14 효소
한 측면에서, 본 개시 내용은 (a) 엔도뉴클레아제를 포함하는 조작된 뉴클레아제 시스템을 제공한다. 일부 경우에, 엔도뉴클레아제는 Cas 엔도뉴클레아제이다. 일부 경우에, 엔도뉴클레아제는 II형, 클래스 II Cas 엔도뉴클레아제이다. 엔도뉴클레아제는 RuvC_III 도메인을 포함할 수 있으며, 여기서 상기 RuvC_III 도메인은 서열 번호 2499-2750 중 어느 하나에 대해 적어도 약 70% 서열 동일성을 갖는다. 일부 경우에, 엔도뉴클레아제는 RuvC_III 도메인을 포함할 수 있으며, 여기서 RuvC_III 도메인은 서열 번호 2499-2750 중 어느 하나에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 동일성을 갖는다. 일부 경우에, 엔도뉴클레아제는 서열 번호 2499-2750 중 어느 하나에 대해 실질적으로 동일한 RuvC_III 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 2499-2750 중 어느 하나에 대해 적어도 약 70% 서열 동일성을 갖는 RuvC_III 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 2499-2750 중 어느 하나에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 동일성을 갖는 RuvC_III 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 2499-2750 중 어느 하나에 대해 실질적으로 동일한 RuvC_III 도메인을 포함할 수 있다.
엔도뉴클레아제는 서열 번호 4313-4564 중 어느 하나에 대해 적어도 약 70% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 4313-4564 중 어느 하나에 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 4313-4564 중 어느 하나에 대해 실질적으로 동일한 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 4313-4564 중 어느 하나에 대해 적어도 약 70% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 4067-4295 중 어느 하나에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 4313-4564 중 어느 하나에 대해 실질적으로 동일한 HNH 도메인을 포함할 수 있다.
일부 경우에, 엔도뉴클레아제는 서열 번호 678-929 중 어느 하나에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체를 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 678-929 중 어느 하나에 대해 실질적으로 동일할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 678-929 중 어느 하나에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체를 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 678-929 중 어느 하나에 실질적으로 동일할 수 있다.
일부 경우에, 엔도뉴클레아제는 하나 이상의 핵 국소화 서열(NLS)을 갖는 변이체를 포함할 수 있다. NLS는 상기 엔도뉴클레아제의 N- 또는 C-말단에 근접할 수 있다. NLS는 서열 번호 678-929 중 어느 하나, 또는 서열 번호 678-929 중 어느 하나에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체의 N-말단 또는 C-말단에 첨부될 수 있다. NLS는 SV40 대형 T 항원 NLS일 수 있다. NLS는 c-myc NLS일 수 있다. NLS는 서열 번호 5593-5608 중 어느 하나에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 99% 동일성을 갖는 서열을 포함할 수 있다. NLS는 서열 번호 5593-5608 중 어느 하나에 대해 실질적으로 동일한 서열을 포함할 수 있다. NLS는 표 1의 임의의 서열 또는 이들의 조합을 포함할 수 있다.
일부 경우에, 서열 동일성은 스미스-워터맨 상동성 검색 알고리즘의 매개변수를 사용하여 BLASTP, CLUSTALW, MUSCLE, MAFFT, Novafold, 또는 CLUSTALW에 의해 결정될 수 있다. 서열 동일성은 단어 길이(W) 3, 기대치(E) 10의 매개변수를 사용하고, 존재 11, 확장 1에서 갭 비용을 설정하는 BLOSUM62 스코어링 매트릭스를 사용하고, 조건부 구성 스코어 매트릭스 조정을 사용하는 BLASTP 알고리즘에 의해 결정될 수 있다.
일부 경우에, 상기 시스템은 (b) 원하는 절단 서열에 상보적인 5' 표적화 영역을 보유하는 엔도뉴클레아제와 복합체를 형성할 수 있는 적어도 하나의 조작된 합성 가이드 리보핵산(sgRNA)을 포함할 수 있다. 일부 경우에, 5' 표적화 영역은 엔도뉴클레아제와 호환되는 PAM 서열을 포함할 수 있다. 일부 경우에, 표적화 영역의 가장 5' 뉴클레오티드는 G일 수 있다. 일부 경우에, 5' 표적화 영역은 15-23 뉴클레오티드 길이일 수 있다. 가이드 서열 및 tracr 서열은 별도의 리보핵산(RNA) 또는 단일 리보핵산(RNA)으로서 공급될 수 있다. 가이드 RNA는 표적화 영역 3'에 crRNA tracrRNA 결합 서열을 포함할 수 있다. 가이드 RNA는 crRNA tracrRNA 결합 영역 3'에 4-뉴클레오티드 링커가 선행하는 tracrRNA 서열을 포함할 수 있다. sgRNA는 5'에서 3'으로 세포에서 표적 서열에 혼성화할 수 있는 비천연 가이드 핵산 서열; 및 tracr 서열을 포함할 수 있다. 일부 경우에, 비천연 가이드 핵산 서열 및 tracr 서열은 공유적으로 연결된다.
일부 경우에, tracr 서열은 특정 서열을 가질 수 있다. tracr 서열은 천연 tracrRNA 서열의 적어도 약 60-100(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 적어도 약 80% 서열 동일성을 가질 수 있다. tracr 서열은 서열 번호 5505의 적어도 약 60-100(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 적어도 약 80% 서열 동일성을 가질 수 있다. 일부 경우에, tracrRNA는 서열 번호 5505의 적어도 약 60-90(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 가질 수 있다. 일부 경우에, tracrRNA는 서열 번호 5505의 적어도 약 60-100(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 실질적으로 동일할 수 있다. tracrRNA는 서열 번호 5505를 포함할 수 있다.
일부 경우에, 엔도뉴클레아제와 복합체를 형성할 수 있는 적어도 하나의 조작된 합성 가이드 리보핵산(sgRNA)은 서열 번호 5469에 대해 적어도 약 80% 동일성을 갖는 서열을 포함할 수 있다. sgRNA는 서열 번호 5469에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 서열을 포함할 수 있다. sgRNA는 서열 번호 5469에 대해 실질적으로 동일한 서열을 포함할 수 있다.
일부 경우에, 상기 시스템은 표적 DNA 유전자좌에서 절단을 위한 제1 영역 및 제2 영역을 표적화하는 2개의 상이한 sgRNA를 포함할 수 있으며, 여기서 제2 영역은 제1 영역에 대해 3'에 있다. 일부 경우에, 상기 시스템은 5'에서 3'으로 다음을 포함하는 단일 또는 이중 가닥 DNA 복구 주형을 포함할 수 있다: 제1 영역의 5'에 적어도 약 20(예를 들어, 적어도 약 40, 80, 120, 150, 200, 300, 500, 또는 1kb) 뉴클레오티드의 서열을 포함하는 제1 상동성 아암, 적어도 약 10 뉴클레오티드의 합성 DNA 서열, 및 제2 영역의 3'에 적어도 약 20(예를 들어, 적어도 약 40, 80, 120, 150, 200, 300, 500, 또는 1kb) 뉴클레오티드의 서열을 포함하는 제2 상동성 아암.
또 다른 측면에서, 본 개시 내용은 관심의 표적 핵산 유전자좌를 변형시키는 방법을 제공한다. 방법은 본원에 개시된 효소 및 적어도 하나의 합성 가이드 RNA(sgRNA)를 포함하는 본원에 개시된 임의의 비천연 시스템을 표적 핵산 유전자좌에 전달하는 단계를 포함할 수 있다. 효소는 적어도 하나의 sgRNA와 복합체를 형성할 수 있고, 복합체가 관심의 표적 핵산 유전자좌에 결합할 때 관심의 표적 핵산 유전자좌를 변형시킬 수 있다. 상기 유전자좌에 효소를 전달하는 단계는 시스템 또는 시스템을 코딩하는 핵산으로 세포를 형질감염시키는 단계를 포함할 수 있다. 상기 유전자좌에 뉴클레아제를 전달하는 단계는 시스템 또는 시스템을 코딩하는 핵산으로 세포를 전기천공하는 단계를 포함할 수 있다. 상기 유전자좌에 뉴클레아제를 전달하는 단계는 관심의 유전자좌를 포함하는 핵산과 함께 완충액에서 시스템을 인큐베이션하는 단계를 포함할 수 있다. 일부 경우에, 표적 핵산 유전자좌는 데옥시리보핵산(DNA) 또는 리보핵산(RNA)을 포함한다. 표적 핵산 유전자좌는 게놈 DNA, 바이러스 DNA, 바이러스 RNA, 또는 박테리아 DNA를 포함할 수 있다. 표적 핵산 유전자좌는 세포 내에 있을 수 있다. 표적 핵산 유전자좌는 시험관 내에 있을 수 있다. 표적 핵산 유전자좌는 진핵생물 세포 또는 원핵생물 세포 내에 있을 수 있다. 세포는 동물 세포, 인간 세포, 박테리아 세포, 고세균 세포, 또는 식물 세포일 수 있다. 효소는 관심의 표적 유전자좌에서 또는 그 근위에서 단일 또는 이중 가닥 파손을 유도할 수 있다.
표적 핵산 유전자좌가 세포 내에 있을 수 있는 경우, 효소는 서열 번호 2499-2750 중 어느 하나에 대해 적어도 약 75%(예를 들어, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%) 동일성을 갖는 RuvC_III 도메인을 갖는 효소를 코딩하는 오픈 리딩 프레임을 함유하는 핵산으로서 공급될 수 있다. 상기 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임을 함유하는 데옥시리보핵산(DNA)은 서열 번호 5581 또는 서열 번호 5581에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체에 대해 실질적으로 동일한 서열을 포함할 수 있다. 일부 경우에, 핵산은 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임이 작동가능하게 연결된 프로모터를 포함한다. 프로모터는 CMV, EF1a, SV40, PGK1, Ubc, 인간 베타 액틴, CAG, TRE, 또는 CaMKIIa 프로모터일 수 있다. 엔도뉴클레아제는 상기 엔도뉴클레아제를 코딩하는 상기 오픈 리딩 프레임을 함유하는 캡핑된 mRNA로서 공급될 수 있다. 엔도뉴클레아제는 번역된 폴리펩티드로서 공급될 수 있다. 적어도 하나의 조작된 sgRNA는 리보핵산(RNA) pol III 프로모터에 작동가능하게 연결된 상기 적어도 하나의 조작된 sgRNA를 코딩하는 유전자 서열을 함유하는 데옥시리보핵산(DNA)으로서 공급될 수 있다. 일부 경우에, 유기체는 진핵생물일 수 있다. 일부 경우에, 유기체는 진균일 수 있다. 일부 경우에, 유기체는 인간일 수 있다.
MG15 효소
한 측면에서, 본 개시 내용은 (a) 엔도뉴클레아제를 포함하는 조작된 뉴클레아제 시스템을 제공한다. 일부 경우에, 엔도뉴클레아제는 Cas 엔도뉴클레아제이다. 일부 경우에, 엔도뉴클레아제는 II형, 클래스 II Cas 엔도뉴클레아제이다. 엔도뉴클레아제는 RuvC_III 도메인을 포함할 수 있으며, 여기서 상기 RuvC_III 도메인은 서열 번호 2751-2913 중 어느 하나에 대해 적어도 약 70% 서열 동일성을 갖는다. 일부 경우에, 엔도뉴클레아제는 RuvC_III 도메인을 포함할 수 있으며, 여기서 RuvC_III 도메인은 서열 번호 2751-2913 중 어느 하나에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 동일성을 갖는다. 일부 경우에, 엔도뉴클레아제는 서열 번호 2751-2913 중 어느 하나에 대해 실질적으로 동일한 RuvC_III 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 2751-2913 중 어느 하나에 대해 적어도 약 70% 서열 동일성을 갖는 RuvC_III 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 2751-2913 중 어느 하나에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 동일성을 갖는 RuvC_III 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 2751-2913 중 어느 하나에 대해 실질적으로 동일한 RuvC_III 도메인을 포함할 수 있다.
엔도뉴클레아제는 서열 번호 4565-4727 중 어느 하나에 대해 적어도 약 70% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 4565-4727 중 어느 하나에 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 4565-4727 중 어느 하나에 대해 실질적으로 동일한 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 4565-4727 중 어느 하나에 대해 적어도 약 70% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 4565-4727 중 어느 하나에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 4565-4727 중 어느 하나에 대해 실질적으로 동일한 HNH 도메인을 포함할 수 있다.
일부 경우에, 엔도뉴클레아제는 서열 번호 930-1092 중 어느 하나에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체를 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 930-1092 중 어느 하나에 대해 실질적으로 동일할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 930-1092 중 어느 하나에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체를 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 930-1092 중 어느 하나에 실질적으로 동일할 수 있다.
일부 경우에, 엔도뉴클레아제는 하나 이상의 핵 국소화 서열(NLS)을 갖는 변이체를 포함할 수 있다. NLS는 상기 엔도뉴클레아제의 N- 또는 C-말단에 근접할 수 있다. NLS는 서열 번호 930-1092 중 어느 하나, 또는 서열 번호 930-1092 중 어느 하나에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체의 N-말단 또는 C-말단에 첨부될 수 있다. NLS는 SV40 대형 T 항원 NLS일 수 있다. NLS는 c-myc NLS일 수 있다. NLS는 서열 번호 5593-5608 중 어느 하나에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 99% 동일성을 갖는 서열을 포함할 수 있다. NLS는 서열 번호 5593-5608 중 어느 하나에 대해 실질적으로 동일한 서열을 포함할 수 있다. NLS는 표 1의 임의의 서열 또는 이들의 조합을 포함할 수 있다.
일부 경우에, 서열 동일성은 스미스-워터맨 상동성 검색 알고리즘의 매개변수를 사용하여 BLASTP, CLUSTALW, MUSCLE, MAFFT, Novafold, 또는 CLUSTALW에 의해 결정될 수 있다. 서열 동일성은 단어 길이(W) 3, 기대치(E) 10의 매개변수를 사용하고, 존재 11, 확장 1에서 갭 비용을 설정하는 BLOSUM62 스코어링 매트릭스를 사용하고, 조건부 구성 스코어 매트릭스 조정을 사용하는 BLASTP 알고리즘에 의해 결정될 수 있다.
일부 경우에, 상기 시스템은 (b) 원하는 절단 서열에 상보적인 5' 표적화 영역을 보유하는 엔도뉴클레아제와 복합체를 형성할 수 있는 적어도 하나의 조작된 합성 가이드 리보핵산(sgRNA)을 포함할 수 있다. 일부 경우에, 5' 표적화 영역은 엔도뉴클레아제와 호환되는 PAM 서열을 포함할 수 있다. 일부 경우에, 표적화 영역의 가장 5' 뉴클레오티드는 G일 수 있다. 일부 경우에, 5' 표적화 영역은 15-23 뉴클레오티드 길이일 수 있다. 가이드 서열 및 tracr 서열은 별도의 리보핵산(RNA) 또는 단일 리보핵산(RNA)으로서 공급될 수 있다. 가이드 RNA는 표적화 영역 3'에 crRNA tracrRNA 결합 서열을 포함할 수 있다. 가이드 RNA는 crRNA tracrRNA 결합 영역 3'에 4-뉴클레오티드 링커가 선행하는 tracrRNA 서열을 포함할 수 있다. sgRNA는 5'에서 3'으로 세포에서 표적 서열에 혼성화할 수 있는 비천연 가이드 핵산 서열; 및 tracr 서열을 포함할 수 있다. 일부 경우에, 비천연 가이드 핵산 서열 및 tracr 서열은 공유적으로 연결된다.
일부 경우에, tracr 서열은 특정 서열을 가질 수 있다. tracr 서열은 천연 tracrRNA 서열의 적어도 약 60-100(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 적어도 약 80% 서열 동일성을 가질 수 있다. tracr 서열은 서열 번호 5506의 적어도 약 60-100(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 적어도 약 80% 서열 동일성을 가질 수 있다. 일부 경우에, tracrRNA는 서열 번호 5506의 적어도 약 60-90(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 가질 수 있다. 일부 경우에, tracrRNA는 서열 번호 5506의 적어도 약 60-100(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 실질적으로 동일할 수 있다. tracrRNA는 서열 번호 5506을 포함할 수 있다.
일부 경우에, 엔도뉴클레아제와 복합체를 형성할 수 있는 적어도 하나의 조작된 합성 가이드 리보핵산(sgRNA)은 서열 번호 5470에 대해 적어도 약 80% 동일성을 갖는 서열을 포함할 수 있다. sgRNA는 서열 번호 5470에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 서열을 포함할 수 있다. sgRNA는 서열 번호 5470에 대해 실질적으로 동일한 서열을 포함할 수 있다.
일부 경우에, 상기 시스템은 표적 DNA 유전자좌에서 절단을 위한 제1 영역 및 제2 영역을 표적화하는 2개의 상이한 sgRNA를 포함할 수 있으며, 여기서 제2 영역은 제1 영역에 대해 3'에 있다. 일부 경우에, 상기 시스템은 5'에서 3'으로 다음을 포함하는 단일 또는 이중 가닥 DNA 복구 주형을 포함할 수 있다: 제1 영역의 5'에 적어도 약 20(예를 들어, 적어도 약 40, 80, 120, 150, 200, 300, 500, 또는 1kb) 뉴클레오티드의 서열을 포함하는 제1 상동성 아암, 적어도 약 10 뉴클레오티드의 합성 DNA 서열, 및 제2 영역의 3'에 적어도 약 20(예를 들어, 적어도 약 40, 80, 120, 150, 200, 300, 500, 또는 1kb) 뉴클레오티드의 서열을 포함하는 제2 상동성 아암.
또 다른 측면에서, 본 개시 내용은 관심의 표적 핵산 유전자좌를 변형시키는 방법을 제공한다. 방법은 본원에 개시된 효소 및 적어도 하나의 합성 가이드 RNA(sgRNA)를 포함하는 본원에 개시된 임의의 비천연 시스템을 표적 핵산 유전자좌에 전달하는 단계를 포함할 수 있다. 효소는 적어도 하나의 sgRNA와 복합체를 형성할 수 있고, 복합체가 관심의 표적 핵산 유전자좌에 결합할 때 관심의 표적 핵산 유전자좌를 변형시킬 수 있다. 상기 유전자좌에 효소를 전달하는 단계는 시스템 또는 시스템을 코딩하는 핵산으로 세포를 형질감염시키는 단계를 포함할 수 있다. 상기 유전자좌에 뉴클레아제를 전달하는 단계는 시스템 또는 시스템을 코딩하는 핵산으로 세포를 전기천공하는 단계를 포함할 수 있다. 상기 유전자좌에 뉴클레아제를 전달하는 단계는 관심의 유전자좌를 포함하는 핵산과 함께 완충액에서 시스템을 인큐베이션하는 단계를 포함할 수 있다. 일부 경우에, 표적 핵산 유전자좌는 데옥시리보핵산(DNA) 또는 리보핵산(RNA)을 포함한다. 표적 핵산 유전자좌는 게놈 DNA, 바이러스 DNA, 바이러스 RNA, 또는 박테리아 DNA를 포함할 수 있다. 표적 핵산 유전자좌는 세포 내에 있을 수 있다. 표적 핵산 유전자좌는 시험관 내에 있을 수 있다. 표적 핵산 유전자좌는 진핵생물 세포 또는 원핵생물 세포 내에 있을 수 있다. 세포는 동물 세포, 인간 세포, 박테리아 세포, 고세균 세포, 또는 식물 세포일 수 있다. 효소는 관심의 표적 유전자좌에서 또는 그 근위에서 단일 또는 이중 가닥 파손을 유도할 수 있다.
표적 핵산 유전자좌가 세포 내에 있을 수 있는 경우, 효소는 서열 번호 2751-2913 중 어느 하나에 대해 적어도 약 75%(예를 들어, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%) 동일성을 갖는 RuvC_III 도메인을 갖는 효소를 코딩하는 오픈 리딩 프레임을 함유하는 핵산으로서 공급될 수 있다. 상기 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임을 함유하는 데옥시리보핵산(DNA)은 서열 번호 5582 또는 서열 번호 5582에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체에 대해 실질적으로 동일한 서열을 포함할 수 있다. 일부 경우에, 핵산은 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임이 작동가능하게 연결된 프로모터를 포함한다. 프로모터는 CMV, EF1a, SV40, PGK1, Ubc, 인간 베타 액틴, CAG, TRE, 또는 CaMKIIa 프로모터일 수 있다. 엔도뉴클레아제는 상기 엔도뉴클레아제를 코딩하는 상기 오픈 리딩 프레임을 함유하는 캡핑된 mRNA로서 공급될 수 있다. 엔도뉴클레아제는 번역된 폴리펩티드로서 공급될 수 있다. 적어도 하나의 조작된 sgRNA는 리보핵산(RNA) pol III 프로모터에 작동가능하게 연결된 상기 적어도 하나의 조작된 sgRNA를 코딩하는 유전자 서열을 함유하는 데옥시리보핵산(DNA)으로서 공급될 수 있다. 일부 경우에, 유기체는 진핵생물일 수 있다. 일부 경우에, 유기체는 진균일 수 있다. 일부 경우에, 유기체는 인간일 수 있다.
MG16 효소
한 측면에서, 본 개시 내용은 (a) 엔도뉴클레아제를 포함하는 조작된 뉴클레아제 시스템을 제공한다. 일부 경우에, 엔도뉴클레아제는 Cas 엔도뉴클레아제이다. 일부 경우에, 엔도뉴클레아제는 II형, 클래스 II Cas 엔도뉴클레아제이다. 엔도뉴클레아제는 RuvC_III 도메인을 포함할 수 있으며, 여기서 상기 RuvC_III 도메인은 서열 번호 2914-3174 중 어느 하나에 대해 적어도 약 70% 서열 동일성을 갖는다. 일부 경우에, 엔도뉴클레아제는 RuvC_III 도메인을 포함할 수 있으며, 여기서 RuvC_III 도메인은 서열 번호 2914-3174 중 어느 하나에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 동일성을 갖는다. 일부 경우에, 엔도뉴클레아제는 서열 번호 2914-3174 중 어느 하나에 대해 실질적으로 동일한 RuvC_III 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 2914-3174 중 어느 하나에 대해 적어도 약 70% 서열 동일성을 갖는 RuvC_III 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 2914-3174 중 어느 하나에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 동일성을 갖는 RuvC_III 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 2914-3174 중 어느 하나에 대해 실질적으로 동일한 RuvC_III 도메인을 포함할 수 있다.
엔도뉴클레아제는 서열 번호 4728-4988 중 어느 하나에 대해 적어도 약 70% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 4728-4988 중 어느 하나에 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 4728-4988 중 어느 하나에 대해 실질적으로 동일한 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 4728-4988 중 어느 하나에 대해 적어도 약 70% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 4728-4988 중 어느 하나에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 4728-4988 중 어느 하나에 대해 실질적으로 동일한 HNH 도메인을 포함할 수 있다.
일부 경우에, 엔도뉴클레아제는 서열 번호 1093-1353 중 어느 하나에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체를 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 1093-1353 중 어느 하나에 대해 실질적으로 동일할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 1093-1353 중 어느 하나에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체를 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 1093-1353 중 어느 하나에 실질적으로 동일할 수 있다.
일부 경우에, 엔도뉴클레아제는 하나 이상의 핵 국소화 서열(NLS)을 갖는 변이체를 포함할 수 있다. NLS는 상기 엔도뉴클레아제의 N- 또는 C-말단에 근접할 수 있다. NLS는 서열 번호 1093-1353 중 어느 하나, 또는 서열 번호 1093-1353 중 어느 하나에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체의 N-말단 또는 C-말단에 첨부될 수 있다. NLS는 SV40 대형 T 항원 NLS일 수 있다. NLS는 c-myc NLS일 수 있다. NLS는 서열 번호 5593-5608 중 어느 하나에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 99% 동일성을 갖는 서열을 포함할 수 있다. NLS는 서열 번호 5593-5608 중 어느 하나에 대해 실질적으로 동일한 서열을 포함할 수 있다. NLS는 표 1의 임의의 서열 또는 이들의 조합을 포함할 수 있다.
일부 경우에, 서열 동일성은 스미스-워터맨 상동성 검색 알고리즘의 매개변수를 사용하여 BLASTP, CLUSTALW, MUSCLE, MAFFT, Novafold, 또는 CLUSTALW에 의해 결정될 수 있다. 서열 동일성은 단어 길이(W) 3, 기대치(E) 10의 매개변수를 사용하고, 존재 11, 확장 1에서 갭 비용을 설정하는 BLOSUM62 스코어링 매트릭스를 사용하고, 조건부 구성 스코어 매트릭스 조정을 사용하는 BLASTP 알고리즘에 의해 결정될 수 있다.
일부 경우에, 상기 시스템은 (b) 원하는 절단 서열에 상보적인 5' 표적화 영역을 보유하는 엔도뉴클레아제와 복합체를 형성할 수 있는 적어도 하나의 조작된 합성 가이드 리보핵산(sgRNA)을 포함할 수 있다. 일부 경우에, 5' 표적화 영역은 엔도뉴클레아제와 호환되는 PAM 서열을 포함할 수 있다. 일부 경우에, 표적화 영역의 가장 5' 뉴클레오티드는 G일 수 있다. 일부 경우에, 5' 표적화 영역은 15-23 뉴클레오티드 길이일 수 있다. 가이드 서열 및 tracr 서열은 별도의 리보핵산(RNA) 또는 단일 리보핵산(RNA)으로서 공급될 수 있다. 가이드 RNA는 표적화 영역 3'에 crRNA tracrRNA 결합 서열을 포함할 수 있다. 가이드 RNA는 crRNA tracrRNA 결합 영역 3'에 4-뉴클레오티드 링커가 선행하는 tracrRNA 서열을 포함할 수 있다. sgRNA는 5'에서 3'으로 세포에서 표적 서열에 혼성화할 수 있는 비천연 가이드 핵산 서열; 및 tracr 서열을 포함할 수 있다. 일부 경우에, 비천연 가이드 핵산 서열 및 tracr 서열은 공유적으로 연결된다.
일부 경우에, tracr 서열은 특정 서열을 가질 수 있다. tracr 서열은 천연 tracrRNA 서열의 적어도 약 60-100(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 적어도 약 80% 서열 동일성을 가질 수 있다. tracr 서열은 서열 번호 5507의 적어도 약 60-100(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 적어도 약 80% 서열 동일성을 가질 수 있다. 일부 경우에, tracrRNA는 서열 번호 5507의 적어도 약 60-90(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 가질 수 있다. 일부 경우에, tracrRNA는 서열 번호 5507의 적어도 약 60-100(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 실질적으로 동일할 수 있다. tracrRNA는 서열 번호 5507을 포함할 수 있다.
일부 경우에, 엔도뉴클레아제와 복합체를 형성할 수 있는 적어도 하나의 조작된 합성 가이드 리보핵산(sgRNA)은 서열 번호 5471에 대해 적어도 약 80% 동일성을 갖는 서열을 포함할 수 있다. sgRNA는 서열 번호 5471에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 서열을 포함할 수 있다. sgRNA는 서열 번호 5471에 대해 실질적으로 동일한 서열을 포함할 수 있다.
일부 경우에, 상기 시스템은 표적 DNA 유전자좌에서 절단을 위한 제1 영역 및 제2 영역을 표적화하는 2개의 상이한 sgRNA를 포함할 수 있으며, 여기서 제2 영역은 제1 영역에 대해 3'에 있다. 일부 경우에, 상기 시스템은 5'에서 3'으로 다음을 포함하는 단일 또는 이중 가닥 DNA 복구 주형을 포함할 수 있다: 제1 영역의 5'에 적어도 약 20(예를 들어, 적어도 약 40, 80, 120, 150, 200, 300, 500, 또는 1kb) 뉴클레오티드의 서열을 포함하는 제1 상동성 아암, 적어도 약 10 뉴클레오티드의 합성 DNA 서열, 및 제2 영역의 3'에 적어도 약 20(예를 들어, 적어도 약 40, 80, 120, 150, 200, 300, 500, 또는 1kb) 뉴클레오티드의 서열을 포함하는 제2 상동성 아암.
또 다른 측면에서, 본 개시 내용은 관심의 표적 핵산 유전자좌를 변형시키는 방법을 제공한다. 방법은 본원에 개시된 효소 및 적어도 하나의 합성 가이드 RNA(sgRNA)를 포함하는 본원에 개시된 임의의 비천연 시스템을 표적 핵산 유전자좌에 전달하는 단계를 포함할 수 있다. 효소는 적어도 하나의 sgRNA와 복합체를 형성할 수 있고, 복합체가 관심의 표적 핵산 유전자좌에 결합할 때 관심의 표적 핵산 유전자좌를 변형시킬 수 있다. 상기 유전자좌에 효소를 전달하는 단계는 시스템 또는 시스템을 코딩하는 핵산으로 세포를 형질감염시키는 단계를 포함할 수 있다. 상기 유전자좌에 뉴클레아제를 전달하는 단계는 시스템 또는 시스템을 코딩하는 핵산으로 세포를 전기천공하는 단계를 포함할 수 있다. 상기 유전자좌에 뉴클레아제를 전달하는 단계는 관심의 유전자좌를 포함하는 핵산과 함께 완충액에서 시스템을 인큐베이션하는 단계를 포함할 수 있다. 일부 경우에, 표적 핵산 유전자좌는 데옥시리보핵산(DNA) 또는 리보핵산(RNA)을 포함한다. 표적 핵산 유전자좌는 게놈 DNA, 바이러스 DNA, 바이러스 RNA, 또는 박테리아 DNA를 포함할 수 있다. 표적 핵산 유전자좌는 세포 내에 있을 수 있다. 표적 핵산 유전자좌는 시험관 내에 있을 수 있다. 표적 핵산 유전자좌는 진핵생물 세포 또는 원핵생물 세포 내에 있을 수 있다. 세포는 동물 세포, 인간 세포, 박테리아 세포, 고세균 세포, 또는 식물 세포일 수 있다. 효소는 관심의 표적 유전자좌에서 또는 그 근위에서 단일 또는 이중 가닥 파손을 유도할 수 있다.
표적 핵산 유전자좌가 세포 내에 있을 수 있는 경우, 효소는 서열 번호 2914-3174 중 어느 하나에 대해 적어도 약 75%(예를 들어, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%) 동일성을 갖는 RuvC_III 도메인을 갖는 효소를 코딩하는 오픈 리딩 프레임을 함유하는 핵산으로서 공급될 수 있다. 상기 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임을 함유하는 데옥시리보핵산(DNA)은 서열 번호 5583 또는 서열 번호 5583에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체에 대해 실질적으로 동일한 서열을 포함할 수 있다. 일부 경우에, 핵산은 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임이 작동가능하게 연결된 프로모터를 포함한다. 프로모터는 CMV, EF1a, SV40, PGK1, Ubc, 인간 베타 액틴, CAG, TRE, 또는 CaMKIIa 프로모터일 수 있다. 엔도뉴클레아제는 상기 엔도뉴클레아제를 코딩하는 상기 오픈 리딩 프레임을 함유하는 캡핑된 mRNA로서 공급될 수 있다. 엔도뉴클레아제는 번역된 폴리펩티드로서 공급될 수 있다. 적어도 하나의 조작된 sgRNA는 리보핵산(RNA) pol III 프로모터에 작동가능하게 연결된 상기 적어도 하나의 조작된 sgRNA를 코딩하는 유전자 서열을 함유하는 데옥시리보핵산(DNA)으로서 공급될 수 있다. 일부 경우에, 유기체는 진핵생물일 수 있다. 일부 경우에, 유기체는 진균일 수 있다. 일부 경우에, 유기체는 인간일 수 있다.
MG18 효소
한 측면에서, 본 개시 내용은 (a) 엔도뉴클레아제를 포함하는 조작된 뉴클레아제 시스템을 제공한다. 일부 경우에, 엔도뉴클레아제는 Cas 엔도뉴클레아제이다. 일부 경우에, 엔도뉴클레아제는 II형, 클래스 II Cas 엔도뉴클레아제이다. 엔도뉴클레아제는 RuvC_III 도메인을 포함할 수 있으며, 여기서 상기 RuvC_III 도메인은 서열 번호 3175-3300 중 어느 하나에 대해 적어도 약 70% 서열 동일성을 갖는다. 일부 경우에, 엔도뉴클레아제는 RuvC_III 도메인을 포함할 수 있으며, 여기서 RuvC_III 도메인은 서열 번호 3175-3300 중 어느 하나에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 동일성을 갖는다. 일부 경우에, 엔도뉴클레아제는 서열 번호 3175-3300 중 어느 하나에 대해 실질적으로 동일한 RuvC_III 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 3175-3300 중 어느 하나에 대해 적어도 약 70% 서열 동일성을 갖는 RuvC_III 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 3175-3300 중 어느 하나에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 동일성을 갖는 RuvC_III 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 3175-3300 중 어느 하나에 대해 실질적으로 동일한 RuvC_III 도메인을 포함할 수 있다.
엔도뉴클레아제는 서열 번호 4989-5146 중 어느 하나에 대해 적어도 약 70% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 4989-5146 중 어느 하나에 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 4989-5146 중 어느 하나에 대해 실질적으로 동일한 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 4989-5146 중 어느 하나에 대해 적어도 약 70% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 4989-5146 중 어느 하나에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 4989-5146 중 어느 하나에 대해 실질적으로 동일한 HNH 도메인을 포함할 수 있다.
일부 경우에, 엔도뉴클레아제는 서열 번호 1354-1511 중 어느 하나에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체를 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 1354-1511 중 어느 하나에 대해 실질적으로 동일할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 1354-1511 중 어느 하나에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체를 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 1354-1511 중 어느 하나에 실질적으로 동일할 수 있다.
일부 경우에, 엔도뉴클레아제는 하나 이상의 핵 국소화 서열(NLS)을 갖는 변이체를 포함할 수 있다. NLS는 상기 엔도뉴클레아제의 N- 또는 C-말단에 근접할 수 있다. NLS는 서열 번호 1354-1511 중 어느 하나, 또는 서열 번호 1354-1511 중 어느 하나에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체의 N-말단 또는 C-말단에 첨부될 수 있다. NLS는 SV40 대형 T 항원 NLS일 수 있다. NLS는 c-myc NLS일 수 있다. NLS는 서열 번호 5593-5608 중 어느 하나에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 99% 동일성을 갖는 서열을 포함할 수 있다. NLS는 서열 번호 5593-5608 중 어느 하나에 대해 실질적으로 동일한 서열을 포함할 수 있다. NLS는 표 1의 임의의 서열 또는 이들의 조합을 포함할 수 있다.
일부 경우에, 서열 동일성은 스미스-워터맨 상동성 검색 알고리즘의 매개변수를 사용하여 BLASTP, CLUSTALW, MUSCLE, MAFFT, Novafold, 또는 CLUSTALW에 의해 결정될 수 있다. 서열 동일성은 단어 길이(W) 3, 기대치(E) 10의 매개변수를 사용하고, 존재 11, 확장 1에서 갭 비용을 설정하는 BLOSUM62 스코어링 매트릭스를 사용하고, 조건부 구성 스코어 매트릭스 조정을 사용하는 BLASTP 알고리즘에 의해 결정될 수 있다.
일부 경우에, 상기 시스템은 (b) 원하는 절단 서열에 상보적인 5' 표적화 영역을 보유하는 엔도뉴클레아제와 복합체를 형성할 수 있는 적어도 하나의 조작된 합성 가이드 리보핵산(sgRNA)을 포함할 수 있다. 일부 경우에, 5' 표적화 영역은 엔도뉴클레아제와 호환되는 PAM 서열을 포함할 수 있다. 일부 경우에, 표적화 영역의 가장 5' 뉴클레오티드는 G일 수 있다. 일부 경우에, 5' 표적화 영역은 15-23 뉴클레오티드 길이일 수 있다. 가이드 서열 및 tracr 서열은 별도의 리보핵산(RNA) 또는 단일 리보핵산(RNA)으로서 공급될 수 있다. 가이드 RNA는 표적화 영역 3'에 crRNA tracrRNA 결합 서열을 포함할 수 있다. 가이드 RNA는 crRNA tracrRNA 결합 영역 3'에 4-뉴클레오티드 링커가 선행하는 tracrRNA 서열을 포함할 수 있다. sgRNA는 5'에서 3'으로 세포에서 표적 서열에 혼성화할 수 있는 비천연 가이드 핵산 서열; 및 tracr 서열을 포함할 수 있다. 일부 경우에, 비천연 가이드 핵산 서열 및 tracr 서열은 공유적으로 연결된다.
일부 경우에, tracr 서열은 특정 서열을 가질 수 있다. tracr 서열은 천연 tracrRNA 서열의 적어도 약 60-100(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 적어도 약 80% 서열 동일성을 가질 수 있다. tracr 서열은 서열 번호 5508 의 적어도 약 60-100(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 적어도 약 80% 서열 동일성을 가질 수 있다. 일부 경우에, tracrRNA는 서열 번호 5508의 적어도 약 60-90(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 가질 수 있다. 일부 경우에, tracrRNA는 서열 번호 5508의 적어도 약 60-100(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 실질적으로 동일할 수 있다. tracrRNA는 서열 번호 5508을 포함할 수 있다.
일부 경우에, 엔도뉴클레아제와 복합체를 형성할 수 있는 적어도 하나의 조작된 합성 가이드 리보핵산(sgRNA)은 서열 번호 5472에 대해 적어도 약 80% 동일성을 갖는 서열을 포함할 수 있다. sgRNA는 서열 번호 5472에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 서열을 포함할 수 있다. sgRNA는 서열 번호 5472에 대해 실질적으로 동일한 서열을 포함할 수 있다.
일부 경우에, 상기 시스템은 표적 DNA 유전자좌에서 절단을 위한 제1 영역 및 제2 영역을 표적화하는 2개의 상이한 sgRNA를 포함할 수 있으며, 여기서 제2 영역은 제1 영역에 대해 3'에 있다. 일부 경우에, 상기 시스템은 5'에서 3'으로 다음을 포함하는 단일 또는 이중 가닥 DNA 복구 주형을 포함할 수 있다: 제1 영역의 5'에 적어도 약 20(예를 들어, 적어도 약 40, 80, 120, 150, 200, 300, 500, 또는 1kb) 뉴클레오티드의 서열을 포함하는 제1 상동성 아암, 적어도 약 10 뉴클레오티드의 합성 DNA 서열, 및 제2 영역의 3'에 적어도 약 20(예를 들어, 적어도 약 40, 80, 120, 150, 200, 300, 500, 또는 1kb) 뉴클레오티드의 서열을 포함하는 제2 상동성 아암.
또 다른 측면에서, 본 개시 내용은 관심의 표적 핵산 유전자좌를 변형시키는 방법을 제공한다. 방법은 본원에 개시된 효소 및 적어도 하나의 합성 가이드 RNA(sgRNA)를 포함하는 본원에 개시된 임의의 비천연 시스템을 표적 핵산 유전자좌에 전달하는 단계를 포함할 수 있다. 효소는 적어도 하나의 sgRNA와 복합체를 형성할 수 있고, 복합체가 관심의 표적 핵산 유전자좌에 결합할 때 관심의 표적 핵산 유전자좌를 변형시킬 수 있다. 상기 유전자좌에 효소를 전달하는 단계는 시스템 또는 시스템을 코딩하는 핵산으로 세포를 형질감염시키는 단계를 포함할 수 있다. 상기 유전자좌에 뉴클레아제를 전달하는 단계는 시스템 또는 시스템을 코딩하는 핵산으로 세포를 전기천공하는 단계를 포함할 수 있다. 상기 유전자좌에 뉴클레아제를 전달하는 단계는 관심의 유전자좌를 포함하는 핵산과 함께 완충액에서 시스템을 인큐베이션하는 단계를 포함할 수 있다. 일부 경우에, 표적 핵산 유전자좌는 데옥시리보핵산(DNA) 또는 리보핵산(RNA)을 포함한다. 표적 핵산 유전자좌는 게놈 DNA, 바이러스 DNA, 바이러스 RNA, 또는 박테리아 DNA를 포함할 수 있다. 표적 핵산 유전자좌는 세포 내에 있을 수 있다. 표적 핵산 유전자좌는 시험관 내에 있을 수 있다. 표적 핵산 유전자좌는 진핵생물 세포 또는 원핵생물 세포 내에 있을 수 있다. 세포는 동물 세포, 인간 세포, 박테리아 세포, 고세균 세포, 또는 식물 세포일 수 있다. 효소는 관심의 표적 유전자좌에서 또는 그 근위에서 단일 또는 이중 가닥 파손을 유도할 수 있다.
표적 핵산 유전자좌가 세포 내에 있을 수 있는 경우, 효소는 서열 번호 3175-3300 중 어느 하나에 대해 적어도 약 75%(예를 들어, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%) 동일성을 갖는 RuvC_III 도메인을 갖는 효소를 코딩하는 오픈 리딩 프레임을 함유하는 핵산으로서 공급될 수 있다. 상기 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임을 함유하는 데옥시리보핵산(DNA)은 서열 번호 5584 또는 서열 번호 5584에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체에 대해 실질적으로 동일한 서열을 포함할 수 있다. 일부 경우에, 핵산은 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임이 작동가능하게 연결된 프로모터를 포함한다. 프로모터는 CMV, EF1a, SV40, PGK1, Ubc, 인간 베타 액틴, CAG, TRE, 또는 CaMKIIa 프로모터일 수 있다. 엔도뉴클레아제는 상기 엔도뉴클레아제를 코딩하는 상기 오픈 리딩 프레임을 함유하는 캡핑된 mRNA로서 공급될 수 있다. 엔도뉴클레아제는 번역된 폴리펩티드로서 공급될 수 있다. 적어도 하나의 조작된 sgRNA는 리보핵산(RNA) pol III 프로모터에 작동가능하게 연결된 상기 적어도 하나의 조작된 sgRNA를 코딩하는 유전자 서열을 함유하는 데옥시리보핵산(DNA)으로서 공급될 수 있다. 일부 경우에, 유기체는 진핵생물일 수 있다. 일부 경우에, 유기체는 진균일 수 있다. 일부 경우에, 유기체는 인간일 수 있다.
MG21 효소
한 측면에서, 본 개시 내용은 (a) 엔도뉴클레아제를 포함하는 조작된 뉴클레아제 시스템을 제공한다. 일부 경우에, 엔도뉴클레아제는 Cas 엔도뉴클레아제이다. 일부 경우에, 엔도뉴클레아제는 II형, 클래스 II Cas 엔도뉴클레아제이다. 엔도뉴클레아제는 RuvC_III 도메인을 포함할 수 있으며, 여기서 상기 RuvC_III 도메인은 서열 번호 3331-3474 중 어느 하나에 대해 적어도 약 70% 서열 동일성을 갖는다. 일부 경우에, 엔도뉴클레아제는 RuvC_III 도메인을 포함할 수 있으며, 여기서 RuvC_III 도메인은 서열 번호 3331-3474 중 어느 하나에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 동일성을 갖는다. 일부 경우에, 엔도뉴클레아제는 서열 번호 3331-3474 중 어느 하나에 대해 실질적으로 동일한 RuvC_III 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 3331-3474 중 어느 하나에 대해 적어도 약 70% 서열 동일성을 갖는 RuvC_III 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 3331-3474 중 어느 하나에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 동일성을 갖는 RuvC_III 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 3331-3474 중 어느 하나에 대해 실질적으로 동일한 RuvC_III 도메인을 포함할 수 있다.
엔도뉴클레아제는 서열 번호 5147-5290 중 어느 하나에 대해 적어도 약 70% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 5147-5290 중 어느 하나에 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 5147-5290 중 어느 하나에 대해 실질적으로 동일한 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 5147-5290 중 어느 하나에 대해 적어도 약 70% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 5147-5290 중 어느 하나에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 5147-5290 중 어느 하나에 대해 실질적으로 동일한 HNH 도메인을 포함할 수 있다.
일부 경우에, 엔도뉴클레아제는 서열 번호 1512-1655 중 어느 하나에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체를 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 1512-1655 중 어느 하나에 대해 실질적으로 동일할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 1512-1655 중 어느 하나에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체를 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 1512-1655 중 어느 하나에 실질적으로 동일할 수 있다.
일부 경우에, 엔도뉴클레아제는 하나 이상의 핵 국소화 서열(NLS)을 갖는 변이체를 포함할 수 있다. NLS는 상기 엔도뉴클레아제의 N- 또는 C-말단에 근접할 수 있다. NLS는 서열 번호 1512-1655 중 어느 하나, 또는 서열 번호 1512-1655 중 어느 하나에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체의 N-말단 또는 C-말단에 첨부될 수 있다. NLS는 SV40 대형 T 항원 NLS일 수 있다. NLS는 c-myc NLS일 수 있다. NLS는 서열 번호 5593-5608 중 어느 하나에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 99% 동일성을 갖는 서열을 포함할 수 있다. NLS는 서열 번호 5593-5608 중 어느 하나에 대해 실질적으로 동일한 서열을 포함할 수 있다. NLS는 표 1의 임의의 서열 또는 이들의 조합을 포함할 수 있다.
일부 경우에, 서열 동일성은 스미스-워터맨 상동성 검색 알고리즘의 매개변수를 사용하여 BLASTP, CLUSTALW, MUSCLE, MAFFT, Novafold, 또는 CLUSTALW에 의해 결정될 수 있다. 서열 동일성은 단어 길이(W) 3, 기대치(E) 10의 매개변수를 사용하고, 존재 11, 확장 1에서 갭 비용을 설정하는 BLOSUM62 스코어링 매트릭스를 사용하고, 조건부 구성 스코어 매트릭스 조정을 사용하는 BLASTP 알고리즘에 의해 결정될 수 있다.
일부 경우에, 상기 시스템은 (b) 원하는 절단 서열에 상보적인 5' 표적화 영역을 보유하는 엔도뉴클레아제와 복합체를 형성할 수 있는 적어도 하나의 조작된 합성 가이드 리보핵산(sgRNA)을 포함할 수 있다. 일부 경우에, 5' 표적화 영역은 엔도뉴클레아제와 호환되는 PAM 서열을 포함할 수 있다. 일부 경우에, 표적화 영역의 가장 5' 뉴클레오티드는 G일 수 있다. 일부 경우에, 5' 표적화 영역은 15-23 뉴클레오티드 길이일 수 있다. 가이드 서열 및 tracr 서열은 별도의 리보핵산(RNA) 또는 단일 리보핵산(RNA)으로서 공급될 수 있다. 가이드 RNA는 표적화 영역 3'에 crRNA tracrRNA 결합 서열을 포함할 수 있다. 가이드 RNA는 crRNA tracrRNA 결합 영역 3'에 4-뉴클레오티드 링커가 선행하는 tracrRNA 서열을 포함할 수 있다. sgRNA는 5'에서 3'으로 세포에서 표적 서열에 혼성화할 수 있는 비천연 가이드 핵산 서열; 및 tracr 서열을 포함할 수 있다. 일부 경우에, 비천연 가이드 핵산 서열 및 tracr 서열은 공유적으로 연결된다.
일부 경우에, tracr 서열은 특정 서열을 가질 수 있다. tracr 서열은 천연 tracrRNA 서열의 적어도 약 60-100(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 적어도 약 80% 서열 동일성을 가질 수 있다. tracr 서열은 서열 번호 5509의 적어도 약 60-100(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 적어도 약 80% 서열 동일성을 가질 수 있다. 일부 경우에, tracrRNA는 서열 번호 5509의 적어도 약 60-90(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 가질 수 있다. 일부 경우에, tracrRNA는 서열 번호 5509의 적어도 약 60-100(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 실질적으로 동일할 수 있다. tracrRNA는 서열 번호 5509를 포함할 수 있다.
일부 경우에, 엔도뉴클레아제와 복합체를 형성할 수 있는 적어도 하나의 조작된 합성 가이드 리보핵산(sgRNA)은 서열 번호 5473에 대해 적어도 약 80% 동일성을 갖는 서열을 포함할 수 있다. sgRNA는 서열 번호 5473에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 서열을 포함할 수 있다. sgRNA는 서열 번호 5473에 대해 실질적으로 동일한 서열을 포함할 수 있다.
일부 경우에, 상기 시스템은 표적 DNA 유전자좌에서 절단을 위한 제1 영역 및 제2 영역을 표적화하는 2개의 상이한 sgRNA를 포함할 수 있으며, 여기서 제2 영역은 제1 영역에 대해 3'에 있다. 일부 경우에, 상기 시스템은 5'에서 3'으로 다음을 포함하는 단일 또는 이중 가닥 DNA 복구 주형을 포함할 수 있다: 제1 영역의 5'에 적어도 약 20(예를 들어, 적어도 약 40, 80, 120, 150, 200, 300, 500, 또는 1kb) 뉴클레오티드의 서열을 포함하는 제1 상동성 아암, 적어도 약 10 뉴클레오티드의 합성 DNA 서열, 및 제2 영역의 3'에 적어도 약 20(예를 들어, 적어도 약 40, 80, 120, 150, 200, 300, 500, 또는 1kb) 뉴클레오티드의 서열을 포함하는 제2 상동성 아암.
또 다른 측면에서, 본 개시 내용은 관심의 표적 핵산 유전자좌를 변형시키는 방법을 제공한다. 방법은 본원에 개시된 효소 및 적어도 하나의 합성 가이드 RNA(sgRNA)를 포함하는 본원에 개시된 임의의 비천연 시스템을 표적 핵산 유전자좌에 전달하는 단계를 포함할 수 있다. 효소는 적어도 하나의 sgRNA와 복합체를 형성할 수 있고, 복합체가 관심의 표적 핵산 유전자좌에 결합할 때 관심의 표적 핵산 유전자좌를 변형시킬 수 있다. 상기 유전자좌에 효소를 전달하는 단계는 시스템 또는 시스템을 코딩하는 핵산으로 세포를 형질감염시키는 단계를 포함할 수 있다. 상기 유전자좌에 뉴클레아제를 전달하는 단계는 시스템 또는 시스템을 코딩하는 핵산으로 세포를 전기천공하는 단계를 포함할 수 있다. 상기 유전자좌에 뉴클레아제를 전달하는 단계는 관심의 유전자좌를 포함하는 핵산과 함께 완충액에서 시스템을 인큐베이션하는 단계를 포함할 수 있다. 일부 경우에, 표적 핵산 유전자좌는 데옥시리보핵산(DNA) 또는 리보핵산(RNA)을 포함한다. 표적 핵산 유전자좌는 게놈 DNA, 바이러스 DNA, 바이러스 RNA, 또는 박테리아 DNA를 포함할 수 있다. 표적 핵산 유전자좌는 세포 내에 있을 수 있다. 표적 핵산 유전자좌는 시험관 내에 있을 수 있다. 표적 핵산 유전자좌는 진핵생물 세포 또는 원핵생물 세포 내에 있을 수 있다. 세포는 동물 세포, 인간 세포, 박테리아 세포, 고세균 세포, 또는 식물 세포일 수 있다. 효소는 관심의 표적 유전자좌에서 또는 그 근위에서 단일 또는 이중 가닥 파손을 유도할 수 있다.
표적 핵산 유전자좌가 세포 내에 있을 수 있는 경우, 효소는 서열 번호 3331-3474 중 어느 하나에 대해 적어도 약 75%(예를 들어, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%) 동일성을 갖는 RuvC_III 도메인을 갖는 효소를 코딩하는 오픈 리딩 프레임을 함유하는 핵산으로서 공급될 수 있다. 상기 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임을 함유하는 데옥시리보핵산(DNA)은 서열 번호 5585 또는 서열 번호 5585에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체에 대해 실질적으로 동일한 서열을 포함할 수 있다. 일부 경우에, 핵산은 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임이 작동가능하게 연결된 프로모터를 포함한다. 프로모터는 CMV, EF1a, SV40, PGK1, Ubc, 인간 베타 액틴, CAG, TRE, 또는 CaMKIIa 프로모터일 수 있다. 엔도뉴클레아제는 상기 엔도뉴클레아제를 코딩하는 상기 오픈 리딩 프레임을 함유하는 캡핑된 mRNA로서 공급될 수 있다. 엔도뉴클레아제는 번역된 폴리펩티드로서 공급될 수 있다. 적어도 하나의 조작된 sgRNA는 리보핵산(RNA) pol III 프로모터에 작동가능하게 연결된 상기 적어도 하나의 조작된 sgRNA를 코딩하는 유전자 서열을 함유하는 데옥시리보핵산(DNA)으로서 공급될 수 있다. 일부 경우에, 유기체는 진핵생물일 수 있다. 일부 경우에, 유기체는 진균일 수 있다. 일부 경우에, 유기체는 인간일 수 있다.
MG22 효소
한 측면에서, 본 개시 내용은 (a) 엔도뉴클레아제를 포함하는 조작된 뉴클레아제 시스템을 제공한다. 일부 경우에, 엔도뉴클레아제는 Cas 엔도뉴클레아제이다. 일부 경우에, 엔도뉴클레아제는 II형, 클래스 II Cas 엔도뉴클레아제이다. 엔도뉴클레아제는 RuvC_III 도메인을 포함할 수 있으며, 여기서 상기 RuvC_III 도메인은 서열 번호 3475-3568 중 어느 하나에 대해 적어도 약 70% 서열 동일성을 갖는다. 일부 경우에, 엔도뉴클레아제는 RuvC_III 도메인을 포함할 수 있으며, 여기서 RuvC_III 도메인은 서열 번호 3475-3568 중 어느 하나에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 동일성을 갖는다. 일부 경우에, 엔도뉴클레아제는 서열 번호 3475-3568 중 어느 하나에 대해 실질적으로 동일한 RuvC_III 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 3475-3568 중 어느 하나에 대해 적어도 약 70% 서열 동일성을 갖는 RuvC_III 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 3475-3568 중 어느 하나에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 동일성을 갖는 RuvC_III 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 3475-3568 중 어느 하나에 대해 실질적으로 동일한 RuvC_III 도메인을 포함할 수 있다.
엔도뉴클레아제는 서열 번호 5291-5389 중 어느 하나에 대해 적어도 약 70% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 5291-5389 중 어느 하나에 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 5291-5389 중 어느 하나에 대해 실질적으로 동일한 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 5291-5389 중 어느 하나에 대해 적어도 약 70% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 5291-5389 중 어느 하나에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 5291-5389 중 어느 하나에 대해 실질적으로 동일한 HNH 도메인을 포함할 수 있다.
일부 경우에, 엔도뉴클레아제는 서열 번호 320-420 중 어느 하나에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체를 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 432-660 중 어느 하나에 대해 실질적으로 동일할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 1656-1755 중 어느 하나에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체를 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 320-321 중 어느 하나에 실질적으로 동일할 수 있다.
일부 경우에, 엔도뉴클레아제는 하나 이상의 핵 국소화 서열(NLS)을 갖는 변이체를 포함할 수 있다. NLS는 상기 엔도뉴클레아제의 N- 또는 C-말단에 근접할 수 있다. NLS는 서열 번호 320-420 중 어느 하나, 또는 서열 번호 320-420 중 어느 하나에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체의 N-말단 또는 C-말단에 첨부될 수 있다. NLS는 SV40 대형 T 항원 NLS일 수 있다. NLS는 c-myc NLS일 수 있다. NLS는 서열 번호 5593-5608 중 어느 하나에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 99% 동일성을 갖는 서열을 포함할 수 있다. NLS는 서열 번호 5593-5608 중 어느 하나에 대해 실질적으로 동일한 서열을 포함할 수 있다. NLS는 표 1의 임의의 서열 또는 이들의 조합을 포함할 수 있다.
일부 경우에, 서열 동일성은 스미스-워터맨 상동성 검색 알고리즘의 매개변수를 사용하여 BLASTP, CLUSTALW, MUSCLE, MAFFT, Novafold, 또는 CLUSTALW에 의해 결정될 수 있다. 서열 동일성은 단어 길이(W) 3, 기대치(E) 10의 매개변수를 사용하고, 존재 11, 확장 1에서 갭 비용을 설정하는 BLOSUM62 스코어링 매트릭스를 사용하고, 조건부 구성 스코어 매트릭스 조정을 사용하는 BLASTP 알고리즘에 의해 결정될 수 있다.
일부 경우에, 상기 시스템은 (b) 원하는 절단 서열에 상보적인 5' 표적화 영역을 보유하는 엔도뉴클레아제와 복합체를 형성할 수 있는 적어도 하나의 조작된 합성 가이드 리보핵산(sgRNA)을 포함할 수 있다. 일부 경우에, 5' 표적화 영역은 엔도뉴클레아제와 호환되는 PAM 서열을 포함할 수 있다. 일부 경우에, 표적화 영역의 가장 5' 뉴클레오티드는 G일 수 있다. 일부 경우에, 5' 표적화 영역은 15-23 뉴클레오티드 길이일 수 있다. 가이드 서열 및 tracr 서열은 별도의 리보핵산(RNA) 또는 단일 리보핵산(RNA)으로서 공급될 수 있다. 가이드 RNA는 표적화 영역 3'에 crRNA tracrRNA 결합 서열을 포함할 수 있다. 가이드 RNA는 crRNA tracrRNA 결합 영역 3'에 4-뉴클레오티드 링커가 선행하는 tracrRNA 서열을 포함할 수 있다. sgRNA는 5'에서 3'으로 세포에서 표적 서열에 혼성화할 수 있는 비천연 가이드 핵산 서열; 및 tracr 서열을 포함할 수 있다. 일부 경우에, 비천연 가이드 핵산 서열 및 tracr 서열은 공유적으로 연결된다.
일부 경우에, tracr 서열은 특정 서열을 가질 수 있다. tracr 서열은 천연 tracrRNA 서열의 적어도 약 60-100(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 적어도 약 80% 서열 동일성을 가질 수 있다. tracr 서열은 서열 번호 5510 중 어느 하나의 적어도 약 60-100(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 적어도 약 80% 서열 동일성을 가질 수 있다. 일부 경우에, tracrRNA는 서열 번호 5510의 적어도 약 60-90(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 가질 수 있다. 일부 경우에, tracrRNA는 서열 번호 5510의 적어도 약 60-100(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 실질적으로 동일할 수 있다. tracrRNA는 서열 번호 5510을 포함할 수 있다.
일부 경우에, 엔도뉴클레아제와 복합체를 형성할 수 있는 적어도 하나의 조작된 합성 가이드 리보핵산(sgRNA)은 서열 번호 5474에 대해 적어도 약 80% 동일성을 갖는 서열을 포함할 수 있다. sgRNA는 서열 번호 5474에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 서열을 포함할 수 있다. sgRNA는 서열 번호 5474에 대해 실질적으로 동일한 서열을 포함할 수 있다.
일부 경우에, 상기 시스템은 표적 DNA 유전자좌에서 절단을 위한 제1 영역 및 제2 영역을 표적화하는 2개의 상이한 sgRNA를 포함할 수 있으며, 여기서 제2 영역은 제1 영역에 대해 3'에 있다. 일부 경우에, 상기 시스템은 5'에서 3'으로 다음을 포함하는 단일 또는 이중 가닥 DNA 복구 주형을 포함할 수 있다: 제1 영역의 5'에 적어도 약 20(예를 들어, 적어도 약 40, 80, 120, 150, 200, 300, 500, 또는 1kb) 뉴클레오티드의 서열을 포함하는 제1 상동성 아암, 적어도 약 10 뉴클레오티드의 합성 DNA 서열, 및 제2 영역의 3'에 적어도 약 20(예를 들어, 적어도 약 40, 80, 120, 150, 200, 300, 500, 또는 1kb) 뉴클레오티드의 서열을 포함하는 제2 상동성 아암.
또 다른 측면에서, 본 개시 내용은 관심의 표적 핵산 유전자좌를 변형시키는 방법을 제공한다. 방법은 본원에 개시된 효소 및 적어도 하나의 합성 가이드 RNA(sgRNA)를 포함하는 본원에 개시된 임의의 비천연 시스템을 표적 핵산 유전자좌에 전달하는 단계를 포함할 수 있다. 효소는 적어도 하나의 sgRNA와 복합체를 형성할 수 있고, 복합체가 관심의 표적 핵산 유전자좌에 결합할 때 관심의 표적 핵산 유전자좌를 변형시킬 수 있다. 상기 유전자좌에 효소를 전달하는 단계는 시스템 또는 시스템을 코딩하는 핵산으로 세포를 형질감염시키는 단계를 포함할 수 있다. 상기 유전자좌에 뉴클레아제를 전달하는 단계는 시스템 또는 시스템을 코딩하는 핵산으로 세포를 전기천공하는 단계를 포함할 수 있다. 상기 유전자좌에 뉴클레아제를 전달하는 단계는 관심의 유전자좌를 포함하는 핵산과 함께 완충액에서 시스템을 인큐베이션하는 단계를 포함할 수 있다. 일부 경우에, 표적 핵산 유전자좌는 데옥시리보핵산(DNA) 또는 리보핵산(RNA)을 포함한다. 표적 핵산 유전자좌는 게놈 DNA, 바이러스 DNA, 바이러스 RNA, 또는 박테리아 DNA를 포함할 수 있다. 표적 핵산 유전자좌는 세포 내에 있을 수 있다. 표적 핵산 유전자좌는 시험관 내에 있을 수 있다. 표적 핵산 유전자좌는 진핵생물 세포 또는 원핵생물 세포 내에 있을 수 있다. 세포는 동물 세포, 인간 세포, 박테리아 세포, 고세균 세포, 또는 식물 세포일 수 있다. 효소는 관심의 표적 유전자좌에서 또는 그 근위에서 단일 또는 이중 가닥 파손을 유도할 수 있다.
표적 핵산 유전자좌가 세포 내에 있을 수 있는 경우, 효소는 서열 번호 3475-3568-2241 중 어느 하나에 대해 적어도 약 75%(예를 들어, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%) 동일성을 갖는 RuvC_III 도메인을 갖는 효소를 코딩하는 오픈 리딩 프레임을 함유하는 핵산으로서 공급될 수 있다. 상기 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임을 함유하는 데옥시리보핵산(DNA)은 서열 번호 5586 또는 서열 번호 5586에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체에 대해 실질적으로 동일한 서열을 포함할 수 있다. 일부 경우에, 핵산은 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임이 작동가능하게 연결된 프로모터를 포함한다. 프로모터는 CMV, EF1a, SV40, PGK1, Ubc, 인간 베타 액틴, CAG, TRE, 또는 CaMKIIa 프로모터일 수 있다. 엔도뉴클레아제는 상기 엔도뉴클레아제를 코딩하는 상기 오픈 리딩 프레임을 함유하는 캡핑된 mRNA로서 공급될 수 있다. 엔도뉴클레아제는 번역된 폴리펩티드로서 공급될 수 있다. 적어도 하나의 조작된 sgRNA는 리보핵산(RNA) pol III 프로모터에 작동가능하게 연결된 상기 적어도 하나의 조작된 sgRNA를 코딩하는 유전자 서열을 함유하는 데옥시리보핵산(DNA)으로서 공급될 수 있다. 일부 경우에, 유기체는 진핵생물일 수 있다. 일부 경우에, 유기체는 진균일 수 있다. 일부 경우에, 유기체는 인간일 수 있다.
MG23 효소
한 측면에서, 본 개시 내용은 (a) 엔도뉴클레아제를 포함하는 조작된 뉴클레아제 시스템을 제공한다. 일부 경우에, 엔도뉴클레아제는 Cas 엔도뉴클레아제이다. 일부 경우에, 엔도뉴클레아제는 II형, 클래스 II Cas 엔도뉴클레아제이다. 엔도뉴클레아제는 RuvC_III 도메인을 포함할 수 있으며, 여기서 상기 RuvC_III 도메인은 서열 번호 3569-3637 중 어느 하나에 대해 적어도 약 70% 서열 동일성을 갖는다. 일부 경우에, 엔도뉴클레아제는 RuvC_III 도메인을 포함할 수 있으며, 여기서 RuvC_III 도메인은 서열 번호 3569-3637 중 어느 하나에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 동일성을 갖는다. 일부 경우에, 엔도뉴클레아제는 서열 번호 3569-3637 중 어느 하나에 대해 실질적으로 동일한 RuvC_III 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 3569-3637 중 어느 하나에 대해 적어도 약 70% 서열 동일성을 갖는 RuvC_III 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 3569-3637 중 어느 하나에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 동일성을 갖는 RuvC_III 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 3569-3637 중 어느 하나에 대해 실질적으로 동일한 RuvC_III 도메인을 포함할 수 있다.
엔도뉴클레아제는 서열 번호 5390-5460 중 어느 하나에 대해 적어도 약 70% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 5390-5460 중 어느 하나에 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 5390-5460 중 어느 하나에 대해 실질적으로 동일한 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 5390-5460 중 어느 하나에 대해 적어도 약 70% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 5390-5460 중 어느 하나에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 HNH 도메인을 포함할 수 있다. 엔도뉴클레아제는 서열 번호 5390-5460 중 어느 하나에 대해 실질적으로 동일한 HNH 도메인을 포함할 수 있다.
일부 경우에, 엔도뉴클레아제는 서열 번호 1756-1826 중 어느 하나에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체를 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 1756-1826 중 어느 하나에 대해 실질적으로 동일할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 1756-1826 중 어느 하나에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체를 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 1756-1826 중 어느 하나에 실질적으로 동일할 수 있다.
일부 경우에, 엔도뉴클레아제는 하나 이상의 핵 국소화 서열(NLS)을 갖는 변이체를 포함할 수 있다. NLS는 상기 엔도뉴클레아제의 N- 또는 C-말단에 근접할 수 있다. NLS는 서열 번호 1756-1826 중 어느 하나, 또는 서열 번호 1756-1826 중 어느 하나에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체의 N-말단 또는 C-말단에 첨부될 수 있다. NLS는 SV40 대형 T 항원 NLS일 수 있다. NLS는 c-myc NLS일 수 있다. NLS는 서열 번호 5593-5608 중 어느 하나에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 99% 동일성을 갖는 서열을 포함할 수 있다. NLS는 서열 번호 5593-5608 중 어느 하나에 대해 실질적으로 동일한 서열을 포함할 수 있다. NLS는 표 1의 임의의 서열 또는 이들의 조합을 포함할 수 있다.
일부 경우에, 서열 동일성은 스미스-워터맨 상동성 검색 알고리즘의 매개변수를 사용하여 BLASTP, CLUSTALW, MUSCLE, MAFFT, Novafold, 또는 CLUSTALW에 의해 결정될 수 있다. 서열 동일성은 단어 길이(W) 3, 기대치(E) 10의 매개변수를 사용하고, 존재 11, 확장 1에서 갭 비용을 설정하는 BLOSUM62 스코어링 매트릭스를 사용하고, 조건부 구성 스코어 매트릭스 조정을 사용하는 BLASTP 알고리즘에 의해 결정될 수 있다.
일부 경우에, 상기 시스템은 (b) 원하는 절단 서열에 상보적인 5' 표적화 영역을 보유하는 엔도뉴클레아제와 복합체를 형성할 수 있는 적어도 하나의 조작된 합성 가이드 리보핵산(sgRNA)을 포함할 수 있다. 일부 경우에, 5' 표적화 영역은 엔도뉴클레아제와 호환되는 PAM 서열을 포함할 수 있다. 일부 경우에, 표적화 영역의 가장 5' 뉴클레오티드는 G일 수 있다. 일부 경우에, 5' 표적화 영역은 15-23 뉴클레오티드 길이일 수 있다. 가이드 서열 및 tracr 서열은 별도의 리보핵산(RNA) 또는 단일 리보핵산(RNA)으로서 공급될 수 있다. 가이드 RNA는 표적화 영역 3'에 crRNA tracrRNA 결합 서열을 포함할 수 있다. 가이드 RNA는 crRNA tracrRNA 결합 영역 3'에 4-뉴클레오티드 링커가 선행하는 tracrRNA 서열을 포함할 수 있다. sgRNA는 5'에서 3'으로 세포에서 표적 서열에 혼성화할 수 있는 비천연 가이드 핵산 서열; 및 tracr 서열을 포함할 수 있다. 일부 경우에, 비천연 가이드 핵산 서열 및 tracr 서열은 공유적으로 연결된다.
일부 경우에, tracr 서열은 특정 서열을 가질 수 있다. tracr 서열은 천연 tracrRNA 서열의 적어도 약 60-100(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 적어도 약 80% 서열 동일성을 가질 수 있다. tracr 서열은 서열 번호 5511의 적어도 약 60-100(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 적어도 약 80% 서열 동일성을 가질 수 있다. 일부 경우에, tracrRNA는 서열 번호 5511의 적어도 약 60-90(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 가질 수 있다. 일부 경우에, tracrRNA는 서열 번호 5511의 적어도 약 60-100(예를 들어, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 또는 적어도 약 90)개의 연속 뉴클레오티드에 대해 실질적으로 동일할 수 있다. tracrRNA는 서열 번호 5511을 포함할 수 있다.
일부 경우에, 엔도뉴클레아제와 복합체를 형성할 수 있는 적어도 하나의 조작된 합성 가이드 리보핵산(sgRNA)은 서열 번호 5475에 대해 적어도 약 80% 동일성을 갖는 서열을 포함할 수 있다. sgRNA는 서열 번호 5475에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 서열을 포함할 수 있다. sgRNA는 서열 번호 5475에 대해 실질적으로 동일한 서열을 포함할 수 있다.
일부 경우에, 상기 시스템은 표적 DNA 유전자좌에서 절단을 위한 제1 영역 및 제2 영역을 표적화하는 2개의 상이한 sgRNA를 포함할 수 있으며, 여기서 제2 영역은 제1 영역에 대해 3'에 있다. 일부 경우에, 상기 시스템은 5'에서 3'으로 다음을 포함하는 단일 또는 이중 가닥 DNA 복구 주형을 포함할 수 있다: 제1 영역의 5'에 적어도 약 20(예를 들어, 적어도 약 40, 80, 120, 150, 200, 300, 500, 또는 1kb) 뉴클레오티드의 서열을 포함하는 제1 상동성 아암, 적어도 약 10 뉴클레오티드의 합성 DNA 서열, 및 제2 영역의 3'에 적어도 약 20(예를 들어, 적어도 약 40, 80, 120, 150, 200, 300, 500, 또는 1kb) 뉴클레오티드의 서열을 포함하는 제2 상동성 아암.
또 다른 측면에서, 본 개시 내용은 관심의 표적 핵산 유전자좌를 변형시키는 방법을 제공한다. 방법은 본원에 개시된 효소 및 적어도 하나의 합성 가이드 RNA(sgRNA)를 포함하는 본원에 개시된 임의의 비천연 시스템을 표적 핵산 유전자좌에 전달하는 단계를 포함할 수 있다. 효소는 적어도 하나의 sgRNA와 복합체를 형성할 수 있고, 복합체가 관심의 표적 핵산 유전자좌에 결합할 때 관심의 표적 핵산 유전자좌를 변형시킬 수 있다. 상기 유전자좌에 효소를 전달하는 단계는 시스템 또는 시스템을 코딩하는 핵산으로 세포를 형질감염시키는 단계를 포함할 수 있다. 상기 유전자좌에 뉴클레아제를 전달하는 단계는 시스템 또는 시스템을 코딩하는 핵산으로 세포를 전기천공하는 단계를 포함할 수 있다. 상기 유전자좌에 뉴클레아제를 전달하는 단계는 관심의 유전자좌를 포함하는 핵산과 함께 완충액에서 시스템을 인큐베이션하는 단계를 포함할 수 있다. 일부 경우에, 표적 핵산 유전자좌는 데옥시리보핵산(DNA) 또는 리보핵산(RNA)을 포함한다. 표적 핵산 유전자좌는 게놈 DNA, 바이러스 DNA, 바이러스 RNA, 또는 박테리아 DNA를 포함할 수 있다. 표적 핵산 유전자좌는 세포 내에 있을 수 있다. 표적 핵산 유전자좌는 시험관 내에 있을 수 있다. 표적 핵산 유전자좌는 진핵생물 세포 또는 원핵생물 세포 내에 있을 수 있다. 세포는 동물 세포, 인간 세포, 박테리아 세포, 고세균 세포, 또는 식물 세포일 수 있다. 효소는 관심의 표적 유전자좌에서 또는 그 근위에서 단일 또는 이중 가닥 파손을 유도할 수 있다.
표적 핵산 유전자좌가 세포 내에 있을 수 있는 경우, 효소는 서열 번호 3569-3637 중 어느 하나에 대해 적어도 약 75%(예를 들어, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%) 동일성을 갖는 RuvC_III 도메인을 갖는 효소를 코딩하는 오픈 리딩 프레임을 함유하는 핵산으로서 공급될 수 있다. 상기 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임을 함유하는 데옥시리보핵산(DNA)은 서열 번호 5587 또는 서열 번호 5587에 대해 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체에 대해 실질적으로 동일한 서열을 포함할 수 있다. 일부 경우에, 핵산은 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임이 작동가능하게 연결된 프로모터를 포함한다. 프로모터는 CMV, EF1a, SV40, PGK1, Ubc, 인간 베타 액틴, CAG, TRE, 또는 CaMKIIa 프로모터일 수 있다. 엔도뉴클레아제는 상기 엔도뉴클레아제를 코딩하는 상기 오픈 리딩 프레임을 함유하는 캡핑된 mRNA로서 공급될 수 있다. 엔도뉴클레아제는 번역된 폴리펩티드로서 공급될 수 있다. 적어도 하나의 조작된 sgRNA는 리보핵산(RNA) pol III 프로모터에 작동가능하게 연결된 상기 적어도 하나의 조작된 sgRNA를 코딩하는 유전자 서열을 함유하는 데옥시리보핵산(DNA)으로서 공급될 수 있다. 일부 경우에, 유기체는 진핵생물일 수 있다. 일부 경우에, 유기체는 진균일 수 있다. 일부 경우에, 유기체는 인간일 수 있다.
본 개시 내용의 시스템은 예를 들어 핵산 편집(예를 들어, 유전자 편집), 핵산 분자에 대한 결합(예를 들어, 서열 특이적 결합)과 같은 다양한 적용을 위해 사용될 수 있다. 이러한 시스템은 예를 들어 대상체에서 질병을 유발할 수 있는 유전적으로 유전된 돌연변이를 해결(예를 들어, 제거 또는 대체)하는 데에, 세포에서 유전자의 기능을 확인하기 위해 유전자를 불활성화하는 데에, 질병 유발 유전 요소(예를 들어, 질병 유발 돌연변이를 코딩하는 증폭된 DNA 서열 또는 역전사된 바이러스 RNA의 절단을 통해)를 검출하기 위한 진단 도구로서, 특정 뉴클레오티드 서열(예를 들어, 박테리아에서 항생제 내성을 코딩하는 서열)을 표적화하고 검출하는 프로브와 함께 비활성화된 효소로서 사용되어, 바이러스 게놈을 표적화하여 바이러스를 불활성화하거나 숙주 세포를 감염시킬 수 없게 만들고, 유전자를 추가하거나 대사 경로를 수정하여 유기체가 귀중한 소분자, 거대분자 또는 2차 대사산물을 생산하도록 조작하고, 진화적 선택을 위한 유전자 구동 요소를 확립하고, 바이오 센서로서 외래 소분자 및 뉴클레오티드에 의한 세포 교란을 감지할 수 있다.
실시예
실시예 1. - 새로운 단백질에 대한 메타게놈 분석
퇴적물, 토양 및 동물로부터 메타게놈 샘플을 수집하였다. 데옥시리보핵산(DNA)을 Zymobiomics DNA 미니 프렙 키트로 추출하고 Illumina HiSeq® 2500에서 시퀀싱하였다. 샘플은 자산 소유자의 동의를 얻어 수집하였다. 공개 소스로부터의 추가 원시 서열 데이터에는 동물 마이크로바이옴, 퇴적물, 토양, 온천, 열수구, 해양, 이탄 습지, 영구 동토층 및 하수 시퀀스가 포함되었다. 메타게놈 서열 데이터는 새로운 Cas 이펙터를 식별하기 위해 II형 Cas 이펙터 단백질을 포함하는 공지된 Cas 단백질 서열에 기반하여 생성된 은닉 마르코프 모델을 사용하여 검색하였다(서로 다른 샘플 유형에서 검출된 이러한 단백질의 분포를 보여주는 [도 45] 참조). 검색에 의해 식별된 신규 이펙터 단백질을 공지된 단백질과 정렬하여 잠재적인 활성 부위를 식별하였다(서로 다른 부위에서 식별된 효소 중 Cas 촉매 잔기의 분포를 보여주는 [도 46] 참조). 이 메타게놈 작업 흐름은 본원에 기재된 클래스 II, II형 CRISPR 엔도뉴클레아제의 MG1, MG2, MG3, MG4, MG6, MG14, MG15, MG16, MG18, MG21, MG22 및 MG23 패밀리의 윤곽을 그렸다.
실시예 2A. - CRISPR 시스템의 MG1 패밀리의 발견
실시예 1의 메타게놈 분석으로부터 데이터를 분석하여 처음에 6개의 구성원(각각 서열 번호 5, 6, 1, 2, 및 3으로 기록된 MG1-1, MG1-2, MG1-3, MG1-4, MG1-5, 및 MG1-6)을 포함하는 이전에 기술되지 않은 추정 CRISPR 시스템의 새로운 클러스터를 밝혀냈다. 이 패밀리는 HNH 및 RuvC 도메인을 포함하는 효소를 특징으로 한다. 이 패밀리의 RuvC 도메인은 이전에 기술된 Cas9 패밀리 구성원에 대해 낮은 상동성을 갖는 RuvC_III 부분을 갖는다. 초기 패밀리 구성원은 그들 사이에서 최대 56.8%의 동일성을 갖지만, 6개의 효소 모두 RuvC 도메인의 분기된 RuvC_III 부분을 나타내고 RHHALDAMV(서열 번호5615), KHHALDAMC(서열 번호5616), 또는 KHHALDAIC(서열 번호5617)의 공통 모티프를 갖는다. 이러한 모티프는 기술된 다른 Cas9 유사 효소에서는 발견되지 않는다. 이러한 새로운 효소 및 그의 관련 하위 도메인에 대한 해당 단백질 및 핵산 서열은 서열 목록에 제시한다. 다른 유전자에 대한 그들의 위치에 기반하여 추정되는 tracrRNA 서열을 식별하였으며 서열 번호 5476-5479로 제시한다. 효소 시스템은 CRISPR 시스템을 포함하는 게놈 빈으로부터 16S rRNA의 서열에 기반하여 우미균 문, 칸디다투스 페레그리니박테리아 문, 또는 칸디다투스 멜라이나박테리아 문에서 유래된 것으로 보인다. 16S rRNA 서열은 서열 번호 5592-5596으로 제시한다. 문헌[Shmakov et al., Mol Cell. 2015 Nov 5;60(3):385-97, 이는 전체가 참고로 포함됨]에 기술된 특징의 언급과 함께 CRISPR 시스템 서열의 상세한 도메인 수준 정렬은 [도 9a, 9b, 9c, 9d, 9e, 9f, 9g, 및 9h]에 도시한다. MG1-1, 1-2 및 1-3 대 추가 독점 단백질 데이터세트를 비교하여 서열 번호 7-319로 제시된, 유사한 구조를 갖는 추가 단백질 서열을 밝혀냈다. 이러한 MG1 단백질 서열로 서열 번호 5618-5632에 나타낸 바와 같은 추가적인 MG1 모티프를 발견하였다.
실시예 2B. - CRISPR 시스템의 MG2 패밀리의 발견
실시예 1의 메타게놈 분석으로부터 데이터를 분석하여 6개의 구성원(MG2-1, MG2-2, MG2-3, MG2-5, 및 MG2-6)을 포함하는 이전에 기술되지 않은 추정 CRISPR 시스템의 새로운 클러스터를 밝혀냈다. 이러한 새로운 효소 및 그의 예시적인 하위 도메인에 대한 해당 단백질 및 핵산 서열은 서열 번호 320, 322-325로 제시한다. 다른 유전자에 대한 그들의 위치에 기반하여 오페론에서 추정되는 tracrRNA 서열을 식별하였고 서열 번호 5490, 5492-5494, 및 5538로 제시한다. 문헌[Shmakov et al., Mol Cell. 2015 Nov 5;60(3):385-97]에서 개략적으로 설명된 바와 같은 서열 대 Cas9의 상세한 도메인 수준 정렬은 [도 7]에 도시한다.
MG2-1, MG2-2, MG2-3, MG2-5, 및 MG2-6 대 추가 독점 단백질 데이터세트를 비교하여 서열 번호 321 및 326-420으로 제시된, 유사한 구조를 갖는 추가 단백질 서열을 밝혀냈다. MG2 패밀리 구성원에서 일반적으로 발견되는 모티프를 서열 번호 5631-5638로 제시한다.
실시예 2C. - CRISPR 시스템의 MG3 패밀리의 발견
실시예 1의 메타게놈 분석으로부터 데이터를 분석하여 이전에 기술되지 않은 새로운 추정 CRISPR 시스템 MG3-1을 밝혀냈다. 이러한 새로운 효소 및 그의 예시적인 하위 도메인에 대한 해당 아미노산 서열은 서열 번호 424, 2245 및 4059로 제시한다. 오페론의 다른 요소에 대한 근접성을 기반으로 추정되는 tracrRNA 함유 서열을 식별하였고 서열 번호 5498로 포함한다. 서열 대 악티노마이세스 나에슬룬디의 Cas9의 상세한 도메인 수준 정렬은 [도 8]에 도시한다.
MG3-1 대 추가 독점 단백질 데이터세트를 비교하여 서열 번호 421-423, 425-431로 제시된, 유사한 구조를 갖는 추가 단백질 서열을 밝혀냈다.
실시예 2D. - CRISPR 시스템의 MG4, 7, 14, 15, 16, 18, 21, 22, 23 패밀리의 발견
실시예 1의 메타게놈 분석으로부터 데이터를 분석하여 각각 하나의 구성원의 9개 패밀리(MG4-5, MG7-2, MG14-1, MG15-1, MG16-2, MG18-1, MG21-1, MG22-1, MG23-1)를 포함하는 이전에 기술되지 않은 추정 CRISPR 시스템의 새로운 클러스터를 밝혀냈다. 이러한 새로운 효소 및 그의 예시적인 하위 도메인에 대한 해당 단백질 및 핵산 서열은 서열 번호 432, 669, 678, 930, 1093, 1354, 1512, 1656, 1756으로 제시한다. 오페론에서 다른 요소에 대한 근접성을 기반으로 하여 추정되는 tracr 함유 서열을 각 패밀리에 대해 식별하였다. 이들 서열은 서열 목록에서 각각 서열 5503-5511로 제시한다.
MG4-5, MG7-2, MG14-1, MG15-1, MG16-2, MG18-1, MG21-1, MG22-1, MG23-1 대 추가 독점 단백질 데이터세트를 비교하여 서열 번호 433-660, 670-677, 679-929, 931-1092, 1094-1353, 1355-1511, 1513-1655, 1657-1755, 및 1757-1826으로 제시된, 유사한 구조를 갖는 추가 단백질 서열을 밝혀냈다. 이들 CRISPR 시스템 세트의 뉴클레아제에 공통적인 모티프는 MG4에 대해 서열 번호 5649; MG14에 대해 서열 번호 5650-5667; MG15에 대해 5668-5675; MG16에 대해 서열 번호 5676-5678; MG18에 대해 서열 번호 5679-5686; MG21에 대해 서열 번호 5687-5693 및 서열 번호 5674-5675; MG22에 대해 서열 번호 5694-5699; 및 MG23에 대해 서열 번호 5700-5717에 제시한다.
실시예 3.-예언적--프로토스페이서 인접 모티프의 결정.
최적의 합성 서열 표적화를 가능하게 하기 위해 본원에 기재된 신규 효소에 대한 프로토스페이서 인접 모티프(PAM) 서열 특이성을 확인하기 위해 문헌[Karvelis et al. Methods. 2017 May 15;121-122:3-8, 이는 전체가 본원에 참고로 포함됨]의 임의의 실시예에 따라 실험을 수행하였다.
한 예(생체 내 스크린)에서, 본원에 기재된 임의의 효소 및 프로토스페이서 표적화 가이드 RNA를 코딩하는 플라스미드를 함유하는 세포를 항생제 내성 유전자 및 무작위화된 PAM 서열의 측면에 위치하는 프로토스페이서를 함유하는 플라스미드 라이브러리와 공동 형질감염시켰다. 기능적 PAM을 함유하는 플라스미드는 효소에 의해 절단되어 세포 사멸로 이어진다. 생존 세포로부터 단리된 효소 절단 저항성 플라스미드 풀의 심층 시퀀싱은 기능적 절단 허용 PAM을 함유하는 고갈된 플라스미드 세트를 표시한다.
또 다른 예(시험관 내 스크린)에서, DNA 플라스미드 또는 연쇄동일서열 반복체 형태의 PAM 라이브러리는 시험관 내에서 또는 세포 용해물에서 조립된 RNP 복합체(예를 들어 효소, tracrRNA 및 crRNA 또는 효소 및 혼성체 sgRNA포함)에 의한 절단을 거친다. 성공적인 절단 이벤트로부터 생성된 자유 DNA 말단을 어댑터 결찰에 의해 포착한 후 측면에 PAM이 있는 생성물을 PCR 증폭한다. 기능적 PAM의 증폭된 라이브러리는 심층 시퀀싱을 거쳐 PAM 허가 DNA 절단을 식별한다.
실시예 4.-예언적--게놈 편집을 위해 포유동물 세포에서 본원에 기재된 바와 같은 합성 CRISPR 시스템의 사용
(i) 세포 호환성 C-말단 핵 국소화 서열(예를 들어, 인간 세포의 경우 SV40 NLS) 및 적합한 폴리아데닐화 신호(예를 들어, 인간 세포의 경우 TK pA 신호)를 가지며 세포 호환성 프로모터 하에 코돈 최적화된 효소를 코딩하는 ORF; 및 (ii) 적합한 중합효소 III 프로모터(예를 들어, 포유동물 세포의 U6 프로모터) 하에 sgRNA를 코딩하는 ORF(G로 시작하는 5' 서열, 이어서 게놈 DNA를 표적화하는 20 nt의 상보적인 표적화 핵산 서열, 이어서 실시예 3을 통해 식별된 상응하는 호환성 PAM 및 3' tracr 결합 서열, 링커, 및 tracrRNA 서열을 가짐) 를 코딩하는 DNA/RNA 서열을 준비한다. 일부 실시 양태에서, 이들 서열은 동일한 또는 별개의 플라스미드 벡터 상에서 제조하며, 이들은 적합한 기술을 통해 진핵생물 세포로 형질감염시킨다. 일부 실시 양태에서, 이들 서열은 별개의 DNA 서열로서 제조하며, 이는 세포 내로 형질감염시키거나 미세주입한다. 일부 실시 양태에서, 이들 서열은 합성된 RNA 또는 시험관 내 전사된 RNA로서 제조하여 이들을 세포 내로 형질감염시키거나 미세주입한다. 일부 실시 양태에서, 이들 서열은 단백질로 번역시키고 세포 내로 형질감염시키나 미세주입한다.
어떤 트랜스펙션 방법이든지 선택하고, (i) 및 (ii)를 세포에 도입한다. 효소 및/또는 sgRNA가 활성 형태로 전사 및/또는 번역될 수 있도록 인큐베이션 기간이 경과되도록 한다. 인큐베이션 기간 후, 표적화 서열 부근의 게놈 DNA를 분석한다(예를 들어, 시퀀싱에 의해). 효소 매개 절단 및 비상동 말단 결합의 결과로서 삽입-결실이 표적화 서열 부근의 게놈 DNA에 도입된다.
일부 실시 양태에서, (i) 및 (ii)는 크기 25 bp 이상의 절단 부위 측면에 있는 게놈의 영역을 코딩하는 제3 복구 뉴클레오티드와 함께 세포 내로 도입하며, 이는 상동성 지시 복구를 용이하게 할 것이다. 이들 측면 서열 내에 단일 염기쌍 돌연변이, 기능적 유전자 단편, 발현을 위한 외래 또는 고유 유전자, 또는 생화학적 경로를 구성하는 여러 유전자를 함유할 수 있다.
실시예 5.-예언적--시험관 내에서 본원에 기재된 바와 같은 합성 CRISPR 시스템의 사용
본원에 기재된 임의의 효소를 정제 태그를 함유하는 적합한 이. 콜라이 발현 플라스미드로 클로닝하고 이. 콜라이에서 재조합적으로 발현시키고 재조합 태그를 사용하여 정제한다. 5' G에 이어서 20 nt 표적화 서열 및 PAM 서열, 호환성 crRNA의 tracrRNA 결합 영역, GAAA 링커, 및 호환성 tracrRNA를 포함하는 RNA를 적합한 고체상 RNA 합성 방법에 의해 합성한다. 재조합 효소 및 sgRNA를 Mg2+를 함유하는 적합한 절단 완충액(예를 들어, 20 mM HEPES pH 7.5, 100 mM KCl, 5 mM MgCl2, 1 mM DTT, 5% 글리세롤)에서 조합하고 표적화 서열 및 PAM 서열에 상보적인 서열에 상보적인 서열을 포함하는 표적 DNA를 도입함으로써 반응을 개시한다. 적합한 분석법(예를 들어, 아가로스 겔 전기영동 후 에티디움 브로마이드 염색(또는 유사하게 작용하는 DNA 삽입제) 및 UV 가시화)에 의해 DNA의 절단을 모니터링한다.
실시예 6.-(일반 프로토콜) 본원에 기재된 엔도뉴클레아제에 대한 PAM 서열 식별/확인
이. 콜라이 용해물 기반 발현 시스템(myTXTL, Arbor Biosciences)에서 발현된 추정 엔도뉴클레아제에 의해 절단될 수 있는 무작위로 생성된 PAM 서열을 포함하는 플라스미드를 시퀀싱하여 PAM 서열을 결정하였다. 이 시스템에서, 이. 콜라이 코돈 최적화된 뉴클레오티드 서열을 T7 프로모터의 제어 하에 PCR 단편으로부터 전사하였다. T7 프로모터 하 tracr 서열과 T7 프로모터에 이어 반복체-스페이서-반복체 서열로 구성된 최소 CRISPR 배열을 가진 두 번째 PCR 단편을 동일한 반응에서 전사하였다. TXTL 시스템에서 엔도뉴클레아제 및 tracr 서열의 성공적인 발현에 이어 CRISPR 배열 가공은 활성의 시험관 내 CRISPR 뉴클레아제 복합체를 제공하였다.
8N 혼합 염기(추정 PAM 서열)가 뒤따르는 최소 배열의 것과 일치하는 스페이서 서열을 함유하는 표적 플라스미드의 라이브러리를 TXTL 반응의 산출물과 함께 인큐베이션하였다. 1-3시간 후, 반응을 중지하고 DNA 클린업 키트, 예를 들어 Zymo DCC, AMPure XP 비드, QiaQuick 등에 의해 DNA를 회수하였다. 어댑터 서열은 엔도뉴클레아제에 의해 절단된 활성 PAM 서열을 가진 DNA에 평활 말단 결찰된 반면, 절단되지 않은 DNA는 결찰에 접근할 수 없었다. 그런 다음 활성 PAM 서열을 포함하는 DNA 세그먼트를 라이브러리 및 어댑터 서열에 특이적인 프라이머를 사용하여 PCR로 증폭하였다. PCR 증폭 산물을 겔에서 분석하여 절단 이벤트에 해당하는 앰플리콘을 식별하였다. 절단 반응의 증폭된 세그먼트는 또한 NGS 라이브러리의 준비를 위한 주형으로 사용하였다. 시작 8N 라이브러리의 하위 집합인 이 결과 라이브러리를 시퀀싱하여 활성 CRISPR 복합체에 대한 올바른 PAM을 포함하는 서열을 밝혀냈다. 단일 RNA 구축물을 사용한 PAM 테스트의 경우, 플라스미드 라이브러리와 함께 시험관 내 전사된 RNA를 추가하고 tracr/최소 CRISPR 배열 주형을 생략한 것을 제외하고는 동일한 절차를 반복하였다. NGS 라이브러리가 준비된 엔도뉴클레아제의 경우, seqLogo(예를 들어, Huber et al. Nat Methods. 2015 Feb;12(2):115-21 참조) 표현을 구성하였으며 [도 27, 38, 29, 30, 31, 32, 33, 34 및 35]에 제시한다. 이러한 표현을 구성하는 데 사용되는 seqLogo 모듈은 DNA 서열 모티프(예를 들어, PAM 서열)의 위치 가중치 매트릭스를 취하고 Schneider 및 Stephens가 도입한 해당 서열 로고를 플로팅한다(예를 들어, Schneider et al. Nucleic Acids Res. 1990 Oct 25;18(20):6097-100 참조). seqLogo 표현에서 서열을 나타내는 문자는 정렬된 서열(예를 들어, PAM 서열)의 각 위치에 대해 서로의 위에 쌓았다. 각 글자의 높이는 빈도에 비례하며, 가장 많이 사용되는 글자가 맨 위에 오도록 정렬하였다.
실시예 7.-(일반 프로토콜) tracrRNA 및 sgRNA 구조의 RNA 접힘
37℃에서 가이드 RNA 서열의 접힌 구조는 문헌[Andronescu et al. Bioinformatics. 2007 Jul 1;23(13):i19-28, 이는 전체가 본원에 참고로 포함됨]의 방법을 사용하여 계산하였다. 본원에 기재된 예시적인 sgRNA의 예측된 구조는 [도 21, 22, 23, 24, 25 및 26]에 제시한다.
실시예 8.-(일반 프로토콜) MG CRISPR 복합체의 시험관 내 절단 효율
엔도뉴클레아제는 프로테아제 결핍 이. 콜라이 B 균주에서 유도성 T7 프로모터로부터의 His 태그된 융합 단백질로서 발현하였다. His 태그된 단백질을 발현하는 세포를 초음파 처리로 용해하고 His 태그된 단백질을 AKTA Avant FPLC(GE Lifescience)의 HisTrap FF 컬럼(GE Lifescience)에서 Ni-NTA 친화성 크로마토그래피로 정제하였다. 용출액은 아크릴아미드 겔(Bio-Rad)에서 SDS-PAGE로 분석하고 InstantBlue Ultrafast coomassie(Sigma-Aldrich)로 염색하였다. 순도는 ImageLab 소프트웨어(Bio-Rad)로 단백질 밴드의 농도계를 사용하여 결정하였다. 정제된 엔도뉴클레아제는 50 mM Tris-HCl, 300 mM NaCl, 1 mM TCEP, 5% 글리세롤; pH 7.5로 구성된 저장 완충액에 투석하고 -80℃에서 보관하였다.
스페이서 서열 및 PAM 서열(예를 들어, 실시예 6에서와 같이 결정됨)을 함유하는 표적 DNA를 DNA 합성에 의해 구축하였다. PAM이 염기를 축퇴시켰을 때를 테스트하기 위해 단일의 대표 PAM을 선택하였다. 표적 DNA는 한쪽 끝으로부터 700 bp에 위치한 PAM 및 스페이서로 PCR 증폭을 통해 플라스미드로부터 유래된 2200 bp의 선형 DNA를 포함하였다. 성공적인 절단으로 700 및 1500 bp의 단편이 생성되었다. 표적 DNA, 시험관 내에서 전사된 단일 RNA, 및 정제된 재조합 단백질을 과량의 단백질 및 RNA와 함께 절단 완충액(10 mM Tris, 100 mM NaCl, 10 mM MgCl2)에서 합하고 5분 내지 3시간, 보통 1시간 동안 인큐베이션하였다. RNAse A를 첨가하고 60분 인큐베이션하여 반응을 중단시켰다. 그런 다음 반응물을 1.2% TAE 아가로스 겔에서 분석하였고 절단된 표적 DNA의 분획을 ImageLab 소프트웨어에서 정량화한다.
실시예 9.-(일반 프로토콜) 이. 콜라이에서 MG CRISPR 복합체의 게놈 절단 활성의 테스트
이. 콜라이는 이중 가닥 DNA 파손을 효율적으로 복구하는 능력이 결여되어 있다. 따라서, 게놈 DNA의 절단은 치명적인 사건이 될 수 있다. 이 현상을 이용하여 스페이서/표적 및 PAM 서열이 게놈 DNA에 통합된 표적 균주에서 엔도뉴클레아제 및 tracrRNA를 재조합적으로 발현함으로써 이. 콜라이에서 엔도뉴클레아제 활성을 테스트하였다.
이 분석에서, PAM 서열은 실시예 6에 기재된 방법에 의해 결정된 바와 같이 테스트되는 엔도뉴클레아제에 대해 특이적이다. tracrRNA의 서열 및 예측된 구조를 기반으로 sgRNA 서열을 결정하였다. 반복체의 5' 말단으로부터 시작하여 8-12 bp(일반적으로 10bp)의 반복체-안티-반복체 쌍을 선택하였다. 반복체의 나머지 3' 말단과 tracrRNA의 5' 말단을 테트라루프로 교체하였다. 일반적으로 테트라루프는 GAAA였지만, 특히 GAAA 서열이 접힘을 방해할 것으로 예상되는 경우 다른 테트라루프를 사용할 수 있다. 이 경우 TTCG 테트라루프를 사용하였다.
게놈 DNA에 통합된 PAM 서열을 갖는 조작된 균주를 엔도뉴클레아제를 코딩하는 DNA로 형질전환시켰다. 그런 다음 형질전환체를 화학적 적격한 상태로 만들고 표적 서열에 특이적인("온 타겟(on target)") 또는 표적에 비특이적인("비표적") 50 ng의 단일 가이드 RNA로 형질전환시켰다. 열충격 후, 37 ℃에서 2시간 동안 SOC에서 형질전환체를 회수하였다. 그런 다음 유도 배지에서 배양한 5배 희석 시리즈에 의해 뉴클레아제 효율을 결정하였다. 콜로니는 희석 시리즈로부터 3회 정량화하였다.
실시예 10a.-(일반 프로토콜) 포유동물 세포에서 MG CRISPR 복합체의 게놈 절단 활성의 테스트
포유동물 세포에서 표적화 및 절단 활성을 보여주기 위해, MG Cas 이펙터 단백질 서열을 2개의 포유동물 발현 벡터에서 테스트하였다: (a) C-말단 SV40 NLS 및 2A-GFP 태그가 있는 하나, (b) GFP 태그가 없고 2개의 SV40 NLS 서열(N-말단에 하나, C-말단에 하나)이 있는 하나. 일부 경우에, 엔도뉴클레아제를 코딩하는 뉴클레오티드 서열은 포유동물 세포에서의 발현을 위해 코돈 최적화하였다.
표적화 서열이 부착된 상응하는 단일 가이드 RNA 서열(sgRNA)을 제2 포유동물 발현 벡터에 클로닝한다. 2개의 플라스미드는 HEK293T 세포에 공동형질감염시킨다. 발현 플라스미드와 sgRNA 표적화 플라스미드를 HEK293T 세포에 공동 형질감염시킨 후 72시간에, DNA를 추출하여 NGS 라이브러리 제조에 사용한다. 포유동물 세포에서 효소의 표적화 효율을 입증하기 위해 표적 부위의 시퀀싱에서 삽입-결실을 통해 퍼센트 NHEJ를 측정한다. 각 단백질의 활성을 테스트하기 위해 최소 10개의 서로 다른 표적 부위를 선택하였다.
실시예 10b. (일반 프로토콜) 포유동물 세포에서 MG CRISPR 복합체의 게놈 절단 활성의 테스트
포유동물 세포에서 표적화 및 절단 활성을 보여주기 위해, MG Cas 이펙터 단백질 서열을 2개의 포유동물 발현 벡터로 클로닝하였다: (a) 측면 N 및 C-말단 SV40 NLS 서열, C-말단 His 태그, 및 His 태그 뒤의 C 말단에 2A-GFP 태그가 있는 하나(백본 1) 및 (b) 측면 NLS 서열 및 C-말단 His 태그가 있지만 T2A GFP 태그는 없는 하나(백본 2). 일부 경우에, 엔도뉴클레아제를 코딩하는 뉴클레오티드 서열은 천연 서열이거나, 이. 콜라이에서의 발현을 위해 코돈 최적화하거나, 포유동물 세포에서의 발현을 위해 코돈-최적화하였다.
표적화 서열이 부착된 상응하는 단일 가이드 RNA 서열(sgRNA)을 제2 포유동물 발현 벡터에 클로닝하였다. 2개의 플라스미드를 HEK293T 세포에 공동 형질감염시켰다. 발현 플라스미드와 sgRNA 표적화 플라스미드를 HEK293T 세포에 공동 형질감염시킨 후 72시간에, DNA를 추출하여 NGS 라이브러리 제조에 사용하였다. 포유동물 세포에서 효소의 표적화 효율을 입증하기 위해 표적 부위의 시퀀싱에서 삽입-결실을 통해 퍼센트 NHEJ를 측정하였다. 각 단백질의 활성을 테스트하기 위해 약 7-12개의 서로 다른 표적 부위를 선택하였다. 활성 후보를 식별하기 위해 5% 삽입-결실의 임의 임계값을 사용하였다.
실시예 11.- MG1 패밀리 구성원의 특성화
PAM 특이성, tracrRNA/sgRNA 검증
MG1 패밀리 엔도뉴클레아제 시스템의 표적화된 엔도뉴클레아제 활성을 실시예 6에 기재된 myTXTL 시스템을 사용하여 확인하였다. 이 분석에서, 절단된 표적 플라스미드의 PCR 증폭은 [도 17-20]에 나타난 바와 같이 겔에서 약 170 bp로 이동하는 산물을 산출한다. MG1-4(이중 가이드: 겔 1, 레인 3 참조, 단일 가이드: 겔 6 레인 2 참조), MG1-5(겔 2 레인 10), MG1-6(이중 가이드: 겔 5 레인 6 참조, 단일 가이드: 겔 6 레인 5 참조) 및 MG1-7(이중 가이드: 겔 3 레인 13 참조, 단일 가이드: 겔 3 레인 2 참조)(각각 단백질 서열 번호 1-4)에 대해 증폭 산물이 관찰되었다. PCR 산물을 시퀀싱하여 표 2에 나타낸 바와 같이 이들 효소에 대한 활성 PAM 서열을 밝혀냈다.
[표 2]
Figure pct00002
tracrRNA의 서열 및 예측된 구조를 기반으로 합성 단일 가이드 RNA(sgRNA)를 설계하였으며 서열 번호 5461-5464로 제시한다. sgRNA로 실시예 6의 PAM 서열 스크린을 반복하였다. 이 실험의 결과를 또한 표 2에도 제시하며, 이는 sgRNA를 사용할 때 PAM 특이성이 약간 변경되었음을 나타낸다.
시험관 내 표적화된 엔도뉴클레아제 활성
PAM 서열 CAGGAAGG를 갖는 표적 DNA에 대한 MG1-4 엔도뉴클레아제 시스템(서열 번호 5461의 sgRNA를 갖는 단백질 서열 번호 1)의 시험관 내 활성을 실시예 8의 방법을 사용하여 확인하였다. 서열의 N을 대체하는 18-24 nt의 다양한 스페이서/표적화 서열 길이를 가진 상기 보고된 단일 가이드 서열(서열 번호 5461)을 사용하였다. 결과는 [도 10]에 나타내며, 여기서 좌측 패널은 상이한 표적화 서열 길이(18-24nt)를 갖는 상응하는 단일 가이드 sgRNA와 조합된 MG1-4에 의한 DNA 절단을 나타내는 겔을 나타내고, 우측 패널은 막대 그래프로서 정량화된 동일한 데이터를 나타낸다. 데이터는 18-24 뉴클레오티드의 표적화 서열이 MG1-4/sgRNA 시스템에서 기능적임을 입증하였다.
박테리아 세포에서 표적화된 엔도뉴클레아제 활성
MG1-4 엔도뉴클레아제 시스템(단백질 서열 번호 1, sgRNA 서열 번호 5461)의 생체 내 활성을 PAM 서열 CAGGAAGG로 실시예 9에서와 같이 테스트하였다. 형질전환된 이. 콜라이를 연속 희석하여 플레이팅하였고, 결과(왼쪽 패널에 이. 콜라이 연속 희석 및 오른쪽 패널에 정량화된 성장을 나타냄)를 [도 11]에 제시한다. 비표적 sgRNA를 발현하는 이. 콜라이와 비교하여 온 타겟 sgRNA를 발현하는 이. 콜라이의 성장에 있어 상당한 감소는 이. 콜라이 세포에서 게놈 DNA가 엔도뉴클레아제에 의해 특이적으로 절단되었음을 나타낸다.
포유동물 세포에서 표적화된 엔도뉴클레아제 활성 (a)
실시예 10의 방법을 사용하여 포유동물 세포에서 표적화 및 절단 활성을 입증하였다. MG1-4(단백질 서열 번호 5527) 및 MG1-6(단백질 서열 번호 5529) 서열을 코딩하는 오픈 리딩 프레임을 2개의 포유동물 발현 벡터, C-말단 SV40 NLS 및 2A-GFP 태그가 있는 하나(이. 콜라이 MG-BB) 및 GFP 태그가 없고 N-말단에 하나, C-말단에 하나로 2개의 NLS 서열이 있는 하나(이. 콜라 pMG5-BB)로 클로닝하였다. MG1-6의 경우, 오픈 리딩 프레임을 포유동물 발현을 위해 추가로 코돈 최적화하고(서열 번호 5589) 2-NLS 플라스미드 백본(MG-16hs)에 클로닝하였다. 이 실험의 결과를 [도 12]에 나타낸다. 엔도뉴클레아제 발현 벡터를 엔도뉴클레아제에 특이적인 tracr 서열 및 표 3-4로부터 선택된 가이드 서열을 가진 sgRNA(예를 들어, 서열 번호 5512 또는 5515)를 발현하기 위한 제2 벡터와 함께 HEK293T 세포에 공동 형질감염시켰다. 공동 형질감염 후 72시간에, DNA를 추출하여 NGS 라이브러리 준비에 사용하였다. 절단 활성은 표적 부위의 서열에 근접한 내부 결실의 출현(NHEJ 남은 부분)에 의해 검출하였다. 포유동물 세포에서 효소의 표적화 효율을 입증하기 위해 표적 부위의 시퀀싱에서 삽입-결실을 통해 퍼센트 NHEJ를 측정하였으며 [도 12]에 제시한다.
[표 3]
Figure pct00003
[표 4]
Figure pct00004
포유동물 세포에서 표적화된 엔도뉴클레아제 활성 (b)
PAM nRRRAA(서열 번호 5527)로 게놈 내의 위치를 테스트하기 위해 MG1-4 표적 유전자좌를 선택하였다. 선택된 표적 부위에 상응하는 스페이서를 실시예 10b에 기재된 포유동물 벡터 시스템 백본 2 내 sgRNA 스캐폴드에 클로닝하였다. 부위는 아래 표 4a에 나열한다. 다양한 표적 부위에서 MG1-4의 활성을 표 4a 및 [도 37]에 나타낸다.
[표 4a]
Figure pct00005
PAM nnRRAC(서열 번호 5529)로 게놈 내의 위치를 테스트하기 위해 MG1-6 표적 유전자좌를 선택하였다. 선택된 표적 부위에 상응하는 스페이서를 실시예 10b에 기재된 포유동물 벡터 시스템 백본 2 내 sgRNA 스캐폴드에 클로닝하였다. 부위는 아래 표 4b에 나열한다. 다양한 표적 부위에서 MG1-6의 활성을 표 4b 및 [도 38]에 나타낸다.
[표 4b]
Figure pct00006
PAM nRRRAAG(서열 번호 5515)로 게놈 내의 위치를 테스트하기 위해 MG1-7 표적 유전자좌를 선택하였다. 선택된 표적 부위에 상응하는 스페이서를 실시예 10b에 기재된 포유동물 벡터 시스템 백본 2 내 sgRNA 스캐폴드에 클로닝하였다. 부위는 아래 표 4c에 나열한다. 다양한 표적 부위에서 MG1-7의 활성을 표 4c 및 [도 39]에 나타낸다.
[표 4c]
Figure pct00007
실시예 12. - MG2 패밀리 구성원의 특성화
PAM 특이성, tracrRNA/sgRNA 검증
MG2 패밀리 구성원의 표적화된 엔도뉴클레아제 활성을 실시예 6에 기재된 myTXTL 시스템을 사용하여 확인하였다. 이 분석의 결과는 [도 17-20]에 나타낸다. [도 17-20]에 나타낸 분석에서, 라이브러리를 성공적으로 절단하는 활성 단백질은 겔에서 약 170 bp의 밴드를 생성한다. MG2-1(겔 2, 레인 11 및 겔 4 레인 6 참조) 및 MG2-7(겔 11 레인 10 참조)(각각 서열 번호 320 및 321 참조)에 대해 증폭 산물이 관찰되었다. PCR 산물을 시퀀싱하여 아래 표 5에서 활성 PAM 서열을 밝혀냈다.
[표 5]
Figure pct00008
박테리아 세포에서 표적화된 엔도뉴클레아제 활성
sgRNA와의 MG2-7 엔도뉴클레아제 시스템(엔도뉴클레아제 서열 번호 321; sgRNA 서열 번호 5465) 및 AGCGTAAG PAM 서열의 생체 내 활성을 실시예 9에서 기재된 방법을 사용하여 확인하였다. 형질전환된 이. 콜라이를 연속 희석하여 플레이팅하였고, 결과(왼쪽 패널에 이. 콜라이 연속 희석 및 오른쪽 패널에 정량화된 성장을 나타냄)는 [도 34]에 제시한다. 비표적 sgRNA를 발현하는 이. 콜라이와 비교하여 온 타겟 sgRNA를 발현하는 이. 콜라이의 성장에 있어 상당한 감소는 이. 콜라이 세포에서 게놈 DNA가 MG1-4 엔도뉴클레아제에 의해 특이적으로 절단되었음을 나타낸다.
실시예 13.- MG3 패밀리 구성원의 특성화
PAM 특이성, tracrRNA/sgRNA 검증
MG3 패밀리 구성원의 표적화된 엔도뉴클레아제 활성을 tracr 서열 및 CRISPR 배열을 사용하여 실시예 6에 기재된 바와 같이 myTXTL 시스템을 사용하여 확인하였다. 이 분석에서, 절단된 표적 플라스미드의 PCR 증폭은 [도 17-20]에 나타난 바와 같이 겔에서 약 170 bp로 이동하는 산물을 산출한다. MG3-6(이중 가이드: 겔 2 레인 8 참조; 단일 가이드: 겔 3 레인 3 참조), MG3-7(이중 가이드: 겔 2 레인 3 참조, 단일 가이드: 겔 3 레인 4 참조), 및 MG3-8(이중 가이드: 겔 9 레인 5 참조)(각각 서열 번호 421, 422 및 423)에 대해 증폭 산물이 관찰되었다. PCR 산물을 시퀀싱하여 아래 표 6에서 활성 PAM 서열을 밝혀냈다.
[표 6]
Figure pct00009
tracrRNA의 서열 및 예측된 구조를 기반으로 합성 단일 가이드 RNA(sgRNA)를 설계하였으며 서열 번호 5466-5467로 제시한다. sgRNA로 실시예 6의 PAM 서열 스크린을 반복하였다. 이 실험의 결과를 또한 표 6에 제시하며, 이는 sgRNA를 사용할 때 PAM 특이성이 약간 변경되었음을 나타낸다.
시험관 내 표적화된 엔도뉴클레아제 활성
MG3-6 엔도뉴클레아제 시스템(엔도뉴클레아제 서열 번호 421)의 시험관 내 활성을 PAM 서열 GTGGGTTA로 실시예 8의 방법을 사용하여 확인하였다. 서열의 N을 대체하는 18-24 nt의 다양한 스페이서/표적화 서열 길이를 가진 상기 보고된 단일 가이드 서열(서열 번호 5466)을 사용하였다. 결과는 [도 13]에 나타내며, 여기서 상단 패널은 상이한 표적화 서열 길이(18-24nt)를 갖는 상이한 sgRNA와 조합된 MG3-6에 의한 DNA 절단을 나타내는 겔을 나타내고, 하단 패널은 막대 그래프로서 정량화된 동일한 데이터를 나타낸다. 데이터는 18-24 뉴클레오티드의 표적화 서열이 MG3-6/sgRNA 시스템에서 기능적임을 입증하였다.
박테리아 세포에서 표적화된 엔도뉴클레아제 활성
MG3-7 엔도뉴클레아제 시스템(단백질 서열 번호 422, sgRNA 서열 번호 5467)의 생체 내 활성을 PAM 서열 TGGACCTG 로 실시예 9에서와 같이 테스트하였다. 형질전환된 이. 콜라이를 연속 희석하여 플레이팅하였고, 결과(상단 패널에 이. 콜라이 연속 희석 및 하단 패널에 정량화된 성장을 나타냄)는 [도 14]에 제시한다. 비표적 sgRNA를 발현하는 이. 콜라이와 비교하여 온 타겟 sgRNA를 발현하는 이. 콜라이의 성장에 있어 상당한 감소는 게놈 DNA가 MG3-7 엔도뉴클레아제에 의해 특이적으로 절단되고 있었음을 나타낸다.
포유동물 세포에서 표적화된 엔도뉴클레아제 활성 (a)
실시예 10의 방법을 사용하여 포유동물 세포에서 표적화 및 절단 활성을 입증하였다. MG3-7(단백질 서열 번호 422)을 코딩하는 오픈 리딩 프레임을 2개의 포유동물 발현 벡터, C-말단 SV40 NLS 및 2A-GFP 태그가 있는 하나(이. 콜라이 MG-BB) 및 GFP 태그가 없고 N-말단에 하나, C-말단에 하나로 2개의 NLS 서열이 있는 하나(이. 콜라 pMG5-BB)로 클로닝하였다. 엔도뉴클레아제 발현 벡터를 표 7로부터 선택된 가이드 서열을 가진 상기 sgRNA를 발현하기 위한 제2 벡터와 함께 HEK293T 세포에 공동 형질감염시켰다. 이 실험의 결과를 [도 12]에 나타낸다. 공동 형질감염 후 72시간에, DNA를 추출하여 NGS 라이브러리 준비에 사용하였다. 절단 활성은 표적 부위에 근접한 내부 결실의 출현(NHEJ 남은 부분)에 의해 검출하였다. 결과는 [도 15]에 제시한다.
sgRNA 플라스미드 상에 코딩되는 표적은 하기 표 7에 나타낸다.
[표 7]
Figure pct00010
포유동물 세포에서 표적화된 엔도뉴클레아제 활성 (b)
PAM nRGGTT(서열 번호 5532)로 게놈 내의 위치를 테스트하기 위해 MG3-6 표적 유전자좌를 선택하였다. 선택된 표적 부위에 상응하는 스페이서를 실시예 10b에 기재된 포유동물 벡터 시스템 백본 1 내 sgRNA 스캐폴드에 클로닝하였다. 부위는 아래 표 7a에 나열한다. 다양한 표적 부위에서 MG3-6의 활성을 표 7a 및 [도 40]에 나타낸다.
[표 7a]
Figure pct00011
PAM nnRnTAC(서열 번호 6303)로 게놈 내의 위치를 테스트하기 위해 MG3-7 표적 유전자좌를 선택하였다. 선택된 표적 부위에 상응하는 스페이서를 실시예 10b에 기재된 포유동물 벡터 시스템 내 sgRNA 스캐폴드에 클로닝하였다. 부위는 아래 표 7b에 나열한다. 다양한 표적 부위에서 MG3-7의 활성을 표 7b 및 [도 41]에 나타낸다.
[표 7b]
Figure pct00012
PAM nnRGGTT(서열 번호 5534)로 게놈 내의 위치를 테스트하기 위해 MG3-8 표적 유전자좌를 선택하였다. 선택된 표적 부위에 상응하는 스페이서를 실시예 10b에 기재된 포유동물 벡터 시스템 백본 1 내 sgRNA 스캐폴드에 클로닝하였다. 부위는 아래 표 7c에 나열한다. 다양한 표적 부위에서 MG3-8의 활성을 표 7c 및 [도 42]에 나타낸다.
[표 7c]
Figure pct00013
실시예 13.- MG4 패밀리 구성원의 특성화
PAM 특이성, tracrRNA/sgRNA 검증
MG4 패밀리 엔도뉴클레아제 시스템의 표적화된 엔도뉴클레아제 활성을 실시예 6에 기재된 바와 같이 myTXTL 시스템을 사용하여 확인하였다. 이 분석에서, 절단된 표적 플라스미드의 PCR 증폭은 [도 17-20]에 나타난 바와 같이 겔에서 약 170 bp로 이동하는 산물을 산출한다. MG4-2에 대해 증폭 산물이 관찰되었다(이중 가이드: 겔 2 레인 9 참조; 단일 가이드: 겔 10 레인 7 참조)(서열 번호 432). PCR 산물을 시퀀싱하여 아래 표 8에 나타낸 활성 PAM 서열을 밝혀냈다.
[표 8]
Figure pct00014
실시예 14.- MG14 패밀리 구성원의 특성화
PAM 특이성, tracrRNA/sgRNA 검증
MG14 패밀리 구성원의 표적화된 엔도뉴클레아제 활성을 실시예 6에 기재된 바와 같이 myTXTL 시스템을 사용하여 확인하였다. 이 분석에서, 절단된 표적 플라스미드의 PCR 증폭은 [도 17-20]에 나타난 바와 같이 겔에서 약 170 bp로 이동하는 산물을 산출한다. MG14-1 에 대해 증폭 산물이 관찰되었다(이중 가이드: 겔 1 레인 4 참조; 단일 가이드: 겔 3 레인 8 참조)(서열 번호 678). PCR 산물을 시퀀싱하여 아래 표 9에서 PAM 서열을 밝혀냈다.
[표 9]
Figure pct00015
박테리아 세포에서 표적화된 엔도뉴클레아제 활성
sgRNA와의 MG14-1 엔도뉴클레아제 시스템(엔도뉴클레아제 서열 번호 678; sgRNA 서열 번호 5469) 및 GGCGGGGA PAM 서열의 생체 내 활성을 실시예 9에 기재된 방법을 사용하여 확인하였다. 형질전환된 이. 콜라이를 연속 희석하여 플레이팅하였고, 결과(좌측 패널에 이. 콜라이 연속 희석 및 우측 패널에 정량화된 성장을 나타냄)는 [도 35]에 제시한다. 비표적 sgRNA를 발현하는 이. 콜라이와 비교하여 온 타겟 sgRNA를 발현하는 이. 콜라이의 성장에 있어 상당한 감소는 게놈 DNA가 이. 콜라이 세포에서 MG1-4 엔도뉴클레아제에 의해 특이적으로 절단되었음을 나타낸다.
포유동물 세포에서 표적화된 엔도뉴클레아제 활성
PAM nnnnGGTA(서열 번호 5535)로 게놈 내의 위치를 테스트하기 위해 MG14-1 표적 유전자좌를 선택하였다. 선택된 표적 부위에 상응하는 스페이서를 실시예 10b에 기재된 포유동물 벡터 시스템 백본 2 내 sgRNA 스캐폴드에 클로닝하였다. 부위는 아래 표 9a에 나열한다. 다양한 표적 부위에서 MG14-1의 활성을 표 9a 및 [도 43]에 나타낸다.
[표 9a]
Figure pct00016
실시예 15.- MG15 패밀리 구성원의 특성화
PAM 특이성, tracrRNA/sgRNA 검증
MG15 패밀리 구성원의 표적화된 엔도뉴클레아제 활성을 실시예 6에 기재된 바와 같이 myTXTL 시스템을 사용하여 확인하였다. 이 분석에서, 절단된 표적 플라스미드의 PCR 증폭은 [도 17-20]에 나타난 바와 같이 겔에서 약 170 bp로 이동하는 산물을 산출한다. MG15-1에 대해 증폭 산물이 관찰되었다(이중 가이드: 겔 7 레인 7 참조; 단일 가이드: 겔 3 레인 9 참조). PCR 산물을 시퀀싱하여 아래 표 10에서 열거된 활성 PAM 서열 특이성을 밝혀냈다.
[표 10]
Figure pct00017
시험관 내 활성
MG15-1 엔도뉴클레아제 시스템(단백질 서열 번호 930; sgRNA 서열 번호 5470)의 시험관 내 활성을 PAM 서열 GGGTCAAA 로 실시예 8의 방법을 사용하여 테스트하였다. (서열의 N을 대체하는) 18-24 nt의 다양한 스페이서/표적화 서열 길이를 가진 상기 보고된 단일 가이드 서열(서열 번호 5470)을 사용하였다. 결과는 [도 16]에 나타내며, 여기서 상단 패널은 상이한 표적화 서열 길이(18-24nt)를 갖는 상이한 sgRNA와 조합된 MG15-1에 의한 DNA 절단을 나타내는 겔을 나타내고, 하단 패널은 막대 그래프로서 정량화된 동일한 데이터를 나타낸다. 데이터는 18-24 뉴클레오티드의 표적화 서열이 MG3-6/sgRNA 시스템과 기능적임을 입증하였다.
박테리아 세포에서 표적화된 엔도뉴클레아제 활성
sgRNA와의 MG15-1 엔도뉴클레아제 시스템(엔도뉴클레아제 서열 번호 930; sgRNA 서열 번호 5470) 및 GGGTCAAA PAM 서열의 생체 내 활성을 실시예 9에 기재된 방법을 이용하여 확인하였다. 형질전환된 이. 콜라이를 연속 희석하여 플레이팅하였고, 결과(좌측 패널에 이. 콜라이 연속 희석 및 우측 패널에 정량화된 성장을 나타냄)는 [도 35]에 제시한다. 비표적 sgRNA를 발현하는 이. 콜라이와 비교하여 온 타겟 sgRNA를 발현하는 이. 콜라이의 성장에 있어 상당한 감소는 게놈 DNA가 이. 콜라이 세포에서 MG1-4 엔도뉴클레아제에 의해 특이적으로 절단되었음을 나타낸다.
실시예 16.- MG16 패밀리 구성원의 특성화
PAM 특이성, tracrRNA / sgRNA 검증
MG16 패밀리 구성원의 표적화된 엔도뉴클레아제 활성을 실시예 6에 기재된 바와 같이 myTXTL 시스템을 사용하여 확인하였다. 이 분석에서, 절단된 표적 플라스미드의 PCR 증폭은 [도 17-20]에 나타난 바와 같이 겔에서 약 170 bp로 이동하는 산물을 산출한다. MG16-2에 대해 증폭 산물이 관찰되었다(겔 7 레인 17 참조). PCR 산물을 시퀀싱하여 아래 표 11에 열거된 활성 PAM 서열 특이성을 밝혀냈다.
[표 11]
Figure pct00018
실시예 17.- MG18 패밀리 구성원의 특성화
PAM 특이성, tracrRNA/sgRNA 검증
MG18 패밀리 구성원의 표적화된 엔도뉴클레아제 활성을 실시예 6에 기재된 바와 같이 myTXTL 시스템을 사용하여 확인하였다. 이 분석에서, 절단된 표적 플라스미드의 PCR 증폭은 [도 17-20]에 나타난 바와 같이 겔에서 약 170 bp로 이동하는 산물을 산출한다. MG18-1에 대해 증폭 산물이 관찰되었다(이중 가이드: 겔 9 레인 9 참조; 단일 가이드 겔 11 레인 12참조). PCR 산물을 시퀀싱하여 아래 표 12에 열거된 활성 PAM 서열 특이성을 밝혀냈다.
[표 12]
Figure pct00019
포유동물 세포에서 표적화된 엔도뉴클레아제 활성
PAM nRWART(서열 번호 5537)로 게놈 내의 위치를 테스트하기 위해 MG18-1 표적 유전자좌를 선택하였다. 선택된 표적 부위에 상응하는 스페이서를 실시예 10b에 기재된 포유동물 벡터 시스템 백본 1 내 sgRNA 스캐폴드에 클로닝하였다. 부위는 아래 표 12a에 나열한다. 다양한 표적 부위에서 MG18-1의 활성을 표 12a 및 [도 44]에 나타낸다.
[표 12a]
Figure pct00020
실시예 18.- MG21 패밀리 구성원의 특성화
PAM 특이성, tracrRNA/sgRNA 검증
MG21 패밀리 구성원의 표적화된 엔도뉴클레아제 활성을 실시예 6에 기재된 바와 같이 myTXTL 시스템을 사용하여 확인하였다. 이 분석에서, 절단된 표적 플라스미드의 PCR 증폭은 [도 17-20]에 나타난 바와 같이 겔에서 약 170 bp로 이동하는 산물을 산출한다. MG21-1에 대해 증폭 산물이 관찰되었다(겔 11 레인 2 참조). PCR 산물을 시퀀싱하여 아래 표 13에 열거된 활성 PAM 서열 특이성을 밝혀냈다.
[표 13]
Figure pct00021
실시예 19.- MG22 패밀리 구성원의 특성화
PAM 특이성, tracrRNA/sgRNA 검증
MG21 패밀리 구성원의 표적화된 엔도뉴클레아제 활성을 실시예 6에 기재된 바와 같이 myTXTL 시스템을 사용하여 확인하였다. 이 분석에서, 절단된 표적 플라스미드의 PCR 증폭은 [도 17-20]에 나타난 바와 같이 겔에서 약 170 bp로 이동하는 산물을 산출한다. [도 17-20]에 나타낸 분석에서, 라이브러리를 성공적으로 절단하는 활성 단백질은 겔에서 약 170 bp의 밴드를 생성한다. MG22-1에 대해 증폭 산물이 관찰되었다(겔 11, 레인 3 참조)(단백질 서열 번호 1656). PCR 산물을 시퀀싱하여 아래 표 14에 열거된 활성 PAM 서열 특이성을 밝혀냈다.
[표 14]
Figure pct00022
실시예 20.- MG23 패밀리 구성원의 특성화
PAM 특이성, tracrRNA/sgRNA 검증
MG22 패밀리 구성원의 표적화된 엔도뉴클레아제 활성을 실시예 6에 기재된 바와 같이 myTXTL 시스템을 사용하여 확인하였다. 이 분석에서, 절단된 표적 플라스미드의 PCR 증폭은 [도 17-20]에 나타난 바와 같이 겔에서 약 170 bp로 이동하는 산물을 산출한다. MG23-1에 대해 증폭 산물이 관찰되었다(겔 11 레인 4 참조). PCR 산물을 시퀀싱하여 아래 표 15에 열거된 이들 효소에 대한 활성 PAM 서열 특이성을 밝혀냈다.
[표 15]
Figure pct00023
실시예 21. MG21-MG23 패밀리 구성원의 포유동물 활성
포유동물 세포에서 표적화 및 절단 활성을 보여주기 위해, 단백질 서열을 측면 N 및 C-말단 SV40 NLS 서열, C-말단 His 태그, 및 His 태그 뒤의 C 말단에 2A-GFP 태그가 있는 포유동물 발현 벡터(백본 1) 및 측면 NLS 서열 및 C-말단 His 태그가 있지만 2A GFP 태그는 없는 발현 벡터(백본 2)로 클로닝하였다. 단백질에 대한 DNA 서열은 천연 서열, 이. 콜라이 코돈 최적화된 서열, 또는 포유동물 코돈 최적화된 서열일 수 있다. 관심의 유전자 표적이 있는 단일 가이드 RNA 서열을 또한 포유동물 발현 벡터에 클로닝한다. 2개의 플라스미드를 HEK293T 세포에 공동 형질감염시킨다. 발현 플라스미드와 sgRNA 표적화 플라스미드를 HEK293T 세포에 공동 형질감염시킨 후 72시간에, DNA를 추출하여 NGS 라이브러리 제조에 사용한다. 포유동물 세포에서 효소의 표적화 효율을 입증하기 위해 표적 부위의 시퀀싱에서 삽입-결실을 통해 퍼센트 NHEJ를 측정한다. 각 단백질의 활성을 테스트하기 위해 약 7-12개의 서로 다른 표적 부위를 선택하였다. 활성 후보를 식별하기 위해 5% 삽입-결실의 임의 임계값을 사용한다.
PAM nnRnR로 위치를 테스트하기 위해 MG21-1 표적 유전자좌를 선택하였다. 선택된 표적 부위에 상응하는 스페이서를 상기 기재된 포유동물 벡터 시스템 백본 2 내 sgRNA 스캐폴드에 클로닝하였다. 부위는 아래 표 16에 나열한다.
[표 16]
Figure pct00024
PAM nnRCnT로 위치를 테스트하기 위해 MG22-1 표적 유전자좌를 선택하였다. 선택된 표적 부위에 상응하는 스페이서를 상기 기재된 포유동물 벡터 시스템 백본 2 내 sgRNA 스캐폴드에 클로닝하였다. 부위는 아래 표 17에 나열한다.
[표 17]
Figure pct00025
PAM nRRA로 위치를 테스트하기 위해 MG23-1 표적 유전자좌를 선택하였다. 선택된 표적 부위에 상응하는 스페이서를 상기 기재된 포유동물 벡터 시스템 백본 2 내 sgRNA 스캐폴드에 클로닝하였다. 부위는 아래 표 18에 나열한다.
[표 18]
Figure pct00026
실시예 22. - 본원에 기재된 시스템을 사용한 T 세포 편집
다양한 MG 시스템이 포유동물 세포에서 기능한다는 것을 확립한 후, 인간 T 세포 게놈을 편집하기 위한 그들의 유용성을 테스트하고자 하였다. 이 목적을 위해 MG3-6(단백질 서열 서열 번호421) 및 MG3-8(단백질 서열 서열 번호423)을 먼저 사용하기 위해, 인간 세포에서의 가이드 활성을 기반으로 하여 MG3-6 컨센서스 PAM 서열은 5'-NNRGRYY-3'(서열 번호 5949)임을 결정하였다. MG3-8에 대한 PAM은 이전에 5'-NNRGGTT-3'(서열 번호 5534)로 결정되었다.
TRAC 위치 표적화
편집된 세포를 생성하기 위해, MG3-6(예를 들어, 서열 번호 5950-5958에 나타낸 스페이서, 실험에서 MG3-6 가이드 1-9) 및 MG3-8(예를 들어, 서열 번호 5959-5965에 나타낸 스페이서, 실험에서 "MG3-8 가이드 1-7"로 지칭됨) 둘 모두에 대해 T 세포에서 TRAC 유전자좌를 표적화하는 적절한 스페이서 서열을 설계하였다. MG3-6에 대해 서열 번호 5466 sgRNA 및 MG3-8에 대해 서열 번호 6304 sgRNA(아래에 나열됨)의 배경에 스페이서 서열을 사용하였다.
Figure pct00027
먼저 각 엔도뉴클레아제와 호환되는 TRAC 유전자를 표적화하는 데 사용되는 스페이서의 최적 길이를 결정하고자 하였다. MG3-6의 경우, 서열이 단축될 때 5' PAM 원위 말단으로부터 절두하는 22-16 뉴클레오티드 범위의 길이를 갖는 상기 스페이서의 하위 집합(서열 번호 5953-5957, 실험에서 "MG3-6 가이드 4-8"이라고 지칭함)을 가진 sgRNA를 뉴클레오펙션시켰다. 이러한 스페이서 보유 가이드 RNA는 Lonza 4D 전기천공기 및 용액 P3를 사용하여 조건당 200K 1차 T 세포(이전에 CD2/3/28 비드로 확장됨)에 뉴클레오펙션시켜, 26 또는 52 또는 104 pmol의 MG3-6 단백질을 각각 32, 64 또는 128 pmol의 가이드 RNA와 함께 전달하였다. 3일 후에 T 세포로부터 게놈 DNA를 수거하고 NGS로 분석하였다. 데이터는 [도 56]에 제시하며, 이는 22-16 뉴클레오티드로부터 MG3-6 가이드 4-8을 절두한 효과를 보여주며, MG3-6에 대해 19-22 뉴클레오티드 길이가 더 짧은 스페이서보다 우수한 성능을 나타냄을 입증한다.
MG3-8로 동일한 스페이서 길이 최적화 실험을 수행하기 위해, 서열이 단축될 때 5' PAM 원위 말단으로부터 절두하는 22-16 뉴클레오티드 범위의 길이를 갖는 상기 스페이서의 하위 집합(서열 번호 5960-5961 및 5963-5964, 실험에서 "MG3-8 가이드 2, 3, 5, 및 8 "이라고 지칭함)를 가진 sgRNA를 뉴클레오펙션시켰다. 이러한 스페이서 보유 가이드 RNA는 Lonza 4D 전기천공기 및 용액 P3를 사용하여 조건당 200K 1차 T 세포(이전에 CD2/3/28 비드로 확장됨)에 뉴클레오펙션시켜 104 pmol의 MG3-8 단백질 및 120 pmol의 gRNA를 전달하였다. 3일 후에 T 세포로부터 게놈 DNA를 수거하여 NGS로 분석하였다. 데이터는 [도 57]에 제시하며, 이는 22-16 뉴클레오티드로부터 MG3-8 가이드 2, 3, 5 및 8을 절두한 효과를 보여주며, MG3-8에 대해 19-22 뉴클레오티드 길이가 더 짧은 스페이서보다 우수한 성능을 나타냄을 입증한다.
TRAC를 표적화하는 것으로 보이는 스페이서 서열을 식별한 후, TRAC 유전자에서 삽입-결실을 유도하고 세포에서 TRAC 발현을 방해하는 이러한 스페이서의 능력을 테스트하였다. 104 pmol의 MG3-6 단백질 및 128 pmol의 가이드 RNA를 사용하여 상기와 같이 가장 우수한 성능의 22 뉴클레오티드 스페이서 보유 sgRNA(MG3-6 가이드 6, 서열 번호 5955; 및 MG3-8 가이드 5, 서열 번호 5963)를 1차 T 세포에 뉴클레오펙션시켰다. 회수 3일 후에 게놈 DNA를 수거하고 삽입-결실의 출현에 대해 NGS로 분석하거나 항-TCR-알파 사슬 Ab를 사용한 유세포 분석으로 분석하였다. NGS 삽입-결실 분석은 [도 58]에 나타내며, 이는 MG3-6 및 MG3-8 sgRNA/효소 조합이 모두 TRAC 유전자에서 약 90% 이상의 삽입-결실 빈도를 생성함을 입증한다. 유동 세포측정 분석은 [도 59]에 나타내며, 이는 MG3-6 sgRNA/효소 조합이 약 95% TCR 음성 세포를 생성함을 입증한다.
유동 세포측정법에 의해 MG3-6/가이드 6 조합이 효과적으로 TRAC 녹아웃을 생성하는 것을 관찰한 후, 형질감염 인핸서 또는 더 높은 가이드 농도의 추가가 성능이 낮은 MG3-6 TRAC 스페이서 보유 가이드에 대한 녹아웃 효율을 개선할 수 있는지 여부를 테스트하였다. 따라서 상기와 같이 T 세포를 형질감염시켜, 52 pmol의 MG3-6 단백질과 60 pmol의 가이드 RNA 및 1 μL IDT 형질감염 인핸서(활용되는 경우) 또는 MG3-6 가이드 4 내지 6(스페이서 서열 서열 번호 5953-5955 및 22 뉴클레오티드 길이였음) 각각에 대해 120 pmol 가이드 RNA 또는 180 pmol 가이드 RNA를 전달하고, 항-TCR-알파 사슬 Ab를 다시 사용하여 유동 세포측정법에 의해 분석하였다. 결과는 [도 60]에 나타내며, 이는 가이드 4 및 5에 대해 가이드 농도를 증가시킴으로써 TRAC 녹아웃 효율이 각각 ~87% 또는 ~71%로 증가될 수 있음을 입증한다.
TRBC 위치 표적화
상기 T 세포에서 TRAC 유전자좌 표적화를 입증한 후, 다음으로 TRBC 유전자좌 표적화를 위한 시약을 설계하고 스크리닝하였다. 따라서 상기와 같이 MG3-6 및 MG3-8에 상응하는 스페이서를 다시 설계하였으며(MG3-6의 경우 표 19 및 MG3-8의 경우 표 20 참조), 이는 그들을 TRBC 유전자좌의 서열로만 안내한다. TRBC에는 두 가지 스플라이스 변이체(TRBC1 및 TRBC2)가 있으므로, 각각을 표적화하는 스페이서를 설계하였다. 각각의 22-nt 스페이서 보유 가이드 RNA를 상기에 기재된 바와 같은 효소와 함께 T 세포에 뉴클레오펙션시키고 항-TCR Ab를 사용하여 T 세포 수용체의 발현을 평가하였다. 각각의 스페이서 보유 가이드에 대한 TCR은 유세포 분석 시 T 세포의 % 생존도와 함께 하기 표 19 및 20에 제시한다. 표 19 및 20은 여러 스페이서(MG3-6의 경우 5, 6, 18 및 19, MG3-8의 경우 2, 6, 7 및 8)가 T 세포에서 TCR 녹아웃을 유도하는 데 중등도 내지 고도로 효과적임을 보여준다.
[표 19]
Figure pct00028
Figure pct00029
Figure pct00030
Figure pct00031
[표 20]
Figure pct00032
Figure pct00033
Figure pct00034
CAR-T 발현과 함께 TCR 제거
본 발명의 엔도뉴클레아제/가이드 조합을 사용하여 T 세포에서 TCR 발현을 효과적으로 녹아웃시킬 수 있음을 입증한 후, 다음으로 TCR을 녹아웃시키고 동일 세포에서 이종 CAR(키메라 항원 수용체)를 발현함으로써 동종이계 CAR-T 세포를 생성할 수 있는지 알아보았다. 이 실험에 사용한 개요는 [도 61]에 도시하며, 이는 TCR 유전자좌의 제안된 표적화에 이어 상동 재조합에 의해 동일한 유전자좌에서 CAR의 통합을 보여준다.
따라서, TRAC 표적화 MG3-6 가이드 6, 서열 번호 5955와 함께 고성능 MG3-6 효소를 사용하여 상기에 기재된 바와 같이 T 세포를 뉴클레오펙션시켰으며, 이는 단지 동일한 T 세포를 300K의 MOI에서 TRAC 상동성 아암을 갖는 이종 CAR 서열을 보유하는 AAV #3029로 감염시켰다. TCR 수용체 및 이종 CAR 항원에 대한 유동 세포측정법을 사용하여 대조군과 함께 형질감염된 세포를 관찰한 후, MG3-6 형질감염 조건이 대략 ~60%의 빈도로 CAR+/TCR- 세포를 생성할 수 있음을 관찰하였다.
GR(글루코코르티코이드 수용체) 유전자좌 표적화
본 발명의 엔도뉴클레아제/가이드 조합을 사용하여 T 세포에서 TCR 발현을 효과적으로 녹아웃시킬 수 있음을 입증한 후, 다음으로 T 세포의 다른 특성(예를 들어, 글루코코르티코이드에 대한 반응)을 조절하기 위해 GR(글루코코르티코이드 수용체) 유전자좌를 표적화할 수 있는지 알아보았다. 따라서 MG3-6 및 MG3-8에 대한 적절한 스페이서를 또다시 설계하였지만, 이번에는 GR 유전자좌의 서열을 표적화하였다(아래 표 21 및 아래 표 22 참조).
MG3-6 표적화 서열(표 21)의 경우, 서열 1-40은 GR 엑손 2를 표적화하도록 설계하였고, 서열 41-45는 GR 엑손 3을 표적화하도록 설계하였으며, 서열 46은 GR 엑손 4를 표적화하도록 설계하였고, 서열 47-54는 GR 엑손 5를 표적화하도록 설계하였고, 서열 55-58은 GR 엑손 6을 표적화도록 설계하였고, 서열 59-61은 GR 엑손 7을 표적화하도록 설계하였고, 서열 62-65는 GR 엑손 8을 표적화하도록 설계하였다. 126 pmol MG3-6 단백질 및 160 pmol 가이드를 사용하여 상기 1차 T 세포로의 뉴클레오펙션에 의해 서열을 스크리닝하고, NGS로 이전과 같이 분석하였다. 스크리닝 결과는 [도 63]에 도시하며, 이는 표 21의 번호가 매겨진 가이드에 의해 생성된 % 삽입-결실을 도시한다. 결과는 여러 스페이서 서열(하기 표 21에서 2, 3, 4, 13, 18, 24, 51, 55, 56, 및 61)이 MG3-6을 사용하여 GR 유전자에서 삽입-결실을 생성하는 데 중등도로 효과적이었음을 나타냈다.
[표 21]
Figure pct00035
Figure pct00036
Figure pct00037
Figure pct00038
MG3-8 표적화 서열(표 22)의 경우, 서열 1-17은 GR 엑손 2를 표적화하도록 설계하였고, 서열 18은 GR 엑손 3을 표적화하도록 설계하였고, 서열 19-20은 GR 엑손 4를 표적화하도록 설계하였고, 서열 21-24는 GR 엑손 5를 표적화하도록 설계하였고, 서열 25-26은 GR 엑손 6을 표적화하도록 설계하였고, 서열 27-29는 GR 엑손 7을 표적화하도록 설계하였으며, 서열 30-31은 GR 엑손 8을 표적화하도록 설계하였다. 52 pmol MG3-8 단백질 및 60 pmol 가이드를 사용하여 상기와 같이 1차 T 세포로의 뉴클레오펙션에 의해 서열을 스크리닝하고, 이전과 같이 NGS로 분석하였다. 스크리닝 결과는 [도 64]에 도시하며, 이는 표 22에서 번호가 매겨진 가이드에 의해 생성된 % 삽입-결실을 나타낸다. 결과는 일부 스페이서 서열(하기 표 22에서 2, 25 및 29)이 MG3-8을 사용하여 GR 유전자에서 삽입-결실을 생성하는 데 중등도로 효과적이었음을 나타냈다.
[표 22]
Figure pct00039
Figure pct00040
AAVS1 세이프 하버(safe-harbor) 유전자좌 표적화
본 발명의 엔도뉴클레아제/가이드 조합을 사용하여 T 세포에서 TCR 발현을 효과적으로 녹아웃시킬 수 있음을 입증한 후, 다음으로 T 세포에서 AAVS1 세이퍼 하버 유전자좌를 표적화할 수 있는지 알아보았다. MG3-6에 대해 적절한 스페이서를 설계하였지만 이번에는 AAVS1 유전자좌의 서열을 표적화하였다(아래 표 23 참조). 126 pmol MG3-6 단백질 및 160 pmol 가이드를 사용하여 상기와 같이 1차 T 세포로의 뉴클레오펙션에 의해 서열을 스크리닝하고, AAVS1 유전자좌에서의 삽입-결실 형성에 대해 NGS로 분석하였다. 표 23은 형질감염된 T 세포에서 각각의 AAVS1 표적화 스페이서 서열과 함께 생성된 삽입-결실의 백분율을 보여주며, 이는 여러 서열(A1, D1, E1, G1, B2, D2, G2, D3, F3, 및 C4)이 MG3-6으로 AAVS1 유전자좌에서 중간 내지 높은 빈도로 삽입-결실을 생성함을 입증한다.
[표 23]
Figure pct00041
Figure pct00042
TIGIT 유전자좌 표적화
본 발명의 엔도뉴클레아제/가이드 조합을 사용하여 T 세포에서 TCR 발현을 효과적으로 녹아웃시킬 수 있음을 입증한 후, 다음으로 T 세포에서 TIGIT 유전자좌를 표적화할 수 있는지 알아보았다. MG3-6에 대해 적절한 스페이서를 설계하였지만 이번에는 TIGIT 유전자좌의 서열을 표적화하였다(아래 표 24 참조). 126 pmol MG3-6 단백질 및 160 pmol 가이드를 사용하여 상기와 같이 1차 T 세포로의 뉴클레오펙션에 의해 서열을 스크리닝하고 상기와 같이 NGS로 분석하였다. 표 24는 형질감염된 T 세포에서 각각의 TIGIT 표적화 스페이서 서열과 함께 생성된 삽입-결실의 백분율을 나타내며, 이는 여러 서열(C1, G1, H1, D3)이 MG3-6으로 높은 삽입-결실 생성 활성을 가짐을 입증한다. 3일 후에 게놈 DNA를 수거하고 NGS로 분석하였다(하기 표 24 참조).
[표 24]
Figure pct00043
Figure pct00044
실시예 23. - 본원에 기재된 시스템을 사용한 NK 세포 편집
CAR 발현과 조합된 TCR 제거
T 세포에서 TCR 발현을 효율적으로 녹아웃시킬 수 있음을 관찰한 후, 다음으로 NK 세포에서 TRAC를 편집할 수 있는지, 예를 들어 TRAC 상동성 아암을 갖는 CAR의 도입과 함께 TCR을 방해하여 동종이계 CAR-NK 세포를 생성할 수 있는지 알아보았다(예시적인 개요에 대해서는 [도 66] 참조). 따라서 Cloudz 인간 NK 세포 확장 키트를 이용하여 NK 세포를 배양하였다. NK 세포는 104 pmol MG3-6 단백질 및 180 pmol 가이드 RNA(TRAC 표적화 MG3-6 가이드 6, 서열 번호 5955와 함께 고성능 MG3-6 효소를 사용)가 포함된, 문헌[Rautela et al., 본원에 참조로 포함된 https://doi.org/10.1101/406934 참조)에서의 만니톨 함유 완충액을 사용하여 Lonza 4D 시스템으로 형질감염시킨 후, TRAC 상동성 아암을 갖는 CAR 서열을 보유하는 AAV #3029로 300K MOI를 사용하여 감염시켰다. 5일 회복 후 세포로부터 게놈 DNA를 수거하고 NGS로 분석하였다. 동시에, CAR 발현은 NK 세포 마커 CD56에 대한 항체와 병행하여 비오티닐화 BCMA 단백질을 사용하여 유동 세포측정법에 의해 분석하였다. 결과는 [도 67](TRAC 삽입-결실 형성을 나타냄) 및 [도 68](x축에 CD56 발현 및 y축에 CAR 발현에 대한 유동 세포측정을 나타냄)에 제시한다. 결과는 CAR 발현과 함께 MG3-6/가이드 RNA 조합이 CAR-양성 NK 세포를 생성하는 데 효과적이었음을 입증한다.
CD38 표적화
그 후, NK 세포에서 CD38 유전자를 표적화하기 위해 MG3-6(표 24) 및 MG3-8(표 25)에 대해 설계된 스페이서 서열을 사용하여 1차 NK 세포에서 CD38 가이드 스크린을 수행하였다. 결과는 표 24 및 25에 서열과 함께 제시하며, 이는 여러 서열(MG3-6의 경우 A1, B1, H1, B2, C4, E4, F4, B5, D5, MG3-8의 경우 C1)이 각각의 엔도뉴클레아제와 함께 세포에 도입될 때 CD38 유전자좌에서 삽입-결실을 생성하기 위한 활성이 중간 내지 높음을 입증한다.
[표 24]
Figure pct00045
Figure pct00046
Figure pct00047
Figure pct00048
[표 25]
Figure pct00049
실시예 23. 본원에 기재된 시스템을 사용한 조혈 줄기 세포에서의 유전자 편집
조혈 줄기 세포(HSC) 편집을 위해, HSC를 Allcells 지침에 따라 37에서 해동하고, DMEM + 10% FBS에서 세척하고, Stemspan II 배지 + CC110 사이토카인에 재현탁하였다. 200K 세포를 Lonza 4D 전기천공기 및 용액 P3을 사용하여 뉴클레오펙션시켰다. 형질감염 3일 후에 게놈 DNA를 수거하고 NGS로 분석하였다(도 70 참조). MG3-6은 TRAC 가이드 5(서열 번호 5954) 및 TRAC 가이드 6(서열 번호 5955)으로 테스트하였다. MG3-8은 TRAC 가이드 2(서열 번호 5960) 및 TRAC 가이드 5(서열 번호 5963)로 테스트하였다.
실시예 24. - 본원에 기재된 시스템을 사용한 B 세포에서의 유전자 편집
B 세포 편집을 위해, 104 pmol MG3-6 단백질 및 180 pmol 가이드가 포함된, 완충액 P3 또는 완충액 #2(Rautela et al., "Efficient genome editing of human natural killer cells by CRISPR RNP," (2021) (https://doi.org/10.1101/406934에서 이용 가능)에 기재된 만니톨 함유 완충액)를 사용하여 Lonza 4D 시스템으로 B 세포를 형질감염시켰다. 형질감염 3일 후에 게놈 DNA를 수거하고 NGS로 분석하였다(도 71 참조). MG3-6은 TRAC 가이드 6(서열 번호 5955)으로 테스트하였다.
실시예 25.- MG48 계열 구성원의 특성화
전사/번역을 위한 주형 DNA
T7 프로모터를 가진 MG48-1(단백질 서열 서열 번호 5769) 및 MG48-3(단백질 서열 서열 번호 5771)의 이. 콜라이 코돈 최적화된 서열을 주문하였다(Twist Biosciences). T7 및 뉴클레아제 서열을 포함하도록 선형 주형을 PCR에 의해 플라스미드로부터 증폭시켰다. T7 프로모터, 천연 반복체, 우리의 플라스미드 라이브러리를 표적화하는 범용 스페이서, 천연 반복체, 측면에 증폭을 위한 어댑터 서열로 구성된 서열로부터 최소 배열 선형 주형을 증폭하였다. ORF 또는 CRISPR 배열 근처의 3개의 유전자간 서열을 메타게놈 콘티그(metagenomic contig)에로부터 식별하고 증폭을 위한 측면 어댑터 서열이 있는 gBlocks로서 주문하였다(Integrated DNA Technologies).
전사/번역 및 절단 반응
MG48-1 및 MG48-3 뉴클레아제, 유전자간 서열 및 최소 배열을 myTXTL®Sigma 70 마스터 믹스 키트(Arbor Biosciences)를 사용하여 전사-번역 반응 혼합물에서 발현시켰다. 최종 반응 혼합물은 5 nM 뉴클레아제 DNA 주형, 12 nM 유전자간 DNA 주형, 15 M 최소 배열 DNA 주형, 0.1 M pTXTL-P70a-T7rnap 및 1X의 myTXTL®Sigma 70 마스터 믹스를 포함하였다. 반응물을 29℃에서 16시간 동안 인큐베이션한 다음 4℃에서 보관하였다.
플라스미드 라이브러리 DNA 절단 반응을 5 nM의 표적 라이브러리, TXTL 발현의 5배 희석액, 10 nM Tris-HCl, 10 nM MgCl2 및 100 mM NaCl을 37℃에서 2시간 동안 혼합하여 수행하였다. 반응을 중지하고 SPRIselect 비드(Beckman Coulter, Inc.)로 세척하고 Tris EDTA pH 8.0 완충액에서 용출하였다. 1.5 nM의 절단 산물을 150 nM 어댑터, 1 X T4 리가제 완충액(New England Biolabs), 20 U/μL T4 DNA 리가제(New England Biolabs)로 실온에서 20분 동안 결찰시켰다. 결찰된 산물을 NGS 프라이머를 이용한 PCR로 증폭하고 NGS로 시퀀싱하여 PAM을 얻었다. 이 실험의 결과는 [도 72]에 제시하며, 이는 NGS로부터 얻은 MG48-1(패널 A, 서열 번호 5855) 및 MG48-3(패널 B, 서열 번호 5856)에 대한 컨센서스 PAM 서열을 보여준다.
전사/번역으로부터의 유전자간 농축의 RNAseq 라이브러리 프렙
Quick-RNA™ Miniprep 키트(Zymo Research)에 따라 TXTL 발현으로부터 RNA를 추출하고 50μL의 물로 용출하였다. 전사체의 총 농도는 Nanodrop 및 Tapestation에서 측정하였다.
RealSeq-AC miRNA 라이브러리 키트(Somagenics)를 사용하여 RNA 시퀀싱을 위해 각 샘플의 총 RNA 100 ng을 준비하였다. 162-163bp 사이의 앰플리콘을 Tapestation으로 정량화하고 20 nM의 최종 농도로 풀링하였다. 6 pM의 최종 농도를 Nano MiSeq V2 키트에 로드하고 Miseq 시스템(Illumina)에서 시퀀싱하였다. RNAseq 판독을 사용하여 유전자의 tracr 서열(MG48-1의 경우 서열 번호 5886 및 MG48-3의 경우 서열 번호 5893)을 식별하였다(도 73 참조, 이는 시퀀싱된 tracr 영역이 강조 표시된 RNAseq 맵핑을 예시함). tracr 서열을 사용하여 HiScribe T7 키트(New England Biolabs)를 사용하여 dsDNA 주형으로부터 시험관 내에서 전사된 sgRNA(MG48-1의 경우 서열 번호 5888 및 MG48-3의 경우 서열 번호 5895)를 설계하였다. sgRNA는 활성을 확인하기 위해 상기 실시예와 동일한 프로토콜을 사용하여 시험관 내에서 테스트하였으며 기능적인 것으로 확인되었다.
실시 양태
다음 실시 양태는 본질적으로 예시적이며 어떠한 방식으로도 제한하려는 의도가 아니다.
1. 다음을 포함하는 조작된 뉴클레아제 시스템:
(a) RuvC_III 도메인 및 HNH 도메인을 포함하는 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 미배양 미생물로부터 유래되며, 상기 엔도뉴클레아제는 클래스 2, II형 Cas 엔도뉴클레아제인 엔도뉴클레아제; 및
(b) 다음을 포함하는 상기 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조:
(i) 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및
(ii) 상기 엔도뉴클레아제에 결합하도록 구성된 tracr 리보핵산 서열.
2. 실시 양태 1에 있어서, 상기 RuvC_III 도메인은 서열 번호 1827-3637 중 어느 하나에 대해 적어도 70%, 적어도 75%, 적어도 80%, 또는 적어도 90% 서열 동일성을 갖는 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
3. 다음을 포함하는 조작된 뉴클레아제 시스템:
(a) 서열 번호 1827-3637 중 어느 하나에 대해 적어도 75% 서열 동일성을 갖는 RuvC_III 도메인을 포함하는 엔도뉴클레아제; 및
(b) 다음을 포함하는 상기 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조:
(i) 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및
(ii) 상기 엔도뉴클레아제에 결합하도록 구성된 tracr 리보핵산 서열.
4. 다음을 포함하는 조작된 뉴클레아제 시스템:
(a) 서열 번호 5512-5537을 포함하는 프로토스페이서 인접 모티프(PAM) 서열에 결합하도록 구성된 엔도뉴클레아제로서, 클래스 2, II형 Cas 엔도뉴클레아제인 엔도뉴클레아제; 및
(b) 다음을 포함하는 상기 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조:
(i) 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및
(ii) 상기 엔도뉴클레아제에 결합하도록 구성된 tracr 리보핵산 서열.
5. 실시 양태 2에 있어서, 상기 엔도뉴클레아제는 미배양 미생물로부터 유래되는 것인 조작된 뉴클레아제 시스템.
6. 실시 양태 2-3 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 상이한 PAM 서열에 결합하도록 조작되지 않은 것인 조작된 뉴클레아제 시스템.
7. 실시 양태 2에 있어서, 상기 엔도뉴클레아제는 Cas9 엔도뉴클레아제, Cas14 엔도뉴클레아제, Cas12a 엔도뉴클레아제, Cas12b 엔도뉴클레아제, Cas 12c 엔도뉴클레아제, Cas12d 엔도뉴클레아제, Cas12e 엔도뉴클레아제, Cas13a 엔도뉴클레아제, Cas13b 엔도뉴클레아제, Cas13c 엔도뉴클레아제, 또는 Cas 13d 엔도뉴클레아제가 아닌 것인 조작된 뉴클레아제 시스템.
8. 실시 양태 2에 있어서, 상기 엔도뉴클레아제는 Cas9 엔도뉴클레아제에 대해 80% 미만의 동일성을 갖는 것인 조작된 뉴클레아제 시스템.
9. 실시 양태 1-6 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 HNH 도메인을 추가로 포함하는 것인 조작된 뉴클레아제 시스템.
10. 실시 양태 1-9 중 어느 하나에 있어서, 상기 tracr 리보핵산 서열은 서열 번호 5476-5511 및 서열 번호 5538 중 어느 하나로부터 선택된 약 60 내지 90개의 연속 뉴클레오티드에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
11. 다음을 포함하는 조작된 뉴클레아제 시스템:
(a) (i) 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및
(ii) 엔도뉴클레아제에 결합하도록 구성된 tracr 리보핵산 서열로서, 서열 번호 5476-5511 및 서열 번호 5538 중 어느 하나로부터 선택된 약 60 내지 90개의 연속 뉴클레오티드에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함하는 tracr 리보핵산 서열
을 포함하는 조작된 가이드 리보핵산 구조; 및
(b) 상기 조작된 가이드 리보핵산에 결합하도록 구성된 클래스 2, II형 Cas 엔도뉴클레아제.
12. 실시 양태 1-1 또는 8 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 5512-5537을 포함하는 군으로부터 선택된 프로토스페이서 인접 모티프(PAM) 서열에 결합하도록 구성되는 것인 조작된 뉴클레아제 시스템.
13. 실시 양태 1-8 중 어느 하나에 있어서, 상기 조작된 가이드 리보핵산 구조는 적어도 2개의 리보핵산 폴리뉴클레오티드를 포함하는 것인 조작된 뉴클레아제 시스템.
14. 실시 양태 1-8 중 어느 하나에 있어서, 상기 조작된 가이드 리보핵산 구조는 상기 가이드 리보핵산 서열 및 상기 tracr 리보핵산 서열을 포함하는 하나의 리보핵산 폴리뉴클레오티드를 포함하는 것인 조작된 뉴클레아제 시스템.
15. 실시 양태 1 내지 14 중 어느 하나에 있어서, 상기 가이드 리보핵산 서열은 원핵생물, 박테리아, 고세균, 진핵생물, 진균, 식물, 포유동물, 또는 인간 게놈 서열에 상보적인 것인 조작된 뉴클레아제 시스템.
16. 실시 양태 1-15 중 어느 하나에 있어서, 상기 가이드 리보핵산 서열은 15-24 뉴클레오티드 길이인 조작된 뉴클레아제 시스템.
17. 실시 양태 1-10 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 상기 엔도뉴클레아제의 N- 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS)을 포함하는 것인 조작된 뉴클레아제 시스템.
18. 실시 양태 1-11 중 어느 하나에 있어서, 상기 NLS는 서열 5597-5612로부터 선택된 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
19. 실시 양태 1-12 중 어느 하나에 있어서, 5'에서 3'으로 다음을 포함하는 단일 또는 이중 가닥 DNA 복구 주형을 추가로 포함하는 조작된 뉴클레아제 시스템:
상기 표적 데옥시리보핵산 서열 5'에 적어도 20 뉴클레오티드의 서열을 포함하는 제1 상동성 아암, 적어도 10 뉴클레오티드의 합성 DNA 서열, 및 상기 표적 서열 3'에 적어도 20 뉴클레오티드의 서열을 포함하는 제2 상동성 아암.
20. 실시 양태 13에 있어서, 상기 제1 또는 제2 상동성 아암은 적어도 40, 80, 120, 150, 200, 300, 500, 또는 1,000 뉴클레오티드의 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
21. 실시 양태 1-14 중 어느 하나에 있어서, 상기 시스템은 Mg2+ 공급원을 추가로 포함하는 조작된 뉴클레아제 시스템.
22. 실시 양태 1-21 중 어느 하나에 있어서, 상기 엔도뉴클레아제 및 상기 tracr 리보핵산 서열은 동일한 문 내의 별개의 박테리아 종으로부터 유래되는 것인 조작된 뉴클레아제 시스템.
23. 실시 양태 1-22 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 더마박터 속에 속하는 박테리아로부터 유도되는 것인 조작된 뉴클레아제 시스템.
24. 실시 양태 1-22 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 우미균 문, 칸디다투스 페레그리니박테리아 문, 또는 칸디다투스 멜라이나박테리아 문에 속하는 박테리아로부터 유도되는 것인 조작된 뉴클레아제 시스템.
25. 실시 양태 1-22 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 5592-5595 중 어느 하나에 대해 적어도 90% 동일성을 갖는 16S rRNA 유전자를 포함하는 박테리아로부터 유래되는 것인 조작된 뉴클레아제 시스템.
26. 실시 양태 1-25 중 어느 하나에 있어서, 상기 HNH 도메인은 서열 번호 3638-3955 중 어느 하나에 대해 적어도 70% 또는 적어도 80% 동일성을 갖는 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
27. 실시 양태 1-26 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 1-1826 또는 그에 대해 적어도 55% 동일성을 갖는 그의 변이체를 포함하는 것인 조작된 뉴클레아제 시스템.
28. 실시 양태 1-27 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 1827-1830 또는 서열 번호 1827-2140으로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
29. 실시 양태 1-28 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 3638-3641 또는 서열 번호 3638-3954로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
30. 실시 양태 1-29 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 5615-5632로 이루어진 군으로부터 선택된 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 또는 적어도 5개의 펩티드 모티프를 포함하는 것인 조작된 뉴클레아제 시스템.
31. 실시 양태 1-30 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 1-4 또는 서열 번호 1-319로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
32. 실시 양태 1-31 중 어느 하나에 있어서, 상기 가이드 RNA 구조는 서열 번호 5461-5464, 서열 번호 5476-5479, 또는 서열 번호 5476-5489로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
33. 실시 양태 1-32 중 어느 하나에 있어서, 상기 가이드 RNA 구조는 줄기 및 루프로 이루어진 헤어핀을 포함하는 것으로 예측되는 RNA 서열을 포함하고, 줄기는 적어도 10개, 적어도 12개, 또는 적어도 14개 염기쌍 리보뉴클레오티드, 및 루프의 4개 염기쌍 내의 비대칭 돌출을 포함하는 것인 조작된 뉴클레아제 시스템.
34. 실시 양태 1-33 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 5512-5515 또는 서열 번호 5527-5530으로 이루어진 군으로부터 선택된 서열을 포함하는 PAM에 결합하도록 구성되는 것인 조작된 뉴클레아제 시스템.
35. 실시 양태 1-34 중 어느 하나에 있어서,
(a) 상기 엔도뉴클레아제는 서열 번호 1827에 대해 적어도 70%, 적어도 80%, 또는 적어도 90% 동일한 서열을 포함하고;
(b) 상기 가이드 RNA 구조는 서열 번호 5461 또는 서열 번호 5476 중 적어도 하나에 대해 적어도 70%, 적어도 80%, 또는 적어도 90% 동일한 서열을 포함하고;
(c) 상기 엔도뉴클레아제는 서열 번호 5512 또는 서열 번호 5527을 포함하는 PAM에 결합하도록 구성되는 것인
조작된 뉴클레아제 시스템.
36. 실시 양태 1-34 중 어느 하나에 있어서,
(a) 상기 엔도뉴클레아제는 서열 번호 1828에 대해 적어도 70%, 적어도 80%, 또는 적어도 90% 동일한 서열을 포함하고;
(b) 상기 가이드 RNA 구조는 서열 번호 5462 또는 서열 번호 5477 중 적어도 하나에 대해 적어도 70%, 적어도 80%, 또는 적어도 90% 동일한 서열을 포함하고;
(c) 상기 엔도뉴클레아제는 서열 번호 5513 또는 서열 번호 5528을 포함하는 PAM에 결합하도록 구성되는 것인
조작된 뉴클레아제 시스템.
37. 실시 양태 1-34 중 어느 하나에 있어서,
(a) 상기 엔도뉴클레아제는 서열 번호 1829에 대해 적어도 70%, 적어도 80%, 또는 적어도 90% 동일한 서열을 포함하고;
(b) 상기 가이드 RNA 구조는 서열 번호 5463 또는 서열 번호 5478 중 적어도 하나에 대해 적어도 70%, 적어도 80%, 또는 적어도 90% 동일한 서열을 포함하고;
(c) 상기 엔도뉴클레아제는 서열 번호 5514 또는 서열 번호 5529를 포함하는 PAM에 결합하도록 구성되는 것인
조작된 뉴클레아제 시스템.
38. 실시 양태 1-34 중 어느 하나에 있어서,
(a) 상기 엔도뉴클레아제는 서열 번호 1830에 대해 적어도 70%, 적어도 80%, 또는 적어도 90% 동일한 서열을 포함하고;
(b) 상기 가이드 RNA 구조는 서열 번호 5464 또는 서열 번호 5479 중 적어도 하나에 대해 적어도 70%, 적어도 80%, 또는 적어도 90% 동일한 서열을 포함하고;
(c) 상기 엔도뉴클레아제는 서열 번호 5515 또는 서열 번호 5530을 포함하는 PAM에 결합하도록 구성되는 것인
조작된 뉴클레아제 시스템.
39. 실시 양태 1-27 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 2141-2142 또는 서열 번호 2141-2241로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
40. 실시 양태 1-27 또는 실시 양태 39 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 3955-3956 또는 서열 번호 3955-4055로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
41. 실시 양태 1-27 또는 실시 양태 39-40 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 5632-5638로 이루어진 군으로부터 선택된 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 또는 적어도 5개의 펩티드 모티프를 포함하는 것인 조작된 뉴클레아제 시스템.
42. 실시 양태 1-27 또는 실시 양태 39-41 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 320-321 또는 서열 번호 320-420으로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
43. 실시 양태 1-27 또는 실시 양태 39-42 중 어느 하나에 있어서, 상기 가이드 RNA 구조는 서열 번호 5465, 서열 번호 5490-5491 또는 서열 번호 5490-5494로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
44. 실시 양태 1-27 또는 실시 양태 39-43 중 어느 하나에 있어서, 상기 가이드 RNA 구조는 적어도 8개, 적어도 10개, 또는 적어도 12개의 염기쌍 리보뉴클레오티드를 포함하는 헤어핀을 포함하는 tracr 리보핵산 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
45. 실시 양태 1-27 또는 실시 양태 39-44 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 5516 및 서열 번호 5531로 이루어진 군으로부터 선택된 서열을 포함하는 PAM에 결합하도록 구성되는 것인 조작된 뉴클레아제 시스템.
46. 실시 양태 1-27 또는 실시 양태 39-45 중 어느 하나에 있어서,
(a) 상기 엔도뉴클레아제는 서열 번호 2141에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고;
(b) 상기 가이드 RNA 구조는 서열 번호 5490에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고;
(c) 상기 엔도뉴클레아제는 서열 번호 5531을 포함하는 PAM에 결합하도록 구성되는 것인
조작된 뉴클레아제 시스템.
47. 실시 양태 1-27 또는 실시 양태 39-45 중 어느 하나에 있어서,
(a) 상기 엔도뉴클레아제는 서열 번호 2142에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고;
(b) 상기 가이드 RNA 구조는 서열 번호 5465 또는 서열 번호 5491에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고;
(c) 상기 엔도뉴클레아제는 서열 번호 5516을 포함하는 PAM에 결합하도록 구성되는 것인
조작된 뉴클레아제 시스템.
48. 실시 양태 1-27 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 2245-2246으로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
49. 실시 양태 1-27 또는 실시 양태 48 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 4059-4060으로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
50. 실시 양태 1-27 또는 실시 양태 48-49 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 5639-5648로 이루어진 군으로부터 선택된 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 또는 적어도 5개의 펩티드 모티프를 포함하는 것인 조작된 뉴클레아제 시스템.
51. 실시 양태 1-27 또는 실시 양태 48-50 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 424-425로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
52. 실시 양태 1-27 또는 실시 양태 48-51 중 어느 하나에 있어서, 상기 가이드 RNA 구조는 서열 번호 5498-5499 및 서열 번호 5539로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
53. 실시 양태 1-27 또는 실시 양태 48-52 중 어느 하나에 있어서, 상기 가이드 RNA 구조는 가이드 리보핵산 서열의 적어도 8 뉴클레오티드 및 tracr 리보핵산 서열의 적어도 8 뉴클레오티드를 포함하는 중단되지 않은 염기쌍 영역을 갖는 헤어핀을 포함하는 것으로 예측되는 가이드 리보핵산 서열을 포함하고, 상기 tracr 리보핵산 서열은 5'에서 3'으로 제1 헤어핀 및 제2 헤어핀을 포함하고, 상기 제1 헤어핀은 상기 제2 헤어핀보다 더 긴 줄기를 갖는 것인 조작된 뉴클레아제 시스템.
54. 실시 양태 1-27 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 2242-2244 또는 서열 번호 2247-2249로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
55. 실시 양태 1-27 또는 실시 양태 54 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 4056-4058 및 서열 번호 4061-4063으로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
56. 실시 양태 1-27 또는 실시 양태 54-55 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 5639-5648로 이루어진 군으로부터 선택된 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 또는 적어도 5개의 펩티드 모티프를 포함하는 것인 조작된 뉴클레아제 시스템.
57. 실시 양태 1-27 또는 실시 양태 54-56 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 421-423 또는 서열 번호 426-428로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
58. 실시 양태 1-27 또는 실시 양태 54-57 중 어느 하나에 있어서, 상기 가이드 RNA 구조는 서열 번호 5466-5467, 서열 번호 5495-5497, 서열 번호 5500-5502, 및 서열 번호 5539 로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
59. 실시 양태 1-27 또는 실시 양태 54-58 중 어느 하나에 있어서, 상기 가이드 RNA 구조는 가이드 리보핵산 서열의 적어도 8 뉴클레오티드 및 tracr 리보핵산 서열의 적어도 8 뉴클레오티드를 포함하는 중단되지 않은 염기쌍 영역을 갖는 헤어핀을 포함하는 것으로 예측되는 가이드 리보핵산 서열을 포함하고, 상기 tracr 리보핵산 서열은 5'에서 3'으로, 제1 헤어핀 및 제2 헤어핀을 포함하고, 상기 제1 헤어핀은 상기 제2 헤어핀보다 더 긴 줄기를 갖는 것인 조작된 뉴클레아제 시스템.
60. 실시 양태 1-27 또는 실시 양태 54-59 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 5517-5518 또는 서열 번호 5532-5534로 이루어진 군으로부터 선택된 서열을 포함하는 PAM에 결합하도록 구성되는 것인 조작된 뉴클레아제 시스템.
61. 실시 양태 1-27 또는 실시 양태 54-60 중 어느 하나에 있어서,
(a) 상기 엔도뉴클레아제는 서열 번호 2247에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고;
(b) 상기 가이드 RNA 구조는 서열 번호 5500에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고;
(c) 상기 엔도뉴클레아제는 서열 번호 5517 또는 서열 번호 5532를 포함하는 PAM에 결합하도록 구성되는 것인
조작된 뉴클레아제 시스템.
62. 실시 양태 1-27 또는 실시 양태 54-60 중 어느 하나에 있어서,
(a) 상기 엔도뉴클레아제는 서열 번호 2248에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고;
(b) 상기 가이드 RNA 구조는 서열 번호 5501에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고;
(c) 상기 엔도뉴클레아제는 서열 번호 5518 또는 서열 번호 5533을 포함하는 PAM에 결합하도록 구성되는 것인
조작된 뉴클레아제 시스템.
63. 실시 양태 1-27 또는 실시 양태 54-60 중 어느 하나에 있어서,
(a) 상기 엔도뉴클레아제는 서열 번호 2249에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고;
(b) 상기 가이드 RNA 구조는 서열 번호 5502에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고;
(c) 상기 엔도뉴클레아제는 서열 번호 5534를 포함하는 PAM에 결합하도록 구성되는 것인
조작된 뉴클레아제 시스템.
64. 실시 양태 1-27 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 2253 또는 서열 번호 2253-2481로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
65. 실시 양태 1-27 또는 실시 양태 64 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 4067 또는 서열 번호 4067-4295로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제.
66. 실시 양태 1-27 또는 실시 양태 64-65 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 5649에 따른 펩티드 모티프를 포함하는 것인 조작된 뉴클레아제 시스템.
67. 실시 양태 1-27 또는 실시 양태 64-66 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 432 또는 서열 번호 432-660으로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
68. 실시 양태 1-27 또는 실시 양태 64-67 중 어느 하나에 있어서, 상기 가이드 RNA 구조는 서열 번호 5468 또는 서열 번호 5503으로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
69. 실시 양태 1-27 또는 실시 양태 64-68 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 5519로 이루어진 군으로부터 선택된 서열을 포함하는 PAM에 결합하도록 구성되는 것인 조작된 뉴클레아제 시스템.
70. 실시 양태 1-27 또는 실시 양태 64-69 중 어느 하나에 있어서,
(a) 상기 엔도뉴클레아제는 서열 번호 2253에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고;
(b) 상기 가이드 RNA 구조는 서열 번호 5468 또는 서열 번호 5503에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고;
(c) 상기 엔도뉴클레아제는 서열 번호 5519를 포함하는 PAM에 결합하도록 구성되는 것인
조작된 뉴클레아제 시스템.
71. 실시 양태 1-27 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 2482-2489로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
72. 실시 양태 1-27 또는 실시 양태 71 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 4296-4303으로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
73. 실시 양태 1-27 또는 실시 양태 71-72 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 661-668로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
74. 실시 양태 1-27 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 2490-2498로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
75. 실시 양태 1-27 또는 실시 양태 74 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 4304-4312로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
76. 실시 양태 1-27 또는 실시 양태 74-75 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 669-677로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
77. 실시 양태 1-27 또는 실시 양태 74-76 중 어느 하나에 있어서, 상기 가이드 RNA 구조는 서열 번호 5504로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
78. 실시 양태 1-27 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 2499 또는 서열 번호 2499-2750으로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
79. 실시 양태 1-27 또는 실시 양태 78 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 4313 또는 서열 번호 4313-4564로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
80. 실시 양태 1-27 또는 실시 양태 78-79 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 5650-5667로 이루어진 군으로부터 선택된 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 또는 적어도 5개의 펩티드 모티프를 포함하는 것인 조작된 뉴클레아제 시스템.
81. 실시 양태 1-27 또는 실시 양태 78-80 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 678 또는 서열 번호 678-929로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
82. 실시 양태 1-27 또는 실시 양태 78-81 중 어느 하나에 있어서, 상기 가이드 RNA 구조는 서열 번호 5469 또는 서열 번호 5505에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
83. 실시 양태 1-27 또는 실시 양태 78-82 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 5520 또는 서열 번호 5535를 포함하는 PAM에 결합하도록 구성되는 것인 조작된 뉴클레아제 시스템.
84. 실시 양태 1-27 또는 실시 양태 78-83 중 어느 하나에 있어서,
(a) 상기 엔도뉴클레아제는 서열 번호 2499에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고;
(b) 상기 가이드 RNA 구조는 서열 번호 5469 또는 서열 번호 5505에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고;
(c) 상기 엔도뉴클레아제는 서열 번호 5520 또는 서열 번호 5535를 포함하는 PAM에 결합하도록 구성되는 것인
조작된 뉴클레아제 시스템.
85. 실시 양태 1-27 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 2751 또는 서열 번호 2751-2913으로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
86. 실시 양태 1-27 또는 실시 양태 85 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 4565 또는 서열 번호 4565-4727로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
87. 실시 양태 1-27 또는 실시 양태 85-86 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 5668-5678로 이루어진 군으로부터 선택된 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 또는 적어도 5개의 펩티드 모티프를 포함하는 것인 조작된 뉴클레아제 시스템.
88. 실시 양태 1-27 또는 실시 양태 85-87 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 930 또는 서열 번호 930-1092로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
89. 실시 양태 1-27 또는 실시 양태 85-88 중 어느 하나에 있어서, 상기 가이드 RNA 구조는 서열 번호 5470 또는 서열 번호 5506에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
90. 실시 양태 1-27 또는 실시 양태 85-89 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 5521 또는 서열 번호 5536으로 이루어진 군으로부터 선택된 서열을 포함하는 PAM에 결합하도록 구성되는 것인 조작된 뉴클레아제 시스템.
91. 실시 양태 1-27 또는 실시 양태 85-90 중 어느 하나에 있어서,
(a) 상기 엔도뉴클레아제는 서열 번호 2751에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고;
(b) 상기 가이드 RNA 구조는 서열 번호 5470 또는 서열 번호 5506에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고;
(c) 상기 엔도뉴클레아제는 서열 번호 5521 또는 서열 번호 5536을 포함하는 PAM에 결합하도록 구성되는 것인
조작된 뉴클레아제 시스템.
92. 실시 양태 1-27 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 2914 또는 서열 번호 2914-3174로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
93. 실시 양태 1-27 또는 실시 양태 92 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 4728 또는 서열 번호 4728-4988로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
94. 실시 양태 1-27 또는 실시 양태 92-93 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 5676-5678로 이루어진 군으로부터 선택된 적어도 1개, 적어도 2개, 또는 적어도 3개의 펩티드 모티프를 포함하는 것인 조작된 뉴클레아제 시스템.
95. 실시 양태 1-27 또는 실시 양태 92-94 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 1093 또는 서열 번호 1093-1353으로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
96. 실시 양태 1-27 또는 실시 양태 92-95 중 어느 하나에 있어서, 상기 가이드 RNA 구조는 서열 번호 5471, 서열 번호 5507, 및 서열 번호 5540-5542로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
97. 실시 양태 1-27 또는 실시 양태 92-96 중 어느 하나에 있어서, 상기 가이드 RNA 구조는 5개 미만의 염기쌍 리보뉴클레오티드를 포함하는 적어도 2개의 헤어핀을 포함하는 것으로 예측되는 tracr 리보핵산 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
98. 실시 양태 1-27 또는 실시 양태 92-97 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 5522를 포함하는 PAM에 결합하도록 구성되는 것인 조작된 뉴클레아제 시스템.
99. 실시 양태 1-27 또는 실시 양태 92-98 중 어느 하나에 있어서,
(a) 상기 엔도뉴클레아제는 서열 번호 2914에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고;
(b) 상기 가이드 RNA 구조는 서열 번호 5471 또는 서열 번호 5507에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고;
(c) 상기 엔도뉴클레아제는 서열 번호 5522를 포함하는 PAM에 결합하도록 구성되는 것인
조작된 뉴클레아제 시스템.
100. 실시 양태 1-27 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 3175 또는 서열 번호 3175-3330으로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
101. 실시 양태 1-27 또는 실시 양태 100 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 4989 또는 서열 번호 4989-5146으로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
102. 실시 양태 1-27 또는 실시 양태 100-101 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 5679-5686으로 이루어진 군으로부터 선택된 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 또는 적어도 5개의 펩티드 모티프를 포함하는 것인 조작된 뉴클레아제 시스템.
103. 실시 양태 1-27 또는 실시 양태 100-102 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 1354 또는 서열 번호 1354-1511로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
104. 실시 양태 1-27 또는 실시 양태 100-103 중 어느 하나에 있어서, 상기 가이드 RNA 구조는 서열 번호 5472 또는 서열 번호 5508로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
105. 실시 양태 1-27 또는 실시 양태 100-104 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 5523 또는 서열 번호 5537로 이루어진 군으로부터 선택된 서열을 포함하는 PAM에 결합하도록 구성되는 것인 조작된 뉴클레아제 시스템.
106. 실시 양태 1-27 또는 실시 양태 100-105 중 어느 하나에 있어서,
(a) 상기 엔도뉴클레아제는 서열 번호 3175에 대해 적어도 70%, 80%, 또는 90 % 동일한 서열을 포함하고;
(b) 상기 가이드 RNA 구조는 서열 번호 5472 또는 서열 번호 5508에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고;
(c) 상기 엔도뉴클레아제는 서열 번호 5523 또는 서열 번호 5537을 포함하는 PAM에 결합하도록 구성되는 것인 조작된 뉴클레아제 시스템.
107. 실시 양태 1-27 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 3331 또는 서열 번호 3331-3474로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
108. 실시 양태 1-27 또는 실시 양태 107 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 5147 또는 서열 번호 5147-5290으로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
109. 실시 양태 1-27 또는 실시 양태 107-108 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 5674-5675 및 서열 번호 5687-5693으로 이루어진 군으로부터 선택된 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 또는 적어도 5개의 펩티드 모티프를 포함하는 것인 조작된 뉴클레아제 시스템.
110. 실시 양태 1-27 또는 실시 양태 107-109 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 1512 또는 서열 번호 1512-1655로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
111. 실시 양태 1-27 또는 실시 양태 107-110 중 어느 하나에 있어서, 상기 가이드 RNA 구조는 서열 번호 5473 또는 서열 번호 5509로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
112. 실시 양태 1-27 또는 실시 양태 107-111 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 5524를 포함하는 PAM에 결합하도록 구성되는 것인 조작된 뉴클레아제 시스템.
113. 실시 양태 1-27 또는 실시 양태 107-112 중 어느 하나에 있어서,
(a) 상기 엔도뉴클레아제는 서열 번호 3331에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고;
(b) 상기 가이드 RNA 구조는 서열 번호 5473 또는 서열 번호 5509에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고;
(c) 상기 엔도뉴클레아제는 서열 번호 5524를 포함하는 PAM에 결합하도록 구성되는 것인
조작된 뉴클레아제 시스템.
114. 실시 양태 1-27 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 3475 또는 서열 번호 3475-3568로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
115. 실시 양태 1-27 또는 실시 양태 114 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 5291 또는 서열 번호 5291-5389로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
116. 실시 양태 1-27 또는 실시 양태 114-115 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 5694-5699로 이루어진 군으로부터 선택된 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 또는 적어도 5개의 펩티드 모티프를 포함하는 것인 조작된 뉴클레아제 시스템.
117. 실시 양태 1-27 또는 실시 양태 114-116 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 1656 또는 서열 번호 1656-1755로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
118. 실시 양태 1-27 또는 실시 양태 114-117 중 어느 하나에 있어서, 상기 가이드 RNA 구조는 서열 번호 5474 또는 서열 번호 5510에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
119. 실시 양태 1-27 또는 실시 양태 114-118 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 5525를 포함하는 PAM에 결합하도록 구성되는 것인 조작된 뉴클레아제 시스템.
120. 실시 양태 1-27 또는 실시 양태 114-119 중 어느 하나에 있어서,
(a) 상기 엔도뉴클레아제는 서열 번호 3475에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고;
(b) 상기 가이드 RNA 구조는 서열 번호 5474 또는 서열 번호 5510에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고;
(c) 상기 엔도뉴클레아제는 서열 번호 5525를 포함하는 PAM에 결합하도록 구성되는 것인
조작된 뉴클레아제 시스템.
121. 실시 양태 1-27 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 3569 또는 서열 번호 3569-3637로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
122. 실시 양태 1-27 또는 실시 양태 121 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 5390 또는 서열 번호 5390-5460으로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
123. 실시 양태 1-27 또는 실시 양태 121-122 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 5700-5717로 이루어진 군으로부터 선택된 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 또는 적어도 5개의 펩티드 모티프를 포함하는 것인 조작된 뉴클레아제 시스템.
124. 실시 양태 1-27 또는 실시 양태 121-123 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 1756 또는 서열 번호 1756-1826으로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
125. 실시 양태 1-27 또는 실시 양태 121-124 중 어느 하나에 있어서, 상기 가이드 RNA 구조는 서열 번호 5475 또는 서열 번호 5511에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
126. 실시 양태 1-27 또는 실시 양태 121-125 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 5526을 포함하는 PAM에 결합하도록 구성되는 것인 조작된 뉴클레아제 시스템.
127. 실시 양태 1-27 또는 실시 양태 121-126 중 어느 하나에 있어서,
(a) 상기 엔도뉴클레아제는 서열 번호 3569에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고;
(b) 상기 가이드 RNA 구조는 서열 번호 5475 또는 서열 번호 5511에 대해 적어도 70%, 80%, 또는 90% 동일한 서열을 포함하고;
(c) 상기 엔도뉴클레아제는 서열 번호 5526을 포함하는 PAM에 결합하도록 구성되는 것인
조작된 뉴클레아제 시스템.
128. 실시 양태 1-127 중 어느 하나에 있어서, 상기 서열 동일성은 BLASTP, CLUSTALW, MUSCLE, MAFFT, 또는 스미스-워터맨 상동성 검색 알고리즘에 의해 결정되는 것인 조작된 뉴클레아제 시스템.
129. 실시 양태 15에 있어서, 상기 서열 동일성은 단어 길이(W) 3, 기대치(E) 10의 매개변수를 사용하고, 및 존재 11, 확장 1에서 갭 비용을 설정하는 BLOSUM62 스코어링 매트릭스를 사용하고, 조건부 구성 스코어 매트릭스 조정을 사용하는 상기 BLASTP 상동성 검색 알고리즘에 의해 결정되는 것인 조작된 뉴클레아제 시스템.
130. (a) 표적 DNA 분자 내의 표적 서열에 상보적인 뉴클레오티드 서열을 포함하는 DNA표적화 세그먼트; 및
(b) 혼성화하여 이중 가닥 RNA(dsRNA) 이중체를 형성하는 2개의 상보적인 뉴클레오티드 스트레치를 포함하는 단백질 결합 세그먼트
를 포함하는 조작된 가이드 리보핵산 폴리뉴클레오티드로서,
상기 2개의 상보적인 뉴클레오티드 스트레치는 개재 뉴클레오티드로 서로 공유적으로 연결되며,
상기 조작된 가이드 리보핵산 폴리뉴클레오티드는 서열 번호 1827-3637 중 어느 하나에 대해 적어도 75% 서열 동일성을 갖는 RuvC_III 도메인을 포함하는 엔도뉴클레아제 복합체를 형성하고 상기 표적 DNA 분자의 상기 표적 서열에 상기 복합체를 표적화하도록 구성되는 것인 조작된 가이드 리보핵산 폴리뉴클레오티드.
131. 실시 양태 17에 있어서, 상기 DNA 표적화 세그먼트는 상기 2개의 상보적인 뉴클레오티드 스트레치 모두의 5'에 위치하는 것인 조작된 가이드 리보핵산 폴리뉴클레오티드.
132. 실시 양태 17-18 중 어느 하나에 있어서,
(a) 상기 단백질 결합 세그먼트는 서열 번호 5476-5479 또는 서열 번호 5476-5489로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 적어도 80%, 또는 적어도 90% 동일성을 갖는 서열을 포함하거나;
(b) 상기 단백질 결합 세그먼트는 (서열 번호 5490-5491 또는 서열 번호 5490-5494) 및 서열 번호 5538 로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 적어도 80%, 또는 적어도 90% 동일성을 갖는 서열을 포함하거나;
(c) 상기 단백질 결합 세그먼트는 서열 번호 5498-5499로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 적어도 80%, 또는 적어도 90% 동일성을 갖는 서열을 포함하거나;
(d) 상기 단백질 결합 세그먼트는 서열 번호 5495-5497 및 서열 번호 5500-5502로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 적어도 80%, 또는 적어도 90% 동일성을 갖는 서열을 포함하거나;
(e) 상기 단백질 결합 세그먼트는 서열 번호 5503에 대해 적어도 70%, 적어도 80%, 또는 적어도 90% 동일성을 갖는 서열을 포함하거나;
(f) 상기 단백질 결합 세그먼트는 서열 번호 5504에 대해 적어도 70%, 적어도 80%, 또는 적어도 90% 동일성을 갖는 서열을 포함하거나;
(g) 상기 단백질 결합 세그먼트는 서열 번호 5505에 대해 적어도 70%, 적어도 80%, 또는 적어도 90% 동일성을 갖는 서열을 포함하거나;
(h) 단백질 결합 세그먼트는 서열 번호 5506에 대해 적어도 70%, 적어도 80%, 또는 적어도 90% 동일성을 갖는 서열을 포함하거나;
(i) 단백질 결합 세그먼트는 서열 번호 5507에 대해 적어도 70%, 적어도 80%, 또는 적어도 90% 동일성을 갖는 서열을 포함하거나;
(j) 상기 단백질 결합 세그먼트는 서열 번호 5508에 대해 적어도 70%, 적어도 80%, 또는 적어도 90% 동일성을 갖는 서열을 포함하거나;
(k) 상기 단백질 결합 세그먼트는 서열 번호 5509에 대해 적어도 70%, 적어도 80%, 또는 적어도 90% 동일성을 갖는 서열을 포함하거나;
(l) 상기 단백질 결합 세그먼트는 상기 서열 번호 5510에 대해 적어도 70%, 적어도 80%, 또는 적어도 90% 동일성을 갖는 서열을 포함하거나;
(m) 상기 단백질 결합 세그먼트는 서열 번호 5511에 대해 적어도 70%, 적어도 80%, 또는 적어도 90% 동일성을 갖는 서열을 포함하는 것인
조작된 가이드 리보핵산 폴리뉴클레오티드.
133. 실시 양태 17-132 중 어느 하나에 있어서,
(a) 상기 가이드 리보핵산 폴리뉴클레오티드는 줄기 및 루프를 포함하는 헤어핀을 포함하는 RNA 서열을 포함하고, 상기 줄기는 적어도 10개, 적어도 12개, 또는 적어도 14개의 염기쌍 리보뉴클레오티드, 및 루프의 4개 염기 쌍 내의 비대칭 돌기를 포함하고;
(b) 상기 가이드 리보핵산 폴리뉴클레오티드는 적어도 8개, 적어도 10개, 또는 적어도 12개의 염기쌍 리보뉴클레오티드를 포함하는 헤어핀을 포함하는 것으로 예측되는 tracr 리보핵산 서열을 포함하고;
(c) 상기 가이드 리보핵산 폴리뉴클레오티드는 가이드 리보핵산 서열의 적어도 8 뉴클레오티드 및 tracr 리보핵산 서열의 적어도 8 뉴클레오티드를 포함하는 중단되지 않은 염기쌍 영역을 갖는 헤어핀을 포함하는 것으로 예측되는 가이드 리보핵산 서열을 포함하고, 상기 tracr 리보핵산 서열은 5'에서 3'으로, 제1 헤어핀 및 제2 헤어핀을 포함하고, 상기 제1 헤어핀은 상기 제2 헤어핀보다 더 긴 줄기를 갖고; 또는
(d) 상기 가이드 리보핵산 폴리뉴클레오티드는 5개 미만의 염기쌍 리보뉴클레오티드를 포함하는 적어도 2개의 헤어핀을 포함하는 것으로 예측되는 tracr 리보핵산 서열을 포함하는 것인
조작된 가이드 리보핵산 폴리뉴클레오티드.
134. 실시 양태 17-133 중 어느 하나의 조작된 가이드 리보핵산 폴리뉴클레오티드를 코딩하는 데옥시리보핵산 폴리뉴클레오티드.
135. 유기체에서의 발현을 위해 최적화된 조작된 핵산 서열을 포함하는 핵산으로서, 상기 핵산은 RuvC_III 도메인 및 HNH 도메인을 포함하는 클래스 2, II형 Cas 엔도뉴클레아제를 코딩하고, 상기 엔도뉴클레아제는 미배양 미생물로부터 유래되는 것인 핵산.
136. 유기체에서의 발현을 위해 최적화된 조작된 핵산 서열을 포함하는 핵산으로서, 서열 번호 1827-3637 중 어느 하나에 대해 적어도 70% 서열 동일성을 갖는 RuvC_III 도메인을 포함하는 엔도뉴클레아제를 코딩하는 핵산.
137. 실시 양태 135-20 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 3638-5460 중 어느 하나에 대해 적어도 70% 또는 적어도 80% 서열 동일성을 갖는 HNH 도메인을 포함하는 것인 핵산.
138. 실시 양태 135-137 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 서열 번호 5572-5591 또는 그에 대해 적어도 70% 서열 동일성을 갖는 그의 변이체를 포함하는 것인 핵산.
139. 실시 양태 135-138 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 상기 엔도뉴클레아제의 N- 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS)을 코딩하는 서열을 포함하는 것인 핵산.
140. 실시 양태 21에 있어서, 상기 NLS는 서열 번호 5597-5612로부터 선택된 서열을 포함하는 것인 핵산.
141. 실시 양태 135-22 중 어느 하나에 있어서, 상기 유기체는 원핵생물, 박테리아, 진핵생물, 진균, 식물, 포유동물, 설치류, 또는 인간인 핵산.
142. 실시 양태 23에 있어서, 상기 유기체는 이. 콜라이이고,
(a) 상기 핵산 서열은 서열 번호 5572-5575로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일성을 갖거나;
(b) 상기 핵산 서열은 서열 번호 5576-5577로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일성을 갖거나;
(c) 상기 핵산 서열은 서열 번호 5578-5580으로 이루어진 군으로부터 선택된 서열에 대해 적어도 70%, 80%, 또는 90% 동일성을 갖거나;
(d) 상기 핵산 서열은 서열 번호 5581에 대해 적어도 70%, 80%, 또는 90% 동일성을 갖거나;
(e) 상기 핵산 서열은 서열 번호 5582에 대해 적어도 70%, 80%, 또는 90% 동일성을 갖거나;
(f) 상기 핵산 서열은 서열 번호 5583에 대해 적어도 70%, 80%, 또는 90% 동일성을 갖거나;
(g) 상기 핵산 서열은 서열 번호 5584에 대해 적어도 70%, 80%, 또는 90% 동일성을 갖거나;
(h) 상기 핵산 서열은 서열 번호 5585에 대해 적어도 70%, 80%, 또는 90% 동일성을 갖거나;
(i) 상기 핵산 서열은 서열 번호 5586에 대해 적어도 70%, 80%, 또는 90% 동일성을 갖거나;
(j) 상기 핵산 서열은 서열 번호 5587에 대해 적어도 70%, 80%, 또는 90% 동일성을 갖는
핵산.
143. 실시 양태 23에 있어서, 상기 유기체는 인간이고,
(a) 상기 핵산 서열은 서열 번호 5588 또는 서열 번호 5589에 대해 적어도 70%, 80%, 또는 90% 동일성을 갖거나;
(b) 상기 핵산 서열은 서열 번호 5590 또는 서열 번호 5591과 적어도 70%, 80%, 또는 90% 동일성을 갖는
핵산.
144. RuvC_III 도메인 및 HNH 도메인을 포함하는 클래스 2, II형 Cas 엔도뉴클레아제를 코딩하는 핵산 서열을 포함하는 벡터로서, 상기 엔도뉴클레아제는 미배양 미생물로부터 유래되는 것인 벡터.
145. 실시 양태 135-143 중 어느 하나의 핵산을 포함하는 벡터.
146. 실시 양태 144-24 중 어느 하나에 있어서,
(a) 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 가이드 리보핵산 서열; 및
(b) 상기 엔도뉴클레아제에 결합하도록 구성된 tracr 리보핵산 서열
을 포함하는 상기 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조를 코딩하는 핵산을 추가로 포함하는 벡터.
147. 실시 양태 144-25 중 어느 하나에 있어서, 벡터는 플라스미드, 미니서클, CELiD, 아데노 관련 바이러스(AAV) 유래 비리온, 또는 렌티바이러스인 벡터.
148. 실시 양태 144-26 중 어느 하나의 벡터를 포함하는 세포.
149. 실시 양태 146의 상기 세포를 배양하는 단계를 포함하는 엔도뉴클레아제의 제조 방법.
150. 이중 가닥 데옥시리보핵산 폴리뉴클레오티드에 결합하거나, 이를 절단, 마킹, 또는 변형하는 방법으로서,
(a) 상기 엔도뉴클레아제 및 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드에 결합하도록 구성된 조작된 가이드 리보핵산 구조와 복합체를 형성하는 클래스 2, II형 Cas 엔도뉴클레아제와 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드를 접촉시키는 단계를 포함하며;
(b) 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 프로토스페이서 인접 모티프(PAM)를 포함하고;
(c) 상기 PAM은 서열 번호 5512-5526 또는 서열 번호 5527-5537로 이루어진 군으로부터 선택된 서열을 포함하는 것인
방법.
151. 실시 양태 28에 있어서, 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 상기 조작된 가이드 리보핵산 구조의 서열에 상보적인 서열을 포함하는 제1 가닥 및 상기 PAM을 포함하는 제2 가닥을 포함하는 것인 방법.
152. 실시 양태 30에 있어서, 상기 PAM은 상기 조작된 가이드 리보핵산 구조의 상기 서열에 상보적인 서열의 3' 말단에 바로 인접한 것인 방법.
153. 실시 양태 28-31 중 어느 하나에 있어서, 상기 클래스 2, II형 Cas 엔도뉴클레아제는 Cas9 엔도뉴클레아제, Cas14 엔도뉴클레아제, Cas12a 엔도뉴클레아제, Cas12b 엔도뉴클레아제, Cas 12c 엔도뉴클레아제, Cas12d 엔도뉴클레아제, Cas12e 엔도뉴클레아제, Cas13a 엔도뉴클레아제, Cas13b 엔도뉴클레아제, Cas13c 엔도뉴클레아제, 또는 Cas 13d 엔도뉴클레아제가 아닌 것인 방법.
154. 실시 양태 28-32 중 어느 하나에 있어서, 상기 클래스 2, II형 Cas 엔도뉴클레아제는 미배양 미생물로부터 유래되는 것인 방법.
155. 실시 양태 28-154 중 어느 하나에 있어서, 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 진핵생물, 식물, 진균, 포유동물, 설치류, 또는 인간 이중 가닥 데옥시리보핵산 폴리뉴클레오티드인 방법.
156. 실시 양태 28-33 중 어느 하나에 있어서,
(a) 상기 PAM은 서열 번호 5512-5515 및 서열 번호 5527-5530으로 이루어진 군으로부터 선택된 서열을 포함하거나;
(b) 상기 PAM은 서열 번호 5516 또는 서열 번호 5531을 포함하거나;
(c) 상기 PAM은 서열 번호 5539를 포함하거나;
(d) 상기 PAM은 서열 번호 5517 또는 서열 번호 5518을 포함하거나;
(e) 상기 PAM은 서열 번호 5519를 포함하거나;
(f) 상기 PAM은 서열 번호 5520 또는 서열 번호 5535를 포함하거나;
(g) 상기 PAM은 서열 번호 5521 또는 서열 번호 5536을 포함하거나;
(h) 상기 PAM은 서열 번호 5522를 포함하거나;
(i) 상기 PAM은 서열 번호 5523 또는 서열 번호 5537을 포함하거나;
(j) 상기 PAM은 서열 번호 5524를 포함하거나;
(k) 상기 PAM은 서열 번호 5525를 포함하거나;
(l) 상기 PAM은 서열 번호 5526을 포함하는 것인
방법.
157. 표적 핵산 유전자좌를 변형시키는 방법으로서, 실시 양태 1-16 중 어느 하나의 상기 조작된 뉴클레아제 시스템을 상기 표적 핵산 유전자좌에 전달하는 단계를 포함하며, 상기 엔도뉴클레아제는 상기 조작된 가이드 리보핵산 구조와 복합체를 형성하도록 구성되고, 상기 복합체는 상기 복합체가 상기 표적 핵산 유전자좌에 결합할 때 상기 복합체가 상기 표적 핵산 유전자좌를 변형시키도록 구성되는 것인 방법.
158. 실시 양태 34에 있어서, 상기 표적 핵산 유전자좌를 변형시키는 단계는 상기 표적 핵산 유전자좌에 결합하거나, 이를 닉킹, 절단 또는 마킹하는 단계를 포함하는 단계를 포함하는 것인 방법.
159. 실시 양태 34-35 중 어느 하나에 있어서, 상기 표적 핵산 유전자좌는 데옥시리보핵산(DNA) 또는 리보핵산(RNA)을 포함하는 것인 방법.
160. 실시 양태 36에 있어서, 상기 표적 핵산은 게놈 DNA, 바이러스 DNA, 바이러스 RNA, 또는 박테리아 DNA를 포함하는 것인 방법.
161. 실시 양태 34-37 중 어느 하나에 있어서, 상기 표적 핵산 유전자좌는 시험관 내에 있는 것인 방법.
162. 실시 양태 34-37 중 어느 하나에 있어서, 상기 표적 핵산 유전자좌는 세포 내에 있는 것인 방법.
163. 실시 양태 39에 있어서, 상기 세포는 원핵생물 세포, 박테리아 세포, 진핵생물 세포, 진균 세포, 식물 세포, 동물 세포, 포유동물 세포, 설치류 세포, 영장류 세포, 또는 인간 세포인 방법.
164. 실시 양태 39-40 중 어느 하나에 있어서, 상기 조작된 뉴클레아제 시스템을 상기 표적 핵산 유전자좌에 전달하는 단계는 실시 양태 135-22 중 어느 하나의 핵산 또는 실시 양태 142-25 중 어느 하나의 벡터를 전달하는 단계를 포함하는 것인 방법.
165. 실시 양태 39-40 중 어느 하나에 있어서, 상기 조작된 뉴클레아제 시스템을 상기 표적 핵산 유전자좌에 전달하는 단계는 상기 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임을 포함하는 핵산을 전달하는 단계를 포함하는 것인 방법.
166. 실시 양태 41에 있어서, 상기 핵산은 상기 엔도뉴클레아제를 코딩하는 상기 오픈 리딩 프레임이 작동가능하게 연결된 프로모터를 포함하는 것인 방법.
167. 실시 양태 39-40 중 어느 하나에 있어서, 상기 조작된 뉴클레아제 시스템을 상기 표적 핵산 유전자좌에 전달하는 단계는 상기 엔도뉴클레아제를 코딩하는 상기 오픈 리딩 프레임을 포함하는 캡핑된 mRNA를 전달하는 단계를 포함하는 것인 방법.
168. 실시 양태 39-40 중 어느 하나에 있어서, 상기 조작된 뉴클레아제 시스템을 상기 표적 핵산 유전자좌에 전달하는 단계는 번역된 폴리펩티드를 전달하는 단계를 포함하는 것인 방법.
169. 실시 양태 39-40 중 어느 하나에 있어서, 상기 조작된 뉴클레아제 시스템을 상기 표적 핵산 유전자좌에 전달하는 단계는 리보핵산(RNA) pol III 프로모터에 작동가능하게 연결된 상기 조작된 가이드 리보핵산 구조를 코딩하는 데옥시리보핵산(DNA)을 전달하는 단계를 포함하는 것인 방법.
170. 실시 양태 34-46 중 어느 하나에 있어서, 상기 엔도뉴클레아제는 상기 표적 유전자좌에서 또는 이에 근접하여 단일 가닥 파손 또는 이중 가닥 파손을 유도하는 것인 방법.
본 발명의 바람직한 실시 양태가 여기에서 제시되고 설명되었지만, 그러한 실시 양태가 단지 예로서 제공된다는 것이 당업자에게 명백할 것이다. 본 발명이 명세서 내에 제공된 특정 예에 의해 제한되는 것으로 의도되지 않는다. 본 발명은 전술한 명세서를 참조하여 설명되었지만, 본 명세서의 실시 양태의 설명 및 예시는 제한적인 의미로 해석되는 것으로 의도되지 않는다. 이제 본 발명을 벗어나지 않고 당업자에게 수많은 변형, 변경 및 대체가 일어날 것이다. 또한, 본 발명의 모든 측면은 다양한 조건 및 변수에 의존하는 본원에 제시된 구체적인 묘사, 구성 또는 상대적인 비율에 제한되지 않는다는 것을 이해해야 한다. 본원에 기재된 본 발명의 실시 양태에 대한 다양한 대안이 본 발명을 실시하는데 사용될 수 있음을 이해해야 한다. 따라서 본 발명은 그러한 대안, 변형, 변경 또는 등가물도 포함하는 것으로 고려된다. 다음 청구범위는 본 발명의 범위를 정의하고 이들 청구범위 및 그 등가물 범위 내의 방법 및 구조를 포함하도록 의도된다.

Claims (104)

  1. 다음을 포함하는 조작된 뉴클레아제 시스템:
    (a) 서열 번호 5718-5846 또는 6257 중 어느 하나에 대해 적어도 75% 서열 동일성을 갖는 서열을 포함하는 엔도뉴클레아제; 및
    (b) 다음을 포함하는 상기 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조:
    (i) 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 리보핵산 서열; 및
    (ii) 상기 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열.
  2. 다음을 포함하는 조작된 뉴클레아제 시스템:
    (a) 서열 번호 5847-5861 또는 6258-6278을 포함하는 프로토스페이서 인접 모티프(PAM: protospacer adjacent motif) 서열에 결합하도록 구성된 엔도뉴클레아제로서, 클래스 2, II형 Cas 엔도뉴클레아제인 엔도뉴클레아제; 및
    (b) 다음을 포함하는 상기 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조:
    (i) 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 리보핵산 서열; 및
    (ii) 상기 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열.
  3. 제1항 또는 제2항에 있어서, 상기 엔도뉴클레아제는 미배양 미생물로부터 유래되는 것인 조작된 뉴클레아제 시스템.
  4. 제1항 내지 제3항 중 어느 하나의 항에 있어서, 상기 엔도뉴클레아제는 상이한 PAM 서열에 결합하도록 조작되지 않은 것인 조작된 뉴클레아제 시스템.
  5. 제1항 내지 제4항 중 어느 하나의 항에 있어서, 상기 엔도뉴클레아제는 Cas9 엔도뉴클레아제, Cas14 엔도뉴클레아제, Cas12a 엔도뉴클레아제, Cas12b 엔도뉴클레아제, Cas 12c 엔도뉴클레아제, Cas12d 엔도뉴클레아제, Cas12e 엔도뉴클레아제, Cas13a 엔도뉴클레아제, Cas13b 엔도뉴클레아제, Cas13c 엔도뉴클레아제, 또는 Cas 13d 엔도뉴클레아제가 아닌 것인 조작된 뉴클레아제 시스템.
  6. 제1항 내지 제5항 중 어느 하나의 항에 있어서, 상기 엔도뉴클레아제는 Cas9 엔도뉴클레아제에 대해 80% 미만의 동일성을 갖는 것인 조작된 뉴클레아제 시스템.
  7. 제1항 내지 제6항 중 어느 하나의 항에 있어서, 상기 리보핵산 서열은 (a) 서열 번호 5886-5887, 5891, 5893, 또는 5894 중 어느 하나; 또는 (b) 서열 번호 5862-5885, 5888-5890, 5892, 5895-5896, 또는 6279-6301 중 어느 하나의 비-축퇴 뉴클레오티드에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
  8. 다음을 포함하는 조작된 뉴클레아제 시스템:
    (a) (i) 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 리보핵산 서열; 및
    (ii) 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열로서, (a) 서열 번호 5886-5887, 5891, 5893, 또는 5894 중 어느 하나; 또는 (b) 서열 번호 5862-5885, 5888-5890, 5892, 5895-5896, 또는 6279-6301 중 어느 하나의 비-축퇴 뉴클레오티드에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함하는 리보핵산 서열
    을 포함하는 조작된 가이드 리보핵산 구조; 및
    (b) 상기 조작된 가이드 리보핵산에 결합하도록 구성된 클래스 2, II형 Cas 엔도뉴클레아제.
  9. 제8항에 있어서, 상기 엔도뉴클레아제는 서열 번호 5847-5861 또는 6258-6278을 포함하는 군으로부터 선택된 프로토스페이서 인접 모티프(PAM) 서열에 결합하도록 구성되는 것인 조작된 뉴클레아제 시스템.
  10. 제8항 또는 제9항에 있어서, 상기 가이드 리보핵산 서열은 15-24개의 뉴클레오티드 길이 또는 19-24개의 뉴클레오티드 길이인 조작된 뉴클레아제 시스템.
  11. 제1항 내지 제10항 중 어느 하나의 항에 있어서, 상기 엔도뉴클레아제는 상기 엔도뉴클레아제의 N- 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS)을 포함하는 것인 조작된 뉴클레아제 시스템.
  12. 제1항 내지 제11항 중 어느 하나의 항에 있어서, 상기 NLS는 서열 번호 5597-5612로부터 선택된 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
  13. 제1항 내지 제12항 중 어느 하나의 항에 있어서, 5'에서 3'으로 다음을 포함하는 단일 또는 이중 가닥 DNA 복구 주형을 추가로 포함하는 조작된 뉴클레아제 시스템: 상기 표적 데옥시리보핵산 서열 5'에 적어도 20개의 뉴클레오티드의 서열을 포함하는 제1 상동성 아암(arm), 적어도 10개의 뉴클레오티드의 합성 DNA 서열, 및 상기 표적 서열 3'에 적어도 20개의 뉴클레오티드의 서열을 포함하는 제2 상동성 아암.
  14. 제13항에 있어서, 상기 제1 또는 제2 상동성 아암은 적어도 40, 80, 120, 150, 200, 300, 500, 또는 1,000개의 뉴클레오티드의 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
  15. 제1항 내지 제14항 중 어느 하나의 항에 있어서, 상기 서열 동일성은 스미스-워터맨(Smith-Waterman) 상동성 검색 알고리즘의 매개변수를 사용하는 BLASTP, CLUSTALW, MUSCLE, MAFFT, 또는 CLUSTALW에 의해 결정되는 것인 조작된 뉴클레아제 시스템.
  16. 제15항에 있어서, 상기 서열 동일성은 단어 길이(W) 3, 기대치(E) 10의 매개변수를 사용하고, 존재 11, 확장 1에서 갭 비용을 설정하는 BLOSUM62 스코어링 매트릭스를 사용하고, 조건부 구성 스코어 매트릭스 조정을 사용하는 상기 BLASTP 상동성 검색 알고리즘에 의해 결정되는 것인 조작된 뉴클레아제 시스템.
  17. (a) 표적 DNA 분자 내의 표적 서열에 상보적인 뉴클레오티드 서열을 포함하는 DNA 표적화 세그먼트; 및
    (b) 혼성화하여 이중 가닥 RNA(dsRNA) 이중체를 형성하는 2개의 상보적인 뉴클레오티드 스트레치를 포함하는 단백질 결합 세그먼트
    를 포함하는 조작된 가이드 리보핵산 폴리뉴클레오티드로서,
    상기 2개의 상보적인 뉴클레오티드 스트레치는 개재 뉴클레오티드로 서로 공유적으로 연결되며,
    상기 조작된 가이드 리보핵산 폴리뉴클레오티드는 서열 번호 5718-5846 또는 6257 중 어느 하나에 대해 적어도 75% 서열 동일성을 갖는 서열을 포함하는 엔도뉴클레아제와 복합체를 형성하고 상기 표적 DNA 분자의 상기 표적 서열에 상기 복합체를 표적화하도록 구성되는
    조작된 가이드 리보핵산 폴리뉴클레오티드.
  18. 제17항에 있어서, 상기 DNA 표적화 세그먼트는 상기 2개의 상보적인 뉴클레오티드 스트레치 모두의 5'에 위치하는 것인 조작된 가이드 리보핵산 폴리뉴클레오티드.
  19. 제17항 또는 제18항의 조작된 가이드 리보핵산 폴리뉴클레오티드 또는 구조를 코딩하는 데옥시리보핵산 폴리뉴클레오티드.
  20. 유기체에서의 발현을 위해 최적화된 조작된 핵산 서열을 포함하는 핵산으로서, 상기 핵산은 서열 번호 5718-5846 또는 6257 중 어느 하나에 대해 적어도 75% 서열 동일성을 갖는 서열을 포함하는 엔도뉴클레아제를 코딩하는 것인 핵산.
  21. 제20항에 있어서, 상기 엔도뉴클레아제는 상기 엔도뉴클레아제의 N- 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS)을 코딩하는 서열을 포함하는 것인 핵산.
  22. 제21항에 있어서, 상기 NLS는 서열 번호 5597-5612로부터 선택된 서열을 포함하는 것인 핵산.
  23. 제20항 내지 제22항 중 어느 하나의 항에 있어서, 상기 유기체는 원핵생물, 박테리아, 진핵생물, 진균, 식물, 포유동물, 설치류, 또는 인간인 핵산.
  24. 제20항 내지 제23항 중 어느 하나의 항의 핵산을 포함하는 벡터.
  25. 제24항에 있어서,
    (a) 표적 데옥시리보핵산 서열에 혼성화하도록 구성된 리보핵산 서열; 및
    (b) 상기 엔도뉴클레아제에 결합하도록 구성된 리보핵산 서열
    을 포함하는 상기 엔도뉴클레아제와 복합체를 형성하도록 구성된 조작된 가이드 리보핵산 구조를 코딩하는 핵산을 추가로 포함하는 벡터.
  26. 제24항 또는 제25항에 있어서, 벡터는 플라스미드, 미니서클, CELiD, 아데노 관련 바이러스(AAV) 유래 비리온, 또는 렌티바이러스인 벡터.
  27. 제24항 내지 제26항 중 어느 하나의 항의 벡터를 포함하는 세포.
  28. 제27항의 상기 세포를 배양하는 단계를 포함하는 엔도뉴클레아제의 제조 방법.
  29. 이중 가닥 데옥시리보핵산 폴리뉴클레오티드에 결합하거나, 이를 절단, 마킹(marking), 또는 변형하는 방법으로서,
    클래스 2, II형 Cas 엔도뉴클레아제 및 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드에 결합하도록 구성된 조작된 가이드 리보핵산 구조와 복합체를 형성하는 상기 엔도뉴클레아제와 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드를 접촉시키는 단계
    를 포함하며; 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 프로토스페이서 인접 모티프(PAM)를 포함하고;
    상기 PAM은 서열 번호 5847-5861 또는 6258-6278로 이루어진 군으로부터 선택된 서열을 포함하는 것인 방법.
  30. 제29항에 있어서, 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 상기 조작된 가이드 리보핵산 구조의 서열에 상보적인 서열을 포함하는 제1 가닥 및 상기 PAM을 포함하는 제2 가닥을 포함하는 것인 방법.
  31. 제30항에 있어서, 상기 PAM은 상기 조작된 가이드 리보핵산 구조의 상기 서열에 상보적인 상기 서열의 3' 말단에 바로 인접한 것인 방법.
  32. 제29항 내지 제31항 중 어느 하나의 항에 있어서, 상기 클래스 2, II형 Cas 엔도뉴클레아제는 Cas9 엔도뉴클레아제, Cas14 엔도뉴클레아제, Cas12a 엔도뉴클레아제, Cas12b 엔도뉴클레아제, Cas 12c 엔도뉴클레아제, Cas12d 엔도뉴클레아제, Cas12e 엔도뉴클레아제, Cas13a 엔도뉴클레아제, Cas13b 엔도뉴클레아제, Cas13c 엔도뉴클레아제, 또는 Cas 13d 엔도뉴클레아제가 아닌 것인 방법.
  33. 제29항 내지 제32항 중 어느 하나의 항에 있어서, 상기 이중 가닥 데옥시리보핵산 폴리뉴클레오티드는 진핵생물, 식물, 진균, 포유동물, 설치류, 또는 인간 이중 가닥 데옥시리보핵산 폴리뉴클레오티드인 방법.
  34. 표적 핵산 유전자좌를 변형시키는 방법으로서, 제1항 내지 제16항 중 어느 하나의 항의 상기 조작된 뉴클레아제 시스템을 상기 표적 핵산 유전자좌에 전달하는 단계를 포함하며, 상기 엔도뉴클레아제는 상기 조작된 가이드 리보핵산 구조와 복합체를 형성하도록 구성되고, 상기 복합체는 상기 복합체가 상기 표적 핵산 유전자좌에 결합할 때 상기 복합체가 상기 표적 핵산 유전자좌를 변형시키도록 구성되는 것인 방법.
  35. 제34항에 있어서, 상기 표적 핵산 유전자좌를 변형시키는 단계는 상기 표적 핵산 유전자좌에 결합하거나, 이를 닉킹(nicking), 절단 또는 마킹하는 것을 포함하는 방법.
  36. 제34항 또는 제35항에 있어서, 상기 표적 핵산 유전자좌는 데옥시리보핵산(DNA) 또는 리보핵산(RNA)을 포함하는 것인 방법.
  37. 제36항에 있어서, 상기 표적 핵산은 게놈 DNA, 바이러스 DNA, 바이러스 RNA, 또는 박테리아 DNA를 포함하는 것인 방법.
  38. 제34항 내지 제37항 중 어느 하나의 항에 있어서, 상기 표적 핵산 유전자좌는 시험관 내에 있는 것인 방법.
  39. 제34항 내지 제37항 중 어느 하나의 항에 있어서, 상기 표적 핵산 유전자좌는 세포 내에 있는 것인 방법.
  40. 제39항에 있어서, 상기 세포는 원핵생물 세포, 박테리아 세포, 진핵생물 세포, 진균 세포, 식물 세포, 동물 세포, 포유동물 세포, 설치류 세포, 영장류 세포, 또는 인간 세포인 방법.
  41. 제34항 내지 제40항 중 어느 하나의 항에 있어서, 상기 조작된 뉴클레아제 시스템을 상기 표적 핵산 유전자좌에 전달하는 단계는 제20항 내지 제23항 중 어느 하나의 항의 핵산 또는 제24항 내지 제26항 중 어느 하나의 항의 벡터를 전달하는 것을 포함하는 방법.
  42. 제34항 내지 제40항 중 어느 하나의 항에 있어서, 상기 조작된 뉴클레아제 시스템을 상기 표적 핵산 유전자좌에 전달하는 단계는 상기 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임을 포함하는 핵산을 전달하는 것을 포함하는 방법.
  43. 제41항에 있어서, 상기 핵산은 상기 엔도뉴클레아제를 코딩하는 상기 오픈 리딩 프레임이 작동가능하게 연결된 프로모터를 포함하는 것인 방법.
  44. 제34항 내지 제41항 중 어느 하나의 항에 있어서, 상기 조작된 뉴클레아제 시스템을 상기 표적 핵산 유전자좌에 전달하는 단계는 상기 엔도뉴클레아제를 코딩하는 상기 오픈 리딩 프레임을 포함하는 캡핑된 mRNA를 전달하는 것을 포함하는 방법.
  45. 제34항 내지 제41항 중 어느 하나의 항에 있어서, 상기 조작된 뉴클레아제 시스템을 상기 표적 핵산 유전자좌에 전달하는 단계는 번역된 폴리펩티드를 전달하는 것을 포함하는 방법.
  46. 제34항 내지 제41항 중 어느 하나의 항에 있어서, 상기 조작된 뉴클레아제 시스템을 상기 표적 핵산 유전자좌에 전달하는 단계는 리보핵산(RNA) pol III 프로모터에 작동가능하게 연결된 상기 조작된 가이드 리보핵산 구조를 코딩하는 데옥시리보핵산(DNA)을 전달하는 것을 포함하는 방법.
  47. 제34항 내지 제46항 중 어느 하나의 항에 있어서, 상기 엔도뉴클레아제는 상기 표적 유전자좌에서 또는 이에 근접하여 단일 가닥 파손 또는 이중 가닥 파손을 유도하는 것인 방법.
  48. 세포에서 TRAC 유전자좌를 편집하는 방법으로서, 상기 세포에
    (a) RNA 가이드된 엔도뉴클레아제; 및
    (b) 조작된 가이드 RNA
    를 접촉시키는 단계를 포함하며, 상기 조작된 가이드 RNA는 상기 엔도뉴클레아제와 복합체를 형성하도록 구성되고 상기 조작된 가이드 RNA는 상기 TRAC 유전자좌의 영역에 혼성화하도록 구성된 스페이서 서열을 포함하고,
    상기 조작된 가이드 RNA는 서열 번호 5950-5958 또는 5959-5965 중 어느 하나의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함하는 것인 방법.
  49. 제48항에 있어서, 상기 RNA 가이드된 엔도뉴클레아제는 클래스 II, II형 Cas 엔도뉴클레아제인 방법.
  50. 제48항 또는 제49항에 있어서, 상기 RNA 가이드된 엔도뉴클레아제는 서열 번호 2242 또는 서열 번호 2244에 대해 적어도 75% 동일성을 갖는 서열을 포함하는 RuvCIII 도메인을 포함하는 것인 방법.
  51. 제50항에 있어서, 상기 RNA 가이드된 엔도뉴클레아제는 HNH 도메인을 추가로 포함하는 것인 방법.
  52. 제48항 내지 제51항 중 어느 하나의 항에 있어서, 상기 RNA 가이드된 엔도뉴클레아제는 서열 번호 421 또는 서열 번호 423에 대해 적어도 75% 동일성을 갖는 서열을 포함하는 것인 방법.
  53. 제48항 내지 제52항 중 어느 하나의 항에 있어서, 상기 조작된 가이드 RNA는 서열 번호 5950-5958 중 어느 하나의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함하고 상기 엔도뉴클레아제는 서열 번호 421에 대해 적어도 75% 동일성을 갖는 서열을 포함하는 것인 방법.
  54. 제48항 내지 제52항 중 어느 하나의 항에 있어서, 상기 조작된 가이드 RNA는 서열 번호 5959-5965 중 어느 하나의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함하고 상기 엔도뉴클레아제는 서열 번호 423에 대해 적어도 75% 동일성을 갖는 서열을 포함하는 것인 방법.
  55. 제48항 내지 제52항 중 어느 하나의 항에 있어서, 상기 조작된 가이드 RNA는 서열 번호 5953-5957 중 어느 하나의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함하는 것인 방법.
  56. 제48항 내지 제52항 중 어느 하나의 항에 있어서, 상기 조작된 가이드 RNA는 서열 번호 5960-5961 또는 5963-5964 중 어느 하나의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함하는 것인 방법.
  57. 세포에서 TRBC 유전자좌를 편집하는 방법으로서, 상기 세포에
    (a) RNA 가이드된 엔도뉴클레아제; 및
    (b) 조작된 가이드 RNA
    를 접촉시키는 단계를 포함하며, 상기 조작된 가이드 RNA는 상기 엔도뉴클레아제와 복합체를 형성하도록 구성되고 상기 조작된 가이드 RNA는 상기 TRBC 유전자좌의 영역에 혼성화하도록 구성된 스페이서 서열을 포함하고,
    상기 조작된 가이드 RNA는 5966-6004 또는 6005-6025 중 어느 하나의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함하는 것인 방법.
  58. 제57항에 있어서, 상기 RNA 가이드된 엔도뉴클레아제는 클래스 II, II형 Cas 엔도뉴클레아제인 방법.
  59. 제57항 또는 제58항에 있어서, 상기 RNA 가이드된 엔도뉴클레아제는 서열 번호 2242 또는 서열 번호 2244에 대해 적어도 75% 동일성을 갖는 서열을 포함하는 RuvCIII 도메인을 포함하는 것인 방법.
  60. 제59항에 있어서, 상기 RNA 가이드된 엔도뉴클레아제는 HNH 도메인을 추가로 포함하는 것인 방법.
  61. 제57항 내지 제60항 중 어느 하나의 항에 있어서, 상기 RNA 가이드된 엔도뉴클레아제는 서열 번호 421 또는 서열 번호 423에 대해 적어도 75% 동일성을 갖는 서열을 포함하는 것인 방법.
  62. 제57항 내지 제61항 중 어느 하나의 항에 있어서, 상기 조작된 가이드 RNA는 서열 번호 5966-6004 중 어느 하나의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함하고 상기 엔도뉴클레아제는 서열 번호 421에 대해 적어도 75% 동일성을 갖는 서열을 포함하는 것인 방법.
  63. 제57항 내지 제61항 중 어느 하나의 항에 있어서, 상기 조작된 가이드 RNA는 서열 번호 6005-6025 중 어느 하나의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함하고 상기 엔도뉴클레아제는 서열 번호 423에 대해 적어도 75% 동일성을 갖는 서열을 포함하는 것인 방법.
  64. 제57항 내지 제61항 중 어느 하나의 항에 있어서, 상기 조작된 가이드 RNA는 서열 번호 5970, 5971, 5983, 또는 5984 중 어느 하나의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함하는 것인 방법.
  65. 제57항 내지 제61항 중 어느 하나의 항에 있어서, 상기 조작된 가이드 RNA는 서열 번호 6006, 6010, 6011, 또는 6012 중 어느 하나의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함하는 것인 방법.
  66. 세포에서 GR(NR3C1) 유전자좌를 편집하는 방법으로서, 상기 세포에
    (a) RNA 가이드된 엔도뉴클레아제; 및
    (b) 조작된 가이드 RNA
    를 접촉시키는 단계를 포함하며, 상기 조작된 가이드 RNA는 상기 엔도뉴클레아제와 복합체를 형성하도록 구성되고 상기 조작된 가이드 RNA는 상기 GR(NR3C1) 유전자좌의 영역에 혼성화하도록 구성된 스페이서 서열을 포함하고,
    상기 조작된 가이드 RNA는 서열 번호 6026-6090 또는 6091-6121 중 어느 하나의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함하는 것인 방법.
  67. 제66항에 있어서, 상기 RNA 가이드된 엔도뉴클레아제는 클래스 II, II형 Cas 엔도뉴클레아제인 방법.
  68. 제66항 또는 제67항에 있어서, 상기 RNA 가이드된 엔도뉴클레아제는 서열 번호 2242 또는 서열 번호 2244에 대해 적어도 75% 동일성을 갖는 서열을 포함하는 RuvCIII 도메인을 포함하는 것인 방법.
  69. 제68항에 있어서, 상기 RNA 가이드된 엔도뉴클레아제는 HNH 도메인을 추가로 포함하는 것인 방법.
  70. 제66항 내지 제69항 중 어느 하나의 항에 있어서, 상기 RNA 가이드된 엔도뉴클레아제는 서열 번호 421 또는 서열 번호 423에 대해 적어도 75% 동일성을 갖는 서열을 포함하는 것인 방법.
  71. 제66항 내지 제70항 중 어느 하나의 항에 있어서, 상기 조작된 가이드 RNA는 서열 번호 6026-6090 중 어느 하나의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함하고 상기 엔도뉴클레아제는 서열 번호 421에 대해 적어도 75% 동일성을 갖는 서열을 포함하는 것인 방법.
  72. 제66항 내지 제70항 중 어느 하나의 항에 있어서, 상기 조작된 가이드 RNA는 서열 번호 6091-6121 중 어느 하나의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함하고 상기 엔도뉴클레아제는 서열 번호 423에 대해 적어도 75% 동일성을 갖는 서열을 포함하는 것인 방법.
  73. 제66항 내지 제70항 중 어느 하나의 항에 있어서, 상기 조작된 가이드 RNA는 서열 번호 6027-6028, 6029, 6038, 6043, 6049, 6076, 6080, 6081, 또는 6086 중 어느 하나의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함하는 것인 방법.
  74. 제66항 내지 제70항 중 어느 하나의 항에 있어서, 상기 조작된 가이드 RNA는 서열 번호 6092, 6115, 또는 6119 중 어느 하나의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함하는 것인 방법.
  75. 세포에서 AAVS1 유전자좌를 편집하는 방법으로서, 상기 세포에
    (a) RNA 가이드된 엔도뉴클레아제; 및
    (b) 조작된 가이드 RNA
    를 접촉시키는 단계를 포함하며, 상기 조작된 가이드 RNA는 상기 엔도뉴클레아제와 복합체를 형성하도록 구성되고 상기 조작된 가이드 RNA는 상기 AAVS1 유전자좌의 영역에 혼성화하도록 구성된 스페이서 서열을 포함하고,
    상기 조작된 가이드 RNA는 서열 번호 6122-6152 중 어느 하나의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함하는 것인 방법.
  76. 제75항에 있어서, 상기 RNA 가이드된 엔도뉴클레아제는 클래스 II, II형 Cas 엔도뉴클레아제인 방법.
  77. 제75항 또는 제76항에 있어서, 상기 RNA 가이드된 엔도뉴클레아제는 서열 번호 2242 또는 서열 번호 2244에 대해 적어도 75% 동일성을 갖는 서열을 포함하는 RuvCIII 도메인을 포함하는 것인 방법.
  78. 제68항에 있어서, 상기 RNA 가이드된 엔도뉴클레아제는 HNH 도메인을 추가로 포함하는 것인 방법.
  79. 제75항 내지 제78항 중 어느 하나의 항에 있어서, 상기 RNA 가이드된 엔도뉴클레아제는 서열 번호 421 또는 서열 번호 423에 대해 적어도 75% 동일성을 갖는 서열을 포함하는 것인 방법.
  80. 제75항 내지 제79항 중 어느 하나의 항에 있어서, 상기 조작된 가이드 RNA는 서열 번호 6122, 6125-6126, 6128, 6131, 6133, 6136, 6141, 6143, 또는 6148 중 어느 하나의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함하는 것인 방법.
  81. 세포에서 TIGIT 유전자좌를 편집하는 방법으로서, 상기 세포에
    (a) RNA 가이드된 엔도뉴클레아제; 및
    (b) 조작된 가이드 RNA
    를 접촉시키는 단계를 포함하며, 상기 조작된 가이드 RNA는 상기 엔도뉴클레아제와 복합체를 형성하도록 구성되고 상기 조작된 가이드 RNA는 상기 TIGIT 유전자좌의 영역에 혼성화하도록 구성된 스페이서 서열을 포함하고,
    상기 조작된 가이드 RNA는 서열 번호 6153-6181 중 어느 하나의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함하는 것인 방법.
  82. 제81항에 있어서, 상기 RNA 가이드된 엔도뉴클레아제는 클래스 II, II형 Cas 엔도뉴클레아제인 방법.
  83. 제81항 또는 제82항에 있어서, 상기 RNA 가이드된 엔도뉴클레아제는 서열 번호 421 또는 서열 번호 423에 대해 적어도 75% 동일성을 갖는 서열을 포함하는 것인 방법.
  84. 제81항 내지 제83항 중 어느 하나의 항에 있어서, 상기 RNA 가이드된 엔도뉴클레아제는 서열 번호 2242 또는 서열 번호 2244에 대해 적어도 75% 동일성을 갖는 서열을 포함하는 RuvCIII 도메인을 포함하는 것인 방법.
  85. 제84항에 있어서, 상기 RNA 가이드된 엔도뉴클레아제는 HNH 도메인을 추가로 포함하는 것인 방법.
  86. 제81항 내지 제85항 중 어느 하나의 항에서, 상기 조작된 가이드 RNA는 서열 번호 66155, 6159, 616, 또는 6172 중 어느 하나의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함하는 것인 방법.
  87. 세포에서 CD38 유전자좌를 편집하는 방법으로서, 상기 세포에
    (a) RNA 가이드된 엔도뉴클레아제; 및
    (b) 조작된 가이드 RNA
    를 접촉시키는 단계를 포함하며, 상기 조작된 가이드 RNA는 상기 엔도뉴클레아제와 복합체를 형성하도록 구성되고 상기 조작된 가이드 RNA는 상기 CD38 유전자좌의 영역에 혼성화하도록 구성된 스페이서 서열을 포함하고,
    상기 조작된 가이드 RNA는 서열 번호 6182-6248 또는 6249-6256 중 어느 하나의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함하는 것인 방법.
  88. 제87항에 있어서, 상기 RNA 가이드된 엔도뉴클레아제는 클래스 II, II형 Cas 엔도뉴클레아제인 방법.
  89. 제87항 또는 제88항에 있어서, 상기 RNA 가이드된 엔도뉴클레아제는 서열 번호 2242 또는 서열 번호 2244에 대해 적어도 75% 동일성을 갖는 서열을 포함하는 RuvCIII 도메인을 포함하는 것인 방법.
  90. 제89항에 있어서, 상기 RNA 가이드된 엔도뉴클레아제는 HNH 도메인을 추가로 포함하는 것인 방법.
  91. 제87항 내지 제90항 중 어느 하나의 항에 있어서, 상기 RNA 가이드된 엔도뉴클레아제는 서열 번호 421 또는 서열 번호 423에 대해 적어도 75% 동일성을 갖는 서열을 포함하는 것인 방법.
  92. 제87항 내지 제91항 중 어느 하나의 항에 있어서, 상기 조작된 가이드 RNA는 서열 번호 6182-6248 중 어느 하나의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함하고 상기 엔도뉴클레아제는 서열 번호 421에 대해 적어도 75% 동일성을 갖는 서열을 포함하는 것인 방법.
  93. 제87항 내지 제91항 중 어느 하나의 항에 있어서, 상기 조작된 가이드 RNA는 서열 번호 6249-6256 중 어느 하나의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함하고 상기 엔도뉴클레아제는 서열 번호 423에 대해 적어도 75% 동일성을 갖는 서열을 포함하는 것인 방법.
  94. 제87항 내지 제91항 중 어느 하나의 항에 있어서, 상기 조작된 가이드 RNA는 서열 번호 6182-6183, 6189, 6191, 6208, 6210, 6211, 또는 6215 중 어느 하나의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함하는 것인 방법.
  95. 제87항 내지 제91항 중 어느 하나의 항에 있어서, 상기 조작된 가이드 RNA는 서열 번호 6251의 적어도 18개의 연속 뉴클레오티드에 대해 적어도 85% 동일성을 갖는 표적화 서열을 포함하는 것인 방법.
  96. 제48항 내지 제95항 중 어느 하나의 항에 있어서, 상기 세포는 말초 혈액 단핵 세포, T 세포, NK 세포, 조혈 줄기 세포(HSCT), 또는 B 세포인 방법.
  97. (a) 표적 DNA 분자 내의 표적 서열에 상보적인 뉴클레오티드 서열을 포함하는 DNA 표적화 세그먼트; 및
    (b) 혼성화하여 이중 가닥 RNA(dsRNA) 이중체를 형성하는 2개의 상보적인 뉴클레오티드 스트레치를 포함하는 단백질 결합 세그먼트
    를 포함하는 조작된 가이드 리보핵산 폴리뉴클레오티드로서,
    상기 2개의 상보적인 뉴클레오티드 스트레치는 개재 뉴클레오티드로 서로 공유적으로 연결되며,
    상기 조작된 가이드 리보핵산 폴리뉴클레오티드는 클래스 2, II형 Cas 엔도뉴클레아제와 복합체를 형성하고 상기 복합체를 상기 표적 DNA 분자의 상기 표적 서열에 표적화하도록 구성되고, 상기 DNA 표적화 세그먼트는 서열 번호 5950-5965, 5966-6025, 6026-6121, 6122-6152, 6153-6181, 또는 6182-6256 중 어느 하나에 대해 적어도 85% 동일성을 갖는 서열을 포함하는 것인 조작된 가이드 리보핵산 폴리뉴클레오티드.
  98. 제97항에 있어서, 상기 단백질 결합 세그먼트는 서열 번호 5466 또는 6304 중 어느 하나에 대해 적어도 85% 동일성을 갖는 서열을 포함하는 것인 조작된 가이드 리보핵산 폴리뉴클레오티드.
  99. 다음을 포함하는 편집된 면역 세포를 생성하기 위한 시스템:
    (a) RNA 가이드된 엔도뉴클레아제;
    (b) 상기 RNA 가이드된 엔도뉴클레아제에 결합하도록 구성된 제97항에 따른 조작된 가이드 리보핵산 폴리뉴클레오티드; 및
    (c) 키메라 항원 수용체(CAR)를 코딩하는 서열에 인접해 있는 제1 및 제2 상동성 아암을 포함하는 단일 또는 이중 가닥 DNA 복구 주형.
  100. 제99항에 있어서, 상기 세포는 말초 혈액 단핵 세포, T 세포, NK 세포, 조혈 줄기 세포(HSCT), 또는 B 세포인 시스템.
  101. 제99항 또는 제100항에 있어서, 상기 RNA 가이드된 엔도뉴클레아제는 클래스 II, II형 Cas 엔도뉴클레아제인 시스템.
  102. 제99항 내지 제101항 중 어느 하나의 항에 있어서, 상기 RNA 가이드된 엔도뉴클레아제는 서열 번호 2242 또는 서열 번호 2244에 대해 적어도 75% 동일성을 갖는 서열을 포함하는 RuvCIII 도메인을 포함하는 것인 방법.
  103. 제102항에 있어서, 상기 RNA 가이드된 엔도뉴클레아제는 HNH 도메인을 추가로 포함하는 것인 방법.
  104. 제99항 내지 제103항 중 어느 하나의 항에 있어서, 상기 RNA 가이드된 엔도뉴클레아제는 서열 번호 421 또는 서열 번호 423에 대해 적어도 75% 동일성을 갖는 서열을 포함하는 것인 방법.
KR1020227042270A 2020-05-08 2021-05-06 Ruvc 도메인을 포함하는 효소 KR20230021657A (ko)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US202063022320P 2020-05-08 2020-05-08
US63/022,320 2020-05-08
US202063032464P 2020-05-29 2020-05-29
US63/032,464 2020-05-29
US202063116155P 2020-11-19 2020-11-19
US63/116,155 2020-11-19
US202163180570P 2021-04-27 2021-04-27
US63/180,570 2021-04-27
PCT/US2021/031136 WO2021226363A1 (en) 2020-05-08 2021-05-06 Enzymes with ruvc domains

Publications (1)

Publication Number Publication Date
KR20230021657A true KR20230021657A (ko) 2023-02-14

Family

ID=78468763

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227042270A KR20230021657A (ko) 2020-05-08 2021-05-06 Ruvc 도메인을 포함하는 효소

Country Status (9)

Country Link
EP (1) EP4146800A1 (ko)
JP (1) JP2023533417A (ko)
KR (1) KR20230021657A (ko)
CN (1) CN116096892A (ko)
AU (1) AU2021267379A1 (ko)
CA (1) CA3177828A1 (ko)
GB (1) GB2612458A (ko)
MX (1) MX2022014067A (ko)
WO (1) WO2021226363A1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2617658B (en) 2020-03-06 2024-04-17 Metagenomi Inc Class II, type V CRISPR systems
KR20220161383A (ko) 2020-03-31 2022-12-06 메타지노미, 인크. 클래스 ii, 유형 ii crispr 시스템
JP2024504981A (ja) * 2021-01-22 2024-02-02 メタゲノミ,インク. 新規の操作されたヌクレアーゼおよびキメラヌクレアーゼ
WO2023118349A1 (en) * 2021-12-21 2023-06-29 Alia Therapeutics Srl Type ii cas proteins and applications thereof
WO2023137451A1 (en) * 2022-01-14 2023-07-20 Arbor Biotechnologies, Inc. Compositions comprising an rna guide targeting cd38 and uses thereof
WO2023194359A1 (en) * 2022-04-04 2023-10-12 Alia Therapeutics Srl Compositions and methods for treatment of usher syndrome type 2a

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11680262B2 (en) * 2017-03-30 2023-06-20 Kyoto University Method for inducing exon skipping by genome editing
US9982279B1 (en) * 2017-06-23 2018-05-29 Inscripta, Inc. Nucleic acid-guided nucleases

Also Published As

Publication number Publication date
GB202217378D0 (en) 2023-01-04
EP4146800A1 (en) 2023-03-15
AU2021267379A1 (en) 2022-12-08
WO2021226363A1 (en) 2021-11-11
CN116096892A (zh) 2023-05-09
CA3177828A1 (en) 2021-11-11
GB2612458A (en) 2023-05-03
MX2022014067A (es) 2023-02-22
JP2023533417A (ja) 2023-08-03

Similar Documents

Publication Publication Date Title
AU2020223370B2 (en) Enzymes with RuvC domains
US11713471B2 (en) Class II, type V CRISPR systems
US10913941B2 (en) Enzymes with RuvC domains
KR20230021657A (ko) Ruvc 도메인을 포함하는 효소
WO2021178934A1 (en) Class ii, type v crispr systems
US20220298494A1 (en) Enzymes with ruvc domains
US20220220460A1 (en) Enzymes with ruvc domains
EP4165177A1 (en) Enzymes with ruvc domains
US20240110167A1 (en) Enzymes with ruvc domains
WO2023039377A1 (en) Class ii, type v crispr systems
GB2617659A (en) Enzymes with RUVC domains
KR20240049306A (ko) Ruvc 도메인을 갖는 효소
WO2023028348A1 (en) Enzymes with ruvc domains

Legal Events

Date Code Title Description
A201 Request for examination