JP2023179468A - Enzymes with ruvc domains - Google Patents

Enzymes with ruvc domains Download PDF

Info

Publication number
JP2023179468A
JP2023179468A JP2023146414A JP2023146414A JP2023179468A JP 2023179468 A JP2023179468 A JP 2023179468A JP 2023146414 A JP2023146414 A JP 2023146414A JP 2023146414 A JP2023146414 A JP 2023146414A JP 2023179468 A JP2023179468 A JP 2023179468A
Authority
JP
Japan
Prior art keywords
seq
sequence
endonuclease
nuclease system
engineered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023146414A
Other languages
Japanese (ja)
Inventor
トーマス,ブライアン
Thomas Brian
ブラウン,クリストファー
Brown Christopher
カンター,ローズ
Kantor Rose
デヴォート,オードラ
Devoto Audra
バターフィールド,クリスティーナ
Butterfield Cristina
アレクサンダー,リサ
Alexander Lisa
エス.エー. ゴルツマン,ダニエラ
S A Goltsman Daniela
リュー,ジェイソン
Liu Jason
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Metagenomi Inc
Original Assignee
Metagenomi Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Metagenomi Inc filed Critical Metagenomi Inc
Publication of JP2023179468A publication Critical patent/JP2023179468A/en
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • C12Y301/21Endodeoxyribonucleases producing 5'-phosphomonoesters (3.1.21)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/50Physical structure
    • C12N2310/53Physical structure partially self-complementary or closed
    • C12N2310/531Stem-loop; Hairpin

Abstract

To provide an engineered nuclease composition.SOLUTION: In one embodiment, an engineered nuclease composition comprises (a) an endonuclease, comprising a RuvC_III domain that comprises a sequence with at least 90% sequence identity to a specific sequence and (b) an engineered guide ribonucleic acid structure configured to form a complex with the endonuclease, wherein the engineered guide ribonucleic acid structure comprises a guide ribonucleic acid sequence configured to hybridize with a target deoxyribonucleic acid sequence.SELECTED DRAWING: Figure 1

Description

相互参照
本出願は、2019年2月14日に出願された「MG1 ENZYMES WITH RUVC DOMAINS」と題される米国仮出願第62/805,868号、および2019年7月15日に出願された「MG1 ENZYMES WITH RUVC DOMAINS」と題される米国仮出願第62/874,414号、および、2019年2月14日に出願された「MG2 ENZYMES CONTAINING RUVC DOMAINS」と題される米国仮出願第62/805,878号、および2019年2月14日に出願された「MG3 ENZYMES WITH RUVC DOMAINS」と題される米国仮出願第62/805,899号の利益を主張し、これらの各々は、参照により完全に本明細書に組み込まれる。
CROSS REFERENCES This application is a reference to U.S. Provisional Application No. 62/805,868, filed on February 14, 2019, entitled "MG1 ENZYMES WITH RUVC DOMAINS" and " U.S. Provisional Application No. 62/874,414 entitled “MG1 ENZYMES WITH RUVC DOMAINS” and U.S. Provisional Application No. 62/874,414 entitled “MG2 ENZYMES CONTAINING RUVC DOMAINS” filed on February 14, 2019. No. 805,878, and U.S. Provisional Application No. 62/805,899, filed February 14, 2019, entitled "MG3 ENZYMES WITH RUVC DOMAINS," each of which is incorporated by reference. Fully incorporated herein.

Cas酵素は、それらの関連するクラスター化して規則的な配置の短い回文配列リピート(CRISPR)ガイドリボ核酸(RNA)とともに、原核生物免疫系に広がる(~45%の細菌、~84%の古細菌)構成成分であり、CRISPR-RNAガイド核酸切断(CRISPR-RNA guided nucleic acid cleavage)によって、感染性ウイルスおよびプラスミドなどの非自己核酸からそのような微生物を保護する役割を果たすように思われる。CRISPR RNAエレメントをコードするデオキシリボ核酸(DNA)エレメントは、構造と長さが比較的保存されている場合があるが、それらのCRISPR関連(Cas)タンパク質は非常に多様であり、種々様々な核酸相互作用ドメインを含有している。CRISPR DNAエレメントは早くとも1987年には観察されていたが、CRISPR/Cas複合体のプログラム可能なエンドヌクレアーゼ切断能力は比較的最近になって認識され、多様なDNA操作および遺伝子編集の用途における、組換えCRISPR/Casシステムの使用につながっている。 Cas enzymes, along with their associated clustered regularly spaced short palindromic repeats (CRISPR)-guided ribonucleic acids (RNAs), are widespread in prokaryotic immune systems (~45% of bacteria, ~84% of archaea). ) and appears to play a role in protecting such microorganisms from infectious viruses and non-self nucleic acids such as plasmids by CRISPR-RNA guided nucleic acid cleavage. Although the deoxyribonucleic acid (DNA) elements encoding CRISPR RNA elements may be relatively conserved in structure and length, their CRISPR-associated (Cas) proteins are highly diverse and interact with a wide variety of nucleic acids. Contains an action domain. Although CRISPR DNA elements have been observed as early as 1987, the programmable endonuclease cleavage capabilities of the CRISPR/Cas complex have been recognized relatively recently and have been shown to be useful in a variety of DNA manipulation and gene editing applications. This has led to the use of recombinant CRISPR/Cas systems.

配列表
本出願は配列表を含んでおり、この配列表はASCIIフォーマットで電子的に提出され、参照によりその全体が本明細書に組み込まれる。前記ASCIIのコピーは、2020年2月13日に作成され、55921-703_601_SL.txtというファイル名であり、23,363,113バイトのサイズである。
SEQUENCE LISTING This application contains a sequence listing, which is submitted electronically in ASCII format and is incorporated herein by reference in its entirety. The ASCII copy was created on February 13, 2020 and is 55921-703_601_SL. The file name is txt and the size is 23,363,113 bytes.

いくつかの態様では、本開示は操作されたヌクレアーゼシステムを提供し、上記操作されたヌクレアーゼシステムは:(a)RuvC_IIIドメインとHNHドメインとを含むエンドヌクレアーゼであって、ここで、上記エンドヌクレアーゼは難培養性微生物(uncultivated microorganism)に由来し、ここで、上記エンドヌクレアーゼは、クラス2のII型Casエンドヌクレアーゼである、エンドヌクレアーゼと;(b)上記エンドヌクレアーゼと複合体を形成するように構成される、操作されたガイドリボ核酸構造であって、上記操作されたガイドリボ核酸構造は:(i)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列と;(ii)上記エンドヌクレアーゼに結合するように構成されたtracrリボ核酸配列とを含む、操作されたガイドリボ核酸構造と、を含む。いくつかの実施形態では、RuvC_IIIドメインは、配列番号:1827-3637のいずれか1つに対して少なくとも70%、少なくとも75%、少なくとも80%、または少なくとも90%の配列同一性を有する配列を含む。 In some aspects, the present disclosure provides an engineered nuclease system, wherein the engineered nuclease system is: (a) an endonuclease comprising a RuvC_III domain and a HNH domain, wherein the endonuclease comprises: derived from an uncultivated microorganism, wherein the endonuclease is a class 2 type II Cas endonuclease; (b) configured to form a complex with the endonuclease; an engineered guide ribonucleic acid structure comprising: (i) a guide ribonucleic acid sequence configured to hybridize to a target deoxyribonucleic acid sequence; (ii) an endonuclease as described above; an engineered guide ribonucleic acid structure comprising a tracr ribonucleic acid sequence configured to bind. In some embodiments, the RuvC_III domain comprises a sequence that has at least 70%, at least 75%, at least 80%, or at least 90% sequence identity to any one of SEQ ID NOs: 1827-3637. .

いくつかの態様では、本開示は操作されたヌクレアーゼシステムを提供し、上記操作されたヌクレアーゼシステムは:(a)配列番号:1827-3637のいずれか1つに対して少なくとも75%の配列同一性を有するRuvC_IIIドメインを含むエンドヌクレアーゼと;(b)上記エンドヌクレアーゼと複合体を形成するように構成される、操作されたガイドリボ核酸構造であって、上記操作されたガイドリボ核酸構造は:(i)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列と;(ii)上記エンドヌクレアーゼに結合するように構成されたtracrリボ核酸配列と、を含む、ガイドリボ核酸構造と、を含む。 In some aspects, the disclosure provides an engineered nuclease system, wherein the engineered nuclease system: (a) has at least 75% sequence identity to any one of SEQ ID NOs: 1827-3637. (b) an engineered guide ribonucleic acid structure configured to form a complex with said endonuclease, said engineered guide ribonucleic acid structure comprising: (i) a guide ribonucleic acid sequence configured to hybridize to a target deoxyribonucleic acid sequence; and (ii) a tracr ribonucleic acid sequence configured to bind to the endonuclease.

いくつかの態様では、本開示は操作されたヌクレアーゼシステムを提供し、上記操作されたヌクレアーゼシステムは:(a)配列番号:5512-5537を含むプロトスペーサー隣接モチーフ(PAM)配列に結合するように構成されたエンドヌクレアーゼであって、ここで、上記エンドヌクレアーゼはクラス2のII型Casエンドヌクレアーゼである、エンドヌクレアーゼと;(b)上記エンドヌクレアーゼと複合体を形成するように構成される、操作されたガイドリボ核酸構造であって、上記操作されたガイドリボ核酸構造は:(i)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列と;(ii)上記エンドヌクレアーゼに結合するように構成されたtracrリボ核酸配列と、を含む、操作されたガイドリボ核酸構造と、を含む。 In some aspects, the present disclosure provides an engineered nuclease system, wherein the engineered nuclease system is configured to: (a) bind to a protospacer adjacent motif (PAM) sequence comprising SEQ ID NOs: 5512-5537; (b) an endonuclease configured to form a complex with the endonuclease, wherein the endonuclease is a class 2 type II Cas endonuclease; wherein the engineered guide ribonucleic acid structure comprises: (i) a guide ribonucleic acid sequence configured to hybridize to the target deoxyribonucleic acid sequence; (ii) configured to bind to the endonuclease. and an engineered guide ribonucleic acid structure comprising an assembled tracr ribonucleic acid sequence.

いくつかの実施形態では、エンドヌクレアーゼは難培養性微生物に由来する。いくつかの実施形態では、エンドヌクレアーゼは、異なるPAM配列に結合するように操作されていない。いくつかの実施形態では、エンドヌクレアーゼは、Cas9エンドヌクレアーゼ、Cas14エンドヌクレアーゼ、Cas12aエンドヌクレアーゼ、Cas12bエンドヌクレアーゼ、Cas12cエンドヌクレアーゼ、Cas12dエンドヌクレアーゼ、Cas12eエンドヌクレアーゼ、Cas13aエンドヌクレアーゼ、Cas13bエンドヌクレアーゼ、Cas13cエンドヌクレアーゼ、またはCas13dエンドヌクレアーゼではない。いくつかの実施形態では、エンドヌクレアーゼは、Cas9エンドヌクレアーゼに対して80%未満の同一性を有する。いくつかの実施形態では、エンドヌクレアーゼはHNHドメインをさらに含む。いくつかの実施形態では、tracrリボ核酸配列は、配列番号:5476-5511および配列番号:5538のいずれか1つから選択される約60~90の連続するヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含む。 In some embodiments, the endonuclease is derived from a difficult-to-cultivate microorganism. In some embodiments, the endonuclease is not engineered to bind to different PAM sequences. In some embodiments, the endonuclease is Cas9 endonuclease, Cas14 endonuclease, Cas12a endonuclease, Cas12b endonuclease, Cas12c endonuclease, Cas12d endonuclease, Cas12e endonuclease, Cas13a endonuclease, Cas13b endonuclease, Cas13 c endonuclease , or not Cas13d endonuclease. In some embodiments, the endonuclease has less than 80% identity to Cas9 endonuclease. In some embodiments, the endonuclease further comprises an HNH domain. In some embodiments, the tracr ribonucleic acid sequences have at least 80% sequence identity over about 60-90 contiguous nucleotides selected from any one of SEQ ID NO: 5476-5511 and SEQ ID NO: 5538. Contains sequences with specific characteristics.

いくつかの態様では、本開示は操作されたヌクレアーゼシステムを提供し、上記操作されたヌクレアーゼシステムは、(a)操作されたガイドリボ核酸構造であって、上記操作されたガイドリボ核酸構造は:(i)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列と;(ii)エンドヌクレアーゼに結合するように構成されたtracrリボ核酸配列であって、ここで、上記tracrリボ核酸配列は、配列番号:5476-5511および配列番号:5538のいずれか1つから選択される約60~90の連続するヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含む、tracrリボ核酸配列と;を含む、操作されたガイドリボ核酸構造と、(b)操作されたガイドリボ核酸に結合するように構成されたクラス2のII型Casエンドヌクレアーゼと、を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5512-5537を含む群から選択されるプロトスペーサー隣接モチーフ(PAM)配列に結合するように構成される。 In some aspects, the present disclosure provides an engineered nuclease system, wherein the engineered nuclease system comprises (a) an engineered guide ribonucleic acid structure, wherein the engineered guide ribonucleic acid structure comprises: (i ) a guide ribonucleic acid sequence configured to hybridize to a target deoxyribonucleic acid sequence; (ii) a tracr ribonucleic acid sequence configured to bind to an endonuclease, wherein the tracr ribonucleic acid sequence is configured to: a tracr ribonucleic acid sequence comprising a sequence having at least 80% sequence identity to about 60-90 contiguous nucleotides selected from any one of SEQ ID NO: 5476-5511 and SEQ ID NO: 5538; and (b) a class 2 type II Cas endonuclease configured to bind to the engineered guide ribonucleic acid. In some embodiments, the endonuclease is configured to bind to a protospacer adjacent motif (PAM) sequence selected from the group comprising SEQ ID NOs: 5512-5537.

いくつかの実施形態では、操作されたガイドリボ核酸構造は、少なくとも2つのリボ核酸ポリヌクレオチドを含む。いくつかの実施形態では、操作されたガイドリボ核酸構造は、ガイドリボ核酸配列とtracrリボ核酸配列とを含む1つのリボ核酸ポリヌクレオチドを含む。 In some embodiments, the engineered guide ribonucleic acid structure comprises at least two ribonucleic acid polynucleotides. In some embodiments, the engineered guide ribonucleic acid structure comprises one ribonucleic acid polynucleotide that includes a guide ribonucleic acid sequence and a tracr ribonucleic acid sequence.

いくつかの実施形態では、ガイドリボ核酸配列は、原核生物、細菌、古細菌、真核生物、真菌、植物、哺乳動物、またはヒトのゲノム配列に相補的である。いくつかの実施形態では、ガイドリボ核酸配列は、15~24ヌクレオチド長である。いくつかの実施形態では、エンドヌクレアーゼは、エンドヌクレアーゼのN末端またはC末端の近位にある1つ以上の核局在化配列(NLS)を含む。いくつかの実施形態では、NLSは、配列番号:5597-5612から選択される配列を含む。 In some embodiments, the guide ribonucleic acid sequence is complementary to a prokaryotic, bacterial, archaeal, eukaryotic, fungal, plant, mammalian, or human genomic sequence. In some embodiments, the guide ribonucleic acid sequence is 15-24 nucleotides in length. In some embodiments, the endonuclease includes one or more nuclear localization sequences (NLS) proximal to the N-terminus or C-terminus of the endonuclease. In some embodiments, the NLS includes a sequence selected from SEQ ID NOs: 5597-5612.

いくつかの実施形態では、操作されたヌクレアーゼシステムは、5’から3’に、標的デオキシリボ核酸配列の5’に少なくとも20のヌクレオチドの配列を含む第1の相同性アームと、少なくとも10のヌクレオチドの合成DNA配列と、標的デオキシリボ核酸配列の3’に少なくとも20のヌクレオチドの配列を含む第2の相同性アームとを含む、一本鎖または二本鎖のDNA修復鋳型をさらに含む。いくつかの実施形態では、第1または第2の相同性アームは、少なくとも40、80、120、150、200、300、500、または1,000のヌクレオチドの配列を含む。 In some embodiments, the engineered nuclease system has a first homology arm comprising, 5' to 3', a sequence of at least 20 nucleotides 5' of the target deoxyribonucleic acid sequence; Further included is a single-stranded or double-stranded DNA repair template comprising a synthetic DNA sequence and a second homology arm comprising a sequence of at least 20 nucleotides 3' of the target deoxyribonucleic acid sequence. In some embodiments, the first or second homology arm comprises a sequence of at least 40, 80, 120, 150, 200, 300, 500, or 1,000 nucleotides.

いくつかの実施形態では、上記操作されたヌクレアーゼシステムは、Mg2+の供給源(source)をさらに含む。 In some embodiments, the engineered nuclease system further comprises a source of Mg 2+ .

いくつかの実施形態では、エンドヌクレアーゼおよびtracrリボ核酸配列は、同じ門内の別個の細菌種に由来する。いくつかの実施形態では、エンドヌクレアーゼは、Dermabacter属に属する細菌に由来する。いくつかの実施形態では、エンドヌクレアーゼは、Verrucomicrobia門、Candidatus Peregrinibacteria門、またはCandidatus Melainabacteria門に属する細菌に由来する。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5592-5595のいずれか1つに対して少なくとも90%の同一性を有する16S rRNA遺伝子を含む細菌に由来する。 In some embodiments, the endonuclease and tracr ribonucleic acid sequences are from separate bacterial species within the same phylum. In some embodiments, the endonuclease is derived from a bacterium belonging to the genus Dermabacter. In some embodiments, the endonuclease is derived from a bacterium belonging to the phylum Verrucomicrobia, Candidatus Peregrinibacteria, or Candidatus Melinabacteria. In some embodiments, the endonuclease is derived from a bacterium that includes a 16S rRNA gene that has at least 90% identity to any one of SEQ ID NOs: 5592-5595.

いくつかの実施形態では、HNHドメインは、配列番号:5638-5460のいずれか1つに対して少なくとも70%または少なくとも80%の同一性を有する配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:1-1826またはそれらに対して少なくとも55%の同一性を有するその変異体を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:1827-1830あるいは配列番号:1827-2140からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。 In some embodiments, the HNH domain comprises a sequence that has at least 70% or at least 80% identity to any one of SEQ ID NOs: 5638-5460. In some embodiments, the endonuclease comprises SEQ ID NO: 1-1826 or a variant thereof having at least 55% identity thereto. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 1827-1830 or SEQ ID NO: 1827-2140. include.

いくつかの実施形態では、エンドヌクレアーゼは、配列番号:3638-3641あるいは配列番号:3638-3954からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5615-5632からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:1-4あるいは配列番号:1-319からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。 In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 3638-3641 or SEQ ID NO: 3638-3954. include. In some embodiments, the endonuclease comprises at least one, at least two, at least three, at least four, or at least five peptide motifs selected from the group consisting of SEQ ID NOs: 5615-5632. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 1-4 or SEQ ID NO: 1-319. include.

いくつかの実施形態では、ガイドRNA構造は、配列番号:5461-5464、配列番号:5476-5479、あるいは配列番号:5476-5489からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、ステムおよびループからなるヘアピンを含むと予想されるRNA配列を含み、ここで、上記ステムは、少なくとも10、少なくとも12、または少なくとも14の塩基対のリボヌクレオチド、および上記ループの4つの塩基対以内の非対称バルジを含む。 In some embodiments, the guide RNA structure is at least 70%, 80% relative to a sequence selected from the group consisting of SEQ ID NO: 5461-5464, SEQ ID NO: 5476-5479, or SEQ ID NO: 5476-5489. , or sequences that are 90% identical. In some embodiments, the guide RNA structure comprises an RNA sequence predicted to include a hairpin consisting of a stem and a loop, wherein the stem is a ribon of at least 10, at least 12, or at least 14 base pairs. nucleotides, and an asymmetric bulge within four base pairs of the loop.

いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5512-5515あるいは配列番号:5527-5530からなる群から選択される配列を含むPAMに結合するように構成される。 In some embodiments, the endonuclease is configured to bind to a PAM comprising a sequence selected from the group consisting of SEQ ID NO: 5512-5515 or SEQ ID NO: 5527-5530.

いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:1827に対して少なくとも70%、少なくとも80%、または少なくとも90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5461あるいは配列番号:5476の少なくとも1つに対して少なくとも70%、少なくとも80%、または少なくとも90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5512あるいは配列番号:5527を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:1828に対して少なくとも70%、少なくとも80%、または少なくとも90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5462あるいは配列番号:5477の少なくとも1つに対して少なくとも70%、少なくとも80%、あるいは少なくとも90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5513あるいは配列番号:5528を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:1829に対して少なくとも70%、少なくとも80%、あるいは少なくとも90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5463あるいは配列番号:5478の少なくとも1つに対して少なくとも70%、少なくとも80%、あるいは少なくとも90%同一である配列を含み;および、(c)エンドヌクレアーゼは、配列番号:5514あるいは配列番号:5529を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:1830に対して少なくとも70%、少なくとも80%、あるいは少なくとも90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5464あるいは配列番号:5479の少なくとも1つに対して少なくとも70%、少なくとも80%、あるいは少なくとも90%同一である配列を含み;および、(c)エンドヌクレアーゼは、配列番号:5515あるいは配列番号:5530を含むPAMに結合するように構成される。 In some embodiments, (a) the endonuclease comprises a sequence that is at least 70%, at least 80%, or at least 90% identical to SEQ ID NO:1827; (b) the guide RNA structure comprises a sequence that is at least 70%, at least 80%, or at least 90% identical to SEQ ID NO:1827; :5461 or SEQ ID NO:5476; and (c) the endonuclease comprises a sequence that is at least 70%, at least 80%, or at least 90% identical to at least one of SEQ ID NO:5461 or SEQ ID NO:5476; and (c) the endonuclease comprises SEQ ID NO:5512 or SEQ ID NO:5527. configured to couple to a PAM containing a PAM. In some embodiments, (a) the endonuclease comprises a sequence that is at least 70%, at least 80%, or at least 90% identical to SEQ ID NO: 1828; (b) the guide RNA structure comprises a sequence that is at least 70%, at least 80%, or at least 90% identical to SEQ ID NO: 1828; : 5462 or SEQ ID NO: 5477; and (c) the endonuclease comprises a sequence that is at least 70%, at least 80%, or at least 90% identical to at least one of SEQ ID NO: 5462 or SEQ ID NO: 5477; configured to couple to a PAM containing a PAM. In some embodiments, (a) the endonuclease comprises a sequence that is at least 70%, at least 80%, or at least 90% identical to SEQ ID NO: 1829; (b) the guide RNA structure comprises a sequence that is at least 70%, at least 80%, or at least 90% identical to SEQ ID NO: : 5463 or SEQ ID NO: 5478; and (c) the endonuclease comprises a sequence that is at least 70%, at least 80%, or at least 90% identical to at least one of SEQ ID NO: 5463 or SEQ ID NO: 5478; 5529. In some embodiments, (a) the endonuclease comprises a sequence that is at least 70%, at least 80%, or at least 90% identical to SEQ ID NO:1830; (b) the guide RNA structure comprises a sequence that is at least 70%, at least 80%, or at least 90% identical to SEQ ID NO: : 5464 or SEQ ID NO: 5479; and (c) the endonuclease comprises a sequence that is at least 70%, at least 80%, or at least 90% identical to at least one of SEQ ID NO: 5464 or SEQ ID NO: 5479; 5530.

いくつかの実施形態では、エンドヌクレアーゼは、配列番号:2141-2142あるいは配列番号:2141-2241からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:3955-3956あるいは配列番号:3955-4055からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5632-5638からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:320-321あるいは配列番号:320-420からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号:5465、配列番号:5490-5491、あるいは配列番号:5490-5494からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、少なくとも8、少なくとも10、または少なくとも12の塩基対のリボヌクレオチドを含むヘアピンを含む、tracrリボ核酸配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5516および配列番号:5531からなる群から選択される配列を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:2141に対して少なくとも70%、80%、または90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5490に対して少なくとも70%、80%、または90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5531を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:2142に対して少なくとも70%、80%、または90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5465あるいは配列番号:5491に対して少なくとも70%、80%、または90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5516を含むPAMに結合するように構成される。 In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 2141-2142 or SEQ ID NO: 2141-2241. include. In some embodiments, the endonuclease produces a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 3955-3956 or SEQ ID NO: 3955-4055. include. In some embodiments, the endonuclease comprises at least one, at least two, at least three, at least four, or at least five peptide motifs selected from the group consisting of SEQ ID NO: 5632-5638. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 320-321 or SEQ ID NO: 320-420. include. In some embodiments, the guide RNA structure is at least 70%, 80%, or Contains sequences that are 90% identical. In some embodiments, the guide RNA structure comprises a tracr ribonucleic acid sequence that includes a hairpin comprising at least 8, at least 10, or at least 12 base pairs of ribonucleotides. In some embodiments, the endonuclease is configured to bind to a PAM comprising a sequence selected from the group consisting of SEQ ID NO: 5516 and SEQ ID NO: 5531. In some embodiments, (a) the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 2141; (b) the guide RNA structure comprises SEQ ID NO: 5490. and (c) the endonuclease is configured to bind to a PAM comprising SEQ ID NO:5531. In some embodiments, (a) the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 2142; (b) the guide RNA structure comprises SEQ ID NO: 5465. or (c) the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5516.

いくつかの実施形態では、エンドヌクレアーゼは、配列番号:2245-2246からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:4059-4060からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5639-5648からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:424-425からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号:5498-5499および配列番号:5539からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、ガイドリボ核酸配列の少なくとも8つのヌクレオチドおよびtracrリボ核酸配列の少なくとも8つのヌクレオチドを含む中断されていない塩基対領域を有するヘアピンを含むと予想されるガイドリボ核酸配列を含み、ここで、上記tracrリボ核酸配列は、5’から3’に、第1のヘアピンと第2のヘアピンとを含み、ここで、上記第1のヘアピンは上記第2のヘアピンよりも長いステムを有する。 In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 2245-2246. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 4059-4060. In some embodiments, the endonuclease comprises at least one, at least two, at least three, at least four, or at least five peptide motifs selected from the group consisting of SEQ ID NOs: 5639-5648. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 424-425. In some embodiments, the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 5498-5499 and SEQ ID NO: 5539. . In some embodiments, the guide RNA structure is predicted to include a hairpin with an uninterrupted base-paired region comprising at least eight nucleotides of the guide ribonucleic acid sequence and at least eight nucleotides of the tracr ribonucleic acid sequence. tracr ribonucleic acid sequence, wherein the tracr ribonucleic acid sequence includes, from 5' to 3', a first hairpin and a second hairpin, wherein the first hairpin is longer than the second hairpin. Has a long stem.

いくつかの実施形態では、エンドヌクレアーゼは、配列番号:2242-2244あるいは配列番号:2247-2249からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:4056-4058および配列番号:4061-4063からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5639-5648からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:421-423あるいは配列番号:426-428からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号:5466-5467、配列番号:5495-5497、配列番号:5500-5502、および配列番号:5539からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、ガイドリボ核酸配列の少なくとも8つのヌクレオチドおよびtracrリボ核酸配列の少なくとも8つのヌクレオチドを含む中断されていない塩基対領域を有するヘアピンを含むと予想されるガイドリボ核酸配列を含み、ここで、上記tracrリボ核酸配列は、5’から3’に、第1のヘアピンと第2のヘアピンとを含み、ここで、上記第1のヘアピンは上記第2のヘアピンよりも長いステムを有する。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5517-5518あるいは配列番号:5532-5534からなる群から選択される配列を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:2247に対して少なくとも70%、80%、または90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5500に対して少なくとも70%、80%、または90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5517あるいは配列番号:5532を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:2248に対して少なくとも70%、80%、または90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5501に対して少なくとも70%、80%、または90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5518あるいは配列番号:5533を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:2249に対して少なくとも70%、80%、または90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5502に対して少なくとも70%、80%、または90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5534を含むPAMに結合するように構成される。 In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 2242-2244 or SEQ ID NO: 2247-2249. include. In some embodiments, the endonuclease produces a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 4056-4058 and SEQ ID NO: 4061-4063. include. In some embodiments, the endonuclease comprises at least one, at least two, at least three, at least four, or at least five peptide motifs selected from the group consisting of SEQ ID NOs: 5639-5648. In some embodiments, the endonuclease produces a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 421-423 or SEQ ID NO: 426-428. include. In some embodiments, the guide RNA structure is at least for a sequence selected from the group consisting of SEQ ID NO: 5466-5467, SEQ ID NO: 5495-5497, SEQ ID NO: 5500-5502, and SEQ ID NO: 5539. Contains sequences that are 70%, 80%, or 90% identical. In some embodiments, the guide RNA structure is predicted to include a hairpin with an uninterrupted base-paired region comprising at least eight nucleotides of the guide ribonucleic acid sequence and at least eight nucleotides of the tracr ribonucleic acid sequence. tracr ribonucleic acid sequence, wherein the tracr ribonucleic acid sequence includes, from 5' to 3', a first hairpin and a second hairpin, wherein the first hairpin is longer than the second hairpin. Has a long stem. In some embodiments, the endonuclease is configured to bind to a PAM comprising a sequence selected from the group consisting of SEQ ID NO: 5517-5518 or SEQ ID NO: 5532-5534. In some embodiments, (a) the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 2247; (b) the guide RNA structure comprises SEQ ID NO: 5500. and (c) the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5517 or SEQ ID NO: 5532. In some embodiments, (a) the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 2248; (b) the guide RNA structure comprises SEQ ID NO: 5501. and (c) the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5518 or SEQ ID NO: 5533. In some embodiments, (a) the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 2249; (b) the guide RNA structure comprises SEQ ID NO: 5502. and (c) the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5534.

いくつかの実施形態では、エンドヌクレアーゼは、配列番号:2253あるいは配列番号:2253-2481からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:4067あるいは配列番号:4067-4295からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5649のペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:432あるいは配列番号:432-660からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号:5468あるいは配列番号:5503からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5519からなる群から選択される配列を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:2253に対して少なくとも70%、80%、または90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5468あるいは配列番号:5503に対して少なくとも70%、80%、または90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5519を含むPAMに結合するように構成される。 In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 2253 or SEQ ID NO: 2253-2481. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 4067 or SEQ ID NO: 4067-4295. In some embodiments, the endonuclease comprises the peptide motif of SEQ ID NO: 5649. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 432 or a sequence selected from the group consisting of SEQ ID NO: 432-660. In some embodiments, the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 5468 or SEQ ID NO: 5503. In some embodiments, the endonuclease is configured to bind to a PAM comprising a sequence selected from the group consisting of SEQ ID NO:5519. In some embodiments, (a) the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 2253; (b) the guide RNA structure comprises SEQ ID NO: 5468. or comprising a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5503; and (c) the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5519.

いくつかの実施形態では、エンドヌクレアーゼは、配列番号:2482-2489からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:4296-4303からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:661-668からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:2490-2498からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:4304-4312からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:669-677からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号:5504からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。 In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 2482-2489. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 4296-4303. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 661-668. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 2490-2498. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NOs: 4304-4312. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 669-677. In some embodiments, the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 5504.

いくつかの実施形態では、エンドヌクレアーゼは、配列番号:2499あるいは配列番号:2499-2750からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:4313あるいは配列番号:4313-4564からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5650-5667からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:678あるいは配列番号:678-929からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号:5469あるいは配列番号:5505に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5520あるいは配列番号:5535を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:2499に対して少なくとも70%、80%、または90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5469あるいは配列番号:5505に対して少なくとも70%、80%、または90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5520あるいは配列番号:5535を含むPAMに結合するように構成される。 In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 2499 or SEQ ID NO: 2499-2750. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 4313 or SEQ ID NO: 4313-4564. In some embodiments, the endonuclease comprises at least one, at least two, at least three, at least four, or at least five peptide motifs selected from the group consisting of SEQ ID NO: 5650-5667. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 678 or SEQ ID NO: 678-929. In some embodiments, the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5469 or SEQ ID NO: 5505. In some embodiments, the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5520 or SEQ ID NO: 5535. In some embodiments, (a) the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 2499; (b) the guide RNA structure comprises SEQ ID NO: 5469. or comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5505; and (c) the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5520 or SEQ ID NO: 5535. configured.

いくつかの実施形態では、エンドヌクレアーゼは、配列番号:2751あるいは配列番号:2751-2913からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:4565あるいは配列番号:4565-4727からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5668-5678からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:930あるいは配列番号:930-1092からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号:5470あるいは配列番号:5506に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5521あるいは配列番号:5536からなる群から選択される配列を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:2751に対して少なくとも70%、80%、または90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5470あるいは配列番号:5506に対して少なくとも70%、80%、または90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5521あるいは配列番号:5536を含むPAMに結合するように構成される。 In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 2751 or a sequence selected from the group consisting of SEQ ID NO: 2751-2913. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 4565 or SEQ ID NO: 4565-4727. In some embodiments, the endonuclease comprises at least one, at least two, at least three, at least four, or at least five peptide motifs selected from the group consisting of SEQ ID NOs: 5668-5678. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 930 or SEQ ID NO: 930-1092. In some embodiments, the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5470 or SEQ ID NO: 5506. In some embodiments, the endonuclease is configured to bind to a PAM comprising a sequence selected from the group consisting of SEQ ID NO: 5521 or SEQ ID NO: 5536. In some embodiments, (a) the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 2751; (b) the guide RNA structure comprises SEQ ID NO: 5470. or comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5506; and (c) the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5521 or SEQ ID NO: 5536. configured.

いくつかの実施形態では、エンドヌクレアーゼは、配列番号:2914あるいは配列番号:2914-3174からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:4728あるいは配列番号:4728-4988からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5676-5678からなる群から選択される少なくとも1つ、少なくとも2つ、または少なくとも3つのペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:1093あるいは配列番号:1093-1353からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号:5471、配列番号:5507、および配列番号:5540-5542からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、5つ未満の塩基対のリボヌクレオチドを含む少なくとも2つのヘアピンを含むと予想されるtracrリボ核酸配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5522を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:2914に対して少なくとも70%、80%、または90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5471あるいは配列番号:5507に対して少なくとも70%、80%、または90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5522を含むPAMに結合するように構成される。 In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 2914 or SEQ ID NO: 2914-3174. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 4728 or a sequence selected from the group consisting of SEQ ID NO: 4728-4988. In some embodiments, the endonuclease comprises at least one, at least two, or at least three peptide motifs selected from the group consisting of SEQ ID NO: 5676-5678. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 1093 or SEQ ID NO: 1093-1353. In some embodiments, the guide RNA structure is at least 70%, 80%, or 90% relative to a sequence selected from the group consisting of SEQ ID NO: 5471, SEQ ID NO: 5507, and SEQ ID NO: 5540-5542. Contains sequences that are identical. In some embodiments, the guide RNA structure comprises a tracr ribonucleic acid sequence predicted to include at least two hairpins comprising ribonucleotides of less than 5 base pairs. In some embodiments, the endonuclease is configured to bind to a PAM comprising SEQ ID NO:5522. In some embodiments, (a) the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 2914; (b) the guide RNA structure comprises SEQ ID NO: 5471. or comprising a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5507; and (c) the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5522.

いくつかの実施形態では、エンドヌクレアーゼは、配列番号:3175あるいは配列番号:3175-3330からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:4989あるいは配列番号:4989-5146からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5679-5686からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:1354あるいは配列番号:1354-1511からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号:5472あるいは配列番号:5508からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5523あるいは配列番号:5537からなる群から選択される配列を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:3175に対して少なくとも70%、80%、または90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5472あるいは配列番号:5508に対して少なくとも70%、80%、または90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5523あるいは配列番号:5537を含むPAMに結合するように構成される。 In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 3175 or a sequence selected from the group consisting of SEQ ID NO: 3175-3330. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 4989 or SEQ ID NO: 4989-5146. In some embodiments, the endonuclease comprises at least one, at least two, at least three, at least four, or at least five peptide motifs selected from the group consisting of SEQ ID NOs: 5679-5686. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 1354 or a sequence selected from the group consisting of SEQ ID NO: 1354-1511. In some embodiments, the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 5472 or SEQ ID NO: 5508. In some embodiments, the endonuclease is configured to bind to a PAM comprising a sequence selected from the group consisting of SEQ ID NO: 5523 or SEQ ID NO: 5537. In some embodiments, (a) the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 3175; (b) the guide RNA structure comprises SEQ ID NO: 5472. or comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5508; and (c) the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5523 or SEQ ID NO: 5537. configured.

いくつかの実施形態では、エンドヌクレアーゼは、配列番号:3331あるいは配列番号:3331-3474からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5147あるいは配列番号:5147-5290からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5674-5675および配列番号:5687-5693からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:1512あるいは配列番号:1512-1655からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号:5473あるいは配列番号:5509からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5524を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:3331に対して少なくとも70%、80%、または90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5473あるいは配列番号:5509に対して少なくとも70%、80%、または90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5524を含むPAMに結合するように構成される。 In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 3331 or SEQ ID NO: 3331-3474. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 5147 or SEQ ID NO: 5147-5290. In some embodiments, the endonuclease is at least one, at least two, at least three, at least four, or at least five selected from the group consisting of SEQ ID NO: 5674-5675 and SEQ ID NO: 5687-5693. Contains two peptide motifs. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 1512 or SEQ ID NO: 1512-1655. In some embodiments, the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 5473 or SEQ ID NO: 5509. In some embodiments, the endonuclease is configured to bind to a PAM comprising SEQ ID NO:5524. In some embodiments, (a) the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 3331; (b) the guide RNA structure comprises SEQ ID NO: 5473. or comprising a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5509; and (c) the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5524.

いくつかの実施形態では、エンドヌクレアーゼは、配列番号:3475あるいは配列番号:3475-3568からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5291あるいは配列番号:5291-5389からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5694-5699からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:1656あるいは配列番号:1656-1755からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号:5474あるいは配列番号:5510に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5525を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:3475に対して少なくとも70%、80%、または90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5474あるいは配列番号:5510に対して少なくとも70%、80%、または90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5525を含むPAMに結合するように構成される。 In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 3475 or SEQ ID NO: 3475-3568. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5291 or a sequence selected from the group consisting of SEQ ID NO: 5291-5389. In some embodiments, the endonuclease comprises at least one, at least two, at least three, at least four, or at least five peptide motifs selected from the group consisting of SEQ ID NO: 5694-5699. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 1656 or a sequence selected from the group consisting of SEQ ID NO: 1656-1755. In some embodiments, the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5474 or SEQ ID NO: 5510. In some embodiments, the endonuclease is configured to bind to a PAM comprising SEQ ID NO:5525. In some embodiments, (a) the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 3475; (b) the guide RNA structure comprises SEQ ID NO: 5474. or (c) the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5525.

いくつかの実施形態では、エンドヌクレアーゼは、配列番号:3569あるいは配列番号:3569-3637からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5390あるいは配列番号:5390-5460からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは配列番号:5700-5717からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:1756あるいは配列番号:1756-1826からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号:5475あるいは配列番号:5511に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5526を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:3569に対して少なくとも70%、80%、または90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5475あるいは配列番号:5511に対して少なくとも70%、80%、または90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5526を含むPAMに結合するように構成される。いくつかの実施形態では、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、またはSmith-Waterman相同性検索アルゴリズムによって決定される。いくつかの実施形態では、配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータ、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリックスのパラメータを使用して、ならびに条件付き組成スコアマトリックス調整(conditional compositional score matrix adjustment)を使用して、BLASTP相同性検索アルゴリズムによって決定される。 In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 3569 or SEQ ID NO: 3569-3637. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5390 or a sequence selected from the group consisting of SEQ ID NO: 5390-5460. In some embodiments, the endonuclease comprises at least one, at least two, at least three, at least four, or at least five peptide motifs selected from the group consisting of SEQ ID NO: 5700-5717. In some embodiments, the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 1756 or a sequence selected from the group consisting of SEQ ID NO: 1756-1826. In some embodiments, the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5475 or SEQ ID NO: 5511. In some embodiments, the endonuclease is configured to bind to a PAM comprising SEQ ID NO:5526. In some embodiments, (a) the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 3569; (b) the guide RNA structure comprises SEQ ID NO: 5475. or comprising a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO:5511; and (c) the endonuclease is configured to bind to a PAM comprising SEQ ID NO:5526. In some embodiments, sequence identity is determined by BLASTP, CLUSTALW, MUSCLE, MAFFT, or the Smith-Waterman homology search algorithm. In some embodiments, sequence identity is determined using the parameters of a BLOSUM62 scoring matrix that sets a wordlength (W) of 3, an expectation (E) of 10, and a gap cost of 11 existence, 1 extension. as determined by the BLASTP homology search algorithm, as well as using the conditional compositional score matrix adjustment.

いくつかの態様では、本開示は操作されたガイドリボ核酸ポリヌクレオチドを提供し、上記操作されたガイドリボ核酸ポリヌクレオチドは:(a)標的DNA分子中の標的配列に相補的なヌクレオチド配列を含むDNA標的化セグメントと;(b)ハイブリダイズして二本鎖RNA(dsRNA)二重鎖を形成するヌクレオチドの2つの相補的なストレッチを含むタンパク質結合セグメントであって、ここで、上記ヌクレオチドの2つの相補的なストレッチは介在ヌクレオチドで互いに共有結合し、ここで、上記操作されたガイドリボ核酸ポリヌクレオチドは、配列番号:1827-3637のいずれか1つに対して少なくとも75%の配列同一性を有するRuvC_IIIドメインを含むエンドヌクレアーゼと複合体を形成し、上記複合体を標的DNA分子の標的配列に標的化するように構成される。いくつかの実施形態では、DNA標的化セグメントは、ヌクレオチドの2つの相補的なストレッチの両方の5’に位置する。 In some aspects, the present disclosure provides engineered guide ribonucleic acid polynucleotides, the engineered guide ribonucleic acid polynucleotides comprising: (a) a nucleotide sequence complementary to a target sequence in a target DNA molecule; (b) a protein binding segment comprising two complementary stretches of nucleotides that hybridize to form a double-stranded RNA (dsRNA) duplex, wherein the two complementary stretches of nucleotides hybridize to form a double-stranded RNA (dsRNA) duplex; stretches are covalently linked to each other with intervening nucleotides, wherein the engineered guide ribonucleic acid polynucleotides have RuvC_III domains having at least 75% sequence identity to any one of SEQ ID NOs: 1827-3637. and is configured to form a complex with an endonuclease comprising a target DNA molecule and target the complex to a target sequence of a target DNA molecule. In some embodiments, the DNA targeting segment is located 5' of both two complementary stretches of nucleotides.

いくつかの実施形態では、(a)タンパク質結合セグメントは、配列番号:5476-5479あるいは配列番号:5476-5489からなる群から選択される配列に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み;(b)タンパク質結合セグメントは、(配列番号:5490-5491あるいは配列番号:5490-5494)および配列番号:5538からなる群から選択される配列に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み;(c)タンパク質結合セグメントは、配列番号:5498-5499からなる群から選択される配列に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み;(d)タンパク質結合セグメントは、配列番号:5495-5497および配列番号:5500-5502からなる群から選択される配列に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み;(e)タンパク質結合セグメントは、配列番号:5503に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み;(f)タンパク質結合セグメントは、配列番号:5504に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み;(g)タンパク質結合セグメントは、配列番号:5505に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み;(h)タンパク質結合セグメントは、配列番号:5506に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み;(i)タンパク質結合セグメントは、配列番号:5507に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み;(j)タンパク質結合セグメントは、配列番号:5508に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み;(k)タンパク質結合セグメントは、配列番号:5509に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み;(l)タンパク質結合セグメントは、配列番号:5510に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み;あるいは、(m)タンパク質結合セグメントは、配列番号:5511に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含む。 In some embodiments, (a) the protein binding segment is at least 70%, at least 80%, or at least 90% relative to a sequence selected from the group consisting of SEQ ID NO: 5476-5479 or SEQ ID NO: 5476-5489. % identity to a sequence selected from the group consisting of (SEQ ID NO:5490-5491 or SEQ ID NO:5490-5494) and SEQ ID NO:5538; (c) the protein binding segment has at least 70%, at least 90% identity to a sequence selected from the group consisting of SEQ ID NOs: 5498-5499; (d) the protein binding segment has at least 70% identity to a sequence selected from the group consisting of SEQ ID NO: 5495-5497 and SEQ ID NO: 5500-5502; %, at least 80%, or at least 90%; (e) the protein binding segment has at least 70%, at least 80%, or at least 90% identity to SEQ ID NO: 5503; (f) the protein binding segment comprises a sequence having at least 70%, at least 80%, or at least 90% identity to SEQ ID NO: 5504; (g) the protein binding segment comprises a sequence having the sequence (h) the protein binding segment comprises a sequence having at least 70%, at least 80%, or at least 90% identity to SEQ ID NO: 5505; (i) the protein binding segment comprises a sequence that has at least 70%, at least 80%, or at least 90% identity to SEQ ID NO: 5507; j) the protein binding segment comprises a sequence having at least 70%, at least 80%, or at least 90% identity to SEQ ID NO: 5508; (k) the protein binding segment comprises a sequence having at least 70%, at least 80%, or at least 90% identity to SEQ ID NO: 5509; (l) the protein binding segment is at least 70%, at least 80%, or at least 90% identical to SEQ ID NO: 5510; or (m) the protein binding segment comprises a sequence that has at least 70%, at least 80%, or at least 90% identity to SEQ ID NO:5511.

いくつかの実施形態では、(a)ガイドリボ核酸ポリヌクレオチドは、ステムとループとを含むヘアピンを含むRNA配列を含み、ここで、上記ステムは、少なくとも10、少なくとも12、または少なくとも14の塩基対のリボヌクレオチド、および上記ループの4つの塩基対内の非対称バルジを含み;(b)ガイドリボ核酸ポリヌクレオチドは、少なくとも8、少なくとも10、または少なくとも12の塩基対のリボヌクレオチドを含むヘアピンを含むと予想されるtracrリボ核酸配列を含み;(c)ガイドリボ核酸ポリヌクレオチドは、ガイドリボ核酸配列の少なくとも8つのヌクレオチドとtracrリボ核酸配列の少なくとも8つのヌクレオチドとを含む中断されていない塩基対領域を有するヘアピンを含むと予想されるガイドリボ核酸配列を含み、ここで、上記tracrリボ核酸配列は、5’から3’に、第1のヘアピンと第2のヘアピンとを含み、ここで、上記第1のヘアピンは上記第2のヘアピンよりも長いステムを有し;あるいは、(d)ガイドリボ核酸ポリヌクレオチドは、5つ未満の塩基対のリボヌクレオチドを含む少なくとも2つのヘアピンを含むと予想されるtracrリボ核酸配列を含む。 In some embodiments, (a) the guide ribonucleic acid polynucleotide comprises an RNA sequence that includes a hairpin that includes a stem and a loop, wherein the stem has at least 10, at least 12, or at least 14 base pairs. (b) the guide ribonucleic acid polynucleotide is expected to include a hairpin comprising at least 8, at least 10, or at least 12 base pairs of ribonucleotides; tracr ribonucleic acid sequence; (c) the guide ribonucleic acid polynucleotide comprises a hairpin having an uninterrupted base-paired region comprising at least eight nucleotides of the guide ribonucleic acid sequence and at least eight nucleotides of the tracr ribonucleic acid sequence; comprising a predicted guide ribonucleic acid sequence, wherein said tracr ribonucleic acid sequence comprises, 5' to 3', a first hairpin and a second hairpin, wherein said first hairpin comprises said first hairpin. or (d) the guide ribonucleic acid polynucleotide comprises a tracr ribonucleic acid sequence predicted to include at least two hairpins comprising ribonucleotides of less than 5 base pairs.

いくつかの態様では、本開示は、本明細書に記載される操作されたガイドリボ核酸ポリヌクレオチドのいずれかをコードするデオキシリボ核酸ポリヌクレオチドを提供する。 In some aspects, the present disclosure provides deoxyribonucleic acid polynucleotides encoding any of the engineered guide ribonucleic acid polynucleotides described herein.

いくつかの態様では、本開示は、生物における発現のために最適化された、操作された核酸配列を含む核酸を提供し、ここで、上記核酸は、RuvC_IIIドメインとHNHドメインとを含むクラス2のII型Casエンドヌクレアーゼをコードし、ここで、上記クラス2のII型Casエンドヌクレアーゼは、難培養性微生物に由来する。 In some aspects, the present disclosure provides a nucleic acid comprising an engineered nucleic acid sequence optimized for expression in an organism, wherein the nucleic acid comprises a class 2 RuvC_III domain and a HNH domain. , wherein the class 2 type II Cas endonuclease is derived from a difficult-to-cultivate microorganism.

いくつかの態様では、本開示は、生物における発現のために最適化された、操作された核酸配列を含む核酸を提供し、ここで、上記核酸は、配列番号:1827-3637のいずれか1つに対して少なくとも70%の配列同一性を有するRuvC_IIIドメインを含むエンドヌクレアーゼをコードする。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:3638-5460のいずれか1つに対して少なくとも70%または少なくとも80%の配列同一性を有するHNHドメインを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5572-5591またはそれらに対して少なくとも70%の配列同一性を有するその変異体を含む。いくつかの実施形態では、エンドヌクレアーゼは、エンドヌクレアーゼのN末端またはC末端の近位にある1つ以上の核局在化配列(NLS)をコードする配列を含む。いくつかの実施形態では、NLSは、配列番号:5597-5612から選択される配列を含む。 In some aspects, the present disclosure provides a nucleic acid comprising an engineered nucleic acid sequence optimized for expression in an organism, wherein the nucleic acid comprises any one of SEQ ID NOs: 1827-3637. It encodes an endonuclease that contains a RuvC_III domain with at least 70% sequence identity to one RuvC_III domain. In some embodiments, the endonuclease comprises an HNH domain having at least 70% or at least 80% sequence identity to any one of SEQ ID NOs: 3638-5460. In some embodiments, the endonuclease comprises SEQ ID NO: 5572-5591 or a variant thereof having at least 70% sequence identity thereto. In some embodiments, the endonuclease includes a sequence encoding one or more nuclear localization sequences (NLS) proximal to the N-terminus or C-terminus of the endonuclease. In some embodiments, the NLS includes a sequence selected from SEQ ID NOs: 5597-5612.

いくつかの実施形態では、生物は、原核生物、細菌、真核生物、真菌、植物、哺乳動物、げっ歯類、またはヒトである。いくつかの実施形態では、生物は大腸菌であり、および:(a)核酸配列は、配列番号:5572-5575からなる群から選択される配列に対して少なくとも70%、80%、または90%の同一性を有する;(b)核酸配列は、配列番号:5576-5577からなる群から選択される配列に対して少なくとも70%、80%、または90%の同一性を有する;(c)核酸配列は、配列番号:5578-5580からなる群から選択される配列に対して少なくとも70%、80%、または90%の同一性を有する;(d)核酸配列は、配列番号:5581に対して少なくとも70%、80%、または90%の同一性を有する;(e)核酸配列は、配列番号:5582に対して少なくとも70%、80%、または90%の同一性を有する;(f)核酸配列は、配列番号:5583に対して少なくとも70%、80%、または90%の同一性を有する;(g)核酸配列は、配列番号:5584に対して少なくとも70%、80%、または90%の同一性を有する;(h)核酸配列は、配列番号:5585に対して少なくとも70%、80%、または90%の同一性を有する;(i)核酸配列は、配列番号:5586に対して少なくとも70%、80%、または90%の同一性を有する;あるいは、(j)核酸配列は、配列番号:5587に対して少なくとも70%、80%、または90%の同一性を有する。いくつかの実施形態では、生物はヒトであり、および:(a)核酸配列は、配列番号:5588あるいは配列番号:5589に対して少なくとも70%、80%、または90%の同一性を有する;あるいは、(b)核酸配列は、配列番号:5590あるいは配列番号:5591に対して少なくとも70%、80%、または90%の同一性を有する。 In some embodiments, the organism is a prokaryote, bacterium, eukaryote, fungus, plant, mammal, rodent, or human. In some embodiments, the organism is E. coli, and: (a) the nucleic acid sequence is at least 70%, 80%, or 90% (b) the nucleic acid sequence has at least 70%, 80%, or 90% identity to a sequence selected from the group consisting of SEQ ID NOs: 5576-5577; (c) the nucleic acid sequence has identity; (d) the nucleic acid sequence has at least 70%, 80%, or 90% identity to a sequence selected from the group consisting of SEQ ID NO: 5578-5580; (e) the nucleic acid sequence has at least 70%, 80%, or 90% identity to SEQ ID NO: 5582; (f) the nucleic acid sequence has 70%, 80%, or 90% identity; (g) the nucleic acid sequence has at least 70%, 80%, or 90% identity to SEQ ID NO:5583; (g) the nucleic acid sequence has at least 70%, 80%, or 90% identity to SEQ ID NO:5584; (h) the nucleic acid sequence has at least 70%, 80%, or 90% identity to SEQ ID NO: 5585; (i) the nucleic acid sequence has at least 70%, 80%, or 90% identity to SEQ ID NO: 5586; 70%, 80%, or 90% identity; alternatively, (j) the nucleic acid sequence has at least 70%, 80%, or 90% identity to SEQ ID NO:5587. In some embodiments, the organism is human, and: (a) the nucleic acid sequence has at least 70%, 80%, or 90% identity to SEQ ID NO: 5588 or SEQ ID NO: 5589; Alternatively, (b) the nucleic acid sequence has at least 70%, 80%, or 90% identity to SEQ ID NO: 5590 or SEQ ID NO: 5591.

いくつかの態様では、本開示は、RuvC_IIIドメインとHNHドメインとを含むクラス2のII型Casエンドヌクレアーゼをコードする核酸配列を含むベクターを提供し、ここで、上記エンドヌクレアーゼは難培養性微生物に由来する。 In some aspects, the present disclosure provides a vector comprising a nucleic acid sequence encoding a class 2 type II Cas endonuclease comprising a RuvC_III domain and a HNH domain, wherein the endonuclease is Originates from

いくつかの態様では、本開示は、本明細書に記載される核酸のいずれかを含むベクターを提供する。いくつかの実施形態では、ベクターは、エンドヌクレアーゼと複合体を形成するように構成される操作されたガイドリボ核酸構造をコードする核酸をさらに含み、上記操作されたガイドリボ核酸構造は:(a)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列と;(b)エンドヌクレアーゼに結合するように構成されたtracrリボ核酸配列と、を含む。いくつかの実施形態では、ベクターは、プラスミド、ミニサークル、CELiD、アデノ随伴ウイルス(AAV)由来のビリオン、またはレンチウイルスである。 In some aspects, the present disclosure provides vectors comprising any of the nucleic acids described herein. In some embodiments, the vector further comprises a nucleic acid encoding an engineered guide ribonucleic acid structure configured to form a complex with an endonuclease, the engineered guide ribonucleic acid structure comprising: (a) a target; (b) a guide ribonucleic acid sequence configured to hybridize to the deoxyribonucleic acid sequence; and (b) a tracr ribonucleic acid sequence configured to bind to the endonuclease. In some embodiments, the vector is a plasmid, minicircle, CELiD, adeno-associated virus (AAV)-derived virion, or lentivirus.

いくつかの態様では、本開示は、本明細書に記載されるベクターのいずれかを含む細胞を提供する。 In some aspects, the present disclosure provides cells comprising any of the vectors described herein.

いくつかの態様では、本開示は、エンドヌクレアーゼを製造する方法を提供し、上記方法は、本明細書に記載される細胞のいずれかを培養する工程を含む。 In some aspects, the present disclosure provides a method of producing an endonuclease, the method comprising culturing any of the cells described herein.

いくつかの態様では、本開示は、二本鎖デオキシリボ核酸ポリヌクレオチドを結合、切断、標識、または修飾するための方法を提供し、上記方法は:(a)クラス2のII型Casエンドヌクレアーゼおよび上記二本鎖デオキシリボ核酸ポリヌクレオチドに結合するように構成される操作されたガイドリボ核酸構造と複合体を形成するクラス2のII型Casエンドヌクレアーゼに、上記二本鎖デオキシリボ核酸ポリヌクレオチドを接触させる工程を含み;(b)ここで、上記二本鎖デオキシリボ核酸ポリヌクレオチドは、プロトスペーサー隣接モチーフ(PAM)を含み;(c)上記PAMは、配列番号:5512-5526あるいは配列番号:5527-5537からなる群から選択される配列を含む。いくつかの実施形態では、二本鎖デオキシリボ核酸ポリヌクレオチドは、操作されたガイドリボ核酸構造の配列に相補的な配列を含む第1の鎖と、PAMを含む第2の鎖とを含む。いくつかの実施形態では、PAMは、操作されたガイドリボ核酸構造の配列に相補的な配列の3’末端に直接隣接している。 In some aspects, the present disclosure provides methods for joining, cleaving, labeling, or modifying double-stranded deoxyribonucleic acid polynucleotides, the methods comprising: (a) a class 2 type II Cas endonuclease; Contacting the double-stranded deoxyribonucleic acid polynucleotide with a class 2 type II Cas endonuclease that forms a complex with an engineered guide ribonucleic acid structure configured to bind to the double-stranded deoxyribonucleic acid polynucleotide. (b) wherein the double-stranded deoxyribonucleic acid polynucleotide includes a protospacer adjacent motif (PAM); (c) the PAM is from SEQ ID NO: 5512-5526 or SEQ ID NO: 5527-5537. including sequences selected from the group. In some embodiments, the double-stranded deoxyribonucleic acid polynucleotide includes a first strand that includes a sequence that is complementary to the sequence of the engineered guide ribonucleic acid structure and a second strand that includes a PAM. In some embodiments, the PAM is directly adjacent to the 3' end of a sequence that is complementary to the sequence of the engineered guide ribonucleic acid structure.

いくつかの実施形態では、クラス2のII型Casエンドヌクレアーゼは、Cas9エンドヌクレアーゼ、Cas14エンドヌクレアーゼ、Cas12aエンドヌクレアーゼ、Cas12bエンドヌクレアーゼ、Cas12cエンドヌクレアーゼ、Cas12dエンドヌクレアーゼ、Cas12eエンドヌクレアーゼ、Cas13aエンドヌクレアーゼ、Cas13bエンドヌクレアーゼ、Cas13cエンドヌクレアーゼ、またはCas13dエンドヌクレアーゼではない。いくつかの実施形態では、クラス2のII型Casエンドヌクレアーゼは、難培養性微生物に由来する。いくつかの実施形態では、二本鎖デオキシリボ核酸ポリヌクレオチドは、真核生物、植物、真菌、哺乳動物、げっ歯類、またはヒトの二本鎖デオキシリボ核酸ポリヌクレオチドである。 In some embodiments, the class 2 type II Cas endonuclease is Cas9 endonuclease, Cas14 endonuclease, Cas12a endonuclease, Cas12b endonuclease, Cas12c endonuclease, Cas12d endonuclease, Cas12e endonuclease, Cas13a endonuclease, Cas13b endonuclease, Cas13c endonuclease, or Cas13d endonuclease. In some embodiments, the class 2 type II Cas endonuclease is derived from a refractory microorganism. In some embodiments, the double-stranded deoxyribonucleic acid polynucleotide is a eukaryotic, plant, fungal, mammalian, rodent, or human double-stranded deoxyribonucleic acid polynucleotide.

いくつかの実施形態では、(a)PAMは、配列番号:5512-5515および配列番号:5527-5530からなる群から選択される配列を含む;(b)PAMは配列番号:5516あるいは配列番号:5531を含む;(c)PAMは配列番号:5539を含む;(d)PAMは配列番号:5517あるいは配列番号:5518を含む;(e)PAMは配列番号:5519を含む;(f)PAMは配列番号:5520あるいは配列番号:5535を含む;(g)PAMは配列番号:5521あるいは配列番号:5536を含む;(h)PAMは配列番号:5522を含む;(i)PAMは配列番号:5523あるいは配列番号:5537を含む;(j)PAMは配列番号:5524を含む;(k)PAMは配列番号:5525を含む;または、(l)PAMは配列番号:5526を含む。 In some embodiments, (a) the PAM comprises a sequence selected from the group consisting of SEQ ID NO: 5512-5515 and SEQ ID NO: 5527-5530; (b) the PAM comprises SEQ ID NO: 5516 or SEQ ID NO: (c) PAM includes SEQ ID NO: 5539; (d) PAM includes SEQ ID NO: 5517 or SEQ ID NO: 5518; (e) PAM includes SEQ ID NO: 5519; (f) PAM includes SEQ ID NO: 5519; SEQ ID NO: 5520 or SEQ ID NO: 5535; (g) PAM includes SEQ ID NO: 5521 or SEQ ID NO: 5536; (h) PAM includes SEQ ID NO: 5522; (i) PAM includes SEQ ID NO: 5523 or (j) PAM comprises SEQ ID NO: 5524; (k) PAM comprises SEQ ID NO: 5525; or (l) PAM comprises SEQ ID NO: 5526.

いくつかの態様では、本開示は、標的核酸遺伝子座を改変するための方法を提供し、上記方法は、本明細書に記載される操作されたヌクレアーゼシステムのいずれかを上記標的核酸遺伝子座に送達する工程を含み、ここで、エンドヌクレアーゼは、操作されたガイドリボ核酸構造と複合体を形成するように構成され、ここで、上記複合体は、上記複合体が上記標的核酸遺伝子座に結合すると、上記複合体が標的核酸遺伝子座を改変するように構成される。いくつかの実施形態では、標的核酸遺伝子座を改変することは、標的核酸遺伝子座を結合、ニッキング、切断、標識することを含む。いくつかの実施形態では、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。いくつかの実施形態では、標的核酸は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含む。いくつかの実施形態では、標的核酸遺伝子座はインビトロである。いくつかの実施形態では、標的核酸遺伝子座は細胞内にある。いくつかの実施形態では、細胞は、原核細胞、細菌細胞、真核細胞、真菌細胞、植物細胞、動物細胞、哺乳動物細胞、げっ歯類細胞、霊長類細胞、またはヒト細胞である。 In some aspects, the present disclosure provides a method for modifying a target nucleic acid locus, the method comprising applying any of the engineered nuclease systems described herein to the target nucleic acid locus. the endonuclease is configured to form a complex with the engineered guide ribonucleic acid structure, wherein the complex is configured to form a complex upon binding of the complex to the target nucleic acid locus. , the complex is configured to modify a target nucleic acid locus. In some embodiments, modifying the target nucleic acid locus includes binding, nicking, cutting, labeling the target nucleic acid locus. In some embodiments, the target nucleic acid locus comprises deoxyribonucleic acid (DNA) or ribonucleic acid (RNA). In some embodiments, the target nucleic acid comprises genomic DNA, viral DNA, viral RNA, or bacterial DNA. In some embodiments, the target nucleic acid locus is in vitro. In some embodiments, the target nucleic acid locus is intracellular. In some embodiments, the cell is a prokaryotic, bacterial, eukaryotic, fungal, plant, animal, mammalian, rodent, primate, or human cell.

いくつかの実施形態では、操作されたヌクレアーゼシステムを標的核酸遺伝子座に送達することは、請求項135-140のいずれかに記載の核酸または請求項142-146のいずれかに記載のベクターを送達することを含む。いくつかの実施形態では、操作されたヌクレアーゼシステムを標的核酸遺伝子座に送達することは、エンドヌクレアーゼをコードするオープンリーディングフレームを含む核酸を送達することを含む。いくつかの実施形態では、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されるプロモーターを含む。いくつかの実施形態では、標的核酸遺伝子座への操作されたヌクレアーゼシステムは、エンドヌクレアーゼをコードするオープンリーディングフレームを含有するキャップされたmRNA(capped mRNA)を送達することを含む。いくつかの実施形態では、標的核酸遺伝子座への操作されたヌクレアーゼシステムは、翻訳されたポリペプチドを送達することを含む。いくつかの実施形態では、標的核酸遺伝子座への操作されたヌクレアーゼシステムは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結される操作されたガイドリボ核酸構造をコードするデオキシリボ核酸(DNA)を送達することを含む。いくつかの実施形態では、エンドヌクレアーゼは、標的遺伝子座で、またはその近位で、一本鎖切断または二本鎖切断を引き起こす。 In some embodiments, delivering the engineered nuclease system to the target nucleic acid locus comprises delivering the nucleic acid of any of claims 135-140 or the vector of any of claims 142-146. including doing. In some embodiments, delivering the engineered nuclease system to the target nucleic acid locus includes delivering a nucleic acid that includes an open reading frame encoding the endonuclease. In some embodiments, the nucleic acid includes a promoter to which an open reading frame encoding an endonuclease is operably linked. In some embodiments, the engineered nuclease system to the target nucleic acid locus comprises delivering capped mRNA containing an open reading frame encoding the endonuclease. In some embodiments, the engineered nuclease system to the target nucleic acid locus comprises delivering translated polypeptide. In some embodiments, the engineered nuclease system to the target nucleic acid locus comprises deoxyribonucleic acid (DNA) encoding an engineered guide ribonucleic acid structure operably linked to a ribonucleic acid (RNA) pol III promoter. including delivering. In some embodiments, the endonuclease causes a single-stranded break or a double-stranded break at or proximal to the target locus.

本開示のさらなる態様および利点は、以下の詳細な説明から当業者に容易に明白となり、ここでは、本開示の例示的な実施形態のみが示され、説明されている。理解されるように、本開示は、他の実施形態および異なる実施形態においても可能であり、その様々な詳細は、そのすべてが本開示から逸脱することなく様々な明白な点で修正することができる。したがって、図面および説明は本来、例示的なものとしてみなされ、限定的なものであるとはみなされない。 Further aspects and advantages of the present disclosure will be readily apparent to those skilled in the art from the following detailed description, in which only exemplary embodiments of the present disclosure are shown and described. As will be understood, this disclosure is capable of other and different embodiments, and its various details may be modified in various obvious respects, all without departing from this disclosure. can. Accordingly, the drawings and description are to be regarded as illustrative in nature and not as restrictive.

参照による組み込み
本明細書で言及される全ての出版物、特許、および特許出願は、あたかも個々の出版物、特許、または特許出願が参照によって組み込まれるよう具体的かつ個別に示されるかのように、同じ程度まで参照により本明細書に組み込まれる。
INCORPORATION BY REFERENCE All publications, patents, and patent applications mentioned herein are incorporated by reference as if each individual publication, patent, or patent application was specifically and individually indicated to be incorporated by reference. , incorporated herein by reference to the same extent.

本発明の新規な特徴は、とりわけ、添付の特許請求の範囲内に明記される。本発明の特徴および利点のより良い理解は、本発明の原理が用いられる例示的実施形態を説明する以下の詳細な説明と、以下の添付図面(本明細書では「図(”Figure”および”FIG.”)」とも称される)とを参照することによって得られるであろう。 The novel features of the invention are pointed out inter alia in the appended claims. A better understanding of the features and advantages of the present invention may be obtained from the following detailed description, which describes illustrative embodiments in which the principles of the invention may be employed, and the accompanying drawings, hereinafter referred to as "Figures" and "Figures". FIG.

様々なクラスおよび型のCRISPR/Cas遺伝子座の典型的な組織を示す。Typical organization of various classes and types of CRISPR/Cas loci is shown. 両方が結合されるハイブリッドsgRNAと比較した、天然のクラス2/II型crRNA/tracrRNAペアの構造を示す。Figure 2 shows the structure of a natural class 2/type II crRNA/tracrRNA pair compared to a hybrid sgRNA to which both are linked. MG1ファミリーからの酵素をコードするCRISPR遺伝子座の構成を示す概念図を示す。A conceptual diagram showing the organization of the CRISPR locus encoding enzymes from the MG1 family is shown. MG2ファミリーからの酵素をコードするCRISPR遺伝子座の構成を示す概念図を示す。A conceptual diagram showing the organization of CRISPR loci encoding enzymes from the MG2 family is shown. MG3ファミリーからの酵素をコードするCRISPR遺伝子座の構成を示す概念図を示す。A conceptual diagram showing the organization of CRISPR loci encoding enzymes from the MG3 family is shown. 黄色ブドウ球菌からのCas9(配列番号:5613)に対する、本開示(MG1-1)の酵素の構造に基づいたアラインメントを示す。Figure 2 shows a structure-based alignment of the enzyme of the present disclosure (MG1-1) to Cas9 from Staphylococcus aureus (SEQ ID NO: 5613). 黄色ブドウ球菌からのCas9(配列番号:5613)に対する、本開示(MG2-1)の酵素の構造に基づいたアラインメントを示す。Figure 2 shows a structure-based alignment of the enzyme of the present disclosure (MG2-1) to Cas9 from Staphylococcus aureus (SEQ ID NO: 5613). Actinomyces naeslundiiからのCas9(配列番号:5614)に対する、本開示(MG3-1)の酵素の構造に基づいたアラインメントを示す。Figure 3 shows a structure-based alignment of the enzyme of the present disclosure (MG3-1) to Cas9 (SEQ ID NO: 5614) from Actinomyces naeslundii. MG1ファミリー酵素MG1-1~MG1-6(配列番号:5、6、9、1、2、および3)の構造に基づいたアラインメントを示す。Figure 2 shows a structure-based alignment of MG1 family enzymes MG1-1 to MG1-6 (SEQ ID NOs: 5, 6, 9, 1, 2, and 3). MG1ファミリー酵素MG1-1~MG1-6(配列番号:5、6、9、1、2、および3)の構造に基づいたアラインメントを示す。Figure 2 shows a structure-based alignment of MG1 family enzymes MG1-1 to MG1-6 (SEQ ID NOs: 5, 6, 9, 1, 2, and 3). MG1ファミリー酵素MG1-1~MG1-6(配列番号:5、6、9、1、2、および3)の構造に基づいたアラインメントを示す。Figure 2 shows a structure-based alignment of MG1 family enzymes MG1-1 to MG1-6 (SEQ ID NOs: 5, 6, 9, 1, 2, and 3). MG1ファミリー酵素MG1-1~MG1-6(配列番号:5、6、9、1、2、および3)の構造に基づいたアラインメントを示す。Figure 2 shows a structure-based alignment of MG1 family enzymes MG1-1 to MG1-6 (SEQ ID NOs: 5, 6, 9, 1, 2, and 3). MG1ファミリー酵素MG1-1~MG1-6(配列番号:5、6、9、1、2、および3)の構造に基づいたアラインメントを示す。Figure 2 shows a structure-based alignment of MG1 family enzymes MG1-1 to MG1-6 (SEQ ID NOs: 5, 6, 9, 1, 2, and 3). MG1ファミリー酵素MG1-1~MG1-6(配列番号:5、6、9、1、2、および3)の構造に基づいたアラインメントを示す。Figure 2 shows a structure-based alignment of MG1 family enzymes MG1-1 to MG1-6 (SEQ ID NOs: 5, 6, 9, 1, 2, and 3). MG1ファミリー酵素MG1-1~MG1-6(配列番号:5、6、9、1、2、および3)の構造に基づいたアラインメントを示す。Figure 2 shows a structure-based alignment of MG1 family enzymes MG1-1 to MG1-6 (SEQ ID NOs: 5, 6, 9, 1, 2, and 3). MG1ファミリー酵素MG1-1~MG1-6(配列番号:5、6、9、1、2、および3)の構造に基づいたアラインメントを示す。Figure 2 shows a structure-based alignment of MG1 family enzymes MG1-1 to MG1-6 (SEQ ID NOs: 5, 6, 9, 1, 2, and 3). 様々な長さの標的化配列を含有するその対応するsgRNAと複合体を形成するMG1-4による、DNAのインビトロ切断を示す。In vitro cleavage of DNA by MG1-4 in complex with its corresponding sgRNA containing targeting sequences of various lengths is shown. MG1-4とその対応するsgRNAを使用した、大腸菌ゲノムDNAの細胞切断を示す。標的スペーサーまたは非標的スペーサーと共にMG1-4で形質転換された細胞の希釈系列が示される(上);下パネルは定量化されたデータを示し、左のバーは非標的sgRNAを表し、右のバーは標的sgRNAを表す。Cellular cleavage of E. coli genomic DNA using MG1-4 and its corresponding sgRNA is shown. Dilution series of cells transformed with MG1-4 with targeted or non-targeted spacers are shown (top); bottom panel shows quantified data, left bar represents non-targeted sgRNA, right bar represents the target sgRNA. ヒトゲノム中の様々な位置を標的とする様々な異なる標的化配列を含有するそれらの対応するsgRNAと一緒に、実施例11に記載されるMG1-4またはMG1-6の構築物を用いたHEK細胞のトランスフェクションによって生成された細胞インデル形成を示す。of HEK cells using the MG1-4 or MG1-6 constructs described in Example 11 together with their corresponding sgRNAs containing a variety of different targeting sequences targeting various locations in the human genome. Figure 2 shows cell indel formation generated by transfection. 様々な長さの標的化配列を含有するその対応するsgRNAと複合体を形成するMG3-6によるDNAのビトロ切断を示す。Figure 3 shows in vitro cleavage of DNA by MG3-6 in complex with its corresponding sgRNA containing targeting sequences of various lengths. MG3-7とその対応するsgRNAを使用した、大腸菌ゲノムDNAの細胞切断を示す。標的スペーサーまたは非標的スペーサーと共にMG3-7で形質転換された細胞の希釈系列が示される(上);下パネルは定量化されたデータを示し、左のバーは非標的sgRNAを表し、右のバーは標的sgRNAを表す。Cellular cleavage of E. coli genomic DNA using MG3-7 and its corresponding sgRNA is shown. Dilution series of cells transformed with MG3-7 with targeted or non-targeted spacers are shown (top); bottom panel shows quantified data, left bar represents non-targeted sgRNA, right bar represents the target sgRNA. ヒトゲノム中の様々な位置を標的とする様々な異なる標的化配列を含有するそれらの対応するsgRNAと一緒に、実施例13に記載されるMG3-7の構築物を用いたHEK細胞のトランスフェクションによって生成された細胞インデル形成を示す。generated by transfection of HEK cells with the constructs of MG3-7 described in Example 13, along with their corresponding sgRNAs containing a variety of different targeting sequences targeting various locations in the human genome. Figure 2 shows the formation of cell indels. 様々な長さの標的化配列を含有するその対応するsgRNAと複合体を形成するMG15-1によるDNAのインビトロ切断を示す。In vitro cleavage of DNA by MG15-1 in complex with its corresponding sgRNA containing targeting sequences of various lengths. アガロースゲルを示し、これは、様々なMGファミリーのヌクレアーゼおよびそれらの対応するtracrRNAまたはsgRNAを含有するTXTL抽出物の存在下でのPAMベクターライブラリー切断の結果を示す。Agarose gel is shown showing the results of PAM vector library cleavage in the presence of TXTL extracts containing various MG family nucleases and their corresponding tracrRNA or sgRNA. アガロースゲルを示し、これは、様々なMGファミリーのヌクレアーゼおよびそれらの対応するtracrRNAまたはsgRNAを含有するTXTL抽出物の存在下でのPAMベクターライブラリー切断の結果を示す。Agarose gel is shown showing the results of PAM vector library cleavage in the presence of TXTL extracts containing various MG family nucleases and their corresponding tracrRNA or sgRNA. アガロースゲルを示し、これは、様々なMGファミリーのヌクレアーゼおよびそれらの対応するtracrRNAまたはsgRNAを含有するTXTL抽出物の存在下でのPAMベクターライブラリー切断の結果を示す。Agarose gel is shown showing the results of PAM vector library cleavage in the presence of TXTL extracts containing various MG family nucleases and their corresponding tracrRNA or sgRNA. アガロースゲルを示し、これは、様々なMGファミリーのヌクレアーゼおよびそれらの対応するtracrRNAまたはsgRNAを含有するTXTL抽出物の存在下でのPAMベクターライブラリー切断の結果を示す。Agarose gel is shown showing the results of PAM vector library cleavage in the presence of TXTL extracts containing various MG family nucleases and their corresponding tracrRNA or sgRNA. 本明細書に記載されるMG酵素の対応するsgRNAの予想される構造(例えば、実施例7でのように予想される)を示す。Figure 2 shows the predicted structure (eg, predicted as in Example 7) of the corresponding sgRNA of the MG enzyme described herein. 本明細書に記載されるMG酵素の対応するsgRNAの予想される構造(例えば、実施例7でのように予想される)を示す。Figure 2 shows the predicted structure (eg, predicted as in Example 7) of the corresponding sgRNA of the MG enzyme described herein. 本明細書に記載されるMG酵素の対応するsgRNAの予想される構造(例えば、実施例7でのように予想される)を示す。Figure 2 shows the predicted structure (eg, predicted as in Example 7) of the corresponding sgRNA of the MG enzyme described herein. 本明細書に記載されるMG酵素の対応するsgRNAの予想される構造(例えば、実施例7でのように予想される)を示す。Figure 2 shows the predicted structure (eg, predicted as in Example 7) of the corresponding sgRNA of the MG enzyme described herein. 本明細書に記載されるMG酵素の対応するsgRNAの予想される構造(例えば、実施例7でのように予想される)を示す。Figure 2 shows the predicted structure (eg, predicted as in Example 7) of the corresponding sgRNA of the MG enzyme described herein. 本明細書に記載されるMG酵素の対応するsgRNAの予想される構造(例えば、実施例7でのように予想される)を示す。Figure 2 shows the predicted structure (eg, predicted as in Example 7) of the corresponding sgRNA of the MG enzyme described herein. 本明細書に記載される(例えば、実施例6に記載される)NGSを介して導き出されたPAM配列のseqLogo表現を示す。FIG. 6 shows a seqLogo representation of a PAM sequence derived via NGS as described herein (e.g., as described in Example 6). 本明細書に記載される(例えば、実施例6に記載される)NGSを介して導き出されたPAM配列のseqLogo表現を示す。FIG. 6 shows a seqLogo representation of a PAM sequence derived via NGS as described herein (e.g., as described in Example 6). 本明細書に記載される(例えば、実施例6に記載される)NGSを介して導き出されたPAM配列のseqLogo表現を示す。FIG. 6 shows a seqLogo representation of a PAM sequence derived via NGS as described herein (e.g., as described in Example 6). 本明細書に記載される(例えば、実施例6に記載される)NGSを介して導き出されたPAM配列のseqLogo表現を示す。FIG. 6 shows a seqLogo representation of a PAM sequence derived via NGS as described herein (e.g., as described in Example 6). 本明細書に記載される(例えば、実施例6に記載される)NGSを介して導き出されたPAM配列のseqLogo表現を示す。FIG. 6 shows a seqLogo representation of a PAM sequence derived via NGS as described herein (e.g., as described in Example 6). 本明細書に記載される(例えば、実施例6に記載される)NGSを介して導き出されたPAM配列のseqLogo表現を示す。FIG. 6 shows a seqLogo representation of a PAM sequence derived via NGS as described herein (e.g., as described in Example 6). 本明細書に記載される(例えば、実施例6に記載される)NGSを介して導き出されたPAM配列のseqLogo表現を示す。FIG. 6 shows a seqLogo representation of a PAM sequence derived via NGS as described herein (e.g., as described in Example 6). MG2-7とその対応するsgRNAを使用した、大腸菌ゲノムDNAの細胞切断を示す。標的スペーサーまたは非標的スペーサーと共にMG2-7で形質転換された細胞の希釈系列が示される(上);下パネルは定量化されたデータを示し、右のバーは非標的sgRNAを表し、左のバーは標的sgRNAを表す。Cellular cleavage of E. coli genomic DNA using MG2-7 and its corresponding sgRNA is shown. Dilution series of cells transformed with MG2-7 with targeted or non-targeted spacers are shown (top); bottom panel shows quantified data, right bar represents non-targeted sgRNA, left bar represents the target sgRNA. MG14-1とその対応するsgRNAを使用した、大腸菌ゲノムDNAの細胞切断を示す。標的スペーサーまたは非標的スペーサーと共にMG14-1で形質転換された細胞の希釈系列が示される(上);下パネルは定量化されたデータを示し、右のバーは非標的sgRNAを表し、左のバーは標的sgRNAを表す。Cellular cleavage of E. coli genomic DNA using MG14-1 and its corresponding sgRNA is shown. Dilution series of cells transformed with MG14-1 with targeted or non-targeted spacers are shown (top); bottom panel shows quantified data, right bar represents non-targeted sgRNA, left bar represents the target sgRNA. MG15-1とその対応するsgRNAを使用した、大腸菌ゲノムDNAの細胞切断を示す。標的スペーサーまたは非標的スペーサーと共にMG15-1で形質転換された細胞の希釈系列が示される(上);下パネルは定量化されたデータを示し、右のバーは非標的sgRNAを表し、左のバーは標的sgRNAを表す。Cellular cleavage of E. coli genomic DNA using MG15-1 and its corresponding sgRNA is shown. Dilution series of cells transformed with MG15-1 with targeted or non-targeted spacers are shown (top); bottom panel shows quantified data, right bar represents non-targeted sgRNA, left bar represents the target sgRNA.

配列表の簡単な説明
本明細書とともに出願された配列表は、本開示の方法、組成物、およびシステムで使用される例示的なポリヌクレオチドおよびポリペプチド配列を提供する。以下は配列表における配列の例示的な説明である。
BRIEF DESCRIPTION OF THE SEQUENCE LISTING The Sequence Listing filed herewith provides exemplary polynucleotide and polypeptide sequences for use in the methods, compositions, and systems of the present disclosure. The following is an exemplary description of the sequences in the sequence listing.

MG1 MG1

配列番号:1-319は、MG1ヌクレアーゼの完全長ペプチド配列を示す。 SEQ ID NO: 1-319 shows the full-length peptide sequence of MG1 nuclease.

配列番号:1827-2140は、上記のMG1ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。 SEQ ID NO: 1827-2140 shows the peptide sequence of the RuvC_III domain of the above MG1 nuclease.

配列番号:3638-3955は、上記のMG1ヌクレアーゼのHNHドメインのペプチドを示す。 SEQ ID NO: 3638-3955 shows the peptide of the HNH domain of the above-mentioned MG1 nuclease.

配列番号:5476-5479は、上記のMG1ヌクレアーゼと同じ遺伝子座(例えば、それぞれ配列番号:1-4と同じ遺伝子座)に由来するMG1 tracrRNAのヌクレオチド配列を示す。 SEQ ID NOs: 5476-5479 indicate the nucleotide sequences of MG1 tracrRNAs derived from the same loci as the above-mentioned MG1 nucleases (eg, the same loci as SEQ ID NOs: 1-4, respectively).

配列番号:5461-5464は、MG1ヌクレアーゼ(例えば、それぞれ配列番号:1-4)と機能するように操作されたsgRNAのヌクレオチド配列を示し、ここで、Nsは標的化配列のヌクレオチドを表示する。 SEQ ID NOs: 5461-5464 indicate the nucleotide sequences of sgRNAs engineered to function with MG1 nuclease (eg, SEQ ID NOs: 1-4, respectively), where Ns represents the nucleotide of the targeting sequence.

配列番号:5572-5575は、MG1ファミリー酵素(配列番号:1-4)の大腸菌のコドン最適化コード配列のヌクレオチド配列を示す。 SEQ ID NOs: 5572-5575 show the nucleotide sequences of E. coli codon-optimized coding sequences for MG1 family enzymes (SEQ ID NOs: 1-4).

配列番号:5588-5589は、MG1ファミリー酵素(配列番号:1および3)のヒトのコドン最適化コード配列のヌクレオチド配列を示す。 SEQ ID NOs: 5588-5589 show the nucleotide sequences of the human codon-optimized coding sequences for MG1 family enzymes (SEQ ID NOs: 1 and 3).

配列番号:5616-5632は、MG1ファミリー酵素のペプチドモチーフ特性を示す。 SEQ ID NO: 5616-5632 shows the peptide motif characteristics of MG1 family enzymes.

MG2 MG2

配列番号:320-420は、MG2ヌクレアーゼの完全長ペプチド配列を示す。 SEQ ID NO: 320-420 shows the full length peptide sequence of MG2 nuclease.

配列番号:2141-2241は、上記のMG2ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。 SEQ ID NO: 2141-2241 shows the peptide sequence of the RuvC_III domain of the above MG2 nuclease.

配列番号:3955-4055は、上記のMG2ヌクレアーゼのHNHドメインのペプチドを示す。 SEQ ID NO: 3955-4055 shows the peptide of the HNH domain of the above MG2 nuclease.

配列番号:5490-5494は、上記のMG2ヌクレアーゼと同じ遺伝子座(例えば、それぞれ配列番号:320、321、323、325、および326と同じ遺伝子座)に由来するMG2 tracrRNAのヌクレオチド配列を示す。 SEQ ID NOs: 5490-5494 show the nucleotide sequences of MG2 tracrRNAs derived from the same loci as the MG2 nucleases described above (eg, the same loci as SEQ ID NOs: 320, 321, 323, 325, and 326, respectively).

配列番号:5465は、MG2ヌクレアーゼ(例えば、上記の配列番号:321)と機能するように操作されたsgRNAのヌクレオチド配列を示す。 SEQ ID NO: 5465 shows the nucleotide sequence of an sgRNA engineered to function with MG2 nuclease (eg, SEQ ID NO: 321 above).

配列番号:5572-5575は、MG2ファミリー酵素の大腸菌のコドン最適化コード配列のヌクレオチド配列を示す。 SEQ ID NOs: 5572-5575 show the nucleotide sequences of E. coli codon-optimized coding sequences for MG2 family enzymes.

配列番号:5631-5638は、MG2ファミリー酵素のペプチド配列特性を示す。 SEQ ID NO:5631-5638 shows the peptide sequence characteristics of MG2 family enzymes.

MG3 MG3

配列番号:421-431は、MG3ヌクレアーゼの完全長ペプチド配列を示す。 SEQ ID NO:421-431 shows the full length peptide sequence of MG3 nuclease.

配列番号:2242-2251は、上記のMG3ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。 SEQ ID NO: 2242-2251 shows the peptide sequence of the RuvC_III domain of the above MG3 nuclease.

配列番号:4056-4066は、上記のMG3ヌクレアーゼのHNHドメインのペプチドを示す。 SEQ ID NOs: 4056-4066 indicate the peptides of the HNH domain of the above MG3 nuclease.

配列番号:5495-5502は、上記のMG3ヌクレアーゼと同じ遺伝子座(例えば、それぞれ配列番号:421-428と同じ遺伝子座)に由来するMG3 tracrRNAのヌクレオチド配列を示す。 SEQ ID NO: 5495-5502 shows the nucleotide sequence of MG3 tracrRNA derived from the same locus as the above-mentioned MG3 nuclease (eg, the same locus as SEQ ID NO: 421-428, respectively).

配列番号:5466-5467は、MG3ヌクレアーゼ(例えば、配列番号:421-423)と機能するように操作されたsgRNAのヌクレオチド配列を示す。 SEQ ID NOs: 5466-5467 show the nucleotide sequences of sgRNAs engineered to function with MG3 nuclease (eg, SEQ ID NOs: 421-423).

配列番号:5578-5580は、MG3ファミリー酵素の大腸菌のコドン最適化コード配列のヌクレオチド配列を示す。 SEQ ID NOs: 5578-5580 show the nucleotide sequences of E. coli codon-optimized coding sequences for MG3 family enzymes.

配列番号:5639-5648は、MG3ファミリー酵素のペプチド配列特性を示す。 SEQ ID NO: 5639-5648 shows the peptide sequence characteristics of MG3 family enzymes.

MG4 MG4

配列番号:432-660は、MG4ヌクレアーゼの完全長ペプチド配列を示す。 SEQ ID NO: 432-660 shows the full length peptide sequence of MG4 nuclease.

配列番号:2253-2481は、上記のMG4ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。 SEQ ID NO: 2253-2481 shows the peptide sequence of the RuvC_III domain of the above MG4 nuclease.

配列番号:4067-4295は、上記のMG4ヌクレアーゼのHNHドメインのペプチドを示す。 SEQ ID NO: 4067-4295 shows the peptide of the HNH domain of the above MG4 nuclease.

配列番号:5503は、上記のMG4ヌクレアーゼと同じ遺伝子座に由来するMG4 tracrRNAのヌクレオチド配列を示す。 SEQ ID NO: 5503 shows the nucleotide sequence of MG4 tracrRNA derived from the same locus as the MG4 nuclease described above.

配列番号:5468は、MG4ヌクレアーゼと機能するように操作されたsgRNAのヌクレオチド配列を示す。 SEQ ID NO: 5468 shows the nucleotide sequence of sgRNA engineered to function with MG4 nuclease.

配列番号:5649は、MG4ファミリー酵素のペプチド配列特性を示す。 SEQ ID NO: 5649 shows the peptide sequence characteristics of MG4 family enzymes.

MG6 MG6

配列番号:661-668は、MG6ヌクレアーゼの完全長ペプチド配列を示す。 SEQ ID NO: 661-668 shows the full length peptide sequence of MG6 nuclease.

配列番号:2482-2489は、上記のMG6ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。 SEQ ID NO: 2482-2489 shows the peptide sequence of the RuvC_III domain of the above MG6 nuclease.

配列番号:4296-4303は、上記のMG3ヌクレアーゼのHNHドメインのペプチドを示す。 SEQ ID NO: 4296-4303 shows the peptide of the HNH domain of the above MG3 nuclease.

MG7 MG7

配列番号:669-677は、MG7ヌクレアーゼの完全長ペプチド配列を示す。 SEQ ID NO: 669-677 shows the full length peptide sequence of MG7 nuclease.

配列番号:2490-2498は、上記のMG7ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。 SEQ ID NO: 2490-2498 shows the peptide sequence of the RuvC_III domain of the above MG7 nuclease.

配列番号:4304-4312は、上記のMG3ヌクレアーゼのHNHドメインのペプチドを示す。 SEQ ID NOs: 4304-4312 show the peptides of the HNH domain of the above MG3 nuclease.

配列番号:5504は、上記のMG7ヌクレアーゼと同じ遺伝子座に由来するMG7 tracrRNAのヌクレオチド配列を示す。 SEQ ID NO: 5504 shows the nucleotide sequence of MG7 tracrRNA derived from the same locus as the MG7 nuclease described above.

MG14配列番号:678-929は、MG14ヌクレアーゼの完全長ペプチド配列を示す。 MG14 SEQ ID NO: 678-929 shows the full length peptide sequence of MG14 nuclease.

配列番号:2499-2750は、上記のMG14ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。 SEQ ID NO: 2499-2750 shows the peptide sequence of the RuvC_III domain of the above MG14 nuclease.

配列番号:4313-4564は、上記のMG14ヌクレアーゼのHNHドメインのペプチドを示す。 SEQ ID NO: 4313-4564 shows the peptide of the HNH domain of the MG14 nuclease described above.

配列番号:5505は、上記のMG14ヌクレアーゼと同じ遺伝子座に由来するMG14 tracrRNAのヌクレオチド配列を示す。 SEQ ID NO: 5505 shows the nucleotide sequence of MG14 tracrRNA derived from the same locus as the MG14 nuclease described above.

配列番号:5581は、MG14ファミリー酵素の大腸菌のコドン最適化コード配列のヌクレオチド配列を示す。 SEQ ID NO: 5581 shows the nucleotide sequence of the E. coli codon-optimized coding sequence for MG14 family enzymes.

配列番号:5650-5667は、MG14ファミリー酵素のペプチド配列特性を示す。 SEQ ID NO: 5650-5667 shows the peptide sequence characteristics of MG14 family enzymes.

MG15 MG15

配列番号:930-1092は、MG15ヌクレアーゼの完全長ペプチド配列を示す。 SEQ ID NO: 930-1092 shows the full length peptide sequence of MG15 nuclease.

配列番号:2751-2913は、上記のMG15ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。 SEQ ID NO: 2751-2913 shows the peptide sequence of the RuvC_III domain of the above MG15 nuclease.

配列番号:4565-4727は、上記のMG15ヌクレアーゼのHNHドメインのペプチドを示す。 SEQ ID NO: 4565-4727 shows the peptide of the HNH domain of the above MG15 nuclease.

配列番号:5506は、上記のMG15ヌクレアーゼと同じ遺伝子座に由来するMG15 tracrRNAのヌクレオチド配列を示す。 SEQ ID NO: 5506 shows the nucleotide sequence of MG15 tracrRNA derived from the same locus as the MG15 nuclease described above.

配列番号:5470は、MG15ヌクレアーゼと機能するように操作されたsgRNAのヌクレオチド配列を示す。 SEQ ID NO: 5470 shows the nucleotide sequence of sgRNA engineered to function with MG15 nuclease.

配列番号:5582は、MG15ファミリー酵素の大腸菌のコドン最適化コード配列のヌクレオチド配列を示す。 SEQ ID NO: 5582 shows the nucleotide sequence of the E. coli codon-optimized coding sequence for MG15 family enzymes.

配列番号:5668-5675は、MG15ファミリー酵素のペプチド配列特性を示す。 SEQ ID NO: 5668-5675 shows the peptide sequence characteristics of MG15 family enzymes.

MG16 MG16

配列番号:1093-1353は、MG16ヌクレアーゼの完全長ペプチド配列を示す。 SEQ ID NO: 1093-1353 shows the full length peptide sequence of MG16 nuclease.

配列番号:2914-3174は、上記のMG16ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。 SEQ ID NO: 2914-3174 shows the peptide sequence of the RuvC_III domain of the above MG16 nuclease.

配列番号:4728-4988は、上記のMG16ヌクレアーゼのHNHドメインのペプチドを示す。 SEQ ID NO: 4728-4988 shows the peptide of the HNH domain of the above MG16 nuclease.

配列番号:5507は、上記のMG3ヌクレアーゼと同じ遺伝子座に由来するMG16 tracrRNAのヌクレオチド配列を示す。 SEQ ID NO: 5507 shows the nucleotide sequence of MG16 tracrRNA derived from the same locus as the MG3 nuclease described above.

配列番号:5471は、MG16ヌクレアーゼと機能するように操作されたsgRNAのヌクレオチド配列を示す。 SEQ ID NO: 5471 shows the nucleotide sequence of sgRNA engineered to function with MG16 nuclease.

配列番号:5583は、MG16ファミリー酵素の大腸菌のコドン最適化コード配列のヌクレオチド配列を示す。 SEQ ID NO: 5583 shows the nucleotide sequence of the E. coli codon-optimized coding sequence for MG16 family enzymes.

配列番号:5676-5678は、MG16ファミリー酵素のペプチド配列特性を示す。 SEQ ID NO: 5676-5678 shows the peptide sequence characteristics of MG16 family enzymes.

MG18 MG18

配列番号:1354-1511は、MG18ヌクレアーゼの完全長ペプチド配列を示す。 SEQ ID NO: 1354-1511 shows the full length peptide sequence of MG18 nuclease.

配列番号:3175-3330は、上記のMG18ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。 SEQ ID NO: 3175-3330 shows the peptide sequence of the RuvC_III domain of the above MG18 nuclease.

配列番号:4989-5146は、上記のMG18ヌクレアーゼのHNHドメインのペプチドを示す。 SEQ ID NO: 4989-5146 shows the peptide of the HNH domain of the above MG18 nuclease.

配列番号:5508は、上記のMG18ヌクレアーゼと同じ遺伝子座に由来するMG18 tracrRNAのヌクレオチド配列を示す。 SEQ ID NO: 5508 shows the nucleotide sequence of MG18 tracrRNA derived from the same locus as the MG18 nuclease described above.

配列番号:5472は、MG18ヌクレアーゼと機能するように操作されたsgRNAのヌクレオチド配列を示す。 SEQ ID NO: 5472 shows the nucleotide sequence of sgRNA engineered to function with MG18 nuclease.

配列番号:5584は、MG18ファミリー酵素の大腸菌のコドン最適化コード配列のヌクレオチド配列を示す。 SEQ ID NO: 5584 shows the nucleotide sequence of the E. coli codon-optimized coding sequence for MG18 family enzymes.

配列番号:5679-5686は、MG18ファミリー酵素のペプチド配列特性を示す。 SEQ ID NO: 5679-5686 shows the peptide sequence characteristics of MG18 family enzymes.

MG21 MG21

配列番号:1512-1655は、MG21ヌクレアーゼの完全長ペプチド配列を示す。 SEQ ID NO: 1512-1655 shows the full length peptide sequence of MG21 nuclease.

配列番号:3331-3474は、上記のMG21ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。 SEQ ID NO: 3331-3474 shows the peptide sequence of the RuvC_III domain of the above MG21 nuclease.

配列番号:5147-5290は、上記のMG21ヌクレアーゼのHNHドメインのペプチドを示す。 SEQ ID NO: 5147-5290 shows the peptide of the HNH domain of the above MG21 nuclease.

配列番号:5509は、上記のMG21ヌクレアーゼと同じ遺伝子座に由来するMG21 tracrRNAのヌクレオチド配列を示す。 SEQ ID NO: 5509 shows the nucleotide sequence of MG21 tracrRNA derived from the same locus as the MG21 nuclease described above.

配列番号:5473は、MG21ヌクレアーゼと機能するように操作されたsgRNAのヌクレオチド配列を示す。 SEQ ID NO: 5473 shows the nucleotide sequence of sgRNA engineered to function with MG21 nuclease.

配列番号:5585は、MG21ファミリー酵素の大腸菌のコドン最適化コード配列のヌクレオチド配列を示す。 SEQ ID NO: 5585 shows the nucleotide sequence of the E. coli codon-optimized coding sequence for MG21 family enzymes.

配列番号:5687-5692および5674-5675は、MG21ファミリー酵素のペプチド配列特性を示す。 SEQ ID NOs: 5687-5692 and 5674-5675 show peptide sequence characteristics of MG21 family enzymes.

MG22 MG22

配列番号:1656-1755は、MG22ヌクレアーゼの完全長ペプチド配列を示す。 SEQ ID NO: 1656-1755 shows the full length peptide sequence of MG22 nuclease.

配列番号:3475-3568は、上記のMG22ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。 SEQ ID NO: 3475-3568 shows the peptide sequence of the RuvC_III domain of the above MG22 nuclease.

配列番号:5291-5389は、上記のMG22ヌクレアーゼのHNHドメインのペプチドを示す。 SEQ ID NO: 5291-5389 shows the peptide of the HNH domain of the above MG22 nuclease.

配列番号:5510は、上記のMG22ヌクレアーゼと同じ遺伝子座に由来するMG22 tracrRNAのヌクレオチド配列を示す。 SEQ ID NO: 5510 shows the nucleotide sequence of MG22 tracrRNA derived from the same locus as the MG22 nuclease described above.

配列番号:5474は、MG22ヌクレアーゼと機能するように操作されたsgRNAのヌクレオチド配列を示す。 SEQ ID NO: 5474 shows the nucleotide sequence of sgRNA engineered to function with MG22 nuclease.

配列番号:5586は、MG22ファミリー酵素の大腸菌のコドン最適化コード配列のヌクレオチド配列を示す。 SEQ ID NO: 5586 shows the nucleotide sequence of the E. coli codon-optimized coding sequence for MG22 family enzymes.

配列番号:5694-5699は、MG22ファミリー酵素のペプチド配列特性を示す。 SEQ ID NO: 5694-5699 shows the peptide sequence characteristics of MG22 family enzymes.

MG23 MG23

配列番号:1756-1826は、MG23ヌクレアーゼの完全長ペプチド配列を示す。 SEQ ID NO: 1756-1826 shows the full length peptide sequence of MG23 nuclease.

配列番号:3569-3637は、上記のMG23ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。 SEQ ID NO: 3569-3637 shows the peptide sequence of the RuvC_III domain of the above MG23 nuclease.

配列番号:5390-5460は、上記のMG23ヌクレアーゼのHNHドメインのペプチドを示す。 SEQ ID NOs: 5390-5460 indicate the peptides of the HNH domain of the above-mentioned MG23 nuclease.

配列番号:5511は、上記のMG23ヌクレアーゼと同じ遺伝子座に由来するMG23 tracrRNAのヌクレオチド配列を示す。 SEQ ID NO: 5511 shows the nucleotide sequence of MG23 tracrRNA derived from the same locus as the MG23 nuclease described above.

配列番号:5475は、MG23ヌクレアーゼと機能するように操作されたsgRNAのヌクレオチド配列を示す。 SEQ ID NO: 5475 shows the nucleotide sequence of sgRNA engineered to function with MG23 nuclease.

配列番号:5587は、MG23ファミリー酵素の大腸菌のコドン最適化コード配列のヌクレオチド配列を示す。 SEQ ID NO: 5587 shows the nucleotide sequence of the E. coli codon-optimized coding sequence for MG23 family enzymes.

配列番号:5700-5717は、MG23ファミリー酵素のペプチド配列特性を示す。 SEQ ID NO:5700-5717 shows the peptide sequence characteristics of MG23 family enzymes.

本発明の様々な実施形態が本明細書中で示され、かつ説明されているが、このような実施形態はほんの一例として提供されるものであることは、当業者には明らかであろう。多数の変形、変更、および置き換えは、本発明から逸脱することなく、当業者によって想到され得る。本明細書に記載される本発明の実施形態の様々な代案が利用され得ることを理解されたい。 While various embodiments of the invention are shown and described herein, it will be obvious to those skilled in the art that such embodiments are provided by way of example only. Numerous variations, modifications, and substitutions may be devised by those skilled in the art without departing from the invention. It should be understood that various alternatives to the embodiments of the invention described herein may be utilized.

本明細書で開示されるいくつかの方法の実施は、特段の定めのない限り、免疫学、生化学、化学、分子生物学、微生物学、細胞生物学、ゲノミクス、および組換えDNAの技術を利用する。例えば、Sambrook and Green,Molecular Cloning:A Laboratory Manual,4th Edition(2012);the series Current Protocols in Molecular Biology(F.M.Ausubel,et al.eds.);the series Methods In Enzymology(Academic Press,Inc.),PCR 2:A Practical Approach(M.J.MacPherson,B.D.Hames and G.R.Taylor eds.(1995)),Harlow and Lane,eds.(1988)Antibodies,A Laboratory Manual,and Culture of Animal Cells:A Manual of Basic Technique and Specialized Applications,6th Edition(R.I.Freshney,ed.(2010)))(これらは、参照によりその全体が本明細書に組み込まれる)。 The practice of some of the methods disclosed herein may involve techniques of immunology, biochemistry, chemistry, molecular biology, microbiology, cell biology, genomics, and recombinant DNA, unless otherwise specified. Make use of it. For example, Sambrook and Green, Molecular Cloning: A Laboratory Manual, 4th Edition (2012); the series Current Protocols in Molecular Biolo gy (F.M. Ausubel, et al. eds.); the series Methods In Enzymology (Academic Press, Inc. ), PCR 2: A Practical Approach (M.J. MacPherson, B.D. Hames and G.R. Taylor eds. (1995)), Harlow and Lane, eds. (1988) Antibodies, A Laboratory Manual, and Culture of Animal Cells: A Manual of Basic Technique and Specialized Application s, 6th Edition (R.I. Freshney, ed. (2010))) (which are incorporated herein by reference in their entirety). (incorporated into the specification).

本明細書で使用されるように、単数形「1つ(a)」、「1つ(an)」、および「その(the)」は、文脈上他の意味を明白に示すものでない限り、同様に複数形を含むことを意図している。さらに、用語「含んでいる(including)」、「含む(includes)」、「有している(having)」、「有する(has)」、「含んだ(with)」、または、その変異形態が詳細な記載および/または請求項のいずれかで使用される程度には、上記のような用語は「含んでいる(comprising)」との用語に類似する手法で包括的であることを意図している。 As used herein, the singular forms "a," "an," and "the" refer to the singular forms "a," "an," and "the," unless the context clearly dictates otherwise. It is intended to include plural forms as well. Additionally, the terms "including," "includes," "having," "has," "with," or variations thereof, To the extent used in either the detailed description and/or the claims, such terms are intended to be inclusive in a manner analogous to the term "comprising". There is.

「約」または「およそ」との用語は、当業者によって決定されるような特定の値の許容可能な誤差範囲内であることを意味し、その誤差範囲は、その値がどのように測定または決定されるか、つまり、測定システムの制限に部分的に依存する。例えば、「約」とは、当該技術分野での実践につき1または1を超える標準偏差を意味し得る。代替的に、「約」は、任意の値の最大20%、最大15%、最大10%、最大5%、または最大1%の範囲を意味する場合がある。 The term "about" or "approximately" means within an acceptable error range of a particular value, as determined by one of ordinary skill in the art, and that error range is based on how that value is measured or determined, i.e. depends in part on the limitations of the measurement system. For example, "about" can mean 1 or more than 1 standard deviation per practice in the art. Alternatively, "about" may mean a range of up to 20%, up to 15%, up to 10%, up to 5%, or up to 1% of any value.

本明細書で使用されるように、「細胞」とは一般に、生体細胞を指す。細胞は、生体の基本構造単位、機能単位、および/または生物学的単位であり得る。細胞は、1つ以上の細胞を有する任意の生物に起源を持つ場合がある。いくつかの非限定的な例としては、原核細胞、真核細胞、細菌細胞、古細菌細胞、単一細胞の真核生物の細胞、原生動物細胞、植物の細胞(例えば、作物、果物、野菜、穀類、ダイズ、トウモロコシ(corn)、トウモロコシ(maize)、小麦、種子、トマト、イネ、キャッサバ、サトウキビ、カボチャ、干し草、ジャガイモ、綿、アサ、タバコ、顕花植物、針葉樹、裸子植物、シダ、ヒカゲノカズラ類、ツノゴケ類、苔類、蘚類の細胞)、藻細胞(例えば、Botryococcus braunii、Chlamydomonas reinhardti、Nannochloropsis gaditana、Chlorella pyrenoidosa、Sargassum patens C.Agardhなど)、海草(例えば、ケルプ)、真菌細胞(例えば、酵母菌細胞、キノコからの細胞)、動物細胞、無脊髄動物(例えば、ショウジョウバエ、刺胞動物、棘皮動物、線虫など)の細胞、脊椎動物(例えば、魚、両生類、爬虫類、鳥、哺乳動物)の細胞、哺乳動物(例えば、ブタ、雌ウシ、ヤギ、ヒツジ、げっ歯類、ラット、マウス、非ヒト霊長類、ヒトなど)の細胞などが挙げられる。細胞は、天然の生物に起源を持たないこともある(例えば、細胞は合成的に作られ、人工細胞と呼ばれることもある)。 As used herein, "cell" generally refers to a living cell. A cell may be the basic structural, functional, and/or biological unit of an organism. A cell may originate from any organism that has one or more cells. Some non-limiting examples include prokaryotic cells, eukaryotic cells, bacterial cells, archaeal cells, single-celled eukaryotic cells, protozoan cells, plant cells (e.g., crops, fruits, vegetables). , cereals, soybeans, corn, maize, wheat, seeds, tomatoes, rice, cassava, sugarcane, pumpkins, hay, potatoes, cotton, hemp, tobacco, flowering plants, conifers, gymnosperms, ferns, cells of lycophytes, hornworts, liverworts, mosses), algal cells (e.g. Botryococcus braunii, Chlamydomonas reinhardti, Nannochloropsis gaditana, Chlorella pyrenoids) a, Sargassum patens C. Agardh etc.), seaweeds (e.g. kelp), fungal cells (e.g. , yeast cells, cells from mushrooms), animal cells, cells of invertebrates (e.g. Drosophila, cnidarians, echinoderms, nematodes, etc.), vertebrates (e.g. fish, amphibians, reptiles, birds, mammals) Examples include cells of mammals (eg, pigs, cows, goats, sheep, rodents, rats, mice, non-human primates, humans, etc.). Cells may not have natural biological origin (for example, cells may be synthetically created and are called artificial cells).

「ヌクレオチド」との用語は、本明細書で使用されるように、一般に、塩基-糖-リン酸塩の組み合わせを指す。ヌクレオチドは合成ヌクレオチドを含むことがある。ヌクレオチドは合成ヌクレオチドアナログを含むことがある。ヌクレオチドは、核酸配列(例えば、デオキシリボ核酸(DNA)およびリボ核酸(RNA))の単量体単位である場合がある。ヌクレオチドとの用語には、リボヌクレオシド三リン酸アデノシン三リン酸(ATP)、ウリジン三リン酸(UTP)、シトシン三リン酸(CTP)、グアノシン三リン酸(GTP)、およびデオキシリボヌクレオシド三リン酸、例えば、dATP、dCTP、dITP、dUTP、dGTP、dTTP、またはそれらの誘導体が含まれ得る。そのような誘導体は、例えば、[αS]dATP、7-デアザ-dGTPおよび7-デアザ-dATP、および、それらを含有する核酸分子にヌクレアーゼ耐性を与えるヌクレオチド誘導体を含む場合がある。ヌクレオチドとの用語は、本明細書に使用されるように、ジデオキシリボヌクレオシド三リン酸(ddNTP)およびそれらの誘導体を指し得る。ジデオキシリボヌクレオシド三リン酸の例示的な例としては、限定されないが、ddATP、ddCTP、ddGTP、ddITP、およびddTTPが挙げられ得る。ヌクレオチドは標識されない場合があるか、または、光学的に検出可能な部分(例えば、フルオロフォア)を含む部分を使用するなどして、検出できるように標識される場合がある。標識化はまた、量子ドットを用いて実施されてもよい。検出可能な標識としては、例えば、放射性同位元素、蛍光標識、化学発光標識、生物発光標識、および酵素標識が挙げられ得る。ヌクレオチドの蛍光標識としては、限定されないが、フルオレセイン、5-カルボキシフルオセイン(FAM)、2’7’-ジメトキシ-4’5-ジクロロ-6-カルボキシフルオセイン(JOE)、ローダミン、6-カルボキシローダミン(R6G)、N,N,N’,N’-テトラメチル-6-カルボキシローダミン(TAMRA)、6-カルボキシ-X-ローダミン(ROX)、4-(4’ジメチルアミノフェニルアゾ)安息香酸(DABCYL)、Cascade Blue、Oregon Green、Texas Red、シアニン、および5-(2’-アミノエチル)アミノナフタレン-1-スルホン酸(EDANS)が挙げられ得る。蛍光標識されたヌクレオチドの特定の例としては、Perkin Elmer(Foster City,Calif)から利用可能な[R6G]dUTP、[TAMRA]dUTP、[R110]dCTP、[R6G]dCTP、[TAMRA]dCTP、[JOE]ddATP、[R6G]ddATP、[FAM]ddCTP、[R110]ddCTP、[TAMRA]ddGTP、[ROX]ddTTP、[dR6G]ddATP、[dR110]ddCTP、[dTAMRA]ddGTP、および[dROX]ddTTP;Amersham(Arlington Heights,Ill)から利用可能なFluoroLink DeoxyNucleotides、FluoroLink Cy3-dCTP、FluoroLink Cy5-dCTP、FluoroLink Fluor X-dCTP、FluoroLink Cy3-dUTP、およびFluoroLink Cy5-dUTP;Boehringer Mannheim(Indianapolis,Ind.)から利用可能なフルオレセイン-15-dATP、フルオレセイン-12-dUTP、テトラメチル-rodamine-6-dUTP、IR770-9-dATP、フルオレセイン-12-ddUTP、フルオレセイン-12-UTP、およびフルオレセイン-15-2’-dATP;および、Molecular Probes(Eugene,Oreg)から利用可能なChromosome Labeled Nucleotides、BODIPY-FL-14-UTP、BODIPY-FL-4-UTP、BODIPY-TMR-14-UTP、BODIPY-TMR-14-dUTP、BODIPY-TR-14-UTP、BODIPY-TR-14-dUTP、Cascade Blue-7-UTP、Cascade Blue-7-dUTP、フルオレセイン-12-UTP、フルオレセイン-12-dUTP、Oregon Green 488-5-dUTP、ローダミン Green-5-UTP、ローダミン Green-5-dUTP、テトラメチルローダミン6-UTP、テトラメチルローダミン6-dUTP、Texas Red-5-UTP、Texas Red-5-dUTP、およびTexas Red-12-dUTPが挙げられ得る。ヌクレオチドも化学修飾によって標識(labeled)または標識(marked)され得る。化学的に修飾された単一ヌクレオチドはビオチンdNTPである場合がある。ビオチン化されたdNTPのいくつかの非限定的な例としては、ビオチン-dATP(例えば、bio-N6-ddATP、biotin-14-dATP)、ビオチン-dCTP(例えば、ビオチン-11-dCTP、ビオチン-14-dCTP)、およびビオチン-dUTP(例えば、ビオチン-11-dUTP、ビオチン-16-dUTP、ビオチン-20-dUTP)が挙げられ得る。 The term "nucleotide," as used herein, generally refers to a base-sugar-phosphate combination. Nucleotides may include synthetic nucleotides. Nucleotides may include synthetic nucleotide analogs. A nucleotide may be a monomeric unit of a nucleic acid sequence, such as deoxyribonucleic acid (DNA) and ribonucleic acid (RNA). The terms nucleotide include the ribonucleoside triphosphates adenosine triphosphate (ATP), uridine triphosphate (UTP), cytosine triphosphate (CTP), guanosine triphosphate (GTP), and deoxyribonucleoside triphosphate (GTP). , for example, dATP, dCTP, dITP, dUTP, dGTP, dTTP, or derivatives thereof. Such derivatives may include, for example, [αS]dATP, 7-deaza-dGTP and 7-deaza-dATP, and nucleotide derivatives that confer nuclease resistance to nucleic acid molecules containing them. The term nucleotide, as used herein, may refer to dideoxyribonucleoside triphosphates (ddNTPs) and derivatives thereof. Illustrative examples of dideoxyribonucleoside triphosphates may include, but are not limited to, ddATP, ddCTP, ddGTP, ddITP, and ddTTP. The nucleotides may be unlabeled or may be detectably labeled, such as using a moiety that includes an optically detectable moiety (eg, a fluorophore). Labeling may also be performed using quantum dots. Detectable labels can include, for example, radioisotopes, fluorescent labels, chemiluminescent labels, bioluminescent labels, and enzyme labels. Fluorescent labels for nucleotides include, but are not limited to, fluorescein, 5-carboxyfluorescein (FAM), 2'7'-dimethoxy-4'5-dichloro-6-carboxyfluorescein (JOE), rhodamine, 6-carboxyrhodamine. (R6G), N,N,N',N'-tetramethyl-6-carboxyrhodamine (TAMRA), 6-carboxy-X-rhodamine (ROX), 4-(4'dimethylaminophenylazo)benzoic acid (DABCYL) ), Cascade Blue, Oregon Green, Texas Red, cyanine, and 5-(2'-aminoethyl)aminonaphthalene-1-sulfonic acid (EDANS). Specific examples of fluorescently labeled nucleotides include [R6G]dUTP, [TAMRA]dUTP, [R110]dCTP, [R6G]dCTP, [TAMRA]dCTP, [ available from Perkin Elmer (Foster City, Calif.). JOE] ddATP, [R6G] ddATP, [FAM] ddCTP, [R110] ddCTP, [TAMRA] ddGTP, [ROX] ddTTP, [dR6G] ddATP, [dR110] ddCTP, [dTAMRA] ddGTP, and [dROX] ddTTP; FluoroLink DeoxyNucleotides, FluoroLink Cy3-dCTP, FluoroLink Cy5-dCTP, FluoroLink Fluor X-dC available from Amersham (Arlington Heights, Ill.) TP, FluoroLink Cy3-dUTP, and FluoroLink Cy5-dUTP; from Boehringer Mannheim (Indianapolis, Ind.) Available Fluorescein-15-dATP, Fluorescein-12-dUTP, Tetramethyl-rodamine-6-dUTP, IR770-9-dATP, Fluorescein-12-ddUTP, Fluorescein-12-UTP, and Fluorescein-15-2'- dATP; and Chromosome Labeled Nucleotides, BODIPY-FL-14-UTP, BODIPY-FL-4-UTP, BODIPY-TMR-14-UTP, BO, available from Molecular Probes (Eugene, Oreg.) DIPY-TMR-14-dUTP , BODIPY -TR -14 -UTP, BODIPY -TR -14 -DUTP, CASCADE BLUE -7 -UTP, CASCADE BLUE -7 -DUTP, Fluoresane -12 -UTP, Fluoresane -12 -DUTP, OREGON GREEN 4 88-5 -DUTP , Rhodamine Green-5-UTP, Rhodamine Green-5-dUTP, Tetramethylrhodamine 6-UTP, Tetramethylrhodamine 6-dUTP, Texas Red-5-UTP, Texas Red-5-dUTP, and Texas Red-12-dUTP can be mentioned. Nucleotides can also be labeled or marked by chemical modification. The chemically modified single nucleotide may be a biotin dNTP. Some non-limiting examples of biotinylated dNTPs include biotin-dATP (e.g., bio-N6-ddATP, biotin-14-dATP), biotin-dCTP (e.g., biotin-11-dCTP, biotin- 14-dCTP), and biotin-dUTP (eg, biotin-11-dUTP, biotin-16-dUTP, biotin-20-dUTP).

「ポリヌクレオチド」、「オリゴヌクレオチド」、および「核酸」との用語は、一般に、一本鎖、二本鎖、あるいは多重鎖(multi-stranded)の形態のいずれかの、任意の長さのヌクレオチドの高分子形態((デオキシリボヌクレオチドまたはリボヌクレオチドのいずれか)、またはそのアナログを指すために交換可能に使用される。ポリヌクレオチドは、細胞に対して外因性または内因性であり得る。ポリヌクレオチドは、無細胞環境に存在することがある。ポリヌクレオチドは、遺伝子またはその断片であることがある。ポリヌクレオチドはDNAであることがある。ポリヌクレオチドはRNAであることがある。ポリヌクレオチドは、任意の三次元構造も有していてもよく、任意の機能を実施してもよい。ポリヌクレオチドは、1つ以上のアナログ(例えば、改変された骨格、糖、または核酸塩基)を含むことがある。存在する場合、ヌクレオチド構造に対する改変は、ポリマーのアセンブリの前または後で与えられ得る。アナログのいくつかの非限定的な例としては、5-ブロモウラシル、ペプチド核酸、xeno核酸、モルフォリノ、ロックド核酸、グリコール核酸、トレオース核酸、ジデオキシヌクレオチド、コルジセピン、7-デアザ-GTP、フルオロフォア(例えば、糖に結合したローダミンまたはフルオレセイン)、ヌクレオチドを含有するチオール、ビオチン結合ヌクレオチド、蛍光塩基アナログ(fluorescent base analogs)、CpGアイランド、メチル-7-グアノシン、メチル化ヌクレオチド、イノシン、チオウリジン、シュードウリジン(pseudourdine)、ジヒドロウリジン、キューオシン、およびワイオシンが挙げられる。ポリヌクレオチドの非限定的な例としては、遺伝子あるいは遺伝子断片のコード領域あるいは非コード領域、連鎖解析から定義された遺伝子座、エクソン、イントロン、メッセンジャーRNA(mRNA)、転移RNA(tRNA)、リボソームRNA(rRNA)、低分子干渉RNA(siRNA)、低分子ヘアピン型RNA(shRNA)、マイクロRNA(miRNA)、リボザイム、cDNA、組換えポリヌクレオチド、分岐ポリヌクレオチド、プラスミド、ベクター、任意の配列の単離されたDNA、任意の配列の単離されたRNA、無細胞DNA(cfDNA)を含む無細胞のポリヌクレオチド、および無細胞RNA(cfRNA)、核酸プローブ、およびプライマーが挙げられる。ヌクレオチドの配列は、非ヌクレオチド構成要素によって中断される場合がある。 The terms "polynucleotide," "oligonucleotide," and "nucleic acid" generally refer to nucleotides of any length, either in single-stranded, double-stranded, or multi-stranded form. (either deoxyribonucleotides or ribonucleotides), or analogs thereof. A polynucleotide can be exogenous or endogenous to a cell. A polynucleotide is , may exist in a cell-free environment. A polynucleotide may be a gene or a fragment thereof. A polynucleotide may be DNA. A polynucleotide may be RNA. A polynucleotide may be any A polynucleotide may also have a three-dimensional structure and perform any function. A polynucleotide may include one or more analogs (e.g., modified backbones, sugars, or nucleobases). Modifications to the nucleotide structure, if present, can be imparted before or after assembly of the polymer. Some non-limiting examples of analogs include 5-bromouracil, peptide nucleic acids, xeno nucleic acids, morpholinos, locked Nucleic acids, glycol nucleic acids, threose nucleic acids, dideoxynucleotides, cordycepin, 7-deaza-GTP, fluorophores (e.g. rhodamine or fluorescein attached to sugars), thiol containing nucleotides, biotin-conjugated nucleotides, fluorescent base analogs ), CpG islands, methyl-7-guanosine, methylated nucleotides, inosine, thiouridine, pseudouridine, dihydrouridine, cuosine, and wyosine. Non-limiting examples of polynucleotides include genes or Coding or non-coding regions of fragments, loci defined by linkage analysis, exons, introns, messenger RNA (mRNA), transfer RNA (tRNA), ribosomal RNA (rRNA), small interfering RNA (siRNA), small molecules hairpin RNA (shRNA), microRNA (miRNA), ribozyme, cDNA, recombinant polynucleotide, branched polynucleotide, plasmid, vector, isolated DNA of any sequence, isolated RNA of any sequence, Included are cell-free polynucleotides, including cell-free DNA (cfDNA), and cell-free RNA (cfRNA), nucleic acid probes, and primers. A sequence of nucleotides may be interrupted by non-nucleotide components.

「トランスフェクション」または「トランスフェクトされた」との用語は、一般に、非ウイルスベースの方法あるいはウイルスベースの方法によって、核酸を細胞内に導入することを指す。核酸分子は、完全タンパク質あるいはその機能性部分をコードする遺伝子配列であり得る。例えば、Sambrook et al.,1989,Molecular Cloning:A Laboratory Manual,18.1-18.88を参照されたい。 The terms "transfection" or "transfected" generally refer to the introduction of a nucleic acid into a cell by non-viral or viral-based methods. A nucleic acid molecule can be a genetic sequence encoding a complete protein or a functional portion thereof. For example, Sambrook et al. , 1989, Molecular Cloning: A Laboratory Manual, 18.1-18.88.

「ペプチド」、「ポリペプチド」、および「タンパク質」との用語は、一般に、ペプチド結合によって結合された少なくとも2つのアミノ酸残基のポリマーを指すために、本明細書において交換可能に使用される。この用語は、ポリマーの特定の長さを暗示せず、また、ペプチドが組換え技術、化学的合成あるいは酵素的合成を使用して産生されるか、または天然に存在するかを暗示または識別することを意図しない。この用語は、天然に存在するアミノ酸ポリマー、ならびに、少なくとも1つの修飾されたアミノ酸を含むアミノ酸ポリマーに適用される。場合によっては、ポリマーが非アミノ酸によって中断される場合がある。この用語には、完全長のタンパク質を含む任意の長さのアミノ酸鎖、ならびに、2次構造および/または3次構造(例えば、ドメイン)を有するまたは有していないタンパク質が含まれる。この用語はまた、例えば、ジスルフィド結合形成、グリコシル化、脂質修飾、アセチル化、リン酸化、酸化、および他の操作、例えば、標識化成分とのコンジュゲートによって修飾されたアミノ酸ポリマーを包含する。「アミノ酸」との用語は、本明細書で使用されるように、一般に、天然アミノ酸、および、修飾されたアミノ酸およびアミノ酸アナログを含む非天然アミノ酸を指す。修飾されたアミノ酸は、天然アミノ酸および非天然アミノ酸を含むことがあり、これは自然に存在しない基あるいは化学的部分をアミノ酸上に含むように化学的に修飾されている。アミノ酸アナログはアミノ酸誘導体を指すこともある。「アミノ酸」との用語には、D-アミノ酸とL-アミノ酸の両方が含まれる。 The terms "peptide," "polypeptide," and "protein" are generally used interchangeably herein to refer to a polymer of at least two amino acid residues joined by peptide bonds. The term does not imply a specific length of the polymer, nor does it imply or distinguish whether the peptide is produced using recombinant technology, chemical or enzymatic synthesis, or is naturally occurring. not intended. This term applies to naturally occurring amino acid polymers as well as amino acid polymers containing at least one modified amino acid. In some cases, the polymer may be interrupted by non-amino acids. The term includes amino acid chains of any length, including full-length proteins, and proteins with or without secondary and/or tertiary structure (eg, domains). The term also encompasses amino acid polymers modified, for example, by disulfide bond formation, glycosylation, lipid modification, acetylation, phosphorylation, oxidation, and other manipulations, such as conjugation with labeling moieties. The term "amino acid" as used herein generally refers to natural amino acids and unnatural amino acids, including modified amino acids and amino acid analogs. Modified amino acids can include natural and unnatural amino acids, which are chemically modified to include groups or chemical moieties on the amino acid that do not occur naturally. Amino acid analogs may also refer to amino acid derivatives. The term "amino acid" includes both D-amino acids and L-amino acids.

本明細書で使用されるように、「非天然」とは、一般に、天然の核酸またはタンパク質では見られない核酸またはポリペプチド配列を指す。非天然はアフィニティータグを指すことがある。非天然は融合を指すことがある。非天然は、突然変異、挿入、および/または欠失を含む天然に存在する核酸またはポリペプチド配列を指すことがある。非天然の配列は、非天然の配列が融合される核酸および/またはポリペプチド配列によって示される可能性がある活性(例えば、酵素活性、メチルトランスフェラーゼ活性、アセチルトランスフェラーゼ活性、キナーゼ活性、ユビキチン化活性など)を示す、および/またはコードする場合がある。非天然の核酸またはポリペプチド配列は、遺伝子操作によって、天然に存在する核酸またはポリペプチド配列(あるいは、その変異体)に結合され、キメラ核酸、および/または、キメラ核酸ならびに/あるいはポリペプチドをコードするポリペプチド配列を生成する場合がある。 As used herein, "non-natural" generally refers to a nucleic acid or polypeptide sequence that is not found in naturally occurring nucleic acids or proteins. Non-natural may refer to affinity tags. Non-natural can refer to fusion. Non-naturally occurring may refer to naturally occurring nucleic acid or polypeptide sequences that contain mutations, insertions, and/or deletions. Non-natural sequences include activities that may be exhibited by the nucleic acid and/or polypeptide sequences to which they are fused (e.g., enzymatic activity, methyltransferase activity, acetyltransferase activity, kinase activity, ubiquitination activity, etc.). ) and/or may be coded. A non-naturally occurring nucleic acid or polypeptide sequence can be genetically linked to a naturally occurring nucleic acid or polypeptide sequence (or a variant thereof) to encode a chimeric nucleic acid and/or a chimeric nucleic acid and/or polypeptide. may produce polypeptide sequences that

「プロモーター」との用語は、本明細書で使用されるように、一般に、遺伝子の転写または発現を制御する調節DNA領域を指し、RNA転写が開始されるヌクレオチドあるいはヌクレオチドの領域に隣接または重複して位置する場合がある。プロモーターは、しばしば転写因子とも呼ばれる、タンパク質因子に結合する特異的DNA配列を含有する場合があり、これは、DNAへのRNAポリメラーゼの結合を促進し、遺伝子転写を引き起こす。「コアプロモーター」とも呼ばれる「基本プロモーター」は、一般に、動作可能に連結されたポリヌクレオチドの転写発現を促進するために必要な基本的な要素をすべて含有しているプロモーターを指す。真核生物の基本プロモーターは典型的に、必ずしもそうとは限らないが、TATAボックスおよび/またはCAATボックスを含有している。 The term "promoter" as used herein generally refers to a regulatory DNA region that controls the transcription or expression of a gene and that is adjacent to or overlaps the nucleotide or region of nucleotides at which RNA transcription is initiated. It may be located at A promoter may contain specific DNA sequences that bind protein factors, often called transcription factors, that facilitate binding of RNA polymerase to the DNA and cause gene transcription. A "basic promoter", also referred to as a "core promoter", generally refers to a promoter that contains all the basic elements necessary to promote transcriptional expression of an operably linked polynucleotide. Eukaryotic basic promoters typically, but not necessarily, contain a TATA box and/or a CAAT box.

「発現」との用語は、本明細書で使用されるように、一般に、DNA鋳型から核酸配列またはポリヌクレオチドが(mRNAあるいは他のRNA転写物などに)転写されるプロセス、および/または、転写されたmRNAがその後、ペプチド、ポリペプチド、あるいはタンパク質へと翻訳されるプロセスを指す。転写産物およびコードされたポリペプチドは、まとめて「遺伝子産物」と呼ばれることがある。ポリヌクレオチドがゲノムDNAに由来する場合、発現は、真核細胞におけるmRNAのスプライシングを含むことがある。 The term "expression," as used herein, generally refers to the process by which a nucleic acid sequence or polynucleotide is transcribed (such as into mRNA or other RNA transcripts) from a DNA template, and/or Refers to the process by which the expressed mRNA is then translated into a peptide, polypeptide, or protein. Transcripts and encoded polypeptides are sometimes collectively referred to as "gene products." If the polynucleotide is derived from genomic DNA, expression may involve splicing of the mRNA in eukaryotic cells.

本明細書で使用されるように、「動作可能に連結する」、「動作可能な連結」、または「動作可能なように連結する」、またはその文法的等価物は一般に、遺伝要素、例えば、プロモーター、エンハンサー、ポリアデニル化配列などの並置を指し、これらの要素は、それらが予期された方法で動作することを可能にする関係にある。例えば、プロモーターおよび/またはエンハンサー配列を含み得る調節エレメントは、その調節エレメントがコード配列の転写を始めるのを支援する場合、コード領域に動作可能に連結される。この機能的関係が維持される限り、調節エレメントとコード領域の間に介在する残基が存在する場合がある。 As used herein, "operably linked," "operably linked," or "operably linked," or grammatical equivalents thereof, generally refer to genetic elements, e.g. Refers to the juxtaposition of promoters, enhancers, polyadenylation sequences, etc., in which these elements are in a relationship that allows them to operate in a predicted manner. For example, a regulatory element, which may include a promoter and/or enhancer sequence, is operably linked to a coding region if the regulatory element assists in initiating transcription of the coding sequence. There may be intervening residues between the regulatory element and the coding region so long as this functional relationship is maintained.

「ベクター」とは、本明細書で使用されるように、一般に、ポリヌクレオチドを含むか、あるいはポリヌクレオチドと会合する高分子または高分子の集合体(association)を指し、細胞へのポリヌクレオチドの送達を媒介するために使用され得る。ベクターの例としては、プラスミド、ウイルスベクター、リポソーム、および他の遺伝子送達ビヒクルが挙げられる。ベクターは一般に、標的中の遺伝子の発現を促進するために遺伝子に動作可能に連結された遺伝エレメント、例えば、調節エレメントを含む。 "Vector," as used herein, generally refers to a macromolecule or association of macromolecules that includes or is associated with a polynucleotide and that directs the transfer of the polynucleotide into a cell. Can be used to mediate delivery. Examples of vectors include plasmids, viral vectors, liposomes, and other gene delivery vehicles. Vectors generally include genetic elements, such as regulatory elements, operably linked to the gene to promote expression of the gene in the target.

本明細書で使用されるように、「発現カセット」および「核酸カセット」は一般に、ともに発現されるか、あるいは発現のために動作可能に連結される核酸配列または要素の組み合わせを指すために交換可能に使用される。場合によっては、発現カセットは、調節エレメントと、それらが発現のために動作可能に連結される遺伝子との組み合わせを指す。 As used herein, "expression cassette" and "nucleic acid cassette" are generally used interchangeably to refer to a combination of nucleic acid sequences or elements that are expressed together or operably linked for expression. used as possible. In some cases, an expression cassette refers to a combination of regulatory elements and genes to which they are operably linked for expression.

DNAまたはタンパク質配列の「機能的断片」とは一般に、完全長のDNAまたはタンパク質配列の生物学的活性に実質的に類似する生物学的活性(機能的または構造的)を保持する断片を指す。DNA配列の生物学的活性は、完全長の配列に起因すると知られている様式で発現に影響を与えるその能力であり得る。 A "functional fragment" of a DNA or protein sequence generally refers to a fragment that retains a biological activity (functional or structural) that is substantially similar to that of the full-length DNA or protein sequence. The biological activity of a DNA sequence may be its ability to affect expression in a manner known to be attributable to the full-length sequence.

本明細書で使用されるように、「操作された」対象は一般に、その対象がヒトの介入によって改変されていることを示す。非限定的な例によると、核酸は、その配列を自然界で生じない配列に変更することによって改変される場合がある;核酸は、ライゲーションされた産物がもとの核酸には存在しない機能を保有するように、その核酸を、その核酸が自然界では会合しない核酸にライゲーションすることによって改変される場合がある;操作された核酸は、自然界では存在しない配列とインビトロで合成される場合がある;タンパク質は、そのアミノ酸配列を自然界では存在しない配列に変更することによって改変される場合がある;操作されたタンパク質は、新しい機能あるいは特性を得る場合がある。「操作された」システムは、少なくとも1つの操作された構成要素を含む。 As used herein, a "manipulated" subject generally indicates that the subject has been modified by human intervention. By way of non-limiting example, a nucleic acid may be modified by changing its sequence to a sequence that does not occur in nature; a nucleic acid may be modified such that the ligated product possesses a function not present in the original nucleic acid. The nucleic acid may be modified by ligation to a nucleic acid with which it is not naturally associated, such that the nucleic acid is associated with it in nature; an engineered nucleic acid may be synthesized in vitro with a sequence that does not occur in nature; A protein may be modified by changing its amino acid sequence to one that does not occur in nature; the engineered protein may gain new functions or properties. An “operated” system includes at least one operated component.

本明細書で使用されるように、「合成」および「人工」は、天然に存在するヒトタンパク質に対して低い配列同一性(例えば、50%未満の配列同一性、25%未満の配列同一性、10%未満の配列同一性、5%未満の配列同一性、1%未満の配列同一性)を有するタンパク質またはそのドメインを指すために交換可能に使用される。例えば、VPRとVP64のドメインは、合成トランス活性化ドメインである。 As used herein, "synthetic" and "artificial" refer to low sequence identity (e.g., less than 50% sequence identity, less than 25% sequence identity) to naturally occurring human proteins. , less than 10% sequence identity, less than 5% sequence identity, less than 1% sequence identity). For example, the VPR and VP64 domains are synthetic transactivation domains.

「tracrRNA」または「tracr配列」との用語は、本明細書で使用されるように、一般に、野生型の例示的なtracrRNA配列(例えば、S.pyogenes、黄色ブドウ球菌などからのtracrRNA、または配列番号:5476-5511)に対して少なくとも約5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、または100%の配列同一性を有する核酸、および/またはその野生型の例示的なtracrRNA配列に類似する配列を指す場合がある。tracrRNAは、野生型の例示的なtracrRNA配列(例えば、S.pyogenes、黄色ブドウ球菌などからのtracrRNA)に対して最大で約5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、あるいは100%の配列同一性を有する核酸、および/またはその野生型の例示的なtracrRNA配列に類似する配列を指す場合がある。tracrRNAは、欠失、挿入、または置換などのヌクレオチド変化、変異体、突然変異、あるいはキメラを含む、tracrRNAの改変された形態を指す場合がある。tracrRNAは、少なくとも6つの連続するヌクレオチドのストレッチにわたって、野生型の例示的なtracrRNA(例えば、S.pyogenes、黄色ブドウ球菌などからのtracrRNA)配列に対して少なくとも約60%同一である核酸を指す場合がある。例えば、tracrRNA配列は、少なくとも6つの連続するヌクレオチドのストレッチにわたって、野生型の例示的なtracrRNA(例えばS.pyogenes、黄色ブドウ球菌などからのtracrRNA)配列に対して少なくとも約60%同一、少なくとも約65%同一、少なくとも約である70%同一、少なくとも約である75%同一、少なくとも約である80%同一、少なくとも約である85%同一、少なくとも約である90%同一、少なくとも約である95%同一、少なくとも約である98%、少なくとも約99%同一、または100%同一である場合がある。II型tracrRNA配列は、隣接したCRISPRアレイ中の反復配列の一部に相補性を有する領域を同定することによって、ゲノム配列上で予測することができる。 The terms "tracrRNA" or "tracr sequence," as used herein, generally refer to wild-type exemplary tracrRNA sequences (e.g., tracrRNA from S. pyogenes, Staphylococcus aureus, etc., or 5476-5511) at least about 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, or 100% sequence identity tracrRNA sequence may refer to a nucleic acid having a tracrRNA sequence similar to its wild-type exemplary tracrRNA sequence. tracrRNA is up to about 5%, 10%, 20%, 30%, 40%, 50%, relative to wild type exemplary tracrRNA sequences (e.g., tracrRNA from S. pyogenes, Staphylococcus aureus, etc.) It may refer to a nucleic acid having 60%, 70%, 80%, 90%, or 100% sequence identity and/or a sequence similar to its wild type exemplary tracrRNA sequence. tracrRNA may refer to modified forms of tracrRNA that include nucleotide changes such as deletions, insertions, or substitutions, variants, mutations, or chimeras. When tracrRNA refers to a nucleic acid that is at least about 60% identical to a wild-type exemplary tracrRNA (e.g., tracrRNA from S. pyogenes, Staphylococcus aureus, etc.) sequence over a stretch of at least 6 contiguous nucleotides. There is. For example, a tracrRNA sequence is at least about 60% identical to a wild-type exemplary tracrRNA (e.g., tracrRNA from S. pyogenes, S. aureus, etc.) sequence over a stretch of at least 6 contiguous nucleotides, at least about % identical, at least about 70% identical, at least about 75% identical, at least about 80% identical, at least about 85% identical, at least about 90% identical, at least about 95% identical , at least about 98%, at least about 99% identical, or 100% identical. Type II tracrRNA sequences can be predicted on a genomic sequence by identifying regions that have complementarity to portions of repeat sequences in adjacent CRISPR arrays.

本明細書で使用されるように、「ガイド核酸」は一般に、別の核酸にハイブリダイズすることができる核酸を指す場合がある。ガイド核酸はRNAであることがある。ガイド核酸はDNAであることがある。ガイド核酸は、核酸の配列に部位特異的に結合するようにプログラムされてもよい。標的とされた核酸または標的核酸は、ヌクレオチドを含むことがある。ガイド核酸はヌクレオチドを含むことがある。標的核酸の一部は、ガイド核酸の一部に相補的であり得る。ガイド核酸に相補的であり、そのガイド核酸とハイブリダイズする二本鎖標的ポリヌクレオチドの鎖は、相補鎖と呼ばれることがある。相補鎖に相補的であり、したがって、ガイド核酸に相補的でない場合がある二本鎖標的ポリヌクレオチドの鎖は、非相補鎖(noncomplementary strand)と呼ばれることがある。ガイド核酸は、1つのポリヌクレオチド鎖を含む場合があり、「単一ガイド核酸(single guide nucleic acid)」と呼ばれることがある。ガイド核酸は、2つのポリヌクレオチド鎖を含む場合があり、「二重ガイド核酸(double guide nucleic acid)」と呼ばれることがある。特に明記しない限り、「ガイド核酸」との用語は包括的であり、単一ガイド核酸および二重ガイド核酸の両方を指す場合がある。ガイド核酸は、「核酸を標的とするセグメント」または「核酸を標的とする配列」と呼ばれることがある、セグメントを含んでいてもよい。核酸を標的とするセグメントは、「タンパク質結合セグメント」または「タンパク質結合配列」または「Casタンパク質結合セグメント」と呼ばれることがあるサブセグメントを含んでいてもよい。 As used herein, "guide nucleic acid" may generally refer to a nucleic acid that is capable of hybridizing to another nucleic acid. The guide nucleic acid may be RNA. The guide nucleic acid may be DNA. A guide nucleic acid may be programmed to site-specifically bind to a sequence of nucleic acids. A targeted or target nucleic acid may include nucleotides. Guide nucleic acids may include nucleotides. A portion of the target nucleic acid may be complementary to a portion of the guide nucleic acid. The strand of a double-stranded target polynucleotide that is complementary to and hybridizes to a guide nucleic acid is sometimes referred to as the complementary strand. A strand of a double-stranded target polynucleotide that is complementary to a complementary strand and therefore may not be complementary to a guide nucleic acid may be referred to as a non-complementary strand. A guide nucleic acid may include one polynucleotide strand and may be referred to as a "single guide nucleic acid." A guide nucleic acid may include two polynucleotide strands and is sometimes referred to as a "double guide nucleic acid." Unless otherwise specified, the term "guide nucleic acid" is inclusive and may refer to both single and dual guide nucleic acids. A guide nucleic acid may include a segment, sometimes referred to as a "nucleic acid targeting segment" or "nucleic acid targeting sequence." Nucleic acid targeting segments may include subsegments sometimes referred to as "protein binding segments" or "protein binding sequences" or "Cas protein binding segments."

2つ以上の核酸あるいはポリペプチド配列の文脈において、「配列同一性」または「パーセント同一性」との用語は一般に、2つ(例えば、ペアワイズアラインメント)、またはそれ以上(例えば、多重配列アライメント)の配列を指し、それらの配列は、配列比較アルゴリズムを使用して測定されるように、局所的または全体的な比較ウィンドウにわたる最大の対応のために比較または整列されたとき、同じであるか、あるいは同じアミノ酸残基またはヌクレオチドの指定された割合を有する。ポリペプチド配列に適切な配列比較アルゴリズムには、例えば、3のwordlength(W)、10のexpectation(E)、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリックスのパラメータを使用する、および30の残基よりも長いポリペプチド配列の条件付き組成スコアマトリックス調整(conditional compositional score matrix adjustment)を使用するBLASTP;2のwordlength(W)、1000000のexpectation(E)のパラメータ、および30残基未満の配列に対してギャップを開くために9で、ギャップを拡張するために1でギャップコストを設定するPAM30スコアリングマトリックスを使用するBLASTP(これらは、https://blast.ncbi.nlm.nih.govで利用可能なBLAST suiteにおけるBLASTPのデフォルトパラメータである);パラメータを用いるCLUSTALW;2のmatch、-1のmismatch、および-1のgapのパラメータを用いるSmith-Waterman相同性検索アルゴリズム;デフォルトパラメータを用いるMUSCLE;2のretreeおよび1000のmaxiterationsのパラメータを用いるMAFFT;デフォルトパラメータを用いるNovafold;デフォルトパラメータを用いるHMMER hmmalignが含まれる。 In the context of two or more nucleic acid or polypeptide sequences, the term "sequence identity" or "percent identity" generally refers to the relationship between two (e.g., pairwise alignments) or more (e.g., multiple sequence alignments). Refers to sequences that are the same when compared or aligned for maximum correspondence over a local or global comparison window, as determined using a sequence comparison algorithm, or Having a specified percentage of the same amino acid residues or nucleotides. Sequence comparison algorithms suitable for polypeptide sequences use, for example, the parameters of the BLOSUM62 scoring matrix, which sets the gap cost at wordlength (W) of 3, expectation (E) of 10, and existence of 11, extension of 1. and BLASTP using conditional compositional score matrix adjustment for polypeptide sequences longer than 30 residues; wordlength (W) of 2, expectation (E) parameters of 1000000. , and 30 BLASTP using a PAM30 scoring matrix that sets the gap cost at 9 to open gaps for sequences with less than a residue and 1 to extend gaps (these are available at https://blast.ncbi.nlm (default parameters for BLASTP in the BLAST suite available at .nih.gov); CLUSTALW with parameters; Smith-Waterman homology search algorithm with parameters of match of 2, mismatch of -1, and gap of -1; Includes: MUSCLE with default parameters; MAFFT with parameters of retree of 2 and maximizations of 1000; Novafold with default parameters; HMMER hmmalign with default parameters.

本明細書で使用されるように、「RuvC_IIIドメイン」との用語は一般に、RuvCエンドヌクレアーゼドメイン(3つの不連続セグメントであるRuvC_I、RuvC_II、およびRuvC_IIIで構成されているRuvCヌクレアーゼドメイン)の3つ目の不連続セグメントを指す。RuvCドメインまたはそのセグメントは一般に、既知のドメイン配列に対するアラインメント、注釈されたドメインを有するタンパク質に対する構造アラインメントによって、あるいは、既知のドメイン配列に基づいて構築された隠れマルコフモデル(HMM)(例えば、RuvC_IIIではPfam HMM PF18541)との比較によって、同定することができる。 As used herein, the term "RuvC_III domain" generally refers to the three RuvC endonuclease domains (the RuvC nuclease domain, which is composed of three discrete segments, RuvC_I, RuvC_II, and RuvC_III). Refers to discrete segments of the eye. RuvC domains or segments thereof are generally constructed by alignment to known domain sequences, structural alignment to proteins with annotated domains, or by hidden Markov models (HMMs) constructed based on known domain sequences (e.g., in RuvC_III). Pfam HMM PF18541).

本明細書で使用されるように、「HNHドメイン」との用語は一般に、特徴的なヒスチジンおよびアスパラギン残基を有するエンドヌクレアーゼドメインを指す。HNHドメインは一般に、既知のドメイン配列に対するアラインメント、注釈されたドメインを有するタンパク質に対する構造アラインメントによって、あるいは、既知のドメイン配列に基づいて構築された隠れマルコフモデル(HMM)(例えば、ドメインHNHではPfam HMM PF01844)との比較によって同定することができる。 As used herein, the term "HNH domain" generally refers to an endonuclease domain that has the characteristic histidine and asparagine residues. HNH domains are generally constructed by alignment to known domain sequences, structural alignment to proteins with annotated domains, or by hidden Markov models (HMMs) constructed based on known domain sequences (e.g., Pfam HMM for domain HNH). It can be identified by comparison with PF01844).

概要 overview

特有の機能および構造を有する新しいCas酵素の発見は、デオキシリボ核酸(DNA)編集技術をさらに混乱させる(disrupt)可能性を提示し、速度、特異性、機能性、および使いやすさを改善することができる。微生物における、クラスター化して規則的な配置の短い回文配列リピート(CRISPR)システムの予測された有病率(prevalence)および多種多様な微生物種と比較して、機能的に特徴づけられたCRISPR/Cas酵素は、文献には比較的ほとんど存在しない。これは部分的に、莫大な数の微生物種が実験室条件で容易に培養されない可能性があるためである。多くの微生物種を表す自然環境的ニッチからのメタゲノム配列決定により、既知の新しいCRISPR/Casシステムの数が急激に増加し、新しいオリゴヌクレオチド編集機能の発見が促進される可能性が提示され得る。そのようなアプローチの有益さの最近の例は、天然微生物群のメタゲノム解析からのCasX/CasY CRISPRシステムの2016年の発見によって示される。 The discovery of new Cas enzymes with unique functions and structures offers the potential to further disrupt deoxyribonucleic acid (DNA) editing technologies, improving speed, specificity, functionality, and ease of use. I can do it. The predicted prevalence of clustered regularly spaced short palindromic repeat (CRISPR) systems in microorganisms and the functionally characterized CRISPR/CRISPR systems compared to a wide variety of microbial species. Cas enzymes are relatively absent from the literature. This is partly because a vast number of microbial species may not be easily cultured in laboratory conditions. Metagenomic sequencing from natural environmental niches representing many microbial species may present the potential to rapidly increase the number of known new CRISPR/Cas systems and facilitate the discovery of new oligonucleotide editing functions. A recent example of the usefulness of such approaches is shown by the 2016 discovery of the CasX/CasY CRISPR system from metagenomic analysis of natural microbial communities.

CRISPR/Casシステムは、微生物中の適応免疫系として機能すると説明されている、RNA指向性ヌクレアーゼ複合体である。それらの自然な文脈では、CRISPR/CasシステムがCRISPR(クラスター化して規則的な配置の短い回文配列リピート)オペロンまたは遺伝子座に生じ、これは一般に2つの部分:(i)RNAベースの標的化要素をコードする、等しく短いスペーサー配列によって分離された短い反復配列のアレイ(30-40bp)と;(ii)アクセサリータンパク質/アクセサリー酵素とともに、RNAベースの標的化要素によって向けられたヌクレアーゼポリペプチドをコードするCasをコードするORFとを含む。特定の標的核酸配列の効率的なヌクレアーゼ標的化は一般に、(i)標的の最初の6~8の核酸(標的シード(target seed))とcrRNAガイドとの間の相補的なハイブリダイゼーションと;(ii)標的シードの定義された近傍内のプロトスペーサー隣接モチーフ(PAM)配列の存在(PAMは一般に、宿主ゲノム内では一般的に表されない配列である)との両方を必要とする。上記システムの正確な機能および構成に応じて、CRISPR-Casシステムは、共有される機能特性および進化の類似性に基づいて、2つのクラス、5つの型、および16の亜型へと一般的に組織化される。 The CRISPR/Cas system is an RNA-directed nuclease complex that has been described to function as an adaptive immune system in microorganisms. In their natural context, CRISPR/Cas systems arise in CRISPR (Clustered Regularly Arranged Short Palindromic Repeats) operons or loci, which generally have two parts: (i) RNA-based targeting; an array of short repeat sequences (30-40 bp) separated by equally short spacer sequences encoding elements; (ii) encoding nuclease polypeptides, along with accessory proteins/enzymes, targeted by RNA-based targeting elements; ORF encoding Cas. Efficient nuclease targeting of a particular target nucleic acid sequence generally involves (i) complementary hybridization between the first 6 to 8 nucleic acids of the target (target seed) and a crRNA guide; ii) the presence of a protospacer adjacent motif (PAM) sequence within a defined vicinity of the target seed (PAM is generally a sequence that is not commonly represented within the host genome). Depending on the exact functionality and configuration of the system, CRISPR-Cas systems are generally divided into two classes, five types, and sixteen subtypes based on shared functional characteristics and evolutionary similarities. Be organized.

クラスIのCRISPR-Casシステムは、大きなマルチサブユニットエフェクター複合体を有しており、I型、III型、およびIV型を含む。 Class I CRISPR-Cas systems have large multi-subunit effector complexes and include types I, III, and IV.

I型のCRISPR-Casシステムは、構成要素の観点から中程度の複雑さであると考えられる。I型のCRISPR-Casシステムでは、RNAを標的とする要素のアレイは長い前駆体crRNA(プレcrRNA)として転写され、これは反復要素で処理されて、短く成熟したcrRNAを遊離し、この短く成熟したcrRNAは、それらの後にプロトスペーサー隣接モチーフ(PAM)と呼ばれる適切な短いコンセンサス配列が続くと、ヌクレアーゼ複合体を核酸標的に向ける。この処理は、カスケードと呼ばれる大きなエンドヌクレアーゼ複合体のエンドリボヌクレアーゼサブユニット(Cas6)を介して行われ、これはさらに、crRNA指向性ヌクレアーゼ複合体のヌクレアーゼ(Cas3)タンパク質成分を含む。Cas Iヌクレアーゼは、DNAヌクレアーゼとして主に機能する。 Type I CRISPR-Cas systems are considered to be of moderate complexity in terms of components. In type I CRISPR-Cas systems, an array of RNA-targeting elements is transcribed as long precursor crRNAs (pre-crRNAs), which are processed with repeating elements to release short, mature crRNAs, and this short, mature The crRNAs, when followed by an appropriate short consensus sequence called the protospacer adjacent motif (PAM), direct the nuclease complex to the nucleic acid target. This processing occurs through the endoribonuclease subunit (Cas6) of a large endonuclease complex called the cascade, which further includes the nuclease (Cas3) protein component of the crRNA-directed nuclease complex. Cas I nuclease functions primarily as a DNA nuclease.

III型のCRISPRシステムは、CsmまたはCmrのタンパク質サブユニットを含むリピート関連ミステリアスタンパク質(repeat-associated mysterious protein)(RAMP)とともに、Cas10として知られる中央ヌクレアーゼの存在を特徴とする場合がある。I型のシステムのように、成熟したcrRNAは、Cas6のような酵素を使用してプレcrRNAから処理される。I型およびII型のシステムとは異なり、III型のシステムは、DNA-RNA二重鎖(RNAポリメラーゼの鋳型として使用されるDNA鎖など)を標的とし、切断するように思われる。 Type III CRISPR systems may be characterized by the presence of a central nuclease known as Cas10, along with repeat-associated mysterious proteins (RAMPs) that include the Csm or Cmr protein subunits. As in type I systems, mature crRNA is processed from pre-crRNA using enzymes such as Cas6. Unlike type I and type II systems, type III systems appear to target and cleave DNA-RNA duplexes, such as the DNA strand used as a template for RNA polymerase.

IV型のCRISPR-Casシステムは、高度に還元された(highly reduced)大サブユニットヌクレアーゼ(csf1)と、Cas5(csf3)とCas7(csf2)の群のRAMPタンパク質の2つの遺伝子と、場合によっては、予測された小サブユニットの1つの遺伝子とからなるエフェクター複合体を持ち;そのようなシステムは一般的に、内因性のプラスミド上で見られる。 The type IV CRISPR-Cas system involves two genes: the highly reduced large subunit nuclease (csf1) and the RAMP proteins of the Cas5 (csf3) and Cas7 (csf2) groups, and in some cases , has an effector complex consisting of one gene of the predicted small subunit; such systems are commonly found on endogenous plasmids.

クラスIIのCRISPR-Casシステムは一般に、単一のポリペプチドのマルチドメインヌクレアーゼエフェクターを有しており、II型、V型、およびVI型を含む。 Class II CRISPR-Cas systems generally have single polypeptide multi-domain nuclease effectors and include types II, V, and VI.

II型のCRISPR-Casシステムは、構成要素の観点から最も単純であると考えられる。II型のCRISPR-Casシステムでは、CRISPRアレイを成熟したcrRNAに処理するには、アレイ反復配列に相補的な領域を有する小さなトランスコードされた(trans-encoded)crRNA(tracrRNA)ではなく、特別なエンドヌクレアーゼサブユニットの存在が必要となり;tracrRNAは、その対応するエフェクターヌクレアーゼ(例えば、Cas9)と反復配列の両方と相互作用することで前駆体dsRNA構造を形成し、この前駆体dsRNA構造は、内因性のRNAse IIIによって切断されて、tracrRNAとcrRNAの両方がロードされた成熟したエフェクター酵素を生成する。Cas IIヌクレアーゼはDNAヌクレアーゼとして知られている。2型エフェクターは一般に、無関係なHNHヌクレアーゼドメインがRuvC様ヌクレアーゼドメインのフォールド内に挿入されたRNase Hフォールドを採用する、RuvC様エンドヌクレアーゼドメインからなる構造を示す。RuvC様ドメインは、標的(例えば、crRNA相補的な)DNA鎖の切断の原因となり、一方で、HNHドメインは置換されたDNA鎖の切断の原因となる。 Type II CRISPR-Cas systems are considered the simplest from a component standpoint. In type II CRISPR-Cas systems, CRISPR arrays are processed into mature crRNAs using specialized rather than small trans-encoded crRNAs (tracrRNAs) with complementary regions to the array repeats. The presence of an endonuclease subunit is required; tracrRNA interacts with both its corresponding effector nuclease (e.g., Cas9) and repeat sequences to form a precursor dsRNA structure, which tracrRNA and crRNA to produce a mature effector enzyme loaded with both tracrRNA and crRNA. Cas II nuclease is known as DNA nuclease. Type 2 effectors generally exhibit a structure consisting of a RuvC-like endonuclease domain that adopts an RNase H fold in which an unrelated HNH nuclease domain is inserted within the fold of the RuvC-like nuclease domain. The RuvC-like domain is responsible for cleavage of the target (eg, crRNA-complementary) DNA strand, while the HNH domain is responsible for cleavage of the displaced DNA strand.

V型のCRISPR-Casシステムは、RuvC様ドメインを含む、II型エフェクターのヌクレアーゼエフェクターと類似するヌクレアーゼエフェクター(例えば、Cas12)構造を特徴とする。II型と同様に、ほとんどの(しかし、すべてでない)V型のCRISPRシステムは、プレcrRNAを成熟したcrRNAへと処理するためにtracrRNAを使用する;しかし、プレcrRNAを切断して複数のcrRNAにするためにRNAse IIIを必要とするII型のシステムとは異なり、V型のシステムは、プレcrRNAを切断するために、エフェクターヌクレアーゼそれ自体を使用することができる。II型のCRISPR-Casシステムと同様に、V型のCRISPR-CasシステムはDNAヌクレアーゼとしても知られている。II型のCRISPR-Casシステムとは異なり、いくつかのV型酵素(例えば、Cas12a)は、二本鎖標的配列の第1のcrRNA指向性切断によって活性化される、頑強な一本鎖の非特異的なデオキシリボヌクレアーゼ活性を有するように思われる。 Type V CRISPR-Cas systems are characterized by a nuclease effector (eg, Cas12) structure that is similar to that of type II effectors, including a RuvC-like domain. Similar to type II, most (but not all) type V CRISPR systems use tracrRNA to process pre-crRNA into mature crRNA; however, they cleave pre-crRNA into multiple crRNAs. Unlike the type II system, which requires RNAse III to cleave the pre-crRNA, the type V system can use the effector nuclease itself to cleave the pre-crRNA. Like the type II CRISPR-Cas system, the type V CRISPR-Cas system is also known as a DNA nuclease. Unlike the type II CRISPR-Cas system, some type V enzymes (e.g., Cas12a) generate robust single-stranded non-transferases that are activated by the first crRNA-directed cleavage of the double-stranded target sequence. It appears to have specific deoxyribonuclease activity.

VI型のCRIPSR-Casシステムは、RNAガイドRNAエンドヌクレアーゼ(RNA-guided RNA endonucleases)を有する。RuvC様ドメインの代わりに、VI型のシステム(例えば、Cas13)の単一のポリペプチドエフェクターは、2つのHEPNリボヌクレアーゼドメインを含む。II型およびV型のシステムの両方とは異なり、VI型のシステムは、プレcrRNAをcrRNAへと処理するために、tracrRNAを必要としないように思われる。しかし、V型のシステムと同様に、いくつかのVI型のシステム(例えば、C2C2)は、標的RNAの第1のcrRNA指向性切断によって活性化された、頑強な一本鎖の非特異的ヌクレアーゼ(リボヌクレアーゼ)活性を持つように思われる。 The type VI CRIPSR-Cas system has RNA-guided RNA endonucleases. Instead of RuvC-like domains, single polypeptide effectors of type VI systems (eg, Cas13) contain two HEPN ribonuclease domains. Unlike both type II and type V systems, type VI systems do not appear to require tracrRNA to process pre-crRNA into crRNA. However, similar to type V systems, some type VI systems (e.g., C2C2) utilize a robust single-stranded, nonspecific nuclease activated by the first crRNA-directed cleavage of the target RNA. It appears to have (ribonuclease) activity.

クラスIIのCRISPR-Casは、そのより単純な構造ゆえに、デザイナーヌクレアーゼ(designer nuclease)/ゲノム編集用途として、エンジニアリングおよび開発のために最も広く採用されている。 Class II CRISPR-Cas has been most widely adopted for engineering and development as designer nuclease/genome editing applications due to its simpler structure.

インビトロでの使用のためのそのようなシステムの初期の適応のうちの1つは、Jinekら(Science.2012 Aug 17;337(6096):816-2、これは参照によって完全に本明細書に組み込まれる)において見ることができる。Jinekの試験では、(i)S.pyogenes SF370から単離された、組換え的に(recombinantly)発現されて精製された完全長のCas9(例えば、クラスIIのII型Cas酵素)、(ii)切断されることが望まれる標的DNA配列に相補的な~20nt5’配列と、それに続く3’tracr結合配列とを有する、精製された成熟~42nt crRNA(crRNA全体が、T7プロモーター配列を有する合成DNA鋳型からインビトロで転写される);(iii)T7プロモーター配列を有する合成DNA鋳型からインビトロで転写された、精製されたtracrRNA、および(iv)Mg2+を含むシステムが最初に説明された。Jinekは、その後、改善された操作されたシステムを説明し、そのシステムでは、それ自体でCas9を標的に向けることができる単一の融合された合成ガイドRNA(sgRNA)を形成するために、(ii)のcrRNAが、リンカー(例えば、GAAA)によって、(iii)の5’末端に結合される(図2の上パネルと下パネルを比較する)。 One of the early adaptations of such a system for in vitro use was by Jinek et al. (Science. 2012 Aug 17;337(6096):816-2, which is fully incorporated herein by reference. (incorporated). In Jinek's test, (i) S. recombinantly expressed and purified full-length Cas9 (e.g., a type II Cas enzyme of class II) isolated from P. pyogenes SF370, (ii) the target DNA sequence desired to be cleaved; Purified mature ~42 nt crRNA with a ~20 nt 5' sequence complementary to , followed by a 3' tracr binding sequence (the entire crRNA is transcribed in vitro from a synthetic DNA template with a T7 promoter sequence); A system containing iii) purified tracrRNA transcribed in vitro from a synthetic DNA template with a T7 promoter sequence, and (iv) Mg2+ was first described. Jinek then described an improved engineered system in which ( The crRNA of ii) is joined to the 5' end of (iii) by a linker (eg GAAA) (compare upper and lower panels of Figure 2).

Maliら(Science.2013 Feb 15;339(6121):823-826.)(これは、参照により完全に本明細書に組み込まれる)は、その後、(i)C末端の核局在化配列(例えば、SV40 NLS)および適切なポリアデニル化シグナル(例えば、TK pAシグナル)を有する適切な哺乳動物プロモーター下で、コドン最適化Cas9(例えば、クラスIIのII型Cas酵素)をコードするORFと;(ii)適切なポリメラーゼIIIプロモーター(例えば、U6プロモーター)下でsgRNAをコードするORF(Gで始まる5’配列と、それに続く相補的な標的化核酸配列の20ntと、それに結合した3’tracr結合配列と、リンカーと、tracrRNA配列とを有する)とをコードするDNAベクターを提供することによって、哺乳動物細胞で使用するためにこのシステムを適合させた。 Mali et al. (Science. 2013 Feb 15; 339(6121):823-826.), which is fully incorporated herein by reference, then (i) added a C-terminal nuclear localization sequence ( with an ORF encoding a codon-optimized Cas9 (e.g., a type II Cas enzyme of class II) under a suitable mammalian promoter with an appropriate polyadenylation signal (e.g., TK pA signal); ii) an ORF encoding an sgRNA under a suitable polymerase III promoter (e.g. U6 promoter) (5' sequence starting with G followed by 20 nt of complementary targeting nucleic acid sequence and a 3' tracr binding sequence linked thereto) This system was adapted for use in mammalian cells by providing a DNA vector encoding a tracrRNA sequence, a linker, and a tracrRNA sequence.

MG1酵素 MG1 enzyme

一態様では、本開示は、(a)エンドヌクレアーゼを含む操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼはCasエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型のクラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼはRuvC_IIIドメインを含む場合があり、ここで、前記RuvC_IIIドメインは、配列番号:1827-2140のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼはRuvC_IIIドメインを含む場合があり、ここで、上記RuvC_IIIドメインは、配列番号:1827-2140.のいずれか1つに対して少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼはRuvC_IIIドメインを含む場合があり、ここで、配列番号:1827-2140のいずれか1つに実質的に同一である。エンドヌクレアーゼは、配列番号:1827-1831のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:1827-1831のいずれか1つに対して少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:1827-1831のいずれか1つと実質的に同一のRuvC_IIIドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:1827に対して少なくとも約70%、、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:1828に対して少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:1829に対して少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:1830に対して少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:1831に対して少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含む場合がある。 In one aspect, the present disclosure provides an engineered nuclease system that includes (a) an endonuclease. In some cases, the endonuclease is a Cas endonuclease. In some cases, the endonuclease is a type II class II Cas endonuclease. The endonuclease may include a RuvC_III domain, where the RuvC_III domain has at least about 70% sequence identity to any one of SEQ ID NOs: 1827-2140. In some cases, the endonuclease may include a RuvC_III domain, where the RuvC_III domain is SEQ ID NO: 1827-2140. at least about 20%, at least about 25%, at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99% identical. In some cases, the endonuclease may include a RuvC_III domain, where the endonuclease is substantially identical to any one of SEQ ID NOs: 1827-2140. The endonuclease may include a RuvC_III domain having at least about 70% sequence identity to any one of SEQ ID NOs: 1827-1831. In some cases, the endonuclease is at least about 20%, at least about 25%, at least about 30%, at least about 35%, at least about 40%, at least about 45% of any one of SEQ ID NOs: 1827-1831. %, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91% %, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99% identity. There are cases. In some cases, the endonuclease includes a RuvC_III domain substantially identical to any one of SEQ ID NOs: 1827-1831. In some cases, the endonuclease is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92% of SEQ ID NO: 1827. , at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99% identity. In some cases, the endonuclease is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, relative to SEQ ID NO: 1828. It may include RuvC_III domains having at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99% identity. In some cases, the endonuclease is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, relative to SEQ ID NO: 1829. It may include RuvC_III domains having at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99% identity. In some cases, the endonuclease is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, relative to SEQ ID NO: 1830. It may include RuvC_III domains having at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99% identity. In some cases, the endonuclease is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, relative to SEQ ID NO: 1831. It may include RuvC_III domains having at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99% identity.

エンドヌクレアーゼは、配列番号:3638-3955のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:3638-3955のいずれか1つに対して少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3638-3955のいずれか1つと実質的に同一のHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3638-3955のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:3638-3955のいずれか1つに対して少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3638-3955のいずれか1つと実質的に同一のHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3638-3641のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:3638-3641のいずれか1つに対して少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3638-3641のいずれか1つと実質的に同一のHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3638のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:3638のいずれか1つに対して少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3638のいずれか1つと実質的に同一のHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3639のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:3639のいずれか1つに対して少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3639のいずれか1つと実質的に同一のHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3640のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:3640のいずれか1つに対して少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3640のいずれか1つと実質的に同一のHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3641のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:3641のいずれか1つに対して少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3641のいずれか1つと実質的に同一のHNHドメインを含む場合がある。 The endonuclease may include an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 3638-3955. In some cases, the endonuclease is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91% of any one of SEQ ID NOs: 3638-3955. %, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99%. May include. The endonuclease may contain an HNH domain substantially identical to any one of SEQ ID NOs: 3638-3955. The endonuclease may include an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 3638-3955. In some cases, the endonuclease is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91% of any one of SEQ ID NOs: 3638-3955. %, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99%. May include. The endonuclease may contain an HNH domain substantially identical to any one of SEQ ID NOs: 3638-3955. The endonuclease may include an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 3638-3641. In some cases, the endonuclease is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91% of any one of SEQ ID NOs: 3638-3641. %, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99%. May include. The endonuclease may contain an HNH domain substantially identical to any one of SEQ ID NOs: 3638-3641. The endonuclease may include an HNH domain having at least about 70% identity to any one of SEQ ID NO:3638. In some cases, the endonuclease is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91%, HNH domains having at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity There is. The endonuclease may contain an HNH domain substantially identical to any one of SEQ ID NO:3638. The endonuclease may include an HNH domain having at least about 70% identity to any one of SEQ ID NO:3639. In some cases, the endonuclease is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91%, HNH domains having at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity There is. The endonuclease may contain an HNH domain substantially identical to any one of SEQ ID NO:3639. The endonuclease may include an HNH domain having at least about 70% identity to any one of SEQ ID NO:3640. In some cases, the endonuclease is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91%, HNH domains having at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity There is. The endonuclease may contain an HNH domain substantially identical to any one of SEQ ID NO:3640. The endonuclease may include an HNH domain having at least about 70% identity to any one of SEQ ID NO:3641. In some cases, the endonuclease is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91%, HNH domains having at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity There is. The endonuclease may contain an HNH domain substantially identical to any one of SEQ ID NO:3641.

場合によっては、エンドヌクレアーゼは、配列番号:1-6あるいは9-319のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:1-6あるいは9-319のいずれか1つと実質的に同一である場合がある。場合によっては、エンドヌクレアーゼは、配列番号:1-4のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:1-4のいずれか1つと実質的に同一の場合がある。場合によっては、エンドヌクレアーゼは、配列番号:5615、5616、あるいは5617のいずれか1つと実質的に同一のペプチドモチーフを含む場合がある。 In some cases, the endonuclease is at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50% of any one of SEQ ID NO: 1-6 or 9-319. , at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96% , at least about 97%, at least about 98%, or at least about 99%. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NO: 1-6 or 9-319. In some cases, the endonuclease is at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55% of any one of SEQ ID NO: 1-4. %, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97% %, at least about 98%, or at least about 99%. In some cases, the endonuclease is substantially identical to any one of SEQ ID NOs: 1-4. In some cases, the endonuclease may include a peptide motif substantially identical to any one of SEQ ID NOs: 5615, 5616, or 5617.

場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有する変異体を含むことがある。NLSは、前記エンドヌクレアーゼのN末端またはC末端の近位にあり得る。NLSは、配列番号:1-6あるいは9-319のいずれか1つのN末端あるいはC末端に付加され得るか、あるいは、配列番号:1-319のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体のN末端あるいはC末端に付加され得る。NLSはSV40ラージT抗原NLSである場合がある。NLSはc-myc NLSである場合がある。NLSは、配列番号:5593-5608のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含む場合がある。NLSは、配列番号:5593-5608のいずれか1つと実質的に同一の配列を含む場合がる。NLSは、下記の表1中の配列のいずれか、またはその組み合わせを含み得る。 In some cases, the endonuclease may include a variant with one or more nuclear localization sequences (NLS). The NLS may be proximal to the N-terminus or C-terminus of the endonuclease. NLS can be added to the N-terminus or C-terminus of any one of SEQ ID NO: 1-6 or 9-319, or at least about 30% to any one of SEQ ID NO: 1-319, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, Added to the N-terminus or C-terminus of a variant with at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity can be done. The NLS may be the SV40 large T antigen NLS. The NLS may be a c-myc NLS. Where the NLS comprises a sequence having at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 99% identity to any one of SEQ ID NOs: 5593-5608 There is. The NLS may include a sequence substantially identical to any one of SEQ ID NOs: 5593-5608. The NLS may include any of the sequences in Table 1 below, or a combination thereof.

場合によっては、エンドヌクレアーゼは、組換え型であり得る(例えば、大腸菌中の発現とそれに続くエピトープタグ精製などの適切な方法によって、クローン化され、発現され、および精製される)。場合によっては、エンドヌクレアーゼは、配列番号:5592-5595のいずれか1つに対して少なくとも約90%の同一性を有する16S rRNA遺伝子を有する細菌に由来する場合がある。エンドヌクレアーゼは、配列番号:5592-5595のいずれか1つと少なくとも約80%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%同一の16S rRNA遺伝子を有する種に由来する場合がある。エンドヌクレアーゼは、配列番号:5592-5595のいずれか1つと実質的に同一の16S rRNA遺伝子を有する種に由来する場合がある。エンドヌクレアーゼは、Verrucomicrobia門またはCandidatus Peregrinibacteria門に属する細菌に由来する場合がある。 In some cases, the endonuclease may be recombinant (eg, cloned, expressed, and purified by suitable methods, such as expression in E. coli followed by epitope tag purification). In some cases, the endonuclease may be derived from a bacterium that has a 16S rRNA gene that has at least about 90% identity to any one of SEQ ID NOs: 5592-5595. The endonuclease is at least about 80%, at least about 82%, at least about 83%, at least about 84%, at least about 85%, at least about 86%, at least about 87% with any one of SEQ ID NOs: 5592-5595, at least about 88%, at least about 89%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, It may be derived from a species that has a 16S rRNA gene that is at least about 98%, or at least about 99% identical. The endonuclease may be derived from a species having a 16S rRNA gene substantially identical to any one of SEQ ID NOs: 5592-5595. The endonuclease may be derived from bacteria belonging to the phylum Verrucomicrobia or Candidatus Peregrinibacteria.

場合によっては、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、またはSmith-Waterman相同性検索アルゴリズムによって決定され得る。配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータを使用して、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリックスを使用して、および条件付き組成スコアマトリックス調整(conditional compositional score matrix adjustment)を使用して、BLASTPアルゴリズムによって決定される場合がある。 In some cases, sequence identity may be determined by BLASTP, CLUSTALW, MUSCLE, MAFFT, Novafold, or Smith-Waterman homology search algorithms. Sequence identity was determined using the BLOSUM62 scoring matrix using parameters of wordlength (W) of 3, expectation (E) of 10, and gap cost with existence of 11, extension of 1, and conditions. may be determined by the BLASTP algorithm using a conditional compositional score matrix adjustment.

場合によっては、上記のシステムは、(b)所望の切断配列に相補的な5’標的化領域を有するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)を含む場合がある。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合可能なPAM配列を含み得る。場合によっては、標的化領域の最も5’側(5’most nucleotide)のヌクレオチドはGである場合がある。場合によっては、5’標的化領域は15~23ヌクレオチド長である場合がある。ガイド配列およびtracr配列は、別個のリボ核酸(RNA)あるいは単一のリボ核酸(RNA)として供給され得る。ガイドRNAは、標的化領域の3’にcrRNA tracrRNA結合配列を含んでもよい。ガイドRNAは、crRNA tracrRNA結合領域の3’に4-ヌクレオチドリンカーが先行するtracrRNA配列を含んでいてもよい。sgRNAは、5’から3’に:細胞中の標的配列にハイブリダイズすることができる非天然のガイド核酸配列と;tracr配列とを含み得る。場合によっては、非天然ガイド核酸配列およびtracr配列は共有結合される。 Optionally, the system described above comprises (b) at least one engineered synthetic guide ribonucleic acid (sgRNA) capable of forming a complex with an endonuclease having a 5' targeting region complementary to the desired cleavage sequence. ) may be included. In some cases, the 5' targeting region may include a PAM sequence that is compatible with an endonuclease. In some cases, the 5' most nucleotide of the targeting region may be a G. In some cases, the 5' targeting region may be 15-23 nucleotides in length. The guide sequence and tracr sequence can be provided as separate ribonucleic acids (RNA) or as a single ribonucleic acid (RNA). The guide RNA may include a crRNA tracrRNA binding sequence 3' of the targeting region. The guide RNA may include a tracrRNA sequence preceded by a 4-nucleotide linker 3' of the crRNA tracrRNA binding region. The sgRNA may include, 5' to 3': a non-natural guide nucleic acid sequence capable of hybridizing to a target sequence in a cell; and a tracr sequence. In some cases, the non-natural guide nucleic acid sequence and the tracr sequence are covalently linked.

場合によっては、tracr配列は特定の配列を有する場合がある。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%を有する。tracr配列は、配列番号:5476-5489のいずれか1つの少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%の配列同一性を有することがある。場合によっては、tracrRNAは、配列番号:5476-5489のいずれか1つの少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する場合がある。場合によっては、tracrRNAは、配列番号:5476-5489のいずれか1つの少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドと実質的に同一である場合がある。tracrRNAは、配列番号:5476-5489のいずれかを含む場合がある。 In some cases, the tracr sequence may have a specific sequence. A tracr sequence comprises at least about 60 to 100 (e.g., at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) contiguous nucleotides of a natural tracr RNA sequence. at least about 80%. The tracr sequence has at least about 60 to 100 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) contiguous nucleotides of at least about 80%. In some cases, the tracrRNA is at least about 60-90 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) contiguous nucleotides, at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about They may have 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. In some cases, the tracrRNA is at least about 60-100 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90 contiguous nucleotides. tracrRNA may include any of SEQ ID NOs: 5476-5489.

場合によっては、エンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号:5461-5464のいずれか1つに対して少なくとも約80%の同一性を有する配列を含む場合がある。sgRNAは、配列番号:5461-5464のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含む場合がる。sgRNAは、配列番号:5461-5464のいずれか1つと実質的に同一の配列を含む場合がある。 Optionally, the at least one engineered synthetic guide ribonucleic acid (sgRNA) capable of forming a complex with an endonuclease is at least about 80% identical to any one of SEQ ID NOs: 5461-5464. may contain sequences with a The sgRNA is at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94% of any one of SEQ ID NOs: 5461-5464. %, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99%. The sgRNA may include a sequence substantially identical to any one of SEQ ID NOs: 5461-5464.

場合によっては、上記のシステムは、標的DNA遺伝子座における切断のために第1の領域および第2の領域を標的とする2つの異なるsgRNAを含む場合があり、ここで、第2の部位は第1の部位の3’である。場合によっては、上記のシステムは、5’~3’まで、第1の領域の5’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、あるいは1kb)のヌクレオチドの配列を含む第1の相同性アームと、少なくとも約10のヌクレオチドの合成DNA配列と、第2の領域の3’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、あるいは1kb)のヌクレオチドの配列を含む第2の相同性アームとを含む、一本鎖または二本鎖のDNA修復鋳型を含む場合がある。 In some cases, the above system may include two different sgRNAs that target a first region and a second region for cleavage at a target DNA locus, where the second site is It is 3' of part 1. In some cases, the above system includes at least about 20 (e.g., at least about 40, 80, 120, 150, 200, 300, 500, or 1 kb) in the 5' to 3' of the first region. a first homology arm comprising a sequence of nucleotides; a synthetic DNA sequence of at least about 10 nucleotides; and a second homology arm comprising a sequence of 300, 500, or 1 kb) nucleotides.

他の態様では、本開示は、標的核酸遺伝子座を改変するための方法を提供する。上記方法は、酵素および本明細書で開示される少なくとも1つの合成ガイドRNA(sgRNA)を含む、本明細書で開示される非天然のシステムのいずれかを、標的核酸遺伝子座に送達する工程を含み得る。酵素は、少なくとも1つのsgRNAと複合体を形成し、その複合体が標的核酸遺伝子座に結合すると、標的核酸遺伝子座を改変する場合がある。前記遺伝子座に酵素を送達することは、上記システムまたは上記システムをコードする核酸で細胞をトランスフェクトすることを含み得る。前記遺伝子座にヌクレアーゼを送達することは、上記システムまたは上記システムをコードする核酸で細胞を電気穿孔することを含み得る。前記遺伝子座にヌクレアーゼを送達することは、対象の遺伝子座を含む核酸と上記システムを緩衝液中でインキュベートすることを含み得る。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含むことがある。標的核酸遺伝子座は細胞内にあることがある。標的核酸遺伝子座はインビトロであることがある。標的核酸遺伝子座は、真核細胞または原核細胞内にあることがある。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、または植物細胞であることがある。酵素は、対象の標的遺伝子座で、またはその近位で、一本鎖切断または二本鎖切断を引き起こすことがある。 In other aspects, the disclosure provides methods for modifying a target nucleic acid locus. The method comprises delivering any of the non-natural systems disclosed herein, including an enzyme and at least one synthetic guide RNA (sgRNA) disclosed herein, to a target nucleic acid locus. may be included. The enzyme may form a complex with at least one sgRNA and modify the target nucleic acid locus when the complex binds to the target nucleic acid locus. Delivering an enzyme to said genetic locus may include transfecting a cell with said system or a nucleic acid encoding said system. Delivering a nuclease to said genetic locus may include electroporating cells with said system or a nucleic acid encoding said system. Delivering a nuclease to the locus may include incubating the system with a nucleic acid comprising the locus of interest in a buffer. In some cases, the target nucleic acid locus comprises deoxyribonucleic acid (DNA) or ribonucleic acid (RNA). The target nucleic acid locus may include genomic DNA, viral DNA, viral RNA, or bacterial DNA. The target nucleic acid locus may be intracellular. The target nucleic acid locus may be in vitro. The target nucleic acid locus may be within a eukaryotic or prokaryotic cell. The cell may be an animal cell, a human cell, a bacterial cell, an archaeal cell, or a plant cell. Enzymes may cause single-strand breaks or double-strand breaks at or near the target locus of interest.

標的核酸遺伝子座が細胞内にある可能性がある場合、酵素は、配列番号:1827-2140のいずれか1つに対して少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードするオープンリーディングフレームを含有する核酸として供給されてもよい。前記エンドヌクレアーゼをコードするオープンリーディングフレームを含有するデオキシリボ核酸(DNA)は、配列番号:5572-5575のいずれか1つ、または、配列番号:5572-5575のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、あるいは少なくとも約99%の同一性を有するその変異体と実質的に同一の配列を含み得る。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されるプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトβアクチン、CAG、TRE、またはCaMKIIaプロモーターである場合がある。エンドヌクレアーゼは、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含有する、キャップされたmRNAとして供給されてもよい。エンドヌクレアーゼは、翻訳されたポリペプチドとして供給されてもよい。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された前記少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含有するデオキシリボ核酸(DNA)として供給されてもよい。場合によっては、生物を真核生物であってもよい。場合によっては、生物を真菌であってもよい。場合によっては、生物をヒトであってもよい。 If the target nucleic acid locus is likely to be intracellular, the enzyme may be at least about 75% (e.g., at least about 90%, at least about 91%, at least Enzymes having RuvC_III domains having an identity of about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%). It may also be provided as a nucleic acid containing an encoding open reading frame. The deoxyribonucleic acid (DNA) containing the open reading frame encoding the endonuclease is any one of SEQ ID NOs: 5572-5575, or at least about 30% of any one of SEQ ID NOs: 5572-5575. %, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80% %, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99%. may contain an array of Optionally, the nucleic acid includes a promoter to which an open reading frame encoding an endonuclease is operably linked. The promoter may be a CMV, EF1a, SV40, PGK1, Ubc, human β-actin, CAG, TRE, or CaMKIIa promoter. The endonuclease may be supplied as a capped mRNA containing the open reading frame encoding the endonuclease. The endonuclease may be supplied as a translated polypeptide. The at least one engineered sgRNA may be provided as deoxyribonucleic acid (DNA) containing a genetic sequence encoding said at least one engineered sgRNA operably linked to a ribonucleic acid (RNA) pol III promoter. good. In some cases, the organism may be a eukaryote. In some cases, the organism may be a fungus. In some cases, the organism may be a human.

場合によっては、本開示は、本明細書で開示されるシステムを含む発現カセット、または本明細書に記載される核酸を提供し得る。場合によっては、発現カセットまたは核酸はベクターとして供給されてもよい。場合によっては、発現カセット、核酸、またはベクターは、細胞中で供給されてもよい。場合によっては、細胞は、配列番号:5592-5595のいずれか1つに対して少なくとも約90%(例えば、少なくとも約99%)の同一性を有する16S rRNA遺伝子を有する、細菌細胞である。 In some cases, the present disclosure may provide expression cassettes comprising the systems disclosed herein, or the nucleic acids described herein. In some cases, the expression cassette or nucleic acid may be provided as a vector. In some cases, expression cassettes, nucleic acids, or vectors may be provided in cells. In some cases, the cell is a bacterial cell having a 16S rRNA gene that has at least about 90% (eg, at least about 99%) identity to any one of SEQ ID NOs: 5592-5595.

MG2酵素 MG2 enzyme

一態様では、本開示は、(a)エンドヌクレアーゼを含む、操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼはCasエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型のクラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼはRuvC_IIIドメインを含む場合があり、ここで、前記RuvC_IIIドメインは、配列番号:2141-2241のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼはRuvC_IIIドメインを含む場合があり、ここで、RuvC_IIIドメインは、配列番号:2141-2241のいずれか1つに対して少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼはRuvC_IIIドメインを含む場合があり、配列番号:2141-2142のいずれか1つと実質的に同一である。エンドヌクレアーゼは、配列番号:2141-2142のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:2141-2142のいずれか1つに対して少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する、RuvC_IIIドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:2141-2142のいずれか1つと実質的に同一のRuvC_IIIドメインを含む場合がある。 In one aspect, the present disclosure provides an engineered nuclease system that includes (a) an endonuclease. In some cases, the endonuclease is a Cas endonuclease. In some cases, the endonuclease is a type II class II Cas endonuclease. The endonuclease may include a RuvC_III domain, where the RuvC_III domain has at least about 70% sequence identity to any one of SEQ ID NOs: 2141-2241. In some cases, the endonuclease may include a RuvC_III domain, where the RuvC_III domain is at least about 20%, at least about 25%, at least about 30% relative to any one of SEQ ID NOs: 2141-2241. , at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80% , at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98% , having at least about 99% identity. In some cases, the endonuclease may include a RuvC_III domain and is substantially identical to any one of SEQ ID NOs: 2141-2142. The endonuclease may include a RuvC_III domain having at least about 70% sequence identity to any one of SEQ ID NOs: 2141-2142. In some cases, the endonuclease is at least about 20%, at least about 25%, at least about 30%, at least about 35%, at least about 40%, at least about 45% of any one of SEQ ID NOs: 2141-2142. %, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91% %, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99% identity. May include. In some cases, the endonuclease includes a RuvC_III domain substantially identical to any one of SEQ ID NOs: 2141-2142.

エンドヌクレアーゼは、配列番号:3955-4055のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:3955-4055のいずれか1つに対して少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%同一であるHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3955-4055のいずれか1つと実質的に同一のHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3955-3956のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:3955-3956のうちのいずれか1つに対して少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%同一であるHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3955-3956のいずれか1つと実質的に同一のHNHドメインを含む場合がある。 The endonuclease may include an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 3955-4055. In some cases, the endonuclease is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91% of any one of SEQ ID NOs: 3955-4055. %, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identical. There is. The endonuclease may contain an HNH domain substantially identical to any one of SEQ ID NOs: 3955-4055. The endonuclease may include an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 3955-3956. In some cases, the endonuclease is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about any one of SEQ ID NOs: 3955-3956. HNH domains that are about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identical. May include. The endonuclease may contain an HNH domain substantially identical to any one of SEQ ID NOs: 3955-3956.

場合によっては、エンドヌクレアーゼは、配列番号:320-420のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:320-420のいずれか1つと実質的に同一であってもよい。場合によっては、エンドヌクレアーゼは、配列番号:320-321のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:320-321のいずれか1つと実質的に同一であってもよい。 In some cases, the endonuclease is at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about Variants having 97%, at least about 98%, or at least about 99% identity may be included. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 320-420. In some cases, the endonuclease is at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about Variants having 97%, at least about 98%, or at least about 99% identity may be included. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 320-321.

場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有する変異体を含んでもよい。NLSは前記エンドヌクレアーゼのN末端またはC末端の近位であってもよい。NLSは、配列番号:320-420のいずれか1つのN末端またはC末端で、あるいは、配列番号:320-420のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体のN末端またはC末端で付加されてもよい。NLSはSV40ラージT抗原NLSであってもよい。NLSはc-myc NLSであってもよい。NLSは、配列番号:5593-5608のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含むことができる。NLSは配列番号:5593-5608のいずれか1つと実質的に同一の配列を含むことができる。NLSは、表1の配列のいずれか、またはその組み合わせを含むことができる: In some cases, the endonuclease may include a variant with one or more nuclear localization sequences (NLS). The NLS may be proximal to the N-terminus or C-terminus of the endonuclease. NLS is at least about 30%, at least about 35%, at least about 40% at the N-terminus or C-terminus of any one of SEQ ID NOs: 320-420, or at least about 35%, at least about 40% relative to any one of SEQ ID NOs: 320-420. %, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90% %, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. The NLS may be an SV40 large T antigen NLS. The NLS may be a c-myc NLS. The NLS comprises a sequence having at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 99% identity to any one of SEQ ID NOs: 5593-5608. I can do it. The NLS can include a sequence substantially identical to any one of SEQ ID NOs: 5593-5608. The NLS can include any of the sequences in Table 1, or a combination thereof:

場合によっては、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、またはSmith-Waterman相同性検索アルゴリズムによって決定されてもよい。配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータを使用し、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリクスを使用し、および条件付き組成スコアマトリクス調整を使用して、BLASTPアルゴリズムで決定することができる。 In some cases, sequence identity may be determined by BLASTP, CLUSTALW, MUSCLE, MAFFT, Novafold, or Smith-Waterman homology search algorithms. Sequence identity was determined using the BLOSUM62 scoring matrix using parameters of wordlength (W) of 3, expectation (E) of 10, and gap cost with existence of 11, extension of 1, and conditional composition. It can be determined with the BLASTP algorithm using a score matrix adjustment.

場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を有するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)を含んでもよい。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合可能なPAM配列を含んでもよい。場合によっては、標的化領域の5’のほとんどのヌクレオチドがGであってもよい。場合によっては、5’標的化領域は15~23ヌクレオチド長であってもよい。ガイド配列およびtracr配列は、別のリボ核酸(RNA)または単一リボ核酸(RNA)として供給されてもよい。ガイドRNAは、標的化領域の3’にcrRNA tracrRNA結合配列を含んでもよい。ガイドRNAは、crRNA tracrRNA結合領域の3’に4-ヌクレオチドリンカーが先行するtracrRNA配列を含んでもよい。sgRNAは、5’から3’に、細胞の標的配列にハイブリダイズすることができる非天然ガイド核酸配列、および、tracr配列を含んでもよい。場合によっては、非天然ガイド核酸配列およびtracr配列は共有結合される。 Optionally, the system comprises: (b) at least one engineered synthetic guide ribonucleic acid (sgRNA) capable of forming a complex with an endonuclease having a 5' targeting region complementary to the desired cleavage sequence; May include. In some cases, the 5' targeting region may include a PAM sequence that is compatible with an endonuclease. In some cases, most nucleotides 5' of the targeting region may be G's. In some cases, the 5' targeting region may be 15-23 nucleotides in length. The guide sequence and tracr sequence may be provided as separate ribonucleic acids (RNA) or as a single ribonucleic acid (RNA). The guide RNA may include a crRNA tracrRNA binding sequence 3' of the targeting region. The guide RNA may include a tracrRNA sequence preceded by a 4-nucleotide linker 3' of the crRNA tracrRNA binding region. The sgRNA may include, 5' to 3', a non-natural guide nucleic acid sequence capable of hybridizing to a cellular target sequence, and a tracr sequence. In some cases, the non-natural guide nucleic acid sequence and the tracr sequence are covalently linked.

場合によっては、tracr配列は特別な配列を有していてもよい。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%を有してもよい。tracr配列は、配列番号:5490-5494のいずれか1つの少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%の配列同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5490-5494のいずれか1つの少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5490-5494のいずれか1つの少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドと実質的に同一であってもよい。tracrRNAは、配列番号:5490-5494のいずれかを含んでもよい。 In some cases, the tracr sequence may have a special sequence. A tracr sequence comprises at least about 60 to 100 (e.g., at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) contiguous nucleotides of a natural tracr RNA sequence. may have at least about 80%. The tracr sequence has at least about 60 to 100 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) contiguous nucleotides of at least about 80%. In some cases, the tracrRNA is at least about 60-90 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) contiguous nucleotides, at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about They may have 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. In some cases, the tracrRNA is at least about 60 to 100 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90 contiguous nucleotides. tracrRNA may include any of SEQ ID NOs: 5490-5494.

場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号:5465に対して少なくとも約80%の同一性を有する配列を含んでもよい。sgRNAは、配列番号:5465に対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含んでもよい。sgRNAは配列番号:5465と実質的に同一の配列を含んでもよい。 Optionally, the at least one engineered synthetic guide ribonucleic acid (sgRNA) capable of forming a complex with an endonuclease may include a sequence having at least about 80% identity to SEQ ID NO: 5465. . The sgRNA is at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, relative to SEQ ID NO: 5465. It may include sequences having at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. The sgRNA may include a sequence substantially identical to SEQ ID NO:5465.

いくつかの態様では、上記システムは、標的DNA遺伝子座における切断のために第1の領域および第2の領域を標的とする2つの異なるsgRNAを含んでいてもよく、ここで、第2の領域は第1の領域に対して3’である。場合によっては、上記システムは、5’から3’に、第1の領域の5’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第1の相同性アーム、少なくとも約10ヌクレオチドの合成DNA配列、および、第2の領域の3’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第2の相同性アームを含む、一本鎖または二本鎖のDNA修復鋳型を含んでいてもよい。 In some embodiments, the system may include two different sgRNAs that target a first region and a second region for cleavage at a target DNA locus, where the second region is 3' for the first region. In some cases, the system includes 5' to 3' at least about 20 (e.g., at least about 40, 80, 120, 150, 200, 300, 500, or 1 kb) nucleotides 5' of the first region. a first homology arm comprising a synthetic DNA sequence of at least about 10 nucleotides, and 3′ of the second region at least about 20 (e.g., at least about 40, 80, 120, 150, 200, 300, 500, or 1 kb) of nucleotides).

他の態様では、本開示は、所望の標的核酸遺伝子座を改変するための方法を提供する。本方法は、本明細書に開示された酵素および少なくとも1つの合成ガイドRNA(sgRNA)を含む本明細書で開示された非天然のシステムのいずれかを、標的核酸遺伝子座に送達する工程を含んでもよい。酵素は、少なくとも1つのsgRNAと複合体を形成してもよく、複合体が所望の標的核酸遺伝子座に結合すると、所望の標的核酸遺伝子座を改変してもよい。酵素を前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をトランスフェクトすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をエレクトロポレーションすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、所望の遺伝子座を含む核酸を有する緩衝液中でシステムをインキュベートすることを含んでもよい。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含んでもよい。標的核酸遺伝子座は細胞内にあってもよい。標的核酸遺伝子座はインビトロであってもよい。標的核酸遺伝子座は、真核細胞内にあっても、原核細胞内にあってもよい。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、または植物細胞であってもよい。酵素は、所望の標的遺伝子座で、またはその近辺で、一本鎖または二本鎖の切断を誘導してもよい。 In other aspects, the disclosure provides methods for modifying a desired target nucleic acid locus. The method comprises delivering any of the non-natural systems disclosed herein comprising an enzyme disclosed herein and at least one synthetic guide RNA (sgRNA) to a target nucleic acid locus. But that's fine. The enzyme may form a complex with at least one sgRNA and modify the desired target nucleic acid locus upon binding of the complex to the desired target nucleic acid locus. Delivering an enzyme to said locus may include transfecting a cell with said system or a nucleic acid encoding said system. Delivering a nuclease to said locus may include electroporating a cell with said system or a nucleic acid encoding said system. Delivering a nuclease to the locus may include incubating the system in a buffer with a nucleic acid containing the desired locus. In some cases, the target nucleic acid locus comprises deoxyribonucleic acid (DNA) or ribonucleic acid (RNA). The target nucleic acid locus may include genomic DNA, viral DNA, viral RNA, or bacterial DNA. The target nucleic acid locus may be intracellular. The target nucleic acid locus may be in vitro. The target nucleic acid locus may be within a eukaryotic or prokaryotic cell. The cell may be an animal cell, a human cell, a bacterial cell, an archaeal cell, or a plant cell. The enzyme may induce single-stranded or double-stranded breaks at or near the desired target locus.

標的核酸の遺伝子座が細胞内にあり得る場合では、酵素は、配列番号:2141-2241のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードするオープンリーディングフレームを含む核酸として供給されてもよい。前記エンドヌクレアーゼをコードするオープンリーディングフレームを含むデオキシリボ核酸(DNA)は、配列番号:5576-5577のいずれか1つと実質的に同一の配列、あるいは、配列番号:5576-5577のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでもよい。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトβアクチン、CAG、TRE、またはCaMKIIaプロモーターであってもよい。エンドヌクレアーゼは、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含むキャップされたmRNAとして供給されてもよい。エンドヌクレアーゼは、翻訳されたポリペプチドとして提供されてもよい。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された前記少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含むデオキシリボ核酸(DNA)として供給されてもよい。場合によっては、生物は真核生物であってもよい。場合によっては、生物は真菌であってもよい。場合によっては、生物はヒトであってもよい。 In cases where the locus of the target nucleic acid may be intracellular, the enzyme has at least about 75% (e.g., at least about 90%, at least about 91%, at least Enzymes having RuvC_III domains having an identity of about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%) It may also be provided as a nucleic acid containing an encoding open reading frame. The deoxyribonucleic acid (DNA) containing the open reading frame encoding the endonuclease has a sequence substantially identical to any one of SEQ ID NOs: 5576-5577, or a sequence substantially identical to any one of SEQ ID NOs: 5576-5577. at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75% %, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. May include. In some cases, the nucleic acid includes a promoter to which is operably linked an open reading frame encoding an endonuclease. The promoter may be a CMV, EF1a, SV40, PGK1, Ubc, human β-actin, CAG, TRE, or CaMKIIa promoter. The endonuclease may be provided as a capped mRNA containing the open reading frame encoding the endonuclease. The endonuclease may be provided as a translated polypeptide. The at least one engineered sgRNA may be provided as deoxyribonucleic acid (DNA) comprising a genetic sequence encoding said at least one engineered sgRNA operably linked to a ribonucleic acid (RNA) pol III promoter. . In some cases, the organism may be eukaryotic. In some cases, the organism may be a fungus. In some cases, the organism may be a human.

MG3酵素 MG3 enzyme

一態様では、本開示は、(a)エンドヌクレアーゼを含む操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼはCasエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型のクラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、前記RuvC_IIIドメインは、配列番号:2242-2251のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、RuvC_IIIドメインは、配列番号:2242-2251のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、配列番号:2242-2251のいずれか1つに実質的に同一である。エンドヌクレアーゼは、配列番号:2242-2244のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:2242-2244のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:2242-2244のいずれか1つに実質的に同一であるRuvC_IIIドメインを含んでいてもよい。 In one aspect, the present disclosure provides an engineered nuclease system that includes (a) an endonuclease. In some cases, the endonuclease is a Cas endonuclease. In some cases, the endonuclease is a type II class II Cas endonuclease. The endonuclease may include a RuvC_III domain, wherein the RuvC_III domain has at least about 70% sequence identity to any one of SEQ ID NOs: 2242-2251. In some cases, the endonuclease may comprise a RuvC_III domain, wherein the RuvC_III domain is at least about 20%, at least about 25%, at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least About 98%, at least about 99% identical. Optionally, the endonuclease may include a RuvC_III domain, wherein the endonuclease is substantially identical to any one of SEQ ID NOs: 2242-2251. The endonuclease may include a RuvC_III domain having at least about 70% sequence identity to any one of SEQ ID NOs: 2242-2244. In some cases, the endonuclease is at least about 20%, at least about 25%, at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about RuvC_III domains having an identity of 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%. May contain. In some cases, the endonuclease may include a RuvC_III domain that is substantially identical to any one of SEQ ID NOs: 2242-2244.

エンドヌクレアーゼは、配列番号:4056-4066のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4056-4066のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4056-4066のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。エンドヌクレアーゼは、配列番号:4056-4058のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4056-4058のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4056-4058のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。 The endonuclease may include an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 4056-4066. In some cases, the endonuclease is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about HNH domains having an identity of 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99%. May contain. The endonuclease may contain an HNH domain substantially identical to any one of SEQ ID NOs: 4056-4066. The endonuclease may include an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 4056-4058. In some cases, the endonuclease is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about HNH domains having an identity of 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99%. May contain. The endonuclease may contain an HNH domain substantially identical to any one of SEQ ID NOs: 4056-4058.

場合によっては、エンドヌクレアーゼは、配列番号:421-431のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:421-431のいずれか1つと実質的に同一であってもよい。場合によっては、エンドヌクレアーゼは、配列番号:421-423のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:421-423のいずれか1つと実質的に同一であってもよい。 In some cases, the endonuclease is at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about Variants having 97%, at least about 98%, or at least about 99% identity may be included. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 421-431. In some cases, the endonuclease is at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about Variants having 97%, at least about 98%, or at least about 99% identity may be included. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 421-423.

場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有する変異体を含んでもよい。NLSは前記エンドヌクレアーゼのN末端またはC末端の近位であってもよい。NLSは、配列番号:421-431のいずれか1つのN末端またはC末端で、あるいは、配列番号:421-431のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体のN末端またはC末端で付加されてもよい。NLSはSV40ラージT抗原NLSであってもよい。NLSはc-myc NLSであってもよい。NLSは、配列番号:5593-5608のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含むことができる。NLSは配列番号:5593-5608のいずれか1つと実質的に同一の配列を含むことができる。NLSは、表1の配列のいずれか、またはその組み合わせを含むことができる: In some cases, the endonuclease may include a variant with one or more nuclear localization sequences (NLS). The NLS may be proximal to the N-terminus or C-terminus of the endonuclease. NLS is at least about 30%, at least about 35%, at least about 40% at the N-terminus or C-terminus of any one of SEQ ID NOs: 421-431, or at least about 35%, at least about 40% relative to any one of SEQ ID NOs: 421-431. %, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90% %, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. The NLS may be an SV40 large T antigen NLS. The NLS may be a c-myc NLS. The NLS comprises a sequence having at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 99% identity to any one of SEQ ID NOs: 5593-5608. I can do it. The NLS can include a sequence substantially identical to any one of SEQ ID NOs: 5593-5608. The NLS can include any of the sequences in Table 1, or a combination thereof:

場合によっては、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、またはSmith-Waterman相同性検索アルゴリズムによって決定されてもよい。配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータを使用し、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリクスを使用し、および条件付き組成スコアマトリクス調整を使用して、BLASTPアルゴリズムで決定することができる。 In some cases, sequence identity may be determined by BLASTP, CLUSTALW, MUSCLE, MAFFT, Novafold, or Smith-Waterman homology search algorithms. Sequence identity was determined using the BLOSUM62 scoring matrix using parameters of wordlength (W) of 3, expectation (E) of 10, and gap cost with existence of 11, extension of 1, and conditional composition. It can be determined with the BLASTP algorithm using a score matrix adjustment.

場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を有するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)を含んでもよい。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合可能なPAM配列を含んでもよい。場合によっては、標的化領域の5’のほとんどのヌクレオチドがGであってもよい。場合によっては、5’標的化領域は15~23ヌクレオチド長であってもよい。ガイド配列およびtracr配列は、別のリボ核酸(RNA)または単一リボ核酸(RNA)として供給されてもよい。ガイドRNAは、標的化領域の3’にcrRNA tracrRNA結合配列を含んでもよい。ガイドRNAは、crRNA tracrRNA結合領域の3’に4-ヌクレオチドリンカーが先行するtracrRNA配列を含んでもよい。sgRNAは、5’から3’に、細胞の標的配列にハイブリダイズすることができる非天然ガイド核酸配列、および、tracr配列を含んでもよい。場合によっては、非天然ガイド核酸配列およびtracr配列は共有結合される。 Optionally, the system comprises: (b) at least one engineered synthetic guide ribonucleic acid (sgRNA) capable of forming a complex with an endonuclease having a 5' targeting region complementary to the desired cleavage sequence; May include. In some cases, the 5' targeting region may include a PAM sequence that is compatible with an endonuclease. In some cases, most nucleotides 5' of the targeting region may be G's. In some cases, the 5' targeting region may be 15-23 nucleotides in length. The guide sequence and tracr sequence may be provided as separate ribonucleic acids (RNA) or as a single ribonucleic acid (RNA). The guide RNA may include a crRNA tracrRNA binding sequence 3' of the targeting region. The guide RNA may include a tracrRNA sequence preceded by a 4-nucleotide linker 3' of the crRNA tracrRNA binding region. The sgRNA may include, 5' to 3', a non-natural guide nucleic acid sequence capable of hybridizing to a cellular target sequence, and a tracr sequence. In some cases, the non-natural guide nucleic acid sequence and the tracr sequence are covalently linked.

場合によっては、tracr配列は特別な配列を有していてもよい。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%を有してもよい。tracr配列は、配列番号:5495-5502のいずれか1つの少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%の配列同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5495-5502のいずれか1つの少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5495-5502のいずれか1つの少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドと実質的に同一であってもよい。tracrRNAは、配列番号:5495-5502のいずれかを含んでもよい。 In some cases, the tracr sequence may have a special sequence. A tracr sequence comprises at least about 60 to 100 (e.g., at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) contiguous nucleotides of a natural tracr RNA sequence. may have at least about 80%. The tracr sequence has at least about 60 to 100 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) contiguous nucleotides of at least about 80%. In some cases, the tracrRNA is at least about 60-90 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) contiguous nucleotides, at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about They may have 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. In some cases, the tracrRNA is at least about 60 to 100 (e.g., at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90 contiguous nucleotides. The tracrRNA may include any of SEQ ID NOs: 5495-5502.

場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号:5466-5467のいずれか1つに対して少なくとも約80%の同一性を有する配列を含んでもよい。sgRNAは、配列番号:5466-5467のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含んでもよい。sgRNAは配列番号:5466-5467のいずれか1つと実質的に同一の配列を含んでもよい。 Optionally, the at least one engineered synthetic guide ribonucleic acid (sgRNA) capable of forming a complex with an endonuclease is at least about 80% identical to any one of SEQ ID NOs: 5466-5467. may include an array having The sgRNA is at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94% of any one of SEQ ID NOs: 5466-5467. %, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99%. The sgRNA may include a sequence substantially identical to any one of SEQ ID NOs: 5466-5467.

場合によっては、上記システムは、標的DNA遺伝子座における切断のために第1の領域および第2の領域を標的とする2つの異なるsgRNAを含んでいてもよく、ここで、第2の領域は第1の領域に対して3’である。場合によっては、上記システムは、5’から3’に、第1の領域の5’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第1の相同性アーム、少なくとも約10ヌクレオチドの合成DNA配列、および、第2の領域の3’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第2の相同性アームを含む、一本鎖または二本鎖のDNA修復鋳型を含んでいてもよい。 In some cases, the system may include two different sgRNAs that target a first region and a second region for cleavage at a target DNA locus, where the second region is a second region. 3' for a region of 1. In some cases, the system includes 5' to 3' at least about 20 (e.g., at least about 40, 80, 120, 150, 200, 300, 500, or 1 kb) nucleotides 5' to the first region. a first homology arm comprising a synthetic DNA sequence of at least about 10 nucleotides, and 3′ of the second region at least about 20 (e.g., at least about 40, 80, 120, 150, 200, 300, 500, or 1 kb) of nucleotides).

他の態様では、本開示は、所望の標的核酸遺伝子座を改変するための方法を提供する。本方法は、本明細書に開示された酵素および少なくとも1つの合成ガイドRNA(sgRNA)を含む本明細書で開示された非天然のシステムのいずれかを、標的核酸遺伝子座に送達する工程を含んでもよい。酵素は、少なくとも1つのsgRNAと複合体を形成してもよく、複合体が所望の標的核酸遺伝子座に結合すると、所望の標的核酸遺伝子座を改変してもよい。酵素を前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をトランスフェクトすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をエレクトロポレーションすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、所望の遺伝子座を含む核酸を有する緩衝液中でシステムをインキュベートすることを含んでもよい。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含んでもよい。標的核酸遺伝子座は細胞内にあってもよい。標的核酸遺伝子座はインビトロであってもよい。標的核酸遺伝子座は、真核細胞内にあっても、原核細胞内にあってもよい。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、または植物細胞であってもよい。酵素は、所望の標的遺伝子座で、またはその近辺で、一本鎖または二本鎖の切断を誘導してもよい。 In other aspects, the disclosure provides methods for modifying a desired target nucleic acid locus. The method comprises delivering any of the non-natural systems disclosed herein comprising an enzyme disclosed herein and at least one synthetic guide RNA (sgRNA) to a target nucleic acid locus. But that's fine. The enzyme may form a complex with at least one sgRNA and modify the desired target nucleic acid locus upon binding of the complex to the desired target nucleic acid locus. Delivering an enzyme to said locus may include transfecting a cell with said system or a nucleic acid encoding said system. Delivering a nuclease to said locus may include electroporating a cell with said system or a nucleic acid encoding said system. Delivering a nuclease to the locus may include incubating the system in a buffer with a nucleic acid containing the desired locus. In some cases, the target nucleic acid locus comprises deoxyribonucleic acid (DNA) or ribonucleic acid (RNA). The target nucleic acid locus may include genomic DNA, viral DNA, viral RNA, or bacterial DNA. The target nucleic acid locus may be intracellular. The target nucleic acid locus may be in vitro. The target nucleic acid locus may be within a eukaryotic or prokaryotic cell. The cell may be an animal cell, a human cell, a bacterial cell, an archaeal cell, or a plant cell. The enzyme may induce single-stranded or double-stranded breaks at or near the desired target locus.

標的核酸の遺伝子座が細胞内にあり得る場合では、酵素は、配列番号:2242-2251のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードするオープンリーディングフレームを含む核酸として供給されてもよい。前記エンドヌクレアーゼをコードするオープンリーディングフレームを含むデオキシリボ核酸(DNA)は、配列番号:5578-5580のいずれか1つと実質的に同一の配列、あるいは、配列番号:5578-5580のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでもよい。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトβアクチン、CAG、TRE、またはCaMKIIaプロモーターであってもよい。エンドヌクレアーゼは、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含むキャップされたmRNAとして供給されてもよい。エンドヌクレアーゼは、翻訳されたポリペプチドとして提供されてもよい。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された前記少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含むデオキシリボ核酸(DNA)として供給されてもよい。場合によっては、生物は真核生物であってもよい。場合によっては、生物は真菌であってもよい。場合によっては、生物はヒトであってもよい。 In cases where the target nucleic acid locus can be intracellular, the enzyme has at least about 75% (e.g., at least about 90%, at least about 91%, at least Enzymes having RuvC_III domains having an identity of about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%). It may also be provided as a nucleic acid containing an encoding open reading frame. The deoxyribonucleic acid (DNA) containing the open reading frame encoding the endonuclease has a sequence substantially identical to any one of SEQ ID NOs: 5578-5580, or a sequence substantially identical to any one of SEQ ID NOs: 5578-5580. at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75% %, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99%. May include. In some cases, the nucleic acid includes a promoter to which is operably linked an open reading frame encoding an endonuclease. The promoter may be a CMV, EF1a, SV40, PGK1, Ubc, human β-actin, CAG, TRE, or CaMKIIa promoter. The endonuclease may be provided as a capped mRNA containing the open reading frame encoding the endonuclease. The endonuclease may be provided as a translated polypeptide. The at least one engineered sgRNA may be provided as deoxyribonucleic acid (DNA) comprising a genetic sequence encoding said at least one engineered sgRNA operably linked to a ribonucleic acid (RNA) pol III promoter. . In some cases, the organism may be eukaryotic. In some cases, the organism may be a fungus. In some cases, the organism may be a human.

MG4酵素 MG4 enzyme

一態様では、本開示は、(a)エンドヌクレアーゼを含む操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼはCasエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型のクラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、前記RuvC_IIIドメインは、配列番号:2253-2481のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、RuvC_IIIドメインは、配列番号:2253-2481のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、配列番号:2253-2481のいずれか1つに実質的に同一である。エンドヌクレアーゼは、配列番号:2253-2481のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:2253-2481のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:2253-2481のいずれか1つに実質的に同一であるRuvC_IIIドメインを含んでいてもよい。 In one aspect, the present disclosure provides an engineered nuclease system that includes (a) an endonuclease. In some cases, the endonuclease is a Cas endonuclease. In some cases, the endonuclease is a type II class II Cas endonuclease. The endonuclease may include a RuvC_III domain, wherein the RuvC_III domain has at least about 70% sequence identity to any one of SEQ ID NOs: 2253-2481. In some cases, the endonuclease may comprise a RuvC_III domain, wherein the RuvC_III domain is at least about 20%, at least about 25%, at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least About 98%, at least about 99% identical. Optionally, the endonuclease may include a RuvC_III domain, wherein the endonuclease is substantially identical to any one of SEQ ID NOs: 2253-2481. The endonuclease may include a RuvC_III domain having at least about 70% sequence identity to any one of SEQ ID NOs: 2253-2481. In some cases, the endonuclease is at least about 20%, at least about 25%, at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about RuvC_III domains having an identity of 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%. May contain. In some cases, the endonuclease may include a RuvC_III domain that is substantially identical to any one of SEQ ID NOs: 2253-2481.

エンドヌクレアーゼは、配列番号:4067-4295のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4067-4295のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4067-4295のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。エンドヌクレアーゼは、配列番号:4067-4295のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4067-4295のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4067-4295のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。 The endonuclease may include an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 4067-4295. In some cases, the endonuclease is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about HNH domains having an identity of 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99%. May contain. The endonuclease may contain an HNH domain substantially identical to any one of SEQ ID NOs: 4067-4295. The endonuclease may include an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 4067-4295. In some cases, the endonuclease is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about HNH domains having an identity of 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99%. May contain. The endonuclease may contain an HNH domain substantially identical to any one of SEQ ID NOs: 4067-4295.

場合によっては、エンドヌクレアーゼは、配列番号:432-660のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:432-660のいずれか1つと実質的に同一であってもよい。場合によっては、エンドヌクレアーゼは、配列番号:432-660のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:432-660のいずれか1つと実質的に同一であってもよい。 In some cases, the endonuclease is at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about Variants having 97%, at least about 98%, or at least about 99% identity may be included. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 432-660. In some cases, the endonuclease is at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about Variants having 97%, at least about 98%, or at least about 99% identity may be included. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 432-660.

場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有する変異体を含んでもよい。NLSは前記エンドヌクレアーゼのN末端またはC末端の近位であってもよい。NLSは、配列番号:432-660のいずれか1つのN末端またはC末端で、あるいは、配列番号:432-660のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体のN末端またはC末端で付加されてもよい。NLSはSV40ラージT抗原NLSであってもよい。NLSはc-myc NLSであってもよい。NLSは、配列番号:5593-5608のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含むことができる。NLSは配列番号:5593-5608のいずれか1つと実質的に同一の配列を含むことができる。NLSは、表1の配列のいずれか、またはその組み合わせを含むことができる: In some cases, the endonuclease may include a variant with one or more nuclear localization sequences (NLS). The NLS may be proximal to the N-terminus or C-terminus of the endonuclease. NLS is at least about 30%, at least about 35%, at least about 40% at the N-terminus or C-terminus of any one of SEQ ID NO: 432-660, or at least about 35%, at least about 40% relative to any one of SEQ ID NO: 432-660. %, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90% %, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. The NLS may be an SV40 large T antigen NLS. The NLS may be a c-myc NLS. The NLS comprises a sequence having at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 99% identity to any one of SEQ ID NOs: 5593-5608. I can do it. The NLS can include a sequence substantially identical to any one of SEQ ID NOs: 5593-5608. The NLS can include any of the sequences in Table 1, or a combination thereof:

場合によっては、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、またはSmith-Waterman相同性検索アルゴリズムによって決定されてもよい。配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータを使用し、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリクスを使用し、および条件付き組成スコアマトリクス調整を使用して、BLASTPアルゴリズムで決定することができる。 In some cases, sequence identity may be determined by BLASTP, CLUSTALW, MUSCLE, MAFFT, Novafold, or Smith-Waterman homology search algorithms. Sequence identity was determined using the BLOSUM62 scoring matrix using parameters of wordlength (W) of 3, expectation (E) of 10, and gap cost with existence of 11, extension of 1, and conditional composition. It can be determined with the BLASTP algorithm using a score matrix adjustment.

場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を有するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)を含んでもよい。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合可能なPAM配列を含んでもよい。場合によっては、標的化領域の5’のほとんどのヌクレオチドがGであってもよい。場合によっては、5’標的化領域は15~23ヌクレオチド長であってもよい。ガイド配列およびtracr配列は、別のリボ核酸(RNA)または単一リボ核酸(RNA)として供給されてもよい。ガイドRNAは、標的化領域の3’にcrRNA tracrRNA結合配列を含んでもよい。ガイドRNAは、crRNA tracrRNA結合領域の3’に4-ヌクレオチドリンカーが先行するtracrRNA配列を含んでもよい。sgRNAは、5’から3’に、細胞の標的配列にハイブリダイズすることができる非天然ガイド核酸配列、および、tracr配列を含んでもよい。場合によっては、非天然ガイド核酸配列およびtracr配列は共有結合される。 Optionally, the system comprises: (b) at least one engineered synthetic guide ribonucleic acid (sgRNA) capable of forming a complex with an endonuclease having a 5' targeting region complementary to the desired cleavage sequence; May include. In some cases, the 5' targeting region may include a PAM sequence that is compatible with an endonuclease. In some cases, most nucleotides 5' of the targeting region may be G's. In some cases, the 5' targeting region may be 15-23 nucleotides in length. The guide sequence and tracr sequence may be provided as separate ribonucleic acids (RNA) or as a single ribonucleic acid (RNA). The guide RNA may include a crRNA tracrRNA binding sequence 3' of the targeting region. The guide RNA may include a tracrRNA sequence preceded by a 4-nucleotide linker 3' of the crRNA tracrRNA binding region. The sgRNA may include, 5' to 3', a non-natural guide nucleic acid sequence capable of hybridizing to a cellular target sequence, and a tracr sequence. In some cases, the non-natural guide nucleic acid sequence and the tracr sequence are covalently linked.

場合によっては、tracr配列は特別な配列を有していてもよい。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%を有してもよい。tracr配列は、配列番号:5503の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%の配列同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5503の少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5503の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドと実質的に同一であってもよい。tracrRNAは、配列番号:5503を含んでもよい。 In some cases, the tracr sequence may have a special sequence. A tracr sequence comprises at least about 60 to 100 (e.g., at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) contiguous nucleotides of a natural tracr RNA sequence. may have at least about 80%. The tracr sequence comprises at least about 60 to 100 (e.g., at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) contiguous nucleotides of SEQ ID NO: 5503. may have at least about 80% sequence identity to. In some cases, the tracrRNA is at least about 60 to 90 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) of SEQ ID NO: 5503. At least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96 consecutive nucleotides %, at least about 97%, at least about 98%, or at least about 99%. In some cases, the tracrRNA is at least about 60 to 100 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) of SEQ ID NO: 5503. Consecutive nucleotides may be substantially identical. tracrRNA may include SEQ ID NO:5503.

場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号:5468に対して少なくとも約80%の同一性を有する配列を含んでもよい。sgRNAは、配列番号:5468に対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含んでもよい。sgRNAは配列番号:5468と実質的に同一の配列を含んでもよい。 Optionally, the at least one engineered synthetic guide ribonucleic acid (sgRNA) capable of forming a complex with an endonuclease may include a sequence having at least about 80% identity to SEQ ID NO: 5468. . The sgRNA is at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, relative to SEQ ID NO: 5468. It may include sequences having at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. The sgRNA may include a sequence substantially identical to SEQ ID NO:5468.

場合によっては、上記システムは、標的DNA遺伝子座における切断のために第1の領域および第2の領域を標的とする2つの異なるsgRNAを含んでいてもよく、ここで、第2の領域は第1の領域に対して3’である。場合によっては、上記システムは、5’から3’に、第1の領域の5’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第1の相同性アーム、少なくとも約10ヌクレオチドの合成DNA配列、および、第2の領域の3’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第2の相同性アームを含む、一本鎖または二本鎖のDNA修復鋳型を含んでいてもよい。 In some cases, the system may include two different sgRNAs that target a first region and a second region for cleavage at a target DNA locus, where the second region is a second region. 3' for a region of 1. In some cases, the system includes 5' to 3' at least about 20 (e.g., at least about 40, 80, 120, 150, 200, 300, 500, or 1 kb) nucleotides 5' of the first region. a first homology arm comprising a synthetic DNA sequence of at least about 10 nucleotides, and 3′ of the second region at least about 20 (e.g., at least about 40, 80, 120, 150, 200, 300, 500, or 1 kb) of nucleotides).

他の態様では、本開示は、所望の標的核酸遺伝子座を改変するための方法を提供する。本方法は、本明細書に開示された酵素および少なくとも1つの合成ガイドRNA(sgRNA)を含む本明細書で開示された非天然のシステムのいずれかを、標的核酸遺伝子座に送達する工程を含んでもよい。酵素は、少なくとも1つのsgRNAと複合体を形成してもよく、複合体が所望の標的核酸遺伝子座に結合すると、所望の標的核酸遺伝子座を改変してもよい。酵素を前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をトランスフェクトすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をエレクトロポレーションすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、所望の遺伝子座を含む核酸を有する緩衝液中でシステムをインキュベートすることを含んでもよい。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含んでもよい。標的核酸遺伝子座は細胞内にあってもよい。標的核酸遺伝子座はインビトロであってもよい。標的核酸遺伝子座は、真核細胞内にあっても、原核細胞内にあってもよい。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、または植物細胞であってもよい。酵素は、所望の標的遺伝子座で、またはその近辺で、一本鎖または二本鎖の切断を誘導してもよい。 In other aspects, the disclosure provides methods for modifying a desired target nucleic acid locus. The method comprises delivering any of the non-natural systems disclosed herein comprising an enzyme disclosed herein and at least one synthetic guide RNA (sgRNA) to a target nucleic acid locus. But that's fine. The enzyme may form a complex with at least one sgRNA and modify the desired target nucleic acid locus upon binding of the complex to the desired target nucleic acid locus. Delivering an enzyme to said locus may include transfecting a cell with said system or a nucleic acid encoding said system. Delivering a nuclease to said locus may include electroporating a cell with said system or a nucleic acid encoding said system. Delivering a nuclease to the locus may include incubating the system in a buffer with a nucleic acid containing the desired locus. In some cases, the target nucleic acid locus comprises deoxyribonucleic acid (DNA) or ribonucleic acid (RNA). The target nucleic acid locus may include genomic DNA, viral DNA, viral RNA, or bacterial DNA. The target nucleic acid locus may be intracellular. The target nucleic acid locus may be in vitro. The target nucleic acid locus may be within a eukaryotic or prokaryotic cell. The cell may be an animal cell, a human cell, a bacterial cell, an archaeal cell, or a plant cell. The enzyme may induce single-stranded or double-stranded breaks at or near the desired target locus.

標的核酸の遺伝子座が細胞内にあり得る場合では、酵素は、配列番号:2253-2481のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードするオープンリーディングフレームを含む核酸として供給されてもよい。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトβアクチン、CAG、TRE、またはCaMKIIaプロモーターであってもよい。エンドヌクレアーゼは、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含むキャップされたmRNAとして供給されてもよい。エンドヌクレアーゼは、翻訳されたポリペプチドとして提供されてもよい。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された前記少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含むデオキシリボ核酸(DNA)として供給されてもよい。場合によっては、生物は真核生物であってもよい。場合によっては、生物は真菌であってもよい。場合によっては、生物はヒトであってもよい。 In cases where the locus of the target nucleic acid may be intracellular, the enzyme has at least about 75% (e.g., at least about 90%, at least about 91%, at least Enzymes having RuvC_III domains having an identity of about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%). It may also be provided as a nucleic acid containing an encoding open reading frame. In some cases, the nucleic acid includes a promoter to which is operably linked an open reading frame encoding an endonuclease. The promoter may be a CMV, EF1a, SV40, PGK1, Ubc, human β-actin, CAG, TRE, or CaMKIIa promoter. The endonuclease may be provided as a capped mRNA containing the open reading frame encoding the endonuclease. The endonuclease may be provided as a translated polypeptide. The at least one engineered sgRNA may be provided as deoxyribonucleic acid (DNA) comprising a genetic sequence encoding said at least one engineered sgRNA operably linked to a ribonucleic acid (RNA) pol III promoter. . In some cases, the organism may be eukaryotic. In some cases, the organism may be a fungus. In some cases, the organism may be a human.

MG6酵素 MG6 enzyme

一態様では、本開示は、(a)エンドヌクレアーゼを含む操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼはCasエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型のクラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、前記RuvC_IIIドメインは、配列番号:2482-2489のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、RuvC_IIIドメインは、配列番号:2482-2489のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、配列番号:2482-2489のいずれか1つに実質的に同一である。 In one aspect, the present disclosure provides an engineered nuclease system that includes (a) an endonuclease. In some cases, the endonuclease is a Cas endonuclease. In some cases, the endonuclease is a type II class II Cas endonuclease. The endonuclease may include a RuvC_III domain, wherein the RuvC_III domain has at least about 70% sequence identity to any one of SEQ ID NOs: 2482-2489. In some cases, the endonuclease may include a RuvC_III domain, wherein the RuvC_III domain is at least about 20%, at least about 25%, at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least About 98%, at least about 99% identical. Optionally, the endonuclease may include a RuvC_III domain, wherein the endonuclease is substantially identical to any one of SEQ ID NOs: 2482-2489.

エンドヌクレアーゼは、配列番号:4296-4303のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4296-4303のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4056-4066のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。 The endonuclease may include an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 4296-4303. In some cases, the endonuclease is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about HNH domains having an identity of 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99%. May contain. The endonuclease may contain an HNH domain substantially identical to any one of SEQ ID NOs: 4056-4066.

場合によっては、エンドヌクレアーゼは、配列番号:661-668のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:661-668のいずれか1つと実質的に同一であってもよい。 In some cases, the endonuclease is at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about Variants having 97%, at least about 98%, or at least about 99% identity may be included. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 661-668.

場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有する変異体を含んでもよい。NLSは前記エンドヌクレアーゼのN末端またはC末端の近位であってもよい。NLSは、配列番号:661-668のいずれか1つのN末端またはC末端で、あるいは、配列番号:661-668のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体のN末端またはC末端で付加されてもよい。NLSはSV40ラージT抗原NLSであってもよい。NLSはc-myc NLSであってもよい。NLSは、配列番号:5593-5608のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含むことができる。NLSは配列番号:5593-5608のいずれか1つと実質的に同一の配列を含むことができる。NLSは、表1の配列のいずれか、またはその組み合わせを含むことができる: In some cases, the endonuclease may include a variant with one or more nuclear localization sequences (NLS). The NLS may be proximal to the N-terminus or C-terminus of the endonuclease. NLS is at least about 30%, at least about 35%, at least about 40% at the N-terminus or C-terminus of any one of SEQ ID NO: 661-668, or at least about 35%, at least about 40% relative to any one of SEQ ID NO: 661-668. %, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90% %, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. The NLS may be an SV40 large T antigen NLS. The NLS may be a c-myc NLS. The NLS comprises a sequence having at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 99% identity to any one of SEQ ID NOs: 5593-5608. I can do it. The NLS can include a sequence substantially identical to any one of SEQ ID NOs: 5593-5608. The NLS can include any of the sequences in Table 1, or a combination thereof:

場合によっては、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、またはSmith-Waterman相同性検索アルゴリズムによって決定されてもよい。配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータを使用し、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリクスを使用し、および条件付き組成スコアマトリクス調整を使用して、BLASTPアルゴリズムで決定することができる。 In some cases, sequence identity may be determined by BLASTP, CLUSTALW, MUSCLE, MAFFT, Novafold, or Smith-Waterman homology search algorithms. Sequence identity was determined using the BLOSUM62 scoring matrix using parameters of wordlength (W) of 3, expectation (E) of 10, and gap cost with existence of 11, extension of 1, and conditional composition. It can be determined with the BLASTP algorithm using a score matrix adjustment.

場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を有するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)を含んでもよい。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合可能なPAM配列を含んでもよい。場合によっては、標的化領域の5’のほとんどのヌクレオチドがGであってもよい。場合によっては、5’標的化領域は15~23ヌクレオチド長であってもよい。ガイド配列およびtracr配列は、別のリボ核酸(RNA)または単一リボ核酸(RNA)として供給されてもよい。ガイドRNAは、標的化領域の3’にcrRNA tracrRNA結合配列を含んでもよい。ガイドRNAは、crRNA tracrRNA結合領域の3’に4-ヌクレオチドリンカーが先行するtracrRNA配列を含んでもよい。sgRNAは、5’から3’に、細胞の標的配列にハイブリダイズすることができる非天然ガイド核酸配列、および、tracr配列を含んでもよい。場合によっては、非天然ガイド核酸配列およびtracr配列は共有結合される。 Optionally, the system comprises: (b) at least one engineered synthetic guide ribonucleic acid (sgRNA) capable of forming a complex with an endonuclease having a 5' targeting region complementary to the desired cleavage sequence; May include. In some cases, the 5' targeting region may include a PAM sequence that is compatible with an endonuclease. In some cases, most nucleotides 5' of the targeting region may be G's. In some cases, the 5' targeting region may be 15-23 nucleotides in length. The guide sequence and tracr sequence may be provided as separate ribonucleic acids (RNA) or as a single ribonucleic acid (RNA). The guide RNA may include a crRNA tracrRNA binding sequence 3' of the targeting region. The guide RNA may include a tracrRNA sequence preceded by a 4-nucleotide linker 3' of the crRNA tracrRNA binding region. The sgRNA may include, 5' to 3', a non-natural guide nucleic acid sequence capable of hybridizing to a cellular target sequence, and a tracr sequence. In some cases, the non-natural guide nucleic acid sequence and the tracr sequence are covalently linked.

場合によっては、tracr配列は特別な配列を有していてもよい。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%を有してもよい。 In some cases, the tracr sequence may have a special sequence. A tracr sequence comprises at least about 60 to 100 (e.g., at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) contiguous nucleotides of a natural tracr RNA sequence. may have at least about 80%.

場合によっては、上記システムは、標的DNA遺伝子座における切断のために第1の領域および第2の領域を標的とする2つの異なるガイドRNAを含んでいてもよく、ここで、第2の領域は第1の領域に対して3’である。場合によっては、上記システムは、5’から3’に、第1の領域の5’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第1の相同性アーム、少なくとも約10ヌクレオチドの合成DNA配列、および、第2の領域の3’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第2の相同性アームを含む、一本鎖または二本鎖のDNA修復鋳型を含んでいてもよい。 In some cases, the system may include two different guide RNAs that target a first region and a second region for cleavage at a target DNA locus, where the second region is 3' to the first region. In some cases, the system includes 5' to 3' at least about 20 (e.g., at least about 40, 80, 120, 150, 200, 300, 500, or 1 kb) nucleotides 5' of the first region. a first homology arm comprising a synthetic DNA sequence of at least about 10 nucleotides, and 3′ of the second region at least about 20 (e.g., at least about 40, 80, 120, 150, 200, 300, 500, or 1 kb) of nucleotides).

他の態様では、本開示は、所望の標的核酸遺伝子座を改変するための方法を提供する。本方法は、本明細書に開示された酵素および少なくとも1つの合成ガイドRNA(sgRNA)を含む本明細書で開示された非天然のシステムのいずれかを、標的核酸遺伝子座に送達する工程を含んでもよい。酵素は、少なくとも1つのsgRNAと複合体を形成してもよく、複合体が所望の標的核酸遺伝子座に結合すると、所望の標的核酸遺伝子座を改変してもよい。酵素を前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をトランスフェクトすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をエレクトロポレーションすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、所望の遺伝子座を含む核酸を有する緩衝液中でシステムをインキュベートすることを含んでもよい。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含んでもよい。標的核酸遺伝子座は細胞内にあってもよい。標的核酸遺伝子座はインビトロであってもよい。標的核酸遺伝子座は、真核細胞内にあっても、原核細胞内にあってもよい。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、または植物細胞であってもよい。酵素は、所望の標的遺伝子座で、またはその近辺で、一本鎖または二本鎖の切断を誘導してもよい。 In other aspects, the disclosure provides methods for modifying a desired target nucleic acid locus. The method comprises delivering any of the non-natural systems disclosed herein comprising an enzyme disclosed herein and at least one synthetic guide RNA (sgRNA) to a target nucleic acid locus. But that's fine. The enzyme may form a complex with at least one sgRNA and modify the desired target nucleic acid locus upon binding of the complex to the desired target nucleic acid locus. Delivering an enzyme to said locus may include transfecting a cell with said system or a nucleic acid encoding said system. Delivering a nuclease to said locus may include electroporating a cell with said system or a nucleic acid encoding said system. Delivering a nuclease to the locus may include incubating the system in a buffer with a nucleic acid containing the desired locus. In some cases, the target nucleic acid locus comprises deoxyribonucleic acid (DNA) or ribonucleic acid (RNA). The target nucleic acid locus may include genomic DNA, viral DNA, viral RNA, or bacterial DNA. The target nucleic acid locus may be intracellular. The target nucleic acid locus may be in vitro. The target nucleic acid locus may be within a eukaryotic or prokaryotic cell. The cell may be an animal cell, a human cell, a bacterial cell, an archaeal cell, or a plant cell. The enzyme may induce single-stranded or double-stranded breaks at or near the desired target locus.

標的核酸の遺伝子座が細胞内にあり得る場合では、酵素は、配列番号:2482-2489のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードするオープンリーディングフレームを含む核酸として供給されてもよい。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトβアクチン、CAG、TRE、またはCaMKIIaプロモーターであってもよい。エンドヌクレアーゼは、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含むキャップされたmRNAとして供給されてもよい。エンドヌクレアーゼは、翻訳されたポリペプチドとして提供されてもよい。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された前記少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含むデオキシリボ核酸(DNA)として供給されてもよい。場合によっては、生物は真核生物であってもよい。場合によっては、生物は真菌であってもよい。場合によっては、生物はヒトであってもよい。 In cases where the target nucleic acid locus can be intracellular, the enzyme has at least about 75% (e.g., at least about 90%, at least about 91%, at least Enzymes having RuvC_III domains having an identity of about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%). It may also be provided as a nucleic acid containing an encoding open reading frame. In some cases, the nucleic acid includes a promoter to which is operably linked an open reading frame encoding an endonuclease. The promoter may be a CMV, EF1a, SV40, PGK1, Ubc, human β-actin, CAG, TRE, or CaMKIIa promoter. The endonuclease may be provided as a capped mRNA containing the open reading frame encoding the endonuclease. The endonuclease may be provided as a translated polypeptide. The at least one engineered sgRNA may be provided as deoxyribonucleic acid (DNA) comprising a genetic sequence encoding said at least one engineered sgRNA operably linked to a ribonucleic acid (RNA) pol III promoter. . In some cases, the organism may be eukaryotic. In some cases, the organism may be a fungus. In some cases, the organism may be a human.

MG7酵素 MG7 enzyme

一態様では、本開示は、(a)エンドヌクレアーゼを含む操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼはCasエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型のクラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、前記RuvC_IIIドメインは、配列番号:2490-2498のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、RuvC_IIIドメインは、配列番号:2490-2498のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、配列番号:2490-2498のいずれか1つに実質的に同一である。エンドヌクレアーゼは、配列番号:2490-2498のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:2490-2498のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:2490-2498のいずれか1つに実質的に同一であるRuvC_IIIドメインを含んでいてもよい。 In one aspect, the present disclosure provides an engineered nuclease system that includes (a) an endonuclease. In some cases, the endonuclease is a Cas endonuclease. In some cases, the endonuclease is a type II class II Cas endonuclease. The endonuclease may include a RuvC_III domain, wherein the RuvC_III domain has at least about 70% sequence identity to any one of SEQ ID NOs: 2490-2498. In some cases, the endonuclease may include a RuvC_III domain, wherein the RuvC_III domain is at least about 20%, at least about 25%, at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least About 98%, at least about 99% identical. Optionally, the endonuclease may include a RuvC_III domain, wherein the endonuclease is substantially identical to any one of SEQ ID NOs: 2490-2498. The endonuclease may include a RuvC_III domain having at least about 70% sequence identity to any one of SEQ ID NOs: 2490-2498. In some cases, the endonuclease is at least about 20%, at least about 25%, at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about RuvC_III domains having an identity of 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%. May contain. In some cases, the endonuclease may include a RuvC_III domain that is substantially identical to any one of SEQ ID NOs: 2490-2498.

エンドヌクレアーゼは、配列番号:4304-4312のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4304-4312のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4304-4312のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。エンドヌクレアーゼは、配列番号:4304-4312のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4304-4312のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4304-4312のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。 The endonuclease may include an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 4304-4312. In some cases, the endonuclease is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about HNH domains having an identity of 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99%. May contain. The endonuclease may contain an HNH domain substantially identical to any one of SEQ ID NOs: 4304-4312. The endonuclease may include an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 4304-4312. In some cases, the endonuclease is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about HNH domains having an identity of 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99%. May contain. The endonuclease may contain an HNH domain substantially identical to any one of SEQ ID NOs: 4304-4312.

場合によっては、エンドヌクレアーゼは、配列番号:669-677のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:669-677のいずれか1つと実質的に同一であってもよい。場合によっては、エンドヌクレアーゼは、配列番号:669-677のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:669-677のいずれか1つと実質的に同一であってもよい。 In some cases, the endonuclease is at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about Variants having 97%, at least about 98%, or at least about 99% identity may be included. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 669-677. In some cases, the endonuclease is at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about Variants having 97%, at least about 98%, or at least about 99% identity may be included. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 669-677.

場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有する変異体を含んでもよい。NLSは前記エンドヌクレアーゼのN末端またはC末端の近位であってもよい。NLSは、配列番号:669-677のいずれか1つのN末端またはC末端で、あるいは、配列番号:669-677のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体のN末端またはC末端で付加されてもよい。NLSはSV40ラージT抗原NLSであってもよい。NLSはc-myc NLSであってもよい。NLSは、配列番号:5593-5608のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含むことができる。NLSは配列番号:5593-5608のいずれか1つと実質的に同一の配列を含むことができる。NLSは、表1の配列のいずれか、またはその組み合わせを含むことができる: In some cases, the endonuclease may include a variant with one or more nuclear localization sequences (NLS). The NLS may be proximal to the N-terminus or C-terminus of the endonuclease. NLS is at least about 30%, at least about 35%, at least about 40% at the N-terminus or C-terminus of any one of SEQ ID NO: 669-677, or at least about 35%, at least about 40% relative to any one of SEQ ID NO: 669-677. %, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90% %, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. The NLS may be an SV40 large T antigen NLS. The NLS may be a c-myc NLS. The NLS comprises a sequence having at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 99% identity to any one of SEQ ID NOs: 5593-5608. I can do it. The NLS can include a sequence substantially identical to any one of SEQ ID NOs: 5593-5608. The NLS can include any of the sequences in Table 1, or a combination thereof:

場合によっては、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、またはSmith-Waterman相同性検索アルゴリズムによって決定されてもよい。配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータを使用し、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリクスを使用し、および条件付き組成スコアマトリクス調整を使用して、BLASTPアルゴリズムで決定することができる。 In some cases, sequence identity may be determined by BLASTP, CLUSTALW, MUSCLE, MAFFT, Novafold, or Smith-Waterman homology search algorithms. Sequence identity was determined using the BLOSUM62 scoring matrix using parameters of wordlength (W) of 3, expectation (E) of 10, and gap cost with existence of 11, extension of 1, and conditional composition. It can be determined with the BLASTP algorithm using a score matrix adjustment.

場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を有するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)を含んでもよい。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合可能なPAM配列を含んでもよい。場合によっては、標的化領域の5’のほとんどのヌクレオチドがGであってもよい。場合によっては、5’標的化領域は15~23ヌクレオチド長であってもよい。ガイド配列およびtracr配列は、別のリボ核酸(RNA)または単一リボ核酸(RNA)として供給されてもよい。ガイドRNAは、標的化領域の3’にcrRNA tracrRNA結合配列を含んでもよい。ガイドRNAは、crRNA tracrRNA結合領域の3’に4-ヌクレオチドリンカーが先行するtracrRNA配列を含んでもよい。sgRNAは、5’から3’に、細胞の標的配列にハイブリダイズすることができる非天然ガイド核酸配列、および、tracr配列を含んでもよい。場合によっては、非天然ガイド核酸配列およびtracr配列は共有結合される。 Optionally, the system comprises: (b) at least one engineered synthetic guide ribonucleic acid (sgRNA) capable of forming a complex with an endonuclease having a 5' targeting region complementary to the desired cleavage sequence; May include. In some cases, the 5' targeting region may include a PAM sequence that is compatible with an endonuclease. In some cases, most nucleotides 5' of the targeting region may be G's. In some cases, the 5' targeting region may be 15-23 nucleotides in length. The guide sequence and tracr sequence may be provided as separate ribonucleic acids (RNA) or as a single ribonucleic acid (RNA). The guide RNA may include a crRNA tracrRNA binding sequence 3' of the targeting region. The guide RNA may include a tracrRNA sequence preceded by a 4-nucleotide linker 3' of the crRNA tracrRNA binding region. The sgRNA may include, 5' to 3', a non-natural guide nucleic acid sequence capable of hybridizing to a cellular target sequence, and a tracr sequence. In some cases, the non-natural guide nucleic acid sequence and the tracr sequence are covalently linked.

場合によっては、tracr配列は特別な配列を有していてもよい。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%を有してもよい。tracr配列は、配列番号:5504の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%の配列同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5504の少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5504の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドと実質的に同一であってもよい。tracrRNAは、配列番号:5504を含んでもよい。 In some cases, the tracr sequence may have a special sequence. A tracr sequence comprises at least about 60 to 100 (e.g., at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) contiguous nucleotides of a natural tracr RNA sequence. may have at least about 80%. The tracr sequence comprises at least about 60 to 100 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) contiguous nucleotides of SEQ ID NO: 5504. may have at least about 80% sequence identity to. In some cases, the tracrRNA is at least about 60 to 90 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) of SEQ ID NO: 5504. At least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96 consecutive nucleotides %, at least about 97%, at least about 98%, or at least about 99%. In some cases, the tracrRNA comprises at least about 60 to 100 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) of SEQ ID NO: 5504. Consecutive nucleotides may be substantially identical. tracrRNA may include SEQ ID NO:5504.

場合によっては、上記システムは、標的DNA遺伝子座における切断のために第1の領域および第2の領域を標的とする2つの異なるsgRNAを含んでいてもよく、ここで、第2の領域は第1の領域に対して3’である。場合によっては、上記システムは、5’から3’に、第1の領域の5’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第1の相同性アーム、少なくとも約10ヌクレオチドの合成DNA配列、および、第2の領域の3’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第2の相同性アームを含む、一本鎖または二本鎖のDNA修復鋳型を含んでいてもよい。 In some cases, the system may include two different sgRNAs that target a first region and a second region for cleavage at a target DNA locus, where the second region is a second region. 3' for a region of 1. In some cases, the system includes 5' to 3' at least about 20 (e.g., at least about 40, 80, 120, 150, 200, 300, 500, or 1 kb) nucleotides 5' of the first region. a first homology arm comprising a synthetic DNA sequence of at least about 10 nucleotides, and 3′ of the second region at least about 20 (e.g., at least about 40, 80, 120, 150, 200, 300, 500, or 1 kb) of nucleotides).

他の態様では、本開示は、所望の標的核酸遺伝子座を改変するための方法を提供する。本方法は、本明細書に開示された酵素および少なくとも1つの合成ガイドRNA(sgRNA)を含む本明細書で開示された非天然のシステムのいずれかを、標的核酸遺伝子座に送達する工程を含んでもよい。酵素は、少なくとも1つのsgRNAと複合体を形成してもよく、複合体が所望の標的核酸遺伝子座に結合すると、所望の標的核酸遺伝子座を改変してもよい。酵素を前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をトランスフェクトすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をエレクトロポレーションすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、所望の遺伝子座を含む核酸を有する緩衝液中でシステムをインキュベートすることを含んでもよい。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含んでもよい。標的核酸遺伝子座は細胞内にあってもよい。標的核酸遺伝子座はインビトロであってもよい。標的核酸遺伝子座は、真核細胞内にあっても、原核細胞内にあってもよい。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、または植物細胞であってもよい。酵素は、所望の標的遺伝子座で、またはその近辺で、一本鎖または二本鎖の切断を誘導してもよい。 In other aspects, the disclosure provides methods for modifying a desired target nucleic acid locus. The method comprises delivering any of the non-natural systems disclosed herein comprising an enzyme disclosed herein and at least one synthetic guide RNA (sgRNA) to a target nucleic acid locus. But that's fine. The enzyme may form a complex with at least one sgRNA and modify the desired target nucleic acid locus upon binding of the complex to the desired target nucleic acid locus. Delivering an enzyme to said locus may include transfecting a cell with said system or a nucleic acid encoding said system. Delivering a nuclease to said locus may include electroporating a cell with said system or a nucleic acid encoding said system. Delivering a nuclease to the locus may include incubating the system in a buffer with a nucleic acid containing the desired locus. In some cases, the target nucleic acid locus comprises deoxyribonucleic acid (DNA) or ribonucleic acid (RNA). The target nucleic acid locus may include genomic DNA, viral DNA, viral RNA, or bacterial DNA. The target nucleic acid locus may be intracellular. The target nucleic acid locus may be in vitro. The target nucleic acid locus may be within a eukaryotic or prokaryotic cell. The cell may be an animal cell, a human cell, a bacterial cell, an archaeal cell, or a plant cell. The enzyme may induce single-stranded or double-stranded breaks at or near the desired target locus.

標的核酸の遺伝子座が細胞内にあり得る場合では、酵素は、配列番号:2490-2498のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードするオープンリーディングフレームを含む核酸として供給されてもよい。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトβアクチン、CAG、TRE、またはCaMKIIaプロモーターであってもよい。エンドヌクレアーゼは、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含むキャップされたmRNAとして供給されてもよい。エンドヌクレアーゼは、翻訳されたポリペプチドとして提供されてもよい。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された前記少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含むデオキシリボ核酸(DNA)として供給されてもよい。場合によっては、生物は真核生物であってもよい。場合によっては、生物は真菌であってもよい。場合によっては、生物はヒトであってもよい。 In cases where the target nucleic acid locus can be intracellular, the enzyme has at least about 75% (e.g., at least about 90%, at least about 91%, at least Enzymes having RuvC_III domains having an identity of about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%) It may also be provided as a nucleic acid containing an encoding open reading frame. In some cases, the nucleic acid includes a promoter to which is operably linked an open reading frame encoding an endonuclease. The promoter may be a CMV, EF1a, SV40, PGK1, Ubc, human β-actin, CAG, TRE, or CaMKIIa promoter. The endonuclease may be provided as a capped mRNA containing the open reading frame encoding the endonuclease. The endonuclease may be provided as a translated polypeptide. The at least one engineered sgRNA may be provided as deoxyribonucleic acid (DNA) comprising a genetic sequence encoding said at least one engineered sgRNA operably linked to a ribonucleic acid (RNA) pol III promoter. . In some cases, the organism may be eukaryotic. In some cases, the organism may be a fungus. In some cases, the organism may be a human.

MG14酵素 MG14 enzyme

一態様では、本開示は、(a)エンドヌクレアーゼを含む操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼはCasエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型のクラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、前記RuvC_IIIドメインは、配列番号:2499-2750のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、RuvC_IIIドメインは、配列番号:2499-2750のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、配列番号:2499-2750のいずれか1つに実質的に同一である。エンドヌクレアーゼは、配列番号:2499-2750のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:2499-2750のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:2499-2750のいずれか1つに実質的に同一であるRuvC_IIIドメインを含んでいてもよい。 In one aspect, the present disclosure provides an engineered nuclease system that includes (a) an endonuclease. In some cases, the endonuclease is a Cas endonuclease. In some cases, the endonuclease is a type II class II Cas endonuclease. The endonuclease may include a RuvC_III domain, wherein the RuvC_III domain has at least about 70% sequence identity to any one of SEQ ID NOs: 2499-2750. In some cases, the endonuclease may comprise a RuvC_III domain, wherein the RuvC_III domain is at least about 20%, at least about 25%, at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least About 98%, at least about 99% identical. Optionally, the endonuclease may include a RuvC_III domain, wherein the endonuclease is substantially identical to any one of SEQ ID NOs: 2499-2750. The endonuclease may include a RuvC_III domain having at least about 70% sequence identity to any one of SEQ ID NOs: 2499-2750. In some cases, the endonuclease is at least about 20%, at least about 25%, at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about RuvC_III domains having an identity of 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%. May contain. In some cases, the endonuclease may include a RuvC_III domain that is substantially identical to any one of SEQ ID NOs: 2499-2750.

エンドヌクレアーゼは、配列番号:4313-4564のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4313-4564のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4313-4564のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。エンドヌクレアーゼは、配列番号:4313-4564のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4067-4295のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4313-4564のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。 The endonuclease may include an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 4313-4564. In some cases, the endonuclease is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about HNH domains having an identity of 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99%. May contain. The endonuclease may contain an HNH domain substantially identical to any one of SEQ ID NOs: 4313-4564. The endonuclease may include an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 4313-4564. In some cases, the endonuclease is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about HNH domains having an identity of 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99%. May contain. The endonuclease may contain an HNH domain substantially identical to any one of SEQ ID NOs: 4313-4564.

場合によっては、エンドヌクレアーゼは、配列番号:678-929のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:678-929のいずれか1つと実質的に同一であってもよい。場合によっては、エンドヌクレアーゼは、配列番号:678-929のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:678-929のいずれか1つと実質的に同一であってもよい。 In some cases, the endonuclease is at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about Variants having 97%, at least about 98%, or at least about 99% identity may be included. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 678-929. In some cases, the endonuclease is at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about Variants having 97%, at least about 98%, or at least about 99% identity may be included. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 678-929.

場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有する変異体を含んでもよい。NLSは前記エンドヌクレアーゼのN末端またはC末端の近位であってもよい。NLSは、配列番号:678-929のいずれか1つのN末端またはC末端で、あるいは、配列番号:678-929のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体のN末端またはC末端で付加されてもよい。NLSはSV40ラージT抗原NLSであってもよい。NLSはc-myc NLSであってもよい。NLSは、配列番号:5593-5608のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含むことができる。NLSは配列番号:5593-5608のいずれか1つと実質的に同一の配列を含むことができる。NLSは、表1の配列のいずれか、またはその組み合わせを含むことができる: In some cases, the endonuclease may include a variant with one or more nuclear localization sequences (NLS). The NLS may be proximal to the N-terminus or C-terminus of the endonuclease. NLS is at least about 30%, at least about 35%, at least about 40% at the N-terminus or C-terminus of any one of SEQ ID NO: 678-929, or at least about 35%, at least about 40% relative to any one of SEQ ID NO: 678-929. %, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90% %, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. The NLS may be an SV40 large T antigen NLS. The NLS may be a c-myc NLS. The NLS comprises a sequence having at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 99% identity to any one of SEQ ID NOs: 5593-5608. I can do it. The NLS can include a sequence substantially identical to any one of SEQ ID NOs: 5593-5608. The NLS can include any of the sequences in Table 1, or a combination thereof:

場合によっては、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、またはSmith-Waterman相同性検索アルゴリズムによって決定されてもよい。配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータを使用し、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリクスを使用し、および条件付き組成スコアマトリクス調整を使用して、BLASTPアルゴリズムで決定することができる。 In some cases, sequence identity may be determined by BLASTP, CLUSTALW, MUSCLE, MAFFT, Novafold, or Smith-Waterman homology search algorithms. Sequence identity was determined using the BLOSUM62 scoring matrix using parameters of wordlength (W) of 3, expectation (E) of 10, and gap cost with existence of 11, extension of 1, and conditional composition. It can be determined with the BLASTP algorithm using a score matrix adjustment.

場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を有するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)を含んでもよい。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合可能なPAM配列を含んでもよい。場合によっては、標的化領域の5’のほとんどのヌクレオチドがGであってもよい。場合によっては、5’標的化領域は15~23ヌクレオチド長であってもよい。ガイド配列およびtracr配列は、別のリボ核酸(RNA)または単一リボ核酸(RNA)として供給されてもよい。ガイドRNAは、標的化領域の3’にcrRNA tracrRNA結合配列を含んでもよい。ガイドRNAは、crRNA tracrRNA結合領域の3’に4-ヌクレオチドリンカーが先行するtracrRNA配列を含んでもよい。sgRNAは、5’から3’に、細胞の標的配列にハイブリダイズすることができる非天然ガイド核酸配列、および、tracr配列を含んでもよい。場合によっては、非天然ガイド核酸配列およびtracr配列は共有結合される。 Optionally, the system comprises: (b) at least one engineered synthetic guide ribonucleic acid (sgRNA) capable of forming a complex with an endonuclease having a 5' targeting region complementary to the desired cleavage sequence; May include. In some cases, the 5' targeting region may include a PAM sequence that is compatible with an endonuclease. In some cases, most nucleotides 5' of the targeting region may be G's. In some cases, the 5' targeting region may be 15-23 nucleotides in length. The guide sequence and tracr sequence may be provided as separate ribonucleic acids (RNA) or as a single ribonucleic acid (RNA). The guide RNA may include a crRNA tracrRNA binding sequence 3' of the targeting region. The guide RNA may include a tracrRNA sequence preceded by a 4-nucleotide linker 3' of the crRNA tracrRNA binding region. The sgRNA may include, 5' to 3', a non-natural guide nucleic acid sequence capable of hybridizing to a cellular target sequence, and a tracr sequence. In some cases, the non-natural guide nucleic acid sequence and the tracr sequence are covalently linked.

場合によっては、tracr配列は特別な配列を有していてもよい。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%を有してもよい。tracr配列は、配列番号:5505の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%の配列同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5505の少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5505の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドと実質的に同一であってもよい。tracrRNAは、配列番号:5505を含んでもよい。 In some cases, the tracr sequence may have a special sequence. A tracr sequence comprises at least about 60 to 100 (e.g., at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) contiguous nucleotides of a natural tracr RNA sequence. may have at least about 80%. The tracr sequence comprises at least about 60 to 100 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) contiguous nucleotides of SEQ ID NO: 5505. may have at least about 80% sequence identity to. In some cases, the tracrRNA is at least about 60 to 90 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) of SEQ ID NO: 5505. At least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96 consecutive nucleotides %, at least about 97%, at least about 98%, or at least about 99%. In some cases, the tracrRNA comprises at least about 60 to 100 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) of SEQ ID NO: 5505. Consecutive nucleotides may be substantially identical. tracrRNA may include SEQ ID NO:5505.

場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号:5469に対して少なくとも約80%の同一性を有する配列を含んでもよい。sgRNAは、配列番号:5469に対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含んでもよい。sgRNAは配列番号:5469と実質的に同一の配列を含んでもよい。 Optionally, the at least one engineered synthetic guide ribonucleic acid (sgRNA) capable of forming a complex with an endonuclease may include a sequence having at least about 80% identity to SEQ ID NO: 5469. . The sgRNA is at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, relative to SEQ ID NO: 5469. It may include sequences having at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. The sgRNA may include a sequence substantially identical to SEQ ID NO:5469.

場合によっては、上記システムは、標的DNA遺伝子座における切断のために第1の領域および第2の領域を標的とする2つの異なるsgRNAを含んでいてもよく、ここで、第2の領域は第1の領域に対して3’である。場合によっては、上記システムは、5’から3’に、第1の領域の5’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第1の相同性アーム、少なくとも約10ヌクレオチドの合成DNA配列、および、第2の領域の3’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第2の相同性アームを含む、一本鎖または二本鎖のDNA修復鋳型を含んでいてもよい。 In some cases, the system may include two different sgRNAs that target a first region and a second region for cleavage at a target DNA locus, where the second region is a second region. 3' for a region of 1. In some cases, the system includes 5' to 3' at least about 20 (e.g., at least about 40, 80, 120, 150, 200, 300, 500, or 1 kb) nucleotides 5' of the first region. a first homology arm comprising a synthetic DNA sequence of at least about 10 nucleotides, and 3′ of the second region at least about 20 (e.g., at least about 40, 80, 120, 150, 200, 300, 500, or 1 kb) of nucleotides).

他の態様では、本開示は、所望の標的核酸遺伝子座を改変するための方法を提供する。本方法は、本明細書に開示された酵素および少なくとも1つの合成ガイドRNA(sgRNA)を含む本明細書で開示された非天然のシステムのいずれかを、標的核酸遺伝子座に送達する工程を含んでもよい。酵素は、少なくとも1つのsgRNAと複合体を形成してもよく、複合体が所望の標的核酸遺伝子座に結合すると、所望の標的核酸遺伝子座を改変してもよい。酵素を前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をトランスフェクトすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をエレクトロポレーションすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、所望の遺伝子座を含む核酸を有する緩衝液中でシステムをインキュベートすることを含んでもよい。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含んでもよい。標的核酸遺伝子座は細胞内にあってもよい。標的核酸遺伝子座はインビトロであってもよい。標的核酸遺伝子座は、真核細胞内にあっても、原核細胞内にあってもよい。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、または植物細胞であってもよい。酵素は、所望の標的遺伝子座で、またはその近辺で、一本鎖または二本鎖の切断を誘導してもよい。 In other aspects, the disclosure provides methods for modifying a desired target nucleic acid locus. The method comprises delivering any of the non-natural systems disclosed herein comprising an enzyme disclosed herein and at least one synthetic guide RNA (sgRNA) to a target nucleic acid locus. But that's fine. The enzyme may form a complex with at least one sgRNA and modify the desired target nucleic acid locus upon binding of the complex to the desired target nucleic acid locus. Delivering an enzyme to said locus may include transfecting a cell with said system or a nucleic acid encoding said system. Delivering a nuclease to said locus may include electroporating a cell with said system or a nucleic acid encoding said system. Delivering a nuclease to the locus may include incubating the system in a buffer with a nucleic acid containing the desired locus. In some cases, the target nucleic acid locus comprises deoxyribonucleic acid (DNA) or ribonucleic acid (RNA). The target nucleic acid locus may include genomic DNA, viral DNA, viral RNA, or bacterial DNA. The target nucleic acid locus may be intracellular. The target nucleic acid locus may be in vitro. The target nucleic acid locus may be within a eukaryotic or prokaryotic cell. The cell may be an animal cell, a human cell, a bacterial cell, an archaeal cell, or a plant cell. The enzyme may induce single-stranded or double-stranded breaks at or near the desired target locus.

標的核酸の遺伝子座が細胞内にあり得る場合では、酵素は、配列番号:2499-2750のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードするオープンリーディングフレームを含む核酸として供給されてもよい。前記エンドヌクレアーゼをコードするオープンリーディングフレームを含むデオキシリボ核酸(DNA)は、配列番号:5581と実質的に同一の配列、あるいは、配列番号:5581に対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでもよい。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトβアクチン、CAG、TRE、またはCaMKIIaプロモーターであってもよい。エンドヌクレアーゼは、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含むキャップされたmRNAとして供給されてもよい。エンドヌクレアーゼは、翻訳されたポリペプチドとして提供されてもよい。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された前記少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含むデオキシリボ核酸(DNA)として供給されてもよい。場合によっては、生物は真核生物であってもよい。場合によっては、生物は真菌であってもよい。場合によっては、生物はヒトであってもよい。 In cases where the target nucleic acid locus may be intracellular, the enzyme has at least about 75% (e.g., at least about 90%, at least about 91%, at least Enzymes having RuvC_III domains having an identity of about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%). It may also be provided as a nucleic acid containing an encoding open reading frame. The deoxyribonucleic acid (DNA) comprising the open reading frame encoding the endonuclease has a sequence substantially identical to SEQ ID NO: 5581, or at least about 30%, at least about 35%, at least about SEQ ID NO: 5581. about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least Variants having about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity may be included. In some cases, the nucleic acid includes a promoter to which is operably linked an open reading frame encoding an endonuclease. The promoter may be a CMV, EF1a, SV40, PGK1, Ubc, human β-actin, CAG, TRE, or CaMKIIa promoter. The endonuclease may be provided as a capped mRNA containing the open reading frame encoding the endonuclease. The endonuclease may be provided as a translated polypeptide. The at least one engineered sgRNA may be provided as deoxyribonucleic acid (DNA) comprising a genetic sequence encoding said at least one engineered sgRNA operably linked to a ribonucleic acid (RNA) pol III promoter. . In some cases, the organism may be eukaryotic. In some cases, the organism may be a fungus. In some cases, the organism may be a human.

MG15酵素 MG15 enzyme

一態様では、本開示は、(a)エンドヌクレアーゼを含む操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼはCasエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型のクラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、前記RuvC_IIIドメインは、配列番号:2751-2913のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、RuvC_IIIドメインは、配列番号:2751-2913のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、配列番号:2751-2913のいずれか1つに実質的に同一である。エンドヌクレアーゼは、配列番号:2751-2913のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:2751-2913のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:2751-2913のいずれか1つに実質的に同一であるRuvC_IIIドメインを含んでいてもよい。 In one aspect, the present disclosure provides an engineered nuclease system that includes (a) an endonuclease. In some cases, the endonuclease is a Cas endonuclease. In some cases, the endonuclease is a type II class II Cas endonuclease. The endonuclease may include a RuvC_III domain, wherein the RuvC_III domain has at least about 70% sequence identity to any one of SEQ ID NOs: 2751-2913. In some cases, the endonuclease may comprise a RuvC_III domain, wherein the RuvC_III domain is at least about 20%, at least about 25%, at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least About 98%, at least about 99% identical. Optionally, the endonuclease may include a RuvC_III domain, wherein the endonuclease is substantially identical to any one of SEQ ID NOs: 2751-2913. The endonuclease may include a RuvC_III domain having at least about 70% sequence identity to any one of SEQ ID NOs: 2751-2913. In some cases, the endonuclease is at least about 20%, at least about 25%, at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about RuvC_III domains having an identity of 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%. May contain. In some cases, the endonuclease may include a RuvC_III domain that is substantially identical to any one of SEQ ID NOs: 2751-2913.

エンドヌクレアーゼは、配列番号:4565-4727のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4565-4727のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4565-4727のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。エンドヌクレアーゼは、配列番号:4565-4727のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4565-4727のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4565-4727のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。 The endonuclease may include an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 4565-4727. In some cases, the endonuclease is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about HNH domains having an identity of 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99%. May contain. The endonuclease may contain an HNH domain substantially identical to any one of SEQ ID NOs: 4565-4727. The endonuclease may include an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 4565-4727. In some cases, the endonuclease is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about HNH domains having an identity of 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99%. May contain. The endonuclease may contain an HNH domain substantially identical to any one of SEQ ID NOs: 4565-4727.

場合によっては、エンドヌクレアーゼは、配列番号:930-1092のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:930-1092のいずれか1つと実質的に同一であってもよい。場合によっては、エンドヌクレアーゼは、配列番号:930-1092のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:930-1092のいずれか1つと実質的に同一であってもよい。 In some cases, the endonuclease is at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about Variants having 97%, at least about 98%, or at least about 99% identity may be included. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 930-1092. In some cases, the endonuclease is at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about Variants having 97%, at least about 98%, or at least about 99% identity may be included. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 930-1092.

場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有する変異体を含んでもよい。NLSは前記エンドヌクレアーゼのN末端またはC末端の近位であってもよい。NLSは、配列番号:930-1092のいずれか1つのN末端またはC末端で、あるいは、配列番号:930-1092のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体のN末端またはC末端で付加されてもよい。NLSはSV40ラージT抗原NLSであってもよい。NLSはc-myc NLSであってもよい。NLSは、配列番号:5593-5608のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含むことができる。NLSは配列番号:5593-5608のいずれか1つと実質的に同一の配列を含むことができる。NLSは、表1の配列のいずれか、またはその組み合わせを含むことができる: In some cases, the endonuclease may include a variant with one or more nuclear localization sequences (NLS). The NLS may be proximal to the N-terminus or C-terminus of the endonuclease. NLS is at least about 30%, at least about 35%, at least about 40% at the N-terminus or C-terminus of any one of SEQ ID NO: 930-1092, or at least about 35%, at least about 40% relative to any one of SEQ ID NO: 930-1092. %, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90% %, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. The NLS may be an SV40 large T antigen NLS. The NLS may be a c-myc NLS. The NLS comprises a sequence having at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 99% identity to any one of SEQ ID NOs: 5593-5608. I can do it. The NLS can include a sequence substantially identical to any one of SEQ ID NOs: 5593-5608. The NLS can include any of the sequences in Table 1, or a combination thereof:

場合によっては、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、またはSmith-Waterman相同性検索アルゴリズムによって決定されてもよい。配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータを使用し、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリクスを使用し、および条件付き組成スコアマトリクス調整を使用して、BLASTPアルゴリズムで決定することができる。 In some cases, sequence identity may be determined by BLASTP, CLUSTALW, MUSCLE, MAFFT, Novafold, or Smith-Waterman homology search algorithms. Sequence identity was determined using the BLOSUM62 scoring matrix using parameters of wordlength (W) of 3, expectation (E) of 10, and gap cost with existence of 11, extension of 1, and conditional composition. It can be determined with the BLASTP algorithm using a score matrix adjustment.

場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を有するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)を含んでもよい。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合可能なPAM配列を含んでもよい。場合によっては、標的化領域の5’のほとんどのヌクレオチドがGであってもよい。場合によっては、5’標的化領域は15~23ヌクレオチド長であってもよい。ガイド配列およびtracr配列は、別のリボ核酸(RNA)または単一リボ核酸(RNA)として供給されてもよい。ガイドRNAは、標的化領域の3’にcrRNA tracrRNA結合配列を含んでもよい。ガイドRNAは、crRNA tracrRNA結合領域の3’に4-ヌクレオチドリンカーが先行するtracrRNA配列を含んでもよい。sgRNAは、5’から3’に、細胞の標的配列にハイブリダイズすることができる非天然ガイド核酸配列、および、tracr配列を含んでもよい。場合によっては、非天然ガイド核酸配列およびtracr配列は共有結合される。 Optionally, the system comprises: (b) at least one engineered synthetic guide ribonucleic acid (sgRNA) capable of forming a complex with an endonuclease having a 5' targeting region complementary to the desired cleavage sequence; May include. In some cases, the 5' targeting region may include a PAM sequence that is compatible with an endonuclease. In some cases, most nucleotides 5' of the targeting region may be G's. In some cases, the 5' targeting region may be 15-23 nucleotides in length. The guide sequence and tracr sequence may be provided as separate ribonucleic acids (RNA) or as a single ribonucleic acid (RNA). The guide RNA may include a crRNA tracrRNA binding sequence 3' of the targeting region. The guide RNA may include a tracrRNA sequence preceded by a 4-nucleotide linker 3' of the crRNA tracrRNA binding region. The sgRNA may include, 5' to 3', a non-natural guide nucleic acid sequence capable of hybridizing to a cellular target sequence, and a tracr sequence. In some cases, the non-natural guide nucleic acid sequence and the tracr sequence are covalently linked.

場合によっては、tracr配列は特別な配列を有していてもよい。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%を有してもよい。tracr配列は、配列番号:5506の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%の配列同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5506の少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5506の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドと実質的に同一であってもよい。tracrRNAは、配列番号:5506を含んでもよい。 In some cases, the tracr sequence may have a special sequence. A tracr sequence comprises at least about 60 to 100 (e.g., at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) contiguous nucleotides of a natural tracr RNA sequence. may have at least about 80%. The tracr sequence comprises at least about 60 to 100 (e.g., at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) contiguous nucleotides of SEQ ID NO: 5506. may have at least about 80% sequence identity to. In some cases, the tracrRNA is at least about 60 to 90 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) of SEQ ID NO: 5506. At least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96 consecutive nucleotides %, at least about 97%, at least about 98%, or at least about 99%. In some cases, the tracrRNA comprises at least about 60 to 100 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) of SEQ ID NO: 5506. Consecutive nucleotides may be substantially identical. tracrRNA may include SEQ ID NO:5506.

場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号:5470に対して少なくとも約80%の同一性を有する配列を含んでもよい。sgRNAは、配列番号:5470に対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含んでもよい。sgRNAは配列番号:5470と実質的に同一の配列を含んでもよい。 Optionally, the at least one engineered synthetic guide ribonucleic acid (sgRNA) capable of forming a complex with an endonuclease may include a sequence having at least about 80% identity to SEQ ID NO: 5470. . The sgRNA is at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, relative to SEQ ID NO: 5470. It may include sequences having at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. The sgRNA may include a sequence substantially identical to SEQ ID NO:5470.

場合によっては、上記システムは、標的DNA遺伝子座における切断のために第1の領域および第2の領域を標的とする2つの異なるsgRNAを含んでいてもよく、ここで、第2の領域は第1の領域に対して3’である。場合によっては、上記システムは、5’から3’に、第1の領域の5’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第1の相同性アーム、少なくとも約10ヌクレオチドの合成DNA配列、および、第2の領域の3’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第2の相同性アームを含む、一本鎖または二本鎖のDNA修復鋳型を含んでいてもよい。 In some cases, the system may include two different sgRNAs that target a first region and a second region for cleavage at a target DNA locus, where the second region is a second region. 3' for a region of 1. In some cases, the system includes 5' to 3' at least about 20 (e.g., at least about 40, 80, 120, 150, 200, 300, 500, or 1 kb) nucleotides 5' of the first region. a first homology arm comprising a synthetic DNA sequence of at least about 10 nucleotides, and 3′ of the second region at least about 20 (e.g., at least about 40, 80, 120, 150, 200, 300, 500, or 1 kb) of nucleotides).

他の態様では、本開示は、所望の標的核酸遺伝子座を改変するための方法を提供する。本方法は、本明細書に開示された酵素および少なくとも1つの合成ガイドRNA(sgRNA)を含む本明細書で開示された非天然のシステムのいずれかを、標的核酸遺伝子座に送達する工程を含んでもよい。酵素は、少なくとも1つのsgRNAと複合体を形成してもよく、複合体が所望の標的核酸遺伝子座に結合すると、所望の標的核酸遺伝子座を改変してもよい。酵素を前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をトランスフェクトすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をエレクトロポレーションすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、所望の遺伝子座を含む核酸を有する緩衝液中でシステムをインキュベートすることを含んでもよい。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含んでもよい。標的核酸遺伝子座は細胞内にあってもよい。標的核酸遺伝子座はインビトロであってもよい。標的核酸遺伝子座は、真核細胞内にあっても、原核細胞内にあってもよい。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、または植物細胞であってもよい。酵素は、所望の標的遺伝子座で、またはその近辺で、一本鎖または二本鎖の切断を誘導してもよい。 In other aspects, the disclosure provides methods for modifying a desired target nucleic acid locus. The method comprises delivering any of the non-natural systems disclosed herein comprising an enzyme disclosed herein and at least one synthetic guide RNA (sgRNA) to a target nucleic acid locus. But that's fine. The enzyme may form a complex with at least one sgRNA and modify the desired target nucleic acid locus upon binding of the complex to the desired target nucleic acid locus. Delivering an enzyme to said locus may include transfecting a cell with said system or a nucleic acid encoding said system. Delivering a nuclease to said locus may include electroporating a cell with said system or a nucleic acid encoding said system. Delivering a nuclease to the locus may include incubating the system in a buffer with a nucleic acid containing the desired locus. In some cases, the target nucleic acid locus comprises deoxyribonucleic acid (DNA) or ribonucleic acid (RNA). The target nucleic acid locus may include genomic DNA, viral DNA, viral RNA, or bacterial DNA. The target nucleic acid locus may be intracellular. The target nucleic acid locus may be in vitro. The target nucleic acid locus may be within a eukaryotic or prokaryotic cell. The cell may be an animal cell, a human cell, a bacterial cell, an archaeal cell, or a plant cell. The enzyme may induce single-stranded or double-stranded breaks at or near the desired target locus.

標的核酸の遺伝子座が細胞内にあり得る場合では、酵素は、配列番号:2751-2913のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードするオープンリーディングフレームを含む核酸として供給されてもよい。前記エンドヌクレアーゼをコードするオープンリーディングフレームを含むデオキシリボ核酸(DNA)は、配列番号:5582と実質的に同一の配列、あるいは、配列番号:5582に対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでもよい。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトβアクチン、CAG、TRE、またはCaMKIIaプロモーターであってもよい。エンドヌクレアーゼは、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含むキャップされたmRNAとして供給されてもよい。エンドヌクレアーゼは、翻訳されたポリペプチドとして提供されてもよい。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された前記少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含むデオキシリボ核酸(DNA)として供給されてもよい。場合によっては、生物は真核生物であってもよい。場合によっては、生物は真菌であってもよい。場合によっては、生物はヒトであってもよい。 In cases where the target nucleic acid locus may be intracellular, the enzyme has at least about 75% (e.g., at least about 90%, at least about 91%, at least Enzymes having RuvC_III domains having an identity of about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%) It may also be provided as a nucleic acid containing an encoding open reading frame. The deoxyribonucleic acid (DNA) comprising the open reading frame encoding the endonuclease has a sequence substantially identical to SEQ ID NO: 5582, or at least about 30%, at least about 35%, at least about SEQ ID NO: 5582. about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least Variants having about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity may be included. In some cases, the nucleic acid includes a promoter to which is operably linked an open reading frame encoding an endonuclease. The promoter may be a CMV, EF1a, SV40, PGK1, Ubc, human β-actin, CAG, TRE, or CaMKIIa promoter. The endonuclease may be provided as a capped mRNA containing the open reading frame encoding the endonuclease. The endonuclease may be provided as a translated polypeptide. The at least one engineered sgRNA may be provided as deoxyribonucleic acid (DNA) comprising a genetic sequence encoding said at least one engineered sgRNA operably linked to a ribonucleic acid (RNA) pol III promoter. . In some cases, the organism may be eukaryotic. In some cases, the organism may be a fungus. In some cases, the organism may be a human.

MG16酵素 MG16 enzyme

一態様では、本開示は、(a)エンドヌクレアーゼを含む操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼはCasエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型のクラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、前記RuvC_IIIドメインは、配列番号:2914-3174のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、RuvC_IIIドメインは、配列番号:2914-3174のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、配列番号:2914-3174のいずれか1つに実質的に同一である。エンドヌクレアーゼは、配列番号:2914-3174のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:2914-3174のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:2914-3174のいずれか1つに実質的に同一であるRuvC_IIIドメインを含んでいてもよい。 In one aspect, the present disclosure provides an engineered nuclease system that includes (a) an endonuclease. In some cases, the endonuclease is a Cas endonuclease. In some cases, the endonuclease is a type II class II Cas endonuclease. The endonuclease may include a RuvC_III domain, wherein the RuvC_III domain has at least about 70% sequence identity to any one of SEQ ID NOs: 2914-3174. In some cases, the endonuclease may include a RuvC_III domain, wherein the RuvC_III domain is at least about 20%, at least about 25%, at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least About 98%, at least about 99% identical. Optionally, the endonuclease may include a RuvC_III domain, wherein the endonuclease is substantially identical to any one of SEQ ID NOs: 2914-3174. The endonuclease may include a RuvC_III domain having at least about 70% sequence identity to any one of SEQ ID NOs: 2914-3174. In some cases, the endonuclease is at least about 20%, at least about 25%, at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about RuvC_III domains having an identity of 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%. May contain. In some cases, the endonuclease may include a RuvC_III domain that is substantially identical to any one of SEQ ID NOs: 2914-3174.

エンドヌクレアーゼは、配列番号:4728-4988のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4728-4988のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4728-4988のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。エンドヌクレアーゼは、配列番号:4728-4988のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4728-4988のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4728-4988のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。 The endonuclease may include an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 4728-4988. In some cases, the endonuclease is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about HNH domains having an identity of 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99%. May contain. The endonuclease may contain an HNH domain substantially identical to any one of SEQ ID NOs: 4728-4988. The endonuclease may include an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 4728-4988. In some cases, the endonuclease is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about HNH domains having an identity of 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99%. May contain. The endonuclease may contain an HNH domain substantially identical to any one of SEQ ID NOs: 4728-4988.

場合によっては、エンドヌクレアーゼは、配列番号:1093-1353のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:1093-1353のいずれか1つと実質的に同一であってもよい。場合によっては、エンドヌクレアーゼは、配列番号:1093-1353のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:1093-1353のいずれか1つと実質的に同一であってもよい。 In some cases, the endonuclease is at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about Variants having 97%, at least about 98%, or at least about 99% identity may be included. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 1093-1353. In some cases, the endonuclease is at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about Variants having 97%, at least about 98%, or at least about 99% identity may be included. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 1093-1353.

場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有する変異体を含んでもよい。NLSは前記エンドヌクレアーゼのN末端またはC末端の近位であってもよい。NLSは、配列番号:1093-1353のいずれか1つに対してN末端またはC末端で、あるいは、配列番号:1093-1353のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体に、付加されてもよい。NLSはSV40ラージT抗原NLSであってもよい。NLSはc-myc NLSであってもよい。NLSは、配列番号:5593-5608のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含むことができる。NLSは配列番号:5593-5608のいずれか1つと実質的に同一の配列を含むことができる。NLSは、表1の配列のいずれか、またはその組み合わせを含むことができる: In some cases, the endonuclease may include a variant with one or more nuclear localization sequences (NLS). The NLS may be proximal to the N-terminus or C-terminus of the endonuclease. NLS is at the N-terminus or C-terminus to any one of SEQ ID NOs: 1093-1353, or at least about 30%, at least about 35% to any one of SEQ ID NOs: 1093-1353, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, Variants having at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity may be added. The NLS may be an SV40 large T antigen NLS. The NLS may be a c-myc NLS. The NLS comprises a sequence having at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 99% identity to any one of SEQ ID NOs: 5593-5608. I can do it. The NLS can include a sequence substantially identical to any one of SEQ ID NOs: 5593-5608. The NLS can include any of the sequences in Table 1, or a combination thereof:

場合によっては、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、またはSmith-Waterman相同性検索アルゴリズムによって決定されてもよい。配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータを使用し、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリクスを使用し、および条件付き組成スコアマトリクス調整を使用して、BLASTPアルゴリズムで決定することができる。 In some cases, sequence identity may be determined by BLASTP, CLUSTALW, MUSCLE, MAFFT, Novafold, or Smith-Waterman homology search algorithms. Sequence identity was determined using the BLOSUM62 scoring matrix using parameters of wordlength (W) of 3, expectation (E) of 10, and gap cost with existence of 11, extension of 1, and conditional composition. It can be determined with the BLASTP algorithm using a score matrix adjustment.

場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を有するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)を含んでもよい。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合可能なPAM配列を含んでもよい。場合によっては、標的化領域の5’のほとんどのヌクレオチドがGであってもよい。場合によっては、5’標的化領域は15~23ヌクレオチド長であってもよい。ガイド配列およびtracr配列は、別のリボ核酸(RNA)または単一リボ核酸(RNA)として供給されてもよい。ガイドRNAは、標的化領域の3’にcrRNA tracrRNA結合配列を含んでもよい。ガイドRNAは、crRNA tracrRNA結合領域の3’に4-ヌクレオチドリンカーが先行するtracrRNA配列を含んでもよい。sgRNAは、5’から3’に、細胞の標的配列にハイブリダイズすることができる非天然ガイド核酸配列、および、tracr配列を含んでもよい。場合によっては、非天然ガイド核酸配列およびtracr配列は共有結合される。 Optionally, the system comprises: (b) at least one engineered synthetic guide ribonucleic acid (sgRNA) capable of forming a complex with an endonuclease having a 5' targeting region complementary to the desired cleavage sequence; May include. In some cases, the 5' targeting region may include a PAM sequence that is compatible with an endonuclease. In some cases, most nucleotides 5' of the targeting region may be G's. In some cases, the 5' targeting region may be 15-23 nucleotides in length. The guide sequence and tracr sequence may be provided as separate ribonucleic acids (RNA) or as a single ribonucleic acid (RNA). The guide RNA may include a crRNA tracrRNA binding sequence 3' of the targeting region. The guide RNA may include a tracrRNA sequence preceded by a 4-nucleotide linker 3' of the crRNA tracrRNA binding region. The sgRNA may include, 5' to 3', a non-natural guide nucleic acid sequence capable of hybridizing to a cellular target sequence, and a tracr sequence. In some cases, the non-natural guide nucleic acid sequence and the tracr sequence are covalently linked.

場合によっては、tracr配列は特別な配列を有していてもよい。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%を有してもよい。tracr配列は、配列番号:5507の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%の配列同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5507の少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5507の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドと実質的に同一であってもよい。tracrRNAは、配列番号:5507を含んでもよい。 In some cases, the tracr sequence may have a special sequence. A tracr sequence comprises at least about 60 to 100 (e.g., at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) contiguous nucleotides of a natural tracr RNA sequence. may have at least about 80%. The tracr sequence comprises at least about 60 to 100 (e.g., at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) contiguous nucleotides of SEQ ID NO: 5507. may have at least about 80% sequence identity to. In some cases, the tracrRNA is at least about 60 to 90 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) of SEQ ID NO: 5507. At least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96 consecutive nucleotides %, at least about 97%, at least about 98%, or at least about 99%. In some cases, the tracrRNA is at least about 60 to 100 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) of SEQ ID NO: 5507. Consecutive nucleotides may be substantially identical. tracrRNA may include SEQ ID NO:5507.

場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号:5471に対して少なくとも約80%の同一性を有する配列を含んでもよい。sgRNAは、配列番号:5471に対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含んでもよい。sgRNAは配列番号:5471と実質的に同一の配列を含んでもよい。 Optionally, the at least one engineered synthetic guide ribonucleic acid (sgRNA) capable of forming a complex with an endonuclease may include a sequence having at least about 80% identity to SEQ ID NO: 5471. . The sgRNA is at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, relative to SEQ ID NO: 5471. It may include sequences having at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. The sgRNA may include a sequence substantially identical to SEQ ID NO:5471.

場合によっては、上記システムは、標的DNA遺伝子座における切断のために第1の領域および第2の領域を標的とする2つの異なるsgRNAを含んでいてもよく、ここで、第2の領域は第1の領域に対して3’である。場合によっては、上記システムは、5’から3’に、第1の領域の5’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第1の相同性アーム、少なくとも約10ヌクレオチドの合成DNA配列、および、第2の領域の3’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第2の相同性アームを含む、一本鎖または二本鎖のDNA修復鋳型を含んでいてもよい。 In some cases, the system may include two different sgRNAs that target a first region and a second region for cleavage at a target DNA locus, where the second region is a second region. 3' for a region of 1. In some cases, the system includes 5' to 3' at least about 20 (e.g., at least about 40, 80, 120, 150, 200, 300, 500, or 1 kb) nucleotides 5' of the first region. a first homology arm comprising a synthetic DNA sequence of at least about 10 nucleotides, and 3′ of the second region at least about 20 (e.g., at least about 40, 80, 120, 150, 200, 300, 500, or 1 kb) of nucleotides).

他の態様では、本開示は、所望の標的核酸遺伝子座を改変するための方法を提供する。本方法は、本明細書に開示された酵素および少なくとも1つの合成ガイドRNA(sgRNA)を含む本明細書で開示された非天然のシステムのいずれかを、標的核酸遺伝子座に送達する工程を含んでもよい。酵素は、少なくとも1つのsgRNAと複合体を形成してもよく、複合体が所望の標的核酸遺伝子座に結合すると、所望の標的核酸遺伝子座を改変してもよい。酵素を前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をトランスフェクトすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をエレクトロポレーションすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、所望の遺伝子座を含む核酸を有する緩衝液中でシステムをインキュベートすることを含んでもよい。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含んでもよい。標的核酸遺伝子座は細胞内にあってもよい。標的核酸遺伝子座はインビトロであってもよい。標的核酸遺伝子座は、真核細胞内にあっても、原核細胞内にあってもよい。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、または植物細胞であってもよい。酵素は、所望の標的遺伝子座で、またはその近辺で、一本鎖または二本鎖の切断を誘導してもよい。 In other aspects, the disclosure provides methods for modifying a desired target nucleic acid locus. The method comprises delivering any of the non-natural systems disclosed herein comprising an enzyme disclosed herein and at least one synthetic guide RNA (sgRNA) to a target nucleic acid locus. But that's fine. The enzyme may form a complex with at least one sgRNA and modify the desired target nucleic acid locus upon binding of the complex to the desired target nucleic acid locus. Delivering an enzyme to said locus may include transfecting a cell with said system or a nucleic acid encoding said system. Delivering a nuclease to said locus may include electroporating a cell with said system or a nucleic acid encoding said system. Delivering a nuclease to the locus may include incubating the system in a buffer with a nucleic acid containing the desired locus. In some cases, the target nucleic acid locus comprises deoxyribonucleic acid (DNA) or ribonucleic acid (RNA). The target nucleic acid locus may include genomic DNA, viral DNA, viral RNA, or bacterial DNA. The target nucleic acid locus may be intracellular. The target nucleic acid locus may be in vitro. The target nucleic acid locus may be within a eukaryotic or prokaryotic cell. The cell may be an animal cell, a human cell, a bacterial cell, an archaeal cell, or a plant cell. The enzyme may induce single-stranded or double-stranded breaks at or near the desired target locus.

標的核酸の遺伝子座が細胞内にあり得る場合では、酵素は、配列番号:2914-3174のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードするオープンリーディングフレームを含む核酸として供給されてもよい。前記エンドヌクレアーゼをコードするオープンリーディングフレームを含むデオキシリボ核酸(DNA)は、配列番号:5583と実質的に同一の配列、あるいは、配列番号:5583に対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでもよい。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトβアクチン、CAG、TRE、またはCaMKIIaプロモーターであってもよい。エンドヌクレアーゼは、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含むキャップされたmRNAとして供給されてもよい。エンドヌクレアーゼは、翻訳されたポリペプチドとして提供されてもよい。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された前記少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含むデオキシリボ核酸(DNA)として供給されてもよい。場合によっては、生物は真核生物であってもよい。場合によっては、生物は真菌であってもよい。場合によっては、生物はヒトであってもよい。 In cases where the target nucleic acid locus may be intracellular, the enzyme has at least about 75% (e.g., at least about 90%, at least about 91%, at least Enzymes having RuvC_III domains having an identity of about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%). It may also be provided as a nucleic acid containing an encoding open reading frame. The deoxyribonucleic acid (DNA) comprising the open reading frame encoding the endonuclease has a sequence substantially identical to SEQ ID NO: 5583, or at least about 30%, at least about 35%, at least about SEQ ID NO: 5583. about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least Variants having about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity may be included. In some cases, the nucleic acid includes a promoter to which is operably linked an open reading frame encoding an endonuclease. The promoter may be a CMV, EF1a, SV40, PGK1, Ubc, human β-actin, CAG, TRE, or CaMKIIa promoter. The endonuclease may be provided as a capped mRNA containing the open reading frame encoding the endonuclease. The endonuclease may be provided as a translated polypeptide. The at least one engineered sgRNA may be provided as deoxyribonucleic acid (DNA) comprising a genetic sequence encoding said at least one engineered sgRNA operably linked to a ribonucleic acid (RNA) pol III promoter. . In some cases, the organism may be eukaryotic. In some cases, the organism may be a fungus. In some cases, the organism may be a human.

MG18酵素 MG18 enzyme

一態様では、本開示は、(a)エンドヌクレアーゼを含む操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼはCasエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型のクラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、前記RuvC_IIIドメインは、配列番号:3175-3300のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、RuvC_IIIドメインは、配列番号:3175-3300のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、配列番号:3175-3300のいずれか1つに実質的に同一である。エンドヌクレアーゼは、配列番号:3175-3300のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:3175-3300のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:3175-3300のいずれか1つに実質的に同一であるRuvC_IIIドメインを含んでいてもよい。 In one aspect, the present disclosure provides an engineered nuclease system that includes (a) an endonuclease. In some cases, the endonuclease is a Cas endonuclease. In some cases, the endonuclease is a type II class II Cas endonuclease. The endonuclease may include a RuvC_III domain, wherein the RuvC_III domain has at least about 70% sequence identity to any one of SEQ ID NOs: 3175-3300. In some cases, the endonuclease may comprise a RuvC_III domain, wherein the RuvC_III domain is at least about 20%, at least about 25%, at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least About 98%, at least about 99% identical. In some cases, the endonuclease may include a RuvC_III domain, wherein the endonuclease is substantially identical to any one of SEQ ID NOs: 3175-3300. The endonuclease may include a RuvC_III domain having at least about 70% sequence identity to any one of SEQ ID NOs: 3175-3300. In some cases, the endonuclease is at least about 20%, at least about 25%, at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about RuvC_III domains having an identity of 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%. May contain. In some cases, the endonuclease may include a RuvC_III domain that is substantially identical to any one of SEQ ID NOs: 3175-3300.

エンドヌクレアーゼは、配列番号:4989-5146のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4989-5146のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4989-5146のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。エンドヌクレアーゼは、配列番号:4989-5146のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4989-5146のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4989-5146のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。 The endonuclease may include an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 4989-5146. In some cases, the endonuclease is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about HNH domains having an identity of 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99%. May contain. The endonuclease may contain an HNH domain substantially identical to any one of SEQ ID NOs: 4989-5146. The endonuclease may include an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 4989-5146. In some cases, the endonuclease is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about HNH domains having an identity of 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99%. May contain. The endonuclease may contain an HNH domain substantially identical to any one of SEQ ID NOs: 4989-5146.

場合によっては、エンドヌクレアーゼは、配列番号:1354-1511のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:1354-1511のいずれか1つと実質的に同一であってもよい。場合によっては、エンドヌクレアーゼは、配列番号:1354-1511のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:1354-1511のいずれか1つと実質的に同一であってもよい。 In some cases, the endonuclease is at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about Variants having 97%, at least about 98%, or at least about 99% identity may be included. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 1354-1511. In some cases, the endonuclease is at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about Variants having 97%, at least about 98%, or at least about 99% identity may be included. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 1354-1511.

場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有する変異体を含んでもよい。NLSは前記エンドヌクレアーゼのN末端またはC末端の近位であってもよい。NLSは、配列番号:1354-1511のいずれか1つのN末端またはC末端で、あるいは、配列番号:1354-1511のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体のN末端またはC末端で付加されてもよい。NLSはSV40ラージT抗原NLSであってもよい。NLSはc-myc NLSであってもよい。NLSは、配列番号:5593-5608のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含むことができる。NLSは配列番号:5593-5608のいずれか1つと実質的に同一の配列を含むことができる。NLSは、表1の配列のいずれか、またはその組み合わせを含むことができる: In some cases, the endonuclease may include a variant with one or more nuclear localization sequences (NLS). The NLS may be proximal to the N-terminus or C-terminus of the endonuclease. NLS is at least about 30%, at least about 35%, at least about 40% at the N-terminus or C-terminus of any one of SEQ ID NO: 1354-1511, or at least about 35%, at least about 40% relative to any one of SEQ ID NO: 1354-1511. %, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90% %, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. The NLS may be an SV40 large T antigen NLS. The NLS may be a c-myc NLS. The NLS comprises a sequence having at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 99% identity to any one of SEQ ID NOs: 5593-5608. I can do it. The NLS can include a sequence substantially identical to any one of SEQ ID NOs: 5593-5608. The NLS can include any of the sequences in Table 1, or a combination thereof:

場合によっては、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、またはSmith-Waterman相同性検索アルゴリズムによって決定されてもよい。配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータを使用し、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリクスを使用し、および条件付き組成スコアマトリクス調整を使用して、BLASTPアルゴリズムで決定することができる。 In some cases, sequence identity may be determined by BLASTP, CLUSTALW, MUSCLE, MAFFT, Novafold, or Smith-Waterman homology search algorithms. Sequence identity was determined using the BLOSUM62 scoring matrix using parameters of wordlength (W) of 3, expectation (E) of 10, and gap cost with existence of 11, extension of 1, and conditional composition. It can be determined with the BLASTP algorithm using a score matrix adjustment.

場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を有するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)を含んでもよい。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合可能なPAM配列を含んでもよい。場合によっては、標的化領域の5’のほとんどのヌクレオチドがGであってもよい。場合によっては、5’標的化領域は15~23ヌクレオチド長であってもよい。ガイド配列およびtracr配列は、別のリボ核酸(RNA)または単一リボ核酸(RNA)として供給されてもよい。ガイドRNAは、標的化領域の3’にcrRNA tracrRNA結合配列を含んでもよい。ガイドRNAは、crRNA tracrRNA結合領域の3’に4-ヌクレオチドリンカーが先行するtracrRNA配列を含んでもよい。sgRNAは、5’から3’に、細胞の標的配列にハイブリダイズすることができる非天然ガイド核酸配列、および、tracr配列を含んでもよい。場合によっては、非天然ガイド核酸配列およびtracr配列は共有結合される。 Optionally, the system comprises: (b) at least one engineered synthetic guide ribonucleic acid (sgRNA) capable of forming a complex with an endonuclease having a 5' targeting region complementary to the desired cleavage sequence; May include. In some cases, the 5' targeting region may include a PAM sequence that is compatible with an endonuclease. In some cases, most nucleotides 5' of the targeting region may be G's. In some cases, the 5' targeting region may be 15-23 nucleotides in length. The guide sequence and tracr sequence may be provided as separate ribonucleic acids (RNA) or as a single ribonucleic acid (RNA). The guide RNA may include a crRNA tracrRNA binding sequence 3' of the targeting region. The guide RNA may include a tracrRNA sequence preceded by a 4-nucleotide linker 3' of the crRNA tracrRNA binding region. The sgRNA may include, 5' to 3', a non-natural guide nucleic acid sequence capable of hybridizing to a cellular target sequence, and a tracr sequence. In some cases, the non-natural guide nucleic acid sequence and the tracr sequence are covalently linked.

場合によっては、tracr配列は特別な配列を有していてもよい。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%を有してもよい。tracr配列は、配列番号:5508の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%の配列同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5508の少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5508の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドと実質的に同一であってもよい。tracrRNAは、配列番号:5508を含んでもよい。 In some cases, the tracr sequence may have a special sequence. A tracr sequence comprises at least about 60 to 100 (e.g., at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) contiguous nucleotides of a natural tracr RNA sequence. may have at least about 80%. The tracr sequence comprises at least about 60 to 100 (e.g., at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) contiguous nucleotides of SEQ ID NO: 5508. may have at least about 80% sequence identity to. In some cases, the tracrRNA is at least about 60 to 90 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) of SEQ ID NO: 5508. At least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96 consecutive nucleotides %, at least about 97%, at least about 98%, or at least about 99%. In some cases, the tracrRNA comprises at least about 60 to 100 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) of SEQ ID NO: 5508. Consecutive nucleotides may be substantially identical. tracrRNA may include SEQ ID NO:5508.

場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号:5472に対して少なくとも約80%の同一性を有する配列を含んでもよい。sgRNAは、配列番号:5472に対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含んでもよい。sgRNAは配列番号:5472と実質的に同一の配列を含んでもよい。 Optionally, the at least one engineered synthetic guide ribonucleic acid (sgRNA) capable of forming a complex with an endonuclease may include a sequence having at least about 80% identity to SEQ ID NO: 5472. . The sgRNA is at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, relative to SEQ ID NO: 5472. It may include sequences having at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. The sgRNA may include a sequence substantially identical to SEQ ID NO:5472.

場合によっては、上記システムは、標的DNA遺伝子座における切断のために第1の領域および第2の領域を標的とする2つの異なるsgRNAを含んでいてもよく、ここで、第2の領域は第1の領域に対して3’である。場合によっては、上記システムは、5’から3’に、第1の領域の5’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第1の相同性アーム、少なくとも約10ヌクレオチドの合成DNA配列、および、第2の領域の3’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第2の相同性アームを含む、一本鎖または二本鎖のDNA修復鋳型を含んでいてもよい。 In some cases, the system may include two different sgRNAs that target a first region and a second region for cleavage at a target DNA locus, where the second region is a second region. 3' for a region of 1. In some cases, the system includes 5' to 3' at least about 20 (e.g., at least about 40, 80, 120, 150, 200, 300, 500, or 1 kb) nucleotides 5' to the first region. a first homology arm comprising a synthetic DNA sequence of at least about 10 nucleotides, and 3′ of the second region at least about 20 (e.g., at least about 40, 80, 120, 150, 200, 300, 500, or 1 kb) of nucleotides).

他の態様では、本開示は、所望の標的核酸遺伝子座を改変するための方法を提供する。本方法は、本明細書に開示された酵素および少なくとも1つの合成ガイドRNA(sgRNA)を含む本明細書で開示された非天然のシステムのいずれかを、標的核酸遺伝子座に送達する工程を含んでもよい。酵素は、少なくとも1つのsgRNAと複合体を形成してもよく、複合体が所望の標的核酸遺伝子座に結合すると、所望の標的核酸遺伝子座を改変してもよい。酵素を前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をトランスフェクトすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をエレクトロポレーションすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、所望の遺伝子座を含む核酸を有する緩衝液中でシステムをインキュベートすることを含んでもよい。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含んでもよい。標的核酸遺伝子座は細胞内にあってもよい。標的核酸遺伝子座はインビトロであってもよい。標的核酸遺伝子座は、真核細胞内にあっても、原核細胞内にあってもよい。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、または植物細胞であってもよい。酵素は、所望の標的遺伝子座で、またはその近辺で、一本鎖または二本鎖の切断を誘導してもよい。 In other aspects, the disclosure provides methods for modifying a desired target nucleic acid locus. The method comprises delivering any of the non-natural systems disclosed herein comprising an enzyme disclosed herein and at least one synthetic guide RNA (sgRNA) to a target nucleic acid locus. But that's fine. The enzyme may form a complex with at least one sgRNA and modify the desired target nucleic acid locus upon binding of the complex to the desired target nucleic acid locus. Delivering an enzyme to said locus may include transfecting a cell with said system or a nucleic acid encoding said system. Delivering a nuclease to said locus may include electroporating a cell with said system or a nucleic acid encoding said system. Delivering a nuclease to the locus may include incubating the system in a buffer with a nucleic acid containing the desired locus. In some cases, the target nucleic acid locus comprises deoxyribonucleic acid (DNA) or ribonucleic acid (RNA). The target nucleic acid locus may include genomic DNA, viral DNA, viral RNA, or bacterial DNA. The target nucleic acid locus may be intracellular. The target nucleic acid locus may be in vitro. The target nucleic acid locus may be within a eukaryotic or prokaryotic cell. The cell may be an animal cell, a human cell, a bacterial cell, an archaeal cell, or a plant cell. The enzyme may induce single-stranded or double-stranded breaks at or near the desired target locus.

標的核酸の遺伝子座が細胞内にあり得る場合では、酵素は、配列番号:3175-3300のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードするオープンリーディングフレームを含む核酸として供給されてもよい。前記エンドヌクレアーゼをコードするオープンリーディングフレームを含むデオキシリボ核酸(DNA)は、配列番号:5584と実質的に同一の配列、あるいは、配列番号:5584に対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでもよい。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトβアクチン、CAG、TRE、またはCaMKIIaプロモーターであってもよい。エンドヌクレアーゼは、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含むキャップされたmRNAとして供給されてもよい。エンドヌクレアーゼは、翻訳されたポリペプチドとして提供されてもよい。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された前記少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含むデオキシリボ核酸(DNA)として供給されてもよい。場合によっては、生物は真核生物であってもよい。場合によっては、生物は真菌であってもよい。場合によっては、生物はヒトであってもよい。 In cases where the target nucleic acid locus may be intracellular, the enzyme has at least about 75% (e.g., at least about 90%, at least about 91%, at least Enzymes having RuvC_III domains having an identity of about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%). It may also be provided as a nucleic acid containing an encoding open reading frame. The deoxyribonucleic acid (DNA) comprising the open reading frame encoding the endonuclease has a sequence substantially identical to SEQ ID NO: 5584, or at least about 30%, at least about 35%, at least about SEQ ID NO: 5584. about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least Variants having about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity may be included. In some cases, the nucleic acid includes a promoter to which is operably linked an open reading frame encoding an endonuclease. The promoter may be a CMV, EF1a, SV40, PGK1, Ubc, human β-actin, CAG, TRE, or CaMKIIa promoter. The endonuclease may be provided as a capped mRNA containing the open reading frame encoding the endonuclease. The endonuclease may be provided as a translated polypeptide. The at least one engineered sgRNA may be provided as deoxyribonucleic acid (DNA) comprising a genetic sequence encoding said at least one engineered sgRNA operably linked to a ribonucleic acid (RNA) pol III promoter. . In some cases, the organism may be eukaryotic. In some cases, the organism may be a fungus. In some cases, the organism may be a human.

MG21酵素 MG21 enzyme

一態様では、本開示は、(a)エンドヌクレアーゼを含む操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼはCasエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型のクラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、前記RuvC_IIIドメインは、配列番号:3331-3474のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、RuvC_IIIドメインは、配列番号:3331-3474のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、配列番号:3331-3474のいずれか1つに実質的に同一である。エンドヌクレアーゼは、配列番号:3331-3474のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:3331-3474のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:3331-3474のいずれか1つに実質的に同一であるRuvC_IIIドメインを含んでいてもよい。 In one aspect, the present disclosure provides an engineered nuclease system that includes (a) an endonuclease. In some cases, the endonuclease is a Cas endonuclease. In some cases, the endonuclease is a type II class II Cas endonuclease. The endonuclease may include a RuvC_III domain, wherein the RuvC_III domain has at least about 70% sequence identity to any one of SEQ ID NOs: 3331-3474. In some cases, the endonuclease may include a RuvC_III domain, wherein the RuvC_III domain is at least about 20%, at least about 25%, at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least About 98%, at least about 99% identical. Optionally, the endonuclease may include a RuvC_III domain, wherein the endonuclease is substantially identical to any one of SEQ ID NOs: 3331-3474. The endonuclease may include a RuvC_III domain having at least about 70% sequence identity to any one of SEQ ID NOs: 3331-3474. In some cases, the endonuclease is at least about 20%, at least about 25%, at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about RuvC_III domains having an identity of 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%. May contain. In some cases, the endonuclease may include a RuvC_III domain that is substantially identical to any one of SEQ ID NOs: 3331-3474.

エンドヌクレアーゼは、配列番号:5147-5290のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:5147-5290のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:5147-5290のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。エンドヌクレアーゼは、配列番号:5147-5290のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:5147-5290のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:5147-5290のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。 The endonuclease may include an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 5147-5290. In some cases, the endonuclease is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about HNH domains having an identity of 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99%. May contain. The endonuclease may contain an HNH domain substantially identical to any one of SEQ ID NOs: 5147-5290. The endonuclease may include an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 5147-5290. In some cases, the endonuclease is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about HNH domains having an identity of 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99%. May contain. The endonuclease may contain an HNH domain substantially identical to any one of SEQ ID NOs: 5147-5290.

場合によっては、エンドヌクレアーゼは、配列番号:1512-1655のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:1512-1655のいずれか1つと実質的に同一であってもよい。場合によっては、エンドヌクレアーゼは、配列番号:1512-1655のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:1512-1655のいずれか1つと実質的に同一であってもよい。 In some cases, the endonuclease is at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about Variants having 97%, at least about 98%, or at least about 99% identity may be included. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 1512-1655. In some cases, the endonuclease is at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about Variants having 97%, at least about 98%, or at least about 99% identity may be included. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 1512-1655.

場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有する変異体を含んでもよい。NLSは前記エンドヌクレアーゼのN末端またはC末端の近位であってもよい。NLSは、配列番号:1512-1655のいずれか1つのN末端またはC末端で、あるいは、配列番号:1512-1655のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体のN末端またはC末端で付加されてもよい。NLSはSV40ラージT抗原NLSであってもよい。NLSはc-myc NLSであってもよい。NLSは、配列番号:5593-5608のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含むことができる。NLSは配列番号:5593-5608のいずれか1つと実質的に同一の配列を含むことができる。NLSは、表1の配列のいずれか、またはその組み合わせを含むことができる: In some cases, the endonuclease may include a variant with one or more nuclear localization sequences (NLS). The NLS may be proximal to the N-terminus or C-terminus of the endonuclease. NLS is at least about 30%, at least about 35%, at least about 40% at the N-terminus or C-terminus of any one of SEQ ID NO: 1512-1655, or at least about 35%, at least about 40% relative to any one of SEQ ID NO: 1512-1655. %, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90% %, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. The NLS may be an SV40 large T antigen NLS. The NLS may be a c-myc NLS. The NLS comprises a sequence having at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 99% identity to any one of SEQ ID NOs: 5593-5608. I can do it. The NLS can include a sequence substantially identical to any one of SEQ ID NOs: 5593-5608. The NLS can include any of the sequences in Table 1, or a combination thereof:

場合によっては、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、またはSmith-Waterman相同性検索アルゴリズムによって決定されてもよい。配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータを使用し、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリクスを使用し、および条件付き組成スコアマトリクス調整を使用して、BLASTPアルゴリズムで決定することができる。 In some cases, sequence identity may be determined by BLASTP, CLUSTALW, MUSCLE, MAFFT, Novafold, or Smith-Waterman homology search algorithms. Sequence identity was determined using the BLOSUM62 scoring matrix using parameters of wordlength (W) of 3, expectation (E) of 10, and gap cost with existence of 11, extension of 1, and conditional composition. It can be determined with the BLASTP algorithm using a score matrix adjustment.

場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を有するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)を含んでもよい。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合可能なPAM配列を含んでもよい。場合によっては、標的化領域の5’のほとんどのヌクレオチドがGであってもよい。場合によっては、5’標的化領域は15~23ヌクレオチド長であってもよい。ガイド配列およびtracr配列は、別のリボ核酸(RNA)または単一リボ核酸(RNA)として供給されてもよい。ガイドRNAは、標的化領域の3’にcrRNA tracrRNA結合配列を含んでもよい。ガイドRNAは、crRNA tracrRNA結合領域の3’に4-ヌクレオチドリンカーが先行するtracrRNA配列を含んでもよい。sgRNAは、5’から3’に、細胞の標的配列にハイブリダイズすることができる非天然ガイド核酸配列、および、tracr配列を含んでもよい。場合によっては、非天然ガイド核酸配列およびtracr配列は共有結合される。 Optionally, the system comprises: (b) at least one engineered synthetic guide ribonucleic acid (sgRNA) capable of forming a complex with an endonuclease having a 5' targeting region complementary to the desired cleavage sequence; May include. In some cases, the 5' targeting region may include a PAM sequence that is compatible with an endonuclease. In some cases, most nucleotides 5' of the targeting region may be G's. In some cases, the 5' targeting region may be 15-23 nucleotides in length. The guide sequence and tracr sequence may be provided as separate ribonucleic acids (RNA) or as a single ribonucleic acid (RNA). The guide RNA may include a crRNA tracrRNA binding sequence 3' of the targeting region. The guide RNA may include a tracrRNA sequence preceded by a 4-nucleotide linker 3' of the crRNA tracrRNA binding region. The sgRNA may include, 5' to 3', a non-natural guide nucleic acid sequence capable of hybridizing to a cellular target sequence, and a tracr sequence. In some cases, the non-natural guide nucleic acid sequence and the tracr sequence are covalently linked.

場合によっては、tracr配列は特別な配列を有していてもよい。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%を有してもよい。tracr配列は、配列番号:5509の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%の配列同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5509の少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5509の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドと実質的に同一であってもよい。tracrRNAは、配列番号:5509を含んでもよい。 In some cases, the tracr sequence may have a special sequence. A tracr sequence comprises at least about 60 to 100 (e.g., at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) contiguous nucleotides of a natural tracr RNA sequence. may have at least about 80%. The tracr sequence comprises at least about 60 to 100 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) contiguous nucleotides of SEQ ID NO: 5509. may have at least about 80% sequence identity to. In some cases, the tracrRNA is at least about 60 to 90 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) of SEQ ID NO: 5509. At least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96 consecutive nucleotides %, at least about 97%, at least about 98%, or at least about 99%. In some cases, the tracrRNA is at least about 60 to 100 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) of SEQ ID NO: 5509. Consecutive nucleotides may be substantially identical. tracrRNA may include SEQ ID NO:5509.

場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号:5473に対して少なくとも約80%の同一性を有する配列を含んでもよい。sgRNAは、配列番号:5473に対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含んでもよい。sgRNAは配列番号:5473と実質的に同一の配列を含んでもよい。 Optionally, the at least one engineered synthetic guide ribonucleic acid (sgRNA) capable of forming a complex with an endonuclease may include a sequence having at least about 80% identity to SEQ ID NO: 5473. . The sgRNA is at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, relative to SEQ ID NO: 5473. It may include sequences having at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. The sgRNA may include a sequence substantially identical to SEQ ID NO:5473.

場合によっては、上記システムは、標的DNA遺伝子座における切断のために第1の領域および第2の領域を標的とする2つの異なるsgRNAを含んでいてもよく、ここで、第2の領域は第1の領域に対して3’である。場合によっては、上記システムは、5’から3’に、第1の領域の5’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第1の相同性アーム、少なくとも約10ヌクレオチドの合成DNA配列、および、第2の領域の3’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第2の相同性アームを含む、一本鎖または二本鎖のDNA修復鋳型を含んでいてもよい。 In some cases, the system may include two different sgRNAs that target a first region and a second region for cleavage at a target DNA locus, where the second region is a second region. 3' for a region of 1. In some cases, the system includes 5' to 3' at least about 20 (e.g., at least about 40, 80, 120, 150, 200, 300, 500, or 1 kb) nucleotides 5' of the first region. a first homology arm comprising a synthetic DNA sequence of at least about 10 nucleotides, and 3′ of the second region at least about 20 (e.g., at least about 40, 80, 120, 150, 200, 300, 500, or 1 kb) of nucleotides).

他の態様では、本開示は、所望の標的核酸遺伝子座を改変するための方法を提供する。本方法は、本明細書に開示された酵素および少なくとも1つの合成ガイドRNA(sgRNA)を含む本明細書で開示された非天然のシステムのいずれかを、標的核酸遺伝子座に送達する工程を含んでもよい。酵素は、少なくとも1つのsgRNAと複合体を形成してもよく、複合体が所望の標的核酸遺伝子座に結合すると、所望の標的核酸遺伝子座を改変してもよい。酵素を前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をトランスフェクトすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をエレクトロポレーションすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、所望の遺伝子座を含む核酸を有する緩衝液中でシステムをインキュベートすることを含んでもよい。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含んでもよい。標的核酸遺伝子座は細胞内にあってもよい。標的核酸遺伝子座はインビトロであってもよい。標的核酸遺伝子座は、真核細胞内にあっても、原核細胞内にあってもよい。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、または植物細胞であってもよい。酵素は、所望の標的遺伝子座で、またはその近辺で、一本鎖または二本鎖の切断を誘導してもよい。 In other aspects, the disclosure provides methods for modifying a desired target nucleic acid locus. The method comprises delivering any of the non-natural systems disclosed herein comprising an enzyme disclosed herein and at least one synthetic guide RNA (sgRNA) to a target nucleic acid locus. But that's fine. The enzyme may form a complex with at least one sgRNA and modify the desired target nucleic acid locus upon binding of the complex to the desired target nucleic acid locus. Delivering an enzyme to said locus may include transfecting a cell with said system or a nucleic acid encoding said system. Delivering a nuclease to said locus may include electroporating a cell with said system or a nucleic acid encoding said system. Delivering a nuclease to the locus may include incubating the system in a buffer with a nucleic acid containing the desired locus. In some cases, the target nucleic acid locus comprises deoxyribonucleic acid (DNA) or ribonucleic acid (RNA). The target nucleic acid locus may include genomic DNA, viral DNA, viral RNA, or bacterial DNA. The target nucleic acid locus may be intracellular. The target nucleic acid locus may be in vitro. The target nucleic acid locus may be within a eukaryotic or prokaryotic cell. The cell may be an animal cell, a human cell, a bacterial cell, an archaeal cell, or a plant cell. The enzyme may induce single-stranded or double-stranded breaks at or near the desired target locus.

標的核酸の遺伝子座が細胞内にあり得る場合では、酵素は、配列番号:3331-3474のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードするオープンリーディングフレームを含む核酸として供給されてもよい。前記エンドヌクレアーゼをコードするオープンリーディングフレームを含むデオキシリボ核酸(DNA)は、配列番号:5585と実質的に同一の配列、あるいは、配列番号:5585に対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでもよい。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトβアクチン、CAG、TRE、またはCaMKIIaプロモーターであってもよい。エンドヌクレアーゼは、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含むキャップされたmRNAとして供給されてもよい。エンドヌクレアーゼは、翻訳されたポリペプチドとして提供されてもよい。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された前記少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含むデオキシリボ核酸(DNA)として供給されてもよい。場合によっては、生物は真核生物であってもよい。場合によっては、生物は真菌であってもよい。場合によっては、生物はヒトであってもよい。 In cases where the locus of the target nucleic acid may be intracellular, the enzyme has at least about 75% (e.g., at least about 90%, at least about 91%, at least Enzymes having RuvC_III domains having an identity of about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%). It may also be provided as a nucleic acid containing an encoding open reading frame. The deoxyribonucleic acid (DNA) comprising the open reading frame encoding the endonuclease has a sequence substantially identical to SEQ ID NO: 5585, or at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least Variants having about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity may be included. In some cases, the nucleic acid includes a promoter to which is operably linked an open reading frame encoding an endonuclease. The promoter may be a CMV, EF1a, SV40, PGK1, Ubc, human β-actin, CAG, TRE, or CaMKIIa promoter. The endonuclease may be provided as a capped mRNA containing the open reading frame encoding the endonuclease. The endonuclease may be provided as a translated polypeptide. The at least one engineered sgRNA may be provided as deoxyribonucleic acid (DNA) comprising a genetic sequence encoding said at least one engineered sgRNA operably linked to a ribonucleic acid (RNA) pol III promoter. . In some cases, the organism may be eukaryotic. In some cases, the organism may be a fungus. In some cases, the organism may be a human.

MG22酵素 MG22 enzyme

一態様では、本開示は、(a)エンドヌクレアーゼを含む操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼはCasエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型のクラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、前記RuvC_IIIドメインは、配列番号:3475-3568のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、RuvC_IIIドメインは、配列番号:3475-3568のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、配列番号:3475-3568のいずれか1つに実質的に同一である。エンドヌクレアーゼは、配列番号:3475-3568のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:3475-3568のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:3475-3568のいずれか1つに実質的に同一であるRuvC_IIIドメインを含んでいてもよい。 In one aspect, the present disclosure provides an engineered nuclease system that includes (a) an endonuclease. In some cases, the endonuclease is a Cas endonuclease. In some cases, the endonuclease is a type II class II Cas endonuclease. The endonuclease may include a RuvC_III domain, wherein the RuvC_III domain has at least about 70% sequence identity to any one of SEQ ID NOs: 3475-3568. In some cases, the endonuclease may include a RuvC_III domain, wherein the RuvC_III domain is at least about 20%, at least about 25%, at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least About 98%, at least about 99% identical. Optionally, the endonuclease may include a RuvC_III domain, wherein the endonuclease is substantially identical to any one of SEQ ID NOs: 3475-3568. The endonuclease may include a RuvC_III domain having at least about 70% sequence identity to any one of SEQ ID NOs: 3475-3568. In some cases, the endonuclease is at least about 20%, at least about 25%, at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about RuvC_III domains having an identity of 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%. May contain. In some cases, the endonuclease may include a RuvC_III domain that is substantially identical to any one of SEQ ID NOs: 3475-3568.

エンドヌクレアーゼは、配列番号:5291-5389のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:5291-5389のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:5291-5389のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。エンドヌクレアーゼは、配列番号:5291-5389のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:5291-5389のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:5291-5389のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。 The endonuclease may include an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 5291-5389. In some cases, the endonuclease is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about HNH domains having an identity of 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99%. May contain. The endonuclease may contain an HNH domain substantially identical to any one of SEQ ID NOs: 5291-5389. The endonuclease may include an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 5291-5389. In some cases, the endonuclease is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about HNH domains having an identity of 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99%. May contain. The endonuclease may contain an HNH domain substantially identical to any one of SEQ ID NOs: 5291-5389.

場合によっては、エンドヌクレアーゼは、配列番号:1656-1755のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:1656-1755のいずれか1つと実質的に同一であってもよい。場合によっては、エンドヌクレアーゼは、配列番号:1656-1755のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:1656-1755のいずれか1つと実質的に同一であってもよい。 In some cases, the endonuclease is at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about Variants having 97%, at least about 98%, or at least about 99% identity may be included. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 1656-1755. In some cases, the endonuclease is at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about Variants having 97%, at least about 98%, or at least about 99% identity may be included. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 1656-1755.

場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有する変異体を含んでもよい。NLSは前記エンドヌクレアーゼのN末端またはC末端の近位であってもよい。NLSは、配列番号:432-660のいずれか1つのN末端またはC末端で、あるいは、配列番号:1656-1755のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体のN末端またはC末端で付加されてもよい。NLSはSV40ラージT抗原NLSであってもよい。NLSはc-myc NLSであってもよい。NLSは、配列番号:5593-5608のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含むことができる。NLSは配列番号:5593-5608のいずれか1つと実質的に同一の配列を含むことができる。NLSは、表1の配列のいずれか、またはその組み合わせを含むことができる: In some cases, the endonuclease may include a variant with one or more nuclear localization sequences (NLS). The NLS may be proximal to the N-terminus or C-terminus of the endonuclease. NLS is at least about 30%, at least about 35%, at least about 40% at the N-terminus or C-terminus of any one of SEQ ID NO: 432-660, or at least about 35%, at least about 40% relative to any one of SEQ ID NO: 1656-1755. %, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90% %, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. The NLS may be an SV40 large T antigen NLS. The NLS may be a c-myc NLS. The NLS comprises a sequence having at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 99% identity to any one of SEQ ID NOs: 5593-5608. I can do it. The NLS can include a sequence substantially identical to any one of SEQ ID NOs: 5593-5608. The NLS can include any of the sequences in Table 1, or a combination thereof:

場合によっては、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、またはSmith-Waterman相同性検索アルゴリズムによって決定されてもよい。配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータを使用し、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリクスを使用し、および条件付き組成スコアマトリクス調整を使用して、BLASTPアルゴリズムで決定することができる。 In some cases, sequence identity may be determined by BLASTP, CLUSTALW, MUSCLE, MAFFT, Novafold, or Smith-Waterman homology search algorithms. Sequence identity was determined using the BLOSUM62 scoring matrix using parameters of wordlength (W) of 3, expectation (E) of 10, and gap cost with existence of 11, extension of 1, and conditional composition. It can be determined with the BLASTP algorithm using a score matrix adjustment.

場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を有するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)を含んでもよい。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合可能なPAM配列を含んでもよい。場合によっては、標的化領域の5’のほとんどのヌクレオチドがGであってもよい。場合によっては、5’標的化領域は15~23ヌクレオチド長であってもよい。ガイド配列およびtracr配列は、別のリボ核酸(RNA)または単一リボ核酸(RNA)として供給されてもよい。ガイドRNAは、標的化領域の3’にcrRNA tracrRNA結合配列を含んでもよい。ガイドRNAは、crRNA tracrRNA結合領域の3’に4-ヌクレオチドリンカーが先行するtracrRNA配列を含んでもよい。sgRNAは、5’から3’に、細胞の標的配列にハイブリダイズすることができる非天然ガイド核酸配列、および、tracr配列を含んでもよい。場合によっては、非天然ガイド核酸配列およびtracr配列は共有結合される。 Optionally, the system comprises: (b) at least one engineered synthetic guide ribonucleic acid (sgRNA) capable of forming a complex with an endonuclease having a 5' targeting region complementary to the desired cleavage sequence; May include. In some cases, the 5' targeting region may include a PAM sequence that is compatible with an endonuclease. In some cases, most nucleotides 5' of the targeting region may be G's. In some cases, the 5' targeting region may be 15-23 nucleotides in length. The guide sequence and tracr sequence may be provided as separate ribonucleic acids (RNA) or as a single ribonucleic acid (RNA). The guide RNA may include a crRNA tracrRNA binding sequence 3' of the targeting region. The guide RNA may include a tracrRNA sequence preceded by a 4-nucleotide linker 3' of the crRNA tracrRNA binding region. The sgRNA may include, 5' to 3', a non-natural guide nucleic acid sequence capable of hybridizing to a cellular target sequence, and a tracr sequence. In some cases, the non-natural guide nucleic acid sequence and the tracr sequence are covalently linked.

場合によっては、tracr配列は特別な配列を有していてもよい。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%を有してもよい。tracr配列は、配列番号:5510の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%の配列同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5510の少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5510の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドと実質的に同一であってもよい。tracrRNAは、配列番号:5510を含んでもよい。 In some cases, the tracr sequence may have a special sequence. A tracr sequence comprises at least about 60 to 100 (e.g., at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) contiguous nucleotides of a natural tracr RNA sequence. may have at least about 80%. The tracr sequence comprises at least about 60 to 100 (e.g., at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) contiguous nucleotides of SEQ ID NO: 5510. may have at least about 80% sequence identity to. In some cases, the tracrRNA is at least about 60 to 90 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) of SEQ ID NO: 5510. At least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96 consecutive nucleotides %, at least about 97%, at least about 98%, or at least about 99%. In some cases, the tracrRNA comprises at least about 60 to 100 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) of SEQ ID NO: 5510. Consecutive nucleotides may be substantially identical. tracrRNA may include SEQ ID NO:5510.

場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号:5474に対して少なくとも約80%の同一性を有する配列を含んでもよい。sgRNAは、配列番号:5474に対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含んでもよい。sgRNAは配列番号:5474と実質的に同一の配列を含んでもよい。 Optionally, the at least one engineered synthetic guide ribonucleic acid (sgRNA) capable of forming a complex with an endonuclease may include a sequence having at least about 80% identity to SEQ ID NO: 5474. . The sgRNA is at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, relative to SEQ ID NO: 5474. It may include sequences having at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. The sgRNA may include a sequence substantially identical to SEQ ID NO:5474.

場合によっては、上記システムは、標的DNA遺伝子座における切断のために第1の領域および第2の領域を標的とする2つの異なるsgRNAを含んでいてもよく、ここで、第2の領域は第1の領域に対して3’である。場合によっては、上記システムは、5’から3’に、第1の領域の5’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第1の相同性アーム、少なくとも約10ヌクレオチドの合成DNA配列、および、第2の領域の3’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第2の相同性アームを含む、一本鎖または二本鎖のDNA修復鋳型を含んでいてもよい。 In some cases, the system may include two different sgRNAs that target a first region and a second region for cleavage at a target DNA locus, where the second region is a second region. 3' for a region of 1. In some cases, the system includes 5' to 3' at least about 20 (e.g., at least about 40, 80, 120, 150, 200, 300, 500, or 1 kb) nucleotides 5' to the first region. a first homology arm comprising a synthetic DNA sequence of at least about 10 nucleotides, and 3′ of the second region at least about 20 (e.g., at least about 40, 80, 120, 150, 200, 300, 500, or 1 kb) of nucleotides).

他の態様では、本開示は、所望の標的核酸遺伝子座を改変するための方法を提供する。本方法は、本明細書に開示された酵素および少なくとも1つの合成ガイドRNA(sgRNA)を含む本明細書で開示された非天然のシステムのいずれかを、標的核酸遺伝子座に送達する工程を含んでもよい。酵素は、少なくとも1つのsgRNAと複合体を形成してもよく、複合体が所望の標的核酸遺伝子座に結合すると、所望の標的核酸遺伝子座を改変してもよい。酵素を前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をトランスフェクトすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をエレクトロポレーションすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、所望の遺伝子座を含む核酸を有する緩衝液中でシステムをインキュベートすることを含んでもよい。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含んでもよい。標的核酸遺伝子座は細胞内にあってもよい。標的核酸遺伝子座はインビトロであってもよい。標的核酸遺伝子座は、真核細胞内にあっても、原核細胞内にあってもよい。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、または植物細胞であってもよい。酵素は、所望の標的遺伝子座で、またはその近辺で、一本鎖または二本鎖の切断を誘導してもよい。 In other aspects, the disclosure provides methods for modifying a desired target nucleic acid locus. The method comprises delivering any of the non-natural systems disclosed herein comprising an enzyme disclosed herein and at least one synthetic guide RNA (sgRNA) to a target nucleic acid locus. But that's fine. The enzyme may form a complex with at least one sgRNA and modify the desired target nucleic acid locus upon binding of the complex to the desired target nucleic acid locus. Delivering an enzyme to said locus may include transfecting a cell with said system or a nucleic acid encoding said system. Delivering a nuclease to said locus may include electroporating a cell with said system or a nucleic acid encoding said system. Delivering a nuclease to the locus may include incubating the system in a buffer with a nucleic acid containing the desired locus. In some cases, the target nucleic acid locus comprises deoxyribonucleic acid (DNA) or ribonucleic acid (RNA). The target nucleic acid locus may include genomic DNA, viral DNA, viral RNA, or bacterial DNA. The target nucleic acid locus may be intracellular. The target nucleic acid locus may be in vitro. The target nucleic acid locus may be within a eukaryotic or prokaryotic cell. The cell may be an animal cell, a human cell, a bacterial cell, an archaeal cell, or a plant cell. The enzyme may induce single-stranded or double-stranded breaks at or near the desired target locus.

標的核酸の遺伝子座が細胞内にあり得る場合では、酵素は、配列番号:3475-3568のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードするオープンリーディングフレームを含む核酸として供給されてもよい。前記エンドヌクレアーゼをコードするオープンリーディングフレームを含むデオキシリボ核酸(DNA)は、配列番号:5586と実質的に同一の配列、あるいは、配列番号:5586に対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでもよい。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトβアクチン、CAG、TRE、またはCaMKIIaプロモーターであってもよい。エンドヌクレアーゼは、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含むキャップされたmRNAとして供給されてもよい。エンドヌクレアーゼは、翻訳されたポリペプチドとして提供されてもよい。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された前記少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含むデオキシリボ核酸(DNA)として供給されてもよい。場合によっては、生物は真核生物であってもよい。場合によっては、生物は真菌であってもよい。場合によっては、生物はヒトであってもよい。 In cases where the locus of the target nucleic acid can be intracellular, the enzyme has at least about 75% (e.g., at least about 90%, at least about 91%, at least Enzymes having RuvC_III domains having an identity of about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%). It may also be provided as a nucleic acid containing an encoding open reading frame. The deoxyribonucleic acid (DNA) comprising the open reading frame encoding the endonuclease has a sequence substantially identical to SEQ ID NO: 5586, or at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least Variants having about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity may be included. In some cases, the nucleic acid includes a promoter to which is operably linked an open reading frame encoding an endonuclease. The promoter may be a CMV, EF1a, SV40, PGK1, Ubc, human β-actin, CAG, TRE, or CaMKIIa promoter. The endonuclease may be provided as a capped mRNA containing the open reading frame encoding the endonuclease. The endonuclease may be provided as a translated polypeptide. The at least one engineered sgRNA may be provided as deoxyribonucleic acid (DNA) comprising a genetic sequence encoding said at least one engineered sgRNA operably linked to a ribonucleic acid (RNA) pol III promoter. . In some cases, the organism may be eukaryotic. In some cases, the organism may be a fungus. In some cases, the organism may be a human.

MG23酵素 MG23 enzyme

一態様では、本開示は、(a)エンドヌクレアーゼを含む操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼはCasエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型のクラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、前記RuvC_IIIドメインは、配列番号:3569-3637のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、RuvC_IIIドメインは、配列番号:3569-3637のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、配列番号:3569-3637のいずれか1つに実質的に同一である。エンドヌクレアーゼは、配列番号:3569-3637のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:3569-3637のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:3569-3637のいずれか1つに実質的に同一であるRuvC_IIIドメインを含んでいてもよい。 In one aspect, the present disclosure provides an engineered nuclease system that includes (a) an endonuclease. In some cases, the endonuclease is a Cas endonuclease. In some cases, the endonuclease is a type II class II Cas endonuclease. The endonuclease may include a RuvC_III domain, wherein the RuvC_III domain has at least about 70% sequence identity to any one of SEQ ID NOs: 3569-3637. In some cases, the endonuclease may comprise a RuvC_III domain, wherein the RuvC_III domain is at least about 20%, at least about 25%, at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least About 98%, at least about 99% identical. Optionally, the endonuclease may include a RuvC_III domain, wherein the endonuclease is substantially identical to any one of SEQ ID NOs: 3569-3637. The endonuclease may include a RuvC_III domain having at least about 70% sequence identity to any one of SEQ ID NOs: 3569-3637. In some cases, the endonuclease is at least about 20%, at least about 25%, at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about RuvC_III domains having an identity of 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%. May contain. In some cases, the endonuclease may include a RuvC_III domain that is substantially identical to any one of SEQ ID NOs: 3569-3637.

エンドヌクレアーゼは、配列番号:5390-5640のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:5390-5460のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:5390-5460のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。エンドヌクレアーゼは、配列番号:5390-5460のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:5390-5460のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:5390-5460のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。 The endonuclease may include an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 5390-5640. In some cases, the endonuclease is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about HNH domains having an identity of 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99%. May contain. The endonuclease may contain an HNH domain substantially identical to any one of SEQ ID NOs: 5390-5460. The endonuclease may include an HNH domain having at least about 70% identity to any one of SEQ ID NOs: 5390-5460. In some cases, the endonuclease is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about HNH domains having an identity of 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99%. May contain. The endonuclease may contain an HNH domain substantially identical to any one of SEQ ID NOs: 5390-5460.

場合によっては、エンドヌクレアーゼは、配列番号:1756-1826のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:1756-1826のいずれか1つと実質的に同一であってもよい。場合によっては、エンドヌクレアーゼは、配列番号:1756-1826のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:1756-1826のいずれか1つと実質的に同一であってもよい。 In some cases, the endonuclease is at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about Variants having 97%, at least about 98%, or at least about 99% identity may be included. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 1756-1826. In some cases, the endonuclease is at least about 30%, at least about 35%, at least about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about Variants having 97%, at least about 98%, or at least about 99% identity may be included. In some cases, the endonuclease may be substantially identical to any one of SEQ ID NOs: 1756-1826.

場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有する変異体を含んでもよい。NLSは前記エンドヌクレアーゼのN末端またはC末端の近位であってもよい。NLSは、配列番号:1756-1826のいずれか1つのN末端またはC末端で、あるいは、配列番号:1756-1826のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体のN末端またはC末端で付加されてもよい。NLSはSV40ラージT抗原NLSであってもよい。NLSはc-myc NLSであってもよい。NLSは、配列番号:5593-5608のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含むことができる。NLSは配列番号:5593-5608のいずれか1つと実質的に同一の配列を含むことができる。NLSは、表1の配列のいずれか、またはその組み合わせを含むことができる: In some cases, the endonuclease may include a variant with one or more nuclear localization sequences (NLS). The NLS may be proximal to the N-terminus or C-terminus of the endonuclease. NLS is at least about 30%, at least about 35%, at least about 40% at the N-terminus or C-terminus of any one of SEQ ID NO: 1756-1826, or at least about 30%, at least about 35%, at least about 40% relative to any one of SEQ ID NO: 1756-1826 %, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90% %, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. The NLS may be an SV40 large T antigen NLS. The NLS may be a c-myc NLS. The NLS comprises a sequence having at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 99% identity to any one of SEQ ID NOs: 5593-5608. I can do it. The NLS can include a sequence substantially identical to any one of SEQ ID NOs: 5593-5608. The NLS can include any of the sequences in Table 1, or a combination thereof:

場合によっては、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、またはSmith-Waterman相同性検索アルゴリズムによって決定されてもよい。配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータを使用し、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリクスを使用し、および条件付き組成スコアマトリクス調整を使用して、BLASTPアルゴリズムで決定することができる。 In some cases, sequence identity may be determined by BLASTP, CLUSTALW, MUSCLE, MAFFT, Novafold, or Smith-Waterman homology search algorithms. Sequence identity was determined using the BLOSUM62 scoring matrix using parameters of wordlength (W) of 3, expectation (E) of 10, and gap cost with existence of 11, extension of 1, and conditional composition. It can be determined with the BLASTP algorithm using a score matrix adjustment.

場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を有するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)を含んでもよい。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合可能なPAM配列を含んでもよい。場合によっては、標的化領域の5’のほとんどのヌクレオチドがGであってもよい。場合によっては、5’標的化領域は15~23ヌクレオチド長であってもよい。ガイド配列およびtracr配列は、別のリボ核酸(RNA)または単一リボ核酸(RNA)として供給されてもよい。ガイドRNAは、標的化領域の3’にcrRNA tracrRNA結合配列を含んでもよい。ガイドRNAは、crRNA tracrRNA結合領域の3’に4-ヌクレオチドリンカーが先行するtracrRNA配列を含んでもよい。sgRNAは、5’から3’に、細胞の標的配列にハイブリダイズすることができる非天然ガイド核酸配列、および、tracr配列を含んでもよい。場合によっては、非天然ガイド核酸配列およびtracr配列は共有結合される。 Optionally, the system comprises: (b) at least one engineered synthetic guide ribonucleic acid (sgRNA) capable of forming a complex with an endonuclease having a 5' targeting region complementary to the desired cleavage sequence; May include. In some cases, the 5' targeting region may include a PAM sequence that is compatible with an endonuclease. In some cases, most nucleotides 5' of the targeting region may be G's. In some cases, the 5' targeting region may be 15-23 nucleotides in length. The guide sequence and tracr sequence may be provided as separate ribonucleic acids (RNA) or as a single ribonucleic acid (RNA). The guide RNA may include a crRNA tracrRNA binding sequence 3' of the targeting region. The guide RNA may include a tracrRNA sequence preceded by a 4-nucleotide linker 3' of the crRNA tracrRNA binding region. The sgRNA may include, 5' to 3', a non-natural guide nucleic acid sequence capable of hybridizing to a cellular target sequence, and a tracr sequence. In some cases, the non-natural guide nucleic acid sequence and the tracr sequence are covalently linked.

場合によっては、tracr配列は特別な配列を有していてもよい。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%を有してもよい。tracr配列は、配列番号:5511の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%の配列同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5511の少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5511の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドと実質的に同一であってもよい。tracrRNAは、配列番号:5511を含んでもよい。 In some cases, the tracr sequence may have a special sequence. A tracr sequence comprises at least about 60 to 100 (e.g., at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) contiguous nucleotides of a natural tracr RNA sequence. may have at least about 80%. The tracr sequence comprises at least about 60 to 100 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) contiguous nucleotides of SEQ ID NO: 5511. may have at least about 80% sequence identity to. In some cases, the tracrRNA is at least about 60 to 90 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) of SEQ ID NO: 5511. At least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96 consecutive nucleotides %, at least about 97%, at least about 98%, or at least about 99%. In some cases, the tracrRNA comprises at least about 60 to 100 (eg, at least about 60, at least about 65, at least about 70, at least about 75, at least about 80, at least about 85, or at least about 90) of SEQ ID NO: 5511. Consecutive nucleotides may be substantially identical. tracrRNA may include SEQ ID NO:5511.

場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号:5475に対して少なくとも約80%の同一性を有する配列を含んでもよい。sgRNAは、配列番号:5475に対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含んでもよい。sgRNAは配列番号:5475と実質的に同一の配列を含んでもよい。 Optionally, the at least one engineered synthetic guide ribonucleic acid (sgRNA) capable of forming a complex with an endonuclease may include a sequence having at least about 80% identity to SEQ ID NO: 5475. . The sgRNA is at least about 80%, at least about 85%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, relative to SEQ ID NO: 5475. It may include sequences having at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity. The sgRNA may include a sequence substantially identical to SEQ ID NO:5475.

場合によっては、上記システムは、標的DNA遺伝子座における切断のために第1の領域および第2の領域を標的とする2つの異なるsgRNAを含んでいてもよく、ここで、第2の領域は第1の領域に対して3’である。場合によっては、上記システムは、5’から3’に、第1の領域の5’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第1の相同性アーム、少なくとも約10ヌクレオチドの合成DNA配列、および、第2の領域の3’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第2の相同性アームを含む、一本鎖または二本鎖のDNA修復鋳型を含んでいてもよい。 In some cases, the system may include two different sgRNAs that target a first region and a second region for cleavage at a target DNA locus, where the second region is a second region. 3' for a region of 1. In some cases, the system includes 5' to 3' at least about 20 (e.g., at least about 40, 80, 120, 150, 200, 300, 500, or 1 kb) nucleotides 5' to the first region. a first homology arm comprising a synthetic DNA sequence of at least about 10 nucleotides, and 3′ of the second region at least about 20 (e.g., at least about 40, 80, 120, 150, 200, 300, 500, or 1 kb) of nucleotides).

他の態様では、本開示は、所望の標的核酸遺伝子座を改変するための方法を提供する。本方法は、本明細書に開示された酵素および少なくとも1つの合成ガイドRNA(sgRNA)を含む本明細書で開示された非天然のシステムのいずれかを、標的核酸遺伝子座に送達する工程を含んでもよい。酵素は、少なくとも1つのsgRNAと複合体を形成してもよく、複合体が所望の標的核酸遺伝子座に結合すると、所望の標的核酸遺伝子座を改変してもよい。酵素を前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をトランスフェクトすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をエレクトロポレーションすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、所望の遺伝子座を含む核酸を有する緩衝液中でシステムをインキュベートすることを含んでもよい。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含んでもよい。標的核酸遺伝子座は細胞内にあってもよい。標的核酸遺伝子座はインビトロであってもよい。標的核酸遺伝子座は、真核細胞内にあっても、原核細胞内にあってもよい。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、または植物細胞であってもよい。酵素は、所望の標的遺伝子座で、またはその近辺で、一本鎖または二本鎖の切断を誘導してもよい。 In other aspects, the disclosure provides methods for modifying a desired target nucleic acid locus. The method comprises delivering any of the non-natural systems disclosed herein comprising an enzyme disclosed herein and at least one synthetic guide RNA (sgRNA) to a target nucleic acid locus. But that's fine. The enzyme may form a complex with at least one sgRNA and modify the desired target nucleic acid locus upon binding of the complex to the desired target nucleic acid locus. Delivering an enzyme to said locus may include transfecting a cell with said system or a nucleic acid encoding said system. Delivering a nuclease to said locus may include electroporating a cell with said system or a nucleic acid encoding said system. Delivering a nuclease to the locus may include incubating the system in a buffer with a nucleic acid containing the desired locus. In some cases, the target nucleic acid locus comprises deoxyribonucleic acid (DNA) or ribonucleic acid (RNA). The target nucleic acid locus may include genomic DNA, viral DNA, viral RNA, or bacterial DNA. The target nucleic acid locus may be intracellular. The target nucleic acid locus may be in vitro. The target nucleic acid locus may be within a eukaryotic or prokaryotic cell. The cell may be an animal cell, a human cell, a bacterial cell, an archaeal cell, or a plant cell. The enzyme may induce single-stranded or double-stranded breaks at or near the desired target locus.

標的核酸の遺伝子座が細胞内にあり得る場合では、酵素は、配列番号:3569-3637のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードするオープンリーディングフレームを含む核酸として供給されてもよい。前記エンドヌクレアーゼをコードするオープンリーディングフレームを含むデオキシリボ核酸(DNA)は、配列番号:5587と実質的に同一の配列、あるいは、配列番号:5587に対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでもよい。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトβアクチン、CAG、TRE、またはCaMKIIaプロモーターであってもよい。エンドヌクレアーゼは、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含むキャップされたmRNAとして供給されてもよい。エンドヌクレアーゼは、翻訳されたポリペプチドとして提供されてもよい。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された前記少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含むデオキシリボ核酸(DNA)として供給されてもよい。場合によっては、生物は真核生物であってもよい。場合によっては、生物は真菌であってもよい。場合によっては、生物はヒトであってもよい。 In cases where the target nucleic acid locus may be intracellular, the enzyme has at least about 75% (e.g., at least about 90%, at least about 91%, at least Enzymes having RuvC_III domains having an identity of about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%). It may also be provided as a nucleic acid containing an encoding open reading frame. The deoxyribonucleic acid (DNA) comprising the open reading frame encoding the endonuclease has a sequence substantially identical to SEQ ID NO: 5587, or at least about 30%, at least about 35%, at least about SEQ ID NO: 5587. about 40%, at least about 45%, at least about 50%, at least about 55%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least Variants having about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identity may be included. In some cases, the nucleic acid includes a promoter to which is operably linked an open reading frame encoding an endonuclease. The promoter may be a CMV, EF1a, SV40, PGK1, Ubc, human β-actin, CAG, TRE, or CaMKIIa promoter. The endonuclease may be provided as a capped mRNA containing the open reading frame encoding the endonuclease. The endonuclease may be provided as a translated polypeptide. The at least one engineered sgRNA may be provided as deoxyribonucleic acid (DNA) comprising a genetic sequence encoding said at least one engineered sgRNA operably linked to a ribonucleic acid (RNA) pol III promoter. . In some cases, the organism may be eukaryotic. In some cases, the organism may be a fungus. In some cases, the organism may be a human.

実施例1.-新規なタンパク質のためのメタゲノム解析
メタゲノム試料を堆積物、土壌、および動物から集めた。デオキシリボ核酸(DNA)を、ZymobiomicsのDNA mini-prep kitを用いて抽出し、Illumina HiSeqR 2500で配列決定した。所有者の同意を得て試料を採取した。公的な情報源からの生の配列データは、動物のマイクロバイオーム、堆積物、土壌、温泉、熱水噴出孔、海洋、泥炭湿地、永久凍土、および下水のシーケンスを含んでいた。メタゲノム配列データは、タイプIIのCasエフェクタータンパク質を含む既知のCasタンパク質配列に基づいて生成された隠れマルコフモデルを用いて検索された。検索により同定された新規なエフェクタータンパク質を、既知のタンパク質にアラインメントして、潜在的な活性部位を特定した。このメタゲノムワークフローにより、本明細書に記載されるクラスII、タイプIIのCRISPRエンドヌクレアーゼのMG1、MG2、MG3、MG4、MG6、MG14、MG15、MG16、MG18、MG21、MG22、およびMG23のファミリーを解明した。
Example 1. - Metagenomic analysis for novel proteins Metagenomic samples were collected from sediments, soil, and animals. Deoxyribonucleic acid (DNA) was extracted using the Zymobiomics DNA mini-prep kit and sequenced on an Illumina HiSeqR 2500. Samples were collected with the consent of the owner. Raw sequence data from public sources included sequences from animal microbiomes, sediments, soils, hot springs, hydrothermal vents, oceans, peat swamps, permafrost, and sewage. Metagenomic sequence data were searched using hidden Markov models generated based on known Cas protein sequences, including type II Cas effector proteins. Novel effector proteins identified by the search were aligned to known proteins to identify potential active sites. This metagenomic workflow elucidates the MG1, MG2, MG3, MG4, MG6, MG14, MG15, MG16, MG18, MG21, MG22, and MG23 families of class II, type II CRISPR endonucleases described herein. did.

実施例2A.-CRISPRシステムのMG1ファミリーの発見
実施例1のメタゲノム解析のデータを解析すると、当初は6つのメンバー(それぞれ配列番号:5、6、1、2、および3として記録されたMG1-1、MG1-2、MG1-3、MG1-4、MG1-5、およびMG1-6)を含むこれまでに記載されていない推定CRISPRシステムの新しいクラスターが明らかとなった。このファミリーは、HNHドメインとRuvCドメインを有する酵素を特徴としている。このファミリーのRuvCドメインは、これまでに記載されたCas9ファミリーメンバーとの相同性が低いRuvC_III部分を有している。当初のファミリーメンバーは最大56.8%の同一性を有しているが、6つの酵素はすべてRuvCドメインのRuvC_III部分が分岐しており、RHHALDAMV(配列番号:5615)、KHHALDAMC(配列番号:5616)、またはKHHALDAIC(配列番号:5617)の共通モチーフを持っている。これらのモチーフは、記載されている他のCas9様酵素には見られないものである。これらの新しい酵素とその関連するサブドメインに対応するタンパク質と核酸の配列は、配列表に提示されている。推定tracrRNA配列は、他の遺伝子との相対的な位置関係に基づいて同定され、配列番号:5476-5479として提示されている。酵素システムは、CRISPRシステムを含むゲノムビンからの16S rRNAの配列に基づいて、Phylum Verrucomicrobia、Phylum Candidatus Peregrinibacteria、またはPhylum Candidatus Melainabacteriaに由来すると思われる。16S rRNAの配列は、配列番号:5592-5596として提示されている。Shmakovらによって記載された特徴を呼び起こすCRISPRシステム配列の詳細なドメインレベルのアラインメント(Mol Cell.2015 Nov 5;60(3):385-97)が図9A、9B、9C、9D、9E、9F、9G、および9Hに描かれている。MG1-1、1-2、および1-3と、追加の独自のタンパク質データセットとを比較すると、配列番号:7-319として提示されている類似のアーキテクチャを有する追加のタンパク質配列が明らかになった。これらのMG1タンパク質の配列により、配列番号:5618-5632に示されるような追加のMG1モチーフが発見された。
Example 2A. -Discovery of the MG1 family of CRISPR systems Analysis of the data from the metagenomic analysis of Example 1 revealed that there were initially six members (MG1-1, MG1- recorded as SEQ ID NOs: 5, 6, 1, 2, and 3, respectively). A new cluster of previously undescribed putative CRISPR systems was revealed, including MG2, MG1-3, MG1-4, MG1-5, and MG1-6). This family is characterized by enzymes with HNH and RuvC domains. The RuvC domains of this family have a RuvC_III portion with low homology to previously described Cas9 family members. Although the original family members share up to 56.8% identity, all six enzymes have divergent RuvC_III portions of their RuvC domains, including RHHALDAMV (SEQ ID NO: 5615) and KHHALDAMC (SEQ ID NO: 5616). ), or KHHALDAIC (SEQ ID NO: 5617). These motifs are not found in other Cas9-like enzymes described. The protein and nucleic acid sequences corresponding to these new enzymes and their associated subdomains are presented in the sequence listing. The putative tracrRNA sequences were identified based on their relative position to other genes and are presented as SEQ ID NOs: 5476-5479. The enzyme system is based on the sequence of 16S rRNA from a genome bin containing a CRISPR system, and is based on Phylum Verrucomicrobia, Phylum Candidatus Peregrinibacteria, or Phylum Candidatus Melainabacteri. It is thought to originate from a. The sequences of 16S rRNA are presented as SEQ ID NOs: 5592-5596. Detailed domain-level alignments of CRISPR system sequences (Mol Cell. 2015 Nov 5;60(3):385-97) that evoke features described by Shmakov et al. Depicted in 9G and 9H. Comparison of MG1-1, 1-2, and 1-3 with additional proprietary protein datasets revealed an additional protein sequence with a similar architecture, presented as SEQ ID NO: 7-319. Ta. The sequences of these MG1 proteins led to the discovery of additional MG1 motifs as shown in SEQ ID NOs: 5618-5632.

実施例2B.-CRISPRシステムのMG2ファミリーの発見
実施例1のメタゲノム解析からのデータを解析すると、6つのメンバー(MG2-1、MG2-2、MG2-3、MG2-5、およびMG2-6)を含むこれまでに記載されていない推定CRISPRシステムの新しいクラスターが明らかになった。これらの新しい酵素と例示的なサブドメインに対応するタンパク質と核酸の配列は、配列番号:320、322-325として提示されている。他の遺伝子との相対的な位置関係から、推定tracrRNA配列がオペロン内で同定され、配列番号:5490、5492-5494、および5538として提示されている。これらの配列対Cas9の詳細なドメインレベルのアラインメントは、Shmakovらにより示されているように(Mol Cell. 2015 Nov 5;60(3):385-97.)、図7に描かれている。
Example 2B. -Discovery of the MG2 family of CRISPR systems Analysis of data from the metagenomic analysis of Example 1 shows that so far, including six members (MG2-1, MG2-2, MG2-3, MG2-5, and MG2-6) A new cluster of putative CRISPR systems has been uncovered that has not yet been described. Protein and nucleic acid sequences corresponding to these new enzymes and exemplary subdomains are presented as SEQ ID NOs: 320, 322-325. Putative tracrRNA sequences were identified within the operon based on their relative positions to other genes and are presented as SEQ ID NOs: 5490, 5492-5494, and 5538. A detailed domain-level alignment of these sequence pairs for Cas9 is depicted in FIG. 7, as shown by Shmakov et al. (Mol Cell. 2015 Nov 5;60(3):385-97.).

MG2-1、MG2-2、MG2-3、MG2-5、およびMG2-6の組み合わせと、追加の独自のタンパク質データセットとを比較すると、配列番号:321および326-420として提示されている類似のアーキテクチャを有する追加のタンパク質配列が明らかになった。MG2ファミリーメンバーによく見られるモチーフは、配列番号:5631-5638として提示されている。 Comparison of the combination of MG2-1, MG2-2, MG2-3, MG2-5, and MG2-6 with additional proprietary protein datasets reveals similar Additional protein sequences have been revealed that have the architecture of Motifs commonly found in MG2 family members are presented as SEQ ID NOs: 5631-5638.

実施例2C.-CRISPRシステムのMG3ファミリーの発見
実施例1のメタゲノム解析のデータを解析すると、新たにこれまでに記載されていない推定CRISPRシステム:MG3-1が明らかになった。この新しい酵素とその例示的なサブドメインの対応するアミノ酸配列は、配列番号:424、2245、および4059として提示されている。オペロンの他の要素との近接性に基づいて、推定tracrRNA含有配列が同定され、配列番号:5498として含まれている。この配列対Actinomyces naeslundii由来のCas9とのドメインレベルの詳細なアラインメントが図8に示されている。
Example 2C. - Discovery of the MG3 family of CRISPR systems Analysis of the metagenomic data of Example 1 revealed a new putative CRISPR system: MG3-1 that has not been described so far. The corresponding amino acid sequences of this new enzyme and its exemplary subdomains are presented as SEQ ID NOs: 424, 2245, and 4059. Based on its proximity to other elements of the operon, a putative tracrRNA-containing sequence was identified and included as SEQ ID NO:5498. A detailed domain-level alignment of this sequence pair with Cas9 from Actinomyces naeslundii is shown in FIG.

MG3-1と、その他の独自のタンパク質データセットを比較すると、SEQ NO:421-423、425-431として提示されている、類似した構造のさらなるタンパク質配列が明らかになった。 Comparison of MG3-1 with other unique protein datasets revealed additional protein sequences of similar structure, presented as SEQ NOs: 421-423, 425-431.

実施例2D.-CRISPRシステムのMG4、7、14、15、16、18、21、22、23ファミリーの発見
実施例1のメタゲノム解析のデータを解析すると、1メンバーずつの9ファミリー(MG4-5、MG7-2、MG14-1、MG15-1、MG16-2、MG18-1、MG21-1、MG22-1、MG23-1)を含む、これまでに記載されていない推定CRISPRシステムの新たなクラスターが明らかになった。これらの新しい酵素とその例示的なサブドメインに対応するタンパク質および核酸の配列は、配列番号:432、669、678、930、1093、1354、1512、1656、1756として提示されている。オペロンの他の要素との近接性に基づいて、各ファミリーについて推定tracr含有配列が同定された。これらの配列は、それぞれ配列番号:5503-5511として配列表に提示されている。
Example 2D. -Discovery of MG4, 7, 14, 15, 16, 18, 21, 22, and 23 families using the CRISPR system Analysis of the data from the metagenomic analysis in Example 1 revealed that 9 families with one member each (MG4-5, MG7-2 , MG14-1, MG15-1, MG16-2, MG18-1, MG21-1, MG22-1, MG23-1), a new cluster of previously undescribed putative CRISPR systems has been revealed. Ta. Protein and nucleic acid sequences corresponding to these new enzymes and their exemplary subdomains are presented as SEQ ID NOs: 432, 669, 678, 930, 1093, 1354, 1512, 1656, 1756. Putative tracr-containing sequences were identified for each family based on their proximity to other elements of the operon. These sequences are presented in the sequence listing as SEQ ID NOs: 5503-5511, respectively.

MG4-5、MG7-2、MG14-1、MG15-1、MG16-2、MG18-1、MG21-1、MG22-1、MG23-1と、その他の独自のタンパク質データセットを比較すると、SEQ NO:433-660、670-677、679-929、931-1092、1094-1353、1355-1511、1513-1655、1657-1755、および1757-1826として提示されている、類似のアーキテクチャを持つ追加のタンパク質配列が明らかになった。これらのセットのCRISPRシステムのヌクレアーゼに共通するモチーフは、MG4については配列番号:5649、MG14については配列番号:5650-5667、MG15については配列番号:5668-5675、MG16については配列番号:5676-5678、MG18については配列番号:5679-5686、MG21については配列番号:5687-5693および配列番号:5674-5675、MG22については配列番号:5694-5699、ならびにMG23については配列番号:5700-5717として提示されている。 Comparing MG4-5, MG7-2, MG14-1, MG15-1, MG16-2, MG18-1, MG21-1, MG22-1, MG23-1 and other proprietary protein datasets, SEQ NO. Additional with similar architecture are presented as: 433-660, 670-677, 679-929, 931-1092, 1094-1353, 1355-1511, 1513-1655, 1657-1755, and 1757-1826. The protein sequence has been revealed. Common motifs for these sets of CRISPR system nucleases are SEQ ID NO: 5649 for MG4, SEQ ID NO: 5650-5667 for MG14, SEQ ID NO: 5668-5675 for MG15, and SEQ ID NO: 5676- for MG16. 5678, SEQ ID NO: 5679-5686 for MG18, SEQ ID NO: 5687-5693 and SEQ ID NO: 5674-5675 for MG21, SEQ ID NO: 5694-5699 for MG22, and SEQ ID NO: 5700-5717 for MG23. It is presented.

実施例3.-予言的(Prophetic)--プロトスペーサー隣接モチーフ(Protospacer-Adjacent Motif)の決定.
実験は、Karvelis et al. Methods. 2017 May 15;121-122:3-8(参照により本明細書に全体として組み込まれる)の例のいずれかのように行われ、本明細書に記載される新規の酵素に対するプロトスペーサー隣接モチーフ(PAM)配列特異性を特定して、最適な合成配列の標的化を可能にする。
Example 3. -Prophetic--Determination of Protospacer-Adjacent Motif.
The experiment was performed as described by Karvelis et al. Methods. The protospacer-adjacent motif ( PAM) identifies sequence specificity to enable optimal synthetic sequence targeting.

一例(インビボスクリーン)では、本明細書に記載されている酵素のいずれかをコードするプラスミドと、プロトスペーサーを標的とするガイドRNAとを有する細胞は、抗生物質耐性遺伝子を含むプラスミドライブラリ、およびランダム化されたPAM配列と隣接しているプロトスペーサー配列で同時形質転換される。機能的なPAMを含むプラスミドは、酵素によって切断され、細胞死に至る。生き残った細胞から単離された酵素切断抵抗性プラスミドプールをディープシーケンシングすると、機能的な切断を可能にするPAMを含む枯渇したプラスミドのセットが示される。 In one example (an in vivo screen), cells with a plasmid encoding any of the enzymes described herein and a guide RNA targeting the protospacer are injected with a plasmid library containing antibiotic resistance genes, and a random The transformed PAM sequence and the flanking protospacer sequence are co-transformed. Plasmids containing functional PAM are cleaved by enzymes, leading to cell death. Deep sequencing of enzyme cleavage-resistant plasmid pools isolated from surviving cells reveals a depleted set of plasmids containing PAMs that allow functional cleavage.

別の例(インビトロスクリーニング)では、DNAプラスミドまたは鎖状体リピートの形態のPAMライブラリは、インビトロまたは細胞溶解物中で組み立てられたRNP複合体(例えば、酵素、tracrRNAおよびcrRNA、または酵素およびハイブリッドsgRNAを含む)による切断に晒される。成功した切断事象から生じる遊離DNA末端は、アダプターライゲーションによって捕捉され、その後、PAM側の生成物のPCR増幅に晒される。増幅された機能的PAMのライブラリは、ディープシーケンシングにかけられ、DNAの切断をライセンス化するPAMが同定される。 In another example (in vitro screening), a PAM library in the form of DNA plasmids or concatenated repeats can be used to synthesize RNP complexes (e.g., enzymes, tracrRNA and crRNA, or enzymes and hybrid sgRNAs) assembled in vitro or in cell lysates. (including cutting). Free DNA ends resulting from a successful cleavage event are captured by adapter ligation and then subjected to PCR amplification of the product on the PAM side. The amplified library of functional PAMs is subjected to deep sequencing to identify PAMs that license DNA cleavage.

実施例4.-予言的--ゲノム編集のための哺乳動物細胞における本明細書に記載される合成CRISPRシステムの使用例
i)細胞適合性のあるC末端核局在化配列(例えば、ヒト細胞の場合はSV40 NLS)および適切なポリアデニル化シグナル(例えば、ヒト細胞の場合はTK pAシグナル)を有する細胞適合性のあるプロモーターの下で、コドン最適化酵素をコードするORF、および、(ii)適切なポリメラーゼIIIプロモーター(例えば、哺乳動物細胞の場合はU6プロモーター)の下で、sgRNA(Gで始まる5’配列と、続いてゲノムDNAを標的とする相補的な標的化核酸配列20ntと、その後、実施例3を介して同定された対応する適合性のあるPAMと、3’tracr結合配列、リンカー、およびtracrRNA配列を有する)をコードするORF、をコードするDNA/RNA配列が調製される。いくつかの実施形態では、これらの配列は、同じまたは別々のプラスミドベクター上で調製され、これらのプラスミドベクターは、適切な技術を介して真核細胞にトランスフェクトされる。いくつかの実施形態では、これらの配列は、別々のDNA配列として調製され、これが細胞にトランスフェクトされるか、または微量注入される。いくつかの実施形態では、これらの配列は、細胞にトランスフェクトされるか、微量注入される、合成RNAまたはインビトロ転写RNAとして調製される。いくつかの実施形態では、これらの配列は、タンパク質に翻訳され、細胞にトランスフェクトされるか、または微量注入される。
Example 4. -Prophetic--An example of the use of the synthetic CRISPR system described herein in mammalian cells for genome editing i) A cytocompatible C-terminal nuclear localization sequence (e.g. SV40 for human cells) NLS) and an ORF encoding a codon-optimizing enzyme under a cytocompatible promoter with an appropriate polyadenylation signal (e.g., TK pA signal for human cells); Under a promoter (e.g., U6 promoter for mammalian cells), the sgRNA (a 5' sequence starting with G, followed by 20 nt of complementary targeting nucleic acid sequence targeting genomic DNA, and then A DNA/RNA sequence is prepared that encodes the corresponding compatible PAM identified through the PAM and an ORF encoding the 3′ tracr binding sequence, linker, and tracr RNA sequence). In some embodiments, these sequences are prepared on the same or separate plasmid vectors, and these plasmid vectors are transfected into eukaryotic cells via appropriate techniques. In some embodiments, these sequences are prepared as separate DNA sequences that are transfected or microinjected into cells. In some embodiments, these sequences are prepared as synthetic or in vitro transcribed RNA that is transfected or microinjected into cells. In some embodiments, these sequences are translated into proteins and transfected or microinjected into cells.

いずれのトランスフェクション方法が選択されても、(i)と(ii)は細胞内に導入される。酵素および/またはsgRNAが活性形態に転写および/または翻訳されるように、インキュベーション期間を経過させる。インキュベーション期間後、標的化配列の近傍にあるゲノムDNAが(例えば、配列決定によって)解析される。酵素を媒介とした切断と非相同末端結合の結果、標的化配列の近傍にあるゲノムDNAにインデルが導入される。 Whichever transfection method is chosen, (i) and (ii) are introduced into the cells. An incubation period is allowed to occur so that the enzyme and/or sgRNA is transcribed and/or translated into the active form. After the incubation period, genomic DNA in the vicinity of the targeting sequence is analyzed (eg, by sequencing). Enzyme-mediated cleavage and non-homologous end joining results in the introduction of indels into the genomic DNA in the vicinity of the targeting sequence.

いくつかの実施形態では、(i)および(ii)は、25bp以上のサイズの切断部位に隣接しているゲノムの領域をコードする第3の修復ヌクレオチドとともに細胞に導入されることで、相同性指向の修復が促進される。これらの隣接配列内には、単一の塩基対突然変異、機能的な遺伝子断片、発現のための外来性または天然の遺伝子、あるいは生化学的経路を構成する複数の遺伝子が含まれることがある。 In some embodiments, (i) and (ii) are introduced into the cell along with a third repair nucleotide encoding a region of the genome that is adjacent to the cleavage site of size 25 bp or greater, thereby Oriented repair is promoted. Within these contiguous sequences may be single base pair mutations, functional gene fragments, foreign or native genes for expression, or multiple genes that constitute a biochemical pathway. .

実施例5.-予言的--インビトロの本明細書に記載される合成CRISPRシステムの使用
本明細書に記載される酵素のいずれかは、精製タグを含む適切な大腸菌発現プラスミドにクローン化され、大腸菌で組換え発現され、組換えタグを用いて精製される。5’Gと、続いて20ntの標的化配列とPAM配列、適合性のあるcrRNAのtracrRNA結合領域、GAAAリンカー、および適合性のあるtracrRNAを含むRNAは、適切な固相RNA合成方法によって合成される。組換え酵素とsgRNAは、Mg2+を含む適切な切断緩衝液(例えば、20mMのHEPES pH7.5、100mMのKCl、5mMのMgCl、1mMのDTT、5%グリセロール)に配合され、標的化配列とPAM配列に相補的な配列を含む標的DNAを導入することで、反応が開始する。DNAの切断は、適切なアッセイ(例えば、アガロースゲル電気泳動と、その後の臭化エチジウム染色(または同様に作用するDNA挿入剤)およびUV可視化)によってモニタリングされる。
Example 5. -Prophetic--Use of the synthetic CRISPR system described herein in vitro. Any of the enzymes described herein are cloned into an appropriate E. coli expression plasmid containing a purification tag and recombined in E. coli. Expressed and purified using recombinant tags. RNA containing the 5'G followed by 20 nt of targeting and PAM sequences, the tracrRNA binding region of a compatible crRNA, a GAAA linker, and a compatible tracrRNA is synthesized by an appropriate solid-phase RNA synthesis method. Ru. The recombinant enzyme and sgRNA are formulated in an appropriate cleavage buffer containing Mg2+ (e.g. 20mM HEPES pH 7.5, 100mM KCl, 5mM MgCl2 , 1mM DTT, 5% glycerol) and combined with the targeting sequence. The reaction is initiated by introducing target DNA containing a sequence complementary to the PAM sequence. DNA cleavage is monitored by a suitable assay, such as agarose gel electrophoresis followed by ethidium bromide staining (or a similarly acting DNA intercalating agent) and UV visualization.

実施例6.-(一般プロトコル)本明細書に記載されるエンドヌクレアーゼのPAM配列同定/確認
PAM配列は、大腸菌ライセートベースの発現システム(myTXTL、Arbor Biosciences)で発現した推定エンドヌクレアーゼで切断できるランダムに生成されたPAM配列を含むプラスミドを配列決定することによって決定された。このシステムでは、大腸菌コドン最適化ヌクレオチド配列が、T7プロモーターの制御下でPCR断片から転写および翻訳された。T7プロモーター下でtracr配列と、T7プロモーターとその後のリピート-スペーサー-リピート配列から構成される最小CRISPRアレイとを有する第2のPCR断片が同じ反応で転写された。TXTLシステムにおけるエンドヌクレアーゼとtracr配列の発現に成功し、その後のCRISPRアレイ処理を行うことで、インビトロで活性のCRISPRヌクレアーゼ複合体が得られた。
Example 6. - (General Protocol) PAM sequence identification/confirmation of the endonucleases described herein PAM sequences were randomly generated that could be cleaved with putative endonucleases expressed in an E. coli lysate-based expression system (myTXTL, Arbor Biosciences). It was determined by sequencing a plasmid containing the PAM sequence. In this system, E. coli codon-optimized nucleotide sequences were transcribed and translated from PCR fragments under the control of the T7 promoter. A second PCR fragment with the tracr sequence under the T7 promoter and a minimal CRISPR array consisting of the T7 promoter followed by repeat-spacer-repeat sequences was transcribed in the same reaction. Successful expression of the endonuclease and tracr sequences in the TXTL system and subsequent CRISPR array processing resulted in an active CRISPR nuclease complex in vitro.

最小限のアレイに一致するスペーサー配列と、その後の8Nの混合塩基(推定PAM配列)とを含む標的プラスミドのライブラリは、TXTL反応の出力と一緒にインキュベートされた。1-3時間後に反応を停止し、DNAクリーンアップキット、例えば、Zymo DCC、AMPure XP beads、QiaQuickなどを用いてDNAを回収した。アダプター配列は、エンドヌクレアーゼによって切断された活性なPAM配列を持つDNAに平滑末端ライゲーションされ、一方、切断されなかったDNAはライゲーションに利用できなかった。次に、活性なPAM配列を含むDNAセグメントは、ライブラリとアダプター配列に特異的なプライマーを用いてPCRで増幅された。PCR増幅産物をゲル上で分離させ、切断事象に対応するアンプリコンを同定した。切断反応の増幅セグメントは、NGSライブラリを調製するための鋳型としても使用された。最初の8Nライブラリのサブセットであった、この結果として生じたライブラリを配列決定することで、活性なCRISPR複合体の正確なPAMを含む配列が明らかになった。単一のRNAコンストラクトを用いたPAMテストでは、インビトロで転写されたRNAがプラスミドライブラリとともに加えられ、tracr/最少CRISPRアレイ鋳型が省略された以外は、同じ手順が繰り返された。NGSライブラリが調製されたエンドヌクレアーゼについては、seqLogo(例えば、Huber et al.Nat Methods.2015 Feb;12(2):115-21)の表現が構築され、図27、38、29、30、31、32、33、34、および35で提示されている。これらの表現を構築するために使用されるseqLogoモジュールは、DNA配列モチーフ(例えば、PAM配列)の位置特異的重み行列(position weight matrix)を取り、SchneiderとStephensが導入した対応する配列ロゴをプロットする(例えば、Schneider et al.Nucleic Acids Res.1990 Oct 25;18(20):6097-100を参照)。seqLogo表現における配列を表す文字は,アラインメントされた配列(例えば、PAM配列)の各位置について互いに重ねられている。各文字の高さはその頻度に比例しており、最も多いものが上にくるように文字を並べ替えている。 A library of target plasmids containing a spacer sequence matching the minimal array followed by 8N mixed bases (putative PAM sequences) was incubated with the output of the TXTL reaction. The reaction was stopped after 1-3 hours, and DNA was collected using a DNA cleanup kit such as Zymo DCC, AMPure XP beads, QiaQuick, etc. The adapter sequence was blunt-end ligated to DNA with an active PAM sequence that was cleaved by the endonuclease, while uncut DNA was unavailable for ligation. DNA segments containing active PAM sequences were then amplified by PCR using primers specific for the library and adapter sequences. PCR amplification products were separated on a gel and amplicons corresponding to cleavage events were identified. The amplified segment of the cleavage reaction was also used as a template to prepare the NGS library. Sequencing of this resulting library, which was a subset of the original 8N library, revealed the exact PAM-containing sequence of the active CRISPR complex. For PAM tests with a single RNA construct, the same procedure was repeated except that the in vitro transcribed RNA was added along with the plasmid library and the tracr/minimal CRISPR array template was omitted. For the endonucleases for which NGS libraries were prepared, representations of seqLogo (e.g., Huber et al. Nat Methods. 2015 Feb; 12(2):115-21) were constructed and , 32, 33, 34, and 35. The seqLogo module used to construct these representations takes a position-specific weight matrix of a DNA sequence motif (e.g., a PAM sequence) and plots the corresponding sequence logo introduced by Schneider and Stephens. (see, eg, Schneider et al. Nucleic Acids Res. 1990 Oct 25;18(20):6097-100). The characters representing sequences in the seqLogo representation are superimposed on each other for each position of an aligned sequence (eg, a PAM sequence). The height of each letter is proportional to its frequency, and the letters are arranged so that the most frequent letters are on top.

実施例7.-(一般的なプロトコル)tracrRNAとsgRNAの構造のRNA折り畳み
ガイドRNA配列の37℃での折り畳み構造は、Andronescu et al. Bioinformatics.2007 Jul 1;23(13):i19-28の方法を用いて計算された。本明細書に記載される例示的なsgRNAの予測構造を、図21、22、23、24、25、および26に示す。
Example 7. - (General protocol) RNA folding of the structure of tracrRNA and sgRNA The folded structure of the guide RNA sequence at 37°C was described by Andronescu et al. Bioinformatics. Calculated using the method of 2007 Jul 1;23(13):i19-28. The predicted structures of exemplary sgRNAs described herein are shown in FIGS. 21, 22, 23, 24, 25, and 26.

実施例8.-(一般的なプロトコル)MG CRISPR複合体のインビトロ切断効率
エンドヌクレアーゼは、プロテアーゼ欠損大腸菌B株において、誘導性T7プロモーターからHisタグ付けされた融合タンパク質として発現した。Hisタグ付けされたタンパク質を発現する細胞を超音波で溶解し、Hisタグ付けされたタンパク質は、AKTA Avant FPLC(GE Lifescience)上のHisTrap FFカラム(GE Lifescience)でのNi-NTAアフィニティークロマトグラフィーによって精製された。溶出物をアクリルアミドゲル(Bio-Rad)上でSDS-PAGEにより分解し、InstantBlue Ultrafastクーマシー(Sigma-Aldrich)で染色した。純度は、ImageLabソフトウェア(Bio-Rad)を用いたタンパク質バンドの濃度測定を用いて決定された。精製されたエンドヌクレアーゼは、50mMのTris-HCl、300mMのNaCl、1mMのTCEP、5%グリセロール;pH7.5からなる保存緩衝液に透析され、-80℃で保存された。
Example 8. - (General protocol) In vitro cleavage efficiency of the MG CRISPR complex The endonuclease was expressed as a His-tagged fusion protein from an inducible T7 promoter in a protease-deficient E. coli B strain. Cells expressing His-tagged proteins were lysed by ultrasound, and His-tagged proteins were lysed by Ni-NTA affinity chromatography on a HisTrap FF column (GE Lifescience) on an AKTA Avant FPLC (GE Lifescience). Refined. Eluates were resolved by SDS-PAGE on acrylamide gels (Bio-Rad) and stained with InstantBlue Ultrafast Coomassie (Sigma-Aldrich). Purity was determined using densitometry of protein bands using ImageLab software (Bio-Rad). The purified endonuclease was dialyzed into a storage buffer consisting of 50mM Tris-HCl, 300mM NaCl, 1mM TCEP, 5% glycerol; pH 7.5 and stored at -80°C.

スペーサー配列とPAM配列(例えば、実施例6のように決定される)を含む標的DNAはDNA合成により構築された。代表的な1つのPAMは、PAMが縮重塩基を有する場合に、試験のために選択された。標的DNAは、一端から700bpに位置するPAMとスペーサーを用いたPCR増幅によってプラスミドから得られた2200bpの直鎖状DNAを含んでいた。切断に成功すると、700bpと1500bpの断片が得られた。標的DNA、インビトロ転写された単一のRNA、および精製された組換えタンパク質を、余剰なタンパク質とRNAを含む切断緩衝液(10mMのTris、100mMのNaCl、10mMのMgCl)で組み合わせ、5分から3時間、通常は1時間インキュベートした。反応を、RNAse Aの添加と60分でのインキュベーションによって停止させた。その後、反応物を1.2%TAEアガロースゲルで分解し、ImageLabソフトウェアで切断された標的DNAの割合を定量化する。 Target DNA containing a spacer sequence and a PAM sequence (eg, determined as in Example 6) was constructed by DNA synthesis. One representative PAM was selected for testing where the PAM has a degenerate base. The target DNA contained a 2200 bp linear DNA obtained from a plasmid by PCR amplification using PAM and a spacer located 700 bp from one end. When the cleavage was successful, fragments of 700 bp and 1500 bp were obtained. Target DNA, in vitro transcribed single RNA, and purified recombinant protein were combined in cleavage buffer (10mM Tris, 100mM NaCl, 10mM MgCl2 ) containing excess protein and RNA for 5 min. Incubation was for 3 hours, usually 1 hour. The reaction was stopped by addition of RNAse A and incubation for 60 minutes. The reactions are then resolved on a 1.2% TAE agarose gel and the percentage of target DNA cleaved is quantified with ImageLab software.

実施例9.-(一般的なプロトコル)大腸菌中のMG CRISPR複合体のゲノム切断活性の試験
大腸菌は、二本鎖DNAの切断を効率的に修復する能力を持っていない。そのため、ゲノムDNAの切断は致死的な事象となり得る。この現象を利用して、ゲノムDNAにスペーサー/標的配列とPAM配列を組み込んだ標的株でエンドヌクレアーゼとtracrRNAを組換え発現させることによって、大腸菌においてエンドヌクレアーゼ活性を試験した。
Example 9. - (General protocol) Testing the genome cleavage activity of the MG CRISPR complex in E. coli E. coli does not have the ability to efficiently repair double-stranded DNA breaks. Therefore, cleavage of genomic DNA can be a fatal event. Taking advantage of this phenomenon, the endonuclease activity was tested in E. coli by recombinantly expressing the endonuclease and tracrRNA in a target strain in which the spacer/target sequence and PAM sequence had been incorporated into the genomic DNA.

このアッセイでは、PAM配列は、実施例6に記載される方法で決定されたように試験対象のエンドヌクレアーゼに特異的である。sgRNA配列は、tracrRNAの配列と予測される構造に基づいて決定された。リピートの5’末端から始めて、8~12bp(一般的には10bp)のリピート-アンチリピートの対を選択した。残りのリピートの3’末端とtracrRNAの5’末端をテトラループに置き換えた。一般に、テトラループはGAAAであったが、特にGAAA配列が折り畳みを阻害すると予測される場合には、他のテトラループを使用することができる。このような場合には、TTCGテトラループを用いた。 In this assay, the PAM sequence is specific for the endonuclease being tested as determined by the method described in Example 6. The sgRNA sequence was determined based on the sequence and predicted structure of tracrRNA. Starting from the 5' end of the repeat, repeat-anti-repeat pairs of 8-12 bp (generally 10 bp) were selected. The 3' ends of the remaining repeats and the 5' ends of tracrRNA were replaced with tetraloops. Generally, the tetraloop was GAAA, but other tetraloops can be used, particularly if the GAAA sequence is predicted to inhibit folding. In such cases, a TTCG tetraloop was used.

ゲノムDNAにPAM配列を組み込んだ組換え株を、エンドヌクレアーゼをコードするDNAで形質転換した。その後、形質転換体を化学的に適合させ、標的配列に特異的(「オンターゲット(on target)」)または標的に非特異的(「ノンターゲット(non target)」)な単一のガイドRNA50ngを用いて、形質転換した。熱ショック後、形質転換体をSOC中で37℃にて2時間回収した。その後、ヌクレアーゼ効率は、誘導培地で培養した5倍希釈系列によって決定された。コロニーは3連で(in triplicate)希釈系列から定量化された。 A recombinant strain with a PAM sequence incorporated into its genomic DNA was transformed with DNA encoding the endonuclease. The transformants are then chemically adapted to receive 50 ng of a single guide RNA that is specific for the target sequence (“on target”) or non-specific for the target (“non target”). was used for transformation. After heat shock, transformants were collected in SOC at 37°C for 2 hours. Nuclease efficiency was then determined by a 5-fold dilution series incubated in induction medium. Colonies were quantified from a dilution series in triplicate.

実施例10.-(一般的なプロトコル)哺乳動物細胞中のMG CRISPR複合体のゲノム切断活性の試験
哺乳動物細胞における標的化および切断活性を示すために、MG Casエフェクタータンパク質配列を2つの哺乳動物発現ベクター:(a)C末端のSV40 NLSと2A-GFPタグを有するものと、(b)GFPタグを持たず、N末端に1つとC末端に1つの、2つのSV40 NLS配列を有するもので試験した。いくつかの例では、エンドヌクレアーゼをコードするヌクレオチド配列は、哺乳動物細胞での発現にコドン最適化されている。
Example 10. - (General Protocol) Testing the Genomic Cleavage Activity of the MG CRISPR Complex in Mammalian Cells To demonstrate targeting and cleavage activity in mammalian cells, the MG Cas effector protein sequence was transferred to two mammalian expression vectors: ( Tested a) with an SV40 NLS at the C-terminus and a 2A-GFP tag, and (b) without a GFP tag and with two SV40 NLS sequences, one at the N-terminus and one at the C-terminus. In some instances, the nucleotide sequence encoding the endonuclease is codon-optimized for expression in mammalian cells.

標的化配列が付加された対応する単一のガイドRNA配列(sgRNA)を、第2の哺乳動物発現ベクターにクローン化する。2つのプラスミドをHEK293T細胞にコトランスフェクトする。発現プラスミドとsgRNA標的化プラスミドをHEK293T細胞にコトランスフェクトしてから72時間後に、DNAを抽出し、NGS-ライブラリの作成に使用する。哺乳動物細胞における酵素の標的化効率を実証するために、標的部位の配列決定におけるインデルを介してパーセントNHEJを測定する。各タンパク質の活性を試験するために、少なくとも10の異なる標的部位が選択された。 The corresponding single guide RNA sequence (sgRNA) with added targeting sequence is cloned into a second mammalian expression vector. The two plasmids are co-transfected into HEK293T cells. Seventy-two hours after co-transfecting the expression plasmid and sgRNA targeting plasmid into HEK293T cells, DNA is extracted and used for NGS-library construction. To demonstrate the targeting efficiency of the enzyme in mammalian cells, we measure the percent NHEJ through indels in sequencing the target site. At least 10 different target sites were selected to test the activity of each protein.

実施例11.-MG1ファミリーメンバーの特徴付け
PAM特異性、tracrRNA/sgRNA検証
Example 11. -Characterization of MG1 family members PAM specificity, tracrRNA/sgRNA validation

MG1ファミリーエンドヌクレアーゼシステムの標的となるエンドヌクレアーゼ活性は、実施例6に記載したmyTXTLシステムを用いて確認された。このアッセイでは、切断された標的プラスミドのPCR増幅により、図17-20に示すように、ゲル中で約170bpで遊走する産物が得られる。増幅産物は、MG1-4(二重ガイド:ゲル1、レーン3を参照、単一ガイド:ゲル6、レーン2を参照)、MG1-5(ゲル2、レーン10)、MG1-6(二重ガイド:ゲル5、レーン6を参照、単一ガイド:ゲル6、レーン5を参照)、MG1-7(二重ガイド:ゲル3、レーン13を参照、単一ガイド:ゲル3、レーン2を参照)(それぞれタンパク質配列番号:1-4)について観察された。PCR産物の配列決定により、表2に示されるように、これらの酵素の活性PAM配列が明らかになった。 Targeted endonuclease activity of the MG1 family endonuclease system was confirmed using the myTXTL system described in Example 6. In this assay, PCR amplification of the cleaved target plasmid results in a product that migrates at approximately 170 bp in the gel, as shown in Figures 17-20. The amplification products were MG1-4 (double guide: gel 1, see lane 3; single guide: gel 6, see lane 2), MG1-5 (gel 2, lane 10), MG1-6 (duplex guide: gel 1, see lane 3), MG1-5 (gel 2, lane 10), Guide: gel 5, see lane 6, single guide: gel 6, see lane 5), MG1-7 (double guide: gel 3, see lane 13, single guide: gel 3, see lane 2) ) (Protein SEQ ID NOs: 1-4, respectively). Sequencing of the PCR products revealed the active PAM sequences of these enzymes, as shown in Table 2.

合成単一ガイドRNA(sgRNA)は、tracrRNAの配列と予測される構造に基づいて設計され、配列番号:5461-5464として提示されている。実施例6のPAM配列スクリーンは、sgRNAを用いて繰り返された。この実験の結果は表2にも示されており、sgRNAを使用するとPAMの特異性がわずかに変化したことが明らかになっている。 Synthetic single guide RNAs (sgRNAs) were designed based on the sequence and predicted structure of tracrRNA and are presented as SEQ ID NOs: 5461-5464. The PAM sequence screen of Example 6 was repeated using sgRNA. The results of this experiment are also shown in Table 2 and reveal that the use of sgRNA slightly altered the specificity of PAM.

インビトロでの標的となるエンドヌクレアーゼ活性 Targeted endonuclease activity in vitro

PAM配列CAGGAAGGを有する標的DNAに対する、MG1-4エンドヌクレアーゼシステム(sgRNA 配列番号:5461を有する、タンパク質配列番号:1)のインビトロ活性が、実施例8の方法を用いて実証された。上記で報告されている単一ガイド配列(配列番号:5461)を使用し、配列のNsを置き換えてスペーサー/標的化配列の長さを18~24ntの範囲で変化させた。その結果を図10に示す。左パネルは、異なる標的化配列長(18~24nt)を有する対応する単一ガイドsgRNAと組み合わせたMG1-4によるDNA切断を実証するゲルを示し、右パネルは、同じデータを棒グラフとして定量化したものを示す。このデータは、18~24ヌクレオチドの標的化配列がMG1-4/sgRNAシステムで機能的であることを実証した。 The in vitro activity of the MG1-4 endonuclease system (Protein SEQ ID NO: 1 with sgRNA SEQ ID NO: 5461) against target DNA having the PAM sequence CAGGAAGG was demonstrated using the method of Example 8. The single guide sequence reported above (SEQ ID NO: 5461) was used and the length of the spacer/targeting sequence was varied from 18 to 24 nt by replacing Ns in the sequence. The results are shown in FIG. The left panel shows a gel demonstrating DNA cleavage by MG1-4 in combination with the corresponding single guide sgRNAs with different targeting sequence lengths (18-24 nt), and the right panel quantified the same data as a bar graph. show something This data demonstrated that targeting sequences of 18-24 nucleotides were functional in the MG1-4/sgRNA system.

細菌細胞における標的となるエンドヌクレアーゼ活性 Targeted endonuclease activity in bacterial cells

MG1-4エンドヌクレアーゼシステム(タンパク質配列番号:1、sgRNA 配列番号:5461)のインビボ活性は、実施例9と同様にPAM配列CAGGAAGGを用いて試験された。形質転換した大腸菌を連続希釈でプレーティングし、その結果(左パネルに大腸菌の連続希釈を示し、右パネルに定量化した成長を示す)を図11に提示する。非標的sgRNAを発現する大腸菌と比較して、オンターゲットsgRNAを発現する大腸菌の増殖の大幅な減少は、ゲノムDNAが大腸菌細胞内でエンドヌクレアーゼによって特異的に切断されたことを示している。 The in vivo activity of the MG1-4 endonuclease system (Protein SEQ ID NO: 1, sgRNA SEQ ID NO: 5461) was tested as in Example 9 using the PAM sequence CAGGAAGG. Transformed E. coli were plated in serial dilutions and the results are presented in FIG. 11 (serial dilutions of E. coli are shown in the left panel and quantified growth is shown in the right panel). The significant reduction in growth of E. coli expressing on-target sgRNA compared to E. coli expressing non-target sgRNA indicates that the genomic DNA was specifically cleaved by the endonuclease in E. coli cells.

哺乳動物細胞における標的となるエンドヌクレアーゼ活性 Targeted endonuclease activity in mammalian cells

実施例10の方法を用いて、哺乳動物細胞における標的化および切断活性を実証した。MG1-4(タンパク質配列番号:5527)およびMG1-6(タンパク質配列番号:5529)の配列をコードするオープンリーディングフレームは、C末端SV40 NLSと2A-GFPタグを有するもの(大腸菌MG-BB)と、GFPタグを持たず、N末端に1つとC末端に1つの2つのNLS配列を持つもの(大腸菌pMG5-BB)の2つの哺乳動物発現ベクターにクローン化された。MG1-6については、オープンリーディングフレームはさらに哺乳動物の発現のためにコドン最適化され(配列番号:5589)、2-NLSプラスミド骨格にクローン化された(MG-16hs)。この実験の結果を図12に示す。エンドヌクレアーゼ発現ベクターは、エンドヌクレアーゼに特異的なtracr配列と表3~4から選択されたガイド配列とを有するsgRNA(例えば、配列番号:5512または5515)を発現させるための第2のベクターとともにHEK293T細胞にコトランスフェクトされた。コトランスフェクションの72時間後に、DNAを抽出し、NGS-ライブラリの調製に使用した。切断活性は、標的部位の配列に近接の内部欠失(NHEJレムナント)の出現により検出された。哺乳動物細胞における酵素の標的化効率を実証するために、標的部位の配列におけるインデルを介してNHEJの割合を測定し、図12に示した。 The method of Example 10 was used to demonstrate targeting and cleavage activity in mammalian cells. The open reading frames encoding the sequences of MG1-4 (Protein SEQ ID NO: 5527) and MG1-6 (Protein SEQ ID NO: 5529) have a C-terminal SV40 NLS and a 2A-GFP tag (E. coli MG-BB). , was cloned into two mammalian expression vectors, one without a GFP tag and with two NLS sequences, one at the N-terminus and one at the C-terminus (E. coli pMG5-BB). For MG1-6, the open reading frame was further codon-optimized for mammalian expression (SEQ ID NO: 5589) and cloned into the 2-NLS plasmid backbone (MG-16hs). The results of this experiment are shown in FIG. The endonuclease expression vector comprises HEK293T along with a second vector for expressing sgRNA (e.g., SEQ ID NO: 5512 or 5515) having an endonuclease-specific tracr sequence and a guide sequence selected from Tables 3-4. co-transfected into cells. 72 hours after co-transfection, DNA was extracted and used for NGS-library preparation. Cleavage activity was detected by the appearance of internal deletions (NHEJ remnants) in close proximity to the target site sequence. To demonstrate the targeting efficiency of the enzyme in mammalian cells, the proportion of NHEJ through indels in the sequence of the target site was determined and shown in FIG. 12.

実施例12.-MG2ファミリーメンバーの特徴付け
PAM特異性、tracrRNA/sgRNAの検証
Example 12. -Characterization of MG2 family members PAM specificity, validation of tracrRNA/sgRNA

MG2ファミリーメンバーの標的となるエンドヌクレアーゼ活性は、実施例6に記載されたようにmyTXTLシステムで確認された。このアッセイの結果を図17~20で示す。図17~20に示すアッセイでは、ライブラリの切断に成功した活性タンパク質は、ゲル中におよそ170bpのバンドを生じさせる。MG2-1(ゲル2、レーン11、およびゲル4、レーン6を参照)およびMG2-7(ゲル11、レーン10を参照)について増幅産物が観察された(それぞれ配列番号:320および321)。PCR産物の配列決定により、以下の表5に示す活性PAM配列が明らかになった。 Targeted endonuclease activity of MG2 family members was confirmed with the myTXTL system as described in Example 6. The results of this assay are shown in Figures 17-20. In the assays shown in Figures 17-20, active proteins that are successfully cleaved from the library give rise to a band of approximately 170 bp in the gel. Amplification products were observed for MG2-1 (see gel 2, lane 11 and gel 4, lane 6) and MG2-7 (see gel 11, lane 10) (SEQ ID NOs: 320 and 321, respectively). Sequencing of the PCR products revealed the active PAM sequences shown in Table 5 below.

細菌細胞における標的となるエンドヌクレアーゼ活性 Targeted endonuclease activity in bacterial cells

sgRNAを有するMG2-7エンドヌクレアーゼシステム(エンドヌクレアーゼ配列番号:321;sgRNA 配列番号:5465)およびAGCGTAAG PAM配列のインビボ活性は、実施例9に記載される方法を用いて確認された。形質転換した大腸菌を連続希釈でプレーティングし、その結果(左パネルに大腸菌の連続希釈を示し、右パネルに定量化した成長を示す)を図34に提示する。非標的sgRNAを発現する大腸菌と比較して、オンターゲットsgRNAを発現する大腸菌の増殖の大幅な減少は、ゲノムDNAが大腸菌細胞内でMG1-4エンドヌクレアーゼによって特異的に切断されたことを示している。 The in vivo activity of the MG2-7 endonuclease system with sgRNA (endonuclease SEQ ID NO: 321; sgRNA SEQ ID NO: 5465) and the AGCGTAAG PAM sequence was confirmed using the method described in Example 9. Transformed E. coli were plated in serial dilutions and the results are presented in FIG. 34 (serial dilutions of E. coli are shown in the left panel and quantified growth is shown in the right panel). The significant reduction in growth of E. coli expressing on-target sgRNA compared to E. coli expressing non-target sgRNA indicates that genomic DNA was specifically cleaved by MG1-4 endonuclease in E. coli cells. There is.

実施例13.-MG3ファミリーメンバーの特徴付け Example 13. -Characterization of MG3 family members

PAM特異性、tracrRNA/sgRNAの検証 PAM specificity, tracrRNA/sgRNA verification

MG3ファミリーメンバーの標的となるエンドヌクレアーゼ活性は、tracr配列およびCRISPRアレイを使用して、実施例6に記載されたようなmyTXTLシステムを使用して確認された。このアッセイでは、切断された標的プラスミドのPCR増幅により、図17~20に示すように、ゲル中で約170bpで遊走する産物が得られる。MG3-6(二重ガイド:ゲル2、レーン8を参照、単一ガイド:ゲル3、レーン3を参照)、MG3-7(二重ガイド:ゲル2、レーン3を参照、単一ガイド:ゲル3、レーン4を参照)、MG3-8(二重ガイド:ゲル9、レーン5を参照)では、増幅産物が観察された(それぞれ配列番号:421、422、および423)。PCR産物の配列決定により、以下の表6に示す活性PAM配列が明らかになった。 Targeted endonuclease activity of MG3 family members was confirmed using the myTXTL system as described in Example 6 using tracr and CRISPR arrays. In this assay, PCR amplification of the cleaved target plasmid results in a product that migrates at approximately 170 bp in the gel, as shown in Figures 17-20. MG3-6 (double guide: gel 2, see lane 8, single guide: gel 3, see lane 3), MG3-7 (double guide: gel 2, see lane 3, single guide: gel 3, see lane 4), MG3-8 (double guide: gel 9, see lane 5), amplification products were observed (SEQ ID NOs: 421, 422, and 423, respectively). Sequencing of the PCR products revealed the active PAM sequences shown in Table 6 below.

合成単一ガイドRNA(sgRNA)は、tracrRNAの配列と予測される構造に基づいて設計され、配列番号:5466-5467として提示されている。実施例6のPAM配列スクリーンは、sgRNAを用いて繰り返された。この実験の結果は表6にも示されており、sgRNAを使用するとPAMの特異性がわずかに変化したことが明らかになっている。 Synthetic single guide RNAs (sgRNAs) were designed based on the sequence and predicted structure of tracrRNA and are presented as SEQ ID NOs: 5466-5467. The PAM sequence screen of Example 6 was repeated using sgRNA. The results of this experiment are also shown in Table 6 and reveal that the use of sgRNA slightly altered the specificity of PAM.

インビトロでの標的となるエンドヌクレアーゼ活性 Targeted endonuclease activity in vitro

MG3-6(エンドヌクレアーゼ配列番号:421)のインビトロ活性は、実施例8の方法を使用して、PAM配列GTGGGTTAで実証された。上記で報告されている単一ガイド配列(配列番号:5466)を使用し、配列のNsを置き換えてスペーサー/標的化配列の長さを18~24ntの範囲で変化させた。その結果を図13に示す。上パネルは、異なる標的化配列長(18~24nt)を有する様々なsgRNAと組み合わせたMG3-6によるDNA切断を実証するゲルを示し、下パネルは、同じデータを棒グラフとして定量化したものを示す。このデータは、18~24ヌクレオチドの標的化配列がMG3-6/sgRNAシステムで機能的であることを実証した。 The in vitro activity of MG3-6 (endonuclease SEQ ID NO: 421) was demonstrated with the PAM sequence GTGGGTTA using the method of Example 8. The single guide sequence reported above (SEQ ID NO: 5466) was used and the length of the spacer/targeting sequence was varied from 18 to 24 nt by replacing Ns in the sequence. The results are shown in FIG. The upper panel shows a gel demonstrating DNA cleavage by MG3-6 in combination with various sgRNAs with different targeting sequence lengths (18-24 nt), and the lower panel shows the same data quantified as a bar graph. . This data demonstrated that targeting sequences of 18-24 nucleotides were functional in the MG3-6/sgRNA system.

細菌細胞における標的となるエンドヌクレアーゼ活性 Targeted endonuclease activity in bacterial cells

MG3-7エンドヌクレアーゼシステム(タンパク質配列番号:422、sgRNA 配列番号:5467)のインビボ活性は、実施例9の方法を使用してPAM配列TGGACCTGを用いて試験された。形質転換した大腸菌を連続希釈でプレーティングし、その結果(上パネルに大腸菌の連続希釈を示し、下パネルに定量化した成長を示す)を図14に提示する。非標的sgRNAを発現する大腸菌と比較して、オンターゲットsgRNAを発現する大腸菌の増殖の大幅な減少は、ゲノムDNAがMG3-7エンドヌクレアーゼシステムによって特異的に切断されていたことを示している。 The in vivo activity of the MG3-7 endonuclease system (Protein SEQ ID NO: 422, sgRNA SEQ ID NO: 5467) was tested using the PAM sequence TGGACCTG using the method of Example 9. Transformed E. coli was plated in serial dilutions and the results are presented in FIG. 14 (top panel shows serial dilution of E. coli, bottom panel shows quantified growth). The significantly reduced growth of E. coli expressing on-target sgRNA compared to E. coli expressing non-target sgRNA indicates that the genomic DNA was being specifically cleaved by the MG3-7 endonuclease system.

哺乳動物細胞における標的となるエンドヌクレアーゼ活性 Targeted endonuclease activity in mammalian cells

実施例10の方法を用いて、哺乳動物細胞における標的化および切断活性を実証した。MG3-7(タンパク質配列番号:422)の配列をコードするオープンリーディングフレームは、C末端SV40 NLSと2A-GFPタグを有するもの(大腸菌MG-BB)と、GFPタグを持たず、N末端に1つとC末端に1つの2つのNLSを持つもの(大腸菌pMG5-BB)の2つの哺乳動物発現ベクターにクローン化された。エンドヌクレアーゼ発現ベクターは、表7から選択されたガイド配列を用いて上記のsgRNAを発現するための第2のベクターでHEK293T細胞へコトランスフェクトされた。この実験の結果を図12に示す。コトランスフェクションの72時間後に、DNAを抽出し、NGS-ライブラリの調製に使用した。切断活性は、標的部位の近傍にある内部欠失(NHEJレムナント)の出現により検出された。結果を図15に示す。 The method of Example 10 was used to demonstrate targeting and cleavage activity in mammalian cells. The open reading frames encoding the sequence of MG3-7 (Protein SEQ ID NO: 422) are divided into two types: one with a C-terminal SV40 NLS and a 2A-GFP tag (E. coli MG-BB), and one without a GFP tag and with a 1 at the N-terminus. It was cloned into two mammalian expression vectors, one with two NLSs and one at the C-terminus (E. coli pMG5-BB). The endonuclease expression vector was co-transfected into HEK293T cells with a second vector to express the sgRNA described above using a guide sequence selected from Table 7. The results of this experiment are shown in FIG. 72 hours after co-transfection, DNA was extracted and used for NGS-library preparation. Cleavage activity was detected by the appearance of internal deletions (NHEJ remnants) in the vicinity of the target site. The results are shown in FIG.

sgRNAプラスミド上でコードされた標的部位を以下の表7に示す。 The target sites encoded on the sgRNA plasmids are shown in Table 7 below.

実施例13.-MG4ファミリーメンバーの特徴付け
PAM特異性、tracrRNA/sgRNAの検証
Example 13. -Characterization of MG4 family members PAM specificity, validation of tracrRNA/sgRNA

MG4ファミリーエンドヌクレアーゼシステムの標的となるエンドヌクレアーゼ活性は、実施例6に記載されるようなmyTXTLシステムを用いて確認された。このアッセイでは、切断された標的プラスミドのPCR増幅により、図17~20に示すように、ゲル中で約170bpで遊走する産物が得られる。MG4-2(二重ガイド:ゲル2、レーン9、単一ガイド:ゲル10、レーン7を参照)について増幅産物が観察された(配列番号:432)。PCR産物の配列決定により、以下の表8に示される活性PAM配列が明らかになった。 Targeted endonuclease activity of the MG4 family endonuclease system was confirmed using the myTXTL system as described in Example 6. In this assay, PCR amplification of the cleaved target plasmid results in a product that migrates at approximately 170 bp in the gel, as shown in Figures 17-20. An amplification product was observed for MG4-2 (double guide: gel 2, lane 9; single guide: gel 10, see lane 7) (SEQ ID NO: 432). Sequencing of the PCR products revealed the active PAM sequences shown in Table 8 below.

実施例14.MG14ファミリーメンバーの特徴付け
PAM特異性、tracrRNA/sgRNAの検証
Example 14. Characterization of MG14 family members PAM specificity, validation of tracrRNA/sgRNA

MG14ファミリーメンバーの標的となるエンドヌクレアーゼ活性は、実施例6に記載されるようなmyTXTLシステムを用いて確認された。このアッセイでは、切断された標的プラスミドのPCR増幅により、図17~20に示すように、ゲル中で約170bpで遊走する産物が得られる。MG14-1(二重ガイド:ゲル2、1レーン4、単一ガイド:ゲル3、レーン8を参照)について増幅産物が観察された(配列番号:678)。PCR産物の配列決定により、以下の表9に示される活性PAM配列特異性が明らかになった。 Targeted endonuclease activity of MG14 family members was confirmed using the myTXTL system as described in Example 6. In this assay, PCR amplification of the cleaved target plasmid results in a product that migrates at approximately 170 bp in the gel, as shown in Figures 17-20. Amplification products were observed for MG14-1 (double guide: gel 2, 1 lane 4, single guide: gel 3, see lane 8) (SEQ ID NO: 678). Sequencing of the PCR products revealed active PAM sequence specificity as shown in Table 9 below.

細菌細胞における標的となるエンドヌクレアーゼ活性 Targeted endonuclease activity in bacterial cells

sgRNAを有するMG14-1エンドヌクレアーゼシステム(エンドヌクレアーゼ配列番号:678;sgRNA 配列番号:5469)およびGGCGGGGA PAM配列のインビボ活性は、実施例9に記載される方法を用いて確認された。形質転換した大腸菌を連続希釈でプレーティングし、その結果(左パネルに大腸菌の連続希釈を示し、右パネルに定量化した成長を示す)を図35に提示する。非標的sgRNAを発現する大腸菌と比較して、オンターゲットsgRNAを発現する大腸菌の増殖の大幅な減少は、ゲノムDNAが大腸菌細胞内でMG1-4エンドヌクレアーゼによって特異的に切断されたことを示している。 The in vivo activity of the MG14-1 endonuclease system with sgRNA (endonuclease SEQ ID NO: 678; sgRNA SEQ ID NO: 5469) and the GGCGGGGA PAM sequence was confirmed using the method described in Example 9. Transformed E. coli were plated in serial dilutions and the results are presented in FIG. 35 (serial dilutions of E. coli are shown in the left panel and quantified growth is shown in the right panel). The significant reduction in growth of E. coli expressing on-target sgRNA compared to E. coli expressing non-target sgRNA indicates that genomic DNA was specifically cleaved by MG1-4 endonuclease in E. coli cells. There is.

実施例15.-MG15ファミリーメンバーの特徴付け
PAM特異性、tracrRNA/sgRNAの検証
Example 15. -Characterization of MG15 family members PAM specificity, validation of tracrRNA/sgRNA

MG15ファミリーメンバーの標的となるエンドヌクレアーゼ活性は、実施例6に記載されるようなmyTXTLシステムを用いて確認された。このアッセイでは、切断された標的プラスミドのPCR増幅により、図17~20に示すように、ゲル中で約170bpで遊走する産物が得られる。MG15-1(二重ガイド:ゲル2、レーン7、単一ガイド:ゲル3、レーン9を参照)について増幅産物が観察された(配列番号:930)。PCR産物の配列決定により、以下の表10で詳細に説明される活性PAM配列特異性が明らかになった。 Targeted endonuclease activity of MG15 family members was confirmed using the myTXTL system as described in Example 6. In this assay, PCR amplification of the cleaved target plasmid results in a product that migrates at approximately 170 bp in the gel, as shown in Figures 17-20. Amplification products were observed for MG15-1 (dual guide: gel 2, lane 7; single guide: gel 3, see lane 9) (SEQ ID NO: 930). Sequencing of the PCR products revealed active PAM sequence specificities detailed in Table 10 below.

インビトロ活性 in vitro activity

MG15-1エンドヌクレアーゼシステム(タンパク質配列番号:930、sgRNA 配列番号:5470)のインビトロ活性は、実施例8の方法を使用してPAM配列GGGTCAAAを用いて試験された。上記で報告されている単一ガイド配列(配列番号:5470)を使用し、配列のNsを置き換えてスペーサー/標的化配列の長さを18~24ntの範囲で変化させた。その結果を図16に示す。上パネルは、異なる標的化配列長(18~24nt)を有する様々なsgRNAと組み合わせたMG15-1によるDNA切断を実証するゲルを示し、下パネルは、同じデータを棒グラフとして定量化したものを示す。このデータは、18~24ヌクレオチドの標的化配列がMG15-1/sgRNAシステムで機能的であることを実証した。 The in vitro activity of the MG15-1 endonuclease system (Protein SEQ ID NO: 930, sgRNA SEQ ID NO: 5470) was tested using the PAM sequence GGGTCAAA using the method of Example 8. The single guide sequence reported above (SEQ ID NO: 5470) was used and the length of the spacer/targeting sequence was varied from 18 to 24 nt by replacing Ns in the sequence. The results are shown in FIG. The top panel shows a gel demonstrating DNA cleavage by MG15-1 in combination with various sgRNAs with different targeting sequence lengths (18-24 nt), and the bottom panel shows the same data quantified as a bar graph. . This data demonstrated that targeting sequences of 18-24 nucleotides were functional in the MG15-1/sgRNA system.

細菌細胞における標的となるエンドヌクレアーゼ活性 Targeted endonuclease activity in bacterial cells

sgRNAを有するMG15-1エンドヌクレアーゼシステム(エンドヌクレアーゼ配列番号:930;sgRNA 配列番号:5470)およびGGGTCAAA PAM配列のインビボ活性は、実施例9に記載される方法を用いて確認された。形質転換した大腸菌を連続希釈でプレーティングし、その結果(左パネルに大腸菌の連続希釈を示し、右パネルに定量化した成長を示す)を図35に提示する。非標的sgRNAを発現する大腸菌と比較して、オンターゲットsgRNAを発現する大腸菌の増殖の大幅な減少は、ゲノムDNAが大腸菌細胞内でMG1-4エンドヌクレアーゼによって特異的に切断されたことを示している。 The in vivo activity of the MG15-1 endonuclease system with sgRNA (endonuclease SEQ ID NO: 930; sgRNA SEQ ID NO: 5470) and the GGGTCAA PAM sequence was confirmed using the method described in Example 9. Transformed E. coli were plated in serial dilutions and the results are presented in FIG. 35 (serial dilutions of E. coli are shown in the left panel and quantified growth is shown in the right panel). The significant reduction in growth of E. coli expressing on-target sgRNA compared to E. coli expressing non-target sgRNA indicates that genomic DNA was specifically cleaved by MG1-4 endonuclease in E. coli cells. There is.

実施例16.-MG16ファミリーメンバーの特徴付け
PAM特異性、tracrRNA/sgRNAの検証
Example 16. -Characterization of MG16 family members PAM specificity, validation of tracrRNA/sgRNA

MG16ファミリーメンバーの標的となるエンドヌクレアーゼ活性は、実施例6に記載されるようなmyTXTLシステムを用いて確認された。このアッセイでは、切断された標的プラスミドのPCR増幅により、図17~20に示すように、ゲル中で約170bpで遊走する産物が得られる。増幅産物は、MG16-2(ゲル11、レーン17を参照)(配列番号:1093)について観察された。PCR産物の配列決定により、以下の表11で詳細に説明される活性PAM配列特異性が明らかになった。 Targeted endonuclease activity of MG16 family members was confirmed using the myTXTL system as described in Example 6. In this assay, PCR amplification of the cleaved target plasmid results in a product that migrates at approximately 170 bp in the gel, as shown in Figures 17-20. Amplification products were observed for MG16-2 (see gel 11, lane 17) (SEQ ID NO: 1093). Sequencing of the PCR products revealed active PAM sequence specificities detailed in Table 11 below.

実施例17.-MG18ファミリーメンバーの特徴付け
PAM特異性、tracrRNA/sgRNAの検証
Example 17. -Characterization of MG18 family members PAM specificity, validation of tracrRNA/sgRNA

MG18ファミリーメンバーの標的となるエンドヌクレアーゼ活性は、実施例6に記載されるようなmyTXTLシステムを用いて確認された。このアッセイでは、切断された標的プラスミドのPCR増幅により、図17~20に示すように、ゲル中で約170bpで遊走する産物が得られる。MG18-1(二重ガイド:ゲル2、レーン9、単一ガイド:ゲル11、レーン12を参照)について増幅産物が観察された(配列番号:1354)。PCR産物の配列決定により、以下の表12で詳細に説明される活性PAM配列特異性が明らかになった。 Targeted endonuclease activity of MG18 family members was confirmed using the myTXTL system as described in Example 6. In this assay, PCR amplification of the cleaved target plasmid results in a product that migrates at approximately 170 bp in the gel, as shown in Figures 17-20. An amplification product was observed for MG18-1 (double guide: gel 2, lane 9; single guide: gel 11, see lane 12) (SEQ ID NO: 1354). Sequencing of the PCR products revealed active PAM sequence specificities detailed in Table 12 below.

実施例18.-MG21ファミリーメンバーの特徴付け
PAM特異性、tracrRNA/sgRNAの検証
Example 18. -Characterization of MG21 family members PAM specificity, validation of tracrRNA/sgRNA

MG21ファミリーの標的となるエンドヌクレアーゼ活性は、実施例6に記載されるようなmyTXTLシステムを用いて確認された。このアッセイでは、切断された標的プラスミドのPCR増幅により、図17~20に示すように、ゲル中で約170bpで遊走する産物が得られる。増幅産物は、MG21-1(ゲル11、レーン2を参照)について観察された(配列番号:1512)。PCR産物の配列決定により、以下の表13で詳細に説明される活性PAM配列特異性が明らかになった。 Targeted endonuclease activity of the MG21 family was confirmed using the myTXTL system as described in Example 6. In this assay, PCR amplification of the cleaved target plasmid results in a product that migrates at approximately 170 bp in the gel, as shown in Figures 17-20. An amplification product was observed for MG21-1 (see gel 11, lane 2) (SEQ ID NO: 1512). Sequencing of the PCR products revealed active PAM sequence specificities detailed in Table 13 below.

実施例19.-MG22ファミリーメンバーの特徴付け
PAM特異性、tracrRNA/sgRNAの検証
Example 19. -Characterization of MG22 family members PAM specificity, validation of tracrRNA/sgRNA

MG22ファミリーメンバーの標的となるエンドヌクレアーゼ活性は、実施例6に記載されるようなmyTXTLシステムを用いて確認された。このアッセイでは、切断された標的プラスミドのPCR増幅により、図17~20に示すように、ゲル中で約170bpで遊走する産物が得られる。図17~20に示すアッセイでは、ライブラリの切断に成功した活性タンパク質は、ゲル中におよそ170bpのバンドを生じさせる。増幅産物は、MG22-1(ゲル11、レーン3を参照)について観察された(タンパク質配列番号:1656)。PCR産物の配列決定により、以下の表14で詳細に説明される活性PAM配列特異性が明らかになった。 Targeted endonuclease activity of MG22 family members was confirmed using the myTXTL system as described in Example 6. In this assay, PCR amplification of the cleaved target plasmid results in a product that migrates at approximately 170 bp in the gel, as shown in Figures 17-20. In the assays shown in Figures 17-20, active proteins that are successfully cleaved from the library give rise to a band of approximately 170 bp in the gel. An amplification product was observed for MG22-1 (see gel 11, lane 3) (Protein SEQ ID NO: 1656). Sequencing of the PCR products revealed active PAM sequence specificities detailed in Table 14 below.

実施例20.-MG23ファミリーメンバーの特徴付け
PAM特異性、tracrRNA/sgRNAの検証
Example 20. -Characterization of MG23 family members PAM specificity, validation of tracrRNA/sgRNA

MG23ファミリーメンバーの標的となるエンドヌクレアーゼ活性は、実施例6に記載されるようなmyTXTLシステムを用いて確認された。このアッセイでは、切断された標的プラスミドのPCR増幅により、図17~20に示すように、ゲル中で約170bpで遊走する産物が得られる。増幅産物は、MG23-1(ゲル11、レーン4を参照)について観察された(配列番号:1756)。PCR産物の配列決定により、以下の表15で詳細に説明されるこれらの酵素について活性PAM配列特異性が明らかになった。 Targeted endonuclease activity of MG23 family members was confirmed using the myTXTL system as described in Example 6. In this assay, PCR amplification of the cleaved target plasmid results in a product that migrates at approximately 170 bp in the gel, as shown in Figures 17-20. An amplification product was observed for MG23-1 (see gel 11, lane 4) (SEQ ID NO: 1756). Sequencing of the PCR products revealed active PAM sequence specificity for these enzymes, detailed in Table 15 below.

本開示のシステムは、例えば、核酸編集(例えば、遺伝子編集)、核酸分子への結合(例えば、配列特異的結合)など、様々な用途に使用することができる。このようなシステムは、例えば、ウイルスゲノムを標的とすることでウイルスを不活性化したり、宿主細胞に感染できないようにしたりするために、価値の高い低分子、高分子、または二次代謝産物を生成するように生物を操作するべく遺伝子を追加したり、代謝経路を変更したりするために、進化的選択のための遺伝子駆動要素を確立するために、バイオセンサーとして外来の低分子およびヌクレオチドによる細胞摂動を検出するために、特定のヌクレオチド配列(例えば、細菌における抗生物質耐性をコードする配列)を標的とするとともに検出するためにプローブと組み合わせた不活性化酵素のように、疾患を引き起こす遺伝的要素を検出するための診断ツールとして(例えば、逆転写されたウイルスRNAまたは疾患を引き起こす突然変異をコードする増幅されたDNA配列の切断を介して)、被験体において疾患を引き起こす可能性のある遺伝的に受け継がれた突然変異をアドレス指定(例えば、除去または置換)して、遺伝子を不活性化することで細胞内での遺伝子の機能を確認するために使用されてもよい。 The systems of the present disclosure can be used in a variety of applications, such as, for example, nucleic acid editing (eg, gene editing), binding to nucleic acid molecules (eg, sequence-specific binding), and the like. Such systems can, for example, inject high-value small molecules, macromolecules, or secondary metabolites to inactivate the virus by targeting the viral genome or rendering it incapable of infecting host cells. by exogenous small molecules and nucleotides as biosensors, to establish gene driving elements for evolutionary selection, to add genes or change metabolic pathways to manipulate organisms to produce Disease-causing genes, such as inactivating enzymes combined with probes to target and detect specific nucleotide sequences (e.g., sequences encoding antibiotic resistance in bacteria) to detect cellular perturbations. as a diagnostic tool for detecting elements that are likely to cause disease in a subject (e.g., through cleavage of reverse transcribed viral RNA or amplified DNA sequences encoding disease-causing mutations). It may be used to address (e.g. remove or replace) genetically inherited mutations to inactivate the gene and thereby confirm the function of the gene within the cell.

本発明の好ましい実施形態が本明細書中で示され、記載されてきたが、このような実施形態はほんの一例として提供されているに過ぎないことが当業者に明らかであろう。本発明が明細書内で提供される特定の例によって制限されることは意図していない。本発明は前述の明細書に関して記載されているが、本明細書中の実施形態の記載および例示は、限定的な意味で解釈されることを目的としていない。当業者であれば、多くの変更、変化、および置換が、本発明から逸脱することなく思いつくだろう。さらに、本発明のすべての態様は、様々な条件および変数に依存する、本明細書で説明された特定の描写、構成、または相対的な比率に限定されないことが理解されよう。本明細書に記載される本発明の実施形態の様々な代替案が、本発明の実施に際して利用され得ることを理解されたい。それゆえ、本発明は、任意のそのような代替物、修正物、変形物、または同等物にも及ぶものと企図される。以下の請求項は本発明の範囲を定義するものであり、この請求項とその均等物の範囲内の方法、および構造体がそれによって包含されるものであるということが意図されている。 While preferred embodiments of the invention have been shown and described herein, it will be obvious to those skilled in the art that such embodiments are provided by way of example only. It is not intended that the invention be limited by the specific examples provided within the specification. Although the invention has been described with respect to the foregoing specification, the description and illustrations of embodiments herein are not intended to be construed in a limiting sense. Many modifications, changes, and substitutions will occur to those skilled in the art without departing from the invention. Furthermore, it will be understood that all aspects of the invention are not limited to the particular depictions, configurations, or relative proportions described herein, depending on various conditions and variables. It should be understood that various alternatives to the embodiments of the invention described herein may be utilized in practicing the invention. Therefore, it is contemplated that the invention extends to any such alternatives, modifications, variations, or equivalents. It is intended that the following claims define the scope of the invention and that methods and structures within the scope of these claims and their equivalents be covered thereby.

Claims (170)

操作されたヌクレアーゼシステムであって、前記操作されたヌクレアーゼシステムは、
(a)RuvC_IIIドメインとHNHドメインとを含むエンドヌクレアーゼであって、ここで、前記エンドヌクレアーゼは難培養性微生物に由来し、ここで、前記エンドヌクレアーゼは、クラス2のII型Casエンドヌクレアーゼである、エンドヌクレアーゼと、
(b)前記エンドヌクレアーゼと複合体を形成するように構成される、操作されたガイドリボ核酸構造であって、前記操作されたガイドリボ核酸構造は、
(i)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列と、
(ii)前記エンドヌクレアーゼに結合するように構成されたtracrリボ核酸配列と、を含む、操作されたガイドリボ核酸構造と、を含む、
操作されたヌクレアーゼシステム。
An engineered nuclease system, the engineered nuclease system comprising:
(a) An endonuclease comprising a RuvC_III domain and a HNH domain, wherein the endonuclease is derived from a difficult-to-cultivate microorganism, and wherein the endonuclease is a class 2 type II Cas endonuclease. , endonuclease, and
(b) an engineered guide ribonucleic acid structure configured to form a complex with said endonuclease, said engineered guide ribonucleic acid structure comprising:
(i) a guide ribonucleic acid sequence configured to hybridize to a target deoxyribonucleic acid sequence;
(ii) an engineered guide ribonucleic acid structure comprising a tracr ribonucleic acid sequence configured to bind to the endonuclease;
Engineered nuclease system.
前記RuvC_IIIドメインは、配列番号:1827-3637のいずれか1つに対して少なくとも70%、少なくとも75%、少なくとも80%、または少なくとも90%の配列同一性を有する配列を含む、請求項1に記載の操作されたヌクレアーゼシステム。 2. The RuvC_III domain comprises a sequence having at least 70%, at least 75%, at least 80%, or at least 90% sequence identity to any one of SEQ ID NOs: 1827-3637. engineered nuclease system. 操作されたヌクレアーゼシステムであって、前記操作されたヌクレアーゼシステムは、
(a)配列番号:1827-3637のいずれか1つに対して少なくとも75%の配列同一性を有するRuvC_IIIドメインを含むエンドヌクレアーゼと、
(b)前記エンドヌクレアーゼと複合体を形成するように構成される、操作されたガイドリボ核酸構造であって、前記操作されたガイドリボ核酸構造は、
(i)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列と、
(ii)前記エンドヌクレアーゼに結合するように構成されたtracrリボ核酸配列と、を含む、操作されたガイドリボ核酸構造と、を含む、
操作されたヌクレアーゼシステム。
An engineered nuclease system, the engineered nuclease system comprising:
(a) an endonuclease comprising a RuvC_III domain having at least 75% sequence identity to any one of SEQ ID NOs: 1827-3637;
(b) an engineered guide ribonucleic acid structure configured to form a complex with said endonuclease, said engineered guide ribonucleic acid structure comprising:
(i) a guide ribonucleic acid sequence configured to hybridize to a target deoxyribonucleic acid sequence;
(ii) an engineered guide ribonucleic acid structure comprising a tracr ribonucleic acid sequence configured to bind to the endonuclease;
Engineered nuclease system.
操作されたヌクレアーゼシステムであって、前記操作されたヌクレアーゼシステムは、
(a)配列番号:5512-5537を含むプロトスペーサー隣接モチーフ(PAM)配列に結合するように構成されたエンドヌクレアーゼであって、ここで、前記エンドヌクレアーゼはクラス2のII型Casエンドヌクレアーゼである、エンドヌクレアーゼと、
(b)前記エンドヌクレアーゼと複合体を形成するように構成される、操作されたガイドリボ核酸構造であって、前記操作されたガイドリボ核酸構造は、
(i)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列と、
(ii)前記エンドヌクレアーゼに結合するように構成されたtracrリボ核酸配列と、を含む、操作されたガイドリボ核酸構造と、を含む、
操作されたヌクレアーゼシステム。
An engineered nuclease system, the engineered nuclease system comprising:
(a) an endonuclease configured to bind to a protospacer adjacent motif (PAM) sequence comprising SEQ ID NO: 5512-5537, wherein the endonuclease is a class 2 type II Cas endonuclease; , endonuclease, and
(b) an engineered guide ribonucleic acid structure configured to form a complex with said endonuclease, said engineered guide ribonucleic acid structure comprising:
(i) a guide ribonucleic acid sequence configured to hybridize to a target deoxyribonucleic acid sequence;
(ii) an engineered guide ribonucleic acid structure comprising a tracr ribonucleic acid sequence configured to bind to the endonuclease;
Engineered nuclease system.
前記エンドヌクレアーゼは難培養性微生物に由来する、請求項4に記載の操作されたヌクレアーゼシステム。 5. The engineered nuclease system of claim 4, wherein the endonuclease is derived from a refractory microorganism. 前記エンドヌクレアーゼは、異なるPAM配列に結合するように操作されていない、請求項4-5のいずれか1つに記載の操作されたヌクレアーゼシステム。 Engineered nuclease system according to any one of claims 4-5, wherein the endonuclease is not engineered to bind to different PAM sequences. 前記エンドヌクレアーゼは、Cas9エンドヌクレアーゼ、Cas14エンドヌクレアーゼ、Cas12aエンドヌクレアーゼ、Cas12bエンドヌクレアーゼ、Cas12cエンドヌクレアーゼ、Cas12dエンドヌクレアーゼ、Cas12eエンドヌクレアーゼ、Cas13aエンドヌクレアーゼ、Cas13bエンドヌクレアーゼ、Cas13cエンドヌクレアーゼ、またはCas13dエンドヌクレアーゼではない、請求項4に記載の操作されたヌクレアーゼシステム。 The endonucleases include Cas9 endonuclease, Cas14 endonuclease, Cas12a endonuclease, Cas12b endonuclease, Cas12c endonuclease, Cas12d endonuclease, Cas12e endonuclease, Cas13a endonuclease, Cas13b endonuclease, Cas13c endonuclease. or Cas13d endonuclease 5. The engineered nuclease system of claim 4, wherein the engineered nuclease system is free. 前記エンドヌクレアーゼは、Cas9エンドヌクレアーゼに対して80%未満の同一性を有する、請求項4に記載の操作されたヌクレアーゼシステム。 5. The engineered nuclease system of claim 4, wherein the endonuclease has less than 80% identity to Cas9 endonuclease. 前記エンドヌクレアーゼはHNHドメインをさらに含む、請求項3-8のいずれか1つに記載の操作されたヌクレアーゼシステム。 Engineered nuclease system according to any one of claims 3-8, wherein the endonuclease further comprises an HNH domain. 前記tracrリボ核酸配列は、配列番号:5476-5511および配列番号:5538のいずれか1つから選択される約60~90の連続するヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含む、請求項1-9のいずれか1つに記載の操作されたヌクレアーゼシステム。 The tracr ribonucleic acid sequence comprises a sequence having at least 80% sequence identity to about 60 to 90 contiguous nucleotides selected from any one of SEQ ID NO: 5476-5511 and SEQ ID NO: 5538. , an engineered nuclease system according to any one of claims 1-9. 操作されたヌクレアーゼシステムであって、前記操作されたヌクレアーゼシステムは、
(a)操作されたガイドリボ核酸構造であって、前記操作されたガイドリボ核酸構造は、
(i)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列と、
(ii)エンドヌクレアーゼに結合するように構成されたtracrリボ核酸配列であって、ここで、前記tracrリボ核酸配列は、配列番号:5476-5511および配列番号:5538のいずれか1つから選択される約60~90の連続するヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含む、tracrリボ核酸配列と、を含む、
操作されたガイドリボ核酸構造と、
(b)前記操作されたガイドリボ核酸に結合するように構成されたクラス2のII型Casエンドヌクレアーゼと、を含む、
操作されたヌクレアーゼシステム。
An engineered nuclease system, the engineered nuclease system comprising:
(a) an engineered guide ribonucleic acid structure, the engineered guide ribonucleic acid structure comprising:
(i) a guide ribonucleic acid sequence configured to hybridize to a target deoxyribonucleic acid sequence;
(ii) a tracr ribonucleic acid sequence configured to bind to an endonuclease, wherein said tracr ribonucleic acid sequence is selected from any one of SEQ ID NO: 5476-5511 and SEQ ID NO: 5538. a tracr ribonucleic acid sequence comprising a sequence having at least 80% sequence identity over about 60 to 90 contiguous nucleotides;
engineered guide ribonucleic acid structure;
(b) a class 2 type II Cas endonuclease configured to bind to the engineered guide ribonucleic acid;
Engineered nuclease system.
前記エンドヌクレアーゼは、配列番号:5512-5537を含む群から選択されるプロトスペーサー隣接モチーフ(PAM)配列に結合するように構成される、請求項1-3または11のいずれかに記載の操作されたヌクレアーゼシステム。 The engineered endonuclease of any of claims 1-3 or 11, wherein the endonuclease is configured to bind to a protospacer adjacent motif (PAM) sequence selected from the group comprising SEQ ID NOs: 5512-5537. nuclease system. 前記操作されたガイドリボ核酸構造は、少なくとも2つのリボ核酸ポリヌクレオチドを含む、請求項1-11のいずれか1つに記載の操作されたヌクレアーゼシステム。 The engineered nuclease system of any one of claims 1-11, wherein the engineered guide ribonucleic acid structure comprises at least two ribonucleic acid polynucleotides. 前記操作されたガイドリボ核酸構造は、前記ガイドリボ核酸配列と前記tracrリボ核酸配列とを含む1つのリボ核酸ポリヌクレオチドを含む、請求項1-11のいずれか1つに記載の操作されたヌクレアーゼシステム。 12. The engineered nuclease system of any one of claims 1-11, wherein the engineered guide ribonucleic acid structure comprises one ribonucleic acid polynucleotide comprising the guide ribonucleic acid sequence and the tracr ribonucleic acid sequence. 前記ガイドリボ核酸配列は、原核生物、細菌、古細菌、真核生物、真菌、植物、哺乳動物、またはヒトのゲノム配列に相補的である、請求項1-14のいずれか1つに記載の操作されたヌクレアーゼシステム。 15. The operation of any one of claims 1-14, wherein the guide ribonucleic acid sequence is complementary to a prokaryotic, bacterial, archaeal, eukaryotic, fungal, plant, mammalian, or human genomic sequence. nuclease system. 前記ガイドリボ核酸配列は15~24ヌクレオチド長である、請求項1-15のいずれか1つに記載の操作されたヌクレアーゼシステム。 Engineered nuclease system according to any one of claims 1-15, wherein the guide ribonucleic acid sequence is 15-24 nucleotides long. 前記エンドヌクレアーゼは、前記エンドヌクレアーゼのN末端またはC末端の近位にある1つ以上の核局在化配列(NLS)を含む、請求項1-16のいずれか1つに記載の操作されたヌクレアーゼシステム。 The engineered endonuclease of any one of claims 1-16, wherein the endonuclease comprises one or more nuclear localization sequences (NLS) proximal to the N-terminus or C-terminus of the endonuclease. Nuclease system. 前記NLSは、配列番号:5597-5612から選択される配列を含む、請求項1-17のいずれか1つに記載の操作されたヌクレアーゼシステム。 Engineered nuclease system according to any one of claims 1-17, wherein the NLS comprises a sequence selected from SEQ ID NOs: 5597-5612. 5’から3’に、前記標的デオキシリボ核酸配列の5’に少なくとも20のヌクレオチドの配列を含む第1の相同性アームと、少なくとも10のヌクレオチドの合成DNA配列と、前記標的デオキシリボ核酸配列の3’に少なくとも20のヌクレオチドの配列を含む第2の相同性アームとを含む、一本鎖または二本鎖のDNA修復鋳型をさらに含む、請求項1-18のいずれか1つに記載の操作されたヌクレアーゼシステム。 5' to 3', a first homology arm comprising a sequence of at least 20 nucleotides 5' of said target deoxyribonucleic acid sequence; a synthetic DNA sequence of at least 10 nucleotides; and 3' of said target deoxyribonucleic acid sequence; and a second homology arm comprising a sequence of at least 20 nucleotides. Nuclease system. 前記第1の相同性アームまたは前記第2の相同性アームは、少なくとも40、80、120、150、200、300、500、または1,000のヌクレオチドの配列を含む、請求項19に記載の操作されたヌクレアーゼシステム。 20. The operation of claim 19, wherein the first homology arm or the second homology arm comprises a sequence of at least 40, 80, 120, 150, 200, 300, 500, or 1,000 nucleotides. nuclease system. 前記操作されたヌクレアーゼシステムは、Mg2+の供給源をさらに含む、請求項1-20のいずれか1つに記載の操作されたヌクレアーゼシステム。 21. The engineered nuclease system of any one of claims 1-20, wherein the engineered nuclease system further comprises a source of Mg2 + . 前記エンドヌクレアーゼおよび前記tracrリボ核酸配列は、同じ門内の別個の細菌種に由来する、請求項1-21のいずれか1つに記載の操作されたヌクレアーゼシステム。 Engineered nuclease system according to any one of claims 1-21, wherein the endonuclease and the tracr ribonucleic acid sequence are derived from distinct bacterial species within the same phylum. 前記エンドヌクレアーゼは、Dermabacter属に属する細菌に由来する、請求項1-22のいずれか1つに記載の操作されたヌクレアーゼシステム。 Engineered nuclease system according to any one of claims 1-22, wherein the endonuclease is derived from a bacterium belonging to the genus Dermabacter. 前記エンドヌクレアーゼは、Verrucomicrobia門、Candidatus Peregrinibacteria門、またはCandidatus Melainabacteria門に属する細菌に由来する、請求項1-22のいずれか1つに記載の操作されたヌクレアーゼシステム。 Engineered nuclease system according to any one of claims 1-22, wherein the endonuclease is derived from a bacterium belonging to the phylum Verrucomicrobia, Candidatus Peregrinibacteria, or Candidatus Melainabacteria. 前記エンドヌクレアーゼは、配列番号:5592-5595のいずれか1つに対して少なくとも90%の同一性を有する16S rRNA遺伝子を含む細菌に由来する、請求項1-22のいずれか1つに記載の操作されたヌクレアーゼシステム。 23. The endonuclease is derived from a bacterium comprising a 16S rRNA gene with at least 90% identity to any one of SEQ ID NOs: 5592-5595. Engineered nuclease system. 前記HNHドメインは、配列番号:5638-5460のいずれか1つに対して少なくとも70%または少なくとも80%の同一性を有する配列を含む、請求項1-25のいずれか1つに記載の操作されたヌクレアーゼシステム。 The engineered HNH domain of any one of claims 1-25, wherein the HNH domain comprises a sequence with at least 70% or at least 80% identity to any one of SEQ ID NOs: 5638-5460. nuclease system. 前記エンドヌクレアーゼは、配列番号:1-1826またはそられに対して少なくとも55%の同一性を有するその変異体を含む、請求項1-26のいずれか1つに記載の操作されたヌクレアーゼシステム。 27. The engineered nuclease system of any one of claims 1-26, wherein the endonuclease comprises SEQ ID NO: 1-1826 or a variant thereof having at least 55% identity thereto. 前記エンドヌクレアーゼは、配列番号:1827-1830あるいは配列番号:1827-2140からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。 1-, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 1827-1830 or SEQ ID NO: 1827-2140. 28. The engineered nuclease system according to any one of 27. 前記エンドヌクレアーゼは、配列番号:3638-3641あるいは配列番号:3638-3954からなる群から選択される配列に対して少なくとも70%、80%、90%同一である配列を含む、請求項1-28のいずれか1つに記載の操作されたヌクレアーゼシステム。 Claims 1-28, wherein the endonuclease comprises a sequence that is at least 70%, 80%, 90% identical to a sequence selected from the group consisting of SEQ ID NO: 3638-3641 or SEQ ID NO: 3638-3954. An engineered nuclease system according to any one of . 前記エンドヌクレアーゼは、配列番号:5615-5632からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む、請求項1-29のいずれか1つに記載の操作されたヌクレアーゼシステム。 Any of claims 1-29, wherein the endonuclease comprises at least one, at least two, at least three, at least four, or at least five peptide motifs selected from the group consisting of SEQ ID NOs: 5615-5632. The engineered nuclease system according to any one of the above. 前記エンドヌクレアーゼは、配列番号:1-4あるいは配列番号:1-319からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-30のいずれか1つに記載の操作されたヌクレアーゼシステム。 Claim 1-, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 1-4 or SEQ ID NO: 1-319. 30. The engineered nuclease system according to any one of 30. 前記ガイドRNA構造は、配列番号:5461-5464、配列番号:5476-5479、あるいは配列番号:5476-5489からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-31のいずれか1つに記載の操作されたヌクレアーゼシステム。 The guide RNA structure is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 5461-5464, SEQ ID NO: 5476-5479, or SEQ ID NO: 5476-5489. 32. An engineered nuclease system according to any one of claims 1-31, comprising a sequence. 前記ガイドRNA構造は、ステムおよびループからなるヘアピンを含むと予想されるRNA配列を含み、ここで、前記ステムは、少なくとも10、少なくとも12、または少なくとも14の塩基対のリボヌクレオチド、および前記ループの4つの塩基対以内の非対称バルジを含む、請求項1-32のいずれか1つに記載の操作されたヌクレアーゼシステム。 The guide RNA structure includes an RNA sequence predicted to include a hairpin consisting of a stem and a loop, where the stem is at least 10, at least 12, or at least 14 base pairs of ribonucleotides, and the loop is 33. Engineered nuclease system according to any one of claims 1-32, comprising an asymmetric bulge of up to 4 base pairs. 前記エンドヌクレアーゼは、配列番号:5512-5515あるいは配列番号:5527-5530からなる群から選択される配列を含むPAMに結合するように構成される、請求項1-33のいずれか1つに記載の操作されたヌクレアーゼシステム。 34. The endonuclease is configured to bind to a PAM comprising a sequence selected from the group consisting of SEQ ID NO: 5512-5515 or SEQ ID NO: 5527-5530. engineered nuclease system. a)前記エンドヌクレアーゼは、配列番号:1827に対して少なくとも70%、少なくとも80%、または少なくとも90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5461あるいは配列番号:5476の少なくとも1つに対して少なくとも70%、少なくとも80%、または少なくとも90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5512あるいは配列番号:5527を含むPAMに結合するように構成される、請求項1-34のいずれか1つに記載の操作されたヌクレアーゼシステム。
a) the endonuclease comprises a sequence that is at least 70%, at least 80%, or at least 90% identical to SEQ ID NO: 1827;
b) the guide RNA structure comprises a sequence that is at least 70%, at least 80%, or at least 90% identical to at least one of SEQ ID NO: 5461 or SEQ ID NO: 5476, and
c) An engineered nuclease system according to any one of claims 1-34, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5512 or SEQ ID NO: 5527.
a)前記エンドヌクレアーゼは、配列番号:1828に対して少なくとも70%、少なくとも80%、または少なくとも90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5462あるいは配列番号:5477の少なくとも1つに対して少なくとも70%、少なくとも80%、または少なくとも90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5513あるいは配列番号:5528を含むPAMに結合するように構成される、請求項1-34のいずれか1つに記載の操作されたヌクレアーゼシステム。
a) the endonuclease comprises a sequence that is at least 70%, at least 80%, or at least 90% identical to SEQ ID NO: 1828;
b) the guide RNA structure comprises a sequence that is at least 70%, at least 80%, or at least 90% identical to at least one of SEQ ID NO: 5462 or SEQ ID NO: 5477, and
c) The engineered nuclease system of any one of claims 1-34, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5513 or SEQ ID NO: 5528.
a)前記エンドヌクレアーゼは、配列番号:1829に対して少なくとも70%、少なくとも80%、または少なくとも90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5463あるいは配列番号:5478の少なくとも1つに対して少なくとも70%、少なくとも80%、または少なくとも90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5514あるいは配列番号:5529を含むPAMに結合するように構成される、請求項1-34のいずれか1つに記載の操作されたヌクレアーゼシステム。
a) the endonuclease comprises a sequence that is at least 70%, at least 80%, or at least 90% identical to SEQ ID NO: 1829;
b) the guide RNA structure comprises a sequence that is at least 70%, at least 80%, or at least 90% identical to at least one of SEQ ID NO: 5463 or SEQ ID NO: 5478, and
c) The engineered nuclease system of any one of claims 1-34, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5514 or SEQ ID NO: 5529.
a)前記エンドヌクレアーゼは、配列番号:1830に対して少なくとも70%、少なくとも80%、または少なくとも90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5464あるいは配列番号:5479の少なくとも1つに対して少なくとも70%、少なくとも80%、または少なくとも90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5515あるいは配列番号:5530を含むPAMに結合するように構成される、請求項1-34のいずれか1つに記載の操作されたヌクレアーゼシステム。
a) the endonuclease comprises a sequence that is at least 70%, at least 80%, or at least 90% identical to SEQ ID NO: 1830;
b) the guide RNA structure comprises a sequence that is at least 70%, at least 80%, or at least 90% identical to at least one of SEQ ID NO: 5464 or SEQ ID NO: 5479, and
c) The engineered nuclease system of any one of claims 1-34, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5515 or SEQ ID NO: 5530.
前記エンドヌクレアーゼは、配列番号:2141-2142あるいは配列番号:2141-2241からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。 Claim 1-, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 2141-2142 or SEQ ID NO: 2141-2241. 28. The engineered nuclease system according to any one of 27. 前記エンドヌクレアーゼは、配列番号:3955-3956あるいは配列番号:3955-4055からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または39のいずれか1つに記載の操作されたヌクレアーゼシステム。 Claim 1-, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 3955-3956 or SEQ ID NO: 3955-4055. The engineered nuclease system according to any one of 27 or 39. 前記エンドヌクレアーゼは、配列番号:5632-5638からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む、請求項1-27または39-40のいずれか1つに記載の操作されたヌクレアーゼシステム。 39. Claims 1-27 or 39, wherein the endonuclease comprises at least one, at least two, at least three, at least four, or at least five peptide motifs selected from the group consisting of SEQ ID NO: 5632-5638. -40. The engineered nuclease system according to any one of -40. 前記エンドヌクレアーゼは、配列番号:320-321あるいは配列番号:320-420からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または39-41のいずれか1つに記載の操作されたヌクレアーゼシステム。 Claim 1-, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 320-321 or SEQ ID NO: 320-420. 27 or 39-41. 前記ガイドRNA構造は、配列番号:5465、配列番号:5490-5491、あるいは配列番号:5490-5494からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または39-42のいずれか1つに記載の操作されたヌクレアーゼシステム。 The guide RNA structure is a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 5465, SEQ ID NO: 5490-5491, or SEQ ID NO: 5490-5494. 43. An engineered nuclease system according to any one of claims 1-27 or 39-42, comprising: 前記ガイドRNA構造は、少なくとも8、少なくとも10、または少なくとも12の塩基対のリボヌクレオチドを含むヘアピンを含む、tracrリボ核酸配列を含む、請求項1-27または39-43のいずれか1つに記載の操作されたヌクレアーゼシステム。 44. The guide RNA structure comprises a tracr ribonucleic acid sequence, comprising a hairpin comprising at least 8, at least 10, or at least 12 base pairs of ribonucleotides. engineered nuclease system. 前記エンドヌクレアーゼは、配列番号:5516および配列番号:5531からなる群から選択される配列を含むPAMに結合するように構成される、請求項1-27または39-44のいずれか1つに記載の操作されたヌクレアーゼシステム。 45. According to any one of claims 1-27 or 39-44, the endonuclease is configured to bind to a PAM comprising a sequence selected from the group consisting of SEQ ID NO:5516 and SEQ ID NO:5531. engineered nuclease system. a)前記エンドヌクレアーゼは、配列番号:2141に対して少なくとも70%、80%、または90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5490に対して少なくとも70%、80%、または90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5531を含むPAMに結合するように構成される、請求項1-27または39-45のいずれか1つに記載の操作されたヌクレアーゼシステム。
a) the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 2141;
b) the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5490, and
c) The engineered nuclease system of any one of claims 1-27 or 39-45, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5531.
a)前記エンドヌクレアーゼは、配列番号:2142に対して少なくとも70%、80%、または90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5465あるいは配列番号:5491に対して少なくとも70%、80%、または90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5516を含むPAMに結合するように構成される、請求項1-27または39-45のいずれか1つに記載の操作されたヌクレアーゼシステム。
a) the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 2142;
b) the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5465 or SEQ ID NO: 5491, and
c) The engineered nuclease system of any one of claims 1-27 or 39-45, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5516.
前記エンドヌクレアーゼは、配列番号:2245-2246からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。 28. The endonuclease according to any one of claims 1-27, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NOs: 2245-2246. The engineered nuclease system described. 前記エンドヌクレアーゼは、配列番号:4059-4060からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または48のいずれか1つに記載の操作されたヌクレアーゼシステム。 49. Any one of claims 1-27 or 48, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NOs: 4059-4060. The engineered nuclease system described in. 前記エンドヌクレアーゼは、配列番号:5639-5648からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む、請求項1-27または48-49のいずれか1つに記載の操作されたヌクレアーゼシステム。 48. Claims 1-27 or 48, wherein the endonuclease comprises at least one, at least two, at least three, at least four, or at least five peptide motifs selected from the group consisting of SEQ ID NOs: 5639-5648. -49. The engineered nuclease system according to any one of -49. 前記エンドヌクレアーゼは、配列番号:424-425からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または48-50のいずれか1つに記載の操作されたヌクレアーゼシステム Any of claims 1-27 or 48-50, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NOs: 424-425. The engineered nuclease system according to any one of 前記ガイドRNA構造は、配列番号:5498-5499および配列番号:5539からなる群から選択される配列に対して少なくとも70%、80%、90%同一である配列を含む、請求項1-27または48-51のいずれか1つに記載の操作されたヌクレアーゼシステム。 or claim 1-27, wherein the guide RNA structure comprises a sequence that is at least 70%, 80%, 90% identical to a sequence selected from the group consisting of SEQ ID NO: 5498-5499 and SEQ ID NO: 5539. 48-52. The engineered nuclease system according to any one of 48-51. 前記ガイドRNA構造は、ガイドリボ核酸配列の少なくとも8つのヌクレオチドおよびtracrリボ核酸配列の少なくとも8つのヌクレオチドを含む中断されていない塩基対領域を有するヘアピンを含むと予想されるガイドリボ核酸配列を含み、ここで、前記tracrリボ核酸配列は、5’から3’に、第1のヘアピンと第2のヘアピンとを含み、ここで、前記第1のヘアピンは前記第2のヘアピンよりも長いステムを有する、請求項1-27または48-52のいずれか1つに記載の操作されたヌクレアーゼシステム。 The guide RNA structure comprises a guide ribonucleic acid sequence predicted to include a hairpin with an uninterrupted base-paired region comprising at least eight nucleotides of the guide ribonucleic acid sequence and at least eight nucleotides of the tracr ribonucleic acid sequence, wherein , wherein the tracr ribonucleic acid sequence comprises, 5' to 3', a first hairpin and a second hairpin, wherein the first hairpin has a longer stem than the second hairpin. Engineered nuclease system according to any one of paragraphs 1-27 or 48-52. 前記エンドヌクレアーゼは、配列番号:2242-2244あるいは配列番号:2247-2249からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。 Claim 1-, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 2242-2244 or SEQ ID NO: 2247-2249. 28. The engineered nuclease system according to any one of 27. 前記エンドヌクレアーゼは、配列番号:4056-4058および配列番号:4061-4063からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または54のいずれか1つに記載の操作されたヌクレアーゼシステム。 Claim 1-, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 4056-4058 and SEQ ID NO: 4061-4063. 55. The engineered nuclease system according to any one of 27 or 54. 前記エンドヌクレアーゼは、配列番号:5639-5648からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む、請求項1-27または54-55のいずれか1つに記載の操作されたヌクレアーゼシステム。 54. Claims 1-27 or 54, wherein the endonuclease comprises at least one, at least two, at least three, at least four, or at least five peptide motifs selected from the group consisting of SEQ ID NOs: 5639-5648. -55. The engineered nuclease system according to any one of -55. 前記エンドヌクレアーゼは、配列番号:421-423あるいは配列番号:426-428からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または54-56のいずれか1つに記載の操作されたヌクレアーゼシステム。 Claim 1-, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 421-423 or SEQ ID NO: 426-428. 27 or 54-56. 前記ガイドRNA構造は、配列番号:5466-5467、配列番号:5495-5497、配列番号:5500-5502、および配列番号:5539からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または54-57のいずれか1つに記載の操作されたヌクレアーゼシステム。 The guide RNA structure has at least 70%, 80%, or 90% identical sequences. 前記ガイドRNA構造は、ガイドリボ核酸配列の少なくとも8つのヌクレオチドおよびtracrリボ核酸配列の少なくとも8つのヌクレオチドを含む中断されていない塩基対領域を有するヘアピンを含むと予想されるガイドリボ核酸配列を含み、ここで、前記tracrリボ核酸配列は、5’から3’に、第1のヘアピンと第2のヘアピンとを含み、ここで、前記第1のヘアピンは前記第2のヘアピンよりも長いステムを有する、請求項1-27または54-58のいずれか1つに記載の操作されたヌクレアーゼシステム。 The guide RNA structure comprises a guide ribonucleic acid sequence predicted to include a hairpin with an uninterrupted base-paired region comprising at least eight nucleotides of the guide ribonucleic acid sequence and at least eight nucleotides of the tracr ribonucleic acid sequence, wherein , wherein the tracr ribonucleic acid sequence comprises, 5' to 3', a first hairpin and a second hairpin, wherein the first hairpin has a longer stem than the second hairpin. An engineered nuclease system according to any one of paragraphs 1-27 or 54-58. 前記エンドヌクレアーゼは、配列番号:5517-5518あるいは配列番号:5532-5534からなる群から選択される配列を含むPAMに結合するように構成される、請求項1-27または54-59のいずれか1つに記載の操作されたヌクレアーゼシステム。 Any of claims 1-27 or 54-59, wherein the endonuclease is configured to bind to a PAM comprising a sequence selected from the group consisting of SEQ ID NOs: 5517-5518 or SEQ ID NOs: 5532-5534. An engineered nuclease system according to one. a)前記エンドヌクレアーゼは、配列番号:2247に対して少なくとも70%、80%、または90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5500に対して少なくとも70%、80%、または90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5517あるいは配列番号:5532を含むPAMに結合するように構成される、請求項1-27または54-60のいずれか1つに記載の操作されたヌクレアーゼシステム。
a) the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 2247;
b) the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5500, and
c) The engineered nuclease system of any one of claims 1-27 or 54-60, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5517 or SEQ ID NO: 5532. .
a)前記エンドヌクレアーゼは、配列番号:2248に対して少なくとも70%、80%、または90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5501に対して少なくとも70%、80%、または90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5518あるいは配列番号:5533を含むPAMに結合するように構成される、請求項1-27または54-60のいずれか1つに記載の操作されたヌクレアーゼシステム。
a) the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 2248;
b) the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5501, and
c) The engineered nuclease system of any one of claims 1-27 or 54-60, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5518 or SEQ ID NO: 5533. .
a)前記エンドヌクレアーゼは、配列番号:2249に対して少なくとも70%、80%、または90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5502に対して少なくとも70%、80%、または90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5534を含むPAMに結合するように構成される、請求項1-27または54-60のいずれか1つに記載の操作されたヌクレアーゼシステム。
a) the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 2249;
b) the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5502, and
c) The engineered nuclease system of any one of claims 1-27 or 54-60, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5534.
前記エンドヌクレアーゼは、配列番号:2253あるいは配列番号:2253-2481からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。 28. The endonuclease of claims 1-27, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 2253 or SEQ ID NO: 2253-2481. An engineered nuclease system according to any one. 前記エンドヌクレアーゼは、配列番号:4067あるいは配列番号:4067-4295からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または64のいずれか1つに記載の操作されたヌクレアーゼシステム。 or claim 1-27, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 4067 or SEQ ID NO: 4067-4295. 64. The engineered nuclease system according to any one of 64. 前記エンドヌクレアーゼは、配列番号:5649のペプチドモチーフを含む、請求項1-27または64-65のいずれか1つに記載の操作されたヌクレアーゼシステム。 66. The engineered nuclease system of any one of claims 1-27 or 64-65, wherein the endonuclease comprises the peptide motif of SEQ ID NO: 5649. 前記エンドヌクレアーゼは、配列番号:432あるいは配列番号:432-660からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または64-66のいずれか1つに記載の操作されたヌクレアーゼシステム。 or claim 1-27, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 432 or SEQ ID NO: 432-660. The engineered nuclease system according to any one of 64-66. 前記ガイドRNA構造は、配列番号:5468あるいは配列番号:5503からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または64-67のいずれか1つに記載の操作されたヌクレアーゼシステム。 64. Claims 1-27 or 64, wherein the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 5468 or SEQ ID NO: 5503. -67. The engineered nuclease system according to any one of -67. 前記エンドヌクレアーゼは、配列番号:5519からなる群から選択される配列を含むPAMに結合するように構成される、請求項1-27または64-68のいずれか1つに記載の操作されたヌクレアーゼシステム。 69. The engineered nuclease of any one of claims 1-27 or 64-68, wherein the endonuclease is configured to bind to a PAM comprising a sequence selected from the group consisting of SEQ ID NO: 5519. system. a)前記エンドヌクレアーゼは、配列番号:2253に対して少なくとも70%、80%、または90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5468あるいは配列番号:5503に対して少なくとも70%、80%、または90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5519を含むPAMに結合するように構成される、請求項1-27または64-69のいずれか1つに記載の操作されたヌクレアーゼシステム。
a) the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 2253;
b) the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5468 or SEQ ID NO: 5503, and
c) The engineered nuclease system of any one of claims 1-27 or 64-69, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5519.
前記エンドヌクレアーゼは、配列番号:2482-2489からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。 28. The endonuclease according to any one of claims 1-27, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NOs: 2482-2489. The engineered nuclease system described. 前記エンドヌクレアーゼは、配列番号:4296-4303からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または71のいずれか1つに記載の操作されたヌクレアーゼシステム。 72. Any one of claims 1-27 or 71, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NOs: 4296-4303. The engineered nuclease system described in. 前記エンドヌクレアーゼは、配列番号:661-668からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または71-72のいずれか1つに記載の操作されたヌクレアーゼシステム。 Any of claims 1-27 or 71-72, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NOs: 661-668. The engineered nuclease system according to any one of the above. 前記エンドヌクレアーゼは、配列番号:2490-2498からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。 28. The endonuclease according to any one of claims 1-27, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NOs: 2490-2498. The engineered nuclease system described. 前記エンドヌクレアーゼは、配列番号:4304-4312からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または74のいずれか1つに記載の操作されたヌクレアーゼシステム。 75. Any one of claims 1-27 or 74, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NOs: 4304-4312. The engineered nuclease system described in. 前記エンドヌクレアーゼは、配列番号:669-677からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または74-75のいずれか1つに記載の操作されたヌクレアーゼシステム。 Any of claims 1-27 or 74-75, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NOs: 669-677. The engineered nuclease system according to any one of the above. 前記ガイドRNA構造は、配列番号:5504からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または74-76のいずれか1つに記載の操作されたヌクレアーゼシステム。 Any of claims 1-27 or 74-76, wherein the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 5504. An engineered nuclease system according to one. 前記エンドヌクレアーゼは、配列番号:2499あるいは配列番号:2499-2750からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。 28. The endonuclease of claims 1-27, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 2499 or SEQ ID NO: 2499-2750. An engineered nuclease system according to any one. 前記エンドヌクレアーゼは、配列番号:4313あるいは配列番号:4313-4564からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または78のいずれか1つに記載の操作されたヌクレアーゼシステム。 or claim 1-27, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 4313 or SEQ ID NO: 4313-4564. 78. The engineered nuclease system according to any one of 78. 前記エンドヌクレアーゼは、配列番号:5650-5667からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む、請求項1-27または78-79のいずれか1つに記載の操作されたヌクレアーゼシステム。 78. Claims 1-27 or 78, wherein the endonuclease comprises at least one, at least two, at least three, at least four, or at least five peptide motifs selected from the group consisting of SEQ ID NOs: 5650-5667. -79. 前記エンドヌクレアーゼは、配列番号:678あるいは配列番号:678-929からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または78-80のいずれか1つに記載の操作されたヌクレアーゼシステム。 or claim 1-27, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 678 or SEQ ID NO: 678-929. 78-80. 前記ガイドRNA構造は、配列番号:5469あるいは配列番号:5505に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または78-81のいずれか1つに記載の操作されたヌクレアーゼシステム。 Any one of claims 1-27 or 78-81, wherein the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5469 or SEQ ID NO: 5505. The engineered nuclease system described. 前記エンドヌクレアーゼは、配列番号:5520あるいは配列番号:5535を含むPAMに結合するように構成される、請求項1-27または78-82のいずれか1つに記載の操作されたヌクレアーゼシステム。 83. The engineered nuclease system of any one of claims 1-27 or 78-82, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5520 or SEQ ID NO: 5535. a)前記エンドヌクレアーゼは、配列番号:2499に対して少なくとも70%、80%、または90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5469あるいは配列番号:5505に対して少なくとも70%、80%、または90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5520あるいは配列番号:5535を含むPAMに結合するように構成される、請求項1-27または78-83のいずれか1つに記載の操作されたヌクレアーゼシステム。
a) the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 2499;
b) the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5469 or SEQ ID NO: 5505, and
c) the engineered nuclease system of any one of claims 1-27 or 78-83, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5520 or SEQ ID NO: 5535. .
前記エンドヌクレアーゼは、配列番号:2751あるいは配列番号:2751-2913からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。 28. The endonuclease of claims 1-27, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 2751 or SEQ ID NO: 2751-2913. An engineered nuclease system according to any one. 前記エンドヌクレアーゼは、配列番号:4565あるいは配列番号:4565-4727からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または85のいずれか1つに記載の操作されたヌクレアーゼシステム。 27 or 27, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 4565 or SEQ ID NO: 4565-4727. 85. The engineered nuclease system according to any one of 85. 前記エンドヌクレアーゼは、配列番号:5668-5678からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む、請求項1-27または85-86のいずれか1つに記載の操作されたヌクレアーゼシステム。 85. Claims 1-27 or 85, wherein the endonuclease comprises at least one, at least two, at least three, at least four, or at least five peptide motifs selected from the group consisting of SEQ ID NOs: 5668-5678. -86. The engineered nuclease system according to any one of -86. 前記エンドヌクレアーゼは、配列番号:930あるいは配列番号:930-1092からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または85-87のいずれか1つに記載の操作されたヌクレアーゼシステム。 or claim 1-27, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 930 or SEQ ID NO: 930-1092. 85-87. 前記ガイドRNA構造は、配列番号:5470あるいは配列番号:5506に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または85-88のいずれか1つに記載の操作されたヌクレアーゼシステム。 Any one of claims 1-27 or 85-88, wherein the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5470 or SEQ ID NO: 5506. The engineered nuclease system described. 前記エンドヌクレアーゼは、配列番号:5521あるいは配列番号:5536からなる群から選択される配列を含むPAMに結合するように構成される、請求項1-27または85-89のいずれか1つに記載の操作されたヌクレアーゼシステム。 89. According to any one of claims 1-27 or 85-89, the endonuclease is configured to bind to a PAM comprising a sequence selected from the group consisting of SEQ ID NO: 5521 or SEQ ID NO: 5536. engineered nuclease system. a)前記エンドヌクレアーゼは、配列番号:2751に対して少なくとも70%、80%、または90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5470あるいは配列番号:5506に対して少なくとも70%、80%、または90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5521あるいは配列番号:5536を含むPAMに結合するように構成される、請求項1-27または85-90のいずれか1つに記載の操作されたヌクレアーゼシステム。
a) the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 2751;
b) the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5470 or SEQ ID NO: 5506, and
c) The engineered nuclease system of any one of claims 1-27 or 85-90, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5521 or SEQ ID NO: 5536. .
前記エンドヌクレアーゼは、配列番号:2914あるいは配列番号:2914-3174からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。 28. The endonuclease of claims 1-27, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 2914 or SEQ ID NO: 2914-3174. An engineered nuclease system according to any one. 前記エンドヌクレアーゼは、配列番号:4728あるいは配列番号:4728-4988からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または92のいずれか1つに記載の操作されたヌクレアーゼシステム。 or claim 1-27, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 4728 or SEQ ID NO: 4728-4988. 92. The engineered nuclease system according to any one of 92. 前記エンドヌクレアーゼは、配列番号:5676-5678からなる群から選択される少なくとも1つ、少なくとも2つ、または少なくとも3つのペプチドモチーフを含む、請求項1-27または92-93のいずれか1つに記載の操作されたヌクレアーゼシステム。 According to any one of claims 1-27 or 92-93, the endonuclease comprises at least one, at least two, or at least three peptide motifs selected from the group consisting of SEQ ID NO: 5676-5678. The engineered nuclease system described. 前記エンドヌクレアーゼは、配列番号:1093あるいは配列番号:1093-1353からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または92-94のいずれか1つに記載の操作されたヌクレアーゼシステム。 27 or 27, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 1093 or SEQ ID NO: 1093-1353. 92-94. 前記ガイドRNA構造は、配列番号:5471、配列番号:5507、および配列番号:5540-5542からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または92-95のいずれか1つに記載の操作されたヌクレアーゼシステム。 The guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 5471, SEQ ID NO: 5507, and SEQ ID NO: 5540-5542. , an engineered nuclease system according to any one of claims 1-27 or 92-95. 前記ガイドRNA構造は、5つ未満の塩基対のリボヌクレオチドを含む少なくとも2つのヘアピンを含むと予想されるtracrリボ核酸配列を含む、請求項1-27または92-96のいずれか1つに記載の操作されたヌクレアーゼシステム。 97. The guide RNA structure comprises a tracr ribonucleic acid sequence predicted to include at least two hairpins comprising ribonucleotides of less than 5 base pairs. engineered nuclease system. 前記エンドヌクレアーゼは、配列番号:5522を含むPAMに結合するように構成される、請求項1-27または92-97のいずれか1つに記載の操作されたヌクレアーゼシステム。 98. The engineered nuclease system of any one of claims 1-27 or 92-97, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5522. a)前記エンドヌクレアーゼは、配列番号:2914に対して少なくとも70%、80%、または90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5471あるいは配列番号:5507に対して少なくとも70%、80%、または90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5522を含むPAMに結合するように構成される、請求項1-27または92-98のいずれか1つに記載の操作されたヌクレアーゼシステム。
a) the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 2914;
b) the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5471 or SEQ ID NO: 5507, and
c) The engineered nuclease system of any one of claims 1-27 or 92-98, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5522.
前記エンドヌクレアーゼは、配列番号:3175あるいは配列番号:3175-3330からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。 28. The endonuclease of claims 1-27, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 3175 or a sequence selected from the group consisting of SEQ ID NO: 3175-3330. An engineered nuclease system according to any one. 前記エンドヌクレアーゼは、配列番号:4989あるいは配列番号:4989-5146からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または100のいずれか1つに記載の操作されたヌクレアーゼシステム。 27 or 27, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 4989 or SEQ ID NO: 4989-5146. 100. The engineered nuclease system according to any one of 100. 前記エンドヌクレアーゼは、配列番号:5679-5686からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む、請求項1-27または100-101のいずれか1つに記載の操作されたヌクレアーゼシステム。 100. Claims 1-27 or 100, wherein the endonuclease comprises at least one, at least two, at least three, at least four, or at least five peptide motifs selected from the group consisting of SEQ ID NOs: 5679-5686. -101. The engineered nuclease system according to any one of -101. 前記エンドヌクレアーゼは、配列番号:1354あるいは配列番号:1354-1511からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または100-102のいずれか1つに記載の操作されたヌクレアーゼシステム。 or claim 1-27, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 1354 or SEQ ID NO: 1354-1511. 100-102. The engineered nuclease system according to any one of 100-102. 前記ガイドRNA構造は、配列番号:5472あるいは配列番号:5508からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または100-103のいずれか1つに記載の操作されたヌクレアーゼシステム。 100. Claim 1-27 or 100, wherein the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 5472 or SEQ ID NO: 5508. -103. The engineered nuclease system according to any one of -103. 前記エンドヌクレアーゼは、配列番号:5523あるいは配列番号:5537からなる群から選択される配列を含むPAMに結合するように構成される、請求項1-27または100-104のいずれか1つに記載の操作されたヌクレアーゼシステム。 105. The endonuclease is configured to bind to a PAM comprising a sequence selected from the group consisting of SEQ ID NO: 5523 or SEQ ID NO: 5537. engineered nuclease system. a)前記エンドヌクレアーゼは、配列番号:3175に対して少なくとも70%、80%、または90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5472あるいは配列番号:5508に対して少なくとも70%、80%、または90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5523あるいは配列番号:5537を含むPAMに結合するように構成される、請求項1-27または100-105のいずれか1つに記載の操作されたヌクレアーゼシステム。
a) the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 3175;
b) the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5472 or SEQ ID NO: 5508, and
c) The engineered nuclease system of any one of claims 1-27 or 100-105, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5523 or SEQ ID NO: 5537. .
前記エンドヌクレアーゼは、配列番号:3331あるいは配列番号:3331-3474からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。 28. The endonuclease of claims 1-27, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 3331 or SEQ ID NO: 3331-3474. An engineered nuclease system according to any one. 前記エンドヌクレアーゼは、配列番号:5147あるいは配列番号:5147-5290からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または107のいずれか1つに記載の操作されたヌクレアーゼシステム or claim 1-27, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 5147 or SEQ ID NO: 5147-5290. 107. Engineered nuclease system according to any one of 107. 前記エンドヌクレアーゼは、配列番号:5674-5675および配列番号:5687-5693からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む、請求項1-27または107-108のいずれか1つに記載の操作されたヌクレアーゼシステム。 The endonuclease comprises at least one, at least two, at least three, at least four, or at least five peptide motifs selected from the group consisting of SEQ ID NO: 5674-5675 and SEQ ID NO: 5687-5693. An engineered nuclease system according to any one of claims 1-27 or 107-108. 前記エンドヌクレアーゼは、配列番号:1512あるいは配列番号:1512-1655からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または107-109のいずれか1つに記載の操作されたヌクレアーゼシステム。 or claim 1-27, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 1512 or SEQ ID NO: 1512-1655. 107-109. The engineered nuclease system according to any one of 107-109. 前記ガイドRNA構造は、配列番号:5473あるいは配列番号:5509からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または107-110のいずれか1つに記載の操作されたヌクレアーゼシステム。 107. Claims 1-27 or 107, wherein the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 5473 or SEQ ID NO: 5509. -110. The engineered nuclease system according to any one of -110. 前記エンドヌクレアーゼは、配列番号:5524を含むPAMに結合するように構成される、請求項1-27または107-111のいずれか1つに記載の操作されたヌクレアーゼシステム。 The engineered nuclease system of any one of claims 1-27 or 107-111, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5524. a)前記エンドヌクレアーゼは、配列番号:3331に対して少なくとも70%、80%、または90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5473あるいは配列番号:5509に対して少なくとも70%、80%、または90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5524を含むPAMに結合するように構成される、請求項1-27または107-112のいずれか1つに記載の操作されたヌクレアーゼシステム。
a) the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 3331;
b) the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5473 or SEQ ID NO: 5509, and
c) The engineered nuclease system of any one of claims 1-27 or 107-112, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5524.
前記エンドヌクレアーゼは、配列番号:3475あるいは配列番号:3475-3568からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。 28. The endonuclease of claims 1-27, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 3475 or SEQ ID NO: 3475-3568. An engineered nuclease system according to any one. 前記エンドヌクレアーゼは、配列番号:5291あるいは配列番号:5291-5389からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または114のいずれか1つに記載の操作されたヌクレアーゼシステム。 or claim 1-27, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 5291 or SEQ ID NO: 5291-5389. 114. The engineered nuclease system according to any one of 114. 前記エンドヌクレアーゼは、配列番号:5694-5699からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む、請求項1-27または114-115のいずれか1つに記載の操作されたヌクレアーゼシステム。 114. Claims 1-27 or 114, wherein the endonuclease comprises at least one, at least two, at least three, at least four, or at least five peptide motifs selected from the group consisting of SEQ ID NOs: 5694-5699. -115. 前記エンドヌクレアーゼは、配列番号:1656あるいは配列番号:1656-1755からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または114-116のいずれか1つに記載の操作されたヌクレアーゼシステム。 or claim 1-27, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 1656 or a sequence selected from the group consisting of SEQ ID NO: 1656-1755. 114-116. The engineered nuclease system according to any one of 114-116. 前記ガイドRNA構造は、配列番号:5474あるいは配列番号:5510に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または114-117のいずれか1つに記載の操作されたヌクレアーゼシステム。 Any one of claims 1-27 or 114-117, wherein the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5474 or SEQ ID NO: 5510. The engineered nuclease system described. 前記エンドヌクレアーゼは、配列番号:5525を含むPAMに結合するように構成される、請求項1-27または114-118のいずれか1つに記載の操作されたヌクレアーゼシステム。 119. The engineered nuclease system of any one of claims 1-27 or 114-118, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5525. a)前記エンドヌクレアーゼは、配列番号:3475に対して少なくとも70%、80%、または90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5474あるいは配列番号:5510に対して少なくとも70%、80%、または90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5525を含むPAMに結合するように構成される、請求項1-27または114-119のいずれか1つに記載の操作されたヌクレアーゼシステム。
a) the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 3475;
b) the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5474 or SEQ ID NO: 5510, and
c) The engineered nuclease system of any one of claims 1-27 or 114-119, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5525.
前記エンドヌクレアーゼは、配列番号:3569あるいは配列番号:3569-3637からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。 28. The endonuclease of claims 1-27, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to a sequence selected from the group consisting of SEQ ID NO: 3569 or SEQ ID NO: 3569-3637. An engineered nuclease system according to any one. 前記エンドヌクレアーゼは、配列番号:5390あるいは配列番号:5390-5460からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または121のいずれか1つに記載の操作されたヌクレアーゼシステム。 or claim 1-27, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5390 or a sequence selected from the group consisting of SEQ ID NO: 5390-5460. 122. The engineered nuclease system according to any one of 121. 前記エンドヌクレアーゼは配列番号:5700-5717からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む、請求項1-27または121-122のいずれか1つに記載の操作されたヌクレアーゼシステム。 1-27 or 121-, wherein the endonuclease comprises at least one, at least two, at least three, at least four, or at least five peptide motifs selected from the group consisting of SEQ ID NO: 5700-5717. 122. The engineered nuclease system according to any one of 122. 前記エンドヌクレアーゼは、配列番号:1756あるいは配列番号:1756-1826からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または121-123のいずれか1つに記載の操作されたヌクレアーゼシステム。 or claim 1-27, wherein the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 1756 or a sequence selected from the group consisting of SEQ ID NO: 1756-1826. 121-123. 前記ガイドRNA構造は、配列番号:5475あるいは配列番号:5511に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または121-124のいずれか1つに記載の操作されたヌクレアーゼシステム。 Any one of claims 1-27 or 121-124, wherein the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5475 or SEQ ID NO: 5511. The engineered nuclease system described. 前記エンドヌクレアーゼは、配列番号:5526を含むPAMに結合するように構成される、請求項1-27または121-125のいずれか1つに記載の操作されたヌクレアーゼシステム。 126. The engineered nuclease system of any one of claims 1-27 or 121-125, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5526. a)前記エンドヌクレアーゼは、配列番号:3569に対して少なくとも70%、80%、または90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5475あるいは配列番号:5511に対して少なくとも70%、80%、または90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5526を含むPAMに結合するように構成される、請求項1-27または121-126のいずれか1つに記載の操作されたヌクレアーゼシステム。
a) the endonuclease comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 3569;
b) the guide RNA structure comprises a sequence that is at least 70%, 80%, or 90% identical to SEQ ID NO: 5475 or SEQ ID NO: 5511, and
c) The engineered nuclease system of any one of claims 1-27 or 121-126, wherein the endonuclease is configured to bind to a PAM comprising SEQ ID NO: 5526.
配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、またはSmith-Waterman相同性検索アルゴリズムによって決定される、請求項1-127のいずれか1つに記載の操作されたヌクレアーゼシステム。 128. The engineered nuclease system of any one of claims 1-127, wherein sequence identity is determined by a BLASTP, CLUSTALW, MUSCLE, MAFFT, or Smith-Waterman homology search algorithm. 前記配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータ、および、11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリックスを使用して、ならびに、条件付き組成スコアマトリックス調整を使用して、BLASTP相同性検索アルゴリズムによって決定される、請求項128に記載の操作されたヌクレアーゼシステム。 The sequence identity was determined using the BLOSUM62 scoring matrix with parameters of wordlength (W) of 3, expectation (E) of 10, and gap costs of 11 existence, 1 extension, and conditional. 129. The engineered nuclease system of claim 128, as determined by a BLASTP homology search algorithm using a compositional score matrix adjustment. 操作されたガイドリボ核酸ポリヌクレオチドであって、前記操作されたガイドリボ核酸ポリヌクレオチドは、
a)標的DNA分子中の標的配列に相補的なヌクレオチド配列を含む、DNAを標的とするセグメントと、
b)ハイブリダイズして二本鎖RNA(dsRNA)二重鎖を形成するヌクレオチドの2つの相補的なストレッチを含む、タンパク質結合セグメントであって、
ここで、前記ヌクレオチドの2つの相補的なストレッチは介在ヌクレオチドで互いに共有結合し、および、
ここで、前記操作されたガイドリボ核酸ポリヌクレオチドは、配列番号:1827-3637のいずれか1つに対して少なくとも75%の配列同一性を有するRuvC_IIIドメインを含むエンドヌクレアーゼと複合体を形成し、前記複合体を標的DNA分子の標的配列に標的化するように構成される、
操作されたガイドリボ核酸ポリヌクレオチド。
An engineered guide ribonucleic acid polynucleotide, the engineered guide ribonucleic acid polynucleotide comprising:
a) a DNA targeting segment comprising a nucleotide sequence complementary to a target sequence in a target DNA molecule;
b) a protein binding segment comprising two complementary stretches of nucleotides that hybridize to form a double-stranded RNA (dsRNA) duplex;
wherein said two complementary stretches of nucleotides are covalently linked to each other at an intervening nucleotide, and
wherein said engineered guide ribonucleic acid polynucleotide forms a complex with an endonuclease comprising a RuvC_III domain having at least 75% sequence identity to any one of SEQ ID NOs: 1827-3637; configured to target the complex to a target sequence of a target DNA molecule;
Engineered guide ribonucleic acid polynucleotides.
前記DNA標的化セグメントは、前記ヌクレオチドの2つの相補的なストレッチの両方の5’に位置する、請求項130に記載の操作されたガイドリボ核酸ポリヌクレオチド。 131. The engineered guide ribonucleic acid polynucleotide of claim 130, wherein said DNA targeting segment is located 5' of both of said two complementary stretches of nucleotides. a)前記タンパク質結合セグメントは、配列番号:5476-5479あるいは配列番号:5476-5489からなる群から選択される配列に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み、
b)前記タンパク質結合セグメントは (配列番号:5490-5491あるいは配列番号:5490-5494)および配列番号:5538からなる群から選択される配列に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み、
c)前記タンパク質結合セグメントは、配列番号:5498-5499からなる群から選択される配列に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み、
d)前記タンパク質結合セグメントは、配列番号:5495-5497および配列番号:5500-5502からなる群から選択される配列に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み、
e)前記タンパク質結合セグメントは、配列番号:5503に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み、
f)前記タンパク質結合セグメントは、配列番号:5504に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み、
g)前記タンパク質結合セグメントは、配列番号:5505に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み、
h)タンパク質結合セグメントは、配列番号:5506に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み、
i)タンパク質結合セグメントは、配列番号:5507に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み、
j)前記タンパク質結合セグメントは、配列番号:5508に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み、
k)前記タンパク質結合セグメントは、配列番号:5509に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み、
l)前記タンパク質結合セグメントは、配列番号:5510に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み、または、
m)前記タンパク質結合セグメントは、配列番号:5511に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含む、請求項130-131のいずれかに記載の操作されたガイドリボ核酸ポリヌクレオチド。
a) the protein binding segment has at least 70%, at least 80%, or at least 90% identity to a sequence selected from the group consisting of SEQ ID NO: 5476-5479 or SEQ ID NO: 5476-5489; including;
b) said protein binding segment is at least 70%, at least 80%, or at least 90% relative to a sequence selected from the group consisting of (SEQ ID NO: 5490-5491 or SEQ ID NO: 5490-5494) and SEQ ID NO: 5538. comprising a sequence having an identity of
c) the protein binding segment comprises a sequence having at least 70%, at least 80%, or at least 90% identity to a sequence selected from the group consisting of SEQ ID NOs: 5498-5499;
d) the protein binding segment has at least 70%, at least 80%, or at least 90% identity to a sequence selected from the group consisting of SEQ ID NO: 5495-5497 and SEQ ID NO: 5500-5502. including;
e) the protein binding segment comprises a sequence having at least 70%, at least 80%, or at least 90% identity to SEQ ID NO: 5503;
f) the protein binding segment comprises a sequence having at least 70%, at least 80%, or at least 90% identity to SEQ ID NO: 5504;
g) the protein binding segment comprises a sequence having at least 70%, at least 80%, or at least 90% identity to SEQ ID NO: 5505;
h) the protein binding segment comprises a sequence having at least 70%, at least 80%, or at least 90% identity to SEQ ID NO: 5506;
i) the protein binding segment comprises a sequence having at least 70%, at least 80%, or at least 90% identity to SEQ ID NO: 5507;
j) the protein binding segment comprises a sequence having at least 70%, at least 80%, or at least 90% identity to SEQ ID NO: 5508;
k) the protein binding segment comprises a sequence having at least 70%, at least 80%, or at least 90% identity to SEQ ID NO: 5509;
l) the protein binding segment comprises a sequence having at least 70%, at least 80%, or at least 90% identity to SEQ ID NO: 5510, or
m) the engineered protein binding segment of any of claims 130-131, wherein the protein binding segment comprises a sequence having at least 70%, at least 80%, or at least 90% identity to SEQ ID NO: 5511. Guided ribonucleic acid polynucleotide.
a)前記ガイドリボ核酸ポリヌクレオチドは、ステムとループとを含むヘアピンを含むRNA配列を含み、ここで、前記ステムは、少なくとも10、少なくとも12、または少なくとも14の塩基対のリボヌクレオチド、および前記ループの4つの塩基対内の非対称バルジを含み、
b)前記ガイドリボ核酸ポリヌクレオチドは、少なくとも8、少なくとも10、または少なくとも12の塩基対のリボヌクレオチドを含むヘアピンを含むと予想されるtracrリボ核酸配列を含み、
c)前記ガイドリボ核酸ポリヌクレオチドは、ガイドリボ核酸配列の少なくとも8つのヌクレオチドとtracrリボ核酸配列の少なくとも8つのヌクレオチドとを含む中断されていない塩基対領域を有するヘアピンを含むと予想されるガイドリボ核酸配列を含み、ここで、前記tracrリボ核酸配列は、5’から3’に、第1のヘアピンと第2のヘアピンとを含み、ここで、前記第1のヘアピンは前記第2のヘアピンよりも長いステムを有し、または、
d)前記ガイドリボ核酸ポリヌクレオチドは、5つ未満の塩基対のリボヌクレオチドを含む少なくとも2つのヘアピンを含むと予想されるtracrリボ核酸配列を含む、請求項130-132のいずれかに記載の操作されたガイドリボ核酸ポリヌクレオチド。
a) said guide ribonucleic acid polynucleotide comprises an RNA sequence comprising a hairpin comprising a stem and a loop, wherein said stem comprises at least 10, at least 12, or at least 14 base pairs of ribonucleotides; contains an asymmetric bulge within four base pairs,
b) the guide ribonucleic acid polynucleotide comprises a tracr ribonucleic acid sequence predicted to include a hairpin comprising at least 8, at least 10, or at least 12 base pairs of ribonucleotides;
c) said guide ribonucleic acid polynucleotide comprises a guide ribonucleic acid sequence predicted to include a hairpin having an uninterrupted base-paired region comprising at least eight nucleotides of the guide ribonucleic acid sequence and at least eight nucleotides of the tracr ribonucleic acid sequence; tracr ribonucleic acid sequence comprises, 5' to 3', a first hairpin and a second hairpin, wherein the first hairpin has a longer stem than the second hairpin. has, or
d) the engineered ribonucleic acid polynucleotide of any of claims 130-132, wherein the guide ribonucleic acid polynucleotide comprises a tracr ribonucleic acid sequence predicted to include at least two hairpins comprising ribonucleotides of less than 5 base pairs. guided ribonucleic acid polynucleotide.
請求項130-133のいずれか1つに記載の操作されたガイドリボ核酸ポリヌクレオチドをコードする、デオキシリボ核酸ポリヌクレオチド。 A deoxyribonucleic acid polynucleotide encoding an engineered guide ribonucleic acid polynucleotide according to any one of claims 130-133. 生物における発現のために最適化された、操作された核酸配列を含む核酸であって、ここで、前記核酸は、RuvC_IIIドメインとHNHドメインとを含むクラス2のII型Casエンドヌクレアーゼをコードし、ここで、前記クラス2のII型Casエンドヌクレアーゼは難培養性微生物に由来する、核酸。 A nucleic acid comprising an engineered nucleic acid sequence optimized for expression in an organism, wherein the nucleic acid encodes a class 2 type II Cas endonuclease comprising a RuvC_III domain and a HNH domain; Here, the class 2 type II Cas endonuclease is a nucleic acid derived from a difficult-to-cultivate microorganism. 生物における発現のために最適化された、操作された核酸配列を含む核酸であって、ここで、前記核酸は、配列番号:1827-3637のいずれか1つに対して少なくとも70%の配列同一性を有するRuvC_IIIドメインを含むエンドヌクレアーゼをコードする、核酸。 A nucleic acid comprising an engineered nucleic acid sequence optimized for expression in an organism, wherein said nucleic acid has at least 70% sequence identity to any one of SEQ ID NOs: 1827-3637. 1. A nucleic acid encoding an endonuclease comprising a RuvC_III domain with a specific property. 前記エンドヌクレアーゼは、配列番号:3638-5460のいずれか1つに対して少なくとも70%または少なくとも80%の配列同一性を有するHNHドメインを含む、請求項135-136のいずれか1つに記載の核酸。 137. The endonuclease according to any one of claims 135-136, wherein the endonuclease comprises an HNH domain having at least 70% or at least 80% sequence identity to any one of SEQ ID NOs: 3638-5460. Nucleic acid. 前記エンドヌクレアーゼは、配列番号:5572-5591またはそれらに対して少なくとも70%の配列同一性を有するその変異体を含む、請求項135-137のいずれか1つに記載の核酸。 138. The nucleic acid of any one of claims 135-137, wherein the endonuclease comprises SEQ ID NO: 5572-5591 or a variant thereof having at least 70% sequence identity thereto. 前記エンドヌクレアーゼは、前記エンドヌクレアーゼのN末端またはC末端の近位にある1つ以上の核局在化配列(NLS)をコードする配列を含む、請求項135-138のいずれか1つに記載の核酸。 139. According to any one of claims 135-138, the endonuclease comprises a sequence encoding one or more nuclear localization sequences (NLS) proximal to the N-terminus or C-terminus of the endonuclease. of nucleic acids. 前記NLSは、配列番号:5597-5612から選択される配列を含む、請求項139に記載の核酸。 140. The nucleic acid of claim 139, wherein the NLS comprises a sequence selected from SEQ ID NOs: 5597-5612. 前記生物は、原核生物、細菌、真核生物、真菌、植物、哺乳動物、げっ歯類、またはヒトである、請求項135-140のいずれか1つに記載の核酸。 141. The nucleic acid according to any one of claims 135-140, wherein the organism is a prokaryote, bacterium, eukaryote, fungus, plant, mammal, rodent, or human. 前記生物は大腸菌であり、ここで、
a)前記核酸配列は、配列番号:5572-5575からなる群から選択される配列に対して少なくとも70%、80%、または90%の同一性を有する、
b)前記核酸配列は、配列番号:5576-5577からなる群から選択される配列に対して少なくとも70%、80%、または90%の同一性を有する、
c)前記核酸配列は、配列番号:5578-5580からなる群から選択される配列に対して少なくとも70%、80%、または90%の同一性を有する、
d)前記核酸配列は、配列番号:5581に対して少なくとも70%、80%、または90%の同一性を有する、
e)前記核酸配列は、配列番号:5582に対して少なくとも70%、80%、または90%の同一性を有する、
f)前記核酸配列は、配列番号:5583に対して少なくとも70%、80%、または90%の同一性を有する、
g)前記核酸配列は、配列番号:5584に対して少なくとも70%、80%、または90%の同一性を有する、
h)前記核酸配列は、配列番号:5585に対して少なくとも70%、80%、または90%の同一性を有する、
i)前記核酸配列は、配列番号:5586に対して少なくとも70%、80%、または90%の同一性を有する、あるいは、
j)前記核酸配列は、配列番号:5587に対して少なくとも70%、80%、または90%の同一性を有する、請求項141に記載の核酸。
The organism is E. coli, where:
a) the nucleic acid sequence has at least 70%, 80%, or 90% identity to a sequence selected from the group consisting of SEQ ID NOs: 5572-5575;
b) the nucleic acid sequence has at least 70%, 80%, or 90% identity to a sequence selected from the group consisting of SEQ ID NOs: 5576-5577;
c) the nucleic acid sequence has at least 70%, 80%, or 90% identity to a sequence selected from the group consisting of SEQ ID NOs: 5578-5580;
d) the nucleic acid sequence has at least 70%, 80%, or 90% identity to SEQ ID NO: 5581;
e) the nucleic acid sequence has at least 70%, 80%, or 90% identity to SEQ ID NO: 5582;
f) the nucleic acid sequence has at least 70%, 80%, or 90% identity to SEQ ID NO: 5583;
g) the nucleic acid sequence has at least 70%, 80%, or 90% identity to SEQ ID NO: 5584;
h) the nucleic acid sequence has at least 70%, 80%, or 90% identity to SEQ ID NO: 5585;
i) the nucleic acid sequence has at least 70%, 80%, or 90% identity to SEQ ID NO: 5586, or
j) The nucleic acid of claim 141, wherein the nucleic acid sequence has at least 70%, 80%, or 90% identity to SEQ ID NO:5587.
前記生物はヒトであり、ここで、
a)前記核酸配列は、配列番号:5588あるいは配列番号:5589に対して少なくとも70%、80%、または90%の同一性を有する、あるいは、
b)前記核酸配列は、配列番号:5590あるいは配列番号:5591に対して少なくとも70%、80%、または90%の同一性を有する、請求項141に記載の核酸。
the organism is a human, where:
a) the nucleic acid sequence has at least 70%, 80%, or 90% identity to SEQ ID NO: 5588 or SEQ ID NO: 5589, or
b) The nucleic acid of claim 141, wherein the nucleic acid sequence has at least 70%, 80%, or 90% identity to SEQ ID NO: 5590 or SEQ ID NO: 5591.
RuvC_IIIドメインとHNHドメインとを含むクラス2のII型Casエンドヌクレアーゼをコードする核酸配列を含むベクターであって、前記クラス2のII型Casエンドヌクレアーゼは、難培養性微生物に由来する、ベクター。 A vector comprising a nucleic acid sequence encoding a class 2 type II Cas endonuclease comprising a RuvC_III domain and an HNH domain, wherein the class 2 type II Cas endonuclease is derived from a difficult-to-cultivate microorganism. 請求項135-143のいずれかに記載の核酸を含むベクター。 A vector comprising the nucleic acid according to any of claims 135-143. 前記クラス2のII型Casエンドヌクレアーゼと複合体を形成するように構成される操作されたガイドリボ核酸構造をコードする核酸をさらに含み、前記操作されたガイドリボ核酸構造は、
a)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列と、
b)前記クラス2のII型Casエンドヌクレアーゼに結合するように構成されたtracrリボ核酸配列と、
を含む、請求項144-145のいずれかに記載のベクター。
further comprising a nucleic acid encoding an engineered guide ribonucleic acid structure configured to form a complex with said class 2 type II Cas endonuclease, said engineered guide ribonucleic acid structure comprising:
a) a guide ribonucleic acid sequence configured to hybridize to a target deoxyribonucleic acid sequence;
b) a tracr ribonucleic acid sequence configured to bind to said class 2 type II Cas endonuclease;
146. The vector of any of claims 144-145, comprising:
前記ベクターは、プラスミド、ミニサークル、CELiD、アデノ随伴ウイルス(AAV)由来のビリオン、またはレンチウイルスである、請求項144-146のいずれかに記載のベクター。 147. The vector of any of claims 144-146, wherein the vector is a plasmid, a minicircle, a CELiD, a virion derived from an adeno-associated virus (AAV), or a lentivirus. 請求項144-147のいずれかに記載のベクターを含む細胞。 A cell comprising a vector according to any of claims 144-147. エンドヌクレアーゼを製造する方法であって、前記方法は、請求項146の前記細胞を培養する工程を含む、方法。 147. A method of producing an endonuclease, the method comprising culturing the cell of claim 146. 二本鎖デオキシリボ核酸ポリヌクレオチドを結合、切断、標識、または修飾するための方法であって、前記方法は、
(a)クラス2のII型Casエンドヌクレアーゼおよび前記二本鎖デオキシリボ核酸ポリヌクレオチドに結合するように構成される操作されたガイドリボ核酸構造と複合体を形成するクラス2のII型Casエンドヌクレアーゼに、前記二本鎖デオキシリボ核酸ポリヌクレオチドを接触させる工程を含み、
(b)前記二本鎖デオキシリボ核酸ポリヌクレオチドは、プロトスペーサー隣接モチーフ(PAM)を含み、および、
(c)前記PAMは、配列番号:5512-5526あるいは配列番号:5527-5537からなる群から選択される配列を含む、
方法。
A method for linking, cleaving, labeling, or modifying double-stranded deoxyribonucleic acid polynucleotides, the method comprising:
(a) a class 2 type II Cas endonuclease in complex with a class 2 type II Cas endonuclease and an engineered guide ribonucleic acid structure configured to bind to the double-stranded deoxyribonucleic acid polynucleotide; contacting the double-stranded deoxyribonucleic acid polynucleotide,
(b) the double-stranded deoxyribonucleic acid polynucleotide comprises a protospacer adjacent motif (PAM), and
(c) the PAM includes a sequence selected from the group consisting of SEQ ID NO: 5512-5526 or SEQ ID NO: 5527-5537;
Method.
前記二本鎖デオキシリボ核酸ポリヌクレオチドは、前記操作されたガイドリボ核酸構造の配列に相補的な配列を含む第1の鎖と、PAMを含む第2の鎖とを含む、請求項149に記載の方法。 150. The method of claim 149, wherein the double-stranded deoxyribonucleic acid polynucleotide comprises a first strand comprising a sequence complementary to the sequence of the engineered guide ribonucleic acid structure and a second strand comprising a PAM. . 前記PAMは、前記操作されたガイドリボ核酸構造の前記配列に相補的な前記配列の3’末端に直接隣接している、請求項151に記載の方法。 152. The method of claim 151, wherein the PAM is directly adjacent to the 3' end of the sequence complementary to the sequence of the engineered guide ribonucleic acid structure. 前記クラス2のII型Casエンドヌクレアーゼは、Cas9エンドヌクレアーゼ、Cas14エンドヌクレアーゼ、Cas12aエンドヌクレアーゼ、Cas12bエンドヌクレアーゼ、Cas12cエンドヌクレアーゼ、Cas12dエンドヌクレアーゼ、Cas12eエンドヌクレアーゼ、Cas13aエンドヌクレアーゼ、Cas13bエンドヌクレアーゼ、Cas13cエンドヌクレアーゼ、またはCas13dエンドヌクレアーゼではない、請求項149-152のいずれか1つに記載の方法。 The class 2 type II Cas endonucleases include Cas9 endonuclease, Cas14 endonuclease, Cas12a endonuclease, Cas12b endonuclease, Cas12c endonuclease, Cas12d endonuclease, Cas12e endonuclease, Cas13a endonuclease, Cas13b endonuclease, C as13c endonuclease , or Cas13d endonuclease. 前記クラス2のII型Casエンドヌクレアーゼは、難培養性微生物に由来する、請求項149-153のいずれか1つに記載の方法。 154. The method of any one of claims 149-153, wherein the class 2 type II Cas endonuclease is derived from a refractory microorganism. 前記二本鎖デオキシリボ核酸ポリヌクレオチドは、真核生物、植物、真菌、哺乳動物、げっ歯類、またはヒトの二本鎖デオキシリボ核酸ポリヌクレオチドである、請求項149-154のいずれか1つに記載の方法。 155. The double-stranded deoxyribonucleic acid polynucleotide is a eukaryotic, plant, fungal, mammalian, rodent, or human double-stranded deoxyribonucleic acid polynucleotide according to any one of claims 149-154. the method of. a)前記PAMは、配列番号:5512-5515および配列番号:5527-5530からなる群から選択される配列を含む、
b)前記PAMは配列番号:5516あるいは配列番号:5531を含む、
c)前記PAMは配列番号:5539を含む、
d)前記PAMは配列番号:5517あるいは配列番号:5518を含む、
e)前記PAMは配列番号:5519を含む、
f)前記PAMは配列番号:5520あるいは配列番号:5535を含む、
g)前記PAMは配列番号:5521あるいは配列番号:5536を含む、
h)前記PAMは配列番号:5522を含む、
i)前記PAMは配列番号:5523あるいは配列番号:5537を含む、
j)前記PAMは配列番号:5524を含む、
k)前記PAMは配列番号:5525を含む、または、
l)前記PAMは配列番号:5526を含む、
請求項149-155のいずれか1つに記載の方法。
a) said PAM comprises a sequence selected from the group consisting of SEQ ID NOs: 5512-5515 and SEQ ID NOs: 5527-5530;
b) the PAM comprises SEQ ID NO: 5516 or SEQ ID NO: 5531;
c) said PAM comprises SEQ ID NO: 5539;
d) the PAM comprises SEQ ID NO: 5517 or SEQ ID NO: 5518;
e) said PAM comprises SEQ ID NO: 5519;
f) the PAM comprises SEQ ID NO: 5520 or SEQ ID NO: 5535;
g) the PAM comprises SEQ ID NO: 5521 or SEQ ID NO: 5536;
h) said PAM comprises SEQ ID NO: 5522;
i) the PAM comprises SEQ ID NO: 5523 or SEQ ID NO: 5537;
j) the PAM comprises SEQ ID NO: 5524;
k) the PAM comprises SEQ ID NO: 5525, or
l) the PAM comprises SEQ ID NO: 5526;
156. A method according to any one of claims 149-155.
標的核酸遺伝子座を改変する方法であって、前記方法は、請求項1-129のいずれか1つに記載の前記操作されたヌクレアーゼシステムのいずれかを、前記標的核酸遺伝子座に送達する工程を含み、ここで、前記エンドヌクレアーゼは、前記操作されたガイドリボ核酸構造と複合体を形成するように構成され、ここで、前記複合体は、前記複合体が前記標的核酸遺伝子座に結合すると、前記複合体が前記標的核酸遺伝子座を改変するように構成される、方法。 130. A method of modifying a target nucleic acid locus, the method comprising the step of delivering any of the engineered nuclease systems of any one of claims 1-129 to the target nucleic acid locus. , wherein the endonuclease is configured to form a complex with the engineered guide ribonucleic acid structure, wherein the complex is configured to form a complex with the engineered guide ribonucleic acid structure, wherein upon binding of the complex to the target nucleic acid locus, the endonuclease A method, wherein the complex is configured to modify said target nucleic acid locus. 前記標的核酸遺伝子座を改変することは、前記標的核酸遺伝子座を結合、ニッキング、切断、または標識することを含む、請求項156に記載の方法。 157. The method of claim 156, wherein modifying the target nucleic acid locus comprises binding, nicking, cleaving, or labeling the target nucleic acid locus. 前記標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む、請求項156-158のいずれかに記載の方法。 159. The method of any of claims 156-158, wherein the target nucleic acid locus comprises deoxyribonucleic acid (DNA) or ribonucleic acid (RNA). 前記標的核酸は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含む、請求項159に記載の方法。 160. The method of claim 159, wherein the target nucleic acid comprises genomic DNA, viral DNA, viral RNA, or bacterial DNA. 前記標的核酸遺伝子座はインビトロにある、請求項156-160のいずれか1つに記載の方法。 161. The method of any one of claims 156-160, wherein the target nucleic acid locus is in vitro. 前記標的核酸遺伝子座は細胞内にある、請求項156-160のいずれか1つに記載の方法。 161. The method of any one of claims 156-160, wherein the target nucleic acid locus is intracellular. 前記細胞は、原核細胞、細菌細胞、真核細胞、真菌細胞、植物細胞、動物細胞、哺乳動物細胞、げっ歯類細胞、霊長類細胞、またはヒト細胞である、請求項162に記載の方法。 163. The method of claim 162, wherein the cell is a prokaryotic cell, a bacterial cell, a eukaryotic cell, a fungal cell, a plant cell, an animal cell, a mammalian cell, a rodent cell, a primate cell, or a human cell. 前記操作されたヌクレアーゼシステムを前記標的核酸遺伝子座に送達する工程は、請求項135-140のいずれかに記載の核酸または請求項142-146のいずれかに記載のベクターを送達することを含む、請求項162-163のいずれか1つに記載の方法。 delivering the engineered nuclease system to the target nucleic acid locus comprises delivering the nucleic acid of any of claims 135-140 or the vector of any of claims 142-146; 164. A method according to any one of claims 162-163. 前記操作されたヌクレアーゼシステムを前記標的核酸遺伝子座に送達する工程は、前記エンドヌクレアーゼをコードするオープンリーディングフレームを含む核酸を送達することを含む、請求項162-163のいずれか1つに記載の方法。 164. The method of claim 162-163, wherein delivering the engineered nuclease system to the target nucleic acid locus comprises delivering a nucleic acid comprising an open reading frame encoding the endonuclease. Method. 前記核酸は、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームが動作可能に連結されるプロモーターを含む、請求項164に記載の方法。 165. The method of claim 164, wherein the nucleic acid comprises a promoter to which the open reading frame encoding the endonuclease is operably linked. 前記操作されたヌクレアーゼシステムを前記標的核酸遺伝子座に送達する工程は、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含むキャップされたmRNAを送達することを含む、請求項162-163のいずれか1つに記載の方法。 164. Any one of claims 162-163, wherein delivering the engineered nuclease system to the target nucleic acid locus comprises delivering capped mRNA comprising the open reading frame encoding the endonuclease. The method described in. 前記操作されたヌクレアーゼシステムを前記標的核酸遺伝子座に送達する工程は、翻訳されたポリペプチドを送達することを含む、請求項162-163のいずれか1つに記載の方法。 164. The method of any one of claims 162-163, wherein delivering the engineered nuclease system to the target nucleic acid locus comprises delivering translated polypeptide. 前記操作されたヌクレアーゼシステムを前記標的核酸遺伝子座に送達する工程は、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結される前記操作されたガイドリボ核酸構造をコードするデオキシリボ核酸(DNA)を送達することを含む、請求項162-163のいずれか1つに記載の方法。 delivering the engineered nuclease system to the target nucleic acid locus delivers deoxyribonucleic acid (DNA) encoding the engineered guide ribonucleic acid structure operably linked to a ribonucleic acid (RNA) pol III promoter. 164. A method according to any one of claims 162-163, comprising: 前記エンドヌクレアーゼは、前記標的核酸遺伝子座で、またはその近位で、一本鎖切断または二本鎖切断を引き起こす、請求項156-169のいずれか1つに記載の方法。 170. The method of any one of claims 156-169, wherein the endonuclease causes a single-strand break or a double-strand break at or proximal to the target nucleic acid locus.
JP2023146414A 2019-02-14 2023-09-08 Enzymes with ruvc domains Pending JP2023179468A (en)

Applications Claiming Priority (10)

Application Number Priority Date Filing Date Title
US201962805899P 2019-02-14 2019-02-14
US201962805868P 2019-02-14 2019-02-14
US201962805878P 2019-02-14 2019-02-14
US62/805,868 2019-02-14
US62/805,899 2019-02-14
US62/805,878 2019-02-14
US201962874414P 2019-07-15 2019-07-15
US62/874,414 2019-07-15
JP2021547336A JP2022520428A (en) 2019-02-14 2020-02-14 Enzyme with RUVC domain
PCT/US2020/018432 WO2020168291A1 (en) 2019-02-14 2020-02-14 Enzymes with ruvc domains

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2021547336A Division JP2022520428A (en) 2019-02-14 2020-02-14 Enzyme with RUVC domain

Publications (1)

Publication Number Publication Date
JP2023179468A true JP2023179468A (en) 2023-12-19

Family

ID=72045639

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2021547336A Ceased JP2022520428A (en) 2019-02-14 2020-02-14 Enzyme with RUVC domain
JP2023146414A Pending JP2023179468A (en) 2019-02-14 2023-09-08 Enzymes with ruvc domains

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2021547336A Ceased JP2022520428A (en) 2019-02-14 2020-02-14 Enzyme with RUVC domain

Country Status (9)

Country Link
US (1) US20240117330A1 (en)
EP (1) EP3924482A4 (en)
JP (2) JP2022520428A (en)
KR (2) KR102623312B1 (en)
CN (2) CN113728098A (en)
AU (2) AU2020223370B2 (en)
CA (1) CA3130135A1 (en)
MX (2) MX2021009886A (en)
WO (1) WO2020168291A1 (en)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10913941B2 (en) 2019-02-14 2021-02-09 Metagenomi Ip Technologies, Llc Enzymes with RuvC domains
GB2594339B (en) * 2020-02-14 2023-02-08 Metagenomi Inc Enzymes with RUVC domains
GB2617658B (en) 2020-03-06 2024-04-17 Metagenomi Inc Class II, type V CRISPR systems
KR20220161383A (en) 2020-03-31 2022-12-06 메타지노미, 인크. Class II, type II CRISPR systems
GB2615901A (en) * 2020-09-11 2023-08-23 Metagenomi Inc Base editing enzymes
WO2022098681A2 (en) * 2020-11-03 2022-05-12 Caspr Biotech Corporation Novel class 2 crispr-cas rna-guided endonucleases
WO2022159742A1 (en) * 2021-01-22 2022-07-28 Metagenomi, Inc Novel engineered and chimeric nucleases
JP2024504981A (en) * 2021-01-22 2024-02-02 メタゲノミ,インク. Novel engineered and chimeric nucleases
WO2022232638A2 (en) * 2021-04-30 2022-11-03 Metagenomi, Inc. Enzymes with ruvc domains
WO2023122663A2 (en) * 2021-12-23 2023-06-29 Mammoth Biosciences, Inc. Effector proteins and methods of use
WO2023194359A1 (en) * 2022-04-04 2023-10-12 Alia Therapeutics Srl Compositions and methods for treatment of usher syndrome type 2a
WO2023245141A2 (en) * 2022-06-15 2023-12-21 Beam Therapeutics Inc. Compositions and methods for reducing complement activation

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6552965B2 (en) * 2012-12-12 2019-07-31 ザ・ブロード・インスティテュート・インコーポレイテッド Engineering and optimization of improved systems, methods and enzyme compositions for sequence manipulation
US10392607B2 (en) * 2015-06-03 2019-08-27 The Regents Of The University Of California Cas9 variants and methods of use thereof
WO2016205759A1 (en) * 2015-06-18 2016-12-22 The Broad Institute Inc. Engineering and optimization of systems, methods, enzymes and guide scaffolds of cas9 orthologs and variants for sequence manipulation
WO2018035250A1 (en) * 2016-08-17 2018-02-22 The Broad Institute, Inc. Methods for identifying class 2 crispr-cas systems
KR20200124702A (en) * 2018-02-23 2020-11-03 파이어니어 하이 부렛드 인터내쇼날 인코포레이팃드 The novel CAS9 ortholog

Also Published As

Publication number Publication date
CN116515797A (en) 2023-08-01
AU2023206079A1 (en) 2023-08-10
US20240117330A1 (en) 2024-04-11
CN113728098A (en) 2021-11-30
MX2021009886A (en) 2021-10-13
AU2020223370A1 (en) 2021-10-07
EP3924482A4 (en) 2023-04-05
MX2023006575A (en) 2023-06-16
KR102623312B1 (en) 2024-01-09
AU2020223370B2 (en) 2023-04-20
JP2022520428A (en) 2022-03-30
EP3924482A1 (en) 2021-12-22
WO2020168291A1 (en) 2020-08-20
CA3130135A1 (en) 2020-08-20
KR20240007322A (en) 2024-01-16
KR20210139254A (en) 2021-11-22

Similar Documents

Publication Publication Date Title
KR102623312B1 (en) Enzyme with RUVC domain
US10982200B2 (en) Enzymes with RuvC domains
JP2023533417A (en) Enzymes with RUVC domains
WO2021178934A1 (en) Class ii, type v crispr systems
US20230340481A1 (en) Systems and methods for transposing cargo nucleotide sequences
US20220298494A1 (en) Enzymes with ruvc domains
US20220220460A1 (en) Enzymes with ruvc domains
WO2021226369A1 (en) Enzymes with ruvc domains
AU2021333586A9 (en) Systems and methods for transposing cargo nucleotide sequences
US20240110167A1 (en) Enzymes with ruvc domains
GB2617659A (en) Enzymes with RUVC domains
KR20240049306A (en) Enzymes with RUVC domains
WO2023039377A1 (en) Class ii, type v crispr systems

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230921

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230921

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20230927

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231002

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231211

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240306