JP2023533417A

JP2023533417A - Ｒｕｖｃドメインを有する酵素

Info

Publication number: JP2023533417A
Application number: JP2022567462A
Authority: JP
Inventors: トーマス，ブライアン; ブラウン，クリストファー; カンター，ローズ; デヴォート，オードラ; バターフィールド，クリスティーナ; アレクサンダー，リサ; エス．エー．ゴルツマン，ダニエラ; リュー，ジェイソン; ラモット，レベッカ; エスピノサ，ディエゴ; ストーリー，メーガン; コスト，グレッグ
Original assignee: メタゲノミ，インコーポレイテッド
Priority date: 2020-05-08
Filing date: 2021-05-06
Publication date: 2023-08-03
Also published as: CN116096892A; CA3177828A1; MX2022014067A; KR20230021657A; GB2612458A; WO2021226363A1; EP4146800A1; GB202217378D0; AU2021267379A1

Abstract

本開示は、際立ったドメインの特徴を有するエンドヌクレアーゼ酵素、並びにそのような酵素又はそのバリアントを用いる方法を提供する。【選択図】図２

Description

関連出願
本出願は、２０２０年５月８日に出願された「ＥＮＺＹＭＥＳＷＩＴＨＲＵＶＣＤＯＭＡＩＮＳ」と題する米国仮出願第６３／０２２，３２０号、２０２０年５月２９日に出願された「ＥＮＺＹＭＥＳＷＩＴＨＲＵＶＣＤＯＭＡＩＮＳ」と題する米国仮出願第６３／０３２，４６４号、及び２０２０年１１月１９日に出願された「ＥＮＺＹＭＥＳＷＩＴＨＲＵＶＣＤＯＭＡＩＮＳ」と題する米国仮出願第６３／１１６，１５５号、及び２０２１年４月２７日に出願された「ＥＮＺＹＭＥＳＷＩＴＨＲＵＶＣＤＯＭＡＩＮＳ」と題する米国仮出願第６３／１８０，５７０号の優先権を主張し、これらの全ては参照によりその全体が本明細書に組み込まれる。

Ｃａｓ酵素は、それらの関連するクラスター化して規則的な配置の短い回文配列リピート（ＣｌｕｓｔｅｒｅｄＲｅｇｕｌａｒｌｙＩｎｔｅｒｓｐａｃｅｄＳｈｏｒｔＰａｌｉｎｄｒｏｍｉｃＲｅｐｅａｔ：ＣＲＩＳＰＲ）ガイドリボ核酸（ＲＮＡ）と共に、そのような微生物を、ＣＲＩＳＰＲ－ＲＮＡガイド核酸切断によって感染性ウイルス及びプラスミドなどの非自己核酸から保護するのに役立つ原核生物免疫システムの広範な（約４５％の細菌、約８４％の古細菌）構成成分であるようである。ＣＲＩＳＰＲＲＮＡ要素をコードするデオキシリボ核酸（ＤＮＡ）要素は、構造及び長さにおいて比較的保存され得るが、それらのＣＲＩＳＰＲ関連（ＣＲＩＳＰＲ－ａｓｓｏｃｉａｔｅｄ：Ｃａｓ）タンパク質は極めて多様であり、多種多様な核酸相互作用ドメインを含有する。ＣＲＩＳＰＲＤＮＡ要素は１９８７年という早い時期に観察されてきたが、ＣＲＩＳＰＲ／Ｃａｓ複合体のプログラム可能なエンドヌクレアーゼ切断能力は比較的最近になって初めて認識され、多様なＤＮＡ操作及び遺伝子編集用途における組換えＣＲＩＳＰＲ／Ｃａｓシステムの使用につながった。

配列表
本出願は、ＡＳＣＩＩ形式で電子的に提出されている配列表を含み、その全体は参照により本明細書に組み込まれる。２０２０年５月２９日に作成された当該ＡＳＣＩＩコピーの名称は、５５９２１＿７１２＿６０１＿ＳＬ．ｔｘｔであり、サイズは２４，６５９，４３９バイトである。

いくつかの態様では、本開示は、操作されたヌクレアーゼシステムであって、（ａ）ＲｕｖＣ＿ＩＩＩドメイン及びＨＮＨドメインを含むエンドヌクレアーゼであって、当該エンドヌクレアーゼは未培養微生物に由来し、当該エンドヌクレアーゼはクラス２タイプＩＩＣａｓエンドヌクレアーゼである、エンドヌクレアーゼ、並びに（ｂ）エンドヌクレアーゼと複合体を形成するように構成された操作されたガイドリボ核酸構造であって、（ｉ）標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列、及び（ｉｉ）エンドヌクレアーゼに結合するように構成されたｔｒａｃｒリボ核酸配列を含む、操作されたガイドリボ核酸構造を含む、操作されたヌクレアーゼシステムを提供する。いくつかの実施形態では、ＲｕｖＣ＿ＩＩＩドメインは、配列番号１８２７～３６３７のいずれか１つに対して、少なくとも７０％、少なくとも７５％、少なくとも８０％、少なくとも８５％、少なくとも８８％、少なくとも９０％、少なくとも９２％、少なくとも９５％、又は少なくとも９８％の配列同一性を有する配列を含む。

いくつかの態様では、本開示は、操作されたヌクレアーゼシステムであって、（ａ）配列番号１８２７～３６３７のいずれか１つに対して、少なくとも７０％、少なくとも７５％、少なくとも８０％、少なくとも８５％、少なくとも８８％、少なくとも９０％、少なくとも９２％、少なくとも９５％、又は少なくとも９８％の配列同一性を有するＲｕｖＣ＿ＩＩＩドメインを含むエンドヌクレアーゼ、並びに（ｂ）エンドヌクレアーゼと複合体を形成するように構成された操作されたガイドリボ核酸構造であって、（ｉ）標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列、及び（ｉｉ）エンドヌクレアーゼに結合するように構成されたｔｒａｃｒリボ核酸配列を含む、操作されたガイドリボ核酸構造を含む、操作されたヌクレアーゼシステムを提供する。

いくつかの態様では、本開示は、操作されたヌクレアーゼシステムであって、（ａ）配列番号５５１２～５５３７を含むプロトスペーサー隣接モチーフ（ｐｒｏｔｏｓｐａｃｅｒａｄｊａｃｅｎｔｍｏｔｉｆ：ＰＡＭ）配列に結合するように構成されたエンドヌクレアーゼであって、当該エンドヌクレアーゼがクラス２タイプＩＩＣａｓエンドヌクレアーゼである、エンドヌクレアーゼ、並びに（ｂ）エンドヌクレアーゼと複合体を形成するように構成された操作されたガイドリボ核酸構造であって、（ｉ）標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列、及び（ｉｉ）エンドヌクレアーゼに結合するように構成されたｔｒａｃｒリボ核酸配列を含む、操作されたガイドリボ核酸構造を含む、操作されたヌクレアーゼシステムを提供する。

いくつかの実施形態では、エンドヌクレアーゼは、未培養微生物に由来する。いくつかの実施形態では、エンドヌクレアーゼは、異なるＰＡＭ配列へと結合するようには操作されていない。いくつかの実施形態では、エンドヌクレアーゼは、Ｃａｓ９エンドヌクレアーゼ、Ｃａｓ１４エンドヌクレアーゼ、Ｃａｓ１２ａエンドヌクレアーゼ、Ｃａｓ１２ｂエンドヌクレアーゼ、Ｃａｓ１２ｃエンドヌクレアーゼ、Ｃａｓ１２ｄエンドヌクレアーゼ、Ｃａｓ１２ｅエンドヌクレアーゼ、Ｃａｓ１３ａエンドヌクレアーゼ、Ｃａｓ１３ｂエンドヌクレアーゼ、Ｃａｓ１３ｃエンドヌクレアーゼ、又はＣａｓ１３ｄエンドヌクレアーゼではない。いくつかの実施形態では、エンドヌクレアーゼは、Ｃａｓ９エンドヌクレアーゼに対して８０％未満の同一性を有する。いくつかの実施形態では、エンドヌクレアーゼは、ＨＮＨドメインを更に含む。いくつかの実施形態では、ｔｒａｃｒリボ核酸配列は、配列番号５４７６～５５１１及び配列番号５５３８のいずれか１つから選択される約６０～９０個の連続するヌクレオチドに対して、少なくとも８０％の配列同一性を有する配列を含む。

いくつかの態様では、本開示は、操作されたヌクレアーゼシステムであって、（ａ）操作されたガイドリボ核酸構造であって、（ｉ）標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列、及び（ｉｉ）エンドヌクレアーゼに結合するように構成されたｔｒａｃｒリボ核酸配列を含み、ここで、ｔｒａｃｒリボ核酸配列が、配列番号５４７６～５５１１及び配列番号５５３８のいずれか１つから選択された約６０～９０個の連続するヌクレオチドに対して少なくとも８０％の配列同一性を有する配列を含む、ｔｒａｃｒリボ核酸配列を含む、操作されたガイドリボ核酸構造、並びに（ｂ）操作されたガイドリボ核酸に結合するように構成されたクラス２タイプＩＩＣａｓエンドヌクレアーゼを含む、操作されたヌクレアーゼシステムを提供する。いくつかの実施形態では、エンドヌクレアーゼは、配列番号５５１２～５５３７を含む群から選択されるプロトスペーサー隣接モチーフ（ＰＡＭ）配列に結合するように構成されている。

いくつかの実施形態では、操作されたガイドリボ核酸構造は、少なくとも２つのリボ核酸ポリヌクレオチドを含む。いくつかの実施形態では、操作されたガイドリボ核酸構造は、ガイドリボ核酸配列及びｔｒａｃｒリボ核酸配列を含む、１つのリボ核酸ポリヌクレオチドを含む。

いくつかの実施形態では、ガイドリボ核酸配列は、原核生物、細菌、古細菌、真核生物、真菌、植物、哺乳動物、又はヒトのゲノム配列に相補的である。いくつかの実施形態では、ガイドリボ核酸配列は、１５～２４ヌクレオチド長である。いくつかの実施形態では、エンドヌクレアーゼは、エンドヌクレアーゼのＮ末端又はＣ末端に近接した１つ以上の核局在化配列（ｎｕｃｌｅａｒｌｏｃａｌｉｚａｔｉｏｎｓｅｑｕｅｎｃｅ：ＮＬＳ）を含む。いくつかの実施形態では、ＮＬＳは、配列番号５５９７～５６１２から選択される配列を含む。

いくつかの実施形態では、操作されたヌクレアーゼシステムは、５’から３’の順に、標的デオキシリボ核酸配列に対して５’である少なくとも２０ヌクレオチドの配列を含む第１のホモロジーアーム、少なくとも１０ヌクレオチドの合成ＤＮＡ配列、及び標的配列に対して３’である少なくとも２０ヌクレオチドの配列を含む第２のホモロジーアームを含む、一本鎖又は二本鎖ＤＮＡ修復鋳型を更に含む。いくつかの実施形態では、第１のホモロジーアーム又は第２のホモロジーアームは、少なくとも４０、８０、１２０、１５０、２００、３００、５００、又は１，０００ヌクレオチドの配列を含む。

いくつかの実施形態では、システムは、Ｍｇ２＋の供給源を更に含む。

いくつかの実施形態では、エンドヌクレアーゼ及びｔｒａｃｒリボ核酸配列は、同じ門内の異なる細菌種に由来する。いくつかの実施形態では、エンドヌクレアーゼは、デルマバクター（Ｄｅｒｍａｂａｃｔｅｒ）属に属する細菌に由来する。いくつかの実施形態では、エンドヌクレアーゼは、ウェルコミクロビウム（Ｖｅｒｒｕｃｏｍｉｃｒｏｂｉａ）門、カンディダートゥス・ペレグリニバクテリア（ＣａｎｄｉｄａｔｕｓＰｅｒｅｇｒｉｎｉｂａｃｔｅｒｉａ）門、又はカンディダートゥス・メライナバクテリア（ＣａｎｄｉｄａｔｕｓＭｅｌａｉｎａｂａｃｔｅｒｉａ）門に属する細菌に由来する。いくつかの実施形態では、エンドヌクレアーゼは、配列番号５５９２～５５９５のいずれか１つに対して少なくとも９０％の同一性を有する１６ＳｒＲＮＡ遺伝子を含む細菌に由来する。

いくつかの実施形態では、ＨＮＨドメインは、配列番号５６３８～５４６０のいずれか１つに対して少なくとも７０％又は少なくとも８０％の同一性を有する配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号１～１８２６、又はそれに対して少なくとも５５％の同一性を有するそのバリアントを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号１８２７～１８３０又は配列番号１８２７～２１４０からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。

いくつかの実施形態では、エンドヌクレアーゼは、配列番号３６３８～３６４１又は配列番号３６３８～３９５４からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号５６１５～５６３２からなる群から選択される、少なくとも１個、少なくとも２個、少なくとも３個、少なくとも４個、又は少なくとも５個のペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号１～４又は配列番号１～３１９からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。

いくつかの実施形態では、ガイドＲＮＡ構造は、配列番号５４６１～５４６４、配列番号５４７６～５４７９、又は配列番号５４７６～５４８９からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、ガイドＲＮＡ構造は、ステム及びループからなるヘアピンを含むと予測されるＲＮＡ配列を含み、当該ステムが、少なくとも１０、少なくとも１２、又は少なくとも１４塩基対のリボヌクレオチド、及び当該ループの４塩基対以内の非対称バルジを含む。

いくつかの実施形態では、エンドヌクレアーゼは、配列番号５５１２～５５１５又は配列番号５５２７～５５３０からなる群から選択される配列を含む、ＰＡＭへと結合するように構成されている。

いくつかの実施形態では、（ａ）エンドヌクレアーゼは、配列番号１８２７に対して、少なくとも７０％、少なくとも８０％、又は少なくとも９０％同一の配列を含み、（ｂ）ガイドＲＮＡ構造は、配列番号５４６１又は配列番号５４７６の少なくとも１つに対して、少なくとも７０％、少なくとも８０％、又は少なくとも９０％同一の配列を含み、（ｃ）エンドヌクレアーゼは、配列番号５５１２又は配列番号５５２７を含むＰＡＭに結合するように構成されている。いくつかの実施形態では、（ａ）エンドヌクレアーゼは、配列番号１８２８に対して、少なくとも７０％、少なくとも８０％、又は少なくとも９０％同一の配列を含み、（ｂ）ガイドＲＮＡ構造は、配列番号５４６２又は配列番号５４７７の少なくとも１つに対して、少なくとも７０％、少なくとも８０％、又は少なくとも９０％同一の配列を含み、（ｃ）エンドヌクレアーゼは、配列番号５５１３又は配列番号５５２８を含むＰＡＭに結合するように構成されている、いくつかの実施形態では、（ａ）エンドヌクレアーゼは、配列番号１８２９に対して、少なくとも７０％、少なくとも８０％、又は少なくとも９０％同一の配列を含み、（ｂ）ガイドＲＮＡ構造は、配列番号５４６３又は配列番号５４７８の少なくとも１つに対して、少なくとも７０％、少なくとも８０％、又は少なくとも９０％同一の配列を含み、（ｃ）エンドヌクレアーゼは、配列番号５５１４又は配列番号５５２９を含むＰＡＭに結合するように構成されている。いくつかの実施形態では、（ａ）エンドヌクレアーゼは、配列番号１８３０に対して、少なくとも７０％、少なくとも８０％、又は少なくとも９０％同一の配列を含み、（ｂ）ガイドＲＮＡ構造は、配列番号５４６４又は配列番号５４７９の少なくとも１つに対して、少なくとも７０％、少なくとも８０％、又は少なくとも９０％同一の配列を含み、（ｃ）エンドヌクレアーゼは、配列番号５５１５又は配列番号５５３０を含むＰＡＭに結合するように構成されている。

いくつかの実施形態では、エンドヌクレアーゼは、配列番号２１４１～２１４２又は配列番号２１４１～２２４１からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号３９５５～３９５６又は配列番号３９５５～４０５５からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号５６３２～５６３８からなる群から選択される、少なくとも１個、少なくとも２個、少なくとも３個、少なくとも４個、又は少なくとも５個のペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号３２０～３２１又は配列番号３２０～４２０からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、ガイドＲＮＡ構造は、配列番号５４６５、配列番号５４９０～５４９１、又は配列番号５４９０～５４９４からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、ガイドＲＮＡ構造は、少なくとも８個、少なくとも１０個、又は少なくとも１２個の塩基対のリボヌクレオチドを含むヘアピンを含む、ｔｒａｃｒリボ核酸配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号５５１６又は配列番号５５３１からなる群から選択される配列を含む、ＰＡＭへと結合するように構成されている。いくつかの実施形態では、（ａ）エンドヌクレアーゼは、配列番号２１４１に対して少なくとも７０％、８０％、又は９０％同一である配列を含み、（ｂ）ガイドＲＮＡ構造は、配列番号５４９０に対して少なくとも７０％、８０％、又は９０％同一である配列を含み、（ｃ）エンドヌクレアーゼは、配列番号５５３１を含むＰＡＭへと結合するように構成される。いくつかの実施形態では、（ａ）エンドヌクレアーゼは、配列番号２１４２に対して少なくとも７０％、８０％、又は９０％同一である配列を含み、（ｂ）ガイドＲＮＡ構造は、配列番号５４６５又は配列番号５４９１に対して少なくとも７０％、８０％、又は９０％同一である配列を含み、（ｃ）エンドヌクレアーゼは、配列番号５５１６を含むＰＡＭへと結合するように構成される。

いくつかの実施形態では、エンドヌクレアーゼは配列番号２２４５～２２４６からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号４０５９～４０６０からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号５６３９～５６４８からなる群から選択される、少なくとも１個、少なくとも２個、少なくとも３個、少なくとも４個、又は少なくとも５個のペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号４２４～４２５からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、ガイドＲＮＡ構造は、配列番号５４９８～５４９９及び配列番号５５３９からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、ガイドＲＮＡ構造は、ガイドリボ核酸配列の少なくとも８ヌクレオチド及びｔｒａｃｒリボ核酸配列の少なくとも８ヌクレオチドを含む中断されていない塩基対領域を有するヘアピンを含むと予測されるガイドリボ核酸配列を含み、ここで、ｔｒａｃｒリボ核酸配列は、５’から３’に向かって、第１のヘアピン及び第２のヘアピンを含み、第１のヘアピンは、第２のヘアピンよりも長いステムを有する。

いくつかの実施形態では、エンドヌクレアーゼは、配列番号２２４２～２２４４又は配列番号２２４７～２２４９からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号４０５６～４０５８又は配列番号４０６１～４０６３からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号５６３９～５６４８からなる群から選択される、少なくとも１個、少なくとも２個、少なくとも３個、少なくとも４個、又は少なくとも５個のペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号４２１～４２３又は配列番号４２６～４２８からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、ガイドＲＮＡ構造は、配列番号５４６６～５４６７、配列番号５４９５～５４９７、配列番号５５００～５５０２、及び配列番号５５３９からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、ガイドＲＮＡ構造は、ガイドリボ核酸配列の少なくとも８ヌクレオチド及びｔｒａｃｒリボ核酸配列の少なくとも８ヌクレオチドを含む中断されていない塩基対領域を有するヘアピンを含むと予測されるガイドリボ核酸配列を含み、ここで、ｔｒａｃｒリボ核酸配列は、５’から３’に向かって、第１のヘアピン及び第２のヘアピンを含み、第１のヘアピンは、第２のヘアピンよりも長いステムを有する。いくつかの実施形態では、エンドヌクレアーゼは、配列番号５５１７～５５１８又は配列番号５５３２～５５３４からなる群から選択される配列を含む、ＰＡＭへと結合するように構成されている。いくつかの実施形態では、（ａ）エンドヌクレアーゼは、配列番号２２４７に対して少なくとも７０％、８０％、又は９０％同一である配列を含み、（ｂ）ガイドＲＮＡ構造は、配列番号５５００に対して少なくとも７０％、８０％、又は９０％同一である配列を含み、（ｃ）エンドヌクレアーゼは、配列番号５５１７又は配列番号５５３２を含むＰＡＭへと結合するように構成される。いくつかの実施形態では、（ａ）エンドヌクレアーゼは、配列番号２２４８に対して少なくとも７０％、８０％、又は９０％同一である配列を含み、（ｂ）ガイドＲＮＡ構造は、配列番号５５０１に対して少なくとも７０％、８０％、又は９０％同一である配列を含み、（ｃ）エンドヌクレアーゼは、配列番号５５１８又は配列番号５５３３を含むＰＡＭへと結合するように構成される。いくつかの実施形態では、（ａ）エンドヌクレアーゼは、配列番号２２４９に対して少なくとも７０％、８０％、又は９０％同一である配列を含み、（ｂ）ガイドＲＮＡ構造は、配列番号５５０２に対して少なくとも７０％、８０％、又は９０％同一である配列を含み、（ｃ）エンドヌクレアーゼは、配列番号５５３４を含むＰＡＭへと結合するように構成される。

いくつかの実施形態では、エンドヌクレアーゼは、配列番号２２５３又は配列番号２２５３～２４８１からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号４０６７又は配列番号４０６７～４２９５からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号５６４９によるペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号４３２又は配列番号４３２～６６０からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、ガイドＲＮＡ構造は、配列番号５４６８又は配列番号５５０３からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号５５１９からなる群から選択される配列を含む、ＰＡＭへと結合するように構成されている。いくつかの実施形態では、（ａ）エンドヌクレアーゼは、配列番号２２５３に対して少なくとも７０％、８０％、又は９０％同一である配列を含み、（ｂ）ガイドＲＮＡ構造は、配列番号５４６８又は配列番号５５０３に対して少なくとも７０％、８０％、又は９０％同一である配列を含み、（ｃ）エンドヌクレアーゼは、配列番号５５１９を含むＰＡＭへと結合するように構成される。

いくつかの実施形態では、エンドヌクレアーゼは、配列番号２４８２～２４８９からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号４２９６～４３０３からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号６６１～６６８からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号２４９０～２４９８からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号４３０４～４３１２からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号６６９～６７７からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、ガイドＲＮＡ構造は、配列番号５５０４からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。

いくつかの実施形態では、エンドヌクレアーゼは、配列番号２４９９又は配列番号２４９９～２７５０からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号４３１３又は配列番号４３１３～４５６４からなる群から選択される配列に対して少なくとも７０％、８０％、又は９０％同一の配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号５６５０～５６６７からなる群から選択される、少なくとも１個、少なくとも２個、少なくとも３個、少なくとも４個、又は少なくとも５個のペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号６７８又は配列番号６７８～９２９からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、ガイドＲＮＡ構造は、配列番号５４６９又は配列番号５５０５に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号５５２０又は配列番号５５３５を含むＰＡＭに結合するように構成される。いくつかの実施形態では、（ａ）エンドヌクレアーゼは、配列番号２４９９に対して少なくとも７０％、８０％、又は９０％同一である配列を含み、（ｂ）ガイドＲＮＡ構造は、配列番号５４６９又は配列番号５５０５に対して少なくとも７０％、８０％、又は９０％同一である配列を含み、（ｃ）エンドヌクレアーゼは、配列番号５５２０又は配列番号５５３５を含むＰＡＭへと結合するように構成される。

いくつかの実施形態では、エンドヌクレアーゼは、配列番号２７５１又は配列番号２７５１～２９１３からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号４５６５又は配列番号４５６５～４７２７からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号５６６８～５６７８からなる群から選択される、少なくとも１個、少なくとも２個、少なくとも３個、少なくとも４個、又は少なくとも５個のペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号９３０又は配列番号９３０～１０９２からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、ガイドＲＮＡ構造は、配列番号５４７０又は配列番号５５０６に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号５５２１又は配列番号５５３６からなる群から選択される配列を含む、ＰＡＭへと結合するように構成されている。いくつかの実施形態では、（ａ）エンドヌクレアーゼは、配列番号２７５１に対して少なくとも７０％、８０％、又は９０％同一である配列を含み、（ｂ）ガイドＲＮＡ構造は、配列番号５４７０又は配列番号５５０６に対して少なくとも７０％、８０％、又は９０％同一である配列を含み、（ｃ）エンドヌクレアーゼは、配列番号５５２１又は配列番号５５３６を含むＰＡＭへと結合するように構成される。

いくつかの実施形態では、エンドヌクレアーゼは、配列番号２９１４又は配列番号２９１４～３１７４からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号４７２８又は配列番号４７２８～４９８８からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは配列番号５６７６～５６７８からなる群から選択される、少なくとも１個、少なくとも２個、又は少なくとも３個のペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号１０９３又は配列番号１０９３～１３５３からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、ガイドＲＮＡ構造は、配列番号５４７１、配列番号５５０７、及び配列番号５５４０～５５４２からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、ガイドＲＮＡ構造は、５塩基対未満のリボヌクレオチドを含む少なくとも２つのヘアピンを含むと予測される、ｔｒａｃｒリボ核酸配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号５５２２を含むＰＡＭに結合するように構成される。いくつかの実施形態では、（ａ）エンドヌクレアーゼは、配列番号２９１４に対して少なくとも７０％、８０％、又は９０％同一である配列を含み、（ｂ）ガイドＲＮＡ構造は、配列番号５４７１又は配列番号５５０７に対して少なくとも７０％、８０％、又は９０％同一である配列を含み、（ｃ）エンドヌクレアーゼは、配列番号５５２２を含むＰＡＭへと結合するように構成される。

いくつかの実施形態では、エンドヌクレアーゼは、配列番号３１７５又は配列番号３１７５～３３３０からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号４９８９又は配列番号４９８９～５１４６からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号５６７９～５６８６からなる群から選択される、少なくとも１個、少なくとも２個、少なくとも３個、少なくとも４個、又は少なくとも５個のペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号１３５４又は配列番号１３５４～１５１１からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、ガイドＲＮＡ構造は、配列番号５４７２又は配列番号５５０８からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号５５２３又は配列番号５５３７からなる群から選択される配列を含む、ＰＡＭへと結合するように構成されている。いくつかの実施形態では、（ａ）エンドヌクレアーゼは、配列番号３１７５に対して少なくとも７０％、８０％、又は９０％同一である配列を含み、（ｂ）ガイドＲＮＡ構造は、配列番号５４７２又は配列番号５５０８に対して少なくとも７０％、８０％、又は９０％同一である配列を含み、（ｃ）エンドヌクレアーゼは、配列番号５５２３又は配列番号５５３７を含むＰＡＭへと結合するように構成される。

いくつかの実施形態では、エンドヌクレアーゼは、配列番号３３３１又は配列番号３３３１～３４７４からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号５１４７又は配列番号５１４７～５２９０からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号５６７４～５６７５及び配列番号５６８７～５６９３からなる群から選択される、少なくとも１個、少なくとも２個、少なくとも３個、少なくとも４個、又は少なくとも５個のペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号１５１２又は配列番号１５１２～１６５５からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、ガイドＲＮＡ構造は、配列番号５４７３又は配列番号５５０９からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号５５２４を含むＰＡＭに結合するように構成される。いくつかの実施形態では、（ａ）エンドヌクレアーゼは、配列番号３３３１に対して少なくとも７０％、８０％、又は９０％同一である配列を含み、（ｂ）ガイドＲＮＡ構造は、配列番号５４７３又は配列番号５５０９に対して少なくとも７０％、８０％、又は９０％同一である配列を含み、（ｃ）エンドヌクレアーゼは、配列番号５５２４を含むＰＡＭへと結合するように構成される。

いくつかの実施形態では、エンドヌクレアーゼは、配列番号３４７５又は配列番号３４７５～３５６８からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号５２９１又は配列番号５２９１～５３８９からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号５６９４～５６９９からなる群から選択される、少なくとも１個、少なくとも２個、少なくとも３個、少なくとも４個、又は少なくとも５個のペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号１６５６又は配列番号１６５６～１７５５からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、ガイドＲＮＡ構造は、配列番号５４７４又は配列番号５５１０に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号５５２５を含むＰＡＭに結合するように構成される。いくつかの実施形態では、（ａ）エンドヌクレアーゼは、配列番号３４７５に対して少なくとも７０％、８０％、又は９０％同一である配列を含み、（ｂ）ガイドＲＮＡ構造は、配列番号５４７４又は配列番号５５１０に対して少なくとも７０％、８０％、又は９０％同一である配列を含み、（ｃ）エンドヌクレアーゼは、配列番号５５２５を含むＰＡＭへと結合するように構成される。

いくつかの実施形態では、エンドヌクレアーゼは、配列番号３５６９又は配列番号３５６９～３６３７からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号５３９０又は配列番号５３９０～５４６０からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号５７００～５７１７からなる群から選択される、少なくとも１個、少なくとも２個、少なくとも３個、少なくとも４個、又は少なくとも５個のペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号１７５６又は配列番号１７５６～１８２６からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、ガイドＲＮＡ構造は、配列番号５４７５又は配列番号５５１１に対して、少なくとも７０％、８０％、又は９０％同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号５５２６を含むＰＡＭに結合するように構成される。いくつかの実施形態では、（ａ）エンドヌクレアーゼは、配列番号３５６９に対して少なくとも７０％、８０％、又は９０％同一である配列を含み、（ｂ）ガイドＲＮＡ構造は、配列番号５４７５又は配列番号５５１１に対して少なくとも７０％、８０％、又は９０％同一である配列を含み、（ｃ）エンドヌクレアーゼは、配列番号５５２６を含むＰＡＭへと結合するように構成される。いくつかの実施形態では、配列同一性は、Ｓｍｉｔｈ－Ｗａｔｅｒｍａｎ相同性検索アルゴリズムのパラメータを用いて、ＢＬＡＳＴＰ、ＣＬＵＳＴＡＬＷ、ＭＵＳＣＬＥ、ＭＡＦＦＴ、又はＣＬＵＳＴＡＬＷによって決定される。いくつかの実施形態では、配列同一性は、３のワード長（Ｗ）、１０の期待値（Ｅ）のパラメータ、及び１１の存在、１の拡張でのＢＬＯＳＵＭ６２スコアリングマトリックス設定ギャップコストを用いて、及び条件付き組成スコアマトリックス調整を用いて、ＢＬＡＳＴＰ相同性検索アルゴリズムによって決定される。

いくつかの態様では、本開示は、操作されたガイドリボ核酸ポリヌクレオチドであって、（ａ）標的ＤＮＡ分子中の標的配列に相補的であるヌクレオチド配列を含む、ＤＮＡ標的化セグメント、及び（ｂ）ハイブリダイズして二本鎖ＲＮＡ（ｄｓＲＮＡ）二重鎖を形成するヌクレオチドの２つの相補的ストレッチを含む、タンパク質結合セグメントを含み、ここで、ヌクレオチドの２つの相補的ストレッチは、介在するヌクレオチドを用いて互いに共有結合しており、操作されたガイドリボ核酸ポリヌクレオチドは、配列番号１８２７～３６３７のいずれか１つに対して、少なくとも７０％、少なくとも７５％、少なくとも８０％、少なくとも８５％、少なくとも８８％、少なくとも９０％、少なくとも９２％、少なくとも９５％、若しくは少なくとも９８％の配列同一性を有する配列を有するＲｕｖＣ＿ＩＩＩドメインを含むエンドヌクレアーゼと複合体を形成するか、又は複合体を標的ＤＮＡ分子の標的配列へと標的化するように構成される、操作されたガイドリボ核酸ポリヌクレオチドを提供する。いくつかの実施形態では、ＤＮＡ標的化セグメントは、ヌクレオチドの２つの相補的ストレッチの両方の５’に位置する。

いくつかの実施形態では、（ａ）タンパク質結合セグメントは、配列番号５４７６～５４７９若しくは配列番号５４７６～５４８９からなる群から選択される配列に対して、少なくとも７０％、少なくとも７５％、少なくとも８０％、少なくとも８５％、少なくとも８８％、少なくとも９０％、少なくとも９２％、少なくとも９５％、若しくは少なくとも９８％の同一性を有する配列を含み、（ｂ）タンパク質結合セグメントは、（配列番号５４９０～５４９１若しくは配列番号５４９０～５４９４）及び配列番号５５３８からなる群から選択される配列に対して、少なくとも７０％、少なくとも８０％、若しくは少なくとも９０％の同一性を有する配列を含む、（ｃ）タンパク質結合セグメントは、配列番号５４９８～５４９９からなる群から選択される配列に対して、少なくとも７０％、少なくとも８０％、若しくは少なくとも９０％の同一性を有する配列を含み、（ｄ）タンパク質結合セグメントは、配列番号５４９５～５４９７及び配列番号５５００～５５０２からなる群から選択される配列に対して、少なくとも７０％、少なくとも８０％、若しくは少なくとも９０％の同一性を有する配列を含み、（ｅ）タンパク質結合セグメントは、配列番号５５０３に対して、少なくとも７０％、少なくとも８０％、若しくは少なくとも９０％の同一性を有する配列を含み、（ｆ）タンパク質結合セグメントは、配列番号５５０４に対して、少なくとも７０％、少なくとも８０％、若しくは少なくとも９０％の同一性を有する配列を含み、（ｇ）タンパク質結合セグメントは、配列番号５５０５に対して、少なくとも７０％、少なくとも８０％、若しくは少なくとも９０％の同一性を有する配列を含み、（ｈ）タンパク質結合セグメントは、配列番号５５０６に対して、少なくとも７０％、少なくとも８０％、若しくは少なくとも９０％の同一性を有する配列を含み、（ｉ）タンパク質結合セグメントは、配列番号５５０７に対して、少なくとも７０％、少なくとも８０％、若しくは少なくとも９０％の同一性を有する配列を含み、（ｊ）タンパク質結合セグメントは、配列番号５５０８に対して、少なくとも７０％、少なくとも８０％、若しくは少なくとも９０％の同一性を有する配列を含み、（ｋ）タンパク質結合セグメントは、配列番号５５０９に対して、少なくとも７０％、少なくとも８０％、若しくは少なくとも９０％の同一性を有する配列を含み、（ｌ）タンパク質結合セグメントは、配列番号５５１０に対して、少なくとも７０％、少なくとも８０％、若しくは少なくとも９０％の同一性を有する配列を含み、又は（ｍ）タンパク質結合セグメントは、配列番号５５１１に対して、少なくとも７０％、少なくとも８０％、若しくは少なくとも９０％の同一性を有する配列を含む。

いくつかの実施形態では、（ａ）ガイドリボ核酸ポリヌクレオチドは、ステム及びループを含むヘアピンを含むＲＮＡ配列を含み、ここで、ステムは、少なくとも１０、少なくとも１２、若しくは少なくとも１４塩基対のリボヌクレオチド、及びループの４塩基対以内の非対称バルジを含み、（ｂ）ガイドリボ核酸ポリヌクレオチドは、少なくとも８、少なくとも１０、若しくは少なくとも１２塩基対のリボヌクレオチドを含むヘアピンを含むと予測される、ｔｒａｃｒリボ核酸配列を含み、（ｃ）ガイドリボ核酸ポリヌクレオチドは、ガイドリボ核酸配列の少なくとも８個のヌクレオチド及びｔｒａｃｒリボ核酸配列の少なくとも８個のヌクレオチドを含む中断されていない塩基対領域を有するヘアピンを含むと予測されるガイドリボ核酸配列を含み、ここで、ｔｒａｃｒリボ核酸配列は、５’から３’に向かって、第１のヘアピン及び第２のヘアピンを含み、第１のヘアピンは、第２のヘアピンよりも長いステムを有し、又は（ｄ）ガイドリボ核酸ポリヌクレオチドは、５塩基対未満のリボヌクレオチドを含む少なくとも２つのヘアピンを含むと予測される、ｔｒａｃｒリボ核酸配列を含む。

いくつかの態様では、本開示は、本明細書中に記載される操作されたガイドリボ核酸ポリヌクレオチドのいずれかをコードする、デオキシリボ核酸ポリヌクレオチドを提供する。

いくつかの態様では、本開示は、生物における発現のために最適化された操作核酸配列を含む核酸であって、核酸は、ＲｕｖＣ＿ＩＩＩドメイン及びＨＮＨドメインを含むクラス２タイプＩＩＣａｓエンドヌクレアーゼをコードし、エンドヌクレアーゼは、未培養微生物に由来する、核酸を提供する。

いくつかの態様では、本開示は、生物における発現のために最適化された操作核酸配列を含む核酸であって、当該核酸が、配列番号１８２７～３６３７のいずれか１つに対して少なくとも７０％の配列同一性を有するＲｕｖＣ＿ＩＩＩドメインを含むエンドヌクレアーゼをコードする、核酸を提供する。いくつかの実施形態では、エンドヌクレアーゼは、配列番号３６３８～５４６０のいずれか１つに対して少なくとも７０％又は少なくとも８０％の配列同一性を有するＨＮＨドメインを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号５５７２～５５９１、又はこれに対して少なくとも７０％の配列同一性を有するそのバリアントを含む。いくつかの実施形態では、エンドヌクレアーゼは、エンドヌクレアーゼのＮ末端又はＣ末端に近接した１つ以上の核局在化配列（ＮＬＳ）をコードする配列を含む。いくつかの実施形態では、ＮＬＳは、配列番号５５９７～５６１２から選択される配列を含む。

いくつかの実施形態では、生物は、原核生物、細菌、真核生物、真菌、植物、哺乳動物、げっ歯類、又はヒトである。いくつかの実施形態では、生物は、大腸菌（Ｅ．ｃｏｌｉ）であり、（ａ）核酸配列は、配列番号５５７２～５５７５からなる群から選択される配列に対して、少なくとも７０％、８０％、若しくは９０％の同一性を有し、（ｂ）核酸配列は、配列番号５５７６～５５７７からなる群から選択される配列に対して、少なくとも７０％、８０％若しくは９０％の同一性を有し、（ｃ）核酸配列は、配列番号５５７８～５５８０からなる群から選択される配列に対して、少なくとも７０％、８０％、若しくは９０％の同一性を有し、（ｄ）核酸配列は、配列番号５５８１に対して、少なくとも７０％、８０％、若しくは９０％の同一性を有し、（ｅ）核酸配列は、配列番号５５８２に対して、少なくとも７０％、８０％、若しくは９０％の同一性を有し、（ｆ）核酸配列は、配列番号５５８３に対して、少なくとも７０％、８０％、若しくは９０％の同一性を有し、（ｇ）核酸配列は、配列番号５５８４に対して、少なくとも７０％、８０％、若しくは９０％の同一性を有し、（ｈ）核酸配列は、配列番号５５８５に対して、少なくとも７０％、８０％、若しくは９０％の同一性を有し、（ｉ）核酸配列は、配列番号５５８６に対して、少なくとも７０％、８０％、若しくは９０％の同一性を有し、又は（ｊ）核酸配列は、配列番号５５８７に対して、少なくとも７０％、８０％、若しくは９０％の同一性を有する。いくつかの実施形態では、生物は、ヒトであり、（ａ）核酸配列は、配列番号５５８８若しくは配列番号５５８９に対して、少なくとも７０％、８０％、若しくは９０％の同一性を有し、又は（ｂ）核酸配列は、配列番号５５９０若しくは配列番号５５９１に対して、少なくとも７０％、８０％、若しくは９０％の同一性を有する。

いくつかの態様では、本開示は、ＲｕｖＣ＿ＩＩＩドメイン及びＨＮＨドメインを含むクラス２タイプＩＩＣａｓエンドヌクレアーゼをコードする核酸配列を含むベクターであって、エンドヌクレアーゼが、未培養微生物に由来する、ベクターを提供する。

いくつかの態様では、本開示は、本明細書に記載の核酸のいずれかを含むベクターを提供する。いくつかの実施形態では、ベクターは、（ａ）標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列、及び（ｂ）エンドヌクレアーゼに結合するように構成されたｔｒａｃｒリボ核酸配列を含むエンドヌクレアーゼと複合体を形成するように構成された、操作されたガイドリボ核酸構造をコードする核酸を更に含む。いくつかの実施形態では、ベクターは、プラスミド、ミニサークル、ＣＥＬｉＤ、アデノ随伴ウイルス（ａｄｅｎｏ－ａｓｓｏｃｉａｔｅｄｖｉｒｕｓ：ＡＡＶ）由来ビリオン、又はレンチウイルスである。

いくつかの態様では、本開示は、本明細書に記載のベクターのいずれかを含む細胞を提供する。

いくつかの態様では、本開示は、本明細書に記載の細胞のいずれかを培養することを含む、エンドヌクレアーゼを製造する方法を提供する。

いくつかの態様では、本開示は、二本鎖デオキシリボ核酸ポリヌクレオチドを結合、切断、マーキング、又は修飾するための方法であって、（ａ）二本鎖デオキシリボ核酸ポリヌクレオチドを、クラス２タイプＩＩＣａｓエンドヌクレアーゼと、エンドヌクレアーゼ及び二本鎖デオキシリボ核酸ポリヌクレオチドへと結合するように構成された操作されたガイドリボ核酸構造との複合体において接触させることを含み、（ｂ）二本鎖デオキシリボ核酸ポリヌクレオチドは、プロトスペーサー隣接モチーフ（ＰＡＭ）を含み、（ｃ）ＰＡＭは、配列番号５５１２～５５２６又は配列番号５５２７～５５３７からなる群から選択される配列を含む、方法を提供する。いくつかの実施形態では、二本鎖デオキシリボ核酸ポリヌクレオチドは、操作されたガイドリボ核酸構造の配列に相補的な配列を含む第１の鎖及びＰＡＭを含む第２の鎖を含む。いくつかの実施形態では、ＰＡＭは、操作されたガイドリボ核酸構造の配列に相補的な配列の３’末端に直接隣接している。

いくつかの実施形態では、クラス２タイプＩＩＣａｓエンドヌクレアーゼは、Ｃａｓ９エンドヌクレアーゼ、Ｃａｓ１４エンドヌクレアーゼ、Ｃａｓ１２ａエンドヌクレアーゼ、Ｃａｓ１２ｂエンドヌクレアーゼ、Ｃａｓ１２ｃエンドヌクレアーゼ、Ｃａｓ１２ｄエンドヌクレアーゼ、Ｃａｓ１２ｅエンドヌクレアーゼ、Ｃａｓ１３ａエンドヌクレアーゼ、Ｃａｓ１３ｂエンドヌクレアーゼ、Ｃａｓ１３ｃエンドヌクレアーゼ、又はＣａｓ１３ｄエンドヌクレアーゼではない。いくつかの実施形態では、クラス２タイプＩＩＣａｓエンドヌクレアーゼは、未培養微生物に由来する。いくつかの実施形態では、二本鎖デオキシリボ核酸ポリヌクレオチドは、真核生物、植物、真菌、哺乳動物、げっ歯類、又はヒトの二本鎖デオキシリボ核酸ポリヌクレオチドである。

いくつかの実施形態では、（ａ）ＰＡＭは、配列番号５５１２～５５１５及び配列番号５５２７～５５３０からなる群から選択される配列を含み、（ｂ）ＰＡＭは、配列番号５５１６又は配列番号５５３１を含み、（ｃ）ＰＡＭは、配列番号５５３９を含み、（ｄ）ＰＡＭは、配列番号５５１７又は配列番号５５１８を含み、（ｅ）ＰＡＭは、配列番号５５１９を含み、（ｆ）ＰＡＭは、配列番号５５２０又は配列番号５５３５を含み、（ｇ）ＰＡＭは、配列番号５５２１又は配列番号５５３６を含み、（ｈ）ＰＡＭは、配列番号５５２２を含み、（ｉ）ＰＡＭは、配列番号５５２３又は配列番号５５３７を含み、（ｊ）ＰＡＭは、配列番号５５２４を含み、（ｋ）ＰＡＭは、配列番号５５２５を含み、又は（ｌ）ＰＡＭは、配列番号５５２６を含む。

いくつかの態様では、本開示は、標的核酸遺伝子座を修飾する方法であって、当該方法が、標的核酸遺伝子座へと、本明細書に記載の操作されたヌクレアーゼシステムのいずれかを送達することを含み、ここで、エンドヌクレアーゼが、操作されたガイドリボ核酸構造と複合体を形成するように構成され、複合体が、複合体が標的核酸遺伝子座へと結合する際に複合体が標的核酸遺伝子座を修飾するように構成される、方法を提供する。いくつかの実施形態では、標的核酸遺伝子座を修飾することは、標的核酸遺伝子座を結合、ニック形成、切断、又はマーキングすることを含む。いくつかの実施形態では、標的核酸遺伝子座は、デオキシリボ核酸（ＤＮＡ）又はリボ核酸（ＲＮＡ）を含む。いくつかの実施形態では、標的核酸は、ゲノムＤＮＡ、ウイルスＤＮＡ、ウイルスＲＮＡ、又は細菌ＤＮＡを含む。いくつかの実施形態では、標的核酸遺伝子座は、インビトロである。いくつかの実施形態では、標的核酸遺伝子座は、細胞内にある。いくつかの実施形態では、細胞は、原核細胞、細菌細胞、真核細胞、真菌細胞、植物細胞、動物細胞、哺乳動物細胞、げっ歯類細胞、霊長類細胞、又はヒト細胞である。

いくつかの実施形態では、操作されたヌクレアーゼシステムを標的核酸遺伝子座へと送達することは、本明細書に記載の核酸のいずれか又は本明細書に記載のベクターのいずれかを送達することを含む。いくつかの実施形態では、操作されたヌクレアーゼシステムを標的核酸遺伝子座へと送達することは、エンドヌクレアーゼをコードするオープンリーディングフレームを含む核酸を送達することを含む。いくつかの実施形態では、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。いくつかの実施形態では、標的核酸遺伝子座に対する操作されたヌクレアーゼシステムは、エンドヌクレアーゼをコードするオープンリーディングフレームを含有するキャップｍＲＮＡを送達することを含む。いくつかの実施形態では、標的核酸遺伝子座に対する操作されたヌクレアーゼシステムは、翻訳されたポリペプチドを送達することを含む。いくつかの実施形態では、標的核酸遺伝子座に対する操作されたヌクレアーゼシステムは、リボ核酸（ＲＮＡ）ｐｏｌＩＩＩプロモーターへと動作可能に連結された操作されたガイドリボ核酸構造をコードするデオキシリボ核酸（ＤＮＡ）を送達することを含む。いくつかの実施形態では、エンドヌクレアーゼは、標的遺伝子座で、又は標的遺伝子座に近接して、一本鎖切断又は二本鎖切断を誘導する。

いくつかの態様では、本開示は、操作されたヌクレアーゼシステムであって、（ａ）配列番号５７１８～５８４６又は配列番号６２５７のいずれか１つに対して少なくとも７５％の配列同一性を有する配列を含むエンドヌクレアーゼ、並びに（ｂ）当該エンドヌクレアーゼと複合体を形成するように構成された操作されたガイドリボ核酸構造であって、（ｉ）標的デオキシリボ核酸配列にハイブリダイズするように構成されたリボ核酸配列、及び（ｉｉ）当該エンドヌクレアーゼに結合するように構成されたリボ核酸配列を含む、操作されたガイドリボ核酸構造を含む、操作されたヌクレアーゼシステムを提供する。いくつかの態様では、本開示は、操作されたヌクレアーゼシステムであって、（ａ）配列番号５８４７～５８６１又は６２５８～６２７８を含むプロトスペーサー隣接モチーフ（ＰＡＭ）配列に結合するように構成されたエンドヌクレアーゼであって、当該エンドヌクレアーゼがクラス２タイプＩＩＣａｓエンドヌクレアーゼである、エンドヌクレアーゼ、並びに（ｂ）当該エンドヌクレアーゼと複合体を形成するように構成された操作されたガイドリボ核酸構造であって、（ｉ）標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列、及び（ｉｉ）当該エンドヌクレアーゼに結合するように構成されたリボ核酸配列を含む、操作されたガイドリボ核酸構造を含む、操作されたヌクレアーゼシステムを提供する。いくつかの実施形態では、当該エンドヌクレアーゼは、未培養微生物に由来する。いくつかの実施形態では、当該エンドヌクレアーゼは、異なるＰＡＭ配列へと結合するようには操作されていない。いくつかの実施形態では、当該エンドヌクレアーゼは、Ｃａｓ９エンドヌクレアーゼ、Ｃａｓ１４エンドヌクレアーゼ、Ｃａｓ１２ａエンドヌクレアーゼ、Ｃａｓ１２ｂエンドヌクレアーゼ、Ｃａｓ１２ｃエンドヌクレアーゼ、Ｃａｓ１２ｄエンドヌクレアーゼ、Ｃａｓ１２ｅエンドヌクレアーゼ、Ｃａｓ１３ａエンドヌクレアーゼ、Ｃａｓ１３ｂエンドヌクレアーゼ、Ｃａｓ１３ｃエンドヌクレアーゼ、又はＣａｓ１３ｄエンドヌクレアーゼではない。いくつかの実施形態では、当該エンドヌクレアーゼは、Ｃａｓ９エンドヌクレアーゼに対して８０％未満の同一性を有する。いくつかの実施形態では、当該リボ核酸配列は、（ａ）配列番号５８８６～５８８７、５８９１、５８９３、若しくは５８９４のいずれか１つ、又は（ｂ）配列番号５８６２～５８８５、５８８８～５８９０、５８９２、５８９５～５８９６、若しくは６２７９～６３０１のいずれか１つの非縮重ヌクレオチドに対して少なくとも８０％の配列同一性を有する配列を含む。いくつかの態様では、本開示は、操作されたヌクレアーゼシステムであって、（ａ）操作されたガイドリボ核酸構造であって、（ｉ）標的デオキシリボ核酸配列にハイブリダイズするように構成されたリボ核酸配列、及び（ｉｉ）エンドヌクレアーゼに結合するように構成されたリボ核酸配列を含み、ここで、当該リボ核酸配列が、（ａ）配列番号５８８６～５８８７、５８９１、５８９３、若しくは５８９４のいずれか１つ、又は（ｂ）配列番号５８６２～５８８５、５８８８～５８９０、５８９２、５８９５～５８９６又は６２７９～６３０１のいずれか１つの非縮重ヌクレオチドに対して少なくとも８０％の配列同一性を有する配列を含む、操作されたガイドリボ核酸構造、及び当該操作されたガイドリボ核酸に結合するように構成されたクラス２タイプＩＩＣａｓエンドヌクレアーゼを含む、操作されたヌクレアーゼシステムを提供する。いくつかの実施形態では、エンドヌクレアーゼは、配列番号５８４７～５８６１又は配列番号６２５８～６２７８を含む群から選択されるプロトスペーサー隣接モチーフ（ＰＡＭ）配列に結合するように構成されている。いくつかの実施形態では、当該ガイドリボ核酸配列は、１５～２４ヌクレオチド長又は１９～２４ヌクレオチド長である。いくつかの実施形態では、当該エンドヌクレアーゼは、当該エンドヌクレアーゼのＮ末端又はＣ末端に近接した１つ以上の核局在化配列（ＮＬＳ）を含む。いくつかの実施形態では、当該ＮＬＳは、配列番号５５９７～５６１２から選択される配列を含む。いくつかの実施形態では、システムは、５’から３’の順で、当該標的デオキシリボ核酸配列に対して５’である少なくとも２０ヌクレオチドの配列を含む第１のホモロジーアーム、少なくとも１０ヌクレオチドの合成ＤＮＡ配列、及び当該標的配列に対して３’である少なくとも２０ヌクレオチドの配列を含む第２のホモロジーアームを含む、一本鎖又は二本鎖ＤＮＡ修復鋳型を更に含む。いくつかの実施形態では、当該第１のホモロジーアーム又は第２のホモロジーアームは、少なくとも４０、８０、１２０、１５０、２００、３００、５００、又は１，０００ヌクレオチドの配列を含む。いくつかの実施形態では、当該配列同一性は、Ｓｍｉｔｈ－Ｗａｔｅｒｍａｎ相同性検索アルゴリズムのパラメータを用いて、ＢＬＡＳＴＰ、ＣＬＵＳＴＡＬＷ、ＭＵＳＣＬＥ、ＭＡＦＦＴ、又はＣＬＵＳＴＡＬＷによって決定される。いくつかの実施形態では、当該配列同一性は、３のワード長（Ｗ）、１０の期待値（Ｅ）のパラメータ、及び１１の存在、１の拡張におけるＢＬＯＳＵＭ６２スコアリングマトリックス設定ギャップコストを用いて、及び条件付き組成スコアマトリックス調整を用いて、当該ＢＬＡＳＴＰ相同性検索アルゴリズムによって決定される。

いくつかの態様では、本開示は、操作されたガイドリボ核酸ポリヌクレオチドであって、（ａ）標的ＤＮＡ分子中の標的配列に相補的であるヌクレオチド配列を含む、ＤＮＡ標的化セグメント、及び（ｂ）ハイブリダイズして二本鎖ＲＮＡ（ｄｓＲＮＡ）二重鎖を形成するヌクレオチドの２つの相補的ストレッチを含む、タンパク質結合セグメントを含み、ここで、当該ヌクレオチドの２つの相補的ストレッチは、介在するヌクレオチドを用いて互いに共有結合しており、当該操作されたガイドリボ核酸ポリヌクレオチドは、配列番号５７１８～５８４６又は配列番号６２５７のいずれか１つに対して少なくとも７５％の配列同一性を有する配列を含むエンドヌクレアーゼと複合体を形成し、かつ当該複合体を当該標的ＤＮＡ分子の当該標的配列へと標的化するように構成される、操作されたガイドリボ核酸ポリヌクレオチドを提供する。いくつかの実施形態では、当該ＤＮＡ標的化セグメントは、当該ヌクレオチドの２つの相補的ストレッチの両方の５’に位置する。

いくつかの態様では、本開示は、生物における発現のために最適化された操作核酸配列を含む核酸であって、当該核酸が、配列番号５７１８～５８４６又は配列番号６２５７のいずれか１つに対して少なくとも７５％の配列同一性を有する配列を含むエンドヌクレアーゼをコードする、核酸を提供する。いくつかの実施形態では、当該エンドヌクレアーゼは、当該エンドヌクレアーゼのＮ末端又はＣ末端に近接した１つ以上の核局在化配列（ＮＬＳ）をコードする配列を含む。いくつかの実施形態では、当該ＮＬＳは、配列番号５５９７～５６１２から選択される配列を含む。いくつかの実施形態では、当該生物は、原核生物、細菌、真核生物、真菌、植物、哺乳動物、げっ歯類、又はヒトである。

いくつかの態様では、本開示は、本明細書に記載の核酸のいずれかを含むベクターを提供する。いくつかの実施形態では、ベクターは、（ａ）標的デオキシリボ核酸配列にハイブリダイズするように構成されたリボ核酸配列、及び（ｂ）当該エンドヌクレアーゼに結合するように構成されたリボ核酸配列を含む、当該エンドヌクレアーゼと複合体を形成するように構成された操作されたガイドリボ核酸構造をコードする核酸を更に含む。いくつかの実施形態では、ベクターは、プラスミド、ミニサークル、ＣＥＬｉＤ、アデノ随伴ウイルス（ａｄｅｎｏ－ａｓｓｏｃｉａｔｅｄｖｉｒｕｓ：ＡＡＶ）由来ビリオン、又はレンチウイルスである。

いくつかの態様では、本開示は、二本鎖デオキシリボ核酸ポリヌクレオチドを結合、切断、マーキング、又は修飾するための方法であって、当該二本鎖デオキシリボ核酸ポリヌクレオチドを、クラス２タイプＩＩＣａｓエンドヌクレアーゼと、当該エンドヌクレアーゼ及び当該二本鎖デオキシリボ核酸ポリヌクレオチドへと結合するように構成された操作されたガイドリボ核酸構造との複合体において接触させることを含み、ここで、当該二本鎖デオキシリボ核酸ポリヌクレオチドは、プロトスペーサー隣接モチーフ（ＰＡＭ）を含み、当該ＰＡＭは、配列番号５８４７～５８６１又は配列番号６２５８～６２７８からなる群から選択される配列を含む、方法を提供する。いくつかの実施形態では、当該二本鎖デオキシリボ核酸ポリヌクレオチドは、当該操作されたガイドリボ核酸構造の配列に相補的な配列を含む第１の鎖及び当該ＰＡＭを含む第２の鎖を含む。いくつかの実施形態では、当該ＰＡＭは、当該操作されたガイドリボ核酸構造の当該配列に相補的な当該配列の３’末端に直接隣接している。いくつかの実施形態では、当該クラス２タイプＩＩＣａｓエンドヌクレアーゼは、Ｃａｓ９エンドヌクレアーゼ、Ｃａｓ１４エンドヌクレアーゼ、Ｃａｓ１２ａエンドヌクレアーゼ、Ｃａｓ１２ｂエンドヌクレアーゼ、Ｃａｓ１２ｃエンドヌクレアーゼ、Ｃａｓ１２ｄエンドヌクレアーゼ、Ｃａｓ１２ｅエンドヌクレアーゼ、Ｃａｓ１３ａエンドヌクレアーゼ、Ｃａｓ１３ｂエンドヌクレアーゼ、Ｃａｓ１３ｃエンドヌクレアーゼ、又はＣａｓ１３ｄエンドヌクレアーゼではない。いくつかの実施形態では、当該二本鎖デオキシリボ核酸ポリヌクレオチドは、真核生物、植物、真菌、哺乳動物、げっ歯類、又はヒトの二本鎖デオキシリボ核酸ポリヌクレオチドである。

いくつかの態様では、本開示は、標的核酸遺伝子座を修飾する方法であって、当該方法が、当該標的核酸遺伝子座へと、本明細書に記載の操作されたヌクレアーゼシステムのいずれかを送達することを含み、ここで、当該エンドヌクレアーゼが、当該操作されたガイドリボ核酸構造と複合体を形成するように構成され、当該複合体が、当該複合体が標的核酸遺伝子座へと結合する際に当該複合体が当該標的核酸遺伝子座を修飾するように構成される、方法を提供する。いくつかの実施形態では、当該標的核酸遺伝子座は、当該標的核酸遺伝子座を結合、ニック形成、切断、又はマーキングすることを含む。いくつかの実施形態では、当該標的核酸遺伝子座は、デオキシリボ核酸（ＤＮＡ）又はリボ核酸（ＲＮＡ）を含む。いくつかの実施形態では、当該標的核酸は、ゲノムＤＮＡ、ウイルスＤＮＡ、ウイルスＲＮＡ、又は細菌ＤＮＡを含む。いくつかの実施形態では、当該標的核酸遺伝子座は、インビトロである。いくつかの実施形態では、当該標的核酸遺伝子座は、細胞内にある。いくつかの実施形態では、当該細胞は、原核細胞、細菌細胞、真核細胞、真菌細胞、植物細胞、動物細胞、哺乳動物細胞、げっ歯類細胞、霊長類細胞、又はヒト細胞である。いくつかの実施形態では、当該標的核酸遺伝子座に対する当該操作されたヌクレアーゼシステムは、本明細書に記載の核酸のいずれか又は本明細書に記載のベクターのいずれかを送達することを含む。いくつかの実施形態では、当該操作されたヌクレアーゼシステムを当該標的核酸遺伝子座へと送達することは、当該エンドヌクレアーゼをコードするオープンリーディングフレームを含む核酸を送達することを含む。いくつかの実施形態では、当該核酸は、当該エンドヌクレアーゼをコードする当該オープンリーディングフレームが動作可能に連結されたプロモーターを含む。いくつかの実施形態では、当該操作されたヌクレアーゼシステムを当該標的核酸遺伝子座へと送達することは、当該エンドヌクレアーゼをコードする当該オープンリーディングフレームを含有するキャップｍＲＮＡを送達することを含む。いくつかの実施形態では、当該操作されたヌクレアーゼシステムを当該標的核酸遺伝子座へと送達することが、翻訳されたポリペプチドを送達することを含む。いくつかの実施形態では、当該操作されたヌクレアーゼシステムを当該標的核酸遺伝子座へと送達することは、リボ核酸（ＲＮＡ）ｐｏｌＩＩＩプロモーターへと動作可能に連結された当該操作されたガイドリボ核酸構造をコードするデオキシリボ核酸（ＤＮＡ）を送達することを含む。いくつかの実施形態では、当該エンドヌクレアーゼは、標的遺伝子座で、又は当該標的遺伝子座に近接して、一本鎖切断又は二本鎖切断を誘導する。

いくつかの態様では、本開示は、細胞内のＴＲＡＣ遺伝子座を編集する方法であって、当該細胞を、（ａ）ＲＮＡガイドエンドヌクレアーゼ及び（ｂ）操作されたガイドＲＮＡと接触させることを含み、ここで、当該操作されたガイドＲＮＡは、当該エンドヌクレアーゼと複合体を形成するように構成され、当該操作されたガイドＲＮＡは、当該ＴＲＡＣ遺伝子座の領域にハイブリダイズするように構成されたスペーサー配列を含み、当該操作されたガイドＲＮＡは、配列番号５９５０～５９５８又は配列番号５９５９～５９６５のいずれか１つの、少なくとも１９、少なくとも２０、少なくとも２１、少なくとも２２、少なくとも２３、又は少なくとも２４ヌクレオチドの連続するヌクレオチドに対して、少なくとも８０％の同一性、少なくとも８２％の同一性、少なくとも８４％の同一性、少なくとも８６％の同一性、少なくとも８８％の同一性、少なくとも９０％の同一性、少なくとも９１％の同一性、少なくとも９２％の同一性、少なくとも９３％の同一性、少なくとも９４％の同一性、少なくとも９５％の同一性、少なくとも９６％の同一性、少なくとも９７％の同一性、少なくとも９８％の同一性、少なくとも９９％の同一性、又は少なくとも１００％の同一性を有する標的配列を含む、方法を提供する。いくつかの実施形態では、当該ＲＮＡガイドエンドヌクレアーゼは、クラスＩＩタイプＩＩＣａｓエンドヌクレアーゼである。いくつかの実施形態では、当該ＲＮＡガイドエンドヌクレアーゼは、配列番号２２４２又は配列番号２２４４に対して、少なくとも７５％の同一性、少なくとも８０％の同一性、少なくとも８２％の同一性、少なくとも８４％の同一性、少なくとも８６％の同一性、少なくとも８８％の同一性、少なくとも９０％の同一性、少なくとも９１％の同一性、少なくとも９２％の同一性、少なくとも９３％の同一性、少なくとも９４％の同一性、少なくとも９５％の同一性、少なくとも９６％の同一性、少なくとも９７％の同一性、少なくとも９８％の同一性、少なくとも９９％の同一性、又は少なくとも１００％の同一性を有する配列を含むＲｕｖＣＩＩＩドメインを含む。いくつかの実施形態では、当該ＲＮＡガイドエンドヌクレアーゼは、ＨＮＨドメインを更に含む。いくつかの実施形態では、当該ＲＮＡガイドエンドヌクレアーゼは、配列番号４２１又は配列番号４２３に対して、少なくとも７５％の同一性、少なくとも８０％の同一性、少なくとも８２％の同一性、少なくとも８４％の同一性、少なくとも８６％の同一性、少なくとも８８％の同一性、少なくとも９０％の同一性、少なくとも９１％の同一性、少なくとも９２％の同一性、少なくとも９３％の同一性、少なくとも９４％の同一性、少なくとも９５％の同一性、少なくとも９６％の同一性、少なくとも９７％の同一性、少なくとも９８％の同一性、少なくとも９９％の同一性、又は少なくとも１００％の同一性を有する配列を含む。いくつかの実施形態では、当該操作されたガイドＲＮＡは、配列番号５９５０～５９５８のいずれか１つの少なくとも１８個の連続するヌクレオチドに対して少なくとも８５％の同一性を有する標的配列を含み、当該エンドヌクレアーゼは、配列番号４２１に対して少なくとも７５％の同一性を有する配列を含む。いくつかの実施形態では、当該操作されたガイドＲＮＡは、配列番号５９５９～５９６５のいずれか１つの少なくとも１８個の連続するヌクレオチドに対して少なくとも８５％の同一性を有する標的配列を含み、当該エンドヌクレアーゼは、配列番号４２３に対して少なくとも７５％の同一性を有する配列を含む。いくつかの実施形態では、当該操作されたガイドＲＮＡは、配列番号５９５３～５９５７のいずれか１つの少なくとも１８個の連続するヌクレオチドに対して、少なくとも８５％の同一性を有する標的配列を含む。いくつかの実施形態では、当該操作されたガイドＲＮＡは、配列番号５９６０～５９６１又は配列番号５９６３～５９６４のいずれか１つの少なくとも１８個の連続するヌクレオチドに対して、少なくとも８５％の同一性を有する標的配列を含む。

いくつかの態様では、本開示は、細胞内のＴＲＢＣ遺伝子座を編集する方法であって、当該細胞を、（ａ）ＲＮＡガイドエンドヌクレアーゼ及び（ｂ）操作されたガイドＲＮＡと接触させることを含み、ここで、当該操作されたガイドＲＮＡは、当該エンドヌクレアーゼと複合体を形成するように構成され、当該操作されたガイドＲＮＡは、当該ＴＲＢＣ遺伝子座の領域にハイブリダイズするように構成されたスペーサー配列を含み、当該操作されたガイドＲＮＡは、配列番号５９６６～６００４又は配列番号６００５～６０２５のいずれか１つの、少なくとも１９、少なくとも２０、少なくとも２１、少なくとも２２、少なくとも２３、又は少なくとも２４ヌクレオチドの連続するヌクレオチドに対して、少なくとも８０％の同一性、少なくとも８２％の同一性、少なくとも８４％の同一性、少なくとも８６％の同一性、少なくとも８８％の同一性、少なくとも９０％の同一性、少なくとも９１％の同一性、少なくとも９２％の同一性、少なくとも９３％の同一性、少なくとも９４％の同一性、少なくとも９５％の同一性、少なくとも９６％の同一性、少なくとも９７％の同一性、少なくとも９８％の同一性、少なくとも９９％の同一性、又は少なくとも１００％の同一性を有する標的配列を含む、方法を提供する。いくつかの実施形態では、当該ＲＮＡガイドエンドヌクレアーゼは、クラスＩＩタイプＩＩＣａｓエンドヌクレアーゼである。いくつかの実施形態では、当該ＲＮＡガイドエンドヌクレアーゼは、配列番号２２４２又は配列番号２２４４に対して、少なくとも７５％の同一性、少なくとも８０％の同一性、少なくとも８２％の同一性、少なくとも８４％の同一性、少なくとも８６％の同一性、少なくとも８８％の同一性、少なくとも９０％の同一性、少なくとも９１％の同一性、少なくとも９２％の同一性、少なくとも９３％の同一性、少なくとも９４％の同一性、少なくとも９５％の同一性、少なくとも９６％の同一性、少なくとも９７％の同一性、少なくとも９８％の同一性、少なくとも９９％の同一性、又は少なくとも１００％の同一性を有する配列を含むＲｕｖＣＩＩＩドメインを含む。いくつかの実施形態では、当該ＲＮＡガイドエンドヌクレアーゼは、ＨＮＨドメインを更に含む。いくつかの実施形態では、当該ＲＮＡガイドエンドヌクレアーゼは、配列番号４２１又は配列番号４２３に対して、少なくとも７５％の同一性、少なくとも８０％の同一性、少なくとも８２％の同一性、少なくとも８４％の同一性、少なくとも８６％の同一性、少なくとも８８％の同一性、少なくとも９０％の同一性、少なくとも９１％の同一性、少なくとも９２％の同一性、少なくとも９３％の同一性、少なくとも９４％の同一性、少なくとも９５％の同一性、少なくとも９６％の同一性、少なくとも９７％の同一性、少なくとも９８％の同一性、少なくとも９９％の同一性、又は少なくとも１００％の同一性を有する配列を含む。いくつかの実施形態では、当該操作されたガイドＲＮＡは、配列番号５９６６～６００４のいずれか１つの少なくとも１８個の連続するヌクレオチドに対して少なくとも８５％の同一性を有する標的配列を含み、当該エンドヌクレアーゼは、配列番号４２１に対して少なくとも７５％の同一性を有する配列を含む。いくつかの実施形態では、当該操作されたガイドＲＮＡは、配列番号６００５～６０２５のいずれか１つの少なくとも１８個の連続するヌクレオチドに対して少なくとも８５％の同一性を有する標的配列を含み、当該エンドヌクレアーゼは、配列番号４２３に対して少なくとも７５％の同一性を有する配列を含む。いくつかの実施形態では、当該操作されたガイドＲＮＡは、配列番号５９７０、５９７１、５９８３、又は５９８４のいずれか１つの少なくとも１８個の連続するヌクレオチドに対して、少なくとも８５％の同一性を有する標的配列を含む。いくつかの実施形態では、当該操作されたガイドＲＮＡは、配列番号６００６、６０１０、６０１１、又は６０１２のいずれか１つの少なくとも１８個の連続するヌクレオチドに対して、少なくとも８５％の同一性を有する標的配列を含む。

いくつかの態様では、本開示は、細胞内のＧＲ（ＮＲ３Ｃ１）遺伝子座を編集する方法であって、当該細胞を、（ａ）ＲＮＡガイドエンドヌクレアーゼ及び（ｂ）操作されたガイドＲＮＡと接触させることを含み、ここで、当該操作されたガイドＲＮＡは、当該エンドヌクレアーゼと複合体を形成するように構成され、当該操作されたガイドＲＮＡは、当該ＧＲ（ＮＲ３Ｃ１）遺伝子座の領域にハイブリダイズするように構成されたスペーサー配列を含み、当該操作されたガイドＲＮＡは、配列番号６０２６～６０９０又は配列番号６０９１～６１２１のいずれか１つの、少なくとも１９、少なくとも２０、少なくとも２１、少なくとも２２、少なくとも２３、又は少なくとも２４ヌクレオチドの連続するヌクレオチド連続するヌクレオチドに対して、少なくとも８０％の同一性、少なくとも８２％の同一性、少なくとも８４％の同一性、少なくとも８６％の同一性、少なくとも８８％の同一性、少なくとも９０％の同一性、少なくとも９１％の同一性、少なくとも９２％の同一性、少なくとも９３％の同一性、少なくとも９４％の同一性、少なくとも９５％の同一性、少なくとも９６％の同一性、少なくとも９７％の同一性、少なくとも９８％の同一性、少なくとも９９％の同一性、又は少なくとも１００％の同一性を有する標的配列を含む、方法を提供する。いくつかの実施形態では、当該ＲＮＡガイドエンドヌクレアーゼは、クラスＩＩタイプＩＩＣａｓエンドヌクレアーゼである。いくつかの実施形態では、当該ＲＮＡガイドエンドヌクレアーゼは、配列番号２２４２又は配列番号２２４４に対して、少なくとも７５％の同一性、少なくとも８０％の同一性、少なくとも８２％の同一性、少なくとも８４％の同一性、少なくとも８６％の同一性、少なくとも８８％の同一性、少なくとも９０％の同一性、少なくとも９１％の同一性、少なくとも９２％の同一性、少なくとも９３％の同一性、少なくとも９４％の同一性、少なくとも９５％の同一性、少なくとも９６％の同一性、少なくとも９７％の同一性、少なくとも９８％の同一性、少なくとも９９％の同一性、又は少なくとも１００％の同一性を有する配列を含むＲｕｖＣＩＩＩドメインを含む。いくつかの実施形態では、当該ＲＮＡガイドエンドヌクレアーゼは、ＨＮＨドメインを更に含む。いくつかの実施形態では、当該ＲＮＡガイドエンドヌクレアーゼは、配列番号４２１又は配列番号４２３に対して少なくとも７５％の同一性を有する配列を含む。いくつかの実施形態では、当該操作されたガイドＲＮＡは、配列番号６０２６～６０９０のいずれか１つの少なくとも１８個の連続するヌクレオチドに対して少なくとも８５％の同一性を有する標的配列を含み、当該エンドヌクレアーゼは、配列番号４２１に対して少なくとも７５％の同一性を有する配列を含む。いくつかの実施形態では、当該操作されたガイドＲＮＡは、配列番号６０９１～６１２１のいずれか１つの少なくとも１８個の連続するヌクレオチドに対して少なくとも８５％の同一性を有する標的配列を含み、当該エンドヌクレアーゼは、配列番号４２３に対して少なくとも７５％の同一性を有する配列を含む。いくつかの実施形態では、当該操作されたガイドＲＮＡは、配列番号６０２７～６０２８、６０２９、６０３８、６０４３、６０４９、６０７６、６０８０、６０８１、又は６０８６のいずれか１つの少なくとも１８個の連続するヌクレオチドに対して、少なくとも８５％の同一性を有する標的配列を含む。いくつかの実施形態では、当該操作されたガイドＲＮＡは、配列番号６０９２、６１１５、又は６１１９のいずれか１つの少なくとも１８個の連続するヌクレオチドに対して、少なくとも８５％の同一性を有する標的配列を含む。

いくつかの態様では、本開示は、細胞内のＡＡＶＳ１遺伝子座を編集する方法であって、当該細胞を、（ａ）ＲＮＡガイドエンドヌクレアーゼ及び（ｂ）操作されたガイドＲＮＡと接触させることを含み、ここで、当該操作されたガイドＲＮＡは、当該エンドヌクレアーゼと複合体を形成するように構成され、当該操作されたガイドＲＮＡは、当該ＡＡＶＳ１遺伝子座の領域にハイブリダイズするように構成されたスペーサー配列を含み、当該操作されたガイドＲＮＡは、配列番号６１２２～６１５２のいずれか１つの、少なくとも１９、少なくとも２０、少なくとも２１、少なくとも２２、少なくとも２３、又は少なくとも２４ヌクレオチドの連続するヌクレオチドに対して、少なくとも８０％の同一性、少なくとも８２％の同一性、少なくとも８４％の同一性、少なくとも８６％の同一性、少なくとも８８％の同一性、少なくとも９０％の同一性、少なくとも９１％の同一性、少なくとも９２％の同一性、少なくとも９３％の同一性、少なくとも９４％の同一性、少なくとも９５％の同一性、少なくとも９６％の同一性、少なくとも９７％の同一性、少なくとも９８％の同一性、少なくとも９９％の同一性、又は少なくとも１００％の同一性を有する標的配列を含む、方法を提供する。いくつかの実施形態では、当該ＲＮＡガイドエンドヌクレアーゼは、クラスＩＩタイプＩＩＣａｓエンドヌクレアーゼである。いくつかの実施形態では、当該ＲＮＡガイドエンドヌクレアーゼは、配列番号２２４２又は配列番号２２４４に対して、少なくとも７５％の同一性、少なくとも８０％の同一性、少なくとも８２％の同一性、少なくとも８４％の同一性、少なくとも８６％の同一性、少なくとも８８％の同一性、少なくとも９０％の同一性、少なくとも９１％の同一性、少なくとも９２％の同一性、少なくとも９３％の同一性、少なくとも９４％の同一性、少なくとも９５％の同一性、少なくとも９６％の同一性、少なくとも９７％の同一性、少なくとも９８％の同一性、少なくとも９９％の同一性、又は少なくとも１００％の同一性を有する配列を含むＲｕｖＣＩＩＩドメインを含む。いくつかの実施形態では、当該ＲＮＡガイドエンドヌクレアーゼは、ＨＮＨドメインを更に含む。いくつかの実施形態では、当該ＲＮＡガイドエンドヌクレアーゼは、配列番号４２１又は配列番号４２３に対して、少なくとも７５％の同一性、少なくとも８０％の同一性、少なくとも８２％の同一性、少なくとも８４％の同一性、少なくとも８６％の同一性、少なくとも８８％の同一性、少なくとも９０％の同一性、少なくとも９１％の同一性、少なくとも９２％の同一性、少なくとも９３％の同一性、少なくとも９４％の同一性、少なくとも９５％の同一性、少なくとも９６％の同一性、少なくとも９７％の同一性、少なくとも９８％の同一性、少なくとも９９％の同一性、又は少なくとも１００％の同一性を有する配列を含む。いくつかの実施形態では、当該操作されたガイドＲＮＡは、配列番号６１２２、６１２５～６１２６、６１２８、６１３１、６１３３、６１３６、６１４１、６１４３、又は６１４８のいずれか１つの少なくとも１８個の連続するヌクレオチドに対して、少なくとも８５％の同一性を有する標的配列を含む。

いくつかの態様では、本開示は、細胞内のＴＩＧＩＴ遺伝子座を編集する方法であって、当該細胞を、（ａ）ＲＮＡガイドエンドヌクレアーゼ及び（ｂ）操作されたガイドＲＮＡと接触させることを含み、ここで、当該操作されたガイドＲＮＡは、当該エンドヌクレアーゼと複合体を形成するように構成され、当該操作されたガイドＲＮＡは、当該ＴＩＧＩＴ遺伝子座の領域にハイブリダイズするように構成されたスペーサー配列を含み、当該操作されたガイドＲＮＡは、配列番号６１５３～６１８１のいずれか１つの、少なくとも１９、少なくとも２０、少なくとも２１、少なくとも２２、少なくとも２３、又は少なくとも２４ヌクレオチドの連続するヌクレオチドに対して、少なくとも８０％の同一性、少なくとも８２％の同一性、少なくとも８４％の同一性、少なくとも８６％の同一性、少なくとも８８％の同一性、少なくとも９０％の同一性、少なくとも９１％の同一性、少なくとも９２％の同一性、少なくとも９３％の同一性、少なくとも９４％の同一性、少なくとも９５％の同一性、少なくとも９６％の同一性、少なくとも９７％の同一性、少なくとも９８％の同一性、少なくとも９９％の同一性、又は少なくとも１００％の同一性を有する標的配列を含む、方法を提供する。いくつかの実施形態では、当該ＲＮＡガイドエンドヌクレアーゼは、クラスＩＩタイプＩＩＣａｓエンドヌクレアーゼである。いくつかの実施形態では、当該ＲＮＡガイドエンドヌクレアーゼは、配列番号４２１又は配列番号４２３に対して、少なくとも７５％の同一性、少なくとも８０％の同一性、少なくとも８２％の同一性、少なくとも８４％の同一性、少なくとも８６％の同一性、少なくとも８８％の同一性、少なくとも９０％の同一性、少なくとも９１％の同一性、少なくとも９２％の同一性、少なくとも９３％の同一性、少なくとも９４％の同一性、少なくとも９５％の同一性、少なくとも９６％の同一性、少なくとも９７％の同一性、少なくとも９８％の同一性、少なくとも９９％の同一性、又は少なくとも１００％の同一性を有する配列を含む。いくつかの実施形態では、当該ＲＮＡガイドエンドヌクレアーゼは、配列番号２２４２又は配列番号２２４４に対して、少なくとも７５％の同一性、少なくとも８０％の同一性、少なくとも８２％の同一性、少なくとも８４％の同一性、少なくとも８６％の同一性、少なくとも８８％の同一性、少なくとも９０％の同一性、少なくとも９１％の同一性、少なくとも９２％の同一性、少なくとも９３％の同一性、少なくとも９４％の同一性、少なくとも９５％の同一性、少なくとも９６％の同一性、少なくとも９７％の同一性、少なくとも９８％の同一性、少なくとも９９％の同一性、又は少なくとも１００％の同一性を有する配列を含むＲｕｖＣＩＩＩドメインを含む。いくつかの実施形態では、当該ＲＮＡガイドエンドヌクレアーゼは、ＨＮＨドメインを更に含む。いくつかの実施形態では、当該操作されたガイドＲＮＡは、配列番号６６１５５、６１５９、６１６、又は６１７２のいずれか１つの少なくとも１８個の連続するヌクレオチドに対して、少なくとも８５％の同一性を有する標的配列を含む。

いくつかの態様では、本開示は、細胞内のＣＤ３８遺伝子座を編集する方法であって、当該細胞を、（ａ）ＲＮＡガイドエンドヌクレアーゼ及び（ｂ）操作されたガイドＲＮＡと接触させることを含み、ここで、当該操作されたガイドＲＮＡは、当該エンドヌクレアーゼと複合体を形成するように構成され、当該操作されたガイドＲＮＡは、当該ＣＤ３８遺伝子座の領域にハイブリダイズするように構成されたスペーサー配列を含み、当該操作されたガイドＲＮＡは、配列番号６１８２～６２４８又は配列番号６２４９～６２５６のいずれか１つの、少なくとも１９、少なくとも２０、少なくとも２１、少なくとも２２、少なくとも２３、又は少なくとも２４ヌクレオチドの連続するヌクレオチドに対して、少なくとも８０％の同一性、少なくとも８２％の同一性、少なくとも８４％の同一性、少なくとも８６％の同一性、少なくとも８８％の同一性、少なくとも９０％の同一性、少なくとも９１％の同一性、少なくとも９２％の同一性、少なくとも９３％の同一性、少なくとも９４％の同一性、少なくとも９５％の同一性、少なくとも９６％の同一性、少なくとも９７％の同一性、少なくとも９８％の同一性、少なくとも９９％の同一性、又は少なくとも１００％の同一性を有する標的配列を含む、方法を提供する。いくつかの実施形態では、当該ＲＮＡガイドエンドヌクレアーゼは、クラスＩＩタイプＩＩＣａｓエンドヌクレアーゼである。いくつかの実施形態では、当該ＲＮＡガイドエンドヌクレアーゼは、配列番号２２４２又は配列番号２２４４に対して、少なくとも７５％の同一性、少なくとも８０％の同一性、少なくとも８２％の同一性、少なくとも８４％の同一性、少なくとも８６％の同一性、少なくとも８８％の同一性、少なくとも９０％の同一性、少なくとも９１％の同一性、少なくとも９２％の同一性、少なくとも９３％の同一性、少なくとも９４％の同一性、少なくとも９５％の同一性、少なくとも９６％の同一性、少なくとも９７％の同一性、少なくとも９８％の同一性、少なくとも９９％の同一性、又は少なくとも１００％の同一性を有する配列を含むＲｕｖＣＩＩＩドメインを含む。いくつかの実施形態では、当該ＲＮＡガイドエンドヌクレアーゼは、ＨＮＨドメインを更に含む。いくつかの実施形態では、当該ＲＮＡガイドエンドヌクレアーゼは、配列番号４２１又は配列番号４２３に対して、少なくとも７５％の同一性、少なくとも８０％の同一性、少なくとも８２％の同一性、少なくとも８４％の同一性、少なくとも８６％の同一性、少なくとも８８％の同一性、少なくとも９０％の同一性、少なくとも９１％の同一性、少なくとも９２％の同一性、少なくとも９３％の同一性、少なくとも９４％の同一性、少なくとも９５％の同一性、少なくとも９６％の同一性、少なくとも９７％の同一性、少なくとも９８％の同一性、少なくとも９９％の同一性、又は少なくとも１００％の同一性を有する配列を含む。いくつかの実施形態では、当該操作されたガイドＲＮＡは、配列番号６１８２～６２４８のいずれか１つの少なくとも１８個の連続するヌクレオチドに対して少なくとも８５％の同一性を有する標的配列を含み、当該エンドヌクレアーゼは、配列番号４２１に対して少なくとも７５％の同一性を有する配列を含む。いくつかの実施形態では、当該操作されたガイドＲＮＡは、配列番号６２４９～６２５６のいずれか１つの少なくとも１８個の連続するヌクレオチドに対して少なくとも８５％の同一性を有する標的配列を含み、当該エンドヌクレアーゼは、配列番号４２３に対して少なくとも７５％の同一性を有する配列を含む。いくつかの実施形態では、当該操作されたガイドＲＮＡは、配列番号６１８２～６１８３、６１８９、６１９１、６２０８、６２１０、６２１１、又は６２１５のいずれか１つの少なくとも１８個の連続するヌクレオチドに対して、少なくとも８５％の同一性を有する標的配列を含む。いくつかの実施形態では、当該操作されたガイドＲＮＡは、配列番号６２５１の少なくとも１８個の連続するヌクレオチドに対して、少なくとも８５％の同一性を有する標的配列を含む。

上記の細胞中の特定の遺伝子座を編集する方法のいずれかのいくつかの実施形態では、当該細胞は、末梢血単核細胞、Ｔ細胞、ＮＫ細胞、造血幹細胞（ｈｅｍａｔｏｐｏｉｅｔｉｃｓｔｅｍｃｅｌｌ：ＨＳＣＴ）、若しくはＢ細胞、又はこれらの任意の組合せである。

いくつかの態様では、本開示は、操作されたガイドリボ核酸ポリヌクレオチドであって、（ａ）標的ＤＮＡ分子中の標的配列に相補的であるヌクレオチド配列を含む、ＤＮＡ標的化セグメント、及び（ｂ）ハイブリダイズして二本鎖ＲＮＡ（ｄｓＲＮＡ）二重鎖を形成するヌクレオチドの２つの相補的ストレッチを含むタンパク質結合セグメントを含み、ここで、当該ヌクレオチドの２つの相補的ストレッチは、介在するヌクレオチドを用いて互いに共有結合しており、当該操作されたガイドリボ核酸ポリヌクレオチドは、クラス２タイプＩＩＣａｓエンドヌクレアーゼと複合体を形成し、かつ当該複合体を当該標的ＤＮＡ分子の当該標的配列へと標的化するように構成され、当該ＤＮＡ標的化セグメントは、配列番号５９５０～５９６５、５９６６～６０２５、６０２６～６１２１、６１２２～６１５２、６１５３～６１８１、又は６１８２～６２５６のいずれか１つの少なくとも１９、少なくとも２０、少なくとも２１、少なくとも２２、少なくとも２３、又は少なくとも２４の連続するヌクレオチドに対して、少なくとも８０％の同一性、少なくとも８２％の同一性、少なくとも８４％の同一性、少なくとも８６％の同一性、少なくとも８８％の同一性、少なくとも９０％の同一性、少なくとも９１％の同一性、少なくとも９２％の同一性、少なくとも９３％の同一性、少なくとも９４％の同一性、少なくとも９５％の同一性、少なくとも９６％の同一性、少なくとも９７％の同一性、少なくとも９８％の同一性、少なくとも９９％の同一性、又は少なくとも１００％の同一性を有する配列を含む、操作されたガイドリボ核酸ポリヌクレオチドを提供する。いくつかの実施形態では、当該タンパク質結合セグメントは、配列番号５４６６又は配列番号６３０４のいずれか１つに対して少なくとも８５％の同一性を有する配列を含む。

いくつかの態様では、本開示は、編集された免疫細胞を生成するためのシステムであって、（ａ）ＲＮＡガイドエンドヌクレアーゼと、（ｂ）当該ＲＮＡガイドエンドヌクレアーゼに結合するように構成された、請求項９７に記載の操作されたガイドリボ核酸ポリヌクレオチドと、（ｃ）キメラ抗原受容体（ｃｈｉｍｅｒｉｃａｎｔｉｇｅｎｒｅｃｅｐｔｏｒ：ＣＡＲ）をコードする配列に隣接する第１のホモロジーアーム及び第２のホモロジーアームを含む、一本鎖又は二本鎖ＤＮＡ修復鋳型と、を含む、システムを提供する。いくつかの実施形態では、当該細胞は、末梢血単核細胞、Ｔ細胞、ＮＫ細胞、造血幹細胞（ＨＳＣＴ）、若しくはＢ細胞、又はこれらの任意の組合せである。いくつかの態様では、当該ＲＮＡガイドエンドヌクレアーゼは、クラスＩＩタイプＩＩＣａｓエンドヌクレアーゼである。いくつかの態様では、当該ＲＮＡガイドエンドヌクレアーゼは、配列番号２２４２又は配列番号２２４４に対して、少なくとも７５％の同一性、少なくとも８０％の同一性、少なくとも８２％の同一性、少なくとも８４％の同一性、少なくとも８６％の同一性、少なくとも８８％の同一性、少なくとも９０％の同一性、少なくとも９１％の同一性、少なくとも９２％の同一性、少なくとも９３％の同一性、少なくとも９４％の同一性、少なくとも９５％の同一性、少なくとも９６％の同一性、少なくとも９７％の同一性、少なくとも９８％の同一性、少なくとも９９％の同一性、又は少なくとも１００％の同一性を有する配列を含むＲｕｖＣＩＩＩドメインを含む。いくつかの態様では、当該ＲＮＡガイドエンドヌクレアーゼは、ＨＮＨドメインを更に含む。いくつかの態様では、当該ＲＮＡガイドエンドヌクレアーゼは、配列番号４２１又は配列番号４２３に対して、少なくとも７５％の同一性、少なくとも８０％の同一性、少なくとも８２％の同一性、少なくとも８４％の同一性、少なくとも８６％の同一性、少なくとも８８％の同一性、少なくとも９０％の同一性、少なくとも９１％の同一性、少なくとも９２％の同一性、少なくとも９３％の同一性、少なくとも９４％の同一性、少なくとも９５％の同一性、少なくとも９６％の同一性、少なくとも９７％の同一性、少なくとも９８％の同一性、少なくとも９９％の同一性、又は少なくとも１００％の同一性を有する配列を含む。

本開示の更なる態様及び利点は、本開示の例示的な実施形態のみが示され説明される以下の詳細な説明から当業者には容易に明らかになるであろう。理解されるように、本開示は、他の異なる実施形態が可能であり、そのいくつかの詳細は、全て本開示から逸脱することなく、様々な明白な点で修正が可能である。したがって、図面及び説明は、本質的に例示と見なされるべきであり、限定と見なされるべきではない。
参照による組込み

本明細書で言及される全ての刊行物、特許、及び特許出願は、あたかも各個々の刊行物、特許、又は特許出願が参照により組み込まれることが具体的かつ個別に示されているのと同程度に、参照により本明細書に組み込まれる。

本発明の新規な特徴は、添付の特許請求の範囲に詳細に記載されている。本発明の特徴及び利点のより良い理解は、本発明の原理が利用される例示的な実施形態を説明する以下の詳細な説明、及び添付の図面（また、本明細書では「図面（Ｆｉｇｕｒｅ）」及び「図（ＦＩＧ．）」）を参照することによって得られるであろう。

図１は、異なるクラス及び型のＣＲＩＳＰＲ／Ｃａｓ遺伝子座の典型的な組織を示す。図２は、両方が結合しているハイブリッドｓｇＲＮＡと比較した、天然のクラス２／ＩＩ型ｃｒＲＮＡ／ｔｒａｃｒＲＮＡ対の構造を示す。図３は、ＭＧ１ファミリーからの酵素をコードする、ＣＲＩＳＰＲ遺伝子座の組織を示す概略図を示す。図４は、ＭＧ２ファミリーからの酵素をコードする、ＣＲＩＳＰＲ遺伝子座の組織を示す概略図を示す。図５は、ＭＧ３ファミリーからの酵素をコードする、ＣＲＩＳＰＲ遺伝子座の組織を示す概略図を示す。図６は、黄色ブドウ球菌（Ｓｔａｐｈｙｌｏｃｏｃｃｕｓａｕｒｅｕｓ）（配列番号５６１３）からのＣａｓ９に対する本開示の酵素（ＭＧ１－１）の構造に基づくアラインメントを示す。機能についての予測された必須残基は、配列の下で呼び出される。保存された残基は黒色で強調する。図７は、黄色ブドウ球菌（Ｓｔａｐｈｙｌｏｃｏｃｃｕｓａｕｒｅｕｓ）からのＣａｓ９（配列番号５６１３）に対する本開示の酵素（ＭＧ２－１）の構造に基づくアラインメントを示す。機能についての予測された必須残基は、配列の下で呼び出される。保存された残基は黒色で強調する。図８は、アクチノミセス・ネスルンディ（Ａｃｔｉｎｏｍｙｃｅｓｎａｅｓｌｕｎｄｉｉ）からのＣａｓ９（配列番号５６１４）に対する本開示の酵素（ＭＧ３－１）の構造に基づくアラインメントを示す。機能についての予測された必須残基は、配列の下で呼び出される。保存された残基は黒色で強調する。図９Ａは、ＭＧ１ファミリー酵素ＭＧ１－１からＭＧ１－６（配列番号５、６、９、１、２及び３）の構造に基づくアラインメントを示す。図９Ｂは、ＭＧ１ファミリー酵素ＭＧ１－１からＭＧ１－６（配列番号５、６、９、１、２及び３）の構造に基づくアラインメントを示す。図９Ｃは、ＭＧ１ファミリー酵素ＭＧ１－１からＭＧ１－６（配列番号５、６、９、１、２及び３）の構造に基づくアラインメントを示す。図９Ｄは、ＭＧ１ファミリー酵素ＭＧ１－１からＭＧ１－６（配列番号５、６、９、１、２及び３）の構造に基づくアラインメントを示す。図９Ｅは、ＭＧ１ファミリー酵素ＭＧ１－１からＭＧ１－６（配列番号５、６、９、１、２及び３）の構造に基づくアラインメントを示す。図９Ｆは、ＭＧ１ファミリー酵素ＭＧ１－１からＭＧ１－６（配列番号５、６、９、１、２及び３）の構造に基づくアラインメントを示す。図９Ｇは、ＭＧ１ファミリー酵素ＭＧ１－１からＭＧ１－６（配列番号５、６、９、１、２及び３）の構造に基づくアラインメントを示す。図９Ｈは、ＭＧ１ファミリー酵素ＭＧ１－１からＭＧ１－６（配列番号５、６、９、１、２及び３）の構造に基づくアラインメントを示す。機能についての予測された必須残基は、配列の下で呼び出される。保存された残基は黒色で強調する。図１０は、様々な長さの標的化配列を含有するその対応するｓｇＲＮＡとの複合体におけるＭＧ１－４によるＤＮＡのインビトロ切断を示す。図１１は、ＭＧ１－４をその対応するｓｇＲＮＡと共に使用いる大腸菌（Ｅ．ｃｏｌｉ）ゲノムＤＮＡの細胞切断を示す。ＭＧ１－４で形質転換した細胞の希釈系列を標的又は非標的スペーサーと共に示す（上部）。上部のパネルは定量されたデータを示し、ここで、左のバーは非標的ｓｇＲＮＡを表し、右のバーは標的ｓｇＲＮＡを表す。図１２は、ヒトゲノム中の様々な位置を標的化する様々な異なる標的化配列を含有するそれらの対応するｓｇＲＮＡと共に、実施例１１に記載されるＭＧ１－４又はＭＧ１－６構築物によるＨＥＫ細胞のトランスフェクションによって生成された細胞インデル形成を示す。図１３は、様々な長さの標的化配列を含有するその対応するｓｇＲＮＡとの複合体におけるＭＧ３－６によるＤＮＡのビトロ切断を示す。図１４は、ＭＧ３－７をその対応するｓｇＲＮＡと共に使用いる大腸菌（Ｅ．ｃｏｌｉ）ゲノムＤＮＡの細胞切断を示す。ＭＧ３－７で形質転換した細胞の希釈系列を標的又は非標的スペーサーと共に示す（上部）。下部のパネルは定量されたデータを示し、ここで、左のバーは非標的ｓｇＲＮＡを表し、右のバーは標的ｓｇＲＮＡを表す。図１５は、ヒトゲノムの様々な位置を標的化する様々な異なる標的化配列を含有するそれらの対応するｓｇＲＮＡと共に、実施例１３に記載されるＭＧ３－７構築物によるＨＥＫ細胞のトランスフェクションによって生成された細胞インデル形成を示す。図１６は、様々な長さの標的化配列を含有するその対応するｓｇＲＮＡとの複合体におけるＭＧ１５－１によるＤＮＡのインビトロ切断を示す。図１７は、様々なＭＧファミリーヌクレアーゼ及びそれらの対応するｔｒａｃｒＲＮＡ又はｓｇＲＮＡを含有するＴＸＴＬ抽出物の存在下における、ＰＡＭベクターライブラリー切断の結果を示すアガロースゲルを示す。図１８は、様々なＭＧファミリーヌクレアーゼ及びそれらの対応するｔｒａｃｒＲＮＡ又はｓｇＲＮＡを含有するＴＸＴＬ抽出物の存在下における、ＰＡＭベクターライブラリー切断の結果を示すアガロースゲルを示す。図１９は、様々なＭＧファミリーヌクレアーゼ及びそれらの対応するｔｒａｃｒＲＮＡ又はｓｇＲＮＡを含有するＴＸＴＬ抽出物の存在下における、ＰＡＭベクターライブラリー切断の結果を示すアガロースゲルを示す。図２０は、様々なＭＧファミリーヌクレアーゼ及びそれらの対応するｔｒａｃｒＲＮＡ又はｓｇＲＮＡを含有するＴＸＴＬ抽出物の存在下における、ＰＡＭベクターライブラリー切断の結果を示すアガロースゲルを示す。図２１は、本明細書中に記載のＭＧ酵素の対応するｓｇＲＮＡの予測された構造（例えば、実施例７のように予測）を示す。図２２は、本明細書中に記載のＭＧ酵素の対応するｓｇＲＮＡの予測された構造（例えば、実施例７のように予測）を示す。図２３は、本明細書中に記載のＭＧ酵素の対応するｓｇＲＮＡの予測された構造（例えば、実施例７のように予測）を示す。図２４は、本明細書中に記載のＭＧ酵素の対応するｓｇＲＮＡの予測された構造（例えば、実施例７のように予測）を示す。図２５は、本明細書中に記載のＭＧ酵素の対応するｓｇＲＮＡの予測された構造（例えば、実施例７のように予測）を示す。図２６は、本明細書中に記載のＭＧ酵素の対応するｓｇＲＮＡの予測された構造（例えば、実施例７のように予測）を示す。図２７は、本明細書中に記載されるようなＮＧＳによって誘導されるＰＡＭ配列のｓｅｑＬｏｇｏ表現を示す（例えば、実施例６に記載される通り）。図２８は、本明細書中に記載されるようなＮＧＳによって誘導されるＰＡＭ配列のｓｅｑＬｏｇｏ表現を示す（例えば、実施例６に記載される通り）。図２９は、本明細書中に記載されるようなＮＧＳによって誘導されるＰＡＭ配列のｓｅｑＬｏｇｏ表現を示す（例えば、実施例６に記載される通り）。図３０は、本明細書中に記載されるようなＮＧＳによって誘導されるＰＡＭ配列のｓｅｑＬｏｇｏ表現を示す（例えば、実施例６に記載される通り）。図３１は、本明細書中に記載されるようなＮＧＳによって誘導されるＰＡＭ配列のｓｅｑＬｏｇｏ表現を示す（例えば、実施例６に記載される通り）。図３２は、本明細書中に記載されるようなＮＧＳによって誘導されるＰＡＭ配列のｓｅｑＬｏｇｏ表現を示す（例えば、実施例６に記載される通り）。図３３は、本明細書中に記載されるようなＮＧＳによって誘導されるＰＡＭ配列のｓｅｑＬｏｇｏ表現を示す（例えば、実施例６に記載される通り）。図３４は、ＭＧ２－７をその対応するｓｇＲＮＡと共に使用いる大腸菌（Ｅ．ｃｏｌｉ）ゲノムＤＮＡの細胞切断を示す。ＭＧ２－７で形質転換した細胞の希釈系列を標的又は非標的スペーサーと共に示す（上部）。下部のパネルは定量されたデータを示し、ここで、右のバーは非標的ｓｇＲＮＡを表し、左のバーは標的ｓｇＲＮＡを表す。図３５は、ＭＧ１４－１をその対応するｓｇＲＮＡと共に使用いる大腸菌（Ｅ．ｃｏｌｉ）ゲノムＤＮＡの細胞切断を示す。ＭＧ１４－１で形質転換した細胞の希釈系列を標的又は非標的スペーサーと共に示す（上部）。下部のパネルは定量されたデータを示し、ここで、右のバーは非標的ｓｇＲＮＡを表し、左のバーは標的ｓｇＲＮＡを表す。図３６は、ＭＧ１５－１をその対応するｓｇＲＮＡと共に使用いる大腸菌（Ｅ．ｃｏｌｉ）ゲノムＤＮＡの細胞切断を示す。ＭＧ１５－１で形質転換した細胞の希釈系列を標的又は非標的スペーサーと共に示す（上部）。下部のパネルは定量されたデータを示し、ここで、右のバーは非標的ｓｇＲＮＡを表し、左のバーは標的ｓｇＲＮＡを表す。図３７は、ヒトゲノム中の様々な位置を標的化する様々な異なる標的化配列を含有するそれらの対応するｓｇＲＮＡと共に、実施例１１に記載されるＭＧ１－４、ＭＧ１－６、及びＭＧ１－７構築物によるＨＥＫ細胞のトランスフェクションによって生成された細胞インデル形成を示す。図３８は、ヒトゲノム中の様々な位置を標的化する様々な異なる標的化配列を含有するそれらの対応するｓｇＲＮＡと共に、実施例１１に記載されるＭＧ１－４、ＭＧ１－６、及びＭＧ１－７構築物によるＨＥＫ細胞のトランスフェクションによって生成された細胞インデル形成を示す。図３９は、ヒトゲノム中の様々な位置を標的化する様々な異なる標的化配列を含有するそれらの対応するｓｇＲＮＡと共に、実施例１１に記載されるＭＧ１－４、ＭＧ１－６、及びＭＧ１－７構築物によるＨＥＫ細胞のトランスフェクションによって生成された細胞インデル形成を示す。図４０は、ヒトゲノム中の様々な位置を標的化する様々な異なる標的化配列を含有するそれらの対応するｓｇＲＮＡと共に、実施例１３に記載されるＭＧ３－６、ＭＧ３－７、及びＭＧ３－８構築物によるＨＥＫ細胞のトランスフェクションによって生成された細胞インデル形成を示す。図４１は、ヒトゲノム中の様々な位置を標的化する様々な異なる標的化配列を含有するそれらの対応するｓｇＲＮＡと共に、実施例１３に記載されるＭＧ３－６、ＭＧ３－７、及びＭＧ３－８構築物によるＨＥＫ細胞のトランスフェクションによって生成された細胞インデル形成を示す。図４２は、ヒトゲノム中の様々な位置を標的化する様々な異なる標的化配列を含有するそれらの対応するｓｇＲＮＡと共に、実施例１３に記載されるＭＧ３－６、ＭＧ３－７、及びＭＧ３－８構築物によるＨＥＫ細胞のトランスフェクションによって生成された細胞インデル形成を示す。図４３は、ヒトゲノムの様々な位置を標的化する様々な異なる標的化配列を含有するそれらの対応するｓｇＲＮＡと共に、実施例１４に記載されるＭＧ１４－１構築物によるＨＥＫ細胞のトランスフェクションによって生成された細胞インデル形成を示す。図４４は、ヒトゲノムの様々な位置を標的化する様々な異なる標的化配列を含有するそれらの対応するｓｇＲＮＡと共に、実施例１７に記載されるＭＧ１８－１構築物によるＨＥＫ細胞のトランスフェクションによって生成された細胞インデル形成を示す。図４５は、本明細書中に記載されるヌクレアーゼの環境分布を示す。選択されたタンパク質ファミリーの代表について、タンパク質長を示す。色は、各タンパク質が同定された環境又は環境型を示す。図４６は、本明細書中に記載されるヌクレアーゼの予測される触媒残基を示す。選択されたタンパク質ファミリーの代表について、タンパク質長を示す。色は、各タンパク質について予測された触媒残基の数を示す。本明細書に記載のエフェクター酵素について、ＨＮＨ及びＲｕｖＣドメインに対応する６つの触媒残基を検索した。図４７は、本明細書中に記載されるヌクレアーゼの候補活性対タンパク質長を示す。図４８は、本明細書中に記載されるヌクレアーゼについて予測された触媒残基の数を示す。図４９は、本明細書中に記載される選択ヌクレアーゼの様々な特徴的な情報の表を示す。図５０は、本明細書中に記載されるようなＮＧＳによって誘導されるＰＡＭ配列のｓｅｑＬｏｇｏ表現を示す（例えば、実施例６に記載される通り）。図５１は、本明細書中に記載されるようなＮＧＳによって誘導されるＰＡＭ配列のｓｅｑＬｏｇｏ表現を示す（例えば、実施例６に記載される通り）。図５２は、本明細書中に記載されるようなＮＧＳによって誘導されるＰＡＭ配列のｓｅｑＬｏｇｏ表現を示す（例えば、実施例６に記載される通り）。図５３は、本明細書中に記載されるようなＮＧＳによって誘導されるＰＡＭ配列のｓｅｑＬｏｇｏ表現を示す（例えば、実施例６に記載される通り）。図５４は、本明細書中に記載されるようなＮＧＳによって誘導されるＰＡＭ配列のｓｅｑＬｏｇｏ表現を示す（例えば、実施例６に記載される通り）。図５５は、ＭＧ３－６及びＭＧ３－８によるＴＲＡＣでのガイドＲＮＡスクリーニングを示す。上部パネル（ＭＧ３－６）について、ｘ軸番号は、配列番号５９５０～５９５８に対応するスペーサーを指す。下部パネル（ＭＧ３－８）について、ｘ軸番号は、配列番号５９５９～５９６５に対応するスペーサーを指す。図５６は、様々なコア配列、長さ、及び用量のガイドＲＮＡを用いたＭＧ３－６の活性（インデル％）を示す。図５７は、様々な配列及び長さのガイドＲＮＡを用いたＭＧ３－８の活性（インデル％）を示す。図５８は、ＴＲＡＣガイド６を有するＭＧ３－６及びＴＲＡＣガイド８を有するＭＧ３－８の活性（インデル％）を示す。図５９は、フローサイトメトリによるＴ細胞受容体発現に対するＴＲＡＣ６ガイドＲＮＡによるＭＧ３－６の効果を示す。編集後の生存率に変化はなかった。図６０は、より多量のｇＲＮＡによるＴＲＡＣ編集効率の増加を示す。図６１は、ＴＣＲ発現が、どのように排除され、ＣＡＲ発現と置き換えられ得るかを示す。図６２は、ＭＧ３－６との標的化ＣＡＲインテグレーションを示す。図６３は、ＮＲ３Ｃｌ遺伝子の様々なエクソンを標的化する様々なガイドＲＮＡによる、ＭＧ３－６によるＧＲ（ＮＲ３Ｃｌ）編集を示す。図６４は、ＮＲ３Ｃｌ遺伝子の様々なエクソンを標的化する様々なガイドＲＮＡによる、ＭＧ３－８によるＧＲ（ＮＲ３Ｃｌ）編集を示す。図６５は、ＧＲ編集を、２つのＭＧ３－６バッチ及び様々なガイドＲＮＡと比較する。図６６は、遺伝子編集が同種異系ＣＡＲ－ＮＫ細胞を作製するためにどのように使用され得るかのプロセスを示す。図６７は、ＴＲＡＣ６ガイドＲＮＡと共にＭＧ３－６を用いるＴＲＡＣ編集を示す。図６８は、フローサイトメトリによるＣＤ５６＋ＮＫ細胞における、ＭＧ３－６によるＣＡＲ発現（Ｙ軸）を示す。図６９は、様々なガイドＲＮＡと共にＭＧ３－６及びＭＧ３－８を用いる初代ＮＫ細胞におけるＣＤ３８編集を示す。図７０は、様々なガイドＲＮＡによるＭＧ３－６及びＭＧ３－８による造血幹細胞におけるＴＲＡＣ編集を示す。図７１は、２つの異なる緩衝液を用いる、ＴＲＡＣガイド６によるＭＧ３－６によるＢ細胞におけるＴＲＡＣ編集を示す。図７２は、実施例２５の方法によって決定された、ＭＧ４８－１（Ａ）及びＭＧ４８－３（Ｂ）のコンセンサスＰＡＭ配列を示す。図７３は、ＭＧ４８－１（Ａ）及びＭＧ４８－３（Ｂ）について実施例２５の方法によって行われた場合の、シーケンシングされたｔｒａｃｒ領域が強調表示されたＲＮＡｓｅｑマッピングを示す。

配列表の簡単な説明
本明細書と共に提出される配列表は、本開示にかかる方法、組成物、及びシステムにおいて使用するための例示的なポリヌクレオチド及びポリペプチド配列を提供する。以下は、その中の配列の例示的な説明である。

ＭＧ１

配列番号１～３１９は、ＭＧ１ヌクレアーゼの全長ペプチド配列を示す。

配列番号１８２７～２１４０は、上記のＭＧ１ヌクレアーゼのＲｕｖＣ＿ＩＩＩドメインのペプチド配列を示す。

配列番号３６３８～３９５５は、上記のＭＧ１ヌクレアーゼのＨＮＨドメインのペプチドを示す。

配列番号５４７６～５４７９は、上記のＭＧ１ヌクレアーゼ（例えば、それぞれ配列番号１～４と同じ遺伝子座）と同じ遺伝子座に由来するＭＧ１ｔｒａｃｒＲＮＡのヌクレオチド配列を示す。

配列番号５４６１～５４６４は、ＭＧ１ヌクレアーゼ（例えば、それぞれ配列番号１～４）で機能するように操作されたｓｇＲＮＡのヌクレオチド配列を示し、ここで、Ｎｓとは標的化配列のヌクレオチドを示す。

配列番号５５７２～５５７５は、ＭＧ１ファミリー酵素（配列番号１～４）の大腸菌（Ｅ．ｃｏｌｉ）コドン最適化コード配列のヌクレオチド配列を示す。

配列番号５５８８～５５８９は、ＭＧ１ファミリー酵素（配列番号１及び３）に対するヒトコドン最適化コード配列のヌクレオチド配列を示す。

配列番号５６１６～５６３２は、ＭＧ１ファミリー酵素に特徴的なペプチドモチーフを示す。

ＭＧ２

配列番号３２０～４２０は、ＭＧ２ヌクレアーゼの全長ペプチド配列を示す。

配列番号２１４１～２２４１は、上記のＭＧ２ヌクレアーゼのＲｕｖＣ＿ＩＩＩドメインのペプチド配列を示す。

配列番号３９５５～４０５５は、上記のＭＧ２ヌクレアーゼのＨＮＨドメインのペプチドを示す。

配列番号５４９０～５４９４は、上記のＭＧ２ヌクレアーゼと同じ遺伝子座（例えば、それぞれ、配列番号３２０、３２１、３２３、３２５、及び３２６と同じ遺伝子座）に由来するＭＧ２ｔｒａｃｒＲＮＡのヌクレオチド配列を示す。

配列番号５４６５は、ＭＧ２ヌクレアーゼ（例えば、上記の配列番号３２１）で機能するように操作されたｓｇＲＮＡのヌクレオチド配列を示す。

配列番号５５７２～５５７５は、ＭＧ２ファミリー酵素の大腸菌（Ｅ．ｃｏｌｉ）コドン最適化コード配列のヌクレオチド配列を示す。

配列番号５６３１～５６３８は、ＭＧ２ファミリー酵素に特徴的なペプチド配列を示す。

ＭＧ３

配列番号４２１～４３１は、ＭＧ３ヌクレアーゼの全長ペプチド配列を示す。

配列番号２２４２～２２５２は、上記のＭＧ３ヌクレアーゼのＲｕｖＣ＿ＩＩＩドメインのペプチド配列を示す。

配列番号４０５６～４０６６は、上記のＭＧ３ヌクレアーゼのＨＮＨドメインのペプチドを示す。

配列番号５４９５～５５０２は、上記のＭＧ３ヌクレアーゼと同じ遺伝子座に由来するＭＧ３ｔｒａｃｒＲＮＡのヌクレオチド配列を示す（例えば、それぞれ配列番号４２１～４２８と同じ遺伝子座）。

配列番号５４６６～５４６７は、ＭＧ３ヌクレアーゼ（例えば、配列番号４２１～４２３）と共に機能するように操作されたｓｇＲＮＡのヌクレオチド配列を示す。

配列番号５５７８～５５８０は、ＭＧ３ファミリー酵素の大腸菌（Ｅ．ｃｏｌｉ）コドン最適化コード配列のヌクレオチド配列を示す。

配列番号５６３９～５６４８は、ＭＧ３ファミリー酵素に特徴的なペプチド配列を示す。

ＭＧ４

配列番号４３２～６６０は、ＭＧ４ヌクレアーゼの全長ペプチド配列を示す。

配列番号２２５３～２４８１は、上記のＭＧ４ヌクレアーゼのＲｕｖＣ＿ＩＩＩドメインのペプチド配列を示す。

配列番号４０６７～４２９５は、上記のＭＧ４ヌクレアーゼのＨＮＨドメインのペプチドを示す。

配列番号５５０３は、上記のＭＧ４ヌクレアーゼと同じ遺伝子座に由来するＭＧ４ｔｒａｃｒＲＮＡのヌクレオチド配列を示す。

配列番号５４６８は、ＭＧ４ヌクレアーゼと共に機能するように操作されたｓｇＲＮＡのヌクレオチド配列を示す。

配列番号５６４９は、ＭＧ４ファミリー酵素に特徴的なペプチド配列を示す。

ＭＧ６

配列番号６６１～６６８は、ＭＧ６ヌクレアーゼの全長ペプチド配列を示す。

配列番号２４８２～２４８９は、上記のＭＧ６ヌクレアーゼのＲｕｖＣ＿ＩＩＩドメインのペプチド配列を示す。

配列番号４２９６～４３０３は、上記のＭＧ３ヌクレアーゼのＨＮＨドメインのペプチドを示す。

ＭＧ７

配列番号６６９～６７７は、ＭＧ７ヌクレアーゼの全長ペプチド配列を示す。

配列番号２４９０～２４９８は、上記のＭＧ７ヌクレアーゼのＲｕｖＣ＿ＩＩＩドメインのペプチド配列を示す。

配列番号４３０４～４３１２は、上記のＭＧ３ヌクレアーゼのＨＮＨドメインのペプチドを示す。

配列番号５５０４は、上記のＭＧ７ヌクレアーゼと同じ遺伝子座に由来するＭＧ７ｔｒａｃｒＲＮＡのヌクレオチド配列を示す。

ＭＧ１４

配列番号６７８～９２９は、ＭＧ１４ヌクレアーゼの全長ペプチド配列を示す。

配列番号２４９９～２７５０は、上記のＭＧ１４ヌクレアーゼのＲｕｖＣ＿ＩＩＩドメインのペプチド配列を示す。

配列番号４３１３～４５６４は、上記のＭＧ１４ヌクレアーゼのＨＮＨドメインのペプチドを示す。

配列番号５５０５は、上記のＭＧ１４ヌクレアーゼと同じ遺伝子座に由来するＭＧ１４ｔｒａｃｒＲＮＡのヌクレオチド配列を示す。

配列番号５５８１は、ＭＧ１４ファミリー酵素の大腸菌（Ｅ．ｃｏｌｉ）コドン最適化コード配列のヌクレオチド配列を示す。

配列番号５６５０～５６６７は、ＭＧ１４ファミリー酵素に特徴的なペプチド配列を示す。

ＭＧ１５

配列番号９３０～１０９２は、ＭＧ１５ヌクレアーゼの全長ペプチド配列を示す。

配列番号２７５１～２９１３は、上記のＭＧ１５ヌクレアーゼのＲｕｖＣ＿ＩＩＩドメインのペプチド配列を示す。

配列番号４５６５～４７２７は、上記のＭＧ１５ヌクレアーゼのＨＮＨドメインのペプチドを示す。

配列番号５５０６は、上記のＭＧ１５ヌクレアーゼと同じ遺伝子座に由来するＭＧ１５ｔｒａｃｒＲＮＡのヌクレオチド配列を示す。

配列番号５４７０は、ＭＧ１５ヌクレアーゼと共に機能するように操作されたｓｇＲＮＡのヌクレオチド配列を示す。

配列番号５５８２は、ＭＧ１５ファミリー酵素の大腸菌（Ｅ．ｃｏｌｉ）コドン最適化コード配列のヌクレオチド配列を示す。

配列番号５６６８～５６７５は、ＭＧ１５ファミリー酵素に特徴的なペプチド配列を示す。

ＭＧ１６

配列番号１０９３～１３５３は、ＭＧ１６ヌクレアーゼの全長ペプチド配列を示す。

配列番号２９１４～３１７４は、上記のＭＧ１６ヌクレアーゼのＲｕｖＣ＿ＩＩＩドメインのペプチド配列を示す。

配列番号４７２８～４９８８は、上記のＭＧ１６ヌクレアーゼのＨＮＨドメインのペプチドを示す。

配列番号５５０７は、上記のＭＧ３ヌクレアーゼと同じ遺伝子座に由来するＭＧ１６ｔｒａｃｒＲＮＡのヌクレオチド配列を示す。

配列番号５４７１は、ＭＧ１６ヌクレアーゼと共に機能するように操作されたｓｇＲＮＡのヌクレオチド配列を示す。

配列番号５５８３は、ＭＧ１６ファミリー酵素の大腸菌（Ｅ．ｃｏｌｉ）コドン最適化コード配列のヌクレオチド配列を示す。

配列番号５６７６～５６７８は、ＭＧ１６ファミリー酵素に特徴的なペプチド配列を示す。

ＭＧ１８

配列番号１３５４～１５１１は、ＭＧ１８ヌクレアーゼの全長ペプチド配列を示す。

配列番号３１７５～３３３０は、上記のＭＧ１８ヌクレアーゼのＲｕｖＣ＿ＩＩＩドメインのペプチド配列を示す。

配列番号４９８９～５１４６は、上記のＭＧ１８ヌクレアーゼのＨＮＨドメインのペプチドを示す。

配列番号５５０８は、上記のＭＧ１８ヌクレアーゼと同じ遺伝子座に由来するＭＧ１８ｔｒａｃｒＲＮＡのヌクレオチド配列を示す。

配列番号５４７２は、ＭＧ１８ヌクレアーゼと共に機能するように操作されたｓｇＲＮＡのヌクレオチド配列を示す。

配列番号５５８４は、ＭＧ１８ファミリー酵素の大腸菌（Ｅ．ｃｏｌｉ）コドン最適化コード配列のヌクレオチド配列を示す。

配列番号５６７９～５６８６は、ＭＧ１８ファミリー酵素に特徴的なペプチド配列を示す。

ＭＧ２１

配列番号１５１２～１６５５は、ＭＧ２１ヌクレアーゼの全長ペプチド配列を示す。

配列番号３３３１～３４７４は、上記のＭＧ２１ヌクレアーゼのＲｕｖＣ＿ＩＩＩドメインのペプチド配列を示す。

配列番号５１４７～５２９０は、上記のＭＧ２１ヌクレアーゼのＨＮＨドメインのペプチドを示す。

配列番号５５０９は、上記のＭＧ２１ヌクレアーゼと同じ遺伝子座に由来するＭＧ２１ｔｒａｃｒＲＮＡのヌクレオチド配列を示す。

配列番号５４７３は、ＭＧ２１ヌクレアーゼと共に機能するように操作されたｓｇＲＮＡのヌクレオチド配列を示す。

配列番号５５８５は、ＭＧ２１ファミリー酵素の大腸菌（Ｅ．ｃｏｌｉ）コドン最適化コード配列のヌクレオチド配列を示す。

配列番号５６８７～５６９２及び配列番号５６７４～５６７５は、ＭＧ２１ファミリー酵素に特徴的なペプチド配列を示す。

ＭＧ２２

配列番号１６５６～１７５５は、ＭＧ２２ヌクレアーゼの全長ペプチド配列を示す。

配列番号３４７５～３５６８は、上記のＭＧ２２ヌクレアーゼのＲｕｖＣ＿ＩＩＩドメインのペプチド配列を示す。

配列番号５２９１～５３８９は、上記のＭＧ２２ヌクレアーゼのＨＮＨドメインのペプチドを示す。

配列番号５５１０は、上記のＭＧ２２ヌクレアーゼと同じ遺伝子座に由来するＭＧ２２ｔｒａｃｒＲＮＡのヌクレオチド配列を示す。

配列番号５４７４は、ＭＧ２２ヌクレアーゼと共に機能するように操作されたｓｇＲＮＡのヌクレオチド配列を示す。

配列番号５５８６は、ＭＧ２２ファミリー酵素の大腸菌（Ｅ．ｃｏｌｉ）コドン最適化コード配列のヌクレオチド配列を示す。

配列番号５６９４～５６９９は、ＭＧ２２ファミリー酵素に特徴的なペプチド配列を示す。

ＭＧ２３

配列番号１７５６～１８２６は、ＭＧ２３ヌクレアーゼの全長ペプチド配列を示す。

配列番号３５６９～３６３７は、上記のＭＧ２３ヌクレアーゼのＲｕｖＣ＿ＩＩＩドメインのペプチド配列を示す。

配列番号５３９０～５４６０は、上記のＭＧ２３ヌクレアーゼのＨＮＨドメインのペプチドを示す。

配列番号５５１１は、上記のＭＧ２３ヌクレアーゼと同じ遺伝子座に由来するＭＧ２３ｔｒａｃｒＲＮＡのヌクレオチド配列を示す。

配列番号５４７５は、ＭＧ２３ヌクレアーゼと共に機能するように操作されたｓｇＲＮＡのヌクレオチド配列を示す。

配列番号５５８７は、ＭＧ２３ファミリー酵素の大腸菌（Ｅ．ｃｏｌｉ）コドン最適化コード配列のヌクレオチド配列を示す。

配列番号５７００～５７１７は、ＭＧ２３ファミリー酵素に特徴的なペプチド配列を示す。

ＭＧ４０

配列番号５７１８～５７５０は、ＭＧ４０ヌクレアーゼの全長ペプチド配列を示す。

配列番号５８４７～５８５２は、ＭＧ４０ヌクレアーゼに関連するプロトスペーサー隣接モチーフを示す。

配列番号５８６２～５８７３は、ＭＧ４０ヌクレアーゼと共に機能するように操作されたｓｇＲＮＡのヌクレオチド配列を示す。

ＭＧ４７

配列番号５７５１～５７６８は、ＭＧ４７ヌクレアーゼの全長ペプチド配列を示す。

配列番号５８５３～５８５４は、ＭＧ４７ヌクレアーゼに関連するプロトスペーサー隣接モチーフを示す。

配列番号５８７８～５８８１は、ＭＧ４７ヌクレアーゼと共に機能するように操作されたｓｇＲＮＡのヌクレオチド配列を示す。

ＭＧ４８

配列番号５７６９～５８０４は、ＭＧ４８ヌクレアーゼの全長ペプチド配列を示す。

配列番号５８５５～５８５６は、ＭＧ４８ヌクレアーゼに関連するプロトスペーサー隣接モチーフを示す。

配列番号５８８６、５８９０、及び５８９３は、上記のＭＧ４８ヌクレアーゼと同じ遺伝子座に由来するＭＧ４８ｔｒａｃｒＲＮＡのヌクレオチド配列を示す。

配列番号５８８７、５８９１、及び５８９４は、本明細書に記載のＭＧ４８ヌクレアーゼに関連するＣＲＩＳＰＲリピートを示す。

配列番号５８８８～５８８９、５８９２、及び５８９５～５８９６は、ＭＧ４８ヌクレアーゼと共に機能するように設計された推定ｓｇＲＮＡを示す。

ＭＧ４９

配列番号５８０５～５８２３は、ＭＧ４９ヌクレアーゼの全長ペプチド配列を示す。

配列番号５８５７～５８５８は、ＭＧ４９ヌクレアーゼに関連するプロトスペーサー隣接モチーフを示す。

配列番号５８７６～５８７７は、ＭＧ４９ヌクレアーゼと共に機能するように操作されたｓｇＲＮＡのヌクレオチド配列を示す。

ＭＧ５０

配列番号５８２４～５８２６は、ＭＧ５０ヌクレアーゼの全長ペプチド配列を示す。

配列番号５８５９は、ＭＧ５０ヌクレアーゼに関連するプロトスペーサー隣接モチーフを示す。

配列番号５８８４～５８８５は、ＭＧ５０ヌクレアーゼと共に機能するように操作されたｓｇＲＮＡのヌクレオチド配列を示す。

ＭＧ５１

配列番号５８２７～５８３０は、ＭＧ５１ヌクレアーゼの全長ペプチド配列を示す。

配列番号５８６０は、ＭＧ５１ヌクレアーゼに関連するプロトスペーサー隣接モチーフを示す。

配列番号５８８２～５８８３は、ＭＧ５１ヌクレアーゼと共に機能するように操作されたｓｇＲＮＡのヌクレオチド配列を示す。

ＭＧ５２

配列番号５８３１～５８４６は、ＭＧ５２ヌクレアーゼの全長ペプチド配列を示す。

配列番号５８６１は、ＭＧ５２ヌクレアーゼに関連するプロトスペーサー隣接モチーフを示す。

配列番号５８７４～５８７５は、ＭＧ４２ヌクレアーゼと共に機能するように操作されたｓｇＲＮＡのヌクレオチド配列を示す。

本発明の様々な実施形態を本明細書に示し説明してきたが、そのような実施形態が例としてのみ提供されることは当業者には明らかであろう。当業者には、本発明から逸脱することなく、多数のバリエーション、変更、及び置換が思い浮かび得る。本明細書に記載の本発明の実施形態に対する様々な代替形態が、採用され得ることを理解するべきである。

本明細書中に開示されるいくつかの方法の実施は、別段示されない限り、免疫学、生化学、化学、分子生物学、微生物学、細胞生物学、ゲノミクス、及び組換えＤＮＡの技術を採用する。例えば、Ｓａｍｂｒｏｏｋ及びＧｒｅｅｎ、「ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ」、第４版（２０１２年）；「ｔｈｅｓｅｒｉｅｓＣｕｒｒｅｎｔＰｒｏｔｏｃｏｌｓｉｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ」（Ｆ．Ｍ．Ａｕｓｕｂｅｌら編）；「ｔｈｅｓｅｒｉｅｓＭｅｔｈｏｄｓＩｎＥｎｚｙｍｏｌｏｇｙ」（ＡｃａｄｅｍｉｃＰｒｅｓｓ，Ｉｎｃ．）、「ＰＣＲ２：ＡＰｒａｃｔｉｃａｌＡｐｐｒｏａｃｈ」（Ｍ．Ｊ．ＭａｃＰｈｅｒｓｏｎ、Ｂ．Ｄ．Ｈａｍｅｓ及びＧ．Ｒ．Ｔａｙｌｏｒ編（１９９５年））、Ｈａｒｌｏｗ及びＬａｎｅ編（１９８８年）、「Ａｎｔｉｂｏｄｉｅｓ，ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ，ａｎｄＣｕｌｔｕｒｅｏｆＡｎｉｍａｌＣｅｌｌｓ：ＡＭａｎｕａｌｏｆＢａｓｉｃＴｅｃｈｎｉｑｕｅａｎｄＳｐｅｃｉａｌｉｚｅｄＡｐｐｌｉｃａｔｉｏｎｓ」、第６版（Ｒ．Ｉ．Ｆｒｅｓｈｎｅｙ編（２０１０年）（これは、参照により全体が本明細書に組み込まれる）。

本明細書で使用される場合、単数形「ａ」、「ａｎ」、及び「ｔｈｅ」は、文脈が明らかにそうでないことを示さない限り、複数形も含むことが意図される。更に、「含む（ｉｎｃｌｕｄｉｎｇ）」、「含む（ｉｎｃｌｕｄｅｓ）」、「有する（ｈａｖｉｎｇ）」、「有する（ｈａｓ）」、「有する（ｗｉｔｈ）」という用語、又はそれらの変形が、詳細な説明及び／又は特許請求の範囲のいずれかで使用される限り、そのような用語は、「含むこと（ｃｏｍｐｒｉｓｉｎｇ）」という用語と同様に包括的な様式であることを意図している。

「約（ａｂｏｕｔ）」又は「およそ（ａｐｐｒｏｘｉｍａｔｅｌｙ）」という用語は、当業者によって決定される特定の値の許容可能な誤差範囲内を意味し、これは、値がどのように測定又は決定されるか、すなわち測定システムの制限に部分的に依存する。例えば、「約（ａｂｏｕｔ）」は、当技術分野の慣例に従って、１つ又は２つ以上の標準偏差内を意味し得る。あるいは、「約（ａｂｏｕｔ）」は、所与の値の最大２０％、最大１５％、最大１０％、最大５％、又は最大１％の範囲を意味し得る。

本明細書で使用される場合、「細胞」は、概して、生物学的細胞を指す。細胞は、生物の基本的な構造、機能、及び／又は生物学的単位であり得る。細胞は、１つ以上の細胞を有する任意の生物に由来し得る。いくつかの非限定的な例としては、原核細胞、真核細胞、細菌細胞、古細菌細胞、単一細胞真核生物の細胞、原虫細胞、植物由来の細胞（例えば、植物作物、果実、野菜、穀物、ダイズ、トウモロコシ（ｃｏｒｎ）、トウモロコシ（ｍａｉｚｅ）、コムギ、種子、トマト、イネ、キャッサバ、サトウキビ、カボチャ、乾草、ジャガイモ、ワタ、大麻、タバコ、顕花植物、針葉樹、裸子植物、シダ、ヒカゲノカズラ、ツノゴケ類、ゼニゴケ、コケ）、藻類細胞（例えば、ボツリオコッカス・ブラウニー（Ｂｏｔｒｙｏｃｏｃｃｕｓｂｒａｕｎｉｉ）、コナミドリムシ（Ｃｈｌａｍｙｄｏｍｏｎａｓｒｅｉｎｈａｒｄｔｉｉ）、ナンノクロロプシス・ガディタナ（Ｎａｎｎｏｃｈｌｏｒｏｐｓｉｓｇａｄｉｔａｎａ）、クロレラ・ピレノイドサ（Ｃｈｌｏｒｅｌｌａｐｙｒｅｎｏｉｄｏｓａ）、及びヤツマタモク（ＳａｒｇａｓｓｕｍｐａｔｅｎｓＣ．Ａｇａｒｄｈ）など）、海藻（例えば、ケルプ）、真菌細胞（例えば、酵母細胞、キノコ由来の細胞）、動物細胞、無脊椎動物由来の細胞（例えば、ショウジョウバエ、刺胞動物、エキノデルム、線虫等）、脊椎動物由来の細胞（例えば、魚、両生類、爬虫類、鳥類、哺乳動物）、並びに哺乳動物由来の細胞（例えば、ブタ、ウシ、ヤギ、ヒツジ、げっ歯類、ラット、マウス、非ヒト霊長類、ヒト等）等が挙げられる。細胞は、天然の生物に由来しない場合がある（例えば、細胞は、人工細胞と称されることもある、合成的に作製されたものであり得る）。

本明細書で使用される場合、「ヌクレオチド」という用語は、概して、塩基－糖－リン酸の組合せを指す。ヌクレオチドは、合成ヌクレオチドを含み得る。ヌクレオチドは、合成ヌクレオチド類似体を含み得る。ヌクレオチドは、核酸配列のモノマー単位（例えば、デオキシリボ核酸（ＤＮＡ）及びリボ核酸（ＲＮＡ））であり得る。ヌクレオチドという用語は、リボヌクレオシド三リン酸アデノシン三リン酸（ａｄｅｎｏｓｉｎｅｔｒｉｐｈｏｓｐｈａｔｅ：ＡＴＰ）、ウリジン三リン酸（ｕｒｉｄｉｎｅｔｒｉｐｈｏｓｐｈａｔｅ：ＵＴＰ）、シトシン三リン酸（ｃｙｔｏｓｉｎｅｔｒｉｐｈｏｓｐｈａｔｅ：ＣＴＰ）、グアノシン三リン酸（ｇｕａｎｏｓｉｎｅｔｒｉｐｈｏｓｐｈａｔｅ：ＧＴＰ）、及びデオキシリボヌクレオシド三リン酸、例えばｄＡＴＰ、ｄＣＴＰ、ｄＩＴＰ、ｄＵＴＰ、ｄＧＴＰ、ｄＴＴＰ、又はそれらの誘導体などを含み得る。そのような誘導体には、例えば、［αＳ］ｄＡＴＰ、７－デアザ－ｄＧＴＰ及び７－デアザ－ｄＡＴＰ、並びにそれらを含有する核酸分子にヌクレアーゼ耐性を付与するヌクレオチド誘導体が含まれ得る。本明細書で使用されるヌクレオチドという用語は、ジデオキシリボヌクレオシド三リン酸（ｄｉｄｅｏｘｙｒｉｂｏｎｕｃｌｅｏｓｉｄｅｔｒｉｐｈｏｓｐｈａｔｅ：ｄｄＮＴＰ）及びそれらの誘導体を指し得る。ジデオキシリボヌクレオシド三リン酸の例示的な例には、ｄｄＡＴＰ、ｄｄＣＴＰ、ｄｄＧＴＰ、ｄｄＩＴＰ、及びｄｄＴＴＰが含まれ得るが、これらに限定されない。ヌクレオチドは、光学的に検出可能な部分（例えば、フルオロフォア）を含む部分を用いるなどして、非標識又は検出可能に標識され得る。標識はまた、量子ドットを用いて行うこともできる。検出可能な標識としては、例えば、放射性同位体、蛍光標識、化学発光標識、生物発光標識、及び酵素標識が挙げられ得る。ヌクレオチドの蛍光標識としては、限定されないが、フルオレセイン、５－カルボキシフルオレセイン（ＦＡＭ）、２’７’－ジメトキシ－４’５－ジクロロ－６－カルボキシフルオレセイン（ＪＯＥ）、ローダミン、６－カルボキシローダミン（Ｒ６Ｇ）、Ｎ，Ｎ，Ｎ’、Ｎ’－テトラメチル－６－カルボキシローダミン（ＴＡＭＲＡ）、６－カルボキシ－Ｘ－ローダミン（ＲＯＸ）、４－（４’ジメチルアミノフェニルアゾ）安息香酸（ＤＡＢＣＹＬ）、ＣａｓｃａｄｅＢｌｕｅ、ＯｒｅｇｏｎＧｒｅｅｎ、ＴｅｘａｓＲｅｄ、シアニン、及び５－（２’－アミノエチル）アミノナフタレン－１－スルホン酸（ＥＤＡＮＳ）が挙げられ得る。蛍光標識ヌクレオチドの具体例としては、カリフォルニア州フォスターシティのＰｅｒｋｉｎＥｌｍｅｒから入手可能な［Ｒ６Ｇ］ｄＵＴＰ、［ＴＡＭＲＡ］ｄＵＴＰ、［Ｒ１１０］ｄＣＴＰ、［Ｒ６Ｇ］ｄＣＴＰ、［ＴＡＭＲＡ］ｄＣＴＰ、［ＪＯＥ］ｄｄＡＴＰ、［Ｒ６Ｇ］ｄｄＡＴＰ、［ＦＡＭ］ｄｄＣＴＰ、［Ｒ１１０］ｄｄＣＴＰ、［ＴＡＭＲＡ］ｄｄＧＴＰ、［ＲＯＸ］ｄｄＴＴＰ、［ｄＲ６Ｇ］ｄｄＡＴＰ、［ｄＲ１１０］ｄｄＣＴＰ、［ｄＴＡＭＲＡ］ｄｄＧＴＰ、及び［ｄＲＯＸ］ｄｄＴＴＰ；イリノイ州アーリントンハイツのＡｍｅｒｓｈａｍから入手可能なＦｌｕｏｒｏＬｉｎｋデオキシリボヌクレオチド、ＦｌｕｏｒｏＬｉｎｋＣｙ３－ｄＣＴＰ、ＦｌｕｏｒｏＬｉｎｋＣｙ５－ｄＣＴＰ、ＦｌｕｏｒｏＬｉｎｋＦｌｕｏｒＸ－ｄＣＴＰ、ＦｌｕｏｒｏＬｉｎｋＣｙ３－ｄＵＴＰ、及びＦｌｕｏｒｏＬｉｎｋＣｙ５－ｄＵＴＰ；インディアナ州インディアナポリスのＢｏｅｈｒｉｎｇｅｒＭａｎｎｈｅｉｍから入手可能なフルオレセイン－１５－ｄＡＴＰ、フルオレセイン－１２－ｄＵＴＰ、テトラメチル－ローダミン－６－ｄＵＴＰ、ＩＲ７７０－９－ｄＡＴＰ、フルオレセイン－１２－ｄｄＵＴＰ、フルオレセイン－１２－ＵＴＰ、及びフルオレセイン－１５－２’－ｄＡＴＰ；並びにオレゴン州ユージーンのＭｏｌｅｃｕｌａｒＰｒｏｂｅｓから入手可能なＢＯＤＩＰＹ－ＦＬ－１４－ＵＴＰ、ＢＯＤＩＰＹ－ＦＬ－４－ＵＴＰ、ＢＯＤＩＰＹ－ＴＭＲ－１４－ＵＴＰ、ＢＯＤＩＰＹ－ＴＭＲ－１４－ｄＵＴＰ、ＢＯＤＩＰＹ－ＴＲ－１４－ＵＴＰ、ＢＯＤＩＰＹ－ＴＲ－１４－ｄＵＴＰ、ＣａｓｃａｄｅＢｌｕｅ－７－ＵＴＰ、ＣａｓｃａｄｅＢｌｕｅ－７－ｄＵＴＰ、フルオレセイン－１２－ＵＴＰ、フルオレセイン－１２－ｄＵＴＰ、ＯｒｅｇｏｎＧｒｅｅｎ４８８－５－ｄＵＴＰ、ＲｈｏｄａｍｉｎｅＧｒｅｅｎ－５－ＵＴＰ、ＲｈｏｄａｍｉｎｅＧｒｅｅｎ－５－ｄＵＴＰ、テトラメチルローダミン－６－ＵＴＰ、テトラメチルローダミン－６－ｄＵＴＰ、ＴｅｘａｓＲｅｄ－５－ＵＴＰ、ＴｅｘａｓＲｅｄ－５－ｄＵＴＰ、及びＴｅｘａｓＲｅｄ－１２－ｄＵＴＰを挙げることができる。ヌクレオチドはまた、化学修飾によって標識又はマーキングされ得る。化学修飾された単一ヌクレオチドは、ビオチン－ｄＮＴＰであり得る。ビオチン化ｄＮＴＰのいくつかの非限定的な例としては、ビオチン－ｄＡＴＰ（例えば、ビオ－Ｎ６－ｄｄＡＴＰ、ビオチン－１４－ｄＡＴＰ）、ビオチン－ｄＣＴＰ（例えば、ビオチン－１１－ｄＣＴＰ、ビオチン－１４－ｄＣＴＰ）、及びビオチン－ｄＵＴＰ（例えば、ビオチン－１１－ｄＵＴＰ、ビオチン－１６－ｄＵＴＰ、ビオチン－２０－ｄＵＴＰ）を挙げることができる。

「ポリヌクレオチド」、「オリゴヌクレオチド」、及び「核酸」という用語は、概して、一本鎖形態、二本鎖形態、又は複数鎖形態のいずれかの、デオキシリボヌクレオチド若しくはリボヌクレオチド、又はそれらの類似体のいずれかの任意の長さのヌクレオチドのポリマー形態を指すために、互換的に使用される。ポリヌクレオチドは細胞に対して外因性又は内因性であり得る。ポリヌクレオチドは無細胞環境に存在し得る。ポリヌクレオチドは遺伝子又はその断片であり得る。ポリヌクレオチドはＤＮＡであり得る。ポリヌクレオチドはＲＮＡであり得る。ポリヌクレオチドは、任意の三次元構造を有していてもよく、任意の機能を果たしていてもよい。ポリヌクレオチドは、１つ以上の類似体（例えば、変更されたバックボーン、糖、又は核酸塩基）を含み得る。存在する場合、ヌクレオチド構造に対する修飾は、ポリマーの組み立ての前又は後に付与され得る。類似体のいくつかの非限定的な例としては、５－ブロモウラシル、ペプチド核酸、異種核酸、モルホリノ、ロックド核酸、グリコール核酸、トレオース核酸、ジデオキシヌクレオチド、コーディセピン、７－デアザ－ＧＴＰ、フルオロフォア（例えば、糖に連結されたローダミン又はフルオレセイン）、チオール含有ヌクレオチド、ビオチン結合ヌクレオチド、蛍光塩基類似体、ＣｐＧアイランド、メチル－７－グアノシン、メチル化ヌクレオチド、イノシン、チオウリジン、プソイドウリジン、ジヒドロウリジン、キューオシン、及びワイオシンが挙げられる。ポリヌクレオチドの非限定的な例としては、遺伝子又は遺伝子断片のコード領域又は非コード領域、連鎖分析から定義される遺伝子座（複数）（遺伝子座（単数））、エクソン、イントロン、メッセンジャＲＮＡ（ｍＲＮＡ）、トランスファＲＮＡ（ｔＲＮＡ）、リボソームＲＮＡ（ｒＲＮＡ）、短鎖干渉ＲＮＡ（ｓｉＲＮＡ）、ショートヘアピンＲＮＡ（ｓｈＲＮＡ）、マイクロＲＮＡ（ｍｉＲＮＡ）、リボザイム、ｃＤＮＡ、組換えポリヌクレオチド、分枝ポリヌクレオチド、プラスミド、ベクター、任意の配列の単離されたＤＮＡ、任意の配列の単離されたＲＮＡ、無細胞ＤＮＡ（ｃｆＤＮＡ）及び無細胞ＲＮＡ（ｃｆＲＮＡ）を含む無細胞ポリヌクレオチド、核酸プローブ、及びプライマが挙げられる。ヌクレオチドの配列は、非ヌクレオチド構成成分によって中断され得る。

「トランスフェクション」又は「トランスフェクトされた」という用語は、概して、非ウイルス又はウイルスベースの方法による細胞への核酸の導入を指す。核酸分子は、完全なタンパク質又はその機能的部分をコードする遺伝子配列であり得る。例えば、Ｓａｍｂｒｏｏｋら、１９８９年、「ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ」、第１８．１～１８．８８頁を参照されたい。

「ペプチド」、「ポリペプチド」、及び「タンパク質」という用語は、概して、ペプチド結合（複数可）によって連結された少なくとも２つのアミノ酸残基のポリマーを指すために本明細書で互換的に使用される。この用語は、特定の長さのポリマーを暗示するものではなく、またペプチドが、組換え技術、化学合成、若しくは酵素合成を用いて産生されるか、又は天然に存在するかを、暗示又は区別することを意図するものでもない。この用語は、天然に存在するアミノ酸ポリマー、及び少なくとも１つの修飾アミノ酸を含むアミノ酸ポリマーに適用される。場合によっては、ポリマーは非アミノ酸によって中断され得る。この用語は、全長タンパク質、並びに二次及び／又は三次構造（例えば、ドメイン）を有する又は有しないタンパク質を含む、任意の長さのアミノ酸鎖を含む。この用語はまた、例えば、ジスルフィド結合形成、グリコシル化、脂質化、アセチル化、リン酸化、酸化、及び標識構成成分とのコンジュゲーションなどの任意の他の操作によって修飾されているアミノ酸ポリマーを包含する。本明細書で使用される場合、「アミノ酸（単数）」及び「アミノ酸（複数）」という用語は、概して、修飾アミノ酸及びアミノ酸類似体を含む天然及び非天然アミノ酸を指すが、これらに限定するものではない。修飾アミノ酸として天然アミノ酸及び非天然アミノ酸が含まれてもよく、これらは、アミノ酸上に天然に存在しない基又は化学部分を含むように化学的に修飾されている。アミノ酸類似体は、アミノ酸誘導体を指してもよい。「アミノ酸」という用語は、Ｄ－アミノ酸とＬ－アミノ酸との両方を含む。

本明細書で使用される場合、「非天然」とは、概して、天然の核酸又はタンパク質には見られない核酸又はポリペプチド配列を指すことができる。非天然はアフィニティタグを指し得る。非天然とは融合物を指し得る。非天然とは、突然変異、挿入、及び／又は欠失を含む、天然に存在する核酸又はポリペプチド配列を指し得る。非天然配列は、非天然配列が融合される核酸及び／又はポリペプチド配列によってもまた提示され得る活性（例えば、酵素活性、メチルトランスフェラーゼ活性、アセチルトランスフェラーゼ活性、キナーゼ活性、ユビキチン化活性等）を、呈し得る及び／又はコードし得る。非天然核酸又はポリペプチド配列は、キメラ核酸及び／又はポリペプチドをコードするキメラ核酸及び／又はポリペプチド配列を生成するために、遺伝子工学によって天然に存在する核酸又はポリペプチド配列（又はそのバリアント）に連結され得る。

本明細書で使用される場合、「プロモーター」という用語は、概して、遺伝子の転写又は発現を制御し、ＲＮＡ転写が開始されるヌクレオチド又はヌクレオチドの領域に隣接して又はそれと重複して位置し得る調節ＤＮＡ領域を指す。プロモーターは、ＲＮＡポリメラーゼのＤＮＡへの結合を促進して遺伝子転写をもたらす、転写因子と称されることが多いタンパク質因子に結合する特異的ＤＮＡ配列を含有し得る。「コアプロモーター」とも称される「基本プロモーター」は、概して、動作可能に連結されたポリヌクレオチドの転写発現を促進するために必要な全ての基本要素を含有するプロモーターを指し得る。真核生物の基本プロモーターは、必ずしもそうとは限らないが、典型的には、ＴＡＴＡボックス及び／又はＣＡＡＴボックスを含有する。

本明細書で使用される場合、「発現」という用語は、概して、核酸配列又はポリヌクレオチドがＤＮＡ鋳型から（ｍＲＮＡ又は他のＲＮＡ転写物などに）転写されるプロセス、及び／又は転写されたｍＲＮＡが、続いて、ペプチド、ポリペプチド、又はタンパク質へと翻訳されるプロセスを指す。転写物及びコードされたポリペプチドは、集合的に「遺伝子産物」と称され得る。ポリヌクレオチドがゲノムＤＮＡに由来する場合、発現は、真核細胞におけるｍＲＮＡのスプライシングを含み得る。

本明細書で使用される場合、「動作可能に連結された（ｏｐｅｒａｂｌｙｌｉｎｋｅｄ）」、「動作可能な連結」、「動作可能に連結された（ｏｐｅｒａｔｉｖｅｌｙｌｉｎｋｅｄ）」、又はそれらの文法上の等価物は、概して、遺伝子要素、例えば、プロモーター、エンハンサー、ポリアデニル化配列等の並置を指し、当該要素は、それらが予想される様式で動作することを可能にする関係にある。例として、プロモーター配列及び／又はエンハンサ配列を含み得る調節要素は、調節要素がコード配列の転写の開始を助ける場合、コード領域へと動作可能に連結される。この機能的関係が維持される限り、調節要素とコード領域との間に介在残基が存在し得る。

本明細書で使用される場合、「ベクター」とは、概して、ポリヌクレオチドを含むか又はポリヌクレオチドと会合し、細胞へのポリヌクレオチドの送達を媒介するために使用され得る、高分子又は高分子の会合体を指す。ベクターの例としては、プラスミド、ウイルスベクター、リポソーム、及び他の遺伝子送達ビヒクルが挙げられる。ベクターは、概して、標的における遺伝子の発現を促進するために遺伝子へと動作可能に連結された、遺伝子要素、例えば調節要素を含む。

本明細書で使用される場合、「発現カセット」及び「核酸カセット」は、概して、一緒に発現されるか、又は発現のために動作可能に連結される、核酸配列又は要素の組合せを指すために互換的に使用される。場合によっては、発現カセットは、調節要素と、それらが発現のために動作可能に連結される１つ又は複数の遺伝子との組合せを指す。

ＤＮＡ又はタンパク質配列の「機能的断片」とは、概して、全長ＤＮＡ又はタンパク質配列の生物学的活性と実質的に同様である生物学的活性（機能的又は構造的のいずれか）を保持する断片を指す。ＤＮＡ配列の生物学的活性は、全長配列に起因することが知られている様式で発現に影響を及ぼすその能力であり得る。

本明細書で使用される場合、「操作された」物体とは、概して、物体が人間の介入によって変更されたことを示す。非限定的な例によれば、核酸は、その配列を天然には存在しない配列へと変更することによって修飾され得る。核酸は、ライゲーションされた産物が元の核酸に存在しない機能を有するように、それが天然では会合しない核酸へとライゲーションすることによって修飾され得る。操作された核酸は、天然に存在しない配列を用いてインビトロで合成され得る。タンパク質は、そのアミノ酸配列を天然には存在しない配列へと変更することによって修飾され得る。操作されたタンパク質は、新しい機能又は特性を獲得し得る。「操作された」システムは、少なくとも１つの操作された構成成分を含む。

本明細書で使用される場合、「合成」及び「人工」は、天然に存在するヒトタンパク質に対して、低い配列同一性（例えば、５０％未満の配列同一性、２５％未満の配列同一性、１０％未満の配列同一性、５％未満の配列同一性、１％未満の配列同一性）を有する、タンパク質又はそのドメインを指すように互換的に使用される。例えば、ＶＰＲドメイン及びＶＰ６４ドメインは合成トランス活性化ドメインである。

本明細書で使用される場合、「ｔｒａｃｒＲＮＡ」又は「ｔｒａｃｒ配列」という用語は、概して、野生型の例示的なｔｒａｃｒＲＮＡ配列（例えば、化膿性連鎖球菌（Ｓ．ｐｙｏｇｅｎｅｓ）黄色ブドウ球菌（Ｓ．ａｕｒｅｕｓ）等に由来するｔｒａｃｒＲＮＡ、又は配列番号５４７６～５５１１）に対して、少なくとも約５％、１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、９５％、若しくは１００％の配列同一性及び／又は配列類似性を有する核酸を指すことができる。ｔｒａｃｒＲＮＡは、野生型の例示的なｔｒａｃｒＲＮＡ配列（例えば、化膿性連鎖球菌（Ｓ．ｐｙｏｇｅｎｅｓ）黄色ブドウ球菌（Ｓ．ａｕｒｅｕｓ）等に由来するｔｒａｃｒＲＮＡ）に対して、最大で約５％、１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、若しくは１００％の配列同一性及び／又は配列類似性を有する核酸を指すことができる。ｔｒａｃｒＲＮＡは、欠失、挿入、又は置換、バリアント、突然変異、又はキメラなどのヌクレオチド変化を含むことができるｔｒａｃｒＲＮＡの修飾形態を指し得る。ｔｒａｃｒＲＮＡは、少なくとも６個の連続するヌクレオチドのストレッチにわたって野生型の例示的ｔｒａｃｒＲＮＡ（例えば、化膿性連鎖球菌（Ｓ．ｐｙｏｇｅｎｅｓ）黄色ブドウ球菌（Ｓ．ａｕｒｅｕｓ）等に由来するｔｒａｃｒＲＮＡ）配列に対して、少なくとも約６０％同一であり得る核酸を指してもよい。例えば、ｔｒａｃｒＲＮＡ配列は、少なくとも６個の連続するヌクレオチドのストレッチにわたって、野生型の例示的ｔｒａｃｒＲＮＡ（例えば、化膿性連鎖球菌（Ｓ．ｐｙｏｇｅｎｅｓ）黄色ブドウ球菌（Ｓ．ａｕｒｅｕｓ）等に由来するｔｒａｃｒＲＮＡ）配列に対して、少なくとも約６０％同一、少なくとも約６５％同一、少なくとも約７０％同一、少なくとも約７５％同一、少なくとも約８０％同一、少なくとも約８５％同一、少なくとも約９０％同一、少なくとも約９５％同一、少なくとも約９８％同一、少なくとも約９９％同一、又は１００％同一であり得る。ＩＩ型ｔｒａｃｒＲＮＡ配列は、隣接するＣＲＩＳＰＲアレイにおいてリピート配列の一部と相補性を有する領域を同定することによってゲノム配列上で予測することができる。

本明細書で使用される場合、「ガイド核酸」とは、概して、別の核酸にハイブリダイズし得る核酸を指すことができる。ガイド核酸はＲＮＡであり得る。ガイド核酸はＤＮＡであり得る。ガイド核酸は、核酸の配列に部位特異的に結合するようにプログラムされ得る。標的化される核酸、又は標的核酸は、ヌクレオチドを含み得る。ガイド核酸はヌクレオチドを含み得る。標的核酸の一部はガイド核酸の一部と相補的であり得る。ガイド核酸に相補的であり、かつガイド核酸とハイブリダイズする二本鎖標的ポリヌクレオチドの鎖は、相補鎖と称され得る。相補鎖に相補的であり、したがってガイド核酸に相補的でない可能性がある二本鎖標的ポリヌクレオチドの鎖は、非相補鎖と呼ばれ得る。ガイド核酸は、ポリヌクレオチド鎖を含んでもよく、「シングルガイド核酸」と呼ばれ得る。ガイド核酸は、２つのポリヌクレオチド鎖を含んでもよく、「ダブルガイド核酸」と呼ばれ得る。特に明記しない限り、「ガイド核酸」という用語は、シングルガイド核酸及びダブルガイド核酸の両方を指す包括的なものであり得る。ガイド核酸は、「核酸標的化セグメント」又は「核酸標的化配列」と称され得るセグメントを含み得る。核酸標的化セグメントは、「タンパク質結合セグメント」又は「タンパク質結合配列」又は「Ｃａｓタンパク質結合セグメント」と称され得るサブセグメントを含み得る。

２つ以上の核酸又はポリペプチド配列の文脈における「配列同一性」又は「同一性パーセント」という用語は、概して、配列比較アルゴリズムを用いて測定した際に局所的又は全体的な比較ウィンドウにわたり比較し、かつ最大対応で整列させた場合、同じであるか、又は同じであるアミノ酸残基若しくはヌクレオチドの指定された割合を有する、２つ（例えば、対のアライメントにおいて）以上（例えば、多重配列アラインメントにおいて）の配列を指す。ポリペプチド配列に好適な配列比較アルゴリズムとしては、例えば、３のワード長、１０の期待値Ｉのパラメータを用いる、及び１１の存在、１の拡張におけるＢＬＯＳＵＭ６２スコアリングマトリックス設定ギャップコスト、及び３０残基より長いポリペプチド配列の条件付き組成スコアマトリックス調整を用いる、ＢＬＡＳＴＰを含む。２のワード長（Ｗ）、１００００００の期待値（Ｅ）、及びＰＡＭ３０スコアリングマトリックス設定ギャップのパラメータを用いるＢＬＡＳＴＰは、３０残基未満の配列に対して、ギャップを開くために９の、ギャップを拡張するために１のコストがかかる（これらは、ｈｔｔｐｓ：／／ｂｌａｓｔ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖで利用可能な一組のＢＬＡＳＴにおけるＢＬＡＳＴのデフォルトパラメータである）；２の一致、－１の不一致、－１のギャップのパラメータを持つＳｍｉｔｈ－Ｗａｔｅｒｍａｎ相同性検索アルゴリズム；デフォルトパラメータを有するＭＵＳＣＬＥ；２のリツリー（ｒｅｔｒｅｅ）及び１０００のパラメータを有するＭＡＦＦＴ；デフォルトパラメータを有するＮｏｖａｆｏｌｄ；をデフォルトパラメータを有するＨＭＭＥＲｈｍｍａｌｉｇｎのパラメータを有するＣＬＵＳＴＡＬＷ。

本開示には、１つ以上の保存的アミノ酸置換を有する本明細書に記載の酵素のいずれかのバリアントが含まれる。そのような保存的置換は、ポリペプチドの三次元構造又は機能を破壊することなく、ポリペプチドのアミノ酸配列において行うことができる。保存的置換は、類似の疎水性、極性、及びＲ鎖長を有するアミノ酸を互いに置換することによって達成することができる。追加的又は代替的に、異なる種由来の相同タンパク質の整列した配列を比較することによって、コードされたタンパク質の基本的機能を変更することなく、種間で突然変異しているアミノ酸残基（例えば、非保存残基）を配置することによって保存的置換を同定することができる。そのような保存的に置換されたバリアントは、本明細書に記載のエンドヌクレアーゼタンパク質配列（例えば、本明細書中に記載のＭＧ１、ＭＧ２、ＭＧ３、ＭＧ４、ＭＧ６、ＭＧ７、ＭＧ１４、ＭＧ１５、ＭＧ１６、ＭＧ１８、ＭＧ２１、ＭＧ２２、又はＭＧ２３ファミリーエンドヌクレアーゼ）のいずれか１つに対して、少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％の同一性を有するバリアントを含み得る。いくつかの実施形態では、そのような保存的置換バリアントは、機能的バリアントである。そのような機能的バリアントは、エンドヌクレアーゼの重要な活性部位残基の活性が破壊されないような置換を有する配列を包含し得る。いくつかの実施形態では、本明細書に記載されるタンパク質のいずれかの機能的バリアントは、図６、図７、図８、図９Ａ、図９Ｂ、図９Ｃ、図９Ｄ、図９Ｅ、図９Ｆ、図９Ｇ、又は図９Ｈにおいて称される保存又は機能的残基の少なくとも１つの置換を欠く。いくつかの実施形態では、本明細書に記載されるタンパク質のいずれかの機能的バリアントは、図６、図７、図８、図９Ａ、図９Ｂ、図９Ｃ、図９Ｄ、図９Ｅ、図９Ｆ、図９Ｇ、又は図９Ｈにおいて称される保存又は機能的残基の全ての置換を欠く。

機能的に類似するアミノ酸を提供する保存的置換表は、様々な参考文献から入手可能である（例えば、Ｃｒｅｉｇｈｔｏｎ、「Ｐｒｏｔｅｉｎｓ：ＳｔｒｕｃｔｕｒｅｓａｎｄＭｏｌｅｃｕｌａｒＰｒｏｐｅｒｔｉｅｓ」（ＷＨＦｒｅｅｍａｎ＆Ｃｏ．；第２版（１９９３年１２月））。以下の８つの群は、各々、互いに保存的置換であるアミノ酸を含有する。
（１）アラニン（Ａ）、グリシン（Ｇ）；
（２）アスパラギン酸（Ｄ）、グルタミン酸（Ｅ）；
（３）アスパラギン（Ｎ）、グルタミン（Ｑ）；
（４）アルギニン（Ｒ）、リジン（Ｋ）；
（５）イソロイシン（Ｉ）、ロイシン（Ｌ）、メチオニン（Ｍ）、バリン（Ｖ）；
（６）フェニルアラニン（Ｆ）、チロシン（Ｙ）、トリプトファン（Ｗ）；
（７）セリン（Ｓ）、トレオニン（Ｔ）；及び
（８）システイン（Ｃ）、メチオニン（Ｍ）

本明細書で使用される場合、用語「ＲｕｖＣ＿ＩＩＩドメイン」とは、概して、ＲｕｖＣエンドヌクレアーゼドメイン（ＲｕｖＣヌクレアーゼドメインは、３つの不連続なセグメント、ＲｕｖＣ＿Ｉ、ＲｕｖＣ＿ＩＩ、及びＲｕｖＣ＿ＩＩＩから構成される）の第３の不連続なセグメントのことを指す。ＲｕｖＣドメイン又はそのセグメントは、概して、既知のドメイン配列へのアラインメントによって、アノテーションされたドメインを有するタンパク質への構造アラインメントによって、又は既知のドメイン配列に基づいて構築された隠れマルコフモデル（ＨｉｄｄｅｎＭａｒｋｏｖＭｏｄｅｌ：ＨＭＭ）との比較によって、同定することができる（例えば、ＲｕｖＣ＿ＩＩＩについてはＰｆａｍＨＭＭＰＦ１８５４１）。

本明細書で使用される場合、「ＨＮＨドメイン」という用語は、概して、特徴的なヒスチジン残基及びアスパラギン残基を有するエンドヌクレアーゼドメインを指す。ＨＮＨドメインは、概して、既知のドメイン配列へのアラインメントによって、アノテーションされたドメインを有するタンパク質への構造アラインメントによって、又は既知のドメイン配列に基づいて構築された隠れマルコフモデル（ＨｉｄｄｅｎＭａｒｋｏｖＭｏｄｅｌ：ＨＭＭ）との比較によって、同定することができる（例えば、ドメインＨＮＨについてはＰｆａｍＨＭＭＰＦ０１８４４）。

概要

独特の機能性及び構造を有する新規Ｃａｓ酵素の発見は、デオキシリボ核酸（ＤＮＡ）編集技術を更に破壊し、速度、特異性、機能性、及び使いやすさを改善する可能性を提供し得る。微生物におけるクラスター化して規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）システムの予測される有病率、及び微生物種の全くの多様性と比較して、文献において、機能的に特徴付けられたＣＲＩＳＰＲ／Ｃａｓ酵素は比較的少ない。これは、膨大な数の微生物種が実験室条件下において容易に培養されない可能性があるためである。多数の微生物種を表す天然の環境ニッチからのメタゲノムシーケンシングは、公知の新しいＣＲＩＳＰＲ／Ｃａｓシステムの数を劇的に増加させ、かつ新しいオリゴヌクレオチド編集機能の発見を加速する可能性を提供し得る。そのようなアプローチの有益性の最近の例は、天然の微生物コミュニティのメタゲノム分析からのＣａｓＸ／ＣａｓＹＣＲＩＳＰＲシステムの２０１６年の発見によって実証されている。

ＣＲＩＳＰＲ／Ｃａｓシステムは、微生物において適応免疫システムとして機能することが記載されているＲＮＡ指向性ヌクレアーゼ複合体である。それらの自然な状況では、ＣＲＩＳＰＲ／Ｃａｓシステムは、ＣＲＩＳＰＲ（クラスター化して規則的な配置の短い回文配列リピート）オペロン又は遺伝子座において生じ、これらは概して、２つの部分：（ｉ）ＲＮＡベースの標的化要素をコードする、等しく短いスペーサー配列によって隔てられた短い反復配列のアレイ（３０～４０ｂｐ）、及び（ｉｉ）アクセサリタンパク質／酵素と共にＲＮＡベースの標的化要素によって誘導されるヌクレアーゼポリペプチドをコードするＣａｓをコードするＯＲＦを含む。特定の標的核酸配列の効率的なヌクレアーゼ標的化は、概して、（ｉ）標的の最初の６～８個の核酸（標的シード）とｃｒＲＮＡガイドとの間の相補的ハイブリダイゼーション、及び（ｉｉ）標的シードの定義された近傍内にプロトスペーサー隣接モチーフ（ＰＡＭ）配列が存在すること（ＰＡＭは、通常、宿主ゲノム内で一般的に表されない配列である）の両方を必要とする。システムの正確な機能及び構成に応じて、ＣＲＩＳＰＲ－Ｃａｓシステムは、一般に、共有された機能的特徴及び進化的類似性に基づいて、２つのクラス、５つのタイプ（型）、及び１６のサブタイプに組織化される。

クラスＩのＣＲＩＳＰＲ－Ｃａｓシステムは、大きなマルチサブユニットエフェクター複合体を有し、Ｉ型（タイプＩ）、ＩＩＩ型（タイプＩＩＩ）、及びＩＶ型（タイプＩＶ）を含む。

Ｉ型ＣＲＩＳＰＲ－Ｃａｓシステムは、構成成分に関して中程度の複雑さを有すると考えられる。Ｉ型ＣＲＩＳＰＲ－Ｃａｓシステムでは、ＲＮＡ標的化要素のアレイは、核酸標的は、プロトスペーサー隣接モチーフ（ＰＡＭ）と呼ばれる好適な短いコンセンサス配列が続く場合にヌクレアーゼ複合体を核酸標的に向ける、短い成熟ｃｒＲＮＡを遊離させるようにリピート要素でプロセシングされる長い前駆体ｃｒＲＮＡ（ｐｒｅ－ｃｒＲＮＡ）として転写され、このプロセシングは、ｃｒＲＮＡ指向型ヌクレアーゼ複合体のヌクレアーゼ（Ｃａｓ３）タンパク質構成成分もまた含む、カスケードと呼ばれる大きなエンドヌクレアーゼ複合体のエンドリボヌクレアーゼサブユニット（Ｃａｓ６）を介して起こる。ＣａｓＩヌクレアーゼは主にＤＮＡヌクレアーゼとして機能する。

ＩＩＩ型ＣＲＩＳＰＲシステムは、Ｃｓｍ又はＣｍｒタンパク質サブユニットを含むリピート関連ミステリアスタンパク質（ｒｅｐｅａｔ－ａｓｓｏｃｉａｔｅｄｍｙｓｔｅｒｉｏｕｓｐｒｏｔｅｉｎ：ＲＡＭＰ）と共に、Ｃａｓ１０として知られる中央ヌクレアーゼの存在を特徴とし得る。Ｉ型システムと同様に、成熟ｃｒＲＮＡは、Ｃａｓ６様酵素を用いてｐｒｅ－ｃｒＲＮＡからプロセシングされる。Ｉ型及びＩＩ型システムとは異なり、ＩＩＩ型システムは、ＤＮＡ－ＲＮＡ二重鎖（ＲＮＡポリメラーゼの鋳型として使用されているＤＮＡ鎖など）を標的とし、かつ切断するようである。

ＩＶ型ＣＲＩＳＰＲ－Ｃａｓシステムは、高度に還元された大サブユニットヌクレアーゼ（ｃｓｆ１）と、Ｃａｓ５（ｃｓｆ３）及びＣａｓ７（ｃｓｆ２）群のＲＡＭＰタンパク質に対する２つの遺伝子と、場合によっては、予測される小サブユニットに対する遺伝子と、からなるエフェクター複合体を保有する。そのようなシステムは、内因性プラスミドに一般的に見られる。

クラスＩＩのＣＲＩＳＰＲ－Ｃａｓシステムは、概して、単一ポリペプチドマルチドメインヌクレアーゼエフェクターを有し、ＩＩ型（タイプＩＩ）、Ｖ型（タイプＶ）、及びＶＩ型（タイプＶＩ）を含む。

ＩＩ型ＣＲＩＳＰＲ－Ｃａｓシステムは、構成成分に関して最も単純であると考えられている。ＩＩ型ＣＲＩＳＰＲ－Ｃａｓシステムでは、ＣＲＩＳＰＲアレイの成熟ｃｒＲＮＡへのプロセシングは、特別なエンドヌクレアーゼサブユニットの存在を必要とせず、むしろアレイリピート配列に相補的な領域を有する小さなトランスコードｃｒＲＮＡ（ｔｒａｃｒＲＮＡ）の存在を必要とする。このｔｒａｃｒＲＮＡは、その対応するエフェクターヌクレアーゼ（例えば、Ｃａｓ９）及びリピート配列の両方と相互作用して前駆体ｄｓＲＮＡ構造を形成し、これは、内因性ＲＮＡｓｅＩＩＩによって切断されて、ｔｒａｃｒＲＮＡ及びｃｒＲＮＡの両方が負荷された成熟エフェクター酵素を生成する。ＣａｓＩＩヌクレアーゼはＤＮＡヌクレアーゼとして知られている。２型エフェクターは、概して、ＲｕｖＣ様ヌクレアーゼドメインのフォールド内に挿入された、無関係なＨＮＨヌクレアーゼドメインを有するＲＮａｓｅＨフォールドを採用するＲｕｖＣ様エンドヌクレアーゼドメインからなる構造を呈する。ＲｕｖＣ様ドメインは、標的（例えば、ｃｒＲＮＡ相補的）ＤＮＡ鎖の切断を担い、一方でＨＮＨドメインは、置き換えられたＤＮＡ鎖の切断を担う。

Ｖ型ＣＲＩＳＰＲ－Ｃａｓシステムは、ＲｕｖＣ様ドメインを含む、ＩＩ型エフェクターのものと同様のヌクレアーゼエフェクター（例えば、Ｃａｓ１２）構造を特徴とする。ＩＩ型と同様に、ほとんどの（全てではないが）Ｖ型ＣＲＩＳＰＲシステムは、プレｃｒＲＮＡを成熟ｃｒＲＮＡにプロセシングするためにｔｒａｃｒＲＮＡを使用する。しかしながら、プレｃｒＲＮＡを複数のｃｒＲＮＡへと切断するためにＲＮＡｓｅＩＩＩを必要とするＩＩ型システムとは異なり、Ｖ型システムは、エフェクターヌクレアーゼ自体を用いてｐｒｅ－ｃｒＲＮＡを切断することができる。ＩＩ型ＣＲＩＳＰＲ－Ｃａｓシステムと同様に、Ｖ型ＣＲＩＳＰＲ－Ｃａｓシステムは、やはりＤＮＡヌクレアーゼとして知られている。ＩＩ型ＣＲＩＳＰＲ－Ｃａｓシステムとは異なり、いくつかのＶ型酵素（例えば、Ｃａｓ１２ａ）は、二本鎖標的配列の最初のｃｒＲＮＡ指向性切断によって活性化される、堅牢な一本鎖非特異的デオキシリボヌクレアーゼ活性を有するようである。

ＶＩ型ＣＲＩＰＳＲ－Ｃａｓシステムは、ＲＮＡガイドＲＮＡエンドヌクレアーゼを有する。ＲｕｖＣ様ドメインの代わりに、ＶＩ型システムの単一ポリペプチドエフェクター（例えば、Ｃａｓ１３）は、２つのＨＥＰＮリボヌクレアーゼドメインを含む。ＩＩ型システム及びＶ型システムのどちらとも異なり、ＶＩ型システムはまた、ｐｒｅ－ｃｒＲＮＡをｃｒＲＮＡにプロセシングするためのｔｒａｃｒＲＮＡを必要としないようである。しかしながら、Ｖ型システムと同様に、いくつかのＶＩ型システム（例えば、Ｃ２Ｃ２）は、標的ＲＮＡの最初のｃｒＲＮＡ指向性切断によって活性化される堅牢な一本鎖非特異的ヌクレアーゼ（リボヌクレアーゼ）活性を有するようである。

それらのより単純な構造のために、クラスＩＩのＣＲＩＳＰＲ－Ｃａｓは、設計者ヌクレアーゼ／ゲノム編集用途として工学及び開発に最も広く採用されている。

インビトロ使用のためのそのようなシステムの初期の用途の１つは、Ｊｉｎｅｋら（「Ｓｃｉｅｎｃｅ．」、２０１２年８月１７日；第３３７巻（第６０９６号）：第８１６～２１頁、参照によりその全体が本明細書に組み込まれる）に見出すことができる。Ｊｉｎｅｋの研究は、最初に、（ｉ）化膿性連鎖球菌（Ｓ．ｐｙｏｇｅｎｅｓ）ＳＦ３７０から単離された組換え発現された精製全長Ｃａｓ９（例えば、クラスＩＩの、ＩＩ型Ｃａｓ酵素）、（ｉｉ）切断が望まれる標的ＤＮＡ配列に相補的な５’の約２０ｎｔを担持する精製された成熟約４２ｎｔ、続いて３’のｔｒａｃｒ結合配列（全ｃｒＲＮＡは、Ｔ７プロモーター配列を保有する合成ＤＮＡ鋳型からインビトロ転写される）、（ｉｉｉ）Ｔ７プロモーター配列を保有する合成ＤＮＡ鋳型からインビトロ転写された精製ｔｒａｃｒＲＮＡ、及び（ｉｖ）Ｍｇ２＋を含むシステムが記載された。Ｊｉｎｅｋは、後に、（ｉｉ）のｃｒＲＮＡがリンカー（例えば、ＧＡＡＡ）によって（ｉｉｉ）の５’末端に連結されて、Ｃａｓ９を単独で標的に誘導することができる単一の融合合成ガイドＲＮＡ（ｓｇＲＮＡ）を形成する、改良され操作されたシステムを記載した（図２の上部パネルと下部パネルとを比較）。

参照により全体が本明細書に組み込まれるＭａｌｉら（「Ｓｃｉｅｎｃｅ．」、２０１３年２月１５日；第３３９巻（第６１２１号）：第８２３～８２６頁）は、後に、（ｉ）Ｃ末端核局在化配列（例えば、ＳＶ４０ＮＬＳ）及び好適なポリアデニル化シグナル（例えば、ＴＫｐＡシグナル）を有する好適な哺乳動物プロモーター下におけるコドン最適化Ｃａｓ９（例えば、クラスＩＩタイプＩＩＣａｓ酵素）をコードするＯＲＦ、及び（ｉｉ）好適なポリメラーゼＩＩＩプロモーター（例えば、Ｕ６プロモーター）下におけるｓｇＲＮＡ（Ｇで始まる５’配列と、その後に続く３’のｔｒａｃｒ結合配列に連結された２０ｎｔの相補的標的化核酸配列、リンカー、及びｔｒａｃｒＲＮＡ配列）をコードするＯＲＦをコードするＤＮＡベクターを提供することによって、哺乳動物細胞における使用のためにこのシステムを適合させた。

ＭＧ酵素

一態様では、本開示は、メタゲノムシーケンシングによって発見された操作されたヌクレアーゼシステムを提供する。場合によっては、メタゲノムシーケンシングは、試料に対して行われる。場合によっては、試料は、様々な環境によって収集され得る。そのような環境は、ヒト微生物叢、動物微生物叢、高温の環境、低温の環境であり得る。そのような環境は沈殿物を含み得る。本明細書に記載の操作されたヌクレアーゼシステムのそのような環境の種類の例は、図４５に見出すことができる。

ＭＧ１酵素

一態様では、本開示は、（ａ）エンドヌクレアーゼを含む、操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼは、Ｃａｓエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、ＩＩ型、クラスＩＩのＣａｓエンドヌクレアーゼである。エンドヌクレアーゼはＲｕｖＣ＿ＩＩＩドメインを含んでもよく、当該ＲｕｖＣ＿ＩＩＩドメインは、配列番号１８２７～２１４０のいずれか１つに対して少なくとも約７０％の配列同一性を有する。場合によっては、エンドヌクレアーゼはＲｕｖＣ＿ＩＩＩドメインを含んでもよく、ここで、ＲｕｖＣ＿ＩＩＩドメインは、配列番号１８２７～２１４０のいずれか１つに対して、少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％の同一性を有する。場合によっては、エンドヌクレアーゼは、配列番号１８２７～２１４０のいずれか１つと実質的に同一であるＲｕｖＣ＿ＩＩＩドメインを含み得る。エンドヌクレアーゼは、配列番号１８２７～１８３１のいずれか１つに対して少なくとも約７０％の配列同一性を有するＲｕｖＣ＿ＩＩＩドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号１８２７～１８３１のいずれか１つに対して、少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％の同一性を有するＲｕｖＣ＿ＩＩＩドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号１８２７～１８３１のいずれか１つと実質的に同一のＲｕｖＣ＿ＩＩＩドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号１８２７に対して、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％の同一性を有するＲｕｖＣ＿ＩＩＩドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号１８２８に対して、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％の同一性を有するＲｕｖＣ＿ＩＩＩドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号１８２９に対して、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％の同一性を有するＲｕｖＣ＿ＩＩＩドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号１８３０に対して、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％の同一性を有するＲｕｖＣ＿ＩＩＩドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号１８３１に対して、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％の同一性を有するＲｕｖＣ＿ＩＩＩドメインを含み得る。

エンドヌクレアーゼは、配列番号３６３８～３９５５のいずれか１つに対して少なくとも約７０％の同一性を有するＨＮＨドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号３６３８～３９５５のいずれか１つに対して、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有すＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号３６３８～３９５５のいずれか１つと実質的に同一のＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号３６３８～３９５５のいずれか１つに対して少なくとも約７０％の同一性を有するＨＮＨドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号３６３８～３９５５のいずれか１つに対して、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有すＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号３６３８～３９５５のいずれか１つと実質的に同一のＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号３６３８～３６４１のいずれか１つに対して少なくとも約７０％の同一性を有するＨＮＨドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号３６３８～３６４１のいずれか１つに対して、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有すＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号３６３８～３６４１のいずれか１つと実質的に同一のＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号３６３８のいずれか１つに対して少なくとも約７０％の同一性を有するＨＮＨドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号３６３８のいずれか１つに対して、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有すＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号３６３８のいずれか１つと実質的に同一のＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号３６３９のいずれか１つに対して少なくとも約７０％の同一性を有するＨＮＨドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号３６３９のいずれか１つに対して、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有すＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号３６３９のいずれか１つと実質的に同一のＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号３６４０のいずれか１つに対して少なくとも約７０％の同一性を有するＨＮＨドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号３６４０のいずれか１つに対して、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有すＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号３６４０のいずれか１つと実質的に同一のＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号３６４１のいずれか１つに対して少なくとも約７０％の同一性を有するＨＮＨドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号３６４１のいずれか１つに対して、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有すＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号３６４１のいずれか１つと実質的に同一のＨＮＨドメインを含み得る。

場合によっては、エンドヌクレアーゼは、配列番号１～６又は配列番号９～３１９のいずれか１つに対して、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号１～６又は配列番号９～３１９のいずれか１つと実質的に同一であり得る。場合によっては、エンドヌクレアーゼは、配列番号１～４のいずれか１つに対して、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号１～４のいずれか１つと実質的に同一であり得る。場合によっては、エンドヌクレアーゼは、配列番号５６１５、５６１６、又は５６１７のいずれか１つと実質的に同一のペプチドモチーフを含み得る。

場合によっては、エンドヌクレアーゼは、１つ以上の核局在化配列（ＮＬＳ）を有するバリアントを含み得る。ＮＬＳは、当該エンドヌクレアーゼのＮ末端又はＣ末端に近接していてもよい。ＮＬＳは、配列番号１～６若しくは配列番号９～３１９のいずれか１つに対して、又は配列番号１～３１９のいずれか１つに対して少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、若しくは少なくとも約９９％の同一性を有するバリアントに対して、Ｎ末端又はＣ末端に付加され得る。ＮＬＳはＳＶ４０ラージＴ抗原ＮＬＳであり得る。ＮＬＳはｃ－ｍｙｃＮＬＳであり得る。ＮＬＳは、配列番号５５９３～５６０８のいずれか１つに対して、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９９％の同一性を有する配列を含み得る。ＮＬＳは、配列番号５５９３～５６０８のいずれか１つと実質的に同一の配列を含み得る。ＮＬＳは、以下の表１の配列のいずれか、又はこれらの組合せを含み得る。

場合によっては、エンドヌクレアーゼは、組換え体（例えば、大腸菌（Ｅ．ｃｏｌｉ）での発現、それに続くエピトープタグ精製などの好適な方法によって、クローニング、発現、及び精製）であり得る。場合によっては、エンドヌクレアーゼは、配列番号５５９２～５５９５のいずれか１つに対して少なくとも約９０％の同一性を有する１６ＳｒＲＮＡ遺伝子を有する細菌に由来し得る。エンドヌクレアーゼは、配列番号５５９２～５５９５のいずれか１つに対して、少なくとも約８０％、少なくとも約８２％、少なくとも約８３％、少なくとも約８４％、少なくとも約８５％、少なくとも約８６％、少なくとも約８７％、少なくとも約８８％、少なくとも約８９％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性の１６ＳｒＲＮＡ遺伝子を有する種に由来し得る。エンドヌクレアーゼは、配列番号５５９２～５５９５のいずれか１つと実質的に同一の１６ＳｒＲＮＡ遺伝子を有する種に由来し得る。エンドヌクレアーゼは、ウェルコミクロビウム（Ｖｅｒｒｕｃｏｍｉｃｒｏｂｉａ）門又はカンディダートゥス・ペレグリニバクテリア（ＣａｎｄｉｄａｔｕｓＰｅｒｅｇｒｉｎｉｂａｃｔｅｒｉａ）門に属する細菌に由来し得る。

場合によっては、当該配列同一性は、Ｓｍｉｔｈ－Ｗａｔｅｒｍａｎ相同性検索アルゴリズムのパラメータを用いて、ＢＬＡＳＴＰ、ＣＬＵＳＴＡＬＷ、ＭＵＳＣＬＥ、ＭＡＦＦＴ、Ｎｏｖａｆｏｌｄ、又はＣＬＵＳＴＡＬＷによって決定され得る。配列同一性は、３のワード長（Ｗ）、１０の期待値（Ｅ）のパラメータを用いて、及び１１の存在、１の拡張でのＢＬＯＳＵＭ６２スコアリングマトリックス設定ギャップコストを用いて、及び条件付き組成スコアマトリックス調整を用いて、ＢＬＡＳＴＰ相同性検索アルゴリズムによって決定され得る。

場合によっては、上記システムは、（ｂ）所望の切断配列に相補的な５’標的化領域を担持するエンドヌクレアーゼと複合体を形成することができる、少なくとも１つの操作された合成ガイドリボ核酸（ｓｙｎｔｈｅｔｉｃｇｕｉｄｅｒｉｂｏｎｕｃｌｅｉｃａｃｉｄ：ｓｇＲＮＡ）を含み得る。場合によっては、５’標的化領域は、エンドヌクレアーゼと適合性のあるＰＡＭ配列を含み得る。場合によっては、標的化領域の５’における大部分のヌクレオチドは、Ｇであり得る。場合によっては、５’標的化領域は、１５～２３ヌクレオチド長であり得る。ガイド配列及びｔｒａｃｒ配列は、別々のリボ核酸（ＲＮＡ）又は単一のリボ核酸（ＲＮＡ）として供給され得る。ガイドＲＮＡは、標的化領域への３’におけるｃｒＲＮＡｔｒａｃｒＲＮＡ結合配列を含み得る。ガイドＲＮＡは、ｃｒＲＮＡｔｒａｃｒＲＮＡ結合領域への３’における４－ヌクレオチドリンカが先行するｔｒａｃｒＲＮＡ配列を含み得る。ｓｇＲＮＡは、５’から３’に向かって、細胞中の標的配列、及びｔｒａｃｒ配列にハイブリダイズすることができる非天然ガイド核酸配列を含み得る。場合によっては、非天然ガイド核酸配列及びｔｒａｃｒ配列は共有結合している。

場合によっては、ｔｒａｃｒ配列は特定の配列を有し得る。ｔｒａｃｒ配列は、天然のｔｒａｃｒＲＮＡ配列の少なくとも約６０～１００（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）の連続するヌクレオチドに対して、少なくとも約８０％を有し得る。ｔｒａｃｒ配列は、配列番号５４７６～５４８９のいずれか１つの少なくとも約６０～１００（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）の連続するヌクレオチドに対して、少なくとも約８０％の配列同一性を有し得る。場合によっては、ｔｒａｃｒＲＮＡは、配列番号５４７６～５４８９のいずれか１つの連続するヌクレオチドの、少なくとも約６０～９０（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）に対して、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有し得る。場合によっては、ｔｒａｃｒＲＮＡは、配列番号５４７６～５４８９のいずれか１つの少なくとも約６０～１００（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）の連続するヌクレオチドと実質的に同一であり得る。ｔｒａｃｒＲＮＡは配列番号５４７６～５４８９のいずれかを含み得る。

場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも１つの操作された合成ガイドリボ核酸（ｓｇＲＮＡ）は、配列番号５４６１～５４６４のいずれか１つに対して少なくとも約８０％の同一性を有する配列を含み得る。ｓｇＲＮＡは、配列番号５４６１～５４６４のいずれか１つに対して、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有する配列を含み得る。ｓｇＲＮＡは、配列番号５４６１～５４６４のいずれか１つと実質的に同一の配列を含み得る。

場合によっては、上記のシステムは、標的ＤＮＡ遺伝子座における切断のための第１の領域及び第２の領域を標的化する２つの異なるｓｇＲＮＡを含んでもよく、ここで、第２の領域は第１の領域に対して３’にある。場合によっては、上記システムは、５’から３’に向かって、第１の領域に対して５’において少なくとも約２０（例えば、少なくとも約４０、８０、１２０、１５０、２００、３００、５００、又は１ｋｂ）ヌクレオチドの配列を含む第１のホモロジーアームに対して、少なくとも約１０ヌクレオチドの合成ＤＮＡ配列、及び第２の領域に対して３’において少なくとも約２０（例えば、少なくとも約４０、８０、１２０、１５０、２００、３００、５００、又は１ｋｂ）ヌクレオチドの配列を含む第２のホモロジーアームを含む、一本鎖又は二本鎖ＤＮＡ修復鋳型を含み得る。

別の態様では、本開示は、標的核酸遺伝子座を修飾する方法を提供する。本方法は、本明細書に開示される酵素及び少なくとも１つの合成ガイドＲＮＡ（ｓｇＲＮＡ）を含む、本明細書に開示される非天然システムのいずれかを標的核酸遺伝子座へと送達することを含み得る。酵素は、少なくとも１つのｓｇＲＮＡと複合体を形成し得、複合体が標的核酸遺伝子座に結合する際に、標的核酸遺伝子座を修飾し得る。酵素を当該遺伝子座へと送達することは、システム又はシステムをコードする核酸により細胞をトランスフェクトすることを含み得る。ヌクレアーゼを前記遺伝子座に送達することは、システム又はシステムをコードする核酸により細胞を電気穿孔することを含み得る。ヌクレアーゼを当該遺伝子座へと送達することは、目的の遺伝子座を含む核酸と共に、緩衝液中でシステムをインキュベートすることを含み得る。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸（ＤＮＡ）又はリボ核酸（ＲＮＡ）を含む。標的核酸遺伝子座は、ゲノムＤＮＡ、ウイルスＤＮＡ、ウイルスＲＮＡ、又は細菌ＤＮＡを含み得る。標的核酸遺伝子座は、細胞内にあり得る。標的核酸遺伝子座はインビトロであり得る。標的核酸遺伝子座は、真核細胞又は原核細胞内にあり得る。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、又は植物細胞であり得る。酵素は、目的の標的遺伝子座で、又は目的の標的遺伝子座に近接して、一本鎖又は二本鎖の切断を誘導し得る。

標的核酸遺伝子座が細胞内にあり得る場合、酵素は、配列番号１８２７～２１４０のいずれか１つに対して、少なくとも約７５％（例えば、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％）の同一性を有するＲｕｖＣ＿ＩＩＩドメインを有する酵素をコードする、オープンリーディングフレームを含有する核酸として供給され得る。当該エンドヌクレアーゼをコードするオープンリーディングフレームを含有するデオキシリボ核酸（ＤＮＡ）は、配列番号５５７２～５５７５のいずれかに対して、又は配列番号５５７２～５５７５のいずれか１つに対して少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有するバリアントにおいて、実質的に同一の配列を含み得る。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、ＣＭＶ、ＥＦ１ａ、ＳＶ４０、ＰＧＫ１、Ｕｂｃ、ヒトベータアクチン、ＣＡＧ、ＴＲＥ、又はＣａＭＫＩＩａプロモーターであり得る。エンドヌクレアーゼは、当該エンドヌクレアーゼをコードする当該オープンリーディングフレームを含有するキャップｍＲＮＡとして供給され得る。エンドヌクレアーゼは翻訳されたポリペプチドとして供給され得る。少なくとも１つの操作されたｓｇＲＮＡは、リボ核酸（ＲＮＡ）ｐｏｌＩＩＩプロモーターへと動作可能に連結された当該少なくとも１つの操作されたｓｇＲＮＡをコードする遺伝子配列を含有する、デオキシリボ核酸（ＤＮＡ）として供給され得る。場合によっては、生物は、真核生物であり得る。場合によっては、生物は、真菌であり得る。場合によっては、生物は、ヒトであり得る。

場合によっては、本開示は、本明細書に開示されるシステム又は本明細書に記載される核酸を含む発現カセットを提供し得る。場合によっては、発現カセット又は核酸はベクターとして供給され得る。場合によっては、発現カセット、核酸、又はベクターは、細胞内に供給され得る。場合によっては、細胞は、配列番号５５９２～５５９５のいずれか１つに対して少なくとも約９０％（例えば、少なくとも約９９％）の同一性を有する１６ＳｒＲＮＡ遺伝子を有する細菌の細胞である。

ＭＧ２酵素

一態様では、本開示は、（ａ）エンドヌクレアーゼを含む、操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼは、Ｃａｓエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、ＩＩ型、クラスＩＩのＣａｓエンドヌクレアーゼである。エンドヌクレアーゼはＲｕｖＣ＿ＩＩＩドメインを含んでもよく、当該ＲｕｖＣ＿ＩＩＩドメインは、配列番号２１４１～２２４１のいずれか１つに対して少なくとも約７０％の配列同一性を有する。場合によっては、エンドヌクレアーゼはＲｕｖＣ＿ＩＩＩドメインを含んでもよく、ここで、ＲｕｖＣ＿ＩＩＩドメインは、配列番号２１４１～２２４１のいずれか１つに対して、少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％の同一性を有する。場合によっては、エンドヌクレアーゼは、配列番号２１４１～２１４２のいずれか１つと実質的に同一であるＲｕｖＣ＿ＩＩＩドメインを含み得る。エンドヌクレアーゼは、配列番号２１４１～２１４２のいずれか１つに対して少なくとも約７０％の配列同一性を有するＲｕｖＣ＿ＩＩＩドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号２１４１～２１４２のいずれか１つに対して、少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％の同一性を有するＲｕｖＣ＿ＩＩＩドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号２１４１～２１４２のいずれか１つと実質的に同一のＲｕｖＣ＿ＩＩＩドメインを含み得る。

エンドヌクレアーゼは、配列番号３９５５～４０５５のいずれか１つに対して少なくとも約７０％の同一性を有するＨＮＨドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号３９５５～４０５５のいずれか１つに対して、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有すＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号３９５５～４０５５のいずれか１つと実質的に同一のＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号３９５５～３９５６のいずれか１つに対して少なくとも約７０％の同一性を有するＨＮＨドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号３９５５～３９５６のいずれか１つに対して、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有すＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号３９５５～３９５６のいずれか１つと実質的に同一のＨＮＨドメインを含み得る。

場合によっては、エンドヌクレアーゼは、配列番号３２０～４２０のいずれか１つに対して、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号３２０～４２０のいずれか１つと実質的に同一であり得る。場合によっては、エンドヌクレアーゼは、配列番号３２０～３２１のいずれか１つに対して、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号３２０～３２１のいずれか１つと実質的に同一であり得る。

場合によっては、エンドヌクレアーゼは、１つ以上の核局在化配列（ＮＬＳ）を有するバリアントを含み得る。ＮＬＳは、当該エンドヌクレアーゼのＮ末端又はＣ末端に近接していてもよい。ＮＬＳは、配列番号３２０～４２０のいずれか１つに対して、又は配列番号３２０～４２０のいずれか１つに対して少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、若しくは少なくとも約９９％の同一性を有するバリアントに対して、Ｎ末端又はＣ末端に付加され得る。ＮＬＳはＳＶ４０ラージＴ抗原ＮＬＳであり得る。ＮＬＳはｃ－ｍｙｃＮＬＳであり得る。ＮＬＳは、配列番号５５９３～５６０８のいずれか１つに対して、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９９％の同一性を有する配列を含み得る。ＮＬＳは、配列番号５５９３～５６０８のいずれか１つと実質的に同一の配列を含み得る。ＮＬＳは、表１の配列のいずれか、又はこれらの組合せを含み得る。

場合によっては、ｔｒａｃｒ配列は特定の配列を有し得る。ｔｒａｃｒ配列は、天然のｔｒａｃｒＲＮＡ配列の少なくとも約６０～１００（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）の連続するヌクレオチドに対して、少なくとも約８０％を有し得る。ｔｒａｃｒ配列は、配列番号５４９０～５４９４のいずれか１つの少なくとも約６０～１００（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）の連続するヌクレオチドに対して、少なくとも約８０％の配列同一性を有し得る。場合によっては、ｔｒａｃｒＲＮＡは、配列番号５４９０～５４９４のいずれか１つの連続するヌクレオチドの、少なくとも約６０～９０（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）に対して、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有し得る。場合によっては、ｔｒａｃｒＲＮＡは、配列番号５４９０～５４９４のいずれか１つの少なくとも約６０～１００（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）の連続するヌクレオチドと実質的に同一であり得る。ｔｒａｃｒＲＮＡは配列番号５４９０～５４９４のいずれかを含み得る。

場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも１つの操作された合成ガイドリボ核酸（ｓｇＲＮＡ）は、配列番号５４６５に対して少なくとも約８０％の同一性を有する配列を含み得る。ｓｇＲＮＡは、配列番号５４６５に対して、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有する配列を含み得る。ｓｇＲＮＡは、配列番号５４６５と実質的に同一の配列を含み得る。

別の態様では、本開示は、目的の標的核酸遺伝子座を修飾する方法を提供する。本方法は、本明細書に開示される酵素及び少なくとも１つの合成ガイドＲＮＡ（ｓｇＲＮＡ）を含む、本明細書に開示される非天然システムのいずれかを標的核酸遺伝子座へと送達することを含み得る。酵素は、少なくとも１つのｓｇＲＮＡと複合体を形成し得、複合体が目的の標的核酸遺伝子座に結合する際に、目的の標的核酸遺伝子座を修飾し得る。酵素を当該遺伝子座へと送達することは、システム又はシステムをコードする核酸により細胞をトランスフェクトすることを含み得る。ヌクレアーゼを前記遺伝子座に送達することは、システム又はシステムをコードする核酸により細胞を電気穿孔することを含み得る。ヌクレアーゼを当該遺伝子座へと送達することは、目的の遺伝子座を含む核酸と共に、緩衝液中でシステムをインキュベートすることを含み得る。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸（ＤＮＡ）又はリボ核酸（ＲＮＡ）を含む。標的核酸遺伝子座は、ゲノムＤＮＡ、ウイルスＤＮＡ、ウイルスＲＮＡ、又は細菌ＤＮＡを含み得る。標的核酸遺伝子座は、細胞内にあり得る。標的核酸遺伝子座はインビトロであり得る。標的核酸遺伝子座は、真核細胞又は原核細胞内にあり得る。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、又は植物細胞であり得る。酵素は、目的の標的遺伝子座で、又は目的の標的遺伝子座に近接して、一本鎖又は二本鎖の切断を誘導し得る。

標的核酸遺伝子座が細胞内にあり得る場合、酵素は、配列番号２１４１～２２４１のいずれか１つに対して、少なくとも約７５％（例えば、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％）の同一性を有するＲｕｖＣ＿ＩＩＩドメインを有する酵素をコードする、オープンリーディングフレームを含有する核酸として供給され得る。当該エンドヌクレアーゼをコードするオープンリーディングフレームを含有するデオキシリボ核酸（ＤＮＡ）は、配列番号５５７６～５５７７のいずれかに対して、又は配列番号５５７６～５５７７のいずれか１つに対して少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有するバリアントにおいて、実質的に同一の配列を含み得る。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、ＣＭＶ、ＥＦ１ａ、ＳＶ４０、ＰＧＫ１、Ｕｂｃ、ヒトベータアクチン、ＣＡＧ、ＴＲＥ、又はＣａＭＫＩＩａプロモーターであり得る。エンドヌクレアーゼは、当該エンドヌクレアーゼをコードする当該オープンリーディングフレームを含有するキャップｍＲＮＡとして供給され得る。エンドヌクレアーゼは翻訳されたポリペプチドとして供給され得る。少なくとも１つの操作されたｓｇＲＮＡは、リボ核酸（ＲＮＡ）ｐｏｌＩＩＩプロモーターへと動作可能に連結された当該少なくとも１つの操作されたｓｇＲＮＡをコードする遺伝子配列を含有する、デオキシリボ核酸（ＤＮＡ）として供給され得る。場合によっては、生物は、真核生物であり得る。場合によっては、生物は、真菌であり得る。場合によっては、生物は、ヒトであり得る。

ＭＧ３酵素

一態様では、本開示は、（ａ）エンドヌクレアーゼを含む、操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼは、Ｃａｓエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、ＩＩ型、クラスＩＩのＣａｓエンドヌクレアーゼである。エンドヌクレアーゼはＲｕｖＣ＿ＩＩＩドメインを含んでもよく、当該ＲｕｖＣ＿ＩＩＩドメインは、配列番号２２４２～２２５１のいずれか１つに対して少なくとも約７０％の配列同一性を有する。場合によっては、エンドヌクレアーゼはＲｕｖＣ＿ＩＩＩドメインを含んでもよく、ここで、ＲｕｖＣ＿ＩＩＩドメインは、配列番号２２４２～２２５１のいずれか１つに対して、少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％の同一性を有する。場合によっては、エンドヌクレアーゼは、配列番号２２４２～２２５１のいずれか１つと実質的に同一であるＲｕｖＣ＿ＩＩＩドメインを含み得る。エンドヌクレアーゼは、配列番号２２４２～２２４４のいずれか１つに対して少なくとも約７０％の配列同一性を有するＲｕｖＣ＿ＩＩＩドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号２２４２～２２４４のいずれか１つに対して、少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％の同一性を有するＲｕｖＣ＿ＩＩＩドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号２２４２～２２４４のいずれか１つと実質的に同一のＲｕｖＣ＿ＩＩＩドメインを含み得る。

エンドヌクレアーゼは、配列番号４０５６～４０６６のいずれか１つに対して少なくとも約７０％の同一性を有するＨＮＨドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号４０５６～４０６６のいずれか１つに対して、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有すＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号４０５６～４０６６のいずれか１つと実質的に同一のＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号４０５６～４０５８のいずれか１つに対して少なくとも約７０％の同一性を有するＨＮＨドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号４０５６～４０５８のいずれか１つに対して、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有すＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号４０５６～４０５８のいずれか１つと実質的に同一のＨＮＨドメインを含み得る。

場合によっては、エンドヌクレアーゼは、配列番号４２１～４３１のいずれか１つに対して、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号４２１～４３１のいずれか１つと実質的に同一であり得る。場合によっては、エンドヌクレアーゼは、配列番号４２１～４２３のいずれか１つに対して、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号４２１～４２３のいずれか１つと実質的に同一であり得る。

場合によっては、エンドヌクレアーゼは、１つ以上の核局在化配列（ＮＬＳ）を有するバリアントを含み得る。ＮＬＳは、当該エンドヌクレアーゼのＮ末端又はＣ末端に近接していてもよい。ＮＬＳは、配列番号４２１～４３１のいずれか１つに対して、又は配列番号４２１～４３１のいずれか１つに対して少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、若しくは少なくとも約９９％の同一性を有するバリアントに対して、Ｎ末端又はＣ末端に付加され得る。ＮＬＳはＳＶ４０ラージＴ抗原ＮＬＳであり得る。ＮＬＳはｃ－ｍｙｃＮＬＳであり得る。ＮＬＳは、配列番号５５９３～５６０８のいずれか１つに対して、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９９％の同一性を有する配列を含み得る。ＮＬＳは、配列番号５５９３～５６０８のいずれか１つと実質的に同一の配列を含み得る。ＮＬＳは、表１の配列のいずれか、又はこれらの組合せを含み得る。

場合によっては、ｔｒａｃｒ配列は特定の配列を有し得る。ｔｒａｃｒ配列は、天然のｔｒａｃｒＲＮＡ配列の少なくとも約６０～１００（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）の連続するヌクレオチドに対して、少なくとも約８０％を有し得る。ｔｒａｃｒ配列は、配列番号５４９５～５５０２のいずれか１つの少なくとも約６０～１００（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）の連続するヌクレオチドに対して、少なくとも約８０％の配列同一性を有し得る。場合によっては、ｔｒａｃｒＲＮＡは、配列番号５４９５～５５０２のいずれか１つの連続するヌクレオチドの、少なくとも約６０～９０（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）に対して、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有し得る。場合によっては、ｔｒａｃｒＲＮＡは、配列番号５４９５～５５０２のいずれか１つの少なくとも約６０～１００（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）の連続するヌクレオチドと実質的に同一であり得る。ｔｒａｃｒＲＮＡは配列番号５４９５～５５０２のいずれかを含み得る。

場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも１つの操作された合成ガイドリボ核酸（ｓｇＲＮＡ）は、配列番号５４６６～５４６７のいずれか１つに対して少なくとも約８０％の同一性を有する配列を含み得る。ｓｇＲＮＡは、配列番号５４６６～５４６７のいずれか１つに対して、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有する配列を含み得る。ｓｇＲＮＡは、配列番号５４６６～５４６７のいずれか１つと実質的に同一の配列を含み得る。

標的核酸遺伝子座が細胞内にあり得る場合、酵素は、配列番号２２４２～２２５１のいずれか１つに対して、少なくとも約７５％（例えば、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％）の同一性を有するＲｕｖＣ＿ＩＩＩドメインを有する酵素をコードする、オープンリーディングフレームを含有する核酸として供給され得る。当該エンドヌクレアーゼをコードするオープンリーディングフレームを含有するデオキシリボ核酸（ＤＮＡ）は、配列番号５５７８～５５８０のいずれかに対して、又は配列番号５５７８～５５８０のいずれか１つに対して少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有するバリアントにおいて、実質的に同一の配列を含み得る。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、ＣＭＶ、ＥＦ１ａ、ＳＶ４０、ＰＧＫ１、Ｕｂｃ、ヒトベータアクチン、ＣＡＧ、ＴＲＥ、又はＣａＭＫＩＩａプロモーターであり得る。エンドヌクレアーゼは、当該エンドヌクレアーゼをコードする当該オープンリーディングフレームを含有するキャップｍＲＮＡとして供給され得る。エンドヌクレアーゼは翻訳されたポリペプチドとして供給され得る。少なくとも１つの操作されたｓｇＲＮＡは、リボ核酸（ＲＮＡ）ｐｏｌＩＩＩプロモーターへと動作可能に連結された当該少なくとも１つの操作されたｓｇＲＮＡをコードする遺伝子配列を含有する、デオキシリボ核酸（ＤＮＡ）として供給され得る。場合によっては、生物は、真核生物であり得る。場合によっては、生物は、真菌であり得る。場合によっては、生物は、ヒトであり得る。

ＭＧ４酵素

一態様では、本開示は、（ａ）エンドヌクレアーゼを含む、操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼは、Ｃａｓエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、ＩＩ型、クラスＩＩのＣａｓエンドヌクレアーゼである。エンドヌクレアーゼはＲｕｖＣ＿ＩＩＩドメインを含んでもよく、当該ＲｕｖＣ＿ＩＩＩドメインは、配列番号２２５３～２４８１のいずれか１つに対して少なくとも約７０％の配列同一性を有する。場合によっては、エンドヌクレアーゼはＲｕｖＣ＿ＩＩＩドメインを含んでもよく、ここで、ＲｕｖＣ＿ＩＩＩドメインは、配列番号２２５３～２４８１のいずれか１つに対して、少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％の同一性を有する。場合によっては、エンドヌクレアーゼは、配列番号２２５３～２４８１のいずれか１つと実質的に同一であるＲｕｖＣ＿ＩＩＩドメインを含み得る。エンドヌクレアーゼは、配列番号２２５３～２４８１のいずれか１つに対して少なくとも約７０％の配列同一性を有するＲｕｖＣ＿ＩＩＩドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号２２５３～２４８１のいずれか１つに対して、少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％の同一性を有するＲｕｖＣ＿ＩＩＩドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号２２５３～２４８１のいずれか１つと実質的に同一のＲｕｖＣ＿ＩＩＩドメインを含み得る。

エンドヌクレアーゼは、配列番号４０６７～４２９５のいずれか１つに対して少なくとも約７０％の同一性を有するＨＮＨドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号４０６７～４２９５のいずれか１つに対して、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有すＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号４０６７～４２９５のいずれか１つと実質的に同一のＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号４０６７～４２９５のいずれか１つに対して少なくとも約７０％の同一性を有するＨＮＨドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号４０６７～４２９５のいずれか１つに対して、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有すＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号４０６７～４２９５のいずれか１つと実質的に同一のＨＮＨドメインを含み得る。

場合によっては、エンドヌクレアーゼは、配列番号４３２～６６０のいずれか１つに対して、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号４３２～６６０のいずれか１つと実質的に同一であり得る。場合によっては、エンドヌクレアーゼは、配列番号４３２～６６０のいずれか１つに対して、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号４３２～６６０のいずれか１つと実質的に同一であり得る。

場合によっては、エンドヌクレアーゼは、１つ以上の核局在化配列（ＮＬＳ）を有するバリアントを含み得る。ＮＬＳは、当該エンドヌクレアーゼのＮ末端又はＣ末端に近接していてもよい。ＮＬＳは、配列番号４３２～６６０のいずれか１つに対して、又は配列番号４３２～６６０のいずれか１つに対して少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、若しくは少なくとも約９９％の同一性を有するバリアントに対して、Ｎ末端又はＣ末端に付加され得る。ＮＬＳはＳＶ４０ラージＴ抗原ＮＬＳであり得る。ＮＬＳはｃ－ｍｙｃＮＬＳであり得る。ＮＬＳは、配列番号５５９３～５６０８のいずれか１つに対して、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９９％の同一性を有する配列を含み得る。ＮＬＳは、配列番号５５９３～５６０８のいずれか１つと実質的に同一の配列を含み得る。ＮＬＳは、表１の配列のいずれか、又はこれらの組合せを含み得る。

場合によっては、ｔｒａｃｒ配列は特定の配列を有し得る。ｔｒａｃｒ配列は、天然のｔｒａｃｒＲＮＡ配列の少なくとも約６０～１００（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）の連続するヌクレオチドに対して、少なくとも約８０％を有し得る。ｔｒａｃｒ配列は、配列番号５５０３の少なくとも約６０～１００（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）の連続するヌクレオチドに対して、少なくとも約８０％の配列同一性を有し得る。場合によっては、ｔｒａｃｒＲＮＡは、配列番号５５０３の連続するヌクレオチドの、少なくとも約６０～９０（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）に対して、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有し得る。場合によっては、ｔｒａｃｒＲＮＡは、配列番号５５０３の少なくとも約６０～１００（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）の連続するヌクレオチドと実質的に同一であり得る。ｔｒａｃｒＲＮＡは配列番号５５０３を含み得る。

場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも１つの操作された合成ガイドリボ核酸（ｓｇＲＮＡ）は、配列番号５４６８に対して少なくとも約８０％の同一性を有する配列を含み得る。ｓｇＲＮＡは、配列番号５４６８に対して、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有する配列を含み得る。ｓｇＲＮＡは、配列番号５４６８と実質的に同一の配列を含み得る。

標的核酸遺伝子座が細胞内にあり得る場合、酵素は、配列番号２２５３～２４８１のいずれか１つに対して、少なくとも約７５％（例えば、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％）の同一性を有するＲｕｖＣ＿ＩＩＩドメインを有する酵素をコードする、オープンリーディングフレームを含有する核酸として供給され得る。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、ＣＭＶ、ＥＦ１ａ、ＳＶ４０、ＰＧＫ１、Ｕｂｃ、ヒトベータアクチン、ＣＡＧ、ＴＲＥ、又はＣａＭＫＩＩａプロモーターであり得る。エンドヌクレアーゼは、当該エンドヌクレアーゼをコードする当該オープンリーディングフレームを含有するキャップｍＲＮＡとして供給され得る。エンドヌクレアーゼは翻訳されたポリペプチドとして供給され得る。少なくとも１つの操作されたｓｇＲＮＡは、リボ核酸（ＲＮＡ）ｐｏｌＩＩＩプロモーターへと動作可能に連結された当該少なくとも１つの操作されたｓｇＲＮＡをコードする遺伝子配列を含有する、デオキシリボ核酸（ＤＮＡ）として供給され得る。場合によっては、生物は、真核生物であり得る。場合によっては、生物は、真菌であり得る。場合によっては、生物は、ヒトであり得る。

ＭＧ６酵素

一態様では、本開示は、（ａ）エンドヌクレアーゼを含む、操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼは、Ｃａｓエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、ＩＩ型、クラスＩＩのＣａｓエンドヌクレアーゼである。エンドヌクレアーゼはＲｕｖＣ＿ＩＩＩドメインを含んでもよく、当該ＲｕｖＣ＿ＩＩＩドメインは、配列番号２４８２～２４８９のいずれか１つに対して少なくとも約７０％の配列同一性を有する。場合によっては、エンドヌクレアーゼはＲｕｖＣ＿ＩＩＩドメインを含んでもよく、ここで、ＲｕｖＣ＿ＩＩＩドメインは、配列番号２４８２～２４８９のいずれか１つに対して、少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％の同一性を有する。場合によっては、エンドヌクレアーゼは、配列番号２４８２～２４８９のいずれか１つと実質的に同一であるＲｕｖＣ＿ＩＩＩドメインを含み得る。

エンドヌクレアーゼは、配列番号４２９６～４３０３のいずれか１つに対して少なくとも約７０％の同一性を有するＨＮＨドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号４２９６～４３０３のいずれか１つに対して、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有すＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号４０５６～４０６６のいずれか１つと実質的に同一のＨＮＨドメインを含み得る。

場合によっては、エンドヌクレアーゼは、配列番号６６１～６６８のいずれか１つに対して、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号６６１～６６８のいずれか１つと実質的に同一であり得る。

場合によっては、エンドヌクレアーゼは、１つ以上の核局在化配列（ＮＬＳ）を有するバリアントを含み得る。ＮＬＳは、当該エンドヌクレアーゼのＮ末端又はＣ末端に近接していてもよい。ＮＬＳは、配列番号６６１～６６８のいずれか１つに対して、又は配列番号６６１～６６８のいずれか１つに対して少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、若しくは少なくとも約９９％の同一性を有するバリアントに対して、Ｎ末端又はＣ末端に付加され得る。ＮＬＳはＳＶ４０ラージＴ抗原ＮＬＳであり得る。ＮＬＳはｃ－ｍｙｃＮＬＳであり得る。ＮＬＳは、配列番号５５９３～５６０８のいずれか１つに対して、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９９％の同一性を有する配列を含み得る。ＮＬＳは、配列番号５５９３～５６０８のいずれか１つと実質的に同一の配列を含み得る。ＮＬＳは、表１の配列のいずれか、又はこれらの組合せを含み得る。

場合によっては、ｔｒａｃｒ配列は特定の配列を有し得る。ｔｒａｃｒ配列は、天然のｔｒａｃｒＲＮＡ配列の少なくとも約６０～１００（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）の連続するヌクレオチドに対して、少なくとも約８０％を有し得る。

場合によっては、上記のシステムは、標的ＤＮＡ遺伝子座における切断のための第１の領域及び第２の領域を標的化する２つの異なるガイドＲＮＡを含んでもよく、ここで、第２の領域は第１の領域に対して３’にある。場合によっては、上記システムは、５’から３’に向かって、第１の領域に対して５’において少なくとも約２０（例えば、少なくとも約４０、８０、１２０、１５０、２００、３００、５００、又は１ｋｂ）ヌクレオチドの配列を含む第１のホモロジーアームに対して、少なくとも約１０ヌクレオチドの合成ＤＮＡ配列、及び第２の領域に対して３’において少なくとも約２０（例えば、少なくとも約４０、８０、１２０、１５０、２００、３００、５００、又は１ｋｂ）ヌクレオチドの配列を含む第２のホモロジーアームを含む、一本鎖又は二本鎖ＤＮＡ修復鋳型を含み得る。

標的核酸遺伝子座が細胞内にあり得る場合、酵素は、配列番号２４８２～２４８９のいずれか１つに対して、少なくとも約７５％（例えば、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％）の同一性を有するＲｕｖＣ＿ＩＩＩドメインを有する酵素をコードする、オープンリーディングフレームを含有する核酸として供給され得る。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、ＣＭＶ、ＥＦ１ａ、ＳＶ４０、ＰＧＫ１、Ｕｂｃ、ヒトベータアクチン、ＣＡＧ、ＴＲＥ、又はＣａＭＫＩＩａプロモーターであり得る。エンドヌクレアーゼは、当該エンドヌクレアーゼをコードする当該オープンリーディングフレームを含有するキャップｍＲＮＡとして供給され得る。エンドヌクレアーゼは翻訳されたポリペプチドとして供給され得る。少なくとも１つの操作されたｓｇＲＮＡは、リボ核酸（ＲＮＡ）ｐｏｌＩＩＩプロモーターへと動作可能に連結された当該少なくとも１つの操作されたｓｇＲＮＡをコードする遺伝子配列を含有する、デオキシリボ核酸（ＤＮＡ）として供給され得る。場合によっては、生物は、真核生物であり得る。場合によっては、生物は、真菌であり得る。場合によっては、生物は、ヒトであり得る。

ＭＧ７酵素

一態様では、本開示は、（ａ）エンドヌクレアーゼを含む、操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼは、Ｃａｓエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、ＩＩ型、クラスＩＩのＣａｓエンドヌクレアーゼである。エンドヌクレアーゼはＲｕｖＣ＿ＩＩＩドメインを含んでもよく、当該ＲｕｖＣ＿ＩＩＩドメインは、配列番号２４９０～２４９８のいずれか１つに対して少なくとも約７０％の配列同一性を有する。場合によっては、エンドヌクレアーゼはＲｕｖＣ＿ＩＩＩドメインを含んでもよく、ここで、ＲｕｖＣ＿ＩＩＩドメインは、配列番号２４９０～２４９８のいずれか１つに対して、少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％の同一性を有する。場合によっては、エンドヌクレアーゼは、配列番号２４９０～２４９８のいずれか１つと実質的に同一であるＲｕｖＣ＿ＩＩＩドメインを含み得る。エンドヌクレアーゼは、配列番号２４９０～２４９８のいずれか１つに対して少なくとも約７０％の配列同一性を有するＲｕｖＣ＿ＩＩＩドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号２４９０～２４９８のいずれか１つに対して、少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％の同一性を有するＲｕｖＣ＿ＩＩＩドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号２４９０～２４９８のいずれか１つと実質的に同一のＲｕｖＣ＿ＩＩＩドメインを含み得る。

エンドヌクレアーゼは、配列番号４３０４～４３１２のいずれか１つに対して少なくとも約７０％の同一性を有するＨＮＨドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号４３０４～４３１２のいずれか１つに対して、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有すＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号４３０４～４３１２のいずれか１つと実質的に同一のＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号４３０４～４３１２のいずれか１つに対して少なくとも約７０％の同一性を有するＨＮＨドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号４３０４～４３１２のいずれか１つに対して、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有すＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号４３０４～４３１２のいずれか１つと実質的に同一のＨＮＨドメインを含み得る。

場合によっては、エンドヌクレアーゼは、配列番号６６９～６７７のいずれか１つに対して、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号６６９～６７７のいずれか１つと実質的に同一であり得る。場合によっては、エンドヌクレアーゼは、配列番号６６９～６７７のいずれか１つに対して、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号６６９～６７７のいずれか１つと実質的に同一であり得る。

場合によっては、エンドヌクレアーゼは、１つ以上の核局在化配列（ＮＬＳ）を有するバリアントを含み得る。ＮＬＳは、当該エンドヌクレアーゼのＮ末端又はＣ末端に近接していてもよい。ＮＬＳは、配列番号６６９～６７７のいずれか１つに対して、又は配列番号６６９～６７７のいずれか１つに対して少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、若しくは少なくとも約９９％の同一性を有するバリアントに対して、Ｎ末端又はＣ末端に付加され得る。ＮＬＳはＳＶ４０ラージＴ抗原ＮＬＳであり得る。ＮＬＳはｃ－ｍｙｃＮＬＳであり得る。ＮＬＳは、配列番号５５９３～５６０８のいずれか１つに対して、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９９％の同一性を有する配列を含み得る。ＮＬＳは、配列番号５５９３～５６０８のいずれか１つと実質的に同一の配列を含み得る。ＮＬＳは、表１の配列のいずれか、又はこれらの組合せを含み得る。

場合によっては、ｔｒａｃｒ配列は特定の配列を有し得る。ｔｒａｃｒ配列は、天然のｔｒａｃｒＲＮＡ配列の少なくとも約６０～１００（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）の連続するヌクレオチドに対して、少なくとも約８０％を有し得る。ｔｒａｃｒ配列は、配列番号５５０４の少なくとも約６０～１００（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）の連続するヌクレオチドに対して、少なくとも約８０％の配列同一性を有し得る。場合によっては、ｔｒａｃｒＲＮＡは、配列番号５５０４の連続するヌクレオチドの、少なくとも約６０～９０（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）に対して、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有し得る。場合によっては、ｔｒａｃｒＲＮＡは、配列番号５５０４の少なくとも約６０～１００（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）の連続するヌクレオチドと実質的に同一であり得る。ｔｒａｃｒＲＮＡは配列番号５５０４を含み得る。

標的核酸遺伝子座が細胞内にあり得る場合、酵素は、配列番号２４９０～２４９８のいずれか１つに対して、少なくとも約７５％（例えば、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％）の同一性を有するＲｕｖＣ＿ＩＩＩドメインを有する酵素をコードする、オープンリーディングフレームを含有する核酸として供給され得る。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、ＣＭＶ、ＥＦ１ａ、ＳＶ４０、ＰＧＫ１、Ｕｂｃ、ヒトベータアクチン、ＣＡＧ、ＴＲＥ、又はＣａＭＫＩＩａプロモーターであり得る。エンドヌクレアーゼは、当該エンドヌクレアーゼをコードする当該オープンリーディングフレームを含有するキャップｍＲＮＡとして供給され得る。エンドヌクレアーゼは翻訳されたポリペプチドとして供給され得る。少なくとも１つの操作されたｓｇＲＮＡは、リボ核酸（ＲＮＡ）ｐｏｌＩＩＩプロモーターへと動作可能に連結された当該少なくとも１つの操作されたｓｇＲＮＡをコードする遺伝子配列を含有する、デオキシリボ核酸（ＤＮＡ）として供給され得る。場合によっては、生物は、真核生物であり得る。場合によっては、生物は、真菌であり得る。場合によっては、生物は、ヒトであり得る。

ＭＧ１４酵素

一態様では、本開示は、（ａ）エンドヌクレアーゼを含む、操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼは、Ｃａｓエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、ＩＩ型、クラスＩＩのＣａｓエンドヌクレアーゼである。エンドヌクレアーゼはＲｕｖＣ＿ＩＩＩドメインを含んでもよく、当該ＲｕｖＣ＿ＩＩＩドメインは、配列番号２４９９～２７５０のいずれか１つに対して少なくとも約７０％の配列同一性を有する。場合によっては、エンドヌクレアーゼはＲｕｖＣ＿ＩＩＩドメインを含んでもよく、ここで、ＲｕｖＣ＿ＩＩＩドメインは、配列番号２４９９～２７５０のいずれか１つに対して、少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％の同一性を有する。場合によっては、エンドヌクレアーゼは、配列番号２４９９～２７５０のいずれか１つと実質的に同一であるＲｕｖＣ＿ＩＩＩドメインを含み得る。エンドヌクレアーゼは、配列番号２４９９～２７５０のいずれか１つに対して少なくとも約７０％の配列同一性を有するＲｕｖＣ＿ＩＩＩドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号２４９９～２７５０のいずれか１つに対して、少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％の同一性を有するＲｕｖＣ＿ＩＩＩドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号２４９９～２７５０のいずれか１つと実質的に同一のＲｕｖＣ＿ＩＩＩドメインを含み得る。

エンドヌクレアーゼは、配列番号４３１３～４５６４のいずれか１つに対して少なくとも約７０％の同一性を有するＨＮＨドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号４３１３～４５６４のいずれか１つに対して、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有すＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号４３１３～４５６４のいずれか１つと実質的に同一のＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号４３１３～４５６４のいずれか１つに対して少なくとも約７０％の同一性を有するＨＮＨドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号４０６７～４２９５のいずれか１つに対して、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有すＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号４３１３～４５６４のいずれか１つと実質的に同一のＨＮＨドメインを含み得る。

場合によっては、エンドヌクレアーゼは、配列番号６７８～９２９のいずれか１つに対して、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号６７８～９２９のいずれか１つと実質的に同一であり得る。場合によっては、エンドヌクレアーゼは、配列番号６７８～９２９のいずれか１つに対して、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号６７８～９２９のいずれか１つと実質的に同一であり得る。

場合によっては、エンドヌクレアーゼは、１つ以上の核局在化配列（ＮＬＳ）を有するバリアントを含み得る。ＮＬＳは、当該エンドヌクレアーゼのＮ末端又はＣ末端に近接していてもよい。ＮＬＳは、配列番号６７８～９２９のいずれか１つに対して、又は配列番号６７８～９２９のいずれか１つに対して少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、若しくは少なくとも約９９％の同一性を有するバリアントに対して、Ｎ末端又はＣ末端に付加され得る。ＮＬＳはＳＶ４０ラージＴ抗原ＮＬＳであり得る。ＮＬＳはｃ－ｍｙｃＮＬＳであり得る。ＮＬＳは、配列番号５５９３～５６０８のいずれか１つに対して、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９９％の同一性を有する配列を含み得る。ＮＬＳは、配列番号５５９３～５６０８のいずれか１つと実質的に同一の配列を含み得る。ＮＬＳは、表１の配列のいずれか、又はこれらの組合せを含み得る。

場合によっては、ｔｒａｃｒ配列は特定の配列を有し得る。ｔｒａｃｒ配列は、天然のｔｒａｃｒＲＮＡ配列の少なくとも約６０～１００（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）の連続するヌクレオチドに対して、少なくとも約８０％を有し得る。ｔｒａｃｒ配列は、配列番号５５０５の少なくとも約６０～１００（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）の連続するヌクレオチドに対して、少なくとも約８０％の配列同一性を有し得る。場合によっては、ｔｒａｃｒＲＮＡは、配列番号５５０５の連続するヌクレオチドの、少なくとも約６０～９０（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）に対して、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有し得る。場合によっては、ｔｒａｃｒＲＮＡは、配列番号５５０５の少なくとも約６０～１００（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）の連続するヌクレオチドと実質的に同一であり得る。ｔｒａｃｒＲＮＡは配列番号５５０５を含み得る。

場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも１つの操作された合成ガイドリボ核酸（ｓｇＲＮＡ）は、配列番号５４６９に対して少なくとも約８０％の同一性を有する配列を含み得る。ｓｇＲＮＡは、配列番号５４６９に対して、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有する配列を含み得る。ｓｇＲＮＡは、配列番号５４６９と実質的に同一の配列を含み得る。

標的核酸遺伝子座が細胞内にあり得る場合、酵素は、配列番号２４９９～２７５０のいずれか１つに対して、少なくとも約７５％（例えば、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％）の同一性を有するＲｕｖＣ＿ＩＩＩドメインを有する酵素をコードする、オープンリーディングフレームを含有する核酸として供給され得る。当該エンドヌクレアーゼをコードするオープンリーディングフレームを含有するデオキシリボ核酸（ＤＮＡ）は、配列番号５５８１に対して、又は配列番号５５８１に対して少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有するバリアントにおいて、実質的に同一の配列を含み得る。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、ＣＭＶ、ＥＦ１ａ、ＳＶ４０、ＰＧＫ１、Ｕｂｃ、ヒトベータアクチン、ＣＡＧ、ＴＲＥ、又はＣａＭＫＩＩａプロモーターであり得る。エンドヌクレアーゼは、当該エンドヌクレアーゼをコードする当該オープンリーディングフレームを含有するキャップｍＲＮＡとして供給され得る。エンドヌクレアーゼは翻訳されたポリペプチドとして供給され得る。少なくとも１つの操作されたｓｇＲＮＡは、リボ核酸（ＲＮＡ）ｐｏｌＩＩＩプロモーターへと動作可能に連結された当該少なくとも１つの操作されたｓｇＲＮＡをコードする遺伝子配列を含有する、デオキシリボ核酸（ＤＮＡ）として供給され得る。場合によっては、生物は、真核生物であり得る。場合によっては、生物は、真菌であり得る。場合によっては、生物は、ヒトであり得る。

ＭＧ１５酵素

一態様では、本開示は、（ａ）エンドヌクレアーゼを含む、操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼは、Ｃａｓエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、ＩＩ型、クラスＩＩのＣａｓエンドヌクレアーゼである。エンドヌクレアーゼはＲｕｖＣ＿ＩＩＩドメインを含んでもよく、当該ＲｕｖＣ＿ＩＩＩドメインは、配列番号２７５１～２９１３のいずれか１つに対して少なくとも約７０％の配列同一性を有する。場合によっては、エンドヌクレアーゼはＲｕｖＣ＿ＩＩＩドメインを含んでもよく、ここで、ＲｕｖＣ＿ＩＩＩドメインは、配列番号２７５１～２９１３のいずれか１つに対して、少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％の同一性を有する。場合によっては、エンドヌクレアーゼは、配列番号２７５１～２９１３のいずれか１つと実質的に同一であるＲｕｖＣ＿ＩＩＩドメインを含み得る。エンドヌクレアーゼは、配列番号２７５１～２９１３のいずれか１つに対して少なくとも約７０％の配列同一性を有するＲｕｖＣ＿ＩＩＩドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号２７５１～２９１３のいずれか１つに対して、少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％の同一性を有するＲｕｖＣ＿ＩＩＩドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号２７５１～２９１３のいずれか１つと実質的に同一のＲｕｖＣ＿ＩＩＩドメインを含み得る。

エンドヌクレアーゼは、配列番号４５６５～４７２７のいずれか１つに対して少なくとも約７０％の同一性を有するＨＮＨドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号４５６５～４７２７のいずれか１つに対して、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有すＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号４５６５～４７２７のいずれか１つと実質的に同一のＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号４５６５～４７２７のいずれか１つに対して少なくとも約７０％の同一性を有するＨＮＨドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号４５６５～４７２７のいずれか１つに対して、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有すＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号４５６５～４７２７のいずれか１つと実質的に同一のＨＮＨドメインを含み得る。

場合によっては、エンドヌクレアーゼは、配列番号９３０～１０９２のいずれか１つに対して、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号９３０～１０９２のいずれか１つと実質的に同一であり得る。場合によっては、エンドヌクレアーゼは、配列番号９３０～１０９２のいずれか１つに対して、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号９３０～１０９２のいずれか１つと実質的に同一であり得る。

場合によっては、エンドヌクレアーゼは、１つ以上の核局在化配列（ＮＬＳ）を有するバリアントを含み得る。ＮＬＳは、当該エンドヌクレアーゼのＮ末端又はＣ末端に近接していてもよい。ＮＬＳは、配列番号９３０～１０９２のいずれか１つに対して、又は配列番号９３０～１０９２のいずれか１つに対して少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、若しくは少なくとも約９９％の同一性を有するバリアントに対して、Ｎ末端又はＣ末端に付加され得る。ＮＬＳはＳＶ４０ラージＴ抗原ＮＬＳであり得る。ＮＬＳはｃ－ｍｙｃＮＬＳであり得る。ＮＬＳは、配列番号５５９３～５６０８のいずれか１つに対して、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９９％の同一性を有する配列を含み得る。ＮＬＳは、配列番号５５９３～５６０８のいずれか１つと実質的に同一の配列を含み得る。ＮＬＳは、表１の配列のいずれか、又はこれらの組合せを含み得る。

場合によっては、ｔｒａｃｒ配列は特定の配列を有し得る。ｔｒａｃｒ配列は、天然のｔｒａｃｒＲＮＡ配列の少なくとも約６０～１００（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）の連続するヌクレオチドに対して、少なくとも約８０％を有し得る。ｔｒａｃｒ配列は、配列番号５５０６の少なくとも約６０～１００（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）の連続するヌクレオチドに対して、少なくとも約８０％の配列同一性を有し得る。場合によっては、ｔｒａｃｒＲＮＡは、配列番号５５０６の連続するヌクレオチドの、少なくとも約６０～９０（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）に対して、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有し得る。場合によっては、ｔｒａｃｒＲＮＡは、配列番号５５０６の少なくとも約６０～１００（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）の連続するヌクレオチドと実質的に同一であり得る。ｔｒａｃｒＲＮＡは配列番号５５０６を含み得る。

場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも１つの操作された合成ガイドリボ核酸（ｓｇＲＮＡ）は、配列番号５４７０に対して少なくとも約８０％の同一性を有する配列を含み得る。ｓｇＲＮＡは、配列番号５４７０に対して、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有する配列を含み得る。ｓｇＲＮＡは、配列番号５４７０と実質的に同一の配列を含み得る。

標的核酸遺伝子座が細胞内にあり得る場合、酵素は、配列番号２７５１～２９１３のいずれか１つに対して、少なくとも約７５％（例えば、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％）の同一性を有するＲｕｖＣ＿ＩＩＩドメインを有する酵素をコードする、オープンリーディングフレームを含有する核酸として供給され得る。当該エンドヌクレアーゼをコードするオープンリーディングフレームを含有するデオキシリボ核酸（ＤＮＡ）は、配列番号５５８２に対して、又は配列番号５５８２に対して少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有するバリアントにおいて、実質的に同一の配列を含み得る。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、ＣＭＶ、ＥＦ１ａ、ＳＶ４０、ＰＧＫ１、Ｕｂｃ、ヒトベータアクチン、ＣＡＧ、ＴＲＥ、又はＣａＭＫＩＩａプロモーターであり得る。エンドヌクレアーゼは、当該エンドヌクレアーゼをコードする当該オープンリーディングフレームを含有するキャップｍＲＮＡとして供給され得る。エンドヌクレアーゼは翻訳されたポリペプチドとして供給され得る。少なくとも１つの操作されたｓｇＲＮＡは、リボ核酸（ＲＮＡ）ｐｏｌＩＩＩプロモーターへと動作可能に連結された当該少なくとも１つの操作されたｓｇＲＮＡをコードする遺伝子配列を含有する、デオキシリボ核酸（ＤＮＡ）として供給され得る。場合によっては、生物は、真核生物であり得る。場合によっては、生物は、真菌であり得る。場合によっては、生物は、ヒトであり得る。

ＭＧ１６酵素

一態様では、本開示は、（ａ）エンドヌクレアーゼを含む、操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼは、Ｃａｓエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、ＩＩ型、クラスＩＩのＣａｓエンドヌクレアーゼである。エンドヌクレアーゼはＲｕｖＣ＿ＩＩＩドメインを含んでもよく、当該ＲｕｖＣ＿ＩＩＩドメインは、配列番号２９１４～３１７４のいずれか１つに対して少なくとも約７０％の配列同一性を有する。場合によっては、エンドヌクレアーゼはＲｕｖＣ＿ＩＩＩドメインを含んでもよく、ここで、ＲｕｖＣ＿ＩＩＩドメインは、配列番号２９１４～３１７４のいずれか１つに対して、少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％の同一性を有する。場合によっては、エンドヌクレアーゼは、配列番号２９１４～３１７４のいずれか１つと実質的に同一であるＲｕｖＣ＿ＩＩＩドメインを含み得る。エンドヌクレアーゼは、配列番号２９１４～３１７４のいずれか１つに対して少なくとも約７０％の配列同一性を有するＲｕｖＣ＿ＩＩＩドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号２９１４～３１７４のいずれか１つに対して、少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％の同一性を有するＲｕｖＣ＿ＩＩＩドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号２９１４～３１７４のいずれか１つと実質的に同一のＲｕｖＣ＿ＩＩＩドメインを含み得る。

エンドヌクレアーゼは、配列番号４７２８～４９８８のいずれか１つに対して少なくとも約７０％の同一性を有するＨＮＨドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号４７２８～４９８８のいずれか１つに対して、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有すＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号４７２８～４９８８のいずれか１つと実質的に同一のＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号４７２８～４９８８のいずれか１つに対して少なくとも約７０％の同一性を有するＨＮＨドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号４７２８～４９８８のいずれか１つに対して、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有すＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号４７２８～４９８８のいずれか１つと実質的に同一のＨＮＨドメインを含み得る。

場合によっては、エンドヌクレアーゼは、配列番号１０９３～１３５３のいずれか１つに対して、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号１０９３～１３５３のいずれか１つと実質的に同一であり得る。場合によっては、エンドヌクレアーゼは、配列番号１０９３～１３５３のいずれか１つに対して、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号１０９３～１３５３のいずれか１つと実質的に同一であり得る。

場合によっては、エンドヌクレアーゼは、１つ以上の核局在化配列（ＮＬＳ）を有するバリアントを含み得る。ＮＬＳは、当該エンドヌクレアーゼのＮ末端又はＣ末端に近接していてもよい。ＮＬＳは、配列番号１０９３～１３５３のいずれか１つに対して、又は配列番号１０９３～１３５３のいずれか１つに対して少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、若しくは少なくとも約９９％の同一性を有するバリアントに対して、Ｎ末端又はＣ末端に付加され得る。ＮＬＳはＳＶ４０ラージＴ抗原ＮＬＳであり得る。ＮＬＳはｃ－ｍｙｃＮＬＳであり得る。ＮＬＳは、配列番号５５９３～５６０８のいずれか１つに対して、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９９％の同一性を有する配列を含み得る。ＮＬＳは、配列番号５５９３～５６０８のいずれか１つと実質的に同一の配列を含み得る。ＮＬＳは、表１の配列のいずれか、又はこれらの組合せを含み得る。

場合によっては、ｔｒａｃｒ配列は特定の配列を有し得る。ｔｒａｃｒ配列は、天然のｔｒａｃｒＲＮＡ配列の少なくとも約６０～１００（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）の連続するヌクレオチドに対して、少なくとも約８０％を有し得る。ｔｒａｃｒ配列は、配列番号５５０７の少なくとも約６０～１００（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）の連続するヌクレオチドに対して、少なくとも約８０％の配列同一性を有し得る。場合によっては、ｔｒａｃｒＲＮＡは、配列番号５５０７の連続するヌクレオチドの、少なくとも約６０～９０（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）に対して、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有し得る。場合によっては、ｔｒａｃｒＲＮＡは、配列番号５５０７の少なくとも約６０～１００（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）の連続するヌクレオチドと実質的に同一であり得る。ｔｒａｃｒＲＮＡは配列番号５５０７を含み得る。

場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも１つの操作された合成ガイドリボ核酸（ｓｇＲＮＡ）は、配列番号５４７１に対して少なくとも約８０％の同一性を有する配列を含み得る。ｓｇＲＮＡは、配列番号５４７１に対して、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有する配列を含み得る。ｓｇＲＮＡは、配列番号５４７１と実質的に同一の配列を含み得る。

標的核酸遺伝子座が細胞内にあり得る場合、酵素は、配列番号２９１４～３１７４のいずれか１つに対して、少なくとも約７５％（例えば、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％）の同一性を有するＲｕｖＣ＿ＩＩＩドメインを有する酵素をコードする、オープンリーディングフレームを含有する核酸として供給され得る。当該エンドヌクレアーゼをコードするオープンリーディングフレームを含有するデオキシリボ核酸（ＤＮＡ）は、配列番号５５８３に対して、又は配列番号５５８３に対して少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有するバリアントにおいて、実質的に同一の配列を含み得る。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、ＣＭＶ、ＥＦ１ａ、ＳＶ４０、ＰＧＫ１、Ｕｂｃ、ヒトベータアクチン、ＣＡＧ、ＴＲＥ、又はＣａＭＫＩＩａプロモーターであり得る。エンドヌクレアーゼは、当該エンドヌクレアーゼをコードする当該オープンリーディングフレームを含有するキャップｍＲＮＡとして供給され得る。エンドヌクレアーゼは翻訳されたポリペプチドとして供給され得る。少なくとも１つの操作されたｓｇＲＮＡは、リボ核酸（ＲＮＡ）ｐｏｌＩＩＩプロモーターへと動作可能に連結された当該少なくとも１つの操作されたｓｇＲＮＡをコードする遺伝子配列を含有する、デオキシリボ核酸（ＤＮＡ）として供給され得る。場合によっては、生物は、真核生物であり得る。場合によっては、生物は、真菌であり得る。場合によっては、生物は、ヒトであり得る。

ＭＧ１８酵素

一態様では、本開示は、（ａ）エンドヌクレアーゼを含む、操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼは、Ｃａｓエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、ＩＩ型、クラスＩＩのＣａｓエンドヌクレアーゼである。エンドヌクレアーゼはＲｕｖＣ＿ＩＩＩドメインを含んでもよく、当該ＲｕｖＣ＿ＩＩＩドメインは、配列番号３１７５～３３００のいずれか１つに対して少なくとも約７０％の配列同一性を有する。場合によっては、エンドヌクレアーゼはＲｕｖＣ＿ＩＩＩドメインを含んでもよく、ここで、ＲｕｖＣ＿ＩＩＩドメインは、配列番号３１７５～３３００のいずれか１つに対して、少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％の同一性を有する。場合によっては、エンドヌクレアーゼは、配列番号３１７５～３３００のいずれか１つと実質的に同一であるＲｕｖＣ＿ＩＩＩドメインを含み得る。エンドヌクレアーゼは、配列番号３１７５～３３００のいずれか１つに対して少なくとも約７０％の配列同一性を有するＲｕｖＣ＿ＩＩＩドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号３１７５～３３００のいずれか１つに対して、少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％の同一性を有するＲｕｖＣ＿ＩＩＩドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号３１７５～３３００のいずれか１つと実質的に同一のＲｕｖＣ＿ＩＩＩドメインを含み得る。

エンドヌクレアーゼは、配列番号４９８９～５１４６のいずれか１つに対して少なくとも約７０％の同一性を有するＨＮＨドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号４９８９～５１４６のいずれか１つに対して、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有すＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号４９８９～５１４６のいずれか１つと実質的に同一のＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号４９８９～５１４６のいずれか１つに対して少なくとも約７０％の同一性を有するＨＮＨドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号４９８９～５１４６のいずれか１つに対して、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有すＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号４９８９～５１４６のいずれか１つと実質的に同一のＨＮＨドメインを含み得る。

場合によっては、エンドヌクレアーゼは、配列番号１３５４～１５１１のいずれか１つに対して、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号１３５４～１５１１のいずれか１つと実質的に同一であり得る。場合によっては、エンドヌクレアーゼは、配列番号１３５４～１５１１のいずれか１つに対して、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号１３５４～１５１１のいずれか１つと実質的に同一であり得る。

場合によっては、エンドヌクレアーゼは、１つ以上の核局在化配列（ＮＬＳ）を有するバリアントを含み得る。ＮＬＳは、当該エンドヌクレアーゼのＮ末端又はＣ末端に近接していてもよい。ＮＬＳは、配列番号１３５４～１５１１のいずれか１つに対して、又は配列番号１３５４～１５１１のいずれか１つに対して少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、若しくは少なくとも約９９％の同一性を有するバリアントに対して、Ｎ末端又はＣ末端に付加され得る。ＮＬＳはＳＶ４０ラージＴ抗原ＮＬＳであり得る。ＮＬＳはｃ－ｍｙｃＮＬＳであり得る。ＮＬＳは、配列番号５５９３～５６０８のいずれか１つに対して、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９９％の同一性を有する配列を含み得る。ＮＬＳは、配列番号５５９３～５６０８のいずれか１つと実質的に同一の配列を含み得る。ＮＬＳは、表１の配列のいずれか、又はこれらの組合せを含み得る。

場合によっては、ｔｒａｃｒ配列は特定の配列を有し得る。ｔｒａｃｒ配列は、天然のｔｒａｃｒＲＮＡ配列の少なくとも約６０～１００（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）の連続するヌクレオチドに対して、少なくとも約８０％を有し得る。ｔｒａｃｒ配列は、配列番号５５０８の少なくとも約６０～１００（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）の連続するヌクレオチドに対して、少なくとも約８０％の配列同一性を有し得る。場合によっては、ｔｒａｃｒＲＮＡは、配列番号５５０８の連続するヌクレオチドの、少なくとも約６０～９０（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）に対して、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有し得る。場合によっては、ｔｒａｃｒＲＮＡは、配列番号５５０８の少なくとも約６０～１００（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）の連続するヌクレオチドと実質的に同一であり得る。ｔｒａｃｒＲＮＡは配列番号５５０８を含み得る。

場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも１つの操作された合成ガイドリボ核酸（ｓｇＲＮＡ）は、配列番号５４７２に対して少なくとも約８０％の同一性を有する配列を含み得る。ｓｇＲＮＡは、配列番号５４７２に対して、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有する配列を含み得る。ｓｇＲＮＡは、配列番号５４７２と実質的に同一の配列を含み得る。

標的核酸遺伝子座が細胞内にあり得る場合、酵素は、配列番号３１７５～３３００のいずれか１つに対して、少なくとも約７５％（例えば、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％）の同一性を有するＲｕｖＣ＿ＩＩＩドメインを有する酵素をコードする、オープンリーディングフレームを含有する核酸として供給され得る。当該エンドヌクレアーゼをコードするオープンリーディングフレームを含有するデオキシリボ核酸（ＤＮＡ）は、配列番号５５８４に対して、又は配列番号５５８４に対して少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有するバリアントにおいて、実質的に同一の配列を含み得る。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、ＣＭＶ、ＥＦ１ａ、ＳＶ４０、ＰＧＫ１、Ｕｂｃ、ヒトベータアクチン、ＣＡＧ、ＴＲＥ、又はＣａＭＫＩＩａプロモーターであり得る。エンドヌクレアーゼは、当該エンドヌクレアーゼをコードする当該オープンリーディングフレームを含有するキャップｍＲＮＡとして供給され得る。エンドヌクレアーゼは翻訳されたポリペプチドとして供給され得る。少なくとも１つの操作されたｓｇＲＮＡは、リボ核酸（ＲＮＡ）ｐｏｌＩＩＩプロモーターへと動作可能に連結された当該少なくとも１つの操作されたｓｇＲＮＡをコードする遺伝子配列を含有する、デオキシリボ核酸（ＤＮＡ）として供給され得る。場合によっては、生物は、真核生物であり得る。場合によっては、生物は、真菌であり得る。場合によっては、生物は、ヒトであり得る。

ＭＧ２１酵素

一態様では、本開示は、（ａ）エンドヌクレアーゼを含む、操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼは、Ｃａｓエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、ＩＩ型、クラスＩＩのＣａｓエンドヌクレアーゼである。エンドヌクレアーゼはＲｕｖＣ＿ＩＩＩドメインを含んでもよく、当該ＲｕｖＣ＿ＩＩＩドメインは、配列番号３３３１～３４７４のいずれか１つに対して少なくとも約７０％の配列同一性を有する。場合によっては、エンドヌクレアーゼはＲｕｖＣ＿ＩＩＩドメインを含んでもよく、ここで、ＲｕｖＣ＿ＩＩＩドメインは、配列番号３３３１～３４７４のいずれか１つに対して、少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％の同一性を有する。場合によっては、エンドヌクレアーゼは、配列番号３３３１～３４７４のいずれか１つと実質的に同一であるＲｕｖＣ＿ＩＩＩドメインを含み得る。エンドヌクレアーゼは、配列番号３３３１～３４７４のいずれか１つに対して少なくとも約７０％の配列同一性を有するＲｕｖＣ＿ＩＩＩドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号３３３１～３４７４のいずれか１つに対して、少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％の同一性を有するＲｕｖＣ＿ＩＩＩドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号３３３１～３４７４のいずれか１つと実質的に同一のＲｕｖＣ＿ＩＩＩドメインを含み得る。

エンドヌクレアーゼは、配列番号５１４７～５２９０のいずれか１つに対して少なくとも約７０％の同一性を有するＨＮＨドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号５１４７～５２９０のいずれか１つに対して、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有すＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号５１４７～５２９０のいずれか１つと実質的に同一のＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号５１４７～５２９０のいずれか１つに対して少なくとも約７０％の同一性を有するＨＮＨドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号５１４７～５２９０のいずれか１つに対して、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有すＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号５１４７～５２９０のいずれか１つと実質的に同一のＨＮＨドメインを含み得る。

場合によっては、エンドヌクレアーゼは、配列番号１５１２～１６５５のいずれか１つに対して、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号１５１２～１６５５のいずれか１つと実質的に同一であり得る。場合によっては、エンドヌクレアーゼは、配列番号１５１２～１６５５のいずれか１つに対して、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号１５１２～１６５５のいずれか１つと実質的に同一であり得る。

場合によっては、エンドヌクレアーゼは、１つ以上の核局在化配列（ＮＬＳ）を有するバリアントを含み得る。ＮＬＳは、当該エンドヌクレアーゼのＮ末端又はＣ末端に近接していてもよい。ＮＬＳは、配列番号１５１２～１６５５のいずれか１つに対して、又は配列番号１５１２～１６５５のいずれか１つに対して少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、若しくは少なくとも約９９％の同一性を有するバリアントに対して、Ｎ末端又はＣ末端に付加され得る。ＮＬＳはＳＶ４０ラージＴ抗原ＮＬＳであり得る。ＮＬＳはｃ－ｍｙｃＮＬＳであり得る。ＮＬＳは、配列番号５５９３～５６０８のいずれか１つに対して、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９９％の同一性を有する配列を含み得る。ＮＬＳは、配列番号５５９３～５６０８のいずれか１つと実質的に同一の配列を含み得る。ＮＬＳは、表１の配列のいずれか、又はこれらの組合せを含み得る。

場合によっては、ｔｒａｃｒ配列は特定の配列を有し得る。ｔｒａｃｒ配列は、天然のｔｒａｃｒＲＮＡ配列の少なくとも約６０～１００（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）の連続するヌクレオチドに対して、少なくとも約８０％を有し得る。ｔｒａｃｒ配列は、配列番号５５０９の少なくとも約６０～１００（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）の連続するヌクレオチドに対して、少なくとも約８０％の配列同一性を有し得る。場合によっては、ｔｒａｃｒＲＮＡは、配列番号５５０９の連続するヌクレオチドの、少なくとも約６０～９０（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）に対して、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有し得る。場合によっては、ｔｒａｃｒＲＮＡは、配列番号５５０９の少なくとも約６０～１００（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）の連続するヌクレオチドと実質的に同一であり得る。ｔｒａｃｒＲＮＡは配列番号５５０９を含み得る。

場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも１つの操作された合成ガイドリボ核酸（ｓｇＲＮＡ）は、配列番号５４７３に対して少なくとも約８０％の同一性を有する配列を含み得る。ｓｇＲＮＡは、配列番号５４７３に対して、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有する配列を含み得る。ｓｇＲＮＡは、配列番号５４７３と実質的に同一の配列を含み得る。

標的核酸遺伝子座が細胞内にあり得る場合、酵素は配列番号３３３１～３４７４のいずれか１つに対して、少なくとも約７５％（例えば、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％）の同一性を有するＲｕｖＣ＿ＩＩＩドメインを有する酵素をコードする、オープンリーディングフレームを含有する核酸として供給され得る。当該エンドヌクレアーゼをコードするオープンリーディングフレームを含有するデオキシリボ核酸（ＤＮＡ）は、配列番号５５８５に対して、又は配列番号５５８５に対して少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有するバリアントにおいて、実質的に同一の配列を含み得る。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、ＣＭＶ、ＥＦ１ａ、ＳＶ４０、ＰＧＫ１、Ｕｂｃ、ヒトベータアクチン、ＣＡＧ、ＴＲＥ、又はＣａＭＫＩＩａプロモーターであり得る。エンドヌクレアーゼは、当該エンドヌクレアーゼをコードする当該オープンリーディングフレームを含有するキャップｍＲＮＡとして供給され得る。エンドヌクレアーゼは翻訳されたポリペプチドとして供給され得る。少なくとも１つの操作されたｓｇＲＮＡは、リボ核酸（ＲＮＡ）ｐｏｌＩＩＩプロモーターへと動作可能に連結された当該少なくとも１つの操作されたｓｇＲＮＡをコードする遺伝子配列を含有する、デオキシリボ核酸（ＤＮＡ）として供給され得る。場合によっては、生物は、真核生物であり得る。場合によっては、生物は、真菌であり得る。場合によっては、生物は、ヒトであり得る。

ＭＧ２２酵素

一態様では、本開示は、（ａ）エンドヌクレアーゼを含む、操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼは、Ｃａｓエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、ＩＩ型、クラスＩＩのＣａｓエンドヌクレアーゼである。エンドヌクレアーゼはＲｕｖＣ＿ＩＩＩドメインを含んでもよく、当該ＲｕｖＣ＿ＩＩＩドメインは、配列番号３４７５～３５６８のいずれか１つに対して少なくとも約７０％の配列同一性を有する。場合によっては、エンドヌクレアーゼはＲｕｖＣ＿ＩＩＩドメインを含んでもよく、ここで、ＲｕｖＣ＿ＩＩＩドメインは、配列番号３４７５～３５６８のいずれか１つに対して、少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％の同一性を有する。場合によっては、エンドヌクレアーゼは、配列番号３４７５～３５６８のいずれか１つと実質的に同一であるＲｕｖＣ＿ＩＩＩドメインを含み得る。エンドヌクレアーゼは、配列番号３４７５～３５６８のいずれか１つに対して少なくとも約７０％の配列同一性を有するＲｕｖＣ＿ＩＩＩドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号３４７５～３５６８のいずれか１つに対して、少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％の同一性を有するＲｕｖＣ＿ＩＩＩドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号３４７５～３５６８のいずれか１つと実質的に同一のＲｕｖＣ＿ＩＩＩドメインを含み得る。

エンドヌクレアーゼは、配列番号５２９１～５３８９のいずれか１つに対して少なくとも約７０％の同一性を有するＨＮＨドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号５２９１～５３８９のいずれか１つに対して、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有すＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号５２９１～５３８９のいずれか１つと実質的に同一のＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号５２９１～５３８９のいずれか１つに対して少なくとも約７０％の同一性を有するＨＮＨドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号５２９１～５３８９のいずれか１つに対して、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有すＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号５２９１～５３８９のいずれか１つと実質的に同一のＨＮＨドメインを含み得る。

場合によっては、エンドヌクレアーゼは、配列番号１６５６～１７５５のいずれか１つに対して、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号１６５６～１７５５のいずれか１つと実質的に同一であり得る。場合によっては、エンドヌクレアーゼは、配列番号１６５６～１７５５のいずれか１つに対して、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号１６５６～１７５５のいずれか１つと実質的に同一であり得る。

場合によっては、エンドヌクレアーゼは、１つ以上の核局在化配列（ＮＬＳ）を有するバリアントを含み得る。ＮＬＳは、当該エンドヌクレアーゼのＮ末端又はＣ末端に近接していてもよい。ＮＬＳは、配列番号４３２～６６０のいずれか１つに対して、又は配列番号１６５６～１７５５のいずれか１つに対して少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、若しくは少なくとも約９９％の同一性を有するバリアントに対して、Ｎ末端又はＣ末端に付加され得る。ＮＬＳはＳＶ４０ラージＴ抗原ＮＬＳであり得る。ＮＬＳはｃ－ｍｙｃＮＬＳであり得る。ＮＬＳは、配列番号５５９３～５６０８のいずれか１つに対して、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９９％の同一性を有する配列を含み得る。ＮＬＳは、配列番号５５９３～５６０８のいずれか１つと実質的に同一の配列を含み得る。ＮＬＳは、表１の配列のいずれか、又はこれらの組合せを含み得る。

場合によっては、ｔｒａｃｒ配列は特定の配列を有し得る。ｔｒａｃｒ配列は、天然のｔｒａｃｒＲＮＡ配列の少なくとも約６０～１００（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）の連続するヌクレオチドに対して、少なくとも約８０％を有し得る。ｔｒａｃｒ配列は、配列番号５５１０の少なくとも約６０～１００（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）の連続するヌクレオチドに対して、少なくとも約８０％の配列同一性を有し得る。場合によっては、ｔｒａｃｒＲＮＡは、配列番号５５１０の連続するヌクレオチドの、少なくとも約６０～９０（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）に対して、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有し得る。場合によっては、ｔｒａｃｒＲＮＡは、配列番号５５１０の少なくとも約６０～１００（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）の連続するヌクレオチドと実質的に同一であり得る。ｔｒａｃｒＲＮＡは配列番号５５１０を含み得る。

場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも１つの操作された合成ガイドリボ核酸（ｓｇＲＮＡ）は、配列番号５４７４に対して少なくとも約８０％の同一性を有する配列を含み得る。ｓｇＲＮＡは、配列番号５４７４に対して、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有する配列を含み得る。ｓｇＲＮＡは、配列番号５４７４と実質的に同一の配列を含み得る。

標的核酸遺伝子座が細胞内にあり得る場合、酵素は配列番号３４７５～３５６８のいずれか１つに対して、少なくとも約７５％（例えば、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％）の同一性を有するＲｕｖＣ＿ＩＩＩドメインを有する酵素をコードする、オープンリーディングフレームを含有する核酸として供給され得る。当該エンドヌクレアーゼをコードするオープンリーディングフレームを含有するデオキシリボ核酸（ＤＮＡ）は、配列番号５５８６に対して、又は配列番号５５８６に対して少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有するバリアントにおいて、実質的に同一の配列を含み得る。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、ＣＭＶ、ＥＦ１ａ、ＳＶ４０、ＰＧＫ１、Ｕｂｃ、ヒトベータアクチン、ＣＡＧ、ＴＲＥ、又はＣａＭＫＩＩａプロモーターであり得る。エンドヌクレアーゼは、当該エンドヌクレアーゼをコードする当該オープンリーディングフレームを含有するキャップｍＲＮＡとして供給され得る。エンドヌクレアーゼは翻訳されたポリペプチドとして供給され得る。少なくとも１つの操作されたｓｇＲＮＡは、リボ核酸（ＲＮＡ）ｐｏｌＩＩＩプロモーターへと動作可能に連結された当該少なくとも１つの操作されたｓｇＲＮＡをコードする遺伝子配列を含有する、デオキシリボ核酸（ＤＮＡ）として供給され得る。場合によっては、生物は、真核生物であり得る。場合によっては、生物は、真菌であり得る。場合によっては、生物は、ヒトであり得る。

ＭＧ２３酵素

一態様では、本開示は、（ａ）エンドヌクレアーゼを含む、操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼは、Ｃａｓエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、ＩＩ型、クラスＩＩのＣａｓエンドヌクレアーゼである。エンドヌクレアーゼはＲｕｖＣ＿ＩＩＩドメインを含んでもよく、当該ＲｕｖＣ＿ＩＩＩドメインは、配列番号３５６９～３６３７のいずれか１つに対して少なくとも約７０％の配列同一性を有する。場合によっては、エンドヌクレアーゼはＲｕｖＣ＿ＩＩＩドメインを含んでもよく、ここで、ＲｕｖＣ＿ＩＩＩドメインは、配列番号３５６９～３６３７のいずれか１つに対して、少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％の同一性を有する。場合によっては、エンドヌクレアーゼは、配列番号３５６９～３６３７のいずれか１つと実質的に同一であるＲｕｖＣ＿ＩＩＩドメインを含み得る。エンドヌクレアーゼは、配列番号３５６９～３６３７のいずれか１つに対して少なくとも約７０％の配列同一性を有するＲｕｖＣ＿ＩＩＩドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号３５６９～３６３７のいずれか１つに対して、少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％の同一性を有するＲｕｖＣ＿ＩＩＩドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号３５６９～３６３７のいずれか１つと実質的に同一のＲｕｖＣ＿ＩＩＩドメインを含み得る。

エンドヌクレアーゼは、配列番号５３９０～５４６０のいずれか１つに対して少なくとも約７０％の同一性を有するＨＮＨドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号５３９０～５４６０のいずれか１つに対して、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有すＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号５３９０～５４６０のいずれか１つと実質的に同一のＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号５３９０～５４６０のいずれか１つに対して少なくとも約７０％の同一性を有するＨＮＨドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号５３９０～５４６０のいずれか１つに対して、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有すＨＮＨドメインを含み得る。エンドヌクレアーゼは、配列番号５３９０～５４６０のいずれか１つと実質的に同一のＨＮＨドメインを含み得る。

場合によっては、エンドヌクレアーゼは、配列番号１７５６～１８２６のいずれか１つに対して、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号１７５６～１８２６のいずれか１つと実質的に同一であり得る。場合によっては、エンドヌクレアーゼは、配列番号１７５６～１８２６のいずれか１つに対して、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号１７５６～１８２６のいずれか１つと実質的に同一であり得る。

場合によっては、エンドヌクレアーゼは、１つ以上の核局在化配列（ＮＬＳ）を有するバリアントを含み得る。ＮＬＳは、当該エンドヌクレアーゼのＮ末端又はＣ末端に近接していてもよい。ＮＬＳは、配列番号１７５６～１８２６のいずれか１つに対して、又は配列番号１７５６～１８２６のいずれか１つに対して少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、若しくは少なくとも約９９％の同一性を有するバリアントに対して、Ｎ末端又はＣ末端に付加され得る。ＮＬＳはＳＶ４０ラージＴ抗原ＮＬＳであり得る。ＮＬＳはｃ－ｍｙｃＮＬＳであり得る。ＮＬＳは、配列番号５５９３～５６０８のいずれか１つに対して、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９９％の同一性を有する配列を含み得る。ＮＬＳは、配列番号５５９３～５６０８のいずれか１つと実質的に同一の配列を含み得る。ＮＬＳは、表１の配列のいずれか、又はこれらの組合せを含み得る。

場合によっては、ｔｒａｃｒ配列は特定の配列を有し得る。ｔｒａｃｒ配列は、天然のｔｒａｃｒＲＮＡ配列の少なくとも約６０～１００（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）の連続するヌクレオチドに対して、少なくとも約８０％を有し得る。ｔｒａｃｒ配列は、配列番号５５１１の少なくとも約６０～１００（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）の連続するヌクレオチドに対して、少なくとも約８０％の配列同一性を有し得る。場合によっては、ｔｒａｃｒＲＮＡは、配列番号５５１１の連続するヌクレオチドの、少なくとも約６０～９０（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）に対して、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有し得る。場合によっては、ｔｒａｃｒＲＮＡは、配列番号５５１１の少なくとも約６０～１００（例えば、少なくとも約６０、少なくとも約６５、少なくとも約７０、少なくとも約７５、少なくとも約８０、少なくとも約８５、又は少なくとも約９０）の連続するヌクレオチドと実質的に同一であり得る。ｔｒａｃｒＲＮＡは配列番号５５１１を含み得る。

場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも１つの操作された合成ガイドリボ核酸（ｓｇＲＮＡ）は、配列番号５４７５に対して少なくとも約８０％の同一性を有する配列を含み得る。ｓｇＲＮＡは、配列番号５４７５に対して、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有する配列を含み得る。ｓｇＲＮＡは、配列番号５４７５と実質的に同一の配列を含み得る。

標的核酸遺伝子座が細胞内にあり得る場合、酵素は配列番号３５６９～３６３７のいずれか１つに対して、少なくとも約７５％（例えば、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％）の同一性を有するＲｕｖＣ＿ＩＩＩドメインを有する酵素をコードする、オープンリーディングフレームを含有する核酸として供給され得る。当該エンドヌクレアーゼをコードするオープンリーディングフレームを含有するデオキシリボ核酸（ＤＮＡ）は、配列番号５５８７に対して、又は配列番号５５８７に対して少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、又は少なくとも約９９％の同一性を有するバリアントにおいて、実質的に同一の配列を含み得る。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、ＣＭＶ、ＥＦ１ａ、ＳＶ４０、ＰＧＫ１、Ｕｂｃ、ヒトベータアクチン、ＣＡＧ、ＴＲＥ、又はＣａＭＫＩＩａプロモーターであり得る。エンドヌクレアーゼは、当該エンドヌクレアーゼをコードする当該オープンリーディングフレームを含有するキャップｍＲＮＡとして供給され得る。エンドヌクレアーゼは翻訳されたポリペプチドとして供給され得る。少なくとも１つの操作されたｓｇＲＮＡは、リボ核酸（ＲＮＡ）ｐｏｌＩＩＩプロモーターへと動作可能に連結された当該少なくとも１つの操作されたｓｇＲＮＡをコードする遺伝子配列を含有する、デオキシリボ核酸（ＤＮＡ）として供給され得る。場合によっては、生物は、真核生物であり得る。場合によっては、生物は、真菌であり得る。場合によっては、生物は、ヒトであり得る。

本開示のシステムは、例えば、核酸編集（例えば、遺伝子編集）、核酸分子への結合（例えば、配列特異的結合）などの様々な用途に使用することができる。このようなシステムは、例えば、細胞内でのその機能を確認するために遺伝子を不活性化する、対象に疾患を引き起こし得る遺伝的に継承された突然変異に対処する（例えば、取り外し又は交換）ため、疾患の原因となる遺伝子要素を（例えば、逆転写されたウイルスＲＮＡ又は疾患の原因となる突然変異をコードする増幅されたＤＮＡ配列の切断を介して）検出するための診断ツールとして、特定のヌクレオチド配列（例えば、抗生物質耐性ｉｎｔ細菌をコードする配列）を標的とし検出するためのプローブと組み合わせた非活性化酵素として、ウイルスゲノムを標的とすることによってウイルスを不活性又は宿主細胞に感染できないようにするように、遺伝子を追加して又は代謝経路を修正して生物に有益な低分子、高分子、若しくは二次代謝産物を産生させるように、進化的選択のための遺伝子駆動要素を確立するように、バイオセンサとしての外来の低分子及びヌクレオチドによる細胞の摂動を検出するように、使用される。

実施例１－新規タンパク質のメタゲノム分析
メタゲノム試料を、沈殿物、土壌、及び動物から収集した。デオキシリボ核酸（ＤＮＡ）を、ＺｙｍｏｂｉｏｍｉｃｓＤＮＡｍｉｎｉ－ｐｒｅｐキットで抽出し、ＩｌｌｕｍｉｎａＨｉＳｅｑ（登録商標）２５００でシーケンシングした。試料は不動産所有者の同意を得て収集された。公的供給源からの追加の生配列データには、動物微生物叢、堆積物、土壌、温泉、熱水噴出孔、海洋、泥炭湿原、永久凍土、及び下水配列が含まれた。メタゲノム配列データを、ＩＩ型Ｃａｓエフェクタータンパク質を含む既知のＣａｓタンパク質配列に基づいて生成された隠れマルコフモデルを用いて検索して、新しいＣａｓエフェクターを同定した（図４５を参照されたく、これは、異なる試料型から検出されたそのようなタンパク質の分布を示す）。検索によって同定された新規エフェクタータンパク質を既知のタンパク質に整列させて、潜在的な活性部位を同定した（図４６を参照されたく、これは、異なる部位から同定された酵素間のＣａｓ触媒残基の分布を示す）。このメタゲノムワークフローは、本明細書に記載のクラスＩＩタイプＩＩＣＲＩＳＰＲエンドヌクレアーゼのＭＧ１、ＭＧ２、ＭＧ３、ＭＧ４、ＭＧ６、ＭＧ１４、ＭＧ１５、ＭＧ１６、ＭＧ１８、ＭＧ２１、ＭＧ２２、及びＭＧ２３ファミリーの描写をもたらした。

実施例２Ａ．－ＣＲＩＳＰＲシステムのＭＧ１ファミリーの発見
実施例１のメタゲノム分析からのデータの分析により、最初に６つのメンバー（配列番号５、６、１、２、及び３としてそれぞれ記録された、ＭＧ１－１、ＭＧ１－２、ＭＧ１－３、ＭＧ１－４、ＭＧ１－５、及びＭＧ１－６）を含む、以前に記載されていない推定ＣＲＩＳＰＲシステムの新しいクラスターが明らかになった。このファミリーは、ＨＮＨドメイン及びＲｕｖＣドメインを担持する酵素を特徴とする。このファミリーのＲｕｖＣドメインは、以前に記載されたＣａｓ９ファミリーメンバーとの相同性が低いＲｕｖＣ＿ＩＩＩ部分を有する。初期ファミリーメンバーはそれらの間で最大５６．８％の同一性を有するが、６つの酵素は全てＲｕｖＣドメインの異なるＲｕｖＣ＿ＩＩＩ部分を呈し、ＲＨＨＡＬＤＡＭＶ（配列番号５６１５）、ＫＨＨＡＬＤＡＭＣ（配列番号５６１６）、又はＫＨＨＡＬＤＡＩＣ（配列番号５６１７）の共通モチーフを担持する。これらのモチーフは、他の記載されたＣａｓ９様酵素には見られない。これらの新規酵素及びそれらの関連サブドメインの対応するタンパク質及び核酸配列を配列表に提示する。推定ｔｒａｃｒＲＮＡ配列を、他の遺伝子に対するそれらの位置に基づいて同定し、配列番号５４７６～５４７９として提示する。酵素システムは、ＣＲＩＳＰＲシステムを含有するゲノムｂｉｎ由来の１６ＳＲＮＡの配列に基づいて、ウェルコミクロビウム（Ｖｅｒｒｕｃｏｍｉｃｒｏｂｉａ）門、カンディダートゥス・ペレグリニバクテリア（ＣａｎｄｉｄａｔｕｓＰｅｒｅｇｒｉｎｉｂａｃｔｅｒｉａ）門、又はカンディダートゥス・メライナバクテリア（ＣａｎｄｉｄａｔｕｓＭｅｌａｉｎａｂａｃｔｅｒｉａ）門に由来すると思われる。１６ＳｒＲＮＡ配列を配列番号５５９２～５５９６として提示する）。Ｓｈｍａｋｏｖらによって記載された特徴（「ＭｏｌＣｅｌｌ．」、２０１５年１１月５日；第６０巻（第３号）：第３８５～９７頁、参照によりその全体が組み込まれる）を一緒に呼び出すＣＲＩＳＰＲシステム配列の詳細なドメインレベルのアラインメントを、図９Ａ、図９Ｂ、図９Ｃ、図９Ｄ、図９Ｅ、図９Ｆ、図９Ｇ、及び図９Ｈに示す。ＭＧ１－１、１－２、及び１－３と追加の独自タンパク質データセットとの比較により、配列番号７～３１９として提示される、同様の構造を有する追加のタンパク質配列が明らかになった。これらのＭＧ１タンパク質配列は、配列番号５６１８～５６３２に示されるような追加のＭＧ１モチーフの発見をもたらした。

実施例２Ｂ．－ＣＲＩＳＰＲシステムのＭＧ２ファミリーの発見
実施例１のメタゲノム分析からのデータの分析により、６つのメンバー（ＭＧ２－１、ＭＧ２－２、ＭＧ２－３、ＭＧ２－５、及びＭＧ２－６）を含む、これまでに記載されていない推定ＣＲＩＳＰＲシステムの新しいクラスターが明らかになった。これらの新規酵素及び例示的なサブドメインの対応するタンパク質及び核酸配列は、配列番号３２０、３２２～３２５として提示されている。他の遺伝子に対するそれらの位置に基づいて、推定ｔｒａｃｒＲＮＡ配列を、オペロンにおいて同定し、配列番号５４９０、５４９２～５４９４、及び５５３８として提示する。Ｓｈｍａｋｏｖら（「ＭｏｌＣｅｌｌ．」、２０１５年１１月５日；第６０巻（第３号）：第３８５～９７頁）に概説されているＣａｓ９に対するこれらの配列の詳細なドメインレベルのアラインメントを図７に示す。

ＭＧ２－１、ＭＧ２－２、ＭＧ２－３、ＭＧ２－５、及びＭＧ２－６対追加の独自タンパク質データセットの比較により、配列番号３２１及び配列番号３２６～４２０として提示される、類似の構造を有する追加のタンパク質配列が明らかになった。ＭＧ２ファミリーメンバーで一般的に見られるモチーフは、配列番号５６３１～５６３８として提示されている。

実施例２Ｃ．－ＣＲＩＳＰＲシステムのＭＧ３ファミリーの発見
実施例１のメタゲノム分析からのデータの分析により、新規のこれまでに記載されていない推定ＣＲＩＳＰＲシステム：ＭＧ３－１が明らかになった。この新規酵素及びその例示的なサブドメインの対応するアミノ酸配列を、配列番号４２４、２２４５、及び４０５９として提示する。オペロン中の他の要素への近接に基づいて、推定ｔｒａｃｒＲＮＡ含有配列が同定され、配列番号５４９８として含まれる。アクチノミセス・ネスルンディ（Ａｃｔｉｎｏｍｙｃｅｓｎａｅｓｌｕｎｄｉｉ）由来のＣａｓ９に対する配列の詳細なドメインレベルのアラインメントを図８に示す。

ＭＧ３－１対追加の独自のタンパク質データセットの比較により、配列番号４２１～４２３、４２５～４３１として提示される、類似の構造を有する追加のタンパク質配列が明らかになった。

実施例２Ｄ．－ＣＲＩＳＰＲシステムのＭＧ４、７、１４、１５、１６、１８、２１、２２、２３ファミリーの発見
実施例１のメタゲノム分析からのデータの分析により、各１つのメンバーの９つのファミリーを含む以前に記載されていない推定ＣＲＩＳＰＲシステムの新しいクラスターが明らかになった（ＭＧ４－５、ＭＧ７－２、ＭＧ１４－１、ＭＧ１５－１、ＭＧ１６－２、ＭＧ１８－１、ＭＧ２１－１、ＭＧ２２－１、ＭＧ２３－１）。これらの新規酵素及びそれらの例示的なサブドメインの対応するタンパク質及び核酸配列は、配列番号４３２、６６９、６７８、９３０、１０９３、１３５４、１５１２、１６５６、１７５６として提示されている。オペロン中の他の要素との近接に基づいて、推定ｔｒａｃｒ含有配列を各ファミリーについて同定した。これらの配列は、それぞれ、配列番号５５０３～５５１１として配列表に提示されている。

ＭＧ４－５、ＭＧ７－２、ＭＧ１４－１、ＭＧ１５－１、ＭＧ１６－２、ＭＧ１８－１、ＭＧ２１－１、ＭＧ２２－１、ＭＧ２３－１と追加の独自タンパク質データセットとの比較により、配列番号４３３～６６０、６７０～６７７、６７９～９２９、９３１～１０９２、１０９４～１３５３、１３５５～１５１１、１５１３～１６５５、１６５７～１７５５、及び１７５７～１８２６として提示される、類似の構造を有する追加のタンパク質配列が明らかになった。ＣＲＩＳＰＲシステムのこれらのセットのヌクレアーゼに共通するモチーフは、ＭＧ４では配列番号５６４９、ＭＧ１４では配列番号５６５０～５６６７、ＭＧ１５では５６６８～５６７５、ＭＧ１６では配列番号５６７６～５６７８、ＭＧ１８では配列番号５６７９～５６８６、ＭＧ２１では配列番号５６８７～５６９３及び配列番号５６７４～５６７５、ＭＧ２２では配列番号５６９４～５６９９、並びにＭＧ２３では配列番号５７００～５７１７として提示される。

実施例３．－予測－－プロトスペーサー隣接モチーフの決定。
実験は、Ｋａｒｖｅｌｉｓら、「Ｍｅｔｈｏｄｓ．」、２０１７年５月１５日；第１２１～１２２巻：第３～８頁の実施例のいずれかと同様に行う。これは、本明細書に記載の新規酵素のプロトスペーサー隣接モチーフ（ＰＡＭ）配列特異性を同定して、最適な合成配列標的化を可能にするために、参照により本明細書に完全に組み込まれる。

一例（インビボスクリーニング）では、本明細書に記載の酵素のいずれかをコードするプラスミド、及びプロトスペーサー標的化ガイドＲＮＡを担持する細胞を、抗生物質耐性遺伝子、及びランダム化ＰＡＭ配列に隣接するプロトスペーサー配列を含有するプラスミドライブラリーで同時形質転換する。機能性ＰＡＭを含有するプラスミドは酵素によって切断され、細胞死をもたらす。生存細胞から単離された酵素切断耐性プラスミドプールのディープシーケンシングは、機能的切断許容ＰＡＭを含有する枯渇プラスミドのセットを示す。

別の例（インビトロスクリーニング）では、ＤＮＡプラスミド又は鎖状体リピートの形態のＰＡＭライブラリーを、インビトロ又は細胞溶解物中で組み立てられたＲＮＰ複合体（例えば、酵素、ｔｒａｃｒＲＮＡ及びｃｒＲＮＡ、又は酵素及びハイブリッドｓｇＲＮＡを含む）による切断に供する。成功した切断事象から得られた遊離ＤＮＡ末端は、アダプタライゲーションによって捕捉され、続いてＰＡＭ側産物のＰＣＲ増幅が行われる。機能性ＰＡＭの増幅ライブラリーをディープシーケンシングに供し、ＤＮＡ切断をライセンスするＰＡＭを同定する。

実施例４．－予告（Ｐｒｏｐｈｅｔｉｃ）－ゲノム編集のための哺乳動物細胞における本明細書に記載の合成ＣＲＩＳＰＲシステムの使用
（ｉ）細胞適合性Ｃ末端核局在化配列（例えば、ヒト細胞の場合にはＳＶ４０ＮＬＳ）及び好適なポリアデニル化シグナル（例えば、ヒト細胞の場合のＴＫｐＡシグナル）を有する細胞適合性プロモーター下におけるコドン最適化酵素をコードするＯＲＦと、（ｉｉ）好適なポリメラーゼＩＩＩプロモーター（例えば、哺乳動物細胞におけるＵ６プロモーター）下におけるｓｇＲＮＡ（Ｇで始まる５’配列に続いてゲノムＤＮＡを標的化する２０ｎｔの相補的標的化核酸配列を有し、その後に例３を介して同定された対応する適合ＰＡＭと、３’ｔｒａｃｒ結合配列、リンカー、及びｔｒａｃｒＲＮＡ配列を有する）をコードするＯＲＦ）をコードするＯＲＦと、をコードするＤＮＡ／ＲＮＡ配列を調製する。いくつかの実施形態では、これらの配列は、好適な技術を介して真核細胞にトランスフェクトされる、同じ又は別個のプラスミドベクター上で調製される。いくつかの実施形態では、これらの配列は、細胞にトランスフェクト又は微量注入される、別個のＤＮＡ配列として調製される。いくつかの実施形態では、これらの配列は、細胞にトランスフェクト又は微量注入される合成ＲＮＡ又はインビトロ転写ＲＮＡとして調製される。いくつかの実施形態では、これらの配列はタンパク質に翻訳され、細胞にトランスフェクト又は微量注入される。

どちらのトランスフェクション方法を選択したとしても、（ｉ）及び（ｉｉ）を細胞へと導入する。酵素及び／又はｓｇＲＮＡを活性形態へと転写及び／又は翻訳することができるように、インキュベーション期間を経過させる。インキュベーション期間後、標的化配列の近傍のゲノムＤＮＡを分析する（例えば、シーケンシングによる）。インデルは、酵素媒介切断及び非相同末端結合の結果として、標的化配列の近傍のゲノムＤＮＡへと導入される。

いくつかの実施形態では、（ｉ）及び（ｉｉ）は、相同組換え修復を促進する、２５ｂｐ以上のサイズの切断部位に隣接するゲノムの領域をコードする第３の修復ヌクレオチドを有する細胞へと導入される。これらの隣接配列内に含有されるのは、単一塩基対突然変異、機能的遺伝子断片、発現のための外来遺伝子若しくはネイティブ遺伝子、又は生化学経路を構成するいくつかの遺伝子であり得る。

実施例５．－予告－インビトロでの本明細書に記載の合成ＣＲＩＳＰＲシステムの使用
本明細書に記載の酵素のいずれかは、精製タグを含有する好適な大腸菌（Ｅ．ｃｏｌｉ）発現プラスミドにクローニングされ、大腸菌（Ｅ．ｃｏｌｉ）で組換え発現され、組換えタグを用いて精製される。５’Ｇと、それに続く２０ｎｔ標的化配列及びＰＡＭ配列、適合性ｃｒＲＮＡのｔｒａｃｒＲＮＡ結合領域、ＧＡＡＡリンカー、並びに適合性ｔｒａｃｒＲＮＡとを含むＲＮＡは、好適な固相ＲＮＡ合成方法によって合成される。組換え酵素及びｓｇＲＮＡを、Ｍｇ２＋（例えば、２０ｍＭＨＥＰＥＳｐＨ７．５、１００ｍＭＫＣｌ、５ｍＭＭｇＣｌ_２、１ｍＭＤＴＴ、５％グリセロール）を含有する好適な切断緩衝液中で組み合わせ、標的化配列及びＰＡＭ配列に相補的な配列を含む標的ＤＮＡを導入することによって、反応を開始する。ＤＮＡの切断を好適なアッセイ（例えば、アガロースゲル電気泳動と、それに続く臭化エチジウム染色（又は同様に作用するＤＮＡ挿入剤）及びＵＶ可視化と）によって監視する。

実施例６．－（一般プロトコル）本明細書に記載のエンドヌクレアーゼのＰＡＭ配列の同定／確認
ＰＡＭ配列は、大腸菌（Ｅ．ｃｏｌｉ）溶解物ベースの発現システム（ｍｙＴＸＴＬ、ＡｒｂｏｒＢｉｏｓｃｉｅｎｃｅｓ）で発現される推定エンドヌクレアーゼによって切断され得る、ランダムに生成されたＰＡＭ配列を含有するプラスミドをシーケンシングすることによって決定した。このシステムでは、大腸菌（Ｅ．ｃｏｌｉ）コドン最適化ヌクレオチド配列を、Ｔ７プロモーターの制御下においてＰＣＲ断片から転写及び翻訳した。Ｔ７プロモーター下におけるｔｒａｃｒ配列、及びＴ７プロモーターとそれに続くリピートスペーサー反復配列からなる最小ＣＲＩＳＰＲアレイとを有する第２のＰＣＲ断片を同じ反応で転写した。ＴＸＴＬシステムにおけるエンドヌクレアーゼ及びｔｒａｃｒ配列の発現の成功、その後のＣＲＩＳＰＲアレイプロセシングは、活性なインビトロＣＲＩＳＰＲヌクレアーゼ複合体を提供した。

最小アレイとそれに続く８Ｎ混合塩基（推定ＰＡＭ配列）と一致するスペーサー配列を含有する標的プラスミドのライブラリーを、ＴＸＴＬ反応の出力とともにインキュベートした。１～３時間後、反応を停止させ、ＤＮＡを、ＤＮＡクリーンアップキット、例えばＺｙｍｏＤＣＣ、ＡＭＰｕｒｅＸＰビーズ、ＱｉａＱｕｉｃｋ等によって回収した。アダプタ配列を、エンドヌクレアーゼによって切断されている活性ＰＡＭ配列を有するＤＮＡに平滑末端ライゲーションしたが、一方で切断されなかったＤＮＡはライゲーションにアクセスできなかった。次いで、活性ＰＡＭ配列を含むＤＮＡセグメントを、ライブラリー及びアダプタ配列に特異的なプライマを用いたＰＣＲによって増幅した。ＰＣＲ増幅産物をゲル上で分解して、切断事象に対応するアンプリコンを同定した。切断反応の増幅セグメントはまた、ＮＧＳライブラリーを調製するための鋳型としても使用した。出発８Ｎライブラリーのサブセットであったこの得られたライブラリーのシーケンシングにより、活性ＣＲＩＳＰＲ複合体に対する正しいＰＡＭを含有する配列が明らかになった。単一のＲＮＡ構築物を用いたＰＡＭ試験のために、インビトロ転写ＲＮＡをプラスミドライブラリーと共に添加し、ｔｒａｃｒ／最小ＣＲＩＳＰＲアレイ鋳型を省略したことを除いて、同じ手順を繰り返した。ＮＧＳライブラリーが調製されたエンドヌクレアーゼについては、ｓｅｑＬｏｇｏ（例えば、Ｈｕｂｅｒら、「ＮａｔＭｅｔｈｏｄｓ．」、２０１５年２月；第１２巻（第２号）：第１１５～２１頁）表現が構築され、図２７、図３８、図２９、図３０、図３１、図３２、図３３、図３４、及び図３５に提示される。これらの表現を構築するために使用されるｓｅｑＬｏｇｏモジュールは、ＤＮＡ配列モチーフ（例えば、ＰＡＭシーケンス）の位置重みマトリックスを取り、Ｓｃｈｎｅｉｄｅｒ及びＳｔｅｐｈｅｎｓによって導入された対応する配列ロゴをプロットする（例えば、Ｓｃｈｎｅｉｄｅｒら、「ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．」、１９９０年１０月２５日；第１８巻（第２０号）：第６０９７～１００頁。ｓｅｑＬｏｇｏ表現内の配列を表す文字は、整列された配列（例えば、ＰＡＭ配列）内の各位置で互いに積み重ねられている。各文字の高さはその頻度に比例し、最も一般的な文字が上になるように文字がソートされている。

実施例７．－（一般プロトコル）ｔｒａｃｒＲＮＡ及びｓｇＲＮＡ構造のＲＮＡフォールディング
Ａｎｄｒｏｎｅｓｃｕら、「Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ．」、２００７年７月１日；第２３巻（第１３号）：第ｉ１９～２８頁（参照によりその全体が本明細書に組み込まれる）の方法を用いて、３７℃でのガイドＲＮＡ配列のフォールド構造を計算した。本明細書中に記載される例示的なｓｇＲＮＡの予測される構造を、図２１、図２２、図２３、図２４、図２５、及び図２６に提示する。

実施例８．－（一般プロトコル）ＭＧＣＲＩＳＰＲ複合体のインビトロ切断効率
エンドヌクレアーゼを、プロテアーゼ欠損大腸菌（Ｅ．ｃｏｌｉ）Ｂ株における誘導可能なＴ７プロモーターからのＨｉｓタグ化融合タンパク質として発現させた。Ｈｉｓタグ化タンパク質を発現する細胞を超音波処理によって溶解し、Ｈｉｓタグ化タンパク質を、ＡＫＴＡＡｖａｎｔＦＰＬＣ（ＧＥＬｉｆｅｓｃｉｅｎｃｅ）でのＨｉｓＴｒａｐＦＦカラム（ＧＥＬｉｆｅｓｃｉｅｎｃｅ）におけるＮｉ－ＮＴＡアフィニティクロマトグラフィによって精製した。溶出液をアクリルアミドゲル（Ｂｉｏ－Ｒａｄ）上でＳＤＳ－ＰＡＧＥによって分解し、ＩｎｓｔａｎｔＢｌｕｅＵｌｔｒａｆａｓｔクーマシー（Ｓｉｇｍａ－Ａｌｄｒｉｃｈ）で染色した。ＩｍａｇｅＬａｂソフトウェア（Ｂｉｏ－Ｒａｄ）を用いたタンパク質バンドのデンシトメトリを用いて純度を決定した。精製エンドヌクレアーゼを、５０ｍＭＴｒｉｓ－ＨＣｌ、３００ｍＭＮａＣｌ、１ｍＭＴＣＥＰ、５％グリセロールからなる保存緩衝液に透析し、ｐＨ７．５、－８０℃で保存した。

スペーサー配列及びＰＡＭ配列（例えば、実施例６のように決定）を含有する標的ＤＮＡを、ＤＮＡ合成によって構築した。単一の代表的なＰＡＭを、ＰＡＭが縮重塩基を有する場合の試験のために選択した。標的ＤＮＡは、一端から７００ｂｐに位置するＰＡＭ及びスペーサーを用いたＰＣＲ増幅によって、プラスミドに由来する２２００ｂｐの線状ＤＮＡを含んでいた。切断が成功すると、７００ｂｐ及び１５００ｂｐの断片が得られた。標的ＤＮＡ、インビトロ転写単一ＲＮＡ、及び精製組換えタンパク質を、過剰なタンパク質及びＲＮＡを伴う切断緩衝液（１０ｍＭトリス、１００ｍＭＮａＣｌ、１０ｍＭＭｇＣｌ_２）中で合わせ、５分間～３時間、通常は１時間インキュベートした。反応を、ＲＮＡｓｅＡの添加及び６０分間のインキュベーションによって停止させた。次いで、反応物を１．２％ＴＡＥアガロースゲルで分解し、切断された標的ＤＮＡの画分をＩｍａｇｅＬａｂソフトウェアで定量化する。

実施例９．－（一般プロトコル）大腸菌（Ｅ．ｃｏｌｉ）におけるＭＧＣＲＩＳＰＲ複合体のゲノム切断活性の試験
大腸菌（Ｅ．ｃｏｌｉ）は二本鎖ＤＮＡ切断を効率的に修復する能力を欠く。したがって、ゲノムＤＮＡの切断は致死的な事象であり得る。この現象を利用して、エンドヌクレアーゼ活性を、そのゲノムＤＮＡに組み込まれたスペーサー／標的及びＰＡＭ配列を有する標的株においてエンドヌクレアーゼ及びｔｒａｃｒＲＮＡを組換え発現させることによって、大腸菌（Ｅ．ｃｏｌｉ）において試験した。

このアッセイでは、ＰＡＭ配列は、実施例６に記載の方法によって決定されるように、試験されているエンドヌクレアーゼに特異的である。ｓｇＲＮＡ配列は、ｔｒａｃｒＲＮＡの配列及び予測される構造に基づいて決定された。リピート部の５’末端から開始して、８～１２ｂｐ（一般に、１０ｂｐ）のリピート－抗－リピート（ｒｅｐｅａｔ－ａｎｔｉ－ｒｅｐｅａｔ）対を選択した。リピートの残りの３’末端及びｔｒａｃｒＲＮＡの５’末端をテトラループで置き換えた。概して、テトラループはＧＡＡＡであったが、特にＧＡＡＡ配列がフォールディングを妨害すると予測される場合、他のテトラループを使用することができる。これらの場合、ＴＴＣＧテトラループを使用した。

ゲノムＤＮＡに組み込まれたＰＡＭ配列を有する操作された株を、エンドヌクレアーゼをコードするＤＮＡで形質転換した。次いで、形質転換体を化学適格性にし、標的配列に対して特異的（「オンターゲット」）又は標的に対して非特異的（「ノンターゲット」）のいずれかである５０ｎｇのシングルガイドＲＮＡで形質転換した。熱衝撃後、形質転換を３７℃で２時間にわたりＳＯＣ中で回収させた。次いで、誘導培地上で増殖させた５倍希釈系列によってヌクレアーゼ効率を決定した。コロニーを３連で希釈系列から定量化した。

実施例１０ａ．－（一般プロトコル）哺乳動物細胞におけるＭＧＣＲＩＳＰＲ複合体のゲノム切断活性の試験
哺乳動物細胞における標的化及び切断活性を示すために、ＭＧＣａｓエフェクタータンパク質配列を、２つの哺乳動物発現ベクターで試験した：（ａ）Ｃ末端ＳＶ４０ＮＬＳ及び２Ａ－ＧＦＰタグを有する１つ、並びに（ｂ）ＧＦＰタグを有しない１つ、及び２つのＳＶ４０ＮＬＳ配列、Ｎ末端上の１つ及びＣ末端上の１つ。いくつかの例では、エンドヌクレアーゼをコードするヌクレオチド配列を、哺乳動物細胞における発現のためにコドン最適化した。

標的化配列が結合した対応するシングルガイドＲＮＡ配列（ｓｇＲＮＡ）を、第２の哺乳動物発現ベクターへとクローニングする。２つのプラスミドをＨＥＫ２９３Ｔ細胞へコトランスフェクトする。ＨＥＫ２９３Ｔ細胞への発現プラスミド及びｓｇＲＮＡ標的プラスミドのコトランスフェクションの７２時間後、ＤＮＡを抽出し、ＮＧＳライブラリーの調製に使用する。パーセントＮＨＥＪを、標的部位のシーケンシングにおけるインデルを介して測定して、哺乳動物細胞における酵素の標的化効率を実証する。各タンパク質の活性を試験するために、少なくとも１０個の異なる標的部位を選択した。

実施例１０ｂ．（一般プロトコル）哺乳動物細胞におけるＭＧＣＲＩＳＰＲ複合体のゲノム切断活性の試験
哺乳動物細胞における標的化及び切断活性を示すために、ＭＧＣａｓエフェクタータンパク質配列を２つの哺乳動物発現ベクターへとクローニングした：（ａ）隣接するＮ及びＣ末端ＳＶ４０ＮＬＳ配列、Ｃ末端Ｈｉｓタグ、及びＨｉｓタグの後のＣ末端に２Ａ－ＧＦＰタグを有する１つ（バックボーン１）、並びに（ｂ）隣接するＮＬＳ配列及びＣ末端Ｈｉｓタグを有するがＴ２ＡＧＦＰタグを有しない１つ（バックボーン２）。いくつかの例では、エンドヌクレアーゼをコードするヌクレオチド配列は、天然配列、大腸菌（Ｅ．ｃｏｌｉ）での発現のためにコドン最適化されたもの、又は哺乳動物細胞での発現のためにコドン最適化されたものであった。

標的化配列が結合した対応するシングルガイドＲＮＡ配列（ｓｇＲＮＡ）を、第２の哺乳動物発現ベクターへとクローニングした。２つのプラスミドをＨＥＫ２９３Ｔ細胞へコトランスフェクトした。ＨＥＫ２９３Ｔ細胞への発現プラスミド及びｓｇＲＮＡ標的プラスミドのコトランスフェクションの７２時間後、ＤＮＡを抽出し、ＮＧＳライブラリーの調製に使用した。パーセントＮＨＥＪを、標的部位のシーケンシングにおけるインデルを介して測定して、哺乳動物細胞における酵素の標的化効率を実証した。各タンパク質の活性を試験するために、約７～１２個の異なる標的部位を選択した。５％インデルの任意の閾値を使用して、活性候補を同定した。

実施例１１．－ＭＧ１ファミリーメンバーの性質決定
ＰＡＭ特異性、ｔｒａｃｒＲＮＡ／ｓｇＲＮＡ検証

ＭＧ１ファミリーエンドヌクレアーゼシステムの標的化されたエンドヌクレアーゼ活性を、実施例６に記載されるようなｍｙＴＸＴＬシステムを用いて確認した。このアッセイでは、切断された標的プラスミドのＰＣＲ増幅により、図１７～図２０に示すように、ゲル中においておよそ１７０ｂｐで移動する産物が得られる。増幅産物は、ＭＧ１－４（デュアルガイド：ゲル１、レーン３を参照、シングルガイド：ゲル６レーン２を参照）、ＭＧ１－５（ゲル２レーン１０）、ＭＧ１－６（デュアルガイド：ゲル５レーン６を参照、シングルガイド：ゲル６レーン５を参照）、及びＭＧ１－７（デュアルガイド：ゲル３レーン１３参照、シングルガイド：ゲル３レーン２参照）について観察された（それぞれ、タンパク質配列番号１～４）。ＰＣＲ産物のシーケンシングにより、表２に示すように、これらの酵素の活性ＰＡＭ配列が明らかになった。

合成シングルガイドＲＮＡ（ｓｇＲＮＡ）を、ｔｒａｃｒＲＮＡの配列及び予測構造に基づいて設計し、配列番号５４６１～５４６４として提示する。実施例６のＰＡＭ配列スクリーニングをｓｇＲＮＡで繰り返した。この実験の結果はまた表２にも提示するが、この結果は、ｓｇＲＮＡを用いた場合にＰＡＭ特異性がわずかに変化したことを明らかにする。

インビトロでの標的化エンドヌクレアーゼ活性

ＰＡＭ配列ＣＡＧＧＡＡＧＧを有する標的ＤＮＡに対するＭＧ１－４エンドヌクレアーゼシステム（ｓｇＲＮＡ配列番号５４６１を有するタンパク質配列番号１）のインビトロ活性を、実施例８の方法を用いて検証した。上で報告されたシングルガイド配列（配列番号５４６１）を使用し、１８～２４ｎｔの様々なスペーサー／標的化配列長を配列のＮに置き換えた。結果を図１０に示し、左側パネルは、異なる標的化配列長（１８～２４ｎｔ）を有する対応するシングルガイドｓｇＲＮＡと組み合わせたＭＧ１－４によるＤＮＡ切断を実証するゲルを示し、右側パネルは、棒グラフとして定量化された同じデータを示す。データは、１８～２４ヌクレオチドからの標的化配列がＭＧ１－４／ｓｇＲＮＡシステムで機能的であることを実証した。

細菌細胞における標的化エンドヌクレアーゼ活性

ＭＧ１－４エンドヌクレアーゼシステム（タンパク質配列番号１、ｓｇＲＮＡ配列番号５４６１）のインビボ活性を、実施例９のようにＰＡＭ配列ＣＡＧＧＡＡＧＧを用いて試験した。形質転換した大腸菌（Ｅ．ｃｏｌｉ）を段階希釈で播種し、結果（左側のパネルに大腸菌（Ｅ．ｃｏｌｉ）段階希釈を示し、右側のパネルに増殖の定量を示す）を図１１に提示する。非標的ｓｇＲＮＡを発現する大腸菌（Ｅ．ｃｏｌｉ）と比較して、標的ｓｇＲＮＡ上で発現する大腸菌（Ｅ．ｃｏｌｉ）の増殖における実質的な減少は、ゲノムＤＮＡが大腸菌（Ｅ．ｃｏｌｉ）細胞中でエンドヌクレアーゼによって特異的に切断されたことを示す。

哺乳動物細胞における標的化エンドヌクレアーゼ活性（ａ）

実施例１０の方法を使用して、哺乳動物細胞における標的化及び切断活性を実証した。ＭＧ１－４（タンパク質配列番号５５２７）及びＭＧ１－６（タンパク質配列番号５５２９）配列をコードするオープンリーディングフレームを、２つの哺乳動物発現ベクターへとクローニングし、１つはＣ末端ＳＶ４０ＮＬＳ及び２Ａ－ＧＦＰタグを有し（大腸菌（Ｅ．ｃｏｌｉ）ＭＧ－ＢＢ）、１つはＧＦＰタグを有さず、２つのＮＬＳ配列を有し、１つはＮ末端上にあり、１つはＣ末端上にある（大腸菌（Ｅ．ｃｏｌｉ）ｐＭＧ５－ＢＢ）。ＭＧ１－６については、オープンリーディングフレームを哺乳動物発現のために更にコドン最適化し（配列番号５５８９）、２－ＮＬＳプラスミドバックボーンへとクローニングした（ＭＧ－１６ｈｓ）。この実験の結果を図１２に示す。エンドヌクレアーゼに特異的なｔｒａｃｒ配列及び表３～表４から選択されるガイド配列を有するｓｇＲＮＡ（例えば、配列番号５５１２又は配列番号５５１５）を発現するための第２のベクターを用いて、エンドヌクレアーゼ発現ベクターをＨＥＫ２９３Ｔ細胞にコトランスフェクトした。コトランスフェクションの７２時間後、ＤＮＡを抽出し、ＮＧＳライブラリーの調製に使用した。標的部位の配列に近接する内部欠失（ＮＨＥＪレムナント）の出現によって切断活性を検出した。パーセントＮＨＥＪを、標的部位のシーケンシングにおけるインデルを介して測定して、哺乳動物細胞における酵素の標的化効率を実証し、これを図１２に提示する。

哺乳動物細胞における標的化エンドヌクレアーゼ活性（ｂ）

ＭＧ１－４標的遺伝子座を選択して、ＰＡＭｎＲＲＲＡＡ（配列番号５５２７）によりゲノム内の位置を試験した。選択した標的部位に対応するスペーサーを、実施例１０ｂに記載の哺乳動物ベクターシステムバックボーン２のｓｇＲＮＡスキャフォールドにクローニングした。部位を以下の表４ａに列挙する。様々な標的部位におけるＭＧ１－４の活性を表４ａ及び図３７に示す。

ＭＧ１－６標的遺伝子座を選択して、ＰＡＭｎｎＲＲＡＣ（配列番号５５２９）によりゲノム内の位置を試験した。選択した標的部位に対応するスペーサーを、実施例１０ｂに記載の哺乳動物ベクターシステムバックボーン２のｓｇＲＮＡスキャフォールドにクローニングした。部位を以下の表４ｂに列挙する。様々な標的部位におけるＭＧ１－６の活性を表４ｂ及び図３８に示す。

ＭＧ１－７標的遺伝子座を選択して、ＰＡＭｎＲＲＲＡＡＧ（配列番号５５１５）によりゲノム内の位置を試験した。選択した標的部位に対応するスペーサーを、実施例１０ｂに記載の哺乳動物ベクターシステムバックボーン２のｓｇＲＮＡスキャフォールドにクローニングした。部位を以下の表４ｃに列挙する。様々な標的部位におけるＭＧ１－７の活性を表４ｃ及び図３９に示す。

実施例１２．－ＭＧ２ファミリーメンバーの性質決定

ＰＡＭ特異性、ｔｒａｃｒＲＮＡ／ｓｇＲＮＡ検証

ＭＧ２ファミリーメンバーの標的化されたエンドヌクレアーゼ活性を、実施例６に記載されるようなｍｙＴＸＴＬシステムで確認した。このアッセイの結果を図１７～図２０に示す。図１７～図２０に示すアッセイでは、ライブラリーを首尾よく切断する活性タンパク質は、ゲル中に約１７０ｂｐのバンドをもたらす。ＭＧ２－１（ゲル２レーン１１及びゲル４レーン６参照）並びにＭＧ２－７（ゲル１１レーン１０参照）について、増幅産物が観察された（それぞれ、配列番号３２０及び配列番号３２１）。ＰＣＲ産物のシーケンシングにより、以下の表５の活性なＰＡＭ配列が明らかになった。

細菌細胞における標的化エンドヌクレアーゼ活性

ｓｇＲＮＡ（エンドヌクレアーゼ配列番号３２１；ｓｇＲＮＡ配列番号５４６５）及びＡＧＣＧＴＡＡＧＰＡＭ配列を有するＭＧ２－７エンドヌクレアーゼシステムのインビボ活性を、実施例９に記載の方法を用いて確認した。形質転換した大腸菌（Ｅ．ｃｏｌｉ）を段階希釈で播種し、結果（左側のパネルに大腸菌（Ｅ．ｃｏｌｉ）段階希釈を示し、右側のパネルに増殖の定量を示す）を図３４に提示する。非標的ｓｇＲＮＡを発現する大腸菌（Ｅ．ｃｏｌｉ）と比較して、標的ｓｇＲＮＡ上で発現する大腸菌（Ｅ．ｃｏｌｉ）の増殖における実質的な減少は、ゲノムＤＮＡが大腸菌（Ｅ．ｃｏｌｉ）細胞中でＭＧ１－４エンドヌクレアーゼによって特異的に切断されたことを示す。

実施例１３．－ＭＧ３ファミリーメンバーの性質決定
ＰＡＭ特異性、ｔｒａｃｒＲＮＡ／ｓｇＲＮＡ検証

ＭＧ３ファミリーメンバーの標的化されたエンドヌクレアーゼ活性を、ｔｒａｃｒ配列及びＣＲＩＳＰＲアレイを用いて、実施例６に記載されるようなｍｙＴＸＴＬシステムを用いて確認した。このアッセイでは、切断された標的プラスミドのＰＣＲ増幅により、図１７～図２０に示すように、ゲル中においておよそ１７０ｂｐで移動する産物が得られる。増幅産物は、ＭＧ３－６（デュアルガイド：ゲル２レーン８参照；シングルガイド：ゲル３レーン３参照）、ＭＧ３－７（デュアルガイド：ゲル２レーン３参照、シングルガイド：ゲル３レーン４参照）、及びＭＧ３－８（デュアルガイド：ゲル９レーン５参照）について観察された（それぞれ、配列番号４２１、４２２、及び４２３）。ＰＣＲ産物のシーケンシングにより、以下の表６の活性なＰＡＭ配列が明らかになった。

合成シングルガイドＲＮＡ（ｓｇＲＮＡ）を、ｔｒａｃｒＲＮＡの配列及び予測構造に基づいて設計し、配列番号５４６６～５４６７として提示する。実施例６のＰＡＭ配列スクリーニングをｓｇＲＮＡで繰り返した。この実験の結果はまた表６にも提示するが、この結果は、ｓｇＲＮＡを用いた場合にＰＡＭ特異性がわずかに変化したことを明らかにする。

インビトロでの標的化エンドヌクレアーゼ活性

ＭＧ３－６（エンドヌクレアーゼ配列番号４２１）のインビトロ活性を、実施例８の方法を用いてＰＡＭ配列ＧＴＧＧＧＴＴＡで検証した。上で報告されたシングルガイド配列（配列番号５４６６）を使用し、１８～２４ｎｔの様々なスペーサー／標的化配列長を配列のＮに置き換えた。結果を図１３に示し、上部パネルは、異なる標的化配列長（１８～２４ｎｔ）を有する異なるｓｇＲＮＡと組み合わせたＭＧ３－６によるＤＮＡ切断を実証するゲルを示し、下部パネルは、棒グラフとして定量化された同じデータを示す。データは、１８～２４ヌクレオチドからの標的化配列がＭＧ３－６／ｓｇＲＮＡシステムで機能的であることを実証した。

細菌細胞における標的化エンドヌクレアーゼ活性

ＭＧ３－７エンドヌクレアーゼシステム（タンパク質配列番号４２２；ｓｇＲＮＡ配列番号５４６７）のインビボ活性を、実施例９の方法を用いてＰＡＭ配列ＴＧＧＡＣＣＴＧで試験した。形質転換した大腸菌（Ｅ．ｃｏｌｉ）を段階希釈で播種し、結果（上部のパネルに大腸菌（Ｅ．ｃｏｌｉ）段階希釈を示し、下部のパネルに増殖の定量を示す）を図１４に示す。非標的ｓｇＲＮＡを発現する大腸菌（Ｅ．ｃｏｌｉ）と比較して、標的ｓｇＲＮＡ上で発現する大腸菌（Ｅ．ｃｏｌｉ）の増殖における実質的な減少は、ゲノムＤＮＡがＭＧ３－７エンドヌクレアーゼシステムによって特異的に切断されていたことを示す。

実施例１０の方法を使用して、哺乳動物細胞における標的化及び切断活性を実証した。ＭＧ３－７（タンパク質配列番号４２２）をコードするオープンリーディングフレームを、２つの哺乳動物発現ベクターへとクローニングし、１つはＣ末端ＳＶ４０ＮＬＳ及び２Ａ－ＧＦＰタグを有し（大腸菌（Ｅ．ｃｏｌｉ）ＭＧ－ＢＢ）、１つはＧＦＰタグを有さず、２つのＮＬＳ配列を有し、１つはＮ末端上にあり、１つはＣ末端上にある（大腸菌（Ｅ．ｃｏｌｉ）ｐＭＧ５－ＢＢ）。エンドヌクレアーゼ発現ベクターを、表７から選択されるガイド配列を有する上記ｓｇＲＮＡを発現するための第２のベクターでＨＥＫ２９３Ｔ細胞へとコトランスフェクトした。この実験の結果を図１２に示す。コトランスフェクションの７２時間後、ＤＮＡを抽出し、ＮＧＳライブラリーの調製に使用した。標的部位の近傍における内部欠失（ＮＨＥＪレムナント）の出現によって切断活性を検出した。結果を図１５に提示する。

ｓｇＲＮＡプラスミドにコードされた標的部位を以下の表７に示す。

ＭＧ３－６標的遺伝子座を選択して、ＰＡＭｎｎＲＧＧＴＴ（配列番号５５３２）によりゲノム内の位置を試験した。選択した標的部位に対応するスペーサーを、実施例１０ｂに記載の哺乳動物ベクターシステムバックボーン１のｓｇＲＮＡスキャフォールドにクローニングした。部位を以下の表７ａに列挙する。様々な標的部位におけるＭＧ３－６の活性を表７ａ及び図４０に示す。

ＭＧ３－７標的遺伝子座を選択して、ＰＡＭｎｎＲｎＴＡＣ（配列番号６３０３）によりゲノム内の位置を試験した。選択した標的部位に対応するスペーサーを、実施例１０ｂに記載の哺乳動物ベクターシステムにおけるｓｇＲＮＡスキャフォールドにクローニングした。部位を以下の表７ｂに列挙する。様々な標的部位におけるＭＧ３－７の活性を表７ｂ及び図４１に示す。

ＭＧ３－８標的遺伝子座を選択して、ＰＡＭｎｎＲＧＧＴＴ（配列番号５５３４）によりゲノム内の位置を試験した。選択した標的部位に対応するスペーサーを、実施例１０ｂに記載の哺乳動物ベクターシステムバックボーン１のｓｇＲＮＡスキャフォールドにクローニングした。部位を以下の表７ｃに列挙する。様々な標的部位におけるＭＧ３－８の活性を表７ｃ及び図４２に示す。

実施例１３．－ＭＧ４ファミリーメンバーの性質決定
ＰＡＭ特異性、ｔｒａｃｒＲＮＡ／ｓｇＲＮＡ検証

ＭＧ４ファミリーエンドヌクレアーゼシステムの標的化されたエンドヌクレアーゼ活性を、実施例６に記載されるようなｍｙＴＸＴＬシステムを用いて確認した。このアッセイでは、切断された標的プラスミドのＰＣＲ増幅により、図１７～図２０に示すように、ゲル中においておよそ１７０ｂｐで移動する産物が得られる。ＭＧ４－２（デュアルガイド：ゲル２レーン９参照、シングルガイド：ゲル１０レーン７参照）について、増幅産物が観察された（配列番号４３２）。ＰＣＲ産物のシーケンシングにより、以下の表８に示す活性なＰＡＭ配列が明らかになった。

実施例１４．－ＭＧ１４ファミリーメンバーの性質決定
ＰＡＭ特異性、ｔｒａｃｒＲＮＡ／ｓｇＲＮＡ検証

ＭＧ１４ファミリーメンバーの標的化されたエンドヌクレアーゼ活性（実施例６に記載されるようなｍｙＴＸＴＬシステムを用いて確認した）。このアッセイでは、切断された標的プラスミドのＰＣＲ増幅により、図１７～図２０に示すように、ゲル中においておよそ１７０ｂｐで移動する産物が得られる。ＭＧ１４－１（デュアルガイド：ゲル１レーン４参照、シングルガイド：ゲル３レーン８参照）について、増幅産物が観察された（配列番号６７８）。ＰＣＲ産物のシーケンシングにより、以下の表９に特異的に示す活性なＰＡＭ配列が明らかになった。

細菌細胞における標的化エンドヌクレアーゼ活性

ｓｇＲＮＡ（エンドヌクレアーゼ配列番号６７８；ｓｇＲＮＡ配列番号５４６９）及びＧＧＣＧＧＧＧＡＰＡＭ配列を有するＭＧ１４－１エンドヌクレアーゼシステムのインビボ活性を、実施例９に記載の方法を用いて確認した。形質転換した大腸菌（Ｅ．ｃｏｌｉ）を段階希釈で播種し、結果（左側のパネルに大腸菌（Ｅ．ｃｏｌｉ）段階希釈を示し、右側のパネルに増殖の定量を示す）を図３５に提示する。非標的ｓｇＲＮＡを発現する大腸菌（Ｅ．ｃｏｌｉ）と比較して、標的ｓｇＲＮＡ上で発現する大腸菌（Ｅ．ｃｏｌｉ）の増殖における実質的な減少は、ゲノムＤＮＡが大腸菌（Ｅ．ｃｏｌｉ）細胞中でＭＧ１－４エンドヌクレアーゼによって特異的に切断されたことを示す。

哺乳動物細胞における標的化エンドヌクレアーゼ活性

ＭＧ１４－１標的遺伝子座を選択して、ゲノム内の位置をＰＡＭｎｎｎｎｎＧＧＴＡ（配列番号５５３５）により試験した。選択した標的部位に対応するスペーサーを、実施例１０ｂに記載の哺乳動物ベクターシステムバックボーン２のｓｇＲＮＡスキャフォールドにクローニングした。部位を以下の表９ａに列挙する。様々な標的部位におけるＭＧ１４－１の活性を表９ａ及び図４３に示す。

実施例１５．－ＭＧ１５ファミリーメンバーの性質決定

ＰＡＭ特異性、ｔｒａｃｒＲＮＡ／ｓｇＲＮＡ検証

ＭＧ１５ファミリーメンバーの標的化されたエンドヌクレアーゼ活性を、実施例６に記載されるようなｍｙＴＸＴＬシステムを用いて確認した。このアッセイでは、切断された標的プラスミドのＰＣＲ増幅により、図１７～図２０に示すように、ゲル中においておよそ１７０ｂｐで移動する産物が得られる。ＭＧ１５－１（デュアルガイド：ゲル７レーン７参照、シングルガイド：ゲル３レーン９参照）について、増幅産物が観察された（配列番号９３０）。ＰＣＲ産物のシーケンシングにより、以下の表１０に特異的に詳述する活性なＰＡＭ配列が明らかになった。

インビトロ活性

ＭＧ１５－１エンドヌクレアーゼシステム（タンパク質配列番号９３０；ｓｇＲＮＡ配列番号５４７０）のインビトロ活性を、実施例８の方法を用いてＰＡＭ配列ＧＧＧＴＣＡＡＡで試験した。上で報告されたシングルガイド配列（配列番号５４７０）を使用し、１８～２４ｎｔの様々なスペーサー／標的化配列長で使用した（配列のＮに置換え）。結果を図１６に示し、上部パネルは、異なる標的化配列長（１８～２４ｎｔ）を有する異なるｓｇＲＮＡと組み合わせたＭＧ１５－１によるＤＮＡ切断を実証するゲルを示し、下部パネルは、棒グラフとして定量化された同じデータを示す。データは、１８～２４ヌクレオチドからの標的化配列がＭＧ１５－１／ｓｇＲＮＡシステムで機能的であることを実証した。

細菌細胞における標的化エンドヌクレアーゼ活性

ｓｇＲＮＡ（エンドヌクレアーゼ配列番号９３０；ｓｇＲＮＡ配列番号５４７０）及びＧＧＧＴＣＡＡＡＰＡＭ配列を有するＭＧ１５－１エンドヌクレアーゼシステムのインビボ活性を、実施例９に記載の方法を用いて確認した。形質転換した大腸菌（Ｅ．ｃｏｌｉ）を段階希釈で播種し、結果（左側のパネルに大腸菌（Ｅ．ｃｏｌｉ）段階希釈を示し、右側のパネルに増殖の定量を示す）を図３５に提示する。非標的ｓｇＲＮＡを発現する大腸菌（Ｅ．ｃｏｌｉ）と比較して、標的ｓｇＲＮＡ上で発現する大腸菌（Ｅ．ｃｏｌｉ）の増殖における実質的な減少は、ゲノムＤＮＡが大腸菌（Ｅ．ｃｏｌｉ）細胞中でＭＧ１－４エンドヌクレアーゼによって特異的に切断されたことを示す。

実施例１６．－ＭＧ１６ファミリーメンバーの性質決定
ＰＡＭ特異性、ｔｒａｃｒＲＮＡ／ｓｇＲＮＡ検証

ＭＧ１６ファミリーメンバーの標的化されたエンドヌクレアーゼ活性を、実施例６に記載されるようなｍｙＴＸＴＬシステムを用いて確認した。このアッセイでは、切断された標的プラスミドのＰＣＲ増幅により、図１７～図２０に示すように、ゲル中においておよそ１７０ｂｐで移動する産物が得られる。ＭＧ１６－２（ゲル１１、レーン１７参照）について、増幅産物が観察された（配列番号１０９３）。ＰＣＲ産物のシーケンシングにより、以下の表１１に特異的に詳述する活性なＰＡＭ配列が明らかになった。

実施例１７．－ＭＧ１８ファミリーメンバーの性質決定
ＰＡＭ特異性、ｔｒａｃｒＲＮＡ／ｓｇＲＮＡ検証

ＭＧ１８ファミリーメンバーの標的化されたエンドヌクレアーゼ活性を、実施例６に記載されるようなｍｙＴＸＴＬシステムを用いて確認した。このアッセイでは、切断された標的プラスミドのＰＣＲ増幅により、図１７～図２０に示すように、ゲル中においておよそ１７０ｂｐで移動する産物が得られる。ＭＧ１８－１（デュアルガイド：ゲル９レーン９参照、シングルガイド：ゲル１１レーン１２参照）について、増幅産物が観察された（配列番号１３５４）。ＰＣＲ産物のシーケンシングにより、以下の表１２に特異的に詳述する活性なＰＡＭ配列が明らかになった。

哺乳動物細胞における標的化エンドヌクレアーゼ活性

ＭＧ１８－１標的遺伝子座を選択して、ＰＡＭｎＲＷＡＲＴ（配列番号５５３７）によりゲノム内の位置を試験した。選択した標的部位に対応するスペーサーを、実施例１０ｂに記載の哺乳動物ベクターシステムバックボーン１のｓｇＲＮＡスキャフォールドにクローニングした。部位を以下の表１２ａに示す。様々な標的部位におけるＭＧ１８－１の活性を表１２ａ及び図４４に示す。

実施例１８．－ＭＧ２１ファミリーメンバーの性質決定
ＰＡＭ特異性、ｔｒａｃｒＲＮＡ／ｓｇＲＮＡ検証

ＭＧ２１ファミリーの標的化されたエンドヌクレアーゼ活性を、実施例６に記載されるようなｍｙＴＸＴＬシステムを用いて確認した。このアッセイでは、切断された標的プラスミドのＰＣＲ増幅により、図１７～図２０に示すように、ゲル中においておよそ１７０ｂｐで移動する産物が得られる。ＭＧ２１－１（ゲル１１レーン２参照）について、増幅産物が観察された（配列番号１５１２）。ＰＣＲ産物のシーケンシングにより、以下の表１３に特異的に詳述する活性なＰＡＭ配列が明らかになった。

実施例１９．－ＭＧ２２ファミリーメンバーの性質決定
ＰＡＭ特異性、ｔｒａｃｒＲＮＡ／ｓｇＲＮＡ検証

ＭＧ２２ファミリーメンバーの標的化されたエンドヌクレアーゼ活性を、実施例６に記載されるようなｍｙＴＸＴＬシステムを用いて確認した。このアッセイでは、切断された標的プラスミドのＰＣＲ増幅により、図１７～図２０に示すように、ゲル中においておよそ１７０ｂｐで移動する産物が得られる。図１７～図２０に示すアッセイでは、ライブラリーを首尾よく切断する活性タンパク質は、ゲル中に約１７０ｂｐのバンドをもたらす。ＭＧ２２－１（ゲル１１レーン３参照）について、増幅産物が観察された（タンパク質配列番号１６５６）。ＰＣＲ産物のシーケンシングにより、以下の表１４に特異的に詳述する活性なＰＡＭ配列が明らかになった。

実施例２０．－ＭＧ２３ファミリーメンバーの性質決定
ＰＡＭ特異性、ｔｒａｃｒＲＮＡ／ｓｇＲＮＡ検証

ＭＧ２３ファミリーメンバーの標的化されたエンドヌクレアーゼ活性を、実施例６に記載されるようなｍｙＴＸＴＬシステムを用いて確認した。このアッセイでは、切断された標的プラスミドのＰＣＲ増幅により、図１７～図２０に示すように、ゲル中においておよそ１７０ｂｐで移動する産物が得られる。ＭＧ２３－１（ゲル１１レーン４参照）について、増幅産物が観察された（配列番号１７５６）。ＰＣＲ産物のシーケンシングにより、以下の表１５に詳述するこれらの酵素の活性ＰＡＭ配列特異性が明らかになった。

実施例２１．－ＭＧ２１～ＭＧ２３ファミリーメンバーの哺乳動物活性
哺乳動物細胞における標的化及び切断活性を示すために、タンパク質配列を、隣接するＮ末端及びＣ末端のＳＶ４０ＮＬＳ配列、Ｃ末端のＨｉｓタグ、及びＨｉｓタグの後のＣ末端に２Ａ－ＧＦＰタグを有する哺乳動物発現ベクター（バックボーン１）、又は隣接するＮＬＳ配列及びＣ末端のＨｉｓタグを有するが２ＡＧＦＰタグを有しない発現ベクター（バックボーン２）にクローニングした。タンパク質のＤＮＡ配列は、天然配列、大腸菌（Ｅ．ｃｏｌｉ）コドン最適化配列、又は哺乳動物コドン最適化配列であり得る。目的の遺伝子標的を有するシングルガイドＲＮＡ配列もまた哺乳動物発現ベクターへとクローニングされる。２つのプラスミドをＨＥＫ２９３Ｔ細胞へコトランスフェクトする。ＨＥＫ２９３Ｔ細胞への発現プラスミド及びｓｇＲＮＡ標的プラスミドのコトランスフェクションの７２時間後、ＤＮＡを抽出し、ＮＧＳライブラリーの調製に使用する。パーセントＮＨＥＪを、標的部位のシーケンシングにおけるインデルを介して測定して、哺乳動物細胞における酵素の標的化効率を実証する。各タンパク質の活性を試験するために、７～１２個の異なる標的部位を選択した。５％インデルの任意の閾値を使用して、活性候補を同定する。

ＭＧ２１－１標的遺伝子座を選択して、ＰＡＭｎｎＲｎＲを有する位置を試験した。選択した標的部位に対応するスペーサーを、上記の哺乳動物ベクターシステムバックボーン２のｓｇＲＮＡスキャフォールドにクローニングした。部位を以下の表１６に列挙する。

ＭＧ２２－１標的遺伝子座を選択して、ＰＡＭｎｎＲＣｎＴを有する位置を試験した。選択した標的部位に対応するスペーサーを、上記の哺乳動物ベクターシステムバックボーン２のｓｇＲＮＡスキャフォールドにクローニングした。部位を以下の表１７に列挙する。

ＭＧ２３－１標的遺伝子座を選択して、ＰＡＭｎＲＲＡを有する位置を試験した。選択した標的部位に対応するスペーサーを、上記の哺乳動物ベクターシステムバックボーン２のｓｇＲＮＡスキャフォールドにクローニングした。部位を以下の表１８に列挙する。

実施例２２－本明細書に記載のシステムを用いたＴ細胞編集
様々なＭＧシステムが哺乳動物細胞において機能することを確立したことで、本発明者らは、ヒトＴ細胞ゲノムを編集するためのそれらの有用性を試験しようとした。この目的のためにＭＧ３－６（タンパク質配列番号４２１）及びＭＧ３－８（タンパク質配列番号４２３）を最初に使用しようとしたことで、本発明者らは、ヒト細胞におけるガイド活性に基づいて、ＭＧ３－６コンセンサスＰＡＭ配列が５’－ＮＮＲＧＲＹＹ－３’（配列番号５９４９）であると決定した。ＭＧ３－８のＰＡＭは、５’－ＮＮＲＧＧＴＴ－３’（配列番号５５３４）として以前に決定された。
ＴＲＡＣ遺伝子座標的化

編集された細胞を生成するために、Ｔ細胞におけるＴＲＡＣ遺伝子座を標的化する適切なスペーサー配列を、ＭＧ３－６（例えば、実験においてＭＧ３－６ガイド１～９と称される配列番号５９５０～５９５８で表されるスペーサー）、及びＭＧ３－８（例えば、実験において「ＭＧ３－８ガイド１－７」と呼ばれる、配列番号５９５９～５９６５で表されるスペーサー）の両方について設計した。スペーサー配列を、ＭＧ３－６については配列番号５４６６ｓｇＲＮＡ、及びＭＧ３－８については配列番号６３０４ｓｇＲＮＡのバックグラウンドで使用した（以下に列挙する）。

本発明者らは、まず、各エンドヌクレアーゼに適合するＴＲＡＣ遺伝子を標的とするために使用されるスペーサーの最適な長さを決定しようとした。ＭＧ３－６については、本発明者らは、配列を短縮した場合に５’ＰＡＭ遠位端からトランケートした２２～１６ヌクレオチドの範囲にわたる長さを持つ、上記スペーサーのサブセット（配列番号５９５３～５９５７、実験では「ＭＧ３－６ガイド４～８」と称される）を持つｓｇＲＮＡをヌクレオフェクト（ｎｕｃｌｅｏｆｅｃｔ）した。これらのスペーサーを担持するガイドＲＮＡは、Ｌｏｎｚａ４Ｄエレクトロポレータ及び溶液Ｐ３を用いて、それぞれ３２若しくは６４若しくは１２８ｐｍｏｌのガイドＲＮＡと共に２６若しくは５２若しくは１０４ｐｍｏｌのＭＧ３－６タンパク質を送達し、条件ごとに２００Ｋ初代Ｔ細胞（以前にＣＤ２／３／２８ビーズで増殖させたもの）にヌクレオフェクトされた。Ｔ細胞からゲノムＤＮＡを３日後に採取し、ＮＧＳによって分析した。データを図５６に提示するが、これは、ＭＧ３－６ガイド４～８を２２～１６ヌクレオチドからトランケートする効果を示し、１９～２２ヌクレオチドの長さがＭＧ３－６の短いスペーサーよりも優れた性能を示したことを実証している。

ＭＧ３－８を用いて同じスペーサー長最適化実験を実施するために、本発明者らは、配列を短縮した場合に５’ＰＡＭ遠位端からトランケートした２２～１６ヌクレオチドの範囲にわたる長さを持つ、上記のスペーサーのサブセット（実験においてＭＧ３－８ガイド２、３、５、及び８と称される配列番号５９６０～５９６１及び配列番号５９６３～５９６４）でｓｇＲＮＡをヌクレオフェクトした。これらのスペーサーを担持するガイドＲＮＡは、Ｌｏｎｚａ４Ｄエレクトロポレータ及び溶液Ｐ３を用いて、１０４ｐｍｏｌのＭＧ３－８タンパク質及び１２０ｐｍｏｌのガイドＲＮＡを送達し、２００Ｋ初代Ｔ細胞（条件ごとに（以前にＣＤ２／３／２８ビーズで増殖させたもの）にヌクレオフェクトされた。Ｔ細胞からゲノムＤＮＡを３日後に採取し、ＮＧＳによって分析した。データを図５７に提示するが、これは、ＭＧ３－８ガイド２、３、５、及び８を２２～１６ヌクレオチドからトランケートする効果を示し、１９～２２ヌクレオチドの長さがＭＧ３－８の短いスペーサーよりも優れた性能を示したことを実証している。

ＴＲＡＣを標的とすると思われるスペーサー配列を同定したことで、本発明者らは、これらのスペーサーがＴＲＡＣ遺伝子にインデルを誘導し、細胞におけるＴＲＡＣ発現を破壊する能力を試験した。本発明者らは、１０４ｐｍｏｌのＭＧ３－６タンパク質及び１２８ｐｍｏｌのガイドＲＮＡを用いて、最高性能の２２個のヌクレオチドスペーサーを担持するｓｇＲＮＡ（ＭＧ３－６ガイド６、配列番号５９５５；及びＭＧ３－８ガイド５、配列番号５９６３）を上記のように初代Ｔ細胞へとヌクレオフェクトした。ゲノムＤＮＡを回収の３日後に採取し、インデルの出現についてＮＧＳによって、又は抗ＴＣＲアルファ鎖Ａｂを用いるフローサイトメトリによって分析した。ＮＧＳインデル分析を図５８に示す。これは、ＭＧ３－６及びＭＧ３－８の両方のｓｇＲＮＡ／酵素の組合せが、ＴＲＡＣ遺伝子におよそ９０％以上の頻度のインデルを生成することを実証している。フローサイトメトリ分析を図５９に示す。これは、ＭＧ３－６ｓｇＲＮＡ／酵素の組合せがおよそ９５％のＴＣＲ陰性細胞を生成することを実証している。

ＭＧ３－６／ガイド６の組合せがフローサイトメトリによってＴＲＡＣノックアウトを効果的に生成することを観察したことで、本発明者らは、トランスフェクションエンハンサ又はより高いガイド濃度の添加が、より性能の低いＭＧ３－６ＴＲＡＣスペーサー担持ガイドのノックアウトの効率を改善し得るかどうかを試験した。したがって、本発明者らは、上記のようにＴ細胞をトランスフェクトし、５２ｐｍｏｌのＭＧ３－６タンパク質、及び６０ｐｍｏｌのガイドＲＮＡ、及び１μＬのＩＤＴトランスフェクションエンハンサ（利用する場合）、又は１２０ｐｍｏｌのガイドＲＮＡ若しくは１８０ｐｍｏｌのガイドＲＮＡを、ＭＧ３－６ガイド４～６（配列番号５９５３～５９５５のスペーサー配列であり、２２ヌクレオチド長であった）の各々へと送達し、抗ＴＣＲアルファ鎖Ａｂを用いて再度フローサイトメトリによってアッセイした。結果を図６０に示し、これは、ガイド４及びガイド５について、ガイド濃度を増加させることにより、ＴＲＡＣノックアウトの効率をそれぞれ約８７％又は約７１％まで増加させることができることを実証する。

ＴＲＢＣ遺伝子座標的化
上記でＴ細胞におけるＴＲＡＣ遺伝子座ターゲティングを実証したことで、本発明者らは次に、ＴＲＢＣ遺伝子座を標的化するための試薬を設計及びスクリーニングした。したがって、本発明者らは、上記のようにＭＧ３－６及びＭＧ３－８に対応するスペーサーを再び設計し（ＭＧ３－６については表１９、ＭＧ３－８については表２０を参照）、ＴＲＢＣ遺伝子座の配列に対してのみそれらを指示した。ＴＲＢＣは２つのスプライスバリアント（ＴＲＢＣ１及びＴＲＢＣ２）を有するので、本発明者らは、各々を標的とするスペーサーを設計した。本発明者らは、上記のように、ガイドＲＮＡを担持する各２２ｎｔスペーサーを酵素と共にＴ細胞へとヌクレオフェクトし、抗ＴＣＲＡｂを用いてＴ細胞受容体の発現を評価した。各スペーサー担持ガイドのＴＣＲを、フローサイトメトリの時間におけるＴ細胞の生存率％と共に、以下の表１９及び表２０に示す。表１９及び表２０は、いくつかのスペーサー（ＭＧ３－６については５、６、１８、及び１９、ＭＧ３－８については２、６、７、及び８）が、Ｔ細胞におけるＴＣＲノックアウトの誘導において中程度から非常に有効であることを示す。

ＣＡＲ－Ｔ発現に伴うＴＣＲアブレーション
本発明者らは、本発明者らのエンドヌクレアーゼ／ガイドの組合せを用いてＴ細胞におけるＴＣＲ発現を効果的にノックアウトすることができることを実証したことで、本発明者らは次に、ＴＣＲをノックアウトし、同じ細胞において異種ＣＡＲ（キメラ抗原受容体）を発現させることによって同種異系ＣＡＲ－Ｔ細胞を生成することができるかどうかを求めた。この実験のために本発明者らが使用したスキームを図６１に示しており、これは、ＴＣＲ遺伝子座の提案された標的化と、それに続く相同組換えによる同じ遺伝子座でのＣＡＲのインテグレーションとを示す。

したがって、本発明者らは、３００ＫのＭＯＩでＴＲＡＣホモロジーアームを有する異種ＣＡＲ配列を担持するＡＡＶ＃３０２９を有する同じＴ細胞のみに感染させる、ＴＲＡＣ標的化ＭＧ３－６ガイド６、配列番号５９５５を有する高性能ＭＧ３－６酵素を用いて上記のようにＴ細胞をヌクレオフェクトした。ＴＣＲ受容体及び異種ＣＡＲ抗原に対するフローサイトメトリを用いて対照と一緒にトランスフェクト細胞を観察した後、本発明者らは、ＭＧ３－６トランスフェクション条件が約６０％のおよその頻度でＣＡＲ＋／ＴＣＲ－細胞を生成し得ることを観察した。

ＧＲ（糖質コルチコイド受容体）遺伝子座標的化
本発明者らは、本発明者らのエンドヌクレアーゼ／ガイドの組合せを用いてＴ細胞におけるＴＣＲ発現を効果的にノックアウトすることができたことを実証したことで、本発明者らは次に、Ｔ細胞の他の特徴を調節するためにＧＲ（グルココルチコイド受容体）遺伝子座を標的とすることができるかどうかを尋ねた（例えば、糖質コルチコイドに対する応答）。本発明者らは、ＭＧ３－６及びＭＧ３－８に適切なスペーサーを再度設計したが、今回はＧＲ遺伝子座の配列を標的とした（以下の表２１及び以下の表２２を参照）。

ＭＧ３－６標的化配列（表２１）について、配列１～４０をＧＲエクソン２を標的とするように設計し、配列４１～４５をＧＲエクソン３を標的とするように設計し、配列４６をＧＲエクソン４を標的とするように設計し、配列４７～５４をＧＲエクソン５を標的とするように設計し、配列５５～５８をＧＲエクソン６を標的とするように設計し、配列５９～６１をＧＲエクソン７を標的とするように設計し、配列６２～６５をＧＲエクソン８を標的とするように設計した。配列を、１２６ｐｍｏｌのＭＧ３－６タンパク質及び１６０ｐｍｏｌのガイドを用いて上記の初代Ｔ細胞へのヌクレオフェクションによってスクリーニングし、ＮＧＳによって以前のように分析した。スクリーニングの結果を図６３に示し、これは表２１の番号付けされたガイドによって生成されたインデルの％を示す。結果は、いくつかのスペーサー配列（下記の表２１の２、３、４、１３、１８、２４、５１、５５、５６、及び６１）が、ＭＧ３－６を用いてＧＲ遺伝子内にインデルを生成するのに中程度有効であることを示した。

ＭＧ３－８標的化配列（表２２）について、配列１～１７はＧＲエクソン２を標的とするように設計され、配列１８はＧＲエクソン３を標的とするように設計され、配列１９～２０はＧＲエクソン４を標的とするように設計され、配列２１～２４はＧＲエクソン５を標的とするように設計され、配列２５～２６はＧＲエクソン６を標的とするように設計され、配列２７～２９はＧＲエクソン７を標的とするように設計され、配列３０～３１はＧＲエクソン８を標的とするように設計された。配列を、５２ｐｍｏｌのＭＧ３－８タンパク質及び６０ｐｍｏｌのガイドを用いて上記のように初代Ｔ細胞へのヌクレオフェクションによってスクリーニングし、ＮＧＳによって以前のように分析した。スクリーニングの結果を図６４に示す。これは、表２２の番号付けされたガイドによって生成されたインデル％を示す。結果は、一部のスペーサー配列（下記表２２中の２、２５、及び２９）が、ＭＧ３－８を用いたＧＲ遺伝子におけるインデルの生成において中程度有効であることを示した。

ＡＡＶＳ１セーフハーバ遺伝子座標的化
本発明者らは、本発明者らのエンドヌクレアーゼ／ガイドの組合せを用いてＴ細胞におけるＴＣＲ発現を効果的にノックアウトすることができることを実証したことで、本発明者らは次に、Ｔ細胞においてＡＡＶＳ１セーフハーバ遺伝子座を標的とすることができるかどうかを求めた。本発明者らはＭＧ３－６に適切なスペーサーを設計したが、今回はＡＡＶＳ１遺伝子座の配列を標的とした（以下の表２３参照）。配列を、１２６ｐｍｏｌのＭＧ３－６タンパク質及び１６０ｐｍｏｌのガイドを用いて上記のように初代Ｔ細胞へのヌクレオフェクションによってスクリーニングし、ＡＡＶＳ１遺伝子座におけるインデル形成についてＮＧＳによって分析した。表２３は、トランスフェクトされたＴ細胞において各ＡＡＶＳ１標的化スペーサー配列と共に生成されたインデルのパーセンテージを示し、いくつかの配列（Ａ１、Ｄ１、Ｅ１、Ｇ１、Ｂ２、Ｄ２、Ｇ２、Ｄ３、Ｆ３、及びＣ４）が、ＭＧ３－６を有するＡＡＶＳ１遺伝子座において中頻度～高頻度を有するインデルを生成することを実証している。

ＴＩＧＩＴ遺伝子座標的化

本発明者らは、本発明者らのエンドヌクレアーゼ／ガイドの組合せを用いてＴ細胞におけるＴＣＲ発現を効果的にノックアウトすることができることを実証したことで、本発明者らは次に、Ｔ細胞におけるＴＩＧＩＴ遺伝子座を標的とすることができるかどうかを求めた。本発明者らはＭＧ３－６に適切なスペーサーを設計したが、今回はＴＩＧＩＴ遺伝子座の配列を標的とした（以下の表２４参照）。配列を、１２６ｐｍｏｌのＭＧ３－６タンパク質及び１６０ｐｍｏｌのガイドを用いて上記のように初代Ｔ細胞へのヌクレオフェクションによってスクリーニングし、上記のようにＮＧＳによって分析した。表２４は、トランスフェクトされたＴ細胞における各ＴＩＧＩＴ標的化スペーサー配列と共に生成されたインデルのパーセンテージを示し、いくつかの配列（Ｃ１、Ｇ１、Ｈ１、Ｄ３）がＭＧ３－６との高いインデル生成活性を有することを実証している。ゲノムＤＮＡを３日後に採取し、ＮＧＳによって分析した（以下の表２４参照）。

実施例２３－本明細書に記載のシステムを用いたＮＫ細胞編集
ＣＡＲ発現と組み合わせたＴＣＲアブレーション

本発明者らは、Ｔ細胞におけるＴＣＲ発現を効率的にノックアウトすることができることを観察したことで、本発明者らは次に、ＮＫ細胞におけるＴＲＡＣを編集することができるかどうか、例えば、ＴＲＡＣホモロジーアームを有するＣＡＲの導入と同時にＴＣＲを破壊して、同種異系ＣＡＲ－ＮＫ細胞を作製することができるかどうかを求めた（スキームの例については図６６を参照されたい）。したがって、本発明者らはＣｌｏｕｄｚＨｕｍａｎＮＫｃｅｌｌＥｘｐａｎｓｉｏｎＫｉｔを用いてＮＫ細胞を培養した。ＮＫ細胞を、１０４ｐｍｏｌのＭＧ３－６タンパク質及び１８０ｐｍｏｌのガイドＲＮＡ（ＴＲＡＣ標的化ＭＧ３－６ガイド６、配列番号５９５５を有する高性能ＭＧ３－６酵素の使用）を含むＲａｕｔｅｌａらのマンニトール含有緩衝液（参照により本明細書に組み込まれる、ｈｔｔｐｓ：／／ｄｏｉ．ｏｒｇ／１０．１１０１／４０６９３４を参照）を用いて、Ｌｏｎｚａ４Ｄシステムでトランスフェクトし、続いて、ＴＲＡＣホモロジーアームを有するＣＡＲ配列を担持するＡＡＶ＃３０２９を有する３００ＫＭＯＩを用いて感染させた。ゲノムＤＮＡを回収５日後に細胞から採取し、ＮＧＳによって分析した。同時に、ＮＫ細胞マーカーＣＤ５６に対する抗体と並行してビオチン化ＢＣＭＡタンパク質を用いるフローサイトメトリによってＣＡＲ発現をアッセイした。結果を図６７（ＴＲＡＣインデル形成を示す）及び図６８（ｘ軸上のＣＤ５６発現、及びｙ軸上のＣＡＲ発現についてのフローサイトメトリを示す）に提示する。結果は、ＣＡＲ発現と一緒のＭＧ３－６／ガイドＲＮＡの組合せがＣＡＲ陽性ＮＫ細胞の生成に有効であったことを実証している。

ＣＤ３８標的化

次いで、ＮＫ細胞中のＣＤ３８遺伝子を標的とするようにＭＧ３－６（表２４）及びＭＧ３－８（表２５）用に設計されたスペーサー配列を用いて、初代ＮＫ細胞においてＣＤ３８ガイドスクリーニングを行った。結果を表２４及び表２５の配列と共に提示し、いくつかの配列（ＭＧ３－６についてはＡ１、Ｂ１、Ｈ１、Ｂ２、Ｃ４、Ｅ４、Ｆ４、Ｂ５、Ｄ５、及びＭＧ３－８についてはＣ１）が、それらのそれぞれのエンドヌクレアーゼと共に細胞へと導入された場合に、ＣＤ３８遺伝子座においてインデルを生成するための中～高い活性を有することを実証している。

実施例２３－本明細書に記載のシステムを用いる造血幹細胞における遺伝子編集
造血幹細胞（Ｈｅｍａｔｏｐｏｉｅｔｉｃｓｔｅｍｃｅｌｌ：ＨＳＣ）の編集のために、ＨＳＣをＡｌｌｃｅｌｌｓの説明書に従って３７で解凍し、ＤＭＥＭ＋１０％ＦＢＳで洗浄し、ＳｔｅｍｓｐａｎＩＩ培地及びＣＣ１１０サイトカインに再懸濁した。Ｌｏｎｚａ４Ｄエレクトロポレータ及び溶液Ｐ３を用いて２００Ｋ細胞をヌクレオフェクトした。ゲノムＤＮＡをトランスフェクションの３日後に採取し、ＮＧＳによって分析した（図７０を参照されたい）。ＭＧ３－６を、ＴＲＡＣガイド５（配列番号５９５４）及びＴＲＡＣガイド６（配列番号５９５５）で試験した。ＭＧ３－８を、ＴＲＡＣガイド２（配列番号５９６０）及びＴＲＡＣガイド５（配列番号５９６３）で試験した。

実施例２４．－本明細書に記載のシステムを用いたＢ細胞における遺伝子編集
Ｂ細胞編集のために、１０４ｐｍｏｌのＭＧ３－６タンパク質及び１８０ｐｍｏｌのガイドを含む緩衝液Ｐ３又は緩衝液＃２（Ｒａｕｔｅｌａら、「ＥｆｆｉｃｉｅｎｔｇｅｎｏｍｅｅｄｉｔｉｎｇｏｆｈｕｍａｎｎａｔｕｒａｌｋｉｌｌｅｒｃｅｌｌｓｂｙＣＲＩＳＰＲＲＮＰ」（２０２１年）（ｈｔｔｐｓ：／／ｄｏｉ．ｏｒｇ／１０．１１０１／４０６９３４で利用可能）に記載されるマンニトール含有緩衝液）を用いて、Ｌｏｎｚａ４ＤシステムによりＢ細胞をトランスフェクトした。ゲノムＤＮＡをトランスフェクションの３日後に採取し、ＮＧＳによって分析した（図７１を参照されたい）。ＭＧ３－６をＴＲＡＣガイド６（配列番号５９５５）で試験した。

実施例２５．－ＭＧ４８ファミリーメンバーの性質決定
転写／翻訳のための鋳型ＤＮＡ

ＭＧ４８－１（タンパク質配列番号５７６９）及びＭＧ４８－３（タンパク質配列番号５７７１）の大腸菌（Ｅ．ｃｏｌｉ）コドン最適化配列を、Ｔ７プロモーターを用いて順序づけた（ＴｗｉｓｔＢｉｏｓｃｉｅｎｃｅｓ）。線状鋳型を、Ｔ７及びヌクレアーゼ配列を含むようにＰＣＲによってプラスミドから増幅した。最小アレイ線状鋳型を、Ｔ７プロモーター、天然リピート、本発明者らのプラスミドライブラリーを標的化するユニバーサルスペーサー、天然リピート、増幅のためのアダプタ配列に隣接する配列から増幅した。ＯＲＦ又はＣＲＩＳＰＲアレイの近くの３つの遺伝子間配列をメタゲノムコンティグから同定し、増幅のために隣接するアダプタ配列を有するｇＢｌｏｃｋとして順序付けた（ＩｎｔｅｇｒａｔｅｄＤＮＡＴｅｃｈｎｏｌｏｇｉｅｓ）。

転写／翻訳及び切断反応

ＭＧ４８－１及びＭＧ４８－３ヌクレアーゼ、遺伝子間配列、及び最小アレイを、ｍｙＴＸＴＬ（登録商標）Ｓｉｇｍａ７０ＭａｓｔｅｒＭｉｘＫｉｔ（ＡｒｂｏｒＢｉｏｓｃｉｅｎｃｅｓ）を用いて転写－翻訳反応混合物中で発現させた。最終反応混合物は、５ｎＭのヌクレアーゼＤＮＡ鋳型、１２ｎＭの遺伝子間ＤＮＡ鋳型、１５ｎＭの最小アレイＤＮＡ鋳型、０．１ｎＭのｐＴＸＴＬ－Ｐ７０ａ－Ｔ７ｒｎａｐ、及び１ＸのｍｙＴＸＴＬ（登録商標）Ｓｉｇｍａ７０ＭａｓｔｅｒＭｉｘを含有した。反応物を２９℃で１６時間インキュベートし、次いで４℃で保存した。

５ｎＭの標的ライブラリー、ＴＸＴＬ発現物の５倍希釈物、１０ｎＭのＴｒｉｓ－ＨＣｌ、１０ｎＭのＭｇＣｌ２、及び１００ｍＭのＮａＣｌを、３７℃で２時間混合することによって、プラスミドライブラリーＤＮＡ切断反応を行った。反応を停止させ、ＳＰＲＩｓｅｌｅｃｔビーズ（ＢｅｃｋｍａｎＣｏｕｌｔｅｒ，Ｉｎｃ．）で洗浄し、ＴｒｉｓＥＤＴＡｐＨ８．０緩衝液に溶出した。１．５ｎＭの切断産物を、１５０ｎＭアダプタ、１×Ｔ４リガーゼ緩衝液（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）、２０Ｕ／μＬＴ４ＤＮＡリガーゼ（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）を用いて、室温で２０分間ライゲーションした。ライゲーションした産物を、ＮＧＳプライマを用いたＰＣＲによって増幅し、ＮＧＳによってシーケンシングしてＰＡＭを得た。この実験の結果は、ＮＧＳから得られたＭＧ４８－１（パネルＡ、配列番号５８５５）及びＭＧ４８－３（パネルＢ、配列番号５８５６）についてのコンセンサスＰＡＭ配列を示す図７２に示される。

転写／翻訳からの遺伝子間濃縮のＲＮＡｓｅｑライブラリー調製

ＲＮＡを、Ｑｕｉｃｋ－ＲＮＡ（商標）ＭｉｎｉｐｒｅｐＫｉｔ（ＺｙｍｏＲｅｓｅａｒｃｈ）に従ってＴＸＴＬ発現から抽出し、５０μＬの水に溶出した。転写物の総濃度をＮａｎｏｄｒｏｐ及びＴａｐｅｓｔａｔｉｏｎで測定した。

各試料からの１００ｎｇの総ＲＮＡを、ＲｅａｌＳｅｑ－ＡＣｍｉＲＮＡＬｉｂｒａｒｙＫｉｔ（Ｓｏｍａｇｅｎｉｃｓ）を用いてＲＮＡシーケンシングのために準備した。１６２～１６３ｂｐの間のアンプリコンをＴａｐｅｓｔａｔｉｏｎで定量化し、２０ｎＭの最終濃度までプールした。６ｐＭの最終濃度をＮａｎｏＭｉｓｅｑＶ２キットにロードし、Ｍｉｓｅｑシステム（Ｉｌｌｕｍｉｎａ）でシーケンシングした。ＲＮＡｓｅｑリードを使用して、遺伝子（シーケンシングされたｔｒａｃｒ領域が強調表示されたＲＮＡｓｅｑマッピングを例示する、図７３を参照）のｔｒａｃｒ配列（ＭＧ４８－１については配列番号５８８６及びＭＧ４８－３については配列番号５８９３）を同定した。ｔｒａｃｒ配列を用いて、本発明者らは、ＨｉＳｃｒｉｂｅＴ７キット（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）を用いてｄｓＤＮＡ鋳型からインビトロ転写された、ｓｇＲＮＡ（ＭＧ４８－１については配列番号５８８８及びＭＧ４８－３については配列番号５８９５）を設計した。ｓｇＲＮＡを、活性を検証するために上記の実施例と同じプロトコルを用いてインビトロで試験し、機能的であると検証した。

実施形態
以下の実施形態は、本質的に例示的なものであり、いかなる方法でも限定することを意図するものではない。
１．操作されたヌクレアーゼシステムであって、
（ａ）ＲｕｖＣ＿ＩＩＩドメイン及びＨＮＨドメインを含むエンドヌクレアーゼであって、当該エンドヌクレアーゼが未培養微生物に由来し、当該エンドヌクレアーゼがクラス２タイプＩＩＣａｓエンドヌクレアーゼである、エンドヌクレアーゼと、
（ｂ）当該エンドヌクレアーゼと複合体を形成するように構成された操作されたガイドリボ核酸構造であって、
（ｉ）標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列、及び
（ｉｉ）当該エンドヌクレアーゼへと結合するように構成されたｔｒａｃｒリボ核酸配列を含む、操作されたガイドリボ核酸構造と、
を含む、操作されたヌクレアーゼシステム。
２．当該ＲｕｖＣ＿ＩＩＩドメインが、配列番号１８２７～３６３７のいずれか１つに対して、少なくとも７０％、少なくとも７５％、少なくとも８０％、又は少なくとも９０％の配列同一性を有する配列を含む、実施形態１に記載の操作されたヌクレアーゼシステム。
３．操作されたヌクレアーゼシステムであって、
（ａ）配列番号１８２７～３６３７のいずれか１つに対して少なくとも７５％の配列同一性を有するＲｕｖＣ＿ＩＩＩドメインを含むエンドヌクレアーゼと、
（ｂ）当該エンドヌクレアーゼと複合体を形成するように構成された操作されたガイドリボ核酸構造であって、
（ｉ）標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列、及び
（ｉｉ）当該エンドヌクレアーゼへと結合するように構成されたｔｒａｃｒリボ核酸配列を含む、操作されたガイドリボ核酸構造と、
を含む、操作されたヌクレアーゼシステム。
４．操作されたヌクレアーゼシステムであって、
（ａ）配列番号５５１２～５５３７を含むプロトスペーサー隣接モチーフ（ＰＡＭ）配列へと結合するように構成されたエンドヌクレアーゼであって、当該エンドヌクレアーゼがクラス２タイプＩＩＣａｓエンドヌクレアーゼである、エンドヌクレアーゼと、
（ｂ）当該エンドヌクレアーゼと複合体を形成するように構成された操作されたガイドリボ核酸構造であって、
（ｉ）標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列、及び
（ｉｉ）当該エンドヌクレアーゼへと結合するように構成されたｔｒａｃｒリボ核酸配列を含む、操作されたガイドリボ核酸構造と、
を含む、操作されたヌクレアーゼシステム。
５．当該エンドヌクレアーゼが、未培養微生物に由来する、実施形態２に記載の操作されたヌクレアーゼシステム。
６．当該エンドヌクレアーゼが、異なるＰＡＭ配列に結合するように操作されていない、実施形態２～３のいずれか一項に記載の操作されたヌクレアーゼシステム。
７．当該エンドヌクレアーゼが、Ｃａｓ９エンドヌクレアーゼ、Ｃａｓ１４エンドヌクレアーゼ、Ｃａｓ１２ａエンドヌクレアーゼ、Ｃａｓ１２ｂエンドヌクレアーゼ、Ｃａｓ１２ｃエンドヌクレアーゼ、Ｃａｓ１２ｄエンドヌクレアーゼ、Ｃａｓ１２ｅエンドヌクレアーゼ、Ｃａｓ１３ａエンドヌクレアーゼ、Ｃａｓ１３ｂエンドヌクレアーゼ、Ｃａｓ１３ｃエンドヌクレアーゼ、又はＣａｓ１３ｄエンドヌクレアーゼではない、実施形態２に記載の操作されたヌクレアーゼシステム。
８．当該エンドヌクレアーゼが、Ｃａｓ９エンドヌクレアーゼに対して８０％未満の同一性を有する、実施形態２に記載の操作されたヌクレアーゼシステム。
９．当該エンドヌクレアーゼが、ＨＮＨドメインを更に含む、実施形態１～６のいずれか一項に記載の操作されたヌクレアーゼシステム。
１０．当該ｔｒａｃｒリボ核酸配列が、配列番号５４７６～５５１１及び配列番号５５３８のいずれか１つから選択される約６０～９０個の連続するヌクレオチドに対して、少なくとも８０％の配列同一性を有する配列を含む、実施形態１～９のいずれか一項に記載の操作されたヌクレアーゼシステム。
１１．操作されたヌクレアーゼシステムであって、
（ａ）操作されたガイドリボ核酸構造であって、
（ｉ）標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列、及び
（ｉｉ）当該エンドヌクレアーゼへと結合するように構成されたｔｒａｃｒリボ核酸配列を含み、
ここで、当該ｔｒａｃｒリボ核酸配列は、配列番号５４７６～５５１１及び配列番号５５３８のいずれか１つから選択される約６０～９０個の連続するヌクレオチドに対して、少なくとも８０％の配列同一性を有する配列を含む、操作されたガイドリボ核酸構造と、
（ｂ）当該操作されたガイドリボ核酸へと結合するように構成されたクラス２タイプＩＩＣａｓエンドヌクレアーゼと、
を含む、操作されたヌクレアーゼシステム。
１２．当該エンドヌクレアーゼが、配列番号５５１２～５５３７を含む群から選択されるプロトスペーサー隣接モチーフ（ＰＡＭ）配列へと結合するように構成されている、実施形態１～１又は８のいずれか一項に記載の操作されたヌクレアーゼシステム。
１３．当該操作されたガイドリボ核酸構造が、少なくとも２つのリボ核酸ポリヌクレオチドを含む、実施形態１～８のいずれか一項に記載の操作されたヌクレアーゼシステム。
１４．当該操作されたガイドリボ核酸構造が、当該ガイドリボ核酸配列及び当該ｔｒａｃｒリボ核酸配列を含む１つのリボ核酸ポリヌクレオチドを含む、実施形態１～８のいずれか一項に記載の操作されたヌクレアーゼシステム。
１５．当該ガイドリボ核酸配列が、原核生物、細菌、古細菌、真核生物、真菌、植物、哺乳動物、又はヒトのゲノム配列に相補的である、実施形態１～１４のいずれか一項に記載の操作されたヌクレアーゼシステム。
１６．当該ガイドリボ核酸配列が、１５～２４ヌクレオチド長である、実施形態１～１５のいずれか一項に記載の操作されたヌクレアーゼシステム。
１７．当該エンドヌクレアーゼが、当該エンドヌクレアーゼのＮ末端又はＣ末端に近接した１つ以上の核局在化配列（ＮＬＳ）を含む、実施形態１～１０のいずれか一項に記載の操作されたヌクレアーゼシステム。
１８．当該ＮＬＳが、配列番号５５９７～５６１２から選択される配列を含む、実施形態１～１１のいずれか一項に記載の操作されたヌクレアーゼシステム。
１９．
システムは、５’から３’に向かって、当該標的デオキシリボ核酸配列に対して５’で少なくとも２０ヌクレオチドの配列を含む第１のホモロジーアームに対して、少なくとも１０ヌクレオチドの合成ＤＮＡ配列と、当該標的配列に対して３’で少なくとも２０ヌクレオチドの配列を含む第２のホモロジーアームと、を含む、一本鎖又は二本鎖ＤＮＡ修復鋳型を更に含む、実施形態１～１２のいずれか一項に記載の操作されたヌクレアーゼシステム。
２０．当該第１のホモロジーアーム又は第２のホモロジーアームが、少なくとも４０、８０、１２０、１５０、２００、３００、５００、又は１，０００ヌクレオチドの配列を含む、実施形態１３に記載の操作されたヌクレアーゼシステム。
２１．当該システムが、Ｍｇ２＋の供給源を更に含む、実施形態１～１４のいずれか一項に記載の操作されたヌクレアーゼシステム。
２２．当該エンドヌクレアーゼ及び当該ｔｒａｃｒリボ核酸配列が、同じ門内の異なる細菌種に由来する、実施形態１～２１のいずれか一項に記載の操作されたヌクレアーゼシステム。
２３．当該エンドヌクレアーゼが、デルマバクター（Ｄｅｒｍａｂａｃｔｅｒ）属に属する細菌に由来する、実施形態１～２２のいずれか一項に記載の操作されたヌクレアーゼシステム。
２４．当該エンドヌクレアーゼが、ウェルコミクロビウム（Ｖｅｒｒｕｃｏｍｉｃｒｏｂｉａ）門、カンディダートゥス・ペレグリニバクテリア（ＣａｎｄｉｄａｔｕｓＰｅｒｅｇｒｉｎｉｂａｃｔｅｒｉａ）門、又はカンディダートゥス・メライナバクテリア（ＣａｎｄｉｄａｔｕｓＭｅｌａｉｎａｂａｃｔｅｒｉａ）門に属する細菌に由来する、実施形態１～２２のいずれか一項に記載の操作されたヌクレアーゼシステム。
２５．当該エンドヌクレアーゼが、配列番号５５９２～５５９５のいずれか１つに対して少なくとも９０％の同一性を有する１６ＳｒＲＮＡ遺伝子を含む細菌に由来する、実施形態１～２２のいずれか一項に記載の操作されたヌクレアーゼシステム。
２６．当該ＨＮＨドメインが、配列番号３６３８～３９５５のいずれか１つに対して少なくとも７０％又は少なくとも８０％の同一性を有する配列を含む、実施形態１～２５のいずれか一項に記載の操作されたヌクレアーゼシステム。
２７．当該エンドヌクレアーゼが、配列番号１～１８２６、又はそれに対して少なくとも５５％の同一性を有するそのバリアントを含む、実施形態１～２６のいずれか一項に記載の操作されたヌクレアーゼシステム。
２８．当該エンドヌクレアーゼが、配列番号１８２７～１８３０又は配列番号１８２７～２１４０からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７のいずれか一項に記載の操作されたヌクレアーゼシステム。
２９．当該エンドヌクレアーゼが、配列番号３６３８～３６４１又は配列番号３６３８～３９５４からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２８のいずれか一項に記載の操作されたヌクレアーゼシステム。
３０．当該エンドヌクレアーゼが、配列番号５６１５～５６３２からなる群から選択される少なくとも１個、少なくとも２個、少なくとも３個、少なくとも４個、又は少なくとも５個のペプチドモチーフを含む、実施形態１～２９のいずれか一項に記載の操作されたヌクレアーゼシステム。
３１．当該エンドヌクレアーゼが、配列番号１～４又は配列番号１～３１９からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～３０のいずれか一項に記載の操作されたヌクレアーゼシステム。
３２．当該ガイドＲＮＡ構造が、配列番号５４６１～５４６４、配列番号５４７６～５４７９、又は配列番号５４７６～５４８９からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～３１のいずれか一項に記載の操作されたヌクレアーゼシステム。
３３．当該ガイドＲＮＡ構造が、ステム及びループからなるヘアピンを含むと予測されるＲＮＡ配列を含み、当該ステムが、少なくとも１０、少なくとも１２、又は少なくとも１４塩基対のリボヌクレオチドと、当該ループの４塩基対以内の非対称バルジと、を含む、実施形態１～３２のいずれか一項に記載の操作されたヌクレアーゼシステム。
３４．当該エンドヌクレアーゼが、配列番号５５１２～５５１５又は配列番号５５２７～５５３０からなる群から選択される配列を含む、ＰＡＭに結合するように構成されている、実施形態１～３３のいずれか一項に記載の操作されたヌクレアーゼシステム。
３５．
ａ）当該エンドヌクレアーゼが、配列番号１８２７に対して少なくとも７０％、少なくとも８０％、又は少なくとも９０％同一の配列を含み、
ｂ）当該ガイドＲＮＡ構造が、配列番号５４６１又は配列番号５４７６の少なくとも１つに対して、少なくとも７０％、少なくとも８０％、又は少なくとも９０％同一の配列を含み、かつ
ｃ）当該エンドヌクレアーゼが、配列番号５５１２又は配列番号５５２７を含むＰＡＭへと結合するように構成されている、
実施形態１～３４のいずれか一項に記載の操作されたヌクレアーゼシステム。
３６．
ａ）当該エンドヌクレアーゼが、配列番号１８２８に対して少なくとも７０％、少なくとも８０％、又は少なくとも９０％同一の配列を含み、
ｂ）当該ガイドＲＮＡ構造が、配列番号５４６２又は配列番号５４７７の少なくとも１つに対して、少なくとも７０％、少なくとも８０％、又は少なくとも９０％同一の配列を含み、かつ
ｃ）当該エンドヌクレアーゼが、配列番号５５１３又は配列番号５５２８を含むＰＡＭへと結合するように構成されている、
実施形態１～３４のいずれか一項に記載の操作されたヌクレアーゼシステム。
３７．
ａ）当該エンドヌクレアーゼが、配列番号１８２９に対して少なくとも７０％、少なくとも８０％、又は少なくとも９０％同一の配列を含み、
ｂ）当該ガイドＲＮＡ構造が、配列番号５４６３又は配列番号５４７８の少なくとも１つに対して、少なくとも７０％、少なくとも８０％、又は少なくとも９０％同一の配列を含み、かつ
ｃ）当該エンドヌクレアーゼが、配列番号５５１４又は配列番号５５２９を含むＰＡＭへと結合するように構成されている、
実施形態１～３４のいずれか一項に記載の操作されたヌクレアーゼシステム。
３８．
ａ）当該エンドヌクレアーゼが、配列番号１８３０に対して少なくとも７０％、少なくとも８０％、又は少なくとも９０％同一の配列を含み、
ｂ）当該ガイドＲＮＡ構造が、配列番号５４６４又は配列番号５４７９の少なくとも１つに対して、少なくとも７０％、少なくとも８０％、又は少なくとも９０％同一の配列を含み、かつ
ｃ）当該エンドヌクレアーゼが、配列番号５５１５又は配列番号５５３０を含むＰＡＭへと結合するように構成されている、
実施形態１～３４のいずれか一項に記載の操作されたヌクレアーゼシステム。
３９．当該エンドヌクレアーゼが、配列番号２１４１～２１４２又は配列番号２１４１～２２４１からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７のいずれか一項に記載の操作されたヌクレアーゼシステム。
４０．当該エンドヌクレアーゼが、配列番号３９５５～３９５６又は配列番号３９５５～４０５５からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７又は実施形態３９のいずれか一項に記載の操作されたヌクレアーゼシステム。
４１．当該エンドヌクレアーゼが、配列番号５６３２～５６３８からなる群から選択される少なくとも１個、少なくとも２個、少なくとも３個、少なくとも４個、又は少なくとも５個のペプチドモチーフを含む、実施形態１～２７又は実施形態３９～４０のいずれか一項に記載の操作されたヌクレアーゼシステム。
４２．当該エンドヌクレアーゼが、配列番号３２０～３２１又は配列番号３２０～４２０からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７又は実施形態３９～４１のいずれか一項に記載の操作されたヌクレアーゼシステム。
４３．当該ガイドＲＮＡ構造が、配列番号５４６５、配列番号５４９０～５４９１、又は配列番号５４９０～５４９４からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７又は実施形態３９～４２のいずれか一項に記載の操作されたヌクレアーゼシステム。
４４．当該ガイドＲＮＡ構造が、少なくとも８、少なくとも１０、又は少なくとも１２塩基対のリボヌクレオチドを含むヘアピンを含む、ｔｒａｃｒリボ核酸配列を含む、実施形態１～２７又は実施形態３９～４３のいずれか一項に記載の操作されたヌクレアーゼシステム。
４５．当該エンドヌクレアーゼが、配列番号５５１６及び配列番号５５３１からなる群から選択される配列を含む、ＰＡＭに結合するように構成されている、実施形態１～２７又は実施形態３９～４４のいずれか一項に記載の操作されたヌクレアーゼシステム。
４６．
ａ）当該エンドヌクレアーゼが、配列番号２１４１に対して少なくとも７０％、８０％、又は９０％同一の配列を含み、
ｂ）当該ガイドＲＮＡ構造が、配列番号５４９０に対して少なくとも７０％、８０％、又は９０％同一の配列を含み、かつ
ｃ）当該エンドヌクレアーゼが、配列番号５５３１を含むＰＡＭへと結合するように構成されている、
実施形態１～２７又は実施形態３９～４５のいずれか一項に記載の操作されたヌクレアーゼシステム。
４７．
ａ）当該エンドヌクレアーゼが、配列番号２１４２に対して少なくとも７０％、８０％、又は９０％同一の配列を含み、
ｂ）当該ガイドＲＮＡ構造が、配列番号５４６５又は配列番号５４９１に対して少なくとも７０％、８０％、又は９０％同一の配列を含み、かつ
ｃ）当該エンドヌクレアーゼが、配列番号５５１６を含むＰＡＭへと結合するように構成されている、
実施形態１～２７又は実施形態３９～４５のいずれか一項に記載の操作されたヌクレアーゼシステム。
４８．当該エンドヌクレアーゼが、配列番号２２４５～２２４６からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７のいずれか一項に記載の操作されたヌクレアーゼシステム。
４９．当該エンドヌクレアーゼが、配列番号４０５９～４０６０からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７又は実施形態４８のいずれか一項に記載の操作されたヌクレアーゼシステム。
５０．当該エンドヌクレアーゼが、配列番号５６３９～５６４８からなる群から選択される少なくとも１個、少なくとも２個、少なくとも３個、少なくとも４個、又は少なくとも５個のペプチドモチーフを含む、実施形態１～２７又は実施形態４８～４９のいずれか一項に記載の操作されたヌクレアーゼシステム。
５１．当該エンドヌクレアーゼが、配列番号４２４～４２５からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７又は実施形態４８～５０のいずれか一項に記載の操作されたヌクレアーゼシステム。
５２．当該ガイドＲＮＡ構造が、配列番号５４９８～５４９９及び配列番号５５３９からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７又は実施形態４８～５１のいずれか一項に記載の操作されたヌクレアーゼシステム。
５３．当該ガイドＲＮＡ構造が、ガイドリボ核酸配列の少なくとも８ヌクレオチド及びｔｒａｃｒリボ核酸配列の少なくとも８ヌクレオチドを含む中断されていない塩基対領域を有するヘアピンを含むと予測されるガイドリボ核酸配列を含み、当該ｔｒａｃｒリボ核酸配列が、５’から３’に向かって、第１のヘアピン及び第２のヘアピンを含み、当該第１のヘアピンが、当該第２のヘアピンよりも長いステムを有する、実施形態１～２７又は実施形態４８～５２のいずれか一項に記載の操作されたヌクレアーゼシステム。
５４．当該エンドヌクレアーゼが、配列番号２２４２～２２４４又は配列番号２２４７～２２４９からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７のいずれか一項に記載の操作されたヌクレアーゼシステム。
５５．当該エンドヌクレアーゼが、配列番号４０５６～４０５８及び配列番号４０６１～４０６３からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７又は実施形態５４のいずれか一項に記載の操作されたヌクレアーゼシステム。
５６．当該エンドヌクレアーゼが、配列番号５６３９～５６４８からなる群から選択される少なくとも１個、少なくとも２個、少なくとも３個、少なくとも４個、又は少なくとも５個のペプチドモチーフを含む、実施形態１～２７又は実施形態５４～５５のいずれか一項に記載の操作されたヌクレアーゼシステム。
５７．当該エンドヌクレアーゼが、配列番号４２１～４２３又は配列番号４２６～４２８からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７又は実施形態５４～５６のいずれか一項に記載の操作されたヌクレアーゼシステム。
５８．当該ガイドＲＮＡ構造が、配列番号５４６６～５４６７、配列番号５４９５～５４９７、配列番号５５００～５５０２、及び配列番号５５３９からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７又は実施形態５４～５７のいずれか一項に記載の操作されたヌクレアーゼシステム。
５９．当該ガイドＲＮＡ構造が、ガイドリボ核酸配列の少なくとも８ヌクレオチド及びｔｒａｃｒリボ核酸配列の少なくとも８ヌクレオチドを含む中断されていない塩基対領域を有するヘアピンを含むと予測されるガイドリボ核酸配列を含み、当該ｔｒａｃｒリボ核酸配列が、５’から３’に向かって、第１のヘアピン及び第２のヘアピンを含み、当該第１のヘアピンが、当該第２のヘアピンよりも長いステムを有する、実施形態１～２７又は実施形態５４～５８のいずれか一項に記載の操作されたヌクレアーゼシステム。
６０．当該エンドヌクレアーゼが、配列番号５５１７～５５１８又は配列番号５５３２～５５３４からなる群から選択される配列を含む、ＰＡＭに結合するように構成されている、実施形態１～２７又は実施形態５４～５９のいずれか一項に記載の操作されたヌクレアーゼシステム。
６１．
ａ）当該エンドヌクレアーゼが、配列番号２２４７に対して少なくとも７０％、８０％、又は９０％同一の配列を含み、
ｂ）当該ガイドＲＮＡ構造が、配列番号５５００に対して少なくとも７０％、８０％、又は９０％同一の配列を含み、かつ
ｃ）当該エンドヌクレアーゼが、配列番号５５１７又は配列番号５５３２を含むＰＡＭへと結合するように構成されている、
実施形態１～２７又は実施形態５４～６０のいずれか一項に記載の操作されたヌクレアーゼシステム。
６２．
ａ）当該エンドヌクレアーゼが、配列番号２２４８に対して少なくとも７０％、８０％、又は９０％同一の配列を含み、
ｂ）当該ガイドＲＮＡ構造が、配列番号５５０１に対して少なくとも７０％、８０％、又は９０％同一の配列を含み、かつ
ｃ）当該エンドヌクレアーゼが、配列番号５５１８又は配列番号５５３３を含むＰＡＭへと結合するように構成されている、
実施形態１～２７又は実施形態５４～６０のいずれか一項に記載の操作されたヌクレアーゼシステム。
６３．
ａ）当該エンドヌクレアーゼが、配列番号２２４９に対して少なくとも７０％、８０％、又は９０％同一の配列を含み、
ｂ）当該ガイドＲＮＡ構造が、配列番号５５０２に対して少なくとも７０％、８０％、又は９０％同一の配列を含み、かつ
ｃ）当該エンドヌクレアーゼが、配列番号５５３４を含むＰＡＭへと結合するように構成されている、
実施形態１～２７又は実施形態５４～６０のいずれか一項に記載の操作されたヌクレアーゼシステム。
６４．当該エンドヌクレアーゼが、配列番号２２５３又は配列番号２２５３～２４８１からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７のいずれか一項に記載の操作されたヌクレアーゼシステム。
６５．当該エンドヌクレアーゼが、配列番号４０６７又は配列番号４０６７～４２９５からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７又は実施形態６４のいずれか一項に記載の操作されたヌクレアーゼシステム。
６６．当該エンドヌクレアーゼが、配列番号５６４９によるペプチドモチーフを含む、実施形態１～２７又は実施形態６４～６５のいずれか一項に記載の操作されたヌクレアーゼシステム。
６７．当該エンドヌクレアーゼが、配列番号４３２又は配列番号４３２～６６０からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７又は実施形態６４～６６のいずれか一項に記載の操作されたヌクレアーゼシステム。
６８．当該ガイドＲＮＡ構造が、配列番号５４６８又は配列番号５５０３からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７又は実施形態６４～６７のいずれか一項に記載の操作されたヌクレアーゼシステム。
６９．当該エンドヌクレアーゼが、配列番号５５１９からなる群から選択される配列を含む、ＰＡＭに結合するように構成されている、実施形態１～２７又は実施形態６４～６８のいずれか一項に記載の操作されたヌクレアーゼシステム。
７０．
ａ）当該エンドヌクレアーゼが、配列番号２２５３に対して少なくとも７０％、８０％、又は９０％同一の配列を含み、
ｂ）当該ガイドＲＮＡ構造が、配列番号５４６８又は配列番号５５０３に対して少なくとも７０％、８０％、又は９０％同一の配列を含み、かつ
ｃ）当該エンドヌクレアーゼが、配列番号５５１９を含むＰＡＭへと結合するように構成されている、
実施形態１～２７又は実施形態６４～６９のいずれか一項に記載の操作されたヌクレアーゼシステム。
７１．当該エンドヌクレアーゼが、配列番号２４８２～２４８９からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７のいずれか一項に記載の操作されたヌクレアーゼシステム。
７２．当該エンドヌクレアーゼが、配列番号４２９６～４３０３からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７又は実施形態７１のいずれか一項に記載の操作されたヌクレアーゼシステム。
７３．当該エンドヌクレアーゼが、配列番号６６１～６６８からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７又は実施形態７１～７２のいずれか一項に記載の操作されたヌクレアーゼシステム。
７４．当該エンドヌクレアーゼが、配列番号２４９０～２４９８からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７のいずれか一項に記載の操作されたヌクレアーゼシステム。
７５．当該エンドヌクレアーゼが、配列番号４３０４～４３１２からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７又は実施形態７４のいずれか一項に記載の操作されたヌクレアーゼシステム。
７６．当該エンドヌクレアーゼが、配列番号６６９～６７７からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７又は実施形態７４～７５のいずれか一項に記載の操作されたヌクレアーゼシステム。
７７．当該ガイドＲＮＡ構造が、配列番号５５０４からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７又は実施形態７４～７６のいずれか一項に記載の操作されたヌクレアーゼシステム。
７８．当該エンドヌクレアーゼが、配列番号２４９９又は配列番号２４９９～２７５０からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７のいずれか一項に記載の操作されたヌクレアーゼシステム。
７９．当該エンドヌクレアーゼが、配列番号４３１３又は配列番号４３１３～４５６４からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７又は実施形態７８のいずれか一項に記載の操作されたヌクレアーゼシステム。
８０．当該エンドヌクレアーゼが、配列番号５６５０～５６６７からなる群から選択される少なくとも１個、少なくとも２個、少なくとも３個、少なくとも４個、又は少なくとも５個のペプチドモチーフを含む、実施形態１～２７又は実施形態７８～７９のいずれか一項に記載の操作されたヌクレアーゼシステム。
８１．当該エンドヌクレアーゼが、配列番号６７８又は配列番号６７８～９２９からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７又は実施形態７８～８０のいずれか一項に記載の操作されたヌクレアーゼシステム。
８２．当該ガイドＲＮＡ構造が、配列番号５４６９又は配列番号５５０５に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７又は実施形態７８～８１のいずれか一項に記載の操作されたヌクレアーゼシステム。
８３．当該エンドヌクレアーゼが、配列番号５５２０又は配列番号５５３５を含むＰＡＭに結合するように構成されている、実施形態１～２７又は実施形態７８～８２のいずれか一項に記載の操作されたヌクレアーゼシステム。
８４．
ａ）当該エンドヌクレアーゼが、配列番号２４９９に対して少なくとも７０％、８０％、又は９０％同一の配列を含み、
ｂ）当該ガイドＲＮＡ構造が、配列番号５４６９又は配列番号５５０５に対して少なくとも７０％、８０％、又は９０％同一の配列を含み、かつ
ｃ）当該エンドヌクレアーゼが、配列番号５５２０又は配列番号５５３５を含むＰＡＭへと結合するように構成されている、
実施形態１～２７又は実施形態７８～８２のいずれか一項に記載の操作されたヌクレアーゼシステム。
８５．当該エンドヌクレアーゼが、配列番号２７５１又は配列番号２７５１～２９１３からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７のいずれか一項に記載の操作されたヌクレアーゼシステム。
８６．当該エンドヌクレアーゼが、配列番号４５６５又は配列番号４５６５～４７２７からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７又は実施形態８５のいずれか一項に記載の操作されたヌクレアーゼシステム。
８７．当該エンドヌクレアーゼが、配列番号５６６８～５６７８からなる群から選択される少なくとも１個、少なくとも２個、少なくとも３個、少なくとも４個、又は少なくとも５個のペプチドモチーフを含む、実施形態１～２７又は実施形態８５～８６のいずれか一項に記載の操作されたヌクレアーゼシステム。
８８．当該エンドヌクレアーゼが、配列番号９３０又は配列番号９３０～１０９２からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７又は実施形態８５～８７のいずれか一項に記載の操作されたヌクレアーゼシステム。
８９．当該ガイドＲＮＡ構造が、配列番号５４７０又は配列番号５５０６に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７又は実施形態８５～８８のいずれか一項に記載の操作されたヌクレアーゼシステム。
９０．当該エンドヌクレアーゼが、配列番号５５２１又は配列番号５５３６からなる群から選択される配列を含む、ＰＡＭに結合するように構成されている、実施形態１～２７又は実施形態８５～８９のいずれか一項に記載の操作されたヌクレアーゼシステム。
９１．
ａ）当該エンドヌクレアーゼが、配列番号２７５１に対して少なくとも７０％、８０％、又は９０％同一の配列を含み、
ｂ）当該ガイドＲＮＡ構造が、配列番号５４７０又は配列番号５５０６に対して少なくとも７０％、８０％、又は９０％同一の配列を含み、かつ
ｃ）当該エンドヌクレアーゼが、配列番号５５２１又は配列番号５５３６を含むＰＡＭへと結合するように構成されている、
実施形態１～２７又は実施形態８５～９０のいずれか一項に記載の操作されたヌクレアーゼシステム。
９２．当該エンドヌクレアーゼが、配列番号２９１４又は配列番号２９１４～３１７４からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７のいずれか一項に記載の操作されたヌクレアーゼシステム。
９３．当該エンドヌクレアーゼが、配列番号４７２８又は配列番号４７２８～４９８８からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７又は実施形態９２のいずれか一項に記載の操作されたヌクレアーゼシステム。
９４．当該エンドヌクレアーゼが、配列番号５６７６～５６７８からなる群から選択される少なくとも１個、少なくとも２個、又は少なくとも３個のペプチドモチーフを含む、実施形態１～２７又は実施形態９２～９３のいずれか一項に記載の操作されたヌクレアーゼシステム。
９５．当該エンドヌクレアーゼが、配列番号１０９３又は配列番号１０９３～１３５３からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７又は実施形態９２～９４のいずれか一項に記載の操作されたヌクレアーゼシステム。
９６．当該ガイドＲＮＡ構造が、配列番号５４７１、配列番号５５０７及び配列番号５５４０～５５４２からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７又は実施形態９２～９５のいずれか一項に記載の操作されたヌクレアーゼシステム。
９７．当該ガイドＲＮＡ構造が、５塩基対未満のリボヌクレオチドを含む少なくとも２つのヘアピンを含むと予測される、ｔｒａｃｒリボ核酸配列を含む、実施形態１～２７又は実施形態９２～９６のいずれか一項に記載の操作されたヌクレアーゼシステム。
９８．当該エンドヌクレアーゼが、配列番号５５２２を含むＰＡＭに結合するように構成されている、実施形態１～２７又は実施形態９２～９７のいずれか一項に記載の操作されたヌクレアーゼシステム。
９９．
ａ）当該エンドヌクレアーゼが、配列番号２９１４に対して少なくとも７０％、８０％、又は９０％同一の配列を含み、
ｂ）当該ガイドＲＮＡ構造が、配列番号５４７１又は配列番号５５０７に対して少なくとも７０％、８０％、又は９０％同一の配列を含み、かつ
ｃ）当該エンドヌクレアーゼが、配列番号５５２２を含むＰＡＭへと結合するように構成されている、
実施形態１～２７又は実施形態９２～９８のいずれか一項に記載の操作されたヌクレアーゼシステム。
１００．当該エンドヌクレアーゼが、配列番号３１７５又は配列番号３１７５～３３３０からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７のいずれか一項に記載の操作されたヌクレアーゼシステム。
１０１．当該エンドヌクレアーゼが、配列番号４９８９又は配列番号４９８９～５１４６からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７又は実施形態１００のいずれか一項に記載の操作されたヌクレアーゼシステム。
１０２．当該エンドヌクレアーゼが、配列番号５６７９～５６８６からなる群から選択される少なくとも１個、少なくとも２個、少なくとも３個、少なくとも４個、又は少なくとも５個のペプチドモチーフを含む、実施形態１～２７又は実施形態１００～１０１のいずれか一項に記載の操作されたヌクレアーゼシステム。
１０３．当該エンドヌクレアーゼが、配列番号１３５４又は配列番号１３５４～１５１１からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７又は実施形態１００～１０２のいずれか一項に記載の操作されたヌクレアーゼシステム。
１０４．当該ガイドＲＮＡ構造が、配列番号５４７２又は配列番号５５０８からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７又は実施形態１００～１０３のいずれか一項に記載の操作されたヌクレアーゼシステム。
１０５．当該エンドヌクレアーゼが、配列番号５５２３又は配列番号５５３７からなる群から選択される配列を含む、ＰＡＭに結合するように構成されている、実施形態１～２７又は実施形態１００～１０４のいずれか一項に記載の操作されたヌクレアーゼシステム。
１０６．
ａ）当該エンドヌクレアーゼが、配列番号３１７５に対して少なくとも７０％、８０％、又は９０％同一の配列を含み、
ｂ）当該ガイドＲＮＡ構造が、配列番号５４７２又は配列番号５５０８に対して少なくとも７０％、８０％、又は９０％同一の配列を含み、かつ
ｃ）当該エンドヌクレアーゼが、配列番号５５２３又は配列番号５５３７を含むＰＡＭへと結合するように構成されている、
実施形態１～２７又は実施形態１００～１０５のいずれか一項に記載の操作されたヌクレアーゼシステム。
１０７．当該エンドヌクレアーゼが、配列番号３３３１又は配列番号３３３１～３４７４からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７のいずれか一項に記載の操作されたヌクレアーゼシステム。
１０８．当該エンドヌクレアーゼが、配列番号５１４７又は配列番号５１４７～５２９０からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７又は実施形態１０７のいずれか一項に記載の操作されたヌクレアーゼシステム。
１０９．当該エンドヌクレアーゼが、配列番号５６７４～５６７５及び配列番号５６８７～５６９３からなる群から選択される少なくとも１個、少なくとも２個、少なくとも３個、少なくとも４個、又は少なくとも５個のペプチドモチーフを含む、実施形態１～２７又は実施形態１０７～１０８のいずれか一項に記載の操作されたヌクレアーゼシステム。
１１０．当該エンドヌクレアーゼが、配列番号１５１２又は配列番号１５１２～１６５５からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７又は実施形態１０７～１０９のいずれか一項に記載の操作されたヌクレアーゼシステム。
１１１．当該ガイドＲＮＡ構造が、配列番号５４７３又は配列番号５５０９からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７又は実施形態１０７～１１０のいずれか一項に記載の操作されたヌクレアーゼシステム。
１１２．当該エンドヌクレアーゼが、配列番号５５２４を含むＰＡＭに結合するように構成されている、実施形態１～２７又は実施形態１０７～１１１のいずれか一項に記載の操作されたヌクレアーゼシステム。
１１３．
ａ）当該エンドヌクレアーゼが、配列番号３３３１に対して少なくとも７０％、８０％、又は９０％同一の配列を含み、
ｂ）当該ガイドＲＮＡ構造が、配列番号５４７３又は配列番号５５０９に対して少なくとも７０％、８０％、又は９０％同一の配列を含み、かつ
ｃ）当該エンドヌクレアーゼが、配列番号５５２４を含むＰＡＭへと結合するように構成されている、
実施形態１～２７又は実施形態１０７～１１２のいずれか一項に記載の操作されたヌクレアーゼシステム。
１１４．当該エンドヌクレアーゼが、配列番号３４７５又は配列番号３４７５～３５６８からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７のいずれか一項に記載の操作されたヌクレアーゼシステム。
１１５．当該エンドヌクレアーゼが、配列番号５２９１又は配列番号５２９１～５３８９からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７又は実施形態１１４のいずれか一項に記載の操作されたヌクレアーゼシステム。
１１６．当該エンドヌクレアーゼが、配列番号５６９４～５６９９からなる群から選択される少なくとも１個、少なくとも２個、少なくとも３個、少なくとも４個、又は少なくとも５個のペプチドモチーフを含む、実施形態１～２７又は実施形態１１４～１１５のいずれか一項に記載の操作されたヌクレアーゼシステム。
１１７．当該エンドヌクレアーゼが、配列番号１６５６又は配列番号１６５６～１７５５からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７又は実施形態１１４～１１６のいずれか一項に記載の操作されたヌクレアーゼシステム。
１１８．当該ガイドＲＮＡ構造が、配列番号５４７４又は配列番号５５１０に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７又は実施形態１１４～１１７のいずれか一項に記載の操作されたヌクレアーゼシステム。
１１９．当該エンドヌクレアーゼが、配列番号５５２５を含むＰＡＭに結合するように構成されている、実施形態１～２７又は実施形態１１４～１１８のいずれか一項に記載の操作されたヌクレアーゼシステム。
１２０．
ａ）当該エンドヌクレアーゼが、配列番号３４７５に対して少なくとも７０％、８０％、又は９０％同一の配列を含み、
ｂ）当該ガイドＲＮＡ構造が、配列番号５４７４又は配列番号５５１０に対して少なくとも７０％、８０％、又は９０％同一の配列を含み、かつ
ｃ）当該エンドヌクレアーゼが、配列番号５５２５を含むＰＡＭへと結合するように構成されている、
実施形態１～２７又は実施形態１１４～１１９のいずれか一項に記載の操作されたヌクレアーゼシステム。
１２１．当該エンドヌクレアーゼが、配列番号３５６９又は配列番号３５６９～３６３７からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７のいずれか一項に記載の操作されたヌクレアーゼシステム。
１２２．当該エンドヌクレアーゼが、配列番号５３９０又は配列番号５３９０～５４６０からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７又は実施形態１２１のいずれか一項に記載の操作されたヌクレアーゼシステム。
１２３．当該エンドヌクレアーゼが、配列番号５７００～５７１７からなる群から選択される少なくとも１個、少なくとも２個、少なくとも３個、少なくとも４個、又は少なくとも５個のペプチドモチーフを含む、実施形態１～２７又は実施形態１２１～１２２のいずれか一項に記載の操作されたヌクレアーゼシステム。
１２４．当該エンドヌクレアーゼが、配列番号１７５６又は配列番号１７５６～１８２６からなる群から選択される配列に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７又は実施形態１２１～１２３のいずれか一項に記載の操作されたヌクレアーゼシステム。
１２５．当該ガイドＲＮＡ構造が、配列番号５４７５又は配列番号５５１１に対して、少なくとも７０％、８０％、又は９０％同一の配列を含む、実施形態１～２７又は実施形態１２１～１２４のいずれか一項に記載の操作されたヌクレアーゼシステム。
１２６．当該エンドヌクレアーゼが、配列番号５５２６を含むＰＡＭに結合するように構成されている、実施形態１～２７又は実施形態１２１～１２５のいずれか一項に記載の操作されたヌクレアーゼシステム。
１２７．
ａ）当該エンドヌクレアーゼが、配列番号３５６９に対して少なくとも７０％、８０％、又は９０％同一の配列を含み、
ｂ）当該ガイドＲＮＡ構造が、配列番号５４７５又は配列番号５５１１に対して少なくとも７０％、８０％、又は９０％同一の配列を含み、かつ
ｃ）当該エンドヌクレアーゼが、配列番号５５２６を含むＰＡＭへと結合するように構成されている、
実施形態１～２７又は実施形態１２１～１２６のいずれか一項に記載の操作されたヌクレアーゼシステム。
１２８．当該配列同一性が、ＢＬＡＳＴＰ、ＣＬＵＳＴＡＬＷ、ＭＵＳＣＬＥ、ＭＡＦＦＴ、又はＳｍｉｔｈ－Ｗａｔｅｒｍａｎ相同性検索アルゴリズムによって決定される、請求項１～１２７のいずれか一項に記載の操作されたヌクレアーゼシステム。
１２９．当該配列同一性が、３のワード長（Ｗ）、１０の期待値（Ｅ）のパラメータ、及び１１の存在、１の拡張でのＢＬＯＳＵＭ６２スコアリングマトリックス設定ギャップコストを用いて、並びに条件付き組成スコアマトリックス調整を用いて、当該ＢＬＡＳＴＰ相同性検索アルゴリズムによって決定される、実施形態１５に記載の操作されたヌクレアーゼシステム。
１３０．操作されたガイドリボ核酸ポリヌクレオチドであって、
ａ）標的ＤＮＡ分子中の標的配列に相補的であるヌクレオチド配列を含む、ＤＮＡ標的化セグメントと、
ｂ）ハイブリダイズして二本鎖ＲＮＡ（ｄｓＲＮＡ）二重鎖を形成するヌクレオチドの２つの相補的ストレッチを含む、タンパク質結合セグメントであって、
当該ヌクレオチドの２つの相補的なストレッチは、介在するヌクレオチドを用いて互いに共有結合しており、
当該操作されたガイドリボ核酸ポリヌクレオチドは、配列番号１８２７～３６３７のいずれか１つに対して少なくとも７５％の配列同一性を有するＲｕｖＣ＿ＩＩＩドメインを含むエンドヌクレアーゼと複合体を形成し、かつ当該標的ＤＮＡ分子の当該標的配列に当該複合体を標的化するように構成される、タンパク質結合セグメントと、
を含む、操作されたガイドリボ核酸ポリヌクレオチド。
１３１．当該ＤＮＡ標的化セグメントが、当該ヌクレオチドの２つの相補的なストレッチの両方の５’側に位置する、実施形態１７に記載の操作されたガイドリボ核酸ポリヌクレオチド。
１３２．
ａ）当該タンパク質結合セグメントが、配列番号５４７６～５４７９又は配列番号５４７６～５４８９からなる群から選択される配列に対して、少なくとも７０％、少なくとも８０％、又は少なくとも９０％の同一性を有する配列を含み、
ｂ）当該タンパク質結合セグメントが、（配列番号５４９０～５４９１又は配列番号５４９０～５４９４）及び配列番号５５３８からなる群から選択される配列に対して、少なくとも７０％、少なくとも８０％、又は少なくとも９０％の同一性を有する配列を含み、
ｃ）当該タンパク質結合セグメントが、配列番号５４９８～５４９９からなる群から選択される配列に対して、少なくとも７０％、少なくとも８０％、又は少なくとも９０％の同一性を有する配列を含み、
ｄ）当該タンパク質結合セグメントが、配列番号５４９５～５４９７及び配列番号５５００～５５０２からなる群から選択される配列に対して、少なくとも７０％、少なくとも８０％、又は少なくとも９０％の同一性を有する配列を含み、
ｅ）当該タンパク質結合セグメントが、配列番号５５０３に対して、少なくとも７０％、少なくとも８０％、又は少なくとも９０％の同一性を有する配列を含み、
ｆ）当該タンパク質結合セグメントが、配列番号５５０４に対して、少なくとも７０％、少なくとも８０％、又は少なくとも９０％の同一性を有する配列を含み、
ｇ）当該タンパク質結合セグメントが、配列番号５５０５に対して、少なくとも７０％、少なくとも８０％、又は少なくとも９０％の同一性を有する配列を含み、
ｈ）タンパク質結合セグメントが、配列番号５５０６に対して、少なくとも７０％、少なくとも８０％、又は少なくとも９０％の同一性を有する配列を含み、
ｉ）タンパク質結合セグメントが、配列番号５５０７に対して、少なくとも７０％、少なくとも８０％、又は少なくとも９０％の同一性を有する配列を含み、
ｊ）当該タンパク質結合セグメントが、配列番号５５０８に対して、少なくとも７０％、少なくとも８０％、又は少なくとも９０％の同一性を有する配列を含み、
ｋ）当該タンパク質結合セグメントが、配列番号５５０９に対して、少なくとも７０％、少なくとも８０％、又は少なくとも９０％の同一性を有する配列を含み、
ｌ）当該タンパク質結合セグメントが、配列番号５５１０に対して、少なくとも７０％、少なくとも８０％、又は少なくとも９０％の同一性を有する配列を含み、又は
ｍ）当該タンパク質結合セグメントが、配列番号５５１１に対して、少なくとも７０％、少なくとも８０％、又は少なくとも９０％の同一性を有する配列を含む、
実施形態１７～１８のいずれか一項に記載の操作されたガイドリボ核酸ポリヌクレオチド。
１３３．
ａ）当該ガイドリボ核酸ポリヌクレオチドは、ステム及びループを含むヘアピンを含むＲＮＡ配列を含み、当該ステムが、少なくとも１０、少なくとも１２、又は少なくとも１４塩基対のリボヌクレオチドと、ループの４塩基対以内の非対称バルジと、を含み、
ｂ）当該ガイドリボ核酸ポリヌクレオチドが、少なくとも８、少なくとも１０、又は少なくとも１２塩基対のリボヌクレオチドを含むヘアピンを含むと予測される、ｔｒａｃｒリボ核酸配列を含み、
ｃ）当該ガイドリボ核酸ポリヌクレオチドが、ガイドリボ核酸配列の少なくとも８ヌクレオチド及びｔｒａｃｒリボ核酸配列の少なくとも８ヌクレオチドを含む中断されていない塩基対領域を有するヘアピンを含むと予測されるガイドリボ核酸配列を含み、当該ｔｒａｃｒリボ核酸配列が、５’から３’に向かって、第１のヘアピン及び第２のヘアピンを含み、当該第１のヘアピンが、当該第２のヘアピンよりも長いステムを有し、又は
ｄ）当該ガイドリボ核酸ポリヌクレオチドが、５塩基対未満のリボヌクレオチドを含む少なくとも２つのヘアピンを含むと予測される、ｔｒａｃｒリボ核酸配列を含む、
実施形態１７～１３２のいずれか一項に記載の操作されたガイドリボ核酸ポリヌクレオチド。
１３４．実施形態１７～１３３のいずれか一項に記載の操作されたガイドリボ核酸ポリヌクレオチドをコードする、デオキシリボ核酸ポリヌクレオチド。
１３５．生物における発現のために最適化された操作核酸配列を含む核酸であって、当該核酸は、ＲｕｖＣ＿ＩＩＩドメイン及びＨＮＨドメインを含むクラス２タイプＩＩＣａｓエンドヌクレアーゼをコードし、当該エンドヌクレアーゼは、未培養微生物に由来する、核酸。
１３６．生物における発現のために最適化された操作核酸配列を含む核酸であって、当該核酸は、配列番号１８２７～３６３７のいずれか１つに対して少なくとも７０％の配列同一性を有するＲｕｖＣ＿ＩＩＩドメインを含むエンドヌクレアーゼをコードする、核酸。
１３７．当該エンドヌクレアーゼが、配列番号３６３８～５４６０のいずれか１つに対して少なくとも７０％又は少なくとも８０％の配列同一性を有するＨＮＨドメインを含む、実施形態１３５～２０のいずれか一項に記載の核酸。
１３８．当該エンドヌクレアーゼが、配列番号５５７２～５５９１、又はそれに対して少なくとも７０％の配列同一性を有するそのバリアントを含む、実施形態１３５～１３７のいずれか一項に記載の核酸。
１３９．当該エンドヌクレアーゼが、当該エンドヌクレアーゼのＮ末端又はＣ末端に近接する１つ以上の核局在化配列（ＮＬＳ）をコードする配列を含む、実施形態１３５～１３８のいずれか一項に記載の核酸。
１４０．当該ＮＬＳが、配列番号５５９７～５６１２から選択される配列を含む、実施形態２１に記載の核酸。
１４１．当該生物が、原核生物、細菌、真核生物、真菌、植物、哺乳動物、げっ歯類、又はヒトである、実施形態１３５～２２のいずれか一項に記載の核酸。
１４２．当該生物が、大腸菌（Ｅ．ｃｏｌｉ）であり、
ａ）当該核酸配列が、配列番号５５７２～５５７５からなる群から選択される配列に対して、少なくとも７０％、８０％又は９０％の同一性を有し、
ｂ）当該核酸配列が、配列番号５５７６～５５７７からなる群から選択される配列に対して、少なくとも７０％、８０％又は９０％の同一性を有し、
ｃ）当該核酸配列が、配列番号５５７８～５５８０からなる群から選択される配列に対して、少なくとも７０％、８０％又は９０％の同一性を有し、
ｄ）当該核酸配列が、配列番号５５８１に対して、少なくとも７０％、８０％、又は９０％の同一性を有し、
ｅ）当該核酸配列が、配列番号５５８２に対して、少なくとも７０％、８０％、又は９０％の同一性を有し、
ｆ）当該核酸配列が、配列番号５５８３に対して、少なくとも７０％、８０％、又は９０％の同一性を有し、
ｇ）当該核酸配列が、配列番号５５８４に対して、少なくとも７０％、８０％、又は９０％の同一性を有し、
ｈ）当該核酸配列が、配列番号５５８５に対して、少なくとも７０％、８０％、又は９０％の同一性を有し、
ｉ）当該核酸配列が、配列番号５５８６に対して、少なくとも７０％、８０％、又は９０％の同一性を有し、又は
ｊ）当該核酸配列が、配列番号５５８７に対して、少なくとも７０％、８０％、又は９０％の同一性を有する、
実施形態２３に記載の核酸。
１４３．当該生物が、ヒトであり、
ａ）当該核酸配列が、配列番号５５８８又は配列番号５５８９に対して、少なくとも７０％、８０％、又は９０％の同一性を有し、又は
ｂ）当該核酸配列が、配列番号５５９０又は配列番号５５９１に対して、少なくとも７０％、８０％、又は９０％の同一性を有する、実施形態２３に記載の核酸。
１４４．ＲｕｖＣ＿ＩＩＩドメイン及びＨＮＨドメインを含むクラス２タイプＩＩＣａｓエンドヌクレアーゼをコードする核酸配列を含むベクターであって、当該エンドヌクレアーゼが、未培養微生物に由来する、ベクター。
１４５．実施形態１３５～１４３のいずれかの核酸を含む、ベクター。
１４６．当該エンドヌクレアーゼと複合体を形成するように構成された操作されたガイドリボ核酸構造をコードする核酸を更に含み、
ａ）標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列、及び
ｂ）当該エンドヌクレアーゼへと結合するように構成されたｔｒａｃｒリボ核酸配列と、
を含む、実施形態１４４～２４のいずれか一項に記載のベクター。
１４７．ベクターが、プラスミド、ミニサークル、ＣＥＬｉＤ、アデノ随伴ウイルス（ＡＡＶ）由来ビリオン、又はレンチウイルスである、実施形態１４４～２５のいずれか一項に記載のベクター。
１４８．実施形態１４４～２６のいずれか一項に記載のベクターを含む、細胞。
１４９．実施形態１４６に記載の当該細胞を培養することを含む、エンドヌクレアーゼを製造する方法。
１５０．二本鎖デオキシリボ核酸ポリヌクレオチドを結合、切断、マーキング、又は修飾するための方法であって、
（ａ）当該二本鎖デオキシリボ核酸ポリヌクレオチドを、クラス２タイプＩＩＣａｓエンドヌクレアーゼと、当該エンドヌクレアーゼ及び当該二本鎖デオキシリボ核酸ポリヌクレオチドへと結合するように構成された操作されたガイドリボ核酸構造との複合体において、接触させることと、
（ｂ）当該二本鎖デオキシリボ核酸ポリヌクレオチドが、プロトスペーサー隣接モチーフ（ＰＡＭ）を含み、
（ｃ）当該ＰＡＭが、配列番号５５１２～５５２６又は配列番号５５２７～５５３７からなる群から選択される配列を含む、方法。
１５１．当該二本鎖デオキシリボ核酸ポリヌクレオチドが、当該操作されたガイドリボ核酸構造の配列に相補的な配列を含む第１の鎖と、当該ＰＡＭを含む第２の鎖と、を含む、実施形態２８に記載の方法。
１５２．当該ＰＡＭが、当該操作されたガイドリボ核酸構造の当該配列に相補的な当該配列の３’末端に直接隣接している、実施形態３０に記載の方法。
１５３．当該クラス２タイプＩＩＣａｓエンドヌクレアーゼが、Ｃａｓ９エンドヌクレアーゼ、Ｃａｓ１４エンドヌクレアーゼ、Ｃａｓ１２ａエンドヌクレアーゼ、Ｃａｓ１２ｂエンドヌクレアーゼ、Ｃａｓ１２ｃエンドヌクレアーゼ、Ｃａｓ１２ｄエンドヌクレアーゼ、Ｃａｓ１２ｅエンドヌクレアーゼ、Ｃａｓ１３ａエンドヌクレアーゼ、Ｃａｓ１３ｂエンドヌクレアーゼ、Ｃａｓ１３ｃエンドヌクレアーゼ、又はＣａｓ１３ｄエンドヌクレアーゼではない、実施形態２８～３１のいずれか一項に記載の方法。
１５４．当該クラス２タイプＩＩＣａｓエンドヌクレアーゼが、未培養微生物に由来する、実施形態２８～３２のいずれか一項に記載の方法。
１５５．当該二本鎖デオキシリボ核酸ポリヌクレオチドが、真核生物、植物、真菌、哺乳動物、げっ歯類、又はヒトの二本鎖デオキシリボ核酸ポリヌクレオチドである、実施形態２８～１５４のいずれか一項に記載の方法。
１５６．
ａ）当該ＰＡＭが、配列番号５５１２～５５１５及び配列番号５５２７～５５３０からなる群から選択される配列を含み、
ｂ）当該ＰＡＭが、配列番号５５１６又は配列番号５５３１を含み、
ｃ）当該ＰＡＭが、配列番号５５３９を含み、
ｄ）当該ＰＡＭが、配列番号５５１７又は配列番号５５１８を含み、
ｅ）当該ＰＡＭが、配列番号５５１９を含み、
ｆ）当該ＰＡＭが、配列番号５５２０又は配列番号５５３５を含み、
ｇ）当該ＰＡＭが、配列番号５５２１又は配列番号５５３６を含み、
ｈ）当該ＰＡＭが、配列番号５５２２を含み、
ｉ）当該ＰＡＭが、配列番号５５２３又は配列番号５５３７を含み、
ｊ）当該ＰＡＭが、配列番号５５２４を含み、
ｋ）当該ＰＡＭが、配列番号５５２５を含み、
ｌ）当該ＰＡＭが、配列番号５５２６を含む、
実施形態２８～３３のいずれか一項に記載の方法。
１５７．標的核酸遺伝子座を修飾する方法であって、当該方法が、当該標的核酸遺伝子座へと、実施形態１～１６のいずれか一項に記載の当該操作されたヌクレアーゼシステムを送達することを含み、ここで、当該エンドヌクレアーゼは、当該操作されたガイドリボ核酸構造と複合体を形成するように構成され、当該複合体は、当該複合体が当該標的核酸遺伝子座へと結合する際に当該複合体が当該標的核酸遺伝子座を修飾するように構成される、方法。
１５８．当該標的核酸遺伝子座を修飾することが、当該標的核酸遺伝子座を結合、ニック形成、切断、又はマーキングすることを含む、実施形態３４に記載の方法。
１５９．当該標的核酸遺伝子座が、デオキシリボ核酸（ＤＮＡ）又はリボ核酸（ＲＮＡ）を含む、実施形態３４～３５のいずれか一項に記載の方法。
１６０．当該標的核酸が、ゲノムＤＮＡ、ウイルスＤＮＡ、ウイルスＲＮＡ、又は細菌ＤＮＡを含む、実施形態３６に記載の方法。
１６１．当該標的核酸遺伝子座が、インビトロである、実施形態３４～３７のいずれか一項に記載の方法。
１６２．当該標的核酸遺伝子座が、細胞内にある、実施形態３４～３７のいずれか一項に記載の方法。
１６３．当該細胞が、原核細胞、細菌細胞、真核細胞、真菌細胞、植物細胞、動物細胞、哺乳動物細胞、げっ歯類細胞、霊長類細胞、又はヒト細胞である、実施形態３９に記載の方法。
１６４．当該操作されたヌクレアーゼシステムを当該標的核酸遺伝子座に送達することが、実施形態１３５～２２のいずれかに記載の核酸、又は実施形態１４２～２５のいずれかに記載のベクターを送達することを含む、実施形態３９～４０のいずれか一項に記載の方法。
１６５．当該操作されたヌクレアーゼシステムを当該標的核酸遺伝子座へと送達することが、当該エンドヌクレアーゼをコードするオープンリーディングフレームを含む核酸を送達することを含む、実施形態３９～４０のいずれか一項に記載の方法。
１６６．当該核酸が、当該エンドヌクレアーゼをコードする当該オープンリーディングフレームが動作可能に連結されているプロモーターを含む、実施形態４１に記載の方法。
１６７．当該操作されたヌクレアーゼシステムを当該標的核酸遺伝子座へと送達することが、当該エンドヌクレアーゼをコードする当該オープンリーディングフレームを含有する、キャップｍＲＮＡを送達することを含む、実施形態３９～４０のいずれか一項に記載の方法。
１６８．当該操作されたヌクレアーゼシステムを当該標的核酸遺伝子座へと送達することが、翻訳されたポリペプチドを送達することを含む、実施形態３９～４０のいずれか一項に記載の方法。
１６９．当該操作されたヌクレアーゼシステムを当該標的核酸遺伝子座へと送達することが、リボ核酸（ＲＮＡ）ｐｏｌＩＩＩプロモーターへと動作可能に連結された当該操作されたガイドリボ核酸構造をコードするデオキシリボ核酸（ＤＮＡ）を送達することを含む、請求項３９～４０のいずれか一項に記載の方法。
１７０．当該エンドヌクレアーゼが、当該標的遺伝子座で、又は当該標的遺伝子座に近接して、一本鎖切断又は二本鎖切断を誘導する、実施形態３４～４６のいずれか一項に記載の方法。

本発明の好ましい実施形態を本明細書に示し説明してきたが、そのような実施形態が例としてのみ提供されることは当業者には明らかであろう。本発明は、本明細書内で提供される特定の例によって限定されることを意図しない。本発明を前述の明細書を参照して説明してきたが、本明細書の実施形態の説明及び例示は、限定的な意味で解釈されることを意味しない。当業者には、本発明から逸脱することなく、多数のバリエーション、変更、及び置換が思い浮かぶであろう。更に、本発明の全ての態様は、様々な条件及び変数に依存する本明細書に記載の特定の描写、構成、又は相対的な割合に限定されないことを理解されたい。本明細書に記載の本発明の実施形態に対する様々な代替形態が、本発明を実施する際に採用され得ることを理解するべきである。したがって、本発明は、任意のそのような代替形態、修正形態、変形形態、又は均等物もまた包含すると考えられる。以下の特許請求の範囲が本発明の範囲を定義し、これらの特許請求の範囲内の方法及び構造並びにそれらの均等物がそれによって包含されることが意図される。

Claims

操作されたヌクレアーゼシステムであって、
（ａ）配列番号５７１８～５８４６又は配列番号６２５７のいずれか１つに対して少なくとも７５％の配列同一性を有する配列を含むエンドヌクレアーゼ、並びに
（ｂ）前記エンドヌクレアーゼと複合体を形成するように構成された操作されたガイドリボ核酸構造であって、
（ｉ）標的デオキシリボ核酸配列にハイブリダイズするように構成されたリボ核酸配列、及び
（ｉｉ）前記エンドヌクレアーゼに結合するように構成されたリボ核酸配列を含む、操作されたガイドリボ核酸構造
を含む、操作されたヌクレアーゼシステム。
操作されたヌクレアーゼシステムであって、
（ａ）配列番号５８４７～５８６１又は配列番号６２５８～６２７８を含むプロトスペーサー隣接モチーフ（ＰＡＭ）配列に結合するように構成されたエンドヌクレアーゼであって、前記エンドヌクレアーゼがクラス２タイプＩＩＣａｓエンドヌクレアーゼである、エンドヌクレアーゼ、並びに
（ｂ）前記エンドヌクレアーゼと複合体を形成するように構成された操作されたガイドリボ核酸構造であって、
（ｉ）標的デオキシリボ核酸配列にハイブリダイズするように構成されたリボ核酸配列、及び
（ｉｉ）前記エンドヌクレアーゼに結合するように構成されたリボ核酸配列を含む、操作されたガイドリボ核酸構造
を含む、操作されたヌクレアーゼシステム。
前記エンドヌクレアーゼが、未培養微生物に由来する、請求項１又は２に記載の操作されたヌクレアーゼシステム。
前記エンドヌクレアーゼが、異なるＰＡＭ配列に結合するように操作されていない、請求項１～３のいずれか一項に記載の操作されたヌクレアーゼシステム。
前記エンドヌクレアーゼが、Ｃａｓ９エンドヌクレアーゼ、Ｃａｓ１４エンドヌクレアーゼ、Ｃａｓ１２ａエンドヌクレアーゼ、Ｃａｓ１２ｂエンドヌクレアーゼ、Ｃａｓ１２ｃエンドヌクレアーゼ、Ｃａｓ１２ｄエンドヌクレアーゼ、Ｃａｓ１２ｅエンドヌクレアーゼ、Ｃａｓ１３ａエンドヌクレアーゼ、Ｃａｓ１３ｂエンドヌクレアーゼ、Ｃａｓ１３ｃエンドヌクレアーゼ、又はＣａｓ１３ｄエンドヌクレアーゼではない、請求項１～４のいずれか一項に記載の操作されたヌクレアーゼシステム。
前記エンドヌクレアーゼが、Ｃａｓ９エンドヌクレアーゼに対して８０％未満の同一性を有する、請求項１～５のいずれか一項に記載の操作されたヌクレアーゼシステム。
前記リボ核酸配列が、（ａ）配列番号５８８６～５８８７、５８９１、５８９３、若しくは５８９４のいずれか１つ、又は（ｂ）配列番号５８６２～５８８５、５８８８～５８９０、５８９２、５８９５～５８９６、若しくは６２７９～６３０１のいずれか１つの非縮重ヌクレオチドに対して少なくとも８０％の配列同一性を有する配列を含む、請求項１～６のいずれか一項に記載の操作されたヌクレアーゼシステム。
操作されたヌクレアーゼシステムであって、
（ａ）操作されたガイドリボ核酸構造であって、
（ｉ）標的デオキシリボ核酸配列にハイブリダイズするように構成されたリボ核酸配列、及び
（ｉｉ）エンドヌクレアーゼに結合するように構成されたリボ核酸配列を含み、
ここで、前記リボ核酸配列が、（ａ）配列番号５８８６～５８８７、５８９１、５８９３、若しくは５８９４のいずれか１つ、又は（ｂ）配列番号５８６２～５８８５、５８８８～５８９０、５８９２、５８９５～５８９６又は６２７９～６３０１のいずれか１つの非縮重ヌクレオチドに対して少なくとも８０％の配列同一性を有する配列を含む、操作されたガイドリボ核酸構造、並びに
（ｂ）前記操作されたガイドリボ核酸に結合するように構成されたクラス２タイプＩＩＣａｓエンドヌクレアーゼ
を含む、操作されたヌクレアーゼシステム。
前記エンドヌクレアーゼが、配列番号５８４７～５８６１又は配列番号６２５８～６２７８を含む群から選択されるプロトスペーサー隣接モチーフ（ＰＡＭ）配列に結合するように構成されている、請求項８に記載の操作されたヌクレアーゼシステム。
前記ガイドリボ核酸配列が、１５～２４ヌクレオチド長又は１９～２４ヌクレオチド長である、請求項８～９のいずれか一項に記載の操作されたヌクレアーゼシステム。
前記エンドヌクレアーゼが、前記エンドヌクレアーゼのＮ末端又はＣ末端に近接した１つ以上の核局在化配列（ＮＬＳ）を含む、請求項１～１０のいずれか一項に記載の操作されたヌクレアーゼシステム。
前記ＮＬＳが、配列番号５５９７～５６１２から選択される配列を含む、請求項１～１１のいずれか一項に記載の操作されたヌクレアーゼシステム。
５’から３’の順に、前記標的デオキシリボ核酸配列に対して５’である少なくとも２０ヌクレオチドの配列を含む第１のホモロジーアーム、少なくとも１０ヌクレオチドの合成ＤＮＡ配列、及び前記標的配列に対して３’である少なくとも２０ヌクレオチドの配列を含む第２のホモロジーアームを含む、一本鎖又は二本鎖ＤＮＡ修復鋳型を更に含む、請求項１～１２のいずれか一項に記載の操作されたヌクレアーゼシステム。
前記第１のホモロジーアーム又は前記第２のホモロジーアームが、少なくとも４０、８０、１２０、１５０、２００、３００、５００、又は１，０００ヌクレオチドの配列を含む、請求項１３に記載の操作されたヌクレアーゼシステム。
前記配列同一性が、Ｓｍｉｔｈ－Ｗａｔｅｒｍａｎ相同性検索アルゴリズムのパラメータを用いて、ＢＬＡＳＴＰ、ＣＬＵＳＴＡＬＷ、ＭＵＳＣＬＥ、ＭＡＦＦＴ、又はＣＬＵＳＴＡＬＷによって決定される、請求項１～１４のいずれか一項に記載の操作されたヌクレアーゼシステム。
前記配列同一性が、３のワード長（Ｗ）、１０の期待値（Ｅ）のパラメータ、及び１１の存在、１の伸長でのＢＬＯＳＵＭ６２スコアリングマトリックス設定ギャップコストを用いて、並びに条件付き組成スコアマトリックス調整を用いて、前記ＢＬＡＳＴＰ相同性検索アルゴリズムによって決定される、請求項１５に記載の操作されたヌクレアーゼシステム。
操作されたガイドリボ核酸ポリヌクレオチドであって、
（ａ）標的ＤＮＡ分子中の標的配列に相補的であるヌクレオチド配列を含む、ＤＮＡ標的化セグメント、及び
（ｂ）ハイブリダイズして二本鎖ＲＮＡ（ｄｓＲＮＡ）二重鎖を形成するヌクレオチドの２つの相補的ストレッチを含む、タンパク質結合セグメントを含み、
ここで、前記ヌクレオチドの２つの相補的ストレッチは、介在するヌクレオチドを用いて互いに共有結合しており、
前記操作されたガイドリボ核酸ポリヌクレオチドは、配列番号５７１８～５８４６又は配列番号６２５７のいずれか１つに対して少なくとも７５％の配列同一性を有する配列を含むエンドヌクレアーゼと複合体を形成し、かつ前記複合体を前記標的ＤＮＡ分子の前記標的配列へと標的化するように構成される、
操作されたガイドリボ核酸ポリヌクレオチド。
前記ＤＮＡ標的化セグメントが、前記ヌクレオチドの２つの相補的なストレッチの両方の５’に位置する、請求項１７に記載の操作されたガイドリボ核酸ポリヌクレオチド。
請求項１７～１８のいずれか一項に記載の操作されたガイドリボ核酸ポリヌクレオチド又は構造をコードする、デオキシリボ核酸ポリヌクレオチド。
生物における発現のために最適化された、操作された核酸配列を含む核酸であって、前記核酸が、配列番号５７１８～５８４６又は配列番号６２５７のいずれか１つに対して少なくとも７５％の配列同一性を有する配列を含むエンドヌクレアーゼをコードする、核酸。
前記エンドヌクレアーゼが、前記エンドヌクレアーゼのＮ末端又はＣ末端に近接する１つ以上の核局在化配列（ＮＬＳ）をコードする配列を含む、請求項２０に記載の核酸。
前記ＮＬＳが、配列番号５５９７～５６１２から選択される配列を含む、請求項２１に記載の核酸。
前記生物が、原核生物、細菌、真核生物、真菌、植物、哺乳動物、げっ歯類、又はヒトである、請求項２０～２２のいずれか一項に記載の核酸。
請求項２０～２３のいずれか一項に記載の核酸を含む、ベクター。
（ａ）標的デオキシリボ核酸配列にハイブリダイズするように構成されたリボ核酸配列、及び
（ｂ）前記エンドヌクレアーゼに結合するように構成されたリボ核酸配列
を含む、前記エンドヌクレアーゼと複合体を形成するように構成された操作されたガイドリボ核酸構造をコードする核酸を更に含む、請求項２４に記載のベクター。
プラスミド、ミニサークル、ＣＥＬｉＤ、アデノ随伴ウイルス（ＡＡＶ）由来ビリオン、又はレンチウイルスである、請求項２４～２５のいずれか一項に記載のベクター。
請求項２４～２６のいずれか一項に記載のベクターを含む、細胞。
請求項２７に記載の細胞を培養することを含む、エンドヌクレアーゼを製造する方法。
二本鎖デオキシリボ核酸ポリヌクレオチドを結合、切断、マーキング、又は修飾するための方法であって、
前記二本鎖デオキシリボ核酸ポリヌクレオチドを、クラス２タイプＩＩＣａｓエンドヌクレアーゼと、前記エンドヌクレアーゼ及び前記二本鎖デオキシリボ核酸ポリヌクレオチドへと結合するように構成された操作されたガイドリボ核酸構造との複合体において接触させることを含み、
ここで、前記二本鎖デオキシリボ核酸ポリヌクレオチドは、プロトスペーサー隣接モチーフ（ＰＡＭ）を含み、並びに
前記ＰＡＭは、配列番号５８４７～５８６１又は配列番号６２５８～６２７８からなる群から選択される配列を含む、
方法。
前記二本鎖デオキシリボ核酸ポリヌクレオチドが、前記操作されたガイドリボ核酸構造の配列に相補的な配列を含む第１の鎖、及び前記ＰＡＭを含む第２の鎖を含む、請求項２９に記載の方法。
前記ＰＡＭが、前記操作されたガイドリボ核酸構造の前記配列に相補的な前記配列の３’末端に直接隣接している、請求項３０に記載の方法。
前記クラス２タイプＩＩＣａｓエンドヌクレアーゼが、Ｃａｓ９エンドヌクレアーゼ、Ｃａｓ１４エンドヌクレアーゼ、Ｃａｓ１２ａエンドヌクレアーゼ、Ｃａｓ１２ｂエンドヌクレアーゼ、Ｃａｓ１２ｃエンドヌクレアーゼ、Ｃａｓ１２ｄエンドヌクレアーゼ、Ｃａｓ１２ｅエンドヌクレアーゼ、Ｃａｓ１３ａエンドヌクレアーゼ、Ｃａｓ１３ｂエンドヌクレアーゼ、Ｃａｓ１３ｃエンドヌクレアーゼ、又はＣａｓ１３ｄエンドヌクレアーゼではない、請求項２９～３１のいずれか一項に記載の方法。
前記二本鎖デオキシリボ核酸ポリヌクレオチドが、真核生物、植物、真菌、哺乳動物、げっ歯類、又はヒトの二本鎖デオキシリボ核酸ポリヌクレオチドである、請求項２９～３２のいずれか一項に記載の方法。
標的核酸遺伝子座を修飾する方法であって、前記方法は、前記標的核酸遺伝子座へと、請求項１～１６のいずれか一項に記載の前記操作されたヌクレアーゼシステムを送達することを含み、ここで、前記エンドヌクレアーゼは、前記操作されたガイドリボ核酸構造と複合体を形成するように構成され、前記複合体は、前記複合体が前記標的核酸遺伝子座へと結合する際に前記複合体が前記標的核酸遺伝子座を修飾するように構成される、方法。
前記標的核酸遺伝子座を修飾することが、前記標的核酸遺伝子座を結合、ニック形成、切断、又はマーキングすることを含む、請求項３４に記載の方法。
前記標的核酸遺伝子座が、デオキシリボ核酸（ＤＮＡ）又はリボ核酸（ＲＮＡ）を含む、請求項３４～３５のいずれか一項に記載の方法。
前記標的核酸が、ゲノムＤＮＡ、ウイルスＤＮＡ、ウイルスＲＮＡ、又は細菌ＤＮＡを含む、請求項３６に記載の方法。
前記標的核酸遺伝子座がインビトロである、請求項３４～３７のいずれか一項に記載の方法。
前記標的核酸遺伝子座が細胞内にある、請求項３４～３７のいずれか一項に記載の方法。
前記細胞が、原核細胞、細菌細胞、真核細胞、真菌細胞、植物細胞、動物細胞、哺乳動物細胞、げっ歯類細胞、霊長類細胞、又はヒト細胞である、請求項３９に記載の方法。
前記操作されたヌクレアーゼシステムを前記標的核酸遺伝子座へと送達することが、請求項２０～２３のいずれか一項に記載の核酸、又は請求項２４～２６のいずれか一項に記載のベクターを送達することを含む、請求項３４～４０のいずれか一項に記載の方法。
前記操作されたヌクレアーゼシステムを前記標的核酸遺伝子座へと送達することが、前記エンドヌクレアーゼをコードするオープンリーディングフレームを含む核酸を送達することを含む、請求項３４～４０のいずれか一項に記載の方法。
前記核酸が、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームが動作可能に連結されたプロモーターを含む、請求項４１に記載の方法。
前記操作されたヌクレアーゼシステムを前記標的核酸遺伝子座へと送達することが、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含有する、キャップｍＲＮＡを送達することを含む、請求項３４～４１のいずれか一項に記載の方法。
前記操作されたヌクレアーゼシステムを前記標的核酸遺伝子座へと送達することが、翻訳されたポリペプチドを送達することを含む、請求項３４～４１のいずれか一項に記載の方法。
前記操作されたヌクレアーゼシステムを前記標的核酸遺伝子座へと送達することが、リボ核酸（ＲＮＡ）ｐｏｌＩＩＩプロモーターへと動作可能に連結された前記操作されたガイドリボ核酸構造をコードするデオキシリボ核酸（ＤＮＡ）を送達することを含む、請求項３４～４１のいずれか一項に記載の方法。
前記エンドヌクレアーゼが、前記標的遺伝子座で、又は前記標的遺伝子座に近接して、一本鎖分解（ｂｒｅａｋ）又は二本鎖分解を誘導する、請求項３４～４６のいずれか一項に記載の方法。
細胞内のＴＲＡＣ遺伝子座を編集する方法であって、前記細胞に、
（ａ）ＲＮＡガイドエンドヌクレアーゼ、及び
（ｂ）操作されたガイドＲＮＡであって、前記操作されたガイドＲＮＡが前記エンドヌクレアーゼと複合体を形成するように構成され、前記操作されたガイドＲＮＡが、前記ＴＲＡＣ遺伝子座の領域にハイブリダイズするように構成されたスペーサー配列を含む、操作されたガイドＲＮＡ
を接触させることを含み、
ここで、前記操作されたガイドＲＮＡは、配列番号５９５０～５９５８又は配列番号５９５９～５９６５のいずれか１つの少なくとも１８個の連続するヌクレオチドに対して少なくとも８５％の同一性を有する標的配列を含む、
方法。
前記ＲＮＡガイドエンドヌクレアーゼが、クラスＩＩタイプＩＩＣａｓエンドヌクレアーゼである、請求項４８に記載の方法。
前記ＲＮＡガイドエンドヌクレアーゼが、配列番号２２４２又は配列番号２２４４に対して少なくとも７５％の同一性を有する配列を含む、ＲｕｖＣＩＩＩドメインを含む、請求項４８又は請求項４９に記載の方法。
前記ＲＮＡガイドエンドヌクレアーゼが、ＨＮＨドメインを更に含む、請求項５０に記載の方法。
前記ＲＮＡガイドエンドヌクレアーゼが、配列番号４２１又は配列番号４２３に対して少なくとも７５％の同一性を有する配列を含む、請求項４８～５１のいずれか一項に記載の方法。
前記操作されたガイドＲＮＡが、配列番号５９５０～５９５８のいずれか１つの少なくとも１８個の連続するヌクレオチドに対して少なくとも８５％の同一性を有する標的配列を含み、前記エンドヌクレアーゼが、配列番号４２１に対して少なくとも７５％の同一性を有する配列を含む、請求項４８～５２のいずれか一項に記載の方法。
前記操作されたガイドＲＮＡが、配列番号５９５９～５９６５のいずれか１つの少なくとも１８個の連続するヌクレオチドに対して少なくとも８５％の同一性を有する標的配列を含み、前記エンドヌクレアーゼが、配列番号４２３に対して少なくとも７５％の同一性を有する配列を含む、請求項４８～５２のいずれか一項に記載の方法。
前記操作されたガイドＲＮＡが、配列番号５９５３～５９５７のいずれか１つの少なくとも１８個の連続するヌクレオチドに対して、少なくとも８５％の同一性を有する標的配列を含む、請求項４８～５２のいずれか一項に記載の方法。
前記操作されたガイドＲＮＡが、配列番号５９６０～５９６１又は配列番号５９６３～５９６４のいずれか１つの少なくとも１８個の連続するヌクレオチドに対して、少なくとも８５％の同一性を有する標的配列を含む、請求項４８～５２のいずれか一項に記載の方法。
細胞内のＴＲＢＣ遺伝子座を編集する方法であって、前記細胞に、
（ａ）ＲＮＡガイドエンドヌクレアーゼ、及び
（ｂ）操作されたガイドＲＮＡであって、前記操作されたガイドＲＮＡは前記エンドヌクレアーゼと複合体を形成するように構成され、前記操作されたガイドＲＮＡは、前記ＴＲＢＣ遺伝子座の領域にハイブリダイズするように構成されたスペーサー配列を含む、操作されたガイドＲＮＡ
を接触させることを含み、
ここで、前記操作されたガイドＲＮＡは、配列番号５９６６～６００４又は配列番号６００５～６０２５のいずれか１つの少なくとも１８個の連続するヌクレオチドに対して少なくとも８５％の同一性を有する標的配列を含む、
方法。
前記ＲＮＡガイドエンドヌクレアーゼが、クラスＩＩタイプＩＩＣａｓエンドヌクレアーゼである、請求項５７に記載の方法。
前記ＲＮＡガイドエンドヌクレアーゼが、配列番号２２４２又は配列番号２２４４に対して少なくとも７５％の同一性を有する配列を含む、ＲｕｖＣＩＩＩドメインを含む、請求項５７又は請求項５８に記載の方法。
前記ＲＮＡガイドエンドヌクレアーゼが、ＨＮＨドメインを更に含む、請求項５９に記載の方法。
前記ＲＮＡガイドエンドヌクレアーゼが、配列番号４２１又は配列番号４２３に対して少なくとも７５％の同一性を有する配列を含む、請求項５７～６０のいずれか一項に記載の方法。
前記操作されたガイドＲＮＡが、配列番号５９６６～６００４のいずれか１つの少なくとも１８個の連続するヌクレオチドに対して少なくとも８５％の同一性を有する標的配列を含み、前記エンドヌクレアーゼが、配列番号４２１に対して少なくとも７５％の同一性を有する配列を含む、請求項５７～６１のいずれか一項に記載の方法。
前記操作されたガイドＲＮＡが、配列番号６００５～６０２５のいずれか１つの少なくとも１８個の連続するヌクレオチドに対して少なくとも８５％の同一性を有する標的配列を含み、前記エンドヌクレアーゼが、配列番号４２３に対して少なくとも７５％の同一性を有する配列を含む、請求項５７～６１のいずれか一項に記載の方法。
前記操作されたガイドＲＮＡが、配列番号５９７０、５９７１、５９８３、又は５９８４のいずれか１つの少なくとも１８個の連続するヌクレオチドに対して、少なくとも８５％の同一性を有する標的配列を含む、請求項５７～６１のいずれか一項に記載の方法。
前記操作されたガイドＲＮＡが、配列番号６００６、６０１０、６０１１、又は６０１２のいずれか１つの少なくとも１８個の連続するヌクレオチドに対して、少なくとも８５％の同一性を有する標的配列を含む、請求項５７～６１のいずれか一項に記載の方法。
細胞内のＧＲ（ＮＲ３Ｃ１）遺伝子座を編集する方法であって、前記細胞に、
（ａ）ＲＮＡガイドエンドヌクレアーゼ、及び
（ｂ）操作されたガイドＲＮＡであって、前記操作されたガイドＲＮＡは前記エンドヌクレアーゼと複合体を形成するように構成され、前記操作されたガイドＲＮＡは、前記ＧＲ（ＮＲ３Ｃ１）遺伝子座の領域にハイブリダイズするように構成されたスペーサー配列を含む、操作されたガイドＲＮＡ
を接触させることを含み、
ここで、前記操作されたガイドＲＮＡは、配列番号６０２６～６０９０又は配列番号６０９１～６１２１のいずれか１つの少なくとも１８個の連続するヌクレオチドに対して少なくとも８５％の同一性を有する標的配列を含む、
方法。
前記ＲＮＡガイドエンドヌクレアーゼが、クラスＩＩタイプＩＩＣａｓエンドヌクレアーゼである、請求項６６に記載の方法。
前記ＲＮＡガイドエンドヌクレアーゼが、配列番号２２４２又は配列番号２２４４に対して少なくとも７５％の同一性を有する配列を含むＲｕｖＣＩＩＩドメインを含む、請求項６６又は請求項６７に記載の方法。
前記ＲＮＡガイドエンドヌクレアーゼが、ＨＮＨドメインを更に含む、請求項６８に記載の方法。
前記ＲＮＡガイドエンドヌクレアーゼが、配列番号４２１又は配列番号４２３に対して少なくとも７５％の同一性を有する配列を含む、請求項６６～６９のいずれか一項に記載の方法。
前記操作されたガイドＲＮＡが、配列番号６０２６～６０９０のいずれか１つの少なくとも１８個の連続するヌクレオチドに対して少なくとも８５％の同一性を有する標的配列を含み、前記エンドヌクレアーゼが、配列番号４２１に対して少なくとも７５％の同一性を有する配列を含む、請求項６６～７０のいずれか一項に記載の方法。
前記操作されたガイドＲＮＡが、配列番号６０９１～６１２１のいずれか１つの少なくとも１８個の連続するヌクレオチドに対して少なくとも８５％の同一性を有する標的配列を含み、前記エンドヌクレアーゼが、配列番号４２３に対して少なくとも７５％の同一性を有する配列を含む、請求項６６～７０のいずれか一項に記載の方法。
前記操作されたガイドＲＮＡが、配列番号６０２７～６０２８、６０２９、６０３８、６０４３、６０４９、６０７６、６０８０、６０８１、又は６０８６のいずれか１つの少なくとも１８個の連続するヌクレオチドに対して、少なくとも８５％の同一性を有する標的配列を含む、請求項６６～７０のいずれか一項に記載の方法。
前記操作されたガイドＲＮＡが、配列番号６０９２、６１１５、又は６１１９のいずれか１つの少なくとも１８個の連続するヌクレオチドに対して、少なくとも８５％の同一性を有する標的配列を含む、請求項６６～７０のいずれか一項に記載の方法。
細胞内のＡＡＶＳ１遺伝子座を編集する方法であって、前記細胞に、
（ａ）ＲＮＡガイドエンドヌクレアーゼ、及び
（ｂ）操作されたガイドＲＮＡであって、前記操作されたガイドＲＮＡが前記エンドヌクレアーゼと複合体を形成するように構成され、前記操作されたガイドＲＮＡが、前記ＡＡＶＳ１遺伝子座の領域にハイブリダイズするように構成されたスペーサー配列を含む、操作されたガイドＲＮＡ
を接触させることを含み、
ここで、前記操作されたガイドＲＮＡは、配列番号６１２２～６１５２のいずれか１つの少なくとも１８個の連続するヌクレオチドに対して少なくとも８５％の同一性を有する標的配列を含む、
方法。
前記ＲＮＡガイドエンドヌクレアーゼが、クラスＩＩタイプＩＩＣａｓエンドヌクレアーゼである、請求項７５に記載の方法。
前記ＲＮＡガイドエンドヌクレアーゼが、配列番号２２４２又は配列番号２２４４に対して少なくとも７５％の同一性を有する配列を含むＲｕｖＣＩＩＩドメインを含む、請求項７５又は請求項７６に記載の方法。
前記ＲＮＡガイドエンドヌクレアーゼが、ＨＮＨドメインを更に含む、請求項６８に記載の方法。
前記ＲＮＡガイドエンドヌクレアーゼが、配列番号４２１又は配列番号４２３に対して少なくとも７５％の同一性を有する配列を含む、請求項７５～７８のいずれか一項に記載の方法。
前記操作されたガイドＲＮＡが、配列番号６１２２、６１２５～６１２６、６１２８、６１３１、６１３３、６１３６、６１４１、６１４３、又は６１４８のいずれか１つの少なくとも１８個の連続するヌクレオチドに対して、少なくとも８５％の同一性を有する標的配列を含む、請求項７５～７９のいずれか一項に記載の方法。
細胞内のＴＩＧＩＴ遺伝子座を編集する方法であって、前記細胞に、
（ａ）ＲＮＡガイドエンドヌクレアーゼ、及び
（ｂ）操作されたガイドＲＮＡであって、前記操作されたガイドＲＮＡが前記エンドヌクレアーゼと複合体を形成するように構成され、前記操作されたガイドＲＮＡが、前記ＴＩＧＩＴ遺伝子座の領域にハイブリダイズするように構成されたスペーサー配列を含む、操作されたガイドＲＮＡ
を接触させることを含み、
ここで、前記操作されたガイドＲＮＡは、配列番号６１５３～６１８１のいずれか１つの少なくとも１８個の連続するヌクレオチドに対して少なくとも８５％の同一性を有する標的配列を含む、
方法。
前記ＲＮＡガイドエンドヌクレアーゼが、クラスＩＩタイプＩＩＣａｓエンドヌクレアーゼである、請求項８１に記載の方法。
前記ＲＮＡガイドエンドヌクレアーゼが、配列番号４２１又は配列番号４２３に対して少なくとも７５％の同一性を有する配列を含む、請求項８１又は請求項８２に記載の方法。
前記ＲＮＡガイドエンドヌクレアーゼが、配列番号２２４２又は配列番号２２４４に対して少なくとも７５％の同一性を有する配列を含むＲｕｖＣＩＩＩドメインを含む、請求項８１～８３のいずれか一項に記載の方法。
前記ＲＮＡガイドエンドヌクレアーゼが、ＨＮＨドメインを更に含む、請求項８４に記載の方法。
前記操作されたガイドＲＮＡが、配列番号６６１５５、６１５９、６１６、又は６１７２のいずれか１つの少なくとも１８個の連続するヌクレオチドに対して、少なくとも８５％の同一性を有する標的配列を含む、請求項８１～８５のいずれか一項に記載の方法。
細胞内のＣＤ３８遺伝子座を編集する方法であって、前記細胞に、
（ａ）ＲＮＡガイドエンドヌクレアーゼ、及び
（ｂ）操作されたガイドＲＮＡであって、前記操作されたガイドＲＮＡは前記エンドヌクレアーゼと複合体を形成するように構成され、前記操作されたガイドＲＮＡは、前記ＣＤ３８遺伝子座の領域にハイブリダイズするように構成されたスペーサー配列を含む、操作されたガイドＲＮＡと、
を接触させることを含み、
ここで、前記操作されたガイドＲＮＡは、配列番号６１８２～６２４８又は配列番号６２４９～６２５６のいずれか１つの少なくとも１８個の連続するヌクレオチドに対して少なくとも８５％の同一性を有する標的配列を含む、
方法。
前記ＲＮＡガイドエンドヌクレアーゼが、クラスＩＩタイプＩＩＣａｓエンドヌクレアーゼである、請求項８７に記載の方法。
前記ＲＮＡガイドエンドヌクレアーゼが、配列番号２２４２又は配列番号２２４４に対して少なくとも７５％の同一性を有する配列を含むＲｕｖＣＩＩＩドメインを含む、請求項８７又は請求項８８に記載の方法。
前記ＲＮＡガイドエンドヌクレアーゼが、ＨＮＨドメインを更に含む、請求項８９に記載の方法。
前記ＲＮＡガイドエンドヌクレアーゼが、配列番号４２１又は配列番号４２３に対して少なくとも７５％の同一性を有する配列を含む、請求項８７～９０のいずれか一項に記載の方法。
前記操作されたガイドＲＮＡが、配列番号６１８２～６２４８のいずれか１つの少なくとも１８個の連続するヌクレオチドに対して少なくとも８５％の同一性を有する標的配列を含み、前記エンドヌクレアーゼが、配列番号４２１に対して少なくとも７５％の同一性を有する配列を含む、請求項８７～９１のいずれか一項に記載の方法。
前記操作されたガイドＲＮＡが、配列番号６２４９～６２５６のいずれか１つの少なくとも１８個の連続するヌクレオチドに対して少なくとも８５％の同一性を有する標的配列を含み、前記エンドヌクレアーゼが、配列番号４２３に対して少なくとも７５％の同一性を有する配列を含む、請求項８７～９１のいずれか一項に記載の方法。
前記操作されたガイドＲＮＡが、配列番号６１８２～６１８３、６１８９、６１９１、６２０８、６２１０、６２１１、又は６２１５のいずれか１つの少なくとも１８個の連続するヌクレオチドに対して、少なくとも８５％の同一性を有する標的配列を含む、請求項８７～９１のいずれか一項に記載の方法。
前記操作されたガイドＲＮＡが、配列番号６２５１の少なくとも１８個の連続するヌクレオチドに対して、少なくとも８５％の同一性を有する標的配列を含む、請求項８７～９１のいずれか一項に記載の方法。
前記細胞が、末梢血単核細胞、Ｔ細胞、ＮＫ細胞、造血幹細胞（ＨＳＣＴ）、又はＢ細胞である、請求項４８～９５のいずれか一項に記載の方法。
操作されたガイドリボ核酸ポリヌクレオチドであって、
（ａ）標的ＤＮＡ分子中の標的配列に対して相補的であるヌクレオチド配列を含む、ＤＮＡ標的化セグメント、及び
（ｂ）ハイブリダイズして二本鎖ＲＮＡ（ｄｓＲＮＡ）二重鎖を形成するヌクレオチドの２つの相補的ストレッチを含む、タンパク質結合セグメント
を含み、
ここで、前記ヌクレオチドの２つの相補的ストレッチは、介在するヌクレオチドを用いて互いに共有結合しており、
前記操作されたガイドリボ核酸ポリヌクレオチドは、クラス２タイプＩＩＣａｓエンドヌクレアーゼと複合体を形成し、かつ前記複合体を前記標的ＤＮＡ分子の前記標的配列へと標的化するように構成され、前記ＤＮＡ標的化セグメントは、配列番号５９５０～５９６５、５９６６～６０２５、６０２６～６１２１、６１２２～６１５２、６１５３～６１８１、又は６１８２～６２５６のいずれか１つに対して少なくとも８５％の同一性を有する配列を含む、
操作されたガイドリボ核酸ポリヌクレオチド。
前記タンパク質結合セグメントが、配列番号５４６６又は配列番号６３０４のいずれか１つに対して少なくとも８５％の同一性を有する配列を含む、請求項９７に記載の操作されたガイドリボ核酸ポリヌクレオチド。
編集された免疫細胞を生成するためのシステムであって、
（ａ）ＲＮＡガイドエンドヌクレアーゼと、
（ｂ）前記ＲＮＡガイドエンドヌクレアーゼに結合するように構成された、請求項９７に記載の操作されたガイドリボ核酸ポリヌクレオチドと、
（ｃ）キメラ抗原受容体（ＣＡＲ）をコードする配列に隣接する第１のホモロジーアーム及び第２のホモロジーアームを含む、一本鎖又は二本鎖ＤＮＡ修復鋳型と、
を含む、システム。
前記細胞が、末梢血単核細胞、Ｔ細胞、ＮＫ細胞、造血幹細胞（ＨＳＣＴ）、又はＢ細胞である、請求項９９に記載のシステム。
前記ＲＮＡガイドエンドヌクレアーゼが、クラスＩＩタイプＩＩＣａｓエンドヌクレアーゼである、請求項９９又は１００に記載のシステム。
前記ＲＮＡガイドエンドヌクレアーゼが、配列番号２２４２又は配列番号２２４４に対して少なくとも７５％の同一性を有する配列を含むＲｕｖＣＩＩＩドメインを含む、請求項９９～１０１のいずれか一項に記載の方法。
前記ＲＮＡガイドエンドヌクレアーゼが、ＨＮＨドメインを更に含む、請求項１０２に記載の方法。
前記ＲＮＡガイドエンドヌクレアーゼが、配列番号４２１又は配列番号４２３に対して少なくとも７５％の同一性を有する配列を含む、請求項９９～１０３のいずれか一項に記載の方法。