JP2023517041A

JP2023517041A - クラスｉｉのｖ型ｃｒｉｓｐｒ系

Info

Publication number: JP2023517041A
Application number: JP2022553203A
Authority: JP
Inventors: トーマス，ブライアン; ブラウン，クリストファー; デヴォート，オードラ; バターフィールド，クリスティーナ; アレクサンダー，リサ; エス．エー．ゴルツマン，ダニエラ; アルバース，ジャスティン; ブルックス，アラン; コスト，グレッグ; テモーチェ－ディアス，モライマ; カステル，シンディ; ラモット，レベッカ
Original assignee: メタゲノミ，インコーポレイテッド
Priority date: 2020-03-06
Filing date: 2021-03-06
Publication date: 2023-04-21
Also published as: KR20240036729A; US20240093239A1; GB2603704B; CN116096876A; GB202219438D0; WO2021178933A3; GB2603704A; AU2021231074C1; US11713471B2; KR102647766B1; MX2022011039A; GB202205584D0; US20220290187A1; AU2021231074B2; EP4114932A4; WO2021178933A2; AU2024200614A1; GB2617658B; EP4114932A2; AU2021231074A1

Abstract

【解決手段】本明細書には、遺伝子編集に有用な、未培養の微生物に由来する方法、組成物および系が説明されている。【選択図】図４Ｂ

Description

相互参照
本願は、２０２０年３月６日に出願された「クラスＩＩのＶ型ＣＲＩＳＰＲ系」と題する米国仮出願第６２／９８６，４７７号、２０２０年５月８日に出願された「クラスＩＩのＶ型ＣＲＩＳＰＲ系」と題する米国仮出願第６３／０２２，２７６号、２０２０年６月２９日に出願された「クラスＩＩのＶ型ＣＲＩＳＰＲ系」と題する米国仮出願第６３／０４５，８１５号、２０２０年８月２０日に出願された「クラスＩＩのＶ型ＣＲＩＳＰＲ系」と題する米国仮出願第６３／０６８，３１６号、２０２０年８月２４日に出願された「クラスＩＩのＶ型ＣＲＩＳＰＲ系」と題する米国仮出願第６３／０６９，６９９号、２０２０年１１月１９日に出願された「クラスＩＩのＶ型ＣＲＩＳＰＲ系」と題する米国仮出願第６３／１１６，１５７号の恩典を主張するものであり、それらのそれぞれは、全体として参照により本明細書に組み込まれる。

クラスター化され規則的に間隔があいた、関連する短い回文構造の繰り返し（ＣＲＩＳＰＲ）ガイドリボ核酸（ＲＮＡ）に加えてＣａｓ酵素は、広く普及している原核生物免疫系の成分（約４５％が細菌、約８４％が古細菌）であり、ＣＲＩＳＰＲ－ＲＮＡによりガイドされた核酸切断によって、例えば感染性ウイルスおよびプラスミドといった非自己核酸からかかる微生物を保護するように機能していることが明らかになっている。ＣＲＩＳＰＲＲＮＡ要素をコードするデオキシリボ核酸（ＤＮＡ）要素は、構造および長さに関しては比較的保存されるものの、そのＣＲＩＳＰＲ関連（Ｃａｓ）タンパク質は非常に多様なものであり、広範な核酸相互作用ドメインを含有している。ＣＲＩＳＰＲＤＮＡ要素は１９８７年と早期に観察されていたものの、ＣＲＩＳＰＲ／Ｃａｓ複合体のプログラム可能なエンドヌクレアーゼ切断能は比較的最近になってやっと認識された。このことが多様なＤＮＡ操作および遺伝子編集用途における組換えＣＲＩＳＰＲ／Ｃａｓ系の使用につながった。

配列表
本出願は、ＡＳＣＩＩフォーマットで電子的に提出された配列表を含有しており、これは参照としてその全体が本明細書に組み込まれている。２０２１年３月５日に作成された当該ＡＳＣＩＩコピーの名称は５５９２１－７１０＿６０１＿ＳＬ．ｔｘｔであり、サイズは２，６１７ＫＢである。

いくつかの態様では、本開示は遺伝子操作されたヌクレアーゼ系を提供し、このヌクレアーゼ系は、（ａ）ＲｕｖＣドメインを含むエンドヌクレアーゼであって、該エンドヌクレアーゼが未培養の微生物に由来しており、かつＣａｓ１２ａエンドヌクレアーゼであるＲｕｖＣドメインを含むエンドヌクレアーゼと、（ｂ）遺伝子操作されたガイドＲＮＡであって、該エンドヌクレアーゼと複合体を形成するように構成され、標的核酸配列にハイブリダイズするように構成されたスペーサー配列を含む遺伝子操作されたガイドＲＮＡと、を含む。いくつかの実施形態では、Ｃａｓ１２ａエンドヌクレアーゼは、配列ＧＷｘｘｘＫを含む。いくつかの実施形態では、遺伝子操作されたガイドＲＮＡは、ＵＣＵＡＣ［Ｎ_３－５］ＧＵＡＧＡＵ（Ｎ_４）を含む。いくつかの実施形態では、遺伝子操作されたガイドＲＮＡは、ＣＣＵＧＣ［Ｎ_４］ＧＣＡＧＧ（Ｎ_３－４）を含む。いくつかの態様では、本開示は遺伝子操作されたヌクレアーゼ系を提供し、このヌクレアーゼ系は、（ａ）配列番号１～３４７０のうちいずれか１つに対して少なくとも７５％の配列同一性を有するエンドヌクレアーゼまたはそのバリアントと、（ｂ）遺伝子操作されたガイドＲＮＡであって、該エンドヌクレアーゼと複合体を形成するように構成され、標的核酸配列にハイブリダイズするように構成されたスペーサー配列を含む遺伝子操作されたガイドＲＮＡと、を含む。いくつかの実施形態では、エンドヌクレアーゼはＲｕｖＣＩ、ＩＩ、またはＩＩＩドメインを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号１～３４７０のうちいずれか１つのＲｕｖＣＩ、ＩＩまたはＩＩＩドメインまたはそのバリアントに対して少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％の同一性を有する。いくつかの実施形態では、ＲｕｖＣＩドメインはＤ触媒残基を含む。いくつかの実施形態では、ＲｕｖＣＩＩドメインはＥ触媒残基を含む。いくつかの実施形態では、ＲｕｖＣＩＩＩドメインはＤ触媒残基を含む。いくつかの実施形態では、当該ＲｕｖＣドメインはヌクレアーゼ活性を有しない。いくつかの実施形態では、当該エンドヌクレアーゼは、配列番号１～３４７０のうちいずれか１つのＷＥＤＩＩドメインまたはそのバリアントに対して少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％の配列同一性を有するＷＥＤＩＩドメインをさらに含む。いくつかの態様では、本開示は遺伝子操作されたヌクレアーゼ系を提供し、このヌクレアーゼ系は、（ａ）配列番号３８６２～３９１３ののうちいずれか１つを含むプロトスペーサー隣接モチーフ（ｐｒｏｔｏｓｐａｃｅｒａｄｊａｃｅｎｔｍｏｔｉｆ、ＰＡＭ）配列に結合するように構成されたエンドヌクレアーゼであって、クラス２のＶ型Ｃａｓエンドヌクレアーゼであるエンドヌクレアーゼと、（ｂ）遺伝子操作されたガイドＲＮＡであって、該エンドヌクレアーゼと複合体を形成するように構成され、標的核酸配列にハイブリダイズするように構成されたスペーサー配列を含む遺伝子操作されたガイドＲＮＡと、を含む。いくつかの実施形態では、エンドヌクレアーゼはジンクフィンガー様ドメインをさらに含む。いくつかの実施形態では、ガイドＲＮＡは、配列番号３４７１、３５５１～３５５９、３６０８～３６０９、３６１２、３６３６～３６３７、３６４０～３６４１、３６４４～３６４５、３６４８～３６４９、３６５２～３６５３、３６５６～３６５７、３６６０～３６６１、３６６４～３６６７、３６７１～３６７２、～３６７８、３６９５～３６９６、３７２９～３７３０、３７３４～３７３５および３８５１～３８５７のうちいずれか１つの非縮重ヌクレオチドに対して少なくとも８０％の配列同一性を有する配列を含む。いくつかの態様では、本開示は遺伝子操作されたヌクレアーゼ系を提供し、このヌクレアーゼ系は、（ａ）配列番号３４７１、３５３９、３５５１～３５５９、３６０８～３６０９、３６１２、３６３６～３６３７、３６４０～３６４１、３６４４～３６４５、３６４８～３６４９、３６５２～３６５３、３６５６～３６５７、３６６０～３６６１、３６６４～３６６７、３６７１～３６７２、３６７７～３６７８、３６９５～３６９６、３７２９～３７３０、３７３４～３７３５、または３８５１～３８５７のうちいずれか１つの非縮重ヌクレオチドに対して少なくとも８０％の配列同一性を有する配列を含む遺伝子操作されたガイドＲＮＡと、（ｂ）該遺伝子操作されたガイドＲＮＡに結合するように構成されたクラス２のＶ型Ｃａｓエンドヌクレアーゼと、を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号３８６３～３９１３のうちいずれか１つを含むプロトスペーサー隣接モチーフ（ＰＡＭ）配列に結合するように構成されている。いくつかの実施形態では、ガイドＲＮＡは、真核生物、真菌、植物、哺乳動物またはヒトゲノムのポリヌクレオチド配列に相補的な配列を含む。いくつかの実施形態では、ガイドＲＮＡは３０～２５０ヌクレオチド長である。いくつかの実施形態では、エンドヌクレアーゼは、該エンドヌクレアーゼのＮ末端またはＣ末端近位に１つ以上の核局在化配列（ｎｕｃｌｅａｒｌｏｃａｌｉｚａｔｉｏｎｓｅｑｕｅｎｃｅ、ＮＬＳ）を含む。いくつかの実施形態では、ＮＬＳは配列番号３９３８～３９５３からなる群からの配列に対して少なくとも８０％同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼの配列が配列番号２１５に対して最適にアラインメントされている場合には、エンドヌクレアーゼは以下の変異：Ｓ１６８Ｒ、Ｅ１７２Ｒ、Ｎ５７７Ｒ、またはＹ１７０Ｒのうち少なくとも１つを含む。いくつかの実施形態では、エンドヌクレアーゼの配列が配列番号２１５に対して最適にアラインメントされている場合には、エンドヌクレアーゼは変異Ｓ１６８ＲおよびＥ１７２Ｒを含む。いくつかの実施形態では、エンドヌクレアーゼの配列が配列番号２１５に対して最適にアラインメントされている場合には、エンドヌクレアーゼは変異Ｎ５７７ＲまたはＹ１７０Ｒを含む。いくつかの実施形態では、エンドヌクレアーゼの配列が配列番号２１５に対して最適にアラインメントされている場合には、エンドヌクレアーゼは変異Ｓ１６８Ｒを含む。いくつかの実施形態では、エンドヌクレアーゼはＥ１７２、Ｎ５７７またはＹ１７０の変異を含まない。いくつかの実施形態では、遺伝子操作されたヌクレアーゼ系は、

一本鎖または二本鎖ＤＮＡ修復テンプレートであって、５’～３’で、すなわち標的デオキシリボ核酸配列に対して５’で少なくとも２０ヌクレオチドの配列を含む第１のホモロジーアームと、少なくとも１０ヌクレオチドの合成ＤＮＡ配列と、標的配列に対して３’で少なくとも２０ヌクレオチドの配列を含む第２のホモロジーアームと、を含む。いくつかの実施形態では、第１のホモロジーアームまたは第２のホモロジーアームは、少なくとも４０、８０、１２０、１５０、２００、３００、５００、または１，０００ヌクレオチドの配列を含む。いくつかの実施形態では、第１のホモロジーアームまたは第２のホモロジーアームは、原核生物、細菌、真菌または真核生物のゲノム配列に相同である。いくつかの実施形態では、一本鎖または二本鎖ＤＮＡ修復テンプレートは導入遺伝子のドナーを含む。いくつかの実施形態では、遺伝子操作されたヌクレアーゼ系は、１つまたは２つの一本鎖ＤＮＡセグメントと隣接している二本鎖ＤＮＡセグメントを含むＤＮＡ修復テンプレートをさらに含む。いくつかの実施形態では、一本鎖ＤＮＡセグメントは二本鎖ＤＮＡセグメントの５’末端にコンジュゲートされている。いくつかの実施形態では、一本鎖ＤＮＡセグメントは二本鎖ＤＮＡセグメントの３’末端にコンジュゲートされている。いくつかの実施形態では、一本鎖ＤＮＡセグメントは４～１０ヌクレオチド塩基の長さを有する。いくつかの実施形態では、一本鎖ＤＮＡセグメントはスペーサー配列内の配列に相補的なヌクレオチド配列を有する。いくつかの実施形態では、二本鎖ＤＮＡ配列は、バーコード、オープンリーディングフレーム、エンハンサー、プロモーター、タンパク質コード配列、ｍｉＲＮＡコード配列、ＲＮＡコード配列、または導入遺伝子を含む。いくつかの実施形態では、二本鎖ＤＮＡ配列はヌクレアーゼ切断部位と隣接している。いくつかの実施形態では、ヌクレアーゼ切断部位はスペーサーおよびＰＡＭ配列を含む。いくつかの実施形態では、系はＭｇ^２＋源をさらに含む。いくつかの実施形態では、ガイドＲＮＡは少なくとも８、少なくとも１０、または少なくとも１２塩基対のリボヌクレオチドを含むヘアピンを含む。いくつかの実施形態では、ヘアピンは１０塩基対のリボヌクレオチドを含む。いくつかの実施形態では、（ａ）エンドヌクレアーゼは、配列番号１４１、２１５、２２９、２６１もしくは１７１１～１７２１のうちいずれか１つに対して少なくとも７５％、８０％もしくは９０％同一の配列、またはそのバリアントを含み、（ｂ）ガイドＲＮＡ構造は、配列番号３６０８～３６０９、３８５３、または３８５１～３８５７のうちいずれか１つの非縮重ヌクレオチドと少なくとも８０％または９０％同一の配列を含む。いくつかの実施形態では、エンドヌクレアーゼは配列番号３８６３～３９１３のうちいずれか１つを含むＰＡＭに結合するように構成されている。いくつかの実施形態では、エンドヌクレアーゼは配列番号３８７１を含むＰＡＭに結合するように構成されている。いくつかの実施形態では、配列同一性は、Ｓｍｉｔｈ－Ｗａｔｅｒｍａｎホモロジー検索アルゴリズムパラメータを用いるＢＬＡＳＴＰ、ＣＬＵＳＴＡＬＷ、ＭＵＳＣＬＥ、ＭＡＦＦＴアルゴリズム、またはＣＬＵＳＴＡＬＷアルゴリズムによって決定される。いくつかの実施形態では、配列同一性は、３のワード長（Ｗ）、１０の期待値（Ｅ）のパラメータ、および１１の存在、１の伸長でのギャップコストを設定しているＢＬＯＳＵＭ６２スコア行列を使用する、ならびに条件付き組合せスコア行列の調整を使用する、ＢＬＡＳＴＰホモロジー検索アルゴリズムによって決定される。

いくつかの態様では、本開示は遺伝子操作されたガイドＲＮＡを提供し、（ａ）標的ＤＮＡ分子中の標的配列に相補的であるヌクレオチド配列を含むＤＮＡ標的セグメントと、（ｂ）二本鎖ＲＮＡ（ｄｓＲＮＡ）二重鎖を形成するようにハイブリダイズするヌクレオチドの２つの相補的な並びを含むタンパク質結合セグメントと、を含み、ヌクレオチドの２つの相補的な並びが、介在性ヌクレオチドと互いに共有結合され、遺伝子操作されたガイドリボ核酸ポリヌクレオチドは、配列番号１～３４７０のうちいずれか１つに対して少なくとも７５％の配列同一性を有するエンドヌクレアーゼとの複合体の形成、および標的ＤＮＡ分子の標的配列への複合体の標的化、が可能である。いくつかの実施形態では、ＤＮＡ標的セグメントは、ヌクレオチドの２つの相補的な並びの両方の３’に位置づけられている。いくつかの実施形態では、タンパク質結合セグメントは、配列番号３６０８～３６０９の非縮重ヌクレオチドに対して少なくとも７０％、少なくとも８０％、または少なくとも９０％の同一性を有する配列を含む。いくつかの実施形態では、二本鎖ＲＮＡ（ｄｓＲＮＡ）二重鎖は、少なくとも５、少なくとも８、少なくとも１０、または少なくとも１２リボヌクレオチドを含む。

いくつかの態様では、本開示は、本明細書に説明されている遺伝子操作されたガイドリボ核酸ポリヌクレオチドをコードするデオキシリボ核酸ポリヌクレオチドを提供する。

いくつかの態様では、本開示は、生物での発現に最適化された遺伝子操作された核酸配列を含む核酸を提供する。この核酸は、クラス２のＶ型Ｃａｓエンドヌクレアーゼをコードしており、未培養の微生物に由来し、該生物は未培養の生物ではない。いくつかの実施形態では、エンドヌクレアーゼは、配列番号１～３４７０のうちいずれか１つに対して少なくとも７０％、または少なくとも８０％の配列同一性を有するバリアントを含む。いくつかの実施形態では、エンドヌクレアーゼは、該エンドヌクレアーゼのＮ末端またはＣ末端近位に１つ以上の核局在化配列（ＮＬＳ）をコードする配列を含む。いくつかの実施形態では、ＮＬＳは配列番号３９３８～３９５３から選択された配列を含む。いくつかの実施形態では、ＮＬＳは配列番号３９３９を含む。いくつかの実施形態では、ＮＬＳはエンドヌクレアーゼのＮ末端近位に存在する。いくつかの実施形態では、ＮＬＳは配列番号３９３８を含む。いくつかの実施形態では、ＮＬＳはエンドヌクレアーゼのＣ末端近位に存在する。いくつかの実施形態では、生物は原核生物、細菌、真核生物、真菌、植物、哺乳動物、げっ歯類、またはヒトである。

いくつかの態様では、本開示は、クラス２のＶ型ＣａｓエンドヌクレアーゼまたはＣａｓ１２ａエンドヌクレアーゼをコードする核酸配列を含む遺伝子操作されたベクターを提供する。該エンドヌクレアーゼは、未培養の微生物に由来する。

いくつかの態様では、本開示は、本明細書に説明されている核酸を含む遺伝子操作されたベクターを提供する。

いくつかの態様では、本開示は、本明細書に説明されているデオキシリボ核酸ポリヌクレオチドを含む遺伝子操作されたベクターを提供する。いくつかの実施形態では、ベクターはプラスミド、ミニサークル、ＣＥＬｉＤ、アデノ随伴ウイルス（ＡＡＶ）由来のウイルス粒子、レンチウイルス、またはアデノウイルスである。

いくつかの態様では、本開示は本明細書に説明されているベクターを含む細胞を提供する。

いくつかの態様では、本開示は本明細書に説明されている宿主細胞のうちいずれかを培養することを含む、エンドヌクレアーゼを製造する方法を提供する。

いくつかの態様では、本開示は、二本鎖デオキシリボ核酸ポリヌクレオチドを結合、切断、マーキングまたは修飾するための方法であって、（ａ）エンドヌクレアーゼおよび二本鎖デオキシリボ核酸ポリヌクレオチドに結合するように構成された遺伝子操作されたガイドＲＮＡを含む複合体中で、二本鎖デオキシリボ核酸ポリヌクレオチドとクラス２のＶ型Ｃａｓエンドヌクレアーゼとを接触させることを含み、（ｂ）該二本鎖デオキシリボ核酸ポリヌクレオチドがプロトスペーサー隣接モチーフ（ＰＡＭ）を含み、（ｃ）該ＰＡＭが配列番号３８６３～３９１３のうちいずれか１つを含む配列を含む。いくつかの実施形態では、二本鎖デオキシリボ核酸ポリヌクレオチドは、遺伝子操作されたガイドＲＮＡの配列に相補的な配列を含む第１の鎖と、ＰＡＭを含む第２の鎖と、を含む。いくつかの実施形態では、ＰＡＭは、遺伝子操作されたガイドＲＮＡの配列に相補的な配列の５’末端に直接隣接している。いくつかの実施形態では、ＰＡＭは配列番号３８７１を含む。いくつかの実施形態では、クラス２のＶ型Ｃａｓエンドヌクレアーゼは未培養の微生物に由来する。いくつかの実施形態では、二本鎖デオキシリボ核酸ポリヌクレオチドは、真核生物、植物、真菌、哺乳動物、げっ歯類、またはヒトの二本鎖デオキシリボ核酸ポリヌクレオチドである。いくつかの実施形態では、方法は、請求項［０００４］～０のうちいずれか一項に記載の遺伝子操作されたヌクレアーゼ系を標的核酸遺伝子座に送達することを含み、該エンドヌクレアーゼが遺伝子操作されたガイドリボ核酸構造と複合体を形成するように構成され、該複合体を標的核酸遺伝子座に結合する際に、複合体が標的核酸遺伝子座を修飾するように、複合体が構成されている。いくつかの実施形態では、標的核酸遺伝子座を修飾することは、標的核酸遺伝子座を結合、標的核酸遺伝子座に切れ目をいれる、標的核酸遺伝子座を切断、または標的核酸遺伝子座をマーキングすることを含む。いくつかの実施形態では、標的核酸遺伝子座はデオキシリボ核酸（ＤＮＡ）またはリボ核酸（ＲＮＡ）を含む。いくつかの実施形態では、標的核酸はゲノムＤＮＡ、ウイルスＤＮＡ、ウイルスＲＮＡ、または細菌性ＤＮＡを含む。いくつかの実施形態では、標的核酸遺伝子座はインビトロである。いくつかの実施形態では、標的核酸遺伝子座は細胞内である。いくつかの実施形態では、細胞は原核生物細胞、細菌細胞、真核生物細胞、真菌細胞、植物細胞、動物細胞、哺乳動物細胞、げっ歯類細胞、霊長類細胞、ヒト細胞、または初代細胞である。いくつかの実施形態では、細胞は初代細胞である。いくつかの実施形態では、初代細胞はＴ細胞である。いくつかの実施形態では、初代細胞は造血幹細胞（ｈｅｍａｔｏｐｏｉｅｔｉｃｓｔｅｍｃｅｌｌ、ＨＳＣ）である。いくつかの実施形態では、遺伝子操作されたヌクレアーゼ系を標的核酸遺伝子座に送達することは、請求項［０００７］～［０００８］のうちいずれか一項に記載の核酸、または請求項［０００８］～［００１１］のうちいずれか一項に記載のベクターを送達することを含む。いくつかの実施形態では、遺伝子操作されたヌクレアーゼ系を標的核酸遺伝子座に送達することは、エンドヌクレアーゼをコードするオープンリーディングフレームを含む核酸を送達することを含む。いくつかの実施形態では、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されているプロモーターを含む。いくつかの実施形態では、遺伝子操作されたヌクレアーゼ系を標的核酸遺伝子座に送達することは、エンドヌクレアーゼをコードするオープンリーディングフレームを含有するキャップされたｍＲＮＡを送達することを含む。いくつかの実施形態では、遺伝子操作されたヌクレアーゼ系を標的核酸遺伝子座に送達することは、翻訳されたポリペプチドを送達することを含む。いくつかの実施形態では、遺伝子操作されたヌクレアーゼ系を標的核酸遺伝子座に送達することは、リボ核酸（ＲＮＡ）ｐｏｌＩＩＩプロモーターに動作可能に連結された遺伝子操作されたガイドＲＮＡをコードするデオキシリボ核酸（ＤＮＡ）を送達することを含む。いくつかの実施形態では、エンドヌクレアーゼは、標的遺伝子座でまたは標的遺伝子座近傍で一本鎖切断または二本鎖切断を誘導する。いくつかの実施形態では、エンドヌクレアーゼは標的遺伝子座内で、または標的遺伝子座に対して３’でねじれ形の一本鎖切断を誘導する。

いくつかの態様では、本開示は、細胞のＴＲＡＣ遺伝子座を編集する方法を提供する。この方法は、（ａ）ＲＮＡガイドエンドヌクレアーゼ、および（ｂ）遺伝子操作されたガイドＲＮＡであって、遺伝子操作されたガイドＲＮＡが該エンドヌクレアーゼと複合体を形成するように構成され、遺伝子操作されたガイドＲＮＡが、ＴＲＡＣ遺伝子座の領域にハイブリダイズするように構成されたスペーサー配列を含む遺伝子操作されたガイドＲＮＡ、を細胞に接触させることを含み、遺伝子操作されたガイドＲＮＡが、配列番号４３１６～４３６９のうちいずれか１つの少なくとも１８連続するヌクレオチドと少なくとも８５％の同一性を有する標的化配列を含む。いくつかの実施形態では、ＲＮＡガイドヌクレアーゼはＣａｓエンドヌクレアーゼである。いくつかの実施形態では、Ｃａｓエンドヌクレアーゼはクラス２のＶ型Ｃａｓエンドヌクレアーゼである。いくつかの実施形態では、クラス２のＶ型Ｃａｓエンドヌクレアーゼは、ＲｕｖＣＩサブドメイン、ＲｕｖＣＩＩサブドメイン、およびＲｕｖＣＩＩＩサブドメインを含むＲｕｖＣドメインを含む。いくつかの実施形態では、クラス２のＶ型Ｃａｓエンドヌクレアーゼは、配列番号１～３４７０のうちいずれか１つに対して少なくとも７５％の配列同一性を有するエンドヌクレアーゼまたはそのバリアントを含む。いくつかの実施形態では、遺伝子操作されたガイドＲＮＡは、配列番号３４７１、３５３９、３５５１～３５５９、３６０８～３６０９、３６１２、３６３６～３６３７、３６４０～３６４１、３６４４～３６４５、３６４８～３６４９、３６５２～３６５３、３６５６～３６５７、３６６０～３６６１、３６６４～３６６７、３６７１～３６７２、３６７７～３６７８、３６９５～３６９６、３７２９～３７３０、３７３４～３７３５および３８５１～３８５７のうちいずれか１つの非縮重ヌクレオチドのうち少なくとも１９個に対して少なくとも８０％の配列同一性を有する配列をさらに含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号１４１、２１５、２２９、２６１または１７１１～１７２１のうちいずれか１つに対して少なくとも７５％、８０％または９０％同一である配列、またはそのバリアントを含む。いくつかの実施形態では、ガイドＲＮＡ構造は、配列番号３６０８～３６０９、３８５３、または３８５１～３８５７のうちいずれか１つの非縮重ヌクレオチドのうち少なくとも１９個に対して少なくとも８０％、または少なくとも９０％同一である配列を含む。いくつかの実施形態では、方法は、３’または５’末端上で、配列番号４４２４または４４２５のうちいずれか１つに対して少なくとも８０％の同一性を有する配列に隣接するカーゴ配列を含むドナー核酸を、細胞に接触させること、または細胞に導入することをさらに含む。いくつかの実施形態では、細胞は末梢血単核球（ｐｅｒｉｐｈｅｒａｌｂｌｏｏｄｍｏｎｏｎｕｃｌｅａｒｃｅｌｌ、ＰＢＭＣ）である。いくつかの実施形態では、細胞はＴ細胞、またはその前駆体、または造血幹細胞（ＨＳＣ）である。いくつかの実施形態では、カーゴ配列は、Ｔ細胞受容体ポリペプチド、ＣＡＲ－Ｔポリペプチド、またはそれらのフラグメントもしくはそれらの誘導体をコードする配列を含む。いくつかの実施形態では、遺伝子操作されたガイドＲＮＡは、配列番号４３７０～４４２３のうちいずれか１つに対して少なくとも８０％の同一性を有する配列を含む。いくつかの実施形態では、遺伝子操作されたガイドＲＮＡは、表５Ａに列挙された対応する化学修飾を含む、表５ＡからのｓｇＲＮＡ１～５４のヌクレオチド配列を含む。いくつかの実施形態では、遺伝子操作されたガイドＲＮＡは、配列番号４３３４、４３５０、または４３２４のうちいずれか１つに対して少なくとも８０％の配列同一性を有する標的化配列を含む。いくつかの実施形態では、遺伝子操作されたガイドＲＮＡは、配列番号４３８８、４４０４、または４３７８のうちいずれか１つに対して少なくとも８０％の配列同一性を有する配列を含む。いくつかの実施形態では、遺伝子操作されたガイドＲＮＡは、表５ＡからのｓｇＲＮＡ９、３５、または１９のヌクレオチド配列を含む。

いくつかの態様では、本開示は遺伝子操作されたヌクレアーゼ系を提供し、この系は、（ａ）ＲＮＡガイドエンドヌクレアーゼと、（ｂ）遺伝子操作されたガイドＲＮＡであって、遺伝子操作されたガイドＲＮＡは、エンドヌクレアーゼと複合体を形成するように構成され、標的核酸配列にハイブリダイズするように構成されたスペーサー配列を含む、遺伝子操作されたガイドＲＮＡと、を含み、以下の修飾：（ｉ）遺伝子操作されたガイドＲＮＡの５’末端の最初の４塩基または遺伝子操作されたガイドＲＮＡの３’末端の最後の４塩基内の少なくとも１つのヌクレオチドの２’－Ｏメチルまたは２’－フルオロ塩基修飾、（ｉｉ）遺伝子操作されたガイドＲＮＡの５’末端の最初の５塩基のうち少なくとも２つの間のチオリン酸（ＰＳ）結合、または遺伝子操作されたガイドＲＮＡの３’末端の最後の５塩基のうち少なくとも２つの間のチオリン酸結合、（ｉｉｉ）遺伝子操作されたガイドＲＮＡの３’ステムまたは５’ステム内のチオリン酸結合、（ｉｖ）遺伝子操作されたガイドＲＮＡの３’ステムまたは５’ステム内の２’－Ｏメチルまたは２’－フルオロ塩基修飾、（ｖ）遺伝子操作されたガイドＲＮＡのスペーサー領域の少なくとも７塩基の２’－フルオロ塩基修飾、および（ｖｉ）遺伝子操作されたガイドＲＮＡのループ領域内のチオリン酸結合、のうち少なくとも１つを含む。いくつかの実施形態では、遺伝子操作されたガイドＲＮＡは、遺伝子操作されたガイドＲＮＡの５’末端の最初の５塩基、または遺伝子操作されたガイドＲＮＡの３’末端の最後の５塩基内の少なくとも１つのヌクレオチドの２’－Ｏメチルまたは２’－フルオロ塩基修飾を含む。いくつかの実施形態では、遺伝子操作されたガイドＲＮＡは、遺伝子操作されたガイドＲＮＡの５’末端、または遺伝子操作されたガイドＲＮＡの３’末端に、２’－Ｏメチルまたは２’－フルオロ塩基修飾を含む。いくつかの実施形態では、遺伝子操作されたガイドＲＮＡは、遺伝子操作されたガイドＲＮＡの５’末端の最初の５塩基のうち少なくとも２つの間にチオリン酸（ＰＳ）結合、または遺伝子操作されたガイドＲＮＡの３’末端の最後の５塩基のうち少なくとも２つの間にチオリン酸結合を含む。いくつかの実施形態では、遺伝子操作されたガイドＲＮＡは、遺伝子操作されたガイドＲＮＡの３’ステムまたは５’ステム内にチオリン酸結合を含む。いくつかの実施形態では、遺伝子操作されたガイドＲＮＡは、遺伝子操作されたガイドＲＮＡの３’ステムまたは５’ステム内に２’－Ｏメチル塩基修飾を含む。いくつかの実施形態では、遺伝子操作されたガイドＲＮＡは、遺伝子操作されたガイドＲＮＡのスペーサー領域の少なくとも７塩基の２’－フルオロ塩基修飾を含む。いくつかの実施形態では、遺伝子操作されたガイドＲＮＡは、遺伝子操作されたガイドＲＮＡのループ領域内にチオリン酸結合を含む。いくつかの実施形態では、遺伝子操作されたガイドＲＮＡは、遺伝子操作されたガイドＲＮＡの５’末端に少なくとも３つの２’－Ｏメチルまたは２’－フルオロ塩基、遺伝子操作されたガイドＲＮＡの５’末端の最初の３塩基の間に２つのチオリン酸結合、遺伝子操作されたガイドＲＮＡの４’末端に少なくとも４つの２’－Ｏメチルまたは２’－フルオロ塩基、および遺伝子操作されたガイドＲＮＡの３’末端の最後の３塩基の間に３つのチオリン酸結合を含む。いくつかの実施形態では、遺伝子操作されたガイドＲＮＡは、遺伝子操作されたガイドＲＮＡの５’末端に少なくとも２つの２’－Ｏ－メチル塩基および少なくとも２つのチオリン酸結合、ならびに遺伝子操作されたガイドＲＮＡの３’末端に少なくとも１つの２’－Ｏ－メチル塩基および少なくとも１つのチオリン酸結合を含む。いくつかの実施形態では、遺伝子操作されたガイドＲＮＡは、遺伝子操作されたガイドＲＮＡの３’ステムまたは５’ステム領域の両方に少なくとも１つの２’－Ｏ－メチル塩基を含む。いくつかの実施形態では、遺伝子操作されたガイドＲＮＡは、遺伝子操作されたガイドＲＮＡのシード領域を除くスペーサー領域に、少なくとも１個～少なくとも１４個の２’－フルオロ塩基を含む。いくつかの実施形態では、遺伝子操作されたガイドＲＮＡは、遺伝子操作されたガイドＲＮＡの５’ステム領域に少なくとも１つの２’－Ｏ－メチル塩基、およびガイドＲＮＡのシード領域を除くスペーサー領域に、少なくとも１個～少なくとも１４個の２’－フルオロ塩基を含む。いくつかの実施形態では、ガイドＲＮＡは、ＶＥＧＦ－Ａ遺伝子を標的化するスペーサー配列を含む。いくつかの実施形態では、ガイドＲＮＡは、配列番号３９８５に対して少なくとも８０％の同一性を有するスペーサー配列を含む。いくつかの実施形態では、ガイドＲＮＡは、表７に列挙された化学修飾を含む、表７からのガイドＲＮＡ１～７のヌクレオチドを含む。いくつかの実施形態では、ＲＮＡガイドヌクレアーゼはＣａｓエンドヌクレアーゼである。いくつかの実施形態では、Ｃａｓエンドヌクレアーゼはクラス２のＶ型Ｃａｓエンドヌクレアーゼである。いくつかの実施形態では、クラス２のＶ型Ｃａｓエンドヌクレアーゼは、ＲｕｖＣＩサブドメイン、ＲｕｖＣＩＩサブドメイン、およびＲｕｖＣＩＩＩサブドメインを含むＲｕｖＣドメインを含む。いくつかの実施形態では、クラス２のＶ型Ｃａｓエンドヌクレアーゼは、配列番号１～３４７０のうちいずれか１つに対して少なくとも７５％の配列同一性を有するエンドヌクレアーゼまたはそのバリアントを含む。いくつかの実施形態では、クラス２のＶ型Ｃａｓエンドヌクレアーゼは、配列番号１４１、２１５、２２９、２６１または１７１１～１７２１のうちいずれか１つに対して少なくとも７５％の配列同一性を有するエンドヌクレアーゼ、またはそのバリアントを含む。いくつかの実施形態では、遺伝子操作されたガイドＲＮＡは、配列番号３４７１、３５３９、３５５１～３５５９、３６０８～３６０９、３６１２、３６３６～３６３７、３６４０～３６４１、３６４４～３６４５、３６４８～３６４９、３６５２～３６５３、３６５６～３６５７、３６６０～３６６１、３６６４～３６６７、３６７１～３６７２、３６７７～３６７８、３６９５～３６９６、３７２９～３７３０、３７３４～３７３５および３８５１～３８５７のうちいずれか１つの非縮重ヌクレオチドに対して少なくとも８０％の配列同一性を有する配列を含む。いくつかの実施形態では、遺伝子操作されたガイドＲＮＡは、配列番号３６０８～３６０９、３８５３、または３８５１～３８５７のうちいずれか１つの非縮重ヌクレオチドに対して少なくとも８０％の配列同一性を有する配列を含む。

いくつかの態様では、本開示は、配列番号１～３４７０のうちいずれか１つに対して少なくとも７５％の配列同一性を有する異種エンドヌクレアーゼ、またはそのバリアントをコードするオープンリーディングフレームを含む宿主細胞を提供する。いくつかの実施形態では、該エンドヌクレアーゼは、配列番号１４１、２１５、２２９、２６１または１７１１～１７２１のうちいずれか１つ、またはそのバリアントに対して少なくとも７５％の配列同一性を有する。いくつかの実施形態では、宿主細胞は、大腸菌細胞または哺乳動物細胞である。いくつかの実施形態では、宿主細胞は大腸菌細胞であり、大腸菌細胞はλＤＥ３溶原菌である、または大腸菌細胞はＢＬ２１（ＤＥ３）株である。いくつかの実施形態では、大腸菌細胞はｏｍｐＴｌｏｎ遺伝子型を有する。いくつかの実施形態では、オープンリーディングフレームは、Ｔ７プロモーター配列、Ｔ７－ｌａｃプロモーター配列、ｌａｃプロモーター配列、ｔａｃプロモーター配列、ｔｒｃプロモーター配列、ＰａｒａＢＡＤプロモーター配列、ＰｒｈａＢＡＤプロモーター配列、Ｔ５プロモーター配列、ｃｓｐＡプロモーター配列、ａｒａＰ_ＢＡＤプロモーター、ラムダファージ由来の強力な左方向プロモーター（ｐＬプロモーター）、またはそれらの任意の組合せに動作可能に連結される。いくつかの実施形態では、オープンリーディングフレームは、エンドヌクレアーゼをコードする配列に対してインフレームで連結されたアフィニティータグをコードする配列を含む。いくつかの実施形態では、アフィニティータグは固定化金属アフィニティークロマトグラフィー（ｉｍｍｏｂｉｌｉｚｅｄｍｅｔａｌａｆｆｉｎｉｔｙｃｈｒｏｍａｔｏｇｒａｐｈｙ、ＩＭＡＣ）タグである。いくつかの実施形態では、ＩＭＡＣタグはポリヒスチジンタグである。いくつかの実施形態では、アフィニティータグはｍｙｃタグ、ヒトインフルエンザ赤血球凝集素（ＨＡ）タグ、マルトース結合タンパク質（ｍａｌｔｏｓｅｂｉｎｄｉｎｇｐｒｏｔｅｉｎ、ＭＢＰ）タグ、グルタチオンＳ－転移酵素（ｇｌｕｔａｔｈｉｏｎｅＳ－ｔｒａｎｓｆｅｒａｓｅ、ＧＳＴ）タグ、ストレプトアビジンタグ、ＦＬＡＧタグ、またはそれらの任意の組合せである。いくつかの実施形態では、アフィニティータグは、プロテアーゼ切断部位をコードするリンカー配列を介してエンドヌクレアーゼをコードする配列にインフレームで連結されている。いくつかの実施形態では、プロテアーゼ切断部位は、タバコエッチウイルス（ｔｏｂａｃｃｏｅｔｃｈｖｉｒｕｓ、ＴＥＶ）プロテアーゼ切断部位、ＰｒｅＳｃｉｓｓｉｏｎ（登録商標）プロテアーゼ切断部位、トロンビン切断部位、血液凝固因子Ｘａ切断部位、エンテロキナーゼ切断部位、またはそれらの任意の組合せである。いくつかの実施形態では、オープンリーディングフレームは、宿主細胞での発現にコドン最適化されている。いくつかの実施形態では、オープンリーディングフレームはベクター上に設けられている。いくつかの実施形態では、オープンリーディングフレームは宿主細胞のゲノムに組み込まれている。

いくつかの態様では、本開示は、適合性のある液体培地中に本明細書に説明されている宿主細胞のうちいずれかを含む培養物を提供する。

いくつかの態様では、本開示は、適合性のある増殖培地中で本明細書に説明されている宿主細胞のうちいずれかを培養することを含む、エンドヌクレアーゼを産生する方法を提供する。いくつかの実施形態では、方法はエンドヌクレアーゼの発現を誘導することをさらに含む。いくつかの実施形態では、ヌクレアーゼの発現の誘導は、さらなる化学薬剤もしくは増量した栄養物を加えることによるもの、または温度上昇もしくは温度低下によるものである。いくつかの実施形態では、さらなる化学薬剤または増量した栄養物は、イソプロピルβ－Ｄ－１－チオガラクトピラノシド（ＩＰＴＧ）または追加量のラクトースを含む。いくつかの実施形態では、方法は、培養後に宿主細胞を単離し、該宿主細胞を溶解してタンパク質抽出物を製造することをさらに含む。いくつかの実施形態では、方法はエンドヌクレアーゼを単離することをさらに含む。いくつかの実施形態では、該単離は、タンパク質抽出物をＩＭＡＣ、イオン交換クロマトグラフィー、陰イオン交換クロマトグラフィー、または陽イオン交換クロマトグラフィーに供することを含む。いくつかの実施形態では、オープンリーディングフレームは、エンドヌクレアーゼをコードする配列に対してインフレームで連結されたアフィニティータグをコードする配列を含む。いくつかの実施形態では、アフィニティータグは、プロテアーゼ切断部位をコードするリンカー配列を介してエンドヌクレアーゼをコードする配列にインフレームで連結されている。いくつかの実施形態では、プロテアーゼ切断部位は、タバコエッチウイルス（ｔｏｂａｃｃｏｅｔｃｈｖｉｒｕｓ、ＴＥＶ）プロテアーゼ切断部位、ＰｒｅＳｃｉｓｓｉｏｎ（登録商標）プロテアーゼ切断部位、トロンビン切断部位、血液凝固因子Ｘａ切断部位、エンテロキナーゼ切断部位、またはそれらの任意の組合せを含む。いくつかの実施形態では、方法は、プロテアーゼ切断部位に対応するプロテアーゼをエンドヌクレアーゼに接触させることで、アフィニティータグを切断することをさらに含む。いくつかの実施形態では、アフィニティータグはＩＭＡＣアフィニティータグである。いくつかの実施形態では、方法は、サブトラクティブＩＭＡＣアフィニティークロマトグラフィーを実施し、エンドヌクレアーゼを含む組成物からアフィニティータグを除去することをさらに含む。

いくつかの態様では、本開示は、（ａ）３－ヌクレオチドＰＡＭ配列または４－ヌクレオチドＰＡＭ配列を結合するように構成されたクラス２のＶ－Ａ型Ｃａｓエンドヌクレアーゼであって、該エンドヌクレアーゼはｓＭｂＣａｓ１２ａに対する切断活性を増加している、クラス２のＶ－Ａ型Ｃａｓエンドヌクレアーゼと、（ｂ）遺伝子操作されたガイドＲＮＡであって、クラス２のＶ－Ａ型Ｃａｓエンドヌクレアーゼを含む複合体を形成するように構成され、標的核酸配列を含む標的核酸にハイブリダイズするように構成されたスペーサー配列を含む、遺伝子操作されたガイドＲＮＡと、を含む、系を提供する。いくつかの実施形態では、切断活性は、適合するガイドＲＮＡを加えたエンドヌクレアーゼを、標的核酸を含む細胞に導入することで、かつ細胞の標的核酸配列の切断を検出することで、インビトロで測定される。いくつかの実施形態では、クラス２のＶ－Ａ型Ｃａｓエンドヌクレアーゼは、２１５～２２５のうちいずれか１つに対して少なくとも７５％の配列同一性を有する配列、またはそのバリアントを含む。いくつかの実施形態では、遺伝子操作されたガイドＲＮＡは、配列番号３６０９の非縮重ヌクレオチドに対して少なくとも８０％の同一性を有する配列を含む。いくつかの実施形態では、標的核酸は、標的核酸配列近位のＹＹＮＰＡＭ配列をさらに含む。いくつかの実施形態では、クラス２のＶ－Ａ型Ｃａｓエンドヌクレアーゼは、ｓＭｂＣａｓ１２ａに対して少なくとも約５％、１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、１００％、または２００％、またはそれ以上増加した活性を有する。

いくつかの態様では、本開示は系を提供し、この系は、（ａ）クラス２のＶ－Ａ’型Ｃａｓエンドヌクレアーゼと、（ｂ）遺伝子操作されたガイドＲＮＡであって、クラス２のＶ型Ｃａｓエンドヌクレアーゼの天然エフェクターリピート配列の約１９～約２５、または約１９～約３１の連続ヌクレオチドに対して少なくとも８０％の同一性を有する配列を含む、遺伝子操作されたガイドＲＮＡを含む。いくつかの実施形態では、天然エフェクターリピート配列は配列番号３５６０～３５７２のうちいずれか１つである。いくつかの実施形態では、クラス２のＶ－Ａ’型Ｃａｓエンドヌクレアーゼは、配列番号１２６に対して少なくとも７５％の同一性を有する。

いくつかの態様では、本開示は系を提供し、この系は、（ａ）クラス２のＶ－Ｌ型エンドヌクレアーゼと、（ｂ）遺伝子操作されたガイドＲＮＡであって、クラス２のＶ型Ｃａｓエンドヌクレアーゼの天然エフェクターリピート配列の約１９～約２５、または約１９～約３１の連続ヌクレオチドに対して少なくとも８０％の同一性を有する配列を含む、遺伝子操作されたガイドＲＮＡを含む。いくつかの実施形態では、該クラス２のＶ－Ｌ型エンドヌクレアーゼは、配列番号７９３～１１６３のうちいずれか１つに対して少なくとも７５％の配列同一性を有する。

いくつかの態様では、本開示は、細胞のＶＥＧＦ－Ａ遺伝子座を破壊する方法を提供し、この方法は、（ａ）クラス２のＶ型Ｃａｓエンドヌクレアーゼと、（ｂ）遺伝子操作されたガイドＲＮＡであって、エンドヌクレアーゼと複合体を形成するように構成され、かつＶＥＧＦ－Ａ遺伝子座の領域にハイブリダイズするように構成されたスペーサー配列を含み、遺伝子操作されたガイドＲＮＡが配列番号３９８５に対して少なくとも８０％の同一性を有する標的化配列を含み、または遺伝子操作されたガイドＲＮＡが表７からのガイドＲＮＡ１～７のうちいずれか１つのヌクレオチド配列を含む、遺伝子操作されたガイドＲＮＡと、を細胞に導入することを含む。いくつかの実施形態では、クラス２のＶ型Ｃａｓエンドヌクレアーゼは、配列番号１～３４７０のうちいずれか１つに対して少なくとも７５％の配列同一性を有するエンドヌクレアーゼまたはそのバリアントを含む。いくつかの実施形態では、クラス２のＶ型Ｃａｓエンドヌクレアーゼは、配列番号１４１、２１５、２２９、２６１または１７１１～１７２１のうちいずれか１つに対して少なくとも７５％の配列同一性を有するエンドヌクレアーゼ、またはそのバリアントを含む。いくつかの実施形態では、遺伝子操作されたガイドＲＮＡは、配列番号３４７１、３５３９、３５５１～３５５９、３６０８～３６０９、３６１２、３６３６～３６３７、３６４０～３６４１、３６４４～３６４５、３６４８～３６４９、３６５２～３６５３、３６５６～３６５７、３６６０～３６６１、３６６４～３６６７、３６７１～３６７２、３６７７～３６７８、３６９５～３６９６、３７２９～３７３０、３７３４～３７３５および３８５１～３８５７のうちいずれか１つの非縮重ヌクレオチドに対して少なくとも８０％の配列同一性を有する配列を含む。いくつかの実施形態では、遺伝子操作されたガイドＲＮＡは、配列番号３６０８～３６０９、３８５３、または３８５１～３８５７のうちいずれか１つの非縮重ヌクレオチドに対して少なくとも８０％の配列同一性を有する配列を含む。

いくつかの態様では、本開示は細胞の遺伝子座を破壊する方法を提供し、この方法は、（ａ）配列番号２１５～２２５のうちいずれか１つに対して少なくとも７５％の同一性を有するクラス２のＶ型Ｃａｓエンドヌクレアーゼ、またはそのバリアントと、（ｂ）遺伝子操作されたガイドＲＮＡであって、エンドヌクレアーゼと複合体を形成するように構成され、該遺伝子座の領域にハイブリダイズするように構成されたスペーサー配列を含む、遺伝子操作されたガイドＲＮＡと、を含む組成物を細胞に接触させることを含み、クラス２のＶ型Ｃａｓエンドヌクレアーゼは、細胞のｓｐＣａｓ９に対して少なくとも同等の切断活性を有する。いくつかの実施形態では、切断活性は、適合するガイドＲＮＡを加えたエンドヌクレアーゼを、標的核酸を含む細胞に導入することで、かつ細胞の標的核酸配列の切断を検出することで、インビトロで測定される。いくつかの実施形態では、該組成物は、２０ｐｍｏｌ以下のクラス２のＶ型Ｃａｓエンドヌクレアーゼを含む。いくつかの実施形態では、該組成物は、１ｐｍｏｌ以下のクラス２のＶ型Ｃａｓエンドヌクレアーゼを含む。

本開示のさらなる態様および利点は、本開示の例示的な実施形態のみが示され、かつ説明されている以下の詳細な説明から、当業者には容易に明らかになるであろう。理解されるであろう通り、本開示は他の実施形態および異なる実施形態が可能であり、そのいくつかの詳細部分は、本開示から全て逸脱することなく、明白となっている様々な点での修飾が可能である。したがって、図面および説明は、本質的には例示であると見なされるべきであり、制限であると見なされるべきではない。

援用記載
本明細書で言及されている全ての刊行物、特許および特許出願は、それぞれ個別の刊行物、特許または特許出願が本明細書の一部として援用されると具体的かつ個別に示されていると仮定した上で、同程度で本明細書の一部として援用される。

本発明の新規特徴は、添付の特許請求の範囲に詳細に記載されている。本発明の特徴および利点の良好な理解は、本発明の原理が利用される例示的な実施形態を記載している以下の詳細な説明、および添付の図面を参照することによって得られるであろう。

本開示前に事前に説明された異なるクラスおよび型のＣＲＩＳＰＲ／Ｃａｓ遺伝子座の典型的な構成を示す。本明細書に説明されているＭＧヌクレアーゼの環境分布を示す。タンパク質長は、ＭＧ２９タンパク質ファミリーの代表例について示されている。影のある円は、各タンパク質を識別する環境または環境タイプを示す（深い灰色の円は高温の環境源を示し、明るい灰色の円は非高温の環境源を示す）。Ｎ／Ａは、試料が収集された環境の種類が未知であることを示している。本明細書に説明されている試料タイプから検出されたＭＧヌクレアーゼに存在する予想の触媒残基の数を表す（例えば、図２）。タンパク質長は、ＭＧ２９タンパク質ファミリーの代表例について示されている。各タンパク質に関して予想された触媒残基の数は、図表の説明に示されている（３．０残基）。第１の残基、第２の残基および第３の触媒残基は、それぞれＲｕｖＣＩドメイン、ＲｕｖＣＩＩドメインおよびＲｕｖＣＩＩＩドメイン中に配置されている。図４Ａは、ＣＲＩＳＰＲＶ－Ａ型エフェクターの多様性を示す。図４Ａは、新規Ｖ－Ａ型エフェクターをコードするコンティグの分類学的分類のファミリーあたりの分布を表す。図４Ｂは、ＣＲＩＳＰＲＶ－Ａ型エフェクターの多様性を示す。図４Ｂは、１１９個の新規および８９個の参照Ｖ型エフェクター配列のアラインメントから推測された系統学的遺伝子系譜を表す。ＭＧファミリーを括弧内に表す。活性ヌクレアーゼ向けのＰＡＭ要件は、ファミリーに関連するボックスで強調されている。非Ｖ－Ａ型参照配列は、木を根付かせるために使用された（＊ＭＧ６１ファミリーは、代替的なステムループ配列を有するｃｒＲＮＡを必要とする）。図５Ａは、本明細書に説明されているヌクレアーゼに関する様々な特性情報を提供する。図５Ａは、エフェクタータンパク質長および試料型のファミリーあたりの分布を表す。図５Ｂは、本明細書に説明されているヌクレアーゼに関する様々な特性情報を提供する。図５Ｂは、ＲｕｖＣ触媒残基の存在を示す。図５Ｃは、本明細書に説明されているヌクレアーゼに関する様々な特性情報を提供する。図５Ｃは、様々なリピートモチーフを有するＣＲＩＳＰＲアレイの数を示す。図５Ｄは、本明細書に説明されているヌクレアーゼに関する様々な特性情報を提供する。図５Ｄは、リピートモチーフのファミリーあたりの分布を表す。図６Ａは、Ｖ－Ａ型配列における触媒およびＰＡＭ相互作用領域の複数の配列アラインメントを表す。フランシセラ・ノビシダＣａｓ１２ａ（ＦｎＣａｓ１２）は参照配列である。他の参照配列は、アシダミノコッカス種（ＡｓＣａｓ１２ａ）、モラクセラ・ボーボクリ（ＭｂＣａｓ１２ａ）、およびラクノスピラ・バクテリウムＮＤ２００６（ＬｂＣａｓ１２ａ）である。図６Ａは、ＲｕｖＣ－Ｉ（左）、ＲｕｖＣ－ＩＩ（中間）およびＲｕｖＣ－ＩＩＩ（右）領域におけるＤＥＤ触媒残基周辺の保存のブロックを示す。図６Ｂは、Ｖ－Ａ型配列における触媒およびＰＡＭ相互作用領域の複数の配列アラインメントを表す。フランシセラ・ノビシダＣａｓ１２ａ（ＦｎＣａｓ１２）は参照配列である。他の参照配列は、アシダミノコッカス種（ＡｓＣａｓ１２ａ）、モラクセラ・ボーボクリ（ＭｂＣａｓ１２ａ）、およびラクノスピラ・バクテリウムＮＤ２００６（ＬｂＣａｓ１２ａ）である。図６Ｂは、ＰＡＭ認識および相互作用に関与する残基を含有するＷＥＤ－ＩＩおよびＰＡＭ相互作用領域を示す。ＦｎＣａｓ１２ａ配列のすぐ下の灰色のボックスは、ドメインを同定している。アラインメント中のより色の濃いボックスは、配列同一性の増加を示す。ＦｎＣａｓ１２ａ配列上の黒いボックスは、参照配列の触媒残基（および位置）を示す。灰色のボックスは、アラインメント（ＦｎＣａｓ１２ａ）の最上部の参照配列におけるドメインを示す。黒いボックスは、参照配列の触媒残基（および位置）を示す。図７Ａは、Ｖ－Ａ型およびこれに関連するＶ－Ａ’エフェクターを表す。図７Ａは、転写の方向を指し示す矢印により示されたＶ－Ａ型（ＭＧ２６－１）およびＶ－Ａ’（ＭＧ２６－２）を示す。ＣＲＩＳＰＲアレイは、灰色の線で示されている。コンティグ中の各タンパク質の予測ドメインはボックスにより示されている。図７Ｂは、Ｖ－Ａ型およびこれに関連するＶ－Ａ’エフェクターを表す。図７Ｂは、Ｖ－Ａ’型ＭＧ２６－２およびＡｓＣａｓ１２ａ参照配列の配列アラインメントを示す。最上部：ＲｕｖＣ－Ｉドメイン。中央：ＲｕｖＣ－ＩおよびＲｕｖＣ－ＩＩ触媒残基を含有する領域。最下部：ＲｕｖＣ－ＩＩＩ触媒残基を含有する領域。触媒残基は四角で示されている。ＡａｃＣ２Ｃ１を有する三元複合体中のｓｇＲＮＡおよび標的ＤＮＡの構造の概略図を表す（Ｙａｎｇ，Ｈｕｉ，ＰｕＧａｏ，ＫａｎａｇａｌａｇｈａｔｔａＲ．Ｒａｊａｓｈａｎｋａｒ，ａｎｄＤｉｎｓｈａｗＪ．Ｐａｔｅｌ．２０１６．’’ＰＡＭ－ＤｅｐｅｎｄｅｎｔＴａｒｇｅｔＤＮＡＲｅｃｏｇｎｉｔｉｏｎａｎｄＣｌｅａｖａｇｅｂｙＣ２ｃ１ＣＲＩＳＰＲ－ＣａｓＥｎｄｏｎｕｃｌｅａｓｅ．’’Ｃｅｌｌ１６７（７）：１８１４－２８．ｅ１２を参照されたい。これは、その全体が参照により本明細書に組み込まれている）。直線状プラスミドＤＮＡ、ＷＴ、野生型ｓｇＲＮＡのＡａｃＣ２ｃ１－介在性切断におけるｓｇＲＮＡのＲ－ＡＲドメインの変異または短縮化の効果を表す。ｓｇＲＮＡ内の変異体ヌクレオチド（レーン１～５）は、左パネル中で強調されている。Δ１５：１５ｎｔは、ｓｇＲＮＡのＲ－ＡＲ１領域から欠失した。Δ１２：１２ｎｔは、ｓｇＲＮＡＪ２／４Ｒ－ＡＲ１領域から除去されている（Ｌｉｕ，Ｌｉａｎｇ，ＰｅｎｇＣｈｅｎ，ＭｉｎＷａｎｇ，ＸｕｅｙａｎＬｉ，ＪｉｕｙｕＷａｎｇ，ＭａｏｌｕＹｉｎ，ａｎｄＹａｎｌｉＷａｎｇ．２０１７．’’Ｃ２ｃ１－ｓｇＲＮＡＣｏｍｐｌｅｘＳｔｒｕｃｔｕｒｅＲｅｖｅａｌｓＲＮＡ－ＧｕｉｄｅｄＤＮＡＣｌｅａｖａｇｅＭｅｃｈａｎｉｓｍ．’’ ＭｏｌｅｃｕｌａｒＣｅｌｌ６５（２）：３１０－２２を参照されたい。これは、その全体が参照により本明細書に組み込まれている）。図１０Ａは、ＣＲＩＳＰＲＲＮＡ（ｃｒＲＮＡ）構造がＶ－Ａ型系間で保存されていることを表す。図１０Ａは、ＬｂＣｐｆ１系における参照ｃｒＲＮＡ配列の折り畳み構造を示す。図１０Ｂは、ＣＲＩＳＰＲＲＮＡ（ｃｒＲＮＡ）構造がＶ－Ａ型系間で保存されていることを表す。図１０Ｂは、新規Ｖ－Ａ型系に関連するＣＲＩＳＰＲリピートの複数の配列アラインメントを示す。ＬｂＣｐｆ１プロセシング部位は、黒色の線で示されている。図１０Ｃは、ＣＲＩＳＰＲＲＮＡ（ｃｒＲＮＡ）構造がＶ－Ａ型系間で保存されていることを表す。図１０Ｃは、代替的なステムループモチーフＣＣＵＧＣ［Ｎ_３－４］ＧＣＡＧＧを有するＭＧ６１－２推定ｃｒＲＮＡの折り畳み構造を示す。図１０Ｄは、ＣＲＩＳＰＲＲＮＡ（ｃｒＲＮＡ）構造がＶ－Ａ型系間で保存されていることを表す。図１０Ｄは、代替的なリピートモチーフ配列を有するＣＲＩＳＰＲリピートの複数の配列アラインメントを示す。プロセシング部位およびループが示されている。本明細書で使用されているガイドＲＮＡ（配列番号３６０８）の予測構造を表す。本明細書に説明されているＭＧ酵素の対応するｓｇＲＮＡ（時計回りに、配列番号３６３６、３６３７、３６４１、３６４０）の予測構造を表す。本明細書に説明されているＭＧ酵素の対応するｓｇＲＮＡ（時計回りに、配列番号３６３６、３６３７、３６４１、３６４０）の予測構造を表す。本明細書に説明されているＭＧ酵素の対応するｓｇＲＮＡ（時計回りに、配列番号３６４４、３６４５、３６４９、３６４８）の予測構造を表す。本明細書に説明されているＭＧ酵素の対応するｓｇＲＮＡ（時計回りに、配列番号３６４４、３６４５、３６４９、３６４８）の予測構造を表す。本明細書に説明されているＭＧ酵素の対応するｓｇＲＮＡ（時計回りに、配列番号３６５２、３６５３、３６５７、３６５６）の予測構造を表す。本明細書に説明されているＭＧ酵素の対応するｓｇＲＮＡ（時計回りに、配列番号３６５２、３６５３、３６５７、３６５６）の予測構造を表す。本明細書に説明されているＭＧ酵素の対応するｓｇＲＮＡ（時計回りに、配列番号３６６０、３６６１、３６６５、３６６４）の予測構造を表す。本明細書に説明されているＭＧ酵素の対応するｓｇＲＮＡ（時計回りに、配列番号３６６０、３６６１、３６６５、３６６４）の予測構造を表す。本明細書に説明されているＭＧ酵素の対応するｓｇＲＮＡ（時計回りに、配列番号３６６６、３６６７、３６７２、３６７１）の予測構造を表す。本明細書に説明されているＭＧ酵素の対応するｓｇＲＮＡ（時計回りに、配列番号３６６６、３６６７、３６７２、３６７１）の予測構造を表す。図１７Ａは、様々なＭＧファミリーヌクレアーゼおよびそれらの対応するｔｒａｃｒＲＮＡまたはｓｇＲＮＡ（実施例１２で説明される）を含有するＴＸＴＬ抽出物が存在した状態での、ＰＡＭベクターライブラリー切断の結果を示すアガロースゲルを表す。図１７Ａは、レーン１：ラダーを示す。バンドは、頂部から底部にかけて７６６、５００、３５０、３００、３５０、２００、１５０、１００、７５、５０であり、レーン２：２８－１＋ＭＧｃｒＲＮＡスペーサー１（配列番号１４１＋３８６０）、レーン３：２９－１＋ＭＧｃｒＲＮＡスペーサー１（配列番号２１５＋３８６０）、レーン４：３０－１＋ＭＧｃｒＲＮＡスペーサー１（配列番号２２６＋３８６０）、レーン５：３１－１＋ＭＧｃｒＲＮＡスペーサー１（配列番号２２９＋３８６０）、レーン６：３２－１＋ＭＧｃｒＲＮＡスペーサー１（配列番号２６１＋３８６０）、レーン７：ラダーである。図１７Ｂは、様々なＭＧファミリーヌクレアーゼおよびそれらの対応するｔｒａｃｒＲＮ図ＡまたはｓｇＲＮＡ（実施例１２で説明される）を含有するＴＸＴＬ抽出物が存在した状態での、ＰＡＭベクターライブラリー切断の結果を示すアガロースゲルを表す。図１７Ｂは、レーン１：ラダー、レーン２：ＬｂａＣａｓ１２ａ＋ＬｂａＣａｓ１２ａｃｒＲＮＡスペーサー２、レーン３：ＬｂａＣａｓ１２ａ＋ＭＧｃｒＲＮＡスペーサー２、レーン４：Ａｐｏ１３－１、レーン５：２８－１＋ＭＧｃｒＲＮＡスペーサー２（配列番号１４１＋３８６１）、レーン６：２９－１＋ＭＧｃｒＲＮＡスペーサー２（配列番号２１５＋３８６１）、レーン７：３０－１＋ＭＧｃｒＲＮＡスペーサー２（配列番号２２６＋３８６１）、レーン８：３１－１＋ＭＧｃｒＲＮＡスペーサー２（配列番号２２９＋３８６１）、レーン９：３２－１＋ＭＧｃｒＲＮＡスペーサー２（配列番号２６１＋３８６１）を示す。図１８Ａ１は、本明細書に説明されているＶ－Ａ型エフェクターが活性ヌクレアーゼであることを示している。図１８Ａ１は、本明細書に説明されている６ヌクレアーゼに関して決定されたＰＡＭ配列のｓｅｑＬｏｇｏを表示する。図１８Ａ２は、本明細書に説明されているＶ－Ａ型エフェクターが活性ヌクレアーゼであることを示している。図１８Ａ２は、本明細書に説明されている６ヌクレアーゼに関して決定されたＰＡＭ配列のｓｅｑＬｏｇｏを表示する。図１８Ｂは、本明細書に説明されているＶ－Ａ型エフェクターが活性ヌクレアーゼであることを示している。図１８Ｂは、活性ヌクレアーゼに関する挿入欠失編集の頻度から推測されたプラスミドトランスフェクション活性アッセイの箱ひげ図を表す。箱ひげ図の境界は、第１の四分位値および第３の四分位値を示す。平均値は「ｘ」で示され、中央値は各箱内の中間線で表されている。図１８Ｃは、本明細書に説明されているＶ－Ａ型エフェクターが活性ヌクレアーゼであることを示している。図１８Ｃは、ＭＧ２９－１およびＡｓＣａｓ１２ａの４個の標的部位でのプラスミドトランスフェクション編集頻度を示す。ＡｓＣａｓ１２ａを用いて比較実験を１つ行った。図１８Ｄは、本明細書に説明されているＶ－Ａ型エフェクターが活性ヌクレアーゼであることを示している。図１８Ｄは、ＴＴＮまたはＣＣＮＰＡＭのうちいずれかを用いて１４個の標的遺伝子座でのヌクレアーゼＭＧ２９－１に関するプラスミドおよびＲＮＰ編集活性を示す。図１８Ｅは、本明細書に説明されているＶ－Ａ型エフェクターが活性ヌクレアーゼであることを示している。図１８Ｅは、ＲＮＰトランスフェクションアッセイからのヌクレアーゼＭＧ２９－１の編集プロファイルを示す。ＡｓＣａｓ１２ａを用いて比較実験を１つ行った。ＭＧ２９－１に関する編集頻度およびプロファイル実験を２回反復して行った。線プロット（図１８Ｃおよび図１８Ｄ）は、標準偏差誤差線を１箇所有する平均編集頻度を示す。ヒトゲノムの様々な位置を標的化する様々な異なる標的化配列を含有する対応するｓｇＲＮＡとともに、実施例１２で説明されているＭＧ２９－１コンストラクトを用いたＨＥＫ細胞のトランスフェクションにより生じた細胞における挿入欠失形成について表す。本明細書に説明されている（実施例１３に説明されている）ＮＧＳによって誘導された特異的なＭＧファミリー酵素のＰＡＭ配列のｓｅｑＬｏｇｏを表示する。本明細書に説明されているＮＧＳによって誘導された特異的なＭＧファミリー酵素のＰＡＭ配列のｓｅｑＬｏｇｏを表示する（頂部～底部、配列番号３８６５、３８６７、３８７２）。本明細書に説明されているＮＧＳによって誘導されたＰＡＭ配列のｓｅｑＬｏｇｏを表示する（頂部～底部、配列番号３８７８、３８７９、３８８０、３８８１）。本明細書に説明されているＮＧＳによって誘導されたＰＡＭ配列のｓｅｑＬｏｇｏを表示する（頂部～底部、配列番号３８８３、３８８４、３８８５）。本明細書に説明されているＮＧＳによって誘導されたＰＡＭ配列のｓｅｑＬｏｇｏを表示する（配列番号３８８２）。ヒトゲノムの様々な位置を標的化する様々な異なる標的化配列を含有する対応するｓｇＲＮＡとともに、実施例１４で説明されているＭＧ３１－１コンストラクトを用いたＨＥＫ細胞のトランスフェクションにより生じた細胞における挿入欠失形成を表す。図２６ＡはＶ－Ａ型ヌクレアーゼの生化学的特徴を示す。図２６Ａは、ユニバーサルｃｒＲＮＡに結合した場合、切断産物末端に結合されたアダプタを有する切断産物のＰＣＲが、本明細書に説明されているヌクレアーゼとＣｐｆ１（ポジティブコントロール）の活性を示していることを示す。予測された切断産物バンドは矢印で標識した。図２６Ｂは、Ｖ－Ａ型ヌクレアーゼの生化学的特徴を示す。図２６Ｂは、天然ｃｒＲＮＡに結合した場合、本明細書に説明されているヌクレアーゼの活性を示している、切断産物の末端に結合されたアダプタを有する切断産物のＰＣＲを示す。切断産物バンドは矢印で示した。図２６Ｃは、Ｖ－Ａ型ヌクレアーゼの生化学的特徴を示す。図２６Ｃは、２１または２３ｎｔ後では切断の頻度がそれほど高くない、位置２２の標的鎖における切断を示しているＮＧＳ切断部位の解析を示す。図２７Ａは、本明細書に説明されているＶ－Ｌ型ヌクレアーゼの複数の配列アラインメントを表し、図２７Ａは、Ｖ－Ｌ型ヌクレアーゼに関する例示的な位置構成を示す。推定ＲｕｖＣ－ＩＩＩドメインを含有する領域は、薄灰色の長方形として示されている。推定ＲｕｖＣ触媒残基は、各配列上に小さな濃灰色の長方形として示されている。推定シングルガイドＲＮＡ結合配列は小さな白色長方形であり、切断可能な推定リン酸結合部位は、配列上の黒色長方形で示されており、標的配列中の切断可能なリン酸近傍の塩基スタッキングを破壊すると予想されている残基は、配列上の小さな中程度の灰色長方形で示されている。図２７Ｂは、本明細書に説明されているＶ－Ｌ型ヌクレアーゼの複数の配列アラインメントを表す。図２７Ｂは、複数の配列アラインメントを示す。推定ＲｕｖＣ－ＩＩＩドメインを含有する領域は、薄灰色の長方形として示されている。推定ＲｕｖＣ触媒残基は、各配列上に小さな濃灰色の長方形として示されている。推定シングルガイドＲＮＡ結合配列は小さな白色長方形であり、切断可能な推定リン酸結合部位は、配列上の黒色長方形で示されており、標的配列中の切断可能なリン酸近傍の塩基スタッキングを破壊すると予想されている残基は、配列上の小さな中程度の灰色長方形で示されている。エフェクターリピート構造とともに例示的な位置構成としてＭＧ６０を標識しているＶ－Ｌ型候補と、Ｖ型ファミリー中の酵素の位置を示している系統学的系譜を示す。ＭＧ７０と標識され得る、より小さなＶ型エフェクターの例を示す。本明細書に説明されているＭＧ７０の特性情報を示す。Ｖ型ファミリーの酵素の位置を示す系統学的系譜とともに例示的な位置構成を表す。本明細書に説明されているＭＧ７０の特性情報を示す。Ｖ型ファミリーの酵素の位置を示す系統学的系譜とともに例示的な位置構成を表す。本明細書に説明されている小さなＶ型エフェクターＭＧ８１の別の例を示す。Ｖ型ファミリーの酵素の位置を示す系統学的系譜とともに例示的な位置構成を表す。本明細書に説明されている小さなＶ型エフェクターＭＧ８１の別の例を示す。Ｖ型ファミリーの酵素の位置を示す系統学的系譜とともに例示的な位置構成を表す。本明細書に同定されているＶ型エフェクターファミリー（例えば、ＭＧ２０、ＭＧ６０、ＭＧ７０、その他）の個々の酵素の活性は、様々な異なる酵素長（例えば、４００～１２００ＡＡ）にわたり維持されている。薄色のドット（典型的）は活性酵素を示しているが、濃い色のドット（未知）は未試験酵素を示している。本明細書に説明されているＭＧヌクレアーゼの配列保存を表す。黒線は、推定ＲｕｖＣ触媒残基を示している。推定ＲｕｖＣ触媒残基（濃灰色の長方形）、切断可能なリン酸結合残基（黒色の長方形）、および切断可能なリン酸に隣接する塩基スタッキングを破壊すると予想されている残基（薄灰色の長方形）を含有する、本明細書に説明されているＭＧヌクレアーゼの領域の図３３における複数の配列アラインメントの拡大版を表す。推定ＲｕｖＣ触媒残基（濃灰色の長方形）、切断可能なリン酸結合残基（黒色の長方形）、および切断可能なリン酸に隣接する塩基スタッキングを破壊すると予測されている残基（薄灰色の長方形）を含有する、本明細書に説明されているＭＧヌクレアーゼの領域の図３３における複数の配列アラインメントの拡大版を表す。推定ＲｕｖＣ－ＩＩＩドメインおよび触媒残基を含有する、本明細書に説明されているＭＧヌクレアーゼの領域を表す。推定シングルガイドＲＮＡ結合残基（配列上の白色の長方形）を含油するＭＧヌクレアーゼの領域を表す。いくつかのＭＧＶ型ファミリーからの代表物の複数のタンパク質配列アラインメントを表す。ヌクレアーゼ活性に関与すると予想されるＲｕｖＣドメイン部分を含有する保存領域を示す。予想される触媒残基を強調している。ＭＧ２９－１遺伝子編集についてＴＲＡＣ遺伝子座の検査を示す。棒グラフは、初代ヒトＴ細胞のＴＲＡＣ遺伝子座を標的化する５４個の別個のガイドＲＮＡを用いてＭＧ２９－１をトランスフェクションすることで得られる挿入欠失の作成を示す。図中に表されている対応するガイドＲＮＡは、配列番号４３１６～４４２３で同定されている。ＴＲＡＣでのＭＧ２９－１編集の最適化を表す。棒グラフは、図３９からの４つの最良な２２ｎｔのガイドＲＮＡ（９、１９、２５および３５）でＭＧ２９－１を（示された濃度で）トランスフェクションすることで得られた挿入欠失の作成を示す。説明文：ＭＧ２９－１９はＭＧ２９－１エフェクター（配列番号２１５）およびガイド９（配列番号４３７８）であり、ＭＧ２９－１１９はＭＧ２９－１エフェクター（配列番号２１５）およびガイド１９（配列番号４３８８）であり、ＭＧ２９－１２５はＭＧ２９－１エフェクター（配列番号２１５）およびガイド２５（配列番号４３９４）であり、ＭＧ２９－１３５はＭＧ２９－１エフェクター（配列番号２１５）およびガイド３５（配列番号４４０４）である。ＴＲＡＣでのＭＧ２９－１編集のための用量およびガイド長の最適化を表す。線グラフは、ＭＧ２９－１およびガイドＲＮＡ＃１９（配列番号４３８８）またはガイドＲＮＡ＃３５（配列番号４４０４）のいずれかのトランスフェクションから得られた挿入欠失の作成を示す。３つの異なる用量のヌクレアーゼ／ガイドＲＮＡが使用された。各用量に関して、６つの異なるガイド長、配列番号４３８８および４４０４の連続する１－ヌクレオチド３’短縮化を試験した。図３９および図４０で使用されたガイドは、この場合、２２ｎｔの長さのスペーサーを含有するガイドである。ＴＲＡＣでの挿入欠失の生成と実施例２２の実験におけるＴ細胞受容体発現の損失の相関関係を示す。ＭＧ２９－１切断により刺激されたＴＲＡＣでの標的化された導入遺伝子の組込みを表す。ＡＡＶ感染により導入遺伝子のドナーのみを受容した細胞は、ＴＣＲ発現は維持したがＣＡＲ発現は欠損する。ＭＧ２９－１ＲＮＰでトランスフェクトされ、１００，０００ｖｇ（ベクターゲノム）のＣＡＲ導入遺伝子のドナーで感染した細胞は、ＴＣＲ発現を失ったがＣＡＲ発現を得る。ＣＡＲ－Ｔ含有ドナー配列（「ＡＡＶ」）を含有するＡＡＶのみ、ＭＧ２９－１酵素およびｓｇＲＮＡ１９を有するＣＡＲ－Ｔ含有ドナー配列（配列番号４３８８）を含有するＡＡＶ（２２ヌクレオチドのスペーサーを含む「ＡＡＶ＋ＭＧ２９－１－１９－２２」）、またはＭＧ２９－１酵素およびｓｇＲＮＡ３５を有するＣＡＲ－Ｔ含有ドナー配列（配列番号４４０４）を含有するＡＡＶ（２２ヌクレオチドのスペーサーを含む「ＡＡＶ＋ＭＧ２９－１－３５－２２」）を用いてトランスフェクトされた細胞についてのＣＡＲ抗原結合対ＴＣＲ発現のＦＡＣＳプロットを示す。造血幹細胞におけるＴＲＡＣでのＭＧ２９－１遺伝子編集を示す。棒グラフは、モックトランスフェクトされた細胞と比較した、ＭＧ２９－１－９－２２（「ＭＧ２９－１９」、ＭＧ２９－１＋ガイドＲＮＡ＃１９）およびＭＧ２９－１－３５－２２（「ＭＧ２９－１３５」、ＭＧ２９－１＋ガイドＲＮＡ＃３５）を用いたトランスフェクション後のＴＲＡＣでの挿入欠失の作成の程度を示す。細胞における遺伝子編集結果の解析に基づくＭＧ２９－１ＰＡＭの改良を示す。５’－ＮＴＴＮ－３’ ＰＡＭ配列を使用してガイドＲＮＡを設計し、続いて得られた遺伝子編集活性に従って分類した。下線を引いた塩基（５’－近位Ｎ）の同一性を各区間に関して示す。１０％を超える活性を有する全てのガイドはゲノムＤＮＡのこの位置にＴを有した。このことは、ＭＧ２９－１ＰＡＭが５’－ＴＴＴＮ－３’として最良に説明され得ることを示している。各区間に関して、この位置でのＴの過剰な表面の統計学的有意性を示す。ＭＧ２９－１スペーサー配列の塩基組成に対する遺伝子編集活性の解析を表す。棒グラフは、ＧＣ含有量（％）と挿入欠失頻度との関係性を示す実験データを示す（「高」は５０％超の挿入欠失（Ｎ＝４）を意味し、「中間」は１０～５０％の挿入欠失（Ｎ＝１５）を意味し、「１％超」は１～５％の挿入欠失（Ｎ＝１２）を意味し、「１％未満」は１％未満の挿入欠失（Ｎ＝８２）を意味する）。ＭＧ２９－１スペーサー配列の塩基組成に対する遺伝子編集活性の解析を表す。棒グラフは、ＧＣ含有量（％）と挿入欠失頻度との関係性を示す実験データを示す（「高」は５０％超の挿入欠失（Ｎ＝４）を意味し、「中間」は１０～５０％の挿入欠失（Ｎ＝１５）を意味し、「１％超」は１～５％の挿入欠失（Ｎ＝１２）を意味し、「１％未満」は１％未満の挿入欠失（Ｎ＝８２）を意味する）。ＭＧ２９－１ガイドＲＮＡの化学修飾を表す。棒グラフは、非修飾ガイドＲＮＡ（試料＃１）に対するＶＥＧＦ－Ａ編集活性に関する、表７からの修飾の結果を示す。様々に化学修飾したＭＧ２９－１ＲＮＡの用量滴定を表す。棒グラフは、修飾パターン１、４、５、７および８を使用したガイドでＲＮＰをトランスフェクションした後の挿入欠失の生成を示す。ＲＮＰ用量は、１２６ｐｍｏｌのＭＧ２９－１および１６０ｐｍｏｌのガイドＲＮＡまたは示した通りであった。総用量（Ａ）、１／４（Ｂ）、１／８（Ｃ）、１／１６（Ｄ）および１／３２（Ｅ）。様々に化学修飾したＭＧ２９－１ＲＮＡの用量滴定を表す。棒グラフは、修飾パターン１、４、５、７および８を使用したガイドでＲＮＰをトランスフェクションした後の挿入欠失の生成を示す。ＲＮＰ用量は、１２６ｐｍｏｌのＭＧ２９－１および１６０ｐｍｏｌのガイドＲＮＡまたは示した通りであった。総用量（Ａ）、１／４（Ｂ）、１／８（Ｃ）、１／１６（Ｄ）および１／３２（Ｅ）。ｐＭＧ４５０のプラスミドマップ（ｌａｃ誘導性ｔａｃプロモーター大腸菌ＢＬ２１発現ベクターにおけるＭＧ２９－１ヌクレアーゼタンパク質）を表す。マウスのアルブミンイントロン１を標的化するガイドを有するｓｐＣａｓ９と比較した場合の、スペーサーｍＡｌｂ２９－１－８（配列番号３９９９）を有するＭＧ２９－１の挿入欠失プロファイルを表す。実施例２９にあるように、次世代シーケンシング（解析されたおよそ１５，０００の総リード）により決定されたマウスのアルブミンイントロン１を標的化するガイドを有するＭＧ２９－１の代表的な挿入欠失プロファイルである。実施例２９にあるように、次世代シーケンシング（解析されたおよそ１５，０００の総リード）により決定されたマウスのアルブミンイントロン１を標的化するガイドを有するＭＧ２９－１の代表的な挿入欠失プロファイルである。実施例２９にあるように、ＲＮＰで核内遺伝子導入されたマウス肝細胞株Ｈｅｐａ１～６中のｓｐＣａｓ９と比較した場合の、ＭＧ２９－１の編集効率を示す。図５３Ａは、野生型ＭＧ２９－１と比較した場合、単一アミノ酸置換および二重アミノ酸置換を有するＭＧ２９－１バリアントの哺乳動物細胞における編集効率を示す。図５３Ａは、ＭＧ２９－１ＷＴまたは変異体バージョンについて分類しているプラスミドでトランスフェクトされたＨｅｐａ１～６細胞における編集効率を表す。図５３Ｂは、野生型ＭＧ２９－１と比較した場合、単一アミノ酸置換および二重アミノ酸置換を有するＭＧ２９－１バリアントの哺乳動物細胞における編集効率を示す。図５３Ｂは、様々な濃度でＷＴまたはＳ１６８ＲをコードするｍＲＮＡでトランスフェクトされたＨｅｐａ１～６細胞における編集効率を表す。図５３Ｃは、野生型ＭＧ２９－１と比較した場合、単一アミノ酸置換および二重アミノ酸置換を有するＭＧ２９－１バリアントの哺乳動物細胞における編集効率を示す。図５３Ｃは、単一アミノ酸置換または二重アミノ酸置換を有するＭＧ２９－１のｍＲＮＡ分類バージョンでトランスフェクトされたＨｅｐａ１～６細胞における編集効率を表す。図５３Ｄは、野生型ＭＧ２９－１と比較した場合、単一アミノ酸置換および二重アミノ酸置換を有するＭＧ２９－１バリアントの哺乳動物細胞における編集効率を示す。図５３Ｄは、１３個のガイドと組み合わせたＳ１６８Ｒに対し、ＭＧ２９－１ＷＴでトランスフェクトされたＨｅｐａ１～６細胞およびＨＥＫ２９３Ｔ細胞における編集効率を表す。１２個のガイドは、表７のガイドに対応している。ガイド「３５（ＴＲＡＣ）」は、ヒトＴＲＡＣ遺伝子座を標的化するガイドである。ＭＧ２９－１ガイドｍＡｌｂ２９－１－８の予想された二次構造を示す。哺乳動物細胞の細胞抽出物全体中のｓｇＲＮＡの安定性に関するＭＧ２９－１ｓｇＲＮＡ配列の化学修飾の影響を示す。図５６Ａは、ＭＧ２９－１タンパク質、ガイドＲＮＡおよび適切なテンプレートで実施されたインビトロ反応における、標的鎖上の切断部位を同定するシーケンシングの使用を示す。図５６Ａは、次世代シーケンシングで決定されるヌクレオチド中のＰＡＭから切断位置の距離を示す。図５６Ｂは、ＭＧ２９－１タンパク質、ガイドＲＮＡおよび適切なテンプレートで実施されたインビトロ反応における、標的鎖上の切断部位を同定するシーケンシングの使用を示す。図５６Ｂは、標的鎖上のＭＧ２９－１切断部位を定義するためのサンガー法シーケンシングの使用を示す。図５６Ｃは、ＭＧ２９－１タンパク質、ガイドＲＮＡおよび適切なテンプレートで実施されたインビトロ反応における、標的鎖上の切断部位を同定するシーケンシングの使用を示す。図５６Ｃは、非ターゲット鎖上のＭＧ２９－１切断部位を定義するためのサンガー法シーケンシングの使用を示す。両方の鎖の切断を評価するため、ＭＧ２９－１、ガイドおよび適切なテンプレートを含有するインビトロ反応に転写産物サンガー法シーケンシングを実施した。標的鎖上の切断部位は位置２３であり、２１～２３塩基での切断を示している図５６ＡのＮＧＳデータと一致している。配列末端における「Ａ」ピークは、ポリメラーゼ転写産物によるものであり、予想されたものである。非ターゲット鎖上の切断部位を、予想されている終結塩基が「Ｔ」である逆方向リードにて見ることができる。印をつけたスポット（線）は、ＰＡＭからの位置１７、続いて末端Ｔでの切断を示す。ただし、ＰＡＭからの位置１８、１９および２０での混合Ｔシグナルが存在しており、これは位置１７、１８および１９でのこの鎖上の様々な切断を示唆している。

配列表の簡単な説明
本明細書とともに提出される配列表は、本開示による方法、組成物および系で使用するための例示的なポリヌクレオチドおよびポリペプチド配列を提供する。以下は、本明細書中の配列の例示的な説明である。

ＭＧ１１
配列番号１～３７は、ＭＧ１１ヌクレアーゼの全長ペプチド配列を示す。

配列番号３４７１は、ＭＧ１１ヌクレアーゼによって機能するように設計されたｃｒＲＮＡの５’直接リピートを示す。

配列番号３４７２～３５３８は、ＭＧ１１ヌクレアーゼのエフェクターリピートモチーフを示す。

配列番号３８～１１８は、ＭＧ１３ヌクレアーゼの全長ペプチド配列を示す。

配列番号３５４０～３５５０は、ＭＧ１３ヌクレアーゼのエフェクターリピートモチーフを示す。

ＭＧ１９
配列番号１１９～１２４は、ＭＧ１９ヌクレアーゼの全長ペプチド配列を示す。

配列番号３５５１～３５５８は、ＭＧ１９ヌクレアーゼによって機能するように遺伝子操作されたｓｇＲＮＡのヌクレオチド配列を示す。

配列番号３８６３～３８６６は、ＭＧ１９ヌクレアーゼと適合するＰＡＭ配列を示す。

ＭＧ２０
配列番号１２５は、ＭＧ２０ヌクレアーゼの全長ペプチド配列を示す。

配列番号３５５９は、ＭＧ２０ヌクレアーゼによって機能するように遺伝子操作されたｓｇＲＮＡのヌクレオチド配列を示す。

配列番号３８６７は、ＭＧ２０ヌクレアーゼと適合するＰＡＭ配列を示す。

ＭＧ２６
配列番号１２６～１４０は、ＭＧ２６ヌクレアーゼの全長ペプチド配列を示す。

配列番号３５６０～３５７２は、ＭＧ２６ヌクレアーゼのエフェクターリピートモチーフを示す。

ＭＧ２８
配列番号１４１～２１４は、ＭＧ２８ヌクレアーゼの全長ペプチド配列を示す。

配列番号３５７３～３６０７は、ＭＧ２８ヌクレアーゼのエフェクターリピートモチーフを示す。

配列番号３６０８～３６０９は、ＭＧ２８ヌクレアーゼによって機能するように設計されたｃｒＲＮＡの５’直接リピートを示す。

配列番号３８６８～３８６９は、ＭＧ２８ヌクレアーゼと適合するＰＡＭ配列を示す。

ＭＧ２９
配列番号２１５～２２５は、ＭＧ２９ヌクレアーゼの全長ペプチド配列を示す。

配列番号３６１０～３６１１は、ＭＧ２９ヌクレアーゼのエフェクターリピートモチーフを示す。

配列番号３６１２は、ＭＧ２９ヌクレアーゼによって機能するように遺伝子操作されたｓｇＲＮＡのヌクレオチド配列を示す。

配列番号３８７０～３８７２は、ＭＧ２９ヌクレアーゼと適合するＰＡＭ配列を示す。

ＭＧ３０
配列番号２２６～２２８は、ＭＧ３０ヌクレアーゼの全長ペプチド配列を示す。

配列番号３６１３～３６１５は、ＭＧ３０ヌクレアーゼのエフェクターリピートモチーフを示す。

配列番号３８７３は、ＭＧ３０ヌクレアーゼと適合するＰＡＭ配列を示す。

ＭＧ３１
配列番号２２９～２６０は、ＭＧ３１ヌクレアーゼの全長ペプチド配列を示す。

配列番号３６１６～３６３２は、ＭＧ３１ヌクレアーゼのエフェクターリピートモチーフを示す。

配列番号３８７４～３８７６は、ＭＧ３１ヌクレアーゼと適合するＰＡＭ配列を示す。

ＭＧ３２
配列番号２６１は、ＭＧ３２ヌクレアーゼの全長ペプチド配列を示す。

配列番号３６３３～３６３４は、ＭＧ３２ヌクレアーゼのエフェクターリピートモチーフを示す。

配列番号３８７６は、ＭＧ３２ヌクレアーゼと適合するＰＡＭ配列を示す。

ＭＧ３７
配列番号２６２～４２６は、ＭＧ３７ヌクレアーゼの全長ペプチド配列を示す。

配列番号３６３５は、ＭＧ３７ヌクレアーゼのエフェクターリピートモチーフを示す。

配列番号３６３６～３６３７、３６４０～３６４１、３６４４～３６４５、３６４８～３６４９、３６５２～３６５３、３６５６～３６５７、および３６６０～３６６１は、ＭＧ３７ヌクレアーゼによって機能するように遺伝子操作されたｓｇＲＮＡのヌクレオチド配列を示す。

配列番号３６３８、３６４２、３６４６、３６５０、３６５４、３６５８および３６６２は、上記ＭＧ３７ヌクレアーゼと同一の遺伝子座から誘導されたＭＧ３７ｔｒａｃｒＲＮＡのヌクレオチド配列を示す。

配列番号３６３９、３６４３、３６４７、３６５１、３６５５および３６５９は、３’標的化配列またはスペーサー配列に５’を配置した場合、ｃｒＲＮＡとして機能する天然ＭＧ３７遺伝子座から誘導された５’直接リピート配列を示す。

ＭＧ５３
配列番号４２７～４２８は、ＭＧ５３ヌクレアーゼの全長ペプチド配列を示す。

配列番号３６６３は、３’標的化配列またはスペーサー配列に５’を配置した場合、ｃｒＲＮＡとして機能する天然ＭＧ５３遺伝子座から誘導された５’直接リピート配列を示す。

配列番号３６６４～３６６７は、ＭＧ５３ヌクレアーゼによって機能するように遺伝子操作されたｓｇＲＮＡのヌクレオチド配列を示す。

配列番号３６６８～３６６９は、上記ＭＧ５３ヌクレアーゼと同一の遺伝子座から誘導されたＭＧ５３のｔｒａｃｒＲＮＡのヌクレオチド配列を示す。

ＭＧ５４
配列番号４２９～４３０は、ＭＧ５４ヌクレアーゼの全長ペプチド配列を示す。

配列番号３６７０は、３’標的化配列またはスペーサー配列に５’を配置した場合にｃｒＲＮＡとして機能する天然ＭＧ５４遺伝子座から誘導された５’直接リピート配列を示す。

配列番号３６７１～３６７２は、ＭＧ５４ヌクレアーゼによって機能するように遺伝子操作されたｓｇＲＮＡのヌクレオチド配列を示す。

配列番号３６７３～３６７６は、上記ＭＧ５４ヌクレアーゼと同一の遺伝子座から誘導されたＭＧ５４のｔｒａｃｒＲＮＡのヌクレオチド配列を示す。

ＭＧ５５
配列番号４３１～６８８は、ＭＧ５５ヌクレアーゼの全長ペプチド配列を示す。

ＭＧ５６
配列番号６８９～６９０は、ＭＧ５６ヌクレアーゼの全長ペプチド配列を示す。

配列番号３６７８は、ＭＧ５６ヌクレアーゼによって機能するように設計されたｃｒＲＮＡの５’直接リピートを示す。

配列番号３６７９～３６８０は、ＭＧ５６ヌクレアーゼのエフェクターリピートモチーフを示す。

ＭＧ５７
配列番号６９１～７２１は、ＭＧ５７ヌクレアーゼの全長ペプチド配列を示す。

配列番号３６８１～３６９４は、ＭＧ５７ヌクレアーゼのエフェクターリピートモチーフを示す。

配列番号３６９５～３６９６は、ＭＧ５７ヌクレアーゼによって機能するように遺伝子操作されたｓｇＲＮＡのヌクレオチド配列を示す。

配列番号３８７９～３８８０は、ＭＧ５７ヌクレアーゼと適合するＰＡＭ配列を示す。

ＭＧ５８
配列番号７２２～７７９は、ＭＧ５８ヌクレアーゼの全長ペプチド配列を示す。

配列番号３６９７～３７１１は、ＭＧ５８ヌクレアーゼのエフェクターリピートモチーフを示す。

ＭＧ５９
配列番号７８０～７９２は、ＭＧ５９ヌクレアーゼの全長ペプチド配列を示す。

配列番号３７１２～３７２８は、ＭＧ５９ヌクレアーゼのエフェクターリピートモチーフを示す。

配列番号３７２９～３７３０は、ＭＧ５９ヌクレアーゼによって機能するように遺伝子操作されたｓｇＲＮＡのヌクレオチド配列を示す。

配列番号３８８１～３８８２は、ＭＧ５９ヌクレアーゼと適合するＰＡＭ配列を示す。

ＭＧ６０
配列番号７９３～１１６３は、ＭＧ６０ヌクレアーゼの全長ペプチド配列を示す。

配列番号３７３１～３７３３は、ＭＧ６０ヌクレアーゼのエフェクターリピートモチーフを示す。

ＭＧ６１
配列番号１１６４～１４６９は、ＭＧ６１ヌクレアーゼの全長ペプチド配列を示す。

配列番号３７３４～３７３５は、ＭＧ６１ヌクレアーゼによって機能するように設計されたｃｒＲＮＡの５’直接リピートを示す。

配列番号３７３６～３８４７は、ＭＧ６１ヌクレアーゼのエフェクターリピートモチーフを示す。

ＭＧ６２
配列番号１４７０～１４７２は、ＭＧ６２ヌクレアーゼの全長ペプチド配列を示す。

配列番号３８４８～３８５０は、ＭＧ６２ヌクレアーゼのエフェクターリピートモチーフを示す。

ＭＧ７０
配列番号１４７３～１５１４は、ＭＧ７０ヌクレアーゼの全長ペプチド配列を示す。

ＭＧ７５
配列番号１５１５～１７１０は、ＭＧ７５ヌクレアーゼの全長ペプチド配列を示す。

ＭＧ７７
配列番号１７１１～１７１２は、ＭＧ７７ヌクレアーゼの全長ペプチド配列を示す。

配列番号３８５１～３８５２は、ＭＧ７７ヌクレアーゼによって機能するように遺伝子操作されたｓｇＲＮＡのヌクレオチド配列を示す。

配列番号３８８３～３８８４は、ＭＧ７７ヌクレアーゼと適合するＰＡＭ配列を示す。

ＭＧ７８
配列番号１７１３～１７１７は、ＭＧ７８ヌクレアーゼの全長ペプチド配列を示す。

配列番号３８５３は、ＭＧ７８ヌクレアーゼによって機能するように遺伝子操作されたｓｇＲＮＡのヌクレオチド配列を示す。

配列番号３８８５は、ＭＧ７８ヌクレアーゼと適合するＰＡＭ配列を示す。

ＭＧ７９
配列番号１７１８～１７２２は、ＭＧ７９ヌクレアーゼの全長ペプチド配列を示す。

配列番号３８５４～３８５７は、ＭＧ７９ヌクレアーゼによって機能するように遺伝子操作されたｓｇＲＮＡのヌクレオチド配列を示す。

配列番号３８８６～３８８９は、ＭＧ７９ヌクレアーゼと適合するＰＡＭ配列を示す。

ＭＧ８０
配列番号１７２３は、ＭＧ８０ヌクレアーゼの全長ペプチド配列を示す。

ＭＧ８１
配列番号１７２４～２６５４は、ＭＧ８１ヌクレアーゼの全長ペプチド配列を示す。

ＭＧ８２
配列番号２６５５～２６５７は、ＭＧ８２ヌクレアーゼの全長ペプチド配列を示す。

ＭＧ８３
配列番号２６５８～２６５９は、ＭＧ８３ヌクレアーゼの全長ペプチド配列を示す。

ＭＧ８４
配列番号２６６０～２６７７は、ＭＧ８４ヌクレアーゼの全長ペプチド配列を示す。

ＭＧ８５
配列番号２６７８～２６８０は、ＭＧ８５ヌクレアーゼの全長ペプチド配列を示す。

ＭＧ９０
配列番号２６８１～２８０９は、ＭＧ９０ヌクレアーゼの全長ペプチド配列を示す。

ＭＧ９１
配列番号２８１０～３４７０は、ＭＧ９１ヌクレアーゼの全長ペプチド配列を示す。

スペーサーセグメント
配列番号３８５８～３８６１は、スペーサーセグメントのヌクレオチド配列を示す。

ＮＬＳ
配列番号３９３８～３９５３は、本開示によるヌクレアーゼに付加され得る例示的な核局在化配列（ＮＬＳ）の配列を示す。

本明細書には本発明の様々な実施形態が示され、説明されているが、かかる実施形態は例としてのみ提供されることは当業者には明らかとなるであろう。当業者にとっては、多数の変形、変更および置換が本明細書から逸脱することがない限りで行われる。本明細書に説明されている本発明の実施形態に対する様々な代替形態が利用され得ることを理解されたい。

本明細書に開示されているいくつかの方法の実践には、特段示さない限り、免疫学、生化学、化学、分子生物学、微生物学、細胞生物学、ゲノミクスおよび組換えＤＮＡの技法を使用する。例えば、ＳａｍｂｒｏｏｋａｎｄＧｒｅｅｎ，ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ，４ｔｈＥｄｉｔｉｏｎ（２０１２）；ｔｈｅｓｅｒｉｅｓＣｕｒｒｅｎｔＰｒｏｔｏｃｏｌｓｉｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ（Ｆ．Ｍ．Ａｕｓｕｂｅｌ，ｅｔａｌ．ｅｄｓ．）、シリーズＭｅｔｈｏｄｓＩｎＥｎｚｙｍｏｌｏｇｙ（ＡｃａｄｅｍｉｃＰｒｅｓｓ，Ｉｎｃ．）、ＰＣＲ２：ＡＰｒａｃｔｉｃａｌＡｐｐｒｏａｃｈ（Ｍ．Ｊ．ＭａｃＰｈｅｒｓｏｎ，Ｂ．Ｄ．ＨａｍｅｓａｎｄＧ．Ｒ．Ｔａｙｌｏｒｅｄｓ．（１９９５）），ＨａｒｌｏｗａｎｄＬａｎｅ，ｅｄｓ．（１９８８）Ａｎｔｉｂｏｄｉｅｓ，ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ，ａｎｄＣｕｌｔｕｒｅｏｆＡｎｉｍａｌＣｅｌｌｓ：ＡＭａｎｕａｌｏｆＢａｓｉｃＴｅｃｈｎｉｑｕｅａｎｄＳｐｅｃｉａｌｉｚｅｄＡｐｐｌｉｃａｔｉｏｎｓ，６ｔｈＥｄｉｔｉｏｎ（Ｒ．Ｉ．Ｆｒｅｓｈｎｅｙ，ｅｄ．（２０１０））の例を参照されたい（これは、その全体が参照により本明細書に組み込まれている）。

本明細書で使用される場合、単数形「１つの（ａ）」、「１つの（ａｎ）」および「その（ｔｈｅ）」は、特段明確に文脈で指示しない限り、複数形を含むことが意図されている。さらには、用語「含む（ｉｎｃｌｕｄｉｎｇ）」、「含む（ｉｎｃｌｕｄｅｓ）」、「有する（ｈａｖｉｎｇ）」、「有する（ｈａｓ）」、「伴う（ｗｉｔｈ）」またはその変形が詳細な説明および／または特許請求の範囲のいずれかで使用される限り、かかる用語は、用語「含む（ｃｏｍｐｒｉｓｉｎｇ）」に類似の様式で包括的であることが意図されている。

用語「約（ａｂｏｕｔ）」または「およそ（ａｐｐｒｏｘｉｍａｔｅｌｙ）」は、当業者によって決定される特定の値にとって許容される誤差範囲内を意味しており、どのように値が測定または決定されるか、すなわち測定系の制限に部分的に依存している。例えば当該技術分野での関連によれば、「約」は、１つまたは２つ以上の標準偏差内を意味し得る。代替的には、「約」は、所与の値の最大２０％、最大１５％、最大１０％、最大５％、または最大１％の範囲を意味し得る。

本明細書で使用される場合、「細胞」は、生物学的細胞を一般に指す。細胞は、生物の基本的な構造的単位、機能的単位、および／または生物学的単位であってもよい。細胞は、１つ以上の細胞を有するいずれかの生物に由来し得る。いくつかの非限定的な例としては、原核生物細胞、真核生物細胞、細菌細胞、古細菌細胞、単細胞真核生物の細胞、原生生物細胞、植物（例えば、作物、果物、野菜、穀物、ダイズ、トウモロコシ（ｃｏｒｎ）、トウモロコシ（ｍａｉｚｅ）、コムギ、種子、トマト、イネ、キャッサバ、サトウキビ、カボチャ、乾草、ジャガイモ、ワタ、カンナビス、タバコ、顕花植物、針葉樹、裸子植物、シダ、ヒカゲノカズラ、ツノゴケ、ゼニゴケ、コケ類）由来の細胞、藻類細胞（例えば、ボツリオコッカス・ブラウニー、クラミドモナス・レインハルディ、ナノクロロプシスガジタナ、クロレラ・ピレノイドサ、サルガッサム・パテンス・Ｃ．アガルドなど）、海藻（例えば、ケルプ）、真菌細胞（例えば、酵母細胞、キノコ由来の細胞）、動物細胞、無脊椎動物（例えば、ミバエ、刺胞動物、棘皮動物、線形動物など）由来の細胞、脊椎動物（例えば、魚類、両生類、爬虫類、鳥類、哺乳動物）由来の細胞、哺乳動物（例えば、ブタ、ウシ、ヤギ、ヒツジ、げっ歯類、ラット、マウス、非ヒト霊長類、ヒトなど）由来の細胞などが挙げられる。細胞は、天然の生物由来ではないことがある（例えば、細胞は合成的に作製され得るが、これは人工細胞と呼ばれることがある）。

本明細書で使用される場合、用語「ヌクレオチド」は、塩基－糖－リン酸の組合せを一般には指す。ヌクレオチドは、合成ヌクレオチドを含んでもよい。ヌクレオチドは、合成ヌクレオチド類似体を含んでもよい。ヌクレオチドは、核酸配列（例えば、デオキシリボ核酸（ＤＮＡ）およびリボ核酸（ＲＮＡ）の単量体単位であってもよい。用語ヌクレオチドは、リボヌクレオシド三リン酸、アデノシン三リン酸（ａｄｅｎｏｓｉｎｅｔｒｉｐｈｏｓｐｈａｔｅ、ＡＴＰ）、ウリジン三リン酸（ｕｒｉｄｉｎｅｔｒｉｐｈｏｓｐｈａｔｅ、ＵＴＰ）、シトシン三リン酸（ｃｙｔｏｓｉｎｅｔｒｉｐｈｏｓｐｈａｔｅ、ＣＴＰ）、グアノシン三リン酸（ｇｕａｎｏｓｉｎｅｔｒｉｐｈｏｓｐｈａｔｅ、ＧＴＰ）およびｄＡＴＰ、ｄＣＴＰ、ｄＩＴＰ、ｄＵＴＰ、ｄＧＴＰ、ｄＴＴＰといったデオキシリボヌクレオシド三リン酸、またはこれらの誘導体を含んでもよい。かかる誘導体は、例えば［αＳ］ｄＡＴＰ、７－デアザ－ｄＧＴＰおよび７－デアザ－ｄＡＴＰ、ならびにこうした誘導体を含有する核酸分子へのヌクレアーゼ耐性を与えるヌクレオチド誘導体を含んでもよい。本明細書で使用される場合、用語ヌクレオチドは、ジデオキシリボヌクレオシド三リン酸（ｄｉｄｅｏｘｙｒｉｂｏｎｕｃｌｅｏｓｉｄｅｔｒｉｐｈｏｓｐｈａｔｅ、ｄｄＮＴＰ）およびその誘導体を指すことがある。ジデオキシリボヌクレオシド三リン酸の実例としては、ｄｄＡＴＰ、ｄｄＣＴＰ、ｄｄＧＴＰ、ｄｄＩＴＰおよびｄｄＴＴＰが挙げられるがこれらに限定されない。ヌクレオチドは、光学的に検出可能な部分（例えば、フルオロフォア）を含む部分を使用するなどして標識されなくてもよく、検出可能に標識されてもよい。標識はまた、量子ドットを用いて行われてもよい。検出可能な標識は例えば、放射性アイソトープ、蛍光標識、化学発光標識、生物発光標識、および酵素標識を含んでもよい。ヌクレオチドの蛍光標識としては、フルオレセイン、５－カルボキシフルオレセイン（ＦＡＭ）、２’７’－ジメトキシ－４’５－ジクロロ－６－カルボキシフルオレセイン（ＪＯＥ）、ローダミン、６－カルボキシローダミン（Ｒ６Ｇ）、Ｎ，Ｎ，Ｎ’、Ｎ’－テトラメチル－６－カルボキシローダミン（ＴＡＭＲＡ）、６－カルボキシ－Ｘ－ローダミン（ＲＯＸ）、４－（４’ジメチルアミノフェニルアゾ）安息香酸（ＤＡＢＣＹＬ）、カスケードブルー、オレゴングリーン、テキサスレッド、シアニンおよび５－（２’－アミノエチル）アミノナフタレン－１－スルホン酸（ＥＤＡＮＳ）が挙げられてもよいが、これらに限定されない。蛍光標識されたヌクレオチドの特定例としては、ＰｅｒｋｉｎＥｌｍｅｒ（ＦｏｓｔｅｒＣｉｔｙ，Ｃａｌｉｆ）から入手可能である［Ｒ６Ｇ］ｄＵＴＰ、［ＴＡＭＲＡ］ｄＵＴＰ、［Ｒ１１０］ｄＣＴＰ、［Ｒ６Ｇ］ｄＣＴＰ、［ＴＡＭＲＡ］ｄＣＴＰ、［ＪＯＥ］ｄｄＡＴＰ、［Ｒ６Ｇ］ｄｄＡＴＰ、［ＦＡＭ］ｄｄＣＴＰ、［Ｒ１１０］ｄｄＣＴＰ、［ＴＡＭＲＡ］ｄｄＧＴＰ、［ＲＯＸ］ｄｄＴＴＰ、［ｄＲ６Ｇ］ｄｄＡＴＰ、［ｄＲ１１０］ｄｄＣＴＰ、［ｄＴＡＭＲＡ］ｄｄＧＴＰ、および［ｄＲＯＸ］ｄｄＴＴＰ；Ａｍｅｒｓｈａｍ（ＡｒｌｉｎｇｔｏｎＨｅｉｇｈｔｓ，Ｉｌ．）から入手可能であるＦｌｕｏｒｏＬｉｎｋＤｅｏｘｙＮｕｃｌｅｏｔｉｄｅｓ、ＦｌｕｏｒｏＬｉｎｋＣｙ３－ｄＣＴＰ、ＦｌｕｏｒｏＬｉｎｋＣｙ５－ｄＣＴＰ、ＦｌｕｏｒｏＬｉｎｋＦｌｕｏｒＸ－ｄＣＴＰ、ＦｌｕｏｒｏＬｉｎｋＣｙ３－ｄＵＴＰおよびＦｌｕｏｒｏＬｉｎｋＣｙ５－ｄＵＴＰ；ＢｏｅｈｒｉｎｇｅｒＭａｎｎｈｅｉｍ（Ｉｎｄｉａｎａｐｏｌｉｓ，Ｉｎｄ．）から入手可能であるＦｌｕｏｒｅｓｃｅｉｎ－１５－ｄＡＴＰ、Ｆｌｕｏｒｅｓｃｅｉｎ－１２－ｄＵＴＰ、Ｔｅｔｒａｍｅｔｈｙｌ－ｒｏｄａｍｉｎｅ－６－ｄＵＴＰ、ＩＲ７７０－９－ｄＡＴＰ、Ｆｌｕｏｒｅｓｃｅｉｎ－１２－ｄｄＵＴＰ、Ｆｌｕｏｒｅｓｃｅｉｎ－１２－ＵＴＰ、およびＦｌｕｏｒｅｓｃｅｉｎ－１５－２’－ｄＡＴＰ；ならびにＭｏｌｅｃｕｌａｒＰｒｏｂｅｓ（Ｅｕｇｅｎｅ，Ｏｒｅｇ）から入手可能である染色体標識ヌクレオチド、ＢＯＤＩＰＹ－ＦＬ－１４－ＵＴＰ、ＢＯＤＩＰＹ－ＦＬ－４－ＵＴＰ、ＢＯＤＩＰＹ－ＴＭＲ－１４－ＵＴＰ、ＢＯＤＩＰＹ－ＴＭＲ－１４－ｄＵＴＰ、ＢＯＤＩＰＹ－ＴＲ－１４－ＵＴＰ、ＢＯＤＩＰＹ－ＴＲ－１４－ｄＵＴＰ、カスケードブルー－７－ＵＴＰ、カスケードブルー－７－ｄＵＴＰ、フルオレセイン－１２－ＵＴＰ、フルオレセイン－１２－ｄＵＴＰ、オレゴングリーン４８８－５－ｄＵＴＰ、ローダミングリーン－５－ＵＴＰ、テトラメチルローダミン－５－ｄＵＴＰ、テトラメチルローダミン－６－ＵＴＰ、テトラメチルローダミン－６－ｄＵＴＰ、テキサスレッド－５－ＵＴＰ、テキサスレッド－５－ｄＵＴＰ、およびテキサスレッド－１２－ｄＵＴＰが挙げられ得る。ヌクレオチドはまた、化学修飾により標識またはマーキングされ得る。化学修飾された単一ヌクレオチドは、ビオチン－ｄＮＴＰであり得る。ビオチン標識されたｄＮＴＰのいくつかの非限定的な例としては、ビオチン－ｄＡＴＰ（例えば、ビオ－Ｎ６－ｄｄＡＴＰ、ビオチン－１４－ｄＡＴＰ）、ビオチン－ｄＣＴＰ（例えば、ビオチン－１１－ｄＣＴＰ、ビオチン－１４－ｄＣＴＰ）およびビオチン－ｄＵＴＰ（例えば、ビオチン－１１－ｄＵＴＰ、ビオチン－１６－ｄＵＴＰ、ビオチン－２０－ｄＵＴＰ）が挙げられ得る。

用語「ポリヌクレオチド」、「オリゴヌクレオチド」、および「核酸」は、一本鎖形態、二本鎖形態、または多本鎖形態のいずれかで、任意の長さのヌクレオチド、デオキシリボヌクオチドもしくはリボヌクレオチドのいずれか、またはそれらの類似体の重合体形態を一般に指すために互換的に使用される。ポリヌクレオチドは、細胞に対して外因性または内因性であってもよい。ポリヌクレオチドは、セルフリー環境で存在してもよい。ポリヌクレオチドは、遺伝子またはそのフラグメントであってもよい。ポリヌクレオチドはＤＮＡであってもよい。ポリヌクレオチドはＲＮＡであってもよい。ポリヌクレオチドは任意の三次元構造を有してもよく、任意の機能を遂行してもよい。ポリヌクレオチドは、１つ以上の類似体（例えば、変性された主鎖、糖、またはヌクレオベース）を含んでもよい。存在する場合には、ヌクレオチド構造に対する修飾は、重合体の構築前後に付与されてもよい。類似体のいくつかの非限定的な例としては、５－ブロモウラシル、ペプチド核酸、異物核酸、モルフォリノ、ロックされた核酸、グリコール核酸、トレオース核酸、ジデオキシヌクレオチド、コーディセピン、７－デアザ－ＧＴＰ、フルオロフォア（例えば、糖に結合されたローダミンまたはフルオレセイン）、チオール含有ヌクレオチド、ビオチン結合ヌクレオチド、蛍光塩基類似体、ＣｐＧアイランド、メチル－７－グアノシン、メチル化ヌクレオチド、イノシン、チオウリジン、プソイドウリジン、ジヒドロウリジン、キューオシン、およびワイオシンが挙げられる。ポリヌクレオチドの非限定的な例としては、遺伝子または遺伝子フラグメントのコード領域または非コード領域、連鎖解析により定義された遺伝子座（ｌｏｃｉ）（遺伝子座（ｌｏｃｕｓ））、エクソン、イントロン、メッセンジャーＲＮＡ（ｍＲＮＡ）、トランスファーＲＮＡ（ｔＲＮＡ）、リボソームＲＮＡ（ｒＲＮＡ）、短干渉ＲＮＡ（ｓｉＲＮＡ）、小ヘアピンＲＮＡ（ｓｈＲＮＡ）、マイクロＲＮＡ（ｍｉＲＮＡ）、リボザイム、ｃＤＮＡ、組換えポリヌクレオチド、分枝ポリヌクレオチド、プラスミド、ベクター、任意の配列の単離されたＤＮＡ、任意の配列の単離されたＲＮＡ、セルフリーＤＮＡ（ｃｆＤＮＡ）およびセルフリーＲＮＡ（ｃｆＲＮＡ）を含むセルフリーポリヌクレオチド、核酸プローブ、ならびにプライマーが挙げられる。ヌクレオチドの配列は、非ヌクレオチド構成成分により中断されてもよい。

用語「トランスフェクション」または「トランスフェクトされた」は、非ウイルスまたはウイルスに基づいた方法による核酸の細胞への導入を一般には指す。核酸分子は、完全なタンパク質またはその機能部分をコードする遺伝子配列であってもよい。例えば、Ｓａｍｂｒｏｏｋｅｔａｌ．，１９８９，ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ，１８．１－１８．８８（これは、その全体が参照により本明細書に組み込まれている）を参照されたい。

用語「ペプチド」、「ポリペプチド」、および「タンパク質」は、本明細書では互換的に使用され、１つ以上のペプチド結合によって連結された少なくとも２つのアミノ酸残基の重合体を一般には指す。この用語は、重合体の特定の長さを暗示するものではなく、組換え技法、化学合成または酵素合成を使用してペプチドが産生されるかどうか、または天然に存在するかどうかを意味または区別しようと意図するものでもない。用語は、天然に存在するアミノ酸重合体、および少なくとも１つの修飾アミノ酸を含むアミノ酸重合体に適用する。いくつかの場合では、重合体は非アミノ酸により中断されてもよい。用語は、全長タンパク質、二次構造および／または三次構造（例えば、ドメイン）を有するタンパク質またはこれを有さないタンパク質を含む、任意の長さのアミノ酸鎖を含む。用語はまた、例えばジスルフィド結合の形成、グリコシル化、脂質修飾、アセチル化、リン酸化、酸化、および標識成分とのコンジュゲーションといった任意の他の操作により修飾されたアミノ酸重合体を包含する。本明細書で使用される場合、用語「アミノ酸」は、修飾アミノ酸およびアミノ酸類似体を含むがこれらに限定されない、天然アミノ酸および非天然アミノ酸を一般には指す。修飾アミノ酸は、アミノ酸に天然には存在しない基または化学部分を含むように化学修飾されている天然アミノ酸および非天然アミノ酸を含んでもよい。アミノ酸類似体は、アミノ酸誘導体を指してもよい。用語「アミノ酸」は、Ｄ－アミノ酸とＬ－アミノ酸の両方を含む。

本明細書で使用される場合、「非天然」は、天然の核酸またはタンパク質では見られない核酸またはポリペプチド配列を一般には指し得る。非天然は、アフィニティータグを指してもよい。非天然は、融合物を指してもよい。非天然は、変異、挿入、および／または欠失を含む天然に存在する核酸またはポリペプチド配列を指してもよい。非天然配列は、非天然配列が融合される核酸および／またはポリペプチド配列によっても示され得る活性（例えば、酵素活性、メチルトランスフェラーゼ活性、アセチルトランスフェラーゼ活性、キナーゼ活性、ユビキチン化活性など）を示し得る、および／またはこれをコードし得る。非天然核酸配列またはポリペプチド配列は、遺伝子操作により天然に存在する核酸配列またはポリペプチド配列（またはそのバリアント）に連結され、キメラ核酸配列、ならびに／またはキメラ核酸および／もしくはポリペプチドをコードするポリペプチド配列を生成してもよい。

本明細書で使用される場合、用語「プロモーター」は、遺伝子の転写または発現を制御し、かつＲＮＡ転写が開始するヌクレオチドまたはヌクレオチドの領域に隣接して配置され得る、またはこれらに重複し得る、調節ＤＮＡ領域を一般には指す。プロモーターは、遺伝子転写につながるＤＮＡへのＲＮＡポリメラーゼの結合を推進させるタンパク質因子（多くの場合、転写因子と呼ばれる）に結合する特異的なＤＮＡ配列を含有し得る。「基本プロモーター」（「コアプロモーター」とも呼ばれる）は、動作可能に連結されたポリヌクレオチドの転写発現を促進するために基本的に必要な要素全てを含有するプロモーターを一般には指し得る。真核生物の基本プロモーターは、典型的には必ずしもそうとは限らないが、ＴＡＴＡボックスおよび／またはＣＡＡＴボックスを含有する。

本明細書で使用される場合、用語「発現」は、核酸配列またはポリヌクレオチドがＤＮＡテンプレート（例えば、ｍＲＮＡまたは他のｍＲＮＡ転写物など）から転写されるプロセス、および／または転写されたＲＮＡがペプチド、ポリペプチド、またはタンパク質に続いて翻訳されるプロセスを一般には指す。転写物およびコードされたポリペプチドは、まとめて「遺伝子産物」と呼ばれてもよい。ポリヌクレオチドがゲノムＤＮＡに由来する場合には、発現は真核生物細胞でのｍＲＮＡのスプライシングを含んでもよい。

本明細書で使用される場合、「動作可能に連結された」、「動作可能な結合」、「動作的に連結された」、または文法的なそれらの同等物は、例えばプロモーター、エンハンサー、ポリアデニル化配列などの遺伝要素の並置を一般には指す。この要素は、それらが予想される様式で動作するのを可能にする関係にある。例えば、プロモーターおよび／またはエンハンサー配列を含み得る調節要素は、これがコード配列の転写を開始するのを支援する場合には、コード領域に動作的に連結されている。この機能的関係が維持される限りは、調節要素とコード領域との間に介在残基が存在され得る。

本明細書で使用される場合、「ベクター」は、ポリヌクレオチドを含む、またはポリヌクレオチドと会合し、ポリヌクレオチドの細胞への送達を媒介するために使用され得る高分子、または高分子の会合を一般には指す。ベクターの例としては、プラスミド、ウイルスベクター、リポソーム、および遺伝子送達ビヒクルが挙げられる。ベクターは、標的中での遺伝子発現を推進するために遺伝子に動作的に連結された、例えば調節要素といった遺伝要素を一般には含む。

本明細書で使用される場合、「発現カセット」および「核酸カセット」は、ともに発現される核酸配列もしくは要素、または発現のために動作可能に連結された核酸配列もしくは要素の組合せを指すため、互換的に一般には使用される。いくつかの場合では、発現カセットは、調節要素と発現のために動作可能に連結されている１つ以上の遺伝子との組合せを指す。

ＤＮＡ配列またはタンパク質配列の「機能フラグメント」は、全長ＤＮＡまたはタンパク質配列の生物学的活性と実質的に同様の生物学的活性（機能的または構造的のいずれか）を保持するフラグメントを一般には指す。ＤＮＡ配列の生物学的活性は、全長配列に起因することで知られている様式で発現に影響する能力であり得る。

本明細書で使用される場合、「遺伝子操作された」対象は、この対象がヒト介入によって修飾されたことを一般には示している。非限定的な例によれば、核酸はその配列を天然に存在しない配列に変化させることで修飾されてもよく、核酸は、結合産物が起源とする核酸中に存在しない機能を保持するように、これを天然では会合しない核酸に結合することで修飾されてもよく、遺伝子操作された核酸は、天然では存在しない配列とインビトロで合成してもよく、タンパク質はそのアミノ酸配列を天然には存在しない配列に変化させることで修飾されてもよく、遺伝子操作されたタンパク質が新規機能または特性を獲得してもよい。「遺伝子操作された」系は、少なくとも１つの遺伝子操作された構成成分を含む。

本明細書で使用される場合、「合成」および「人工」は、天然に存在するヒトタンパク質に対して低い配列同一性（例えば、５０％未満の配列同一性、２５％未満の配列同一性、１０％未満の配列同一性、５％未満の配列同一性、１％未満の配列同一性）を有するそのタンパク質またはドメインを指すために互換的に一般には使用され得る。例えば、ＶＰＲおよびＶＰ６４ドメインは、合成トランス活性化ドメインである。

本明細書で使用される場合、用語「Ｃａｓ１２ａ」は、クラス２のＶ－Ａ型Ｃａｓエンドヌクレアーゼであり、（ａ）ＣＲＩＳＰＲアレイから転写後にヌクレアーゼ自体によってプロセシングされる比較的小さなガイドＲＮＡ（約４２～４４ヌクレオチド）を使用し、（ｂ）ＤＮＡを切断し、ねじれ形の切断部位を残す、Ｃａｓエンドヌクレアーゼのファミリーを一般には指す。酵素のこのファミリーのさらなる特徴は、例えばＺｅｔｓｃｈｅＢ，ＨｅｉｄｅｎｒｅｉｃｈＭ，ＭｏｈａｎｒａｊｕＰ，ｅｔａｌ．ＮａｔＢｉｏｔｅｃｈｎｏｌ２０１７；３５：３１－３４，ａｎｄＺｅｔｓｃｈｅＢ，ＧｏｏｔｅｎｂｅｒｇＪＳ，ＡｂｕｄａｙｙｅｈＯＯ，ｅｔａｌ．Ｃｅｌｌ２０１５；１６３：７５９－７７１に見出すことができ、これは本明細書に参照により組み込まれている。

本明細書で使用される場合、「ガイド核酸」は、別の核酸にハイブリダイズし得る核酸を一般には指し得る。ガイド核酸はＲＮＡであってもよい。ガイド核酸はＤＮＡであってもよい。ガイド核酸は、部位特異的に核酸の配列に結合するようにプログラムされていてもよい。標的される核酸、または標的核酸はヌクレオチドを含んでもよい。ガイド核酸はヌクレオチドを含んでもよい。標的核酸の一部は、ガイド核酸の一部に相補的であってもよい。ガイド核酸に相補的であり、これとハイブリダイズする二本鎖標的ポリヌクレオチド鎖は相補鎖と呼ばれてもよい。相補鎖に相補的であり、それによりガイド核酸に相補的でない可能性がある二本鎖標的ポリヌクレオチド鎖は、非相補鎖と呼ばれてもよい。ガイド核酸はポリヌクレオチド鎖を含んでもよく、「単一ガイド核酸」と呼ばれ得る。ガイド核酸は２本のポリヌクレオチド鎖を含んでもよく、「二重ガイド核酸」と呼ばれてもよい。特段明記しない限り、用語「ガイド核酸」は包括的な用語であり得、単一ガイド核酸と二重ガイド核酸の両方を指す。ガイド核酸は、「核酸標的セグメント」または「核酸標的化配列」もしくは「スペーサー配列」と呼ばれ得るセグメントを含んでもよい。核酸標的セグメントは、「タンパク質結合セグメント」または「タンパク質結合配列」または「Ｃａｓタンパク質結合セグメント」と呼ばれ得るサブセグメントを含んでもよい。

２つ以上の核酸またはポリペプチド配列に関する用語「配列同一性」または「パーセント同一性」は、配列比較アルゴリズムを使用して測定する際、部分的な比較ウィンドウまたは全体的な比較ウィンドウにわたって最大一致させるために比較およびアラインメントさせた場合に、同一である、または特定の割合の同一であるアミノ酸残基もしくはヌクレオチドを有する２つ（例えば、ペアワイズアラインメントで）または複数（例えば、多重整列）の配列を一般には指す。ポリペプチド配列に好適な配列比較アルゴリズムとしては、例えば３のワード長（Ｗ）、１０の期待値（Ｅ）のパラメータ、および１１の存在、１の伸長でのギャップコストを設定しているＢＬＯＳＵＭ６２スコア行列を使用し、３０残基より長いポリペプチド配列のための条件付き組合せスコア行列の調整を使用するＢＬＡＳＴＰ；２のワード長（Ｗ）、１００００００の期待値（Ｅ）のパラメータ、および３０残基未満の配列についてはギャップを開くためには９、ギャップを拡張するためには１のギャップコストを設定しているＰＡＭ３０スコア行列（これらは、ｈｔｔｐｓ：／／ｂｌａｓｔ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖで入手可能であるＢＬＡＳＴスイートのＢＬＡＳＴＰ向けのデフォルトパラメータである）を使用するＢＬＡＳＴＰ；２の一致、－１の不一致、および－１のギャップを有するＳｍｉｔｈ－Ｗａｔｅｒｍａｎホモロジー検索アルゴリズムを有するＣＬＵＳＴＡＬＷ；デフォルトパラメータを用いるＭＵＳＣＬＥ；２のｒｅｔｒｅｅおよび１０００の最大反復のパラメータを用いるＭＡＦＦＴ；デフォルトパラメータを用いるＮｏｖａｆｏｌｄ；デフォルトパラメータを用いるＨＭＭＥＲｈｍｍアラインが挙げられる。

２つ以上の核酸またはポリペプチド配列に関する用語「最適にアラインメントされた」は、例えば最大または「最適化された」パーセント同一性スコアを生成するアラインメントにより決定される際には、アミノ酸残基またはヌクレオチドの最大一致にアラインメントされた２つ（例えば、ペアワイズアラインメントで）または複数（例えば、多重整列）の配列を一般には指す。

本開示には、１つ以上の保存的アミノ酸置換を有する本明細書に説明されている酵素のうちいずれかのバリアントが含まれる。かかる保存的置換基は、三次元構造またはポリペプチドの機能を破壊することなく、ポリペプチドのアミノ酸配列中で作製され得る。保存的置換基は、互いに同様の疎水性、極性およびＲ鎖長を有するアミノ酸を置換することで達成され得る。加えて、または代替的には、異なる種に由来する相同タンパク質のアラインメントされた配列を比較することで、コードされたタンパク質の基本機能を変性させることなく、種間で変異したアミノ酸残基（例えば、非保存残基）を配置することで保存置換基を同定することができる。こうした保存的に置換されたバリアントとしては、本明細書に説明されたエンドヌクレアーゼタンパク質配列のうちいずれか１つに対して、少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％の同一性を有するバリアント（例えば、本明細書に説明されているＭＧ１１、ＭＧ１３、ＭＧ２６、ＭＧ２８、ＭＧ２９、ＭＧ３０、ＭＧ３１、ＭＧ３２、ＭＧ３７、ＭＧ５３、ＭＧ５４、ＭＧ５５、ＭＧ５６、ＭＧ５７、ＭＧ５８、ＭＧ５９、ＭＧ６０、ＭＧ６１、ＭＧ６２、ＭＧ７０、ＭＧ８２、ＭＧ８３、ＭＧ８４、またはＭＧ８５のファミリーエンドヌクレアーゼ、または本明細書に説明されている任意の他のファミリーヌクレアーゼ）が挙げられてもよい。いくつかの実施形態では、かかる保存的に置換されたバリアントは機能的バリアントである。かかる機能的バリアントは、エンドヌクレアーゼの１つ以上の重要な活性部位残基またはガイドＲＮＡ結合残基の活性が破壊されないような置換を有する配列を包含し得る。いくつかの実施形態では、本明細書に説明されているタンパク質のいずれかの機能的バリアントは、図１７、図１８、図１０、図２０、もしくは図２５にコールアウトされた少なくとも１つの保存残基または機能残基、または表１Ｂに説明されている残基の置換を欠失している。いくつかの実施形態では、本明細書に説明されているタンパク質のいずれかの機能的バリアントは、図１７、図１８、図１０、図２０、もしくは図２５にコールアウトされた全ての保存残基または機能残基、または表１Ｂに説明されている残基の置換を欠失している。

本開示にはまた、酵素の活性を減少または除去する１つ以上の触媒残基の置換を有する、本明細書に説明されている酵素のうちいずれかのバリアント（例えば、活性減少バリアント）が含まれる。いくつかの実施形態では、本明細書に説明されているタンパク質のような活性が減少したバリアントは、表１Ｂで同定された少なくとも１つ、少なくとも２つ、または３つ全ての触媒残基の破壊置換を含む。

機能的に類似するアミノ酸を提供する保存的置換基の表は、様々な参考文献から入手可能である（例えば、Ｃｒｅｉｇｈｔｏｎ，Ｐｒｏｔｅｉｎｓ：ＳｔｒｕｃｔｕｒｅｓａｎｄＭｏｌｅｃｕｌａｒＰｒｏｐｅｒｔｉｅｓ（ＷＨＦｒｅｅｍａｎ＆Ｃｏ．；２ｎｄｅｄｉｔｉｏｎ（Ｄｅｃｅｍｂｅｒ１９９３）を参照されたい）。以下の８個の基はそれぞれ、互いに保存的置換基であるアミノ酸を含有する：
１）アラニン（Ａ）、グリシン（Ｇ）；
２）アスパラギン酸（Ｄ）、グルタミン酸（Ｅ）；
３）アスパラギン（Ｎ）、グルタミン（Ｑ）；
４）アルギニン（Ｒ）、リジン（Ｋ）；
５）イソロイシン（Ｉ）、ロイシン（Ｌ）、メチオニン（Ｍ）、バリン（Ｖ）；
６）フェニルアラニン（Ｆ）、チロシン（Ｙ）、トリプトファン（Ｗ）；
７）セリン（Ｓ）、トレオニン（Ｔ）；および
８）システイン（Ｃ）、メチオニン（Ｍ）

概要
類のない機能性および構造を有する新規Ｃａｓ酵素の発見は、デオキシリボ核酸（ＤＮＡ）編集技術をさらに破壊する潜在能力を提供し、速度、特異性、機能性および使いやすさを向上し得る。微生物のクラスター化され規則的に間隔があいた短い回文構造の繰り返し（ＣＲＩＳＰＲ）系の予想有病率、および多種多様な微生物種に関しては、比較的機能的に特徴付けられているＣＲＩＳＰＲ／Ｃａｓ酵素は文献中にはほぼ存在しない。膨大な数の微生物種は実験室の条件では容易に培養できない可能性があることが、部分的ではあるがこの理由である。多数の微生物種を含有する天然環境適所からのメタゲノムシーケンシングは、既知の新規ＣＲＩＳＰＲ／Ｃａｓ系の数を劇的に増加させ、新規オリゴヌクレオチド編集機能性の発見を加速度的に進行させる潜在能力を提供し得る。こうしたアプローチの有益性の最近の例は、２０１６年に発見された天然微生物の群集のメタゲノム解析からのＣａｓＸ／ＣａｓＹＣＲＩＳＰＲ系により実証されている。

ＣＲＩＳＰＲ／Ｃａｓ系は、微生物の適応免疫系として機能すると説明されているＲＮＡ依存性ヌクレアーゼ複合体である。通常、ＣＲＩＳＰＲ／Ｃａｓ系は、ＣＲＩＳＰＲ（クラスター化され規則的に間隔があいた短い回文構造の繰り返し）オペロンまたは遺伝子座に生じる。これは２つの部分：（ｉ）ＲＮＡベースの標的要素をコードする、等しく短いスペーサー配列で分離された短い反復配列のアレイ（３０～４０ｂｐ）と、（ｉｉ）アクセサリータンパク質／酵素に加えてＲＮＡベースの標的要素によって向けられたヌクレアーゼポリペプチドをコードするＣａｓをコードするＯＲＦと、を一般に含む。特定の標的核酸配列を標的化する有効なヌクレアーゼは、（ｉ）第１の６～８核酸の標的（標的シード）とｃｒＲＮＡガイド間の相補的なハイブリダイゼーションと、（ｉｉ）定義された標的シード近傍内でのプロトスペーサー隣接モチーフ（ＰＡＭ）配列の存在と、の両方を一般には必要とする（ＰＡＭは通常、宿主ゲノム内では一般には表れない）。系の正確な機能および構成に応じて、ＣＲＩＳＰＲ－Ｃａｓ系は、共通する機能特性および進化的類似性に基づいて２つのクラス、５つの型、および１６のサブタイプに一般には構成される（図１を参照されたい）。

クラスＩのＣＲＩＳＰＲ－Ｃａｓ系は大きなマルチサブユニットのエフェクター複合体を有し、Ｉ型、ＩＩＩ型およびＩＶ型を含む。クラスＩＩのＣＲＩＳＰＲ－Ｃａｓ系は、単一ポリペプチドマルチドメインヌクレアーゼエフェクターを一般に有し、ＩＩ型、Ｖ型およびＶＩ型を含む。

ＩＩ型のＣＲＩＳＰＲ－Ｃａｓ系は、構成成分に関しては最も単純であると考えられる。ＩＩ型のＣＲＩＳＰＲ－Ｃａｓ系では、ＣＲＩＳＰＲアレイの成熟ｃｒＲＮＡのプロセシングは、特別なエンドヌクレアーゼサブユニットの存在を必要としないが、むしろアレイリピート配列に相補的な領域を有する小さなトランスコードｃｒＲＮＡ（ｔｒａｃｒＲＮＡ）を必要とする。このｔｒａｃｒＲＮＡは、対応するエフェクターヌクレアーゼ（例えば、Ｃａｓ９）とリピート配列の両方と相互作用して前駆体ｄｓＲＮＡ構造を形成する。この構造は、内在性リボヌクレアーゼＩＩＩで切断されて、ｔｒａｃｒＲＮＡとｃｒＲＮＡの両方が添加された成熟エフェクター酵素を生成する。ＣａｓＩＩヌクレアーゼはＤＮＡヌクレアーゼとして知られている。ＩＩ型エフェクターは、ＲｕｖＣ様ヌクレアーゼドメインのフォールド内に挿入された無関係のＨＮＨヌクレアーゼドメインを有するリボヌクレアーゼＨフォールドを取り入れたＲｕｖＣ様エンドヌクレアーゼドメインからなる構造を一般に示す。ＲｕｖＣ様ドメインは、標的（例えばｃｒＲＮＡに相補的）ＤＮＡ鎖の切断の原因となるが、ＨＮＨドメインは置換されたＤＮＡ鎖の切断の原因となる。

Ｖ型ＣＲＩＳＰＲ－Ｃａｓ系は、ＲｕｖＣ様ドメインを含む、ＩＩ型エフェクターに類似するヌクレアーゼエフェクター（例えば、Ｃａｓ１２）構造により特徴付けられる。ＩＩ型と同様に、大部分（ただし全てではない）のＶ型ＣＲＩＳＰＲ系は、ｐｒｅ－ｃｒＲＮＡを成熟ｃｒＲＮＡにプロセシングするためにｔｒａｃｒＲＮＡを使用する。ただし、このｐｒｅ－ｃｒＲＮＡを複数のｃｒＲＮＡに切断するためにリボヌクレアーゼＩＩＩを必要とするＩＩ型系とは異なり、Ｖ型系はｐｒｅ－ｃｒＲＮＡを切断するためにエフェクターヌクレアーゼ自体を使用することが可能である。ＩＩ型のＣＲＩＳＰＲ－Ｃａｓ系と同様に、Ｖ型ＣＲＩＳＰＲ－Ｃａｓ系はさらにＤＮＡヌクレアーゼとして知られている。ＩＩ型のＣＲＩＳＰＲ－Ｃａｓ系とは異なり、いくつかのＶ型酵素（例えば、Ｃａｓ１２ａ）は、二本鎖標的配列の第１のｃｒＲＮＡ特異性切断により活性化される強力な一本鎖非特異的デオキシリボヌクレアーゼ活性を有することが明らかとなっている。

ＣＲＩＳＰＲ－Ｃａｓ系は、その標的能力および使いやすさから選択される遺伝子編集技術として、近年台頭してきた。最も一般的に使用される系は、クラス２のＩＩ型ＳｐＣａｓ９およびクラス２のＶ－Ａ型Ｃａｓ１２ａ（以前はＣｐｆ１）である。細胞における報告された特異性が他のヌクレアーゼよりも高く、オフターゲット作用がより少ないまたは全くないことから、特にＶ－Ａ型系はさらに広く使用されるようになっている。Ｖ－Ａ系はまた、ガイドＲＮＡが小さく（ＳｐＣａｓ９がおよそ１００ｎｔであるのと比較すると４２～４４ヌクレオチド）、ＣＲＩＳＰＲアレイによる転写後にヌクレアーゼ自体によってプロセシングされ、複数の遺伝子編集を伴う複合的な用途が単純化される。さらには、Ｖ－Ａ系はねじれ形の切断部位を有する。これは、マイクロホモロジー依存性標的組込み（ＭＩＴＩ）といった依存性修復経路を推進する。

最も一般的に使用されているＶ－Ａ型酵素は、選択された標的部位である５’－ＴＴＴＶ－３’（ラクノスピラ・バクテリウムＮＤ２００６（ＬｂＣａｓ１２ａ）およびアシダミノコッカス種（ＡｓＣａｓ１２ａ）について）ならびに５’－ＴＴＶ－３’（フランシセラ・ノビシダ（ＦｎＣａｓ１２ａ））に隣接する５’プロトスペーサー隣接モチーフ（ＰＡＭ）を必要とする。相同分子種の近年の調査により、哺乳動物細胞の培養物（例えば、ＹＴＶ、ＹＹＮまたはＴＴＮ）でも活性である、制限が少ないＰＡＭ配列を有するタンパク質が明らかとなった。ただし、これらの酵素はＶ－Ａ生物多様性および標的能力を完全に包含するわけではなく、全ての可能な能力およびＰＡＭ配列の要件を表さない可能性がある。ここでは、Ｖ－Ａ型ヌクレアーゼの多数のメタゲノムから数千のゲノムフラグメントを取り出した。Ｖ－Ａ酵素の既知の多様性は拡張されている可能性があり、新規系は高度な標的化が可能であり、コンパクトかつ正確な遺伝子編集薬に発展している可能性がある。

ＭＧ酵素
Ｖ－Ａ型ＣＲＩＳＰＲ系は、様々なゲノム編集用途における使用に急速に採用されている。これらのプログラム可能なヌクレアーゼは、微生物の適応免疫系の一部であり、その天然での多様性は未だほぼ調査されていない。Ｖ－Ａ型ＣＲＩＳＰＲ酵素の新規ファミリーは、様々な複合環境から収集されたメタゲノムの大規模解析により同定され、これらの系の代表物が遺伝子編集プラットフォームに発展した。ヌクレアーゼは系統学的に多様であり（図４Ａを参照されたい）、特定のモチーフを有するシングルガイドＲＮＡを認識する。こうした系の大部分は未培養の生物に由来しており、そのいくつかは同一のＣＲＩＳＰＲオペロン内に異なるＶ型エフェクターをコードする。生化学解析により、予想されていなかったＰＡＭ多様性が明らかとなった（図４Ｂを参照されたい）。これは、これらの系が様々なゲノム編集用途を推進させるであろうことを示している。ガイド配列の単純さおよびヒト細胞株における活性は、遺伝子治療および細胞治療における有用性を示唆している。

いくつかの態様では、本開示は新規Ｖ－Ｌ型候補を提供する（図２７を参照されたい）。Ｖ－Ｌ型は新規サブタイプであり得、いくつかのサブタイプは同定され得る。これらのヌクレアーゼは、約１０００～１１００アミノ酸長である。Ｖ－Ｌ型は、Ｖ－Ａ型エフェクターとして同一のＣＲＩＳＰＲ遺伝子座に見出すことができる。Ｖ－Ｌ候補について、ＲｕｖＣ触媒残基が同定され得、これらのＶ－Ｌ型候補はｔｒａｃｒＲＮＡを必要としない可能性がある。Ｖ－Ｌ型の一例は、本明細書に説明されているＭＧ６０ヌクレアーゼである（図２８および図３２を参照されたい）。

いくつかの態様では、本開示はより小さなＶ型エフェクターを提供する（図３０を参照されたい）。かかるエフェクターは小さな推定エフェクターであり得る。これらのエフェクターは送達を単純化し、治療用途を拡大し得る。

いくつかの態様では、本開示は新規Ｖ型エフェクターを提供する。こうしたエフェクターは、本明細書に説明されているＭＧ７０であり得る（図２９を参照されたい）。ＭＧ７０は約３７３アミノ酸長の超小型酵素であり得る。ＭＧ７０は、Ｎ末端に単一のトランスポザーゼドメインを有し得、予想されるｔｒａｃｒＲＮＡを有し得る（図３０および図３２を参照されたい）。

いくつかの態様では、本開示はより小さなＶ型エフェクターを提供する（図３１を参照されたい）。こうしたエフェクターは、本明細書に説明されているＭＧ８１であり得る。ＭＧ８１は約５００～７００アミノ酸長であり得、ＲｕｖＣ、およびＨＴＨＤＮＡ結合ドメインを含有し得る。

一態様では、本開示は、メタゲノムシーケンシングにより発見された遺伝子操作されたヌクレアーゼ系を提供する。いくつかの場合では、メタゲノムシーケンシングは試料上で行われる。いくつかの場合では、試料は様々な環境から収集され得る。こうした環境はヒトマイクロバイオーム、動物のマイクロバイオーム、高温の環境、低温の環境であり得る。こうした環境は沈降物を含み得る。本明細書に説明されている遺伝子操作されたヌクレアーゼ系のこうした環境の種類の例は図２に見出すことができる。

一態様では、本開示は、（ａ）エンドヌクレアーゼを含む遺伝子操作されたヌクレアーゼ系を提供する。いくつかの場合では、エンドヌクレアーゼはＣａｓエンドヌクレアーゼである。いくつかの場合では、エンドヌクレアーゼはクラス２のＶ型Ｃａｓエンドヌクレアーゼである。いくつかの場合では、エンドヌクレアーゼはクラス２のＶ－Ａ型Ｃａｓエンドヌクレアーゼである。いくつかの場合では、エンドヌクレアーゼは未培養の微生物に由来する。エンドヌクレアーゼはＲｕｖＣドメインを含み得る。いくつかの場合では、遺伝子操作されたヌクレアーゼ系は（ｂ）遺伝子操作されたガイドＲＮＡを含む。いくつかの場合では、遺伝子操作されたガイドＲＮＡはエンドヌクレアーゼと複合体を形成するように構成されている。いくつかの場合では、遺伝子操作されたガイドＲＮＡはスペーサー配列を含む。いくつかの場合では、スペーサー配列は標的核酸配列にハイブリダイズするように構成されている。

一態様では、本開示は、（ａ）エンドヌクレアーゼを含む遺伝子操作されたヌクレアーゼ系を提供する。いくつかの場合では、エンドヌクレアーゼは配列番号１～３４７０のうちいずれか１つに対して少なくとも約７０％の配列同一性を有する。いくつかの場合では、エンドヌクレアーゼは、配列番号１～３４７０のうちいずれか１つに対して少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、または少なくとも約９９％の同一性を有する。

いくつかの場合では、エンドヌクレアーゼは、配列番号１～３４７０のうちいずれか１つに対して少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％の同一性を有するバリアントを含む。いくつかの場合では、エンドヌクレアーゼは配列番号１～３４７０のうちいずれか１つに対して実質的に同一であり得る。

いくつかの場合では、遺伝子操作されたヌクレアーゼ系は遺伝子操作されたガイドＲＮＡを含む。いくつかの場合では、遺伝子操作されたガイドＲＮＡはエンドヌクレアーゼと複合体を形成するように構成されている。いくつかの場合では、遺伝子操作されたガイドＲＮＡはスペーサー配列を含む。いくつかの場合では、スペーサー配列は標的核酸配列にハイブリダイズするように構成されている。

一態様では、本開示は（ａ）エンドヌクレアーゼを含む遺伝子操作されたヌクレアーゼ系を提供する。いくつかの場合では、エンドヌクレアーゼはプロトスペーサー隣接モチーフ（ＰＡＭ）配列に結合するように構成されている。いくつかの場合では、ＰＡＭ配列は配列番号３８６３～３９１３のうちいずれか１つに対して実質的に同一である。いくつかの場合では、ＰＡＭ配列は配列番号３８６３～３９１３のうちいずれか１つである。いくつかの場合では、エンドヌクレアーゼはＣａｓエンドヌクレアーゼである。いくつかの場合では、エンドヌクレアーゼはクラス２のＣａｓエンドヌクレアーゼである。いくつかの場合では、エンドヌクレアーゼはクラス２のＶ型Ｃａｓエンドヌクレアーゼである。いくつかの場合では、エンドヌクレアーゼはクラス２のＶ－Ａ型Ｃａｓエンドヌクレアーゼである。いくつかの場合では、遺伝子操作されたヌクレアーゼ系は（ｂ）遺伝子操作されたガイドＲＮＡを含む。いくつかの場合では、遺伝子操作されたガイドＲＮＡはエンドヌクレアーゼと複合体を形成するように構成されている。いくつかの場合では、遺伝子操作されたガイドＲＮＡはスペーサー配列を含む。いくつかの場合では、スペーサー配列は標的核酸配列にハイブリダイズするように構成されている。

いくつかの場合では、エンドヌクレアーゼはＣｐｆ１またはＣｍｓ１エンドヌクレアーゼではない。いくつかの場合では、エンドヌクレアーゼはジンクフィンガー様ドメインをさらに含む。

いくつかの場合では、ガイドＲＮＡは、配列番号３４７１、３５３９、３５５１～３５５９、３６０８～３６０９、３６１２、３６３６～３６３７、３６４０～３６４１、３６４４～３６４５、３６４８～３６４９、３６５２～３６５３、３６５６～３６５７、３６６０～３６６１、３６６４～３６６７、３６７１～３６７２、３６７７～３６７８、３６９５～３６９６、３７２９～３７３０、３７３４～３７３５または３８５１～３８５７の最初の１９ヌクレオチドまたは非縮重ヌクレオチドに対して少なくとも８０％の配列同一性を有する配列を含む。いくつかの場合では、ガイドＲＮＡは、配列番号３４７１、３５３９、３５５１～３５５９、３６０８～３６０９、３６１２、３６３６～３６３７、３６４０～３６４１、３６４４～３６４５、３６４８～３６４９、３６５２～３６５３、３６５６～３６５７、３６６０～３６６１、３６６４～３６６７、３６７１～３６７２、３６７７～３６７８、３６９５～３６９６、３７２９～３７３０、３７３４～３７３５、または３８５１～３８５７の最初の１９ヌクレオチドまたは非縮重ヌクレオチドに対して少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、または少なくとも約９９％の同一性を有する配列を含む。いくつかの場合では、ガイドＲＮＡは、配列番号３４７１、３５３９、３５５１～３５５９、３６０８～３６０９、３６１２、３６３６～３６３７、３６４０～３６４１、３６４４～３６４５、３６４８～３６４９、３６５２～３６５３、３６５６～３６５７、３６６０～３６６１、３６６４～３６６７、３６７１～３６７２、３６７７～３６７８、３６９５～３６９６、３７２９～３７３０、３７３４～３７３５、または３８５１～３８５７の最初の１９ヌクレオチドまたは非縮重ヌクレオチドに対して少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、または少なくとも約９９％の同一性を有するバリアントを含む。いくつかの場合では、ガイドＲＮＡは、配列番号３４７１、３５３９、３５５１～３５５９、３６０８～３６０９、３６１２、３６３６～３６３７、３６４０～３６４１、３６４４～３６４５、３６４８～３６４９、３６５２～３６５３、３６５６～３６５７、３６６０～３６６１、３６６４～３６６７、３６７１～３６７２、３６７７～３６７８、３６９５～３６９６、３７２９～３７３０、３７３４～３７３５、または３８５１～３８５７の最初の１９ヌクレオチドまたは非縮重ヌクレオチドに対して実質的に同一である配列を含む。

いくつかの場合では、ガイドＲＮＡは、配列番号３４７１、３５３９、３５５１～３５５９、３６０８～３６０９、３６１２、３６３６～３６３７、３６４０～３６４１、３６４４～３６４５、３６４８～３６４９、３６５２～３６５３、３６５６～３６５７、３６６０～３６６１、３６６４～３６６７、３６７１～３６７２、３６７７～３６７８、３６９５～３６９６、３７２９～３７３０、３７３４～３７３５、または３８５１～３８５７の最初の１９ヌクレオチドまたは非縮重ヌクレオチドに対して少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、または少なくとも約９９％の同一性を有する配列を含む。いくつかの場合では、エンドヌクレアーゼは遺伝子操作されたガイドＲＮＡに結合するように構成されている。いくつかの場合では、Ｃａｓエンドヌクレアーゼは遺伝子操作されたガイドＲＮＡに結合するように構成されている。いくつかの場合では、クラス２のＣａｓエンドヌクレアーゼは遺伝子操作されたガイドＲＮＡに結合するように構成されている。いくつかの場合では、クラス２のＶ型Ｃａｓエンドヌクレアーゼは遺伝子操作されたガイドＲＮＡに結合するように構成されている。いくつかの場合では、クラス２のＶ－Ａ型Ｃａｓエンドヌクレアーゼは遺伝子操作されたガイドＲＮＡに結合するように構成されている。

いくつかの場合では、エンドヌクレアーゼは、配列番号３８６３～３９１３のうちいずれか１つを含むプロトスペーサー隣接モチーフ（ＰＡＭ）配列に結合するように構成されている。

いくつかの場合では、ガイドＲＮＡは、真核生物、真菌、植物、哺乳動物またはヒトゲノムのポリヌクレオチド配列に相補的な配列を含む。いくつかの場合では、ガイドＲＮＡは、真核生物ゲノムのポリヌクレオチド配列に相補的な配列を含む。いくつかの場合では、ガイドＲＮＡは、真菌ゲノムのポリヌクレオチド配列に相補的な配列を含む。いくつかの場合では、ガイドＲＮＡは、植物ゲノムのポリヌクレオチド配列に相補的な配列を含む。いくつかの場合では、ガイドＲＮＡは、哺乳動物ゲノムのポリヌクレオチド配列に相補的な配列を含む。いくつかの場合では、ガイドＲＮＡは、ヒトゲノムのポリヌクレオチド配列に相補的な配列を含む。

いくつかの場合では、ガイドＲＮＡは３０～２５０ヌクレオチド長である。いくつかの場合では、ガイドＲＮＡは４２～４４ヌクレオチド長である。いくつかの場合では、ガイドＲＮＡは４２ヌクレオチド長である。いくつかの場合では、ガイドＲＮＡは４３ヌクレオチド長である。いくつかの場合では、ガイドＲＮＡは４４ヌクレオチド長である。いくつかの場合では、ガイドＲＮＡは８５～２４５ヌクレオチド長である。いくつかの場合では、ガイドＲＮＡは９０ヌクレオチド長超である。いくつかの場合では、ガイドＲＮＡは２４５ヌクレオチド長未満である。

いくつかの場合では、エンドヌクレアーゼは１つ以上の核局在化配列（ＮＬＳ）を有するバリアントを含み得る。ＮＬＳは、エンドヌクレアーゼのＮ末端またはＣ末端近傍であり得る。ＮＬＳは、配列番号３９３８～３９５３のうちいずれか１つの、または配列番号３９３８～３９５３のうちいずれか１つに対して少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、もしくは少なくとも約９９％の同一性を有するバリアントのＮ末端またはＣ末端に付加され得る。いくつかの場合では、ＮＬＳは、配列番号３９３８～３９５３のうちいずれか１つに対して実質的に同一の配列を含み得る。

いくつかの場合では、遺伝子操作されたヌクレアーゼ系は一本鎖または二本鎖ＤＮＡ修復テンプレートをさらに含む。いくつかの場合では、遺伝子操作されたヌクレアーゼ系は一本鎖ＤＮＡ修復テンプレートをさらに含む。いくつかの場合では、遺伝子操作されたヌクレアーゼ系は二本鎖ＤＮＡ修復テンプレートをさらに含む。いくつかの場合では、一本鎖または二本鎖ＤＮＡ修復テンプレートは、５’～３’で、すなわち当該標的デオキシリボ核酸配列に対して５’で少なくとも２０ヌクレオチドの配列を含む第１のホモロジーアームと、少なくとも１０ヌクレオチドの合成ＤＮＡ配列と、当該標的配列に対して３’で少なくとも２０ヌクレオチドの配列を含む第２のホモロジーアームと、をさらに含み得る。

いくつかの場合では、第１のホモロジーアームは、少なくとも４０、少なくとも５０、少なくとも６０、少なくとも７０、少なくとも８０、少なくとも９０、少なくとも１００、少なくとも１１０、少なくとも１２０、少なくとも１３０、少なくとも１４０、少なくとも１５０、少なくとも１７５、少なくとも２００、少なくとも２５０、少なくとも３００、少なくとも４００、少なくとも５００、少なくとも７５０、または少なくとも１０００ヌクレオチドの配列を含む。いくつかの場合では、第２のホモロジーアームは、少なくとも４０、少なくとも５０、少なくとも６０、少なくとも７０、少なくとも８０、少なくとも９０、少なくとも１００、少なくとも１１０、少なくとも１２０、少なくとも１３０、少なくとも１４０、少なくとも１５０、少なくとも１７５、少なくとも２００、少なくとも２５０、少なくとも３００、少なくとも４００、少なくとも５００、少なくとも７５０、または少なくとも１０００ヌクレオチドの配列を含む。

いくつかの場合では、第１のホモロジーアームまたは第２のホモロジーアームは、原核生物のゲノム配列に相同である。いくつかの場合では、第１のホモロジーアームまたは第２のホモロジーアームは、細菌のゲノム配列に相同である。いくつかの場合では、第１のホモロジーアームまたは第２のホモロジーアームは、真菌のゲノム配列に相同である。いくつかの場合では、第１のホモロジーアームまたは第２のホモロジーアームは、真核生物のゲノム配列に相同である。

いくつかの場合では、遺伝子操作されたヌクレアーゼ系はＤＮＡ修復テンプレートをさらに含む。ＤＮＡ修復テンプレートは、二本鎖ＤＮＡセグメントを含み得る。二本鎖ＤＮＡセグメントは、１つの一本鎖ＤＮＡセグメントと隣接し得る。二本鎖ＤＮＡセグメントは、２つの一本鎖ＤＮＡセグメントと隣接し得る。いくつかの場合では、一本鎖ＤＮＡセグメントは二本鎖ＤＮＡセグメントの５’末端にコンジュゲートされている。いくつかの場合では、一本鎖ＤＮＡセグメントは二本鎖ＤＮＡセグメントの３’末端にコンジュゲートされている。

いくつかの場合では、一本鎖ＤＮＡセグメントは１～１５ヌクレオチド塩基の長さを有する。いくつかの場合では、一本鎖ＤＮＡセグメントは４～１０ヌクレオチド塩基の長さを有する。いくつかの場合では、一本鎖ＤＮＡセグメントは４ヌクレオチド塩基の長さを有する。いくつかの場合では、一本鎖ＤＮＡセグメントは５ヌクレオチド塩基の長さを有する。いくつかの場合では、一本鎖ＤＮＡセグメントは６ヌクレオチド塩基の長さを有する。いくつかの場合では、一本鎖ＤＮＡセグメントは７ヌクレオチド塩基の長さを有する。いくつかの場合では、一本鎖ＤＮＡセグメントは８ヌクレオチド塩基の長さを有する。いくつかの場合では、一本鎖ＤＮＡセグメントは９ヌクレオチド塩基の長さを有する。いくつかの場合では、一本鎖ＤＮＡセグメントは１０ヌクレオチド塩基の長さを有する。

いくつかの場合では、一本鎖ＤＮＡセグメントはスペーサー配列内の配列に相補的なヌクレオチド配列を有する。いくつかの場合では、二本鎖ＤＮＡ配列は、バーコード、オープンリーディングフレーム、エンハンサー、プロモーター、タンパク質コード配列、ｍｉＲＮＡコード配列、ＲＮＡコード配列、または導入遺伝子を含む。

いくつかの場合では、遺伝子操作されたヌクレアーゼ系はＭｇ^２＋の源をさらに含む。

いくつかの場合では、ガイドＲＮＡは少なくとも８塩基対のリボヌクレオチドを含むヘアピンを含む。いくつかの場合では、ガイドＲＮＡは少なくとも９塩基対のリボヌクレオチドを含むヘアピンを含む。いくつかの場合では、ガイドＲＮＡは少なくとも１０塩基対のリボヌクレオチドを含むヘアピンを含む。いくつかの場合では、ガイドＲＮＡは少なくとも１１塩基対のリボヌクレオチドを含むヘアピンを含む。いくつかの場合では、ガイドＲＮＡは少なくとも１２塩基対のリボヌクレオチドを含むヘアピンを含む。

いくつかの場合では、エンドヌクレアーゼは、配列番号１４１、２１５、２２９、２６１もしくは１７１１～１７２１のうちいずれか１つのバリアント、１４１、２１５、２２９、２６１もしくは１７１１～１７２１のバリアントに対して少なくとも７０％同一の配列、またはそのバリアントを含む。いくつかの場合では、エンドヌクレアーゼは、配列番号１４１、２１５、２２９、２６１、もしくは１７１１～１７２１のうちいずれか１つのバリアントに対して少なくとも７５％同一の配列、またはそのバリアントを含む。いくつかの場合では、エンドヌクレアーゼは、配列番号１４１、２１５、２２９、２６１、もしくは１７１１～１７２１のうちいずれか１つのバリアントに対して少なくとも８０％同一の配列、またはそのバリアントを含む。いくつかの場合では、エンドヌクレアーゼは、配列番号１４１、２１５、２２９、２６１、もしくは１７１１～１７２１のうちいずれか１つのバリアントに対して少なくとも８５％同一の配列、またはそのバリアントを含む。いくつかの場合では、エンドヌクレアーゼは、配列番号１４１、２１５、２２９、２６１、もしくは１７１１～１７２１のうちいずれか１つのバリアントに対して少なくとも９０％同一の配列、またはそのバリアントを含む。いくつかの場合では、エンドヌクレアーゼは、配列番号１４１、２１５、２２９、２６１、もしくは１７１１～１７２１のうちいずれか１つのバリアントに対して少なくとも９５％同一の配列、またはそのバリアントを含む。

いくつかの場合では、ガイドＲＮＡ構造は、配列番号３６０８の最初の１９ヌクレオチドまたは非縮重ヌクレオチドに対して少なくとも７０％同一の配列を含む。いくつかの場合では、ガイドＲＮＡ構造は、配列番号３６０８の最初の１９ヌクレオチドまたは非縮重ヌクレオチドに対して少なくとも７５％同一の配列を含む。いくつかの場合では、ガイドＲＮＡ構造は、配列番号３６０８の最初の１９ヌクレオチドまたは非縮重ヌクレオチドに対して少なくとも８０％同一の配列を含む。いくつかの場合では、ガイドＲＮＡ構造は、配列番号３６０８の最初の１９ヌクレオチドまたは非縮重ヌクレオチドに対して少なくとも８５％同一の配列を含む。いくつかの場合では、ガイドＲＮＡ構造は、配列番号３６０８の最初の１９ヌクレオチドまたは非縮重ヌクレオチドに対して少なくとも９０％同一の配列を含む。いくつかの場合では、ガイドＲＮＡ構造は、配列番号３６０８の最初の１９ヌクレオチドまたは非縮重ヌクレオチドに対して少なくとも９５％同一の配列を含む。いくつかの場合では、エンドヌクレアーゼは配列番号３８６３～３９１３のうちいずれか１つを含むＰＡＭに結合するように構成されている。

いくつかの場合では、配列は、Ｓｍｉｔｈ－Ｗａｔｅｒｍａｎホモロジー検索アルゴリズムパラメータを用いるＢＬＡＳＴＰ、ＣＬＵＳＴＡＬＷ、ＭＵＳＣＬＥ、もしくはＭＡＦＦＴアルゴリズム、またはＣＬＵＳＴＡＬＷアルゴリズムによって決定され得る。配列同一性は、３のワード長（Ｗ）、１０の期待値（Ｅ）のパラメータ、および１１の存在、１の伸長でのギャップコストを設定しているＢＬＯＳＵＭ６２スコア行列を使用する、ならびに条件付き組合せスコア行列の調整を使用する、当該ＢＬＡＳＴＰホモロジー検索アルゴリズムによって決定されてもよい。

一態様では、本開示は（ａ）ＤＮＡ標的セグメントを含む遺伝子操作されたガイドＲＮＡを提供する。いくつかの場合では、ＤＮＡ標的セグメントは、標的配列に相補的であるヌクレオチド配列を含む。いくつかの場合では、標的配列は標的ＤＮＡ分子中にある。いくつかの場合では、遺伝子操作されたガイドＲＮＡは（ｂ）タンパク質結合セグメントを含む。いくつかの場合では、タンパク質結合セグメントは、ヌクレオチドの２つの相補的な並びを含む。いくつかの場合では、ヌクレオチドの２つの相補的な並びはハイブリダイズして二本鎖ＲＮＡ（ｄｓＲＮＡ）二重鎖を形成する。いくつかの場合では、ヌクレオチドの２つの相補的な並びは、介在性ヌクレオチドを用いて互いに共有結合されている。いくつかの場合では、遺伝子操作されたガイドリボ核酸ポリヌクレオチドは、エンドヌクレアーゼと複合体を形成することができる。いくつかの場合では、エンドヌクレアーゼは、配列番号１～３４７０のうちいずれか１つに対して少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、または少なくとも約９９％の同一性を有する。いくつかの場合では、複合体は標的ＤＮＡ分子の標的配列を標的化する。

いくつかの場合では、ＤＮＡ標的セグメントは、ヌクレオチドの２つの相補的な並びの両方の３’に位置づけられている。いくつかの場合では、タンパク質結合セグメントは、配列番号３６０８の最初の１９ヌクレオチドまたは非縮重ヌクレオチドに対して少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、または少なくとも約９９％の同一性を有する配列を含む。

いくつかの場合では、二本鎖ＲＮＡ（ｄｓＲＮＡ）二重鎖は、少なくとも８リボヌクレオチドを含む。いくつかの場合では、二本鎖ＲＮＡ（ｄｓＲＮＡ）二重鎖は、少なくとも９リボヌクレオチドを含む。いくつかの場合では、二本鎖ＲＮＡ（ｄｓＲＮＡ）二重鎖は、少なくとも１０リボヌクレオチドを含む。いくつかの場合では、二本鎖ＲＮＡ（ｄｓＲＮＡ）二重鎖は、少なくとも１１リボヌクレオチドを含む。いくつかの場合では、二本鎖ＲＮＡ（ｄｓＲＮＡ）二重鎖は、少なくとも１２リボヌクレオチドを含む。

いくつかの場合では、デオキシリボ核酸ポリヌクレオチドは遺伝子操作されたガイドリボ核酸ポリヌクレオチドをコードする。

一態様では、本開示は遺伝子操作された核酸配列を含む核酸を提供する。いくつかの場合では、遺伝子操作された核酸配列は生物での発現に最適化されている。いくつかの場合では、核酸はエンドヌクレアーゼをコードする。いくつかの場合では、エンドヌクレアーゼはＣａｓエンドヌクレアーゼである。いくつかの場合では、エンドヌクレアーゼはクラス２のエンドヌクレアーゼである。いくつかの場合では、エンドヌクレアーゼはクラス２のＶ型Ｃａｓエンドヌクレアーゼである。いくつかの場合では、エンドヌクレアーゼはクラス２のＶ－Ａ型Ｃａｓエンドヌクレアーゼである。いくつかの場合では、エンドヌクレアーゼは未培養の微生物に由来する。いくつかの場合では、生物は未培養の生物ではない。

いくつかの場合では、エンドヌクレアーゼは、配列番号１～３４７０のうちいずれか１つに対して少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％の配列同一性を有するバリアントを含む。

いくつかの場合では、エンドヌクレアーゼは１つ以上の核局在化配列（ＮＬＳ）を有するバリアントを含み得る。ＮＬＳは、エンドヌクレアーゼのＮ末端またはＣ末端近傍であり得る。ＮＬＳは、配列番号３９３８～３９５３のうちいずれか１つの、または配列番号３９３８～３９５３のうちいずれか１つに対して少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、もしくは少なくとも約９９％の配列同一性を有するバリアントのＮ末端またはＣ末端に付加され得る。

いくつかの場合では、生物は原核生物である。いくつかの場合では、生物は細菌である。いくつかの場合では、生物は真核生物である。いくつかの場合では、生物は真菌である。いくつかの場合では、生物は植物である。いくつかの場合では、生物は哺乳動物である。いくつかの場合では、生物はげっ歯類である。いくつかの場合では、生物はヒトである。

一態様では、本開示は遺伝子操作されたベクターを提供する。いくつかの場合では、遺伝子操作されたベクターはエンドヌクレアーゼをコードする核酸配列を含む。いくつかの場合では、エンドヌクレアーゼはＣａｓエンドヌクレアーゼである。いくつかの場合では、エンドヌクレアーゼはクラス２のＣａｓエンドヌクレアーゼである。いくつかの場合では、エンドヌクレアーゼはクラス２のＶ型Ｃａｓエンドヌクレアーゼである。いくつかの場合では、エンドヌクレアーゼはクラス２のＶ－Ａ型Ｃａｓエンドヌクレアーゼである。いくつかの場合では、エンドヌクレアーゼは未培養の微生物に由来する。

いくつかの場合では、遺伝子操作されたベクターは本明細書に説明されている核酸を含む。いくつかの場合では、本明細書に説明されている核酸は、本明細書に説明されているデオキシリボ核酸ポリヌクレオチドである。いくつかの場合では、ベクターはプラスミド、ミニサークル、ＣＥＬｉＤ、アデノ随伴ウイルス（ＡＡＶ）由来のウイルス粒子、またはレンチウイルスである。

一態様では、本開示は本明細書に説明されているベクターを含む細胞を提供する。

一態様では、本開示はエンドヌクレアーゼを製造する方法を提供する。いくつかの場合では、方法は細胞を培養することを含む。

一態様では、本開示は、二本鎖デオキシリボ核酸ポリヌクレオチドを結合、切断、マーキングまたは修飾するための方法を提供する。この方法は、二本鎖デオキシリボ核酸ポリヌクレオチドをエンドヌクレアーゼと接触させることを含み得る。いくつかの場合では、エンドヌクレアーゼはＣａｓエンドヌクレアーゼである。いくつかの場合では、エンドヌクレアーゼはクラス２のＣａｓエンドヌクレアーゼである。いくつかの場合では、エンドヌクレアーゼはクラス２のＶ型Ｃａｓエンドヌクレアーゼである。いくつかの場合では、エンドヌクレアーゼはクラス２のＶ－Ａ型Ｃａｓエンドヌクレアーゼである。いくつかの場合では、エンドヌクレアーゼは遺伝子操作されたガイドＲＮＡを含む複合体中にある。いくつかの場合では、遺伝子操作されたガイドＲＮＡはエンドヌクレアーゼに結合するように構成されている。いくつかの場合では、遺伝子操作されたガイドＲＮＡは、二本鎖デオキシリボ核酸ポリヌクレオチドに結合するように構成されている。いくつかの場合では、遺伝子操作されたガイドＲＮＡは、エンドヌクレアーゼおよび二本鎖デオキシリボ核酸ポリヌクレオチドに結合するように構成されている。いくつかの場合では、二本鎖デオキシリボ核酸ポリヌクレオチドはプロトスペーサー隣接モチーフ（ＰＡＭ）を含む。いくつかの場合では、ＰＡＭは配列番号３８６３～３９１３のうちいずれか１つを含む配列を含む。

いくつかの場合では、二本鎖デオキシリボ核酸ポリヌクレオチドは、遺伝子操作されたガイドＲＮＡの配列に相補的な配列を含む第１の鎖と、ＰＡＭを含む第２の鎖と、を含む。いくつかの場合では、ＰＡＭは、遺伝子操作されたガイドＲＮＡの配列に相補的な配列の５’末端に直接隣接している。いくつかの場合では、エンドヌクレアーゼはＣｐｆ１エンドヌクレアーゼまたはＣｍｓ１エンドヌクレアーゼではない。いくつかの場合では、エンドヌクレアーゼは未培養の微生物に由来する。いくつかの場合では、二本鎖デオキシリボ核酸ポリヌクレオチドは、真核生物、植物、真菌、哺乳動物、げっ歯類、またはヒトの二本鎖デオキシリボ核酸ポリヌクレオチドである。いくつかの場合では、ＰＡＭ配列は配列番号３８６３～３９１３のうちいずれか１つを含む。

一態様では、本開示は標的核酸遺伝子座を修飾する方法を提供する。この方法は、本明細書に説明されている遺伝子操作されたヌクレアーゼ系を標的核酸遺伝子座に送達することを含み得る。いくつかの場合では、エンドヌクレアーゼは遺伝子操作されたガイドリボ核酸構造と複合体を形成するように構成されている。いくつかの場合では、標的核酸遺伝子座に複合体を結合する際に複合体が標的核酸遺伝子座を修飾するように複合体は構成されている。

いくつかの場合では、標的核酸遺伝子座を修飾することは、当該標的核酸遺伝子座を結合、標的核酸遺伝子座に切れ目をいれる、標的核酸遺伝子座を切断、または標的核酸遺伝子座をマーキングすることを含む。いくつかの場合では、標的核酸遺伝子座はデオキシリボ核酸（ＤＮＡ）またはリボ核酸（ＲＮＡ）を含む。いくつかの場合では、標的核酸はゲノムＤＮＡ、ウイルスＤＮＡ、ウイルスＲＮＡ、または細菌性ＤＮＡを含む。いくつかの場合では、標的核酸遺伝子座はインビトロである。いくつかの場合では、標的核酸遺伝子座は細胞内である。いくつかの場合では、細胞は原核生物細胞、細菌細胞、真核生物細胞、真菌細胞、植物細胞、動物細胞、哺乳動物細胞、げっ歯類細胞、霊長類細胞、またはヒト細胞である。

いくつかの場合では、遺伝子操作されたヌクレアーゼ系の標的核酸遺伝子座への送達は、本明細書に説明されている核酸または本明細書に説明されているベクターを送達することを含む。いくつかの場合では、遺伝子操作されたヌクレアーゼ系の標的核酸遺伝子座への送達は、エンドヌクレアーゼをコードするオープンリーディングフレームを含む核酸を送達することを含む。いくつかの場合では、核酸はプロモーターを含む。いくつかの場合では、エンドヌクレアーゼをコードするオープンリーディングフレームはプロモーターに動作可能に連結する。

いくつかの場合では、遺伝子操作されたヌクレアーゼ系の標的核酸遺伝子座への送達は、エンドヌクレアーゼをコードするオープンリーディングフレームを含有するキャップされたｍＲＮＡを送達することを含む。いくつかの場合では、遺伝子操作されたヌクレアーゼ系の標的核酸遺伝子座への送達は、翻訳されたポリペプチドを送達することを含む。いくつかの場合では、遺伝子操作されたヌクレアーゼ系の標的核酸遺伝子座への送達は、リボ核酸（ＲＮＡ）ｐｏｌＩＩＩプロモーターに動作可能に連結された遺伝子操作されたガイドＲＮＡをコードするデオキシリボ核酸（ＤＮＡ）を送達することを含む。

いくつかの場合では、エンドヌクレアーゼは、標的遺伝子座でまたは標的遺伝子座近傍で一本鎖切断または二本鎖切断を誘導する。いくつかの場合では、エンドヌクレアーゼは当該標的遺伝子座内で、または当該標的遺伝子座に対して３’でねじれ形の一本鎖切断を誘導する。

いくつかの場合では、エフェクターリピートモチーフを使用し、ＭＧヌクレアーゼのガイド設計を周知する。例えば、Ｖ－Ａ型系のプロセシングされたｇＲＮＡは、ＣＲＩＳＰＲリピートの最終２０～２２ヌクレオチドからなる。この配列は、（スペーサーとともに）ｃｒＲＮＡに合成されてもよく、考えられる標的のライブラリー上で切断するために、合成されたヌクレアーゼとともにインビトロで試験されてもよい。この方法を使用し、ＰＡＭが決定され得る。いくつかの場合では、Ｖ－Ａ型酵素は「ユニバーサル」ｇＲＮＡを使用し得る。いくつかの場合では、Ｖ型酵素は類のないｇＲＮＡを必要とし得る。

本開示の系は、例えば核酸の編集（例えば、遺伝子編集）、核酸分子への結合（例えば、配列特異的結合）などの様々な用途のために使用され得る。こうした系は例えば、対象に疾患を引き起こす可能性がある遺伝的に受け継がれた変異に対処（例えば、除去または置換）し、細胞におけるその機能を確認する目的で遺伝子を失活させるために使用され得る。また、疾患により引き起こされる遺伝要素を検出する診断ツール（例えば、逆転写ウイルスＲＮＡまたは疾患により引き起こされる変異をコードする増幅ＤＮＡ配列の切断による）として、特異的なヌクレオチド配列（例えば、細菌へと微生物耐性をコードする配列）を標的化および検出するため、プローブと組み合わせた不活化酵素としても使用され得る。さらには、ウイルスゲノムを標的化することでウイルスを不活性化する、またはウイルスの宿主細胞への感染を不可能なものとするために、遺伝子の追加または代謝経路の修正を行い、生物を遺伝子操作して有用な小分子、高分子または二次代謝産物を産生するために、進化的選択のために遺伝子ドライブ要素を確立するために、バイオセンサとして外来の小分子およびヌクレオチドにより細胞の摂動を検出するためにも使用され得る。

実施例１新規タンパク質のためのメタゲノム解析の方法
沈降物、土壌および動物からメタゲノム試料を収集した。ＺｙｍｏｂｉｏｍｉｃｓＤＮＡミニプレップキットを用いてデオキシリボ核酸（ＤＮＡ）を抽出し、ＩｌｌｕｍｉｎａＨｉＳｅｑ（登録商標）２５００上で配列決定した。土地所有者の同意の下に試料を収集した。クラスＩＩのＶ型Ｃａｓエフェクタータンパク質を含む既知のＣａｓタンパク質配列に基づいて生成された隠れマルコフモデルを使用し、メタゲノム配列データを検索し、新規Ｃａｓエフェクターを同定した（図２を参照されたい。これは、高熱試料などの試料型から同定された１ファミリーであるＭＧ２９で検出されたタンパク質の分布を示している）。この検索により同定された新規エフェクタータンパク質を既知のタンパク質にアラインメントし、可能性のある活性部位を同定した（図３を参照されたい。これは、様々な試料から同定された全てのＭＧ２９ファミリーエフェクターは、ＲｕｖＣＩ、ＲｕｖＣＩＩ、およびＲｕｖＣＩＩＩ触媒ドメインに由来する３つの触媒残基を有し、活性であると予想されることを示している）。このメタゲノムワークフローは、本明細書に説明されているＭＧ１１、ＭＧ１３、ＭＧ１９、ＭＧ２０、ＭＧ２６、ＭＧ２８、ＭＧ２９、ＭＧ３０、ＭＧ３１、ＭＧ３２、ＭＧ３７、ＭＧ５３、ＭＧ５４、ＭＧ５５、ＭＧ５６、ＭＧ５７、ＭＧ５８、ＭＧ５９、ＭＧ６０、ＭＧ６１、ＭＧ６２、ＭＧ７０、ＭＧ７５、ＭＧ７７、ＭＧ７８、ＭＧ７９、ＭＧ８０、ＭＧ８１、ＭＧ８２、ＭＧ８３、ＭＧ８４、ＭＧ８５、ＭＧ９０、およびＭＧ９１ファミリーの図をもたらした。エフェクタータンパク質をコードするゲノム遺伝子座に隣接するそれらの位置によって推定スペーサー配列を同定した。

実施例２新規タンパク質のためのメタゲノム解析の方法
１３個の動物のマイクロバイオーム、高温のバイオフィルムおよび沈降物試料を収集し、収集後に氷上またはＺｙｍｏＤＮＡ／ＲＮＡＳｈｉｅｌｄ中に保存した。ＱｉａｇｅｎＤＮｅａｓｙＰｏｗｅｒＳｏｉｌキットまたはＺｙｍｏＢＩＯＭＩＣＳＤＮＡミニプレップキットのいずれかを使用し、ＤＮＡを試料から抽出した。ＤＮＡシーケンシングライブラリーを構築し、４００～８００ｂｐの標的挿入サイズの対の１５０ｂｐリードを用いて（試料につき１０ＧＢのシーケンシングを標的化する）、ＵＣＢｅｒｋｅｌｅｙのＶｉｎｃｅｎｔＪ．ＣｏａｔｅｓＧｅｎｏｍｉｃｓＳｅｑｕｅｎｃｉｎｇＬａｂｏｒａｔｏｒｙにてＩｌｌｕｍｉｎａＨｉＳｅｑ４０００またはＮｏｖａｓｅｑ装置で配列決定を行った。ＮＣＢＩＳＲＡから、公的に利用可能であるメタゲノムシーケンシングデータをダウンロードした。ＢＢＭａｐ（ＢｕｓｈｎｅｌｌＢ．，ｓｏｕｒｃｅｆｏｒｇｅ．ｎｅｔ／ｐｒｏｊｅｃｔｓ／ｂｂｍａｐ／）を使用してシーケンシングリードを整え、Ｍｅｇａｈｉｔ１１を用いて組み立てた。Ｐｒｏｄｉｇａｌを用いてオープンリーディングフレームおよびタンパク質配列を予想した。既知のＶ－Ａ型ＣＲＩＳＰＲヌクレアーゼのＨＭＭプロファイルを作り、ＨＭＭＥＲ３（ｈｍｍｅｒ．ｏｒｇ）を使用し、予想される全てのタンパク質に対してこれを検索し、考えられるエフェクターを同定した。組み立てられたコンティグ上のＣＲＩＳＰＲアレイをＭｉｎｃｅｄ（ｈｔｔｐｓ：／／ｇｉｔｈｕｂ．ｃｏｍ／ｃｔＳｋｅｎｎｅｒｔｏｎ／ｍｉｎｃｅｄ）を用いて予想した。Ｋａｉｊｕを用いてタンパク質を分類に割り当て、全てのコードしたタンパク質が一致していることを見出すことでコンティグ分類を決定した。

ＭＡＦＦＴを用いて予想されるＶ型エフェクタータンパク質および参照（例えば、ＬｂＣａｓ１２ａ、ＡｓＣａｓ１２ａ、ＦｎＣａｓ１２ａ）エフェクタータンパク質をアラインメントし、ＦａｓＴｒｅｅ２を使用して系統学的系譜を推測した。この試験から回収された配列から構成される系統群を同定することで、新規ファミリーを表した。ファミリー内から、可能な限り多くの系統学的多様性をサンプリングする様式では、実験室での解析（すなわち、ＣＲＩＳＰＲアレイを用いて良好に組み立てられ、注釈を付けたコンティグでこれらを見出した）に必要な構成成分を含有する場合には、候補を選択した。多様なファミリーに由来する小さなエフェクターに優先順位を付けた（すなわち、広範囲のタンパク質配列を共有する代表物を有するファミリー）。触媒残基およびＰＡＭ相互作用残基を同定するため、ＭＵＳＣＬＥおよびＣｌｕｓｔａｌＷを使用し、選択された代表物および参照配列をアラインメントした。Ｖ－Ａ型系であるＴＣＴＡＣ－Ｎ－ＧＴＡＧＡ（１個～８個のＮ残基を含有する）に関連するモチーフについて、ＣＲＩＳＰＲアレイリピートを検索した。この解析から、代表的なＣＲＩＳＰＲアレイがこれらのモチーフ配列のうち１つを含有する場合には、ファミリーをＶ－Ａとして推定的に分類した。このデータセットを使用し、次にさらにファミリーを分類するために使用されるＶ－Ａファミリーに関連するＨＭＭプロファイルを同定した（図３３～図３７を参照されたい）。慣例ではコードする生物に基づいて新規Ｃａｓ１２ヌクレアーゼを命名するが、本明細書に説明されているヌクレアーゼに関してはこの命名を行うことが不可能である。したがって、慣例に最良の形で従うことを目的として、この系が組み立てたメタゲノムフラグメントに由来することを示すために接頭辞ＭＧを用いて本明細書に説明されている系を命名する。

多様な環境（土壌性マイクロバイオーム、好熱性マイクロバイオーム、沈降物マイクロバイオーム、ヒトマイクロバイオームおよび非ヒトマイクロバイオーム）から、１４０，８６７Ｍｂｐの組み立てたメタゲノムシーケンシングデータを取り出した。全体では、１１９個のゲノムフラグメントは、ＣＲＩＳＰＲアレイに隣接するＶ－Ａ型ヌクレアーゼと遠い関係にあるＣＲＩＳＰＲエフェクターをコードした（図４Ｂを参照したい）。Ｖ－Ａ型エフェクターを、互いに３０％未満の平均ペアワイズアミノ酸同一性を参照する、および参照配列（例えば、ＬｂＣａｓ１２ａ、ＡｓＣａｓ１２ａ、ＦｎＣａｓ１２ａ）を有する１４個の新規ファミリーに分類した。いくつかのエフェクターは、ＲｕｖＣドメインおよびαヘリカル認識ドメイン、ならびにＲｕｖＣＩ／ＣＩＩ／ＣＩＩＩドメインに由来する保存されたＤＥＤヌクレアーゼ触媒残基（複数の配列アラインメント中で同定される、例えば以下の表１Ａを参照されたい）を含有したが、これはこうしたエフェクターが活性ヌクレアーゼであることを示唆していた（図５～図７）。新規Ｖ－Ａ型ヌクレアーゼは、サイズにして８００未満から１，４００アミノ酸長の範囲であり（図５Ａを参照されたい）、それらの分類は、多様な門のアレイに及んでいた（図４Ａを参照されたい）。これは、考えられる水平伝播を示唆している。

Ｖ－Ａ型ＣＲＩＳＰＲ系を保有するいくつかのゲノムフラグメントはまた、ここではＶ－Ａ型プライム（Ｖ－Ａ’、図７Ａ）とも呼ばれる第２のエフェクターをコードしていた。例えば、Ｖ－Ａ’型ＭＧ２６－２は、Ｖ－Ａ型ＭＧ２６－１と１６．６％のみのアミノ酸同一性を共有しているが、同一のＣＲＩＳＰＲＣａｓオペロンにこれをコードしており、ＭＧ２６－１と同一のｃｒＲＮＡを共有し得る（図７Ｂ）。ヌクレアーゼドメインは何ら予想されていないが、ＭＧ２６－２は、複数の配列アラインメントにより同定された３つのＲｕｖＣ触媒残基を含有した（図７Ｂ）。

実施例３（一般プロトコール）ＰＡＭ配列の同定／確認
ｃｒＲＮＡおよびｃｒＲＮＡのスペーサーに相補的な配列の５’末端に隣接して配置された８個のランダム化ヌクレオチドを有するプラスミドライブラリーを用いてインキュベートすることで、ＣＲＩＳＰＲエフェクターによりインビトロで切断され得るＰＡＭ配列を同定した。この８個のランダム化ヌクレオチドが機能的ＰＡＭ配列を形成した場合、プラスミドを切断する。続いて、切断されたプラスミドの末端にアダプタを結合させることで機能的ＰＡＭ配列を同定し、続いてアダプタを含むＤＮＡフラグメントを配列決定した。大腸菌ライセートベースの発現系（ｍｙＴＸＴＬ、ＡｒｂｏｒＢｉｏｓｃｉｅｎｃｅｓ）で推定エンドヌクレアーゼを発現させた。Ｔ７プロモーターの制御下で、推定ヌクレアーゼをコードする大腸菌コドン最適化ヌクレオチド配列を転写し、ＰＣＲフラグメントからこれをインビトロで翻訳した。Ｔ７プロモーター、続いてリピート－スペーサー－リピート配列から構成された最小ＣＲＩＳＰＲアレイを有する第２のＰＣＲフラグメントを同一の反応にて転写した。エンドヌクレアーゼおよびリピート－スペーサー－リピート配列を首尾よく発現させ、続いてＣＲＩＳＰＲアレイプロセシングを行うことで、インビトロで活性であるＣＲＩＳＰＲヌクレアーゼ複合体を提供した。

ＴＸＴＬ反応結果を用いて、８Ｎ（縮重）塩基（考えられるＰＡＭ配列）が先行する最小アレイ中のプラスミドとマッチングするスペーサー配列を含有する、標的プラスミドのライブラリーをインキュベートした。１～３時間後、この反応を停止し、ＤＮＡクリーンアップキット（例えば、ＺｙｍｏＤＣＣ、ＡＭＰｕｒｅＸＰビーズ、ＱｉａＱｕｉｃｋなど）によりＤＮＡを回収した。エンドヌクレアーゼで切断された活性ＰＡＭ配列を用いて、アダプタ配列を平滑断端でＤＮＡフラグメントに結合した。一方、切断されなかったＤＮＡは結合に関してはアクセス不可能であった。つづいで、ライブラリーおよびアダプタ配列に特異的なプライマーを用いて、ＰＣＲにより、活性ＰＡＭ配列を含むＤＮＡセグメントを増幅させた。ＰＣＲ増幅産物をゲルに溶解し、切断現象に対応するアンプリコンを同定した。切断反応の増幅セグメントを、ＮＧＳライブラリーの調製用のテンプレートとして、またはサンガー法シーケンシング用の基質としても使用した。こうして得られた、出発８Ｎのライブラリーのサブセットであるライブラリーを配列決定することで、ＣＲＩＳＰＲ複合体と適合するＰＡＭ活性を有する配列を明らかにした。プロセシングされたＲＮＡコンストラクトを用いたＰＡＭ試験のため、プラスミドライブラリーとともにインビトロで転写されたＲＮＡを添加し、最小ＣＲＩＳＰＲアレイテンプレートを省略したことを除き、同一の手順を繰り返した。こうしたアッセイで標的として以下の配列を使用した：ＣＧＴＧＡＧＣＣＡＣＣＡＣＧＴＣＧＣＡＡＧＣＣＴ（配列番号３８６０）；ＧＴＣＧＡＧＧＣＴＴＧＣＧＡＣＧＴＧＧＴＧＧＣＴ（配列番号３８６１）；
ＧＴＣＧＡＧＧＣＴＴＧＣＧＡＣＧＴＧＧＴＧＧＣＴ（配列番号３８５８）；および
ＴＧＧＡＧＡＴＡＴＣＴＴＧＡＡＣＣＴＴＧＣＡＴＣ（配列番号３８５９）。

実施例４本明細書に説明されているエンドヌクレアーゼ用のＰＡＭ配列の同定／確認
改良を加えた大腸菌ライセートベースの発現系（ｍｙＴＸＴＬ、ＡｒｂｏｒＢｉｏｓｃｉｅｎｃｅｓ）により、ＰＡＭ要件を決定した。簡潔に言えば、２９℃、１６時間にわたってＴ７プロモーターの制御下で、大腸菌コドン最適化エフェクタータンパク質配列を発現させた。続いてこの粗タンパク質貯蔵物を、最終反応体積の２０％の濃度にてインビトロでの消化反応に使用した。８Ｎ混合塩基が先行する定常標的配列からなる５ｎＭのプラスミドライブラリー、およびＮＥＢ緩衝液２．１（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂ；候補と市販のタンパク質とを比較するためにＮＥＢ緩衝液２．１を選択した）中で標的配列に相補的な配列に連結したエフェクターと同一のＣＲＩＳＰＲ遺伝子座から誘導された５０ｎＭのインビトロで転写されたｃｒＲＮＡを用いて、３７℃で３時間にわたってこの反応をインキュベートした。ＰＡＭ発見アッセイではタンパク質濃度を正規化しなかった（ＰＣＲ増幅シグナルは、低い発現または活性に対して高い感受性を提供する）。ＡＭＰｕｒｅＳＰＲＩビーズ（ＢｅｃｋｍａｎＣｏｕｌｔｅｒ）を用いてクリーンアップすることで、ＴＸＴＬ反応による切断産物を回収した。ＫｌｅｎｏｗフラグメントおよびｄＮＴＰ（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂ）を加えることでＤＮＡを平滑末端化した。１００倍過剰な二本鎖アダプタ配列を用いて平滑断端産物を結合し、ＮＧＳライブラリーの調製用のテンプレートとして使用し、このライブラリーの配列解析からＰＡＭ要件を決定した。

２０超のＰｈｒｅｄクオリティスコアで生ＮＧＳリードをフィルタリングした。ＰＡＭ近傍領域を発見するため、参照としてＰＡＭに隣接する主鎖に由来する既知のＤＮＡ配列を表す２８ｂｐを使用し、８ｂｐ隣接部分を推定ＰＡＭとして同定した。各リードについて、ＰＡＭと結合アダプタとの間の距離もまた測定した。参照配列またはアダプタ配列に対し、完全な一致部分を有さないリードを除外した。最も頻度が高い切断部位±２ｂｐを有するＰＡＭのみが解析に含まれるように、切断部位頻度によりＰＡＭ配列をフィルタリングした。この補正により、粗大腸菌ライセートの使用により、ランダムな位置で生じる可能性がある低レベルのバックグラウンド切断を除去した。このフィルタリング工程は、候補タンパク質のシグナル対ノイズ比に応じて２％～４０％のリードを除去することができる。この場合、活性が少ないタンパク質はバックグラウンドの多いシグナルを有する。参照であるＭＧ２９－１に関して、この工程では２％のリードをフィルタリングした。ＰＡＭのフィルタリングリストを使用し、Ｌｏｇｏｍａｋｅｒを使用して配列露後を生成した。これらのＰＡＭの配列ロゴ表を図２０～図２４に示す。

実施例５ｔｒａｃｒＲＮＡ予想およびガイド設計
ｓｇＲＮＡおよび標的ＤＮＡに結合されたＡａｃＣ２ｃ１（Ｃａｓ１２ｂ）の三元複合体の結晶構造により、Ｒ－ＡＲ二重鎖１とＲ－ＡＲ二重鎖２と表示される、結合されたｓｇＲＮＡの２つの別個のリピート－アンチ－リピート（Ｒ－ＡＲ）が明らかになる（本明細書の図８および図９、ならびにＹａｎｇ，Ｈｕｉ，ＰｕＧａｏ，ＫａｎａｇａｌａｇｈａｔｔａＲ．Ｒａｊａｓｈａｎｋａｒ，ａｎｄＤｉｎｓｈａｗＪ．Ｐａｔｅｌ．２０１６．’’ＰＡＭ－ＤｅｐｅｎｄｅｎｔＴａｒｇｅｔＤＮＡＲｅｃｏｇｎｉｔｉｏｎａｎｄＣｌｅａｖａｇｅｂｙＣ２ｃ１ＣＲＩＳＰＲ－ＣａｓＥｎｄｏｎｕｃｌｅａｓｅ．’’ Ｃｅｌｌ１６７（７）：１８１４－２８．ｅ１２ａｎｄＬｉｕ，Ｌｉａｎｇ，ＰｅｎｇＣｈｅｎ，ＭｉｎＷａｎｇ，ＸｕｅｙａｎＬｉ，ＪｉｕｙｕＷａｎｇ，ＭａｏｌｕＹｉｎ，ａｎｄＹａｎｌｉＷａｎｇ．２０１７．’’Ｃ２ｃ１－ｓｇＲＮＡＣｏｍｐｌｅｘＳｔｒｕｃｔｕｒｅＲｅｖｅａｌｓＲＮＡ－ＧｕｉｄｅｄＤＮＡＣｌｅａｖａｇｅＭｅｃｈａｎｉｓｍ．’’ ＭｏｌｅｃｕｌａｒＣｅｌｌ６５（２）：３１０－２２、そのそれぞれの全体が、参照により本明細書に組み込まれている）。天然ＣＲＩＳＰＲアレイの周囲のゲノム前後関係におけるアンチリピート配列を検索することで、本明細書に開示されているＣＲＩＳＰＲエフェクターについての推定ｔｒａｃｒＲＮＡ配列を同定した。この場合、Ｒ－ＡＲ二重鎖２アンチリピート配列は、Ｒ－ＡＲ二重鎖１アンチリピート配列（よりもｔｒａｃｒＲＮＡの５’末端に近い）の約２０～９０ヌクレオチド上流に存在する。ｔｒａｃｒＲＮＡ配列の同定後、各酵素について２つのガイド配列を設計した。第１のガイド配列は、Ｒ－ＡＲ二重鎖１および２（例えば、配列番号３６３６、３６４０、３６４４、３６４８、３６５２、３６５６、３６６０、３６７１および３６７２を参照されたい）の両方を含み、第２のガイド配列は、この領域が切断に必須ではない可能性があることから、Ｒ－ＡＲ二重鎖１領域が欠失した短いガイド配列（例えば、配列番号３６３７、３６４１、３６４５、３６４９、３６５３、３６５７、および３６６１）であった。

実施例６予想されるＲＮＡフォールディングのためのプロトコール
Ａｎｄｒｏｎｅｓｃｕ２００７（これは、参照により本明細書に完全に組み込まれる）の方法を使用し、３７℃でのＲＮＡ配列の予想されるＲＮＡフォールディングを計算した。

実施例７ＲＮＡガイドの同定
Ｖ－Ａ型エフェクターおよびＣＲＩＳＰＲアレイをコードしたコンティグについて、リピートの二次構造フォールディングは、新規Ｖ－Ａ型系がシングルガイドｃｒＲＮＡ（ｓｇＲＮＡ、図１０）を必要とすることを示した。ｔｒａｃｒＲＮＡ配列を確実に予想することはできなかった。ｓｇＲＮＡは、ＣＲＩＳＰＲリピートの３’末端からの約１９～２２ｎｔを含有した。インビトロ活性について試験された６個のＶ－Ａ型の候補からのＣＲＩＳＰＲリピートの複数配列のアラインメントは、ｓｇＲＮＡのステムループ構造を形成するリピートの３’末端に高度に保存されたモチーフを示している（図１０Ｃ）。このモチーフ（ＵＣＵＡＣ［Ｎ３－５］ＧＵＡＧＡＵ）は、３～５個のヌクレオチド（ループ）により分離された短いパリンドロームリピート（ステム）からなる。

ｓｇＲＮＡモチーフの保存を使用し、分類されたＶ－Ａ型ヌクレアーゼに対する類似性を示さない可能性がある新規エフェクターを明らかにした。６９，１１７個のＣＲＩＳＰＲアレイからのリピートでモチーフを検索した。最も一般的なモチーフは４－ヌクレオチドループを含有するが、３－ヌクレオチドループおよび５－ヌクレオチドループはそこまで一般的ではなかった（図１２、図１３、図１４、図１５および図１６を参照されたい）。リピートモチーフを含有するＣＲＩＳＰＲアレイを取り囲むゲノム前後関係の検査により、様々な長さのエフェクターが多数明らかになった。例えば、ファミリーＭＧ５７のエフェクターは、同定されたＶ－Ａ型ヌクレアーゼのうち最大のもの（平均で約１４００ａａ）であり、４ｂｐのループを有するリピートをコードしていた。ＨＭＭ解析から同定された別のファミリーは、異なるリピートモチーフ（ＣＣＵＧＣ［Ｎ_３－４］ＧＣＡＧＧを含有していた（図５Ｃ、５Ｄを参照されたい）。配列は異なるものの、構造は高度に類似するステムループ構造へと折り畳まれることが予想された。

実施例８ＭＧＣＲＩＳＰＲ複合体のインビトロ切断効率
プロテアーゼ欠損大腸菌Ｂ株における誘導性Ｔ７プロモーターからのＨｉｓタグ融合タンパク質として、エンドヌクレアーゼが発現される。超音波処理によってＨｉｓタグタンパク質を発現している細胞を溶解し、ＡＫＴＡＡｖａｎｔＦＰＬＣ（ＧＥＬｉｆｅｓｃｉｅｎｃｅ）上でＨｉｓトラップＦＦカラム（ＧＥＬｉｆｅｓｃｉｅｎｃｅ）でのＮｉ－ＮＴＡアフィニティークロマトグラフィーによりＨｉｓタグタンパク質を精製した。アクリルアミドゲル（Ｂｉｏ－Ｒａｄ）上でのＳＤＳ－ＰＡＧＥにより溶出液を溶解し、ＩｎｓｔａｎｔＢｌｕｅＵｌｔｒａｆａｓｔクーマシー（Ｓｉｇｍａ－Ａｌｄｒｉｃｈ）で染色する。ＩｍａｇｅＬａｂソフトウェア（Ｂｉｏ－Ｒａｄ）を用いてタンパク質バンドのデンシトメトリーを使用し、純度を決定する。５０ｍＭトリス－ＨＣｌ、３００ｍＭＮａＣｌ、１ｍＭＴＣＥＰ、５％のグリセロールから構成された精製されたエンドヌクレアーゼを保存緩衝液（ｐＨ７．５）中に透析し、－８０℃で保存する。ＤＮＡ合成により、スペーサー配列およびＰＡＭ配列（例えば、実施例３または実施例４のいずれかにあるように決定される）を含有する標的ＤＮＡを構築する。ＰＡＭが縮重塩基を有する場合、試験のため、単一の代表的なＰＡＭが選択される。標的ＤＮＡは、ＰＡＭおよび一方の端から７００ｂｐに配置されたスペーサーを用いたＰＣＲ増幅により、プラスミドに由来する２２００ｂｐの直線状ＤＮＡから構成される。切断が成功すると、７００ｂｐおよび１５００ｂｐのフラグメントが生じる。標的ＤＮＡ、インビトロで転写されたシングルＲＮＡ、および精製された組換えタンパク質を切断緩衝液（１０ｍＭトリス、１００ｍＭＮａＣｌ、１０ｍＭＭｇＣｌ_２）中で過剰な量のタンパク質およびＲＮＡと組み合わせ、５分～３時間（通常、１時間）にわたってインキュベートした。リボヌクレアーゼＡを加え、６０分間インキュベートすることで反応を停止する。続いて反応物を１．２％のＴＡＥアガロースゲル上に溶解し、切断された標的ＤＮＡの画分をＩｍａｇｅＬａｂソフトウェアで定量する。

実施例９大腸菌中でのＭＧＣＲＩＳＰＲ複合体のゲノム切断活性試験
大腸菌は、二本鎖ＤＮＡ切断を効果的に修復する能力に欠いている。これにより、ゲノムＤＮＡの切断は致命的な事象となる可能性がある。この現象を活用し、スペーサー／標的を有する標的株においてエンドヌクレアーゼおよびガイドＲＮＡ（例えば、実施例６にあるように決定される）を組換え発現させることで、大腸菌におけるエンドヌクレアーゼ活性を試験し、ゲノムＤＮＡへと組み込まれたそのゲノムＤＮＡ（例えば、実施例４にあるように決定される）へと組み込まれたＰＡＭ配列を、エンドヌクレアーゼをコードするＤＮＡを用いて形質転換させる。続いて形質転換体を化学的に形質転換受容性がある状態とし、標的配列に特異的な（「オンターゲット」）、または標的に非特異的である（「非ターゲット」）のいずれかである５０ｎｇのガイドＲＮＡ（例えば、ｃｒＲＮＡ）を用いてこれを形質転換する。ヒートショック後、３７℃で２時間、ＳＯＣ中で形質転換を回復させた。続いて、誘導媒体上で増殖させた５倍希釈系によりヌクレアーゼ効率を決定する。３回反復してコロニーを希釈系から定量した。オフターゲットガイドＲＮＡを用いて形質転換されたコロニー数と比較してオンターゲットガイドＲＮＡで形質転換されたコロニー数の減少は、エンドヌクレアーゼによる特異的なゲノム切断を示す。

実施例１０一般的手順：哺乳動物細胞におけるＭＧＣＲＩＳＰＲ複合体のゲノム切断活性の試験
２種類の哺乳動物発現ベクターを使用し、哺乳動物細胞における標的活性および切断活性を検出する。最初に、ＭＧＣａｓエフェクターを、Ｃ末端のＳＶ４０ＮＬＳとＧＦＰタグ（タンパク質の発現をモニタリングするための２Ａ－ＧＦＰタグ）に連結されたウイルス性２Ａ一致切断可能ペプチド配列に融合させる。次に、ＭＧＣａｓエフェクターを２つのＳＶ４０ＮＬＳ配列（一方はＮ末端、もう一方はＣ末端）に融合させる。ＮＬＳ配列は、本明細書に説明されているＮＬＳ配列（例えば、配列番号３９３８～３９５３）のうちいずれかを含む。いくつかの例では、エンドヌクレアーゼをコードするヌクレオチド配列は、哺乳動物細胞での発現にコドン最適化されている。

哺乳動物の標的ＤＮＡに相補的な配列に融合されたｃｒＲＮＡ配列を有するシングルガイドＲＮＡを、第２の哺乳動物の発現ベクターにクローニングする。２つのプラスミドは、ＨＥＫ２９３Ｔ細胞へと同時トランスフェクトする。同時トランスフェクトの７２時間後、形質転換ＨＥＫ２９３Ｔ細胞からＤＮＡを抽出し、ＮＧＳライブラリーの調製用にこれを使用する。哺乳動物細胞における酵素の標的効率を実証するため、標的部位における挿入欠失を定量することで、ＮＨＥＪパーセントを測定する。少なくとも１０個の異なる標的部位を選択し、各タンパク質の活性を試験する。

実施例１１哺乳動物細胞におけるＭＧＣＲＩＳＰＲ複合体のゲノム切断活性の試験
哺乳動物細胞における標的活性および切断活性を示すため、ＭＧＣａｓエフェクタータンパク質配列を、隣接するＮ末端およびＣ末端のＳＶ４０ＮＬＳ配列、Ｃ末端Ｈｉｓタグ、およびＨｉｓタグ後のＣ末端における２Ａ－ＧＦＰ（例えば、ＧＦＰに連結されたウイルス性２Ａ一致切断可能ペプチド配列）タグを有する哺乳動物発現ベクターにクローニングした（主鎖１）。いくつかの例では、エンドヌクレアーゼをコードするヌクレオチド配列は、大腸菌細胞での発現にコドン最適化されている、または哺乳動物細胞での発現にコドン最適化されている天然配列であった。

目的の遺伝子標的を有するシングルガイドＲＮＡ配列（ｓｇＲＮＡ）もまた、哺乳動物の発現ベクターにクローニングした。２つのプラスミドは、ＨＥＫ２９３Ｔ細胞へと同時トランスフェクトする。ＨＥＫ２９３Ｔ細胞に発現プラスミドおよびｓｇＲＮＡ標的プラスミドを同時トランスフェクトした７２時間後、ＤＮＡを抽出し、ＮＧＳライブラリーの調製用にこれを使用した。哺乳動物細胞における酵素の標的効率を実証するため、標的部位のシーケンシングにおける挿入欠失により、ＮＨＥＪパーセントを測定する。各タンパク質の活性を試験するため、７～１２個の異なる標的部位を選択した。５％の挿入欠失の任意の閾値を使用し、活性候補を同定した。パラメータ：切断オフセット＝－４およびウィンドウ＝１０を使用し、ＣＲＩＳＰＲｅｓｓｏを用いたＮＧＳリードから、ヒト細胞におけるゲノム編集効率を評価した。±１ｂｐ挿入欠失／変異、および２以上のｂｐ欠失、挿入、および変異について、ＣＲＩＳＰＲｅｓｓｏ結果からの全ての切断後現象を合計した。予想されるアンプリコンにアラインメントされた全配列に対し、全ての結果を正規化した（図１８を参照されたい）。

実施例１２ＭＧ２９ファミリーの特性評価
ＰＡＭ特異性、ｔｒａｃｒＲＮＡ／ｓｇＲＮＡ検証
実施例３および実施例８に説明されているｍｙＴＸＴＬ系を使用し、ＭＧ２９ファミリーのエンドヌクレアーゼ系の標的化されたエンドヌクレアーゼ活性を確認した。このアッセイでは、図１７に示されるように、切断された標的プラスミドのＰＣＲ増幅により、ゲル中およそ１７０ｂｐで移動する産物を得る。配列番号３６０９に対応するｃｒＲＮＡを有するＭＧ２９－１に関して、増幅産物を観察した（図１７Ａ、レーン７を参照されたい）。ＰＣＲ産物の配列決定により、以下の表２に示されるように、これらの酵素に関する活性ＰＡＭ配列を明らかにした。

哺乳動物細胞における標的化されたエンドヌクレアーゼ活性
ＰＡＭＹＹｎ（配列番号３８７１）を有するゲノムにおける配置を試験するため、ＭＧ２９－１標的遺伝子座を選択した。選択された標的部位に対応するスペーサーを、実施例９に説明されている哺乳動物ベクター系の主鎖１におけるｓｇＲＮＡ足場にクローニングした。

この部位は、以下の表３に列挙されている。様々な標的部位におけるＭＧ２９－１の活性を、表２および図１９に示す。

実施例１３ＮＧＳによる高複製ＰＡＭ決定
実施例３および実施例８に説明されているように、ｍｙＴＸＴＬキットにおける大腸菌ライセートに基づく発現を使用し、Ｖ型エンドヌクレアーゼ（例えば、ＭＧ２８、ＭＧ２９、ＭＧ３０、ＭＧ３１エンドヌクレアーゼ）を切断活性について試験した。ｃｒＲＮＡ、および８個の縮重（「Ｎ」）塩基が先行するｃｒＲＮＡとマッチングするスペーサーシーケンシングを含有するプラスミドライブラリー（５’ＰＡＭライブラリー）を用いてインキュベートする際には、機能的ＰＡＭを有するプラスミドライブラリーのサブセットを切断した。この切断部位への結合およびＰＣＲ増幅は、１７０ｂｐでゲル中にて観察されたバンドにより実証された活性の証拠を提供した（図１７Ｂ）。ゲル１（上部パネル、Ａ）レーンは以下の通りである：１（ラダー、最も濃いバンドは２００ｂｐに対応する）；２：ポジティブコントロール（予め検証されたライブラリー）；３（ｎ／ａ）；４（ｎ／ａ）；５（ＭＧ２８－１）；６（ＭＧ２９－１）；７（ＭＧ３０－１）；８（ＭＧ３１－１）；９（ＭＧ３２－１）；および１０（ラダー）。ゲル２（下部パネル、Ｂ）レーンは以下の通りである：１（ラダー、最も濃いバンドは２００ｂｐに対応する）；２：（ＬｂＣｐｆ１ポジティブコントロール）；３（ＬｂＣｐｆ１ポジティブコントロール）；４（ネガティブコントロール）；５（ｎ／ａ）；６（ｎ／ａ）；７（ＭＧ２８－１）；８（ＭＧ２９－１）；９（ＭＧ３０－１）；および１０（ＭＧ３１－１）；１１（ＭＧ３２－１）。

ＰＣＲ産物をさらにＮＧＳシーケンシングに供し、ＰＡＭをｓｅｑＬｏｇｏ（例えば、Ｈｕｂｅｒｅｔａｌ．ＮａｔＭｅｔｈｏｄｓ．２０１５Ｆｅｂ；１２（２）：１１５－２１）表示に照らし合わせた（図２０）。ｓｅｑＬｏｇｏ表示は、位置０～７として標識されたスペーサーの上流（５’）である８ｂｐを示している。図２０に示されるように、ＰＡＭはピリミジンリッチであり（ＣおよびＴ）、大部分の配列要件はスペーサーの２～４ｂｐ上流である（ＳｅｑＬｏｇｏでは位置４～６）。

ＭＧ候補のＰＡＭを以下の表４に示す。

いくつかの場合では、スペーサーに直接隣接する位置の優先度は弱い可能性がある（例えば、「ｎ」の代わりには「ｍ」または「ｖ」）。

実施例１４ＭＧ３１ヌクレアーゼを用いた哺乳動物細胞における標的化エンドヌクレアーゼ活性
哺乳動物細胞における標的化されたエンドヌクレアーゼ活性
ＰＡＭＴＴＴＲ（配列番号３８７５）を有するゲノムにおける配置を試験するため、ＭＧ３１－１標的遺伝子座を選択した。選択された標的部位に対応するスペーサーを、実施例１１に説明されている哺乳動物ベクター系の主鎖１におけるｓｇＲＮＡ足場にクローニングした。

この部位は、以下の表５に列挙されている。様々な標的部位におけるＭＧ３１－１の活性を、表５および図２５に示す。

実施例１５インビトロ活性
この実施例に説明されているさらなる生化学解析のため、バイオインフォマティクス解析および予備のスクリーニングから有望な候補を選択した。保存された３’ｓｇＲＮＡ構造を使用し、３’の２０ｎｔのＣＲＩＳＰＲリピートおよび２４ｎｔスペーサーを含む「ユニバーサル」ｓｇＲＮＡを設計した（図１０）。７個の試験された候補のうち、６個は８ＮＰＡＭライブラリーに対してインビトロで活性を示した（図２６Ａ）。残りの不活性候補（３０－１）は、予想される内在性の整えられたＣＲＩＳＰＲリピート（配列番号３６０８、図２６Ｂを参照されたい）を用いて試験した場合、活性を示したが、この候補はＮＧＳライブラリーアッセイには含まれていない。（図２６Ｃ）

同定されたＰＡＭの大部分は、２～３塩基のチミンリッチ配列である（図１８Ａ）。ただし、ＭＧ２６－１（ＰＡＭＹＹｎ）およびＭＧ２９－１（ＰＡＭＹＹｎ）といった２つの酵素は、ピリミジン塩基、チミンまたはシトシンのいずれかに対するＰＡＭ特異性を有しており、これらによってさらに広範な配列標的化が可能となった。推定ＰＡＭ相互作用残基の解析は、活性のあるＶ－Ａ型ヌクレアーゼが保存されたリジンおよびＧＷｘｘｘＫモチーフを含有することを示しており、ＦｎＣａｓ１２ａにおいて異なるＰＡＭの認識および異なるＰＡＭとの相互作用では重要であることを示している。

発明者らによるＰＡＭ検出アッセイはＰＡＭ濃縮前に平滑断端フラグメントを生成するために結合を必要としていたが、このことは、これらの酵素が既に報告したＶ－Ａ型ヌクレアーゼに類似しているねじれ形の二本鎖ＤＮＡ切断を生成することを示唆していた。挿入欠失を検出するために使用されるＮＧＳリードを解析することで標的鎖上の切断部位を同定することができ（図１８Ｂ）、第２２のＰＡＭ遠位塩基後の切断を示した。

切断産物を配列決定することで、ＭＧ２９－１によるインビトロ切断をさらに調査した。標的鎖上の切断位置は、大部分の配列ではＰＡＭから２２ヌクレオチド離れており、２１ヌクレオチドまたは２３ヌクレオチドではそれほど頻度は高くなかった（図５６）。非ターゲット鎖上における切断位置は、ＰＡＭから１７～１９ヌクレオチドである。組み合わせることで、これらの結果は３～５ｂｐのオーバーハングを示す。

実施例１６ゲノム編集
ＰＡＭの確認後、遺伝子標的活性についてＨＥＫ２９３Ｔ細胞において、本明細書に説明されている新規タンパク質を試験した。１０個の試験された標的遺伝子座のうち少なくとも１個において、全ての候補は５％を超えるＮＨＥＪの活性（バックグラウンド補正）を示した。ＭＧ２９－１は、ＮＨＥＪ修飾結果においては最も高い全体活性を示し、最大数の標的に関しては活性である（図１８Ｂ）。ここから、このヌクレアーゼを、ＨＥＫ２９３細胞での精製リボヌクレオタンパク質複合体（ｒｉｂｏｎｕｃｌｅｏｐｒｏｔｅｉｎ、ＲＮＰ）試験のために選択した。ＭＧ２９－１ホロ酵素のＲＮＰトランスフェクションは、９個の標的のうち４個の標的ではプラスミドベースのトランスフェクションよりも高い編集レベルを示し、いくつかの場合ではこの編集効率は８０％を超えた（図１８Ｃ）。ＭＧ２９－１の編集プロファイルの解析は、このヌクレアーゼが、標的部位における他の種類の編集よりもさらに多い３以上のｂｐの欠失を生成することを示している（図１８Ｄ）。いくつかの標的（５個～８個）では、ＭＧ２９－１の挿入欠失頻度はＡｓＣｐｆ１の挿入欠失頻度の２倍である（図１８Ｅ）。

実施例１７考察
様々な複合体環境から収集され、ファミリーに整理されたメタゲノムからＶ－Ａ型ＣＲＩＳＰＲを同定した。これらの新規Ｖ－Ａ型ヌクレアーゼは多様な配列とファミリー内およびファミリー全体の系統学的起源を有し、多様なＰＡＭ部位を有する標的を切断した。他のＶ－Ａ型ヌクレアーゼ（例えば、ＬｂＣａｓ１２ａ、ＡｓＣａｓ１２ａ、ＦｎＣａｓ１２ａ）と同様に、本明細書に説明されているエフェクターは、シングルガイドＣＲＩＳＰＲＲＮＡ（ｓｇＲＮＡ）を利用してねじれ形のＤＮＡの二本鎖切断を標的化し、ガイドの設計と合成を簡略化して多重編集を推進させる。ｃｒＲＮＡのステムループ構造を形成するＣＲＩＳＰＲリピートモチーフの解析は、本明細書に説明されているＶ－Ａ型エフェクターが、より短いまたはより長いループよりもさらに多い４ｎｔのループガイドを有することを示唆していた。１６Ｃｐｆ１の相同分子種について４ｎｔのループも予め観察したが、ＬｂＣｐｆ１のｓｇＲＮＡモチーフは、あまり一般的ではない５ｎｔを有する。Ｖ－Ａ型エフェクターのＭＧ６１ファミリーについては、異常なステムループのＣＲＩＳＰＲリピートリピートモチーフ配列であるＣＣＵＧＣ［Ｎ_３－４］ＧＣＡＧＧを同定した。Ｖ－Ａ型において様々なループ長を有するｓｇＲＮＡの高度の保存は、本明細書に説明されているタンパク質について示されているように、柔軟なレベルの活性を提供し得る。まとめると、これらのエフェクターは既に研究された酵素に近い相同体ではなく、Ｖ－Ａ型様ｓｇＲＮＡヌクレアーゼの多様性を大幅に拡大する。

本明細書に説明されているさらなるＶ型エフェクターは、Ｃａｓ１２ａヌクレアーゼに隣接してコードされ得るＶ－Ａ型プライムエフェクター（Ｖ－Ａ’）とここでは呼ばれるＶ－Ａ型様ヌクレアーゼの重複から創出され得る。Ｖ－Ａ型系とこれらのＶ－Ａ’型系の両方は、ＣＲＩＳＰＲｓｇＲＮＡを共有している可能性があるが、Ｖ－Ａ’型系はＣａｓ１２ａとは互いに異なっている（図４）。これらのプライムエフェクターに関連するＣＲＩＳＰＲリピートはまた、ＵＣＵＡＣ［Ｎ_３－５］ＧＵＡＧＡＵモチーフを有するシングルガイドｃｒＲＮＡへと折り畳んだ。ある１つの報告ではＶ－Ａ型ヌクレアーゼに隣接してコードされたＶ型ｃｍｓ１エフェクターを同定しているが、これは植物細胞における切断活性のためにシングルガイドｃｒＲＮＡを必要とした。各エフェクターについて異なるＣＲＩＳＰＲアレイを報告したが、本明細書に説明されているＶ－Ａ’型系は、Ｖ－Ａ型とＶ－Ａ’型の両方がＤＮＡ標的化と切断のために同一のｃｒＲＮＡを必要とし得ることを示唆した。Ｒｏｉｚｍａｎの細菌ゲノムに近年説明されているように（例えば、Ｃｈｅｎｅｔａｌ．ＦｒｏｎｔＭｉｃｒｏｂｉｏｌ．２０１９Ｍａｙ３；１０：９２８）、Ｖ－Ａ型とＶ－Ａ’型エフェクターの両方は、配列相同性解析および系統学解析に基づくと遠い関係にある。したがって、プライムエフェクターはＶ－Ａ型分類内には属しておらず、別個のＶ型サブ分類であることが認められている。

活性Ｖ－Ａ型ヌクレアーゼについて決定されたＰＡＭは一般にチミンリッチであり、それ以外のＶ－Ａ型ヌクレアーゼについて説明されている既に説明されたＰＡＭに類似している。対照的に、ＭＧ２９－１はさらに短いＹＹＮＰＡＭ配列を必要としており、ＬｂＣｐｆ１の４つのヌクレオチドＴＴＴＶＰＡＭと比較すると、標的の柔軟性を増加させる。加えて、ＭＧ２９－１を含有するＲＮＰは、３ヌクレオチドＰＡＭを有するｓＭｂＣａｓ１２ａと比較すると、ＨＥＫ２９３細胞においてさらに高い活性を有した。

インビトロ編集活性について新規ヌクレアーゼを試験する場合、ＭＧ２９－１は、報告されているこのクラスの他の酵素に適合性またはさらに良好な活性を示した。Ｃａｓ１２ａ相同分子種を使用した、哺乳動物細胞におけるプラスミドのトランスフェクション編集効率についての報告は、ＴリッチＰＡＭを有するガイドについては２１％～２６％の挿入欠失頻度を示し、ＣＣＮＰＡＭを有する１８ガイドのうち１つは、Ｍｂ３Ｃａｓ１２ａにおいては約１０％の活性を示した（モラクセラ・ボーボクリＡＡＸ１１＿００２０５Ｃａｓ１２ａ、例えばＷａｎｇｅｔａｌ．ＪｏｕｒｎａｌｏｆＣｅｌｌＳｃｉｅｎｃｅ２０２０１３３：ｊｃｓ２４０７０５を参照されたい）。特に、プラスミドのトランスフェクションにおけるＭＧ２９－１活性は、ＴＴＮおよびＣＣＮＰＡＭを有する標的のＭｂ３Ｃａｓ１２ａについて報告された活性よりも大きいことが明らかである（例えば、図１８を参照されたい）。プラスミドトランスフェクションのための標的部位は全ての実験において同一のＴＴＧＰＡＭを有するため、編集効率の差は、異なる標的遺伝子でのゲノム利用性の差に起因し得る。ＲＮＰとしてのＭＧ２９－１編集は、プラスミドによるものよりもはるかに効率的であり、７つの標的遺伝子座のうち２つのＡｓＣａｓ１２ａよりも効率的である。したがって、ＭＧ２９－１は高度に活性があり、かつ効率的な遺伝子編集ヌクレアーゼであり得る。これらの発見は、シングルガイドＶ－Ａ型ＣＲＩＳＰＲヌクレアーゼの既知の多様性を増加させ、未培養の微生物からの新規酵素のゲノム編集における潜在能力を実証する。７個の新規ヌクレアーゼは、多様なＰＡＭ要件を伴うインビトロ活性を示し、ＲＮＰデータは、ヒト細胞株における治療に関連する標的については８０％以上の編集効率を示した。これらの新規ヌクレアーゼによってＣＲＩＳＰＲ関連酵素のツールキットが拡大し、多様なゲノム編集の適用が可能となる。

実施例１８Ｔ細胞のＴＲＡＣ遺伝子座のＭＧ２９－１の誘導による編集
当初予想されたＭＧ２９－１の５’－ＴＴＮ－３’ＰＡＭ優先度にマッチングする配列についてＴ細胞受容体α鎖定常領域（Ｔｃｅｌｌｒｅｃｅｐｔｏｒａｌｐｈａｃｈａｉｎｃｏｎｓｔａｎｔｒｅｇｉｏｎ、ＴＲＡＣＡ）の３つのエクソンを走査し、固有のＡｌｔ－Ｒ修飾を有するシングルガイドＲＮＡをＩＤＴから注文した。全てのガイドスペーサー配列は２２ｎｔの長さであった。ガイド（８０ｐｍｏｌ）を精製ＭＧ２９－１タンパク質（６３ｐｍｏｌ）と混合し、室温で１５分間インキュベートした。ネガティブ選択を使用することで（ＳｔｅｍｃｅｌｌＴｅｃｈｎｏｌｏｇｉｅｓヒトＴ細胞単離キット＃１７９５１）ＰＢＭＣからＴ細胞を精製し、ＣＤ２／３／２８ビーズ（ＭｉｌｔｅｎｙｉＴ細胞活性化／増殖キット＃１３０－０９１－４４１）により活性化させた。細胞増殖させた４日後、プログラムＥＯ－１１５およびＰ３緩衝液を使用するＬｏｎｚａ４－ＤＮｕｃｌｅｏｆｅｃｔｏｒを用いてＭＧ２９－１／ガイドＲＮＡ混合物のそれぞれを２００，０００個のＴ細胞中に電気穿孔した。トランスフェクションの７２時間後に細胞を回収し、ゲノムＤＮＡを単離した。ＴＲＡＣＡ遺伝子座を標的化するプライマーを使用し、ハイスループットＤＮＡシーケンシングを使用する解析のためにＰＣＲ増幅した。ＮＨＥＪベースの遺伝子編集に典型的な挿入および欠失の生成は、固有のＰｙｔｈｏｎスクリプトを使用して定量した（図３９を参照されたい）。

実施例１９ＭＧ２９－１のリードガイドの再試験
ＭＧ２９－１のためのリードガイドを再試験する実験を行った。５’－ＴＴＮ－３’にマッチングする配列についてＴ細胞受容体α鎖定常領域の３つのエクソンを走査し、Ａｌｔ－Ｒ修飾を使用するシングルガイドＲＮＡをＩＤＴから注文した。全てのガイドスペーサー配列は２２ｎｔの長さであった。ガイドを精製ＭＧ２９－１タンパク質（８０ｐｍｏｌのｇＲＮＡ＋６３ｐｍｏｌのＭＧ２９－１；または１６０ｐｍｏｌのｇＲＮＡ＋１２６ｐｍｏｌのＭＧ２９－１）と混合し、室温で１５分間インキュベートした。ネガティブ選択を使用することで（ＳｔｅｍｃｅｌｌＴｅｃｈｎｏｌｏｇｉｅｓヒトＴ細胞単離キット＃１７９５１）ＰＢＭＣからＴ細胞を精製し、ＣＤ２／３／２８ビーズ（ＭｉｌｔｅｎｙｉＴ細胞活性化／増殖キット＃１３０－０９１－４４１）により活性化させた。細胞増殖させた４日後、プログラムＥＯ－１１５およびＰ３緩衝液を使用するＬｏｎｚａ４－ＤＮｕｃｌｅｏｆｅｃｔｏｒを用いてＭＧ２９－１／ガイドＲＮＡ混合物のそれぞれを２００，０００個のＴ細胞中に電気穿孔した。トランスフェクションの７２時間後にゲノムＤＮＡを回収し、ハイスループットＤＮＡシーケンシングを使用する解析のためにＰＣＲ増幅した。ＮＨＥＪベースの遺伝子編集に典型的な挿入および欠失の生成は、固有のＰｙｔｈｏｎスクリプトを使用して定量した（図４０を参照されたい）。

実施例２０ＭＧ２９－１のガイドスペーサー長の試験
最適なガイドスペーサー長を決定するために実験を行った。５’－ＴＴＮ－３’にマッチングする配列についてＴ細胞受容体α鎖定常領域の３つのエクソンを走査し、Ａｌｔ－Ｒ修飾を使用するシングルガイドＲＮＡをＩＤＴから注文した。ガイドを精製ＭＧ２９－１タンパク質（８０ｐｍｏｌのｇＲＮＡ＋６０ｐｍｏｌのエフェクター；１６０ｐｍｏｌのｇＲＮＡ＋１２０ｐｍｏｌのエフェクター；または３２０ｐｍｏｌのｇＲＮＡ＋２４０ｐｍｏｌのエフェクター）と混合し、室温で１５分間インキュベートした。ネガティブ選択を使用することで（ＳｔｅｍｃｅｌｌＴｅｃｈｎｏｌｏｇｉｅｓヒトＴ細胞単離キット＃１７９５１）ＰＢＭＣからＴ細胞を精製し、ＣＤ２／３／２８ビーズ（ＭｉｌｔｅｎｙｉＴ細胞活性化／増殖キット＃１３０－０９１－４４１）により活性化させた。細胞増殖させた４日後、プログラムＥＯ－１１５およびＰ３緩衝液を使用するＬｏｎｚａ４－ＤＮｕｃｌｅｏｆｅｃｔｏｒを用いてＭＧ２９－１／ガイドＲＮＡ混合物のそれぞれを２００，０００個のＴ細胞中に電気穿孔した。トランスフェクションの７２時間後にゲノムＤＮＡを回収し、ハイスループットＤＮＡシーケンシングを使用する解析のためにＰＣＲ増幅した。ＮＨＥＪベースの遺伝子編集に典型的な挿入および欠失の生成は、固有のＰｙｔｈｏｎスクリプトを使用して定量した。結果を図４１に示すが、これは２０～２４ｎｔのガイドスペーサー長が良好に機能し、１９ｎｔではドロップオフが存在することを実証している。

実施例２１ＴＣＲ発現に対するＭＧ２９－１挿入欠失の生成の決定
ＡＰＣ標識した抗ヒトＴＣＲα／β Ａｂ（Ｂｉｏｌｅｇｅｎｄ＃３０６７１８，クローンＩＰ２６）およびＡｔｔｕｎｅＮｘＴフローサイトメーター（ＴｈｅｒｍｏＦｉｓｈｅｒ）を使用したフローサイトメトリーにより、ＴＣＲの発現について、図４１の細胞を解析した。挿入欠失データを図４１より取得する。

実施例２２ＭＧ２９－１を用いた標的化されたＣＡＲの組込み
５’－ＴＴＮ－３’にマッチングする配列についてＴ細胞受容体α鎖定常領域の３つのエクソンを走査し、ＩＤＴ固有のＡｌｔ－Ｒ修飾を使用するシングルガイドＲＮＡをＩＤＴから注文した。ガイド（８０ｐｍｏｌ）を精製ＭＧ２９－１タンパク質（６３ｐｍｏｌ）と混合し、室温で１５分間インキュベートした。ネガティブ選択を使用することで（ＳｔｅｍｃｅｌｌＴｅｃｈｎｏｌｏｇｉｅｓヒトＴ細胞単離キット＃１７９５１）ＰＢＭＣからＴ細胞を精製し、ＣＤ２／３／２８ビーズ（ＭｉｌｔｅｎｙｉＴ細胞活性化／増殖キット＃１３０－０９１－４４１）により活性化させた。細胞増殖させた４日後、プログラムＥＯ－１１５およびＰ３緩衝液を使用するＬｏｎｚａ４－ＤＮｕｃｌｅｏｆｅｃｔｏｒを用いてＭＧ２９－１／ガイドＲＮＡ混合物のそれぞれを２００，０００個のＴ細胞中に電気穿孔した。ＴＲＡＣ遺伝子を標的化する５’および３’ホモロジーアーム（配列番号４４２４の５’アームは約５００ｎｔの長さであり、配列番号４４２５の３’アームは約５００ｎｔの長さである）と隣接している、カスタマイズされたキメラ抗原受容体のコード配列を含有するセロタイプ６アデノ随伴ウイルス（ＡＡＶ－６）の１００，０００ベクターゲノムを、トランスフェクション後の細胞に直ちに加えた。ＴＲＡＣ挿入欠失に対するＴＣＲの発現について複写物を解析し（図４２）、ＴＲＡＣ遺伝子の挿入欠失がＴＣＲの発現の損失に相関することを示した。実施例２１にあるようなＴＣＲの発現（図４２）について、および標的抗原のＣＡＲへの結合（図４３、プロットは単一の生細胞に関してゲート制御される）について、細胞もまたフローサイトメトリーで同時に解析した。図４３のフロー解析結果は、ガイドＲＮＡは単独でＴＣＲの発現除去に有効であったが（「ＲＮＰのみ」）、ＡＡＶをガイドＲＮＡに加えることでＣＡＲ抗原に結合する細胞の新規集団が生じることを示した（プロットの上部左の「ＡＡＶ＋ＭＧ２９－１－１９－２２」および「ＡＡＶ＋ＭＧ２９－１－３５－２２」）。ｓｇＲＮＡ３５（配列番号４４０４）は、ＣＡＲの組込みの誘導においてはｓｇＲＮＡ１９（配列番号４３８８）よりも少量ではあるが有効であった。この差に関する考えられる説明の１つは、ガイド１９について予想されるヌクレアーゼ切断部位が右のホモロジーアームの末端から約１６０ｂｐ離れているという点である。

実施例２３ＨＳＣにおけるＭＧ２９－１ＴＲＡＣ編集
Ａｌｌｃｅｌｌから造血幹細胞を購入し、供給業者の指示に従い解凍し、ＤＭＥＭ＋１０％ＦＢＳで洗浄した。ＣＣ１１０サイトカインを加えたＳｔｅｍｓｐａｎＩＩ培地に再懸濁した。４ｍＬの培地、６ウェルのディッシュで１００万個の細胞を７２時間培養した。ＭＧ２９－１ＲＮＰを作製してトランスフェクトし、ＥＯ－１００ヌクレオフェクションプログラムの使用を除き実施例１８のように遺伝子編集を解析した。結果を図５６に示すが、これは、以下の表５Ｂの＃１９（配列番号４３８８）および＃３５（配列番号４４０４）ｓｇＲＮＡを使用した、造血幹細胞のＴＲＡＣでの遺伝子編集を示す。この結果は、＃３５ｓｇＲＮＡがＴＲＡＣ遺伝子座の標的化に非常に有効であることもまた示している。

実施例２４ＭＧ２９－１に関連するＰＡＭ特異性のさらなる解析
ＭＧ２９－１のＰＡＭ特異性をさらに正確に決定するため、さらなる解析を行った。５’－ＮＴＴＮ－３’ ＰＡＭ配列を使用してガイドＲＮＡを設計し、続いて観察された遺伝子編集活性に従って選別した（図４５、下線を引いた塩基（５’－近位Ｎ）の同一性を各区間について示している）。１０％を超える活性を有し、ゲノムＤＮＡにおいてこの位置でＴを有するガイド全ては、ＭＧ２９－１ＰＡＭが５’－ＴＴＴＮ－３’としてよりよく説明され得ることを示している。各区間に関して、この位置でのＴの過剰な表面の統計学的有意性を示す。図４５では、様々な区間（高、中、低、１％超、１％未満）は、
■高：５０％超の挿入欠失（Ｎ＝４）
■中：１０～５０％の挿入欠失（Ｎ＝１５）
■低：５～１０％の挿入欠失（Ｎ＝５）
■１％超：１～５％の挿入欠失（Ｎ＝１２）
■１％未満（Ｎ＝８２）

実施例２５スペーサー塩基組成に対するＭＧ２９－１挿入欠失誘導の決定
ＭＧ２９－１スペーサー配列の塩基組成に対する遺伝子編集活性のさらなる解析を行った。この相関関係は中程度（Ｒ＾２＝０．２３）であったが、ＧＣ含有量がさらに高い場合には活性がより良好なものに向かう傾向がある（図４６を参照されたい、スペーサー配列のＧＣ含有量に対し、培養された細胞に誘導された挿入欠失間の相関関係はドット状のプロットとして示されている）。

実施例２６ＭＧ２９－１ガイドの化学修飾
実施例１８の手順を使用するが、ＶＥＧＦ－Ａを標的化する示されたガイドＲＮＡを用いて、ＭＧ２９－１を使用するＶＥＧＦ－Ａ遺伝子座の標的化について化学修飾を最適化する実験を行った（以下の表７を参照されたい）。実験は１２６ｐｍｏｌのＭＧ２９－１および１６０ｐｍｏｌのガイドＲＮＡを使用した。結果を図４７に示す。ガイド＃４、＃５、＃６、＃７および＃８は、非修飾ガイド＃１に対して向上した活性を示した。これは、これらの配列の対応する修飾が非修飾ＲＮＡ配列に対するこれらのガイドＲＮＡの活性を向上させたことを示している。

実施例２７実施例２６から修飾されたＭＧ２９－１ガイドの滴定
実施例２６で使用される修飾されたガイドの活性の用量依存性を決定するためにさらなる実験を行い、考えられる用量依存性毒性効果を同定した。出発用量（Ａ、１２６ｐｍｏｌのＭＧ２９－１および１６０ｐｍｏｌのガイドＲＮＡ）の１／４（Ｂ）、１／８（Ｃ）、１／１６（Ｄ）および１／３２（Ｅ）であることを除き、実施例２６にあるように実験を行った。結果を図４８に示す。

実施例２８本明細書に説明されているヌクレアーゼの大規模合成
プロジェクト概要
ＭｅｔａｇｅｎｏｍｉのＶ－Ａ型ＣＲＩＳＰＲヌクレアーゼ、ＭＧ２９－１の産生を、１０Ｌの初期培養体積にスケールアップする。発現スクリーニング、スケールアップ発現、下流の開発、製剤研究、およびＳＤＳ－ＰＡＧＥによって精製されたタンパク質の９０％以上の送達を行う。

発現および精製スクリーニング
宿主株、発現培地、誘導物質、誘導時間および温度といった条件を変更しつつ、図４９に示されているｐＭＧ４５０ベクターからのＭＧ２９－１の発現を試験した。全ての条件についてＳＤＳ－ＰＡＧＥにより、大腸菌細胞ペーストから抽出された全ての可溶性タンパク質を解析する。収率および純度を推定し、最適な発現条件を同定するため、上位３つの発現条件で固定化金属アフィニティークロマトグラフィー（ＩＭＡＣ）プルダウン、続いてＳＤＳ－ＰＡＧＥを実施する。溶解のためのスケールアップ方法が開発されている。ＩＭＡＣおよびサブトラクティブＩＭＡＣによる精製（タバコエッチウイルスプロテアーゼ（ＴＥＶ）切断）のため、重要なパラメータを同定する。ＳＤＳ－ＰＡＧＥを使用し、カラム画分を試験する。ＳＤＳ－ＰＡＧＥおよび２８０ｎｍ（Ａ２８０）での測光吸光度を使用し、溶出プールを試験する。タンジェンシャルフローろ過（ｔａｎｇｅｎｔｉａｌｆｌｏｗｆｉｌｔｒａｔｉｏｎ、ＴＦＦ）による緩衝液交換および濃縮のための方法を開発する。

必要に応じて、９０％以上の純度を達成するためにさらなるクロマトグラフィー工程を開発する。１つのクロマトグラフィーモードを試験する（例えば、セラミックハイドロキシアパタイトクロマトグラフィー）。最大８個の特有の条件を試験する（例えば、２～３個の緩衝系をそれぞれ有する２～６個の樹脂）。ＳＤＳ－ＰＡＧＥを使用し、カラム画分を試験する。ＳＤＳ－ＰＡＧＥおよびＡ２８０を使用し、溶出プールを試験する。１つの条件を選択し、３つの条件の負荷試験を実施する。上記のようにカラム画分および溶出プールを解析する。ＴＦＦによる緩衝液交換および濃縮のための方法が開発され得る。

大腸菌の形質転換、振盪フラスコ中での培養物の調製、および発現スクリーニング中に同定された最適な発現条件による材料および方法を使用した誘導を行う。細胞ペーストを回収し、ＳＤＳ－ＰＡＧＥにより発現を検証する。結果を報告し、精製のため出発材料として細胞ペーストを使用する。細胞培養物の体積を２０Ｌに制限する。下流方法の開発中に開発された方法を使用し、最大１グラムのタンパク質を精製する。最終保存緩衝液へと製剤化し、Ａ２８０により収率および濃度を、ＳＤＳ－ＰＡＧＥにより純度のＱＣ試験を行う。

製剤試験
精製されたタンパク質を使用し、精製されたタンパク質の最適な保存条件を決定するために製剤試験を行う。研究により、濃度、保存緩衝液、保存温度、最大凍結／解凍サイクル、保存時間、またはその他の条件を調査することができる。

実施例２９培養されたマウスの肝細胞におけるイントロン領域を編集する、本明細書に説明されているヌクレアーゼの能力の実証
発現された遺伝子のイントロン領域は、疾患を処置または治療する治療用タンパク質を発現するという目的に関して、対象の治療用タンパク質のコード配列を組み込むための魅力的なゲノム標的である。外因的に供給されたドナーテンプレートの存在下で配列特異的ヌクレアーゼを使用し、イントロン内部で二本鎖切断を生成することによって、タンパク質コード配列の組込みを達成することができる。ドナーテンプレートの標的化された組込みを生じさせる、相同組換え修復（ｈｏｍｏｌｏｇｙｄｉｒｅｃｔｅｄｒｅｐａｉｒ、ＨＤＲ）および非相同末端結合（ｎｏｎ－ｈｏｍｏｌｏｇｏｕｓｅｎｄｊｏｉｎｉｎｇ、ＮＨＥＪ）と呼ばれる２つの主要な細胞修復経路のうち１つによって、ドナープレートを二本鎖切断へと組み込むことができる。ＮＨＥＪ経路は非分裂細胞では主要であるが、ＨＤＲ経路は主に分裂細胞でのみ活性である。肝臓は、タンパク質コード配列の標的化された組込みには特に魅力的な組織である。これは、インビボ送達系の有効性および高い効率でタンパク質を発現および分泌する肝臓の能力に起因する。

イントロン領域で二本鎖切断を生成するＭＧ２９－１の潜在能力を評価するため、血清アルブミンのイントロン１を標的遺伝子座として選択した。ＧｅｎｅｉｏｕｓＰｒｉｍｅ核酸解析ソフトウェアのガイド発見アルゴリズムを使用し、マウスのアルブミンイントロン１に標的された２２ｎｔのスペーサー長を有するシングルガイドＲＮＡ（ｓｇＲＮＡ）を同定した（ｈｔｔｐｓ：／／ｗｗｗ．ｇｅｎｅｉｏｕｓ．ｃｏｍ／ｐｒｉｍｅ／）。スペーサーに対して５’に配置されているＫＴＴＧ（配列番号３８７０）のＰＡＭを使用し、マウスのアルブミンイントロン１内部の合計１１２の考えられるｓｇＲＮＡを同定した。イントロン／エクソン境界に及ぶガイドを除外した。ＧｅｎｅｉｏｕｓＰｒｉｍｅを使用してマウスのゲノムに対するこれらの１１２ガイドのスペーサー配列を検索し、ゲノムの追加部位へのアラインメントに基づき、ソフトウェアによって特異性スコアを割り当てた。特異性について懸念があることから、４個以上の近接する塩基を有する、同一塩基のスペーサー配列を除外した。試験のため、最も高い特異性スコアを有する合計１２個のスペーサーを選択した。ｓｇＲＮＡを生成するため、「ＴＡＡＴＴＴＣＴＡＣＴＧＴＴＧＴＡＧＡＴ」の主鎖配列をスペーサー配列の３’末端に加えた。ｃｐｆ１ガイドに関するｓｇＲＮＡの性能を向上させることで知られている化学修飾塩基を組み入れることで、ｓｇＲＮＡを化学合成した（ＩｎｔｅｇｒａｔｅｄＤＮＡＴｅｃｈｎｏｌｏｇｉｅｓから入手可能なＡｌｔＲ１／ＡｌｔＲ２化学物質）。これらのガイドのスペーサー配列を以下の表８に列挙する。

標準条件（５％のＣＯ２インキュベータ中に１０％のＦＢＳを含むＤＭＥＭ培地）下で形質転換されたマウス肝細胞株であるＨｅｐａ１～６細胞を培養し、ＰＢＳ緩衝液中でｓｇＲＮＡと精製ＭＧ２９－１タンパク質とを混合することで形成されたリボ核タンパク質を用いて核内遺伝子導入した。４Ｄヌクレオフェクション装置（Ｌｏｎｚａ）を使用し、５０ｐｍｏｌのＭＧ２９－１タンパク質と１００ｐｍｏｌのｓｇＲＮＡとを混合することで形成されたＲＮＰを用いて、完全ＳＦヌクレオフェクション試薬（Ｌｏｎｚａ）中に懸濁されたＨｅｐａ１～６細胞（１×１０^５）を核内遺伝子編集した。ヌクレオフェクション後、２４ウェルプレートへ１０％のＦＢＳを加えたＤＭＥＭ中に細胞を播種し、４８～７２時間にわたって５％のＣＯ２インキュベータ中でインキュベートした。続いてカラムベースの精製キット（ＰｕｒｅｌｉｎｋゲノムＤＮＡミニキット、ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ）を使用して細胞からゲノムＤＮＡを抽出し、２６０ｎｍでの吸光度で定量した。それぞれ０．５マイクロモルのプライマーであるｍＡｌｂ９０Ｆ（ＣＴＣＣＴＣＴＴＣＧＴＣＴＣＣＧＧＣ）（配列番号４０３１）およびｍＡｌｂ１０７３Ｒ（ＣＴＧＣＣＡＣＡＴＴＧＣＴＣＡＧＣＡＣ）（配列番号４０３２）、および１倍のＰｆｕｓｉｏｎＦｌａｓｈＰＣＲＭａｓｔｅｒＭｉｘを含有する反応物で、５０ｎｇのゲノムＤＮＡからアルブミンイントロン１領域をＰＣＲ増幅した。

カラムベースの精製キット（ＤＮＡ精製・抽出キット、ＺｙｍｏＲｅｓｅａｒｃｈ）を使用して、得られたマウスのアルブミンの全イントロン１に及ぶ９８４ｂｐのＰＣＲ産物を精製し、各ｓｇＲＮＡについて予想される標的部位の１５０～３５０ｂｐ内に配置されているプライマーを使用して配列決定した。トランスフェクトされていないＨｅｐａ１～６細胞由来のプライマーであるｍＡｌｂ９０Ｆ（配列番号４０３１）およびｍＡｌｂ１０７３Ｒ（配列番号４０３２）を使用して生成したＰＣＲ産物を、コントロールとして並行して配列決定した。挿入欠失の頻度および挿入欠失プロファイルを決定するＩｎｆｅｒｅｎｃｅｏｆＣＲＩＳＰＲＥｄｉｔｓ（ＩＣＥ）を使用し、サンガー法シーケンシングクロマトグラムを解析した（Ｈｓｉａｕｅｔ．ａｌ，ＩｎｆｅｒｅｎｃｅｏｆＣＲＩＳＰＲＥｄｉｔｓｆｒｏｍＳａｎｇｅｒＴｒａｃｅＤａｔａ．ＢｉｏＡｒｘｉｖ．２０１８ｈｔｔｐｓ：／／ｗｗｗ．ｂｉｏｒｘｉｖ．ｏｒｇ／ｃｏｎｔｅｎｔ／ｅａｒｌｙ／２０１８／０１／２０／２５１０８２）。

ヌクレアーゼが生細胞内部でＤＮＡの二本鎖切断（ＤＳＢ）を精製する場合、ＤＳＢは細胞ＤＮＡ修復機構により修復される。培養物中で形質転換された哺乳動物細胞などの活発に分裂している細胞では、かつ修復テンプレートが存在しない条件下では、この修復はＮＨＥＪ経路で発生する。このＮＨＥＪ経路は、二本鎖切断部位で塩基の挿入または欠失を導入するエラープローンプロセスである（Ｌｉｅｂｅｒ，Ｍ．Ｒ，ＡｎｎｕＲｅｖＢｉｏｃｈｅｍ．２０１０；７９：１８１－２１１）。したがって、発生し続いて修復されるこれらの挿入および欠失は二本鎖切断の特徴であり、ヌクレアーゼの編集効率または切断効率の情報として広く利用されている。挿入および欠失のプロファイルは、二本鎖切断を作製したヌクレアーゼの特性に依存しているが、切断部位の配列状況にも依存する。インビトロアッセイに基づき、ＭＧ２９－１ヌクレアーゼはＰＡＭの３’に配置されたねじれ形の切断を生成する。ねじれ形に切断することで、多くの場合では、末端結合前の一本鎖のトリミングによってさらに大きな欠失がもたらされる。表８は、Ｈｅｐａ１～６細胞で試験されたマウスのアルブミンイントロン１を標的化しているそれぞれの１９個のｓｇＲＮＡにより生成された全体の挿入欠失頻度を列挙している。１８個のｓｇＲＮＡのうち１１個では標的部位の検出可能な挿入欠失が生じ、５個のｓｇＲＮＡでは５０％を超える挿入欠失頻度が生じ、４個のｓｇＲＮＡでは７５％を超える挿入欠失頻度が生じる。これらのデータは、ＭＧ２９－１ヌクレアーゼが、７５％を超える効率を有するｓｇＲＮＡに関しては、予想される標的部位で培養されたマウスの生細胞のゲノムを編集することができることを実証している。

市販の脂質ベースのトランスフェクション試薬（リポフェクタミンＭｅｓｓｅｎｇｅｒＭＡＸ，Ｉｎｖｉｔｒｏｇｅｎ）を使用し、ｓｇＲＮＡとＭＧ２９－１ヌクレアーゼをコードするｍＲＮＡを同時トランスフェクトすることで、同一セットのｓｇＲＮＡの編集効率を評価した。ＭＧ２９－１のコード配列をクローニングしたプラスミド由来のＴ７ポリメラーゼを使用し、インビトロ転写によってＭＧ２９－１をコードするｍＲＮＡを生成した。ヒトのコドン利用表を使用してＭＧ２９－１コード配列をコドン最適化し、Ｎ末端ではＳＶ４０に、Ｃ末端ではヌクレオチドプラスミンに由来する核局在化シグナルに隣接させた。さらに、翻訳を向上させるため、コード配列の３’末端でＵＴＲをインキュベートした。インビボでのｍＲＮＡ安定性を向上させるため、コード配列の３’末端で３’のＵＴＲ、続いておよそ９０～１１０ヌクレオチドのポリＡトラクトをインキュベートした（例えば、野生型ＭＧ２９－１については配列番号４４２６、Ｓ１６８Ｒバリアントについては配列番号３３２７）。インビトロ転写反応は、ＣｌｅａｎＣａｐ（登録商標）キャッピング試薬（ＴｒｉｌｉｎｋＢｉｏＴｅｃｈｎｏｌｏｇｉｅｓ）を含み、ＭＥＧＡＣｌｅａｒ（商標）転写クリーンアップキット（Ｉｎｖｉｔｒｏｇｅｎ）を使用して得られたＲＮＡを精製し、ＴａｐｅＳｔａｔｉｏｎ（Ａｇｉｌｅｎｔ）を使用して純度を評価し、これが９０％を超える全長のＲＮＡから構成されていることを見出した。

表１で確認されるように、Ｈｅｐａ１～６細胞のｍＲＮＡ／ｓｇＲＮＡ脂質トランスフェクション後の編集効率は、ＲＮＰのヌクレオフェクションで見られるものと類似しているが同一ではなかった。ただし、ＭＧ２９－１ヌクレアーゼは、ｍＲＮＡの形態で送達される場合には、培養された肝細胞では活性であることを確認した。

図５０は、ガイドとしてｍＡｌｂ２９－１－８（配列番号３９９９）を使用するＩＣＥ解析により決定されるＭＧ２９－１の挿入欠失プロファイルの代表例であり、４塩基の欠失が最も頻繁な現象であり（全配列の２５％）、１、５、６または７塩基の欠失は、配列の約１０～１５％をそれぞれ占めていることを実証している代表例である。最大１３塩基の長い欠失もまた検出されたが、挿入は検出不可能であった。対照的に、マウスのアルブミンイントロン１を標的化するガイドを有するｓｐＣａｓ９は、１塩基の挿入または欠失を主に生成した。

図５１は、マウスのアルブミンイントロン１領域のＰＣＲ産物の次世代シーケンシング（ＮＧＳ）により決定される、ＭＧ２９－１の挿入欠失プロファイルおよびｓｇＲＮＡであるｍＡｌｂ２９－１－８の代表例である。合計で、およそ１５，０００個の配列リードを得た。ＮＧＳにより、４塩基の欠失は最も頻繁な挿入欠失であり（全体の２０％）、１、５、６および７塩基の欠失は、挿入欠失の約１０％をそれぞれ占めていた。最大１９ｂｐのより大きな欠失も検出された。ＮＧＳ解析により観察されたプロファイルは、ＩＣＥにより測定されたプロファイルと厳密には一致している。これらの結果は、ＭＧ２９－１が、インビトロで観察されたねじれ形の切断と一致する標的部位にて、大きな欠失を生成することを実証する。

実施例３０培養されたヒトの肝細胞（ＨｅｐＧ２）におけるイントロン領域を標的化する、本明細書に説明されているヌクレアーゼの能力の実証
ヒト細胞のイントロン領域で二本鎖切断を生成するＭＧ２９－１の潜在能力を評価するため、ヒト血清アルブミンのイントロン１を標的遺伝子座として選択した。ＧｅｎｅｉｏｕｓＰｒｉｍｅ核酸解析ソフトウェアのガイド発見アルゴリズムを使用し、ヒトのアルブミンイントロン１に標的された２２ｎｔのスペーサー長を有するシングルガイドＲＮＡ（ｓｇＲＮＡ）を同定した（ｈｔｔｐｓ：／／ｗｗｗ．ｇｅｎｅｉｏｕｓ．ｃｏｍ／ｐｒｉｍｅ／）。スペーサーに対して５’に配置されているＫＴＴＧ（配列番号３８７０）のＰＡＭを使用し、ヒトのアルブミンイントロン１内部の合計９０の考えられるｓｇＲＮＡを同定した。イントロン／エクソン境界に及ぶガイドを除外した。ＧｅｎｅｉｏｕｓＰｒｉｍｅを使用してマウスのゲノムに対するこれらのガイドのスペーサー配列を検索し、ゲノムの追加部位へのアラインメントに基づき、ソフトウェアによって特異性スコアを割り当てた。特異性について懸念があることから、４個以上の近接する塩基を有する、同一塩基のスペーサー配列を除外した。試験のため、最も高い特異性スコアを有する合計２３個のスペーサーを選択した。ｓｇＲＮＡを生成するため、「ＴＡＡＴＴＴＣＴＡＣＴＧＴＴＧＴＡＧＡＴ」の主鎖配列をスペーサー配列の３’末端に加えた。ｃｐｆ１ガイドに関するｓｇＲＮＡの性能を向上させることで知られている化学修飾塩基を組み入れることで、ｓｇＲＮＡを化学合成した（ＩｎｔｅｇｒａｔｅｄＤＮＡＴｅｃｈｎｏｌｏｇｉｅｓから入手可能なＡｌｔＲ１／ＡｌｔＲ２化学物質）。これらのガイドのスペーサー配列を以下の表９に列挙する。

標準条件（５％のＣＯ２インキュベータ中に１０％のＦＢＳを含むＭＥＭ培地）下で形質転換されたヒト肝細胞株であるＨｅｐＧ２細胞を培養し、ＰＢＳ緩衝液中でｓｇＲＮＡと精製ＭＧ２９－１タンパク質とを混合することで形成されたリボ核タンパク質を用いて核内遺伝子導入した。４Ｄヌクレオフェクション装置（Ｌｏｎｚａ）を使用し、８０ｐｍｏｌのＭＧ２９－１タンパク質と１６０ｐｍｏｌのｓｇＲＮＡとを混合することで形成されたＲＮＰを用いて、完全ＳＦヌクレオフェクション試薬（Ｌｏｎｚａ）中に懸濁された合計１ｅ５のＨｅｐＧ２細胞を核内遺伝子編集した。ヌクレオフェクション後、２４ウェルプレートへ１０％のＦＢＳを加えたＤＭＥＭ中に細胞を播種し、４８～７２時間にわたって５％のＣＯ_２インキュベータ中でインキュベートした。続いてカラムベースの精製キット（ＰｕｒｅｌｉｎｋゲノムＤＮＡミニキット、ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ）を使用して細胞からゲノムＤＮＡを抽出し、２６０ｎｍでの吸光度で定量した。それぞれ０．５マイクロモルのプライマーであるｈＡｌｂ１１Ｆ（ＴＣＴＴＣＴＧＴＣＡＡＣＣＣＣＡＣＡＣＧＣＣ）（配列番号４０７９）およびｈＡｌｂ８３４Ｒ（ＣＴＴＧＴＣＴＧＧＧＣＡＡＧＧＧＡＡＧＡ）（配列番号４０８０）、および１倍のＰｆｕｓｉｏｎＦｌａｓｈＰＣＲＭａｓｔｅｒＭｉｘを含有する反応物中、５０ｎｇのゲノムＤＮＡから、アルブミンイントロン１領域をＰＣＲ増幅した。カラムベースの精製キット（ＤＮＡ精製・抽出キット、ＺｙｍｏＲｅｓｅａｒｃｈ）を使用して、得られたマウスのアルブミンの全イントロン１に及ぶ８２６ｂｐのＰＣＲ産物を精製し、ｓｇＲＮＡについて予想される標的部位の１５０～３５０ｂｐ内に配置されているプライマーを使用して配列決定した。

トランスフェクトされていないＨｅｐＧ２細胞由来のプライマーであるｈＡｌｂ１１Ｆ（ＴＣＴＴＣＴＧＴＣＡＡＣＣＣＣＡＣＡＣＧＣＣ）（配列番号４０７９）およびｈＡｌｂ８３４Ｒ（ＣＴＴＧＴＣＴＧＧＧＣＡＡＧＧＧＡＡＧＡ）（配列番号４０８０）を使用して生成されたＰＣＲ産物を、コントロールとして並行して配列決定した。挿入欠失の頻度および挿入欠失プロファイルを決定するＩｎｆｅｒｅｎｃｅｏｆＣＲＩＳＰＲＥｄｉｔｓ（ＩＣＥ）を使用し、サンガー法シーケンシングクロマトグラムを解析した。ヌクレアーゼが生細胞内部でＤＮＡの二本鎖切断（ＤＳＢ）を精製する場合、ＤＳＢは細胞ＤＮＡ修復機構により修復される。培養物中で形質転換された哺乳動物細胞などの活発に分裂している細胞では、かつ修復テンプレートが存在しない条件下では、この修復はＮＨＥＪ経路で発生する。このＮＨＥＪ経路は、二本鎖切断部位で塩基の挿入または欠失を導入するエラープローンプロセスである（Ｌｉｅｂｅｒ，Ｍ．Ｒ，ＡｎｎｕＲｅｖＢｉｏｃｈｅｍ．２０１０；７９：１８１－２１１）。

したがって、発生し続いて修復されるこれらの挿入および欠失は二本鎖切断の特徴であり、ヌクレアーゼの編集効率または切断効率の情報として広く利用されている。挿入および欠失のプロファイルは、二本鎖切断を作製したヌクレアーゼの特性に依存しているが、切断部位の配列状況にも依存する。インビトロアッセイに基づき、ＭＧ２９－１ヌクレアーゼは、ＰＡＭから２２ヌクレオチド（ＰＡＭから２１ヌクレオチドではそれほど頻度は高くない）の標的鎖を切断し、ＰＡＭから１８ヌクレオチドの非ターゲット鎖を切断した。こうすることでＰＡＭの３’に配置された４ヌクレオチドのねじれ形末端を形成する。ねじれ形に切断することで、多くの場合では、末端結合前の一本鎖のトリミングによってさらに大きな欠失がもたらされる。

表９は、ＨｅｐＧ２細胞で試験されたヒトのアルブミンイントロン１を標的化しているそれぞれの２３個のｓｇＲＮＡにより生成された全体の挿入欠失頻度を列挙している。２３個のｓｇＲＮＡのうち１６個では標的部位の検出可能な挿入欠失が生じ、８個のｓｇＲＮＡでは５０％を超える挿入欠失が生じ、５個のｓｇＲＮＡでは９０％を超える挿入欠失頻度が生じる。これらのデータは、ＭＧ２９－１ヌクレアーゼが、９０％を超える効率を有するｓｇＲＮＡに関しては、予想される標的部位で培養されたヒトの生細胞株のゲノムを編集することができることを実証している。

実施例３１培養されたマウスの肝細胞におけるエクソン領域を編集する、本明細書に説明されているヌクレアーゼの能力の実証
配列特異的ヌクレアーゼを使用し、遺伝子のコード配列を破壊し、それによって目的のタンパク質の機能的ノックアウトを作成することができる。これは、特異的タンパク質のノックダウンが特定の疾患に有益な効果を有する場合には治療用途のものであり得る。遺伝子のコード配列を破壊する方法の１つとしては、配列特異的ヌクレアーゼを使用し、遺伝子のエクソン領域内に二本鎖切断を作製することである。エラープローン修復経路によってこれらの二本鎖切断を修復し、フレームシフト変異またはタンパク質の機能を破壊するアミノ酸配列に対する変化のいずれかをもたらし得る挿入または欠失を生成する。

肝細胞で発現される遺伝子のエクソン領域で二本鎖切断を生成するＭＧ２９－１の潜在能力を評価するため、グリコール酸オキシダーゼ（ｈａｏ－１）をコードする遺伝子を標的遺伝子座として選択した。ＧｅｎｅｉｏｕｓＰｒｉｍｅ核酸解析ソフトウェアのガイド発見アルゴリズムを使用し、マウスのｈａｏ－１のエクソン１～４に標的された２２ｎｔのスペーサー長を有するシングルガイドＲＮＡ（ｓｇＲＮＡ）を同定した（ｈｔｔｐｓ：／／ｗｗｗ．ｇｅｎｅｉｏｕｓ．ｃｏｍ／ｐｒｉｍｅ／）。ｈａｏ－１遺伝子の最初の４エクソンは、ｈａｏ－１コード配列のＮ末端のおよそ５０％を含む。遺伝子のコード配列のＮ末端に向かって作成された挿入欠失は、タンパク質の活性を破壊するフレームシフトまたはミスセンス変異を作成する可能性が高いことから、最初の４エクソンを選択した。スペーサーに対して５’に配置されているＫＴＴＧ（配列番号３８７０）のＰＡＭを使用し、マウスのｈａｏ－１エクソン１～４内部の合計４５の考えられるｓｇＲＮＡを同定した。イントロン／エクソン境界に及ぶガイドを含むが、これはこうしたガイドがスプライシングに干渉する挿入欠失を作成することができることが理由である。ＧｅｎｅｉｏｕｓＰｒｉｍｅを使用してマウスのゲノムに対するこれらの４５ガイドのスペーサー配列を検索し、マウスのゲノムの追加部位へのアラインメントに基づき、ソフトウェアによって特異性スコアを割り当てた。特異性について懸念があることから、４個以上の近接する塩基を有する、同一塩基のスペーサー配列を除外した。試験のため、最も高い特異性スコアを有する合計４５個のスペーサーを選択した。

ｓｇＲＮＡを生成するため、「ＴＡＡＴＴＴＣＴＡＣＴＧＴＴＧＴＡＧＡＴ」の主鎖配列をスペーサー配列の３’末端に加えた。ｃｐｆ１ガイドに関するｓｇＲＮＡの性能を向上させることで知られている化学修飾塩基を組み入れることで、ｓｇＲＮＡを化学合成した（ＩｎｔｅｇｒａｔｅｄＤＮＡＴｅｃｈｎｏｌｏｇｉｅｓから入手可能なＡｌｔＲ１／ＡｌｔＲ２化学物質）。これらのガイドのスペーサー配列を表１０に列挙する。
表１０：マウスのｈａｏ－１エクソン１～４を標的化するＭＧ２９－１ｓｇＲＮＡのスペーサー配列およびＭＧ２９－１／ｓｇＲＮＡＲＮＰを用いて核内遺伝子導入されたＨｅｐａ１～６細胞における活性

標準条件（５％のＣＯ_２インキュベータ中に１０％のＦＢＳを含むＤＭＥＭ培地）下で形質転換されたマウス肝細胞株であるＨｅｐａ１～６細胞を培養し、ＰＢＳ緩衝液中でｓｇＲＮＡと精製ＭＧ２９－１タンパク質とを混合することで形成されたリボ核タンパク質を用いて核内遺伝子導入した。４Ｄヌクレオフェクション装置（Ｌｏｎｚａ）を使用し、５０ｐｍｏｌのＭＧ２９－１タンパク質と１００ｐｍｏｌのｓｇＲＮＡとを混合することで形成されたＲＮＰを用いて、完全ＳＦヌクレオフェクション試薬（Ｌｏｎｚａ）中に懸濁された合計１ｅ^５のＨｅｐａ１～６細胞を核内遺伝子編集した。ヌクレオフェクション後、２４ウェルプレートへ１０％のＦＢＳを加えたＤＭＥＭ中に細胞を播種し、４８～７２時間にわたって５％のＣＯ２インキュベータ中でインキュベートした。続いてカラムベースの精製キット（ＰｕｒｅｌｉｎｋゲノムＤＮＡミニキット、ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ）を使用して細胞からゲノムＤＮＡを抽出し、２６０ｎｍでの吸光度で定量した。各エクソンに特異的である、０．５マイクロモルの対のプライマーを含有する反応物における４０ｎｇのゲノムＤＮＡから、マウスのｈａｏ－１遺伝子１のエクソン１～４をＰＣＲ増幅した。エクソン１に使用されたＰＣＲプライマーは、ＰＣＲ＿ｍＨＥ１＿Ｆ＿＋２３３（ＧＴＧＡＣＣＡＡＣＣＣＴＡＣＣＣＧＴＴＴ）（配列番号４１７１）、ＰＣＲ＿ｍＨＥ１＿Ｒ＿－５５３（ＧＣＡＡＧＣＡＣＣＴＡＣＴＧＴＣＴＣＧＴ）（配列番号４１７２）であった。エクソン２に使用されたＰＣＲプライマーは、ＨＡＯ１＿Ｅ２＿Ｆ５７２１（ＣＡＡＣＧＡＡＧＧＴＴＣＣＣＴＣＣＡＧＧ）（配列番号４１７３）、ＨＡＯ１＿Ｅ２＿Ｒ６２７１（ＧＧＡＡＧＧＧＴＧＴＴＣＧＡＧＡＡＧＧＡ）（配列番号４１７４）であった。エクソン３に使用されたＰＣＲプライマーは、ＨＡＯ１＿Ｅ３＿Ｆ２３１９８（ＴＧＣＣＣＴＡＧＡＣＡＡＧＣＴＧＡＣＡＣ）（配列番号４１７５）、ＨＡＯ１＿Ｅ３＿Ｒ２３８７９（ＣＡＧＡＴＴＣＴＧＧＡＡＧＴＧＧＣＣＣＡ）（配列番号４１７６）であった。エクソン４に使用されたＰＣＲプライマーは、ＨＡＯ１＿Ｅ４＿Ｆ３１０８７（ＣＣＴＧＴＡＧＧＴＧＧＣＴＧＡＧＴＡＣＧ）（配列番号４１７７）、ＨＡＯ１＿Ｅ４＿Ｒ３１６５０（ＡＧＧＴＴＴＧＧＴＴＣＣＣＣＴＣＡＣＣＴ）（配列番号４１７８）であった。

プライマーおよびゲノムＤＮＡに加えて、ＰＣＲ反応物は１倍のＰｆｕｓｉｏｎＦｌａｓｈＰＣＲＭａｓｔｅｒＭｉｘ（ＴｈｅｒｍｏＦｉｓｈｅｒ）を含有した。得られたＰＣＲ産物は、アガロースゲル上で解析した場合には単一のバンドを含むがこれはＰＣＲ反応が特異的であることを実証しており、カラムベースの精製キット（ＤＮＡ精製・抽出キット、ＺｙｍｏＲｅｓｅａｒｃｈ）を使用して精製した。配列決定するため、各切断部位から少なくとも１００ｎｔの配列に相補的であるプライマーを使用した。配列エクソン１に対するプライマーは、Ｓｅｑ＿ｍＨＥ１＿Ｆ＿＋１３９（ＧＴＣＴＡＧＧＣＡＴＡＣＡＡＴＧＴＴＴＧＣＴＣＡ）（配列番号４１７９）であった。配列エクソン２に対するプライマーは、５９３８ＦＳｅｑ＿ＨＡＯ１＿Ｅ２（ＣＴＡＴＧＣＡＡＧＧＡＡＡＡＧＡＴＴＴＧＧＣＣ）（配列番号４１８０）であった。配列エクソン３に対するプライマーは、ＨＡＯ１＿Ｅ３＿Ｆ２３４７６（ＴＣＴＴＣＣＣＣＣＴＴＧＡＡＴＧＡＡＡＣＡＣＴ）（配列番号４１８１）であり、逆ＰＣＲプライマーはＨＡＯ１＿Ｅ３＿Ｒ２３８７９（ＣＡＧＡＴＴＣＴＧＧＡＡＧＴＧＧＣＣＣＡ）（配列番号４１８２）であった。配列エクソン４に対するプライマーは、逆ＰＣＲプライマーであるＨＡＯ１＿Ｅ４＿Ｒ３１６５０（ＡＧＧＴＴＴＧＧＴＴＣＣＣＣＴＣＡＣＣＴ）（配列番号４１８３）であった。

ＰＣＲ産物のシーケンシングは、これらの産物がｈａｏ－１エクソンの予測配列を含有することを示した。各ｓｇＲＮＡについて予想される１００～３５０ｂｐの標的部位内に配置されたプライマーを使用し、異なるＲＮＰを用いて核内遺伝子導入されたＨｅｐａ１６細胞に由来するＰＣＲ産物、または未処理のコントロールを配列決定した。挿入欠失の頻度および挿入欠失プロファイルを決定するＩｎｆｅｒｅｎｃｅｏｆＣＲＩＳＰＲＥｄｉｔｓ（ＩＣＥ）を使用し、サンガー法シーケンシングクロマトグラムを解析した（Ｈｓｉａｕｅｔ．ａｌ，ＩｎｆｅｒｅｎｃｅｏｆＣＲＩＳＰＲＥｄｉｔｓｆｒｏｍＳａｎｇｅｒＴｒａｃｅＤａｔａ．ＢｉｏＡｒｘｉｖ．２０１８ｈｔｔｐｓ：／／ｗｗｗ．ｂｉｏｒｘｉｖ．ｏｒｇ／ｃｏｎｔｅｎｔ／ｅａｒｌｙ／２０１８／０１／２０／２５１０８２）。ヌクレアーゼが生細胞内部でＤＮＡの二本鎖切断（ＤＳＢ）を精製する場合、ＤＳＢは細胞ＤＮＡ修復機構により修復される。培養物中で形質転換された哺乳動物細胞などの活発に分裂している細胞では、かつ修復テンプレートが存在しない条件下では、この修復はＮＨＥＪ経路で発生する。このＮＨＥＪ経路は、二本鎖切断部位で塩基の挿入または欠失を導入するエラープローンプロセスである（Ｌｉｅｂｅｒ，Ｍ．Ｒ，ＡｎｎｕＲｅｖＢｉｏｃｈｅｍ．２０１０；７９：１８１－２１１）。したがって、発生し続いて修復されるこれらの挿入および欠失は二本鎖切断の特徴であり、ヌクレアーゼの編集効率または切断効率の情報として、当該技術分野で広く利用されている。表１０に示すように、１４個のガイドはそれらの予想される標的部位における検出可能な編集を実証した。４個のガイドは、９０％を超える編集活性を示した。１４個の活性ガイド全てがＴＴＴＮのＰＡＭ配列を有するが、このＰＡＭはインビボで好ましいことを実証している。ただし、ＴＴＴＮＰＡＭを利用するガイド全てが活性であるわけではなかった。これらのデータは、ＭＧ２９－１ヌクレアーゼが、高い効率を伴い、培養された肝細胞におけるエクソン領域に、ＲＮＡガイドされ、配列特異性のある二本鎖切断を生成可能であることを実証している。

実施例３２Ｈａｏ－１遺伝子を破壊するためにさらなるｓｇＲＮＡの設計
ｈａｏ－１遺伝子のエクソン部分を標的化するため、さらなるｓｇＲＮＡを設計した。これらはおよそ５０％のコード配列を含み、遺伝子のコード配列のＮ末端に向かって生成された挿入欠失が、タンパク質の活性を破壊するフレームシフトまたはミスセンス変異を作成する可能性が高いことから、これらは最初の４エクソンを標的化するために設定されている。哺乳動物細胞でさらに活性であると実施例３１に示されている、より制限的なＫＴＴＧのＰＡＭ（配列番号３８７０）を使用し、ヒトｈａｏ－１エクソン１～４内部に全体で４２個の考えられるｓｇＲＮＡを同定した（表１１）。

イントロン／エクソン境界に及ぶガイドを含むが、これはこうしたガイドがスプライシングに干渉する挿入欠失を作成することができることが理由である。ＧｅｎｅｉｏｕｓＰｒｉｍｅを使用してヒトゲノムに対するこれらの４２ガイドのスペーサー配列を検索し、ヒトゲノムへのアラインメントに基づき、ソフトウェアによって特異性スコアを割り当てた。より高い特異性スコアは、スペーサーが設計された部位以外のヒトゲノムにおける１つ以上の配列を認識するこうしたガイドの可能性が低いことを示す。特異性スコアは１０％～１００％の範囲であり、２５個のガイドは９０％を超える特異性スコアを有し、３３個のガイドは８０％を超える特異性スコアを有する。この解析は、高い特異性スコアを有するヒト遺伝子のエクソン領域を標的化するガイドを容易に同定可能であると実証しており、多数の高活性ガイドが同定されるであろうことが予測される。

実施例３３本明細書に説明されているヌクレアーゼの編集能力とマウスの肝細胞におけるｓｐＣａｓ９の編集能力との比較
細菌種であるストレプトコッカス・ピオゲネスに由来するＣＲＩＳＰＲＣａｓ９ヌクレアーゼ（ｓｐＣａｓ９）は、ゲノム編集に広く使用されており、同定されている最も活性のあるＲＮＡガイドヌクレアーゼの１つである。マウス肝細胞株であるＨｅｐａ１～６における異なる用量のＲＮＰのヌクレオフェクションにより、ｓｐＣａｓ９と比較したＭＧ２９－１の相対的能力を評価した。マウスアルブミンのｓｇＲＮＡ標的イントロン１を両方のヌクレアーゼに使用した。ＭＧ２９－１については、実施例２９に同定されたｓｇＲＮＡであるｍＡｌｂ２９－１－８を選択した。ＭＧ２９－１と類似のｓｇＲＮＡ構造を有するＶ型ヌクレアーゼｃｐｆ１のガイドの能力を向上させるように設計された、ＡｌｔＲ１／ＡｌｔＲ２（ＩｎｔｅｇｒａｔｅｄＤＮＡＴｅｃｈｎｏｌｏｇｉｅｓ）と呼ばれる化学修飾を組み入れることで、ガイドであるｍＡｌｂ２９－１－８（実施例２９を参照されたい）を化学合成した。ｓｐＣａｓ９について、インシリコスクリーニングから選択された３個のガイドを試験することで、マウスのアルブミンイントロン１を効率的に編集したｓｇＲＮＡを同定した。これらの研究で使用されたｓｐＣａｓ９タンパク質は、商用供給業者（ＩｎｔｅｇｒａｔｅｄＤＮＡＴｅｃｈｎｏｌｏｇｉｅｓのＡｌｔＲ－ｓＰＣａｓ９）から取得した。

ｓｇＲＮＡであるｍＡｌｂＲ１（スペーサー配列、ＴＴＡＧＴＡＴＡＧＣＡＴＧＧＴＣＧＡＧＣ）を化学合成し、細胞の能力を向上させるガイドの両端の３塩基上の２’ Ｏメチル塩基とチオリン酸（ＰＳ）結合から構成される化学修飾を組み込んだ。ｓｇＲＮＡであるｍＡｌｂＲ１は、２０ｐｍｏｌのｓｐＣａｓ９タンパク質／５０ｐｍｏｌのガイドから構成されたＲＮＰをＨｅｐａ１～６細胞へと核内遺伝子導入した場合に、９０％の頻度で挿入欠失を生成した。これは高度に活性のあるガイドであることを示している。２０ｐｍｏｌ～１ｐｍｏｌの範囲のヌクレアーゼタンパク質で形成されたＲＮＰおよび１：２．５の一定比のタンパク質：ｓｇＲＮＡを、Ｈｅｐａ１～６細胞へと核内遺伝子導入した。ＰＣＲ増幅されたゲノムＤＮＡのサンガー法シーケンシングおよびＩＣＥ解析を使用し、マウスのアルブミンイントロン１における標的部位の挿入欠失を定量した。図５２に示された結果は、編集が飽和していない場合には、ＭＧ２９－１はＲＮＰが低用量のｓｐＣａｓ９よりも高いパーセンテージの挿入欠失を生成したことを実証している。これらのデータは、ＭＧ２９－１が少なくとも同程度に活性であり、肝臓由来の哺乳動物細胞においては、ｓｐＣａｓ９よりも潜在的にはさらに活性があることを示している。

実施例３４本明細書に説明されているヌクレアーゼの配列バリアントの編集およびマウスの肝細胞における評価
ＭＧ２９－１の編集効率を向上させるため、ＭＧ２９－１コード領域の１つまたは２つのアミノ酸を置換している変異のセットを導入した。アシダミノコッカス種（ＡｓＣａｓ１２ａ）へのアラインメントにより、アミノ酸置換基のセットを決定した。構造化ガイド編集（Ｋｌｅｉｎｓｔｉｖｅｒ，ｅｔａｌ，ＮａｔＢｉｏｔｅｃｈｎｏｌ．２０１９，３７２７６－２８２）により、ＰＡＭ結合を変性または向上させるという目的でＡｓＣａｓ１２ａ中の異なるアミノ酸を置換した。ＡｓＣａｓ１２ａにおける４個のアミノ酸置換：Ｓ１７０Ｒ、Ｅ１７４Ｒ、Ｎ５７７ＲおよびＫ５８３Ｒは、基準となるＰＡＭおよび基準とならないＰＡＭによる高い編集効率を示した。複数のアラインメントにより、これらの置換にマッチングするＭＧ２９－１の部位を同定した。これらの部位は、ＭＧ２９－１におけるＳ１６８Ｒ、Ｅ１７２Ｒ、Ｎ５７７ＲおよびＫ５８３Ｒに対応する。

単一アミノ酸置換を試験するため、２－プラスミド送達系を使用した。標準的な分子クローニング技術を使用し、単一アミノ酸置換を有するＭＧ２９－１をコードする発現プラスミドを構築した。プラスミドの１つは、ＣＭＶプロモーターの下でＭＧ２９－１をコードし、第２のプラスミドはｍＡｌｂ２９－１－８であるｓｇＲＮＡを含有するが（表８を参照されたい）、Ｈｅｐａ１～６細胞において高い編集効率を有する。ヒトＵ６プロモーターによりガイドの転写を駆動した。ＭＧ２９－１をコードするインビトロで転写された（ＩＶＴ）ｍＲＮＡ（どのようにしてＩＶＴｍＲＮＡを作製したかの詳細については実施例３３を参照されたい）およびＩｎｔｅｇｒａｔｅｄＤＮＡＴｅｃｈｎｏｌｏｇｉｅｓによりＣｐｆ１に最適化された（ＩｎｔｅｇｒａｔｅｄＤＮＡＴｅｃｈｎｏｌｏｇｉｅｓで合成された）ＡｌｔＲ１／ＡｌｔＲ２化学修飾を組み入れている化学合成されたガイドを使用して、２－プラスミド系を使用する単一アミノ酸置換による最初の結果と二重アミノ酸置換の試験との確認を行った。２－プラスミド系を送達するため、ＭＧ２９－１をコードする１００ｎｇのプラスミドとガイドをコードする４００ｎｇのプラスミドとをリポフェクタミン３０００と混合し、これをＨｅｐａ１～６細胞に加えて３日間インキュベートした後、ゲノムＤＮＡ単離を行った。

ＩＶＴｍＲＮＡおよび合成ガイドを送達するため、３００ｎｇのｍＲＮＡと１２０ｎｇの合成ガイドとをリポフェクタミンＭｅｓｓｅｎｇｅｒＭＡＸと混合し、これを細胞に加えて２日間インキュベートした後、ゲノムＤＮＡ単離を行った。ＩＶＴｍＲＮＡを使用してスクリーニングされた合成ガイドは、表８にその詳細が述べられているガイドに対応しているが、簡潔さのため、ガイド「ｍＡｌｂ２９－１－１」をｇ１－１として、「ｍＡｌｂ２９－１－８」をｇ１－８として表しているように、図５３のガイド名を短縮化した。ヒトのＴ細胞受容体遺伝子座（ＴＲＡＣ）を標的化するガイドの１つもまた試験した（図５３Ｄにおける３５ＴＲＡＣ）。ガイド３５ＴＲＡＣスペーサーは、ＴＴＴＧＰＡＭを有するＧＡＧＴＣＴＣＴＣＡＧＣＴＧＧＴＡＣＡＣＧＧ（配列番号４２６８）である。既に言及したのと同一の修飾を用いたガイド３５ＴＲＡＣを注文した。マウスのアルブミンイントロン１のＭＧ２９－１編集に関する先行例に説明されている通りにゲノムＤＮＡおよびＰＣＲ増幅を実施した。ガイド３５ＴＲＡＣについて、プライマーＦ：ＴＧＣＴＴＴＧＣＴＧＧＧＣＣＴＴＴＴＴＣ（配列番号４２６９）、プライマーＲ：ＡＣＡＧＴＣＴＧＡＧＣＡＡＡＧＧＣＡＧＧ（配列番号４２７０）を用いて、ヒトＴＲＡＣ遺伝子座を増幅した。既に説明されている通りに、得られた９５７ｂｐのＰＣＲ産物を精製した。プライマーＡＴＣＡＣＧＡＧＣＡＧＣＴＧＧＴＴＴＣＴ（配列番号４２７１）を使用し、サンガー法シーケンシングにより編集を評価した。

ＰＣＲ産物のサンガー法シーケンシング、続いてＩｎｆｅｒｅｎｃｅｏｆＣＲＩＳＰＲＥｄｉｔｓ（ＩＣＥ）を使用し、マウスのアルブミンイントロン１およびヒトＴＲＡＣ遺伝子座についての編集効率を定量した。最大で４つの生物学的複写物を表すデータを、図５３にプロットした。単一アミノ酸置換Ｓ１６８Ｒは、２－プラスミド系のガイドであるｍＡｌｂ２９－１－８を使用した場合に、編集効率が向上したことを実証した（図５３Ａ）。変異Ｅ１７２Ｒは、ガイドであるｍＡｌｂ２９－１－８については大きな向上をもたらさなかったが、変異Ｋ５８３ＲはｍＡｌｂ２９－１－８ガイドを用いて編集を完全に妨げた。ＭＧ２９－１ｍＲＮＡを用いたトランスフェクションおよび合成ガイドであるｍＡｌｂ２９－１－８は、プラスミドトランスフェクションから結果を確認した（図５３Ｂ）。単一アミノ酸置換Ｓ１６８Ｒは、ガイドであるｍＡｌｂ２９－１－８を用いて試験された異なる濃度のｍＲＮＡ全体にさらに高い編集効率を与えた（図５３Ｂ）。Ｅ１７２Ｒ（図５３Ａに見られるように単独で活性を損なわなかった置換）、またはＮ５７７Ｒ（ＭＧ２９－１プラスミドトランスフェクションでは試験されていないが、高い編集効率のｃｐｆ１を与える置換）およびＹ１７０Ｒ（予想されるＭＧ２９－１タンパク質に基づいて編集効率を向上させる可能性があると仮定されたもの）を用いたＳ１６８Ｒの二重アミノ酸置換を試験し、単一のＳ１６８Ｒ変異体と比較した。

試験された条件下では、二重変異はどれも編集効率を向上させることはなかった（図５３Ｃ）。ＭＧ２９－１ＷＴおよびＭＧ２９－１のＳ１６８Ｒバリアントの編集効率を、マウスのアルブミンイントロン１を標的化する１２個のガイドおよびヒトＴ細胞受容体遺伝子座（ＴＲＡＣ）を標的化する１個のガイドと並行して比較した。ＭＧ２９－１のＳ１６８Ｒバリアントは１３個のガイド全てについて向上した編集効率を示し、ガイドの一部は他のものよりも有益であった（図４Ｄ）。重要な点としては、Ｓ１６８Ｒは試験されたガイドのいずれかについては哺乳動物の編集効率を損なわなかった。これらの結果は、ＭＧ２９－１のＳ１６８Ｒ（アルギニンに変化したアミノ酸位置１６８のセリン）バリアントは編集活性を向上させることを実証しており、これは治療用途のための高度に活性があるガイドを同定する点で有利である。

実施例３５哺乳動物細胞におけるガイド安定性を向上させ、かつ編集効率を向上させる、本明細書に説明されているヌクレアーゼのｓｇＲＮＡの化学修飾の同定
ＲＮＡ分子は、ヌクレアーゼによる切断に対する感受性を理由として、生物系では本質的に不安定である。ＲＮＡの天然の化学構造の修飾は、治療薬開発に関してはＲＮＡ干渉（ＲＮＡｉ）に使用される安定性ＲＮＡ分子を向上させるために広く使用されている（Ｃｏｒｅｙ，ＪＣｌｉｎＩｎｖｅｓｔ．２００７Ｄｅｃ３；１１７（１２）：３６１５－３６２２，Ｊ．Ｂ．Ｂｒａｍｓｅｎ，Ｊ．ＫｊｅｍｓＦｒｏｎｔｉｅｒｓｉｎＧｅｎｅｔｉｃｓ，３（２０１２），ｐ．１５４）。安定性を向上させ、それによるインビボでの短いＲＮＡ分子の能力を向上させるという点で、ＲＮＡのヌクレオベースまたはホスホジエステル主鎖に対する化学修飾の導入は重要であった。ヌクレアーゼに対する安定性および相補的なＤＮＡまたはＲＮＡへの親和性といった点で異なる特性を有する広範の化学修飾を開発した。

類似の化学修飾は、ＣＲＩＳＰＲＣａｓ９ヌクレアーゼのためのガイドＲＮＡに適用されている（Ｈｅｎｄｅｌｅｔａｌ，ＮａｔＢｉｏｔｅｃｈｎｏｌ．２０１５Ｓｅｐ；３３（９）：９８５－９８９，ＲｙａｎｅｔａｌＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ２０１８Ｊａｎ２５；４６（２）：７９２－８０３．，ＭｉｒｅｔａｌＮａｔｕｒｅＣｏｍｍｕｎｉｃａｔｉｏｎｓｖｏｌｕｍｅ９，Ａｒｔｉｃｌｅｎｕｍｂｅｒ：２６４１（２０１８），Ｏ’ ＲｅｉｌｌｙｅｔａｌＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ２０１９４７，５４６－５５８，ＹｉｎｅｔａｌＮａｔｕｒｅＢｉｏｔｅｃｈｎｏｌｏｇｙｖｏｌｕｍｅ３５，ｐａｇｅｓ１１７９－１１８７（２０１７）、そのそれぞれの全体が、参照により本明細書に組み込まれている）。

ＭＧ２９－１ヌクレアーゼは、ｃｐｆ１などの既知のＶ型ＣＲＩＳＰＲ酵素に類似する限定されたアミノ酸配列を有する新規ヌクレアーゼである。ＭＧ２９－１について同定されたガイドＲＮＡの構造的（主鎖）成分の配列はｃｐｆ１の配列に類似しているものの、ＭＧ２９－１ガイドに対してどの化学修飾が活性を保持しつつも安定性を向上させることが可能かについては知られていなかった。哺乳動物細胞におけるｓｇＲＮＡ活性および哺乳動物細胞のタンパク質抽出物が存在する場合の安定性に対するそれらの影響を評価するため、一連のＭＧ２９－１ｓｇＲＮＡの化学修飾を設計した。

本発明者らは、ｓｇＲＮＡｍＡｌｂ２９－１－８を選択した。これは、ガイドがｃｐｆ１のガイドＲＮＡの活性を向上させるように設計されているＡｌｔＲ１／ＡｌｔＲ２として知られているＩＤＴが開発した固有の化学修飾のセットを含有する場合に、マウス肝細胞株であるＨｅｐａ１～６で高度に活性があるものであり、市販されている（ＩＤＴ）。本発明者らは、ヌクレオベースの２つの化学修飾である、２’ヒドロキシル基をメチル基に置換した２’－Ｏ－メチルと、２’ヒドロキシル基をフッ素に置換した２’－フルオロとを試験するために選択した。２’－Ｏ－メチルと２’－フルオロ修飾の両方は、ヌクレアーゼに対する耐性を向上させる。２’－Ｏ－メチル修飾は、ＲＮＡの転写修飾後に天然に存在し、ＲＮＡ：ＲＮＡ二重鎖の結合親和性を向上させるが、ＲＮＡ：ＤＮＡ安定性における影響はほとんどない。２’－フルオロ修飾塩基は免疫活性化作用を低減し、ＲＮＡ：ＲＮＡとＲＮＡ：ＤＮＡハイブリッドの両方の結合親和性を増加させる（ＰａｌｌａｎｅｔａｌＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ２０１１Ａｐｒ；３９（８）：３４８２－９５，ＣｈｅｎｅｔａｌＳｃｉｅｎｔｉｆｉｃＲｅｐｏｒｔｓｖｏｌｕｍｅ９，Ａｒｔｉｃｌｅｎｕｍｂｅｒ：６０７８（２０１９），Ｋａｗａｓａｋｉ，Ａ．Ｍ．ｅｔａｌＪＭｅｄＣｈｅｍ３６，８３１－８４１（１９９３））。

塩基間のホスホジエステル結合の代わりにチオリン酸（ＰＳ）結合を含むこともまた評価した。ＰＳ結合はヌクレアーゼに対する耐性を向上させる（ＭｏｎｉａｅｔａｌＮｕｃｌｅｉｃＡｃｉｄｓ，ＰｒｏｔｅｉｎＳｙｎｔｈｅｓｉｓ，ａｎｄＭｏｌｅｃｕｌａｒＧｅｎｅｔｉｃｓ｜Ｖｏｌｕｍｅ２７１，ＩＳＳＵＥ２４，Ｐ１４５３３－１４５４０，Ｊｕｎｅ１４，１９９６）。

マウスのアルブミンイントロン１を標的化するスペーサー（ｍＡｌｂ２９－１－８）を有するＭＧ２９－１ｓｇＲＮＡの予想される二次構造を、図５４に示す。他のＣＲＩＳＰＲ－Ｃａｓ系について知られていることに基づき、ガイドの主鎖部分のステムループがＭＧ２９－１タンパク質との相互作用にとって重要であると推定した。二次構造に基づき、ガイドの異なる構造領域および機能領域における一連の化学修飾を設計した。ガイドのどの構造領域および機能領域が、活性を著しく損なうことなく異なる化学修飾を許容することができるのかを知らせる、化学修飾がより少ないガイドの初期試験を可能とするモジュラーアプローチを採用した。構造領域および機能領域を以下のように定義した。ガイドの３’末端および５’末端はエキソヌクレアーゼの標的であり、２’－Ｏ－メチルおよびＰＳ結合を含む様々な化学修飾、ｓｐＣａｓ９のガイドの安定性を向上させるために使用されるアプローチにより保護され得る（Ｈｅｎｄｅｌｅｔａｌ，ＮａｔＢｉｏｔｅｃｈｎｏｌ．２０１５Ｓｅｐ；３３（９）：９８５－９８９）。

修飾のため、ガイドの主鎖領域のステムとループの半数の両方を含む配列を選択した。スペーサーを、シード領域（ＰＡＭに最接近している最初の６ヌクレオチド）およびスペーサーの残り１６ヌクレオチド（非シード領域と呼ばれる）に分けた。全体で４３個のガイドを設計し、３９個を合成した。４３個のガイド全ては同一のヌクレオチド配列を含有するが、化学修飾が異なっている。ＲＮＰのヌクレオフェクションによって、またはＭＧ２９－１およびガイドをコードするｍＲＮＡの同時トランスフェクションによって、またはこれら両方の方法によって、Ｈｅｐａ１～６細胞における３９個のガイドの編集活性を評価した。これら２つのトランスフェクション方法は、細胞への送達における差のため、ガイドの観察された活性に影響を与え得る。

ＲＮＰのヌクレオフェクションを使用する場合、ガイドおよびＭＧ２９－１タンパク質を試験管内で予め組み合わせ、続いてヌクレオフェクションを使用して細胞にこれらを送達する。このヌクレオフェクションでは、ＲＮＰの存在下で細胞懸濁液に電流を印加する。電流は細胞膜（および場合によっては核膜も該当）に一時的に細孔を開け、ＲＮＰにおける電荷により駆動されるＲＮＰの細胞侵入を可能にする。電流により生成された細孔を介して、またはＲＮＰのタンパク質成分中の遺伝子操作された核局在化シグナルを介して、またはこの２つの組合せを介してＲＮＰが核に入るかどうかは明確にはなっていない。

ＭｅｓｓｅｎｇｅｒＭＡＸといった脂質トランスフェクション試薬とともにｍＲＮＡとガイドとの同時トランスフェクトを使用する場合、２つのＲＮＡの混合物は正に帯電した脂質を有する複合体を形成する。この複合体はエンドサイトーシスにより細胞に侵入し、最終的には細胞質に到達する。細胞質では、ｍＲＮＡはタンパク質に翻訳される。ＭＧ２９－１などのＲＮＡガイドヌクレアーゼの場合には、得られたＭＧ２９－１タンパク質は、ＭＧ２９－１タンパク質に遺伝子操作された核局在化シグナルにより媒介されるプロセスで核に侵入する前に、細胞質にてガイドＲＮＡと複合体を形成すると推定される。

ｍＲＮＡを十分な量のＭＧ２９－１タンパク質に翻訳し、続いてＭＧ２９－１タンパク質をガイドＲＮＡに結合するにはある一定の量の時間がかかることから、ガイドＲＮＡは、ヌクレオフェクションにより予め形成されたＲＮＰを送達する場合よりも長く、細胞質中に完全な状態で存在する必要があり得る。したがって、脂質ベースのｍＲＮＡ／ｓｇＲＮＡの同時トランスフェクションは、ＲＮＰのように活性であるガイド化学物質を一部もたらすＲＮＰヌクレオフェクションの場合よりも安定したガイドを必要とするが、カチオン性脂質試薬を使用してｍＲＮＡと同時トランスフェクトする場合には不活性であり得る。

ガイドｍＡｌｂ２９８－１～ｍＡｌｂ２９８－５は、２’－Ｏ－メチルと２’フルオロ塩基の混合物＋ＰＳ結合を使用した、配列の５’末端および３’末端のみの化学修飾を含有する。化学修飾なしのｓｇＲＮＡと比較すると、これらのガイドは、ＲＮＰを介して送達される場合に７倍～１１倍活性であり、ガイドに対する末端修飾はガイド活性を向上させることを実証したが、これはエキソヌクレアーゼに対する耐性を向上させたことによると推定される。ｓｇＲＮＡであるｍＡｌｂ２９８－１～ｍＡｌｂ２９８－５は、市販の化学修飾（ＡｌｔＲ１／ＡｌｔＲ２）を含有する６４～１１４％のガイドの編集活性を示した。ガイド４は、最大数の化学修飾を含有するが、末端修飾されたガイドの活性は最小であった。ただし、非修飾ガイドよりも依然として７倍多い活性を有していた。ガイドｍＡｌｂ２９８－３０は、５’末端に３個の２’－Ｏメチル塩基と２個のＰＳ結合を、５’末端に４個の２’－Ｏメチル塩基と３個のＰＳ結合を含有し、非修飾ガイドよりも約１０倍高い活性も示し、ｍＡｌｂ２９８－１と比較してＲＮＡ同時トランスフェクションする場合には、ほぼ同じまたはわずかに向上したことを示した。これらのデータは、ＭＧ２９－１ガイドの両末端のＰＳ結合と組み合わせられた２’Ｏ－メチルが非修飾ガイドと比較してガイド活性が著しく増強されたことを実証する。

２’－フルオロ塩基とＰＳ結合との組合せもまた、ガイドの３’末端で許容された。ガイドｍＡｌｂ２９８－２８は、５’末端に３個の２’－フルオロ塩基と２個のＰＳ結合を、３’末端に４個の２’－フルオロ塩基と３個のＰＳ結合を含有する。この末端修飾されたガイドは、両末端に２’－ＯメチルとＰＳ修飾を有するガイドに類似する良好な編集活性を保持しており、ガイド安定性を向上し、編集活性を保持するために２’－フルオロが２’－Ｏメチルの代わりに使用されることを実証していた。

ｓｇＲＮＡであるｍＡｌｂ２９８－６、ｍＡｌｂ２９８－７、およびｍＡｌｂ２９８－８は、ステムの異なる領域にｍＡｌｂ２９８－１＋ＰＳ結合が存在する、同一の最小の化学修飾を５’末端と３’末端の両方に含有する。３’ステム（ｍＡｌｂ２９８－６）および５’ステム（ｍＡｌｂ２９８－７）のＰＳ結合は、ＲＮＰヌクレオフェクションアッセイのｍＡｌｂ２９８－１と比較して約３０％活性を減少させた。これは、これらの修飾が許容され得ることを示した。脂質ベースのトランスフェクションにより、活性の大幅な低減が観察された。

３’ステムおよび５’ステム（ｍＡｌｂ２９８－８）の両方のＰＳ結合を導入することで、ＲＮＰヌクレオフェクションアッセイのｍＡｌｂ２９８－１と比較して約８０％活性を減少させ、脂質トランスフェクションアッセイでは９５％超減少させた。これは、２つのＰＳ結合修飾の組合せは、ガイドの機能を著しく損なったことを示した。

ｓｇＲＮＡであるｍＡｌｂ２９８－９は、ｍＡｌｂ２９８－１＋ループのＰＳ結合に存在する、同一の最小の化学修飾を５’末端と３’末端の両方に含有し、ｍＡｌｂ２９８－１と類似する活性を示した。これは、ループのＰＳ結合が良好に許容されていることを示す。

ｓｇＲＮＡであるｍＡｌｂ２９８－１０、ｍＡｌｂ２９８－１１、およびｍＡｌｂ２９８－１２は、ステムの異なる領域にｍＡｌｂ２９８－１＋２’－Ｏメチル塩基が存在する、同一の最小の化学修飾を５’末端と３’末端の両方に含有する。３’ステム（ｍＡｌｂ２９８－１１）もしくは５’ステム（ｍＡｌｂ２９８－１２）のいずれか、またはステム（ｍＡｌｂ２９８－１０）の半数の両方に２’－Ｏメチル塩基を含むことで、最も活性のあるガイドであるｍＡｌｂ２９８－１２（５’ステム修飾）とｍＡｌｂ２９８－１とを比較すると、一般には活性がわずかに低減された状態で良好に許容された。

ガイドであるｍＡｌｂ２９８－１４は、ｍＡｌｂ２９８－１＋ステムの半数の両方の２’－Ｏ－メチル塩基とＰＳ結合との組合せに存在する、同一の最小の化学修飾を５’末端と３’末端の両方に含有する。これは、ＲＮＰヌクレオフェクションまたは脂質ベースのＲＮＡ同時トランスフェクションでは編集活性を有さなかった。これは、両ステムにＰＳ結合のみを含有するｍＡｌｂ２９８－８が低レベルの活性を保持していたという結果を確認かつ評価しており、ステムの半数の両方の大量の化学修飾によりガイドが不活性となることを示している。

ｓｇＲＮＡであるｍＡｌｂ２９８－１３は、ｍＡｌｂ２９８－１＋主鎖の残り部分およびスペーサーのシード領域を除くスペーサー全体にわたり、他の塩基ごとに間隔を開けているＰＳ結合に存在する、同一の最小の化学修飾を５’末端と３’末端の両方に含有する。これらの修飾により、バックグラウンドレベルに近い編集活性の劇的な損失がもたらされた。大部分のガイドについては純度が７５％を超えることと比較すると、このガイドの純度はわずかに約５０％であるが、編集活性の完全な損失を引き起こすことはできなかった。これにより、ガイド全体に本質的にランダムな方式でＰＳ結合を分布させることは、編集活性を保持しながらもガイド安定性を向上させるには有効なアプローチではない。

ガイドｍＡｌｂ２９８－１５およびｍＡｌｂ２９８－１６は、主鎖にｍＡｌｂ２９８－１＋大量のＰＳ結合が存在する、同一の最小化学修飾を５’末端と３’末端の両方に含有する。両方のガイドは、ＲＮＰヌクレオフェクションによっては約３５％のｍＡｌｂ２９８－１の活性を保持した一方、脂質ベースのＲＮＡ同時トランスフェクションによってはわずか３％のｍＡｌｂ２９８－１の活性を保持した。これは、主鎖の大量のＰＳ修飾が編集活性を著しく低減させたことを示している。ｍＡｌｂ２９８－１７およびｍＡｌｂ２９８－１８のように、主鎖のＰＳ結合とスペーサー領域のＰＳ結合とを組み合わせることで、ＰＳ結合をランダムに含むことがＭＧ２９－１による直接編集に対するガイドの能力を妨げるという観察結果に一致する、活性のさらなる損失がもたらされた。

ガイドであるｍＡｌｂ２９８－１９は、スペーサーにｍＡｌｂ２９８－１と同一の化学修飾を含有するが、主鎖領域では、５’端部はさらに４個の２’Ｏ－メチル塩基とさらに１４個のＰＳ結合を有する。ｍＡｌｂ２９８－１９の活性は、ＲＮＰヌクレオフェクションにより約４０％のｍＡｌｂ２９８－１の活性であったが、ＲＮＡ同時トランスフェクションではわずか２２％であった。これは、ガイドの主鎖領域の大量の化学修飾が良好に許容されていないことをさらに実証している。

ガイドであるｍＡｌｂ２９８－２０、ｍＡｌｂ２９８－２１、ｍＡｌｂ２９８－２２、およびｍＡｌｂ２９８－２３は、５’末端に単一の２’－Ｏメチルと、ｍＡｌｂ２９８－１と同じ５’末端修飾である２個のＰＳ結合から構成された主鎖領域に、同一の化学修飾を有する。ガイドであるｍＡｌｂ２９８－２０、ｍＡｌｂ２９８－２１、ｍＡｌｂ２９８－２２、およびｍＡｌｂ２９８－２３のスペーサー領域は、２’－Ｏ－メチルと２’－フルオロ塩基との組合せ、ならびにＰＳ結合を含有する。これらの４ガイドのうち最も活性があるものはｍＡｌｂ２９８－２である。この中の２’－フルオロ修飾は、ＰＡＭ（シード領域）に最も近い７塩基および２’－Ｏ－メチルと２個のＰＳ結合で修飾された３’末端の最終塩基を除き、スペーサーの全ての塩基に作製された。これは、シード領域を除き、スペーサーの大部分に２’－フルオロ修飾を含むということは活性を著しく低減させず、それによってガイド安定性を増強させる良好な戦略を表すということを実証している。

ガイドであるｍＡｌｂ２９８－２４、ｍＡｌｂ２９８－２５、ｍＡｌｂ２９８－２６、およびｍＡｌｂ２９８－８は、主鎖に同一の化学修飾を有する。ステムの半数の両方にＰＳ結合を有するｍＡｌｂ２９８－８は、編集活性がわずか２４％（ガイドであるｍＡｌｂ２９８－１の２％）に著しく低減し、これらのＰＳ結合が活性を損なったことを実証している。興味深いことには、ｍＡｌｂ２９８－２４およびｍＡｌｂ２９８－２５の編集活性も低かったものの、ｍＡｌｂ２９８－２６の活性はｍＡｌｂ２９８－８と比較すると向上していた。これは、スペーサー（シード領域を除く）中の１４個の塩基に２’－フルオロ塩基を含むｍＡｌｂ２９８－２６のさらなる修飾が、ステム中のＰＳ結合により引き起こされた編集活性の低減を救済可能であることを示している。これは、編集活性時にスペーサー中の２’－フルオロ塩基が有益に影響するというさらなる証拠を提供する。

ガイドであるｍＡｌｂ２９８－２７およびｍＡｌｂ２９８－２９は、主鎖および活性のないスペーサー領域の全体にわたって大量の塩基およびＰＳ修飾を含有する。これは、ガイドの化学修飾全てが編集活性を保持するわけではないということをさらに示している。

ｍＡｌｂ２９８－１～ｍＡｌｂ２９８－３０のガイドの解析から得られた構造活性の関係に基づき、７個のガイドのさらなるセットを設計し、Ｈｅｐａ１～６細胞のＲＮＰヌクレオフェクションおよび脂質ベースのＲＮＡ同時トランスフェクションによって設計した。これらのガイドは、ｍＡｌｂ２９８－１～ｍＡｌｂ２９８－３０のガイドで良好な編集活性を保持すると観察されている化学修飾を組み合わせた。ガイドであるｍＡｌｂ２９８－３１～ｍＡｌｂ２９８－３７は全て、５’末端の少なくとも１個の２’－Ｏメチルおよび２個のＰＳ結合と、５’末端の１個の２’－Ｏメチルおよび１個のＰＳ結合とから構成される末端修飾を含有する。末端修飾に加え、ｍＡｌｂ２９８－３１のようにステムの半数の両方の２’－Ｏメチル塩基とスペーサー（シード領域を除く）の１４個の塩基の２’－フルオロ塩基とを組み合わせることで、非修飾ガイドと比較してわずかに向上した、または単独で末端修飾に類似しており１０倍向上した編集活性がもたらされた。ｍＡｌｂ２９８－３２のように適当な５’ステムの２’－Ｏメチル塩基と、スペーサー（シード領域を除く）の１４個の塩基の２’－フルオロ塩基とを組み合わせることで、試験した中で最も活性であるガイドがもたらされた。

同様に、ｍＡｌｂ２９８－３３のように、適当なループのＰＳ結合とスペーサー（シード領域を除く）の１４個の塩基の２’－フルオロ塩基とを組み合わせることで、非修飾ガイドよりも最大で１５倍高い強力な活性がもたらされた。ガイドであるｍＡｌｂ２９８－３７は、さらに大量の３’末端修飾と、５’ステムの２’－Ｏメチル塩基、ループ中のＰＳ結合および１４個の２’フルオロ塩基、ならびにスペーサー（シード領域を除く）中の３個のＰＳ結合とを組み合わせる。このガイドは、ＡｌｔＲ１／Ｒ２修飾の編集活性に類似する編集活性を依然として保持しており、非修飾ガイドと比較すると著しく向上していた。したがって、ｍＡｌｂ２９８－３７は、哺乳動物細胞において強力な編集活性を保持している重度に修飾されたＭＧ２９－１ガイドを表している。ガイドであるｍＡｌｂ２９８－３８は、ＲＮＰとして送達された場合には強力な編集活性を示したが、脂質ベースのＲＮＡ同時トランスフェクションにより細胞に送達される場合には完全に不活性であった。これは、このようなガイドはヌクレアーゼに対して予想されていなかった感受性をいくらか有する可能性があることを示唆している。スペーサーにおいて１１個のより少ない２’－フルオロ塩基と１個少ないＰＳ結合を有すること以外はガイドであるｍＡｌｂ２９８－３７と同一のガイドであるｍＡｌｂ２９８－３９は、ＲＮＰとｍＲＮＡの両方のトランスフェクション法を考慮すると最も高い編集活性を有したが、インビボでの性能という点では有害である可能性があるいくつかの他のガイド設計よりも化学修飾が少ない。

より大量の化学修飾を有するものの、良好な編集活性もまた保持し得るｍＡｌｂ２９８－４０～ｍＡｌｂ２９８－４３を作成するため、さらなる組合せの化学修飾を設計した。例えば、一部のＤＮＡ塩基もまた組み入れるｍＡｌｂ２９８－４１では、わずか６個の塩基のみが非修飾リボヌクレオチドである。同様に、ｍＡｌｂ２９８－４２は全スペーサーにわたり２’－フルオロ基を含有し、５個の非修飾リボヌクレオチドを有する。本発明者らは、これらの試験および他のガイド化学修飾により、１つ以上の最適化された設計がもたらされることを予想している。それにもかかわらず、ガイドであるｍＡｌｂ２９８－１～ｍＡｌｂ２９８－３９のセット、とりわけｍＡｌｂ２９８－３１～ｍＡｌｂ２９８－３９のセット内では、本発明者らは、非修飾ガイドまたは適当な末端修飾を有するガイドの編集活性と同様またはこれに優る編集活性を保持する大量の化学修飾を有するガイドを同定する。

化学修飾を有さないガイド（天然ＲＮＡ）と比較して化学修飾ガイドの安定性を試験するため、細胞の粗抽出物を使用する安定性アッセイを使用した。インビトロまたはインビボで哺乳動物細胞に送達される場合、ガイドＲＮＡが曝されるヌクレアーゼ混合物を含有しなければならないことから、哺乳動物細胞に由来する細胞の粗抽出物を選択した。コンフルエントな細胞の１５ｃｍのディッシュにつき３ｍｌの冷ＰＢＳを加え、セルスクレーパーを使用してディッシュ表面から細胞を放出することで、Ｈｅｐａ１～６細胞を収集した。細胞を２００ｇで１０分間ペレット化し、将来的に使用するために－８０℃で凍結した。安定性アッセイのため、４体積の冷ＰＢＳ中に細胞を再懸濁させた（例えば、１００ｍｇのペレットについては、４００μＬの冷ＰＢＳ中に細胞を再懸濁させた）。０．２％の最終濃度（ｖ／ｖ）までＴｒｉｔｏｎＸ－１００を加え、細胞を１０秒間ボルテックスし、１０分間にわたって氷上に配置し、再度１０秒間ボルテックスした。ＴｒｉｔｏｎＸ－１００は、細胞膜を破壊するが使用される濃度ではタンパク質を不活化または変性させることがない、反応が穏やかな非イオン性界面活性剤である。

氷上にて安定性反応を構成した。これは、１００ｆｍｏｌの各ガイドを含む２０μＬの細胞の粗抽出物からなった（１μＬの１００ｎＭストック）。投入時、１５分、３０分、６０分、２４０分および５４０分（分で表しているこの時間は、各試料をインキュベートした時間の長さを指す）からなる６つの反応をガイドごとに構成した。試料を３７℃で１５分～最大５４０分インキュベートし、投入時のコントロールを氷上に５分間静置した。各インキュベーション期間後、全てのタンパク質を直ちに変性し、リボヌクレアーゼを効率的に阻害し、ＲＮＡのその後の回収を推進する、３００μＬのフェノールとグアニジンチオシアン酸塩の混合物（Ｔｒｉｒｅａｇｅｎｔ，ＺｙｍｏＲｅｓｅａｒｃｈ）を加えることで反応を停止させた。Ｔｒｉｒｅａｇｅｎｔを加えた後、試料を１５秒間ボルテックスし、－２０℃で保存した。Ｄｉｒｅｃｔ－ｚｏｌＲＮＡミニプレップキット（ＺｙｍｏＲｅｓｅａｒｃｈ）を使用して試料からＲＮＡを抽出し、１００μＬのヌクレアーゼフリー水に溶出させた。ＴａｑｍａｎｍｉＲＮＡアッセイ技術（ＴｈｅｒｍｏＦｉｓｈｅｒ）を使用するＴａｑｍａｎＲＴ－ｑＰＣＲ、ならびにガイドの全てについて同一であるｍＡｌｂ２９８ｓｇＲＮＡの配列を特異的に検出するために設計されたプライマーおよびプローブを使用し、修飾されたガイドの検出を行った。投入した試料と比較して残留するｓｇＲＮＡのパーセンテージの関数としてデータをプロットした。細胞抽出物（図５５）でインキュベートした場合に化学修飾を有さないガイドは最も迅速に除去され、９０％超のガイドは３０分以内に分解された。ＡｌｔＲ１／ＡｌｔＲ２（図５５のＡｌｔＲ）化学修飾を有するガイドは、細胞抽出物の存在下では非修飾ガイドよりもわずかに安定性があり、約８０％のガイドは３０分で分解された。両端に化学修飾、ならびに両方のステムに２’Ｏ－メチル塩基およびシード領域を除くスペーサーの全ての位置に２’－フルオロ塩基を含有する、ガイドであるｍＡｌｂ２９８－３１は、非修飾ガイドまたはＡｌｔＲガイドのいずれかよりも著しく安定していた。

ガイドであるｍＡｌｂ２９８－３４は、ガイドであるｍＡｌｂ２９８－３１と比較して向上した安定性を示した。ガイドであるｍＡｌｂ２９８－３４は、スペーサー内部の化学修飾においてのみガイドであるｍＡｌｂ２９８－３１とは異なっている。ｍＡｌｂ２９８－３４はスペーサーにｍＡｌｂ２９８－３１よりも９個少ない２’－フルオロ塩基を有するが、ｍＡｌｂ２９８－３１の２個のＰＳ結合と比較すると、スペーサーに４個のＰＳ結合を含有する。２’－フルオロ塩基はＲＮＡの安定性を向上させることから、このことは、スペーサーの追加のＰＳ結合が、ｍＡｌｂ２９８－３１と比較してｍＡｌｂ２９８－３４の安定性を向上させる原因であることを示唆している。

ガイドであるｍＡｌｂ２９８－３７は試験されたガイド全ての中で最も安定しており、２４０分（４時間）後に８０％のガイドが残留しているという点で、３０％残留していたｍＡｌｂ２９８－３４と比較するとこれよりも著しく安定していた。ｍＡｌｂ２９８－３７の化学修飾は、スペーサーと主鎖領域の両方においてガイドであるｍＡｌｂ２９８－３４とは異なっている。ｍＡｌｂ２９８－３７は、５’末端にさらに２個の２’－Ｏ－メチル基とさらに２個のＰＳ結合を有する。さらに、ｍＡｌｂ２９８－３７のループ領域はＰＳ結合を含有し、ｍＡｌｂ２９８－３４のステム後半に存在する２’－Ｏ－メチル基を含有しない。さらに、ｍＡｌｂ２９８－３７のスペーサーは９個多い２’－フルオロ塩基を含有するが、異なる配置とはいえｍＡｌｂ２９８－３４と同数のＰＳ結合を含有する。

全体的には、これらのデータはスペーサーの５’末端および主鎖領域のループのさらなるＰＳ結合がガイドＲＮＡの安定性を著しく向上させることを示唆している。試験されたガイドの中で、細胞抽出物中で最大の安定性を示すガイドであるｍＡｌｂ２９８－３７は、ＡｌｔＲ１／Ａｌｔｒ２修飾と比較して類似または向上している、５’末端および３’末端のみの化学修飾と比較して向上している、Ｈｅｐａ１～６細胞における強力な編集活性も示した。

実施例３６本明細書に説明されているヌクレアーゼを使用した、マウスの治療的な遺伝子編集
本明細書に説明されている遺伝子編集プラットフォームは、インビボでの修復変性に影響する可能性がある。肝組織は組織の一例であるが、これは、例えば有害遺伝子の発現をノックダウンするように機能し、かつ／または欠陥遺伝子を置換するために使用される挿入欠失の導入による、本明細書に説明されているインビボでの遺伝子編集のための遺伝子編集組成物および系を使用して有利に標的化されることができる。例えば、いくつかの遺伝性疾患は主に肝臓で発現するタンパク質の欠陥から生じ、肝臓へのインビボ送達はアデノ随伴ウイルス（ＡＡＶ）ベクターによる臨床試験では安全かつ有効であることが照明されている。核酸およびＲＮＡｉ戦略向けの承認済薬物を送達するための脂質ナノ粒子もまた示している。肝組織はまた、全身循環にタンパク質を有効に分泌するための適切な細胞機構を含む。

遺伝子編集治療のため、表１３または表１４の症状を有する対象を選択する。例えば、遺伝子編集プラットフォームを使用し、遺伝子補充治療による処置を行うため、血友病Ａに罹患しているヒトまたはマウスのモデル対象を識別した。

本明細書に説明されているＭＧヌクレアーゼをコードするｓｇＲＮＡおよびｍＲＮＡをカプセル化している脂質ナノ粒子（ＬＮＰ）を含む遺伝子編集プラットフォーム、ならびに治療用遺伝子をコードするドナーテンプレート核酸を含むＡＡＶ（例えば、ＡＡＶセロタイプ８）を、対象の肝臓へ静脈内導入する。ＬＮＰの表面機能化により、ＬＮＰを肝細胞に標的化する。

例えば、血友病Ａに罹患している対象は、本明細書に説明されているＭＧ２９－１ヌクレアーゼをコードするｍＲＮＡ（配列番号２１４）を含有するＬＮＰを含む、遺伝子補充プラットフォームを用いて処置される。ＬＮＰはまた、肝臓内部で高度に発現されるアルブミンＩに特異的なｓｇＲＮＡを含有する（例えば、アルブミンは肝臓内では約５ｇ／ｄＬで発現可能であるが、第ＶＩＩＩ因子は肝臓内では約１０μｇ／ｄＬで発現可能である。これはすなわち、アルブミンよりも１００万倍少ない）。ＬＮＰに加え、第ＶＩＩＩ因子補充ヌクレオチド配列をコードする補充テンプレートＤＮＡをコードするプラスミドを含むＡＡＶ８（ＡＡＶセロタイプ８）ウイルス粒子を、同様に対象に送達する。一旦、細胞内部に入ると、ｍＲＮＡ、ｓｇＲＮＡ、およびテンプレートＤＮＡが一時的に発現する。ＭＧ２９－１ヌクレアーゼは、ｓｇＲＮＡを使用して宿主肝細胞ＤＮＡの標的遺伝子座を標的化し、宿主ＤＮＡを切断する。ＡＡＶ８内の宿主肝細胞に送達されるプラスミドから転写されたドナーテンプレートＤＮＡを細胞にスプライシングし、アルブミンＩ遺伝子の標的部位で宿主ＤＮＡへと安定して組み込む。挿入された第ＶＩＩＩ因子のＤＮＡをアルブミンプロモーターの下で発現させる。

遺伝子ノックダウン治療のために選択された対象にて、遺伝子編集プラットフォームも使用する。例えば、本明細書に説明されているＭＧ２９－１ヌクレアーゼをコードするｍＲＮＡ（配列番号２１４）およびトランスサイレチン遺伝子の標的部位に特異的なｓｇＲＮＡを含有するＬＮＰを用いて、遺伝性ＡＴＴＲアミロイドーシスを呈している対象を処置する。ＭＧ２９－１ヌクレアーゼおよびｓｇＲＮＡを送達し、対象の肝細胞中で発現する。いくつかの実施形態では、ｓｇＲＮＡをトランスサイレチン遺伝子の終止コドンに標的化し、ＭＧ２９－１ヌクレアーゼの活性を内因性終止コドンから除去し、遺伝子の発現を効果的にノックダウンする。いくつかの実施形態では、遺伝子ノックダウンプラットフォームは、終止コドンを含むポリヌクレオチドをコードするプラスミドを含有するＡＡＶ８を含む。ヌクレアーゼおよびｓｇＲＮＡを発現している同一の細胞にＡＡＶ８を送達する場合、外因性終止コドンをトランスサイレチン遺伝子にスプライシングする。こうすることで、編集したＤＮＡから産生されたＲＮＡから翻訳されているタンパク質の成熟前短縮化の結果として、遺伝子の発現のノックダウンが生じる。

本明細書には本発明の好ましい実施形態が示され、説明されているが、かかる実施形態は例としてのみ提供されることは当業者には明らかとなるであろう。本発明は、明細書内に提供されている特定の実施例により限定されることを意図していない。本発明は、前述の明細書を参照して説明されてきたが、本明細書の実施形態の説明および例示は、限定的な意味で解釈されることを意味していない。当業者にとっては、多数の変形、変更および置換が本明細書から逸脱することがない限り、ここで行われる。さらに、本発明の全ての態様は、様々な条件および変数に依存する、本明細書に記載の特定の描写、構成または相対的割合に限定されないということを理解されたい。本発明の実践時に、本明細書に説明されている本発明の実施形態に対する様々な代替形態が利用され得ることを理解されたい。したがって、本発明はこうした代替、修正、変更または同等物のいずれかもまた包含することを企図している。以下の特許請求の範囲は発明の範囲を定義するものであり、これらの特許請求の範囲内の方法および構造ならびにこれらの同等物をこれによって包含することを意図している。

Claims

遺伝子操作されたヌクレアーゼ系であって、
（ａ）ＲｕｖＣドメインを含むエンドヌクレアーゼであって、前記エンドヌクレアーゼが未培養の微生物に由来しており、かつＣａｓ１２ａエンドヌクレアーゼである、ＲｕｖＣドメインを含むエンドヌクレアーゼと、
（ｂ）遺伝子操作されたガイドＲＮＡであって、前記遺伝子操作されたガイドＲＮＡが前記エンドヌクレアーゼと複合体を形成するように構成され、標的核酸配列にハイブリダイズするように構成されたスペーサー配列を含む、遺伝子操作されたガイドＲＮＡと、を含む、遺伝子操作されたヌクレアーゼ系。
遺伝子操作されたヌクレアーゼ系であって、
（ａ）配列番号１～３４７０のうちいずれか１つに対して少なくとも７５％の配列同一性を有するエンドヌクレアーゼまたはそのバリアントと、
（ｂ）遺伝子操作されたガイドＲＮＡであって、前記遺伝子操作されたガイドＲＮＡが前記エンドヌクレアーゼと複合体を形成するように構成され、標的核酸配列にハイブリダイズするように構成されたスペーサー配列を含む、遺伝子操作されたガイドＲＮＡと、を含む、遺伝子操作されたヌクレアーゼ系。
遺伝子操作されたヌクレアーゼ系であって、
（ａ）配列番号３８６２～３９１３のうちいずれか１つを含むプロトスペーサー隣接モチーフ（ＰＡＭ）配列に結合するように構成されたエンドヌクレアーゼであって、クラス２のＶ型Ｃａｓエンドヌクレアーゼである、エンドヌクレアーゼと、
（ｂ）遺伝子操作されたガイドＲＮＡであって、前記遺伝子操作されたガイドＲＮＡが前記エンドヌクレアーゼと複合体を形成するように構成され、標的核酸配列にハイブリダイズするように構成されたスペーサー配列を含む、遺伝子操作されたガイドＲＮＡと、を含む、遺伝子操作されたヌクレアーゼ系。
前記エンドヌクレアーゼが、ジンクフィンガー様ドメインをさらに含む、請求項１～３のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
前記ガイドＲＮＡが、配列番号３４７１、３５５１～３５５９、３６０８～３６０９、３６１２、３６３６～３６３７、３６４０～３６４１、３６４４～３６４５、３６４８～３６４９、３６５２～３６５３、３６５６～３６５７、３６６０～３６６１、３６６４～３６６７、３６７１～３６７２、～３６７８、３６９５～３６９６、３７２９～３７３０、３７３４～３７３５、および３８５１～３８５７のうちいずれか１つの非縮重ヌクレオチドに対して少なくとも８０％の配列同一性を有する配列を含む、請求項１～４のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
遺伝子操作されたヌクレアーゼ系であって、
（ａ）配列番号３４７１、３５３９、３５５１～３５５９、３６０８～３６０９、３６１２、３６３６～３６３７、３６４０～３６４１、３６４４～３６４５、３６４８～３６４９、３６５２～３６５３、３６５６～３６５７、３６６０～３６６１、３６６４～３６６７、３６７１～３６７２、３６７７～３６７８、３６９５～３６９６、３７２９～３７３０、３７３４～３７３５、および３８５１～３８５７のうちいずれか１つの非縮重ヌクレオチドに対して少なくとも８０％の配列同一性を有する配列を含む遺伝子操作されたガイドＲＮＡと、
（ｂ）前記遺伝子操作されたガイドＲＮＡに結合するように構成されたクラス２のＶ型Ｃａｓエンドヌクレアーゼと、を含む、遺伝子操作されたヌクレアーゼ系。
前記エンドヌクレアーゼが、配列番号３８６３～３９１３のいずれか１つを含むプロトスペーサー隣接モチーフ（ＰＡＭ）配列に結合するように構成されている、請求項１～６のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
前記ガイドＲＮＡが、真核生物、真菌、植物、哺乳動物、またはヒトゲノムのポリヌクレオチド配列に相補的な配列を含む、請求項１～７のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
前記ガイドＲＮＡが３０～２５０ヌクレオチド長である、請求項１～８のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
前記エンドヌクレアーゼが、前記エンドヌクレアーゼのＮ末端またはＣ末端近位に１つ以上の核局在化配列（ＮＬＳ）を含む、請求項１～９のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
前記ＮＬＳが、配列番号３９３８～３９５３からなる群の配列に対して少なくとも８０％同一である配列を含む、請求項１～１０のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
前記エンドヌクレアーゼの配列が配列番号２１５に対して最適にアラインメントされている場合には、前記エンドヌクレアーゼが以下の変異：Ｓ１６８Ｒ、Ｅ１７２Ｒ、Ｎ５７７Ｒ、またはＹ１７０Ｒのうち少なくとも１つを含む、請求項１～１０のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
前記エンドヌクレアーゼの配列が配列番号２１５に対して最適にアラインメントされている場合には、前記エンドヌクレアーゼが変異Ｓ１６８ＲおよびＥ１７２Ｒを含む、請求項１～１０のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
前記エンドヌクレアーゼの配列が配列番号２１５に対して最適にアラインメントされている場合には、前記エンドヌクレアーゼが変異Ｎ５７７ＲまたはＹ１７０Ｒを含む、請求項１～１０のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
前記エンドヌクレアーゼの配列が配列番号２１５に対して最適にアラインメントされている場合には、前記エンドヌクレアーゼが変異Ｓ１６８Ｒを含む、請求項１～１０のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
前記エンドヌクレアーゼがＥ１７２、Ｎ５７７、またはＹ１７０の変異を含まない、請求項１５に記載の遺伝子操作されたヌクレアーゼ系。
一本鎖または二本鎖ＤＮＡ修復テンプレートであって、５’～３’で、すなわち前記標的デオキシリボ核酸配列に対して５’で少なくとも２０ヌクレオチドの配列を含む第１のホモロジーアームと、少なくとも１０ヌクレオチドの合成ＤＮＡ配列と、前記標的配列に対して３’で少なくとも２０ヌクレオチドの配列を含む第２のホモロジーアームと、を含む一本鎖または二本鎖ＤＮＡ修復テンプレート、
をさらに含む、請求項１～１６のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
前記第１のホモロジーアームまたは前記第２のホモロジーアームが、少なくとも４０、８０、１２０、１５０、２００、３００、５００、または１，０００ヌクレオチドの配列を含む、請求項１７に記載の遺伝子操作されたヌクレアーゼ系。
前記第１のホモロジーアームおよび前記第２のホモロジーアームが、原核生物、細菌、真菌、または真核生物のゲノム配列に相同である、請求項１２～１８のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
前記一本鎖または前記二本鎖ＤＮＡ修復テンプレートが導入遺伝子のドナーを含む、請求項１２～１９のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
１つまたは２つの一本鎖ＤＮＡセグメントと隣接している二本鎖ＤＮＡセグメントを含むＤＮＡ修復テンプレートをさらに含む、請求項１～２０のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
一本鎖ＤＮＡセグメントが、前記二本鎖ＤＮＡセグメントの５’末端にコンジュゲートされている、請求項２１に記載の遺伝子操作されたヌクレアーゼ系。
前記一本鎖ＤＮＡセグメントが、前記二本鎖ＤＮＡセグメントの３’末端にコンジュゲートされている、請求項２１に記載の遺伝子操作されたヌクレアーゼ系。
前記一本鎖ＤＮＡセグメントが、４～１０ヌクレオチド塩基の長さを有する、請求項２１～２３のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
前記一本鎖ＤＮＡセグメントが、前記スペーサー配列内の配列に相補的なヌクレオチド配列を有する、請求項２１～２４のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
前記二本鎖ＤＮＡ配列が、バーコード、オープンリーディングフレーム、エンハンサー、プロモーター、タンパク質コード配列、ｍｉＲＮＡコード配列、ＲＮＡコード配列、または導入遺伝子を含む、請求項２１～２５のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
前記二本鎖ＤＮＡ配列がヌクレアーゼ切断部位と隣接している、請求項２１～２５のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
前記ヌクレアーゼ切断部位がスペーサー配列およびＰＡＭ配列を含む、請求項２７に記載の遺伝子操作されたヌクレアーゼ系。
前記ヌクレアーゼ系がＭｇ^２＋源をさらに含む、請求項１～２８のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
前記ガイドＲＮＡが、少なくとも８、少なくとも１０、または少なくとも１２塩基対のリボヌクレオチドを含むヘアピンを含む、請求項１～２９のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
前記ヘアピンが１０塩基対のリボヌクレオチドを含む、請求項３０に記載の遺伝子操作されたヌクレアーゼ系。
ａ）前記エンドヌクレアーゼが、配列番号１４１、２１５、２２９、２６１、もしくは１７１１～１７２１のうちいずれか１つに対して少なくとも７５％、８０％、もしくは９０％同一の配列、またはそのバリアントを含み、
ｂ）前記ガイドＲＮＡ構造が、配列番号３６０８～３６０９、３８５３、または３８５１～３８５７のうちいずれか１つの非縮重ヌクレオチドに対して少なくとも８０％、または９０％同一の配列を含む、
請求項１～３１のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
前記エンドヌクレアーゼが、配列番号３８６３～３９１３のうちいずれか１つを含むＰＡＭに結合するように構成されている、請求項１～３２のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
前記エンドヌクレアーゼが配列番号３８７１を含むＰＡＭに結合するように構成されている、請求項１～３２のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
前記配列同一性が、Ｓｍｉｔｈ－Ｗａｔｅｒｍａｎホモロジー検索アルゴリズムパラメータでＢＬＡＳＴＰ、ＣＬＵＳＴＡＬＷ、ＭＵＳＣＬＥ、ＭＡＦＦＴアルゴリズム、またはＣＬＵＳＴＡＬＷアルゴリズムによって決定される、請求項５～３４のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
前記配列同一性が、３のワード長（Ｗ）、１０の期待値（Ｅ）のパラメータ、および１１の存在、１の伸長でのギャップコストを設定しているＢＬＯＳＵＭ６２スコア行列を使用する、ならびに条件付き組合せスコア行列の調整を使用する、前記ＢＬＡＳＴＰホモロジー検索アルゴリズムによって決定される、請求項３５に記載の遺伝子操作されたヌクレアーゼ系。
遺伝子操作されたガイドＲＮＡであって、
ａ）標的ＤＮＡ分子中の標的配列に相補的であるヌクレオチド配列を含むＤＮＡ標的セグメントと、
ｂ）二本鎖ＲＮＡ（ｄｓＲＮＡ）二重鎖を形成するようにハイブリダイズするヌクレオチドの２つの相補的な並びを含むタンパク質結合セグメントと、を含み、
前記ヌクレオチドの２つの相補的な並びが、介在性ヌクレオチドと互いに共有結合され、
前記遺伝子操作されたガイドリボ核酸ポリヌクレオチドが、配列番号１～３４７０のうちいずれか１つに対して少なくとも７５％の配列同一性を有するエンドヌクレアーゼとの複合体の形成、および前記標的ＤＮＡ分子の前記標的配列への前記複合体の標的化、が可能である、遺伝子操作されたガイドＲＮＡ。
前記ＤＮＡ標的セグメントが、前記ヌクレオチドの２つの相補的な並びの両方の３’に位置づけられている、請求項３７に記載の遺伝子操作されたガイドリボ核酸ポリヌクレオチド。
前記タンパク質結合セグメントが、配列番号３６０８～３６０９の非縮重ヌクレオチドに対して少なくとも７０％、少なくとも８０％、または少なくとも９０％の同一性を有する配列を含む、請求項３７～３８に記載の遺伝子操作されたガイドリボ核酸ポリヌクレオチド。
前記二本鎖ＲＮＡ（ｄｓＲＮＡ）二重鎖が、少なくとも５、少なくとも８、少なくとも１０、または少なくとも１２リボヌクレオチドを含む、請求項３７～３９のいずれか一項に記載の遺伝子操作されたガイドリボ核酸ポリヌクレオチド。
請求項１～４０のいずれか一項に記載の遺伝子操作されたガイドリボ核酸ポリヌクレオチドをコードするデオキシリボ核酸ポリヌクレオチド。
生物での発現に最適化された遺伝子操作された核酸配列を含む核酸であって、前記核酸がクラス２のＶ型Ｃａｓエンドヌクレアーゼをコードしており、前記エンドヌクレアーゼが未培養の微生物に由来し、前記生物が前記未培養の生物ではない、核酸。
前記エンドヌクレアーゼが、配列番号１～３４７０のうちいずれか１つに対して少なくとも７０％、または少なくとも８０％の配列同一性を有するバリアントを含む、請求項４２に記載の核酸。
前記エンドヌクレアーゼが、前記エンドヌクレアーゼのＮ末端またはＣ末端近位に１つ以上の核局在化配列（ＮＬＳ）をコードする配列を含む、請求項４２または４３に記載の核酸。
前記ＮＬＳが配列番号３９３８～３９５３から選択された配列を含む、請求項４４に記載の核酸。
前記ＮＬＳが配列番号３９３９を含む、請求項４４または４５に記載の核酸。
前記ＮＬＳが前記エンドヌクレアーゼの前記Ｎ末端近位にある、請求項４６に記載の核酸。
前記ＮＬＳが配列番号３９３８を含む、請求項４４または４５に記載の核酸。
前記ＮＬＳが前記エンドヌクレアーゼの前記Ｃ末端近位にある、請求項４８に記載の核酸。
前記生物が、原核生物、細菌、真核生物、真菌、植物、哺乳動物、げっ歯類、またはヒトである、請求項４２～４９のいずれか一項に記載の核酸。
クラス２のＶ型Ｃａｓエンドヌクレアーゼをコードする核酸配列を含む遺伝子操作されたベクターであって、前記エンドヌクレアーゼが未培養の微生物に由来する、遺伝子操作されたベクター。
請求項４２～４６のいずれか一項に記載の核酸を含む遺伝子操作されたベクター。
請求項４１に記載のデオキシリボ核酸ポリヌクレオチドを含む遺伝子操作されたベクター。
前記ベクターがプラスミド、ミニサークル、ＣＥＬｉＤ、アデノ随伴ウイルス（ＡＡＶ）由来のウイルス粒子、レンチウイルス、またはアデノウイルスである、請求項５１～５３のいずれか一項に記載の遺伝子操作されたベクター。
請求項５１～５４のいずれか一項に記載のベクターを含む細胞。
エンドヌクレアーゼを製造する方法であって、請求項５５に記載の細胞を培養することを含む、方法。
二本鎖デオキシリボ核酸ポリヌクレオチドを結合、切断、マーキング、または修飾するための方法であって、
（ａ）前記エンドヌクレアーゼおよび前記二本鎖デオキシリボ核酸ポリヌクレオチドに結合するように構成された遺伝子操作されたガイドＲＮＡを含む複合体中で、前記二本鎖デオキシリボ核酸ポリヌクレオチドとクラス２のＶ型Ｃａｓエンドヌクレアーゼとを接触させること、を含み、
前記二本鎖デオキシリボ核酸ポリヌクレオチドがプロトスペーサー隣接モチーフ（ＰＡＭ）を含み、
前記ＰＡＭが配列番号３８６３～３９１３のうちいずれか１つを含む配列を含む、方法。
前記二本鎖デオキシリボ核酸ポリヌクレオチドが、前記遺伝子操作されたガイドＲＮＡの配列に相補的な配列を含む第１の鎖と、前記ＰＡＭを含む第２の鎖と、を含む、請求項５７に記載の方法。
前記ＰＡＭが、前記遺伝子操作されたガイドＲＮＡの前記配列に相補的な前記配列の５’末端に直接隣接している、請求項５８に記載の方法。
前記ＰＡＭが配列番号３８７１を含む、請求項５７～５９のいずれか一項に記載の方法。
前記クラス２のＶ型Ｃａｓエンドヌクレアーゼが未培養の微生物に由来する、請求項５７～６０のいずれか一項に記載の方法。
前記二本鎖デオキシリボ核酸ポリヌクレオチドが、真核生物、植物、真菌、哺乳動物、げっ歯類、またはヒト二本鎖デオキシリボ核酸ポリヌクレオチドである、請求項５７～６１のいずれか一項に記載の方法。
標的核酸遺伝子座を修飾する方法であって、前記方法が、請求項１～３６のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系を前記標的核酸遺伝子座に送達することを含み、前記エンドヌクレアーゼが前記遺伝子操作されたガイドリボ核酸構造と複合体を形成するように構成され、前記複合体を前記標的核酸遺伝子座に結合する際に前記複合体が前記標的核酸遺伝子座を修飾するように、前記複合体が構成されている、方法。
前記標的核酸遺伝子座を修飾することが、前記標的核酸遺伝子座を結合、前記標的核酸遺伝子座に切れ目をいれる、前記標的核酸遺伝子座を切断、または前記標的核酸遺伝子座をマーキングすることを含む、請求項６３に記載の方法。
前記標的核酸遺伝子座がデオキシリボ核酸（ＤＮＡ）またはリボ核酸（ＲＮＡ）を含む、請求項６３または６４に記載の方法。
前記標的核酸がゲノムＤＮＡ、ウイルスＤＮＡ、ウイルスＲＮＡ、または細菌ＤＮＡを含む、請求項６３に記載の方法。
前記標的核酸遺伝子座がインビトロである、請求項６３～６６のいずれか一項に記載の方法。
前記標的核酸遺伝子座が細胞内にある、請求項６３～６６のいずれか一項に記載の方法。
前記細胞が原核生物細胞、細菌細胞、真核生物細胞、真菌細胞、植物細胞、動物細胞、哺乳動物細胞、げっ歯類細胞、霊長類細胞、ヒト細胞、または初代細胞である、請求項６８に記載の方法。
前記細胞が初代細胞である、請求項６８または６９に記載の方法。
前記初代細胞がＴ細胞である、請求項７０に記載の方法。
前記初代細胞が造血幹細胞（ＨＳＣ）である、請求項７０に記載の方法。
前記遺伝子操作されたヌクレアーゼ系を前記標的核酸遺伝子座に送達することが、請求項４２～４６のいずれか一項に記載の核酸、または請求項５１～５４のいずれか一項に記載のベクターを送達することを含む、請求項６３～７２のいずれか一項に記載の方法。
前記遺伝子操作されたヌクレアーゼ系を前記標的核酸遺伝子座に送達することが、前記エンドヌクレアーゼをコードするオープンリーディングフレームを含む核酸を送達することを含む、請求項６３～７３のいずれか一項に記載の方法。
前記核酸が、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームが動作可能に連結されているプロモーターを含む、請求項７４に記載の方法。
前記遺伝子操作されたヌクレアーゼ系を前記標的核酸遺伝子座に送達することが、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含有するキャップされたｍＲＮＡを送達することを含む、請求項６３～７５のいずれか一項に記載の方法。
前記遺伝子操作されたヌクレアーゼ系を前記標的核酸遺伝子座に送達することが、翻訳されたポリペプチドを送達することを含む、請求項６３～７６のいずれか一項に記載の方法。
前記遺伝子操作されたヌクレアーゼ系を前記標的核酸遺伝子座に送達することが、リボ核酸（ＲＮＡ）ｐｏｌＩＩＩプロモーターに動作可能に連結された前記遺伝子操作されたガイドＲＮＡをコードするデオキシリボ核酸（ＤＮＡ）を送達することを含む、請求項６３～７６のいずれか一項に記載の方法。
前記エンドヌクレアーゼが、前記標的遺伝子座でまたは前記標的遺伝子座近傍で、一本鎖切断または二本鎖切断を誘導する、請求項６３～７８のいずれか一項に記載の方法。
前記エンドヌクレアーゼが、前記標的遺伝子座内で、または前記標的遺伝子座に対して３’でねじれ形の一本鎖切断を誘導する、請求項７９に記載の方法。
細胞のＴＲＡＣ遺伝子座を編集する方法であって、
（ａ）ＲＮＡガイドエンドヌクレアーゼ、および
（ｂ）遺伝子操作されたガイドＲＮＡであって、前記遺伝子操作されたガイドＲＮＡが前記エンドヌクレアーゼと複合体を形成するように構成され、前記遺伝子操作されたガイドＲＮＡが、前記ＴＲＡＣ遺伝子座の領域にハイブリダイズするように構成されたスペーサー配列を含む、遺伝子操作されたガイドＲＮＡ、を前記細胞に接触させることを含み、
前記遺伝子操作されたガイドＲＮＡが、配列番号４３１６～４３６９のうちいずれか１つの少なくとも１８連続ヌクレオチドに対して少なくとも８５％の同一性を有する標的化配列を含む、方法。
前記ＲＮＡガイドヌクレアーゼがＣａｓエンドヌクレアーゼである、請求項８１に記載の方法。
前記Ｃａｓエンドヌクレアーゼがクラス２のＶ型Ｃａｓエンドヌクレアーゼである、請求項８２に記載の方法。
前記クラス２のＶ型Ｃａｓエンドヌクレアーゼが、ＲｕｖＣＩサブドメイン、ＲｕｖＣＩＩサブドメイン、およびＲｕｖＣＩＩＩサブドメインを含むＲｕｖＣドメインを含む、請求項８３に記載の方法。
前記クラス２のＶ型Ｃａｓエンドヌクレアーゼが、配列番号１～３４７０のうちいずれか１つに対して少なくとも７５％の配列同一性を有するエンドヌクレアーゼ、またはそのバリアントを含む、請求項８３または８４に記載の方法。
前記遺伝子操作されたガイドＲＮＡが、配列番号３４７１、３５３９、３５５１～３５５９、３６０８～３６０９、３６１２、３６３６～３６３７、３６４０～３６４１、３６４４～３６４５、３６４８～３６４９、３６５２～３６５３、３６５６～３６５７、３６６０～３６６１、３６６４～３６６７、３６７１～３６７２、３６７７～３６７８、３６９５～３６９６、３７２９～３７３０、３７３４～３７３５、および３８５１～３８５７のうちいずれか１つの非縮重ヌクレオチドの少なくとも１９個に対して少なくとも８０％の配列同一性を有する配列をさらに含む、請求項８１～８５のいずれか一項に記載の方法。
前記エンドヌクレアーゼが、配列番号１４１、２１５、２２９、２６１、もしくは１７１１～１７２１のうちいずれか１つに対して少なくとも７５％、少なくとも８０％、もしくは少なくとも９０％同一である配列、またはそのバリアントを含む、請求項８１～８５のいずれか一項に記載の方法。
前記ガイドＲＮＡ構造が、配列番号３６０８～３６０９、３８５３、または３８５１～３８５７のうちいずれか１つの非縮重ヌクレオチドの少なくとも１９個に対して少なくとも８０％、または少なくとも９０％同一である配列を含む、請求項８７に記載の方法。
前記方法が、３’または５’末端上で、配列番号４４２４または４４２５のうちいずれか１つに対して少なくとも８０％の同一性を有する配列に隣接するカーゴ配列を含むドナー核酸を、前記細胞に接触させること、または前記細胞に導入することをさらに含む、請求項８１～８８のいずれか一項に記載の方法。
前記細胞が末梢血単核球（ＰＢＭＣ）である、請求項８１～８９のいずれか一項に記載の方法。
前記細胞がＴ細胞、またはその前駆体、または造血幹細胞（ＨＳＣ）である、請求項８１～８９のいずれか一項に記載の方法。
前記カーゴ配列が、Ｔ細胞受容体ポリペプチド、ＣＡＲ－Ｔポリペプチド、またはそれらのフラグメントもしくはそれらの誘導体をコードする配列を含む、請求項８９～９１のいずれか一項に記載の方法。
前記遺伝子操作されたガイドＲＮＡが、配列番号４３７０～４４２３のうちいずれか１つに対して少なくとも８０％の同一性を有する配列を含む、請求項８１～９２のいずれか一項に記載の方法。
前記遺伝子操作されたガイドＲＮＡが、表５Ａに列挙された対応する化学修飾を含む、表５ＡからのｓｇＲＮＡ１～５４のヌクレオチド配列を含む、請求項９３に記載の方法。
前記遺伝子操作されたガイドＲＮＡが、配列番号４３３４、４３５０、または４３２４のうちいずれか１つに対して少なくとも８０％の配列同一性を有する標的化配列を含む、請求項８１～９３のいずれか一項に記載の方法。
前記遺伝子操作されたガイドＲＮＡが、配列番号４３８８、４４０４、または４３７８のうちいずれか１つに対して少なくとも８０％の配列同一性を有する配列を含む、請求項８１～９３のいずれか一項に記載の方法。
前記遺伝子操作されたガイドＲＮＡが、表５ＡからのｓｇＲＮＡ９、３５、または１９のヌクレオチド配列を含む、請求項９６に記載の方法。
遺伝子操作されたヌクレアーゼ系であって、
（ａ）ＲＮＡガイドエンドヌクレアーゼと、
（ｂ）遺伝子操作されたガイドＲＮＡであって、前記遺伝子操作されたガイドＲＮＡが前記エンドヌクレアーゼと複合体を形成するように構成され、前記遺伝子操作されたガイドＲＮＡが標的核酸配列にハイブリダイズするように構成されたスペーサー配列を含む、遺伝子操作されたガイドＲＮＡと、を含み、
前記遺伝子操作されたガイドＲＮＡが、以下の修飾：
（ｉ）前記遺伝子操作されたガイドＲＮＡの５’末端の最初の４塩基、または前記遺伝子操作されたガイドＲＮＡの３’末端の最後の４塩基内の少なくとも１ヌクレオチドの２’－Ｏメチル、または２’－フルオロ塩基修飾、
（ｉｉ）前記遺伝子操作されたガイドＲＮＡの５’末端の最初の５塩基のうち少なくとも２つの間のチオリン酸（ＰＳ）結合、または前記遺伝子操作されたガイドＲＮＡの３’末端の最後の５塩基のうち少なくとも２つの間のチオリン酸結合、
（ｉｉｉ）前記遺伝子操作されたガイドＲＮＡの３’ステムまたは５’ステム内のチオリン酸結合、
（ｉｖ）前記遺伝子操作されたガイドＲＮＡの３’ステムまたは５’ステム内の２’－Ｏメチル、または２’－塩基修飾、
（ｖ）前記遺伝子操作されたガイドＲＮＡのスペーサー領域の少なくとも７塩基の２’－フルオロ塩基修飾、および
（ｖｉ）前記遺伝子操作されたガイドＲＮＡのループ領域内のチオリン酸結合、
のうち少なくとも１つを含む、遺伝子操作されたヌクレアーゼ系。
前記遺伝子操作されたガイドＲＮＡが、前記遺伝子操作されたガイドＲＮＡの５’末端の最初の５塩基、または前記遺伝子操作されたガイドＲＮＡの３’末端の最後の５塩基内の少なくとも１ヌクレオチドの２’－Ｏメチル、または２’－フルオロ塩基修飾を含む、請求項９８に記載の遺伝子操作されたヌクレアーゼ系。
前記遺伝子操作されたガイドＲＮＡが、前記遺伝子操作されたガイドＲＮＡの５’末端、または前記遺伝子操作されたガイドＲＮＡの３’末端で２’－Ｏメチル、または２’－フルオロ塩基修飾を含む、請求項９８に記載の遺伝子操作されたヌクレアーゼ系。
前記遺伝子操作されたガイドＲＮＡが、前記遺伝子操作されたガイドＲＮＡの５’末端の最初の５塩基のうち少なくとも２つの間のチオリン酸（ＰＳ）結合、または前記遺伝子操作されたガイドＲＮＡの３’末端の最後の５塩基のうち少なくとも２つの間のチオリン酸結合、を含む、請求項９８～１００のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
前記遺伝子操作されたガイドＲＮＡが、前記遺伝子操作されたガイドＲＮＡの３’ステムまたは５’ステム内にチオリン酸結合を含む、請求項９８～１０１のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
前記遺伝子操作されたガイドＲＮＡが、前記遺伝子操作されたガイドＲＮＡの３’ステムまたは５’ステム内に２’－Ｏメチル塩基修飾を含む、請求項９８～１０２のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
前記遺伝子操作されたガイドＲＮＡが、前記遺伝子操作されたガイドＲＮＡのスペーサー領域の少なくとも７塩基の２’－フルオロ塩基修飾を含む、請求項９８～１０３のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
前記遺伝子操作されたガイドＲＮＡが、前記遺伝子操作されたガイドＲＮＡのループ領域内にチオリン酸結合を含む、請求項９８～１０４のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
前記遺伝子操作されたガイドＲＮＡが、前記遺伝子操作されたガイドＲＮＡの前記５’末端で少なくとも３つの２’－Ｏメチルまたは２’－フルオロ塩基、前記遺伝子操作されたガイドＲＮＡの前記５’末端の最初の３塩基間の２つのチオリン酸結合、前記遺伝子操作されたガイドＲＮＡの前記４’末端での少なくとも４つの２’－Ｏメチルまたは２’－フルオロ塩基、および前記遺伝子操作されたガイドＲＮＡの前記３’末端の最後の３塩基間の３つのチオリン酸結合、を含む、請求項９８～１０５のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
前記遺伝子操作されたガイドＲＮＡが、前記遺伝子操作されたガイドＲＮＡの５’末端に少なくとも２つの２’－Ｏ－メチル塩基および少なくとも２つのチオリン酸結合、ならびに前記遺伝子操作されたガイドＲＮＡの３’末端に少なくとも１つの２’－Ｏ－メチル塩基および少なくとも１つのチオリン酸結合を含む、請求項９８に記載の遺伝子操作されたヌクレアーゼ系。
前記遺伝子操作されたガイドＲＮＡが、前記遺伝子操作されたガイドＲＮＡの前記３’ステムまたは前記５’ステム領域の両方に、少なくとも１つの２’－Ｏ－メチル塩基を含む、請求項１０７に記載の遺伝子操作されたヌクレアーゼ系。
前記遺伝子操作されたガイドＲＮＡが、前記遺伝子操作されたガイドＲＮＡのシード領域を除く前記スペーサー領域に少なくとも１個～少なくとも１４個の２’－フルオロ塩基を含む、請求項１０７または１０８に記載の遺伝子操作されたヌクレアーゼ系。
前記遺伝子操作されたガイドＲＮＡが、前記遺伝子操作されたガイドＲＮＡの前記５’ステム領域に少なくとも１つの２’－Ｏ－メチル塩基、および前記ガイドＲＮＡのシード領域を除く前記スペーサー領域に少なくとも１個～少なくとも１４個の２’－フルオロ塩基を含む、請求項１０７に記載の遺伝子操作されたヌクレアーゼ系。
前記ガイドＲＮＡが、ＶＥＧＦ－Ａ遺伝子を標的化するスペーサー配列を含む、請求項９８～１１０のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
前記ガイドＲＮＡが、配列番号３９８５に対して少なくとも８０％の同一性を有するスペーサー配列を含む、請求項１１１に記載の遺伝子操作されたヌクレアーゼ系。
前記ガイドＲＮＡが、表７に列挙された化学修飾を含む表７からのガイドＲＮＡ１～７のヌクレオチドを含む、請求項１１１に記載の遺伝子操作されたヌクレアーゼ系。
前記ＲＮＡガイドヌクレアーゼがＣａｓエンドヌクレアーゼである、請求項９８～１１３のいずれか一項に記載の方法。
前記Ｃａｓエンドヌクレアーゼがクラス２のＶ型Ｃａｓエンドヌクレアーゼである、請求項１１４に記載の方法。
前記クラス２のＶ型Ｃａｓエンドヌクレアーゼが、ＲｕｖＣＩサブドメイン、ＲｕｖＣＩＩサブドメイン、およびＲｕｖＣＩＩＩサブドメインを含むＲｕｖＣドメインを含む、請求項１１５に記載の方法。
前記クラス２のＶ型Ｃａｓエンドヌクレアーゼが、配列番号１～３４７０のうちいずれか１つに対して少なくとも７５％の配列同一性を有するエンドヌクレアーゼ、またはそのバリアントを含む、請求項１１５～１１６のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
前記クラス２のＶ型Ｃａｓエンドヌクレアーゼが、配列番号１４１、２１５、２２９、２６１、もしくは１７１１～１７２１のうちいずれか１つに対して少なくとも７５％の配列同一性を有するエンドヌクレアーゼ、またはそのバリアントを含む、請求項１１５～１１６のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
前記遺伝子操作されたガイドＲＮＡが、配列番号３４７１、３５３９、３５５１～３５５９、３６０８～３６０９、３６１２、３６３６～３６３７、３６４０～３６４１、３６４４～３６４５、３６４８～３６４９、３６５２～３６５３、３６５６～３６５７、３６６０～３６６１、３６６４～３６６７、３６７１～３６７２、３６７７～３６７８、３６９５～３６９６、３７２９～３７３０、３７３４～３７３５、および３８５１～３８５７のうちいずれか１つの非縮重ヌクレオチドに対して少なくとも８０％の配列同一性を有する配列を含む、請求項１１４～１１８のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
前記遺伝子操作されたガイドＲＮＡが、配列番号３６０８～３６０９、３８５３、または３８５１～３８５７のうちいずれか１つの非縮重ヌクレオチドに対して少なくとも８０％の配列同一性を有する配列を含む、請求項１１１～１１８のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
配列番号１～３４７０のうちいずれか１つに対して少なくとも７５％の配列同一性を有する異種エンドヌクレアーゼ、またはそのバリアントをコードするオープンリーディングフレームを含む、宿主細胞。
前記エンドヌクレアーゼが、配列番号１４１、２１５、２２９、２６１、もしくは１７１１～１７２１のうちいずれか１つ、またはそのバリアントに対して少なくとも７５％の配列同一性を有する、請求項１２１に記載の宿主細胞。
前記宿主細胞が大腸菌細胞である、請求項１２１～１２２のいずれか一項に記載の宿主細胞。
前記大腸菌細胞がλＤＥ３溶原菌である、または前記大腸菌細胞がＢＬ２１（ＤＥ３）株である、請求項１２３に記載の宿主細胞。
前記大腸菌細胞がｏｍｐＴｌｏｎ遺伝子型を有する、請求項１０９～１１０のいずれか一項に記載の宿主細胞。
前記オープンリーディングフレームが、Ｔ７プロモーター配列、Ｔ７－ｌａｃプロモーター配列、ｌａｃプロモーター配列、ｔａｃプロモーター配列、ｔｒｃプロモーター配列、ＰａｒａＢＡＤプロモーター配列、ＰｒｈａＢＡＤプロモーター配列、Ｔ５プロモーター配列、ｃｓｐＡプロモーター配列、ａｒａＰ_ＢＡＤプロモーター、ラムダファージ由来の強力な左方向プロモーター（ｐＬプロモーター）、またはそれらの任意の組合せに動作可能に連結される、請求項１２１～１２５のいずれか一項に記載の宿主細胞。
前記オープンリーディングフレームが、前記エンドヌクレアーゼをコードする配列にインフレームで連結されたアフィニティータグをコードする配列を含む、請求項１２１～１２６のいずれか一項に記載の宿主細胞。
前記アフィニティータグが、固定化金属アフィニティークロマトグラフィー（ＩＭＡＣ）タグである、請求項１２７に記載の方法。
前記ＩＭＡＣタグがポリヒスチジンタグである、請求項１２８に記載の方法。
前記アフィニティータグがｍｙｃタグ、ヒトインフルエンザ赤血球凝集素（ＨＡ）タグ、マルトース結合タンパク質（ＭＢＰ）タグ、グルタチオンＳ－転移酵素（ＧＳＴ）タグ、ストレプトアビジンタグ、ＦＬＡＧタグ、またはそれらの任意の組合せである、請求項１２７に記載の方法。
前記アフィニティータグが、プロテアーゼ切断部位をコードするリンカー配列を介して前記エンドヌクレアーゼをコードする前記配列にインフレームで連結されている、請求項１２７～１３０のいずれか一項に記載の宿主細胞。
前記プロテアーゼ切断部位が、タバコエッチウイルス（ＴＥＶ）プロテアーゼ切断部位、ＰｒｅＳｃｉｓｓｉｏｎ（登録商標）プロテアーゼ切断部位、トロンビン切断部位、血液凝固因子Ｘａ切断部位、エンテロキナーゼ切断部位、またはそれらの任意の組合せである、請求項１３１に記載の宿主細胞。
前記オープンリーディングフレームが、前記宿主細胞での発現にコドン最適化されている、請求項１２１～１３２のいずれか一項に記載の宿主細胞。
前記オープンリーディングフレームがベクター上に設けられている、請求項１２１～１３３のいずれか一項に記載の宿主細胞。
前記オープンリーディングフレームが前記宿主細胞のゲノムに組み込まれている、請求項１２１～１３３のいずれか一項に記載の宿主細胞。
適合性のある液体培地中で、請求項１２１～１３５のいずれか一項に記載の宿主細胞を含む培養物。
適合性のある増殖培地中で、請求項１２１～１３５のいずれか一項に記載の宿主細胞を培養することを含む、エンドヌクレアーゼを産生する方法。
さらなる化学薬剤、または増量した栄養物を追加することで、前記エンドヌクレアーゼの発現を誘導することをさらに含む、請求項１３７に記載の方法。
さらなる化学薬剤または増量した栄養物がイソプロピルβ－Ｄ－１－チオガラクトピラノシド（ＩＰＴＧ）または追加量のラクトースを含む、請求項１３８に記載の方法。
前記培養後に前記宿主細胞を単離し、前記宿主細胞を溶解してタンパク質抽出物を製造することをさらに含む、請求項１３７～１３９のいずれか一項に記載の方法。
前記タンパク質抽出物をＩＭＡＣ、またはイオンアフィニティークロマトグラフィーに供することをさらに含む、請求項１４０に記載の方法。
前記オープンリーディングフレームが、前記エンドヌクレアーゼをコードする配列にインフレームで連結されたＩＭＡＣアフィニティータグをコードする配列を含む、請求項１４１に記載の方法。
前記ＩＭＡＣアフィニティータグが、プロテアーゼ切断部位をコードするリンカー配列を介して前記エンドヌクレアーゼをコードする前記配列にインフレームで連結されている、請求項１４２に記載の方法。
前記プロテアーゼ切断部位が、タバコエッチウイルス（ＴＥＶ）プロテアーゼ切断部位、ＰｒｅＳｃｉｓｓｉｏｎ（登録商標）プロテアーゼ切断部位、トロンビン切断部位、血液凝固因子Ｘａ切断部位、エンテロキナーゼ切断部位、またはそれらの任意の組合せを含む、請求項１４３に記載の方法。
前記プロテアーゼ切断部位に対応するプロテアーゼを前記エンドヌクレアーゼに接触させることで、前記ＩＭＡＣアフィニティータグを切断することをさらに含む、請求項１４３～１４４のいずれか一項に記載の方法。
サブトラクティブＩＭＡＣアフィニティークロマトグラフィーを実施し、前記エンドヌクレアーゼを含む組成物から前記アフィニティータグを除去することをさらに含む、請求項１４５に記載の方法。
系であって、
（ａ）３－または４－ヌクレオチドＰＡＭ配列を結合するように構成されたクラス２のＶ－Ａ型Ｃａｓエンドヌクレアーゼであって、前記エンドヌクレアーゼがｓＭｂＣａｓ１２ａに対して切断活性を増加している、クラス２のＶ－Ａ型Ｃａｓエンドヌクレアーゼと、
（ｂ）前記遺伝子操作されたガイドＲＮＡであって、前記遺伝子操作されたガイドＲＮＡが前記クラス２のＶ－Ａ型Ｃａｓエンドヌクレアーゼと複合体を形成するように構成され、前記遺伝子操作されたガイドＲＮＡが、標的核酸配列を含む標的核酸にハイブリダイズするように構成されたスペーサー配列を含む、遺伝子操作されたガイドＲＮＡと、を含む、系。
前記切断活性が、適合するガイドＲＮＡに加えて前記エンドヌクレアーゼを、前記標的核酸を含む細胞に導入することで、かつ前記細胞の前記標的核酸配列の切断を検出することで、インビトロで測定される、請求項１４７に記載の系。
前記クラス２のＶ－Ａ型Ｃａｓエンドヌクレアーゼが、２１５～２２５のうちいずれか１つに対して少なくとも７５％の同一性を有する配列、またはそのバリアントを含む、請求項１４７～１４８のいずれか一項に記載の系。
前記遺伝子操作されたガイドＲＮＡが、配列番号３６０９の非縮重ヌクレオチドに対して少なくとも８０％の同一性を有する配列を含む、請求項１４９に記載の系。
前記標的核酸が、前記標的核酸配列近位のＹＹＮＰＡＭ配列をさらに含む、請求項１４９～１５０のいずれか一項に記載の系。
前記クラス２のＶ－Ａ型Ｃａｓエンドヌクレアーゼが、ｓＭｂＣａｓ１２ａに対して少なくとも約５％、１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、１００％、または２００％、またはそれ以上増加した活性を有する、請求項１４７～１５１のいずれか一項に記載の系。
系であって、
（ａ）クラス２のＶ－Ａ’型Ｃａｓエンドヌクレアーゼと、
（ｂ）遺伝子操作されたガイドＲＮＡであって、前記遺伝子操作されたガイドＲＮＡが、クラス２のＶ型Ｃａｓエンドヌクレアーゼの天然エフェクターリピート配列の約１９～約２５、または約１９～約３１の連続ヌクレオチドに対して少なくとも８０％の同一性を有する配列を含む、遺伝子操作されたガイドＲＮＡと、を含む、系。
前記天然エフェクターリピート配列が配列番号３５６０～３５７２のうちいずれか１つである、請求項１５３に記載の系。
前記クラス２のＶ－Ａ’型Ｃａｓエンドヌクレアーゼが配列番号１２６に対して少なくとも７５％の同一性を有する、請求項１５３～１５４のいずれか一項に記載の系。
細胞のＶＥＧＦ－Ａ遺伝子座を破壊する方法であって、
（ｂ）クラス２のＶ型Ｃａｓエンドヌクレアーゼと、
（ｂ）遺伝子操作されたガイドＲＮＡであって、前記遺伝子操作されたガイドＲＮＡが前記エンドヌクレアーゼと複合体を形成するように構成され、前記遺伝子操作されたガイドＲＮＡが前記ＶＥＧＦ－Ａ遺伝子座の領域にハイブリダイズするように構成されたスペーサー配列を含む、遺伝子操作されたガイドＲＮＡと、
を前記細胞に導入することを含み、
前記遺伝子操作されたガイドＲＮＡが配列番号３９８５に対して少なくとも８０％の同一性を有する標的化配列を含み、または
前記遺伝子操作されたガイドＲＮＡが、表７からのガイドＲＮＡ１～７のうちいずれか１つのヌクレオチド配列を含む、方法。
前記クラス２のＶ型Ｃａｓエンドヌクレアーゼが、配列番号１～３４７０のうちいずれか１つに対して少なくとも７５％の配列同一性を有するエンドヌクレアーゼ、またはそのバリアントを含む、請求項１５６に記載の系。
前記クラス２のＶ型Ｃａｓエンドヌクレアーゼが、配列番号１４１、２１５、２２９、２６１、もしくは１７１１～１７２１のうちいずれか１つに対して少なくとも７５％の配列同一性を有するエンドヌクレアーゼ、またはそのバリアントを含む、請求項１５６～１５７のいずれか一項に記載の系。
前記遺伝子操作されたガイドＲＮＡが、配列番号３４７１、３５３９、３５５１～３５５９、３６０８～３６０９、３６１２、３６３６～３６３７、３６４０～３６４１、３６４４～３６４５、３６４８～３６４９、３６５２～３６５３，３６５６～３６５７、３６６０～３６６１、３６６４～３６６７、３６７１～３６７２、３６７７～３６７８、３６９５～３６９６、３７２９～３７３０、３７３４～３７３５、および３８５１～３８５７のうちいずれか１つの非縮重ヌクレオチドに対して少なくとも８０％の配列同一性を有する配列を含む、請求項１５６～１５８のいずれか一項に記載の系。
前記遺伝子操作されたガイドＲＮＡが、配列番号３６０８～３６０９、３８５３、または３８５１～３８５７のうちいずれか１つの非縮重ヌクレオチドに対して少なくとも８０％の配列同一性を有する配列を含む、請求項１５６～１５８のいずれか一項に記載の系。
細胞の遺伝子座を破壊する方法であって、
（ａ）配列番号２１５～２２５のうちいずれか１つに対して少なくとも７５％の同一性を有するクラス２のＶ型Ｃａｓエンドヌクレアーゼ、またはそのバリアントと、
（ｂ）遺伝子操作されたガイドＲＮＡであって、前記遺伝子操作されたガイドＲＮＡが前記エンドヌクレアーゼと複合体を形成するように構成され、前記遺伝子操作されたガイドＲＮＡが前記遺伝子座の領域にハイブリダイズするように構成されたスペーサー配列を含む、遺伝子操作されたガイドＲＮＡと、
を含む組成物を前記細胞に接触させることを含み、
前記クラス２のＶ型Ｃａｓエンドヌクレアーゼが、前記細胞のｓｐＣａｓ９に対して少なくとも同等の切断活性を有する、方法。
前記切断活性が、適合するガイドＲＮＡに加えて前記エンドヌクレアーゼを、前記標的核酸を含む細胞に導入することで、かつ前記細胞の前記標的核酸配列の切断を検出することで、インビトロで測定される、請求項１６１に記載の方法。
前記組成物が、２０ｐｍｏｌ以下の前記クラス２のＶ型Ｃａｓエンドヌクレアーゼを含む、請求項１６１～１６２のいずれか一項に記載の方法。
前記組成物が１ｐｍｏｌ以下の前記クラス２のＶ型Ｃａｓエンドヌクレアーゼを含む、請求項１６３に記載の方法。