JP2021520844A

JP2021520844A - 操作されたカスケード構成要素およびカスケード複合体

Info

Publication number: JP2021520844A
Application number: JP2020564445A
Authority: JP
Inventors: ピーター・ショーン・キャメロン; スコット・デーヴィッド・グラディア; サンネ・エフェリーネ・クロンペ; サミュエル・ヘンリー・スタンバーグ; マシュー・スコット・トンプソン
Original assignee: カリブー・バイオサイエンシーズ・インコーポレイテッド
Priority date: 2018-06-13
Filing date: 2019-06-12
Publication date: 2021-08-26
Anticipated expiration: 2039-06-12
Also published as: JP6965466B2; AU2019284926B2; EP3601574A1; CA3163768A1; CN112272704A; KR102516697B1; ZA202006880B; AU2019284926A1; SG11202010182SA; EP4219720A3; CA3102148A1; KR20210006966A; AU2022200903B2; WO2019241452A1; EP3601574A4; EP4219720A2; AU2022200903A1; MX2020013579A; KR20230035689A; AU2019284926C1

Abstract

本開示は、マルチタンパク質エフェクター複合体を含む操作されたクラス１Ｉ型ＣＲＩＳＰＲ−Ｃａｓ（カスケード）系、Ｉ型ＣＲＩＳＰＲ−Ｃａｓサブユニットタンパク質および核酸ガイドを含む核タンパク質複合体、Ｉ型ＣＲＩＳＰＲ−Ｃａｓサブユニットタンパク質をコードするポリヌクレオチド、ならびにガイドポリヌクレオチドを提供する。また、本発明の操作されたクラス１Ｉ型ＣＲＩＳＰＲ−Ｃａｓ系を製造し、かつ用いる方法が開示される。【選択図】図１Ａ

Description

関連出願の相互参照
本出願は、２０１９年５月２２日出願の現在係属中の米国特許出願第１６／４２０，０６１号明細書の一部継続出願であり、これは、２０１９年１月３０日出願の、現在許可されている米国特許出願第１６／２６２，７７３号明細書の継続であり、これは、２０１８年８月１７日出願の米国特許出願第１６／１０４，８７５号明細書（現在、２０１９年３月１２日発行の米国特許第１０，２２７，５７６号明細書）の継続であり、そして、２０１８年６月１３日出願の現在係属中の米国仮特許出願第６２／６８４，７３５号明細書、および２０１９年２月１９日出願の現在係属中の米国仮特許出願第６２／８０７，７１７号明細書の利益を主張する：これらの出願の内容は、その全体を参照によって本明細書に組み入れる。

連邦政府の資金援助を受けた研究または開発に関する陳述
該当なし。

配列表
本出願は、ＡＳＣＩＩフォーマットで電子的に提出されており、かつその全体が参照によって本明細書に組み入れる配列表を含有する。ＡＳＣＩＩコピー（２０１９年６月１２日作成）は、ＣＢＩ０３２−３０＿ＳＴ２５．ｔｘｔと命名され、サイズは３．１ＭＢである。

技術分野
本開示は、一般に、マルチタンパク質エフェクター複合体を含む操作されたクラス１Ｉ型ＣＲＩＳＰＲ−Ｃａｓ（カスケード）系、Ｉ型ＣＲＩＳＰＲ−Ｃａｓサブユニットタンパク質および核酸ガイドを含む核タンパク質複合体、Ｉ型ＣＲＩＳＰＲ−Ｃａｓサブユニットタンパク質をコードするポリヌクレオチド、ならびにガイドポリヌクレオチドに関する。本開示はまた、本発明の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓ系を製造し、かつ用いる組成物および方法に関する。

背景
Ｃｌｕｓｔｅｒｅｄｒｅｇｕｌａｒｌｙｉｎｔｅｒｓｐａｃｅｄｓｈｏｒｔｐａｌｉｎｄｒｏｍｉｃｒｅｐｅａｔ（ＣＲＩＳＰＲ）およびＣＲＩＳＰＲ関連タンパク質（Ｃａｓ）は、ＣＲＩＳＰＲ−Ｃａｓ系を構成する。ＣＲＩＳＰＲ−Ｃａｓ系は、細菌および古細菌における、外来のポリヌクレオチドに対する適応免疫を実現する（例えば、非特許文献１〜５参照）。天然宿主内の種々のＣＲＩＳＰＲ−Ｃａｓ系は、ＤＮＡ標的化（クラス１Ｉ型；クラス２ＩＩ型およびＶ型）、ＲＮＡ標的化（クラス２ＶＩ型）、ならびにＤＮＡおよびＲＮＡ合同の標的化（クラス１ＩＩＩ型）ができる（例えば、非特許文献６〜８参照）。

ＣＲＩＳＰＲ−Ｃａｓ系の分類は、反復が多くあった。Ｋｏｏｎｉｎ，Ｅ．Ｖ．ら（非特許文献５）は、ＣＲＩＳＰＲ−Ｃａｓ系の個々のタイプおよびサブタイプに特異的なシグネチャーｃａｓ遺伝子を考慮した分類体系を提唱した。また、この分類は、複数の共有Ｃａｓタンパク質間の配列類似性、最もよく保存されたＣａｓタンパク質の系統学、遺伝子組織化、およびＣＲＩＳＰＲアレイの構造も考慮したものであった。このアプローチは、ＣＲＩＳＰＲ−Ｃａｓ系を以下の２つの互いに異なるクラス：マルチタンパク質エフェクター複合体（Ｉ型（抗ウイルス防御のためのＣＲＩＳＰＲ関連複合体（「カスケード」）エフェクター複合体）、ＩＩＩ型（Ｃｍｒ／Ｃｓｍエフェクター複合体）、およびＩＶ型）を含むクラス１；および単一のエフェクタータンパク質（ＩＩ型（Ｃａｓ９）、Ｖ型（Ｃａｓ１２ａ（以前にＣｐｆ１と呼ばれた））、およびＶＩ型（Ｃａｓ１３ａ（以前にＣ２ｃ２と呼ばれた）））を含むクラス２に分ける分類スキームを提供した。クラス１系において、Ｉ型が最も一般的かつ多様であり、ＩＩＩ型は、細菌よりも古細菌において一般的であり、そしてＩＶ型が最も一般的でない。

Ｉ型系は、シグネチャーＣａｓ３タンパク質を含む。Ｃａｓ３タンパク質は、ＤＮＡ標的配列切断を担うヘリカーゼおよびＤＮａｓｅドメインを有する。現在まで、ｃａｓ遺伝子数が可変的な、Ｉ型系の７つのサブタイプが同定されてきた（すなわち、Ｉ−Ａ型、Ｉ−Ｂ型、Ｉ−Ｃ型、Ｉ−Ｄ型、Ｉ−Ｅ型、Ｉ−Ｆ型（およびＩ−Ｆ型のバリアント（例えば、Ｉ−Ｆｖ１型、Ｉ−Ｆｖ２型））、およびＩ−Ｕ型）。Ｉ型ｃａｓ遺伝子として、以下が挙げられるが、これらに限定されない：ｃａｓ７、ｃａｓ５、ｃａｓ８、ｃｓｅ２、ｃｓａ５、ｃａｓ３、ｃａｓ２、ｃａｓ４、ｃａｓ１、およびｃａｓ６。Ｉ型系を有する生物の例は、以下の通りである：Ｉ−Ａ、アルカエオグロブス・フルギドゥス（Ａｒｃｈａｅｏｇｌｏｂｕｓｆｕｌｇｉｄｕｓ）；Ｉ−Ｂ、クロストリジウム・クルイベリ（Ｃｌｏｓｔｒｉｄｉｕｍｋｌｕｙｖｅｒｉ）；Ｉ−Ｃ、バチルス・ハロデュランス（Ｂａｃｉｌｌｕｓｈａｌｏｄｕｒａｎｓ）；Ｉ−Ｕ、ゲオバクター・スルフレドゥセンス（Ｇｅｏｂａｃｔｅｒｓｕｌｆｕｒｒｅｄｕｃｅｎｓ）；Ｉ−Ｄ、シアノテス（Ｃｙａｎｏｔｈｅｃｅ）属種８８０２；Ｉ−Ｅ、大腸菌（Ｅｓｃｈｅｒｉｃｈｉａｃｏｌｉ）Ｋ１２（大腸菌（Ｅ．ｃｏｌｉ）Ｋ１２）；Ｉ−Ｆ、仮性結核菌（Ｙｅｒｓｉｎｉａｐｓｅｕｄｏ−ｔｕｂｅｒｃｕｌｏｓｉｓ）；Ｉ−Ｆバリアント、シェワネラ・プトレファシエンス（Ｓｈｅｗａｎｅｌｌａｐｕｔｒｅｆａｃｉｅｎｓ）ＣＮ−３２（非特許文献５）。Ｃａｓ３タンパク質媒介性切断の特徴、およびＤＮＡの漸進的分解が記載されてきた（例えば、非特許文献９〜１６参照）。

Ｉ型系は、典型的に、ＣＲＩＳＰＲＲＮＡ（ｃｒＲＮＡまたは「ガイドＲＮＡ」）と組み合わさってカスケード複合体を形成するタンパク質をコードしている。当該複合体は、複数のタンパク質およびｃｒＲＮＡを含み、これらは双方とも、ＣＲＩＳＰＲ遺伝子座から転写される。Ｉ型系において、プレｃｒＲＮＡの一次プロセシングが、Ｃａｓ６によって触媒される。これは、典型的に、８ヌクレオチドの５’ハンドル、スペーサー領域、および３’ハンドルを有するｃｒＲＮＡをもたらす；５’ハンドルおよび３’ハンドルは、双方ともリピート配列に由来する。一部の系において、３’ハンドルは、ステム−ループ構造を形成する；他の系において、ｃｒＲＮＡの３’末端の二次プロセシングが、リボヌクレアーゼによって触媒される（例えば、非特許文献１７参照）。

Ｉ型ＣＲＩＳＰＲ−Ｃａｓ系のカスケードエフェクター複合体は、ＲＮＡＲｅｃｏｇｎｉｔｉｏｎＭｏｔｉｆ（ＲＲＭ）フォールドおよび付加的な「大きな」、そして「小さな」サブユニットタンパク質を含有するパラログなＲｅｐｅａｔ−ＡｓｓｏｃｉａｔｅｄＭｙｓｔｅｒｉｏｕｓＰｒｏｔｅｉｎ（ＲＡＭＰ；例えば、Ｃａｓ７およびＣａｓ５タンパク質）を有する骨格を含む（例えば、非特許文献５、図２参照）。これらのカスケードエフェクター複合体は、典型的に、Ｃａｓ５サブユニットタンパク質およびいくつかのＣａｓ７サブユニットタンパク質を有する。また、そのようなカスケードエフェクター複合体は、ガイドＲＮＡを含む。カスケードエフェクター複合体は、ガイドＲＮＡの長さに沿って非対称的に配置された種々のサブユニットタンパク質を含む。Ｃａｓ５サブユニットタンパク質および大きなサブユニットタンパク質（Ｃａｓ８タンパク質）は、複合体の一末端に位置して、ガイドＲＮＡの５’末端を包む。数コピーの小さなサブユニットタンパク質が、Ｃａｓ７サブユニットタンパク質の複数のコピーに結合したガイドＲＮＡ骨格と相互作用する。Ｃａｓ６サブユニットタンパク質（別のＲＡＭＰタンパク質）は、主にｃｒＲＮＡの３’ハンドル（リピート領域）との会合を介して、カスケードエフェクター複合体と会合する。Ｃａｓ６サブユニットタンパク質は、通常、プレｃｒＲＮＡプロセシングに関与するリピート特異的ＲＮａｓｅとして機能する；しかしながら、Ｉ−Ｃ型系では、Ｃａｓ５がリピート特異的ＲＮａｓｅとして機能し、Ｃａｓ６は存在しない。

ＣＲＩＳＰＲ−ＣａｓＩ型カスケードサブユニットタンパク質の一次配列は、ほとんど配列同一性がない；しかしながら、相同ＲＡＭＰモジュールの存在、およびマルチタンパク質エフェクター複合体の全体的な構造類似性は、当該エフェクター複合体の共通起源を支持している（例えば、非特許文献５参照）。

Ｉ型ＣＲＩＳＰＲ−Ｃａｓ系における作用の適応免疫機構は、本質的に３つの相：適合、発現、および干渉を伴う。適合相において、外来のＤＮＡまたはＲＮＡは、宿主に感染し、そして種々のｃａｓ遺伝子によってコードされるタンパク質が、感染ＤＮＡまたはＲＮＡの領域に結合する。そのような領域は、プロトスペーサーと呼ばれる。プロトスペーサー隣接モチーフ（ＰＡＭ）は、プロトスペーサーに隣接する短いヌクレオチド配列（例えば、２〜６塩基対のＤＮＡ配列）である。ＰＡＭ配列は、典型的に、Ｃａｓ１サブユニットタンパク質／Ｃａｓ２サブユニットタンパク質複合体によって認識され、活性ＰＡＭセンシング部位は、Ｃａｓ１サブユニットタンパク質に付随する（例えば、非特許文献１８参照）。

発現相において、複数のスペーサー−リピート要素を含むＣＲＩＳＰＲアレイは、単一の転写産物として転写される。個々のスペーサーリピート要素が、エンドヌクレアーゼ（例えば、Ｉ型、Ｃａｓ６タンパク質；およびＩ−Ｃ型、Ｃａｓ５タンパク質）によってプロセシングされて個々のｃｒＲＮＡになる。Ｃａｓサブユニットタンパク質が発現されて、ｃｒＲＮＡと会合して、カスケードエフェクター複合体を形成する。

カスケードエフェクター複合体は、宿主に感染する外来のポリヌクレオチドをスキャンして、スペーサーと相補的なＤＮＡを同定する。Ｉ型系では、エフェクター複合体が、ＰＡＭに隣接するスペーサーと相補的な配列を同定すると、干渉が起こる；そしてＣａｓ３タンパク質は、ＤＮＡ結合カスケードエフェクター複合体に動員されて、外来のポリヌクレオチドを切断し、かつ次第に消化する。

Ｍａｋａｒｏｖａ，Ｋ．Ｓ．ら（非特許文献１９）は、Ｉ型ＣＲＩＳＰＲ−Ｃａｓ系について、遺伝子、相同体、カスケード複合体、および作用機構の概要を記載している。

Ｉ型ＣＲＩＳＰＲ−Ｃａｓ系はこれまで、カスケード複合体の異種発現の困難、およびＩ型ＣＲＩＳＰＲ−Ｃａｓ系がＤＮＡ標的を切断する方法に一部起因して、真核生物ゲノム操作用途での使用を制限してきた。

Ｂａｒｒａｎｇｏｕ，Ｒ．ら、Ｓｃｉｅｎｃｅ３１５巻：１７０９〜１７１２頁（２００７年）Ｍａｋａｒｏｖａ，Ｋ．Ｓ．ら、ＮａｔｕｒｅＲｅｖｉｅｗｓＭｉｃｒｏｂｉｏｌｏｇｙ９巻：４６７〜４７７頁（２０１１年）Ｇａｒｎｅａｕ，Ｊ．Ｅ．ら、Ｎａｔｕｒｅ４６８巻：６７〜７１頁（２０１０年）Ｓａｐｒａｎａｕｓｋａｓ，Ｒ．ら、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．３９巻：９２７５〜９２８２頁（２０１１年）Ｋｏｏｎｉｎ，Ｅ．Ｖ．ら、Ｃｕｒｒ．Ｏｐｉｎ．Ｍｉｃｒｏｂｉｏｌ．３７巻：６７〜７８頁（２０１７年）Ｍａｋａｒｏｖａ，Ｋ．Ｓ．ら、Ｎａｔ．Ｒｅｖ．Ｍｉｃｒｏｂｉｏｌ．１３巻：７２２〜７３６頁（２０１５年）Ｓｈｍａｋｏｖ，Ｓ．ら、Ｎａｔ．Ｒｅｖ．Ｍｉｃｒｏｂｉｏｌ．１５巻：１６９〜１８２頁（２０１７年）Ａｂｕｄａｙｙｅｈ，Ｏ．Ｏ．ら、Ｓｃｉｅｎｃｅ３５３巻：１〜１７頁（２０１６年）Ｐｌａｇｅｎｓ，Ａ．ら、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．４２巻：５１２５〜５１３８頁（２０１４年）Ｍａｉｅｒ，Ｌ．ら、ＲＮＡＢｉｏｌ．１０巻：８６５〜８７４頁（２０１３年）Ｈｏｃｈｓｔｒａｓｓｅｒ，Ｍ．ら、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ１１１巻：６６１８〜６６２３頁（２０１４年）Ｓｉｎｋｕｎａｓ，Ｔ．ら、ＥＭＢＯＪ．３０巻：１３３５〜１３４２頁（２０１１年）Ｗｅｓｔｒａ，Ｅ．ら、Ｍｏｌ．Ｃｅｌｌ４６巻：５９５〜６０５（２０１２年）Ｍｕｌｅｐａｔｉ，Ｓ．ら、Ｊ．Ｂｉｏｌ．Ｃｈｅｍ．２８８巻：２２１８４〜２２１９２頁（２０１３年）Ｓｉｎｋｕｎａｓ，Ｔ．ら、ＥＭＢＯＪ．３２巻：３８５〜３９４頁（２０１３年）Ｒｅｄｄｉｎｇ，Ｓ．ら、Ｃｅｌｌ１６３巻：８５４〜８６５頁（２０１５年）ｖａｎｄｅｒＯｏｓｔ，Ｊ．ら、ＮａｔｕｒｅＲｅｖｉｅｗｓＭｉｃｒｏｂｉｏｌｏｇｙ１２巻：４７９〜４９２頁（２０１４年）Ｊａｃｋｓｏｎ，Ｓ．Ａ．ら、Ｓｃｉｅｎｃｅ３５６巻：３５６号（６３３３頁）（２０１７年）Ｍａｋａｒｏｖａ，Ｋ．Ｓ．ら、Ｃｅｌｌ１６８巻：９４６頁（２０１７年）

本発明は、一般に、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体およびその構成要素（タンパク質構成要素、修飾された、または明確に変化したガイドポリヌクレオチド、およびそれらの組合せが挙げられる）を含む組成物に関する。

本発明の一実施形態は、組成物であって：
第１のＣｓｅ２サブユニットタンパク質、第１のＣａｓ５サブユニットタンパク質、第１のＣａｓ６サブユニットタンパク質、および第１のＣａｓ７サブユニットタンパク質と、
第１のＣａｓ８サブユニットタンパク質および第１のＦｏｋＩを含む第１の融合タンパク質であって、第１のＣａｓ８サブユニットタンパク質のＮ末端または第１のＣａｓ８サブユニットタンパク質のＣ末端は、第１のリンカーポリペプチドによって、第１のＦｏｋＩのＣ末端またはＮ末端にそれぞれ共有結合されており、第１のリンカーポリペプチドは、長さが１０アミノ酸〜４０アミノ酸である、第１の融合タンパク質と、
第１の核酸標的配列に結合することができる第１のスペーサーを含む第１のガイドポリヌクレオチドと
を含む第１の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体と；
第２のＣｓｅ２サブユニットタンパク質、第２のＣａｓ５サブユニットタンパク質、第２のＣａｓ６サブユニットタンパク質、および第２のＣａｓ７サブユニットタンパク質と、
第２のＣａｓ８サブユニットタンパク質および第２のＦｏｋＩを含む第２の融合タンパク質であって、第２のＣａｓ８サブユニットタンパク質のＮ末端または第２のＣａｓ８タンパク質のＣ末端は、第２のリンカーポリペプチドによって、第２のＦｏｋＩのＣ末端またはＮ末端にそれぞれ共有結合されており、第２のリンカーポリペプチドは、長さが１０アミノ酸〜４０アミノ酸である、第２の融合タンパク質と、
第２の核酸標的配列に結合することができる第２のスペーサーを含む第２のガイドポリヌクレオチドと
を含む第２の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体と；
を含み、第２の核酸標的配列のプロトスペーサー隣接モチーフ（ＰＡＭ）および第１の核酸標的配列のＰＡＭは、スペーサー間距離が２０塩基対〜４２塩基対である、組成物である。

一部の実施形態において、第１のリンカーポリペプチドおよび／または第２のリンカーポリペプチドの長さは、１５アミノ酸〜３０アミノ酸、または１７アミノ酸〜２０アミノ酸の長さである。一実施形態において、第１のリンカーポリペプチドと第２のリンカーポリペプチドの長さは、同じある。

第２の核酸標的配列と第１の核酸標的配列間のスペーサー間距離として、以下に限定されないが、２２塩基対〜４０塩基対、２６塩基対〜３６塩基対、２９塩基対〜３５塩基対、または３０塩基対〜３４塩基対が挙げられる。

第１のＦｏｋＩおよび第２のＦｏｋＩは、ホモダイマーを形成するように会合することができるモノマーサブユニットであってもよいし、ヘテロダイマーを形成するように会合することができる、互いに異なるサブユニットであってもよい。

一部の実施形態において、第１のＣａｓ８サブユニットタンパク質のＮ末端は、第１のリンカーポリペプチドによって、第１のＦｏｋＩのＣ末端に共有結合されており、第１のＣａｓ８サブユニットタンパク質のＣ末端は、第１のリンカーポリペプチドによって、第１のＦｏｋＩのＮ末端に共有結合されており、第２のＣａｓ８サブユニットタンパク質のＮ末端は、第２のリンカーポリペプチドによって、第２のＦｏｋＩのＣ末端に共有結合されており、第２のＣａｓ８サブユニットタンパク質のＣ末端は、第２のリンカーポリペプチドによって、第２のＦｏｋＩのＮ末端に共有結合されており、かつそれらが組み合わされている。第１のＣａｓ８サブユニットタンパク質および第２のＣａｓ８サブユニットタンパク質は、それぞれ異なる配列を有するＣａｓ８サブユニットタンパク質を含んでもよいし、第１および第２のＣａｓ８サブユニットタンパク質は、双方が同一のアミノ酸配列を含んでもよい。

同様に、第１のＣｓｅ２サブユニットタンパク質および第２のＣｓｅ２サブユニットタンパク質は、それぞれ異なるＣｓｅ２サブユニットタンパク質アミノ酸配列を含んでも、同一のＣｓｅ２サブユニットタンパク質アミノ酸配列を含んでもよく、第１のＣａｓ５サブユニットタンパク質および第２のＣａｓ５サブユニットタンパク質は、それぞれ異なるＣａｓ５サブユニットタンパク質アミノ酸配列を含んでも、同一のＣａｓ５サブユニットタンパク質アミノ酸配列を含んでもよく、第１のＣａｓ６サブユニットタンパク質および第２のＣａｓ６サブユニットタンパク質は、それぞれ異なるＣａｓ６サブユニットタンパク質アミノ酸配列を含んでも、同一のＣａｓ６サブユニットタンパク質アミノ酸配列を含んでもよく、第１のＣａｓ７サブユニットタンパク質および第２のＣａｓ７サブユニットタンパク質は、それぞれ異なるＣａｓ７サブユニットタンパク質アミノ酸配列を含んでも、同一のＣａｓ７サブユニットタンパク質アミノ酸配列を含んでもよく、それらの組合せであってもよい。

好ましい実施形態において、ガイドポリヌクレオチドはＲＮＡを含む。

更なる実施形態において、本発明は、野生型Ｉ型ＣＲＩＳＰＲＣａｓ３タンパク質（「ｗｔＣａｓ３タンパク質」）よりも低減された、ＤＮＡに沿った移動が可能な操作されたＩ型ＣＲＩＳＰＲＣａｓ３突然変異タンパク質（「ｍＣａｓ３タンパク質」）を含む。

本発明はまた、細胞内でゲノム編集を実行するための、先の組成物の使用、および先の組成物を製造する方法を含む。

本発明の更なる実施形態は、本明細書中の開示を考慮すれば、当業者にとって容易に明らとなろう。

図面は比例的に表現されず、拡大縮小もされない。指標の位置はおおよそのものである。

Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の一般図を示す。Ｉ型ＣＲＩＳＰＲ−ＣａｓｃｒＲＮＡの一般図を示す。融合ドメインが隣のスペーサー配列に結合した２つの操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の説明となる例を示す。融合ドメインが隣のスペーサー配列に結合した２つの操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の説明となる例を示す。融合ドメインが隣のスペーサー配列に結合した２つの操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の説明となる例を示す。円順列置換タンパク質の例を示す。本発明の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の多様な例を示す。本発明の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の多様な例を示す。本発明の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の多様な例を示す。本発明の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の多様な例を示す。本発明の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の多様な例を示す。本発明の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の多様な例を示す。本発明の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の多様な例を示す。基質チャネルの例を示す。ｄＣａｓ９：ＮＡＴＮＡ複合体によってカスケードサブユニットタンパク質に融合された機能的タンパク質ドメインの部位特異的動員の一般図を示す。図１２−１の続き。本発明の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の例を示す。本発明の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の例を示す。本発明の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の例およびそれらの使用方法を示す。本発明の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の例およびそれらの使用方法を示す。本発明の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の例およびそれらの使用方法を示す。本発明の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の例およびそれらの使用方法を示す。本発明の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の例およびそれらの使用方法を示す。本発明の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の例およびそれらの使用方法を示す。活性なエンドヌクレアーゼ活性を含むＣａｓ３タンパク質を使用する本発明の実施形態を示す。活性なエンドヌクレアーゼ活性を含むＣａｓ３タンパク質を使用する本発明の実施形態を示す。多様なカスケード構成要素発現系の模式図を示す。多様なカスケード構成要素発現系の模式図を示す。多様なカスケード構成要素発現系の模式図を示す。多様なカスケード構成要素発現系の模式図を示す。多様なカスケード構成要素発現系の模式図を示す。本発明の操作されたカスケード系のゲノム編集に関するデータを示す。本発明の操作されたカスケード系のゲノム編集に関するデータを示す。本発明の操作されたカスケード系のゲノム編集に関するデータを示す。本発明の操作されたカスケード系のゲノム編集に関するデータを示す。本発明の操作されたカスケード系のゲノム編集に関するデータを示す。本発明の操作されたカスケード系のゲノム編集に関するデータを示す。本発明の操作されたカスケード系のゲノム編集に関するデータを示す。本発明の操作されたカスケード系のゲノム編集に関するデータを示す。対形成ガイドＲＮＡ（ｇＲＮＡ）を含む最小ＣＲＩＳＰＲアレイの例を示す。操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓ複合体のＲＮＰおよびプラスミドベースの送達を介するヒト細胞におけるゲノム編集に関するデータを示す。操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓ複合体のＲＮＰおよびプラスミドベースの送達を介するヒト細胞におけるゲノム編集に関するデータを示す。操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓ複合体のＲＮＰおよびプラスミドベースの送達を介するヒト細胞におけるゲノム編集に関するデータを示す。操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓ複合体のＲＮＰおよびプラスミドベースの送達を介するヒト細胞におけるゲノム編集に関するデータを示す。修復の結果に関するデータを示す。図３７−１の続き。図３７−２の続き。図３７−３の続き。ｇＲＮＡと標的ＤＮＡとの間のミスマッチが操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓ複合体によるゲノム編集をどのように阻害するかに関するデータを示す。ｇＲＮＡと標的ＤＮＡとの間のミスマッチが操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓ複合体によるゲノム編集をどのように阻害するかに関するデータを示す。ｇＲＮＡと標的ＤＮＡとの間のミスマッチが操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓ複合体によるゲノム編集をどのように阻害するかに関するデータを示す。３つのカスケード相同体バリアントについてのＰＡＭ選択性の拡張スクリーニングに関するデータを示す。３つのカスケード相同体バリアントについてのＰＡＭ選択性の拡張スクリーニングに関するデータを示す。３つのカスケード相同体バリアントについてのＰＡＭ選択性の拡張スクリーニングに関するデータを示す。３つのカスケード相同体バリアントについてのＰＡＭ選択性の拡張スクリーニングに関するデータを示す。操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓ複合体の編集効率における例示的な変化に関するデータを示す。操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓ複合体の編集効率における例示的な変化に関するデータを示す。操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓ複合体の編集効率における例示的な変化に関するデータを示す。操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓ複合体の編集効率における例示的な変化に関するデータを示す。操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓ複合体の編集効率における例示的な変化に関するデータを示す。操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓ複合体の編集効率における例示的な変化に関するデータを示す。３つのカスケード相同体バリアントについてのＦｏｋＩ−Ｃａｓ８リンカー長およびスペーサー間距離の拡張スクリーニングに関するデータを示す。３つのカスケード相同体バリアントについてのＦｏｋＩ−Ｃａｓ８リンカー長およびスペーサー間距離の拡張スクリーニングに関するデータを示す。３つのカスケード相同体バリアントについてのＦｏｋＩ−Ｃａｓ８リンカー長およびスペーサー間距離の拡張スクリーニングに関するデータを示す。オリゴ鋳型ＰＣＲ増幅の例を示す。オリゴ鋳型ＰＣＲ増幅の例を示す。ＦｏｋＩ−カスケード相同体バリアントおよびスペーサー間距離に対して示すゲノム編集パーセントについてのデータを示す。ＥｃｏＣａｓ３タンパク質の機能的ドメインおよび配列内に作製した突然変異体の相対位置の線状表示を示す。野生型または突然変異型ＥｃｏＣａｓ３タンパク質を含むＥｃｏカスケードＲＮＰ複合体を使用するゲノム編集に関するデータを示す。野生型または突然変異型ＥｃｏＣａｓ３タンパク質を含むＥｃｏカスケードＲＮＰ複合体を使用するゲノム編集に関するデータを示す。野生型または突然変異型ＥｃｏＣａｓ３タンパク質を含むＥｃｏカスケードＲＮＰ複合体を使用するゲノム編集に関するデータを示す。野生型または突然変異型ＥｃｏＣａｓ３タンパク質を含むＥｃｏカスケードＲＮＰ複合体を使用するゲノム編集に関するデータを示す。ｄＣａｓ９−ＶＰ６４／ｓｇＲＮＡＲＮＰ複合体ロードブロックに関するデータおよびＥｃｏカスケードＲＮＰ複合体による標的切断に対するそれらの効果を示す。ｄＣａｓ９−ＶＰ６４／ｓｇＲＮＡＲＮＰ複合体ロードブロックに関するデータおよびＥｃｏカスケードＲＮＰ複合体による標的切断に対するそれらの効果を示す。ｄＣａｓ９−ＶＰ６４／ｓｇＲＮＡＲＮＰ複合体ロードブロックに関するデータおよびＥｃｏカスケードＲＮＰ複合体による標的切断に対するそれらの効果を示す。ｄＣａｓ９−ＶＰ６４／ｓｇＲＮＡＲＮＰ複合体ロードブロックに関するデータおよびＥｃｏカスケードＲＮＰ複合体による標的切断に対するそれらの効果を示す。ｄＣａｓ９−ＶＰ６４／ｓｇＲＮＡＲＮＰ複合体ロードブロックに関するデータおよびＥｃｏカスケードＲＮＰ複合体による標的切断に対するそれらの効果を示す。ｍＣａｓ３［Ｄ４５２Ａ］／ＥｃｏカスケードまたはｍＣａｓ３［Ｄ４５２Ａ］−Ｅｃｏカスケードについての例示的な編集データを示す。ＰｓｅカスケードＲＮＰ複合体による８つのＴＲＡＣ標的部位でのゲノム編集についてのデータを示す。

文献の援用
本明細書中で引用される全ての特許、刊行物、および特許出願は、個々の特許、刊行物、または特許出願が、全ての目的について、その全体が参照によって組み入れることが具体的に、かつ個々に示されているが如く、参照によって本明細書に組み入れる。

発明の詳細な説明
本明細書中で用いられる専門用語は、特定の実施形態のみを説明することを目的としており、限定となることは意図されていないと理解されるべきである。本明細書および特許請求の範囲において用いられている単数形「ａ」、「ａｎ」、および「ｔｈｅ」は、文脈上明らかにそうでない場合を除き、複数の指示対象を含む。ゆえに、例えば、「ポリヌクレオチド」への言及は、１つまたはそれ以上のポリヌクレオチドを含み、そして「ベクター」への言及は、１つまたはそれ以上のベクターを含む。

他に定義しない限り、本明細書中で用いられる全ての技術用語および科学用語は、本発明が係わる当業者によって一般的に理解されるのと同じ意味を有する。好ましい材料および方法が本明細書中に記載されているが、本明細書中で記載されるものと類似の、または等価な他の方法および材料も本発明に有用であり得る。

本明細書および実施例の教示を鑑みて、当業者であれば、例えば以下の標準テキストによって教示されるような、免疫学、生化学、化学、分子生物学、微生物学、細胞生物学、ゲノム解析学、および組換えポリヌクレオチドの従来の技術を応用することができる：ＣｅｌｌｕｌａｒａｎｄＭｏｌｅｃｕｌａｒＩｍｍｕｎｏｌｏｇｙ、第９版、Ａ．Ｋ．Ａｂｂａｓ．ら、Ｅｌｓｅｖｉｅｒ（２０１７年）、ＩＳＢＮ９７８−０３２３４７９７８３；ＣａｎｃｅｒＩｍｍｕｎｏｔｈｅｒａｐｙＰｒｉｎｃｉｐｌｅｓａｎｄＰｒａｃｔｉｃｅ、第１版、Ｌ．Ｈ．Ｂｕｔｔｅｒｆｉｅｌｄら、ＤｅｍｏｓＭｅｄｉｃａｌ（２０１７年）、ＩＳＢＮ９７８−１６２０７００９７６；Ｊａｎｅｗａｙ’ｓＩｍｍｕｎｏｂｉｏｌｏｇｙ、第９版、ＫｅｎｎｅｔｈＭｕｒｐｈｙ、ＧａｒｌａｎｄＳｃｉｅｎｃｅ（２０１６年）、ＩＳＢＮ９７８−０８１５３４５０５３；ＣｌｉｎｉｃａｌＩｍｍｕｎｏｌｏｇｙａｎｄＳｅｒｏｌｏｇｙ：ＡＬａｂｏｒａｔｏｒｙＰｅｒｓｐｅｃｔｉｖｅ、第４版、Ｃ．ＤｏｒｒｅｓｔｅｙｎＳｔｅｖｅｎｓら、Ｆ．Ａ．ＤａｖｉｓＣｏｍｐａｎｙ（２０１６年）、ＩＳＢＮ９７８−０８０３６４４６６３；Ａｎｔｉｂｏｄｉｅｓ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ、第２版、Ｅ．Ａ．Ｇｒｅｅｎｆｉｅｌｄ、ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙＰｒｅｓｓ（２０１４年）、ＩＳＢＮ９７８−１−９３６１１３−８１−１；ＣｕｌｔｕｒｅｏｆＡｎｉｍａｌＣｅｌｌｓ：ＡＭａｎｕａｌｏｆＢａｓｉｃＴｅｃｈｎｉｑｕｅａｎｄＳｐｅｃｉａｌｉｚｅｄＡｐｐｌｉｃａｔｉｏｎｓ、第７版、Ｒ．Ｉ．Ｆｒｅｓｈｎｅｙ、Ｗｉｌｅｙ−Ｂｌａｃｋｗｅｌｌ（２０１６年）、ＩＳＢＮ９７８−１１１８８７３６５６；ＴｒａｎｓｇｅｎｉｃＡｎｉｍａｌＴｅｃｈｎｏｌｏｇｙ、第３版：ＡＬａｂｏｒａｔｏｒｙＨａｎｄｂｏｏｋ、Ｃ．Ａ．Ｐｉｎｋｅｒｔ、Ｅｌｓｅｖｉｅｒ（２０１４年）、ＩＳＢＮ９７８−０１２４１０４９０７；ＴｈｅＬａｂｏｒａｔｏｒｙＭｏｕｓｅ、第２版、Ｈ．Ｈｅｄｒｉｃｈ、ＡｃａｄｅｍｉｃＰｒｅｓｓ（２０１２年）、ＩＳＢＮ９７８−０１２３８２００８２；ＭａｎｉｐｕｌａｔｉｎｇｔｈｅＭｏｕｓｅＥｍｂｒｙｏ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ、第４版、Ｒ．Ｂｅｈｒｉｎｇｅｒら、ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙＰｒｅｓｓ（２０１３年）、ＩＳＢＮ９７８−１９３６１１３０１９；ＰＣＲ２：ＡＰｒａｃｔｉｃａｌＡｐｐｒｏａｃｈ、Ｍ．Ｊ．ＭｃＰｈｅｒｓｏｎら、ＩＲＬＰｒｅｓｓ（１９９５年）、ＩＳＢＮ９７８−０１９９６３４２４８；ＭｅｔｈｏｄｓｉｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ（シリーズ）、Ｊ．Ｍ．Ｗａｌｋｅｒ、ＩＳＳＮ１０６４−３７４５、ＨｕｍａｎａＰｒｅｓｓ；ＲＮＡ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ、Ｄ．Ｃ．Ｒｉｏら、ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙＰｒｅｓｓ（２０１０年）、ＩＳＢＮ９７８−０８７９６９８９１１；ＭｅｔｈｏｄｓｉｎＥｎｚｙｍｏｌｏｇｙ（シリーズ）、ＡｃａｄｅｍｉｃＰｒｅｓｓ；ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ（第４版）、Ｍ．Ｒ．Ｇｒｅｅｎら、ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙＰｒｅｓｓ（２０１２年）、ＩＳＢＮ９７８−１６０５５００５６０；ＢｉｏｃｏｎｊｕｇａｔｅＴｅｃｈｎｉｑｕｅｓ、第３版、Ｇ．Ｔ．Ｈｅｒｍａｎｓｏｎ、ＡｃａｄｅｍｉｃＰｒｅｓｓ（２０１３年）、ＩＳＢＮ９７８−０１２３８２２３９０；ＭｅｔｈｏｄｓｉｎＰｌａｎｔＢｉｏｃｈｅｍｉｓｔｒｙａｎｄＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ、Ｗ．Ｖ．Ｄａｓｈｅｋ、ＣＲＣＰｒｅｓｓ（１９９７年）、ＩＳＢＮ９７８−０８４９３９４８０５；ＰｌａｎｔＣｅｌｌＣｕｌｔｕｒｅＰｒｏｔｏｃｏｌｓ（ＭｅｔｈｏｄｓｉｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ）、Ｖ．Ｍ．Ｌｏｙｏｌａ−Ｖａｒｇａｓら、ＨｕｍａｎａＰｒｅｓｓ（２０１２年）、ＩＳＢＮ９７８−１６１７７９８１７７；ＰｌａｎｔＴｒａｎｓｆｏｒｍａｔｉｏｎＴｅｃｈｎｏｌｏｇｉｅｓ、Ｃ．Ｎ．Ｓｔｅｗａｒｔら、Ｗｉｌｅｙ−Ｂｌａｃｋｗｅｌｌ（２０１１年）、ＩＳＢＮ９７８−０８１３８２１９５５；ＲｅｃｏｍｂｉｎａｎｔＰｒｏｔｅｉｎｓｆｒｏｍＰｌａｎｔｓ（ＭｅｔｈｏｄｓｉｎＢｉｏｔｅｃｈｎｏｌｏｇｙ）、Ｃ．Ｃｕｎｎｉｎｇｈａｍら、ＨｕｍａｎａＰｒｅｓｓ（２０１０年）、ＩＳＢＮ９７８−１６１７３７０２１２；ＰｌａｎｔＧｅｎｏｍｉｃｓ：ＭｅｔｈｏｄｓａｎｄＰｒｏｔｏｃｏｌｓ（ＭｅｔｈｏｄｓｉｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ）、Ｗ．Ｂｕｓｃｈ、ＨｕｍａｎａＰｒｅｓｓ（２０１７年）、ＩＳＢＮ９７８−１４９３９７００１８；ＰｌａｎｔＢｉｏｔｅｃｈｎｏｌｏｇｙ：ＭｅｔｈｏｄｓｉｎＴｉｓｓｕｅＣｕｌｔｕｒｅａｎｄＧｅｎｅＴｒａｎｓｆｅｒ、Ｒ．Ｋｅｓｈａｖａｃｈａｎｄｒａｎら、ＯｒｉｅｎｔＢｌａｃｋｓｗａｎ（２００８年）、ＩＳＢＮ９７８−８１７３７１６１６４。

Ｃｌｕｓｔｅｒｅｄｒｅｇｕｌａｒｌｙｉｎｔｅｒｓｐａｃｅｄｓｈｏｒｔｐａｌｉｎｄｒｏｍｉｃｒｅｐｅａｔ（ＣＲＩＳＰＲ）および関連するＣＲＩＳＰＲ関連タンパク質（Ｃａｓタンパク質）が、ＣＲＩＳＰＲ−Ｃａｓ系を構成する（例えば、非特許文献１参照）。

本明細書中で用いられる「Ｃａｓタンパク質」、「ＣＲＩＳＰＲ−Ｃａｓタンパク質」、「ＣＲＩＳＰＲ−Ｃａｓサブユニットタンパク質」、および「Ｃａｓサブユニットタンパク質」は全て、同定されている場合を除き、クラス１Ｉ型ＣＲＩＳＰＲ−Ｃａｓタンパク質を指す。典型的には、本発明の態様での使用について、Ｃａｓサブユニットタンパク質は、１つまたはそれ以上のコグネイトポリヌクレオチド（最も典型的にはｃｒＲＮＡ）と相互作用して、Ｉ型エフェクター複合体（最も典型的にはＲＮＰ複合体）を形成することができる。

Ｉ−Ｅ型ＣＲＩＳＰＲ−Ｃａｓ系においてカスケードをコードする遺伝子は、長い期間をかけて種々の取決めにより命名されてきた。これが、最近の文献とより古い文献とを比較するときに、混乱点となる場合がある。典型的には、本明細書は、Ｋｏｏｎｉｎ，Ｅ．ら（非特許文献５）に示される命名法を用いている。この中で、基準大腸菌（Ｅ．ｃｏｌｉ）Ｋ１２オペロンの遺伝子順序は：ｃａｓ３、ｃａｓ８、ｃａｓ１１、ｃａｓ７、ｃａｓ５、ｃａｓ６、ｃａｓ１、およびｃａｓ２である。分かり易くする目的で、ｃａｓ８ｅの修飾詞「ｅ」は、時折、Ｉ型系内の異なるサブタイプ間でｃａｓ８遺伝子を識別するのに用いられる。野生型大腸菌（Ｅ．ｃｏｌｉ）Ｉ−Ｅ型ＣＲＩＳＰＲ−Ｃａｓの化学量論は、Ｃａｓ５₁−Ｃａｓ６₁−Ｃａｓ７₆−Ｃａｓ８₁−Ｃａｓ１１₂−ｇＲＮＡ₁である。

しかしながら、相互参照する目的で：ｃａｓ８は、以前にｃｓｅ１およびｃａｓＡと呼ばれ、そして「大サブユニット」としても知られ；ｃａｓ１１は、以前にｃｓｅ２およびｃａｓＢと呼ばれ、そして「小サブユニット」としても知られ；ｃａｓ７は、以前にｃｓｅ４およびｃａｓＣと呼ばれ；ｃａｓ５は、以前にｃａｓＤと呼ばれ、時折修飾詞が与えられてｃａｓ５ｅとなり；そしてｃａｓ６は、以前にｃｓｅ３およびｃａｓＥと呼ばれ、多くの場合修飾詞が与えられてｃａｓ６ｅとなった。Ｃａｓサブユニットタンパク質をコードする遺伝子を、表１に一覧にしている。

ＰＡＭ配列は、典型的に、Ｃａｓ１サブユニットタンパク質／Ｃａｓ２サブユニットタンパク質複合体によって認識され、活性ＰＡＭセンシング部位が、Ｃａｓ１サブユニットタンパク質に付随する（例えば、非特許文献１８参照）。Ｃａｓ１タンパク質およびＣａｓ２タンパク質は、大多数の知られているＣＲＩＳＰＲ−Ｃａｓ系において存在しており、ＣＲＩＳＰＲカセット中へのスペーサーの挿入に十分である（例えば、Ｙｏｓｅｆ，Ｉら、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．４０巻：５５６９〜５５７６頁（２０１２年）参照）。これらの２つのタンパク質は、適合プロセス用の複合体を形成する。Ｃａｓ１タンパク質のエンドヌクレアーゼ活性は、スペーサー統合に必要とされるが、Ｃａｓ２タンパク質は、非酵素的機能を実行するようである（例えば、Ｎｕｎｅｚ，Ｊ．ら、ＮａｔＳｔｒｕｃｔＭｏｌＢｉｏｌ．２１巻：５２８〜５３４頁（２０１４年）；Ｒｉｃｈｔｅｒ，Ｃ．ら、ＰＬｏＳＯｎｅ．２０１２年；７巻：ｅ４９５４９頁参照）。Ｃａｓ１−Ｃａｓ２タンパク質複合体は、他の系から準自律的であると思われるＣＲＩＳＰＲ−Ｃａｓ系の高度に保存された情報処理モジュールを表す（例えば、Ｍａｋａｒｏｖａ，Ｋ．ら、ＭｅｔｈｏｄｓＭｏｌ．Ｂｉｏｌ．１３１１巻：４７〜７５頁（２０１５年）参照）。エンドヌクレアーゼＣａｓ１タンパク質は、感染性病原体との以前の遭遇の記憶を維持するＣＲＩＳＰＲ系のユニークな能力を確実にする必須のＣａｓタンパク質である。

用語「Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体」、「Ｉ型ＣＲＩＳＰＲ−Ｃａｓ核タンパク質（ＮＰ）複合体」、「カスケード核タンパク質（ＮＰ）複合体」、および「Ｉ型核タンパク質（ＮＰ）複合体」は、本明細書中で互換的に用いられており、典型的に、ガイドポリヌクレオチドと共に複合体を形成するカスケードタンパク質を指す。「カスケード複合体」および「Ｉ型複合体」は、典型的に、カスケードＮＰ複合体のタンパク質構成要素を指す場合に用いられる。用語「カスケードＲＮＰ複合体」、「Ｉ型ＣＲＩＳＰＲ−ＣａｓＲＮＰ複合体」、および「Ｉ型ＲＮＰ複合体」は、より包括的なガイドポリヌクレオチド（すなわち、カスケードＮＰ複合体中の）との対比で、ｃｒＲＮＡを含むカスケード複合体を指す。野生型Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の例を、図１Ａに示す。図１Ａは、Ｍａｋａｒｏｖａ，Ｋ．Ｓ．ら（非特許文献１９；非特許文献６）を変更して作成している。図１Ａは、カスケード複合体として会合した６つのＣａｓ７タンパク質、Ｃａｓ５タンパク質、Ｃａｓ８タンパク質、２つのＣｓｅ２タンパク質、Ｃａｓ６タンパク質、およびｃｒＲＮＡを示す（図１Ａ：Ｃａｓ７、Ｃａｓ５、Ｃａｓ８、Ｃｓｅ２、およびＣａｓ６；Ｃａｓ６周りの破線のボックスは、ｃｒＲＮＡヘアピンとの相互作用を示す；ｃＲＮＡは、黒色の線で示し、ヘアピンを含む）。複合体は、核酸標的配列に結合することができる。ｗｔＣａｓ３タンパク質（図１Ａ、破線のボックスによって囲まれているＣａｓ３）の、複合体との会合の後、カスケード複合体は、核酸標的配列を切断することができる。表１で注目されるように、一部のＣａｓサブユニットタンパク質の総数は、カスケード複合体で変動し得る。

「Ｃａｓ３」および「Ｃａｓ３タンパク質」は、本明細書中で、Ｉ型ＣＲＩＳＰＲ−Ｃａｓ３タンパク質、その改変型、およびそのバリアントを指すのに互換的に用いられる。Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体は、ｃｒＲＮＡガイドと相補的な外来ＤＮＡに結合して、Ｃａｓ３（標的分解に必要とされるトランス作用ヌクレアーゼ−ヘリカーゼ）を動員する。Ｃａｓ３タンパク質は、スーパーファミリー２由来のヘリカーゼに特徴的なモチーフを有しており、そしてＤＥＡＤ／ＤＥＡＨボックス領域および保存されたＣ末端ドメインを含有する。Ｃａｓ３タンパク質およびそのバリアントが、当該技術において知られている（例えば、非特許文献１３；非特許文献１２；Ｂｅｌｏｇｌａｚｏｖａ，Ｎ．ら、ＥＭＢＯＪ．３０巻：４６１６〜４６２７頁（２０１１年）；Ｍｕｌｅｐａｔｉ，Ｓ．ら、Ｊ．Ｂｉｏｌ．Ｃｈｅｍ．２８６巻：３１８９６〜３１９０３頁（２０１１年）参照）。本明細書中で用いられる用語「ｍＣａｓ３タンパク質」は、その対応するｗｔＣａｓ３タンパク質に対して１つまたはそれ以上の突然変異を含むＣａｓ３タンパク質を指す。ｍＣａｓ３タンパク質として、以下に限定されないが、ｍＣａｓ３タンパク質（例えば、実施例２３Ａ、実施例２３Ｂ、および実施例２３Ｃ）、ｄｂｌｍＣａｓ３タンパク質（例えば、実施例２６Ａ、実施例２６Ｂ、および実施例２６Ｃ）、およびｄＣａｓ３^*（いかなるヌクレアーゼ活性および／またはヘリカーゼ活性も有していない突然変異Ｃａｓ３タンパク質）が挙げられる。

本明細書中で用いられる用語「ヌクレアーゼ」は、ホスホジエステル結合（二本鎖（ｄｓ）核酸（例えば、ｄｓＤＮＡ、ゲノムＤＮＡ（ｇＤＮＡ）、ｄｓＲＮＡ）において見出される２つのヌクレオチド、一本鎖（ｓｓ）核酸（例えば、ｓｓＤＮＡ、ＲＮＡ）、またはハイブリッドｄｓＲＮＡ／ＤＮＡを連結するもの等）を切断することができる酵素を指す。「エンドヌクレアーゼ」は、典型的に、その標的分子内のｓｓ−（ニック）またはｄｓ−切断に影響を与えることができる。ＤＮＡエンドヌクレアーゼの一例として、ＦｏｋＩ酵素がある。「ＦｏｋＩエンドヌクレアーゼ」および「ＦｏｋＩ」は、本明細書中で互換的に用いられており、ＦｏｋＩ酵素、ＦｏｋＩ相同体、ＦｏｋＩ酵素の酵素活性ドメイン、およびＦｏｋＩ酵素のバリアントを指す。ＦｏｋＩ二量体化が、典型的に、ＤＮＡ切断に必要とされる。ＦｏｋＩのダイマーは、ホモダイマーを形成するように会合する２つのモノマーサブユニット、またはヘテロダイマーを形成するように会合する２つの互いに異なるモノマーサブユニットを含み得る（例えば、Ｂｉｔｉｎａｉｔｅ，Ｊ．ら、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ９５巻：１０５７０〜１０５７５頁（１９９８年）；Ｒａｍａｌｉｎｇａｍ，Ｓ．ら、Ｊ．Ｍｏｌ．Ｂｉｏｌ．４０５巻：６３０〜６４１頁（２０１１年）参照）。ＦｏｋＩバリアントの一例として、Ｇｕｏら（Ｇｕｏ，Ｊ．ら、Ｊ．Ｍｏｌ．Ｂｉｏｌ．４００巻：９６〜１０７頁（２０１０年））によって記載されるＳｈａｒｋｅｙバリアントがある。更なるＤＮＡおよびＲＮＡヌクレアーゼが、当該技術において知られている。

本明細書中で用いられる「ＣＲＩＳＰＲＲＮＡ」、「ｃｒＲＮＡ」、および「ガイドＲＮＡ」は、１つまたはそれ以上のＲＮＡを指し、これとＣａｓサブユニットタンパク質が相互作用して、Ｉ型エフェクター複合体を形成することができ、これは、（核酸標的配列を含まないポリヌクレオチドに対して）ポリヌクレオチド内の核酸標的配列に選択的に結合するように複合体をガイドする。本明細書中で用いられる「ガイド」および「ガイドポリヌクレオチド」は、リボヌクレオチド塩基（例えば、ＲＮＡ）およびリボース糖を含むＩ型エフェクター複合体のポリヌクレオチド構成要素、ならびに異種の構成要素、ならびにそれらの組合せ（以下に限定されないが、デオキシリボヌクレオチド塩基、ヌクレオチド類似体、修飾ヌクレオチド、様々な窒素塩基、基本的に相異するヌクレオチド塩基、化学的に異種の分子、塩基（例えば、ＲＮＡ塩基、ＤＮＡ塩基、および／または修飾塩基）の混合物等、ならびにそれらの組合せ、加えて、合成骨格、天然に存在する骨格、天然に存在しない骨格、基本的に相異する骨格残基、化学的に異種の残基または結合、修飾骨格、混合物（例えば、骨格のリボースおよびデオキシリボース構成要素）等、ならびにそれらの組合せが挙げられる）を指す。ガイドポリヌクレオチドの一部の例を、本明細書中に記載する。ｃｒＲＮＡスペーサーを介して核酸標的配列と会合するＩ型ＣＲＩＳＰＲ−ＣａｓｃｒＲＮＡの例を、図１Ｂに示す。図１Ｂは、Ｈｏｃｈｓｔｒａｓｓｅｒ，Ｍ．Ｌ．ら、Ｍｏｌ．Ｃｅｌｌ６３巻：８４０〜８５１頁（２０１６年）を変更して作成している。図１Ｂにおいて、ＰＡＭ（図１Ｂ、１０４）は、核酸標的配列に付随し、二本鎖核酸の５’および３’鎖が示されている（図１Ｂ、垂直な線は、水素結合を表す）。ガイドポリヌクレオチド（図１Ｂ、１０６）は、典型的に、５’ハンドル領域（図１Ｂ、１０１）、シード領域を含むスペーサー領域（図１Ｂ、１０３）、および２つの水素結合リピート領域を含む３’ヘアピン（図１Ｂ、１０２）を含む；水平の線は、水素結合を表す。いくつかのＩ型カスケード相同体と関連するＰＡＭ配列を、本明細書中で考察する。ＰＡＭ配列は、プロトスペーサー配列（図１Ｂ、１０５）に隣接する。図１Ｂは、核酸標的配列に結合したカスケード複合体スペーサーを示す（図１Ｂ、垂直な線は、水素結合を表す）。また、図１Ｂは、プロトスペーサー領域（図１Ｂ、プロトスペーサー）を示す。スペーサーは、約６〜約５６ヌクレオチドのｃｒＲＮＡの領域を含むことができ、スペーサーは、ポリヌクレオチド内の核酸標的配列と相補的である。スペーサー長は、Ｉ−Ｅ型ＣＲＩＳＰＲ−Ｃａｓ系において、カスケード活性を微調整するように変えることができる。カスケード複合体には、ｃｒＲＮＡスペーサーに全６ヌクレオチドが加わったエクストラＣａｓ７サブユニット、およびスペーサーに全１２ヌクレオチドが加わったエクストラＣｓｅ２サブユニットが組み込まれることがある（例えば、Ｌｕｏ，Ｍ．Ｌ．ら、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．４４巻（１５号）：７３８５〜７３９４頁（２０１６年）参照）。スペーサーは、典型的に、約３２〜約３６ヌクレオチドの領域を含む。

用語「スペーサー」、「スペーサー配列」、および「核酸標的結合配列」は、本明細書中で互換的に用いられる。

「標的」、「標的配列」、「核酸標的配列」、および「オンターゲット配列」は、本明細書中で、カスケード核タンパク質複合体（例えば、カスケードＲＮＰ複合体）のガイドの核酸標的結合配列（例えば、ｃｒＲＮＡのスペーサー）と完全に、または部分的に相補的である核酸配列を指すのに互換的に用いられる。典型的には、核酸標的結合配列は、カスケード核タンパク質複合体の結合が導かれることとなる核酸標的配列と１００％相補的となるように選択される；しかしながら、核酸標的配列への結合を減弱させるために、より低いパーセント相補性を用いることができる。標的結合配列が標的配列と１００％相補的である場合、「オフターゲット」配列結合は、核酸標的結合配列（スペーサー）との相補性が１００％未満である核酸配列へのカスケード核タンパク質複合体の結合を指す。二本鎖ＤＮＡ配列は、典型的に、１本の鎖上に核酸標的配列を含む（図１Ｂ、ガイドＲＮＡに結合した水素部分（ｓｅｃｔｉｏｎｈｙｄｒｏｇｅｎ））。「標的領域」は、核酸標的配列を含む。

本明細書中で用いられる「ステム要素」または「ステム構造」は、二本鎖領域を形成することが知られている、または予測される核酸の２本の鎖（「ステム要素」）を指す。「ステム−ループ要素」または「ステム−ループ構造」は、１本の鎖の３’末端配列が、典型的に一本鎖のヌクレオチドのヌクレオチド配列（「ステム−ループ要素ヌクレオチド配列」）によって、第２の鎖の５’末端配列に共有結合されているステム構造を指す。一部の実施形態において、ループ要素は、約３〜約２０ヌクレオチド長、好ましくは約４〜約１０ヌクレオチド長のループ要素ヌクレオチド配列を含む。好ましい実施形態において、ループ要素ヌクレオチド配列は、ループ要素ヌクレオチド配列内にステム要素を生じさせるように、水素結合形成を介して相互作用しない、不対核酸塩基の一本鎖ヌクレオチド配列である。また、用語「ヘアピン要素」は、本明細書中で、ステム−ループ構造を指すのに用いられる。そのような構造は、当該技術において周知である。塩基対形成は、正確であり得る；しかしながら、当該技術において知られているように、ステム要素は、正確な塩基対形成を必要としない。ゆえに、ステム要素は、１つまたはそれ以上の塩基ミスマッチまたは非対形成塩基を含んでもよい。ガイドポリヌクレオチド内のステム−ループ構造の例を、図１Ｂに示す。

「リンカー要素ヌクレオチド配列」、「リンカーヌクレオチド配列」、および「リンカーポリヌクレオチド」は、本明細書中で互換的に用いられており、第１の核酸配列に共有結合された１つまたはそれ以上のヌクレオチドの一本鎖核酸配列または二本鎖核酸配列（例えば、５’−リンカーヌクレオチド配列−第１の核酸配列−３’）のいずれかを指す。一部の実施形態において、リンカーヌクレオチド配列が、２つの別個の核酸配列を連結して、単一のポリヌクレオチドを形成する（例えば、５’−第１の核酸配列−リンカーヌクレオチド配列−第２の核酸配列−３’）。リンカーヌクレオチド配列の他の例として、以下に限定されないが、５’−第１の核酸配列−リンカーヌクレオチド配列−３’および５’−リンカーヌクレオチド配列−第１の核酸配列−リンカーヌクレオチド配列−３’が挙げられる。一部の実施形態において、リンカー要素ヌクレオチド配列は、リンカー要素ヌクレオチド配列内の二次構造（例えば、ステム−ループ構造）を生じさせるように、水素結合形成を介して互いに相互作用しない、不対核酸塩基の一本鎖ヌクレオチド配列であってよい。一部の実施形態において、２つのリンカー要素ヌクレオチド配列は、２つのリンカー要素ヌクレオチド配列間の水素結合を介して互いに相互作用することができる。一部の実施形態において、リンカーポリヌクレオチドが、「リンカーポリペプチド」をコードする。そのようなリンカーポリヌクレオチドは、典型的に、第１のポリペプチドをコードする第１のポリヌクレオチドの３’末端を、第２のポリペプチドをコードする第２のポリヌクレオチドの５’末端に連結して、Ｎ−第１のポリペプチド−リンカーポリペプチド−第２のポリペプチド−Ｃを含む融合タンパク質をコードする単一のポリヌクレオチドを形成する。本発明の一部の実施形態において、２つを超えるポリペプチド配列を、リンカーポリペプチドによってタンデムに連結することができる（例えば、Ｎ−第１のポリペプチド−第１のリンカーポリペプチド−第２のポリペプチド−第２のリンカーポリペプチド−第３のポリペプチド−Ｃ）。また、「リンカーポリペプチド」、「リンカーポリペプチド配列」、「アミノ酸リンカー配列」、および「リンカー配列」は、本明細書中で互換的に用いられる。

本明細書中で用いられる「ヌクレオチド配列を連結する」は、第１の核酸配列および第２の核酸配列を共有結合的に連結する一本鎖核酸配列リンカー配列を指す。

本明細書中で用いられる用語「スペーサー間」、「スペーサー間領域」、および「スペーサー間距離」は、互換可能であり、典型的にはＰＡＭ−ｉｎの配置にある、第１の核酸標的配列（例えば、第１のＤＮＡ標的配列）のＰＡＭと、第２の核酸標的配列（例えば、第２のＤＮＡ標的配列）のＰＡＭとの間の距離を指し、第１のＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体が、第１の核酸標的配列に結合することができる第１のスペーサーを含み、第２のＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体が、第２の核酸標的配列に結合することができる第２のスペーサーを含む。図２Ａ、図２Ｂ、および図２Ｃは、リンカーポリヌクレオチド（図２Ａ、「リンカー１」および「リンカー２」）を介して各カスケード複合体と連結される融合タンパク質（図２Ａ、扇形として表す「ＦＰ１」および「ＦＰ２」；例えば、ＦＰ１およびＦＰは、ＦｏｋＩであってよい）を含む２つのＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体（図２Ａ：「カスケード１」、実線の輪郭のボックス、「ｃｒＲＮＡ１」を含む；および「カスケード２」、破線のボックス、「ｃｒＲＮＡ２」を含む）の実例を示しており、ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体は、二本鎖ＤＮＡ（図２Ａ、「ｄｓＤＮＡ」）、対形成された、水平の破線として表す）上の隣接する核酸標的配列に結合される。各核酸標的配列に付随するＰＡＭ配列を示す（図２Ａ、「ＰＡＭ１」、空白のボックス、および「ＰＡＭ２」、空白のボックス））。図２Ａは、ＰＡＭ−ｉｎ（ＰＡＭ−ｉｎ／ＰＡＭ−ｉｎ）配置の、２つの標的部位間のインタースペーサーを示す（図２Ａの最上位の水平の双方向矢印線として示す）。図２Ｂは、ＰＡＭ−ｉｎ／ＰＡＭ−ｏｕｔ配置の、２つの標的部位間のインタースペーサーを示す（図２Ｂの最上位の水平の双方向矢印線として示す）。図２Ｃは、ＰＡＭ−ｏｕｔ（ＰＡＭ−ｏｕｔ／ＰＡＭ−ｏｕｔ）配置の、２つの標的部位間のインタースペーサーを示す（図２Ｃの最上位の水平の双方向矢印線として示す）。また、図２Ａ、図２Ｂ、および図２Ｃは、ｄｓＤＮＡの２本の鎖の分離を示す。カスケード複合体は、ＰＡＭに隣接するｄｓＤＮＡ標的配列を認識する。ＰＡＭ配列は、Ｃｓｅ１によって認識される。ｃｒＲＮＡと、相補的標的ＤＮＡ鎖間の塩基対形成は、非相補的標的ＤＮＡ鎖の位置がずれたＲ−ループをもたらす（例えば、Ｂｅｌｏｇｌａｚｏｖａ，Ｎ．ら、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．４３巻：５３０〜５４３頁（２０１５年）参照）。

本明細書中で用いられる用語「コグネイト」は、相互作用する生体分子、例えば細胞表面受容体（例えば、ケモカイン受容体）、およびそのリガンド（例えば、腫瘍細胞上で、または腫瘍微環境内で発現されるケモカイン）；部位特異的ポリペプチドおよびそのガイド；ガイド結合配列と相補的な核酸標的配列に部位特異的に結合することができる部位特異的ポリペプチド／ガイド複合体（すなわち、核タンパク質複合体）；等を指す。また、用語「コグネイト」は、１つまたはそれ以上のガイドポリヌクレオチドの１つに存在するスペーサーと相補的な核酸標的配列に部位特異的に結合することができる核タンパク質複合体を形成することができる一群のＣａｓサブユニットタンパク質（例えば、Ｃｓｅ２、Ｃａｓ５、Ｃａｓ６、Ｃａｓ７、およびＣａｓ８）および１つまたはそれ以上のガイドポリヌクレオチド（例えば、Ｉ型ＣＲＩＳＰＲ−ＣａｓＲＮＡ）を指す。

用語「野生型」、「天然に存在する」、および「無改変」は、本明細書中で、自然界に存在する典型的な（または最も一般的な）形態、外観、表現型、または系統を意味するのに用いられる；例えば、細胞、生物、ポリヌクレオチド、タンパク質、高分子複合体、遺伝子、ＲＮＡ、ＤＮＡ、またはゲノムの典型的な形態（これらは、天然の源に存在し、かつ天然の源から単離することができる）。野生型の形態、外観、表現型、または系統は、意図的な改変、変化、突然変異、および／または著しく異なる構造的変化の前の、元の親として機能する。ゆえに、突然変異形態、バリアント形態、操作された形態、組換え形態、および改変形態は、野生型形態ではない。

用語「操作された」、「遺伝子操作された」、「遺伝的に改変された」、「組換え型の」、「改変された」、「天然に存在しない」、および「非天然の」は、生物または細胞のゲノムの意図的なヒト操作または機械操作を示す。当該用語は、本明細書中で定義されるゲノム編集を含むゲノム改変の方法、遺伝子の発現または不活化を変更する技術、酵素工学、指向性進化、知識ベースの設計、ランダム突然変異誘発法、遺伝子シャッフリング、およびコドン最適化等を包含する。遺伝子工学法は、当該技術において知られている。

「共有結合」、「共有結合的に取り付けられた」、「共有結合した」、「共有結合的に連結された」、「共有結合的に連結した」、および「分子結合」は、本明細書中で互換的に用いられており、電子対を原子間で共有することを伴う化学結合を指す。共有結合の例として、以下に限定されないが、ホスホジエステル結合、ホスホロチオアート結合、ジスルフィド結合、およびペプチド結合（−ＣＯ−ＮＨ−）が挙げられる。

「非共有結合」、「非共有結合的に取り付けられた」、「非共有結合した」、「非共有結合的に連結された」、「非共有結合的相互作用」、および「非共有結合的に連結した」は、本明細書中で互換的に用いられており、一対の電子を共有することを伴わない、比較的弱いあらゆる化学結合を指す。複数の非共有結合は、多くの場合、巨大分子の高次構造を安定化させて、分子間の特異的相互作用を媒介する。非共有結合の例として、以下に限定されないが、水素結合、イオン相互作用（例えば、Ｎａ⁺Ｃｌ^-）、ファンデルワールス相互作用、および疎水結合が挙げられる。

本明細書中で用いられる「水素結合」、「水素−塩基対形成」、および「水素結合した」は、互換可能であり、以下に限定されないが；「ワトソン−クリック水素結合塩基対」（Ｗ−Ｃ水素結合塩基対またはＷ−Ｃ水素結合）；「フーグスティーン水素結合塩基対」（フーグスティーン水素結合）；および「ウォブル水素結合塩基対」（ウォブル水素結合）が挙げられる規範的な水素結合および非規範的な水素結合を指す。Ｗ−Ｃ水素結合（逆Ｗ−Ｃ水素結合を含む）は、プリン−ピリミジン塩基対形成、例えば、アデニン：チミン、グアニン：シトシン、およびウラシル：アデニンを指す。フーグスティーン水素結合（逆フーグスティーン水素結合を含む）は、核酸における塩基対形成の変形を指し、２つの核酸塩基（各鎖上に１つ）が、主溝内で水素結合によって一緒に保持される。この非Ｗ−Ｃ水素結合により、第３の鎖が二重鎖に巻きついて、三本鎖螺旋を形成することができる。ウォブル水素結合（逆ウォブル水素結合を含む）は、ＲＮＡ分子における２つのヌクレオチド間の対形成を指し、ワトソン−クリック塩基対規則に従わない。４つの主要なウォブル塩基対がある：グアニン：ウラシル、イノシン（ヒポキサンチン）：ウラシル、イノシン−アデニン、およびイノシン−シトシン。規範的な水素結合および非規範的な水素結合の規則が、当業者に知られている（例えば、ＴｈｅＲＮＡＷｏｒｌｄ、第三版（ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＭｏｎｏｇｒａｐｈＳｅｒｉｅｓ）、Ｒ．Ｆ．Ｇｅｓｔｅｌａｎｄ、ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙＰｒｅｓｓ（２００５年）、ＩＳＢＮ９７８−０８７９６９７３９６；ＴｈｅＲＮＡＷｏｒｌｄ、第二版（ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＭｏｎｏｇｒａｐｈＳｅｒｉｅｓ）、Ｒ．Ｆ．Ｇｅｓｔｅｌａｎｄら、ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙＰｒｅｓｓ（１９９９年）、ＩＳＢＮ９７８−０８７９６９５６１３；ＴｈｅＲＮＡＷｏｒｌｄ（ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＭｏｎｏｇｒａｐｈＳｅｒｉｅｓ）、Ｒ．Ｆ．Ｇｅｓｔｅｌａｎｄら、ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙＰｒｅｓｓ（１９９３年）、ＩＳＢＮ９７８−０８７９６９４５６２（例えば、付表１：ＳｔｒｕｃｔｕｒｅｓｏｆＢａｓｅＰａｉｒｓＩｎｖｏｌｖｉｎｇａｔＬｅａｓｔＴｗｏＨｙｄｒｏｇｅｎＢｏｎｄｓ、Ｉ．Ｔｉｎｏｃｏ参照）；ＰｒｉｎｃｉｐｌｅｓｏｆＮｕｃｌｅｉｃＡｃｉｄＳｔｒｕｃｔｕｒｅ、Ｗ．Ｓａｅｎｇｅｒ、ＳｐｒｉｎｇｅｒＩｎｔｅｒｎａｔｉｏｎａｌＰｕｂｌｉｓｈｉｎｇＡＧ（１９８８年）、ＩＳＢＮ９７８−０−３８７−９０７６１−１；ＰｒｉｎｃｉｐｌｅｓｏｆＮｕｃｌｅｉｃＡｃｉｄＳｔｒｕｃｔｕｒｅ、第一版、Ｓ．Ｎｅｉｄｌｅ、ＡｃａｄｅｍｉｃＰｒｅｓｓ（２００７年）、ＩＳＢＮ９７８−０１２３６９５０７９１参照）。

「連結する」、「連結された」、および「連結」は、本明細書中で互換的に用いられており、2つの巨大分子（例えば、ポリヌクレオチド、タンパク質等）間の共有結合または非共有結合を指す。

本明細書中で用いられる用語「核酸配列」、「ヌクレオチド配列」、および「オリゴヌクレオチド」は、互換可能であり、ヌクレオチドのポリマー形態を指す。本明細書中で用いられる用語「ポリヌクレオチド」は、１つの５’末端および１つの３’末端を有し、かつ１つまたはそれ以上の核酸配列を含み得るヌクレオチドのポリマー形態を指す。「環状ポリヌクレオチド」は、その５’末端とその３’末端との間に共有結合を有することで、環状のポリヌクレオチドを形成するポリヌクレオチドを指す。ヌクレオチドは、デオキシリボヌクレオチド（ＤＮＡ）、リボヌクレオチド（ＲＮＡ）、それらの類似体、またはそれらの組合せであってもよく（例えば、ガイドポリヌクレオチドの文脈において先で述べた通りである）、そしてあらゆる長さであってもよい。ポリヌクレオチドは、あらゆる機能を実行してもよく、そして種々の二次構造および三次構造を有してもよい。当該用語は、天然のヌクレオチドの知られている類似体、ならびに塩基、糖、および／またはリン酸部分において修飾されているヌクレオチドを包含する。特定のヌクレオチドの類似体は、塩基対形成特異性が同じである（例えば、ＴとのＡの塩基対の類似性）。ポリヌクレオチドは、１つの修飾ヌクレオチドまたは複数の修飾ヌクレオチドを含んでもよい。修飾ヌクレオチドの例として、以下に限定されないが、フッ化ヌクレオチド、メチル化ヌクレオチド、およびヌクレオチド類似体が挙げられる。ヌクレオチド構造を、ポリマーがアセンブルされる前に、またはその後に、修飾してもよい。重合後、ポリヌクレオチドを追加的に、例えば、標識構成要素または標的結合構成要素とのコンジュゲーションを介して、修飾してもよい。ヌクレオチド配列には、非ヌクレオチド構成要素を組み込んでもよい。また、包含されるのは、合成の、天然に存在する、かつ／または天然に存在しない修飾骨格残基または結合を含む核酸であり、基準ポリヌクレオチド（例えば、ＤＮＡまたはＲＮＡ）と同程度の結合特性を有する。そのような類似体の例として、以下に限定されないが、ホスホロチオアート、ホスホロアミダート、メチルホスホナート、キラル−メチルホスホナート、２−Ｏ−メチルリボヌクレオチド、ペプチド−核酸（ＰＮＡ）、ＬｏｃｋｅｄＮｕｃｌｅｉｃＡｃｉｄ（ＬＮＡ（商標））（Ｅｘｉｑｏｎ，Ｉｎｃ．、Ｗｏｂｕｒｎ、ＭＡ）ヌクレオシド、グリコール核酸、架橋核酸、およびモルフォリノ構造が挙げられる。

ペプチド−核酸（ＰＮＡ）は、ポリヌクレオチドリン酸−糖骨格が、フレキシブルな偽ペプチドポリマーによって置換され、かつ核酸塩基がポリマーに連結されている、核酸の合成相同体である。ＰＮＡは、ＲＮＡおよびＤＮＡの相補的な配列に対して高い親和性および特異性でハイブリダイズする能力を有する。

ホスホロチオアート核酸において、ホスホロチオアート（ＰＳ）結合は、ポリヌクレオチドリン酸骨格において、硫黄原子を非架橋酸素で置換している。この修飾により、ヌクレオチド間結合は、ヌクレアーゼ分解に対して耐性を示すようになる。一部の実施形態において、ホスホロチオアート結合が、ポリヌクレオチド配列の５’末端または３’末端の最後の３〜５ヌクレオチド間に導入されて、エキソヌクレアーゼ分解を阻害している。オリゴヌクレオチドの全体を通してのホスホロチオアート結合の配置は、同様に、エンドヌクレアーゼによる分解を低減する一助となる。

トレオース核酸（ＴＮＡ）は、人工的な遺伝的ポリマーである。ＴＮＡの骨格構造は、ホスホジエステル結合によって連結される繰返しトレオース糖を含む。ＴＮＡポリマーは、ヌクレアーゼ分解に対して耐性を示す。ＴＮＡは、塩基対水素結合によって二重鎖構造に自己アセンブルすることができる。

「リバースホスホラミダイト」を用いることによって、連鎖反転（ｌｉｎｋａｇｅｉｎｖｅｒｓｉｏｎ）をポリヌクレオチド中に導入することができる（例えば、ｗｗｗ．ｕｃａｌｇａｒｙ．ｃａ／ｄｎａｌａｂ／ｓｙｎｔｈｅｓｉｓ／−ｍｏｄｉｆｉｃａｔｉｏｎｓ／ｌｉｎｋａｇｅｓ参照）。２つの５’−ＯＨ末端を有するが、３’−ＯＨ末端を欠くオリゴヌクレオチドを生じさせることによって、ポリヌクレオチドの末端での３’−３’結合が、エキソヌクレアーゼ分解に対してポリヌクレオチドを安定化させる。典型的には、そのようなポリヌクレオチドは、５’−ＯＨ位置上にホスホラミダイト基を、そして３’−ＯＨ位置上にジメトキシトリチル（ＤＭＴ）保護基を有する。通常、ＤＭＴ保護基は５’−ＯＨ上にあり、そしてホスホラミダイトは３’−ＯＨ上にある。

ポリヌクレオチド配列は、特に明記しない限り、本明細書中で、従来の５’から３’の向きに示される。

本明細書中で用いられる「配列同一性」は、通常、種々の重み付けパラメータを有するアルゴリズムを用いて、第１のポリヌクレオチドまたはポリペプチドを第２のポリヌクレオチドまたはポリペプチドと比較した、ヌクレオチド塩基またはアミノ酸の同一性パーセントを指す。２つのポリヌクレオチドまたは２つのポリペプチド間の配列同一性は、ワールドワイドウェブを介して、以下に限定されないが、ＧＥＮＢＡＮＫ（ｗｗｗ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ／ｇｅｎｂａｎｋ／）およびＥＭＢＬ−ＥＢＩ（ｗｗｗ．ｅｂｉ．ａｃ．ｕｋ）が挙げられるサイトにて利用可能な種々の方法およびコンピュータプログラム（例えば、ＢＬＡＳＴ、ＣＳ−ＢＬＡＳＴ、ＰＳＩ−ＢＬＡＳＴ、ＦＡＳＴＡ、ＨＭＭＥＲ、Ｌ−ＡＬＩＧＮ等）による配列アラインメントを用いて求めることができる。２つのポリヌクレオチドまたは２つのポリペプチド配列間の配列同一性が、通常、種々の方法またはコンピュータプログラムの標準的なデフォルトパラメータを用いて算出される。２つのポリヌクレオチドまたは２つのポリペプチド間の、本明細書中で用いられる高い程度の配列同一性は、典型的には約９０％の同一性〜１００％の同一性、例えば、約９０％またはそれ以上の同一性、好ましくは約９５％またはそれ以上の同一性、より好ましくは約９８％またはそれ以上の同一性である。２つのポリヌクレオチドまたは２つのポリペプチド間の、本明細書中で用いられる中程度の配列同一性は、典型的には約８０％の同一性〜約８５％の同一性、例えば、約８０％またはそれ以上の同一性、好ましくは約８５％の同一性である。２つのポリヌクレオチドまたは２つのポリペプチド間の、本明細書中で用いられる低い程度の配列同一性は、典型的には、約５０％の同一性〜７５％の同一性、例えば、約５０％の同一性、好ましくは約６０％の同一性、より好ましくは約７５％の同一性である。例えば、アミノ酸置換を含むＣａｓタンパク質（例えば、Ｉ−Ｅ型Ｃｓｅ２、Ｃａｓ５、Ｃａｓ６、Ｃａｓ７、および／またはＣａｓ８）は、基準Ｃａｓタンパク質（例えば、それぞれ野生型Ｉ−Ｅ型Ｃｓｅ２、Ｃａｓ５、Ｃａｓ６、Ｃａｓ７、および／またはＣａｓ８）に対して、その長さにわたって、低い程度の配列同一性、中程度の配列同一性、または高い程度の配列同一性を有してよい。別の例として、ガイドポリヌクレオチドは、基準Ｃａｓタンパク質と複合体形成する基準野生型ガイドポリヌクレオチド（例えば、Ｉ−Ｅ型Ｃｓｅ２、Ｃａｓ５、Ｃａｓ６、Ｃａｓ７、および／またはＣａｓ８と複合体を形成するガイドポリヌクレオチド）と比較して、その長さにわたって、低い程度の配列同一性、中程度の配列同一性、または高い程度の配列同一性を有してよい。

本明細書中で用いられる「ハイブリダイゼーション」、「ハイブリダイズする」、または「ハイブリダイジング」は、２つの相補的な一本鎖ＤＮＡまたはＲＮＡ分子を組み合わせて、水素塩基対形成を介して単一の二本鎖分子（ＤＮＡ／ＤＮＡ、ＤＮＡ／ＲＮＡ、ＲＮＡ／ＲＮＡ）を形成するプロセスである。ハイブリダイゼーションストリンジェンシは、典型的に、ハイブリダイゼーション温度、およびハイブリダイゼーションバッファの塩濃度によって決定される；例えば、高温および低塩は、高いストリンジェンシハイブリダイゼーション条件を実現する。様々なハイブリダイゼーション条件についての塩濃度範囲および温度範囲の例は、以下の通りである：高ストリンジェンシは、おおよそ０．０１Ｍ〜おおよそ０．０５Ｍの塩、ハイブリダイゼーション温度はＴ_mよりも５℃〜１０℃低い；中程度のストリンジェンシは、おおよそ０．１６Ｍ〜おおよそ０．３３Ｍの塩、ハイブリダイゼーション温度はＴ_mよりも２０℃〜２９℃低い；そして低ストリンジェンシは、おおよそ０．３３Ｍ〜おおよそ０．８２Ｍの塩、ハイブリダイゼーション温度はＴ_mよりも４０℃〜４８℃低い。二重鎖核酸配列のＴ_mは、当該技術において周知の標準的な方法によって算出される（例えば、Ｍａｎｉａｔｉｓ，Ｔ．ら、ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ、ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙＰｒｅｓｓ：ＮｅｗＹｏｒｋ（１９８２年）；Ｃａｓｅｙ，Ｊ．ら、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．４巻：１５３９〜１５５２頁（１９７７年）；Ｂｏｄｋｉｎ，Ｄ．Ｋ．ら、Ｊ．ＶｉｒｏｌｏｇｉｃａｌＭｅｔｈｏｄｓ１０巻：４５〜５２頁（１９８５年）；Ｗａｌｌａｃｅ，Ｒ．Ｂ．ら、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．９巻：８７９〜８９４頁（１９８１年）参照）。Ｔ_mを推定するアルゴリズム予測ツールもまた広く利用可能である。ハイブリダイゼーションについての高ストリンジェンシ条件は、典型的に、標的配列と相補的なポリヌクレオチドが、標的配列と主にハイブリダイズして、非対象配列に実質的にハイブリダイズしない条件を指す。典型的には、ハイブリダイゼーション条件は、中程度のストリンジェンシ、好ましくは高ストリンジェンシの条件である。

本明細書中で用いられる「相補性」は、別の核酸配列と（例えば、規範的なワトソン−クリック塩基対形成を介して）水素結合を形成する核酸配列の能力を指す。相補性パーセントは、第２の核酸配列と水素結合を形成することができる核酸配列内の残基のパーセンテージを示す。２つの核酸配列が１００％の相補性を有するならば、２つの配列は完全に相補的である、すなわち、第１のポリヌクレオチドの全ての連続残基が、第２のポリヌクレオチド内の同じ数の連続残基と水素結合する。

本明細書中で用いられる「結合」は、巨大分子間（例えば、タンパク質とポリヌクレオチドとの間、ポリヌクレオチドとポリヌクレオチドとの間、タンパク質とタンパク質との間等）での非共有結合性の相互作用を指す。また、そのような非共有結合性の相互作用は、「会合」または「相互作用」（例えば、第１の巨大分子が第２の巨大分子と相互作用するならば、第１の巨大分子は第２の巨大分子と非共有結合的に結合する）と呼ぶ。結合相互作用のいくつかの部分は、配列特異的であってもよい（用語「配列特異的結合」、「配列特異的に結合する」、「部位特異的結合」、および「部位特異的に結合する」は、本明細書中で互換的に用いられる）。本明細書中で用いられる配列特異的結合は、典型的に、Ｉ型ＣＲＩＳＰＲ−Ｃａｓサブユニットタンパク質（例えば、Ｃｓｅ２、Ｃａｓ５、Ｃａｓ６、Ｃａｓ７、およびＣａｓ８）と複合体を形成して、タンパク質を、核酸標的結合配列（例えば、ＤＮＡ標的結合配列）なしで、第２の核酸配列（例えば、第２のＤＮＡ配列）と比較して、核酸標的配列（例えば、ＤＮＡ標的配列）を含む核酸配列（例えば、ＤＮＡ配列）に選択的に結合させることができる１つまたはそれ以上のガイドポリヌクレオチドを指す。結合相互作用の全ての構成要素が配列特異的であることを必要とするわけではない（例えば、タンパク質の、ＤＮＡ骨格内のリン酸残基との接触）。結合相互作用は、解離定数（Ｋｄ）によって特徴付けることができる。「結合親和性」は、結合相互作用の強度を指す。結合親和性が高いほど、低いＫｄと相関する。

本明細書中で用いられるエフェクター複合体は、そのような複合体がポリヌクレオチド内の核酸標的配列中のポリヌクレオチドに結合し、またはこれを切断するならば、ポリヌクレオチドを「標的化」したと言われる。

本明細書中で用いられる「二本鎖切断」（ＤＳＢ）は、ＤＮＡの二本鎖セグメントの双方の鎖が分離されることを指す。ある例として、そのような切断が起これば、一方の鎖が「粘着末端」を有すると言うことができ、そこでは、ヌクレオチドが曝されて、他方の鎖上のヌクレオチドに水素結合されていない。他の例では、「平滑末端」が生じ得、そこでは、双方の鎖が、互いに完全に塩基対形成されたままである。

「ドナーポリヌクレオチド」、「ドナーオリゴヌクレオチド」、および「ドナー鋳型」は、本明細書中で互換的に用いられており、二本鎖ポリヌクレオチド（例えば、ＤＮＡ）、一本鎖ポリヌクレオチド（例えば、ＤＮＡまたはＲＮＡ）、またはそれらの組合せであり得る。ドナーポリヌクレオチドは、挿入配列（例えば、ＤＮＡ内のＤＳＢ）に隣接する相同アームを含んでもよい。各側部上の相同アームは、長さが変動してもよい（例えば、１〜５０塩基、５０〜１００塩基、１００〜２００塩基、２００〜３００塩基、３００〜５００塩基、５００〜１０００塩基）。相同アームは、長さが対称性であっても非対称性であってもよい。ドナーポリヌクレオチドの設計および構築のためのパラメータが、当該技術において周知である（例えば、Ｒａｎ，Ｆ．ら、ＮａｔｕｒｅＰｒｏｔｏｃｏｌｓ８巻：２２８１〜２３０８頁（２０１３年）；Ｓｍｉｔｈｉｅｓ，Ｏ．ら、Ｎａｔｕｒｅ３１７巻：２３０〜２３４頁（１９８５年）；Ｔｈｏｍａｓ，Ｋ．ら、Ｃｅｌｌ４４巻：４１９〜４２８頁（１９８６年）；Ｗｕ，Ｓ．ら、ＮａｔｕｒｅＰｒｏｔｏｃｏｌｓ３巻：１０５６〜１０７６頁（２００８年）；Ｓｉｎｇｅｒ，Ｂ．ら、Ｃｅｌｌ３１巻：２５〜３３頁（１９８２年）；Ｓｈｅｎ，Ｐ．ら、Ｇｅｎｅｔｉｃｓ１１２巻：４４１〜４５７頁（１９８６年）；Ｗａｔｔ，Ｖ．ら、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ８２巻：４７６８〜４７７２頁（１９８５年）；Ｓｕｇａｗａｒａ，Ｎ．ら、Ｊ．Ｍｏｌ．Ｂｉｏ．１２巻：５６３〜５７５頁（１９９２年）；Ｒｕｂｎｉｔｚ，Ｊ．ら、Ｊ．Ｍｏｌ．Ｂｉｏ．４巻：２２５３〜２２５８頁（１９８４年）；Ａｙａｒｅｓ，Ｄ．ら、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ８３巻：５１９９〜５２０３頁（１９８６年）；Ｌｉｓｋａｙ，Ｒ．ら、Ｇｅｎｅｔｉｃｓ１１５巻：１６１〜１６７頁（１９８７年）参照）。一部の実施形態において、ドナーポリヌクレオチドは、キメラ抗原受容体（例えば、ＣＡＲ）を含む。

用語「キメラ抗原受容体」および「ＣＡＲ」は、本明細書中で互換的に用いられており、典型的に、少なくとも２つの構成要素：細胞外抗原認識ドメイン（標的結合ドメインまたは細胞外リガンド結合ドメインとも呼ばれる）および細胞内活性化ドメイン（例えば、１つまたはそれ以上の細胞内シグナリングドメイン、および典型的に１つまたはそれ以上の共刺激シグナリングドメインを含む）を含む、ラボで作出されるポリペプチド分子を指す。ＣＡＲはさらに、ヒンジドメインおよび膜貫通ドメインを含んでもよい。典型的なＣＡＲポリペプチドの構造は、以下の通りである：Ｎ末端−細胞外−［抗原認識ドメイン−ヒンジドメイン］−膜貫通−［膜貫通ドメイン］−細胞内−［細胞内活性化ドメイン］−Ｃ末端；またはＮ末端−細胞内−［細胞内活性化ドメイン］−膜貫通−［膜貫通ドメイン］−細胞外−［抗原認識ドメイン−ヒンジドメイン］−Ｃ末端。

細胞外抗原認識ドメインの例が、抗原に結合するのに用いられる部分を含み、以下に限定されないが、一本鎖免疫グロブリン可変フラグメント（ｓｃＦｖ）、抗原結合フラグメント（Ｆａｂ；典型的には、抗原に結合し、かつ重鎖および軽鎖の各々の１つの定常ドメインおよび１つの可変ドメインで構成される、抗体の領域）、ナノボディ、ラクダ科もしくはサメ由来の一本鎖抗体、操作されたタンパク質結合足場（例えば、ＤＡＲＰｉｎｓおよびＣｅｎｔｙｒｉｎｓ）、またはそれらのコグネイト受容体に結合する天然のリガンドが挙げられる。

ヒンジドメインの例として、以下に限定されないが、可変長（例えば、１つまたはそれ以上のアミノ酸）のポリペプチドヒンジ、ＣＤ８アルファのヒンジ領域、ＣＤ２８のヒンジ領域、ＩｇＧ４のヒンジ領域、およびそれらの組合せが挙げられる。

膜貫通ドメインの例として、以下に限定されないが、膜貫通タンパク質に由来する膜貫通領域、例えば、ＣＤ８アルファ、ＣＤ２８、ＤＡＰ１０、ＤＡＰ１２、ＮＫＧ２Ｄ、およびそれらの組合せが挙げられる。

細胞内活性化ドメインの例として、以下に限定されないが、ＣＤ２８、４−１ＢＢ、ＣＤ３ゼータ、ＯＸ４０、２Ｂ４、ＤＡＰ１０、ＤＡＰ１２の細胞内シグナリングドメイン、切頂および突然変異シグナリングドメイン（例えば、ＣＤ３ゼータの３つのＩＴＡＭドメイン内の突然変異および切頂）、または他の細胞内シグナリングドメイン、およびそれらの組合せが挙げられる。

細胞外リガンド結合ドメインがコグネイトリガンドに結合する場合、ＣＡＲの細胞内シグナリングドメインは、リンパ球を活性化する（ＣＡＲ−Ｔ細胞の説明について、例えば、Ｂｒｕｄｎｏ，Ｊ．ら、ＮａｔｕｒｅＲｅｖ．Ｃｌｉｎ．Ｏｎｃｏｌ．１５巻：３１〜４６頁（２０１８年）；Ｍａｕｄｅ，Ｓ．ら、Ｎ．Ｅｎｇｌ．Ｊ．Ｍｅｄ．３７１巻：１５０７〜１５１７頁（２０１４年）；Ｓａｄｅｌａｉｎ，Ｍ．ら、ＣａｎｃｅｒＤｉｓｃ．３巻：３８８〜３９８頁（２０１３年）；米国特許第７，４４６，１９０号明細書；米国特許第８，３９９，６４５号明細書）参照）（ＣＡＲ−ＮＫ細胞の説明について、例えば、Ｒｅｚｖａｎｉ，Ｋ．ら、Ｍｏｌ．Ｔｈｅｒ．、２５巻：１７６９〜１７８１頁（２０１７年）；Ｓｉｅｇｌｅｒ，Ｅ．ら、ＣｅｌｌＳｔｅｍＣｅｌｌ．２３巻：１６０〜１６１頁（２０１８年）；Ｌｉ，Ｙ．ら、ＣｅｌｌＳｔｅｍＣｅｌｌ．２３巻：１８１〜１９２頁（２０１８年）；Ｌｉｎ，Ｃ．ら、Ｂｉｏｃｈｉｍ．Ｂｉｏｐｈｙｓ．Ａｃｔａ．Ｒｅｖ．Ｃａｎｃｅｒ．１８６９巻：２００〜２１５頁（２０１８年）；Ｈｕ，Ｙ．ら、Ａｃｔａ．Ｐｈａｒｍａｃｏｌ．Ｓｉｎ．３９巻：１６７〜１７６頁（２０１８年）；Ｆａｎｇ，Ｆ．ら、Ｓｅｍｉｎ．Ｉｍｍｕｎｏｌ．３１巻：３７〜５４頁（２０１７年）；Ｇｌｉｅｎｋｅ，Ｗ．ら、ＦｒｏｎｔＰｈａｒｍａｃｏｌ．６巻：２１頁（２０１５年）参照）。

表２は、例示的な細胞標的、および細胞標的に結合するｓｃＦｖ／結合タンパク質を示す。そのようなｓｃＦｖ／結合タンパク質またはその部分は、ＣＡＲ構築体中に組み込むことができる。

本明細書中で用いられる「相同組換え修復」（ＨＤＲ）は、細胞内で起こるＤＮＡ修復、例えばｇＤＮＡ内のＤＳＢの修復を指す。ＨＤＲは、ヌクレオチド配列相同性を必要としており、ドナーまたは鋳型ポリヌクレオチドを用いて、（例えば、ＤＮＡ標的配列内に）ＤＳＢが存在した配列を修復する。ドナーポリヌクレオチドは、通常、ドナーポリヌクレオチドが修復に適した鋳型として機能することができるような、ＤＳＢに隣接する配列との配列相同性を必要とする。ＨＤＲは、例えば、ドナーポリヌクレオチドからＤＮＡ標的配列への遺伝情報の移行をもたらす。ＨＤＲは、ドナーポリヌクレオチド配列がＤＮＡ標的配列と異なるならば、そしてドナーポリヌクレオチドの一部または全てを、ＤＮＡ標的配列中に組み込むならば、ＤＮＡ標的配列の改変（例えば、挿入、欠失、または突然変異）をもたらし得る。一部の実施形態において、ドナーポリヌクレオチド全体、一部のドナーポリヌクレオチド、またはドナーポリヌクレオチドのコピーを、ＤＮＡ標的配列の部位に組み込む。例えば、ドナーポリヌクレオチドを、ＤＮＡ標的配列内の切断の修復に用いることができ、修復は、ＤＮＡ内の切断部位での、または当該切断の近くでの、ドナーポリヌクレオチドからの遺伝情報の移行をもたらす。したがって、新しい遺伝情報を、ＤＮＡ標的配列にて挿入またはコピーすることができる。

「ゲノム領域」は、核酸標的配列部位のいずれかの側部に存在する、または代わりに、一部の核酸標的配列部位も含む、宿主細胞のゲノム内の染色体のセグメントである。ドナーポリヌクレオチドの相同アームは、対応するゲノム領域との相同組換えを経験するのに十分な相同性を有する。一部の実施形態において、ドナーポリヌクレオチドの相同アームは、核酸標的配列部位に直ぐ隣接するゲノム領域に対して著しい配列相同性を共有する；相同アームを、核酸標的配列部位からより遠くのゲノム領域に対して十分な相同性を有するように設計することができることが認識されている。

本明細書中で用いられる「非相同末端結合」（ＮＨＥＪ）は、ドナーポリヌクレオチドの必要条件なしでの、切断の一方の末端の、切断の他方の末端への直接のライゲーションによる、ＤＮＡ内のＤＳＢの修復を指す。ＮＨＥＪは、修復鋳型を用いずにＤＮＡを修復するための、細胞に利用可能なＤＮＡ修復経路である。ＮＨＥＪは、ドナーポリヌクレオチドの非存在下で、多くの場合、ＤＳＢの部位にてランダムに挿入または欠失されることとなるヌクレオチドをもたらす。

「ミクロ相同媒介末端結合」（ＭＭＥＪ）は、ｇＤＮＡ内のＤＳＢを修復する経路である。ＭＭＥＪは、ＤＳＢに隣接する欠失、および結合前の切断部位に対して内部でのミクロ相同配列のアラインメントを包含する。ＭＭＥＪは、遺伝的に定義され、かつ、例えば、ＣｔＩＰ、ポリ（ＡＤＰリボース）ポリメラーゼ１（ＰＡＲＰ１）、ＤＮＡポリメラーゼシータ（Ｐｏｌθ）、ＤＮＡリガーゼ１（Ｌｉｇ１）、またはＤＮＡリガーゼ３（Ｌｉｇ３）の活性を必要とする。更なる遺伝的構成要素が、当該技術において知られている（例えば、Ｓｆｅｉｒ，Ａ．ら、ＴｒｅｎｄｓｉｎＢｉｏｃｈｅｍｉｃａｌＳｃｉｅｎｃｅｓ４０巻：７０１〜７１４頁（２０１５年）参照）。

本明細書中で用いられる「ＤＮＡ修復」は、細胞の機構が、細胞内に含有されるＤＮＡ分子への損傷を修復するあらゆるプロセスを包含する。修復される損傷は、一本鎖切断またはＤＳＢを含み得る。ＤＳＢを修復する少なくとも３つの機構：ＨＤＲ、ＮＨＥＪ、およびＭＭＥＪが存在する。また、「ＤＮＡ修復」は、本明細書中で、標的遺伝子座が、例えば、ヌクレオチドを挿入し、欠失させ、または置換する（全て、ゲノム編集の形態を表す）ことによって改変される、ヒトまたは機械操作に由来するＤＮＡ修復を指すのに用いられる。

本明細書中で用いられる「組換え」は、２つのポリヌクレオチド間での遺伝情報の交換プロセスを指す。

本明細書中で用いられる用語「調節配列」、「調節要素」、および「制御要素」は、互換可能であり、発現されることとなるポリヌクレオチド標的の上流（５’非コード配列）、内部、または下流（３’非翻訳配列）にあるポリヌクレオチド配列を指す。調節配列は、例えば、転写のタイミング；転写の量もしくはレベル；ＲＮＡプロセシングもしくは安定性；および／または関連する構造ヌクレオチド配列の翻訳に影響する。調節配列として、アクチベーター結合配列、エンハンサー、イントロン、ポリアデニル化認識配列、プロモーター、転写開始部位、リプレッサー結合配列、ステム−ループ構造、翻訳開始配列、内部リボソーム侵入部位（ＩＲＥＳ）、翻訳リーダー配列、転写終結配列（例えば、ポリアデニル化シグナルおよびポリＵ配列）、翻訳終結配列、およびプライマー結合部位等を挙げることができる。

調節要素として、多くの宿主細胞型において、ヌクレオチド配列の構成的な、誘導性の、かつ抑制可能な発現を導くもの、および特定の宿主細胞のみにおいてヌクレオチド配列の発現を導くもの（例えば、組織特異的調節配列）が挙げられる。一部の実施形態において、ベクターは、１つもしくはそれ以上のｐｏｌＩＩＩプロモーター、１つもしくはそれ以上のｐｏｌＩＩプロモーター、１つもしくはそれ以上のｐｏｌＩプロモーター、またはそれらの組合せを含む。ｐｏｌＩＩＩプロモーターの例として、以下に限定されないが、Ｕ６およびＨ１プロモーターが挙げられる。ｐｏｌＩＩプロモーターの例として、以下に限定されないが、レトロウイルスのラウス肉腫ウイルス（ＲＳＶ）ＬＴＲプロモーター（場合により、ＲＳＶエンハンサーを有する）、サイトメガロウイルス（ＣＭＶ）プロモーター（場合により、ＣＭＶエンハンサーを有する；例えば、Ｂｏｓｈａｒｔ，Ｍ．ら、Ｃｅｌｌ４１巻：５２１〜５３０頁（１９８５年）参照）、ＳＶ４０プロモーター、ジヒドロ葉酸レダクターゼプロモーター、β−アクチンプロモーター、ホスホグリセロールキナーゼ（ＰＧＫ）プロモーター、およびＥＦ１αプロモーター、ならびに操作された人工プロモーター（例えば、ＭＮＤプロモーターおよびCＡＧプロモーター）が挙げられる。発現ベクターの設計は、形質転換されることとなる宿主細胞の選択、所望される発現レベル等の要因によって決まり得ることが、当業者によって理解されるであろう。ベクターが、宿主細胞中に導入されることによって、本明細書中に記載されるような、核酸配列によってコードされる融合タンパク質またはペプチドが挙げられる、ＲＮＡ転写産物、タンパク質、またはペプチドを生成することができる。

本明細書中で用いられる「遺伝子」は、エクソンおよび関連する調節配列を含むポリヌクレオチド配列を指す。遺伝子はさらに、イントロンおよび／または非翻訳領域（ＵＴＲ）を含んでもよい。

本明細書中で用いられる用語「作動可能に連結された」は、互いと機能的に関係するように配置されたポリヌクレオチド配列またはアミノ酸配列を指す。例えば、調節配列（例えば、プロモーターまたはエンハンサー）が、ポリヌクレオチドの転写を調節する、または当該転写の調節に寄与するならば、調節配列は、遺伝子産物をコードするポリヌクレオチドに「作動可能に連結され」ている。作動可能に連結された調節要素は、典型的に、コード配列と連続している。しかしながら、最大数キロベースまたはそれ以上プロモーターから離れていても、エンハンサーは機能することができる。加えて、マルチシストロン性構築体は、２Ａ自己切断ペプチド、ＩＲＥＳ要素等を含むことによって、１つのプロモーターのみを用いるマルチコード配列を含むことができる。したがって、一部の調節要素は、ポリヌクレオチド配列に作動可能に連結されているが、ポリヌクレオチド配列と連続していなくてもよい。同様に、翻訳調節要素が、ポリヌクレオチドからのタンパク質発現の調節に寄与する。

本明細書中で用いられる「発現」は、例えば、メッセンジャーＲＮＡ（ｍＲＮＡ）または他のＲＮＡ転写産物（例えば、非コード、例えば、構造または足場ＲＮＡ）をもたらす、ＤＮＡ鋳型からのポリヌクレオチドの転写を指す。当該用語はさらに、転写されたｍＲＮＡが、ペプチド、ポリペプチド、またはタンパク質に翻訳されるプロセスを指す。転写産物およびコードされたポリペプチドは、まとめて「遺伝子産物」と呼ぶことができる。ポリヌクレオチドがｇＤＮＡに由来するならば、発現は、真核細胞において、ｍＲＮＡをスプライシングすることを含み得る。

「コード配列」、または選択されたポリペプチドを「コードする」配列は、適切な調節配列の制御下に配置された場合、インビトロまたはインビボで転写され（ＤＮＡの場合）、かつポリペプチドに翻訳される（ｍＲＮＡの場合）核酸分子である。コード配列の境界は、５’末端の開始コドン、および３’末端の翻訳終止コドンによって決定される。

本明細書中で用いられる「人工転写アクチベーター（ＡＴＡ）」または「人工転写因子（ＡＴＦ）」が意味するのは、それが会合した遺伝子にＲＮＡポリメラーゼＩＩホロ酵素を動員し、それによって注目する遺伝子の異所性発現を引き起こすことができる複合体である。そのようなアクチベーターは、少なくとも２つの構成要素を含む：（１）コグネイトヌクレオチド配列を直接認識して、当該配列に結合することができる、触媒的に不活性なポリヌクレオチド結合ドメイン、または結合のためのそのような配列にガイドされるポリヌクレオチド結合ドメイン（例えば、核酸結合ドメイン、および本明細書中に記載されるガイドを含む核タンパク質複合体）；ならびに（２）転写機構を構成する種々のタンパク質と相互作用して転写を上方制御する活性化ドメイン（「エフェクタードメイン」とも呼ばれる）。

「触媒的に不活性なポリヌクレオチド結合ドメイン」が意味するのは、結合ドメインによって結合される核酸標的部位に結合するがこれを切断しない分子である。そのようなドメインの代表的な例が、本明細書中で詳述される。

本明細書中で用いられる用語「調節する」は、機能の数、程度、または量の変化を指す。例えば、本明細書中で開示されるＩ型ＣＲＩＳＰＲ核タンパク質複合体は、プロモーターまたは転写開始部位もしくはレギュレータ部位にて、またはそれらの近くで、核酸標的配列に結合することによって、プロモーター配列の活性を調節し得る。結合後に起こる作用に応じて、Ｉ型ＣＲＩＳＰＲ核タンパク質複合体は、プロモーター配列に作動可能に連結された遺伝子の転写を誘導、増強、抑制、または阻害することができる。ゆえに、遺伝子発現の「調節」は、遺伝子活性化および遺伝子抑制の双方を含む。

調節は、標的遺伝子の発現によって直接的または間接的に影響されるあらゆる特徴を判定することによってアッセイすることができる。そのような特徴の例として、ＲＮＡもしくはタンパク質レベル、タンパク質活性、生成物レベル、遺伝子の発現、またはリポータ遺伝子の活性レベルの変化が挙げられる。したがって、用語、遺伝子の「発現の調節」、「発現の阻害」、および「発現の活性化」は、遺伝子の転写を変化させ、活性化させ、または阻害する、Ｉ型ＣＲＩＳＰＲ核タンパク質複合体の能力を指し得る。

機能（例えば、酵素機能）を、上方調節する（例えば、機能を増大させる、強化する、増幅させる、または増強する）、または下方調節する（例えば、機能を低下させる、弱める、減弱させる、または小さくする）ことができる。一実施形態において、ｍＣａｓ３タンパク質の、一本鎖ＤＮＡ（ｓｓＤＮＡ）への結合、またはｍＣａｓ３タンパク質によるＡＴＰ結合／加水分解は、対応するｗｔＣａｓ３タンパク質と比較して、上方調節することも下方調節することもできる。

本明細書中で用いられる「ベクター」および「プラスミド」は、遺伝的材料を細胞中に導入するためのポリヌクレオチドビヒクルを指す。ベクターは、直鎖状であっても環状であってもよい。ベクターは、適切な宿主細胞内でベクターの複製をもたらすことができる複製配列（例えば、複製起点）を含有し得る。適切な宿主の形質転換の直ぐ後に、ベクターは複製して、宿主ゲノムから独立して機能し、または宿主ゲノム中に統合することができる。ベクター設計は、とりわけ、意図される使用、およびベクター用の宿主細胞によって決まり、そして特定の使用のための本発明のベクターの設計、および宿主細胞は、当該技術のレベルの範囲内である。ベクターの４つの主要なタイプは、プラスミド、ウイルスベクター、コスミド、および人工染色体である。典型的には、ベクターは、複製起点、マルチクローニング部位、および／または選択マーカーを含む。発現ベクターは、典型的に、発現カセットを含む。「組換えウイルス」が意味するのは、例えば、異種核酸構築体の、ウイルスゲノムまたはその部分中への追加または挿入によって、遺伝的に改変されたウイルスである。

本明細書中で用いられる「発現カセット」は、組換え方法を用いて、または合成手段によって生成され、そして選択されたポリヌクレオチドに作動可能に連結されて、選択されたポリヌクレオチドの発現を宿主細胞内で促進する調節配列を含むポリヌクレオチド構築体を指す。例えば、調節配列は、選択されたポリヌクレオチドの転写を宿主細胞内で、または選択されたポリヌクレオチドの転写および翻訳を宿主細胞内で促進することができる。発現カセットは、例えば、宿主細胞のゲノム内に統合することもできるし、ベクター内に存在して発現ベクターを形成することもできる。

本明細書中で用いられる「標的化ベクター」は、ｇＤＮＡに相同である、調整されたＤＮＡアーム（標的遺伝子または核酸標的配列の要素（例えば、ＤＳＢ）に隣接する）を典型的に含む組換えＤＮＡ構築体である。標的化ベクターは、ドナーポリヌクレオチドを含む。標的遺伝子の要素を、欠失および／または挿入が挙げられるいくつかの方法で改変することができる。欠陥のある標的遺伝子を、機能的標的遺伝子によって置換することができ、または択一的に、機能遺伝子をノックアウトすることができる。場合により、標的化ベクターのドナーポリヌクレオチドは、標的遺伝子中に導入される選択マーカーを含む選択カセットを含む。標的遺伝子に隣接する、または標的遺伝子内の領域（核酸標的配列を含む）の標的化を用いて、遺伝子発現の調節に影響を与えることができる。

本明細書中で用いられる用語「〜」は、所定の範囲において末端の値を含める（例えば、１〜５０ヌクレオチド長は、１ヌクレオチドおよび５０ヌクレオチドを含む；５アミノ酸〜５０アミノ酸長は、５アミノ酸および５０アミノ酸を含む）。

本明細書中で用いられる用語「アミノ酸」（ａａ）は、アミノ酸類似体、修飾アミノ酸、ペプチド模倣体、グリシン、およびＤまたはＬ光学異性体が挙げられる、天然の、そして合成の（非天然の）アミノ酸を指す。

本明細書中で用いられる用語「ペプチド」、「ポリペプチド」、「タンパク質」、および「サブユニットタンパク質」は、互換可能であり、アミノ酸のポリマーを指す。ポリペプチドは、あらゆる長さのものであってよい。ポリペプチドは、分枝状であっても直鎖状であってもよく、非アミノ酸によって中断されていてもよく、そして修飾アミノ酸を含んでもよい。また、当該用語は、例えば、アセチル化、ジスルフィド結合形成、グリコシル化、脂質化、リン酸化、ペグ化、ビオチン化、架橋結合、および／または（例えば、標識構成要素またはリガンドとの）コンジュゲーションを介して修飾されたアミノ酸ポリマーを指す。ポリペプチド配列は、特に明記しない限り、本明細書中で、従来のＮ末端からＣ末端の向きに示される。

ポリペプチドおよびポリヌクレオチドは、分子生物学の分野においてルーチンの技術を用いて製造することができる（例えば、先で一覧にした標準テキスト参照）。さらに、本質的にあらゆるポリペプチドまたはポリヌクレオチドが、市販の源から入手可能である。

本明細書中で用いられる用語「融合タンパク質」および「キメラタンパク質」は、天然では単一のタンパク質内に一緒に存在しない２つまたはそれ以上のタンパク質、タンパク質ドメイン、タンパク質フラグメント、または環状配置ポリペプチドを結合することによって作出された単一のタンパク質を指す。一部の実施形態において、リンカーポリヌクレオチドは、第１のタンパク質、タンパク質ドメイン、タンパク質フラグメント、または環状配置ポリペプチドを、第２のタンパク質、タンパク質ドメイン、タンパク質フラグメント、または環状配置ポリペプチドに連結するのに用いることができる。例えば、融合タンパク質は、Ｉ型ＣＲＩＳＰＲ−Ｃａｓタンパク質（例えば、Ｃａｓ８、Ｃａｓ３）、および別のタンパク質由来の機能ドメイン（例えば、ＦｏｋＩ；例えば、米国特許第９，８８５，０２６号明細書参照）を含んでもよい。そのようなドメインを融合タンパク質内に含むような改変は、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓタンパク質に、付加的な活性を付与することができる。そのような活性として、ヌクレアーゼ活性、メチルトランスフェラーゼ活性、デメチラーゼ活性、ＤＮＡ修復活性、ＤＮＡ損傷活性、脱アミノ活性、ジスムターゼ活性、アルキル化活性、脱プリン化活性、酸化活性、ピリミジンダイマー形成活性、インテグラーゼ活性、トランスポザーゼ活性、リコンビナーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、フォトリアーゼ活性、グリコシラーゼ活性、アセチルトランスフェラーゼ活性、デアセチラーゼ活性、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、ＳＵＭＯ化活性、脱ＳＵＭＯ化活性、リボシル化活性、脱リボース化活性、および／またはミリストイル化活性もしくは脱ミリストイル化活性（核酸標的配列と会合したポリペプチド（例えば、ヒストン）を修飾する）を挙げることができる。

一部の実施形態において、融合タンパク質は、エピトープタグ（例えば、ヒスチジンタグ、ＨＡタグ、ＦＬＡＧ（登録商標）（ＳｉｇｍａＡｌｄｒｉｃｈ、Ｓｔ．Ｌｏｕｉｓ、ＭＯ）タグ、Ｍｙｃタグ、核局在化シグナル（ＮＬＳ）タグ、ＳｕｎＴａｇ）、リポータタンパク質配列（例えば、グルタチオン−Ｓ−トランスフェラーゼ、ベータ−ガラクトシダーゼ、ルシフェラーゼ、緑色蛍光タンパク質、シアン蛍光タンパク質、黄色蛍光タンパク質）、および／または核酸配列結合ドメイン（例えば、ＤＮＡ結合ドメインまたはＲＮＡ結合ドメイン）を含んでもよい。

また、融合タンパク質は、アクチベータードメイン（例えば、ヒートショック転写因子、ＮＦＫＢアクチベーター）またはリプレッサードメイン（例えば、ＫＲＡＢドメイン）を含んでもよい。Ｌｕｐｏ，Ａ．ら、ＣｕｒｒｅｎｔＧｅｎｏｍｉｃｓ１４巻：２６８〜２７８頁（２０１３年）によって記載されるように、ＫＲＡＢドメインは、強力な転写抑制モジュールであり、ほとんどのＣ２Ｈ２ジンクフィンガータンパク質のアミノ末端配列内に位置する（例えば、Ｍａｒｇｏｌｉｎ，Ｊ．ら、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ９１巻：４５０９〜４５１３頁（１９９４年）；Ｗｉｔｚｇａｌｌ，Ｒ．ら、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ９１巻：４５１４〜４５１８頁（１９９４年）参照）。ＫＲＡＢドメインは、典型的に、タンパク質−タンパク質相互作用を介して、コリプレッサータンパク質および／または転写因子に結合して、ＫＲＡＢジンクフィンガータンパク質（ＫＲＡＢ−ＺＦＰ）が結合する遺伝子の転写抑制を引き起こす（例えば、Ｆｒｉｅｄｍａｎ，Ｊ．Ｒ．ら、Ｇｅｎｅｓ＆Ｄｅｖｅｌｏｐｍｅｎｔ１０巻：２０６７〜２６７８頁（１９９６年）参照）。一部の実施形態において、リンカー核酸配列は、２つまたはそれ以上のタンパク質、タンパク質ドメイン、またはタンパク質フラグメントを結合するのに用いられる。

本明細書中で用いられる「ＣＡＳＣＡＤＥａ」（カスケード活性化）は、ＣＲＩＳＰＲ方法または系であり、当該方法または系は、カスケードＲＮＰ複合体の標的核酸配列の遺伝子座に付随する遺伝子の発現を活性化する。一部の実施形態において、カスケード複合体の１つまたはそれ以上のタンパク質が、エフェクタードメイン（例えば、ＶＰ１６またはＶＰ６４）に融合され、そして融合体およびガイドポリヌクレオチドを含むカスケードＲＮＰ複合体が、内因性転写因子の動員に用いられる。一部の実施形態において、ガイドポリヌクレオチドは、５’または３’が、転写因子を動員もするＭＳ２結合ＲＮＡ等のヌクレオチドエフェクタードメインに融合し得る。

本明細書中で用いられる「ＣＡＳＣＡＤＥｉ」（カスケード阻害）は、ＣＲＩＳＰＲ方法または系であり、当該ＣＲＩＳＰＲ方法または系は、カスケードＲＮＰ複合体の標的核酸配列の遺伝子座に付随する遺伝子の発現を下方制御する（すなわち、カスケードＲＮＰ複合体は、遺伝子の発現を下方制御するのに用いられる）。内因性抑制因子の動員について、カスケード複合体内の１つまたはそれ以上のタンパク質が、典型的に、エフェクタードメイン（例えば、ＫＲＡＢ）に融合される。一部の実施形態において、ガイドポリヌクレオチドは、５’または３’が、内因性転写抑制エフェクタータンパク質を動員もするヌクレオチドエフェクタードメインに融合し得る。

本明細書中で用いられる「部分」は、一部の分子を指す。部分は、官能基であり得、または複数の官能基を有する一部の分子（例えば、共通の構造的態様を共有する）を説明し得る。用語「部分」および「官能基」は、典型的に、本明細書中で互換的に用いられる；しかしながら、「官能基」は、より詳細には、いくつかの共通の化学的挙動を含む一部の分子を指し得る。「部分」は、多くの場合、構造の説明として用いられる。一部の実施形態において、５’末端、３’末端、または５’末端および３’末端（例えば、第１のステム要素内の非天然の５’末端および／または非天然の３’末端）が、１つまたはそれ以上の部分を含み得る。

本明細書中で用いられる「養子細胞」は、細胞療法処置に使用するために、例えば、癌を処置し、かつ／または移植片対宿主病（ＧｖＨＤ）および細胞療法の他の不所望の副作用（例えば、以下に限定されないが、サイトカインストーム、投与された遺伝的に改変された材料の発癌性形質転換、神経学的障害等）を予防するために遺伝的に改変することができる細胞を指す。養子細胞として、以下に限定されないが、幹細胞、人工多能性幹細胞（ｉＰＳＣ）、臍帯血幹細胞、リンパ球、マクロファージ、赤血球、線維芽細胞、内皮細胞、上皮細胞、および膵臓前駆体細胞が挙げられる。

本明細書中で用いられる「細胞療法」は、遺伝的に改変された細胞を利用する、疾患または障害の処置を指す。遺伝的改変は、本明細書中に記載される方法、例えば、ウイルスベクター、ヌクレオフェクション、遺伝子ガン送達、ソノポレーション、細胞スクイージング、リポフェクション、または他の化学物質、細胞透過ペプチド等の使用を含む方法を用いて導入することができる。

本明細書中で用いられる「養子細胞療法（ＡＣＴ）」は、特定の患者に戻される、当該患者由来の（自己由来細胞療法）、または当該患者を処置するための、第三者のドナー由来の（同種細胞療法）、遺伝的に改変された養子細胞を用いる療法を指す。ＡＣＴとして、以下に限定されないが、骨髄移植、幹細胞移植、Ｔ細胞療法、ＣＡＲ−Ｔ細胞療法、およびナチュラルキラー（ＮＫ）細胞療法が挙げられる。

本明細書中で用いられる「リンパ球」は、脊椎動物の免疫系の一部である白血球を指す。また、用語「リンパ球」によって包含されるのは、リンパ系細胞を生じさせる造血幹細胞または人工多能性幹細胞（ｉＰＳＣ）である。リンパ球として、細胞媒介性の、細胞障害性適応免疫用のＴ細胞、例えばＣＤ４＋および／またはＣＤ８＋細胞障害性Ｔ細胞；アルファ／ベータＴ細胞およびガンマ／デルタＴ細胞；制御性Ｔ細胞、例えばＴｒｅｇ細胞；細胞媒介性の、細胞障害性先天性免疫において機能するＮＫ細胞；体液の、抗体駆動適応免疫用のＢ細胞；ＮＫ／Ｔ細胞；サイトカイン誘導キラー細胞（ＣＩＫ細胞）；ならびに抗原提示細胞（ＡＰＣ）、例えば樹状細胞が挙げられる。リンパ球は、哺乳動物の細胞、例えばヒト（Ｈｏｍｏｓａｐｉｅｎｓ）細胞であってもよい。また、用語「リンパ球」は、ＴまたはＮＫ細胞表面上にキメラ抗原受容体（ＣＡＲ）を生成するように改変された、遺伝的に改変されたＴ細胞およびＮＫ細胞（ＣＡＲ−Ｔ細胞およびＣＡＲ−ＮＫ細胞）を包含する。当該ＣＡＲ−Ｔ細胞は、特定の可溶性の抗原を、または標的細胞表面、例えば腫瘍細胞表面上の、もしくは腫瘍微環境内の細胞上の抗原を認識する。

また、本明細書中で用いられる用語「リンパ球」によって包含されるのは、主要組織適合性複合体（ＭＨＣ）によって提示される標的細胞のタンパク質または（糖）脂質抗原を認識することができる、１つまたはそれ以上の特定の、天然に存在する、または操作されたＴ細胞受容体を発現するように遺伝子操作された、Ｔ細胞受容体操作Ｔ細胞（ＴＣＲ）である。これらの抗原の小さなピース、例えばペプチドまたは脂肪酸が、標的細胞表面に移されて、ＭＨＣの一部として、Ｔ細胞受容体に提示される。抗原がロードされたＭＨＣに結合したＴ細胞受容体が、リンパ球を活性化する。

リンパ球が、その細胞表面上の抗原特異的受容体を介してトリガされると、リンパ球の活性化が起こる。これにより、細胞は増殖して、特殊なエフェクターリンパ球に分化する。そのような「活性化された」リンパ球は、典型的に、リンパ球の表面上の一セットの受容体によって特徴付けられる。活性化されたＴ細胞についての表面マーカーとして、ＣＤ３、ＣＤ４、ＣＤ８、ＰＤ１、およびＩＬ２Ｒ等が挙げられる。活性化された細胞障害性リンパ球は、標的細胞の表面上のコグネイト受容体に結合した後に、標的細胞を死滅させることができる。

また、腫瘍浸潤リンパ球（ＴＩＬ）も、本明細書中で用いられる用語「リンパ球」によって包含される。ＴＩＬは、腫瘍内外の環境（「腫瘍微環境」）に侵入した免疫細胞である。ＴＩＬは、典型的に、腫瘍細胞および腫瘍微環境から単離されて、腫瘍抗原に対する高い反応性について、インビトロで選択される。ＴＩＬは、インビボで存在する寛容化の影響を克服する条件下でインビトロで増殖されてから、処置のために対象中に導入される。

Ｔ細胞は、典型的に、いくつかのサブタイプ、例えば「未感作Ｔ細胞」（Ｔｎ）、「幹細胞記憶Ｔ細胞」（Ｔｓｃｍ）、「セントラルメモリＴ細胞」（Ｔｃｍ）、「エフェクターメモリＴ細胞」（Ｔｅｍ）、「エフェクターＴ細胞」（Ｔｅｆｆ）、および「制御性Ｔ細胞」（Ｔｒｅｇ）が存在する。各々のＴ細胞サブセットが、一セットの細胞表面マーカーによって特徴付けられる。

本明細書中で用いられる用語「親和性タグ」は、典型的に、ある巨大分子の、別の巨大分子に対する結合親和性を増大させて、例えば、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓ核タンパク質複合体の形成を促進する１つまたはそれ以上の部分を指す。一部の実施形態において、親和性タグを用いて、あるＣａｓサブユニットタンパク質の、別のＣａｓサブユニットタンパク質に対する（例えば、第１のＣａｓ７タンパク質の、第２のＣａｓ７タンパク質に対する）結合親和性を増大させることができる。一部の実施形態において、親和性タグを用いて、１つまたはそれ以上のＣａｓサブユニットタンパク質の、コグネイトガイドポリヌクレオチドに対する結合親和性を増大させることができる。本発明の一部の実施形態は、１つまたはそれ以上の親和性タグを、Ｃａｓサブユニットタンパク質配列のＮ末端に、Ｃａｓサブユニットタンパク質配列のＣ末端に、Ｃａｓサブユニットタンパク質配列のＮ末端とＣ末端との間に位置決めされた位置に、またはそれらの組合せに、導入する。本発明の一部の実施形態において、１つまたはそれ以上のガイドポリヌクレオチドが、１つまたはそれ以上のＣａｓサブユニットタンパク質とのガイドポリヌクレオチドの結合親和性を増大させる親和性タグを含む。多種多様な親和性タグが、２０１４年１０月２３日公開の米国特許出願公開第２０１４−０３１５９８５号明細書に開示されている。リガンドおよびリガンド結合部分が、対形成された親和性タグである。

本明細書中で用いられる「架橋結合」は、あるポリマー鎖（例えば、ポリヌクレオチドまたはポリペプチド）を別のポリマー鎖に連結する結合である。そのような結合は、共有結合であってもイオン結合であってもよい。一部の実施形態において、ポリヌクレオチドを架橋結合することによって、あるポリヌクレオチドを別のポリヌクレオチドに結合してもよい。他の実施形態において、ポリヌクレオチドをポリペプチドに架橋結合してもよい。更なる実施形態において、ポリペプチドをポリペプチドに架橋結合してもよい。

本明細書中で用いられる用語「架橋結合部分」は、典型的に、２つの巨大分子間の架橋結合を実現するのに適した部分を指す。架橋結合部分は、親和性タグの別の例である。

本明細書中で用いられる「宿主細胞」は、通常、生体細胞を指す。細胞は、生物の基本的、構造的、機能的、かつ／または生物学的単位である。細胞は、１つまたはそれ以上の細胞を有するあらゆる生物に由来してよい。宿主細胞の例として、以下に限定されないが、原核細胞、真核細胞、細菌細胞、古細菌細胞、単細胞真核生物の細胞、真核生物の細胞、原生動物細胞、植物由来細胞、藻類細胞（例えば、ボツリオコッカス・ブラウニ（Ｂｏｔｒｙｏｃｏｃｃｕｓｂｒａｕｎｉｉ）、コナミドリムシ（Ｃｈｌａｍｙｄｏｍｏｎａｓｒｅｉｎｈａｒｄｔｉｉ）、ナンノクロロプシス・ガディタナ（Ｎａｎｎｏｃｈｌｏｒｏｐｓｉｓｇａｄｉｔａｎａ）、クロレラ（Ｃｈｌｏｒｅｌｌａｐｙｒｅｎｏｉｄｏｓａ）、ヤツマタモク（ＳａｒｇａｓｓｕｍｐａｔｅｎｓＣ．ａｇａｒｄｈ）等）、海草（例えば、ケルプ）、真菌細胞（例えば、酵母細胞またはキノコ由来細胞）、動物細胞、無脊椎動物（例えば、ミバエ、刺胞動物、棘皮動物、線虫等）由来細胞、哺乳動物（例えば、ブタ、乳牛、ヤギ、ヒツジ、齧歯類、ラット、マウス、非ヒト霊長類、ヒト等）が挙げられる脊椎動物由来細胞が挙げられる。さらに、宿主細胞は、幹細胞または前駆体細胞、および免疫細胞、例えば本明細書中に記載されるあらゆる免疫細胞であってよい。宿主細胞は、ヒト細胞であってよい。一部の実施形態において、ヒト細胞は、ヒトの体外にある。一部の実施形態において、生存生物の体（例えば、ヒトの体）の細胞が、エクスビボ（すなわち、生体の外側で）操作される。イクスビボは、多くの場合、臓器、細胞、または組織が、処置または手順用に生体（例えば、ヒトの体）から採られてから生体に戻される医療手順を指す。

本明細書中で用いられる「幹細胞」は、自己再生能力、すなわち、多数の細胞分裂サイクルを経験する一方、未分化状態を維持する能力を有する細胞を指す。幹細胞は、全能性、多能性、複能性、少能性、または単能性であり得る。幹細胞は、胚、胎児、羊膜、成人、または人工多能性幹細胞であり得る。

本明細書中で用いられる「人工多能性幹細胞」は、非多能性細胞、典型的には体細胞に人工的に由来する一種の多能性幹細胞を指す。一部の実施形態において、体細胞は、ヒト体細胞である。体細胞の例として、以下に限定されないが、真皮線維芽細胞、骨髄由来間葉細胞、心筋細胞、ケラチン生成細胞、肝細胞、胃細胞、神経幹細胞、肺細胞、腎細胞、脾細胞、および膵細胞が挙げられる。体細胞の更なる例として、免疫系の細胞が挙げられ、以下に限定されないが、Ｂ細胞、樹状細胞、顆粒球、先天性リンパ系細胞、巨核球、単球／マクロファージ、骨髄由来サプレッサ細胞、ナチュラルキラー（ＮＫ）細胞、Ｔ細胞、胸腺細胞、および造血幹細胞が挙げられる。

本明細書中で用いられる「造血幹細胞」は、造血細胞、例えばリンパ球に分化する能力を有する未分化細胞を指す。

本明細書中で用いられる「植物」は、植物全体、植物器官、植物組織、胚原質、種子、植物細胞、およびそれらの後代を指す。植物細胞として、以下に限定されないが、種子、懸濁培養体、胚、分裂組織領域、カルス組織、葉、根、シュート、配偶体、胞子体、花粉、および小胞子由来の細胞が挙げられる。植物部分として、分化または未分化組織が挙げられ、以下に限定されないが、根、幹、シュート、葉、花粉、種子、腫瘍組織、ならびに細胞および培養体（例えば、単細胞、プロトプラスト、胚、およびカルス組織）の種々の形態が挙げられる。植物組織は、植物体内にあっても、植物の器官、組織、または細胞培養体内にあってもよい。「植物器官」は、植物の形態学的かつ機能的に互いに異なる部分を構成する植物組織または一群の組織を指す。

用語「対象」、「個体」、または「患者」は、本明細書中で互換的に用いられており、脊索動物門のあらゆるメンバーを指し、以下に限定されないが、ヒトおよび他の霊長類が挙げられ、非ヒト霊長類、例えば、アカゲザル、チンパンジー、および他のサル、ならびに類人猿の種；農園動物、例えば、ウシ、ヒツジ、ブタ、ヤギ、およびウマ；家畜哺乳動物、例えば、イヌおよびネコ；ウサギ、マウス、ラット、およびモルモットが挙げられるラボ動物；家畜、野生、および狩猟鳥類、例えば、ニワトリ、シチメンチョウ、ならびに他の家禽鳥類、カモ、およびガチョウが挙げられる鳥類等が挙げられる。当該用語は、特定の年齢または性別を意味しない。ゆえに、当該用語は、成人、若者、および生まれたての個体、ならびに男性および女性を含む。一部の実施形態において、宿主細胞は、対象（例えば、リンパ球、幹細胞、前駆体細胞、または組織特異的細胞）に由来する。一部の実施形態において、対象は非ヒト対象である。一部の実施形態において、対象はヒト（Ｈ．ｓａｐｉｅｎｓ）対象である。

用語「有効な量」または「治療的に有効な量」の組成物または剤、例えば本明細書中で定められる遺伝子操作された養子細胞は、所望される応答をもたらすのに、例えば、同種養子細胞療法と関連する１つまたはそれ以上の有害な副作用を予防または除外するのに十分な量の組成物または剤を指す。そのような応答は、問題となっている特定の疾患によって決まることとなる。例えば、養子細胞療法を用いて癌が処置されることとなる患者において、所望される応答として、以下に限定されないが、ＧｖＨＤ、宿主対移植片拒絶、サイトカイン放出症候群（ＣＲＳ）、サイトカインストームの影響の処置または予防、および投与された遺伝的改変細胞の発癌性形質転換の低減が挙げられる。必要とされる正確な量は、対象の種、年齢、および全身状態、処置されることとなる症状の重症度、ならびに用いられる特定の改変リンパ球、投与モード等に応じて、対象毎に変動することとなる。個々のあらゆる症例において適した「有効な」量は、ルーチンの実験を用いて、当業者によって決定することができる。

特定の疾患、例えば癌の症状またはＧｖＨＤの「処置」、またはこれらを「処置する」は：（１）疾患を予防する、例えば、疾患の体質であり得るが、疾患の病徴をまだ経験も提示もしていない対象において、疾患の進行を予防し、もしくは疾患をより小さな強度で起こさせること；（２）疾患を阻害する、例えば、進行の速度を低減し、進行を抑制し、もしくは疾患の状態を取り消すこと；かつ／または（３）疾患の病徴を和らげる、例えば、対象によって経験される病徴の数を少なくすることを含む。

本明細書中で用いられる「遺伝子編集」または「ゲノム編集」が意味するのは、遺伝的改変、例えば、細胞ゲノム内の特定の部位でのヌクレオチド配列の、またはさらに単一の塩基の挿入、欠失、または置換をもたらす一種の遺伝子工学である。当該用語は、以下に限定されないが、本明細書中で定義される異種遺伝子発現、遺伝子またはプロモーターの挿入または欠失、核酸突然変異、および破壊的遺伝的改変を含む。

「エピトープ」が意味するのは、特定のＢ細胞およびＴ細胞が応答する分子上の部位である。エピトープは、エピトープにユニークな空間的高次構造内に３つまたはそれ以上のアミノ酸を含み得る。通常、エピトープは、少なくとも５個のそのようなアミノ酸からなり、より一般的には少なくとも８〜１０個のそのようなアミノ酸からなる。アミノ酸の空間的高次構造を判定する方法が、当該技術において知られており、例えば、Ｘ線結晶解析、電子顕微鏡検査、および二次元核磁気共鳴が挙げられる。さらに、所定のタンパク質内のエピトープの同定は、当該技術において周知の技術を用いて、例えば疎水性研究および部位特異的血清学を用いて、容易に達成される。

「ミモトープ」は、エピトープの構造を模倣する巨大分子、例えばペプチドである。この特性のため、ミモトープは、エピトープによって誘発されるものと類似の抗体応答を引き起こす。所定のエピトープ抗原に対する抗体が、そのエピトープを模倣するミモトープを認識することとなる。ミモトープは一般的に、バイオパニングを介したファージディスプレイライブラリから得られる。

「抗体」は、ポリペプチド内に存在する注目するエピトープを「認識する」、すなわち、これに特異的に結合する分子、例えばリガンド結合ドメインを意図する。「特異的に結合する」が意味するのは、抗体がエピトープと「ロックアンドキー」型の相互作用で相互作用して、抗原と抗体との間で複合体を形成することである。本明細書中で用いられる用語「抗体」は、モノクローナル調製品、および以下から得られる抗体を含む：ハイブリッド（キメラ）抗体分子；Ｆ（ａｂ’）２およびＦ（ａｂ）フラグメント；Ｆｖ分子（非共有結合性のヘテロダイマー；一本鎖Ｆｖ分子（ｓｃＦｖ）；二量体および三量体抗体フラグメント構築体；ミニボディ；ヒト化抗体分子；一本鎖抗体；Ｎａｎｏｂｏｄｙ（登録商標）（ＡｂｌｙｎｘＮ．Ｖ．、Ｚｗｉｊｎａａｒｄｅ、Ｂｅｌｇｉｕｍ）抗体；ならびにそのような分子から得られるあらゆる機能フラグメント（そのようなフラグメントは、親抗体分子の免疫学的結合特性を保持する）。当該抗体は、様々な種、例えば、ヒト、マウス、ラット、ウサギ、ラクダ、ニワトリ等から供給することができる。次に、さらに、抗体および抗体部分を、インビトロ技術、例えばファージディスプレイおよび酵母ディスプレイによって得ることができる。完全ヒト化抗体を、操作されたヒト化Ｂ細胞レパートリを有するヒト血漿、ヒトＢ細胞クローニング、マウス、ラット、ウサギ、ニワトリ等から得ることができる。次に、抗体をさらに、親和性成熟および他の方法、例えば非フコシル化またはＩｇＧＦｃ操作によって修飾することができる。

本明細書中で用いられる用語「モノクローナル抗体」は、均一な抗体集団を有する抗体組成物を指す。当該用語は、抗体の種に関しても源に関しても制限されないし、製造される様式によって制限されることが意図されることもない。当該用語は、親モノクローナル抗体分子の免疫学的結合特性を示す、免疫グロブリン全体、ならびにフラグメント、例えばＦａｂ、Ｆ（ａｂ’）₂、Ｆｖ、および他のフラグメント、ならびにキメラおよびヒト化均一抗体集団を包含する。

「抗体依存性細胞媒介性細胞障害（ＡＤＣＣ）」は、「抗体依存性細胞性細胞障害」とも呼ばれ、膜−表面リガンド結合ドメインが特異的抗体によって結合された場合に、免疫系のエフェクター細胞が、標的細胞、例えば養子細胞を能動的に溶解させる機構を指す。エフェクター細胞は、典型的に、ナチュラルキラー（ＮＫ）細胞である。しかしながら、マクロファージ、好中球、および好酸球が、ＡＤＣＣを媒介することもできる。ＡＤＣＣは、抗体、または免疫系の細胞の関与なしに膜に損傷を与えることによって標的を溶解もさせる相補体依存性細胞障害（ＣＤＣ）から独立している。

本明細書中で用いられる「形質転換」は、宿主細胞中への外因性ポリヌクレオチドの挿入を指し、挿入に用いられる方法に拘わらない。例えば、形質転換は、直接的吸収、形質移入、感染等によるものであってよい。外因性ポリヌクレオチドは、非統合ベクター、例えばエピソームとして維持してもよいし、代わりに宿主ゲノム中に組み込んでもよい。本明細書中で用いられる「トランスジェニック生物」は、無関係な生物由来のＤＮＡが人工的に導入された遺伝的材料を含有する生物を指す。当該用語は、トランスジェニック生物の後代（あらゆる世代）を含むが、後代が遺伝的改変を有する場合に限る。一部の実施形態において、トランスジェニック生物は、非ヒトトランスジェニック生物である。

本明細書中で用いられる「単離された」は、ヒトの介入によって、その天然の環境から離れて存在するため、自然の産物でない分子（例えば、ポリヌクレオチドまたはポリペプチド）を指し得る。ポリペプチドを指す場合、「単離された」は、示された分子が、生物全体から独立かつ分離しており、これにより分子が、同じ型の他の生体高分子の実質的非存在下で、自然界に見出され、または存在することを意味する。ポリヌクレオチドに関する用語「単離された」は、核酸分子であって、通常は自然界でこれに付随している配列の全てもしくは一部が全くない核酸分子；または自然界に存在する配列であるが、異種配列が付随している配列；または染色体に付随していない分子である。

本明細書中で用いられる用語「精製された」は、好ましくは、同じ分子の少なくとも７５重量％、より好ましくは少なくとも８５重量％、さらにより好ましくは少なくとも９５重量％、最も好ましくは少なくとも９８重量％が存在することを意味する。

本明細書中で用いられる「基質チャネル」は、最初にバルク環境中に拡散することのない、ある酵素反応から別の酵素反応への反応体の直接的移行を指す（例えば、Ｗｈｅｅｌｄｏｎ，Ｉ．ら、Ｎａｔ．Ｃｈｅｍ．８巻：２９９〜３０９頁（２０１６年）参照）。この酵素工程の中間生成物は、バルク溶液と平衡になく、これにより効率および収率は、酵素プロセスにおいて増大可能となる。天然に存在する代謝プロセス内の酵素は頻繁に、共局在化、および制御された凝集体へのアセンブリーの手段を進化させてきた。

本明細書中で用いられる「基質チャネル要素」は、代謝経路の構成要素を指す。一部の実施形態において、基質チャネル要素は、化学反応を触媒する酵素である。

本明細書中で用いられる「基質チャネル複合体」は、いくつかの手段を介して一緒に共局在化される複数の基質チャネル要素を指す。

本明細書中で用いられる「ＲＮＡ足場」は、ペプチドが結合用の基質として用いることができるＲＮＡ分子を指す。

本明細書中で示されるデータは、カスケード構成要素とヌクレアーゼドメイン（例えば、二量体化−依存性の、非特異的なＦｏｋＩヌクレアーゼドメイン；例えば、Ｕｒｎｏｖ，Ｆ．Ｄ．ら、ＮａｔｕｒｅＲｅｖｉｅｗｓＧｅｎｅｔｉｃｓ１１巻：６３６〜６４６頁（２０１０年）；Ｊｏｕｎｇ，Ｊ．Ｋ．ら、Ｎａｔ．Ｒｅｖ．Ｍｏｌ．ＣｅｌｌＢｉｏｌ．１４巻：４９〜５５頁（２０１３年）；Ｇｕｉｌｉｎｇｅｒ，Ｊ．Ｐ．ら、Ｎａｔ．Ｂｉｏｔｅｃｈｎｏｌ．３２巻：５７７〜５８２頁（２０１４年）；Ｔｓａｉ，Ｓ．Ｑ．ら、Ｎａｔ．Ｂｉｏｔｅｃｈｎｏｌ．３２巻：５６９〜５７６頁（２０１４年）参照）との間の融合が、ヒト細胞内でＩ型系による効率的なプログラマブルＲＮＡガイド遺伝子編集を媒介することを実証する。データは、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓ系（例えば、ＦｏｋＩ−カスケード構成要素融合体を含む）を、無傷のリボ核タンパク（ＲＮＰ）複合体として直接形質移入することができる、または個々のプラスミドコード構成要素の送達を介して細胞内でアセンブルすることができることを実証している。本明細書中で示される全てのＣＲＩＳＰＲ関連（Ｃａｓ）遺伝子は、単一のポリシストロン性ベクター上にアセンブルされて、単純化された２構成要素のＣａｓタンパク質−ガイドＲＮＡ発現系を生じた。また、ヌクレアーゼ（例えば、ＦｏｋＩ）／カスケード構成要素リンカー配列の長さ／組成設計、および適切なＤＮＡジオメトリの製剤形態、ならびに選択的カスケード相同体選択は、編集効率が最大約５０％である操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓ複合体を提供する。ＰＡＭ必要条件、およびＤＮＡ標的化中のミスマッチ感度に関係する、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓ系（例えば、ＦｏｋＩ−カスケード構成要素融合タンパク質を含む）の重要な特徴を判定した。

第１の態様において、本発明は、以下に限定されないが、カスケードサブユニットタンパク質およびカスケードガイドポリヌクレオチドが挙げられるカスケード構成要素をコードする操作されたポリヌクレオチドに関する。

一実施形態において、本発明は、カスケードＩ−Ｅ型系に由来するカスケード構成要素をコードする操作されたポリヌクレオチドに関する。カスケードタンパク質およびカスケードｃｒＲＮＡを含む例示的なポリヌクレオチド構築体が、実施例１に示される。実施例１、表１５、および配列番号１〜配列番号２０は、特に大腸菌（Ｅ．ｃｏｌｉ）株Ｋ−１２ＭＧ１６５５由来の、Ｉ−Ｅ型カスケードの５つのサブユニットタンパク質をコードする遺伝子のポリヌクレオチドＤＮＡ配列、および結果として生じるタンパク質構成要素のアミノ酸配列を示す。ポリヌクレオチド配列は、大腸菌（Ｅ．ｃｏｌｉ）ｇＤＮＡに由来し、そして大腸菌（Ｅ．ｃｏｌｉ）内での特異的発現用にコドン最適化し、かつ／または真核細胞（例えば、ヒト細胞）内での特異的発現用にコドン最適化した。このポリヌクレオチドが前駆体ｃｒＲＮＡに転写されて、カスケードＲＮＡエンドヌクレアーゼによってプロセシングされた場合、ゲノム内の相補的ＤＮＡ配列を標的化するようなガイドＲＮＡとして機能する成熟ｃｒＲＮＡが生成される。最小ＣＲＩＳＰＲアレイは、ｃｒＲＮＡのガイド部分を示す例示的なスペーサー配列に隣接する２つのリピート配列（実施例１において示されるＣＲＩＳＰＲアレイ配列内で下線が施されている）を含む。カスケードエンドヌクレアーゼによるＲＮＡプロセシングが、５’および３’末端の双方に、ガイド配列に隣接するリピート配列を有するｃｒＲＮＡを生成する。当業者であれば、本明細書および実施例の教示を鑑みて、（例えば、ｇＤＮＡ内の）選択された標的配列へのカスケード複合体の結合を標的化するのに適したスペーサー配列を選択することができる。

本明細書のガイダンスに従って、そして一例として、大腸菌（Ｅ．ｃｏｌｉ）株Ｋ−１２ＭＧ１６５５由来のカスケードサブユニット遺伝子の相同体の位置を決定するためにＢＬＡＳＴおよびＰＳＩ−ＢＬＡＳＴ等のバイオインフォマティクスツールを用いてから、カスケード遺伝子のフランキングゲノムの近傍を調査して、残留するカスケードサブユニットタンパク質の遺伝子の位置を決定し、かつ同定することで、更なる細菌または古細菌種由来のカスケード構成要素をコードするポリヌクレオチド配列を同定かつ設計することができる（例えば、実施例１４Ａ、実施例１４Ｂ、実施例１５Ａ、および実施例１５Ｂ参照）。カスケード遺伝子は、保存されたオペロンとして共起するので、典型的に、同じＩ型サブタイプ内に一貫した順序で配置されて、追跡調査の分析および実験用の同定および選択を促進する。一例として、Ｃａｓ８相同体の位置を決定して、相同カスケード試験用に見込みがある細菌種を同定してから、Ｃａｓ８、および相同ＣＲＩＳＰＲ−Ｃａｓ系由来のカスケードの他のタンパク質構成要素をコードするポリヌクレオチド配列を得、または設計することによって、更なるＩ−Ｅ型系を同定することができる。

いくつかの種由来のカスケードのサブユニットタンパク質をコードする遺伝子のポリヌクレオチドＤＮＡ配列（表３および表４で一覧にされる）（一部は、大腸菌（Ｅ．ｃｏｌｉ）株Ｋ−１２ＭＧ１６５５に由来するものと相同なカスケード複合体を有する）、および結果として生じるタンパク質構成要素のアミノ酸配列、ならびに例示的な最小ＣＲＩＳＰＲアレイが、配列番号２２〜配列番号２１３として表される（表３）。

タンパク質についてのポリヌクレオチド配列は、宿主細菌のｇＤＮＡに由来し、そして大腸菌（Ｅ．ｃｏｌｉ）内での特異的発現用にコドン最適化し、かつ／または真核細胞（例えば、ヒト細胞）内での特異的発現用にコドン最適化した。対応する最小ＣＲＩＳＰＲアレイをコードするポリヌクレオチドＤＮＡ配列は、１２の種に由来するリピート配列に基づいており、そしてガイドＲＮＡとして機能する成熟ｃｒＲＮＡを生成するのに用いることができる。表４において、最小ＣＲＩＳＰＲアレイは、ｃｒＲＮＡのガイド部分を示す例示的な「スペーサー」配列に隣接する２つのリピート配列（小文字、下線が施されている）を含む。エンドヌクレアーゼカスケードサブユニットによるＲＮＡプロセシングが、５’および３’末端の双方に、ガイド配列に隣接するリピート配列を有するｃｒＲＮＡを生成する。

別の実施形態において、本発明は、他のＩ型サブタイプ（以下に限定されないが、Ｉ−Ｂ型、Ｉ−Ｃ型、Ｉ−Ｆ型、およびＩ−Ｆ型のバリアントが挙げられ、これらは、本明細書のガイダンスに従って、そしてＢＬＡＳＴおよびＰＳＩ−ＢＬＡＳＴ等のバイオインフォマティクスツールを用いて、各サブタイプの特色となるホールマークシステムからカスケード遺伝子の相同体の位置を決定することによって、同定かつ設計することができる（例えば、非特許文献５；非特許文献６参照））内の、更なる細菌または古細菌種由来のカスケード構成要素をコードする操作されたポリヌクレオチド配列に関する。所望の相同体を同定した後に、カスケード遺伝子のフランキングゲノムの近傍を調査して、本明細書中で開示される、残留するカスケードサブユニットタンパク質の遺伝子の位置を決定しかつ同定することができる。一例として、Ｃａｓ８相同体の位置を決定すること、そして相同カスケード試験用に見込みがある細菌種を同定してから、Ｃａｓ８、Ｃａｓ５、および相同ＣＲＩＳＰＲ−Ｃａｓ系由来のカスケードの他のタンパク質構成要素をコードするポリヌクレオチド配列を得、または設計することによって、更なるＩ−Ｆ型系を同定することができる（そしてＣａｓ５相同体の位置を決定することによって、更なるＩ−Ｆ型バリアント２系を同定することができる）。

１２の更なる相同カスケード複合体由来のＩ−Ｂ型、Ｉ−Ｃ型、Ｉ−Ｆ型、およびＩ−Ｆ型バリアント２由来のカスケードの３つ、４つ、または５つのサブユニットタンパク質をコードする遺伝子のポリヌクレオチドＤＮＡ配列、および結果として生じるタンパク質構成要素のアミノ酸配列、ならびに例示的な最小ＣＲＩＳＰＲアレイが、配列番号２１４〜配列番号３５１として表される（表３）。サブユニットタンパク質についてのポリヌクレオチド配列は、宿主細菌のｇＤＮＡに由来し、そして大腸菌（Ｅ．ｃｏｌｉ）内での特異的発現用にコドン最適化し、かつ／または真核細胞（例えば、ヒト細胞）内での特異的発現用にコドン最適化した。対応する最小ＣＲＩＳＰＲアレイをコードするポリヌクレオチドＤＮＡ配列は、１２の種から由来するリピート配列に基づいており、そしてガイドＲＮＡとして機能する成熟ｃｒＲＮＡを生成するために用いることができる。表５において、最小ＣＲＩＳＰＲアレイは、ｃｒＲＮＡのガイド部分を示す例示的な「スペーサー」配列に隣接する２つのリピート配列（小文字、下線が施されている）を含む。エンドヌクレアーゼカスケードサブユニットによるＲＮＡプロセシングが、５’および３’末端の双方に、ガイド配列に隣接するリピート配列を有するｃｒＲＮＡを生成する。

実施例１９Ａ〜実施例１９Ｉおよび実施例２２Ａ〜実施例２２Ｃは、複数のカスケード複合体相同体の設計および試験を記載しており、これらは各々、各カスケード複合体についてのゲノム編集の効率を評価するために、Ｃａｓサブユニットタンパク質−ＦｏｋＩ融合タンパク質を含む。最も高い編集を、シュードモナス（Ｐｓｅｕｄｏｍｏｎａｓ）属種Ｓ−６−２由来のバリアントで観察した一方、他の相同体（すなわち、サルモネラ・エンテリカ（Ｓａｌｍｏｎｅｌｌａｅｎｔｅｒｉｃａ）、ゲオサーモバクター（Ｇｅｏｔｈｅｒｍｏｂａｃｔｅｒ）属種ＥＰＲ−Ｍ、メタノケッラ・アルボリザエ（Ｍｅｔｈａｎｏｃｅｌｌａａｒｖｏｒｙｚａｅ）ＭＲＥ５０、およびＳ．サーモフィルス（Ｓ．ｔｈｅｒｍｏｐｈｉｌｕｓ）（株ＮＤ０７））が、大腸菌（Ｅ．ｃｏｌｉ）とおおよそ等しい編集を示した。また、編集を、操作されたコレラ菌（Ｖｉｂｒｉｏｃｈｏｌｅｒａｅ）株Ｌ１５（Ｉ−Ｆ型）ＦｏｋＩ−カスケード複合体およびコレラ菌（Ｖｉｂｒｉｏｃｈｏｌｅｒａｅ）株ＨＥ４８（Ｉ−Ｆｖ２型）ＦｏｋＩ−カスケード複合体で観察した。一実施形態において、これらの異なる相同体の異なるＰＡＭ必要条件は、標的ポリヌクレオチド（例えば、細胞内のｇＤＮＡ）内の標的密度を増大させ得る。したがって、カスケード複合体相同体のこのコレクションは、標的ポリヌクレオチド（例えば、細胞内のｇＤＮＡ）内の核酸標的配列の選択におけるより大きなフレキシビリティを提供する。

第２の態様において、本発明は、改変カスケードサブユニットタンパク質に関する。改変に適したカスケードサブユニットタンパク質として、以下に限定されないが、本明細書中に記載される種のカスケードサブユニットタンパク質が挙げられる。

一実施形態において、本発明は、カスケードサブユニットタンパク質の操作された円順列置換（ｃｉｒｃｕｌａｒｐｅｒｍｕｔａｔｉｏｎ）に関する。カスケードサブユニットタンパク質のそのような円順列置換は、カスケードサブユニットタンパク質のアミノ酸の元の直鎖状配列の連結性が異なるが、三次元の形状が全体的に類似するタンパク質構造をもたらす（例えば、Ｂｌｉｖｅｎ，Ｓ．ら、ＰＬｏＳＣｏｍｐｕｔ．Ｂｉｏｌ．８巻：ｅ１００２４４５頁（２０１２年）参照）。カスケードサブユニットタンパク質の円順列置換は、いくつかの利点を有し得る。例えば、Ｃａｓ７サブユニットタンパク質の円順列置換は、Ｃａｓ７タンパク質の折畳みもカスケード複合体のアセンブリーも乱すことなく、更なるポリペプチド配列との連結について、融合タンパク質またはリンカー領域を形成するように位置を定められるように設計された新しいＮ末端および新しいＣ末端を作出することができる。Ｃａｓ７の円順列置換（円順列置換されたＣａｓ７、ｃｐＣａｓ７）の３つの例が、図３Ａおよび図３Ｂにおいて示されている。図３Ａおよび図３Ｂにおいて、タンパク質の３つの部分が示されている：天然のタンパク質のＮ末端部分（図３Ａ、垂直なストライプ、例えば、Ｃａｓ７タンパク質）、天然のタンパク質の中心部（図３Ａ、灰色の陰影が付いている）、および天然のタンパク質のＣ末端部分（図３Ａ、陰影が付いていない）。図３Ａは、円順列置換されたタンパク質（図３Ａ、ｃｐＣａｓ７）を生成するための、天然のタンパク質のＣ末端位置への、天然のタンパク質のＮ末端部分の再配置を示しており、ここで天然のタンパク質のＮ末端部分は、ｃｐＣａｓ７のＮ末端にあり、リンカーポリペプチド（図３Ａ、リンカー）によって天然のタンパク質の中心部分に連結されている。図３Ｂは、天然のタンパク質（図３Ｂ、ｃｐＣａｓ７）のＮ末端位置への、天然のタンパク質（図３Ｂ、Ｃａｓ７）のＣ末端部分の再配置を示しており、ここで天然のタンパク質のＣ末端部分は、ｃｐＣａｓ７のＮ末端にあり、リンカーポリペプチド（図３Ｂ、リンカー）によって天然のタンパク質の中心部分に連結されている。

実施例１０Ａ、実施例１０Ｂ、および実施例１０に示されるデータは、円順列置換されたＣａｓ７サブユニットタンパク質バリアントを含むカスケード複合体の精製により、円順列置換されたＩ−Ｅ型ＣＲＩＳＰＲ−Ｃａｓサブユニットタンパク質を、野生型タンパク質を含むカスケード複合体と（分子量に基づいて）本質的に同じ組成物を有するカスケード複合体を形成するのに首尾よく用いることができることが実証されることを示している。

別の実施形態において、本発明は、更なるポリペプチド配列に融合されて融合タンパク質を作製するカスケードサブユニットタンパク質、およびそのような融合タンパク質をコードするポリヌクレオチドに関する。更なるポリペプチド配列として、以下に限定されないが、タンパク質、タンパク質ドメイン、タンパク質フラグメント、および機能ドメインを挙げることができる。そのような更なるポリペプチド配列の例として、以下に限定されないが、転写アクチベーターまたはリプレッサードメイン、およびヌクレオチドデアミナーゼ（例えば、シチジンデアミナーゼまたはアデニンデアミナーゼ（例えば、Ｋｏｍｏｒら、Ｎａｔｕｒｅ５５３巻：４２０〜４２４頁（２０１６年）；Ｋｏｂｌａｎら、Ｎａｔ．Ｂｉｏｔｅｃｈｎｏｌ．ｄｏｉ：１０．１０３８／ｎｂｔ．４１７２（２０１８年５月２９日）に記載されている））に由来する配列が挙げられる。融合タンパク質についての更なる機能ドメインが、本明細書中で示されている。

更なるポリペプチド配列を、カスケードサブユニットタンパク質のいずれかに融合させてもよく、更なるポリペプチド配列は、カスケードサブユニットタンパク質のコード配列を含むポリヌクレオチドの５’または３’末端に典型的に添えられている更なるポリヌクレオチド配列によってコードされる。一部の実施形態において、アミノ酸リンカーをコードする更なるポリヌクレオチド配列が、カスケードサブユニットタンパク質を、注目する更なるポリペプチド配列に連結している。一部の実施形態において、融合タンパク質パートナについてのポリヌクレオチド配列、およびリンカー配列は、天然に存在するｇＤＮＡ配列に由来してもよいし、大腸菌（Ｅ．ｃｏｌｉ）内での細菌発現または哺乳動物細胞（例えば、ヒト細胞）内での真核生物発現用にコドン最適化してもよい。親和性タグ（例えば、Ｈｉｓ６、Ｓｔｒｅｐ−ｔａｇ（登録商標）ＩＩ（ＩＢＡＧＭＢＨＬＬＣ、Ｇｏｔｔｉｎｇｅｎ、Ｇｅｒｍａｎｙ））、核局在化シグナルまたは配列（ＮＬＳ）、マルトース結合タンパク質、およびＦｏｋＩを含む融合タンパク質の例が、実施例１に示されている。また、例示的なアミノ酸リンカー配列が、実施例１に開示されている。

実施例１１Ａは、カスケードサブユニットタンパク質−ＦｏｋＩ融合体、およびシチジンデアミナーゼ、エンドヌクレアーゼ、制限酵素、ヌクレアーゼ／ヘリカーゼ、またはそれらのドメインへのカスケードサブユニットタンパク質融合体を記載している。実施例１１Ｂは、他のカスケードサブユニットタンパク質とのカスケードサブユニットタンパク質融合体、ならびに他のカスケードサブユニット融合タンパク質および酵素タンパク質ドメインとのカスケードサブユニットタンパク質融合体（実施例１１Ｄ）を記載している。一部の実施形態において、Ｉ型ＣＲＩＳＰＲサブユニットタンパク質は、Ｎ末端、Ｃ末端、またはＮ末端とＣ末端との間の位置でのタンパク質融合を生成するのに用いることができる能力について、インシリコで評価することができる。一部の実施形態において、Ｉ型ＣＲＩＳＰＲサブユニットタンパク質が、１つまたはそれ以上のポリペプチドリンカーを用いて、Ｎ末端、Ｃ末端、またはＮ末端とＣ末端との間の位置の１つまたはそれ以上の融合ドメインに連結していてもよい。一部の実施形態において、カスケードサブユニットタンパク質が、一本鎖ＦｏｋＩに融合していてもよい（例えば、ＥｃｏＣａｓｃａｄｅＲＮＰ複合体への一本鎖ＦｏｋＩ融合体；ヌクレオチド配列、配列番号１９２６；タンパク質配列、配列番号１９２７）。例示的なポリペプチドリンカーが、実施例１、１１、１８、および１９に示されている。

図４Ａおよび図４Ｂは、更なるタンパク質配列（例えば、ＦｏｋＩ）に融合された、Ｃａｓ８サブユニットタンパク質を含むカスケード複合体を示す（図４Ａ、図４Ｂ、Ｃａｓ７、Ｃａｓ５、Ｃａｓ８、Ｃｓｅ２、Ｃａｓ６、Ｃａｓ６周りの破線のボックスは、ｃｒＲＮＡヘアピンとの相互作用を示す；ｃＲＮＡは、黒色の線として示されており、ヘアピンを含む；そして、Ｃａｓ８、「Ｃ」Ｃ末端、「Ｎ」Ｎ末端が示される）。図４Ａは、リンカーポリペプチド（図４Ａ、黒色の曲線）を用いてＣａｓ８サブユニットタンパク質のＣ末端と連結された更なるタンパク質配列（図４Ａ、ＦＰ）の例を示す。図４Ｂは、リンカーポリペプチド（図４Ｂ、黒色の曲線）を用いてＣａｓ８サブユニットタンパク質のＮ末端と連結された更なるタンパク質配列（図４Ｂ、ＦＰ）の例を示す。実施例１１Ａは、ＦｏｋＩヌクレアーゼドメインとＮ末端にて融合するＩ−Ｅ型Ｃａｓ８のインシリコ設計、クローニング、発現、および精製を記載している。

図５Ａおよび図５Ｂは、更なるタンパク質配列に融合したカスケードサブユニットタンパク質を含むカスケード複合体の更なる例を示す。図５Ａおよび図５Ｂにおいて、ｃＲＮＡは、黒色の線として示されており、ヘアピンを含み、そしてカスケード複合体のＣａｓタンパク質の相対位置が示されている（図５Ａ、図５Ｂ：Ｃａｓ７、Ｃａｓ５、Ｃａｓ８、Ｃｓｅ２、Ｃａｓ６；Ｃａｓ６周りの破線のボックスは、ｃｒＲＮＡヘアピンとの相互作用を示す）。図５Ａは、各々リンカーポリペプチド（図５Ａ、黒色の曲線）を介して６つのＣａｓ７サブユニットタンパク質に各々融合した検出可能部分（例えば、緑色蛍光タンパク質；図５Ａ、ＧＦＰ）の例を示す。そのようなカスケード複合体は、カスケード複合体と会合した複数の検出可能部分の存在の結果としての著しいシグナル増幅を提供することによる、核酸標的配列への複合体の結合の検出に有用であり得る。図５Ｂは、リンカーポリペプチド（図５Ｂ、黒色の曲線）を用いてＣａｓ６サブユニットタンパク質と連結された更なるタンパク質配列（図５Ｂ、ＦＰ）の例を示す。

大腸菌（Ｅ．ｃｏｌｉ）Ｉ−Ｅ型カスケードサブユニットタンパク質を含有する融合タンパク質の例として、以下が挙げられるが、これらに限定されない：同じサブユニット（例えば、Ｃｓｅ２＿リンカー＿Ｃｓｅ２）、円順列置換されたサブユニット（例えば、ｃｐＣａｓ７＿リンカー＿ｃｐＣａｓ７＿リンカー＿ｃｐＣａｓ７＿リンカー＿ｃｐＣａｓ７＿リンカー＿ｃｐＣａｓ７＿リンカー＿ｃｐＣａｓ７）、ヌクレアーゼに融合したＩ−Ｅ型カスケードタンパク質（例えば、ＦｏｋＩ＿リンカー＿Ｃａｓ８、Ｃａｓ３＿リンカー＿Ｃａｓ８、Ｃａｓ６＿リンカー＿ＦｏｋＩ、Ｓ１ヌクレアーゼ＿リンカー＿Ｃｓｅ２＿リンカー＿Ｃｓｅ２）、シチジンデアミナーゼに融合したＩ−Ｅ型カスケードタンパク質（例えば、Ｃａｓ８＿リンカー＿ＡＩＤ、Ｃｓｅ２＿リンカー＿Ｃｓｅ２＿リンカー＿ＡＰＯＢＥＣ３Ｇ）、および１つまたはそれ以上の他のＩ−Ｅ型カスケードタンパク質に融合したＩ−Ｅ型カスケードタンパク質（例えば、Ｃａｓ６＿リンカー＿ｃｐＣａｓ７＿リンカー＿ｃｐＣａｓ７＿リンカー＿ｃｐＣａｓ７＿リンカー＿ｃｐＣａｓ７＿リンカー＿ｃｐＣａｓ７＿リンカー＿ｃｐＣａｓ７、ｃｐＣａｓ７＿リンカー＿ｃｐＣａｓ７＿リンカー＿ｃｐＣａｓ７＿リンカー＿ｃｐＣａｓ７＿リンカー＿ｃｐＣａｓ７＿リンカー＿ｃｐＣａｓ７＿リンカー＿Ｃａｓ５、Ｃａｓ６＿リンカー＿ｃｐＣａｓ７＿リンカー＿ｃｐＣａｓ７＿リンカー＿ｃｐＣａｓ７＿リンカー＿ｃｐＣａｓ７＿リンカー＿ｃｐＣａｓ７＿リンカー＿ｃｐＣａｓ７＿リンカー＿Ｃａｓ５）。

図６Ａ、図６Ｂ、および図６Ｃは、ｃｐＣａｓ７を含有する操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体のイラストを示す。図６Ａ、図６Ｂ、および図６Ｃにおいて、「ｃｐＣａｓ７」は、円順列置換されたＣａｓ７タンパク質であり（図６Ａ、図６Ｂ、図６Ｃ：ｃｐＣａｓ７、Ｃａｓ５、Ｃａｓ８、Ｃｓｅ２、およびＣａｓ６；Ｃａｓ６周りの破線のボックスは、ｃｒＲＮＡヘアピンとの相互作用を示す；ｃＲＮＡは、黒色の線として示されており、ヘアピンを含む；ｃｐＣａｓ７について、陰影は、図３Ａにおいて示される円順列置換されたタンパク質に相当する）、そしてカスケード複合体のＣａｓタンパク質の相対位置が示されている。図６Ａは、６つの個々のｃｐＣａｓ７サブユニットタンパク質を含むカスケード複合体を示す（図６Ａ、ｃｐＣａｓ７）。図６Ｂは、６つの融合ｃｐＣａｓ７サブユニットタンパク質を含むカスケード複合体を示しており、ｃｐＣａｓ７サブユニットタンパク質（図６Ｂ、ｃｐＣａｓ７）のＣ末端は、リンカーポリペプチド（図６Ｂ、リンカーポリペプチドは、ｃｐＣａｓ７サブユニットタンパク質を連結する暗黒色の線として示されている）を用いて、隣接するｃｐＣａｓ７サブユニットタンパク質のＮ末端と連結されている。図６Ｃは、カスケード複合体が６つの融合ｃｐＣａｓ７サブユニットタンパク質（「骨格」）を含む実施形態を示しており、第１のｃｐＣａｓ７サブユニットタンパク質のＣ末端は、リンカーポリペプチド（図６Ｃ、リンカーポリペプチドは、ｃｐＣａｓ７サブユニットタンパク質を連結する暗黒色の線として示されている）を用いて、第２のｃｐＣａｓ７サブユニットタンパク質のＮ末端と連結されており、第２のｃｐＣａｓ７サブユニットタンパク質のＣ末端は、リンカーポリペプチド（図６Ｃ、ｃｐＣａｓ７とＦＰとを連結している黒色の直線）を用いて、異なるタンパク質配列（図６Ｃ、ＦＰ）（例えば、シチジンデアミナーゼ）のＮ末端と連結されており、そしてこのタンパク質コード配列のＣ末端は、リンカーポリペプチドを用いて、第３のｃｐＣａｓ７のＮ末端と連結されている。ｃｐＣａｓ７サブユニットタンパク質のそのような融合骨格の一利点は、更なるタンパク質配列が、骨格に沿う特定の位置にて導入されて、ガイドがカスケード複合体の結合を導く核酸標的配列の長さに沿う様々な位置への更なるタンパク質配列のアクセスをもたらすことができることである。

図７Ａおよび図７Ｂは、融合タンパク質を含む操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の更なる実施形態を示す。図７Ａおよび図７Ｂにおいて、カスケード複合体のＣａｓタンパク質の相対位置が示されている（図７Ａ、図７Ｂ：Ｃａｓ７、Ｃａｓ５、Ｃａｓ８、Ｃｓｅ２、およびＣａｓ６；Ｃａｓ６周りの破線のボックスは、ｃｒＲＮＡヘアピンとの相互作用を示す；ｃＲＮＡは、黒色の線として示されており、ヘアピンを含む）。図７Ａは、Ｃｓｅ２−Ｃｓｅ２融合タンパク質（図７Ａ、黒色の曲線によって連結されている２つのＣｓｅ２タンパク質）を含むカスケード複合体を示す。インシリコ設計、クローニング、発現、精製、および電気泳動運動能シフトアッセイが、実施例１１Ｂおよび実施例１１Ｃの、Ｃｓｅ２−Ｃｓｅ２融合タンパク質を含むカスケード複合体に記載されている。図７Ｂは、更なるタンパク質配列（図７Ｂ、ＦＰ）とリンカーポリペプチド（図７Ｂ、Ｃｓｅ２タンパク質をＦＰに連結している黒色の曲線）を介して連結されているＣｓｅ２−Ｃｓｅ２融合タンパク質を含むカスケード複合体を示す。実施例１１Ｄは、シチジンデアミナーゼに融合したＣｓｅ２−Ｃｓｅ２タンパク質のインシリコ設計、クローニング、発現、および精製を記載している。

一部の実施形態において、１つまたはそれ以上の核局在化シグナルを、カスケードタンパク質サブユニット（例えば、Ｃａｓ８−ＦｏｋＩ融合タンパク質、ｃｐＣａｓ７タンパク質、またはＣｓｅ２−Ｃｓｅ２融合タンパク質）の操作されたＮ末端またはＣ末端に加えることができる。

融合ポリペプチドの一部の実施形態において、リンカーポリペプチドは、２つまたはそれ以上のタンパク質コード配列を連結する。例示的なリンカーポリペプチドの長さが、実施例において記載されている。典型的には、リンカー長として、以下に限定されないが、約１０アミノ酸〜約４０アミノ酸、約１５アミノ酸〜約３０アミノ酸、約１７アミノ酸〜約２０アミノ酸が挙げられる。リンカーポリペプチドのアミノ酸組成は、典型的に、極性のある、小さな、かつ／または帯電しているアミノ酸（例えば、Ｇｌｙ、Ａｌａ、Ｌｅｕ、Ｖａｌ、Ｇｌｎ、Ｓｅｒ、Ｔｈｒ、Ｐｒｏ、Ｇｌｕ、Ａｓｐ、Ｌｙｓ、Ａｒｇ、Ｈｉｓ、Ａｓｎ、Ｃｙｓ、Ｔｙｒ）を含む。更なる実施形態において、リンカーポリペプチドは、メチオニンを含有しないように設計され、そして融合体は、クリプティック翻訳開始部位を回避するように設計されている。本明細書のガイダンスに従って、リンカーポリペプチドは、融合タンパク質内での機能ドメインおよびカスケードタンパク質の適切な間隔保持および位置決めを実現するように設計されている（例えば、Ｃｈｉｃｈｉｌｉ，Ｃら、ＰｒｏｔｅｉｎＳｃｉｅｎｃｅ２２巻：１５３〜１６７頁（２０１３年）；Ｃｈｅｎ，Ｘ．ら、６５巻：１３５７〜１３６９頁（２０１３年）；Ｇｅｏｒｇｅ，Ｒ．ら、ＰｒｏｔｅｉｎＥｎｇｉｎｅｅｒｉｎｇ，ＤｅｓｉｇｎａｎｄＳｅｌｅｃｔｉｏｎ１５巻：８７１〜８７９頁（２００２年）参照）。本発明の実行に有用なリンカーポリペプチドの更なる例として、カスケード系を含む生物においてカスケードタンパク質のコード配列を互いに連結することが同定されているリンカーポリペプチド（例えば、非特許文献１３によって記載されるような、ストレプトミセス・グリセウス（Ｓｔｒｅｐｔｏｍｙｃｅｓｇｒｉｓｅｕｓ）においてＣａｓ８をＣａｓ３に連結するリンカーポリペプチド）がある。

融合タンパク質コードＤＮＡ配列を、選択された生物、例えば、細菌、古細菌、植物、菌類、または哺乳動物の細胞内での発現用にコドン最適化してよい。コドン最適化プログラムが、例えばＩｎｔｅｇｒａｔｅｄＤＮＡＴｅｃｈｎｏｌｏｇｉｅｓウェブサイト（ｗｗｗ．ｉｄｔｄｎａ．ｃｏｍ／ＣｏｄｏｎＯｐｔ）上で、またはＧｅｎｓｃｒｉｐｔ（登録商標）（Ｇｅｎｓｃｒｉｐｔ、Ｐｉｓｃａｔａｗａｙ、ＮＪ）サービスを介して、広く利用可能である。レシピエント発現ベクター中へのクローニングを促進するために、ＳＬＩＣクローニング（例えば、Ｌｉ，Ｍ．ら、ＭｅｔｈｏｄｓＭｏｌ．Ｂｉｏｌ．８５２巻：５１〜５９頁（２０１２年）参照）に適合するベクターと重複する更なる配列を、ＤＮＡ配列の５’および３’末端に添えてよい。

他の実施形態において、カスケードサブユニットタンパク質を、転写活性化および／または抑制ドメインに融合させてもよい。一部の実施形態において、融合タンパク質は、アクチベータードメイン（例えば、ヒートショック転写因子、ＮＦＫＢアクチベーター、ＶＰ１６、およびＶＰ６４（例えば、Ｅｇｕｃｈｉ，Ａ．ら、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ１１３巻：Ｅ８２５７〜Ｅ８２６６頁（２０１６年）；Ｐｅｒｅｚ−Ｐｉｎｅｒａ，Ｐ．ら、ＮａｔｕｒｅＭｅｔｈｏｄｓ１０巻：９７３〜６頁（２０１３年）；Ｇｉｌｂｅｒｔ，Ｌ．Ａ．ら、Ｃｅｌｌ１５９巻：６４７〜６１頁（２０１４年）参照）またはリプレッサードメイン（例えば、ＫＲＡＢドメイン）を含んでもよい。一部の実施形態において、リンカー核酸配列は、タンパク質、タンパク質ドメイン、またはタンパク質フラグメントの２つまたはそれ以上のコード配列を結合させるのに用いられる。

転写アクチベーターに融合されたＩ型ＣＲＩＳＰＲ−Ｃａｓサブユニットタンパク質を含むカスケード複合体を用いて、遺伝子の発現を活性化させることができる。標的遺伝子座は、細胞の転写活性化機構（因子）についての１つまたはそれ以上の結合部位を典型的に保有する転写開始部位（ＴＳＳ）を含有してもよい。図８は、転写アクチベーターＶＰ６４にリンカーポリペプチド（図８、ｃｐＣａｓ７をＶＰ６４に連結している黒色の曲線）を介して連結されたｃｐＣａｓ７（図３Ａと比較）を含む６つの融合タンパク質を含むカスケード複合体を示す。図８において、ｃｒＲＮＡは、ヘアピンを含む暗黒色の線として示されており、そしてカスケード複合体のＣａｓタンパク質の相対位置が示されている（図８：ｃｐＣａｓ７、Ｃａｓ５、Ｃａｓ８、Ｃｓｅ２、およびＣａｓ６；Ｃａｓ６周りの破線のボックスは、ｃｒＲＮＡヘアピンとの相互作用を示す）。カスケード複合体のそのような操作は、複合体を、遺伝子の転写活性化用のフレキシブルなツール（ＣＡＳＣＡＤＥａ）に変換し、そこでは、選択された遺伝子の標的化が、カスケード複合体の結合を、選択された遺伝子の１つまたはそれ以上の調節要素（例えば、ＴＳＳ）に向けるガイド配列の選択によって達成される。実施例１２は、転写活性化活性をカスケード複合体に付与するための、ＶＰ６４活性化ドメインに融合する大腸菌（Ｅ．ｃｏｌｉ）Ｉ−Ｅ型ｃｐ−Ｃａｓ７タンパク質の設計を記載している。転写アクチベーターとして、以下に限定されないが、ホメオドメインタンパク質、ジンクフィンガータンパク質、ウイングドへリックス（フォークヘッド）タンパク質、ロイシン−ジッパータンパク質、ヘリックス−ループ−ヘリックスタンパク質、ヘテロ二量体転写因子、活性化ドメイン、およびエンハンサーに結合する転写因子が挙げられる（例えば、ＭｏｌｅｃｕｌａｒＣｅｌｌＢｉｏｌｏｇｙ，ＨａｒｖｅｙＬｏｄｉｓｈら、ＷＨＦｒｅｅｍａｎ＆Ｃｏ；（２００２年）ＩＳＢＮ９７８−０８４９３９４８０５参照）。

また、転写リプレッサーに融合するＩ型ＣＲＩＳＰＲ−Ｃａｓサブユニットタンパク質を含むカスケード複合体を用いて、遺伝子の発現を抑制することができる。標的遺伝子座は、転写調節要素を含んでもよい。一実施形態において、カスケードサブユニットタンパク質を、リンカーポリペプチドを介してＫＲＡＢドメインに連結させてもよい。カスケードサブユニットタンパク質／ＫＲＡＢドメイン融合体を含むカスケード複合体は、当該複合体を、遺伝子の転写抑制用のフレキシブルなツール（ＣＡＳＣＡＤＥｉ）に変換することができ、そこでは、選択された遺伝子の標的化が、カスケード複合体の結合を、選択された遺伝子の１つまたはそれ以上の調節要素に向けるガイド配列の選択によって達成される。転写リプレッサーとして、以下に限定されないが、受動転写リプレッサー、ｂｚｉｐ転写因子ファミリー、ｓｐ１様転写リプレッサー、活性転写リプレッサー（例えば、ヒストンデアセチラーゼの動員を介した転写抑制、ヒストン脱アセチル化、および二重特異性リプレッサーが挙げられる（例えば、Ｔｈｉｅｌ，Ｇ．ら、Ｅｕｒ．Ｊ．Ｂｉｏｃｈｅｍ．２７１巻：２８５５〜２８６２頁（２００４年）；ＮｉｃｏｌａＲｅｙｎｏｌｄｓ，Ｎ．ら、Ｄｅｖｅｌｏｐｍｅｎｔ１４０巻：５０５〜５１２頁（２０１３年）；Ｇａｓｔｏｎ，Ｋ．ら、ＣｅｌｌＭｏｌ．ＬｉｆｅＳｃｉ．，６０巻：７２１〜７４１頁（２００３年）参照）。

更なる実施形態において、カスケードサブユニットタンパク質を、親和性タグに融合させてもよい。

本発明の他の実施形態において、Ｉ型ＣＲＩＳＰＲ−Ｃａｓガイドポリヌクレオチドを、ガイドポリヌクレオチド内の選択された位置での、選択されたポリヌクレオチド要素の挿入、またはヌクレオチドの変更（例えば、ＲＮＡ部分の代わりにＤＮＡ部分を用いる基本的に異なる変更、およびガイドポリヌクレオチドについて先で記載された他の変更）によって修飾することができる。そのような実施形態として、以下に限定されないが、１つまたはそれ以上のヌクレオチドエフェクタードメイン（例えば、転写因子を動員するＭＳ２もしくはＭＳ２−Ｐ６５−ＨＳＦ１結合ＲＮＡまたはアプタマー）を５’、３’、または内部に融合させたＩ型ＣＲＩＳＰＲ−Ｃａｓガイドポリヌクレオチドが挙げられる。図９は、Ｉ型ＣＲＩＳＰＲガイドポリヌクレオチドを示しており、そしてカスケード複合体のＣａｓタンパク質の相対位置が示されている（図９：Ｃａｓ７、Ｃａｓ５、Ｃａｓ８、Ｃｓｅ２、およびＣａｓ６；Ｃａｓ６周りの破線のボックスは、ｃｒＲＮＡヘアピンとの相互作用を示す；ｃＲＮＡは、破線のボックス内で黒色の線として示されており、ヘアピンを含む）。図９において、ｃｒＲＮＡはさらに、ガイドポリヌクレオチドの３’ヘアピン中に導入されたＲＮＡアプタマーヘアピン（図９、矢印によって示される位置）を含む。

また、Ｉ型ＣＲＩＳＰＲ−Ｃａｓガイドの長さは、典型的にはＣａｓ７サブユニットタンパク質およびＣｓｅ２サブユニットタンパク質結合領域を長くする、または短くすることによって、変更することができる。図１０Ａは、３つのＣａｓ７サブユニット、１つのＣｓｅ２サブユニット、および短くされたｃｒＲＮＡを有するカスケード複合体を示す（図１０Ａ：Ｃａｓ７、Ｃａｓ５、Ｃａｓ８、Ｃｓｅ２、およびＣａｓ６；Ｃａｓ６周りの破線のボックスは、ｃｒＲＮＡヘアピンとの相互作用を示す；ｃＲＮＡは、黒色の線として示されており、ヘアピンを含む）。図１０Ｂは、９つのＣａｓ７サブユニット、３つのＣｓｅ２サブユニット、および長くされたｃｒＲＮＡを有するカスケード複合体を示す（図１０Ｂ：Ｃａｓ７、Ｃａｓ５、Ｃａｓ８、Ｃｓｅ２、およびＣａｓ６；Ｃａｓ６周りの破線のボックスは、ｃｒＲＮＡヘアピンとの相互作用を示す；ｃＲＮＡは、黒色の線として示されており、ヘアピンを含む）。

実施例１６は、Ｉ型ＣＲＩＳＰＲ−ＣａｓガイドｃｒＲＮＡの修飾の生成および試験、ならびに操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体を構築するのに用いられる修飾ガイドの適合性を記載している。

第３の態様において、本発明は、１つまたはそれ以上の操作されたカスケード構成要素をコードする核酸配列、ならびに１つまたはそれ以上の操作されたカスケード構成要素をコードする核酸配列を含む発現カセット、ベクター、および組換え細胞に関する。本発明の第３の態様の一部の実施形態として、選択されたカスケード系の全ての構成要素（例えば、Ｃｓｅ２、Ｃａｓ５、Ｃａｓ６、Ｃａｓ７、およびＣａｓ８タンパク質、ならびに１つまたはそれ以上のコグネイトガイド）をコードする１つまたはそれ以上のポリペプチドが挙げられ、当該構成要素は、エフェクター複合体を形成することができる。典型的には、１つを超えるコグネイトガイドが発現される場合、ガイドは、様々な核酸標的配列に結合を向けるための様々なスペーサー配列を有する。そのような実施形態として、以下に限定されないが、発現カセット、ベクター、および組換え細胞が挙げられる。

一実施形態において、本発明は、１つまたはそれ以上の操作されたカスケード構成要素をコードする１つまたはそれ以上の核酸配列を含む１つまたはそれ以上の発現カセットに関する。発現カセットは、典型的に：転写の調節、転写後の調節、または翻訳の調節の１つまたはそれ以上に関与する調節配列を含む。発現カセットは、以下に限定されないが、細菌細胞、酵母細胞、植物細胞、および哺乳動物細胞（ヒト細胞を含む）が挙げられる多種多様な生物中に導入することができる。発現カセットは、典型的に、導入されることとなる生物に対応する機能的調節配列を含む。

本発明の更なる実施形態は、ベクターに関し、１つまたはそれ以上の操作されたカスケード構成要素をコードする１つまたはそれ以上の核酸配列を含む発現ベクターが挙げられる。また、ベクターは、選択マーカーまたはスクリーニングできるマーカーをコードする配列を含んでもよい。さらに、核標的化配列を、例えば、カスケードサブユニットタンパク質に加えてもよい。また、ベクターは、タンパク質タグ（例えば、ポリ−Ｈｉｓタグ、ヘマグルチニンタグ、蛍光タンパク質タグ、および生物発光タグ）をコードするポリヌクレオチドを含んでもよい。そのようなタンパク質タグのコード配列を、例えば、カスケードサブユニットタンパク質をコードする１つまたはそれ以上の核酸配列に融合させることができる。

発現ベクターの構築のための一般的な方法が、当該技術において知られている。宿主細胞用の発現ベクターが市販されている。適切なベクターの選択およびその構築を促進するように設計された、いくつかの市販のソフト製品があり、例えば、昆虫細胞形質転換および昆虫細胞内での遺伝子発現用の昆虫細胞ベクター、細菌形質転換および細菌細胞内での遺伝子発現用の細菌プラスミド、細胞形質転換ならびに酵母および他の菌類内での遺伝子発現用の酵母プラスミド、哺乳動物細胞形質転換および哺乳動物細胞または哺乳動物内での遺伝子発現用の哺乳動物ベクター、ならびに細胞形質転換および遺伝子発現用のウイルスベクター（以下に限定されないが、レンチウイルス、レトロウイルス、アデノウイルス、単純ヘルペスウイルスＩまたはＩＩ、パルボウイルス、細網内皮症ウイルス、およびアデノ随伴ウイルス（ＡＡＶ）ベクターが挙げられる）、ならびにそのようなポリヌクレオチドのクローニングを容易にする方法がある。

ＡＡＶベースのベクター（ｒＡＡＶ）が、本発明の方法の実行に有用なウイルスベクターの一例である。ＡＡＶは、パルボウイルス科の一本鎖ＤＮＡメンバーであり、元来複製が欠損したウイルスである。ＡＡＶベクターは、遺伝子治療に最も頻繁に用いられているウイルスベクターの１つである。ＡＡＶ（ＡＡＶ血清型１［ＡＡＶ−１］〜ＡＡＶ−１２）の１２のヒト血清型、および非ヒト由来の１００を超える血清型が知られている。一実施形態において、ＡＡＶ−６がベクターとして用いられる。

レンチウイルスベクターが、本発明の方法の実行に有用なウイルスベクターの別の例である。レンチウイルスは、レトロウイルス科のメンバーであり、一本鎖ＲＮＡウイルスである。これは、分裂細胞および非分裂細胞の双方に感染することができ、かつゲノム中への統合により安定した発現をもたらすことができる。レンチウイルスベクターの安全性を増大させるために、ウイルスベクターを生成するのに必須の構成要素が、複数のプラスミドにわたって分けられている。運搬ベクターは、典型的に、複製不能であり、そして加えて、３’ＬＴＲ内に欠失を含有し得、これによりウイルスは統合後に自己不活化する。パッケージングおよびエンベローププラスミドが、典型的に、運搬ベクターと組み合わせて用いられる。例えば、パッケージングプラスミドが、Ｇａｇ、Ｐｏｌ、Ｒｅｖ、およびＴａｔ遺伝子の組合せをコードし得る。運搬プラスミドが、ウイルスＬＴＲおよびｐｓｉパッケージングシグナルを含み得る。エンベローププラスミドは、通常、エンベロープタンパク質（通常、その広い感染範囲のため、水胞性口内炎ウイルス糖タンパク質、ＶＳＶ−ＧＰ）を含む。

実例となる植物形質転換ベクターとして、アグロバクテリウム・ツメファシエンス（Ａｇｒｏｂａｃｔｅｒｉｕｍｔｕｍｅｆａｃｉｅｎｓ）のＴｉプラスミドに由来するものが挙げられる（例えば、Ｌｅｅ，Ｌ．Ｙ．ら、ＰｌａｎｔＰｈｙｓｉｏｌｏｇｙ１４６巻：３２５〜３３２頁（２００８年）参照）。また、当該技術において有用であり、かつ知られているのは、アグロバクテリウム・リゾゲネス（Ａｇｒｏｂａｃｔｅｒｉｕｍｒｈｉｚｏｇｅｎｅｓ）プラスミドである。例えば、ＳＮＡＰＧＥＮＥ（商標）（ＧＳＬＢｉｏｔｅｃｈＬＬＣ、Ｃｈｉｃａｇｏ、ＩＬ；ｓｎａｐｇｅｎｅ．ｃｏｍ／ｒｅｓｏｕｒｃｅｓ／ｐｌａｓｍｉｄ＿ｆｉｌｅｓ／ｙｏｕｒ＿ｔｉｍｅ＿ｉｓ＿ｖａｌｕａｂｌｅ／）は、ベクター、個々のベクター配列、およびベクターマップ、ならびに多くのベクターの商業的供給源の広範なリストを提供している。

細菌発現系において組換えカスケードを発現させて精製するために、カスケードサブユニットタンパク質、および注目するガイド配列を含む最小ＣＲＩＳＰＲアレイをコードするベクターを設計してよい。したがって、本発明の一態様として、そのような発現系が挙げられる。一実施形態において、カスケード複合体は、３つの互いに異なるプラスミドベクターから発現され、これらはまとめて以下の構成要素：Ｃａｓ８タンパク質；Ｃｓｅ２、Ｃａｓ７、Ｃａｓ５、およびＣａｓ６タンパク質；ならびにＣＲＩＳＰＲＲＮＡをコードする。一部の実施形態において、Ｃａｓ８をコードする発現プラスミドは、天然のｇＤＮＡ遺伝子配列を含み、そして他の実施形態において、発現プラスミドは、選択された細胞型内での発現用にコドン最適化したＣａｓ８をコードしてよい。同様に、Ｃｓｅ２、Ｃａｓ７、Ｃａｓ５、およびＣａｓ６をコードする発現プラスミドは、天然のｇＤＮＡ遺伝子配列を含有してもよいし、選択された細胞型内での発現用にコドン最適化した遺伝子配列を含有してもよい。一部の実施形態において、様々なタンパク質が全て、単一のポリシストロン性転写産物から翻訳されるように、オペロンをコードするカスケードサブユニットタンパク質の全体を、単一の転写プロモーターの下流に配置してもよい。更なる実施形態において、カスケードサブユニットタンパク質をコードする遺伝子を互いに分けて、転写ターミネーターおよびプロモーターを介在させてもよい。

ｃｒＲＮＡをコードする発現プラスミドは、適切な転写プロモーターの下流に、単一のスペーサー配列に隣接するわずか２つのリピートを含有してもよいし、複数のスペーサー配列（同じ正確なガイド配列、または複数の互いに異なるガイド配列のいずれか）に隣接する多くのリピートを含有してもよい。ＣＲＩＳＰＲの調整された発現、およびカスケードサブユニット、特にＣａｓ６サブユニットは、長い前駆体ｃｒＲＮＡの、成熟した長さのｃｒＲＮＡへのプロセシングをもたらし、これらはそれぞれ、ｃｒＲＮＡの５’および３’末端上に単一のリピートのフラグメントを、そして中央に単一のスペーサー配列を含む。

大腸菌（Ｅ．ｃｏｌｉ）内で完全なカスケード複合体を発現するための代替戦略として、２つのプラスミドを用いるものがある：一プラスミドが、単一の発現プラスミド上にＣａｓ８−Ｃｓｅ２−Ｃａｓ７−Ｃａｓ５−Ｃａｓ６オペロン全体をコードし、そして一プラスミドが、ＣＲＩＳＰＲＲＮＡをコードしている。この場合、通常はＣａｓ８遺伝子の３’末端と重複するＣｓｅ２遺伝子の５’末端が、Ｃａｓ８遺伝子の３’末端から空間的に分離されて、親和性タグおよび／またはプロテアーゼ認識配列をコードするポリヌクレオチド配列が添えられる。

実施例２は、カスケードタンパク質用の２つのタイプの細菌発現プラスミド系を記載している：第１のタイプは、２つのプラスミドを含み、第１のプラスミドが、Ｃａｓ８タンパク質をコードし、そして第２のプラスミドが、ＣａｓＢＣＤＥ複合体の４つのサブユニットタンパク質（ｃｓｅ２−ｃａｓ７−ｃａｓ５−ｃａｓ６オペロン）をコードしている；そして、第２のタイプは、カスケード複合体の５つのサブユニットタンパク質（ｃａｓ８−ｃｓｅ２−ｃａｓ７−ｃａｓ５−ｃａｓ６オペロン）を全てコードする発現プラスミドを含む。また、コグネイトＣＲＩＳＰＲアレイが記載されている。

カスケード複合体の精製を促進するために、Ｃｓｅ２サブユニット上に親和性タグ、例えばＮ末端Ｓｔｒｅｐ−ＩＩタグまたはヘキサヒスチジン（Ｈｉｓ６）タグを添えてもよい。さらに、最初の精製後のプロテアーゼによる配列の生化学的切断が、親和性タグを最終の組換えカスケード複合体から遊離させるように、プロテアーゼ、例えばＴＥＶプロテアーゼまたはＨＲＶ３Ｃプロテアーゼによって認識されるアミノ酸配列を、親和性タグとＣｓｅ２サブユニットの天然のＮ末端との間に挿入してもよい。また、親和性タグを、他のサブユニット上に配置してもよいし、Ｃｓｅ２サブユニット上に残してもよく、そして他のサブユニット上の更なる親和性タグと組み合わせてもよい。親和性タグを含む例示的なカスケードサブユニットタンパク質が、実施例１、実施例２、実施例３Ａ、実施例３Ｂ、および実施例３Ｃに示されている。

Ｉ−Ｅ型カスケード系について、大腸菌（Ｅ．ｃｏｌｉ）の株を、ＣＲＩＳＰＲＲＮＡおよびｃｓｅ２−ｃａｓ７−ｃａｓ５−ｃａｓ６遺伝子をコードするプラスミドで形質転換して、タンパク質発現を誘導することができ、Ｃａｓ８サブユニットを欠いているカスケード複合体を生成することができる。このカスケード複合体は、典型的に、Ｃａｓ８−マイナスカスケード複合体と呼ばれ、または代わりに、ＣａｓＢＣＤＥ複合体と呼ばれる（例えば、Ｊｏｒｅ，Ｍ．ら、Ｎａｔ．Ｓｔｒｕｃｔ．Ｍｏｌ．Ｂｉｏｌ．１８巻：５２９〜５３６頁（２０１１年）参照）。この精製された複合体を、別に精製されたＣａｓ８と生化学的に組み合わせて、完全カスケードを再構成することができる（例えば、Ｓａｓｈｉｔａｌ，Ｄ．Ｇ．ら、Ｍｏｌ．Ｃｅｌｌ４６巻：６０６〜６１５頁（２０１２年）参照）。

表６は、最小ＣＲＩＳＰＲアレイ、ｃａｓ８、ｃｓｅ２−ｃａｓ７−ｃａｓ５−ｃａｓ６構築体およびｃａｓ８−ｃｓｅ２−ｃａｓ７−ｃａｓ５−ｃａｓ６構築体をコードし、異なるタグおよび設計を含有する細菌発現プラスミドの例示的な配列を示す。カスケード複合体をコードするプラスミド、および相同Ｉ型系由来のカスケード複合体を、同様に、本明細書のガイダンスに従って、大腸菌（Ｅ．ｃｏｌｉ）Ｋ−１２ＭＧ１６５５において見出されるＩ−Ｅ型についての例示的な発現プラスミド配列として設計することができる。表６は加えて、遺伝子編集実験用のヌクレアーゼ−カスケード融合体の生成のための、Ｃａｓ８−Ｃｓｅ２−Ｃａｓ７−Ｃａｓ５−Ｃａｓ６タンパク質を発現する発現プラスミドの配列、およびｃａｓ８遺伝子またはｃａｓ６遺伝子のいずれかへのＦｏｋＩ融合を含有する。

表７は、５つ全てのサブユニットタンパク質を、単一の細菌発現プラスミド由来のｃｒＲＮＡと一緒にコードする単一のポリプロモーター細菌発現プラスミドの配列を含有する。この設計において、各遺伝子は、転写プロモーターおよびターミネーターを有する上流および下流に隣接する他の遺伝子から分離されている。親和性タグおよび／またはプロテアーゼ認識タグ、ならびにヌクレアーゼタンパク質への融合をコードする更なる配列を導入して、遺伝子編集用のカスケード−ヌクレアーゼ融合体を生成することができる。

本明細書中の設計基準に基づいて他のＩ型サブタイプおよび他の細菌または古細菌生物由来の相同カスケード複合体をコードする更なる細菌発現プラスミドを設計することができる。そのような発現プラスミドは、カスケード遺伝子用のｇＤＮＡ配列で設計することもできるし、大腸菌（Ｅ．ｃｏｌｉ）または他の細菌の株内での発現用にコドン最適化した遺伝子配列で設計することもできる。

哺乳動物細胞、例えばヒト細胞内でカスケードまたはカスケードへのエフェクター融合体を発現させるために、真核生物発現プラスミドベクターを、関連するタンパク質およびＲＮＡ構成要素の発現を真核生物の転写および翻訳機構によって可能にするように設計した。一実施形態において、カスケードは、真核生物プロモーター（例えば、サイトメガロウイルス（ＣＭＶ）プロモーター）によって駆動される別個の発現ベクター上に各タンパク質構成要素をコードし、そしてＲＮＡポリメラーゼＩＩＩプロモーター（例えば、ヒトＵ６プロモーター）によって駆動される別個の発現ベクター上にｃｒＲＮＡをコードすることによって、哺乳動物細胞内で生成することができる。ＣＲＩＳＰＲＲＮＡは、成熟ｃｒＲＮＡのガイド部分として機能する１つまたはそれ以上のスペーサー配列に隣接する少なくとも２つのリピートを含有する最小ＣＲＩＳＰＲアレイと共にコードすることができる。ＣＲＩＳＰＲＲＮＡを生成する構築体は、最小アレイ内の最も外側のリピートに隣接する更なる配列で設計することができる。前駆体ＣＲＩＳＰＲＲＮＡのプロセシングが、別個のプラスミドから発現させることができる、カスケード複合体（Ｃａｓ６サブユニットタンパク質）のＲＮＡプロセシングサブユニットによって可能となる。

表８は、大腸菌（Ｅ．ｃｏｌｉ）Ｉ−Ｅ型カスケード複合体の各タンパク質用の個々の真核生物発現プラスミドの配列を含有する。Ｃａｓ８サブユニットは、更なるエフェクターヌクレアーゼドメイン、例えばＦｏｋＩヌクレアーゼに融合させることができる（実施例１、実施例３Ａ、実施例３Ｂ、および実施例３Ｃ）。また、表８は、２つの別個のｃｒＲＮＡをコードすることによって、３つのリピート配列が２つのスペーサーに隣接する、カスケードのｃｒＲＮＡ構成要素用の発現プラスミドの配列を含有する。核局在化シグナル（ＮＬＳ）、親和性タグ、および当該タグを連結するリンカー配列を添えるポリヌクレオチド配列に、各タンパク質コード遺伝子を添えてもよい。いずれかのカスケードサブユニットタンパク質への他の融合を、典型的に、カスケードサブユニットタンパク質を注目する更なるポリペプチド配列に連結するアミノ酸リンカーをコードする更なるポリヌクレオチド配列が挙げられる、５’または３’コード配列に添えられている更なるポリヌクレオチド配列によって、コードすることができる。候補融合タンパク質の例が、本明細書中に記載されている。

より少ない発現ベクター上でカスケード複合体の構成要素を発現させるために、ポリシストロン性発現ベクターを構築することによって、単一のプロモーター（例えば、ＣＭＶプロモーター）が、トセア・アシグナ（Ｔｈｏｓｅａａｓｉｇｎａ）ウイルス２Ａ配列によって分離される複数のコード配列の発現を同時に駆動することができる。２Ａウイルスペプチド配列は、リボソームスキップを誘導して、複数のタンパク質コード遺伝子を、真核細胞内での発現用の単一のポリシストロン性構築体内に連結することを可能にする。ゆえに、単一のプロモーターによって駆動される単一の転写産物上にカスケード複合体の４つまたは５つのタンパク質サブユニットをコードするポリシストロン性ベクターを設計することができる。表９は、ＣＲＩＳＰＲＲＮＡ発現プラスミドと組み合わされて、哺乳動物細胞内で機能的カスケードを生成することができる真核生物ポリシストロン性発現プラスミドの配列を含有する。

一部の実施形態において、ＣＲＩＳＰＲＲＮＡは、タンパク質コード遺伝子の３’非翻訳領域（ＵＴＲ）内にコードされており、その発現は、ＲＮＡポリメラーゼＩＩプロモーター（例えば、ＣＭＶプロモーター）によって駆動されて、転写産物を生成する。そのような実施形態において、最小ＣＲＩＳＰＲアレイは、タンパク質コード遺伝子、例えばＣａｓ６、Ｃａｓ７、またはリポータ遺伝子（例えば、増強緑色蛍光タンパク質、ｅＧＦＰ）の下流に存在するように設計されており、そして上流の転写産物に安定性を付与することが以前に示されたＭＡＬＡＴ１三重鎖配列によって、タンパク質コード配列から分離されている。最小ＣＲＩＳＰＲアレイは、（典型的に、異なるプラスミドを用いて発現される）カスケードのＲＮＡプロセシングサブユニット（最小ＣＲＩＳＰＲアレイを切断するエンドヌクレアーゼ）によってプロセシングされ、切断が、転写産物中に導入され、そして三重鎖配列は、上流のタンパク質コード遺伝子の３’末端を、早期のエキソヌクレアーゼによる分解から保護する。表１０は、３つのポリヌクレオチド配列を含有し、それにより、ＣＲＩＳＰＲアレイは、Ｃａｓ６、Ｃａｓ７、またはｅＧＦＰの下流でクローニングされ、そして融合配列全体の発現は、ＣＭＶプロモーターによって駆動される。

一部の実施形態において、ＣＲＩＳＰＲＲＮＡアレイは、ｆｉｖｅ５カスケードサブユニットタンパク質の発現を駆動するポリシストロン性構築体と同じベクター上にコードされる；これらの２つの要素の組合せは、カスケード複合体の機能的サブユニットの全て（タンパク質およびＲＮＡの双方）を、カスケードサブユニットの１つに融合したあらゆるヌクレアーゼまたはエフェクタードメインと一緒に生成するオールインワンベクターを生成する。表１１は、哺乳動物細胞内で機能的ＦｏｋＩ−カスケードＲＮＰを生成するための、それぞれの構成要素を全てコードする当該オールインワンポリヌクレオチド配列の２つの代表的な配列を含有する。

実施例３Ａ、実施例３Ｂ、および実施例３Ｃは、各カスケードサブユニットタンパク質および最小ＣＲＩＳＰＲアレイを発現する別個のプラスミドを用いる発現系、複数のカスケードサブユニットタンパク質コード配列が、単一のプロモーターから発現される発現系、および単一のプラスミドカスケード発現系が、哺乳動物細胞に用いられるｃａｓ８−ｃｓｅ２−ｃａｓ７−ｃａｓ５−ｃａｓ６オペロンおよび最小ＣＲＩＳＰＲアレイの全体を発現するように構築された発現系を記載している。

当業者であれば、本明細書のガイダンスに従って、大腸菌（Ｅ．ｃｏｌｉ）Ｉ−Ｅ型カスケード複合体が提供される例と同様に、他のカスケード複合体をコードする更なる哺乳動物発現ベクターを設計することができる。

第４の態様において、本発明は、宿主細胞中への操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の１つまたはそれ以上の構成要素をコードするプラスミドの導入による、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の生成に関する。形質転換された宿主細胞（または組換え細胞）、または組換えＤＮＡ技術を用いて形質転換もしくは形質移入された細胞の後代は、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の１つまたはそれ以上の構成要素をコードする１つまたはそれ以上の核酸配列を含み得る。宿主細胞中にポリヌクレオチドを導入する方法（例えば、発現ベクター）が、当該技術において知られており、典型的に、宿主細胞の種類に基づいて選択される。そのような方法として、例えば、ウイルスまたはバクテリオファージ感染、形質移入、コンジュゲーション、エレクトロポレーション、リン酸カルシウム沈殿、ポリエチレンイミン媒介形質移入、ＤＥＡＥデキストラン媒介形質移入、プロトプラスト融合、リポフェクション、リポソーム媒介形質移入、パーティクルガン技術、マイクロプロジェクタイル砲撃、直接的マイクロインジェクション、およびナノ粒子媒介送達が挙げられる。本発明の一実施形態において、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の構成要素をコードするポリヌクレオチドが、細菌細胞（例えば、大腸菌（Ｅ．ｃｏｌｉ））中に導入される。

実施例４Ａおよび実施例４Ｂは、Ｃａｓ８タンパク質コード配列、および操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の、大腸菌（Ｅ．ｃｏｌｉ）発現系を用いた細菌生産のための、そのような複合体の構成要素についてのコード配列の導入および発現の方法を記載している。

本明細書中で開示される種々の例示的な宿主細胞は、操作されたカスケードエフェクター複合体を用いて組換え細胞を生産するのに用いることができる。そのような宿主細胞として、以下に限定されないが、植物細胞、酵母細胞、細菌細胞、昆虫細胞、藻類細胞、および哺乳動物細胞が挙げられる。

考察を容易にするために、「形質移入」は、以下で、宿主細胞中にポリヌクレオチドを導入するあらゆる方法に言及するのに用いられる。

一部の実施形態において、宿主細胞が、Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の１つまたはそれ以上の構成要素をコードする核酸配列で一過的に、または非一過的に形質移入される。一部の実施形態において、細胞が、対象において本来存在するかの如く、形質移入される。一部の実施形態において、形質移入される細胞、例えば一次細胞または前駆体細胞が、最初に、対象から取り出される。一部の実施形態において、一次細胞または前駆体細胞は、培養され、かつ／またはイクスビボ形質移入の後に、同じ対象または異なる対象に戻される。

操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の発現および精製は、大きな労働力を要するので、多数のガイドポリヌクレオチドまたはエフェクター複合体バリアントにわたるスクリーニングを促進するために、より高いスループットのプラスミドベースの送達系を設計した。５つのＣａｓ遺伝子の各々を、ヒトコドン最適化して、Ｎ末端ＮＬＳ融合体としてＣＭＶ駆動発現プラスミドにクローニングし、そしてＴ細胞受容体アルファ遺伝子座（ＵＣＳＣゲノムブラウザ、ｈｇ３８）のＴＲＡＪ２７エクソンを標的化する対形成されたｇＲＮＡを含有する最小ＣＲＩＳＰＲアレイを、ヒトＵ６プロモーターの下流にある、第６のプラスミドにクローニングした（実施例３Ａ；図３５）。図３５において、構成要素の順序は、左から右に、以下の通りである：ｈｕ６プロモーター、末端が菱形の灰色の矩形；リピート１、空白の（白色の）菱形；スペーサー１、灰色のワッフル様矩形；リピート２、灰色の菱形；スペーサー２、灰色の点画矩形；およびリピート３、黒色の菱形。図３５において、ブラケットは、２つのｇＲＮＡをコードする領域を示す。一部の実施形態において、２つのガイドＲＮＡは、同じであってよく（例えば、同じ核酸標的配列を標的化する）、そして他の実施形態において、２つのガイドＲＮＡは、相異してもよい（例えば、２つの異なる核酸標的配列を標的化する）。

ほとんどのＩ型系におけるｇＲＮＡプロセシングが、カスケード内に存在するＣａｓ６リボヌクレアーゼによって自然に触媒されて（例えば、Ｂｒｏｕｎｓ，Ｓ．Ｊ．ら、Ｓｃｉｅｎｃｅ３２１巻：９６０〜９６４頁（２００８年）；Ｈｏｃｈｓｔｒａｓｓｅｒ，Ｍ．ら、ＴｒｅｎｄｓＢｉｏｃｈｅｍ．Ｓｃｉ．４０巻：５８〜６６頁（２０１５年）参照）、本明細書中で示される対形成ｇＲＮＡアプローチにより、複数のプロモーターが不要となる。したがって、本発明の一実施形態は、対形成されたガイドポリヌクレオチドを含むベクターを含み、当該ガイドポリヌクレオチドが、調節要素に作動可能に連結されて、ガイドポリヌクレオチド（例えば、ｇＲＮＡ）の発現を実現する。６−プラスミドの共形質移入が、ＴＲＡＪ２７遺伝子座での最大約３％の編集をもたらし、そしていずれか１つの構成要素の除去が、ゲノム編集を排除した（唯一の例外がＣａｓ１１）。大腸菌（Ｅ．ｃｏｌｉ）カスケードエフェクター複合体は、ＤＮＡ結合を絶対に必要とするわけでない（例えば、Ｗｅｓｔｒａ，Ｅ．ら、ＲＮＡＢｉｏｌ．９巻：１１３４〜１１３８頁（２０１２年）参照）。

本発明の別の実施形態において、２つのガイド配列を典型的に含む最小ＣＲＩＳＰＲアレイが、細胞または生化学反応中にＤＮＡ鋳型として導入される。ＤＮＡ鋳型は、ＰＣＲ増幅によって生成される（例えば、図４２Ａ；実施例２０Ａ）。そのような最小ＣＲＩＳＰＲアレイは、カスケード複合体タンパク質構成要素をコードする１つまたはそれ以上のプラスミドにより、細胞中に導入することができる。一部の実施形態において、対形成されたガイドポリヌクレオチドを含む最小ＣＲＩＳＰＲアレイおよびベクターは双方とも、細胞または生化学反応中に導入することができる。２つのカスケードＲＮＰ複合体を用いる方法（例えば、核酸標的配列に結合する方法、または核酸標的配列を切断する方法；例えば、図１５Ａ、図１５Ｂ、図１５Ｃ参照）において、最小ＣＲＩＳＰＲアレイは、２つの異なるガイドをコードしてよい。したがって、一部の実施形態において、２つのガイドＲＮＡは、異なってよい（例えば、２つの異なる核酸標的配列を標的化する）。単一のカスケードＲＮＰ複合体を用いる方法（例えば、ｍＣａｓ３タンパク質と会合したＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体、またはＣａｓ３融合タンパク質が複合体と会合しているＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体を用いる場合；例えば、図１６Ａ、図１７Ｂ、図１７Ｃ、図２１Ａ、図２１Ｂ、図２１Ｃ、図２１Ｄ参照）において、最小ＣＲＩＳＰＲアレイが、２コピーの同じガイド配列をコードしてよい。したがって、一部の実施形態において、２つのガイドＲＮＡは、同じであってよい（例えば、同じ核酸標的配列を標的化する）。

さらに別の実施形態において、ｃｒＲＮＡ前駆体の、成熟ガイドＲＮＡへのヌクレオチド鎖切断的プロセシングのための、Ｃａｓ６タンパク質によって認識される配列および構造をさらに含むガイド配列をコードするポリヌクレオチドを、細胞または生化学反応中に導入してよい。他の実施形態において、プロセシングを必要としない成熟ガイドポリヌクレオチドを、カスケード複合体のアセンブリーに用いてもよい。そのような成熟ガイドは、配列修飾（例えば、例えばＲＮａｓｅによる、ヌクレアーゼ消化からガイドを保護する一助となるような、５’および／または３’末端でのホスホロチオエート結合）を含んでもよい。更なるガイド修飾として、ヌクレオチド配列（例えば、ヌクレオチド類似体等）について本明細書中に記載されるものが挙げられる。

実施例９Ａ、実施例９Ｂ、実施例９Ｃ、および実施例９Ｄは、ヒト細胞内でゲノム編集を促進するような、ＦｏｋＩ融合タンパク質を含む大腸菌（Ｅ．ｃｏｌｉ）Ｉ−Ｅ型カスケード複合体の設計および送達を示す。実施例９Ｂは、カスケード複合体構成要素を発現するプラスミドベクターの、真核細胞中への送達を記載している。第５の態様において、本発明は、細胞からの、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の精製、およびそのような複合体の使用に関する。操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体が、宿主細胞内で生成される。操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体（この場合、カスケードＲＮＰ複合体）は、細胞溶解液から精製される。

実施例５Ａおよび実施例５Ｂは、実施例４Ｂに記載されるように、細菌内での過剰発現によって生成される大腸菌（Ｅ．ｃｏｌｉ）Ｉ−Ｅ型カスケードＲＮＰ複合体の精製を記載している。当該方法は、固定化金属親和性クロマトグラフィーに続いてサイズ排除クロマトグラフィー（ＳＥＣ）を用いる。実施例５Ａおよび実施例５Ｂは、精製されたカスケードＲＮＰ生成物の品質を評価するのに用いることができる方法を記載している。Ｃａｓ８、Ｃａｓ７、Ｃａｓ６、Ｃａｓ５、およびＣｓｅ２カスケードＲＮＰ複合体、Ｃａｓ７、Ｃａｓ６、Ｃａｓ５、およびＣｓｅ２タンパク質、ならびにＦｏｋＩ−Ｃａｓ８融合タンパク質を含むカスケード複合体の精製を示す実施例が示される。

また、精製された、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体は、生化学アッセイ（例えば、結合および／または切断アッセイ）に直接用いることができる。実施例６Ａ、実施例６Ｂ、および実施例６Ｃは、インビトロＤＮＡ結合または切断アッセイに用いられるｄｓＤＮＡ標的配列の生成を記載している。実施例６は、合成ｓｓＤＮＡオリゴヌクレオチドのアニーリング、ｇＤＮＡから選択された核酸標的配列のＰＣＲ増幅、および核酸標的配列の、細菌プラスミド中へのクローニングを含む、標的配列を生成する３つの方法を記載している。ｄｓＤＮＡ標的配列を、カスケード結合または切断アッセイに用いた。

１つまたはそれ以上の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の部位特異的結合および／または当該複合体による切断は、必要ならば、電気泳動運動能シフトアッセイ（例えば、Ｇａｒｎｅｒ，Ｍ．ら、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．９巻：３０４７〜３０６０頁（１９８１年）；Ｆｒｉｅｄ，Ｍ．ら、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．９巻：６５０５〜６５２５頁（１９８１年）；Ｆｒｉｅｄ，Ｍ．，Ｅｌｅｃｔｒｏｐｈｏｒｅｓｉｓ１０巻：３６６〜３７６頁（１９８９年）；Ｆｉｌｌｅｂｅｅｎ，Ｃ．ら、Ｊ．Ｖｉｓ．Ｅｘｐ．（９４），ｅ５２２３０，ｄｏｉ：１０．３７９１／５２２３０（２０１４年）参照）、または実施例７に記載される生化学切断アッセイを用いて確認することができる。

実施例７において示されるデータは、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体が、超コイル化された、環状プラスミド基質の、切断された、直鎖状形態への変換によって明示されるように、ほぼ定量的なＤＮＡ切断を示すことができることを実証している。操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体（例えば、ＦｏｋＩ−カスケード構成要素融合タンパク質を含む）によるロバストな生化学活性を実証した後に、細胞内でのゲノム編集を実行した。

実施例８Ａ、実施例８Ｂ、実施例８Ｃ、および実施例８Ｄは、Ｃａｓサブユニットタンパク質−ＦｏｋＩ融合タンパク質を含む大腸菌（Ｅ．ｃｏｌｉ）Ｉ−Ｅ型カスケード複合体の設計、およびヒト細胞への送達を示す。実施例８Ｄにおけるデータは、予めアセンブルされたカスケードＲＮＰの、標的細胞中への送達、およびヒト細胞内での有効なゲノム編集を実証している。

精製された、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体は、細胞中に直接導入することができる。細胞中に構成要素を導入する方法として、エレクトロポレーション、リポフェクション、パーティクルガン技術、およびマイクロプロジェクタイル砲撃が挙げられる。

図３６Ａ、図３６Ｂ、図３６Ｃ、および図３６Ｄは、操作されたカスケード−ＲＮＰ複合体、および操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓ複合体のプラスミドベースの送達を用いて、ヒト細胞内でのゲノム編集についての比較データを示す。図３６Ａ〜図３６Ｄ、図３６Ａにおいて、ＨＥＫ２９３細胞を、精製されたＲＮＰで形質移入してから、編集された部位を次世代シーケンシング（ＮＧＳ）で分析した。図３６Ａ（ＲＮＰ形質移入）に示されるように、２つの隣接した遺伝子座を標的化するＦｏｋＩ−カスケードＲＮＰ複合体（図３６Ａ、図の左側、直線よりも上に示す）を、ＨＥＫ２９３細胞（図３６Ａ、灰色の星型、図の左側）中にヌクレオフェクト（ｎｕｃｌｅｏｆｅｃｔ）して、ＤＮＡ切断およびゲノム編集を誘導した。１６個のユニークなゲノム標的部位（実施例６Ｃ、表３１、ＨｕｍａｎＤｕａｌＨｓａ１−１６参照）での編集効率を算出した（ｎ＝１）。ＴＲＡＣは、Ｔ細胞受容体の定常領域である。Ｔ細胞受容体は、生成される場合、スプライス接合部（すなわち、「可変」領域および「結合」領域）を含む。本明細書中に記載されるＴＲＡＣガイドのいくつかは、結合領域（例えば、ＴＲＡＪ２７）を標的化する。各標的についてのスペーサー間距離が、グラフの下方に示されている（図３６Ａ、左から右に、２５、３０、３５、４０、４５塩基対（ｂｐ））。図３６Ａにおいて、垂直軸は、編集効率パーセント（図３６Ａ、編集効率（％））であり、水平軸は、標的１〜１６を表し、そして水平軸の下方には、スペーサー間長を塩基対（ｂｐ）で示すブラケットがある。

図３６Ｂは、図３６Ａ内の標的７についての代表的なＤＮＡ修復結果を示す。図３６Ｂにおいて、対形成されたｇＲＮＡによって標的化される半部位の相対位置が、それらの関連ＰＡＭ部位と共に、図の最上位に示されている。スペーサー間距離が、頂部の線によって示されている。グラフにおいて、予想される切断部位（図３６Ｂ、垂直な黒色の中央線として示される位置「０」）およびｂｐ距離（−５０〜５０）が、最上部にて示される。灰色の各水平線が、標的遺伝子座にて観察された、配列決定されたリードの異なるクラスを表す。これらの線についてのインジケータは、以下の通りである：灰色の領域＝配列マッチ；黒色の水平線＝欠失；そして空白のボックス＝挿入。円が、各線によってグラフの右側に位置決めされている：黒色の円は、野生型リードである；そして空白の白色の円は、突然変異リードである。予想される野生型リードが、第１の灰色のバー（「Ｒｅｆ」；すなわち、基準配列）で示されている。野生型リードが、第２の灰色のバー（第２の灰色のバー；図３６Ｂ、黒色の円）で示されている。次の１１本の線が、突然変異リード（図３６Ｂ、空白の円）を示す。挿入長（塩基対の数で与えられる）が、円の右側のカラムに示されている。リードの合計パーセントが、右側の次のカラムに示されており、そして総リードが、右側の最後のカラムに示されている。

図３６Ｃ（６−プラスミド形質移入系）に示されるように、ＨＥＫ２９３細胞（図３６Ｃ、灰色の星型、図の左側）を、６つのプラスミドで形質移入した。５つのプラスミドが、Ｃａｓタンパク質（図３６Ｃ、ＦｏｋＩ−Ｃａｓ８、Ｃａｓ１１、Ｃａｓ７、Ｃａｓ５、およびＣａｓ６として示されるプラスミド）をコードしており、そして１つのプラスミドが、対形成されたｇＲＮＡをコードしており、これらは、ＣＭＶおよびヒトＵ６（ｈＵ６）プロモーターの制御下にあった（図３６Ｃ、ｇＲＮＡ）。その後、編集された部位を、ＮＧＳで分析した。ＦｏｋＩ−カスケードＲＮＰ複合体の実例が、破線の下方にある。図３６Ａから標的７での編集効率を算出し（ｎ＝２）（図３６Ａ、グラフ内の黒色のバー）、そして単一の構成要素を欠くプラスミド混合物（図３６Ｃ、水平軸の下方、−／＋を含有する灰色のボックス）を、対照として含めた（図３６Ｃ、グラフ内の空白のバー）。

図３６Ｄ（２−プラスミド形質移入系）に示されるように、ＨＥＫ２９３細胞（図３６Ｄ、灰色の星型、図の左側）を、対形成されたｇＲＮＡ発現プラスミド（図３６Ｄ、ｇＲＮＡプラスミド）、およびＴ２Ａ「リボソームスキップ」配列ペプチド（図３６Ｄ、ＣＭＶ−Ｃａｓ７−２Ａ−Ｃａｓ１１−２Ａ−Ｃａｓ５−２Ａ−Ｃａｓ６−２Ａ−ＦｏｋＩ−Ｃａｓ８）によって分離されている５つのタンパク質を全てコードするポリシストロン性発現プラスミドで形質移入した。その後、編集された部位を、ＮＧＳで分析した。ＦｏｋＩ−カスケードＲＮＰ複合体の実例が、破線の下方にある。図３６Ａに示される１６の標的での編集効率を、２−プラスミド系形質移入（図３６Ｄ、空白のバー）、および図３７Ｃ（ｎ＝３）由来の６−プラスミド系形質移入（図３６Ｄ、黒色のバー）の双方について、算出した。図３６Ｄにおいて、垂直軸は、編集効率パーセント（「編集効率（％））であり、水平軸は、標的１〜１６を表し、そして水平軸の下方には、スペーサー間長を塩基対（ｂｐ）で示すブラケットがある（図３６Ｄ、左から右に、２５、３０、３５、４０、４５ｂｐ）。

ＦｏｋＩおよびＣａｓ６上に核局在化シグナル配列を含有する精製されたカスケード−ＲＮＰでＨＥＫ２９３細胞をヌクレオフェクトすることによって、実験を実行した。ｇＤＮＡから得たＰＣＲアンプリコンの次世代シーケンシングによって明示されるように、最大約４％の編集効率が観察された。試験した１６の標的部位の間で、編集は、典型的に、３０ｂｐのスペーサー間長を含有する部位にあった（図３６Ａ）。修復結果のスペクトルをより綿密に調べると、インデルが、インタースペーサーの中央に密集し（図３６Ｂ）、Ｉ型ＣＲＩＳＰＲ−Ｃａｓ複合体の設計と一致することが明らかとなった。したがって、本発明の一実施形態において、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓ複合体は、細胞中に直接導入される。６−プラスミド送達実験（図３６Ｃ）について、１つを除いて、４２０ｎｇの各プラスミドを含有するプラスミド混合物をアセンブルしてから、陰性対照としての水または７００ｎｇの欠失プラスミドのいずれかを、ヌクレオフェクション以降に再添加した。最初のＦｏｋＩ−ＥｃｏＣａｓｃａｄｅポリシストロン性２−プラスミド送達実験（図３６Ｄ）について、細胞を、５００ｎｇの各プラスミドまたは５００ｎｇの対形成されたｇＲＮＡ発現プラスミド、および２．５μｇのポリシストロン性プラスミド（各条件について、合計３μｇ）でエレクトロポレーションした。一実施形態において、５つのｃａｓ遺伝子を全て、Ｔ２Ａ「リボソームスキップ」配列によって連続的に連結された単一のポリシストロン性発現ベクター（図３６Ｄ）に構築した（例えば、Ｋｉｍ，Ｊ．ら、ＰＬｏＳＯＮＥ６，ｅ１８５５６（２０１１年）；Ｌｉｕ，Ｚ．ら、Ｓｃｉ．Ｒｅｐ．７巻：２１９３頁（２０１７年）参照）。驚くべきことに、ポリシストロン性プラスミドおよび対形成されたｇＲＮＡ発現プラスミドによる共形質移入は、６−プラスミド法（実施例９Ａ）および直接的ＲＮＰ送達法（実施例８Ａ、実施例８Ｂ、実施例８Ｃ、実施例８Ｄ）の双方で観察されたものと類似の編集効率およびＤＮＡ修復結果をもたらし、生化学的に活性な操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体をアセンブルして、ヒト細胞内の核に送られているという結論を支持した。まとめて、これらの実験は、広く用いられているＣａｓ９およびｓｇＲＮＡプラスミドと大きさが類似するたった２つの分子構成要素による、真核細胞における、複雑な、１１−サブユニットＲＮＡガイドヌクレアーゼを再構成する、大いに単純化された発現系を証明した。

操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓ複合体（大腸菌（Ｅ．ｃｏｌｉ）（ＥｃｏＣａｓｃａｄｅ、シュードモナス（Ｐｓｅｕｄｏｍｏｎａｓ）属種Ｓ−６−２（ＰｓｅＣａｓｃａｄｅ）、およびストレプトコッカス・サーモフィルス（Ｓｔｒｅｐｔｏｃｏｃｃｕｓｔｈｅｒｍｏｐｈｉｌｕｓ）（ＳｔｈＣａｓｃａｄｅ））についてのデータは、双方の半部位、要求されるスペーサー間距離、および許容ＰＡＭを含むに違いないことから、ほとんどの標的部位がユニークなであろうということを示唆した。ＥｃｏＣａｓｃａｄｅ、ＰｓｅＣａｓｃａｄｅ、およびＳｔｈＣａｓｃａｄｅ由来の操作されたカスケード相同体を、より詳細な特性評価のために選択した。

図３７Ａ、図３７Ｂ、図３７Ｃ、および図３７Ｄは、ＦｏｋＩリンカー、スペーサー間長、およびカスケード相同体に関する編集効率を示す。図３７ＡのＦｏｋＩ−ＥｃｏＣａｓｃａｄｅ編集効率を、ＦｏｋＩ−Ｃａｓ８リンカー長（図３７Ａ、空白の円、低い線、１０ａａ；空白の円の上方のグラフ線、２０ａａ；黒色の円、１７ａａ；および灰色の円、３０ａａのリンカー長）およびスペーサー間距離の関数として示す。図３７Ａにおいて、垂直軸は、編集効率（％）であり、水平軸は、ｂｐのスペーサー間距離である。各データポイントは、３〜４個のユニークな標的部位の平均を表す。

図３７Ｂは、３０ａａリンカーを有するＦｏｋＩ−カスケードヌクレアーゼを示す。ＦｏｋＩ−Ｃａｓ８リンカーを、１２個のＩ−Ｅ型カスケードバリアントについて生成し、そして４〜７個の標的部位でのゲノム編集について試験した。各データポイントは、単一のゲノム部位を表し、そしてバーは、部位間の平均および標準偏差（ｓ．ｄ．）を示す。標的は、ＡＡＧ（図３７Ｂ、灰色のバー）またはＧＡＡ（図３７Ｂ、白色のバー）ＰＡＭ配列のいずれか、および３０ｂｐのスペーサー間距離を含有し、種は、以下のように、水平軸上にある：Ｅｃｏ、大腸菌（Ｅ．ｃｏｌｉ）；Ｐｓｅ、シュードモナス（Ｐｓｅｕｄｏｍｏｎａｓ）属種Ｓ−６−２；Ｓｅｎ、サルモネラ・エンテリカ（Ｓａｌｍｏｎｅｌｌａｅｎｔｅｒｉｃａ）；Ｇｅｏ、ゲオサーモバクター（Ｇｅｏｔｈｅｒｍｏｂａｃｔｅｒ）属種ＥＰＲ−Ｍ；Ｍａｒ、メタノケッラ・アルボリザエ（Ｍｅｔｈａｎｏｃｅｌｌａａｒｖｏｒｙｚａｅ）；Ａｈｅ、アトランティバクター・ヘルマンニ（Ａｔｌａｎｔｉｂａｃｔｅｒｈｅｒｍａｎｎｉｉ）；Ｏｃｅ、オセアニコラ（Ｏｃｅａｎｉｃｏｌａ）属種ＨＬ−３５；Ｐａｅ、緑膿菌（Ｐｓｅｕｄｏｍｏｎａｓａｅｒｕｇｉｎｏｓａ）；Ｓｔｈ、ストレプトコッカス・サーモフィルス（Ｓｔｒｅｐｔｏｃｏｃｃｕｓｔｈｅｒｍｏｐｈｉｌｕｓ）；Ｓｔｒ、ストレプトミセス（Ｓｔｒｅｐｔｏｍｙｃｅｓ）属種Ｓ４；Ｋｐｎ、クレブシエラ・ニューモニエ（Ｋｌｅｂｓｉｅｌｌａｐｎｅｕｍｏｎｉａｅ）；Ｌｂａ、ラクノスピラ菌（Ｌａｃｈｎｏｓｐｉｒａｃｅａｅｂａｃｔｅｒｉｕｍ）。

図３７Ｃにおいて、ＦｏｋＩ−ＰｓｅＣａｓｃａｄｅデータが示されており、垂直軸は、編集効率パーセント（図３７Ｃ、編集効率（％））であり、水平軸は、塩基対（ｂｐ）のスペーサー間長を示す。ＦｏｋＩ−Ｃａｓ８リンカー長は、１７アミノ酸であった。各データポイントは、単一のゲノム部位を表し、そしてバーは、７〜８個の部位間の平均およびｓ．ｄ．を示す。

図３７Ｄは、ＰＡＭ配列の関数としてのＦｏｋＩ−ＰｓｅＣａｓｃａｄｅ編集効率についてのデータを示しており、垂直軸は、編集効率パーセント（図３７Ｄ、編集効率（％））であり、水平軸は、ＰＡＭ配列に相当する（図３７Ｄ、左から右に、ＣＣＧ、ＣＧＣ、ＡＡＧ、ＡＡＡ、ＡＴＧ、ＡＡＣ、ＡＧＧ、ＡＴＡ、ＧＡＧ、およびＡＡＴ）。ゲノム部位は、水平軸上に示すように、第２の半部位にて１つのＡＡＧＰＡＭおよび可変ＰＡＭを含有した。各データポイントは、単一のゲノム部位を表し、そしてバーは、６〜１５個の部位間の平均およびｓ．ｄ．を示す。

図３７Ｅは、ＰＡＭ配列の関数としてのＦｏｋＩ−ＥｃｏＣａｓｃａｄｅ編集効率（図３７Ｅ、垂直軸、編集効率（％））についてのデータを示している。標的部位は、水平軸（図３７Ｅ、左から右に、ＣＣＧ、ＣＧＣ、ＡＡＧ、ＡＧＧ、ＡＴＧ、ＧＡＧ、ＡＡＡ、ＡＡＣ、ＡＴＡ、およびＡＡＴ）上で示されるように、第２の半部位にて固定ＡＡＧＰＡＭおよび可変ＰＡＭを含有した。各ドットは、ＨＥＫ２９３細胞内の単一の標的部位を表し、そしてＰＡＭあたり６〜１５個の部位（部位あたりｎ＝１）を試験した。棒グラフは、平均およびｓ．ｄ．を表す。

図３７Ｆは、ＰＡＭ配列の関数としてのＦｏｋＩ−ＳｔｈＣａｓｃａｄｅ効率（図３７Ｆ、垂直軸、編集効率（％））についてのデータを示している。標的部位は、水平軸（図３７Ｆ、左から右に、ＣＣ、ＡＡ、ＧＡ、ＴＡ、およびＣＡ）上で示されるように、第２の半部位にて固定ＧＡＡＰＡＭおよび可変ＰＡＭを含有した。各ドットは、ＨＥＫ２９３細胞内の単一の標的部位を表し、そしてＰＡＭあたり１８〜３３個の部位（部位あたりｎ＝１）を試験した。棒グラフは、平均およびｓ．ｄ．を表す。

図３７Ｇは、図３７Ｃおよび図３７Ｄ由来の高い編集効率（１０〜５３％）を示す４０個のゲノム部位についてのインデルクラス頻度を表すヒートマップを示す。０〜６０の編集効率パーセントが、最上部パネルにおいて棒グラフで示されている。１〜８ｂｐの挿入長が、中央のパネルに示されるヒートマップで示されており、そして１〜５０ｂｐの欠失長が、下部パネルにおいてヒートマップで示されている。４０個のゲノム標的部位（図３７Ｇ、標的）が、水平軸上に示されている（１〜４０）。単一のｂｐ挿入が、ヌクレオチド同一性によって分けられており、そして図の底部のグレイスケール強度スケールが、挿入頻度パーセンテージ（図３７Ｇ、ＩｎｓＦｒｅｑ（％）、スケールは０〜２０以上である）、および欠失頻度パーセンテージ（図３７Ｇ、ＤｅｌＦｒｅｑ（％）、スケールは０〜２０以上である）に相当する。右の棒グラフは、各インデルクラスの平均頻度（図３７Ｇ、スケールは０〜２０である）を表す。右の円グラフは、切断部位に隣接する配列の重複を含有するものとしてここで定義される、推定の鋳型修復（図３７Ｇ、円グラフの黒色の領域）に由来する２〜４ｂｐの挿入のフラクションを示す。「他」は、円グラフの灰色の領域内に表されている。

５つの最も高度に編集されたＦｏｋＩ−ＰｓｅＣａｓｃａｄｅ標的部位（約２０〜４８％の編集）についてのヒトゲノム内の最も密接に関連した部位を調査した（３０〜３３ｂｐのスペーサー間必要条件によってのみ拘束される）。５つ全ての標的にわたって、双方の半部位間でミスマッチが＜２２個の部位は、同定されなかった。ＦｏｋＩ−ＥｃｏＣａｓｃａｄｅＦｏｋＩ−Ｃａｓ８リンカー型およびスペーサー間距離実験（図３７Ａ）について、細胞を、２．４μｇのＦｏｋＩ−ＥｃｏＣａｓｃａｄｅポリシストロン性プラスミドおよび約０．５〜３．５μｇの対形成されたｇＲＮＡ発現プラスミドでヌクレオフェクトした。

ＦｏｋＩ−カスケード相同体スクリーン（図３７Ｂ）について、細胞を、１．５μｇのＦｏｋＩ−カスケードポリシストロン性プラスミドおよび約０．４〜２．２μｇの対形成されたｇＲＮＡ発現プラスミドでヌクレオフェクトした。相同体間で、４〜７個の部位が標的化され、そしてＦｏｋＩ−ＥｃｏＣａｓｃａｄｅによる高い編集効率を示した部位を選択した。相同体バリアントＦｏｋＩ−Ｃａｓ８リンカー型およびスペーサー間距離編集実験（図３７Ｃおよび図４１Ａ〜図４１Ｃ）について、細胞を、５μｇのポリシストロン性プラスミドおよび約１００〜４００ｎｇの対形成されたオリゴ鋳型ｇＲＮＡ発現アンプリコンでヌクレオフェクトした。この実験について、ｇＲＮＡ濃度は、ウェルまたは相同体バリアント間で標準化しなかった。加えて、図４１Ａ〜図４１Ｃについて、細胞を、ＦｏｋＩ−ＥｃｏＣａｓｃａｄｅまたはＦｏｋＩ−ＳｔｈＣａｓｃａｄｅｇＲＮＡよりも平均して約１．５×多いＦｏｋＩ−ＰｓｅＣａｓｃａｄｅｇＲＮＡでヌクレオフェクトした。

オリゴ鋳型ＰＣＲ増幅が、本明細書中で記載されている（例えば、実施例２０Ａ）。哺乳動物細胞内でのヒトＵ６（ｈＵ６）プロモーター（図４２Ａ、４２０）由来の対形成されたｇＲＮＡ発現用のアンプリコンを生成するためのオリゴ鋳型ＰＣＲ戦略が、図４２Ａおよび図４２Ｂ内に示されている。手短に言うと、内側リバースオリゴヌクレオチド（図４２Ａ、４２４）は、双方のｇＲＮＡ配列をコードし、そして新しい標的部位について改変されている（「リピート−スペーサー−リピート−スペーサー−リピート」配列をコードするユニークなプライマーとも呼ばれる（図４２Ａ、４２１：リピート、空白の矩形；スペーサー１、灰色の矩形；リピート、空白の矩形；スペーサー２、灰色の矩形；リピート、空白の矩形））が、残りのプライマーは不変である（図４２Ａ：外側のフォワードプライマー、４２２；内側のフォワードプライマー、４２３；外側のリバースプライマー、４２５）。ＦｏｋＩＥｃｏＣａｓｃａｄｅＲＮＰ複合体および対形成されたｇＲＮＡ発現プラスミドまたは対形成されたｇＲＮＡ発現アンプリコンのいずれかをコードするポリシストロン性プラスミドでＨＥＫ２９３細胞を共形質移入した後の標的７での編集効率（図３６Ｂ参照）が、図４２Ｂに示されている。図４２Ｂにおいて、垂直軸は、編集効率（％）であり、そして水平軸は、対形成されたｇＲＮＡカセット（ｎｇ）である。データポイントは、以下の通りである：ＦｏｋＩ−ＥｃｏＣａｓｃａｄｅＲＮＰ複合体（ｎｇ）、対形成されたｇＲＮＡプラスミド、対形成されたｇＲＮＡアンプリコン；それぞれ３７５、空白の三角形、空白の円；７５０、黒色の三角形、黒色の円；１，５００、灰色の三角形、灰色の円；３，０００、白色の線入りの黒色の三角形、白色の線入りの黒色の円。図４２Ｂ内のデータは、対形成されたｇＲＮＡ発現プラスミドに対して、対形成されたｇＲＮＡ発現アンプリコンについて、編集効率が高くなければ、匹敵することを実証している。

ＰＡＭスクリーン（図３７Ｄ、図３７Ｅ、図３７Ｆ、図３９Ａ〜図３９Ｄ、図４０Ｃ、および図４０Ｆ）のために、典型的に、細胞を、３μｇのＦｏｋＩ−カスケードポリシストロン性プラスミド、および（特に明記しない限り）１５０ｎｇ（ＦｏｋＩ−ＰｓｅＣａｓｃａｄｅおよびＦｏｋＩ−ＥｃｏＣａｓｃａｄｅ）または約８０〜１２０ｎｇ（ＦｏｋＩ−ＳｔｈＣａｓｃａｄｅ）のいずれかの対形成されたオリゴ鋳型ｇＲＮＡ発現アンプリコンでヌクレオフェクトした。

特異性分析（図３８Ａ〜図３８Ｃ）のために、細胞を、３μｇのポリシストロン性カスケードおよび１５０ｎｇの対形成されたオリゴ鋳型ｇＲＮＡ発現アンプリコンでヌクレオフェクトして、ヌクレオフェクションの５日後に収穫した。図３８Ａの最上位にて、水平の線は、スペーサー間距離を示し、鋏は、予想される切断部位を示し、そして対応するＰＡＭ領域（図３８Ａ、末端をコントラストで引き立たせている矩形のボックス）を有するゲノム標的の半部位が示されている。示される半部位の、標的との関係が、破線によって示されている。各標的について、３２の塩基対が示されており、そしてＰＡＭ領域が、シード配列に隣接して示されている。図３８Ａは、グリッド内の塗り潰されたボックス（ＰＡＭ部位を除外する）によって表されるように、ゲノム標的内で１つまたは双方の半部位へのミスマッチを含有するように設計された、対形成されたｇＲＮＡを示す。なお、双方の半部位は、分かり易くするために、方向性を同じにして表している。図３８Ｂは、完全にマッチするｇＲＮＡについての編集効率のパーセンテージとしてプロットされた、ミスマッチ対形成ｇＲＮＡの各組合せについてのゲノム標的７０での相対編集効率を示す。図３８Ｂにおいて、頂部の線は、標的（図３８Ｂ、標的７０）を示し、次の行はガイド（図３８Ｂ、ｇＲＮＡ１およびｇＲＮＡ２）を表し、次の行はミスマッチのセット（図３８Ｂ、ｍｍセット１およびｍｍセット２）を特定しており、次の行はＦｏｋＩ−カスケードＲＮＰ複合体を示している。左側の列は、相対編集ガイド１−ｍｍセット１／ガイド２−ｍｍセット２についての、右側の列は、ガイド１−ｍｍセット２／ガイド２−ｍｍセット１についてのデータを示し、双方のデータの列は、相対編集効率パーセント（図３８Ｂ、相対編集ｅｆｆ（％）；スケール０〜１００）を示し、すなわち、左側の列は、ミスマッチ（ｍｍ）セット１および２を有するｇＲＮＡ₁およびｇＲＮＡ₂についてのデータを示し、そして右側の列は、同じであるが、ｇＲＮＡ₁とｇＲＮＡ₂との間でミスマッチ（ｍｍ）セットが交換された標的についてのデータを示す（ｎ＝１）。図３８Ｃは、標的７３での編集効率を示しており（ｎ＝１）、図３８Ｂ内のように表されている。

対形成されたｇＲＮＡ発現カセットをオリゴ鋳型ＰＣＲ増幅によって生成するスケーラブルな方法（本明細書中で記載される）（労働力を要するクローニング工程の必要を除外した）を開発した後に、ＦｏｋＩリンカーおよびＤＮＡスペーサー間長を、各相同体バリアントについて、９６個のゲノム標的部位のパネルにわたって再スクリーニングした。１７−ａａリンカーにより、ＦｏｋＩ−ＰｓｅＣａｓｃａｄｅは、おおよそ３０〜３３ｂｐのスペーサー間ウィンドウ内で平均約１５〜２５％の編集効率を一貫してもたらし、そして一部の標的は、最大約４０〜５０％のインデルを示した（図３７Ｃ）。類似の傾向が、他の相同体で観察された。ＰＡＭ必要条件を、１つのコグネイトＰＡＭおよび第２の突然変異ＰＡＭを保有するゲノム部位を標的化することによって調査した。ＰＡＭ認識は、インビトロで、厳格な５’−ＧＧ−３’化膿連鎖球菌（Ｓ．ｐｙｏｇｅｎｅｓ）ＰＡＭ必要条件よりもはるかにプロミスキャスであることが示されてきた（例えば、Ｓｚｃｚｅｌｋｕｎ，Ｍ．ら、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ１１１巻：９７９８〜９８０３頁（２０１４年）；Ｈａｙｅｓ，Ｒ．ら、Ｎａｔｕｒｅ５３０巻：４９９〜５０３頁（２０１６年）；非特許文献１３；Ｆｉｎｅｒａｎ，Ｐ．ら、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ１１１巻：Ｅ１６２９〜Ｅ１６３８頁（２０１４年）；Ｌｅｅｎａｙ，Ｒ．ら、Ｍｏｌ．Ｃｅｌｌ．６２巻：１３７〜１４７頁（２０１６年）参照）。驚くべきことに、インビトロデータは、多数のＰＡＭが活性について実際に寛容であることを実証し、明確な順位選好性が出現した（図３７Ｄ；図３９Ａ〜図３９Ｄ）。これに対して、突然変異ＰＡＭがＣＲＩＳＰＲアレイ由来の「自己」標的を示した場合、編集を完全に無効にした。

図３９Ａ〜図３９Ｄの各々において、垂直軸は、編集効率（編集効率（％））に相当し、そして水平軸は、標的に付随するＰＡＭ配列に相当する。図３９Ａは、ＰＡＭ配列の関数として、ＦｏｋＩ−ＰｓｅＣａｓｃａｄｅ編集効率を示す。ゲノム部位は、水平軸上に示すように、第２の半部位にて１つの固定ＡＴＧＰＡＭおよび可変ＰＡＭを含有した。バーは、平均およびｓ．ｄ．を示す（可変ＰＡＭあたり６〜１４個の部位、標的部位あたりｎ＝１）。なお、図３７Ｄは、ＦｏｋＩ−ＰｓｅＣａｓｃａｄｅについてのデータを記載しており、一方のＰＡＭがＡＡＧにて固定されており、そして他方のＰＡＭが、ＡＴＧを含む一セットのＰＡＭにわたって可変的である。ゆえに、当該ＰＡＭのサブセットは、ＡＡＧ−ＡＴＧである。図３９Ａは、ＦｏｋＩ−ＰｓｅＣａｓｃａｄｅについてのデータを記載しており、一方のＰＡＭがＡＴＧにて固定されており、そして他方のＰＡＭが、ＡＡＧを含む当該セットのＰＡＭにわたって可変的である（図３９Ａ、水平軸、左から右に、ＡＡＧ、ＡＡＣ、ＡＡＡ、ＡＴＧ、ＧＡＧ、ＡＴＡ、ＡＡＴ、およびＡＧＧ）。ゆえに、当該ＰＡＭのサブセットもまた、ＡＡＧ−ＡＴＧであり、そして図３７Ｄにおいて同じＡＡＧ−ＡＴＧ部位である。

図３９Ｂは、ＰＡＭ配列の関数として、ＦｏｋＩ−ＥｃｏＣａｓｃａｄｅ編集を示す（図３９Ｂ、水平軸、左から右に、ＣＣＧ、ＣＧＣ、ＡＡＧ、ＡＧＧ、ＡＴＧ、ＧＡＧ、ＡＡＡ、ＡＡＣ、ＡＴＡ、およびＡＡＴ）。固定ＰＡＭはＡＡＧであった。バーは、平均およびｓ．ｄ．を示す（可変ＰＡＭあたり６〜１５個の部位、標的部位あたりｎ＝１）。図３９Ｃ（図３９Ｃ、水平軸、左から右に、ＡＡＧ、ＡＴＧ、ＡＡＣ、ＡＡＡ、ＡＧＧ、ＧＡＧ、ＡＡＴ、およびＡＴＡ）は、図３９Ｂに示されるものと類似の分析を示すが、第１のＰＡＭを、ＡＴＧに固定した（可変ＰＡＭあたり６〜１４個の部位、標的部位あたりｎ＝１）。ＡＡＧ−ＡＴＧ対に相当する図３９Ｂ内のＡＴＧカラム（平均約３）は、ＡＡＧ−ＡＴＧ対に相当する図３９Ｃ内のＡＡＧカラム（平均約３）と同一である。なお、垂直軸は、異なるスケールのものである。図３９Ｄは、ＰＡＭ配列の関数として、ＦｏｋＩ−ＳｔｈＣａｓｃａｄｅ編集を示す（図３９Ｄ、水平軸、左から右に、ＣＣ、ＡＡ、ＧＡ、ＴＡ、およびＣＡ）。固定されたＰＡＭは、ＧＡＡであった。バーは、平均およびｓ．ｄ．を示す（可変ＰＡＭあたり１８〜３３個の部位；標的部位あたりｎ＝１）。

図４０Ａ、図４０Ｂ、図４０Ｃ、図４０Ｄ、図４０Ｅ、および図４０Ｆは、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓ複合体の編集効率の例示的な変化に関連するデータを示す。ｂｐのスペーサー間距離（水平軸）に対する編集効率パーセンテージ（垂直軸）について図４０Ａ（ＦｏｋＩ−ＰｓｅＣａｓｃａｄｅ）および図４０Ｄ（ＦｏｋＩ−ＳｔｈＣａｓｃａｄｅ）に示されるデータを、図４１Ａおよび図４１Ｃに示されるデータについて実施例２０Ｃに本質的に記載されるようにして得た。図４０Ａおよび図４０Ｄにおいて、水平軸は、２３〜３４ｂｐのスペーサー間距離を示し、そしてグラフのバーは、左から右に、１７ａａ（薄い灰色のバー）、２０アミノ酸（濃い灰色のバー）、および３０ａａ（白色のバー）のＦｏｋＩ−Ｃａｓ８ポリペプチドリンカー長である。図４０Ｃおよび図４０Ｆに示されるデータは、図３９Ｂについて本質的に記載されるようにして得た。図４０Ｃおよび図４０Ｆは、ＰＡＭ配列の関数として、ＦｏｋＩ−ＰｓｅＣａｓｃａｄｅおよびＦｏｋＩ−ＳｔｈＣａｓｃａｄｅ編集（図４０Ｃ、図４０Ｆ、垂直軸、編集効率（％））を示す（図４０Ｃ、左から右に、ＣＣＧ、ＣＧＣ、ＡＡＧ、ＡＡＡ、ＡＴＧ、ＡＡＣ、ＡＧＧ、ＡＴＡ、ＧＡＧ、およびＡＡＴ；図４０Ｆ、左から右に、ＣＣ、ＡＡ、ＧＡ、ＴＡ、およびＣＡ）。図４０Ｂは、ＦｏｋＩ−ＰｓｅＣａｓｃａｄｅＲＮＰ複合体を示す。ＦｏｋＩ−ＰｓｅＣａｓｃａｄｅについての固定ＰＡＭは、ＡＡＧであり（図４０Ｂ、ＡＡＧＰＡＭ）、そして他のＰＡＭは、一セットのＰＡＭ間で可変的である（図４０Ｂ、可変ＰＡＭ）。図４０Ｅは、ＦｏｋＩ−ＳｔｈＣａｓｃａｄｅＲＮＰ複合体を示す。ＦｏｋＩ−ＳｔｈＣａｓｃａｄｅについての固定ＰＡＭは、ＧＡＡであり（図４０Ｂ、ＧＡＡＰＡＭ）、そして他のＰＡＭは、一セットのＰＡＭ間で可変的である（図４０Ｅ、可変ＰＡＭ）。ＦｏｋＩ−ＰｓｅＣａｓｃａｄｅを、リンカーおよびインタースペーサーの選好性について再スクリーニングした。データは、ほぼ５０％の編集を実証した。また、ＰＡＭ選好性を調査した。このデータから、ＰＡＭのインビトロ順位選好性を判定した。本質的に同じ分析を、ストレプトコッカス・サーモフィルス（Ｓｔｒｅｐｔｏｃｏｃｃｕｓｔｈｅｒｍｏｐｈｉｌｕｓ）由来のバリアントについて実行した。編集は、Ｓ．サーモフィルス（Ｓ．ｔｈｅｒｍｏｐｈｉｌｕｓ）系において、より低かった。しかしながら、本明細書中で示されるデータは、インビボで、ヒト細胞において、Ｓ．サーモフィルス（Ｓ．ｔｈｅｒｍｏｐｈｉｌｕｓ）系についてのＰＡＭ選好性が非常にプロミスキャスであることを実証している。プロトスペーサー（すなわち、標的配列）の上流の単一のＡが、編集について寛容であったという事実は、通常、（例えば、同じ遺伝子内の潜在的クラス２ＩＩ型ＣＲＩＳＰＲ−Ｃａｓ９ＰＡＭが付随する標的部位の数と比較して）遺伝子内の潜在的標的配列の数の増大をもたらす。さらに、本明細書中で示されるインビボデータは、非特許文献１５によって実証されるインビトロＰＡＭ選好性と相関する。

何百もの編集されたゲノム部位にわたるＮＧＳデータの蓄積は、ＦｏｋＩ−ＰｓｅＣａｓｃａｄｅによって導入されたＤＳＢのＤＮＡ修復結果を特徴付ける能力を示した。インデル頻度が＞１０％である４０個のユニークな部位に焦点を合わせて、欠失および挿入の頻度を、予測された切断部位を包囲する５０ｂｐのウィンドウ内での総突然変異リードの関数として分析した。２〜４ｂｐの挿入が、高度に増量されて、調査した部位の大多数に存在した（図３７Ｅ）。詳細に調べると、これらの挿入の約９０％が、切断部位に隣接する配列の完全な重複を含有することが示された。特定のいかなる理論にも拘束されることを望むものではないが、そのような重複は、二量体ＦｏｋＩによって導入されたスタガー切断の鋳型修復の結果であるかもしれない。

ＦｏｋＩ−ＰｓｅＣａｓｃａｄｅの特異性は、２つの高効率標的部位を、対形成されたミスマッチｇＲＮＡの広範囲にわたるパネルで編集することによって、評価した（図３８Ａ）。カスケードの以前の研究は、約８ｎｔのＰＡＭ近位シード配列、および３２ｎｔのガイドｇＲＮＡ内の６位毎のミスマッチプロミスキュアティを強調してきた。これは、これらの塩基が、標的結合して直ぐに形成されたＲＮＡ−ＤＮＡヘテロ二重鎖構造からはじかれた（ｆｌｉｐｐｅｄｏｕｔｏｆ）ことに起因する（例えば、Ｊｕｎｇ，Ｃ．ら、Ｃｅｌｌ１７０巻：３５〜４７頁（２０１７年）；Ｍｕｌｅｐａｔｉ，Ｓ．ら、Ｓｃｉｅｎｃｅ３４５巻：１４７９〜１４８４頁（２０１４年）；Ｆｉｎｅｒａｎ，Ｐ．ら、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ１１１巻：Ｅ１６２９〜Ｅ１６３８頁（２０１４年）；Ｓｅｍｅｎｏｖａ，Ｅ．ら、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ１０８巻：１００９８〜１０１０３頁（２０１１年）参照）。ＰＡＭ近位シード領域内のミスマッチは、ゲノム編集にとって高度に有害であったが、ＰＡＭから遠位のミスマッチは、十分に許容されて、ほぼ野生型の編集効率に至った（図３８Ｂ；図３８Ｃ）。しかしながら、ミスマッチのブロックが双方の半部位内に存在した場合、編集は、試験した対形成されたｇＲＮＡのパネル全体にわたって劇的に減少した（図３８Ｂ、図３８Ｃ）。ＰＡＭに関するデータおよびＦｏｋＩ−ＰｓｅＣａｓｃａｄｅ媒介ゲノム編集のスペーサー間データ（図３８Ｃ；図３７Ｄ）に基づいて、本発明の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓ複合体の一利点は、標的化可能な部位が、ヒトゲノム内で、約２０〜約３０ｂｐ毎に存在し得るが、潜在的オフターゲット部位での編集がありそうもないことである。

したがって、本発明の一実施形態において、所定の操作されたＦｏｋＩ−カスケード系の、潜在的な標的化可能な部位、または「標的密度」は、その効率的なスペーサー間距離およびＰＡＭ選好性の関数であり、そして相同体にわたっていくつかの変異性を有することとなる。一部の実施形態において、以下の基準を用いて、ＦｏｋＩ−ＰｓｅＣａｓｃａｄｅ、ＦｏｋＩ−ＥｃｏＣａｓｃａｄｅ、およびＦｏｋＩ−ＳｔｈＣａｓｃａｄｅについて、ヒトゲノム内の標的密度を算出することができる（データを、予測される標的密度を算出するのに推定した）。

ＦｏｋＩ−ＰｓｅＣａｓｃａｄｅ、標的密度を、以下のモチーフを用いて算出することができる：
５’−［半部位₁−ＰＡＭ₁］−［スペーサー間］−［ＰＡＭ₂−半部位₂］−３’。

ここで、［半部位₁−ＰＡＭ₁］は、半部位₁ｇＲＮＡ₁標的−鎖標的配列およびＰＡＭのリバース相補体を表し、そして［半部位₂−ＰＡＭ₂］は、半部位₂ｇＲＮＡ₂非標的鎖ＰＡＭおよび標的−配列を表す。ＦｏｋＩ−ＰｓｅＣａｓｃａｄｅによる編集を支持したスペーサー間長の分布に基づいて（例えば、図３７Ｄ参照）、有効なスペーサー間長は、約３０〜３３ｂｐである。ＰＡＭは、最も高い編集を与えるセット１（ＡＡＧ、ＡＡＡ、ＡＴＧ、ＡＡＣ）、または活性を示す、試験したＰＡＭのいずれかを含有するならば、セット２（ＡＡＧ、ＡＧＧ、ＡＴＧ、ＧＡＧ、ＡＡＡ、ＡＡＣ、ＡＡＴ、ＡＴＡ）のいずれかに属すると定義した（例えば、図３９Ａ；図４０Ｂ参照）。このことから、２つのＰＡＭがセット１またはセット２のいずれかに属する好ましいスペーサー間長基準を満たす潜在的な標的部位が、平均してそれぞれ３３．４ｂｐまたは９．２ｂｐ毎に生じることとなる。

ＦｏｋＩ−ＥｃｏＣａｓｃａｄｅの標的密度を、スペーサー間長を３１〜３３と定義し、かつＰＡＭを、最も高い編集を与えるセット１（ＡＡＧ、ＡＧＧ、ＡＴＧ、ＧＡＧ、ＡＡＡ）、または活性を示す、試験したＰＡＭのいずれかを含有するならば、セット２（ＡＡＧ、ＡＧＧ、ＡＴＧ、ＧＡＧ、ＡＡＡ、ＡＡＣ、ＡＡＴ、ＡＴＡ）のいずれかに属すると定義したこと以外、同様に判定した（例えば、図３９Ｃ；図３９Ｄ参照）。このことから、潜在的な標的部位を、セット１ＰＡＭまたはセット２ＰＡＭで算出し、平均してそれぞれ３０．４ｂｐまたは１２．２ｂｐ毎に生じた。

ＦｏｋＩ−ＳｔｈＣａｓｃａｄｅのヒトゲノム標的密度を、スペーサー間長を２９〜３１ｂｐと定義し、かつＰＡＭをＮＮＡと定義したこと以外、同様に判定した（例えば、図３９Ｄ参照）。このことから、潜在的な標的部位は、平均して４ｂｐ毎に生じると算出された。

したがって、本明細書中に記載される操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓ複合体は、ゲノム編集に利用可能ないくつかのＰＡＭ隣接標的配列を用意することによって、種々の潜在的な標的部位を用意する方法を提供する。ゆえに、本発明の一実施形態は、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓ複合体と関連するＰＡＭ配列を用いて、（例えば、クラス２ＣＲＩＳＰＲ−ＣａｓＩＩ型またはＶ型系のＰＡＭ配列が付随する利用可能な標的配列の数と比較して）遺伝子内の利用可能な標的配列の数の増大をもたらす方法に関する。この方法の用途は、以下に限定されないが、標的配列への結合および／または切断、標的配列の突然変異、標的配列またはその調節要素に関連した転写調節、ならびに本明細書中に記載される操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓ複合体の使用によって媒介される（例えば、遺伝子の生成物内の）意図的な改変、変更、および／または著しく異なる構造的変更を含み得る操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓ複合体の使用に関する。

一部の実施形態において、本明細書中に記載される操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体を用いて、ゲノム内のＤＮＡ標的遺伝子座にて、選択されたポリヌクレオチド配列（例えば、ドナーポリヌクレオチドの一部）を部位特異的に導入して、ｇＤＮＡの改変、変更、および／または突然変異を生成することによって、非ヒトトランスジェニック生物を生成することができる。トランスジェニック生物は、動物であっても植物であってもよい。

トランスジェニック動物は、典型的に、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体を接合子細胞中に導入することによって生成される。トランスジェニックマウスの製造に関して記載される基本的な技術（例えば、Ｃｈｏ，Ａ．ら、「ＧｅｎｅｒａｔｉｏｎｏｆＴｒａｎｓｇｅｎｉｃＭｉｃｅ」、ＣｕｒｒｅｎｔＰｒｏｔｏｃｏｌｓｉｎＣｅｌｌＢｉｏｌｏｇｙ、ＣＨＡＰＴＥＲ．Ｕｎｉｔ−１９．１１（２００９年）参照）は、５つの基本的工程を伴う：第１に、本明細書中に記載される、適切なドナーポリヌクレオチドを含む系の調製工程；第２に、ドナー接合子の収穫工程；第３に、マウス接合子中への系のマイクロインジェクション工程；第４に、偽妊娠レシピエントマウス中への、微量注入した接合子の移植工程；そして第５に、創始者マウスにおいて確立されたｇＤＮＡの改変のジェノタイピングおよび分析を実行する工程。創始者マウスは、あらゆる後代に遺伝的改変を伝えることとなる。創始者マウスは、典型的に、導入遺伝子についてヘテロ接合性である。これらのマウス間の交配は、導入遺伝子について２５％の確率でホモ接合性であるマウスを生成することとなる。

トランスジェニック植物を生成する方法もまた周知であり、操作された１つのＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体を用いて適用することができる。（例えばアグロバクテリウム（Ａｇｒｏｂａｃｔｅｒｉｕｍ）属媒介形質転換を用いて）生成されたトランスジェニック植物は、典型的に、一染色体中に挿入された一導入遺伝子を含有する。単一の導入遺伝子を含有する独立した分離トランスジェニック植物をそれ自体と有性生殖で交配させる（すなわち、自殖させる）ことによって、導入遺伝子に関してホモ接合性であるトランスジェニック植物を生成することが可能である。典型的な接合性アッセイとして、以下に限定されないが、ホモ接合体とヘテロ接合体とを識別する単一のヌクレオチド多型アッセイおよび熱増幅アッセイが挙げられる。

第６の態様において、本発明は、基質チャネルを作出するための、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の使用に関する。一部の実施形態において、基質チャネル要素およびＣａｓ７サブユニットタンパク質を含む融合タンパク質が構築される。次に、当該Ｃａｓ７融合タンパク質は、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体（例えば、Ｃｓｅ２、Ｃａｓ５、Ｃａｓ６、Ｃａｓ７−基質チャネル要素融合体、およびＣａｓ８を含む）にアセンブルされる。一部の実施形態において、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体のｃｒＲＮＡを伸ばして、更なるＣａｓ７サブユニットに対応することができる（例えば、Ｌｕｏ，Ｍ．ら、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．４４巻：７３８５〜７３９４頁（２０１６年）参照）。様々な基質要素をＣａｓ７に融合させてから、所望される化学量論で混合することができる。これらの種々のＣａｓ７サブユニットが、完全なＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体にアセンブルすると、基質要素の共局在化が、基質チャネリングの効力を増強させ得る。

一部の実施形態において、複数のＣａｓ７−基質チャネル要素融合体が、他のＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体構成要素の非存在下で結合することができるようなＲＮＡ足場が構築される。

基質チャネル要素を、Ｃａｓ７のＮ末端および／またはＣａｓ７のＣ末端に融合させることができる。また、Ｃａｓ７の円順列置換を、基質チャネル要素に融合させることができる。

図１１Ａおよび図１１Ｂは、経路において３つの連続した酵素からなる基質チャネルのイラストを示す。基質チャネルは、代謝経路鎖内での連続した酵素の活性部位への直接的な中間代謝生成物の通過を、別のチャネル空間中に放出させることなく促進する。図１１Ａは、操作された基質チャネルの典型的な配置を示す。酵素Ｅ１、Ｅ２、およびＥ３は、足場タンパク質（Ｓ１、Ｓ２、Ｓ３）マトリックスに共有結合的に、または非共有結合的に相互作用する。両矢印は、酵素と足場タンパク質との間の相互作用（例えば、親和性相互作用）を表す。基質（Ｘ）は次に、別のチャネル空間に放出されることなくプロセシングされて、生成物（Ｙ）になる。図１１Ｂは、Ｃａｓ７サブユニットタンパク質への融合（すなわち、共有結合相互作用）タンパク質として酵素Ｅ１、Ｅ２、およびＥ３を有することで基質チャネルを作出する、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体を含む本発明の一実施形態を示す。ｃｐＣａｓ７タンパク質、およびｃｐＣａｓ７タンパク質で形成された骨格もまた、本発明のこの態様の実行に有用であり得る。

他の実施形態において、基質チャネル要素を、Ｃａｓ６に融合させることができる。カスケード複合体のＣａｓ６サブユニットは、特定のＲＮＡヘアピン構造を認識する。互いに連結される複数のＣａｓ６ＲＮＡヘアピン構造で構成されるＲＮＡ足場を構築することができる。異なるカスケード複合体由来のＣａｓ６ペプチドは、異なる認識配列を有する。したがって、ＲＮＡ足場を、複数の直交Ｃａｓ６ＲＮＡヘアピンから構築することができる。直交Ｃａｓ６ペプチドに異なる基質チャネル要素を融合させることによって、基質チャネル複合体を、特定の化学量論にてアセンブルすることができる。

基質チャネル要素を、Ｃａｓ６のＮ末端および／またはＣａｓ６のＣ末端に融合させることができる。また、Ｃａｓ６の円順列置換を、基質チャネル要素に融合させることができる。

一部の実施形態において、注目する異種代謝経路を、モデル生物、例えば大腸菌（Ｅ．ｃｏｌｉ）内で発現させることができる。遺伝子が異種発現される場合、より効率的に遺伝子を発現させるように遺伝子をコドン最適化することができる。

一実施形態において、注目する代謝経路は、出芽酵母（Ｓａｃｃｈａｒｏｍｙｃｅｓｃｅｒｅｖｉｓｉａｅ）由来のメバロン酸経路である。この経路の基質チャネル要素として、以下に限定されないが、アセトアセチル−ＣｏＡ−チオラーゼ（ＡｔｏＢ）、ヒドロキシ−メチルグルタリル−ＣｏＡシンターゼ（ＨＭＧS）、およびヒドロキシ−メチルグルタリル−ＣｏＡリダクターゼ（ＨＭＧＲ）が挙げられる。

別の実施形態において、注目する代謝経路は、出芽酵母（Ｓ．ｃｅｒｅｖｉｓｉａｅ）由来のグリセロール合成経路である。この経路の基質チャネル要素として、以下に限定されないが、グリセロール−３−リン酸デヒドロゲナーゼ（ＧＰＤ１）およびグリセロール−３−リン酸ホスファターゼ（ＧＰＰ２）が挙げられる。

さらに別の実施形態において、注目する代謝経路は、クロストリジウム・ステルコラリウム（Ｃｌｏｓｔｒｉｄｉｕｍｓｔｅｒｃｏｒａｒｉｕｍ）由来のデンプン加水分解経路である。この経路の基質チャネル要素として、以下に限定されないが、ＣｅｌＹおよびＣｅｌＺが挙げられる。

更なる実施形態において、注目する代謝経路は、大腸菌（Ｅ．ｃｏｌｉ）由来のグルコースホスホトランスフェラーゼ経路である。この経路の基質チャネル要素として、以下に限定されないが、トレハロース−６−リン酸シンセターゼ（ＴＰＳ）およびトレハロース−６−リン酸ホスファターゼ（ＴＰＰ）が挙げられる。

第７の態様において、本発明は、クラス２ＩＩ型Ｃａｓ９タンパク質および核酸−標的化核酸（ＮＡＴＮＡ）を含む複合体による、カスケードサブユニットタンパク質に融合した機能ドメインの部位特異的動員に関する。機能ドメインが本明細書中で開示されており、そして、以下に限定されないが、転写活性化できる、または転写抑制できる、酵素機能を有するタンパク質ドメインが挙げられる。実施例１３Ａおよび実施例１３Ｂは、クラス２ＩＩ型ＣＲＩＳＰＲｓｇＲＮＡ、ｃｒＲＮＡ、ｔｒａｃｒＲＮＡ、またはｃｒＲＮＡおよびｔｒａｃｒＲＮＡ配列を、クラス１Ｉ型ＣＲＩＳＰＲリピートステム配列で操作して、ＩＩ型ＣＲＩＳＰＲＣａｓタンパク質／ガイドＲＮＡ複合体結合部位への１つまたはそれ以上のカスケードサブユニットタンパク質の動員を可能にする方法を記載する。

図１２Ａ、図１２Ｂ、および図１２Ｃは、ｄＣａｓ９：ＮＡＴＮＡ複合体による、カスケードサブユニットタンパク質に融合した機能タンパク質ドメインの、標的部位への部位特異的動員の一般化したイラストを示す。スペーサー配列（図１２Ａ、１０１）を含むクラス２ＩＩ型ＣＲＩＳＰＲＮＡＴＮＡ（図１２Ａ、１０２）が、クラス１Ｉ型ＣＲＩＳＰＲリピートステム配列（図１２Ａ、１０４）に、リンカー核酸配列（図１２Ａ、１０３）を介して共有結合されている。Ｉ型ＣＲＩＳＰＲリピートステム配列に共有結合されたＩＩ型ＣＲＩＳＲＰＮＡＴＮＡ（図１２Ａ、１０５）は、ＩＩ型ｄＣａｓ９（図１２Ａ、１０６）およびＩ型カスケードサブユニットタンパク質（例えば、Ｃａｓ６；図１２Ａ、１０７）に結合することができ、これは、ＲＮＰ複合体を形成するように、リンカー配列（図１２Ａ、１０８）を介して機能タンパク質ドメイン（例えば、酵素ドメイン、転写活性化または抑制ドメイン；図１２Ａ、１０９）に融合されている。このＲＮＰ複合体（図１２Ｂ、１１０）は、ＩＩ型ＣＲＩＳＰＲＮＡＴＮＡスペーサー配列（図１２Ａ、１０１）と相補的な標的配列（図１２Ｂ、１１２）を含む二本鎖ＤＮＡ（図１２Ｂ、１１１）を標的化することができる。ＲＮＰ複合体による標的認識により、スペーサー配列（図１２Ａ、１０１）と標的配列（図１２Ｂ、１１２）との間のハイブリダイゼーション（図１２Ｂ、１１３）が生じる。ＤＮＡへのカスケードサブユニット−機能ドメイン融合タンパク質の局在化により、隣接する遺伝子（図１２Ｃ、１１４）の機能タンパク質ドメインまたは転写調節によるＤＮＡの改変が可能となる。

第８の態様において、本発明は、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体、操作されたガイドポリヌクレオチド、およびそれらの組合せを含む組成物に関する。一部の実施形態において、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体は、会合したＣａｓ３融合タンパク質を含む。野生型Ｉ型ＣＲＩＳＰＲ−Ｃａｓ系は、ＤＮＡ標的化用のカスケードエフェクター複合体およびプロセッシブ（ｐｒｏｃｅｓｓｉｖｅ）ＤＮＡ分解用のＣａｓ３ヘリカーゼ−ヌクレアーゼの作用の調整を必要とする。本発明の一実施形態において、Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体を操作して、ヌクレアーゼドメイン（例えば、非特異的ＦｏｋＩエンドヌクレアーゼドメイン）に複合体を融合させることによって、正確なＤＳＢを製造した。このアプローチは、介在配列（すなわち、スペーサー間）によって分けられた２つの半部位ＤＮＡ配列を標的化する対形成されたガイドポリヌクレオチドを用いる。

本発明のこの態様の実施形態は、それぞれがスペーサー、ならびにＣａｓサブユニットおよびエンドヌクレアーゼを含む融合タンパク質を含む２つの操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体（例えば、ＦｏｋＩ；例えば、図２Ａ、図２Ｂ、および図２Ｃのカスケード複合体参照）を含む組成物であって、少なくとも２つのパラメータが、ゲノム編集効率を調節するように変えられている組成物に関する。そのようなパラメータとして、以下が挙げられる：
Ｃａｓサブユニットタンパク質およびエンドヌクレアーゼ（例えば、ＦｏｋＩ）を含む融合タンパク質を生成するのに用いられるリンカーポリペプチドの長さ；ならびに
スペーサーが結合でできる核酸標的配列間のスペーサー間距離の長さ。

アミノ酸組成物および配列リンカーポリペプチドに関するガイダンスが、本明細書中で提供される。

本発明のこの態様の一実施形態は、組成物であって：
第１のＣｓｅ２サブユニットタンパク質、第１のＣａｓ５サブユニットタンパク質、第１のＣａｓ６サブユニットタンパク質、および第１のＣａｓ７サブユニットタンパク質と、
第１のＣａｓ８サブユニットタンパク質および第１のＦｏｋＩを含む第１の融合タンパク質であって、第１のＣａｓ８サブユニットタンパク質のＮ末端または第１のＣａｓ８サブユニットタンパク質のＣ末端は、第１のリンカーポリペプチドによって、第１のＦｏｋＩのＣ末端またはＮ末端にそれぞれ共有結合されており、第１のリンカーポリペプチドは、長さが約１０アミノ酸〜約４０アミノ酸である、第１の融合タンパク質と、
第１の核酸標的配列に結合することができる第１のスペーサーを含む第１のガイドポリヌクレオチドと
を含む第１の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体と；
第２のＣｓｅ２サブユニットタンパク質、第２のＣａｓ５サブユニットタンパク質、第２のＣａｓ６サブユニットタンパク質、および第２のＣａｓ７サブユニットタンパク質と、
第２のＣａｓ８サブユニットタンパク質および第２のＦｏｋＩを含む第２の融合タンパク質であって、第２のＣａｓ８サブユニットタンパク質のＮ末端または第２のＣａｓ８タンパク質のＣ末端は、第２のリンカーポリペプチドによって、第２のＦｏｋＩのＣ末端またはＮ末端にそれぞれ共有結合されており、第２のリンカーポリペプチドは、長さが約１０アミノ酸〜約４０アミノ酸である、第２の融合タンパク質と、
第２の核酸標的配列に結合することができる第２のスペーサーを含む第２のガイドポリヌクレオチドと
を含む第２の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体と
を含み、
第２の核酸標的配列のプロトスペーサー隣接モチーフ（ＰＡＭ）および第１の核酸標的配列のＰＡＭは、スペーサー間距離が約２０塩基対〜約４２塩基対である、組成物である。

そのような第１の核酸標的配列に結合された第１の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体および第２の核酸標的配列に結合された第２の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の例が、図２Ａ、図２Ｂ、および図２Ｃに示されている。

一部の実施形態において、第１のリンカーポリペプチドおよび／または第２のリンカーポリペプチドの長さは、約１５アミノ酸〜約３０アミノ酸、または約１７のアミノ酸〜約２０アミノ酸の長さである。一実施形態において、第１のリンカーポリペプチドと第２のリンカーポリペプチドの長さは、同じである。

第１のＣａｓ８サブユニットタンパク質および第２のＣａｓ８サブユニットタンパク質はそれぞれ、Ｃａｓ８サブユニットタンパク質の同一のアミノ酸配列を含んでよい。

同様に、第１のＣｓｅ２サブユニットタンパク質および第２のＣｓｅ２サブユニットタンパク質は、それぞれＣｓｅ２サブユニットタンパク質の同一のアミノ酸配列を含んでよく、第１のＣａｓ５サブユニットタンパク質および第２のＣａｓ５サブユニットタンパク質は、それぞれＣａｓ５サブユニットタンパク質の同一のアミノ酸配列を含んでよく、第１のＣａｓ６サブユニットタンパク質および第２のＣａｓ６サブユニットタンパク質は、それぞれＣａｓ６サブユニットタンパク質の同一のアミノ酸配列を含んでよく、第１のＣａｓ７サブユニットタンパク質および第２のＣａｓ７サブユニットタンパク質は、それぞれＣａｓ７サブユニットタンパク質の同一のアミノ酸配列を含んでよく、そしてこれらは組み合わされる。

典型的には、第１のＣａｓ８サブユニットタンパク質のＮ末端は、第１のリンカーポリペプチドによって、第１のＦｏｋＩのＣ末端に共有結合されており、第１のＣａｓ８サブユニットタンパク質のＣ末端は、第１のリンカーポリペプチドによって、第１のＦｏｋＩのＮ末端に共有結合されており、第２のＣａｓ８サブユニットタンパク質のＮ末端は、第２のリンカーポリペプチドによって、第２のＦｏｋＩのＣ末端に共有結合されており、第２のＣａｓ８サブユニットタンパク質のＣ末端は、第２のリンカーポリペプチドによって、第２のＦｏｋＩのＮ末端に共有結合されており、そしてこれらは組み合わされる。

本発明のこの態様の実施形態は、第２の核酸標的配列と第１の核酸標的配列との間の長さが、約２２塩基対〜約４０塩基対、約２６塩基対〜約３６塩基対、約２９塩基対〜約３５塩基対、または約３０塩基対〜約３４塩基対のスペーサー間距離である実施形態を含む。

第１のＦｏｋＩおよび第２のＦｏｋＩは、会合してホモダイマーを形成することができるモノマーサブユニットであってもよいし、会合してヘテロダイマーを形成することができる互いに異なるサブユニットであってもよい。

好ましい実施形態において、ガイドポリヌクレオチドは、ＲＮＡを含む。

一部の実施形態において、ｇＤＮＡは、第２の核酸標的配列のＰＡＭおよび第１の核酸標的配列のＰＡＭを含む。

一部の実施形態において、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体は、サルモネラ・エンテリカ（Ｓａｌｍｏｎｅｌｌａｅｎｔｅｒｉｃａ）、ゲオサーモバクター（Ｇｅｏｔｈｅｒｍｏｂａｃｔｅｒ）属種（ＥＰＲ−Ｍ株）、メタノケッラ・アルボリザエ（Ｍｅｔｈａｎｏｃｅｌｌａａｒｖｏｒｙｚａｅ）ＭＲＥ５０、ストレプトコッカス・サーモフィルス（Ｓｔｒｅｐｔｏｃｏｃｃｕｓｔｈｅｒｍｏｐｈｉｌｕｓ）、（例えば、ストレプトコッカス・サーモフィルス（Ｓｔｒｅｐｔｏｃｏｃｃｕｓｔｈｅｒｍｏｐｈｉｌｕｓ）（ＮＤ０７株））、シュードモナス（Ｐｓｅｕｄｏｍｏｎａｓ）属種Ｓ−６−２、および大腸菌（Ｅ．ｃｏｌｉ）からなる群から選択される１つまたはそれ以上の生物のＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体に基づく。好ましい実施形態において、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体は、ストレプトコッカス・サーモフィルス（Ｓｔｒｅｐｔｏｃｏｃｃｕｓｔｈｅｒｍｏｐｈｉｌｕｓ）、（例えば、ストレプトコッカス・サーモフィルス（Ｓｔｒｅｐｔｏｃｏｃｃｕｓｔｈｅｒｍｏｐｈｉｌｕｓ）（ＮＤ０７株））、シュードモナス（Ｐｓｅｕｄｏｍｏｎａｓ）属種Ｓ−６−２、および／または大腸菌（Ｅ．ｃｏｌｉ）のＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体に基づく。シュードモナス（Ｐｓｅｕｄｏｍｏｎａｓ）属種Ｓ−６−２は、大腸菌（Ｅ．ｃｏｌｉ）相同体よりも約１０倍高い編集効率を誘導し、そして試験した他の相同体のおおよそ半分が、大腸菌（Ｅ．ｃｏｌｉ）と同等の活性を示した。このことは、多様なＩ型系由来の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体を、ヒト細胞内でのゲノム編集に機能的に用いることができることを実証している。

実施例１８Ａ、実施例１８Ｂ、実施例１８Ｃ、実施例１８Ｄ、実施例２０Ａ、実施例２０Ｂ、および実施例２０Ｃに示されるデータは、Ｃａｓサブユニットタンパク質およびＦｏｋＩを含む融合タンパク質を生成するのに用いられるリンカーポリペプチドの長さを変えること、かつ／またはスペーサーが結合できる核酸標的配列間のスペーサー間距離の長さを変えることで、細胞内でのゲノム編集効率の調節が促進されることを実証している。

さらに別の実施形態において、本発明は、カスケードサブユニットタンパク質（例えば、Ｃａｓ８サブユニットタンパク質）および第１の機能ドメイン（例えば、ＦｏｋＩ）を含む第１の融合タンパク質、ならびにｄＣａｓ３^*タンパク質および第２の機能ドメイン（例えば、ＦｏｋＩ）を含む第２の融合タンパク質を含む操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体に関する（図１３Ａ：Ｃａｓ７、Ｃａｓ５、Ｃａｓ８、Ｃｓｅ２、およびＣａｓ６、Ｃａｓ６周りの破線のボックスは、ｃｒＲＮＡヘアピンとの相互作用を示す；ｃＲＮＡは、黒色の線として示されており、ヘアピンを含む）。第１の機能ドメイン（例えば、ＦｏｋＩ）を含む操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体（図１３Ａ、Ｃａｓ８−リンカー１−ＦＰ１融合体）は、ＤＮＡに結合することができ、次いで、ｄＣａｓ３^*−第２の機能ドメイン（例えば、ＦｏｋＩ）融合タンパク質（図１３Ａ、ｄＣａｓ３^*−リンカー２−ＦＰ２）を動員することができる。第１の機能ドメイン（図１３Ａ、Ｃａｓ８−リンカー１−ＦＰ１融合体）および第２の機能ドメイン（図１３Ａ、ｄＣａｓ３^*−リンカー２−ＦＰ２）が二量体タンパク質のサブユニットを含む場合には、ｄＣａｓ３^*第２の機能ドメイン（例えば、ＦｏｋＩ）融合タンパク質は、第１の機能ドメイン（例えば、ＦｏｋＩ）を含む操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体に結合して、第１の機能ドメインおよび第２の機能ドメインの二量体化を促進する（図１３Ａ）。図１４Ａは、リンカーポリペプチド（図１４Ａ、リンカー１）を介してＣａｓサブユニットタンパク質（図１４Ａ、ストライプのボックス）に連結された第１の機能ドメイン（図１４Ａ、ＦＤ１）、およびカスケード複合体と会合したリンカーポリペプチド（図１４Ａ、リンカー２）を介して第２の機能ドメイン（図１４Ａ、ＦＤ２）に連結されたｄＣａｓ３^*を含む（然るに、ＦＤ１およびＦＤ２を近接させて、ＦＤ１およびＦＤ２の相互作用を促進する）操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体（図１４Ａ、カスケード）の、ｄｓＤＮＡへの結合を示す。カスケード複合体の結合は、単一のＰＡＭ配列（図１４Ａ、ＰＡＭ、空白のボックス）を伴う。図１４Ａにおいて、ｄｓＤＮＡは、対形成された、水平の破線として示されている。二量体エンドヌクレアーゼである機能ドメイン（例えば、ＦｏｋＩ）の場合、ＦＤ１およびＦＤ２の付近は、機能ダイマーの形成を促進する。

本発明のこの実施形態の一利点は、単一のカスケード複合体（単一のＰＡＭ配列を認識する）を、２つのＦｏｋＩ−カスケード複合体を用いることに対して（図１４Ａを、図２Ａ、図２Ｂ、および図２Ｃと比較して）、二本鎖核酸標的配列を切断するのに用いることができることである。２つのＦｏｋＩ−カスケード複合体を用いるには、適切な向きの２つのＰＡＭ配列（図２Ａ、図２Ｂ、および図２Ｃ）を必要とし、これらは近位の核酸標的配列の選択を制限し得る。

Ｃａｓサブユニットタンパク質およびエンドヌクレアーゼ（例えば、ＦｏｋＩ）を含む融合タンパク質を生成するのに用いたリンカーポリペプチドの長さおよび／または組成、ならびにｄＣａｓ３^*タンパク質およびエンドヌクレアーゼを含む融合タンパク質を生成するのに用いたリンカーポリペプチドの長さおよび／または組成を変動させて、ゲノム編集効率を調節することができる。実施例２１Ａ、実施例２１Ｂ、実施例２１Ｃ、および実施例２１Ｄは、ゲノム編集効率の調節のための、複数のＣａｓ３−ＦｏｋＩリンカーの組成および長さ、ならびにＦｏｋＩ−Ｃａｓ８リンカーの組成および長さの設計および試験を記載している。

本発明のこの態様の別の実施形態は、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体（図１３Ｂ：Ｃａｓ７、Ｃａｓ５、Ｃａｓ８、Ｃｓｅ２、およびＣａｓ６；Ｃａｓ６周りの破線のボックスは、ｃｒＲＮＡヘアピンとの相互作用を示す；ｃＲＮＡは、黒色の線として示されており、ヘアピンを含む）、ならびにリンカーポリペプチド（図１３Ｂ、リンカー）によって連結されたｄＣａｓ３^*タンパク質（図１３Ｂ、ｄＣａｓ３^*）および機能ドメイン（図１３Ｂ、ＦＰ）（例えば、シチジンデアミナーゼ）を含む融合タンパク質を含む。操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体は、ＤＮＡに結合して、ｄＣａｓ３^*−機能ドメイン（例えば、シチジンデアミナーゼ）融合タンパク質を動員することができる。この実施形態は、機能ドメインによって、またはこれと相互作用して、改変のための核酸標的配列の部位特異的標的化を促進することができる。シチジンデアミナーゼの場合、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体、ならびにｄＣａｓ３^*タンパク質およびシチジンデアミナーゼを含む融合タンパク質は、核酸標的配列内での部位特異的塩基編集に用いることができる。図１４Ｂは、リンカーポリペプチド（図１４Ｂ、リンカー）を介して機能ドメイン（図１４Ｂ、ＦＤ）と連結されたｄＣａｓ３^*タンパク質（図１４Ｂ、ｄＣａｓ３^*）を含む融合タンパク質を含む操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体（図１４Ｂ、カスケード）の例を示しており、複合体は、ｄｓＤＮＡ（図１４Ｂ、対形成された、水平の破線）に結合されている。図１４Ｂにおいて、ｄｓＤＮＡとの機能ドメインの接触が促進される。カスケード複合体の結合は、単一のＰＡＭ配列（図１４Ｂ、ＰＡＭ、空白のボックス）を伴う。図１４Ｃは、リンカーポリペプチド（図１４Ｃ、リンカー）を介して機能ドメイン（図１４Ｃ、ＦＤ）と連結されたｄＣａｓ３^*タンパク質（図１４Ｃ、ｄＣａｓ３^*）を含む融合タンパク質を含む操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体（図１４Ｃ、カスケード）の別の例を示しており、複合体は、ｄｓＤＮＡ（図１４Ｃ、対形成された、水平の破線）に結合されている。カスケード複合体の結合は、単一のＰＡＭ配列（図１４Ｃ、ＰＡＭ、空白のボックス）を伴う。図１４Ｃにおいて、ｓｓＤＮＡとの機能ドメインの接触が促進される。

Ｉ型ＣＲＩＳＰＲ−Ｃａｓサブユニットタンパク質との融合タンパク質を構築するのに用いることができる更なる機能ドメインおよびタンパク質が、本明細書および実施例に記載されている。Ｃａｓ３−リンカーポリペプチド機能ドメイン融合タンパク質についてのリンカーポリペプチドの組成および長さは、機能ドメインの性能に及ぼす作用を評価するための実施例２１Ａ〜実施例２１Ｄおよび本明細書のガイダンスに従って評価することができる。

本発明の一部の実施形態は、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体およびｍＣａｓ３タンパク質を用いてよく、ｍＣａｓ３タンパク質は、下方調節されたヘリカーゼ活性（例えば、Ｃａｓ３プロセッシビティ突然変異タンパク質であるｍＣａｓ３タンパク質は、野生型Ｉ型ＣＲＩＳＰＲＣａｓ３タンパク質と比較して、ＤＮＡに沿う移動が低減している）を含み、またはｍＣａｓ３タンパク質は、ヘリカーゼ活性が欠如している（例えば、ｍＣａｓ３タンパク質は、もはやプロセッシブヌクレアーゼ様ｗｔＣａｓ３タンパク質でないが、ｍＣａｓ３タンパク質は、ニッキング活性を保持している）。操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体は、ＤＮＡに結合することができ、次いで、ｍＣａｓ３タンパク質を動員することができる。この実施形態は、ゲノムＤＮＡの部位特異的切断を促進することができる。

表４８は、いくつかのｍＣａｓ３タンパク質を記載しており、Ｃａｓ３タンパク質になされた突然変異は、ヘリカーゼドメインのＡＴＰ結合／加水分解領域またはヘリカーゼドメインのｓｓＤＮＡ経路保存領域に影響を与えた。図４４は、ＥｃｏＣａｓ３タンパク質の機能ドメイン、およびＣａｓ３コード配列内になされた突然変異の相対位置の線形の表示を示している。図４４において、ＨＤヌクレアーゼドメイン（アミノ酸１〜２７２）、ヘリカーゼドメイン、（ＲｅｃＡ１領域、アミノ酸２７３〜５２１；ＲｅｃＡ２領域、アミノ酸５２２〜７３７）、リンカー（アミノ酸７３８〜７９４）、およびＣ末端ドメイン（ＣＴＤ、アミノ酸７９５〜８８８）が示されている。Ｈｕｏ，Ｙ．ら、Ｎａｔ．Ｓｔｒｕｃｔ．Ｍｏｌ．Ｂｉｏｌ．９巻：７７１〜７７７頁（２０１４年）は、サーモビフィダ・フスカ（Ｔｈｅｒｍｏｂｉｆｉｄａｆｕｓｃａ）（受託コード：Ｑ４７ＰＪ０；配列番号１８６９）、サッカロモノスポラ・ビリディス（Ｓａｃｃｈａｒｏｍｏｎｏｓｐｏｒａｖｉｒｉｄｉｓ）（Ｃ７ＭＴＡ６；配列番号１８７０）、サーモモノスポラ・クルバータ（Ｔｈｅｒｍｏｍｏｎｏｓｐｏｒａｃｕｒｖａｔａ）（Ｄ１Ａ６Ｑ２；配列番号１９２２）、ストレプトマイセス・アベルミティリス（Ｓｔｒｅｐｔｏｍｙｃｅｓａｖｅｒｍｉｔｉｌｉｓ）（Ｑ８２５Ｂ５；配列番号１９２５）、ストレプトマイセス・ボトロペンシス（Ｓｔｒｅｐｔｏｍｙｃｅｓｂｏｔｔｒｏｐｅｎｓｉｓ）（Ｍ３ＤＩ１３；配列番号１９２３）、サーマス・サーモフィルス（Ｔｈｅｒｍｕｓｔｈｅｒｍｏｐｈｉｌｕｓ）株ＨＤ８（Ｑ５３ＶＹ２；配列番号１９２４）、および大腸菌（Ｅ．ｃｏｌｉ）（Ｐ３８０３６；配列番号１８４４）由来のタンパク質のＣａｓ３ファミリーの配列アラインメントによる配列保存分析を記載している。ヘリカーゼドメインまたはｓｓＤＮＡループ結合ドメインのＡＴＰ結合部分内に突然変異を有する２４の異なるＥｃｏＣａｓ３タンパク質バリアントをスクリーニングした（実施例２３Ａ〜実施例２３Ｃ）。いくつかの突然変異体が、アンプリコンウィンドウ内に有意に多い、かつ／または位置がシフトした欠失クラスを示した；ｍＣａｓ３タンパク質は、ｗｔＣａｓ３と比較して、プロセッシビティが低減したことを支持することが見出された。

実施例２３Ａ〜実施例２３Ｃは、そのようなｍＣａｓ３タンパク質を記載しており、平均のｍＣａｓ３タンパク質誘導欠失は、対応するｗｔＣａｓ３タンパク質で生じた平均の欠失と比較して、より短い。そのようなｍＣａｓ３タンパク質は、（例えば、ヒト細胞内での）ゲノム編集に有用である。図４５Ａ、図４５Ｂ、図４５Ｃ、および図４５Ｄは、ｍＣａｓ３タンパク質が、カスケードＲＮＰ複合体と会合すると、ヒト細胞中に導入されて、その中で発現された場合に、カスケードＲＮＰ複合体と会合したｗｔＣａｓ３タンパク質と比較して、より短い平均欠失長を生じることを示すデータを示す。本明細書の教示を鑑みて、当業者であれば、大腸菌（Ｅ．ｃｏｌｉ）の他に細菌の他の種から得られるＣａｓ３タンパク質の対応する領域内で、類似の突然変異を形成することができる。

実施例２６Ａ〜実施例２６Ｃが、ゲノム欠失を生成するのに有用なｍＣａｓ３タンパク質の更なる例を記載しており、平均のｍＣａｓ３タンパク質誘導欠失は、対応するｗｔＣａｓ３タンパク質で生じた平均の欠失と比較して、より短い。実施例において示されるデータは、シュードモナス（Ｐｓｅｕｄｏｍｏｎａｓ）属種Ｓ−６−２（ｍＰｓｅＣａｓ３タンパク質）由来のＣａｓ３のＡＴＰアーゼ／ヘリカーゼ欠損バリアントを、ＰｓｅＣａｓｃａｄｅＲＮＰ複合体に用いて、予想される切断部位での欠失（すなわち、切断部位局在化欠失）を生成することができることを支持している。

ｗｔＰｓｅＣａｓ３タンパク質／ＰｓｅＣａｓｃａｄｅ活性を、さらに特徴付けた。更なる実験を、標的−富化プローブを用いて実行した。これにより、大きなゲノム欠失の検出が可能となる。具体的には、ＨＥＫ２９３細胞を、実施例２６Ａ〜実施例２６Ｃに本質的に記載されるように、ＰｓｅＣａｓｃａｄｅＲＮＰ複合体、ｗｔＰｓｅＣａｓ３タンパク質、およびＴＲＡＣ遺伝子座に向けられる最小ＣＲＩＳＰＲアレイをコードするＤＮＡ鋳型で形質移入した。標的−富化プローブを用いて、ゲノムフラグメントを単離かつ配列決定した；一方で、実施例２６Ｃにおいて、アンプリコンウィンドウを用いて、欠失の存在を同定した。標的−富化／配列決定方法は、アンプリコンウィンドウを用いて欠失を同定することによって提供されない、より大きな欠失の先入観のないビューを提供した。全体として、標的−富化、およびゲノムフラグメントの配列決定を用いて評価した欠失が、ｗｔＰｓｅＣａｓ３タンパク質開始部位の上流で始まって、大部分は一方向性であることが見出された。欠失は、１ｂｐ〜ほぼ２５０ｋｂに及んだ。ゲノムＤＮＡを切断する方法を提供し、かつ所定の長さの欠失を提供することに加えて、当該方法は、定義された位置にて大きな、ランダムなサブセットの欠失を生成して、遺伝子の調節／プロモーター領域を探査するのに有用であり得る。

ｍＣａｓ３タンパク質は、１つまたはそれ以上の突然変異（例えば、表４８に記載される突然変異の組合せ）を含んでもよい。

欠失長の制御を、いくつかのｍＣａｓ３タンパク質について実証した。一部の実施形態において、ガイドポリヌクレオチドを含むカスケード複合体と会合した本発明のｍＣａｓ３タンパク質は、約１〜約６００塩基対、約１〜約５００塩基対、約１〜約４００塩基対、約１〜約３００塩基対、好ましくは約１〜約２５０塩基対、約１〜約２００塩基対、または約１〜約１００塩基対の平均欠失長をもたらし得る。

一部の実施形態において、ｗｔＣａｓ３タンパク質またはｍＣａｓ３タンパク質は、カスケード複合体の種々のサブユニットに融合して、Ｃａｓ３平均欠失長をさらに制御することができる。カスケード複合体へのテザリングが、Ｃａｓ３タンパク質またはｍＣａｓ３タンパク質の、ＤＮＡに沿う移動を制限または防止し得る。なぜなら、カスケード複合体が結合している遺伝子座に固定されることとなるからである。ｗｔＣａｓ３タンパク質またはｍＣａｓ３タンパク質を、典型的にはリンカーポリペプチドにより、カスケード複合体のタンパク質構成要素のＮまたはＣ末端ドメインのいずれかに融合させることができる（例えば、ＥｃｏＣａｓｃａｄｅ複合体について、融合は、ＥｃｏＣａｓ８、ＥｃｏＣａｓ６、またはＥｃｏＣａｓ５によることがある）。また、ＮＬＳ配列を、融合タンパク質のＮ末端に添えてもよい。大腸菌（Ｅ．ｃｏｌｉ）カスケードタンパク質構成要素についてのそのような構築体の例が、表１２に示されている。また、これらのＥｃｏＣａｓ３融合タンパク質は、それらのＮ末端にＮＬＳ配列が添えられている。

本発明の実施形態は、野生型Ｉ型ＣＲＩＳＰＲＣａｓ３タンパク質（ｗｔＣａｓ３タンパク質）と比較して、ＤＮＡに沿う移動を低減できる操作されたＩ型ＣＲＩＳＰＲｍＣａｓ３タンパク質を含む。一部の実施形態において、ｍＣａｓ３タンパク質は、対応するｗｔＣａｓ３タンパク質との配列同一性が、約９０％またはそれ以上、好ましくは約９５％またはそれ以上、より好ましくは約９８％またはそれ以上である。ｍＣａｓ３タンパク質についてのコード配列は、アミノ末端、カルボキシ末端、またはアミノおよびカルボキシ末端の双方にて共有結合された核局在化シグナルを含んでもよい。ｍＣａｓ３タンパク質は、ヘリカーゼ活性を下方調節する１つまたはそれ以上の突然変異を含んでよく、操作されたｍＣａｓ３タンパク質は、対応するｗｔＣａｓ３タンパク質と比較して、ヌクレアーゼ活性（または少なくともその一部）を保持する。典型的には、ＤＮＡは、核酸標的配列を含む標的領域を含むｄｓＤＮＡである。ｗｔＣａｓ３タンパク質が、対応するカスケード核タンパク質複合体と会合し（「カスケードＮＰ複合体／ｗｔＣａｓ３タンパク質」；例えば、カスケードＲＮＰ複合体）、そしてカスケードＮＰ複合体が、核酸標的配列と相補的なスペーサーを含むガイドを含む場合、カスケードＮＰ複合体／ｗｔＣａｓ３タンパク質の、核酸標的配列への結合が、ＤＮＡの標的領域内の切断を促進して、典型的には標的領域内の欠失をもたらし；そしてｍＣａｓ３タンパク質は、カスケードＮＰ複合体と会合し（「カスケードＮＰ複合体／ｍＣａｓ３タンパク質」；例えば、カスケードＲＮＰ複合体／ｍＣａｓ３タンパク質）、かつ核酸標的配列に結合した場合、ＤＮＡの標的領域内の切断を促進して、ｗｔＣａｓ３平均欠失長と比較してより短い平均欠失長をもたらす。

一部の実施形態において、ｍＣａｓ３タンパク質内の１つまたはそれ以上の突然変異は、ｗｔＣａｓ３タンパク質と比較したアミノ酸の置換である。他の実施形態において、１つまたはそれ以上の欠失は、ｗｔＣａｓ３タンパク質と比較した、ｍＣａｓ３タンパク質コード配列におけるアミノ酸の欠失または挿入を含む。１つまたはそれ以上の突然変異は、ヘリカーゼドメインのＲｅｃＡ１領域内にあってもＲｅｃＡ２領域内にあってもよい。一実施形態において、１つまたはそれ以上の突然変異は、ｗｔＣａｓ３タンパク質と比較して、ｓｓＤＮＡへのｍＣａｓ３タンパク質の結合を下方調節する（例えば、ｓｓＤＮＡループ結合に影響を与える突然変異および／またはヘリカーゼドメインのｓｓＤＮＡ経路保存領域内の突然変異）。更なる実施形態において、１つまたはそれ以上の突然変異は、ｗｔＣａｓ３タンパク質と比較して、ｍＣａｓ３タンパク質によるＡＴＰの加水分解を下方調節し、またはｗｔＣａｓ３タンパク質と比較して、ｍＣａｓ３タンパク質へのＡＴＰの結合を下方調節する。更なる実施形態において、ｍＣａｓ３タンパク質は、ｗｔＣａｓ３タンパク質と比較して、ｓｓＤＮＡへのｍＣａｓ３タンパク質の結合を下方調節し、ｍＣａｓ３タンパク質によるＡＴＰの加水分解を下方調節し、またはｗｔＣａｓ３タンパク質と比較して、ｍＣａｓ３タンパク質へのＡＴＰの結合を下方調節する１つまたはそれ以上の突然変異の組合せを含む。

更なる実施形態は、カスケード核タンパク質複合体（例えば、カスケードＲＮＰ複合体）のＣａｓタンパク質のコード配列のアミノ末端またはカルボキシ末端に共有結合されたｍＣａｓ３タンパク質についてのコード配列を含む。そのようなＣａｓタンパク質は、Ｃｓｅ２、Ｃａｓ８タンパク質、Ｃａｓ７タンパク質、Ｃａｓ６、およびＣａｓ５タンパク質からなる群から選択することができる。

一部の実施形態において、ｗｔＣａｓ３タンパク質は、大腸菌（Ｅ．ｃｏｌｉ）Ｉ型ＣＲＩＳＰＲＣａｓ３タンパク質である。他の実施形態において、ｗｔＣａｓ３タンパク質は、シュードモナス（Ｐｓｅｕｄｏｍｏｎａｓ）属種Ｓ−６−２、サーモビフィダ・フスカ（Ｔｈｅｒｍｏｂｉｆｉｄａｆｕｓｃａ）、サッカロモノスポラ・ビリディス（Ｓａｃｃｈａｒｏｍｏｎｏｓｐｏｒａｖｉｒｉｄｉｓ）、サーモモノスポラ・クルバータ（Ｔｈｅｒｍｏｍｏｎｏｓｐｏｒａｃｕｒｖａｔａ）、ストレプトマイセス・アベルミティリス（Ｓｔｒｅｐｔｏｍｙｃｅｓａｖｅｒｍｉｔｉｌｉｓ）、ストレプトマイセス・ボトロペンシス（Ｓｔｒｅｐｔｏｍｙｃｅｓｂｏｔｔｒｏｐｅｎｓｉｓ）、サーマス・サーモフィルス（Ｔｈｅｒｍｕｓｔｈｅｒｍｏｐｈｉｌｕｓ）、コレラ菌（Ｖｉｂｒｉｏｃｈｏｌｅｒａ）、サルモネラ・エンテリカ（Ｓａｌｍｏｎｅｌｌａｅｎｔｅｒｉｃａ）、ゲオサーモバクター（Ｇｅｏｔｈｅｒｍｏｂａｃｔｅｒ）属種ＥＰＲ−Ｍ、メタノケッラ・アルボリザエ（Ｍｅｔｈａｎｏｃｅｌｌａａｒｖｏｒｙｚａｅ）ＭＲＥ５０、およびストレプトコッカス・サーモフィルス（Ｓｔｒｅｐｔｏｃｏｃｃｕｓｔｈｅｒｍｏｐｈｉｌｕｓ）（ＮＤ０７株）からなる群から選択されるｗｔＣａｓ３タンパク質である。

大腸菌（Ｅ．ｃｏｌｉ）Ｉ型ＣＲＩＳＰＲｗｔＣａｓ３タンパク質について、１つまたはそれ以上の突然変異として、以下に限定されないが、Ｄ４５２Ｈ、Ａ６０２Ｖ、またはＤ４５２ＨおよびＡ６０２Ｖを挙げることができる。

更なる実施形態において、細胞は、ＤＮＡを含み、当該細胞は、真核細胞（例えば、ヒト細胞）であってもよい。

更なる実施形態において、本発明は、ｍＣａｓ３タンパク質についてのコード配列を含むポリヌクレオチド、ｍＣａｓ３タンパク質コード配列を含む発現カセット、ｍＣａｓ３タンパク質コード配列を含むプラスミド、およびｍＣａｓ３タンパク質を含むカスケード核タンパク質複合体を含む。

第９の態様において、本発明は、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体を用いる方法に関する。

一部の実施形態において、本発明は、ポリヌクレオチド（例えば、ｄｓＤＮＡ）内の核酸標的配列に結合する方法であって、細胞または生化学反応中への導入のための、１つまたはそれ以上の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体を用意して、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体を細胞または生化学反応中に導入することによって、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の、ポリヌクレオチドとの接触を促進することを含む方法を含む。複合体の、ポリヌクレオチドとの接触により、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の、ポリヌクレオチド内の核酸標的配列への結合が生じる。

一実施形態において、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体は、ポリヌクレオチド内の核酸標的配列と相補的なガイドを含む。操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体は、ポリヌクレオチド内の核酸標的配列に結合する。

更なる実施形態において、第１の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体が、ポリヌクレオチド内の第１の核酸標的配列と相補的なガイドを含み、そして第２の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体が、ポリヌクレオチド内の第２の核酸標的配列と相補的なガイドを含む。第１の操作された１つのＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体は、第１の核酸標的配列に結合し、そして第２の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体は、ポリヌクレオチド内の第２の核酸標的配列に結合する。

さらに別の実施形態において、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体が、ポリヌクレオチド内の核酸標的配列と相補的なガイドを含み、そしてさらに、複合体と会合することができるｄＣａｓ３^*融合タンパク質を含む。操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体は、ポリヌクレオチド内の核酸標的配列に結合し、そしてエフェクター複合体は、複合体と会合したｄＣａｓ３^*融合タンパク質を含む。

核酸標的配列に結合するそのような方法は、インビトロで（例えば、生化学反応内で、または培養細胞内で；一部の実施形態において、培養細胞は、培養中の、ヒトに導入されていないヒト培養細胞である）；インビボで（例えば、生存生物（但し、一部の実施形態において、生物は非ヒト生物であることを条件とする）の細胞内で）；またはエクスビボで（例えば、対象から取り出された細胞（但し、一部の実施形態において、対象は、ヒト対象を含み、そして他の実施形態において、対象は、非ヒト対象であることを条件とする））実行することができる。

核酸配列とポリペプチドとの間の相互作用を評価かつ／または定量化する種々の方法が、当該技術において知られており、以下に限定されないが：免疫沈降（ＣｈＩＰ）アッセイ、ＤＮＡ電気泳動運動能シフトアッセイ（ＥＭＳＡ）、ＤＮＡプルダウンアッセイ、ならびにマイクロプレートキャプチャおよび検出アッセイが挙げられる。これらの方法の多くを実行するための市販のキット、材料、および試薬が利用可能であり、例えば、以下の供給者から得ることができる：ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ（Ｗｉｌｍｉｎｇｔｏｎ、ＤＥ）、Ｓｉｇｎｏｓｉｓ（ＳａｎｔａＣｌａｒａ、ＣＡ）、Ｂｉｏ−Ｒａｄ（Ｈｅｒｃｕｌｅｓ、ＣＡ）、およびＰｒｏｍｅｇａ（Ｍａｄｉｓｏｎ、ＷＩ）。ポリペプチドと核酸配列との間の相互作用を検出するための一般的なアプローチとして、ＥＭＳＡがある（例えば、ＨｅｌｌｍａｎＬ．Ｍ．ら、ＮａｔｕｒｅＰｒｏｔｏｃｏｌｓ２巻：１８４９〜１８６１頁（２００７年）参照）。

別の実施形態において、本発明は、ポリヌクレオチド内の核酸標的配列を切断する方法であって（例えば、ｄｓＤＮＡ内の一本鎖切断またはｄｓＤＮＡ内の二本鎖切断）、細胞または生化学反応中への導入のための、１つまたはそれ以上の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体を用意して、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体を、細胞または生化学反応中に導入することによって、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の、ポリヌクレオチドとの接触を促進することを含む方法を含む。

一実施形態において、ポリヌクレオチド内の第１の核酸標的配列と相補的なガイド、および第１のヌクレアーゼドメイン（例えば、ＦｏｋＩ）を含む第１の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体（図１５Ａ、カスケード１、実線の輪郭のボックス、リンカーポリペプチド（黒色の曲線）を介して、第１のヌクレアーゼドメイン（扇形として表される）に連結されている）、ならびにポリヌクレオチド内の第２の核酸標的配列と相補的なガイド、および第２のヌクレアーゼドメイン（例えば、ＦｏｋＩ）を含む第２の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体（図１５Ａ、カスケード２、破線の輪郭のボックス、リンカーポリペプチド（黒色の曲線）を介して、第２のヌクレアーゼドメイン（扇形として表される）に連結されている）が、細胞または生化学反応中に導入される。第１の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体（図１５Ｂ、カスケード１）は、ｄｓＤＮＡ（図１５Ｂ、ｄｓＤＮＡ、対形成された、黒色の水平の線によって表される）内の第１の核酸標的配列に結合し、そして第１のヌクレアーゼドメインは、ｄｓＤＮＡの第１の鎖を切断し（図１５Ｃ、カスケード１）、そして第２の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体（図１５Ｂ、カスケード２）は、ｄｓＤＮＡ内の第２の核酸標的配列に結合し、そして第２のヌクレアーゼドメインは、ｄｓＤＮＡの第２の鎖を切断する。操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の結合は、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体によって、ポリヌクレオチド（例えば、ｄｓＤＮＡ）内の核酸標的配列の切断をもたらす。

更なる実施形態において、ポリヌクレオチド内の第１の核酸標的配列と相補的なガイドを含む第１の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体、ポリヌクレオチド内の第２の核酸標的配列と相補的なガイドを含む第２の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体、およびＣａｓ３ニッカーゼ（例えば、ニッカーゼ活性のみを有するＡＴＰアーゼ欠損Ｃａｓ３バリアント）が、細胞または生化学反応中に導入される。第１の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体は、ｄｓＤＮＡ内の第１の核酸標的配列に結合し、Ｃａｓ３ニッカーゼタンパク質は、第１の複合体と会合して、ｄｓＤＮＡの第１の鎖を切断し、そして第２の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体は、ｄｓＤＮＡ内の第２の核酸標的配列に結合し、Ｃａｓ３ニッカーゼタンパク質は、第２の複合体と会合して、ｄｓＤＮＡの第２の鎖を切断する。Ｃａｓ３ニッカーゼタンパク質が会合した、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の結合は、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体によって、ポリヌクレオチド（例えば、ｄｓＤＮＡ）内の核酸標的配列の切断をもたらす。実施例２５Ａ、実施例２５Ｂ、および実施例２５Ｃは、Ｃａｓ３ＡＴＰアーゼ欠損突然変異タンパク質を含むカスケードＲＮＰ複合体が、対形成されたニッキングによる標的化されたゲノム欠失を誘導することができることを実証するデータを示す。この対形成されたニッキングは、宿主細胞（例えば、ヒト細胞）のゲノム内で、標的化された欠失を促進することができる。

別の実施形態において、ポリヌクレオチド内の核酸標的配列と相補的なガイド、および第１のヌクレアーゼドメイン（例えば、ＦｏｋＩ）を含む操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体（図１６Ａ、カスケード；破線の輪郭のボックス、リンカーポリペプチド（黒色の曲線）を介して、第１のヌクレアーゼドメイン（扇形として表される）に連結されている）、ならびに複合体と会合することができるｄＣａｓ３^*−第２のヌクレアーゼドメイン（例えば、ＦｏｋＩ）融合タンパク質（図１６Ａ、ｄＣａｓ３；実線の輪郭のボックス、リンカーポリペプチド（黒色の曲線）を介して、第２のヌクレアーゼドメイン（扇形として表される）に連結されている）が、細胞または生化学反応中に導入される。操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体（図１６Ｂ、カスケード）は、ｄｓＤＮＡ（図１６Ｂ、対形成された、黒色の水平の線）内の核酸標的配列に結合して、ｄｓＤＮＡの第１の鎖を切断し（図１６Ｃ、カスケード）、そしてｄＣａｓ３^*融合タンパク質は、カスケードＲＮＰ複合体と会合して（図１６Ｂ、ｄＣａｓ３^*）、ｄｓＤＮＡの第２の鎖を切断する（図１６Ｃ、ｄＣａｓ３^*）。

更なる実施形態において、ポリヌクレオチド内に核酸標的配列を含む標的領域と相補的なガイドを含む操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体、および当該複合体と会合することができるＣａｓ３タンパク質（例えば、Ｃａｓ３タンパク質またはｍＣａｓ３タンパク質）が、細胞または生化学反応中に導入される。操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体は、ｄｓＤＮＡ内の核酸標的配列に結合し、Ｃａｓ３タンパク質（例えば、Ｃａｓ３タンパク質またはｍＣａｓ３タンパク質）は、複合体と会合して、標的領域内のｄｓＤＮＡの少なくとも１本の鎖を切断する。一部の実施形態において、ｍＣａｓ３タンパク質によるｄｓＤＮＡの切断は、ｄｓＤＮＡの標的領域内の欠失をもたらす。この方法は、特定の長さの広範囲の欠失を形成するのに用いることができ、そして遺伝子ノックアウトまたはノックインの作出に有用であり得る。一部の実施形態において、Ｃａｓ３タンパク質（例えば、Ｃａｓ３タンパク質またはｍＣａｓ３タンパク質）を、カスケード複合体サブユニットタンパク質（例えば、Ｃａｓ７タンパク質、Ｃａｓ８タンパク質、Ｃａｓ５タンパク質、Ｃｓｅ２タンパク質）に融合させることができる。実施例２３Ａ〜実施例２３Ｃは、ｍＣａｓ３タンパク質の実施形態を記載している。

別の実施形態において、本発明は、Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体を用いることに関し、核酸標的配列を欠失させるために、ヌクレアーゼドメインが、カスケード複合体タンパク質（例えば、実施例１１Ａ、表３８参照）に、またはｄＣａｓ３^*タンパク質（例えば、ＤＮａｓｅに融合したｄＣａｓ３^*タンパク質）に融合されている。この方法は、ｄｓＤＮＡの標的領域内の切断および欠失を形成するのに用いることができ、そして遺伝子ノックアウトの作出に有用であり得る。一部の実施形態において、ヌクレアーゼドメインを、カスケード複合体サブユニットタンパク質、例えば、Ｃａｓ７タンパク質、Ｃａｓ８タンパク質、Ｃａｓ５タンパク質、Ｃｓｅ２タンパク質に融合させることができる。

ポリヌクレオチド内の核酸標的配列を切断する方法がさらに、細胞のｇＤＮＡ中へのドナーポリヌクレオチドの少なくとも一部の組込みを促進するための、細胞中へのドナーポリヌクレオチドの導入を含んでもよい。

図１７Ａは、ポリヌクレオチド内の第１の核酸標的配列と相補的なガイドおよび第１のヌクレアーゼドメイン（例えば、ＦｏｋＩ）（図１７Ａ、カスケード１に連結している曲線として示されているリンカーポリペプチド、および灰色の扇形）を含む第１の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体（図１７Ａ、カスケード１）、ならびにポリヌクレオチド内の第２の核酸標的配列と相補的なガイドおよび第２のヌクレアーゼドメイン（例えば、ＦｏｋＩ）（図１７Ａ、カスケード２に連結している曲線として示されるリンカーポリペプチド、および灰色の扇形）を含む第２の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体（図１７Ａ、カスケード２）によって切断されているｄｓＤＮＡの双方の鎖（図１７Ａ、対形成された、暗い水平の線）の例を示している。図１７Ｂは、二本鎖切断された部位に隣接するＤＮＡ配列（図１８Ｂ、ドナー、破線）と相補的な相同アームを含むドナーポリヌクレオチド（図１７Ｂ、カスケード２の上方に示される対形成された破線）を示している。図１７Ｃは、二本鎖切断された部位の領域内での、ドナーポリヌクレオチドの一部（図１７Ｃ、ｄｓＤＮＡを表す対形成された、暗い水平の線を連結する対形成された破線）の組込みを示す。ドナーポリヌクレオチドの組込みは、細胞ＤＮＡ修復機構（例えば、ＨＤＲ）によって媒介される（図１７Ｂ〜図１７Ｃ、下向きに指している垂直な矢印は、細胞ＤＮＡ修復機構を表す）。

他の実施形態において、ポリヌクレオチド内の第１の核酸標的配列と相補的なガイド、および第１のヌクレアーゼドメインを含む操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体は、第２のヌクレアーゼドメインを含む第２の構成要素と対形成することができ、第２の構成要素は、ポリヌクレオチド内の第２の核酸標的配列に結合することができる。そのような第２の構成要素の例として、第２のヌクレアーゼドメインを含む転写アクチベーター様エフェクターヌクレアーゼ（ＴＡＬＥＮ）、第２のヌクレアーゼドメインを含むジンクフィンガーヌクレアーゼ（ＺＦＮ）、または第２のヌクレアーゼドメインを含むｄＣａｓ９／ＮＡＴＮＡ複合体が挙げられる。

一実施形態において、標的ポリヌクレオチド（例えば、ｇＤＮＡ）の領域を、標的ポリヌクレオチド内の第１の核酸標的配列と相補的なガイドを含むカスケード複合体と、ｄＣａｓ９／ＮＡＴＮＡ複合体との組合せを用いて欠失させることができ、ＮＡＴＮＡは、標的ポリヌクレオチド内の第２の核酸標的配列と相補的なスペーサー配列を含む。第１および第２の核酸標的配列は、欠失のために標的化された核酸標的配列に隣接するように選択される。活性エンドヌクレアーゼ活性を含むＣａｓ３タンパク質が、カスケード複合体と会合してから、欠失のために標的化された核酸標的配列を含むｄｓＤＮＡの一本鎖を、次第に欠失させる。Ｃａｓ３タンパク質がｄＣａｓ９／ＮＡＴＮＡ複合体（すなわち、「ロードブロック」）と衝突すると、Ｃａｓ３ヌクレアーゼ活性は、ｄＣａｓ９／ＮＡＴＮＡ複合体によって第２の核酸標的配列にて停止し得る。図２１Ａ〜図２１Ｄは、核酸標的配列のＣａｓ３欠失の例を示す。図２１Ａは、欠失のために標的化された核酸標的配列に隣接する核酸標的配列１（図２１Ａ、ＮＡＴＳ１）および核酸標的配列２（図２１Ａ、ＮＡＴＳ２）を含むｄｓＤＮＡ（図２１Ａ、対形成された、黒色の水平の線）を示す。図２１Ａは、ＮＡＴＳ１と相補的なガイドを含むカスケード複合体（図２１Ａ、カスケード；黒色の線のフレームの矩形）、Ｃａｓ３タンパク質（図２１Ａ、Ｃａｓ３；灰色の扇形）、およびＮＡＴＳ２と相補的なスペーサーを含むｄＣａｓ９／ＮＡＴＮＡ複合体（図２１Ａ、ｄＣａｓ９；破線のフレームの矩形）を示している。図２１Ｂは、ＮＡＴＳ１へのカスケード複合体の結合、カスケード複合体とのＣａｓ３タンパク質の会合、およびＮＡＴＳ２へのｄＣａｓ９／ＮＡＴＮＡ複合体の結合を示す。図２１Ｃは、欠失のために標的化された核酸標的配列の一本鎖の、Ｃａｓ３による漸進的欠失を示す。図２１Ｄは、ＮＡＴＳ２に結合したｄＣａｓ９／ＮＡＴＮＡ複合体の位置での、ｄｓＤＮＡからのＣａｓ３タンパク質の解離を示す。実施例２４Ａ〜実施例２４Ｄは、カスケード核タンパク質複合体と会合したＣａｓ３タンパク質によって媒介される欠失の長さを制御するためのタンパク質ロードブロックの使用を支持するデータを示している；このように、カスケード核タンパク質複合体と会合したＣａｓ３タンパク質を用いて、細胞（例えば、ヒト細胞）のｇＤＮＡ内で、長さが定義された欠失の形成を促進する方法が提供される。

別の実施形態において、標的ポリヌクレオチド（例えば、ｇＤＮＡ）の領域を、標的ポリヌクレオチド内の第１の核酸標的配列と相補的なガイドを含む第１のカスケード複合体と、標的ポリヌクレオチド内の第２の核酸標的配列と相補的なガイドを含む第２のカスケード複合体との組合せを用いて欠失させることができる。第１および第２の核酸標的配列は、欠失のために標的化された核酸標的配列に隣接するように選択される。活性エンドヌクレアーゼ活性を含むＣａｓ３タンパク質が、各カスケード複合体と会合してから、欠失のために標的化された核酸標的配列の双方の鎖を、次第に欠失させる。各Ｃａｓ３タンパク質がカスケード複合体の１つと衝突すると、Ｃａｓ３ヌクレアーゼ活性は、カスケード複合体によって第１および第２の核酸標的配列にて停止し得る。図２２Ａ〜図２２Ｄは、核酸標的配列の双方の鎖のＣａｓ３欠失の例を示す。図２２Ａは、欠失のために標的化された核酸標的配列に隣接する核酸標的配列１（図２２Ａ、ＮＡＴＳ１）および核酸標的配列２（図２２Ａ、ＮＡＴＳ２）を含むｄｓＤＮＡ（図２２Ａ；対形成された、黒色の水平の線）を示す。図２２Ａは、ＮＡＴＳ１と相補的なガイドを含む第１のカスケード複合体（図２２Ａ、カスケード１；黒色の線のフレームの矩形）、Ｃａｓ３タンパク質（図２２Ａ、Ｃａｓ３；灰色の扇形）、およびＮＡＴＳ２と相補的なガイドを含む第２のカスケード複合体（図２２Ａ、カスケード２；破線のフレームの矩形）を示す。図２２Ｂは、ＮＡＴＳ１およびＮＡＴＳ２へのカスケード複合体の結合、ならびにカスケード複合体とのＣａｓ３タンパク質の会合を示す。図２２Ｃは、欠失のために標的化された核酸標的配列の双方の鎖の、Ｃａｓ３によるＤＮＡおよびヌクレアーゼ分解に沿う移動に由来する漸進的欠失を示す。図２２Ｄは、ＮＡＴＳ１およびＮＡＴＳ２に結合したカスケード複合体の位置での、ｄｓＤＮＡからのＣａｓ３タンパク質の解離を示す。

更なる実施形態において、カスケード複合体を、Ｃａｓ３タンパク質に結合することができないように改変することができ、そしてそのような改変カスケード複合体は、図２１Ａ〜図２１Ｄにおいて示されるのと本質的に同じようにして、カスケードＲＮＰ複合体と会合した、触媒活性のあるＣａｓ３によるＤＮＡの漸進的分解を停止するロードブロックとして作用することができる。更なる部位特異的結合タンパク質（例えば、転写アクチベーター様エフェクター（ＴＡＬ）またはジンクフィンガー（ＺｎＦ）ＤＮＡ結合タンパク質）を、同様にロードブロックとして用いることができる。

一部の実施形態において、核酸標的配列は、ｄｓＤＮＡ（例えば、ゲノム）ＤＮＡである。一部の実施形態において、核酸標的配列は、二本鎖であり、そして鎖の一方または双方が切断される。核酸標的配列を切断するそのような方法を、インビトロで、インビボで、またはエクスビボで実行することができる。

先で述べたように、一部の実施形態において、本発明は、ドナーポリヌクレオチドの存在下で、ｄｓＤＮＡ内の核酸標的配列の切断を促進するための、宿主細胞中への１つまたはそれ以上の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の導入に関し、１つまたはそれ以上の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体は、宿主細胞ＤＮＡの核酸標的配列を含む標的領域内に切断部位（または切断部位および関連する欠失）を生成することによって、標的領域中へのドナーポリヌクレオチドの少なくとも一部の挿入を促進する。一部の実施形態において、切断部位は、標的領域内の二本鎖切断である（例えば、スペーサー、ならびにＣａｓタンパク質およびエンドヌクレアーゼ（例えば、ＦｏｋＩ）を含む融合タンパク質を各々含む２つの操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体、またはＣａｓ３タンパク質もしくはｍＣａｓ３タンパク質と会合するスペーサーを各々含む２つの操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体を用いる場合）。一部の実施形態において、切断部位は、標的領域内の一本鎖切断である（例えば、ｍＣａｓ３タンパク質と会合したＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体を用いる場合）。他の実施形態において、切断部位は、標的領域内の欠失である（例えば、Ｃａｓ３またはｍＣａｓ３タンパク質と会合したＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体を用いる場合）。

相同組換え修復（ＨＤＲ）を実証するために、ヒトゲノム内の４つの遺伝子座（ＷＤＲ９２、Ｂ２Ｍ、ＣＣＲ５、およびＴＲＡＣ）に対してＦｏｋＩ−ＰｓｅＣａｓｃａｄｅＲＮＰ複合体を標的化するように、最小ＣＲＩＳＰＲアレイを設計した。最小ＣＲＩＳＰＲアレイを、３つのオリゴヌクレオチド（配列番号１５１３〜配列番号１５１５；実施例２０Ａ）、および「リピート−スペーサー−リピート−スペーサー−リピート」配列をコードするユニークなプライマーを用いたＰＣＲベースのアセンブリーで生成し、第１および第２のスペーサーは、ＦｏｋＩ−ＰｓｅＣａｓｃａｄｅＲＮＰ複合体を、隣接する核酸標的配列に向けて、ＦｏｋＩ二量体化およびゲノム切断（すなわち、切断部位の生成）を可能にした。

切断部位を含む標的領域内の各ＨＤＲ挿入部位（この場合、切断部位と重複する）について、細胞を以下で形質移入した：ＮＬＳがＦｏｋＩのＮ末端に連結されたＣａｓ８のＮ末端に融合したＦｏｋＩを含むＦｏｋＩ−ＰｓｅＣａｓｃａｄｅ複合体タンパク質構成要素をコードする３μｇのベクター、１５０ｎｇの最小ＣＲＩＳＰＲアレイ、およびＨＤＲのための０〜６０ｐｍｏｌの一本鎖オリゴデオキシヌクレオチド（ｓｓＯＤＮ）鋳型ドナーポリヌクレオチド。ｓｓＯＤＮは、相同アームを含み、各相同アームは、７５ヌクレオチドであり、そして２本のアームを、切断部位の周りに対称的に位置決めした。ドナーポリヌクレオチドはさらに、ドナーポリヌクレオチドの細胞分解を低減させ、または妨げるために、相同アームの３’末端のヌクレオチドにホスホロチオアート結合を含んだ。ホスホロチオエート結合の５’に、ドナーポリヌクレオチドはさらに、２つの終止コドンを挿入するための、そして修復される染色体内のスペーサー間距離を増大させることで、ＦｏｋＩ−ＰｓｅＣａｓｃａｄｅＲＮＰ複合体の再切断を妨げるための「ＴＡＡＴＡＡＴ」の挿入配列を含んだ。

形質移入を、ＨＤＲを可能にするために混合物内にｓｓＯＤＮを含めたこと以外は、実施例２０Ｂに本質的に記載されるようにＨＥＫ２９３細胞内で実行した。形質移入の数日後に、ｇＤＮＡを細胞から精製して、エキソヌクレアーゼで処理して、以降のＰＣＲに混入する虞があるいかなる残留ｓｓＯＤＮも除去してから、ドナー挿入を測定するための増幅用の鋳型として用いた。ディープシーケンシング分析を、実施例２０Ｃに本質的に記載されるように実行した。この実験由来の総リード中の突然変異リードのパーセンテージを、表１３に示す（第１列は、ｓｓＯＤＮのｐｍｏｌである）：

突然変異リードのパーセンテージは、非相同末端結合に由来するインデル、および「ＴＡＡＴＡＡＴ」ＨＤＲ配列の挿入を含有する突然変異リードを示す。

「ＴＡＡＴＡＡＴ」挿入配列のみを含有する、この実験由来の総突然変異リード中のＨＤＲリードのパーセンテージを、表１４に示す（第１の列は、ｓｓＯＤＮのｐｍｏｌである）：

データから分かるように、カスケードＲＮＰ複合体によるｄｓＤＮＡの切断は、ヒトゲノムの全体にわたる複数の遺伝子座にて、ドナーポリヌクレオチドのＨＤＲおよび組込みを可能にする。

さらに別の実施形態において、本発明は、細胞または生化学反応内のポリヌクレオチド（例えば、ＤＮＡ）内の１つまたはそれ以上の核酸標的配列を改変する方法であって、細胞または生化学反応中への導入用の１つまたはそれ以上の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体（例えば、Ｃａｓサブユニットタンパク質−シチジンデアミナーゼ融合タンパク質を含む）を用意することと、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体を、細胞または生化学反応中に導入することによって、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の、ポリヌクレオチドとの接触を促進して、ポリヌクレオチド内の核酸標的配列への操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の結合をもたらして、核酸標的配列の突然変異（例えば、ＣからＴ、ＧからＡ、ＡからＧ、そしてＴからＣ）を促進することとを含む方法を含む。図１８Ａ〜図１８Ｄは、Ｃａｓサブユニットタンパク質−リンカーポリペプチド−シチジンデアミナーゼ融合タンパク質（カスケード／ＣＤ複合体）を含むカスケード複合体を用いて、細胞のｇＤＮＡ内の標的ヌクレオチドを突然変異させる例を示している（図１８Ａ、対形成された暗い水平の線、シトシンについて「Ｃ」、グアニンについて「Ｇ」）。カスケード／ＣＤ複合体（図１８Ａ；「カスケード」は、カスケード、および灰色の扇形として表されるシチジンデアミナーゼ「ＣＤ」を連結する曲線として示されるリンカーポリペプチドを有する）が、細胞中に導入される。カスケード／ＣＤ複合体は、標的シトシン（図１８Ｂ、「Ｃ」）に隣接するＤＮＡ標的配列と相補的なガイドを含む。図１８Ｂにおいて、カスケード／ＣＤ複合体は、ＤＮＡ標的配列に結合し、そしてシチジンデアミナーゼは、シトシン（図１８Ｂ、「Ｃ」）をウラシル（図１８Ｃ、「Ｕ」）に変換する。次に、細胞の修復機構は、ウラシルをチミジンに修復し、そしてミスマッチしたグアニジンをアデニンに変えることができる（図１８Ｃ〜図１８Ｄ、下向きに指している垂直な矢印は、細胞ＤＮＡ修復機構を表す）。

さらに別の実施形態において、本発明は、インビトロまたはインビボの転写、例えば、調節要素配列を含む遺伝子の転写を調節する方法を含む。そのような方法は、細胞または生化学反応中への導入のための、１つまたはそれ以上の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体（例えば、Ｃａｓサブユニットタンパク質−転写因子融合タンパク質を含む）を用意することと、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体を、細胞または生化学反応中に導入することによって、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の、調節要素配列との接触を促進して、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の、調節要素配列への結合をもたらすことによって、調節要素配列を含む遺伝子のインビトロ、またはインビボでの転写の調節を促進することとを含む。

図１９Ａおよび図１９Ｂは、包括的な遺伝子（「遺伝子１」）の転写活性化についての、例となる一般的なイラストを示す。図１９Ａは、真核細胞内の内因性遺伝子の転写調節の概要を示す。図１９Ａにおいて、２本の暗い平行線は、二本鎖ＤＮＡを表し、遺伝子１（図１９Ａ、遺伝子１）の位置、および遺伝子１と関連する転写開始部位（図１９Ａ、ＴＳＳ）が示されている。図１９Ａの第１のパネルにおいて、遺伝子１の転写活性化に必要とされる転写因子（図１９Ａ、ＴＦ）、およびポリメラーゼＩＩ（図１９Ａ、ＰｏｌＩＩ）が、遺伝子１−ＴＳＳとまだ会合していない状態で示されている。第２のパネルは、ＴＦの、そのコグネイトＴＳＳとの会合を示す。次に、ＴＦは、転写活性化タンパク質（図１９Ａ、ＴＰ）を動員し、これはその後、ＲＮＡポリメラーゼＩＩ（図１９Ａ、ＰｏｌＩＩ）を動員する。典型的に、真核生物において、ＴＦ因子およびＴＰは、複数のタンパク質、およびおそらく他の分子を含む複合体を形成する。第３のパネルは、ＰｏｌＩＩによる、遺伝子１の結果として生じる転写を示す（図１９Ａ、遺伝子１の終端の曲がった矢印は、転写の方向を示す）。このタイプの転写活性化は、典型的に、遺伝子の発現に特異的であるＴＦに依存する。図１９Ｂは、本発明の一実施形態のイラストを示しており、カスケード複合体が、転写活性化を担う細胞内の１つまたはそれ以上の構成要素（転写活性化因子；図１９Ｂ、ＴＡ）を誘引するタンパク質または因子（図１９Ｂ、ＣＡＳＣＡＤＥａ）を含むように操作されている。そのようなタンパク質または因子の例として、タンパク質ＶＰ６４がある。ＣＡＳＣＡＤＥａは、ＴＳＳ（図１９Ｂ、ＴＳＳ）に、またはその近くに結合することができるガイドを含む。図１９Ｂにおいて、２本の暗い平行線は、二本鎖ＤＮＡを表し、遺伝子１（図１９Ｂ、遺伝子１）の位置、および遺伝子１と関連する転写開始部位（ＴＳＳ）が示されている。図１９Ｂの第１のパネルにおいて、ＣＡＳＣＡＤＥａおよびポリメラーゼＩＩ（図１９Ｂ、ＰｏｌＩＩ）が、遺伝子１−ＴＳＳとまだ会合していない状態で示されている。第２のパネルは、ＣＡＳＣＡＤＥａの、その標的、ＴＳＳとの会合を示す。次に、ＣＡＳＣＡＤＥａは、転写活性化タンパク質（図１９Ｂ、ＴＡ）を動員し、これはその後、ＲＮＡポリメラーゼＩＩ（図１９Ｂ、ＰｏｌＩＩ）を動員する。第３のパネルは、ＰｏｌＩＩによる、遺伝子１の結果として生じる転写を示す（図１９Ｂ、遺伝子１の終端の曲がった矢印は、転写の方向を示す）。本発明のこの実施形態の一利点は、遺伝子の転写活性化が、遺伝子のＴＳＳに結合する内因性転写因子に依存するのではなく、遺伝子のＴＳＳを、適切なカスケードガイドの選択によって標的化することができることである。

図２０Ａおよび図２０Ｂは、Ｃａｓサブユニットタンパク質−ＫＲＡＢドメイン融合体、および遺伝子１と関連する調節配列（図２０Ａ、プロモーター）と相補的なガイドを含むカスケード複合体（図２０Ａ、曲線として示されるリンカーポリペプチドが、カスケード、およびＫＲＡＢドメインを表す環状要素を連結しているＣＡＳＣＡＤＥｉ）を用いた、包括的遺伝子（図２０Ａ、遺伝子１）の転写抑制についての、例となる一般的なイラストを示す。ＣＡＳＣＡＤＥｉの、調節配列への結合（図２０Ｂ）が、遺伝子１の転写抑制をもたらす（図２０Ｂ、Ｘで終わる暗い線は、転写抑制を示す）。

本明細書中に記載される、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体を、キット中に組み込むことができる。一部の実施形態において、キットは、１つまたはそれ以上のコンテナがキット要素を、１つもしくはそれ以上の別個の組成物として、または場合により、構成要素の適合性が許すならば、混合物として保持する、パッケージを含む。一部の実施形態において、キットはまた、以下の賦形剤の１つまたはそれ以上を含む：バッファ、緩衝剤、塩、滅菌水溶液、保存剤、およびそれらの組合せ。実例となるキットは、１つもしくはそれ以上の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体、および１つもしくはそれ以上の賦形剤、または操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の１つもしくはそれ以上の構成要素をコードする１つもしくはそれ以上の核酸配列を含んでもよい。

さらに、キットは、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体組成物を用いるための説明書をさらに含んでもよい。

本発明の別の態様は、１つまたはそれ以上の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体、またはその構成要素を作製または製造する方法に関する。一実施形態において、作製または製造する方法は、細胞内での操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の生成、および細胞溶解液からの操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の精製を含む。

操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体組成物はさらに、検出可能な標識、例えば、検出可能なシグナルを提供することができる部分を含んでもよい。検出可能な標識の例として、以下に限定されないが、酵素、放射性同位体、特異的結合対のメンバー、フルオロフォア（ＦＡＭ）、蛍光タンパク質（緑色蛍光タンパク質（ＧＦＰ）、赤色蛍光タンパク質、ｍＣｈｅｒｒｙ、ｔｄＴｏｍａｔｏ）、適切なフルオロフォアと一緒のＤＮＡまたはＲＮＡアプタマー（増強ＧＦＰ（ｅＧＦＰ）、「Ｓｐｉｎａｃｈ」）、量子ドット、および抗体等が挙げられる。多数の、そして種々の適切な検出可能な標識が、当業者に周知である。

一部の実施形態において、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体（すなわち、核タンパク質粒子）は、以下に限定されないが、ヌクレオフェクション、遺伝子ガン送達、ソノポレーション、細胞スクイージング、リポフェクション、または他の化学物質、細胞透過ペプチド等の使用を含む方法によって細胞中に導入することができる。他の実施形態において、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体および関連タンパク質の１つまたはそれ以上の構成要素についてのコード配列を、ベクター系、構成要素の１つまたはそれ以上をコードするＤＮＡ配列を含む発現カセット、および構成要素の１つまたはそれ以上をコードするＲＮＡ配列を含む発現カセットを含む１つまたはそれ以上のＲＮＡ分子（例えば、ｍＲＮＡ）を用いて、細胞中に導入することができる。

本発明の一実施形態は、組換え細胞（例えば、改変リンパ球）を生成するための、操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の使用に関する。当該方法は、典型的に、宿主細胞での、核酸標的配列を含む標的領域を含むｄｓＤＮＡの、本発明の１つまたはそれ以上の操作されたクラス１Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体との接触を促進することを含む。操作されたクラス１Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の、核酸標的配列との接触により、操作されたクラス１Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の、核酸標的配列を含む標的領域との結合、核酸標的配列を含む標的領域の切断、および標的領域内のｄｓＤＮＡの改変が生じるので、組換え細胞を生成する。一部の実施形態において、ｄｓＤＮＡは、１つを超える核酸標的配列を含み、そして各核酸標的配列と相補的なスペーサー配列を含む操作されたクラス１Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体は、各核酸標的配列に結合して、これを切断し、かつ改変するのに用いられる。一部の実施形態において、標的領域の改変は、挿入、欠失、または挿入および欠失である。細胞中への導入のための、１つまたはそれ以上の操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体を用意することを含む、ポリヌクレオチド内の核酸標的配列を切断する方法（例えば、ｄｓＤＮＡ内の一本鎖切断またはｄｓＤＮＡ内の二本鎖切断）が、先に記載されている。

本発明の実施形態は、１つまたはそれ以上の操作されたクラス１Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体を用いて組換え細胞を生成することを含み、組換え細胞のｇＤＮＡは、（例えば、Ｂ２Ｍ遺伝子および／またはＰＤＣＤ１遺伝子の）ノックアウト突然変異、ノックイン（例えば、ＴＲＡＣ遺伝子座での編集、およびドナーポリヌクレオチド由来のＣＡＲの統合）、またはそれらの組合せを含む。一部の実施形態において、ｇＤＮＡのＴＲＡＣ遺伝子内の核酸標的配列での切断の後に、核酸標的配列でのドナーポリヌクレオチドの少なくとも一部の組込みが続く。ドナーポリヌクレオチドは、ＣＡＲ構築体を含んでよく、ＣＡＲは、核酸標的配列内に挿入される。

本発明の方法によって製造される組換え細胞を、養子細胞移入（ＡＣＴ）に用いることができる。ＡＣＴは、移植免疫細胞を用いて癌を処置する、急速に台頭した免疫治療アプローチである。ＡＣＴは、患者中への細胞の移入である。最も一般的に、免疫細胞は、免疫機能を向上させることを目的として、免疫系に由来する。自己由来癌免疫治療において、免疫細胞または幹細胞は、患者から収穫されて、エクスビボ培養によって大量に増殖されてから、患者に戻される。免疫細胞または幹細胞を、培養における種々の方法（例えば、Ｔ細胞のゲノム中にＣＡＲを組み込むための、ゲノム編集の使用）で改変することができる。一部の実施形態において、改変のためのリンパ球が、対象から単離されて、改変されてから、同じ対象中に再導入される。この技術は、自己由来リンパ球治療として知られている。同種異系癌免疫治療において、単一のドナーに由来する、培養増殖された免疫細胞または幹細胞が、多数の患者への処置を実現する。また、そのような免疫細胞または幹細胞を、培養における種々の方法で改変することができる。一部の実施形態において、リンパ球を単離して、改変して、異なる対象中に導入してよい。この技術は、同種異系リンパ球治療として知られている。

特定の実施形態において、そのような免疫治療法は、以下に限定されないが、Ｔ細胞、ナチュラルキラー細胞（ＮＫ細胞）、Ｂ細胞、腫瘍浸潤リンパ球（ＴＩＬ）、キメラ抗原受容体Ｔ細胞（ＣＡＲ−Ｔ細胞）、Ｔ細胞受容体操作Ｔ細胞（ＴＣＲ）、ＴＣＲＣＡＲ−Ｔ細胞、ＣＡＲＴＩＬ細胞、ＣＡＲ−ＮＫ細胞、操作されたＮＫ細胞、またはリンパ球を生じさせる造血幹細胞が挙げられるリンパ球を利用してよい。他の実施形態において、細胞は、幹細胞、樹状細胞等である。そのような細胞のゲノムは、本発明の１つまたはそれ以上の操作されたクラス１Ｉ型カスケードエフェクター複合体の使用によって改変することができる（例えば、リンパ球ゲノムにおける挿入および／または欠失の生成）。

改変のためのリンパ球を、対象、例えばヒト対象から、例えば、例えばＴＩＬの場合、血液から、もしくは固体腫瘍から、またはリンパ器官、例えば、胸腺、骨髄、リンパ節、および粘膜関連リンパ組織から単離することができる。リンパ球を単離する技術は、当該技術において周知である。例えば、リンパ球は、末梢血単核細胞（ＰＢＭＣ）から単離することができ、これは、例えば、ｆｉｃｏｌｌ、血液の層を分離する親水性の多糖、および密度勾配遠心分離を用いて、全血から分離される。通常、抗凝固剤または脱線維血標本が、ｆｉｃｏｌｌ溶液の最上部で層にされて、遠心分離されて、細胞の異なる層が形成される。最下層は、赤血球を含み、これが、ｆｉｃｏｌｌ培地によって収集または凝集されて、通過して、下部に完全に沈む。次の層は、顆粒球を主に含有し、これもまた、ｆｉｃｏｌｌ−ｐａｑｕｅ溶液を通過して下方に移動する。次の層は、リンパ球を含み、これは典型的に、単球および血小板と共に、血漿とｆｉｃｏｌｌ溶液間の界面にある。リンパ球を単離するために、この層を回収して、塩溶液で洗浄して、血小板、ｆｉｃｏｌｌ、および血漿を除去してから、再度遠心分離する。これ以外にも、細胞を、遠心分離技術（例えば、ＣｅｌｌＳａｖｅｒ（登録商標）（Ｈａｅｍｏｎｅｔｒｉｃｓ、Ｂｒａｉｎｔｒｅｅ、ＭＡ）機械またはＬｏｖｏＡｕｔｏｍａｔｅｄＣｅｌｌＰｒｏｃｅｓｓｉｎｇＳｙｓｔｅｍ（ＦｒｅｓｅｎｉｕｓＫａｂｉＵＳＡ、ＬＬＣ、ＬａｋｅＺｕｒｉｃｈ、ＩＬを用いて）により、ドナー血液から単離することができる。

リンパ球を単離するための他の技術は、バイオパニングを含み、これは、抗体コーティングしたプラスチック表面に、注目する細胞を結合させることによって、細胞集団を溶液から単離する。次に、不所望の細胞を、特異的抗体および補体による処理によって除去する。加えて、蛍光活性化セルソーティング（ＦＡＣＳ）分析を用いて、リンパ球を検出かつカウントすることができる。ＦＡＣＳ分析は、光散乱および蛍光の差異に基づいて、標識された細胞を分離するフローサイトメーターを用いる。

ＴＩＬについて、リンパ球を腫瘍から単離して、例えば高用量ＩＬ−２内で増殖させて、自己由来腫瘍またはＨＬＡ一致腫瘍細胞株のいずれかに対するサイトカイン放出共培養アッセイを用いて選択する。同種異系非ＭＨＣ一致対照と比較して特異的反応性が増大した証拠がある培養体を選択して、急速に増殖させてから、対象中に導入して、癌を処置する（例えば、Ｒｏｓｅｎｂｅｒｇ、Ｓ．ら、Ｃｌｉｎ．ＣａｎｃｅｒＲｅｓ．１７巻：４５５０〜４５５７頁（２０１１年）；Ｄｕｄｌｙ、Ｍ．ら、Ｓｃｉｅｎｃｅ２９８巻：８５０〜８５４頁（２００２年）；Ｄｕｄｌｙ、Ｍ．ら、Ｊ．Ｃｌｉｎ．Ｏｎｃｏｌ．２６巻：５２３３〜５２３９頁（２００８年）；Ｄｕｄｌｅｙ、Ｍ．ら、Ｊ．Ｉｍｍｎｏｔｈｅｒ．２６巻：３３２〜３４２頁（２００３年）参照）。

単離して直ぐに、リンパ球を、特異性、頻度、および機能に関して特徴付けることができる。頻繁に使用されるアッセイとして、ＥＬＩＳＰＯＴアッセイが挙げられ、これは、Ｔ細胞応答の頻度を測定する。

一部の実施形態において、ＣＤ４＋およびＣＤ８＋Ｔ細胞は、ドナー末梢血単核細胞（ＰＢＭＣ）から単離される。当業者であれば、先に述べたような種々の方法によって、Ｔ細胞または他のリンパ系細胞を単離することができる。また、そのような細胞は、ｉＰＳＣ細胞からの分化によって単離することができる。

単離の後、リンパ球を、当該技術において知られている技術を用いて活性化して、増殖、および特殊なエフェクターリンパ球への分化を促進することができる。活性化されたＴ細胞用の表面マーカーとして、例えば、ＣＤ３、ＣＤ４、ＣＤ８、ＰＤ１、およびＩＬ２Ｒ等が挙げられる。活性化された細胞障害性リンパ球は、標的細胞の表面上のコグネイト受容体に結合した後に、標的細胞を死滅させることができる。ＮＫ細胞用の表面マーカーとして、例えば、ＣＤ１６およびＣＤ５６等が挙げられる。

単離、および場合により活性化の後に、リンパ球を、所望の特徴をもたらすように改変することができる。本発明の１つまたはそれ以上の操作されたＩ型カスケードエフェクター複合体を用いて、以下に限定されないが、発現されることとなるコード配列の導入、および／または内因性遺伝子発現の不活化が挙げられるゲノム改変を導入することができる。一部の実施形態において、本発明の１つまたはそれ以上の操作されたＩ型カスケードエフェクター複合体を用いて、ＴＲＡＣ遺伝子（Ｔ細胞受容体α定常部をコードする）、Ｂ２Ｍ遺伝子（β２ミクログロブリンをコードする）、および／またはＰＤＣＤ１遺伝子（プログラム細胞死タンパク質１（ＰＤ−１としても知られている）をコードする）を編集することができる。

Ｔ細胞およびＮＫ細胞が、本発明の方法によって改変することができるリンパ球の例である。一部の実施形態において、本発明の１つまたはそれ以上の操作されたＩ型カスケードエフェクター複合体を用いて、ＣＡＲを含むドナーポリヌクレオチドの存在下で遺伝子の標的領域内に切断部位を導入することができ、ＣＡＲは、リンパ球のゲノムの標的領域中に組み込まれる。更なる実施形態において、本発明の１つまたはそれ以上の操作されたＩ型カスケードエフェクター複合体を用いて、遺伝子の標的領域内に切断部位を導入して、遺伝子の発現を防止するためのノックアウト突然変異の生成を促進することができる。

別の実施形態において、本発明の操作されたＩ型カスケードエフェクター複合体を用いて、ヒトｉＰＳＣ中にゲノム改変を導入することができる。一部の実施形態において、本発明の１つまたはそれ以上の操作されたＩ型カスケードエフェクター複合体を用いて、ＴＲＡＣ遺伝子、Ｂ２Ｍ遺伝子、および／またはＰＤＣＤ１遺伝子を編集することができる。更なる実施形態において、操作されたＩ型カスケードエフェクター複合体をドナーポリヌクレオチドと一緒に用いて、ゲノム改変、およびコード配列、例えばＣＡＲまたはサイトカイン（例えばＩＬ２およびＩＬ１５等）を導入することができる。次に、改変ｉＰＳＣ細胞を、Ｔ細胞およびＮＫ細胞または樹状細胞を含む成熟細胞型にさらに分化させることができる。一部の実施形態において、改変ｉＰＳＣを、ＣＡＲ−Ｔ細胞およびＣＡＲ−ＮＫ細胞に分化させることができる。

本発明の方法の一部の実施形態において、ドナーポリヌクレオチドは、ＣＡＲをコードするポリヌクレオチドを含む。ＣＡＲを、相同組換え（「ノックイン」）を介して、切断部位を含む遺伝子（例えば、ＴＲＡＣ遺伝子）の標的領域中への挿入のために標的化することができる。このアプローチの利点は、標的化されたＴＲＡＣ遺伝子のノックアウトを実現する；すなわち、ＴＲＡＣ遺伝子を無効にすることもできることである。ＣＡＲ構築体中に組み込むことができる細胞外抗原認識ドメインの例が、先に記載されている（表２参照）。一実施形態において、細胞外抗原認識ドメインは、ＣＤ１９結合部分（例えば、抗ＣＤ１９ｓｃＦｖ）を含む。別の実施形態において、細胞外抗原認識ドメインは、Ｂ細胞成熟抗原（ＢＣＭＡ）結合部分（例えば、抗ＢＣＭＡｓｃＦｖ）を含む。

ＤＮＡの標的領域内に切断部位を生成することを含む本発明の方法の実施形態において、当該方法はさらに、ドナーポリヌクレオチドを改変細胞中に導入することによって、改変細胞の、切断部位を含む標的領域中へのドナーポリヌクレオチドの少なくとも一部の挿入を促進することを含んでよい。ドナーポリヌクレオチドは、改変細胞中に直接導入することができる。一部の実施形態において、ドナーポリヌクレオチドは、ベクターを用いて導入される。ベクターの構築のための一般的な方法が、当該技術において知られている。ウイルスベクターの例として、以下に限定されないが、レンチウイルス、レトロウイルス、アデノウイルス、単純ヘルペスウイルスＩまたはＩＩ、パルボウイルス、細網内皮症ウイルス、およびＡＡＶベクターが挙げられる。

本発明の方法の更なる実施形態は、Ｂ２Ｍ遺伝子内への突然変異の導入を含む。好ましい実施形態において、突然変異は、Ｂ２Ｍ遺伝子内のノックアウト突然変異である。

本発明の方法の更なる実施形態は、ＰＤＣＤ１遺伝子内への突然変異の導入を含む。好ましい実施形態において、突然変異は、ＰＤＣＤ１遺伝子内のノックアウト突然変異である。

本発明の１つまたはそれ以上の操作されたＩ型カスケードエフェクター複合体によって促進されるゲノム改変は、操作されたカスケード複合体、ポリヌクレオチド（例えば、プラスミドまたは発現カセット）、またはそれらの混合物のいずれかを宿主細胞（例えば、リンパ球）中に同時に、または連続的に導入することによって実行することができる。

改変リンパ球を生成した後に、リンパ球を、以下に限定されないが、ＦＡＣＳ、マイクロフルイディクスベースのスクリーニングプラットフォーム等が挙げられる高スループットスクリーニング技術等の方法を用いて、細胞が発現する（例えば、所望の細胞表面受容体を発現する）か発現しない（例えば、１つまたはそれ以上の操作されたＩ型カスケードエフェクター複合体を用いたゲノム編集により発現が不活化された細胞表面タンパク質）かについて選択するためにスクリーニングすることができる。これらの技術は、当該技術において知られている（例えば、Ｗｏｊｃｉｋ，Ｍ．ら、Ｉｎｔ．Ｊ．Ｍｏｌ．Ｓｃｉ．１６巻：２４９１８〜２４９４５頁（２０１５年）参照）。

一旦生成されると、改変リンパ球は、処置されることとなる対象への送達用の医薬組成物に製剤化することができる。本発明の組成物は、改変リンパ球および１つまたはそれ以上の薬学的に許容される賦形剤を含む。例示的な賦形剤として、限定されないが、炭水化物、無機塩、抗菌剤、抗酸化剤、界面活性剤、バッファ、酸、塩基、およびそれらの組合せが挙げられる。注射可能な組成物に適した賦形剤として、水、アルコール、ポリオール、グリセリン、植物油、リン脂質、および界面活性剤が挙げられる。炭水化物、例えば糖、誘導体化された糖、例えばアルジトール、アルドン酸、エステル化された糖、および／または糖ポリマーが、賦形剤として存在してもよい。具体的な炭水化物賦形剤として、例えば：単糖、例えば、フルクトース、マルトース、ガラクトース、グルコース、Ｄ−マンノース、ソルボース等；二糖、例えば、ラクトース、スクロース、トレハロース、セロビオース等；多糖、例えば、ラフィノース、メレジトース、マルトデキストリン、デキストラン、デンプン等；およびアルジトール、例えば、マンニトール、キシリトール、マルチトール、ラクチトール、キシリトール、ソルビトール（グルシトール）、ピラノシルソルビトール、ミオイノシトール等が挙げられる。また、賦形剤として、無機塩またはバッファ、例えば、クエン酸、塩化ナトリウム、塩化カリウム、硫酸ナトリウム、硝酸カリウム、一塩基性リン酸ナトリウム、二塩基性リン酸ナトリウム、およびそれらの組合せを挙げることができる。凍結剤（例えば、ＣｒｙｏＳｔｏｒ（登録商標）（ＢｉｏＬｉｆｅＳｏｌｕｔｉｏｎｓＩｎｃ、Ｂｏｔｈｅｌｌ、ＷＡ）ＣＳ２、ＣＳ５、またはＣＳ１０凍結培地）を用いて、貯蔵および輸送用に細胞を凍結することができる。

また、本発明の医薬組成物は、微生物の増殖を防止または阻止するための抗菌剤を含んでもよい。本発明に適した抗菌剤の非限定的な例として、塩化ベンザルコニウム、塩化ベンゼトニウム、ベンジルアルコール、塩化セチルピリジニウム、クロロブタノール、フェノール、フェニルエチルアルコール、硝酸フェニル水銀、チメロサール、およびそれらの組合せが挙げられる。

また、抗酸化剤が、医薬組成物中に存在してもよい。抗酸化剤は、酸化を防止することによって、リンパ球または調製物の他の構成要素の劣化を防止するのに用いられる。本発明に用いるのに適した抗酸化剤として、例えば、パルミチン酸アスコルビル、ブチル化ヒドロキシアニソール、ブチル化ヒドロキシトルエン、次亜リン酸、モノチオグリセロール、没食子酸プロピル、重亜硫酸ナトリウム、ホルムアルデヒドスルホキシル酸ナトリウム、メタ重亜硫酸ナトリウム、およびそれらの組合せが挙げられる。

界面活性剤が、賦形剤として存在してもよい。例示的な界面活性剤として：ポリソルベート、例えばＴＷＥＥＮ２０およびＴＷＥＥＮ８０、ならびにプルロニック、例えばＦ６８およびＦ８８（ＢＡＳＦ、ＭｏｕｎｔＯｌｉｖｅ、ＮｅｗＪｅｒｓｅｙ）；ソルビタンエステル；脂質、例えばリン脂質、例えばレシチンおよび他のホスファチジルコリン、ホスファチジルエタノールアミン（しかしリポソーム形態でないことが好ましい）、脂肪酸、および脂肪エステル；ステロイド、例えばコレステロール；キレート化剤、例えばＥＤＴＡ；ならびに亜鉛および他のそのような適切なカチオンが挙げられる。

酸または塩基が、医薬組成物内に賦形剤として存在してもよい。用いることができる酸の非限定的な例として、塩酸、酢酸、リン酸、クエン酸、リンゴ酸、乳酸、ギ酸、トリクロロ酢酸、硝酸、過塩素酸、リン酸、硫酸、フマル酸、およびそれらの組合せからなる群から選択される酸が挙げられる。適切な塩基の例として、限定されないが、水酸化ナトリウム、酢酸ナトリウム、水酸化アンモニウム、水酸化カリウム、酢酸アンモニウム、酢酸カリウム、リン酸ナトリウム、リン酸カリウム、クエン酸ナトリウム、ギ酸ナトリウム、硫酸ナトリウム、硫酸カリウム、フマル酸カリウム、およびそれらの組合せからなる群から選択される塩基が挙げられる。

組成物中のリンパ球（または他の組換え細胞）の量は、いくつかの要因に応じて変動することとなるが、組成物が単位剤型またはコンテナ（例えば、バッグ）内にある場合、最適には治療的に有効な用量となろう。治療的に有効な用量は、組成物の量を増大させて、どの量が臨床的に所望されるエンドポイントをもたらすかを判定する繰返し投与によって、実験的に決定することができる。

組成物中の個々のあらゆる賦形剤の量は、賦形剤の性質および機能、ならびに組成物の特定のニーズに応じて変動することとなる。典型的には、個々のあらゆる賦形剤の最適な量が、ルーチンの実験を通して、すなわち、様々な量の賦形剤（低〜高に及ぶ）を含有する組成物を調製して、安定性および他のパラメータを調査してから、最適な性能が、重大な副作用なく達成される範囲を判定することによって、決定される。しかしながら、賦形剤は通常、組成物中に、約１重量％〜約９９重量％、好ましくは約５重量％から約９８重量％、より好ましくは約１５重量％から約９５重量％の賦形剤の量で存在することとなり、最も好ましくは３０重量％未満の濃度である。これらの前述の医薬賦形剤は、他の賦形剤と一緒に、「Ｒｅｍｉｎｇｔｏｎ：ＴｈｅＳｃｉｅｎｃｅ＆ＰｒａｃｔｉｃｅｏｆＰｈａｒｍａｃｙ」、現行版、Ｗｉｌｌｉａｍｓ＆Ｗｉｌｌｉａｍｓ；「Ｐｈｙｓｉｃｉａｎ’ｓＤｅｓｋＲｅｆｅｒｅｎｃｅ」、現行版、ＭｅｄｉｃａｌＥｃｏｎｏｍｉｃｓ、Ｍｏｎｔｖａｌｅ，ＮＪ；およびＫｉｂｂｅ，Ａ．Ｈ．、ＨａｎｄｂｏｏｋｏｆＰｈａｒｍａｃｅｕｔｉｃａｌＥｘｃｉｐｉｅｎｔｓ、現行版、ＡｍｅｒｉｃａｎＰｈａｒｍａｃｅｕｔｉｃａｌＡｓｓｏｃｉａｔｉｏｎ、Ｗａｓｈｉｎｇｔｏｎ、Ｄ．Ｃ．に記載されている。

医薬組成物は、送達および使用の意図されるモードに応じて、シリンジ、移植デバイス内等に収容することができる。好ましくは、存在する組成物の量は、予め測定された、または予め包装された形態の単回用量に適している。

本明細書中の医薬組成物は、場合により、１つまたはそれ以上の更なる剤、例えば、問題となっている癌について対象を処置するのに、または処置由来の知られている副作用を処置するのに用いられる他の薬物を含んでもよい。例えば、Ｔ細胞は、血流中にサイトカインを放出し、これが危険なほど高い発熱および血圧の急な降下をもたらす虞がある。この症状は、サイトカイン放出症候群（ＣＲＳ）として知られている。多くの患者において、ＣＲＳは、ステロイドおよび免疫治療、例えばＩＬ−６活性をブロックするトシリズマブ（Ａｃｔｅｍｒａ（商標）、Ｇｅｎｅｎｔｅｃｈ、ＳｏｕｔｈＳａｎＦｒａｎｃｉｓｃｏ、ＣＡ）が挙げられる標準的な支持療法で管理することができる。

改変リンパ球組成物による処置の治療的に有効な少なくとも１サイクルが、対象に施されることとなる。「処置の治療的に有効なサイクル」によって意図されるのは、施された場合に、問題となっている疾患についての個体の処置に対してポジティブな治療応答を導く処置のサイクルである。「ポジティブな治療応答」によって意図されるのは、個々に受ける本発明に従う処置が、腫瘍の縮小および／またはリンパ球療法の必要の低減等の改善が挙げられる、疾患の１つまたはそれ以上の病徴の改善を示すことである。

特定の実施形態において、リンパ球または他の薬物を含む組成物の複数回の治療的に有効な用量が投与されることとなる。本発明の組成物は、典型的に、必ずしも必要ではないが、注射を介して、例えば、皮下に、皮内に、静脈内に、動脈内に、筋肉内に、腹膜内に、脊髄内に、腫瘍内に、結節内に、点滴によって、または局所に、投与される。医薬の調製は、投与の直前に、溶液の形態であっても懸濁液の形態であってもよい。前述のものは、更なる投与モードも意図されるので、例示的であることを意味する。医薬組成物は、当該技術において知られている医学的に許容可能なあらゆる方法に従って、同じ投与経路を用いて投与しても、異なる投与経路を用いて投与してもよい。

投与されることとなる実際の用量は、対象の年齢、体重、および全身状態、ならびに処置されることとなる症状の重症度、医療専門家の判断、および投与されることとなる特定のリンパ球に応じて変動することとなる。治療的に有効な量は、当業者によって決定することができ、そして特定の各症例の特定の必要条件に合うように調整されることとなる。

通常、リンパ球の治療的に有効な量は、患者あたり合計約１×１０⁵〜約１×１０¹⁰個以上、例えば１×１０⁶〜約１×１０¹⁰個、例えば、１×１０⁷〜１×１０⁹個、例えば５×１０⁷〜５×１０⁸個に及ぶ、またはこれらの範囲内のあらゆる量のリンパ球となることとなる。他の投薬量範囲は、ｋｇ／体重あたり１×１０⁴〜１×１０¹⁰個の細胞となり得る。リンパ球の総数を、単回のボーラス用量で投与してもよいし、２回またはそれ以上の用量で、例えば１日またはそれ以上の間隔をおいて投与してもよい。投与される化合物の量は、特定のリンパ球組成物の効力、処置されることとなる疾患、および投与経路によって決まることとなる。

加えて、用量は、リンパ球の混合物、例えばＣＤ８＋およびＣＤ４＋細胞の混合を含んでよい。ＣＤ８＋およびＣＤ４＋細胞の混合が提供されるならば、ＣＤ８＋細胞の、ＣＤ４＋細胞に対する比率は、例えば、１：１、１：２または２：１、１：３または３：１、１：４または４：１、１：５または５：１等であり得る。

改変リンパ球を、他の剤の前に、他の剤と同時に、または他の剤の後に投与することができる。他の剤と同時に提供されるならば、改変リンパ球は、同じ組成物中で、または異なる組成物中で提供することができる。ゆえに、リンパ球および他の剤を、同時療法によって個体に提示することができる。「同時療法」によって意図されるのは、物質の組合せの治療効果が、治療を受けた対象において引き起こされるような、対象への投与である。例えば、同時療法は、改変リンパ球を含む医薬組成物の用量、および少なくとも１つの他の剤、例えば別の化学療法剤を含む医薬組成物の用量を投与することによって達成することができ、組合せにおいては、特定の投薬レジメンに従って、治療的に有効な用量を含む。同様に、改変リンパ球および治療剤は、少なくとも１回の治療用量で投与することができる。別個の医薬組成物の投与を、同時に、または異なる時点で（例えば、同じ日に、または異なる日に、いずれかの順序で、順次）実行することができるが、これらの物質の組合せの治療効果が、療法を受けている対象において引き起こされる限りにおいてである。

本明細書中に記載される、本発明の操作されたＩ型カスケードエフェクター複合体は、ゲノム編集ツールを提供する。ゲノム編集用の哺乳動物細胞内でクラス１ＣＲＩＳＰＲ−Ｃａｓ系の機能的再構成を実証する実験は、そのような簡素化されたプラスミド設計が、より少ないタンパク質構成要素およびユニークなＰＡＭ必要条件を示すもの、ならびに潜在的にはＩＩＩ型ＣＲＩＳＰＲ−Ｃａｓ系由来のＲＮＡ−およびＤＮＡ−標的化エフェクター複合体すら挙げられる、他のクラス１ＣＲＩＳＰＲ−Ｃａｓ系の使用を可能にすることを示す（例えば、Ｈｉｌｌｅ，Ｆ．ら、Ｃｅｌｌ１７２巻：１２３９〜１２５９頁（２０１８年）；Ｔａｍｕｌａｉｔｉｓ，Ｇ．ら、ＴｒｅｎｄｓＭｉｃｒｏｂｉｏｌ．２５巻：４９〜６１頁（２０１７年）参照）。カスケード複合体のマルチサブユニットの性質は、合成転写因子、エピゲノムモディファイア、および塩基エディタ等のエフェクター融合体の多価かつ／または立体配置的に正確な動員についての潜在能力を提供する。また、Ｉ型系からの完全なＤＮＡ干渉経路の異種発現、すなわち、ゲノム標的部位へのＣａｓ３ヘリカーゼ−ヌクレアーゼのカスケード媒介動員を利用して、大きなＤＮＡ欠失を生成して、相同組換え修復用の長いｓｓＤＮＡ束を曝露することができ、かつ／または定義されたゲノム遺伝子座にてタンパク質−ＤＮＡロードブロックを機械的に崩壊させることができる。したがって、本発明の一実施形態において、操作されたクラス１ＣＲＩＳＰＲ−Ｃａｓ系を用いて、大きな欠失領域を生成することができ、そしてドナーポリヌクレオチド（例えば、適切な相同アームを含む）を細胞中に導入することで、領域中へのドナーポリヌクレオチドの少なくとも一部の挿入を促進することができる。

本発明の実施形態として、以下が挙げられるが、これらに限定されない。

実施形態１．組成物であって：
第１のＣｓｅ２サブユニットタンパク質、第１のＣａｓ５サブユニットタンパク質、第１のＣａｓ６サブユニットタンパク質、および第１のＣａｓ７サブユニットタンパク質と、
第１のＣａｓ８サブユニットタンパク質および第１のＦｏｋＩを含む第１の融合タンパク質であって、第１のＣａｓ８サブユニットタンパク質のＮ末端または第１のＣａｓ８サブユニットタンパク質のＣ末端は、第１のリンカーポリペプチドによって、第１のＦｏｋＩのＣ末端またはＮ末端にそれぞれ共有結合されており、第１のリンカーポリペプチドは、長さが約１０アミノ酸〜約４０アミノ酸である、第１の融合タンパク質と、
第１の核酸標的配列に結合することができる第１のスペーサーを含む第１のガイドポリヌクレオチドと
を含む第１の操作されたクラス１Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体と；
第２のＣｓｅ２サブユニットタンパク質、第２のＣａｓ５サブユニットタンパク質、第２のＣａｓ６サブユニットタンパク質、および第２のＣａｓ７サブユニットタンパク質と、
第２のＣａｓ８サブユニットタンパク質および第２のＦｏｋＩを含む第２の融合タンパク質であって、第２のＣａｓ８サブユニットタンパク質のＮ末端または第２のＣａｓ８サブユニットタンパク質のＣ末端は、第２のリンカーポリペプチドによって、第２のＦｏｋＩのＣ末端またはＮ末端にそれぞれ共有結合されており、第２のリンカーポリペプチドは、長さが約１０アミノ酸〜約４０アミノ酸である、第２の融合タンパク質と、
第２の核酸標的配列に結合することができる第２のスペーサーを含む第２のガイドポリヌクレオチドと
を含む第２の操作されたクラス１Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体と
を含み、第２の核酸標的配列のプロトスペーサー隣接モチーフ（ＰＡＭ）および第１の核酸標的配列のＰＡＭは、スペーサー間距離が約２０ｂｐ〜約４２ｂｐである、組成物。

実施形態２．第１のリンカーポリペプチドは、長さが約１５アミノ酸〜約３０アミノ酸である、実施形態１の組成物。

実施形態３．第１のリンカーポリペプチドは、長さが約１７アミノ酸〜約２０アミノ酸である、実施形態２の組成物。

実施形態４．第２のリンカーポリペプチドは、長さが約１５アミノ酸〜約３０アミノ酸である、実施形態１〜３のいずれか１つの組成物。

実施形態５．第２のリンカーポリペプチドは、長さが約１７アミノ酸〜約２０アミノ酸である、実施形態４の組成物。

実施形態６．第１のリンカーポリペプチドと第２のリンカーポリペプチドの長さは、同じである、先の実施形態のいずれかの組成物。

実施形態７．第２の核酸標的配列および第１の核酸標的配列は、それぞれスペーサー間距離が約２２ｂｐ〜約４０ｂｐである、先の実施形態のいずれかの組成物。

実施形態８．第２の核酸標的配列および第１の核酸標的配列は、それぞれスペーサー間距離が約２６ｂｐ〜約３６ｂｐである、実施形態７の組成物。

実施形態９．第２の核酸標的配列および第１の核酸標的配列は、それぞれスペーサー間距離が約２９ｂｐ〜約３５ｂｐである、実施形態８の組成物。

実施形態１０．第２の核酸標的配列および第１の核酸標的配列は、それぞれスペーサー間距離が約３０ｂｐ〜約３４ｂｐである、実施形態９の組成物。

実施形態１１．第１のＦｏｋＩおよび第２のＦｏｋＩは、ホモダイマーを形成するように会合することができるモノマーサブユニットである、先の実施形態のいずれかの組成物。

実施形態１２．第１のＦｏｋＩおよび第２のＦｏｋＩは、ヘテロダイマーを形成するように会合することができる、互いに異なるモノマーサブユニットである、実施形態１〜１０のいずれか１つの組成物。

実施形態１３．第１のＣａｓ８サブユニットタンパク質のＮ末端は、第１のリンカーポリペプチドによって、第１のＦｏｋＩのＣ末端に共有結合されている、先の実施形態のいずれかの組成物。

実施形態１４．第１のＣａｓ８サブユニットタンパク質のＣ末端は、第１のリンカーポリペプチドによって、第１のＦｏｋＩのＮ末端に共有結合されている、実施形態１〜１２のいずれか１つの組成物。

実施形態１５．第２のＣａｓ８サブユニットタンパク質のＮ末端は、第２のリンカーポリペプチドによって、第２のＦｏｋＩのＣ末端に共有結合されている、先の実施形態のいずれかの組成物。

実施形態１６．第２のＣａｓ８サブユニットタンパク質のＣ末端は、第２のリンカーポリペプチドによって、第２のＦｏｋＩのＮ末端に共有結合されている、実施形態１〜１４のいずれか１つの組成物。

実施形態１７．第１のＣａｓ８サブユニットタンパク質および第２のＣａｓ８サブユニットタンパク質は、それぞれ同一のアミノ酸配列を含む、先の実施形態のいずれかの組成物。

実施形態１８．第１のＣｓｅ２サブユニットタンパク質および第２のＣｓｅ２サブユニットタンパク質は、それぞれ同一のアミノ酸配列を含み、第１のＣａｓ５サブユニットタンパク質および第２のＣａｓ５サブユニットタンパク質は、それぞれ同一のアミノ酸配列を含み、第１のＣａｓ６サブユニットタンパク質および第２のＣａｓ６サブユニットタンパク質は、それぞれ同一のアミノ酸配列を含み、そして第１のＣａｓ７サブユニットタンパク質および第２のＣａｓ７サブユニットタンパク質は、それぞれ同一のアミノ酸配列を含む、先の実施形態のいずれかの組成物。

実施形態１９．第１のガイドポリヌクレオチドはＲＮＡを含む、先の実施形態のいずれかの組成物。

実施形態２０．第２のガイドポリヌクレオチドはＲＮＡを含む、先の実施形態のいずれかの組成物。

実施形態２１．ゲノムＤＮＡは、第２の核酸標的配列のＰＡＭおよび第１の核酸標的配列のＰＡＭを含む、先の実施形態のいずれかの組成物。

実施形態２２．細胞であって：先の実施形態のいずれかの組成物を含む細胞。

実施形態２３．細胞のゲノムＤＮＡは、第２の核酸標的配列のＰＡＭおよび第１の核酸標的配列のＰＡＭを含む、実施形態２２の細胞。

実施形態２４．原核細胞である、実施形態２２または２３の細胞。

実施形態２５．真核細胞である、実施形態２２または２３の細胞。

実施形態２６．実施形態１〜２１のいずれか１つの第１のＣｓｅ２サブユニットタンパク質、第１のＣａｓ５サブユニットタンパク質、第１のＣａｓ６サブユニットタンパク質、第１のＣａｓ７サブユニットタンパク質、第１の融合タンパク質、および第１のガイドポリヌクレオチドをコードする、１つまたはそれ以上の核酸配列。

実施形態２７．実施形態１〜２１のいずれか１つの第２のＣｓｅ２サブユニットタンパク質、第２のＣａｓ５サブユニットタンパク質、第２のＣａｓ６サブユニットタンパク質、第２のＣａｓ７サブユニットタンパク質、第２の融合タンパク質、および第２のガイドポリヌクレオチドをコードする、１つまたはそれ以上の核酸配列。

実施形態２８．実施形態２６、実施形態２７、または実施形態２６および実施形態２７の１つまたはそれ以上の核酸配列を含む１つまたはそれ以上の発現カセット。

実施形態２９．実施形態２８の１つまたはそれ以上の発現カセットを含む１つまたはそれ以上のベクター。

実施形態３０．第１の核酸標的配列および第２の核酸標的配列を含むポリヌクレオチドに結合する方法であって、当該方法は：
細胞または生化学反応中への導入のための、実施形態１〜２１のいずれか１つの組成物を用意することと；
細胞または生化学反応中に組成物を導入することによって、第１の操作されたクラス１Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の、第１の核酸標的配列との接触、および第２の操作されたクラス１Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の、第２の核酸標的配列との接触を促進して、ポリヌクレオチド内での、第１の操作されたクラス１Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の、第１の核酸標的配列との結合、および第２の操作されたクラス１Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の、第２の核酸標的配列の結合を生じさせることと
を含む方法。

実施形態３１．ゲノムＤＮＡはポリヌクレオチドを含む、実施形態３０の方法。

実施形態３２．第１の核酸標的配列および第２の核酸標的配列を含むポリヌクレオチドを切断する方法であって、当該方法は：
細胞または生化学反応中への導入のための、実施形態１〜２１のいずれか１つの組成物を用意することと、
細胞または生化学反応中に組成物を導入することによって、第１の核酸標的配列との第１の操作されたクラス１Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の接触、および第２の核酸標的配列との操作された第２のクラス１Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の接触を促進して、第１の操作されたクラス１Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体による第１の核酸標的配列の切断、および第２の操作されたクラス１Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体による第２の核酸標的配列の切断をもたらすことと
を含む方法。

実施形態３３．ゲノムＤＮＡはポリヌクレオチドを含む、実施形態３２の方法。

実施形態３４．実施形態１〜２１のいずれか１つの組成物と；バッファとを含むキット。

実施形態３５．実施形態２６、実施形態２７、または実施形態２６および実施形態２７の１つまたはそれ以上の核酸配列と；バッファとを含むキット。

実施形態３６．組成物であって：
Ｃｓｅ２サブユニットタンパク質、Ｃａｓ５サブユニットタンパク質、Ｃａｓ６サブユニットタンパク質、およびＣａｓ７サブユニットタンパク質と、
Ｃａｓ８サブユニットタンパク質および第１のＦｏｋＩを含む第１の融合タンパク質であって、第１のＣａｓ８サブユニットタンパク質のＮ末端または第１のＣａｓ８サブユニットタンパク質のＣ末端は、第１のリンカーポリペプチドによって、第１のＦｏｋＩのＣ末端またはＮ末端にそれぞれ共有結合されている、第１の融合タンパク質と、
核酸標的配列に結合することができるスペーサーを含むガイドポリヌクレオチドと
を含む操作されたクラス１Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体と；
ｄＣａｓ３^*タンパク質および第２のＦｏｋＩを含む操作されたクラス１Ｉ型ＣＲＩＳＰＲ−Ｃａｓ３融合タンパク質を含む第２の融合タンパク質であって、ｄＣａｓ３^*タンパク質のＮ末端またはｄＣａｓ３^*タンパク質のＣ末端は、第２のリンカーポリペプチドによって、第２のＦｏｋＩのＣ末端またはＮ末端にそれぞれ共有結合的に連結されている、第２の融合タンパク質と、を含み、第１のリンカーポリペプチドは、長さが約１０アミノ酸〜約４０アミノ酸である、組成物。

実施形態３７．第１のリンカーポリペプチドは、長さが約５アミノ酸〜約４０アミノ酸である、実施形態３６の組成物。

実施形態３８．第２のリンカーポリペプチドは、長さが約５アミノ酸〜約４０アミノ酸である、実施形態３６の組成物。

実施形態３９．細胞であって：実施形態３６〜３８のいずれか１つの組成物を含む細胞。

実施形態４０．原核細胞である、実施形態３９の細胞。

実施形態４１．真核細胞である、実施形態３９の細胞。

実施形態４２．実施形態３６〜３８のいずれか１つのＣｓｅ２サブユニットタンパク質、Ｃａｓ５サブユニットタンパク質、Ｃａｓ６サブユニットタンパク質、Ｃａｓ７サブユニットタンパク質、第１の融合タンパク質、およびガイドポリヌクレオチドをコードする、１つまたはそれ以上の核酸配列。

実施形態４３．実施形態３６〜３８のいずれか１つの第２の融合タンパク質をコードする１つまたはそれ以上の核酸配列。

実施形態４４．実施形態４２、実施形態４３、または実施形態４２および実施形態４３の１つまたはそれ以上の核酸配列を含む１つまたはそれ以上の発現カセット。

実施形態４５．実施形態４４の１つまたはそれ以上の発現カセットを含む１つまたはそれ以上のベクター。

実施形態４６．核酸標的配列を含むポリヌクレオチドに結合する方法であって、当該方法は：
細胞または生化学反応中への導入のための、実施形態３６〜３８のいずれか１つの組成物を用意することと；
細胞または生化学反応中に組成物を導入することによって、操作されたクラス１Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の、核酸標的配列との接触、および第２の融合タンパク質の、操作されたクラス１Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体との接触を促進して、ポリヌクレオチド内での、操作されたクラス１Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体および第２の融合タンパク質の、核酸標的配列への結合を生じさせることと
を含む方法。

実施形態４７．ゲノムＤＮＡはポリヌクレオチドを含む、実施形態４６の方法。

実施形態４８．核酸標的配列を含むポリヌクレオチドを切断する方法であって、当該方法は：
細胞または生化学反応中への導入のための、実施形態３６〜３８のいずれか１つの組成物を用意することと；
細胞または生化学反応中に組成物を導入することによって、第１の核酸標的配列との第１の操作されたクラス１Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の接触、および第２の核酸標的配列との操作された第２のクラス１Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の接触を促進することと、
細胞または生化学反応中に組成物を導入することによって、核酸標的配列との操作されたクラス１Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の接触、および操作されたクラス１Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体との第２の融合タンパク質の接触を促進して、操作されたクラス１Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体および第２の融合タンパク質による核酸標的配列の切断をもたらすことと
を含む方法。

実施形態４９．ゲノムＤＮＡはポリヌクレオチドを含む、実施形態４８の方法。

実施形態５０．実施形態３６〜３８のいずれか１つの組成物と；バッファとを含むキット。

実施形態５１．実施形態４２、実施形態４３、または実施形態４２および実施形態４３の１つまたはそれ以上の核酸配列と；バッファとを含むキット。

実施形態５２．野生型Ｉ型ＣＲＩＳＰＲＣａｓ３タンパク質（「ｗｔＣａｓ３タンパク質」）よりも低減された、ＤＮＡに沿った移動が可能な操作されたＩ型ＣＲＩＳＰＲＣａｓ３突然変異タンパク質（「ｍＣａｓ３タンパク質」）であって、ｍＣａｓ３タンパク質は：
対応するｗｔＣａｓ３タンパク質と約９５％以上の配列同一性と、
アミノ末端、カルボキシ末端、またはアミノ末端およびカルボキシ末端の双方にて共有結合する核局在化シグナルと、
ヘリカーゼ活性を下方調節する１つまたはそれ以上の突然変異と
を含み、操作されたＩ型ＣＲＩＳＰＲＣａｓ３突然変異タンパク質は、ヌクレアーゼ活性を保持しており；
ＤＮＡは、核酸標的配列を含む標的領域を含む二本鎖ＤＮＡ（ｄｓＤＮＡ）であり；
ｗｔＣａｓ３タンパク質が、対応するカスケード核タンパク質複合体と会合し（「カスケードＮＰ複合体／ｗｔＣａｓ３タンパク質」）、かつカスケードＮＰ複合体が、核酸標的配列と相補的なスペーサーを含むガイドを含む場合、カスケードＮＰ複合体／ｗｔＣａｓ３タンパク質の、核酸標的配列への結合が、ＤＮＡの標的領域内の切断を促進することによって、欠失（「ｗｔＣａｓ３−欠失」）をもたらし；
ｍＣａｓ３タンパク質は、カスケードＮＰ複合体と会合し（「カスケードＮＰ複合体／ｍＣａｓ３タンパク質」）、核酸標的配列に結合する場合、ＤＮＡの標的領域内の切断を促進することによって、ｗｔＣａｓ３−欠失よりも短い欠失をもたらす、ｍＣａｓ３タンパク質。

実施形態５３．１つまたはそれ以上の突然変異は、アミノ酸の置換である、実施形態５３のｍＣａｓ３タンパク質。

実施形態５４．１つまたはそれ以上の突然変異は、ヘリカーゼドメインのＲｅｃＡ１領域またはＲｅｃＡ２領域内のいずれかにある、先の実施形態のいずれかのｍＣａｓ３タンパク質。

実施形態５５．１つまたはそれ以上の突然変異は、ｗｔＣａｓ３タンパク質よりも、一本鎖ＤＮＡ（ｓｓＤＮＡ）へのｍＣａｓ３タンパク質の結合を下方調節する、先の実施形態のいずれかのｍＣａｓ３タンパク質。

実施形態５６．１つまたはそれ以上の突然変異は、ｗｔＣａｓ３タンパク質よりも、ｍＣａｓ３タンパク質によるアデノシン三リン酸（ＡＴＰ）の加水分解を下方調節し、またはｍＣａｓ３タンパク質へのＡＴＰの結合を下方調節する、先の実施形態のいずれかのｍＣａｓ３タンパク質。

実施形態５７．ｍＣａｓ３タンパク質のコーディング配列は、カスケードＮＰ複合体のＣａｓタンパク質のコーディング配列のアミノ末端またはカルボキシ末端に共有結合されている、先の実施形態のいずれかのｍＣａｓ３タンパク質。

実施形態５８．１つまたはそれ以上の突然変異は、ｗｔＣａｓ３タンパク質よりも、一本鎖ＤＮＡ（ｓｓＤＮＡ）へのｍＣａｓ３タンパク質の結合を下方調節する、先の実施形態のいずれかのｍＣａｓ３タンパク質。

実施形態５９．ｍＣａｓ３タンパク質のコーディング配列は、カスケードＲＮＰ複合体のＣａｓタンパク質のコーディング配列のアミノ末端またはカルボキシ末端に共有結合されている、先の実施形態のいずれかのｍＣａｓ３タンパク質。

実施形態６０．Ｃａｓタンパク質は、Ｃｓｅ２、Ｃａｓ８タンパク質、Ｃａｓ７タンパク質、Ｃａｓ６タンパク質、およびＣａｓ５タンパク質からなる群から選択される、先の実施形態のいずれかのｍＣａｓ３タンパク質。

実施形態６１．ｗｔＣａｓ３タンパク質は、大腸菌（Ｅ．ｃｏｌｉ）Ｉ型ＣＲＩＳＰＲＣａｓ３タンパク質である、先の実施形態のいずれかのｍＣａｓ３タンパク質。

実施形態６２．１つまたはそれ以上の突然変異は、Ｄ４５２Ｈ、Ａ６０２Ｖ、ならびにＤ４５２ＨおよびＡ６０２Ｖからなる群から選択される、実施形態６１のｍＣａｓ３タンパク質。

実施形態６３．ＤＮＡは細胞内にある、先の実施形態のいずれかのｍＣａｓ３タンパク質。

実施形態６４．細胞は真核細胞である、実施形態６３のｍＣａｓ３タンパク質。

実施形態６５．真核細胞は、哺乳動物細胞（例えば、ヒト細胞）である、実施形態６４のｍＣａｓ３タンパク質。

実施形態６６．実施形態５２〜６５のいずれか１つのｍＣａｓ３タンパク質をコードする１つまたはそれ以上のポリヌクレオチド。

実施形態６７．哺乳動物細胞内での発現のための調節配列に作動可能に連結された、実施形態５２〜６５のいずれか１つのｍＣａｓ３タンパク質をコードするポリヌクレオチド配列を含むプラスミド。

実施形態６８．実施形態５２〜６５のいずれか１つのｍＣａｓ３タンパク質をコードするポリヌクレオチド配列を含む１つまたはそれ以上のプラスミド、および哺乳動物細胞内での発現のための調節配列に作動可能に連結された、対応するＩ型ＣＲＩＳＰＲカスケードのタンパク質構成要素をコードする１つまたはそれ以上のポリヌクレオチド。

実施形態６９．哺乳動物細胞内での発現のための調節配列に作動可能に連結された１つまたはそれ以上のガイドポリヌクレオチドをコードするプラスミドをさらに含む、実施形態６８の１つまたはそれ以上のプラスミド。

実施形態７０．実施形態５２〜６５のいずれか１つのｍＣａｓ３タンパク質を含むＩ型ＣＲＩＳＰＲカスケード核タンパク質複合体。

実施形態７１．核タンパク質複合体はＲＮＰである、実施形態７０のＩ型ＣＲＩＳＰＲカスケード核タンパク質複合体。

本発明の好ましい実施形態が本明細書中で示され、かつ説明されてきたが、そのような実施形態は、一例としてのみ記載されていることは、当業者にとって明らかであろう。本明細書および実施例から、当業者であれば、本発明の必須の特徴を確認することができ、そしてその精神および範囲から逸脱しない範囲で、種々の使用および条件に適合させるために、本発明を変更、置換、変形、かつ修飾することができる。また、そのような変化、置換、変形、および修飾は、本開示の範囲内に含まれることが意図される。

実験の部
本発明の態様を以下の実施例に説明する。使用する数（例えば、量、濃度、変化パーセントなど）に関する正確度を保証するために努力がなされたが、いくつかの実験誤差および偏差が説明されるべきである。特に示さないかぎり、温度は摂氏温度であり、圧力は大気圧またはその近くである。これらの実施例は、単に例証として与えられるものであり、本発明の範囲を限定することを意図するものではないことが理解されるべきである。

カスケード構成要素をコードするポリヌクレオチドのｉｎｓｉｌｉｃｏ設計
本実施例は、Ｉ−Ｅ型ＣＲＩＳＰＲ−Ｃａｓ系に由来する遺伝子配列、タンパク質配列、およびＣＲＩＳＰＲ配列を用いる、カスケードをコードするポリヌクレオチド構成要素の設計の説明を提供するものである。

表１５は、Ｉ−Ｅ型からの、具体的には大腸菌（Ｅ．ｃｏｌｉ）Ｋ−１２ＭＧ１６５５株からのカスケードの５つのタンパク質をコードする遺伝子のポリヌクレオチドＤＮＡ配列、および結果としてもたらされるタンパク質構成要素のアミノ酸配列を示す。ＮＣＢＩ参照配列ＮＺ＿ＣＰ０１４２２５．１からゲノム配列を得た。表１５において、大腸菌における発現およびまたヒト細胞における発現について特異的にコドン最適化されたカスケードタンパク質構成要素をコードする、大腸菌ｇＤＮＡまたは製造業者によって産生されたポリヌクレオチドのいずれかからポリヌクレオチド配列を増幅させた。

加えて、カスケードタンパク質を含むいくつかの融合タンパク質を設計した。表１６は、カスケードタンパク質融合タンパク質をコードする遺伝子のポリヌクレオチドＤＮＡ配列、および結果としてもたらされるタンパク質構成要素のアミノ酸配列を示す。ほとんどの場合、表１６に記載される融合タンパク質は、融合構築物内の２つのポリペプチド配列を結びつける短いトリアミノ酸リンカーを含み；このリンカーは、典型的にはグリシン−グリシン−セリン（ＧＧＳ）またはグリシン−セリン−グリシン（ＧＳＧ）を含む。それぞれの特定の融合タンパク質に使用される正確なトリアミノ酸リンカー配列は、表１６中の全長アミノ酸配列に見出すことができる。

他のカスケードタンパク質と同時発現した場合のＣｓｅ２タンパク質上のＨｉｓ６（ヘキサヒスチジン；配列番号４１８）ペプチドタグおよびＳｔｒｅｐ−ｔａｇ（商標）ＩＩ（ＧＥＨｅａｌｔｈｃａｒｅＢｉｏ−Ｓｃｉｅｎｃｅｓ、Ｐｉｔｔｓｂｕｒｇｈ、ＰＡ）（配列番号４１９）ペプチドタグは、それぞれニッケル−ニトリロ酢酸（Ｎｉ−ＮＴＡ）樹脂またはＳｔｒｅｐ−Ｔａｃｔｉｎ（商標）（ＩＢＡＧＭＢＨＬＬＣ、Ｇｏｅｔｔｉｎｇｅｎ、Ｇｅｒｍａｎｙ）樹脂のいずれかにより複合体を精製できるようにする。ＨＲＶ３Ｃ（ヒトライノウイルス３Ｃ）プロテアーゼによってＨＲＶ３Ｃプロテアーゼ認識配列（配列番号４２０）を切断し、これを使用して目的のタンパク質からＮ末端融合物を除去することができる。ＮＬＳ（核局在化シグナル；Ｃａｓ６、Ｃａｓ７、および／またはＣａｓ８タンパク質上の配列番号４２１のペプチドタグは、真核細胞系における核輸送を可能にする。Ｃａｓ６またはＣａｓ７タンパク質上のＨＡ（ヘマグルチニン；配列番号４２２）ペプチドタグは、抗ＨＡ抗体を用いたウエスタンブロット法による異種タンパク質発現の検出を可能にする。ＭＢＰ（マルトース結合タンパク質；配列番号４２３）ペプチド融合は、Ｃａｓ８タンパク質の精製を促進する可溶化タグである。ＴＥＶ（タバコエッチ病ウイルス）プロテアーゼによってＴＥＶプロテアーゼ認識配列（配列番号４２４）を切断し、これを使用して、目的のタンパク質からＮ末端融合物を除去することができる。ＦｏｋＩヌクレアーゼドメインは、Ｇｕｏらによって記載されるシャーキーバリアントを含み（Ｇｕｏ、Ｊ．ら、Ｊ．Ｍｏｌ．Ｂｉｏｌ．４００：９６〜１０７（２０１０年））、２つのモノマーＦｏｋＩサブユニットは会合してホモダイマーを形成し、ホモダイマー化すると二本鎖ＤＮＡの切断を触媒する。リンカー配列（配列番号４２５）を使用して、ＦｏｋＩヌクレアーゼドメインをＣａｓ８タンパク質と融合させる。

ＦｏｋＩヌクレアーゼドメインをＣａｓ８タンパク質に結びつける様々な長さおよびアミノ酸組成の追加的なリンカー配列が設計されている。これらのアミノ酸配列は、表１７に見出すことができる。

表１８は、前駆体ｃｒＲＮＡに転写され、カスケードのＲＮＡエンドヌクレアーゼタンパク質によってプロセシングされた場合に、生化学アッセイおよび細胞培養遺伝子編集実験において相補的ＤＮＡ配列を標的化するためのガイドＲＮＡとして機能する成熟ｃｒＲＮＡを生成する、４つの最小ＣＲＩＳＰＲアレイのポリヌクレオチドＤＮＡ配列を含む。

最小ＣＲＩＳＰＲアレイは、ｃｒＲＮＡのガイド部分に相当するスペーサー配列に隣接する２つのリピート配列（下線部、小文字）を含む。カスケードエンドヌクレアーゼタンパク質によるＲＮＡのプロセシングは、ガイド配列に隣接するリピート配列を５’末端および３’末端の両方に有するｃｒＲＮＡを生成する。ＣＲＩＳＰＲアレイはまた、２つのスペーサー配列に隣接する３つのリピート配列（下線部）を含むように拡張される場合があり、これらのスペーサー配列は、エンドヌクレアーゼカスケードタンパク質によるＲＮＡプロセシングによる２つの互いに異なるｃｒＲＮＡのガイド部分に相当する。アレイは、所望により追加的なスペーサー配列を含むようにさらに拡張することができる。

カスケードエフェクター複合体の産生のための細菌発現ベクターの設計
本実施例は、カスケード関連タンパク質をコードする細菌発現ベクターの設計のみならず、実施例１に記載されるガイド配列を含む最小ＣＲＩＳＰＲアレイについて記載する。最小ＣＲＩＳＰＲアレイをコードするプラスミドでの使用のためのカスケードサブユニットタンパク質発現系の構築について記載する。

単一プラスミドカスケードタンパク質発現系を構築して、ＣａｓＢＣＤＥ複合体（Ｃｓｅ２、Ｃａｓ７、Ｃａｓ５、およびＣａｓ６タンパク質を含むが、Ｃａｓ８タンパク質を含まない）として知られる、大腸菌におけるカスケード複合体、または大腸菌における機能的カスケード複合体全体のいずれかのタンパク質を発現させた。単一プラスミド系は、単一の発現プラスミド上にｃｓｅ２−ｃａｓ７−ｃａｓ５−ｃａｓ６オペロン、またはｃａｓ８−ｃｓｅ２−ｃａｓ７−ｃａｓ５−ｃａｓ６オペロン全体のいずれかを含む。Ｃａｓ８タンパク質は、ＣａｓＢＣＤＥ複合体と一緒に混合してカスケードを再構成する生化学実験に使用するために、それ自体の発現プラスミドから発現させることができる。

発現ベクターの構築のために出発プラスミドを使用した（Ｂｒｏｕｎｓ、Ｓ．ら、Ｓｃｉｅｎｃｅ３２１：９６０〜９６４（２００８年）参照）。Ｃａｓオペロンを含む単一プラスミドカスケードタンパク質発現系を以下のように組み立てた。ｃａｓ遺伝子についてのコーディング配列をｃｓｅ２−ｃａｓ７−ｃａｓ５−ｃａｓ６（ＣａｓＢＣＤＥ複合体）またはｃａｓ８−ｃｓｅ２−ｃａｓ７−ｃａｓ５−ｃａｓ６（全カスケード複合体）の順序で配置し、野生型細菌遺伝子の配置に対応する配列で分離した（ＮＣＢＩ参照配列ＮＺ＿ＣＰ０１４２２５．１参照）。

アフィニティータグ（Ｈｉｓ６またはＳｔｒｅｐ−ｔａｇ（登録商標）ＩＩ、ＩＢＡＧＭＢＨＬＬＣ、Ｇｏｅｔｔｉｎｇｅｎ、Ｇｅｒｍａｎｙ）をコードするポリヌクレオチド配列を付加するために、対応するコーディング配列をｃａｓ８遺伝子の３’末端とｃｓｅ２遺伝子の５’末端との接合部に挿入した；これらの２つのオープンリーディングフレームは、野生型ｇＤＮＡ配列において重複している。

Ｎ末端ＮＬＳタグおよび／またはＮＬＳ−ＨＡタグをコードするポリヌクレオチド配列をｃａｓ６遺伝子の５’末端に付加するために、ｃａｓ６遺伝子と上流のｃａｓ５遺伝子との間に追加的なスペーシングを導入した。それは、これらのオープンリーディングフレームが野生型ｇＤＮＡ配列において重複する結果、ｃａｓ６遺伝子についてのシャイン・ダルガノ配列がｃａｓ５遺伝子の３’部分内にあるからである。新しいシャイン・ダルガノ配列を新しいＮＬＳ−Ｃａｓ６またはＮＬＳ−ＨＡ−Ｃａｓ６のオープンリーディングフレームの上流に挿入して、翻訳効率を改善した。

Ｃ末端ＮＬＳタグおよび／またはＨＡ−ＮＬＳタグをコードするポリヌクレオチド配列をｃａｓ７遺伝子の３’末端に付加するために、ｃａｓ７遺伝子と下流のｃａｓ５遺伝子との間に追加的なスペーシングを導入した。それは、これらのオープンリーディングフレームが野生型ｇＤＮＡ配列において近接する結果、ｃａｓ５遺伝子についてのシャイン・ダルガノ配列がｃａｓ７遺伝子の３’部分内にあるからである。新しいシャイン・ダルガノ配列を新しいＣａｓ７−ＮＬＳまたはＣａｓ７−ＨＡ−ＮＬＳのオープンリーディングフレームの上流に挿入して、ｃａｓ５遺伝子についての翻訳効率を改善した。

Ｎ末端ＮＬＳ−ＦｏｋＩ−リンカー融合物をコードするポリヌクレオチド配列をＣａｓ８タンパク質に付加するために、対応するコーディング配列をｃａｓ８遺伝子の５’末端に挿入した。

ａａｄＡ遺伝子の存在によりスペクチノマイシン耐性を付与するｐＣＤＦ（ＭｉｌｌｉｐｏｒｅＳｉｇｍａ、Ｈａｙｗａｒｄ、ＣＡ）ベクター骨格内にｃｓｅ２−ｃａｓ７−ｃａｓ５−ｃａｓ６オペロンおよびｃａｓ８−ｃｓｅ２−ｃａｓ７−ｃａｓ５−ｃａｓ６オペロンをクローニングした。オペロンの転写は、Ｔ７プロモーターによって駆動され、Ｌａｃオペレーターの制御下にあり；このベクターは、ＬａｃＩリプレッサーもまたコードする。Ｔ７ターミネーターをｃｓｅ２−ｃａｓ７−ｃａｓ５−ｃａｓ６またはｃａｓ８−ｃｓｅ２−ｃａｓ７−ｃａｓ５−ｃａｓ６オペロンの下流にクローニングした。このベクターは、ＣＤＦ複製起点を含む。

Ｃａｓ８またはＦｏｋＩ−Ｃａｓ８融合タンパク質の発現のために、ｋａｎＲ遺伝子の存在によりカナマイシン耐性を付与するｐＥＴ（ＭｉｌｌｉｐｏｒｅＳｉｇｍａ、Ｈａｙｗａｒｄ、ＣＡ）ファミリーベクター骨格内にｃａｓ８遺伝子をクローニングした。オペロンの転写は、Ｔ７プロモーター（Ｐ_T7）によって駆動され、Ｌａｃオペレーター（ｌａｃＯ）の制御下にあり；このベクターは、ＬａｃＩリプレッサー（ｌａｃＩ遺伝子）もまたコードする。Ｔ７ターミネーターをｃａｓ８遺伝子の下流にクローニングした。このベクターは、ＣｏｌＥ１複製起点を含む。

図２３Ａ、図２３Ｂ、図２３Ｃ、図２３Ｄ、および図２３Ｅは、ｃａｓ８、ｆｏｋＩ−ｃａｓ８、ｃｓｅ２−ｃａｓ７−ｃａｓ５−ｃａｓ６オペロン、ｃａｓ８−ｃｓｅ２−ｃａｓ７−ｃａｓ５−ｃａｓ６オペロン、およびｆｏｋＩ−ｃａｓ８−ｃｓｅ２−ｃａｓ７−ｃａｓ５−ｃａｓ６オペロンについての過剰発現ベクターの模式図を示す。図２３Ａ、図２３Ｂ、図２３Ｃ、図２３Ｄ、および図２３Ｅにおける呼称は、本実施例（および実施例１）に説明され、次の通りである：Ｐ_T7（Ｔ７プロモーター）、ｌａｃＯ（Ｌａｃオペレーター）、Ｈｉｓ６（ヘキサヒスチジン）、ＭＢＰ（マルトース結合タンパク質）、Ｓｔｒｅｐ−ｔａｇ（登録商標）ＩＩ（ＩＢＡＧＭＢＨＬＬＣ、Ｇｏｅｔｔｉｎｇｅｎ、Ｇｅｒｍａｎｙ）ＨＲＶ３Ｃ（ヒトライノウイルス３Ｃ）プロテアーゼ認識配列、ＴＥＶ（タバコエッチ病ウイルス）プロテアーゼ認識配列、ＮＬＳ（核局在化シグナル）、ｋａｎＲ（カナマイシン耐性遺伝子）、ｌａｃＩ（ＬａｃＩリプレッサー遺伝子）、ｃｏｌＥ１ｏｒｉ（複製起点）、ＣＤＦｏｒｉ（ＣｌｏＤＦ１３複製起点）、ＦｏｋＩヌクレアーゼドメイン（Ｓｈａｒｋｅｙバリアント）、およびａａｄＡ（アミノグリコシド耐性タンパク質をコードする遺伝子）。

表１９は、Ｃａｓ８タンパク質、ＣａｓＢＣＤＥ複合体（ｃｓｅ２−ｃａｓ７−ｃａｓ５−ｃａｓ６オペロン）の４つのタンパク質、およびカスケード複合体（ｃａｓ８−ｃｓｅ２−ｃａｓ７−ｃａｓ５−ｃａｓ６オペロン）の全部で５つのタンパク質をコードする細菌発現プラスミドの配列を提供する。Ｃａｓ８タンパク質のＮ末端にＦｏｋＩが融合したポリヌクレオチド配列および融合していないポリヌクレオチド配列を提供する。

ｃｒＲＮＡを含むＣａｓＢＣＤＥ複合体およびカスケード複合体を精製するために、ｃｓｅ２−ｃａｓ７−ｃａｓ５−ｃａｓ６オペロンまたはｃａｓ８−ｃｓｅ２−ｃａｓ７−ｃａｓ５−ｃａｓ６オペロンをコードするタンパク質発現ベクターを、最小ＣＲＩＳＰＲアレイを含むベクターと組み合わせる。

ｃａｍＲ遺伝子によりクロラムフェニコール耐性を付与するｐＡＣＹＣ−Ｄｕｅｔ１ベクター骨格内にＣＲＩＳＰＲアレイをクローニングした。アレイの転写はＴ７プロモーターによって駆動され、Ｌａｃオペレーター（ｌａｃＯ）の制御下であり；このベクターは、ＬａｃＩリプレッサーもまたコードする。Ｔ７ターミネーターをＣＲＩＳＰＲアレイの下流にクローニングした。このベクターは、ｐ１５Ａ複製起点を含む。

図２４は、２つのリピート（図２４、「リピート」）および１つのスペーサー（図２４、「スペーサー」）を有するＣＲＩＳＰＲアレイを含む発現ベクターの模式図を含む。アレイは、本明細書に記載されるように拡張することができる。図２４における呼称は、本実施例（および実施例１）に説明され、次の通りである：Ｐ_T7（Ｔ７プロモーター）、ｌａｃＯ（Ｌａｃオペレーター）、ｌａｃＩ（ＬａｃＩリプレッサー遺伝子）、ｐ１５Ａｏｒｉ（複製起点）、およびｃａｍＲ（クロラムフェニコール耐性遺伝子）。

表２０は、最小ＣＲＩＳＰＲアレイの例をコードする細菌発現プラスミドの配列を提供するものである。

哺乳動物細胞におけるカスケードエフェクター複合体の産生のための真核生物発現ベクターの設計
本実施例は、カスケード関連タンパク質をコードする真核生物発現プラスミドベクターの設計のみならず、実施例１に記載される構成要素の配列を含む最小ＣＲＩＳＰＲアレイを記載する。

Ａ．各カスケードタンパク質を発現している別々のプラスミドおよび最小ＣＲＩＳＰＲアレイ
ヒトサイトメガロウイルス（ＣＭＶ）前初期プロモーター／エンハンサーによって駆動される別々の発現ベクター上にタンパク質構成要素のそれぞれをコードさせ、ヒトＵ６プロモーターによって駆動される別々の発現ベクター上にｃｒＲＮＡをコードさせることによって、カスケードタンパク質を哺乳動物細胞において発現させることができる。

各発現プラスミドについての出発プラスミドは、ｐｃＤＮＡ３．１（ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ、Ｗｉｌｍｉｎｇｔｏｎ、ＤＥ）の派生物であった。ヒト細胞における発現のためにコドン最適化されたカスケードタンパク質についてのコーディング配列（実施例１参照）を、ベクター内のＣＭＶプロモーターの下流でウシ成長ホルモン（ｂＧＨ）ポリアデニル化シグナルの上流に挿入した。Ｎ末端ＮＬＳおよび３×ＦＬＡＧエピトープタグをコードするポリヌクレオチド配列の５’末端にｃｓｅ２遺伝子を融合させた。Ｎ末端ＮＬＳをコードするポリヌクレオチド配列の５’末端にｃａｓ５遺伝子を融合させた。Ｎ末端ＮＬＳおよびＨＡエピトープタグをコードするポリヌクレオチド配列の５’末端にｃａｓ６遺伝子を融合させた。Ｎ末端ＮＬＳおよびＭｙｃエピトープタグをコードするポリヌクレオチド配列の５’末端にｃａｓ７遺伝子を融合させた。Ｎ末端ＮＬＳをコードするポリヌクレオチド配列の５’末端にｃａｓ８遺伝子を融合させ；別の実施形態では、Ｎ末端ＮＬＳ、ＨＡエピトープタグ、およびＦｏｋＩヌクレアーゼドメインをコードするポリヌクレオチド配列の５’末端にｃａｓ８遺伝子を融合させた。

ａｍｐＲ遺伝子の存在によりアンピシリン耐性を付与するｐｃＤＮＡ３．１派生物ベクター骨格内に各遺伝子または遺伝子融合物をクローニングした。このベクターは、ＳＶ４０初期プロモーター（Ｐ_SV40）および起点（ＳＶ４０ｏｒｉ）の下流で、ＳＶ４０初期ポリアデニル化シグナル（ＳＶ４０ｐＡ）の上流にあるｎｅｏＲ遺伝子の存在によりネオマイシン耐性もまたコードする。ヒトＣＭＶ前初期プロモーター／エンハンサー（Ｐ_CMV）およびｂＧＨ（ウシ成長ホルモン）ポリアデニル化シグナルに加えて、このベクターは、目的の遺伝子の上流にＴ７プロモーターを含み、ｍＲＮＡのｉｎｖｉｔｒｏ転写を可能にする。このベクターは、ｆ１複製起点のみならず、ＣｏｌＥ１複製起点を含む。

図２５は、ＦｏｋＩ−Ｃａｓ８融合タンパク質をコードする哺乳動物発現ベクターの模式図を含む。図２５における呼称は、本実施例（および実施例１）に説明され、次の通りである：ヒトＣＭＶ前初期プロモーター／エンハンサー（Ｐ_CMV）、ＮＬＳ（核局在化シグナル）、ＦｏｋＩ（ＦｏｋＩヌクレアーゼドメイン（Ｓｈａｒｋｅｙバリアント））、Ｃａｓ８タンパク質コーディング配列、ｂＧＨｐＡ（ウシ成長ホルモンポリアデニル化シグナル）、ｆ１ｏｒｉ（ｆ１ファージ複製起点）、Ｐ_SV40（ＳＶ４０初期プロモーター）、ＳＶ４０ｏｒｉ（ＳＶ４０起点）、ｎｅｏＲ（ネオマイシン耐性遺伝子）、ＳＶ４０ｐＡ（ＳＶ４０初期ポリアデニル化シグナル）、ｃｏｌＥ１ｏｒｉ（複製起点）、およびａｍｐＲ（アンピシリン耐性遺伝子）。他のカスケードタンパク質をコードするベクターを同様に設計した。

表２１は、Ｃｓｅ２、Ｃａｓ５、Ｃａｓ６、Ｃａｓ７、Ｃａｓ８、およびＦｏｋＩ−Ｃａｓ８のそれぞれをコードする個別の哺乳動物発現ベクターの配列を提供するものである。

２つのスペーサー配列に隣接する３つのリピートを含む最小ＣＲＩＳＰＲアレイをＣＲＩＳＰＲＲＮＡにコードさせた。ＣＲＩＳＰＲＲＮＡを生成する構築物は、追加的な配列が最小アレイ中の最外側リピートに隣接するように設計することができる。前駆体ＣＲＩＳＰＲＲＮＡのプロセシングは、カスケード複合体のＲＮＡプロセシングタンパク質（Ｃａｓ６タンパク質）によって可能にされ、それを別々のプラスミド上に発現させることができる。

ヒトＣＭＶプロモーターをヒトＵ６プロモーター（Ｐ_U6）で置換し、ｂＧＨポリアデニル化シグナルをポリ−Ｔ終結シグナルで置換したことを除き、上記と同じｐｃＤＮＡ３．１派生物ベクター骨格内にＣＲＩＳＰＲアレイをクローニングした。そのようなＣＲＩＳＰＲアレイの例を図３５に図示する。この図中、ｈＵ６プロモーター（図３５、ドット模様の領域として示す）は第１のリピート配列（白の菱形）に隣接し、第１のリピート配列は第１のスペーサー配列（図３５、スペーサー１、斜線）に隣接し、第１のスペーサー配列は第２のリピート配列（図３５、灰色の菱形）に隣接し、第２のリピート配列は第２のスペーサー配列（図３５、スペーサー２）に隣接し、第２のスペーサー配列は第３のリピート配列（図３５、黒の菱形）に隣接する。図３５において、対形成ｇＲＮＡガイドを含む領域を示す（図３５、対形成ｇＲＮＡ）。

図２６は、ＴＲＡＣ遺伝子を標的化する代表的なＣＲＩＳＰＲアレイをコードする真核生物発現ベクターの模式図を含む。図２６における呼称が、本実施例（および実施例１）に説明され、次の通りである：Ｐ_U6（ヒトＵ６プロモーター）、リピート（ＣＲＩＳＰＲＲＮＡリピート）、ＴＲＡＣスペーサー−１（ＴＲＡＣ遺伝子を標的化する第１のスペーサー）、ＴＲＡＣスペーサー−２（ＴＲＡＣ遺伝子を標的化する第２のスペーサー）、ポリＴ（ポリＴ終結シグナル）、ｆ１ｏｒｉ（ｆ１ファージ複製起点）、Ｐ_SV40（ＳＶ４０初期プロモーター）、ＳＶ４０ｏｒｉ（ＳＶ４０起点）、ｎｅｏＲ（ネオマイシン耐性遺伝子）、ＳＶ４０ｐＡ（ＳＶ４０初期ポリアデニル化シグナル）、ｃｏｌＥ１ｏｒｉ（複製起点）、およびａｍｐＲ（アンピシリン耐性遺伝子）。

表２２は、ＴＲＡＣ遺伝子を標的化するＣＲＩＳＰＲアレイをコードする代表的な哺乳動物発現ベクターの配列を提供し；ＴＲＡＣ遺伝子中のマッチするＤＮＡ配列を標的化するスペーサー配列を表１８に見出すことができる。

Ｂ．複数のカスケードタンパク質コーディング配列が単一のプロモーターから発現されるカスケードタンパク質発現系
より少ない発現ベクターからカスケード複合体の構成要素を発現させるために、多シストロン性発現ベクターを構築した。それぞれで、単一のＣＭＶプロモーターが、２Ａウイルスペプチド配列により分離された複数のコーディング配列の発現を同時に駆動する。ゾセア・アシグナ（Ｔｈｏｓｅａａｓｉｇｎａ）ウイルス２Ａペプチド配列はリボソームスキップを誘導することで（例えば、Ｌｉｕ、Ｚ．ら、Ｓｃｉ．Ｒｅｐ．７：２１９３（２０１７年）参照）、複数のタンパク質コーディング遺伝子を単一の多シストロン性構築物内で連結することを可能にする。

多シストロン性発現プラスミドのための出発プラスミドは、ＣＭＶプロモーターおよびｂＧＨポリアデニル化シグナルを含む、上記と同じｐｃＤＮＡ３．１派生物であった。ヒト細胞における発現のためにコドン最適化されたカスケードタンパク質についてのコーディング配列（実施例１参照）をｃａｓ７−ｃｓｅ２−ｃａｓ５−ｃａｓ６−ｃａｓ８の順に繋ぎ、各遺伝子対の間にゾセア・アシグナウイルス２Ａ（Ｔ２Ａ）ペプチドをコードするポリヌクレオチド配列が挿入させた。加えて、ＮＬＳタグをコードするポリヌクレオチド配列を各カスケードタンパク質遺伝子の５’末端に付加し、ＦｏｋＩヌクレアーゼドメインをコードするポリヌクレオチド配列を３０アミノ酸のリンカー配列によって繋いてｃａｓ８遺伝子の５’末端に付加した。最終構築物は、次の順序のエレメントを有する：ＮＬＳ−ｃａｓ７−Ｔ２Ａ−ＮＬＳ−ｃｓｅ２−Ｔ２Ａ−ＮＬＳ−ｃａｓ５−Ｔ２Ａ−ＮＬＳ−ｃａｓ６−Ｔ２Ａ−ＮＬＳ−ｆｏｋＩ−リンカー−ｃａｓ８。

図２７は、すべてのカスケードタンパク質をコードする例示的な多シストロン性哺乳動物発現ベクターの模式図を含む。図２７における呼称は、本実施例（および実施例１）に説明され、次の通りである：ヒトＣＭＶ前初期プロモーター／エンハンサー（Ｐ_CMV）、ＮＬＳ（核局在化シグナル）、Ｔ２Ａ（ゾセア・アシグナウイルス２Ａペプチドをコードするポリヌクレオチド配列）、Ｃａｓ７、Ｃｓｅ２、Ｃａｓ５、およびＣａｓ６タンパク質についてのコーディング配列、ｆｏｋＩ（ＦｏｋＩヌクレアーゼドメイン（Ｓｈａｒｋｅｙバリアント）リンカー配列、Ｃａｓ８タンパク質についてのコーディング配列、ｂＧＨｐＡ（ウシ成長ホルモンポリアデニル化シグナル）、ｆ１ｏｒｉ（ｆ１ファージ複製起点）、Ｐ_SV40（ＳＶ４０初期プロモーター）、ＳＶ４０ｏｒｉ（ＳＶ４０起点）、ｎｅｏＲ（ネオマイシン耐性遺伝子）、ＳＶ４０ｐＡ（ＳＶ４０初期ポリアデニル化シグナル）、ｃｏｌＥ１ｏｒｉ（複製起点）、ａｍｐＲ（アンピシリン耐性遺伝子）、およびＭｌｕＩ制限部位。

表２３は、すべてのカスケードタンパク質をコードする例示的な多シストロン性哺乳動物発現ベクターの配列を提供するものである。このベクターを、上記のＣＲＩＳＰＲＲＮＡをコードする哺乳動物発現ベクターと組み合わせて、哺乳動物細胞における機能的カスケード複合体を産生することができる。

Ｃ．単一プラスミド発現系
単一プラスミドカスケード発現系を構築して、ヒト細胞に完全カスケード複合体を発現させた。このプラスミドは、単一プラスミド上にｃａｓ８−ｃｓｅ２−ｃａｓ７−ｃａｓ５−ｃａｓ６オペロン全体および最小ＣＲＩＳＰＲアレイをコードする。最小ＣＲＩＳＰＲアレイを上流のヒトＵ６プロモーターおよび下流のポリ−Ｔ終結シグナルと一緒にＭｌｕＩ制限部位内に挿入することによって、多シストロン性タンパク質発現ベクターからこのプラスミドを構築した（表２３および図２７に記載）。

表２４は、ヒト細胞におけるカスケード複合体の形成を促進するためのｃｒＲＮＡと一緒の全部で５つのカスケードタンパク質の発現のための単一プラスミドの配列を提供するものである。

大腸菌および哺乳動物細胞におけるＣａｓ３タンパク質（配列番号２１；モノマーＣａｓ３ヌクレアーゼ／ヘリカーゼ大腸菌Ｋ−１２亜株ＭＧ１６５５）の発現のためのプラスミドも設計した。表２５は、これらのプラスミドの構築物および配列を提供するものである。

カスケード構成要素をコードするポリヌクレオチドの細菌生産株への導入
本実施例は、大腸菌発現系を用いた細菌細胞におけるＣａｓ８サブユニットタンパク質コーディング配列のみならず操作されたＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の構成要素についてのコーディング配列の導入および発現について記載する。

Ａ．Ｃａｓ８タンパク質の発現
Ｔ７プロモーターからのＨｉｓ６−ＭＢＰ−ＴＥＶ−Ｃａｓ８のＩＰＴＧ誘導発現のためのオペロンを含むプラスミド（実施例２、配列番号４３８、表１９、図２３Ａ）から大腸菌Ｉ−Ｅ型Ｃａｓ８タンパク質を発現させた。本発現プラスミドはカナマイシンに対する耐性を付与した。

Ｃａｓ８タンパク質を発現させるために、発現プラスミドで大腸菌細胞を形質転換した。簡潔には、微量遠心チューブ中のケミカルコンピテント大腸菌細胞（大腸菌ＢＬ２１Ｓｔａｒ（商標）（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、Ｗａｌｔｈａｍ、ＭＡ）細胞）のアリコート１００μＬを氷上で１０分間解凍した。解凍した細胞にプラスミドＤＮＡ３５ｎｇを添加し、細胞をＤＮＡと共に氷上で８分間インキュベートした。微量遠心チューブを４２℃の水浴中に３０秒間入れ、次いで直ちにチューブを氷中に２分間入れることによって熱ショックを行った。２×ＹＴ培地９００μＬを微量遠心チューブに加え、この微量遠心チューブをチューブローテーターに３７℃で１時間置いた。最終的に、回収した細胞１００μＬを、ＬＢ固形カナマイシン（５０μｇ／ｍＬ）上に蒔き、３７℃で一晩インキュベートした。

抗生物質選択プレート上に生育したコロニーから単一のコロニーを釣り上げ、カナマイシン（５０μｇ／ｍＬ）を補充した２×ＹＴ培地１０ｍＬ中にこれを播種した。培養物を２００ＲＰＭのオービタルシェーカーで振盪しながら３７℃で一晩生育させた。カナマイシン（５０μｇ／ｍＬ）を補充した２×ＹＴ培地１Ｌを有する２Ｌバッフル付きフラスコに一晩培養物６ｍＬを移した。６００ｎｍの吸光度が０．５６になるまで培養物１Ｌを２００ＲＰＭのオービタルシェーカーで振盪しながら３７℃で生育させた。

次いで、ＩＰＴＧを終濃度１ｍＭまで添加することによって発現を誘導した。誘導された培養物を２００ＲＰＭのオービタルシェーカーで振盪しながら１６℃で一晩生育させた。４，０００ＲＣＦ、４℃で１５分間の遠心分離によって細胞を回収した。溶解緩衝液５０ｍＬあたりＣｏｍｐｌｅｔｅ（商標）（Ｒｏｃｈｅ、Ｂａｓｅｌ、Ｓｗｉｔｚｅｒｌａｎｄ）プロテアーゼ阻害剤錠１つを補充した、５０ｍＭトリスｐＨ７．５、１００ｍＭＮａＣｌ、５％グリセリン、および１ｍＭＴＣＥＰから構成される溶解緩衝液１５ｍＬ中に細胞ペレットを再懸濁した。すぐ下流のプロセシングのために、再懸濁した細胞を５０ｍＬコニカルチューブに移した。Ｃａｓ８タンパク質を精製し、精製タンパク質を本質的にＦｏｋＩ−Ｃａｓ８融合タンパク質について下（実施例５Ｃ）に記載されるように特徴づけた。

Ｂ．カスケードＲＮＰ複合体の構成要素の発現
カスケードＲＮＰ複合体を産生するために２プラスミド系を使用して大腸菌細胞中に５つの大腸菌カスケードタンパク質およびＲＮＡガイドの一式を共発現させた。１つのプラスミド（実施例２、配列番号４４１、表１９、図２３Ｄ）は、Ｔ７プロモーターからのＣｓｅ２、Ｃａｓ５、Ｃａｓ６、Ｃａｓ７、およびＣａｓ８タンパク質のＩＰＴＧ誘導発現のためのオペロンを含んでいた。Ｃｓｅ２のＮ末端との翻訳融合体としてＨｉｓ６アフィニティータグを含めた（実施例１、配列番号３９２、表１６）。第２のプラスミドは、Ｊ３ガイドのＩＰＴＧ誘導発現をコードしていた（実施例２、配列番号４４４、表２０、図２４）。カスケードタンパク質発現プラスミドはスペクチノマイシン耐性を付与し、カスケードＲＮＡガイド発現プラスミドはクロラムフェニコール耐性を付与した。

同じ細胞においてカスケードタンパク質およびＲＮＡ構成要素を共発現させるために、２つのプラスミドで大腸菌細胞を同時形質転換した。マイクロ遠心チューブ中のケミカルコンピテント大腸菌細胞（大腸菌、ＢＬ２１Ｓｔａｒ（商標）（ＤＥ３）（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、Ｗａｌｔｈａｍ、ＭＡ））のアリコート１００μＬを氷上で１０分間解凍した。解凍した細胞に各プラスミド３５ｎｇを添加し、これらの細胞をＤＮＡと共に氷上で８分間インキュベートした。マイクロ遠心チューブを４２℃の水浴中に３０秒間入れ、次いで直ちにマイクロ遠心チューブを氷中に２分間入れることによって熱ショックを行った。２×ＹＴ培地９００μＬをマイクロ遠心チューブに加え、このマイクロ遠心チューブをチューブローテーターに３７℃で１時間置いた。最終的に、回収した細胞１００μＬを、クロラムフェニコール（３４μｇ／ｍＬ）およびスペクチノマイシン（５０μｇ／ｍＬ）を有するＬＢ固形培地上に蒔き、３７℃で一晩インキュベートした。

抗生物質選択プレート上に生育したコロニーから単一のコロニーを釣り上げ、クロラムフェニコール（３４μｇ／ｍＬ）およびスペクチノマイシン（１００μｇ／ｍＬ）を補充した２×ＹＴ培地１０ｍＬ中にこれを播種した。培養物を２００ＲＰＭのオービタルシェーカーで振盪しながら３７℃で一晩生育させた。クロラムフェニコール（３４μｇ／ｍＬ）およびスペクチノマイシン（１００μｇ／ｍＬ）を補充した２×ＹＴ培地１Ｌを有する２Ｌバッフル付きフラスコに一晩培養物６ｍＬを移した。６００ｎｍの吸光度が０．５６になるまで培養物１Ｌを２００ＲＰＭのオービタルシェーカーで振盪しながら３７℃で生育させた。

ＩＰＴＧを終濃度１ｍＭまで添加することによって両方のプラスミドからの発現を誘導した。誘導された培養物を２００ＲＰＭのオービタルシェーカーで振盪しながら１６℃で一晩生育させた。４，０００ＲＣＦ、４℃で１５分間の遠心分離によって細胞を回収した。溶解緩衝液５０ｍＬあたりＣｏｍｐｌｅｔｅ（商標）（Ｒｏｃｈｅ、Ｂａｓｅｌ、Ｓｗｉｔｚｅｒｌａｎｄ）プロテアーゼ阻害剤錠１つを補充した、５０ｍＭトリスｐＨ７．５、１００ｍＭＮａＣｌ、５％グリセリン、および１ｍＭＴＣＥＰから構成される溶解緩衝液１５ｍＬ中に細胞ペレットを再懸濁した。すぐ下流のプロセシングのために、再懸濁した細胞を５０ｍＬコニカルチューブに移した。カスケードＲＮＰ複合体を精製し、下記のように特徴づけた。

カスケード構成要素およびカスケードＲＮＰ複合体の精製
本実施例は、実施例４Ｂに記載される細菌における過剰発現によって産生された大腸菌Ｉ−Ｅ型カスケードＲＮＰ複合体を精製するための方法を記載するものである。この方法は、固定化金属アフィニティークロマトグラフィーに続いてサイズ排除クロマトグラフィー（ＳＥＣ）を使用する。本実施例はまた、精製カスケードＲＮＰ産物の品質を評価するために使用される方法を記載する。加えて、本実施例は、カスケード構成要素の精製および特徴付けを記載する。

Ａ．Ｃａｓ８、Ｃａｓ７、Ｃａｓ６、Ｃａｓ５、およびＣｓｅ２カスケードＲＮＰ複合体の精製
大腸菌Ｉ−Ｅ型カスケードＲＮＰ複合体を実施例４Ｂに記載されるように産生した。固定化金属アフィニティークロマトグラフィーを用いてカスケード複合体を捕捉した。簡潔には、実施例４Ｂに記載のように産生した再懸濁後の細胞ペレットを氷上で解凍し、溶解緩衝液５０ｍＬあたりＣｏｍｐｌｅｔｅ（商標）（Ｒｏｃｈｅ、Ｂａｓｅｌ、Ｓｗｉｔｚｅｒｌａｎｄ）プロテアーゼ阻害剤錠１つを補充した、５０ｍＭトリスｐＨ７．５、１００ｍＭＮａＣｌ、５％グリセリン、および１ｍＭＴＣＥＰから構成される溶解緩衝液の追加的な１５ｍＬによって体積を３５ｍＬにした。

５０ｍＬコニカルチューブを氷浴中に入れ、１／２インチのチップを備えるＱ５００超音波処理器（Ｑｓｏｎｉｃａ、Ｎｅｗｔｏｗｎ、ＣＴ）を使用する２ラウンドの超音波処理によって細胞を溶解させた。各ラウンドの超音波処理は、５０％振幅で１０秒の超音波処理に続く２０秒の休止という繰り返しサイクルを伴う２．５分の処理サイクルからなった。超音波処理のラウンドの間、チューブを氷浴中で１分間放冷した。４８，３８４ＲＣＦ、４℃で３０分間の遠心分離によって溶解物を清澄化した。次いで、５０ｍＭトリスｐＨ７．５、１００ｍＭＮａＣｌ、１０ｍＭイミダゾール、５％グリセリン、および１ｍＭＴＣＥＰから構成されるＮｉ洗浄緩衝液で予備平衡化しておいたＨｉｓｐｕｒ（商標）Ｎｉ−ＮＴＡ（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、Ｗａｌｔｈａｍ、ＭＡ）樹脂に、清澄な上清を添加した。大腸菌発現培養物１Ｌ毎に１．５ｍＬベッド体積のニッケルアフィニティー樹脂を使用した。優しく混合しながら４℃で１時間インキュベーション後、５００ＲＣＦ、４℃で２分間の遠心分離によって樹脂をペレットにした。上清を吸引し、樹脂を５ベッド体積のＮｉ洗浄緩衝液で５回洗浄した。各洗浄の後に、樹脂を５００ＲＣＦ、４℃で２分間ペレットにし、吸引によって上清を除去した。最終的に、５０ｍＭトリスｐＨ７．５、１００ｍＭＮａＣｌ、３００ｍＭイミダゾール、５％グリセリン、および１ｍＭトリス（２−カルボキシエチル）ホスフィン（ＴＣＥＰ）から構成される５ベッド体積のＮｉ溶出緩衝液の添加によって、結合したタンパク質（カスケードＲＮＰ複合体を含む）を溶出させた。５００ＲＣＦ、４℃で２分間遠心分離後、ニッケルアフィニティー溶出液を清潔な５０ｍＬコニカルチューブ中に吸引した。

ニッケルアフィニティーの溶出液をサイズ排除クロマトグラフィー（ＳＥＣ）によってさらに精製した。Ｕｌｔｒａｃｅｌ（登録商標）−５０（ＭｉｌｌｉｐｏｒｅＳｉｇｍａ、Ｈａｙｗａｒｄ、ＣＡ）メンブランを備えるＡｍｉｃｏｎ（登録商標）（ＭｉｌｌｉｐｏｒｅＳｉｇｍａ、Ｂｉｌｌｅｒｉｃａ、ＭＡ）限外濾過スピン濃縮器を使用する１２℃での限外濾過によってニッケルアフィニティーの溶出液を終体積０．５ｍＬに濃縮した。濃縮したサンプルを、５０ｍＭトリスｐＨ７．５、５００ｍＭＮａＣｌ、５％グリセリン、０．１ｍＭＥＤＴＡ、および１ｍＭＴＣＥＰから構成されるＳＥＣ緩衝液で平衡化したＨｉＰｒｅｐ（商標）１６／６０Ｓｅｐｈａｃｒｙｌ（登録商標）Ｓ−３００（ＧＥＨｅａｌｔｈｃａｒｅ、Ｕｐｐｓａｌａ、Ｓｗｅｄｅｎ）カラムを用いて４℃で流速０．５ｍＬ／分の分離によってさらに精製する前に、０．２２μＭＵｌｔｒａｆｒｅｅ−ＭＣＧＶ（ＭｉｌｌｉｐｏｒｅＳｉｇｍａ、Ｈａｙｗａｒｄ、ＣＡ）遠心フィルターを使用して濾過した。ＳＥＣ緩衝液でタンパク質を溶出させ、１ｍｌ画分を収集した。ＵＶ２８０による判定で最も早く溶出したピークを高分子量凝集物質と仮定し、対応する画分を捨てた。その後の溶出画分をクマシー染色ＳＤＳ−ＰＡＧＥによって分析した。適切に形成された各複合体は、Ｃａｓ８を１分子、Ｃａｓ７を６分子、Ｃａｓ６およびＣａｓ５をそれぞれ１分子、ならびにＣｓｅ２を２分子含んでいた。ＳＤＳ−ＰＡＧＥゲル上に視覚化した場合に、予想される化学量論比のカスケードタンパク質をおおよそで有した溶出画分をプールした。プールした画分を分光測定により分析して、２８０ｎｍの吸光度よりも大きい２６０ｎｍの吸光度によって実証されるように、これらの画分がかなりの核酸構成要素を含有していたことを確認した。

Ｕｌｔｒａｃｅｌ（登録商標）−５０（ＭｉｌｌｉｐｏｒｅＳｉｇｍａ、Ｈａｙｗａｒｄ、ＣＡ）メンブランを備えるＡｍｉｃｏｎ（登録商標）（ＭｉｌｌｉｐｏｒｅＳｉｇｍａ、Ｈａｙｗａｒｄ、ＣＡ）スピン濃縮器でプールされたサンプルを１００μＬに濃縮し、次いで貯蔵緩衝液で５０倍希釈することによって、プールされたサンプルを５０ｍＭトリスｐＨ７．５、１００ｍＭＮａＣｌ、５％グリセリン、０．１ｍＭＥＤＴＡ、および１ｍＭＴＣＥＰから構成される貯蔵緩衝液中になるように交換した。最後に、同じ限外濾過装置を使用してサンプルを１０ｍｇ／ｍＬに濃縮し、−８０℃で保存した。

最終精製産物を分光光度分析して、カスケードＲＮＰ複合体の柊濃度を決定し、２８０ｎｍの吸光度よりも大きい２６０ｎｍの吸光度によって実証されるような核酸構成要素の存在を確認した。２８０ｎｍの吸光度を、インタクトな複合体の０．１％溶液の経路長１ｃｍの計算吸光度で割ることによってカスケードＲＮＰ複合体の濃度を決定した。精製複合体の０．１％溶液の予測される吸光度は２．０３ｃｍ^-1であるが、これは、複合体中の各分子についての２８０ｎｍの計算吸光係数の合計（９１６９４０Ｍ^-1ｃｍ^-1）を複合体中の各分子の分子量の合計（４５０８３２ｇ／モル）で割ることによって計算した。

追加的に、クマシーブルー染色を行うＳＤＳ−ＰＡＧＥによって最終産物を分析して、各タンパク質構成要素がほぼ正しい化学量論比で存在したことを確認し、混入タンパク質の存在を評価した。ＳＤＳ−ＰＡＧＥゲルをクマシーＩｎｓｔａｎｔＢｌｕｅ（商標）（Ｅｘｐｅｄｅｏｎ、ＳａｎＤｉｅｇｏ、ＣＡ）染色により染色した。Ｇｅｌｄｏｃ（商標）ＥＺ（Ｂｉｏ−Ｒａｄ、Ｈｅｒｃｕｌｅｓ、ＣＡ）イメージャーを使用してゲルをイメージングし、ＩｍａｇｅＬａｂ（Ｂｉｏ−Ｒａｄ、Ｈｅｒｃｕｌｅｓ、ＣＡ）ソフトウェアを使用してアノテーションした。

Ｂ．Ｃａｓ７、Ｃａｓ６、Ｃａｓ５、およびＣｓｅ２タンパク質を含むカスケード複合体の精製
タンパク質構成要素Ｃａｓ７、Ｃａｓ６、Ｃａｓ５、およびＣｓｅ２から構成されるカスケード複合体を精製した。本質的に実施例４Ｂに記載されるように第１のプラスミド（実施例２、図２４）からＬ３ガイドＲＮＡ（実施例２、配列番号４４５、表２０）を発現させた。本質的に実施例４Ｂに記載されるように第２のプラスミド（実施例２、配列番号４４０、表１９、図２３Ｃ）からカスケードタンパク質を発現させた。

アフィニティークロマトグラフィーを使用して複合体を捕捉した。再懸濁した細胞ペレットを氷上で解凍した。５０ｍＬコニカルチューブ中で、溶解緩衝液５０ｍＬあたりＣｏｍｐｌｅｔｅ（商標）（Ｒｏｃｈｅ、Ｂａｓｅｌ、Ｓｗｉｔｚｅｒｌａｎｄ）プロテアーゼ阻害剤錠１つを補充した、５０ｍＭトリスｐＨ７．５、１００ｍＭＮａＣｌ、５％グリセリン、および１ｍＭＴＣＥＰから構成される溶解緩衝液の追加的な１５ｍＬで体積を３５ｍＬにした。５０ｍＬコニカルチューブを氷浴中に入れ、１／２インチのチップを備えるＱ５００超音波処理器（Ｑｓｏｎｉｃａ、Ｎｅｗｔｏｗｎ、ＣＴ）を使用する６ラウンドの超音波処理によって細胞を溶解させた。各ラウンドの超音波処理は、９０％振幅で３秒の超音波処理に続く９秒の休止という繰り返しサイクルを伴う１分の処理サイクルからなった。超音波処理のラウンドの間、チューブを氷水浴中で１分間放冷した。４８，３８４ＲＣＦ、４℃で３０分間の遠心分離によって溶解物を清澄化した。５０ｍＭトリスｐＨ７．５、１００ｍＭＮａＣｌ、１ｍＭＥＤＴＡ、５％グリセリン、および１ｍＭＴＣＥＰから構成されるＳｔｒｅｐ−洗浄緩衝液で予備平衡化しておいたＳｔｒｅｐ−Ｔａｃｔｉｎ（登録商標）Ｓｅｐｈａｒｏｓｅ（登録商標）（ＩＢＡＧＭＢＨＬＬＣ、Ｇｏｅｔｔｉｎｇｅｎ、Ｇｅｒｍａｎｙ）樹脂の添加によって清澄な上清をアフィニティー精製した。大腸菌発現培養物１Ｌに対して０．５５ｍＬのベッド体積のアフィニティー樹脂を使用した。優しく混合しながら４℃で１時間インキュベートした後、３０ｍＬ使い捨て自然流下カラム（Ｂｉｏ−Ｒａｄ、Ｈｅｒｃｕｌｅｓ、ＣＡ）にサンプルを注ぎ、未結合の物質がカラムを通過して流れるようにした。５ベッド体積のＳｔｒｅｐ−洗浄緩衝液で樹脂を５回洗浄した。最後に、５０ｍＭトリスｐＨ７．５、１００ｍＭＮａＣｌ、２．５ｍＭデスチオビオチン、５％グリセリン、１ｍＭＥＤＴＡ、および１ｍＭＴＣＥＰから構成される５ベッド体積のＳｔｒｅｐ溶出緩衝液の２回の逐次添加によって、結合したタンパク質を溶出させた。

ＳＥＣによってアフィニティー溶出液をさらに精製した。Ｕｌｔｒａｃｅｌ（登録商標）−５０（ＭｉｌｌｉｐｏｒｅＳｉｇｍａ、Ｈａｙｗａｒｄ、ＣＡ）メンブランを備えるＡｍｉｃｏｎ（登録商標）（ＭｉｌｌｉｐｏｒｅＳｉｇｍａ、Ｈａｙｗａｒｄ、ＣＡ）スピン濃縮器を使用する１２℃での限外濾過によってアフィニティー溶出液を最終体積５５０μＬに濃縮した。５０ｍＭトリスｐＨ７．５、５００ｍＭＮａＣｌ、５％グリセリン、０．１ｍＭＥＤＴＡ、および１ｍＭＴＣＥＰから構成されるＳＥＣ緩衝液で平衡化したＨｉＰｒｅｐ（商標）１６／６０Ｓｅｐｈａｃｒｙｌ（登録商標）Ｓ−３００（ＧＥＨｅａｌｔｈｃａｒｅ、Ｕｐｐｓａｌａ、Ｓｗｅｄｅｎ）カラムを用いて４℃、流速０．４ｍＬ／分で分離することによってさらに精製する前に、０．２２μｍ１３ｍｍＵｌｔｒａＣｒｕｚ（登録商標）（ＳａｎｔａＣｒｕｚＢｉｏｔｅｃｈｎｏｌｏｇｙ、Ｄａｌｌａｓ、ＴＸ）ＰＶＤＦシリンジフィルターを使用して、濃縮したサンプルを濾過した。ＳＥＣ緩衝液でタンパク質を溶出させ、０．７５ｍｌの画分を収集した。ＵＶ２８０による判定で最も早く溶出したピークを高分子量凝集物質と仮定し、対応する画分を捨てた。第２のピーク（第１のＵＶ２８０のピーク後方のショルダー）に対応する画分をプールした。

Ｕｌｔｒａｃｅｌ（登録商標）−５０（ＭｉｌｌｉｐｏｒｅＳｉｇｍａ、Ｈａｙｗａｒｄ、ＣＡ）メンブランを備えるＡｍｉｃｏｎ（登録商標）（ＭｉｌｌｉｐｏｒｅＳｉｇｍａ、Ｈａｙｗａｒｄ、ＣＡ）スピン濃縮器で２００μＬに濃縮し、次いで５０ｍＭトリスｐＨ７．５、１００ｍＭＮａＣｌ、５％グリセリン、０．１ｍＭＥＤＴＡ、および１ｍＭＴＣＥＰから構成される貯蔵緩衝液で７５倍希釈することによって、プールされたサンプルを保存用緩衝液中になるように交換した。２回目にサンプルを７００μＬに濃縮し、再び保存用緩衝液で２０倍希釈した。最後に、同じ限外濾過装置でサンプルを４．７ｍｇ／ｍＬに濃縮し、−８０℃で保存した。

最終精製産物を分光光度分析して、カスケードＲＮＰ複合体の終濃度を決定し、２８０ｎｍの吸光度よりも大きい２６０ｎｍの吸光度によって実証されるような核酸構成要素の存在を確認した。２８０ｎｍの吸光度を、インタクトな複合体の０．１％溶液の経路長１ｃｍの計算吸光度で割ることによってカスケードＲＮＰ複合体の濃度を決定した。精製複合体の０．１％溶液の予測される吸光度は２．１８ｃｍ^-1であるが、これは、複合体中の各分子についての２８０ｎｍの計算吸光係数の合計（７６２２４０Ｍ^-1ｃｍ^-1）を複合体中の各分子の分子量の合計（３４８９５２．０７ｇ／モル）で割ることによって計算した。

追加的に、クマシーブルー染色を行うＳＤＳ−ＰＡＧＥによって最終産物を分析して、各カスケードタンパク質がほぼ正しい化学量論比で存在したことを確認し、混入タンパク質の存在を評価した。ＳＤＳ−ＰＡＧＥゲルをクマシーＩｎｓｔａｎｔＢｌｕｅ（商標）（Ｅｘｐｅｄｅｏｎ、ＳａｎＤｉｅｇｏ、ＣＡ）染色により染色した。Ｇｅｌｄｏｃ（商標）ＥＺ（Ｂｉｏ−Ｒａｄ、Ｈｅｒｃｕｌｅｓ、ＣＡ）イメージャーを使用してゲルをイメージングし、ＩｍａｇｅＬａｂ（Ｂｉｏ−Ｒａｄ、Ｈｅｒｃｕｌｅｓ、ＣＡ）ソフトウェアを使用してアノテーションした。適切に形成された各複合体は、Ｃａｓ７を６分子、Ｃａｓ６およびＣａｓ５をそれぞれ１分子、ならびにＣｓｅ２を２分子含んでいた。

Ｃ．ＦｏｋＩ−Ｃａｓ８融合タンパク質の精製
固定化金属アフィニティークロマトグラフィー、陽イオン交換クロマトグラフィー（ＣＩＥＸ）、および最終的にサイズ排除クロマトグラフィー（ＳＥＣ）を使用して、細菌過剰発現ペレットから大腸菌Ｉ−Ｅ型Ｃａｓ８タンパク質とのＦｏｋＩヌクレアーゼ融合物を含む融合タンパク質を精製するために使用される方法を本明細書において記載する。

リンカー配列を含む大腸菌Ｉ−Ｅ型ＦｏｋＩ−Ｃａｓ８融合タンパク質は、実施例１（配列番号４１３、表１６）に記載されている。発現プラスミドは、実施例２（配列番号４３９、表１９、図２３Ｂ）に記載されている。本質的に実施例４Ａに記載されるように、融合タンパク質を含む細胞を産生した。Ｃａｓ８融合タンパク質は、Ｎ末端Ｈｉｓ６タグ、マルトース結合タンパク質ドメイン、ＴＥＶ切断部位、ＦｏｋＩヌクレアーゼドメイン、およびアミノ酸３０個のリンカーを含んでいた。固定化金属アフィニティークロマトグラフィーを使用してタンパク質を捕捉した。再懸濁した細胞ペレットを含む５０ｍＬコニカルチューブを氷上で解凍した。次いで、チューブを氷浴中に入れ、４０％振幅で１０秒の超音波処理に続く２０秒の休止という繰り返しサイクルを伴う３分の処理サイクルのための１／４インチのチップを備えるＱ５００超音波処理器（Ｑｓｏｎｉｃａ、Ｎｅｗｔｏｗｎ、ＣＴ）を使用する超音波処理によって細胞を溶解した。３０，９７０ＲＣＦ、４℃で３０分間の遠心分離によって溶解物を清澄化した。次いで、５０ｍＭトリスｐＨ７．５、１００ｍＭＮａＣｌ、１０ｍＭイミダゾール、５％グリセリン、および１ｍＭＴＣＥＰから構成されるＮｉ洗浄緩衝液で予備平衡化しておいたＨｉｓｐｕｒ（商標）Ｎｉ−ＮＴＡ（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、Ｗａｌｔｈａｍ、ＭＡ）樹脂に、清澄な上清を添加した。大腸菌発現培養物１Ｌに対して２ｍＬのベッド体積のニッケルアフィニティー樹脂を使用した。優しく混合しながら４℃で１時間インキュベートした後、３０ｍＬ使い捨て自然流下カラム（Ｂｉｏ−Ｒａｄ、Ｈｅｒｃｕｌｅｓ、ＣＡ）にサンプルを注ぎ、未結合の物質がカラムを通して流れるようにした。５ベッド体積のＮｉ−洗浄緩衝液で樹脂を５回洗浄した。最後に、５０ｍＭトリスｐＨ７．５、１００ｍＭＮａＣｌ、３００ｍＭイミダゾール、５％グリセリン、および１ｍＭＴＣＥＰから構成される５ベッド体積のＮｉ溶出緩衝液を用いて、結合したタンパク質を溶出させた。

ニッケルアフィニティー溶出液をＴＥＶプロテアーゼで処理して、アフィニティータグを除去した。ＴＥＶプロテアーゼを溶出液に１：２５（ｗ／ｗ）の比で添加した。１２ｍＬＳｌｉｄ−Ａ−Ｌｙｚｅｒ（商標）、１０ＫＭＷＣＯ（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、Ｗａｌｔｈａｍ、ＭＡ）透析カセットを使用して、ＴＥＶを含むサンプルをＮｉ−洗浄緩衝液に対して一晩透析した。

Ｎｉアフィニティークロマトグラフィーにより透析サンプルからＴＥＶプロテアーゼおよび切断されたＨｉｓ６−ＭＢＰ断片を除去した。Ｎｉ−洗浄緩衝液で平衡化された清潔なＨｉｓｐｕｒ（商標）Ｎｉ−ＮＴＡ（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、Ｗａｌｔｈａｍ、ＭＡ）樹脂カラムに透析されたサンプルを注いだ。次いで、樹脂を１カラム体積のＮｉ−ＮＴＡ洗浄緩衝液で洗浄した。流出液および洗浄液を合わせ、濃縮し、Ｕｌｔｒａｃｅｌ（登録商標）−１０（ＭｉｌｌｉｐｏｒｅＳｉｇｍａ、Ｈａｙｗａｒｄ、ＣＡ）メンブランを備えるＡｍｉｃｏｎ（登録商標）（ＭｉｌｌｉｐｏｒｅＳｉｇｍａ、Ｈａｙｗａｒｄ、ＣＡ）スピン濃縮器を使用して、保存用緩衝液（５０ｍＭトリスｐＨ７．５、５００ｍＭＮａＣｌ、５％グリセリン、および１ｍＭＴＣＥＰ）中になるように交換した。次いで、このサンプルを保存用に−８０℃で凍結させた。

サンプルを解凍し、陽イオン交換クロマトグラフィー（ＣＩＥＸ）によってさらに精製した。サンプルを氷上で解凍し、５０ｍＭトリスｐＨ７．５、５％グリセリン、および１ｍＭＴＣＥＰから構成される冷ＣＩＥＸ＿Ａ緩衝液で０．４７５ｍＬから４．７５ｍＬに１０倍希釈し、結果として５０ｍＭＮａＣｌの終濃度をもたらした。１０ｍＬキャピラリーループを使用して、ＣＩＥＸ＿Ａ緩衝液および５％ＣＩＥＸ＿Ｂ緩衝液（５０ｍＭトリスｐＨ７．５、１ＭＮａＣｌ、５％グリセリン、および１ｍＭＴＣＥＰ）を含む緩衝液で平衡化した１ｍＬＨｉｔｒａｐ（商標）ＳＰＨＰ（ＧＥＨｅａｌｔｈｃａｒｅ、Ｕｐｐｓａｌａ、Ｓｗｅｄｅｎ）カラムにサンプルを負荷した。分離を通して流速は０．７５ｍＬ／ｍｉｎであった。５％ＣＩＥＸ＿Ｂ緩衝液１５ｍＬでループの中身をカラム上に出した。５％ＣＩＥＸ＿Ｂ緩衝液の追加的な２ｍＬで未結合のサンプルを洗浄した。結合したタンパク質として集めた５００μＬの画分を、５％から６５％のＣＩＥＸ＿Ｂ緩衝液の８ｍＬの直接勾配をかけて溶出した。２つの大きなＵＶ２８０溶出ピークがあった。これら２つのピークのうちの２番目に対応する４つの画分をプールした。プールされた体積の合計は２ｍＬであった。

プールされたＣＩＥＸ画分をＳＥＣによってさらに精製した。Ｕｌｔｒａｃｅｌ（登録商標）−１０（ＭｉｌｌｉｐｏｒｅＳｉｇｍａ、Ｈａｙｗａｒｄ、ＣＡ）メンブランを備えるＡｍｉｃｏｎ（登録商標）（ＭｉｌｌｉｐｏｒｅＳｉｇｍａ、Ｈａｙｗａｒｄ、ＣＡ）スピン濃縮器を使用する１２℃での限外濾過によって、プールされたＣＩＥＸ画分を０．３ｍＬの終体積に濃縮した。０．２２μｍＵｌｔｒａｆｒｅｅ−ＭＣＧＶ遠心分離（ＭｉｌｌｉｐｏｒｅＳｉｇｍａ、Ｈａｙｗａｒｄ、ＣＡ）スピンフィルターを使用して、濃縮したサンプルを濾過し、Ｃａｓ８ＳＥＣ緩衝液（５０ｍＭトリスｐＨ７．５、２００ｍＭＮａＣｌ、５％グリセリン、および１ｍＭＴＣＥＰ）で平衡化した１０／３００Ｓｕｐｅｒｄｅｘ（商標）２００ＧＬＩｎｃｒｅａｓｅ（ＧＥＨｅａｌｔｈｃａｒｅ、Ｕｐｐｓａｌａ、Ｓｗｅｄｅｎ）カラムを用い、４℃で流速０．６ｍＬ／分の分離によってそれをさらに精製した。Ｃａｓ８ＳＥＣ緩衝液でタンパク質を溶出させ、０．５ｍｌ画分を収集した。ＵＶ２８０による判定で最も早く溶出したピークを高分子量凝集物質と仮定し、対応する画分を捨てた。約１４ｍＬ後にＵＶ２８０の第２の主ピークが溶出した。この第２のピークに対応する画分をプールした。Ｕｌｔｒａｃｅｌ（登録商標）−３（ＭｉｌｌｉｐｏｒｅＳｉｇｍａ、Ｈａｙｗａｒｄ、ＣＡ）メンブランを備えるＡｍｉｃｏｎ（登録商標）（ＭｉｌｌｉｐｏｒｅＳｉｇｍａ、Ｈａｙｗａｒｄ、ＣＡ）スピン濃縮器を用いて、プールしたサンプルを４０μＬに濃縮した。濃縮したサンプルを−８０℃で保存した。

最終精製産物を分光光度分析して、融合タンパク質の最終濃度を決定し、２６０ｎｍの吸光度よりも大きい２８０ｎｍの吸光度によって実証されるような有意な核酸構成要素が存在しないことを確認した。２８０ｎｍ吸光度を、インタクトな複合体の０．１％溶液の計算吸光度で割ることによってＦｏｋＩ−Ｃａｓ８融合物の濃度を決定した。精製複合体の０．１％溶液の予測される吸光度は１．０５ｃｍ^-1であるが、これは、ＦｏｋＩ−Ｃａｓ８融合物についての２８０ｎｍの吸光係数（（８６２９０Ｍ^-1ｃｍ^-1）をその分子量（８２１７１．３２ｇ／モル）で割ることによって計算した。追加的に、ＩｎｓｔａｎｔＢｌｕｅ（商標）（Ｅｘｐｅｄｅｏｎ、ＳａｎＤｉｅｇｏ、ＣＡ）染色により染色したＳＤＳ−ＰＡＧＥゲルによって最終産物を分析した。Ｇｅｌｄｏｃ（商標）ＥＺ（Ｂｉｏ−Ｒａｄ、Ｈｅｒｃｕｌｅｓ、ＣＡ）イメージャーを使用してゲルをイメージングし、ＩｍａｇｅＬａｂ（Ｂｉｏ−Ｒａｄ、Ｈｅｒｃｕｌｅｓ、ＣＡ）ソフトウェアを使用してアノテーションした。この分析は、精製融合タンパク質が予想されたサイズであったこと、および低レベルの混入タンパク質だけが存在したことを実証している。

生化学切断アッセイに使用するためのｄｓＤＮＡ標的配列の産生
カスケード複合体またはカスケード−融合エフェクター複合体を用いたｉｎｖｉｔｒｏＤＮＡ結合または切断アッセイに使用するためのｄｓＤＮＡ標的配列は、いくつかの異なる方法を用いて産生することができる。本実施例は、合成ｓｓＤＮＡオリゴヌクレオチドのアニーリング、ｇＤＮＡから選択された核酸標的配列のＰＣＲ増幅、および／または核酸標的配列の細菌プラスミドへのクローニングを含む、標的配列を産生するための３つの方法を記載するものである。ｄｓＤＮＡ標的配列をカスケード結合または切断アッセイに使用した。

Ａ．合成ｓｓＤＮＡオリゴヌクレオチドをアニーリングすることによるｄｓＤＮＡ標的配列の産生
ＣＲＩＳＰＲＲＮＡのガイド部分によって認識される標的配列、近隣プロトスペーサー隣接モチーフ（ＰＡＭ）、ならびに追加的な５’および３’隣接配列を含む、目的の標的領域をコードするＤＮＡオリゴヌクレオチドを商業的製造業者（ＩｎｔｅｇｒａｔｅｄＤＮＡＴｅｃｈｎｏｌｏｇｉｅｓ、Ｃｏｒａｌｖｉｌｌｅ、ＩＡ）から購入した。構築物１つあたり、センス鎖を含む１つおよび非センス鎖を含む１つという２つのオリゴヌクレオチドを注文した。表２６は、バクテリオファージラムダｇＤＮＡに由来するＪ３と表示される標的配列を含むように注文されたオリゴヌクレオチド配列を挙げる。標的配列およびＰＡＭ配列は、５’末端および３’末端の両方への２０ｂｐの追加的な配列に隣接する。

１×アニーリング緩衝液（６ｍＭＨＥＰＥＳ、ｐＨ７．０、および６０ｍＭＫＣｌ）中で等モル濃度（１０μＭ）の両方のオリゴヌクレオチドを混合し、９５℃で２分間加熱し、次いでゆっくりと冷却することによってオリゴヌクレオチドをアニーリングした。次いで、カスケードＲＮＰおよび／またはカスケード−エフェクタードメイン融合ＲＮＰを用いて、アニーリングしたオリゴヌクレオチドをＤＮＡ結合および／またはＤＮＡ切断アッセイに直接使用した。

ＣＲＩＳＰＲＲＮＡのガイド部分によって認識される標的配列と隣接近隣プロトスペーサー隣接モチーフ（ＰＡＭ）との両方、ならびに追加的な５’および３’隣接配列を含む目的の標的領域をコードする５’Ｃｙ５蛍光標識ＤＮＡオリゴヌクレオチドを商業的製造業者（ＩｎｔｅｇｒａｔｅｄＤＮＡＴｅｃｈｎｏｌｏｇｉｅｓ、Ｃｏｒａｌｖｉｌｌｅ、ＩＡ）から購入した。１つが５’蛍光標識センス鎖を含み、１つが５’非標識センス鎖を含み、１つが５’蛍光標識非センス鎖を含み、１つが５’非標識非センス鎖を含む、４つのオリゴヌクレオチドを構築物１つあたりに注文した。標的配列およびＰＡＭ配列は、５’末端および３’末端の両方の２０ｂｐの追加的な配列に隣接する。

表２７は、バクテリオファージラムダｇＤＮＡに由来したＪ３と表示される標的配列およびヒトＣＣＲ５座位に由来したＣＣＲ５と表示される対照標的配列を含むように注文されたオリゴヌクレオチド配列を挙げる。

１×アニーリング緩衝液（６ｍＭＨＥＰＥＳ、ｐＨ７．０、６０ｍＭＫＣｌ）中で等モル濃度（１μＭ）の１つの標識オリゴヌクレオチドと１つの非標識オリゴヌクレオチドまたは２つの標識オリゴヌクレオチドまたは２つの非標識オリゴヌクレオチドとを混合し、９５℃で２分間加熱し、次いでゆっくりと冷却することによって、オリゴヌクレオチドをアニーリングした。次いでアニーリングしたオリゴヌクレオチドを、カスケードＲＮＰおよび／またはカスケード−エフェクタードメイン融合ＲＮＰを用いたＤＮＡ結合アッセイに直接使用した。ＡＺＵＲＥｃ６００（ＡｚｕｒｅＢｉｏＳｙｓｔｅｍｓ、Ｄｕｂｌｉｎ、ＣＡ）バイオイメージャーを用いてＣｙ５蛍光標識ＤＮＡオリゴヌクレオチドをイメージングした。

この方法は、追加的な標識または非標識の標的配列または二重標的配列を産生するために適用することができ、その際、二重標的は、スペーサー間配列によって分離された、個別のカスケード分子によって標的化される２つのプロトスペーサー配列を含む標的として定義される。

Ｂ．ｇＤＮＡからのＰＣＲ増幅によるｄｓＤＮＡ標的配列の産生
ｇＤＮＡ鋳型物質からＰＣＲ増幅を直接用いて、ヒトｇＤＮＡ由来の二重標的のためのｄｓＤＮＡ標的配列を産生させた。具体的には、ＰＣＲ反応物は、Ｋ５６２細胞から精製されたヒトｇＤＮＡおよびＱ５ＨｏｔＳｔａｒｔＨｉｇｈ−Ｆｉｄｅｌｉｔｙ２ＸＭａｓｔｅｒＭｉｘ（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ、Ｉｐｓｗｉｃｈ、ＭＡ）のみならず、表２８に挙げられるプライマーを含有した。表中、下線部分は、ｇＤＮＡ内のプライマー結合部位に対応する。

製造業者の説明書（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ、Ｉｐｓｗｉｃｈ、ＭＡ）に従ってＰＣＲを行い、ＮｕｃｌｅｏｓｐｉｎＧｅｌおよびＰＣＲＣｌｅａｎｕｐキット（Ｍａｃｈｅｒｅｙ−Ｎａｇｅｌ、Ｂｅｔｈｌｅｈｅｍ、ＰＡ）を使用して長さ２８８ｂｐの所望の産物ＤＮＡを精製した。次いで、カスケードＲＮＰおよび／またはカスケード−エフェクタードメイン融合ＲＮＰを用いたＤＮＡ結合および／またはＤＮＡ切断アッセイにこのｄｓＤＮＡを直接使用した。

Ｃ．細菌プラスミドへの標的配列のクローニングによるｄｓＤＮＡ標的配列の産生
ＣＲＩＳＰＲＲＮＡのガイド部分によって認識されるプロトスペーサーとしても知られる標的配列、近隣プロトスペーサー隣接モチーフ（ＰＡＭ）、ならびに追加的な５’および３’隣接配列を含む、目的の標的領域をコードするＤＮＡオリゴヌクレオチドを商業製造業者（ＩｎｔｅｇｒａｔｅｄＤＮＡＴｅｃｈｎｏｌｏｇｉｅｓ、Ｃｏｒａｌｖｉｌｌｅ、ＩＡ）から購入した。アニーリングした場合に、制限酵素ＥｃｏＲＩおよびＢｌｐＩ、またはＢａｍＨＩおよびＥｃｏＲＩによるそれらのそれぞれの認識部位の切断時に末端が付着末端を再生するようにオリゴヌクレオチドを設計した。バクテリオファージラムダゲノムに由来するＪ３と表示される単一の標的配列を含むようにオリゴヌクレオチドを設計した。加えて、バクテリオファージラムダゲノムに由来するＪ３およびＬ３と表示される２つのタンデム型標的配列が１５ｂｐのスペーサー間配列によって互いから分離されたものを含むようにオリゴヌクレオチドを設計した。これらのオリゴヌクレオチドの配列を表２９に挙げる。

オリゴヌクレオチドは、商業製造業者によって導入された、またはＴ４ポリヌクレオチドキナーゼ（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ、Ｉｐｓｗｉｃｈ、ＭＡ）を使用して社内でリン酸化された、５’−リン酸化末端を含む。次いで、オリゴヌクレオチドをアニーリング緩衝液（６ｍＭＨＥＰＥＳ、ｐＨ７．０、６０ｍＭＫＣｌ）中で等モル量で一緒に混合し、９５℃で２分間加熱し、次いで作業台上でゆっくりと冷却することによって終濃度１μＭでアニーリングさせた。

別に、ｐＡＣＹＣ−Ｄｕｅｔ１（ＭｉｌｌｉｐｏｒｅＳｉｇｍａ、Ｈａｙｗａｒｄ、ＣＡ）プラスミドをＢａｍＨＩおよびＥｃｏＲＩ、またはＥｃｏＲＩおよびＢｌｐＩのいずれかの対応する制限酵素対で二重消化したが、その付着末端は、ハイブリダイゼーションしたオリゴヌクレオチドの末端によって形成される付着末端とマッチする。アガロースゲル電気泳動を用いて、取り除いた挿入部から、二重消化されたベクターを分離した。

ハイブリダイズしたオリゴヌクレオチドを二重消化されたベクターにクローニングするために、ハイブリダイズしたオリゴヌクレオチドを５０ｎＭ原液濃度に希釈し、次いでハイブリダイズしたオリゴヌクレオチド、二重消化されたベクター、およびＱｕｉｃｋＬｉｇａｓｅ（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ、Ｉｐｓｗｉｃｈ、ＭＡ）を使用してライゲーション反応物１０μＬを形成させた。次いで、ライゲーション反応を用いてケミカルコンピテント大腸菌株を形質転換し、アガロースプレート上で一晩生育させた後、個別のクローンを単離し、液体培養で生育させて、十分な細菌培養物を生成し、その培養物からプラスミドを単離した。次いで、サンガーシークエンシングを用いて所望のプラスミド配列を検証した。表３０は、Ｊ３標的配列（配列番号４８１）を含むプラスミドならびに１５ｂｐのスペーサー間配列（配列番号４８２）によって分離されているＪ３およびＬ３標的配列を含むプラスミドについての完全ベクター配列を提供するものである。

さらなるクローニング操作を用いて、追加的な二重標的プラスミド構築物を生成した。配列番号４８２の１５ｂｐのスペーサー間配列は、ユニークなＡｖｒＩＩおよびＸｈｏＩ制限部位を含む。したがって、これらの制限部位へのハイブリダイズしたさらなるオリゴヌクレオチドの導入は、精製されたカスケードＲＮＰおよびカスケード−ヌクレアーゼ融合ＲＮＰを用いた生化学検査のためにインタースペーサーをより長い長さに伸長する。ｃｒＲＮＡによってガイドされるＦｏｋＩ−カスケード融合複合体が２つの隣接ＤＮＡ部位を標的化するので、隣接ＤＮＡ結合複合体由来のＦｏｋＩドメインのダイマー化は、２つの標的部位を分離しているインタースペーサー内にＤＮＡ切断をもたらす。様々なスペーサー間長を設計し、試験して、ＦｏｋＩヌクレアーゼドメインとそれが融合したカスケードサブユニットタンパク質との間で所定の係留形状を有する所定のスペーサー間長を評価した。３０ｂｐの拡張されたスペーサー間配列を含む標的ＤＮＡ基質についての完全ベクター配列を配列番号４８３として表３０に示す。

加えて、以下のクローニング戦略は、１つの大きな挿入部に沿って連続的に結びついたいくつかの標的配列を含むプラスミド基質を提供した。１７個の連続する二重標的を含んだ遺伝子ブロックを商業製造業者（ＩｎｔｅｇｒａｔｅｄＤＮＡＴｅｃｈｎｏｌｏｇｉｅｓ、Ｃｏｒａｌｖｉｌｌｅ、ＩＡ）に注文した。遺伝子ブロックは、各二重標的を近隣二重標的から分離している４ｂｐを含み、ヒトｇＤＮＡに由来する１６個の二重標的のみならず、バクテリオファージラムダゲノムに由来するＪ３／Ｌ３標的を含む１つの対照二重標的も含んでいた。１６個の連続するヒト二重標的のゲノム座標を表３１に示す。末端に隣接ＳａｃＩおよびＳｂｆＩ制限部位を有する遺伝子ブロックを注文し、その結果、それをｐＡＣＹＣ−Ｄｕｅｔ１ベクター中のＳａｃＩおよびＳｂｆＩ部位にクローニングすることができた。ｐＡＣＹＣ−Ｄｕｅｔ１内に遺伝子ブロックをクローニングすることによって生成される多重標的プラスミド基質の全ベクター配列を表３０の配列番号４８４に示す。この多重標的配列プラスミドは、プラスミド内の連続的に結びついた標的部位のうちの１つを標的化するｃｒＲＮＡを内部に有する複数の異なるＦｏｋＩ−カスケード調製物の生化学試験を可能にする。

生化学的切断アッセイにおける精製カスケード複合体の使用
本実施例は、生化学ｄｓＤＮＡ切断アッセイにおけるＦｏｋＩ−カスケード融合タンパク質複合体の使用を例証するものである。タンパク質試薬を、ｄｓＤＮＡ切断におけるそれらの活性に関して比較した。

実施例１、２、および５に概略を述べるように、大腸菌Ｉ−Ｅ型カスケード系に由来するＦｏｋＩ−カスケードＲＮＰを設計し、大腸菌において組み換え発現させ、使用のために精製した。バクテリオファージラムダｇＤＮＡに由来するＪ３およびＬ３標的配列を標的化するＣＲＩＳＰＲＲＮＡ、またはヒトｇＤＮＡ内のＴＲＡＣ遺伝子におけるイントロンを標的化するＣＲＩＳＰＲＲＮＡのいずれかを含むようにこれらのＲＮＰを設計した。各ＲＮＰ調製物は、ｃｒＲＮＡのガイド部分以外は同一である２つのＦｏｋＩ−カスケード複合体を含む不均一混合物である。

Ｃａｓ８を有さないカスケード複合体と別々にＦｏｋＩ−Ｃａｓ８を精製し、Ｊ３およびＬ３ラムダ標的配列に標的化されたガイドポリヌクレオチドを有するようにプログラムし、ＰＡＭ−イン立体配置で標的部位を内部に有するＪ３／Ｌ３プラスミド基質を用いる生化学切断アッセイに使用した。

（実施例２に記載されるように配列番号４４０および配列番号４４６を使用して産生された）ＣａｓＢＣＤＥ複合体を、１６−ａａリンカー（実施例２、表１９における配列番号４３９に記載される一般ＦｏｋＩ−Ｃａｓ８発現ベクター配列；特定の１６−ａａリンカーは、実施例１、表１７における配列番号４３１である）を含む精製ＦｏｋＩ−Ｃａｓ８と一緒に混合することによってＦｏｋＩ−カスケード複合体を再構成した。１×カスケード切断緩衝液（２０ｍＭトリス−Ｃｌ、ｐＨ７．５、２００ｍＭＮａＣｌ、５ｍＭＭｇＣｌ₂、１ｍＭＴＣＥＰ、５％グリセリン）中で、どちらも１μＭ終濃度のＣａｓＢＣＤＥおよびＦｏｋＩ−Ｃａｓ８を用いて再構成を行った。

ＤＮＡ切断アッセイを行うための反応混合物は次の通りである。Ｊ３／Ｌ３二重標的配列を３０ｂｐインタースペーサー（表３０の配列番号４８３）と共に含むプラスミド基質を、終濃度１３．３ｎｇ／μＬのプラスミドＤＮＡを有する１×カスケード切断緩衝液中の反応物１５μＬ中に様々な濃度のＦｏｋＩ−カスケード複合体（３〜１００ｎＭ）と共にインキュベートした。反応物を３７℃で３０分間インキュベートし、その後、６×ＳＤＳ負荷色素３μＬを添加した。負荷色素を添加して、結合したＦｏｋＩ−カスケード複合体を変性させた。反応混合物の構成要素を０．８％アガロースゲル電気泳動によって分離した。電気泳動後にＳＹＢＲ（商標）ＳａｆｅＤＮＡＧｅｌＳｔａｉｎ（ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ、Ｗｉｌｍｉｎｇｔｏｎ、ＤＥ）でゲルを染色した。

陽性対照として、化膿性連鎖球菌（Ｓ．ｐｙｏｇｅｎｅｓ）Ｃａｓ９タンパク質に、カスケードＪ３標的配列の２０ｂｐ部分を標的化する単鎖ガイドＲＮＡ（ｓｇＲＮＡ）（ｓｇＲＮＡ−Ｊ３；スペーサー配列を配列番号５０１として示す）をプログラミングした。１×ＣＣＥ緩衝液（２０ｍＭＨＥＰＥＳｐＨ７．４、１０ｍＭＭｇＣｌ₂、１５０ｍＭＫＣｌ、５％グリセリン）中で２倍モル過剰のｓｇＲＮＡと一緒にＣａｓ９を混合することによってＣａｓ９／ｓｇＲＮＡ−Ｊ３複合体を再構成した。反応物を３７℃で３０分間インキュベートすることによって、このＣａｓ９／ｓｇＲＮＡ−Ｊ３複合体による切断を同じ濃度範囲（３〜１００ｎＭ）にわたり評価した。未切断のプラスミドＤＮＡのみならず、ＮｈｅＩ制限酵素（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ、Ｉｐｓｗｉｃｈ、ＭＡ）で直鎖化されたプラスミドＤＮＡを含む対照レーンも実験に含めた。未切断のプラスミドＤＮＡは高次コイルを形成しており、切断された直鎖化プラスミドＤＮＡよりも移動度が大きいので、標的ＤＮＡの切断は、プラスミドにおける移動度シフトによって証明される。ニックが入った開環状プラスミドＤＮＡは、高次コイル形成プラスミドＤＮＡおよび直鎖化プラスミドＤＮＡの両方よりも移動度が小さい。

これらの実験から得られたデータは、濃度範囲にわたり、ＦｏｋＩ−カスケード複合体がＣａｓ９−ｓｇＲＮＡと類似の標的ＤＮＡ切断活性を示したことを実証している。試験した最高濃度（１００ｎＭ）で、プラスミド標的は、ＦｏｋＩ−カスケード複合体およびＣａｓ９−ｓｇＲＮＡによって定量的に直鎖化された。

ＦｏｋＩ−カスケード複合体試薬を、それらの標的ＤＮＡ切断の動態についても試験した。３０ｂｐインタースペーサー（配列番号４８３）を有するＪ３／Ｌ３二重標的配列を含むプラスミド基質を、反応物１５μＬ中の２００ｎＭＦｏｋＩ−カスケード複合体または２００ｎＭＣａｓ９−ｓｇＲＮＡと共に終濃度１３．３ｎｇ／μＬのプラスミドＤＮＡでインキュベートした。０、７、１０、１５、２０、２５、または３０分のいずれかで反応をクエンチし、上記のようにアガロースゲル電気泳動によって反応構成要素を分離した。ＦｏｋＩ−カスケード複合体は、Ｃａｓ９／ｓｇＲＮＡ−Ｊ３複合体と類似しているがわずかに遅い速度の標的ＤＮＡ切断活性を示し、標的プラスミドは、ＦｏｋＩ−カスケード複合体について２５分の時点まで、およびＣａｓ９／ｓｇＲＮＡ−Ｊ３複合体について２０分の時点までに定量的に直鎖化された。

Ｊ３／Ｌ３二重標的プラスミド基質の特異的ＤＮＡ切断と比べたｐＡＣＹＣ−Ｄｕｅｔ１非標的プラスミド基質に対するそれらの非特異的ＤＮＡ切断および／またはニッキング活性についてもＦｏｋＩ−カスケード複合体試薬を試験した。表３２は、この対照のために使用したｐＡＣＹＣ−Ｄｕｅｔ１非標的プラスミド基質の配列（配列番号５０２）を含む。具体的には、反応緩衝液中の一価塩濃度に対する非特異的および特異的ＤＮＡ標的切断の依存性を検討した。ＮａＣｌ濃度を２００ｍＭから１５０ｍＭ、１００ｍＭまたは５０ｍＭのいずれかに低下させた、１×カスケード切断緩衝液（２０ｍＭトリス−Ｃｌ、ｐＨ７．５、２００ｍＭＮａＣｌ、５ｍＭＭｇＣｌ₂、１ｍＭＴＣＥＰ、および５％グリセリン）のバリアントを製造し、２００ｎＭＦｏｋＩ−カスケード複合体を１３．３ｎｇ／μＬのＪ３／Ｌ３標的プラスミドまたは１３．３ｎｇ／μＬのｐＡＣＹＣ−Ｄｕｅｔ１非標的プラスミドのいずれかと共にインキュベートすることによって、上記と同じ切断反応を行った。ＮａＣｌ濃度を１００ｍＭに維持したが、５ｍＭＭｇＣｌ₂を１０ｍＭＥＤＴＡに置換した追加的な対照反応を行ったが、ＦｏｋＩがＤＮＡ切断のために二価金属イオンを必要とするので、これは切断を妨げると予想された。したがって、非標的プラスミドおよびＪ３／Ｌ３標的プラスミドを次の反応条件に供した：−ＦｏｋＩ−カスケード複合体；＋ＦｏｋＩ−カスケード複合体、１００ｍＭＮａＣｌ緩衝液＋１０ｍＭＥＤＴＡ；＋ＦｏｋＩ−カスケード複合体、５０ｍＭＮａＣｌ緩衝液；＋ＦｏｋＩ−カスケード複合体、１００ｍＭＮａＣｌ緩衝液；＋ＦｏｋＩ−カスケード複合体、１５０ｍＭＮａＣｌ緩衝液；＋ＦｏｋＩ−カスケード複合体、２００ｍＭＮａＣｌ緩衝液。データは、ＦｏｋＩ−カスケード複合体が＜２００ｍＭＮａＣｌの低い塩濃度で非標的プラスミドおよびＪ３／Ｌ３標的プラスミドの両方の非特異的ニッキングを示し、ところが２００ｍＭＮａＣｌの一価塩濃度で、非標的プラスミドが無傷のままであったが、Ｊ３／Ｌ３標的プラスミドが定量的に直鎖化されたことを実証している。さらに、ＥＤＴＡを含有する緩衝液は、予想通り標的切断の完全な抑止をもたらした。

ＦｏｋＩ−カスケード複合体が予想される位置で、すなわちＪ３標的とＬ３標的とを分離しているスペーサー間配列の中央で標的プラスミドを切断することを確認するために、標的プラスミドを最初にＦｏｋＩ−カスケード複合体と共にインキュベートし、続いてプラスミド基質の他のどこかを切断するＡｆｅＩ制限酵素（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ、Ｉｐｓｗｉｃｈ、ＭＡ）と共にインキュベートする実験を行った。したがって、ＦｏｋＩ−カスケード１複合体およびＡｆｅＩの両方による切断は、高次コイル形成環状プラスミドを２つの直鎖状断片に変換し、それらの断片はアガロースゲル上で互いに異なる種として泳動する。具体的には、切断は、長さが２４２７ｂｐおよび１３５７ｂｐの断片を生成すると予想された。

１３．３ｎｇ／μＬＪ３／Ｌ３標的プラスミドを２００ｎＭＦｏｋＩ−カスケード１複合体と共に３０分間インキュベートし、その後ＡｆｅＩ１μＬ（１０ユニット／μＬ；ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ、Ｉｐｓｗｉｃｈ、ＭＡ）を反応物に添加し、続いて追加的に３７℃で３０分間インキュベートした。反応産物を上記のようにアガロースゲル電気泳動によって分離した。追加的に、対照実験のために標的プラスミドをＦｏｋＩ−カスケード１複合体のみまたはＡｆｅＩのみと共にインキュベートし、（プラスミドがＪ３／Ｌ３二重標的を欠如することから）ＦｏｋＩ−カスケード１複合体ではなくＡｆｅＩによって切断することができる非標的プラスミドを用いて同じ反応を行った。表３２は、この対照のために使用したｐＡＣＹＣ−Ｄｕｅｔ１非標的プラスミド基質の配列（配列番号５０２）を含む。したがって、非標的プラスミドおよびＪ３／Ｌ３標的プラスミドを次の反応条件に供した：−ＡｆｅＩ／−ＦｏｋＩ−カスケード複合体；−ＡｆｅＩ／＋ＦｏｋＩ−カスケード複合体；＋ＡｆｅＩ／＋ＦｏｋＩ−カスケード複合体；および＋ＡｆｅＩ／−ＦｏｋＩ−カスケード複合体。データは、ＦｏｋＩ−カスケード複合体が予想される位置で標的プラスミドを切断したことを実証している。それは、ＦｏｋＩ−カスケード１複合体およびＡｆｅＩとの同時インキュベーションが、予想される長さの２つの直鎖状産物をもたらしたからである。

ＦｏｋＩ−カスケード複合体によるＤＮＡ切断の配列特異性をさらに確認するために、次のものを含む追加的な対照プラスミド基質を生成した：Ｊ３標的に隣接するＰＡＭへの突然変異、Ｌ３標的に隣接するＰＡＭへの突然変異、Ｊ３／Ｌ３標的に隣接する両方のＰＡＭへの突然変異；Ｊ３標的内のスペーサー配列への突然変異、Ｌ３標的内のスペーサー配列への突然変異、Ｊ３／Ｌ３標的内の両方のスペーサー配列への突然変異；ならびにＪ３標的はあるがＬ３標的なし、Ｌ３標的はあるがＪ３標的なし、およびＪ３標的もＬ３標的もなし。したがって、プラスミド基質は次の通りであった：Ｊ３ＰＡＭ突然変異体、Ｌ３ＰＡＭ突然変異体、Ｊ３／Ｌ３ＰＡＭ突然変異体、Ｊ３スペーサー突然変異体、Ｌ３スペーサー突然変異体、Ｊ３／Ｌ３スペーサー突然変異体、非標的プラスミド、Ｊ３のみの標的、Ｌ３のみの標的、およびＪ３／Ｌ３標的プラスミド。各標的を次の反応条件に供した：−ＮｄｅＩ／−ＦｏｋＩ−カスケード複合体；＋ＮｄｅＩ／−ＦｏｋＩ−カスケード複合体；および−ＮｄｅＩ／＋ＦｏｋＩ−カスケード１複合体。表３２は、上記の突然変異型プラスミド基質のすべての配列を含む（配列番号５０２〜配列番号５１０）。

２００ｎＭＦｏｋＩ−カスケード複合体および１３．３ｎｇ／μＬプラスミド基質を使用して上記のようにＤＮＡ切断反応を行った；ＮｄｅＩ（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ、Ｉｐｓｗｉｃｈ、ＭＡ）を用いて各プラスミド基質を直鎖化するための対照反応を行った。上記のようにアガロースゲル電気泳動を行った。データは、効率的な二本鎖切断の導入および標的プラスミドの直鎖化が、ＰＡＭ突然変異もしくはシード突然変異を内部に含む対照プラスミドではなくＪ３／Ｌ３標的プラスミドについてのみ、または２つの標的部位のうちの１つだけに観察されることを実証している。

様々なＦｏｋＩ−カスケード複合体についての構成要素をクローニングし、過剰発現させた。異なるＦｏｋＩ−カスケード複合体についての活性を比較するために、これらの構成要素によって産生されたＲＮＰを精製し、生化学的ＤＮＡ切断について試験した。具体的には、次のものを含む再構成されたＦｏｋＩ−カスケード複合体についてＤＮＡ切断活性を比較した：別々に精製されたＣａｓＢＣＤＥ複合体（配列番号４４０および配列番号４４６を使用して産生）およびＦｏｋＩ−Ｃａｓ８（配列番号４３９を使用して産生）；Ｊ３／Ｌ３ガイドｃｒＲＮＡを内部に含むＦｏｋＩ−カスケード（配列番号４４２および配列番号４４６を使用して産生）；Ｃａｓ７サブユニット（配列番号４４３および配列番号４４６を使用して産生）またはＣａｓ６サブユニット上のいずれかに追加的な核局在化シグナルを内部に含むＦｏｋＩ−カスケード；Ｃａｓ７サブユニットまたはＣａｓ６サブユニット上のいずれかに追加的な核局在化シグナルおよびＨＡタグを内部に含むＦｏｋＩ−カスケード；サイズ排除クロマトグラフィー（ＳＥＣ）およびイオン交換クロマトグラフィー（ＩＥＸ）の両方を伴う、よりストリンジェントな精製を受けたＦｏｋＩ−カスケード；ならびにさらなるクリーンアップを行わずに固定化金属アフィニティークロマトグラフィー（ＩＭＡＣ）によってのみ精製されたＦｏｋＩ−カスケード。

したがって、非標的プラスミドおよびＪ３／Ｌ３標的プラスミドを次の反応条件に供した：陰性対照；ＡｆｅＩ；ＣａｓＢＣＤＥ＋ＦｏｋＩ−Ｃａｓ８複合体；ＦｏｋＩ−カスケード複合体；ＦｏｋＩ−カスケード（ＮＬＳ−Ｃａｓ６）複合体；ＦｏｋＩ−カスケード（Ｃａｓ７−ＮＬＳ）複合体；ＦｏｋＩ−カスケード（ＮＬＳ−ＨＡ−Ｃａｓ６）複合体；ＦｏｋＩ−カスケード（Ｃａｓ７−ＨＡ−ＮＬＳ）複合体；ＦｏｋＩ−カスケード複合体（ＩＥＸ、ＳＥＣクリーンアップ）；およびＦｏｋＩ−カスケード複合体（クリーンアップなし）。非標的プラスミドまたはコンセンサスＪ３／Ｌ３標的プラスミドのいずれかを使用して上記のようにこれらのＲＮＰ試薬を用いたＤＮＡ切断反応を行い、アガロースゲル電気泳動によって反応産物を分離した。データは、1つの例外を除きすべてのＲＮＰ試薬がほぼ同一で定量的なプラスミドＤＮＡの切断を示し、非標的プラスミドのバックグラウンド切断がないことを実証している。唯一の例外は、さらなるクリーンアップなしに精製されたＦｏｋＩ−カスケードであったが、ＦｏｋＩ−カスケードが非標的プラスミドと共にインキュベートされたレーンに見られるように、これはより非特異的なニッキング活性を示した。

最後に、出発点としてＦｏｋＩ−カスケード複合体のＮＬＳタグ付きＣａｓ７バリアントを使用して、１つの大きな挿入部（配列番号４８４）に沿って連続的に結びついたヒトゲノム部位Ｈｓａ０１〜Ｈｓａ１６についてのプラスミド基質の生化学的ＤＮＡ切断について１６個の異なる対形成ガイドｃｒＲＮＡを試験した。ｃｒＲＮＡのそれぞれの対は、ヒトｇＤＮＡにおける２つの隣接標的部位に対応する２つのユニークなスペーサー配列がインタースペーサーによって分離されたものを含み；標的配列は、配列番号４８５〜配列番号５００に記載されている。表３３は、Ｈｓａ０１〜Ｈｓａ１６ｇＤＮＡ配列を標的化する対毎に両方のｃｒＲＮＡの配列を含み；ｃｒＲＮＡのスペーサーに下線を付け、小文字で示し、ガイド領域の５’および３’の配列は、ＣＲＩＳＰＲアレイからのリピート配列に対応する。

１６個のＦｏｋＩ−カスケード複合体を精製した後、上記のように切断反応を行った。この反応では、ＦｏｋＩ−カスケード複合体を、ヒトゲノム部位Ｈｓａ０１〜Ｈｓａ１６を含むプラスミド基質と共にインキュベートし、アガロースゲル電気泳動によって反応産物を分離した。データは、１６個のＲＮＰ試薬のうち、１６個中１４個（Ｈｓａ０３〜Ｈｓａ１６）が高次コイル環状プラスミド基質の切断型直鎖状形態への変換によって証明されるような定量的に近いＤＮＡ切断を示したことを実証している。構築物Ｈｓａ０１およびＨｓａ０２だけが部分ニッキング活性を示した。さらにデータは、設計された１６個の対形成ｇＲＮＡを使用してＦｏｋＩ−カスケード複合体が効果的にプログラムされて、治療的に関連するヒト遺伝子が標的化されたことを実証した。

ＦｏｋＩ−カスケードＲＮＰ複合体の標的細胞への導入
本実施例は、ヒト細胞におけるゲノム編集を促進するためのＦｏｋＩ融合タンパク質を含む大腸菌Ｉ−Ｅ型カスケード複合体の設計および送達を例証し、それらを予め組み立てられたカスケードＲＮＰ複合体として標的細胞内に送達することを記載するものである。

Ａ．細胞内への形質導入のためのＦｏｋＩを含むカスケードＲＮＰ複合体の産生
最小ＣＲＩＳＰＲアレイを設計して、ヒトゲノムにおける８つの互いに異なる座位を標的化した。各最小ＣＲＩＳＰＲアレイは、両方ともＣＲＩＳＰＲリピート配列に隣接した２つのスペーサー配列を含んでいた。２つのスペーサー配列は、互いに３０ｂｐ離れたゲノム中の座位（すなわち、３０ｂｐのスペーサー間領域）を標的化しており、各スペーサーは、標的細胞ゲノム中のＡＡＧまたはＡＴＧプロトスペーサー隣接モチーフ（ＰＡＭ）配列に隣接する標的配列と結合するように設計した。アニーリングされたオリゴヌクレオチド（ＩｎｔｅｇｒａｔｅｄＤＮＡＴｅｃｈｎｏｌｏｇｉｅｓ、Ｃｏｒａｌｖｉｌｌｅ、ＩＡ）を細菌発現のためにｐＡＣＹＣ−Ｄｕｅｔ１（ＭｉｌｌｉｐｏｒｅＳｉｇｍａ、Ｈａｙｗａｒｄ、ＣＡ）ベクター骨格中にライゲーションすることによって各最小ＣＲＩＳＰＲアレイを含むプラスミドベクターを産生した。

最小ＣＲＩＳＰＲアレイにおいて選択されたスペーサーを産生するための重複プライマーを表３４に示し、プライマーの配列を表３５に記載する。

カスケードＲＮＰ複合体の産生のための細菌発現ベクターの設計を実施例２に詳細に説明する。簡潔には、各ｃａｓ遺伝子を単一のオペロンから発現させ、ｃａｓ遺伝子についてのコーディング配列をｃａｓ８−ｃａｓ２−ｃａｓ７−ｃａｓ５−ｃａｓ６の順序で配置した。３０−ａａリンカーによってＦｏｋＩ部分をＣａｓ８に結びつけ、核局在化シグナル（ＮＬＳ）をＦｏｋＩ−Ｃａｓ８（ＦｏｋＩ−カスケード複合体）のＮ末端およびＣａｓ６のＮ末端に結びつけた（以後、ＦｏｋＩ−カスケード−ＮＬＳ−Ｃａｓ６複合体と呼ぶ、配列番号５７７）。

本質的に実施例５Ａに記載されるようにＦｏｋＩ−カスケード−ＮＬＳ−Ｃａｓ６複合体を大腸菌から組み立てられた複合体として精製した。

Ｂ．ＦｏｋＩを含むカスケードＲＮＰ複合体の真核細胞へのトランスフェクション
ＨＥＫ２９３細胞（ＡＴＣＣ、Ｍａｎａｓｓａｓ、ＶＡ）を、１０％ＦＢＳおよび１×抗生物質−抗真菌薬溶液（Ｍｅｄｉａｔｅｃｈ、Ｉｎｃ．、Ｍａｎａｓｓａｓ、ＶＡ）を補充したＤＭＥＭ培地中、３７℃、５％ＣＯ₂および湿度１００％で懸濁培養した。Ｎｕｃｌｅｏｆｅｃｔｏｒ（登録商標）９６-ｗｅｌｌＳｈｕｔｔｌｅシステム（Ｌｏｎｚａ、Ａｌｌｅｎｄａｌｅ、ＮＪ）を使用してＨＥＫ２９３細胞をトランスフェクトした。ヌクレオフェクションの前に、ＦｏｋＩ−カスケードＲＮＰ５μｌを９６ウェルプレートの個別のウェルに移した。各ウェルは、ＲＮＰに応じて約２２５〜５００ｐｍｏｌのＦｏｋＩ−カスケード−ＮＬＳ−Ｃａｓ６複合体を含んでいた。ＨＥＫ２９３細胞を５０ｍｌコニカル遠心チューブに移し、２００×Ｇで３分間遠心分離した。培地を吸引し、カルシウムおよびマグネシウムを含まないＰＢＳ中で細胞ペレットを洗浄した。細胞をもう一度遠心分離し、ＮｕｃｌｅｏｆｅｃｔｏｒＳＦ（Ｌｏｎｚａ、Ａｌｌｅｎｄａｌｅ、ＮＪ）緩衝液中に１×１０⁷個／ｍｌの濃度で再懸濁した。この細胞懸濁液２０μｌを９６ウェルプレート中のＦｏｋＩ−カスケード−ＮＬＳ−Ｃａｓ６複合体に添加し、混合し、次いで全体積を９６ウェルＮｕｃｌｅｏｃｕｖｅｔｔｅ（商標）（Ｌｏｎｚａ、Ａｌｌｅｎｄａｌｅ、ＮＪ）プレートに移した。次いでプレートをＮｕｃｌｅｏｆｅｃｔｏｒ（商標）９６−ｗｅｌｌＳｈｕｔｔｌｅ（商標）システム（Ｌｏｎｚａ、Ａｌｌｅｎｄａｌｅ、ＮＪ）中に負荷し、９６−ＣＭ−１３０Ｎｕｃｌｅｏｆｅｃｔｏｒ（商標）プログラム（Ｌｏｎｚａ、Ａｌｌｅｎｄａｌｅ、ＮＪ）を使用して細胞にヌクレオフェクションした。ヌクレオフェクションの直後、完全ＤＭＥＭ培地８０μｌを９６ウェルＮｕｃｌｅｏｃｕｖｅｔｔｅ（商標）（Ｌｏｎｚａ、Ａｌｌｅｎｄａｌｅ、ＮＪ）プレートの各ウェルに添加した。次いで、ウェルの全内容物を、完全ＤＭＥＭ培地１００μｌを含む９６ウェル組織培養プレートに移した。細胞を３７℃、５％ＣＯ₂および１００％湿度で約７２時間培養した。

約７２時間後に、ＨＥＫ２９３細胞を５００×Ｇで５分間遠心分離し、培地を除去した。カルシウムおよびマグネシウムを含まないＰＢＳ中で細胞を洗浄した。次いで細胞ペレットをＱｕｉｃｋＥｘｔｒａｃｔＤＮＡＥｘｔｒａｃｔｉｏｎｓｏｌｕｔｉｏｎ（Ｅｐｉｃｅｎｔｒｅ、Ｍａｄｉｓｏｎ、ＷＩ）５０μｌ中に再懸濁した。次いで得られたｇＤＮＡサンプルを３７℃で１０分間、６５℃で６分間、および９５℃で３分間インキュベートして、反応を止めた。次いでｇＤＮＡサンプルを水５０μｌで希釈し、その後のディープシークエンシング解析のために−２０℃で保存した。

Ｃ．トランスフェクトされた細胞からのｇＤＮＡのディープシークエンシング
単離されたｇＤＮＡを使用して、終体積１０μＬ中に１×濃度のＱ５ＨｏｔＳｔａｒｔＨｉｇｈ−Ｆｉｄｅｌｉｔｙ２ＸＭａｓｔｅｒＭｉｘ（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ、Ｉｐｓｗｉｃｈ、ＭＡ）、各０．５μＭのプライマー、ｇＤＮＡ３．７５μＬを使用して第１のＰＣＲを行い、９８℃で１分間と、９８℃１０秒、６０℃２０秒、７２℃３０秒の３５サイクルと、７２℃で２分間の最終伸長とで増幅した。ＰＣＲ反応物を水で１：１００希釈した。標的特異的プライマーを表３６に示す。標的特異的プライマーは、Ｉｌｌｕｍｉｎａコンパチブル配列を含み、その結果、ＭｉＳｅｑシークエンサー（Ｉｌｌｕｍｉｎａ、ＳａｎＤｉｅｇｏ、ＣＡ）を使用して増幅産物を分析することができた。

それぞれがユニークな８ｂｐのインデックス（プライマー配列中に「ＮＮＮＮＮＮＮＮ」で示す）（配列番号５７５および配列番号５７６参照）を含むことで、配列解析の間に各アンプリコンのデマルチプレクシングを可能にするプライマー（表３５におけるＧ２およびＨ２）を用いて、各標的が増幅されるように第２の「バーコーディング」ＰＣＲを設定した。

終体積１０μＬ中に１×濃度のＱ５ＨｏｔＳｔａｒｔＨｉｇｈ−Ｆｉｄｅｌｉｔｙ２ＸＭａｓｔｅｒＭｉｘ（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ、Ｉｐｓｗｉｃｈ、ＭＡ）、それぞれ０．５μＭのプライマー、１：１００希釈された第１のＰＣＲ物質１μＬを使用して第２のＰＣＲを行い、９８℃で１分と、９８℃１０秒、６０℃２０秒、７２℃３０秒の１２サイクルと、７２℃で２分間の最終伸長とで増幅した。シークエンシングのためにアンプリコンのＳＰＲＩｓｅｌｅｃｔビーズ（ＢｅｃｋｍａｎＣｏｕｌｔｅｒ、Ｐａｓａｄｅｎａ、ＣＡ）ベースの浄化を行うためにＰＣＲ反応物を単一の微量遠心チューブ内にプールした。

プールしたアンプリコンに、０．９×体積のＳＰＲＩｓｅｌｅｃｔビーズを添加し、混合し、室温で１０分間インキュベートした。溶液が透明になるまでマイクロチューブを磁気チューブスタンド（ＢｅｃｋｍａｎＣｏｕｌｔｅｒ、Ｐａｓａｄｅｎａ、ＣＡ）に立てた。上清を除去し、捨て、残ったビーズを１体積の８５％エタノールで洗浄し、室温（ＲＴ）で３０秒間インキュベートした。インキュベーションの後に、エタノールを吸引し、ビーズを室温で１０分間風乾した。次いでマイクロチューブを磁気スタンドから外し、０．２５×体積の水をビーズに添加し、強く混合し、ＲＴで２分間インキュベートした。微量遠心分離機でマイクロチューブを回転させて、チューブの内容物を収集し、次いで磁石に戻し、溶液が透明になるまでインキュベートし、精製アンプリコンを含有する上清を清潔なマイクロチューブに分注した。Ｎａｎｏｄｒｏｐ（商標）２０００（ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ、Ｗｉｌｍｉｎｇｔｏｎ、ＤＥ）システムを使用して精製アンプリコンのライブラリーを定量した。

アンプリコンライブラリーを２６０ｎｍの吸光度（Ｎａｎｏｄｒｏｐ（商標）２０００（ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ、Ｗｉｌｍｉｎｇｔｏｎ、ＤＥ）システム）およびアンプリコンのサイズから計算した４ｎＭ濃度に規準化した。ＭｉＳｅｑシークエンサー（Ｉｌｌｕｍｉｎａ、ＳａｎＤｉｅｇｏ、ＣＡ）によりＭｉＳｅｑ試薬キットｖ２、３００サイクル（Ｉｌｌｕｍｉｎａ、ＳａｎＤｉｅｇｏ、ＣＡ）を用いて２つの１５１サイクルのペアエンドラン＋２つの８サイクルのインデックスリードでライブラリーを解析した。

Ｄ．ディープシークエンシングデータの解析
第２のラウンドのＰＣＲにおけるアンプリコンに適応したインデックスバーコーディング配列に基づきシークエンシングデータにおける産物の同一性を解析した。以下のタスクを実行する計算スクリプトを使用してＭｉＳｅｑ（Ｉｌｌｕｍｉｎａ、ＳａｎＤｉｅｇｏ、ＣＡ）データを処理した：

Ｂｏｗｔｉｅ（ｂｏｗｔｉｅ−ｂｉｏ．ｓｏｕｒｃｅｆｏｒｇｅ．ｎｅｔ／ｉｎｄｅｘ．ｓｈｔｍｌ）ソフトウェアを使用してリードをヒトゲノム（ｂｕｉｌｄＧＲＣｈ３８／３８）と整列させた。

整列されたリードを野生型座位と比較した；座位のどの部分とも整列しなかったリードを捨てた。

野生型配列とマッチするリードを集計した。インデルを有するリード（ＦｏｋＩ−カスケードＲＮＰの予想される切断部位から前後１０ｂｐ）をインデルの種類によって分類し、集計した。

総インデルリードを野生型リードとインデルリードとの合計で割り、突然変異型リードのパーセントを与えた。

図２８は、ゲノム編集（図２８、縦軸、「編集％」）をＦｏｋＩ−カスケード−ＮＬＳ−Ｃａｓ６複合体ヌクレオフェクション（ｎ＝１）に対して示す（図２８、横軸、Ｈｓａ３、Ｈｓａ４、Ｈｓａ５、Ｈｓａ６、Ｈｓａ７、Ｈｓａ８、Ｈｓａ９、およびＨｓａ１０）。図２８では、白い棒線は陰性対照であり、黒い棒線はＦｏｋＩ−カスケード−ＮＬＳ−Ｃａｓ６複合体の添加である）。ＦｏｋＩ−カスケード−ＮＬＳ−Ｃａｓ６複合体は全部で８つの座位に編集を誘導した。編集は、約０．２〜５％のインデルの範囲であり、インデルは、スペーサー間領域中央の予測される切断部位周辺に中心を置いた。

ＦｏｋＩ−カスケードＲＮＰ複合体の構成要素をコードするプラスミドの標的細胞への導入
本実施例は、ヒト細胞におけるゲノム編集を促進するための、ＦｏｋＩ融合タンパク質を含む大腸菌Ｉ−Ｅ型カスケード複合体の設計および送達を例証する。本実施例はまた、真核細胞へのカスケード複合体構成要素を発現しているプラスミドベクターの送達を記載する。

Ａ．標的細胞にトランスフェクトすべきＦｏｋＩ−カスケードＲＮＰ構成要素をコードするベクターの産生
最小ＣＲＩＳＰＲアレイを設計して、ヒトゲノムにおけるＴＲＡＣ座位を標的化した。最小ＣＲＩＳＰＲアレイは、実施例１および３に記載されるようにその両方がＣＲＩＳＰＲリピート配列に隣接した２つのスペーサー配列を含んでいた。２つのスペーサー配列は、互いに３０ｂｐ離れたゲノム中の座位を標的化しており、各スペーサーは、ＡＡＧＰＡＭ配列に隣接するゲノム配列と相補的であった。２つのスペーサー配列に隣接するＣＲＩＳＰＲリピートをコードする、アニーリングされたオリゴヌクレオチド（ＩｎｔｅｇｒａｔｅｄＤＮＡＴｅｃｈｎｏｌｏｇｉｅｓ、Ｃｏｒａｌｖｉｌｌｅ、ＩＡ）を、２つのＣＲＩＳＰＲリピート配列と共に哺乳動物発現ベクター中にライゲートすることによって、最小ＣＲＩＳＰＲアレイを含むプラスミドベクターを産生した。結果としてもたらされたプラスミドは、ヒトＵ６（ｈＵ６）プロモーターから２つのガイドを発現した「リピート−スペーサー−リピート−スペーサー−リピート」を含んでいた（配列番号４５４）。

ＦｏｋＩ−カスケードＲＮＰタンパク質構成要素をコードする遺伝子を、ＣＭＶプロモーターを含むプラスミドベクター中にクローニングして、哺乳動物細胞における送達および発現を可能にした。Ｃａｓ遺伝子を別々のプラスミド（配列番号４４８〜配列番号４５１および配列番号４５３）中に、または各遺伝子が２Ａウイルスペプチド「リボソームスキップ」配列（配列番号４５５中）を介して連結した多シストロン性構築物として単一のプラスミド中にクローニングした。２つの異なる方法を介してＦｏｋＩ−カスケードＲＮＰ複合体を真核細胞中に送達した：ｃａｓ遺伝子および最小ＣＲＩＳＰＲアレイを、別々のプラスミド（６プラスミド送達系、配列番号４４８〜配列番号４５１、配列番号４５３および配列番号４５４）上に、またはすべてのｃａｓ遺伝子を多シストロン性構築物としてコードする１つのプラスミドおよび最小ＣＲＩＳＰＲアレイをコードする第２のプラスミド（２プラスミド送達系、配列番号４５４および配列番号４５５）上に供給した。

Ｂ．ＦｏｋＩ−カスケードＲＮＰ複合体をコードするプラスミドのトランスフェクション
６プラスミド送達系および２プラスミド送達系についてのトランスフェクション条件を、実施例８Ｂに詳述されるものに以下の変更を加えて行った。ヌクレオフェクションの前に、プラスミドベクター溶液５μｌを９６ウェルプレートの個別のウェルに移した。ゲノム編集のために各構成要素の必要性を調べることによって６プラスミド送達系を最初に試験した。より具体的には、プラスミドの「カクテル」を各ウェルに添加することにより、一定量（４２０ｎｇ）の５つのプラスミドおよび可変量の第６のプラスミド（０ｎｇ、７０ｎｇ、７００ｎｇ、または１，４００ｎｇのいずれか）があるようにした。次に、一定量（３．５μｇ）の合計プラスミドＤＮＡで、ｃａｓコードプラスミドに対する最小ＣＲＩＳＰＲアレイプラスミドの比を変動させてヌクレオフェクションすることによって、６プラスミド送達系および２プラスミド送達系を比較した。最後に、その後のディープシークエンシング解析のためにヌクレオフェクションの約７２時間後に溶解物を回収した。

Ｃ．トランスフェクトされた細胞からのｇＤＮＡのディープシークエンシングおよびデータ解析
実施例８Ｃに詳述するようにディープシークエンシングを行ったが、表３６からの標的特異的プライマーＹおよびＺだけを使用した。

Ｄ．ディープシークエンシングデータの解析
実施例８Ｄに詳述するようにディープシークエンシングデータの解析を行った。図２９は、ＴＲＡＣ座位でのゲノム編集（図２９、縦軸、「編集％」）を６プラスミド送達戦略における各ＦｏｋＩ−カスケード構成要素（ｎ＝１）に対して示す（図２９、横軸、ガイド、ＦｏｋＩ−Ｃａｓ８、Ｃｓｅ２、Ｃａｓ７、Ｃａｓ５、Ｃａｓ６、および参照サンプル）。図２９では、白い棒線はＦｏｋＩ−カスケード構成要素０ｎｇを表し、ドットの棒線はＦｏｋＩ−カスケード構成要素７０ｎｇを表し、格子の棒線はＦｏｋＩ−カスケード構成要素７００ｎｇを表し、縞の棒線はＦｏｋＩ−カスケード構成要素１，４００ｎｇを表す（各ＦｏｋＩ−カスケード構成要素について横軸の棒線のそれぞれ左から右への順序を示す）。示すように、所与の構成要素が欠如した場合、編集が打ち消された、または劇的に減少した（Ｃｓｅ２の場合）。これは、各カスケード構成要素がプラスミド送達を介した編集に必要であることを確認するものである。

図３０は、６プラスミド送達系または２プラスミド送達系を用いたゲノム編集を比較するデータを示す。図３０は、標的座位でのゲノム編集（図３０、縦軸、「編集％」）を様々な濃度の６プラスミド系（図３０、白い棒線）および２プラスミド系（図３０、黒い棒線）の各構成要素に対して示す（図３０、横軸の棒線の順序は、左から右にそれぞれ６プラスミド系および２プラスミド系である）。横軸に沿った数値グループは構成要素の量を指す：一番上の行＝ｎｇ単位の合計プラスミド、第２の行＝ｎｇ単位の最小ＣＲＩＳＰＲアレイプラスミド、および第３の行＝ｎｇ単位のＣａｓコードプラスミド（例えば、第１の数値グループ：一番上の行＝合計プラスミド、３５００ｎｇ；第２の行＝最小ＣＲＩＳＰＲアレイプラスミド、０ｎｇ；および第３の行＝Ｃａｓコードプラスミド、３５００ｎｇ）。

両方の方法にわたり、ｃａｓ：最小ＣＲＩＳＰＲアレイプラスミドの最高の比で最高レベルの編集が達成された。追加的に、多シストロン性プラスミドは、可能性としてプラスミド１μｇあたりの転写の増加により、より高い編集レベルを可能にした。

カスケードサブユニットタンパク質の円順列置換
本実施例は、構造ガイドモデル化アプローチを使用する円順列置換（ｃｐ）大腸菌Ｉ−Ｅ型Ｃａｓ７タンパク質のｉｎｓｉｌｉｃｏ設計、クローニング、発現、および精製を例証するものである。

Ａ．ｉｎｓｉｌｉｃｏ設計
大腸菌カスケード結晶構造５Ｈ９Ｅ．ｐｄｂに基づく構造ガイドアプローチを用いて大腸菌Ｉ−Ｅ型Ｃａｓ７タンパク質（配列番号１８）を円順列置換した（ｗｗｗ．ｒｃｓｂ．ｏｒｇ／ｐｄｂ／；Ｈａｙｅｓ、Ｒ．Ｐら、Ｎａｔｕｒｅ５３０（７５９１）：４９９〜５０３（２０１６年））。ナイーブなＣａｓ７Ｎ末端とＣ末端とを、配列グリシン−セリン（Ｇ−Ｓ）を有する２アミノ酸ペプチドリンカーで結びつけた。この環状Ｃａｓ７のポリペプチド配列を、野生型Ｃａｓ７ポリペプチド配列における残基３０１と残基３０２との間のペプチド結合に対応する位置で開いて、新しいＮ末端（残基３０２）および新しいＣ末端（残基３０１）を形成させ、結果としてＣａｓ７タンパク質の円順列置換バージョン（ｃｐ−Ｃａｓ７Ｖ１タンパク質）をもたらした。Ｃａｓ７タンパク質の折り畳みまたはカスケード複合体の組み立てを妨害せずに融合タンパク質またはリンカー領域との結びつきのための位置になるように新しいＮ末端および新しいＣ末端を設計した。ｃｐ−Ｃａｓ７Ｖ１タンパク質（配列番号５７８）の新しいＮ末端（すなわち、野生型Ｃａｓ７タンパク質の残基３０２に対応するアミノ酸残基）にメチオニン残基を付加した。

Ｇ−Ｓリンカーを使用して第２のｃｐ−Ｃａｓ７タンパク質、ｃｐ−Ｃａｓ７Ｖ２タンパク質を同様に操作した。ｃｐ−Ｃａｓ７Ｖ２タンパク質のＮ末端およびＣ末端は、野生型Ｃａｓ７配列における残基３３８および３３９にそれぞれ対応する。Ｃａｓ７タンパク質の折り畳みまたはカスケード複合体の組み立てを妨害せずに融合タンパク質またはリンカー領域との結びつきのための位置になるように新しいＮ末端および新しいＣ末端を設計した。ｃｐ−Ｃａｓ７Ｖ２タンパク質（配列番号５７９）のＮ末端（すなわち、野生型Ｃａｓ７タンパク質の残基３３９に対応するアミノ酸残基）にメチオニン残基を付加した。

Ｂ．ｃｐ−Ｃａｓ７を含むカスケード複合体のクローニング、発現、および精製
ｃｐ−Ｃａｓ７Ｖ１タンパク質およびｃｐ−Ｃａｓ７Ｖ２タンパク質のｉｎｓｉｌｉｃｏ設計ポリペプチド配列のＤＮＡコーディング配列を大腸菌における発現のためにコドン最適化した。

これらのＤＮＡコーディング配列を合成のために商業製造業者（ＧｅｎＳｃｒｉｐｔ、Ｐｉｓｃａｔａｗａｙ、ＮＪ）に提供した。ＤＮＡ配列をカスケード−オペロン発現ベクター（表１９；配列番号４４１）に個別に導入して、実施例２に記載される発現ベクター中の野生型Ｃａｓ７タンパク質を置換した。

各発現ベクターを大腸菌ＢＬ２１Ｓｔａｒ（商標）（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、Ｗａｌｔｈａｍ、ＭＡ）細胞中にトランスフェクトしたが、第２のベクターは、実施例２に記載されるように表２０に示されるＪ３標的についてのガイドＲＮＡ（配列番号４４４）をコードしていた。実施例４Ｂに記載されるように細胞を培養した。Ｃａｓ５、Ｃａｓ６、ｃｐ−Ｃａｓ７Ｖ１、Ｃｓｅ２、およびＣａｓ８タンパク質のみならず、ガイドＲＮＡ／標的Ｊ３；ならびにＣａｓ５、Ｃａｓ６、ｃｐ−Ｃａｓ７Ｖ２、Ｃｓｅ２、およびＣａｓ８タンパク質のみならずガイドＲＮＡ／標的Ｊ３を含む大腸菌Ｉ−Ｅ型カスケード複合体を実施例５Ａに記載されるように精製した。

ｃｐ−Ｃａｓ７バリアントを含むカスケード複合体の精製は、円順列置換Ｉ−Ｅ型ＣＲＩＳＰＲ−Ｃａｓサブユニットタンパク質をうまく使用して、野生型タンパク質を含むカスケード複合体と本質的に同じ組成（分子量ベース）を有するカスケード複合体を形成させることができることを実証している。

Ｃ．カスケード／ｃｐ−Ｃａｓ７およびＪ３標的のＥＭＳＡ（電気泳動移動度シフトアッセイ）
精製カスケード／ｃｐ−Ｃａｓ７複合体を本実施例に記載されるように精製し、ＥＭＳＡに供して、それらのそれぞれの標的配列への特異的結合を実証した。簡潔には、カスケード／ｃｐ−Ｃａｓ７およびカスケード／ｗｔ−Ｃａｓ７を精製し、１０ｍｇ／ｍＬに濃縮した。本質的に実施例６Ａに記載されるようにＣｙ５二本鎖標的ＤＮＡを産生し、ＴＥ緩衝液中に１μＭに希釈した（Ｊ３標的は配列番号４６９および配列番号４７２であり、ＣＣＲ５標的は配列番号４７４および配列番号４７０である）。異なるタンパク質／標的比のカスケード複合体および標識二本鎖標的ＤＮＡを３７℃で３０分間インキュベートした。インキュベーションの直後、５０％グリセリン２μｌをサンプルに添加し、それらを５％ネイティブＰＡＡゲルに負荷した。ゲルを０．５×ＴＢＥ緩衝液中で４℃、７０Ｖで９０分間泳動し、ＡＺＵＲＥｃ６００Ｂｉｏｉｍａｇｅｒ（ＡｚｕｒｅＢｉｏＳｙｓｔｅｍｓ、Ｄｕｂｌｉｎ、ＣＡ）でイメージングし、バンドを定量した。データを表３７に示す。

カスケードサブユニット融合タンパク質
Ａ．ＦｏｋＩとのカスケードサブユニットの融合
本実施例は、カスケード複合体にヌクレアーゼ活性を付与するためにＦｏｋＩヌクレアーゼドメインに融合された大腸菌Ｉ−Ｅ型Ｃａｓ８タンパク質のｉｎｓｉｌｉｃｏ設計、クローニング、発現、および精製を例証するものである。

大腸菌Ｉ−Ｅ型Ｃａｓ８のＮ末端にフラボバクテリウム・オケアノコイテス（Ｆｌａｖｏｂａｃｔｅｒｉｕｍｏｋｅａｎｏｋｏｉｔｅｓ）ＦｏｋＩヌクレアーゼドメイン（ＧｅｎＢａｎｋ番号ＡＡＡ２４９２７．１）を融合させた。ＦｏｋＩヌクレアーゼドメインは、Ｇｕｏら（Ｇｕｏ、Ｊ．ら、Ｊ．Ｍｏｌ．Ｂｉｏｌ．４００：９６〜１０７（２０１０年））によって記載されるＳｈａｒｋｅｙバリアントに含まれる残基を含み、ホモダイマー化されると二本鎖ＤＮＡ切断を触媒する。ＦｏｋＩヌクレアーゼについてのアミノ酸配列（配列番号５８０）は、残基Ｑ３８４〜Ｆ５７９（ＧｅｎＢａｎｋ番号ＡＡＡ２４９２７．１）を含み、以下の点突然変異を有した：Ｅ４８６Ｑ、Ｌ４９９Ｉ、およびＤ４６９Ｎ。簡潔には、ＦｏｋＩのＳｈａｒｋｅｙヌクレアーゼドメイン（配列番号５８１）のＮ末端を、リンカー配列（配列番号５８２）を用いてＣａｓ８に融合させた。精製目的で、ヘキサヒスチジンタグ（Ｈｉｓ６、配列番号５８３）に続くＭＢＰタグ（配列番号５８４）に続くＴＥＶプロテアーゼ切断配列（配列番号５８５）、核局在化シグナル（ＮＬＳ、配列番号５８６）、およびＧＧＳリンカーをＮ末端でＦｏｋＩの残基３８４に付加した。最終構築物は、タンパク質配列中にＮＨ３−Ｈｉｓ６−ＭＢＰ−ＴＥＶ−ＮＬＳ−ＧＧＳ−ＦｏｋＩＳｈａｒｋｅｙ−３０ａａ−リンカー−Ｃａｓ８−ＣＯＯＨ（配列番号４１３）を含んでいた。

ｉｎｓｉｌｉｃｏ設計されたＤＮＡ配列を合成のために商業製造業者（ＧｅｎＳｃｒｉｐｔ、Ｐｉｓｃａｔａｗａｙ、ＮＪ）に提供した。実施例２に記載されるｋａｎＲ遺伝子の存在によりカナマイシン耐性を付与するｐＥＴ発現（ＭｉｌｌｉｐｏｒｅＳｉｇｍａ、Ｈａｙｗａｒｄ、ＣＡ）ファミリーベクター骨格にＤＮＡ配列をクローニングし、結果としてＮＨ３−Ｈｉｓ６−ＭＢＰ−ＴＥＶ−ＮＬＳ−ＧＧＳ−ＦｏｋＩＳｈａｒｋｅｙ−３０ａａ−リンカー−Ｃａｓ８−ＣＯＯＨ（配列番号４３９）を有するベクターをもたらした。

実施例４Ｂおよび実施例５Ｃに記載されるように大腸菌Ｉ−Ｅ型カスケードＨ３−Ｈｉｓ６−ＭＢＰ−ＴＥＶ−ＮＬＳ−ＧＧＳ−ＦｏｋＩＳｈａｒｋｅｙ−３０ａａ−リンカー−Ｃａｓ８−ＣＯＯＨ（配列番号４３９）を発現させ、精製した。ＴＥＶ切断後のタンパク質配列は、ＮＨ３−ＮＬＳ−ＧＧＳ−ＦｏｋＩＳｈａｒｋｅｙ−３０ａａ−リンカー−Ｃａｓ８−ＣＯＯＨ（配列番号５８７）を含む。

同様に、実施例１および２に記載されるＮＬＳ−ＦｏｋＩ−リンカー−Ｃａｓ８＿Ｈｉｓ６−ＨＲＶ３Ｃ−Ｃｓｅ２＿Ｃａｓ７＿Ｃａｓ５＿Ｃａｓ６（配列番号４４２）を有するベクター中にＦｏｋ１−Ｃａｓ８融合タンパク質を構築した。実施例２に記載されるようにＪ３標的についてのガイドＲＮＡ（配列番号４４４）をコードする第２のベクターを用いて各発現ベクターを大腸菌ＢＬ２１Ｓｔａｒ（商標）（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、Ｗａｌｔｈａｍ、ＭＡ）細胞にトランスフェクトした。実施例４Ｂおよび実施例５Ａに記載されるようにこの構築物を発現させ、精製した。融合ＦｏｋＩ−Ｃａｓ８バリアントを含むカスケード複合体の精製は、ヌクレアーゼと融合したＩ−Ｅ型ＣＲＩＳＰＲ−Ｃａｓサブユニットタンパク質を使用して、野生型タンパク質を含むカスケード複合体と本質的に同じ組成（分子量ベースで）を有するカスケード複合体をうまく形成することができることを実証している。標的核酸の生化学的切断（実施例７）および真核細胞におけるゲノム配列の細胞内切断のためにＦｏｋＩ−Ｃａｓ８融合物がうまく使用された（実施例８Ｄおよび実施例９Ｄ）。

表３８は、Ｃａｓサブユニットタンパク質−酵素融合物のさらなる例を挙げるものである。表３８では、ＡＰＯＢＥＣは、シチジンデアミナーゼ経路のメンバーである遺伝子に対応し（ヒトＡＰＯＢＥＣＩＧｅｎｂａｎｋ番号ＡＢ００９４２６、ヒトＡＰＯＢＥＣ３ＦＧｅｎｂａｎｋ番号ＣＨ４７１０９５、ヒトＡＰＯＢＥＣ３ＧＧｅｎｂａｎｋ番号ＣＲ４５６４７２、ラットＡＰＯＢＥＣＵＣＳＣゲノムブラウザーＩＤＲＧＤ：２１３３ｒａｔ）；ＡＩＤは、活性化誘導シチジンデアミナーゼに対応し（Ｇｅｎｂａｎｋ番号ＡＹ５３６５１６）；ＰｍＣＤＡ１はＡＩＤオーソログであり（例えば、Ｎｉｓｈｉｄａら、Ｓｃｉｅｎｃｅ１６：３５３（２０１６年）；Ｉｗａｍａｔｓｕら、Ｊ．Ｂｉｏｃｈｅｍ．１１０：１５１〜１５８（１９９１年）参照）；ＰｖｕＩＩＨＩＦＩＴ４６ＧはＰｖｕＩＩ高忠実度バリアントＴ４６Ｇであり（例えば、Ｆｏｎｆａｒａら、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．４０：８４７〜８６０（２０１２年）参照）；ＰｖｕＩＩ単鎖Ｔ４６ＧはｐｄｂＩＤ３ＫＳＫに記載されている）；Ｉ−ＴｅｖＩは、バクテリオファージＴ４からの部位特異的配列寛容性ホーミングエンドヌクレアーゼであり、Ｎ末端触媒ドメインおよびＣ末端ＤＮＡ結合ドメインを含み（これらのドメインは長い可動性リンカーにより結びつけいている）（例えば、ＶａｎＲｏｅｙら、ＥＭＢＯＪ．２０：３６３１〜３６３７（２００１年）参照）；ＢｃｎＩ（例えば、Ｓｏｋｏｌｏｗｓｋａら、Ｊ．Ｍｏｌ．Ｂｉｏｌ．３６９：７２２〜７３４（２００７年）参照）；およびＭｖａＩ（例えば、Ｋａｕｓ−Ｄｒｏｂｅｋら、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．３５：２０３５〜２０４６（２００７年））は制限酵素である。

Ｂ．別のカスケードサブユニットタンパク質とのカスケードサブユニットタンパク質の融合物
大腸菌カスケード結晶構造５Ｈ９Ｅ．ｐｄｂに基づく構造ガイドアプローチを用いてカスケード複合体の２つのＣｓｅ２タンパク質を一緒に融合させた（ｗｗｗ．ｒｃｓｂ．ｏｒｇ／ｐｄｂ／；例えば、Ｈａｙｅｓ、Ｒ．Ｐら、Ｎａｔｕｒｅ５３０（７５９１）：４９９〜５０３（２０１６年）参照）。簡潔には、１０−ａａ可動性リンカー（配列番号５８９）を使用して、１つのＣｓｅ２のＣ末端および第２のＣｓｅ２のＮ末端を一緒に融合させた。Ｃｓｅ２−Ｃｓｅ２（ＣａｓＢ＿ＣａｓＢ）融合タンパク質の全配列を配列番号５８８に示す。

ｉｎｓｉｌｉｃｏ設計されたＤＮＡ配列を合成のために商業製造業者（ＧｅｎＳｃｒｉｐｔ、Ｐｉｓｃａｔａｗａｙ、ＮＪ）に提供した。ＤＮＡ配列を実施例２で設計された発現ベクターにクローニングした（配列番号４４１）。Ｃｓｅ２配列を配列番号５８８と交換した。

各発現ベクターを、実施例２に記載されるようにＪ３標的についてのガイドＲＮＡ（配列番号４４４）をコードする第２のベクターと共に大腸菌ＢＬ２１Ｓｔａｒ（商標）（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、Ｗａｌｔｈａｍ、ＭＡ）にトランスフェクトした。実施例４Ｂおよび５Ｂに記載されるようにＣａｓ５、Ｃａｓ６、Ｃａｓ７、Ｃｓｅ２−Ｃｓｅ２、およびＣａｓ８を含む大腸菌Ｉ−Ｅ型カスケード複合体を発現させ、精製した。融合したＣｓｅ２−Ｃｓｅ２バリアントを含むカスケード複合体の精製は、融合したＩ−Ｅ型ＣＲＩＳＰＲ−Ｃａｓサブユニットタンパク質が、野生型タンパク質を含むカスケード複合体と本質的に同じ組成（分子量ベースで）を有するカスケード複合体をうまく形成したことを実証している。

Ｃ．カスケード／Ｃｓｅ２−Ｃｓｅ２およびＪ３標的の電気泳動移動度シフトアッセイ（ＥＭＳＡ）
精製カスケード／Ｃｓｅ２−Ｃｓｅ２複合体を本実施例に記載されるように精製し、ＥＭＳＡに供して、それらのそれぞれの標的配列への特異的結合を実証した。簡潔には、カスケード／Ｃｓｅ２−Ｃｓｅ２およびカスケード／ＷＴ−Ｃｓｅ２を精製し、１０ｍｇ／ｍＬに濃縮した。実施例６Ａに記載されるようにＣｙ５二本鎖標的ＤＮＡを産生し、ＴＥ緩衝液中に１Ｍになるよう希釈した（Ｊ３標的は配列番号４６９および配列番号４７２であり、ＣＣＲ５標的は配列番号４７４および配列番号４７０である）。カスケード複合体および標識二本鎖標的ＤＮＡを種々のタンパク質／標的比にて３７℃で３０分間インキュベートした。インキュベーションの直後、５０％グリセリン２μｌをサンプルに添加し、それらを５％ネイティブＰＡＡゲルに負荷した。０．５×ＴＢＥ緩衝液中のゲルを４℃、７０Ｖで９０分間泳動させ、ＡＺＵＲＥｃ６００Ｂｉｏｉｍａｇｅｒ（ＡｚｕｒｅＢｉｏＳｙｓｔｅｍｓ、Ｄｕｂｌｉｎ、ＣＡ）でイメージングし、バンドを定量した。データを表３９に示す。

Ｄ．別のカスケードサブユニットタンパク質および酵素タンパク質ドメインとのカスケードサブユニットタンパク質の融合
シチジンデアミナーゼｒＡＰＯＢＥＣ１（アポリポタンパク質ＢｍＲＮＡ編集酵素触媒サブユニット１、ドブネズミ（Ｒａｔｔｕｓｎｏｒｖｅｇｉｃｕｓ）；ＮＣＢＩ遺伝子ＩＤ：２５３８３、ｕＥｎｓｅｍｂｌ：ＥＮＳＲＮＯＧ００００００１５４１１）を融合のために選択した。大腸菌カスケード結晶構造５Ｈ９Ｅ．ｐｄｂに基づく構造ガイドアプローチを使用してＣｓｅ２−Ｃｓｅ２タンパク質をｒＡＰＯＢＥＣ１と融合させた（ｗｗｗ．ｒｃｓｂ．ｏｒｇ／ｐｄｂ／；例えば、Ｈａｙｅｓ、Ｒ．Ｐら、Ｎａｔｕｒｅ５３０（７５９１）：４９９〜５０３（２０１６年）参照）。簡潔には、９−ａａ可動性リンカー（配列番号５９１）を使用して、ｒＡＰＯＢＥＣ１（配列番号５９０）のＣ末端をＣｓｅ２−Ｃｓｅ２ダイマー（上記）のＮ末端と融合させた。ｒＡＰＯＢＥＣＩ＿Ｃｓｅ２−Ｃｓｅ２融合タンパク質の全配列を配列番号５９２に示す。

ｉｎｓｉｌｉｃｏ設計されたＤＮＡ配列を合成のために商業製造業者（ＧｅｎＳｃｒｉｐｔ、Ｐｉｓｃａｔａｗａｙ、ＮＪ）に提供した。ＤＮＡ配列を発現ベクター（配列番号４４１）にクローニングし、Ｃｓｅ２配列を置換した。実施例２に記載されるように、各発現ベクターを、Ｊ３標的についてのガイドＲＮＡをコードする第２のベクター（配列番号４４４）と共に大腸菌ＢＬ２１Ｓｔａｒ（商標）（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、Ｗａｌｔｈａｍ、ＭＡ）細胞にトランスフェクトした。実施例４Ｂおよび５Ｂに記載されるようにＣａｓ５、Ｃａｓ６、Ｃａｓ７、ｒＡＰＯＢＥＣ１＿Ｃｓｅ２−Ｃｓｅ２、およびＣａｓ８を含む大腸菌Ｉ−Ｅ型カスケード複合体を発現させ、精製した。融合ｒＡＰＯＢＥＣ１＿Ｃｓｅ２−Ｃｓｅ２バリアントを含むカスケード複合体の精製は、野生型タンパク質を含むカスケード複合体と本質的に同じ組成（分子量ベースで）を有するカスケード複合体を形成するために、Ｉ−Ｅ型ＣＲＩＳＰＲ−Ｃａｓサブユニットタンパク質とのシチジンデアミナーゼ融合物がうまく使用されたことを実証している。表４０は、Ｃｓｅ２−Ｃｓｅ２との酵素融合物の例を示す。

転写活性化／抑制ドメインとのカスケードサブユニットタンパク質の融合物
本実施例は、ＶＰ６４活性化ドメインと融合した大腸菌Ｉ−Ｅ型ｃｐ−Ｃａｓ７タンパク質の設計がカスケード複合体に転写活性化活性を付与することを例証する。

ＶＰ６４は、ＶＰ１６（単純ヘルペスウイルスタンパク質１６、ＤＡＬＤＤＦＤＬＤＭＬ（配列番号６１４）；アミノ酸４３７〜４４７、ＵＮＩＰＲＯＴ：ＵＬ４８）の４つのタンデム型コピーがグリシン−セリン（ＧＳ）リンカーに結びついたものを含む転写活性化因子である。遺伝子のプロモーター近くに結合することができるタンパク質ドメインと融合した場合、ＶＰ６４（配列番号６１５）は強い転写活性化因子として作用する。大腸菌Ｉ−Ｅ型ｃｐ−Ｃａｓ７Ｖ２（配列番号６１６）を操作のために選択することができる。

活性化ドメインＶＰ６４を、ｃｐＣａｓ７Ｖ２のＮ末端に融合させることができる（実施例１０Ａに記載）。リンカー（例えば、５〜５０アミノ酸長）を選択して、ｃｐＣａｓ７Ｖ２およびＶＰ６４ドメインを作動可能に連結することができる。

ｉｎｓｉｌｉｃｏ設計されたＤＮＡ配列を合成のために商業製造業者に提供することができる。ＶＰ６４−ｃｐＣａｓ７Ｖ２融合タンパク質をコードするＤＮＡ配列を発現ベクターにクローニングすることができる（例えば、ＶＰ６４−ｃｐＣａｓ７Ｖ２を使用してＣａｓ７を置換することができる配列番号４５５）。実施例２に記載されるようにＪ３標的についてのガイドＲＮＡ（配列番号４４４）をコードする第２のベクターと共に、各発現ベクターを大腸菌ＢＬ２１Ｓｔａｒ（商標）（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、Ｗａｌｔｈａｍ、ＭＡ）細胞にトランスフェクトすることができる。実施例４および５に記載されるようにＣａｓ５、Ｃａｓ６、ＶＰ６４＿ｃｐＣａｓ７Ｖ２、Ｃｓｅ２、およびＣａｓ８を含む大腸菌Ｉ−Ｅ型カスケード複合体を発現させ、精製することができる。野生型タンパク質を含むカスケード複合体と本質的に同じ組成（分子量ベースで）を有するカスケード複合体を形成させるために融合ＶＰ６４＿ｃｐＣａｓ７Ｖ２バリアントを含むカスケード複合体の精製を用いることができる。

特定の遺伝子のプロモーター領域に標的化されたガイドの選択を用いて、融合ＶＰ６４＿ｃｐＣａｓ７Ｖ２を含むカスケード複合体が遺伝子の転写活性化を促進する能力を検証することができる。

ｄＣａｓ９／ガイド複合体によるカスケードサブユニットに融合した機能的ドメインの部位特異的動員
本実施例は、機能的ドメインと融合した１つまたはそれ以上のカスケードサブユニットタンパク質（すなわち、Ｃａｓ６、Ｃａｓ５など）のＩＩ型ＣＲＩＳＰＲＣａｓタンパク質／ガイドＲＮＡ複合体結合部位への動員のためのクラス１Ｉ型ＣＲＩＳＰＲリピートステム配列（例えば、Ｉ−Ｆ型ＣＲＩＳＰＲリピートステム配列）を有するクラス２ＩＩ型ＣＲＩＳＰＲｓｇＲＮＡ、ｃｒＲＮＡ、ｔｒａｃｒＲＮＡ、またはｃｒＲＮＡおよびｔｒａｃｒＲＮＡ配列を操作する方法を記載する。本明細書におけるこの方法は、Ｇｉｌｂｅｒｔ、Ｌ．ら、Ｃｅｌｌ１５４（２）：４４２〜４５１（２０１３年）およびＦｅｒｒｙ、Ｑら、ＮａｔｕｒｅＣｏｍｍｕｎｉｃａｔｉｏｎ８：１４６３３ｄｏｉ：１０．１０３８／ｎｃｏｍｍｓ１４６３３（２０１７年）を変更したものである。

Ａ．ＩＩ型ガイドＲＮＡの操作
ＩＩ型ＣＲＩＳＰＲｓｇＲＮＡ、ｃｒＲＮＡ、ｔｒａｃｒＲＮＡ、またはｃｒＲＮＡおよびｔｒａｃｒＲＮＡ（まとめて「ＩＩ型ガイドＲＮＡ」と称される）を操作のために選択することができる。

ＩＩ型ガイドＲＮＡ配列をＩ型ＣＲＩＳＰＲリピートステム配列の組み入れ領域についてｉｎｓｉｌｉｃｏで評価することができる。Ｉ型ＣＲＩＳＰＲリピートステム配列をＩＩ型ガイドＲＮＡの５’もしくは３’末端、またはＩＩ型ガイドＲＮＡの内部に結合させることができる、またはＩＩ型ガイドＲＮＡの二次構造（例えば、３’ヘアピンエレメント）を置換することができる。Ｉ型ＣＲＩＳＰＲリピートステム配列の組み入れは、リンカーエレメントのヌクレオチド配列を伴うことができる。Ｉ型ＣＲＩＳＰＲリピートステム配列を含むように３’操作されたＩＩ型ｔｒａｃｒＲＮＡの例を表４１に示す。

Ｃ−Ｘ−Ｃケモカイン受容体４型（ＣＸＣＲ４）などの哺乳動物遺伝子を標的化のために選択することができる。ＩＩ型ＣＲＩＳＰＲＣａｓタンパク質ＰＡＭ配列（例えば、５’−ＮＧＧ）に隣接して存在するＩＩ型ＣＲＩＳＰＲＣａｓタンパク質標的配列について５’ＵＴＲとエクソン１との間の接合部を、ｉｎｓｉｌｉｃｏでスキャンすることができる。５’方向の上流に存在する２０ヌクレオチドの標的配列をＩＩ型ｃｒＲＮＡ中に組み入れることができる。ＣＸＣＲ４を標的化するＩＩ型ｃｒＲＮＡの一例を表４２に示す。

あるいは、ＣＸＣＲ４標的化スペーサー（ＲＮＡ）（配列番号６１９）の３’末端を、３’Ｉ型ＣＲＩＳＰＲリピートステム配列（ＲＮＡ）を有するＩＩ型ｔｒａｃｒＲＮＡ（配列番号６１７）の５’末端とリンカーで共有結合的に連結することができる。適切なリンカーエレメントは５’−ＧＡＡＡ−３’である。

組み入れられたＩ型ＣＲＩＳＰＲリピートステム配列を有するｉｎｓｉｌｉｃｏ設計されたＩＩ型ガイドＲＮＡを、合成のために商業製造業者に提供することができる。

Ｉ型カスケードサブユニットタンパク質（例えば、Ｃａｓ６）を転写活性化または抑制ドメイン（例えば、ＫＲＡＢ）に作動可能に連結し、実施例１２に記載されるように核局在化シグナル（ＮＬＳ）をＣ末端にタグ付けすることができる。

ＩＩ型Ｃａｓタンパク質（例えば、Ｃａｓ９）が触媒的に不活性（例えばｄＣａｓ９）であり、ＮＬＳ配列によりタグ付けされるように、ＩＩ型Ｃａｓタンパク質を突然変異誘発することができる。

Ｃａｓ６−ＫＲＡＢ−ＮＬＳタンパク質およびｄＣａｓ９−ＮＬＳタンパク質を組み換え発現させ、大腸菌から精製することができる。

ＲＮＰ複合体は、６０ｐｍｏｌのｄＣａｓ９タンパク質：６０ｐｍｏｌのＣａｓ６−ＫＲＡＢ−ＮＬＳ：１２０ｐｍｏｌのＣＸＣＲ４標的化ｃｒＲＮＡ：Ｉ型ＣＲＩＳＰＲリピートステム配列を含むように３’操作された１２０ｐｍｏｌのｔｒａｃｒＲＮＡの濃度で形成することができる。ｄＣａｓ９およびＣａｓ６−ＫＲＡＢ−ＮＬＳとの組み立ての前に、１２０ｐｍｏｌのＣＸＣＲ４標的化ｃｒＲＮＡおよびＩ型ＣＲＩＳＰＲリピートステム配列を含むように３’操作された１２０ｐｍｏｌのｔｒａｃｒＲＮＡ（本明細書において「操作されたＩＩ型ガイドＲＮＡ」と称される）のそれぞれを、終体積２μＬ中に所望の合計濃度（１２０ｐｍｏｌ）に希釈し、９５℃で２分間インキュベートし、サーモサイクラーから取り出し、平衡化して室温にすることができる。ｄＣａｓ９およびＣａｓ６−ＫＲＡＢ−ＮＬＳタンパク質を結合緩衝液（２０ｍＭＨＥＰＥＳ、１００ｍＭＫＣｌ、５ｍＭＭｇＣｌ₂、および５％グリセリン、ｐＨ７．４）中に適切な濃度に希釈して終体積３μＬにし、ＩＩ型ガイドＲＮＡ２μＬと混合し、続いて３７℃で３０分間インキュベートすることができる。トランスフェクトされていない対照（例えば、緩衝液のみ）、操作されていないＩＩ型ガイドＲＮＡ、または抑制ドメインと連結していないＣａｓ６を使用して、陰性対照ＲＮＰを組み立てることができる。

Ｂ．ｄＣａｓ９：Ｃａｓ６−ＫＲＡＢ−ＮＬＳ：操作されたＩＩ型ガイドＲＮＡを使用する細胞トランスフェクション
Ｎｕｃｌｅｏｆｅｃｔｏｒ（登録商標）９６−ｗｅｌｌＳｈｕｔｔｌｅシステム（Ｌｏｎｚａ、Ａｌｌｅｎｄａｌｅ、ＮＪ）および以下のプロトコールを使用して、ｄＣａｓ９：Ｃａｓ６−ＫＲＡＢ−ＮＬＳ：操作されたＩＩ型ガイドＲＮＡ核タンパク質複合体をＨＥＫ２９３細胞（ＡＴＣＣ、ＭａｎａｓｓａｓＶＡ）にトランスフェクトすることができる：複合体を９６ウェルプレートの個別のウェルに終体積５μＬで分注することができる。細胞培養培地をＨＥＫ２９３細胞培養プレートから取り出し、細胞をＴｒｙｐＬＥ（商標）（ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ、Ｗｉｌｍｉｎｇｔｏｎ、ＤＥ）で剥離することができる。２００×ｇで３分間遠心分離することによって懸濁ＨＥＫ２９３細胞をペレットにし、ＴｒｙｐＬＥ試薬を吸引し、細胞をカルシウムおよびマグネシウムを含まないリン酸緩衝食塩水（ＰＢＳ）で洗浄することができる。２００×ｇで３分間遠心分離することによって細胞をペレットにし、ＰＢＳを吸引し、カルシウムおよびマグネシウムを含まないＰＢＳ１０ｍＬ中に細胞ペレットを再懸濁することができる。

Ｃｏｕｎｔｅｓｓ（登録商標）ＩＩ自動細胞計数機（ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ；ＧｒａｎｄＩｓｌａｎｄ、ＮＹ）を使用して細胞を計数することができる。２．２×１０⁷個の細胞を１．５ｍｌマイクロチューブに移し、ペレットにすることができる。ＰＢＳを吸引し、細胞をＮｕｃｌｅｏｆｅｃｔｏｒ（商標）ＳＦ（Ｌｏｎｚａ、Ａｌｌｅｎｄａｌｅ、ＮＪ）溶液中に密度１×１０⁷個／ｍＬに再懸濁することができる。次いで、細胞懸濁液２０μＬを、ＲＮＰ複合体５μＬを含む各個別のウェルに添加することができ、各ウェルからの全体積を９６ウェルＮｕｃｌｅｏｃｕｖｅｔｔｅ（商標）（Ｌｏｎｚａ、Ａｌｌｅｎｄａｌｅ、ＮＪ）プレートのウェルに移すことができる。プレートをＮｕｃｌｅｏｆｅｃｔｏｒ（商標）９６−ｗｅｌｌＳｈｕｔｔｌｅ（商標）（Ｌｏｎｚａ、Ａｌｌｅｎｄａｌｅ、ＮＪ）に負荷することができ、９６−ＣＭ−１３０Ｎｕｃｌｅｏｆｅｃｔｏｒ（商標）（Ｌｏｎｚａ、Ａｌｌｅｎｄａｌｅ、ＮＪ）プログラムを使用して細胞をヌクレオフェクションすることができる。ヌクレオフェクション後、１０％ウシ胎仔血清（ＦＢＳ；ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ、Ｗｉｌｍｉｎｇｔｏｎ、ＤＥ）、ペニシリンおよびストレプトマイシン（ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ、ＧｒａｎｄＩｓｌａｎｄ、ＮＹ）を補充したダルベッコ変法イーグル培地（ＤＭＥＭ；ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ、Ｗｉｌｍｉｎｇｔｏｎ、ＤＥ）７０μＬを各ウェルに添加することができ、細胞懸濁液５０μＬを、予温したＤＭＥＭ完全培養培地１５０μＬを含む９６ウェル細胞培養プレートに移すことができる。プレートを組織培養インキュベーターに移し、５％ＣＯ₂中、３７℃で４８時間維持することができる。

ｄＣａｓ９：Ｃａｓ６−ＫＲＡＢ−ＮＬＳ：操作されたＩＩ型ガイドＲＮＡ核タンパク質複合体のヌクレオフェクションの７２時間後、ＣＸＣＲ４発現の抑制について細胞を評価することができる。培養培地をＨＥＫ２９３から吸引することができ、カルシウムおよびマグネシウムを含まないＰＢＳで細胞を１回洗浄することができ、次いでＴｒｙｐＬＥ（ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ、ＧｒａｎｄＩｓｌａｎｄ、ＮＹ）の添加によりトリプシン処理し、続いて３７℃で３〜５分間インキュベートする。トリプシン処理された細胞を優しくピペッティングして、単一細胞懸濁液を形成することができ、次いで２００×ｇで３分間遠心分離することによって細胞をペレットにすることができる。遠心分離後、培養培地を吸引することができ、細胞を１０ｍＭＥＤＴＡ／ＰＢＳ緩衝液中に再懸濁し、単一細胞懸濁液中に優しく混合する。１０％ＦＢＳを含有するＰＢＳ中に０．０５％の抗ヒトＣＸＣＲ４抗体コンジュゲートＦＩＴＣ（Ｍｅｄｉｃａｌ＆ＢｉｏｌｏｇｉｃａｌＬａｂｏｒａｔｏｒｉｅｓＣｏ．、Ｎａｇｏｙａ、Ｊａｐａｎ）を使用して、単一細胞懸濁液を室温で１時間染色することができる。アイソタイプ対照およびネイティブなＲＮＰ対照を参照のために同様に染色することができる。次いで染色された細胞をＬＳＲＩＩフローサイトメーター（ＢＤｌａｂｏｒａｔｏｒｉｅｓ、ＳａｎＪｏｓｅ、ＣＡ）で選別し、ＦＩＴＣ陽性蛍光細胞の集団を集計することができる。

ＣＸＣＲ４発現における低減を、トランスフェクトされていない対照の測定蛍光と比べたｄＣａｓ９：Ｃａｓ６−ＫＲＡＢ−ＮＬＳ：操作されたＩＩ型ガイドＲＮＡをヌクレオフェクションされたサンプルの検出蛍光における減少により測定する。Ｉ型ＣＲＩＳＰＲリピートステム配列を有する操作されたＩＩ型ガイドＲＮＡをヌクレアーゼ欠損ＩＩ型Ｃａｓ９タンパク質と組み合わせて使用して、抑制ドメインと融合したＩ型ＣＲＩＳＰＲカスケードサブユニットタンパク質を遺伝子標的に動員および局在化させ、前記遺伝子標的の転写を抑制することができることを実証するために、フローサイトメーターからの蛍光の減少を使用することができる。

Ｉ型ｃａｓ遺伝子の同定およびスクリーニング
本実施例は、異なる種からのＩ型ｃａｓ遺伝子を同定およびスクリーニングするための方法を記載する。本明細書に示す方法は、Ｓｈｍａｋｏｖ、Ｓ．ら、Ｍｏｌ．Ｃｅｌｌ６０：３８５〜３９７（２０１５年）を変更したものである。

Ａ．Ｉ型ＣＲＩＳＰＲ−Ｃａｓ遺伝子の同定
ＢａｓｉｃＬｏｃａｌＡｌｉｇｎｍｅｎｔＳｅａｒｃｈＴｏｏｌ（ＢＬＡＳＴ、ｂｌａｓｔ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ／Ｂｌａｓｔ．ｃｇｉ）を使用して、様々な種のゲノムの検索を実行し、Ｉ型ＣＲＩＳＰＲ−Ｃａｓ複合体の様々な遺伝子構成要素をコードする１つまたはそれ以上の遺伝子を同定することができる。ｃａｓ１インテグラーゼ遺伝子は、クラス１およびクラス２ＣＲＩＳＰＲ−Ｃａｓファミリーの両方の構成要素であり、ｃａｓ１遺伝子を含む種を同定した場合、これらのゲノムにおける部分配列サーチャーを実行して、Ｉ型特異的遺伝子を含むゲノムを単離することができる。ゲノム検索は、ＣＲＩＳＰＲ−Ｃａｓインテグラーゼ遺伝子ｃａｓ１上にアンカーすることができ、使用することができる大腸菌Ｋ−１２ＭＧ１６５５由来のＩ−Ｅ型系からの例示的なｃａｓ１配列は配列番号６２１である。特定の遺伝子（例えば、ｃａｓ７およびｃａｓ５）がＩ型系の干渉複合体の中核構成要素であり、それらを使用して、Ｉ型系を含む種をさらに識別することができる。使用することができる大腸菌Ｋ−１２ＭＧ１６５５ｃａｓ７およびｃａｓ５遺伝子の例示的な配列は、それぞれ配列番号６２２および配列番号６２３である。Ｉ型特異的ヌクレアーゼ−ヘリカーゼｃａｓ３遺伝子またはその相同体の同定により、ｃａｓ７およびｃａｓ５遺伝子を有する同定されたゲノムをさらにパースすることができる。使用することができる大腸菌Ｋ−１２ＭＧ１６５５ｃａｓ３配列の例示的な配列は、配列番号６２４である。

ＣＲＩＳＰＲ−Ｃａｓインテグラーゼ遺伝子ｃａｓ１、Ｉ型干渉複合体遺伝子ｃａｓ７およびｃａｓ５、ならびにヌクレアーゼ−ヘリカーゼｃａｓ３遺伝子、またはそれらの何かの組み合せを含むゲノムは、Ｉ型ＣＲＩＳＰＲ−Ｃａｓ系の候補の可能性がある。Ｉ型ＣＲＩＳＰＲ−Ｃａｓ遺伝子は、一般的に、典型的には２０キロ塩基（ｋｂ）内の単一ゲノム座位における１つの近位に見出される。Ｉ型干渉複合体を構成する残りのｃａｓ遺伝子の他のオープンリーディングフレーム（ＯＲＦ）についてｃａｓ１、ｃａｓ７、ｃａｓ５、またはｃａｓ３遺伝子周辺の区域を検索することができる。推定されるＯＲＦのアミノ酸配列を公知のＩ型遺伝子と相同性について比較することができ、またはＩ型タンパク質構成要素の特徴的なタンパク質ドメインの存在を、ＭａｘＰｌａｎｃｋＩｎｓｔｉｔｕｔｅＢｉｏｉｎｆｏｒｍａｔｉｃｓＴｏｏｌｋｉｔ（ｗｗｗ．ｔｏｏｌｋｉｔ．ｔｕｅｂｉｎｇｅｎ．ｍｐｇ．ｄｅ／＃／）から入手可能な相同性検出および構造予測検索ツール、もしくは同等物を使用して分析することができる。

Ｂ．同定されたＩ型構成要素のスクリーニング
Ｉ型構成要素（例えば、ｃａｓ遺伝子および対応するｃｒＲＮＡ）の推定上のコレクションを同定した後、Ｉ型構成要素がプログラム可能なＤＮＡ標的化を実行する能力についてそれらの構成要素を試験することができる。

実施例１、２、および３のガイダンスに従って推定上のｃａｓ遺伝子およびｃｒＲＮＡを発現ベクター中にコードさせることができる。様々なｃａｓ遺伝子およびｃｒＲＮＡをコードするベクターを細菌株に導入し、実施例４および５に記載されるようにＩ型干渉複合体を発現および精製することができる。サイズ排除クロマトグラフィー（ＳＥＣ）カラムからの溶出画分をＳＤＳ−ＰＡＧＥゲルにより分析して、完全なＩ型干渉複合体を構成するタンパク質構成要素の同一性を重量ベースで決定することができる。臭化エチジウムゲルも泳動して、干渉複合体の部分としてのｃｒＲＮＡの存在を検出することができる。

精製されたカスケード複合体が実施例６および７に記載されるようなＤＮＡ標的のｉｎｖｉｔｒｏ生化学切断を支援する能力についてそれらの複合体を試験することができる。

単一の推定上のｃａｓ遺伝子が発現されない対照発現および精製サンプルを使用して、プログラム可能なＤＮＡ標的ができる完全なＩ型干渉複合体を構成する必要なｃａｓ遺伝子を決定することができる。

ある特定の適用のために、ゲノム配列からの個別のｃａｓ遺伝子相同体（例えば、ｃａｓ７）の同定で十分であり、追加的なｃａｓ遺伝子を同定する必要も、スクリーニングする必要もない。

Ｉ型ｃｒＲＮＡの同定
本実施例は、種々の種におけるＩ型ｃｒＲＮＡを同定する方法を記載する。本明細書に示される方法は、Ｃｈｙｌｉｎｓｋｉ、Ｋ．ら、ＲＮＡＢｉｏｌｏｇｙ１０：７２６〜７３７（２０１３年）を変更したものである。

様々な種のゲノムの検索を実行して、実施例１７Ａに記載されるＩ型ＣＲＩＳＰＲ−Ｃａｓ遺伝子を同定することができる。１つまたはそれ以上のＩ型特異的ｃａｓ遺伝子を含むゲノムは、ＣＲＩＳＰＲリピート−スペーサーアレイ内にコードされるＣＲＩＳＰＲＲＮＡ（ｃｒＲＮＡ）を含む可能性がある候補ゲノムである。同定されたＩ型ｃａｓ遺伝子（例えば、ｃａｓ７、ｃａｓ５、またはｃａｓ３遺伝子）に隣接する配列を、関連するＣＲＩＳＰＲリピート−スペーサーアレイについて探索することができる。ｉｎｓｉｌｉｃｏ予測スクリーニングのための方法を使用して、Ｇｒｉｓｓａ、Ｉ．Ｖ．ら、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．３５（Ｗｅｂサーバー発行）：Ｗ５２〜Ｗ５７（２００７年）に従ってリピートアレイからｃｒＲＮＡ配列を抽出することができる。ｃｒＲＮＡ配列は、ＣＲＩＳＰＲリピートアレイ内に含まれ、外来スペーサー配列によって間があいたその特徴的なリピート配列によって同定することができる。

Ａ．ＲＮＡ−ｓｅｑライブラリーの製造
ＲＮＡシークエンシング（ＲＮＡ−ｓｅｑ）を用いて、ｉｎｓｉｌｉｃｏで同定された個別のｃｒＲＮＡを含む推定上のＣＲＩＳＰＲアレイをさらに検証することができる。

推定上のＩ型ｃａｓ遺伝子およびｃｒＲＮＡ構成要素を含むと同定された種からの細胞を商業的リポジトリ（例えば、ＡＴＣＣ、Ｍａｎａｓｓａｓ、ＶＡ；ＧｅｒｍａｎＣｏｌｌｅｃｔｉｏｎｏｆＭｉｃｒｏｏｒｇａｎｉｓｍｓａｎｄＣｅｌｌＣｕｌｔｕｒｅｓＧｍｂＨ（ＤＳＭＺ）、Ｂｒａｕｎｓｃｈｗｅｉｇ、Ｇｅｒｍａｎｙ）から入手することができる。

細胞を対数増殖中期に生育させ、Ｔｒｉｚｏｌ試薬（ＳｉｇｍａＡｌｄｒｉｃｈ、Ｓｔ．Ｌｏｕｉｓ、ＭＯ）を使用して総ＲＮＡを製造し、それをＤＮアーゼＩ（Ｆｅｒｍｅｎｔａｓ、Ｖｉｌｎｉｕｓ、Ｌｉｔｈｕａｎｉａ）で処理することができる。

総ＲＮＡ１０μｇをＲｉｂｏ−ＺｅｒｏｒＲＮＡＲｅｍｏｖａｌＫｉｔ（Ｉｌｌｕｍｉｎａ、ＳａｎＤｉｅｇｏ、ＣＡ）で処理することができ、残りのＲＮＡは、ＲＮＡＣｌｅａｎａｎｄＣｏｎｃｅｎｔｒａｔｏｒｓ（ＺｙｍｏＲｅｓｅａｒｃｈ、Ｉｒｖｉｎｅ、ＣＡ）を使用して精製することができる。

ＴＲＵＳＥＱ（商標）ＳｍａｌｌＲＮＡＬｉｂｒａｒｙＰｒｅｐａｒａｔｉｏｎＫｉｔ（Ｉｌｌｕｍｉｎａ、ＳａｎＤｉｅｇｏ、ＣＡ）を製造業者の説明書に従って使用して、ライブラリーを製造することができる。これにより、アダプター配列を有するｃＤＮＡがもたらされるであろう。

結果としてもたらされたｃＤＮＡライブラリーを、ＭｉＳｅｑシークエンサー（Ｉｌｌｕｍｉｎａ、ＳａｎＤｉｅｇｏ、ＣＡ）を使用してシークエンシングすることができる。

Ｂ．シークエンシングデータの処理
ｃＤＮＡライブラリーのシークエンシングリードは、例えば以下の方法を用いて処理することができる。

アダプター配列は、ｃｕｔａｄａｐｔ１．１（ｐｙｐｉ．ｐｙｔｈｏｎ．ｏｒｇ／ｐｙｐｉ／ｃｕｔａｄａｐｔ／１．１）を用いて除去することができ、リードの３’末端から約１５ヌクレオチドをトリミングしてリードの質を改善することができる。

Ｂｏｗｔｉｅ２（ｗｗｗ．ｂｏｗｔｉｅ−ｂｉｏ．ｓｏｕｒｃｅｆｏｒｇｅ．ｎｅｔ／ｂｏｗｔｉｅ２／ｉｎｄｅｘ．ｓｈｔｍｌ）を使用して、リードをそれぞれの種（すなわち、同定すべき推定上のｃｒＲＮＡが由来する種）のゲノムと整列させることができる。その後のシークエンシング解析ステップのために、Ｂｏｗｔｉｅ２によって生成されるＳｅｑｕｅｎｃｅＡｌｉｇｎｍｅｎｔ／Ｍａｐ（ＳＡＭ）ファイルを、ＳＡＭＴｏｏｌｓ（ｗｗｗ．ｓａｍｔｏｏｌｓ．ｓｏｕｒｃｅｆｏｒｇｅ．ｎｅｔ／）を使用してＢｉｎａｒｙＡｌｉｇｎｍｅｎｔ／Ｍａｐ（ＢＡＭ）ファイルに変換することができる。

１つまたはそれ以上のＣＲＩＳＰＲ座位にマップするリード被覆率は、ＢＡＭファイルからＢｅｄＴｏｏｌｓ（ｂｅｄｔｏｏｌｓ．ｒｅａｄｔｈｅｄｏｃｓ．ｏｒｇ／ｅｎ／ｌａｔｅｓｔ／）を使用して計算することができる。

以前のステップで生成されるＢＥＤファイルをＩｎｔｅｇｒａｔｉｖｅＧｅｎｏｍｉｃｓＶｉｅｗｅｒ（ＩＧＶ；ｗｗｗ．ｂｒｏａｄｉｎｓｔｉｔｕｔｅ．ｏｒｇ／ｉｇｖ／）にロードして、シークエンシングリードのパイルアップを可視化することができる。リードパイルを使用して、転写された推定上のｃｒＲＮＡ配列の５’末端および３’末端を同定することができる。ＲＮＡ−ｓｅｑデータを使用して、推定上のｃｒＲＮＡエレメントがｉｎｖｉｖｏで活発に転写されることを検証することができる。

実施例１７Ａのガイダンスに従って、コグネイトＩ型ｃａｓ遺伝子を用いて、プログラム可能なＤＮＡ標的化を実行する能力について推定上のｃｒＲＮＡを試験することができる。

カスケードガイドＲＮＡ骨格における変化に対して寛容な部位についての探索
本実施例は、Ｉ型ガイドｃｒＲＮＡへの様々な変化の生成および試験ならびにカスケードポリヌクレオチド複合体の構築に使用するためのそれらの適合性を記載する。下記の方法は、Ｂｒｉｎｅｒ、Ａ．ら、Ｍｏｌ．Ｃｅｌｌ５６：３３３〜３３９（２０１４年）を変更したものである。

ｃｒＲＮＡ骨格に変化を導入し、結果としてもたらされた操作されたｃｒＲＮＡを、コグネイトカスケード複合体を用いて試験して、Ｉ型ガイドｃｒＲＮＡ骨格における操作に適した領域または位置の同定を容易にすることができる。

Ｉ型ＣＲＩＳＰＲ系（例えば、大腸菌カスケード）からのｃｒＲＮＡを操作のために選択することができる。ｃｒＲＮＡ配列をｉｎｓｉｌｉｃｏで操作して、以下の領域の１つまたはそれ以上から選択される領域中の核酸配列に１つまたはそれ以上の塩基変化（例えば、置換、変化、突然変異、欠失、および／または挿入）を導入することができる：スペーサーの５’（５’ハンドル）、スペーサーエレメント、Ｉ型ＣＲＩＳＰＲリピートステム配列、またはＩ型ＣＲＩＳＰＲリピートステム配列の３’（３’ハンドル）の核酸配列。

また、塩基変化を使用して、ｃｒＲＮＡ領域のいずれかの水素塩基対相互作用にミスマッチを導入するか、または２つの塩基の置換により代替的な水素塩基対相互作用を導入する塩基対突然変異を導入することができ、その際、代替的な水素塩基対相互作用は、本来の水素塩基対相互作用と異なる（例えば、本来の水素塩基対相互作用はワトソン−クリック塩基対形成であり、２つの塩基の置換は逆フーグスティーン塩基対を形成する）。また、塩基の置換を用いて、ｃｒＲＮＡ骨格内に水素塩基対相互作用を導入することができる。

ｃｒＲＮＡの領域を独立して操作して、ｃｒＲＮＡ骨格内に二次構造エレメントを導入することができる。そのような二次構造エレメントには、以下が含まれるが、それに限定されるわけではない：ステム−ループエレメント、ステムエレメント、シュードノット、およびリボザイム。さらに、ｃｒＲＮＡ骨格を操作して、５’末端、３’末端、またはｃｒＲＮＡ内部のいずれかでの欠失により、ｃｒＲＮＡ骨格の部分を欠失させることができる。代替的な骨格構造もまた導入することができる。

ｉｎｓｉｌｉｃｏ設計されたｃｒＲＮＡ配列を合成のために商業製造業者に提供することができる。

操作されたｃｒＲＮＡが個別のカスケードサブユニットタンパク質（すなわち、Ｃａｓ６、Ｃａｓ５など）による結合を支援する、またはカスケードタンパク質複合体の完全形成を支援する、またはヌクレアーゼ（例えば、Ｃａｓ３）の動員によりカスケード複合体の形成および二本鎖ＤＮＡ標的配列の改変を支援する能力について、それらの操作されたｃｒＲＮＡを評価することができる。個別のカスケードサブユニットタンパク質へのｃｒＲＮＡの結合およびカスケードタンパク質複合体の組み立ては、Ｊｏｒｅ、Ｍ．ら、ＮａｔｕｒｅＳｔｒｕｃｔｕｒａｌ＆ＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ１８：５２９〜５３６（２０１１年）に類似の方法でナノ−ＥＳＩ質量分析により評価することができる。ヌクレアーゼの動員による二本鎖ＤＮＡ標的配列のｃｒＲＮＡおよびカスケードタンパク質複合体による改変の生化学的特徴づけを、実施例６および７に記載される方法と類似の方法で実行することができる。ヌクレアーゼの動員によりカスケード複合体の形成および二本鎖ＤＮＡ標的配列の改変を支援することができる操作されたｃｒＲＮＡを、実施例８Ａ、実施例８Ｂ、実施例８Ｃ、および実施例８Ｄに記載される方法を用いて細胞における活性について検証することができる。

ＤＮＡ標的結合配列を含むカスケード複合体ガイドのスクリーニング
本実施例は、ヒトｇＤＮＡ（ｇＤＮＡ）に存在するＤＮＡ標的配列を改変するため、およびそれらの部位での切断活性のレベルを測定するための本発明のＩ型ＣＲＩＳＰＲタンパク質およびＩ型ガイドｃｒＲＮＡの使用を例証するものである。

標的部位（ＤＮＡ標的配列）を、最初にｇＤＮＡから選択することができる。Ｉ型ガイドｃｒＲＮＡを設計して、選択された配列を標的化することができる。アッセイ（例えば、実施例７に記載）を行って、ＤＮＡ標的配列の切断レベルを決定することができる。

Ａ．ｇＤＮＡからのＤＮＡ標的配列の選択
カスケードタンパク質複合体（例えば、大腸菌Ｉ−Ｅ型カスケード）についてのＰＡＭ配列（例えば、ＡＴＧ）を、選択されたゲノム領域内に同定することができる。

３’がＡＴＧＰＡＭ配列に隣接する１つまたはそれ以上のカスケードＤＮＡ標的配列（例えば、３２ヌクレオチド長）を同定することができる。

核酸標的配列の選択基準は、以下を含むことができるが、それに限定されるわけではない：ゲノム中の他の領域との相同性；Ｇ−Ｃ含量のパーセント；融解温度；スペーサー内のホモポリマーの存在；２つの配列の間の距離；および当業者に公知の他の基準。

カスケードＤＮＡ標的配列とハイブリダイズするＤＮＡ標的結合配列をガイドｃｒＲＮＡ中に組み入れることができる。ガイドｃｒＲＮＡ構築物の核酸配列が、典型的には商業製造業者に提供され、商業製造業者によって合成される。

本明細書に記載されるガイドｃｒＲＮＡをコグネイトＩ型カスケードタンパク質複合体と共に使用して、ｃｒＲＮＡ／カスケードタンパク質複合体を形成させることができる。

Ｂ．切断パーセンテージおよび特異性の決定
ガイドｃｒＲＮＡと関係するｉｎｖｉｔｒｏ切断パーセンテージおよび特異性（すなわち、オフターゲット結合の量）は、例えば、実施例７に記載される切断アッセイを用いて決定し、以下のように比較することができる：

（１）単一のＤＮＡ標的配列だけが同定される、またはガイドｃｒＲＮＡのために選択される場合、ＤＮＡ標的配列のそれぞれについて切断パーセンテージおよび特異性を決定することができる。そう望む場合、ガイドｃｒＲＮＡを操作すること、またはエフェクタータンパク質／エフェクタータンパク質結合配列を導入してガイドｃｒＲＮＡもしくはカスケードサブユニットタンパク質を操作すること、またはリガンド／リガンド結合部分を導入してガイドｃｒＲＮＡもしくはカスケードサブユニットタンパク質を操作することを含むが、それに限定されるわけではない方法を用いるさらなる実験で切断パーセンテージおよび／または特異性を変更することができる。

（２）複数のＤＮＡ標的配列が同定される、またはガイドｃｒＲＮＡのために選択される場合、切断アッセイから得られる切断パーセンテージのデータおよび部位特異性のデータを、標的結合配列を含む異なるＤＮＡの間で比較して、所望の切断パーセンテージおよび特異性を有するＤＮＡ標的配列を同定することができる。切断パーセンテージのデータおよび特異性のデータは、多様な適用のための選択の基になる判定基準を提供する。例えば、いくつかの状況では、ガイドｃｒＲＮＡの活性が、最も重要な要因の場合がある。他の状況では、切断部位の特異性が、切断パーセンテージよりも比較的重要な場合がある。そう望む場合、ガイドｃｒＲＮＡを操作すること、エフェクタータンパク質／エフェクタータンパク質結合配列を導入してガイドｃｒＲＮＡもしくはカスケードサブユニットタンパク質を操作すること、またはリガンド／リガンド結合部分を導入してガイドｃｒＲＮＡもしくはカスケードサブユニットタンパク質を操作することを含むが、それに限定されるわけではない方法を用いるさらなる実験で切断パーセンテージおよび／または特異性を変更することができる。

ｉｎｖｉｔｒｏ分析に代替的にまたは追加的に、ガイドｃｒＲＮＡの細胞内切断パーセンテージおよび特異性を、例えば実施例８Ｃおよび実施例８Ｄに記載される方法を用いて得て、以下のように比較することができる：

（１）単一のＤＮＡ標的配列だけが同定される、またはガイドｃｒＲＮＡのために選択される場合、ＤＮＡ標的配列のそれぞれについての切断パーセンテージおよび特異性を決定することができる。そう望む場合、ガイドｃｒＲＮＡを操作すること、またはエフェクタータンパク質／エフェクタータンパク質結合配列を導入してガイドｃｒＲＮＡもしくはカスケードサブユニットタンパク質を操作すること、またはリガンド／リガンド結合部分を導入してガイドｃｒＲＮＡもしくはカスケードサブユニットタンパク質を操作することを含むが、それに限定されるわけではない方法を用いるさらなる実験で切断パーセンテージおよび／または特異性を変更することができる。

（２）複数のＤＮＡ標的配列が同定される、またはガイドｃｒＲＮＡのために選択される場合、切断アッセイから得られる切断パーセンテージのデータおよび部位特異性のデータを、標的結合配列を含む異なるＤＮＡの間で比較して、所望の切断パーセンテージおよび特異性を有するＤＮＡ標的配列を同定することができる。切断パーセンテージのデータおよび特異性のデータは、多様な適用のための選択の基になる判断基準を提供する。例えば、いくつかの状況では、ガイドｃｒＲＮＡの活性が、最も重要な要因の場合がある。他の状況では、切断部位の特異性が、切断パーセンテージよりも比較的重要な場合がある。そう望む場合、ガイドｃｒＲＮＡを操作すること、エフェクタータンパク質／エフェクタータンパク質結合配列を導入してガイドｃｒＲＮＡもしくはカスケードサブユニットタンパク質を操作すること、またはリガンド／リガンド結合部分を導入してガイドｃｒＲＮＡもしくはカスケードサブユニットタンパク質を操作することを含むが、それに限定されるわけではない方法を用いるさらなる実験で切断パーセンテージおよび／または特異性を変更することができる。

効率的なＦｏｋＩ−カスケード複合体のゲノム編集のためにＦｏｋＩ−Ｃａｓ８リンカーの組成およびスペーサー間距離を変動させること
本実施例は、ＦｏｋＩ−Ｃａｓ８および様々な長さのリンカーポリペプチドを含む複数の融合タンパク質の設計および試験のみならず、効率的なゲノム編集のためにスペーサー間距離を変動させる効果を例証する。

Ａ．標的細胞内にトランスフェクトすべきＦｏｋＩ融合タンパク質を含む大腸菌Ｉ−Ｅ型カスケード複合体構成要素をコードするベクターの産生
２つの異なる遺伝子：ＡＤＡＭＴＳＬ１およびＰＣＳＫ９またはその近くでヒトゲノム中の座位のセットを標的化するために最小ＣＲＩＳＰＲアレイを設計した。スペーサー間距離は、２ｂｐ刻みで１４〜６０ｂｐの範囲であった。各スペーサー間距離について４つの標的を設計した。標的は、ＡＡＧまたはＡＴＧのいずれかのＰＡＭ配列に隣接していた。実施例９Ａに記載されるように配列番号４５４を用いて「リピート−スペーサー−リピート−スペーサー−リピート」配列を含むガイドのためのコーディング配列をクローニングした。配列番号６２５〜配列番号８１６は、最小ＣＲＩＳＰＲアレイを生成するために使用されるオリゴヌクレオチド配列の全セットについての配列を提供するものである。

ＦｏｋＩ−カスケードＲＮＰサブユニットタンパク質構成要素をコードする遺伝子を、哺乳動物細胞における送達および発現を可能にするためのＣＭＶプロモーター；２Ａウイルスペプチド「リボソームスキップ」配列を介して連結したｃａｓ遺伝子；３０−ａａリンカー（配列番号４５５）により結びついたＦｏｋＩおよびＣａｓ８を含む融合タンパク質を含むベクターにクローニングした。様々な長さおよびアミノ酸組成の追加的なリンカーポリペプチド配列を設計し、これらを使用してこれらのベクター中のＣａｓ８タンパク質にＦｏｋＩを結びつけた。追加的なリンカーポリペプチド配列を表４３に挙げる。

Ｂ．ＦｏｋＩ−カスケードＲＮＰ複合体構成要素をコードするベクターのトランスフェクション
トランスフェクション条件は、本質的に実施例８Ｂに記載されるものに以下の改変を加えたものであった。ヌクレオフェクションの前に、プラスミドベクター溶液５μｌを９６ウェルプレートの個別のウェルに移した。各ウェルは、ＦｏｋＩ−カスケードＲＮＰ複合体サブユニットタンパク質構成要素をコードするプラスミド２．４μｇおよび最小ＣＲＩＳＰＲアレイをコードするプラスミド約１〜２μｇを含んでいた。

Ｃ．トランスフェクトされた細胞からのｇＤＮＡのディープシークエンシング
本質的に実施例８Ｃに記載されるものに以下の改変を加えてディープシークエンシングを行った。実施例８Ｃの表３６からのプライマーＹおよびＺの代わりに、標的特異的プライマーは配列番号８２５〜配列番号１０１６であった。

Ｄ．ディープシークエンシングデータの解析
本質的に実施例８Ｄに記載されるようにディープシークエンシングデータの解析を行った。図３１Ａおよび図３１Ｂは、データ解析の結果を示す。図３１Ａおよび図３１Ｂにおいて、ゲノム編集パーセントをＦｏｋＩ−Ｃａｓ８リンカーの種類（図３１Ａ、図３１Ｂ、縦軸１４〜６０ＡＡ）およびスペーサー間距離（ｎ＝１）に対して示す（図３１Ａ、図３１Ｂ、横軸、スペーサー間距離５〜５０ｂｐ）。図３１Ａにおいて、右側の灰色目盛の縦棒は、インデルのパーセンテージである。図３１Ｂにおいて、セル内の値は、インデルのパーセントである。データの初期解析により、１７および２０アミノ酸のＦｏｋＩ−Ｃａｓ８リンカー（それぞれ配列番号８２１および配列番号８２２）ならびに約２６ｂｐおよび約３０〜３２ｂｐのスペーサー間距離でゲノム編集が最高であったことが示された。データを再処理し、１０００未満の配列リードを有するサンプルは、低い被覆率が原因で誇張された編集値を含むおそれがあるので除去した（関連するサンプルのすべてが＞１０００のリードを含んだ部位だけを保持した）。図３１Ａおよび図３１Ｂに示されるこのデータにより、１７および２０アミノ酸のＦｏｋＩ−Ｃａｓ８リンカー（それぞれ配列番号８２１および配列番号８２２）ならびに約３０〜３２ｂｐのスペーサー間距離でゲノム編集が最高であったことが示された。したがって、ＦｏｋＩ−Ｃａｓ８融合タンパク質のスペーサー間距離およびリンカーポリペプチド長を変動させることにより、Ｆｏｋ１−Ｃａｓ８融合タンパク質を含むＩ型ＣＲＩＳＰＲ−Ｃａｓ複合体を使用する効率的なゲノム編集が達成された。リンカーポリペプチドのアミノ酸組成を本明細書に述べる。

ゲノム編集のためのカスケード相同体の同定
本実施例は、ゲノム編集の効率を評価するための複数の相同カスケード複合体の設計および試験を例証する。

Ａ．相同カスケード複合体を用いた試験のための部位の同定
追加的な相同カスケード複合体を試験するための部位のパネルを同定した。具体的には、最小ＣＲＩＳＰＲアレイを設計して、３０ｂｐのスペーサー間距離を有し、ＡＡＧまたはＡＴＧのいずれかのＰＡＭ配列が隣接したヒトゲノム中の座位のセットを標的化した。実施例９Ａに記載される方法に従って配列番号４５４を用いて「リピート−スペーサー−リピート−スペーサー−リピート」配列を含むガイドポリヌクレオチドをクローニングした。最小ＣＲＩＳＰＲアレイを生成するために使用されるオリゴヌクレオチド配列の全セットを配列番号１０１７〜配列番号１１３０（Ｈｓａ３３Ｆ、配列番号１０１７、およびＨｓａ３３Ｒ、配列番号１０７４は、１つの対を例示する）として示す。ＴＲＡＣ座位を標的化するガイドを含む陽性対照を含めた（配列番号４５４）。

哺乳動物細胞における送達および発現を可能にするためのＣＭＶプロモーター；２Ａウイルスペプチド「リボソームスキップ」配列を介して連結したｃａｓ遺伝子；３０−ａａリンカー（配列番号４５５）により結びついたＦｏｋＩおよびＣａｓ８を含む融合タンパク質を含むＦｏｋＩ−カスケードＲＮＰサブユニットタンパク質構成要素をコードする遺伝子をベクター中にクローニングした。

Ｂ．ＦｏｋＩ−カスケードＲＮＰ複合体構成要素をコードするベクターのトランスフェクション
トランスフェクション条件は、本質的に実施例８Ｂに記載されるものに以下の改変を加えて行った。ヌクレオフェクションの前に、プラスミドベクター溶液５μｌを９６ウェルプレートの個別のウェルに移した。各ウェルは、ＦｏｋＩ−カスケードＲＮＰサブユニットタンパク質構成要素をコードするプラスミド３μｇおよび最小ＣＲＩＳＰＲアレイをコードするプラスミド０．３μｇを含んでいた。

Ｃ．トランスフェクトされた細胞からのｇＤＮＡのディープシークエンシング
本質的に実施例８Ｃに記載されるものに以下の改変を加えてディープシークエンシングを行った。実施例８Ｃの表３６からのプライマーＹおよびＺの代わりに、本実施例に使用される標的特異的プライマーは、配列番号１１３１〜配列番号１２４４であった。

Ｄ．ディープシークエンシングデータの解析
ディープシークエンシングデータの解析を本質的に実施例８Ｄに記載されるように行った。図３２は、データ解析の結果を示す。図３２において、ゲノム編集パーセント（図３２、縦軸、編集％）を実施例８Ａからの標的Ｈｓａ０７（ｎ＝３）に加えて５８個の試験部位に対してプロットする（図３２、横軸、「標的」；これらの最小ＣＲＩＳＰＲアレイを生成するために使用されるオリゴヌクレオチド配列を上述する）。図３２に示すように、編集は、約６％〜検出限界未満の範囲であった。これらのデータから、ゲノム編集のための相同カスケード複合体を試験するためにＡＡＧＰＡＭを有する８つの部位のパネル（Ｈｓａ０７ならびに以下の標的Ｈｓａ３７、Ｈｓａ４３、Ｈｓａ４６、Ｈｓａ６０、Ｈｓａ７７、Ｈｓａ８８、およびＨｓａ１２６に対応する標的１、３〜５、１０、１３、および１６）を選択した。

Ｅ．ゲノム編集のためにＦｏｋＩヌクレアーゼを用いて試験するための相同カスケード複合体の同定
異なるＩ型系からのＣａｓ８タンパク質配列を、ｐｓｉ−ＢＬＡＳＴｐのためのクエリとして使用して、相同体選択のための系統樹を生成した。具体的には、フソバクテリウム・ヌクレアタム（Ｆｕｓｏｂａｃｔｅｒｉｕｍｎｕｃｌｅａｔｕｍ）（ＷＰ＿００８７９８９７８．１）からのＣａｓ８をＩ−Ｂ型のために使用し、バチルス・ハロデュランス（Ｂａｃｉｌｌｕｓｈａｌｏｄｕｒａｎｓ）（ＷＰ＿０１０８９６５１９．１）からのＣａｓ８をＩ−Ｃ型のために使用し、大腸菌（ＷＰ＿００１０５０４０１．１）からのＣａｓ８をＩ−Ｅ型のために使用し、緑膿菌（Ｐｓｅｕｄｏｍｏｎａｓａｅｒｕｇｉｎｏｓａ）（ＷＰ＿００３１３９２２４．１）からのＣａｓ８をＩ−Ｆ型のために使用し、シェワネラ・プトレファシエンス（Ｓｈｅｗａｎｅｌｌａｐｕｔｒｅｆａｃｉｅｎｓ）（ＷＰ＿０１１９１９２２６．１）からのＣａｓ５をＩ−Ｆｖ２型のために使用した。

次に、各Ｉ型系について数千個の相同体が同定されるまでｐｓｉ−ＢＬＡＳＴｐを複数回繰り返した。この情報から、ｉｎｔｅｒａｃｔｉｖｅＴｒｅｅｏｆＬｉｆｅオンラインソフトウェア（ｉＴＯＬ、ｉｔｏｌ．ｅｍｂｌ．ｄｅ／ｌｏｇｉｎ．ｃｇｉからアクセス可能）を使用して系統樹を築いた。様々な枝の長さを用いてクレードを自動的に崩壊させた後に系統樹を目視検査した。

次いで、主要クレードの範囲に入る生物のリストを出力し、選択のために手作業で検査した。このステップでは、Ｉ−Ｅ型内の１２個の相同体と、Ｉ−Ｂ、Ｉ−Ｃ、Ｉ−Ｆ、およびＩ−Ｆｖ２型について２〜３つの代表的な相同体との両方に対して系統樹の異なる領域からサンプリングされた相同体を選択することに重きを置いた。上記の系統発生解析に基づきｃａｓ８およびｃａｓ５候補をＮＣＢＩに入力し、内因性宿主細菌内のゲノム状況を、ＮＣＢＩのゲノムグラフィックブラウザー内で目視検査した。（１）３７℃で生育する生物中に見出された；（２）それらのｃａｓ遺伝子オペロンが無傷であり、予想されるカスケードサブユニットタンパク質をコードする遺伝子、ｃａｓ３遺伝子、および無傷の獲得遺伝子（すなわち、ｃａｓ１およびｃａｓ２）のすべてを有した；（３）それらのｃａｓ遺伝子オペロンが１つまたはそれ以上のＣＲＩＳＰＲアレイに隣接した；ならびに（４）それらのＣＲＩＳＰＲアレイが＞１０個のスペーサーを含んでいた場合にかぎり、カスケード相同体を選択した。いくつかの相同体について、ＣＲＩＳＰＲｆｉｎｄｅｒプログラム（ｃｒｉｓｐｒ．ｉ２ｂｃ．ｐａｒｉｓ−ｓａｃｌａｙ．ｆｒ／Ｓｅｒｖｅｒ／）を使用して推定上のＰＡＭ配列を同定した。上記基準に基づき、表４４に示される２２個の相同カスケード複合体を選択した。

Ｆ．標的細胞へのトランスフェクションのための２２個の互いに異なる種からのＦｏｋＩ−カスケードＲＮＰ構成要素をコードするベクターの産生
各相同体からの各ｃａｓ遺伝子についての配列を、ＦｏｋＩヌクレアーゼおよびＣａｓ８を含む融合タンパク質を含んでいた多シストロン性構築物の部分として合成した。各Ｉ−Ｅ型カスケード複合体相同体について、適切なＰＡＭ配列を有する座位を標的化する約７〜８つのガイドのセットを生成した。Ｉ−Ｂ、Ｉ−Ｃ、Ｉ−Ｆ、およびＩ−Ｆｖ２型カスケード相同体毎に、適切なＰＡＭ配列を有する座位を標的化する約２〜７つのガイドのセットを生成した。各カスケード複合体相同体系は、それらのコグネイトガイド（配列番号１２６７〜配列番号１２８８）を処理するためにユニークなリピート配列を必要とした。「リピート−スペーサー−リピート−スペーサー−リピート」配列を含むガイドについてのコーディング配列を、配列番号４５４について実施例９Ａに記載される方法を使用してクローニングした。５’末端でオリゴヌクレオチドをリン酸化し、オーバーハング配列を付加して、適切なリピート配列を有するプラスミドベクターへのクローニングを可能にした。２２個のカスケード複合体相同体のための最小ＣＲＩＳＰＲアレイを生成するために使用したオリゴヌクレオチド配列の全セットを（配列番号１２８９〜配列番号１４００）として示す。

以下を含む、ＦｏｋＩ−カスケードＲＮＰサブユニットタンパク質構成要素をコードする遺伝子をベクターにクローニングした：哺乳動物細胞における送達および発現を可能にするためのＣＭＶプロモーター；２Ａウイルスペプチド「リボソームスキップ」配列を介して連結したｃａｓ遺伝子；３０−ａａリンカーにより結びついたＦｏｋＩおよびＣａｓ８を含む融合タンパク質。

Ｇ．ＦｏｋＩ−カスケードＲＮＰ複合体をコードするプラスミドのトランスフェクション
トランスフェクション条件は、本質的に実施例８Ｂに記載されるものに以下の改変を加えたものであった。ヌクレオフェクションの前に、プラスミドベクター溶液５μｌを９６ウェルプレートの個別のウェルに移した。各ウェルは、ＦｏｋＩ−カスケードＲＮＰサブユニットタンパク質構成要素をコードするプラスミド１．５μｇおよび最小ＣＲＩＳＰＲアレイをコードするプラスミド約０．５〜１．５μｇを含んでいた。実験を三つ組で行い、実験は、陽性対照として８つの部位（実施例８ＡからのＨｓａ０７ならびに実施例１９Ｆおよび実施例１９ＧからのＨｓａ３７、Ｈｓａ４３、Ｈｓａ４６、Ｈｓａ６０、Ｈｓａ７７、Ｈｓａ８８、Ｈｓａ１２６）に標的化される大腸菌からのＦｏｋＩ−カスケードＲＮＰ複合体（配列番号４５５）を含んでいた。前述のように、以下のオリゴヌクレオチドを使用して、大腸菌陽性対照で使用される最小ＣＲＩＳＰＲアレイを生成した：Ｈｓａ３７（配列番号１０１９；配列番号１０７６）、Ｈｓａ４３（配列番号１０２４；配列番号１０８１）、Ｈｓａ４６（配列番号１０２７；配列番号１０８４）、Ｈｓａ６０（配列番号１０３７；配列番号１０９４）、Ｈｓａ７７（配列番号１０４５；配列番号１１０２）、Ｈｓａ８８（配列番号１０５０；配列番号１１０７）、Ｈｓａ１２６（配列番号１０７２；配列番号１１２９）。

Ｈ．トランスフェクトされた細胞からのｇＤＮＡのディープシークエンシング
ディープシークエンシングは、本質的に実施例８Ｃに記載されるものに以下の改変を加えて行った。実施例８Ｃの表３６からのプライマーＹおよびＺの代わりに、本実施例に使用される標的特異的プライマーは、配列番号１４０１〜配列番号１５１２であった。Ｉ−Ｅ型ＲＮＰ複合体と、Ｉ−Ｂ、Ｉ−Ｃ、Ｉ−Ｆ、およびＩ−Ｆｖ２型ＲＮＰ複合体とのどちらにも大腸菌Ｉ−Ｅ型カスケードを含む対照サンプルを比較のために含め、実施例８ＡからのＨｓａ０７および本実施例からのＨｓａ３７、Ｈｓａ４３、Ｈｓａ４６、Ｈｓａ６０、Ｈｓａ７７、Ｈｓａ８８、Ｈｓａ１２６に対応する標的特異的プライマーを用いてシークエンシングした。より具体的には、これらの標的のために以下の標的特異的増幅プライマーを使用した：Ｈｓａ３７（配列番号１１３３；配列番号１１９０）、Ｈｓａ４３（配列番号１１３８；配列番号１１９５）、Ｈｓａ４６（配列番号１１４１；配列番号１１９８）、Ｈｓａ６０（配列番号１１５１；配列番号１２０８）、Ｈｓａ７７（配列番号１１５９；配列番号１２１６）、Ｈｓａ８８（配列番号１１６４；配列番号１２２１）、Ｈｓａ１２６（配列番号１１８６；配列番号１２４３）。

Ｉ．ディープシークエンシングデータの解析
本質的に実施例８Ｄに記載されるようにディープシークエンシングデータの解析を行った。図３３Ａおよび図３３Ｂは、これらの実験からの結果を示す。図３３Ａにおいて、縦軸は、編集パーセント（図３３Ａ、編集％）であり、横軸の数字はＩ−Ｅ型相同体系に対応する配列番号である。Ｉ−Ｅ型ＦｏｋＩ−カスケード相同体の多くで編集が観察された（図３３Ａ）。シュードモナス属種Ｓ−６−２からのバリアントで最高の編集が観察され、一方、他の相同体（すなわち、サルモネラ・エンテリカ、ゲオテルモバクター属種ＥＰＲ−Ｍ、メタノセラ・アルボリザエＭＲＥ５０、およびＳ．サーモフィルス（ＮＤ０７株））は、大腸菌とほぼ等価の編集を示した。図３３Ｂでは、縦軸は編集パーセント（図３３Ｂ、編集％）であり、横軸の数字は、Ｉ−Ｂ、Ｉ−Ｃ、Ｉ−Ｆ、およびＩ−Ｆｖ２型相同体系に対応する配列番号である。Ｉ−Ｂ、Ｉ−Ｃ、Ｉ−Ｆ、およびＩ−Ｆｖ２型に由来するＦｏｋＩ−カスケードＲＮＰを用いた編集は、検出限界未満であった（図３３Ｂ）。

本実施例は、Ｉ型相同体をスクリーニングして、ゲノム編集能を提供するＩ型系を同定するための方法を提供するものである。追加的なＩ型相同体スクリーニングを実施例２２に記載する。

効率的なゲノム編集のためのシュードモナス属種Ｓ−６−２におけるＦｏｋＩ−Ｃａｓ８リンカー長およびスペーサー間距離の変動
本実施例は、ＦｏｋＩ−Ｃａｓ８および様々な長さのリンカーポリペプチドを含む複数の融合タンパク質の設計および試験、ならびにシュードモナス属種Ｓ−６−２のＩ−Ｅ型ＣＲＩＳＰＲ−Ｃａｓ系を用いた効率的なゲノム編集のためのスペーサー間距離を変動させる効果を例証する。

Ａ．標的細胞にトランスフェクトすべきＦｏｋＩ−カスケードＲＮＰ構成要素をコードするベクターの産生
最小ＣＲＩＳＰＲアレイを設計して、ヒトゲノムにおける座位のセットを標的化した。スペーサー間距離は、１ｂｐ刻みの２３〜３４ｂｐの範囲であった。各スペーサー間距離について８つの標的を設計し、標的はＡＡＧＰＡＭ配列に隣接した。３つのオリゴヌクレオチド（配列番号１５１３〜配列番号１５１５）および「リピート−スペーサー−リピート−スペーサー−リピート」配列をコードするユニークなプライマーを使用してＰＣＲベースの組み立て（オリゴ鋳型ＰＣＲ増幅）を有する最小ＣＲＩＳＰＲアレイを生成して、ＦｏｋＩ−カスケードの標的化を可能にした。最小ＣＲＩＳＰＲアレイを生成するためのユニークなオリゴヌクレオチド配列の全セットは配列番号１５１６〜配列番号１７０４であった。ＳＰＲＩｓｅｌｅｃｔ（登録商標（ＢｅｃｋｍａｎＣｏｕｌｔｅｒ、Ｐａｓａｄｅｎａ、ＣＡ）ビーズを本質的に製造業者の説明書に従って使用して、ＰＣＲで組み立てたガイドを精製し、濃縮した。

ＦｏｋＩ−カスケードＲＮＰサブユニットタンパク質構成要素をコードする遺伝子を、以下を含むベクターにクローニングした：哺乳動物細胞における送達および発現を可能にするためのＣＭＶプロモーター、２Ａ「リボソームスキップ」配列を介して連結したｃａｓ遺伝子、および３０−ａａリンカー（配列番号１７４８）でＣａｓ８に結合したＦｏｋＩ。様々な長さの追加的なリンカーのポリペプチド配列を設計し、ＦｏｋＩをＣａｓ８タンパク質に結びつけて融合タンパク質を形成させるために使用した。リンカーポリペプチド配列を表４５に挙げる。

Ｂ．ＦｏｋＩ−カスケードＲＮＰ複合体構成要素をコードするベクターのトランスフェクション
トランスフェクション条件は、以下の改変を加える以外、本質的に実施例８Ｂに記載されるように行った。ヌクレオフェクションの前に、プラスミドベクター溶液５μｌを９６ウェルプレートの個別のウェルに移した。各ウェルは、ＦｏｋＩ−カスケードＲＮＰタンパク質構成要素をコードするプラスミド５μｇおよび最小ＣＲＩＳＰＲアレイをコードする直鎖状ＰＣＲ産物約０．１〜０．５μｇを含んでいた。

Ｃ．トランスフェクトされた細胞からのｇＤＮＡのディープシークエンシング
ディープシークエンシングを、本質的に実施例８Ｃに記載されるように行った。実施例８Ｃの表３６からのプライマーＹおよびＺの代わりに、標的特異的プライマーは配列番号１７０５〜配列番号１８０３であった。

ディープシークエンシングデータの解析を、本質的に実施例８Ｄに記載されるように行った。図３４は、９５個の部位でのゲノム編集（図３４、縦軸「編集％」）を示す（ｎ＝１）。図３４において、横軸は塩基対単位のスペーサー間長に対応する（図３４、スペーサー間長（ｂｐ））。リンカー長を左から右に１７ＡＡ（図３４、白い棒線）、２０ＡＡ（図３４、斜め格子の棒線）、および３０ＡＡ（図３４、縞模様の棒線）の３つの棒グラフによって表した。編集は、約５０％（図３４、エラーバーは平均±１ｓ．ｄ．を示す）から検出限界未満の範囲であり、スペーサー間距離およびリンカーポリペプチド長と関係した。リンカーポリペプチドのアミノ酸組成を本明細書において述べる。約３０〜３３ｂｐのスペーサー間距離ならびに１７および２０アミノ酸のリンカーポリペプチド長は非常に効率的な編集を提供した。

本質的に本実施例に示されるものと同じプロトコールに従って、本発明を裏づけるものとして行われた追加的な実験からのデータを図４１Ａ、図４１Ｂ、および図４１Ｃに示す。これらの図において、縦軸は編集効率（％）であり、横軸はｂｐ単位のスペーサー間距離（２３〜３４ｂｐ）である。データは、３つのカスケード相同体バリアント、ＦｏｋＩ−Ｐｓｅカスケード（図４１Ａ）、ＦｏｋＩ−Ｅｃｏカスケード（図４１Ｂ）、およびＦｏｋＩ−Ｓｔｈカスケード（図４１Ｃ）についてのＦｏｋＩ−Ｃａｓ８リンカー長およびスペーサー間距離のスクリーニングを拡張したものである。編集効率パーセントを、１７ａａ、２０ａａ、および３０ａａ（図４１Ａ、図４１Ｂ、および図４１Ｃ：左から右に、１７ａａ、２０ａａ、および３０ａａ）のＦｏｋＩ−Ｃａｓ８リンカー長およびスペーサー間距離に対して表す。各点は、単一のゲノム部位を表し、スペーサー間距離１つあたり７〜８つの部位を試験した。平均を棒グラフに示す。これらのデータから分かるように、約３０〜３３ｂｐのスペーサー間距離ならびに１７、２０、および３０アミノ酸のリンカーポリペプチド長は、ＦｏｋＩ−Ｐｓｅカスケードのための効率的な編集を提供し、約３１〜３３ｂｐのスペーサー間距離ならびに１７、２０、および３０アミノ酸のリンカーポリペプチド長はＦｏｋＩ−Ｅｃｏカスケードのための効率的な編集を提供し、約２９〜３１ｂｐのスペーサー間距離ならびに１７、２０、および３０アミノ酸のリンカーポリペプチド長はＦｏｋＩ−Ｓｔｈカスケードのための効率的な編集を提供した。

ＦｏｋＩ−カスケードゲノム編集を可能にするためのＣａｓ３−ＦｏｋＩおよびＦｏｋＩ−Ｃａｓ８の利用
本実施例は、ＦｏｋＩのダイマー化を誘導して、ヒトゲノムにおける座位での二本鎖切断を生成するためのＣａｓ３−ＦｏｋＩおよびＦｏｋＩ−カスケードの使用を例証する（例えば、図１６Ａ、図１６Ｂ、および図１６Ｃ参照）。より具体的には、本実施例は、ゲノム編集効率に影響するための複数のＣａｓ３−ＦｏｋＩリンカーの組成および長さならびにＦｏｋＩ−Ｃａｓ８リンカーの組成および長さの設計ならびに試験を詳述する。

Ａ．標的細胞にトランスフェクトすべきＦｏｋＩ−Ｃａｓ３およびＦｏｋＩ−カスケードＲＮＰ構成要素をコードするベクターの産生
ヒトゲノムにおいてＡＡＧＰＡＭに隣接する３つの互いに異なる部位を標的化するために最小ＣＲＩＳＰＲアレイを設計する。ガイドによって方向付けされる大腸菌ＦｏｋＩ−カスケードダイマーを用いたスペーサー間編集を支援することが以前に示されたことから、ＦｏｋＩ−カスケード結合に許容性であることが公知である部位（例えば、Ｈｓａ３７、Ｈｓａ４３、およびＨｓａ４６）を選択する。

上記の実施例に記載されるＦｏｋＩ−カスケード系は、２つのＦｏｋＩカスケード複合体を使用したものであるので（例えば、図１５Ａ、図１５Ｂ、および図１５Ｃ参照）；第１の核酸標的部位を特定している第１のガイド配列および第２の核酸標的部位を特定している第２のガイド配列を使用することができる。Ｃａｓ３−ＦｏｋＩ−ＦｏｋＩ−カスケード系はＰＡＭを1つだけ必要とするので、核酸標的部位への機能的カスケード複合体の結合を促進するために「リピート−スペーサー−リピート」を含むガイドで十分なはずである。「リピート−スペーサー−リピート−スペーサー−リピート」を含むポリヌクレオチドもまた使用することができるが、典型的には本実施形態において、２つのスペーサー配列は同じ核酸標的配列へのカスケード複合体の結合を方向付ける；言い換えれば、２つのスペーサーは同じ配列を有することができる。ガイドを、配列番号４５４を用いて実施例９Ａに本質的に記載されるようにクローニングする。最小ＣＲＩＳＰＲアレイの生成のために以下のアニーリングされたオリゴヌクレオチドを使用する：Ｈｓａ３７（配列番号１０１９；配列番号１０７６）、Ｈｓａ４３（配列番号１０２４；配列番号１０８１）、およびＨｓａ４６（配列番号１０２７；配列番号１０８４）。

実施例９Ａに記載されるように、ＦｏｋＩ−カスケードＲＮＰタンパク質構成要素をコードする遺伝子を、ＣＭＶプロモーターを含むプラスミドベクターにクローニングして、哺乳動物細胞における送達および発現を可能にする。２Ａ「リボソームスキップ」配列を介してｃａｓ遺伝子を連結する。さらに、３０−ａａリンカー（配列番号４５５）でＦｏｋＩをＣａｓ８に融合する。様々な長さおよび組成の追加的なリンカー配列を設計し、ＦｏｋＩをＣａｓ８タンパク質に結びつけるために使用する。そのような配列の例を表４６に挙げる。

大腸菌からのＣａｓ３タンパク質を、３０−ａａリンカーを使用してＦｏｋＩにＣ末端で融合する。この融合物をＮ末端のＮＬＳ配列（配列番号１８０６）によりさらに操作する。様々な長さおよび組成の追加的なリンカー配列を設計し、ＦｏｋＩをＣａｓ３タンパク質に結びつけるために使用する（表４６および配列番号１８０４〜配列番号１８０７）。

Ｃａｓ３タンパク質のヘリカーゼまたはヌクレアーゼ活性が不活性された追加的なＣａｓ３−ＦｏｋＩ融合構築物を生成する（配列番号１８０８〜配列番号１８１５）。Ｃａｓ３タンパク質のＤ４５２ＡおよびＤ７５Ａ突然変異を作製することによって、それぞれヘリカーゼおよびヌクレアーゼ活性を障害する（例えば、Ｍｕｌｅｐａｔｉ、Ｓ．ら、Ｊ．Ｂｉｏｌ．Ｃｈｅｍ．２８８：２２１８４〜２２１９２（２０１３年）参照）。

Ｂ．ＦｏｋＩ−カスケードＲＮＰ複合体をコードするプラスミドのトランスフェクション
トランスフェクション条件は、実施例８Ｂに記載されるものに以下の改変を加えて行う。ヌクレオフェクションの前に、プラスミドベクター溶液５μｌを９６ウェルプレートの個別のウェルに移す。各ウェルは、以下の３つの構成要素を含む：ＦｏｋＩ−カスケードＲＮＰタンパク質構成要素のセットをコードするプラスミド３μｇ、Ｃａｓ３−ＦｏｋＩをコードするプラスミド３μｇ、および最小ＣＲＩＳＰＲアレイをコードするプラスミド０．５μｇ。９６ウェルプレートをマトリックスとして設定して、３つの構成要素のすべての組み合わせを提供する。

Ｃ．トランスフェクトされた細胞からのｇＤＮＡのディープシークエンシング
ディープシークエンシングは、以下の改変を加えて実施例８Ｃに記載されるように行う。実施例８Ｃの表３６からのプライマーＹおよびＺの代わりに本実施例に使用される標的特異的プライマーは、以下の通りである：配列番号１１３３および配列番号１１９０（Ｈｓａ３７標的部位）、配列番号１１３８および配列番号１１９５（Ｈｓａ４３標的部位）、ならびに配列番号１１４１および配列番号１１９８（Ｈｓａ４６標的部位）。

Ｄ．ディープシークエンシングデータの解析
ＦｏｋＩ−カスケード結合部位のＰＡＭ配列の約１ｂｐ〜約２５ｂｐ上流のインデルを集計することを除き、ディープシークエンシングデータの解析を実施例８Ｄに記載されるように行う。このようにして、もっとも効率的な編集を支援するＦｏｋＩ−Ｃａｓ８リンカー配列、Ｃａｓ３−ＦｏｋＩリンカー配列、およびＣａｓ３バリアントの組み合わせを決定することができる。

操作された相同体ＦｏｋＩ−カスケード複合体のスクリーニング
本実施例は、ゲノム編集の効率を評価するための異なる数のサブユニットを有する複数の相同カスケード複合体の設計および試験を例証する。本実施例は、実施例１９に記載される解析を拡張したものである。

Ａ．ＦｏｋＩ−カスケードＲＮＰ複合体について標的細胞にトランスフェクトすべきＤＮＡ鋳型構成要素の産生
最小ＣＲＩＳＰＲアレイを設計して、ヒトゲノム中のｇＤＮＡの反対鎖上の隣接座位に２つのＦｏｋＩ−カスケードＲＮＰ複合体を標的化した。ＦｏｋＩ−カスケード構築物は、３つまたは４つのいずれかの遺伝子を含む１１個の相同種のそれぞれに由来した：Ｆ．ヌクレアツム（Ｆ．ｎｕｃｌｅａｔｕｍ）（Ｆｎｕ、Ｉ−Ｂ型）、Ｃ．フェータス（Ｃ．ｆｅｔｕｓ）（Ｃｆｅ、Ｉ−Ｂ型）、Ｏ．スプラキニカス（Ｏ．ｓｐｌａｎｃｈｎｉｃｕｓ）（Ｏｓｐ、Ｉ−Ｂ型）、Ｂ．ハロデュランス（Ｂ．ｈａｌｏｄｕｒａｎｓ）（Ｂｈｅ、Ｉ−Ｃ型）、Ｄ．ブルガリス（Ｄｖｕ、Ｉ−Ｃ型）、コレラ菌（Ｖ．ｃｈｏｌｅｒａ）Ｌ１５株（Ｖｃｈ、Ｉ−Ｆ型）、Ｋ．オキシトカ（Ｋ．ｏｘｙｔｏｃａ）（Ｋｏｈ、Ｉ−Ｆ型）、緑膿菌（Ｐａｅ、Ｉ−Ｆ型）、Ｓ．プトレファシエンス（Ｓｐｕ、Ｉ−Ｆｖ２）、アシネトバクター（Ａｃｉ、Ｉ−Ｆｖ２型）、コレラ菌ＨＥ４８株（Ｖｃｈ＿ｖ２、Ｉ−Ｆｖ２型）。

第１および第２の操作されたクラス１Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体を設計し、その際、第１のガイドポリヌクレオチドは、第１の核酸標的配列と結合することが可能な第１のスペーサーを含み、第２のガイドポリヌクレオチドは第２の核酸標的配列と結合することが可能な第２のスペーサーを含み、第１の核酸標的配列のＰＡＭおよび第２の核酸標的配列のＰＡＭは１４塩基対と６０塩基対との間のスペーサー間距離を有した。ＰＡＭがガイドＲＮＡ標的配列に対して内側を向く（すなわち、ＰＡＭ−イン配向）ように２つの操作されたクラス１Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体を配向させた。ＰＡＭ配列はＩ−Ｂ型についてＴＣＡ、Ｉ−Ｃ型についてＴＴＣ、Ｉ−Ｆ、Ｉ−Ｆｖ２型についてＣＣであった（Ｉ−Ｆ型およびＩ−Ｆｖ２型はＣＲＩＳＰＲアレイにおいて異なるリピート配列を有する；表４７および表４４参照）。

ＦｏｋＩ−カスケードＲＮＰ複合体の標的化を可能にするための３つのオリゴヌクレオチドおよび「リピート−スペーサー−リピート−スペーサー−リピート」配列をコードするユニークなプライマーを使用して、本質的に本明細書（例えば、実施例２０Ａ；ならびにまた図４２Ａおよび図４２Ｂ）に記載されるように、ＰＣＲベースのオリゴ鋳型アセンブリーを用いて最小ＣＲＩＳＰＲアレイを生成した。Ｉ−Ｂ型および１−Ｃ型のために非ユニバーサルリバースオリゴヌクレオチドプライマーを使用した。本質的に実施例２０Ａに記載されるようにＳＰＲＩｓｅｌｅｃｔ（登録商標）ビーズ（ＢｅｃｋｍａｎＣｏｕｌｔｅｒ、Ｐａｓａｄｅｎａ、ＣＡ）を使用して、ＰＣＲで組み立てた最小ＣＲＩＳＰＲアレイを精製し、濃縮した。

操作されたクラス１Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体において、ＦｏｋＩコーディング配列をＩ−Ｂ、Ｉ−Ｃ、Ｉ−Ｆ型複合体についてＣａｓ８のＮ末端に、およびＩ−Ｆｖ２型複合体についてＣａｓ５のＮ末端に融合させた。ＦｏｋＩ−カスケードＲＮＰタンパク質構成要素をコードする遺伝子を、以下を含むベクターにクローニングした（表４４および表４７参照）：哺乳動物細胞における送達および発現を可能にするためのＣＭＶプロモーター、２Ａ「リボソームスキップ」配列を介して連結したｃａｓ遺伝子、および３０−ａａリンカーでＣａｓ８（またはＩ−Ｆｖ２型相同体の場合は３０−ａａリンカーでＣａｓ５）に結合したＦｏｋＩモノマー。

Ｂ．操作されたＦｏｋＩ−カスケードＲＮＰ複合体構成要素をコードするベクターのトランスフェクション
トランスフェクション条件は、本質的に実施例８Ｂに記載されるものに以下の改変を加えて行った。ヌクレオフェクションの前に、ＤＮＡ鋳型を含有する溶液５μＬを９６ウェルプレートの個別のウェルに移し、その際ウェルは、相同ＦｏｋＩ−カスケード複合体の構成要素をコードする各プラスミド約１．５μｇおよび最小ＣＲＩＳＰＲアレイをコードする直鎖状ＰＣＲ産物０．４μｇを含んでいた。

Ｃ．トランスフェクトされた細胞からのｇＤＮＡのディープシークエンシング
ディープシークエンシングを、本質的に実施例８Ｃに記載されるように行った。しかし、実施例８Ｃの表３６からのプライマーＹおよびＺの代わりに、異なる標的特異的プライマーを使用した。図４３は、データ解析の結果を示す。図４３において、ゲノム編集パーセントは、ＦｏｋＩ−カスケード相同体バリアント（図４３、横軸、１１個の相同体バリアントは上記の略語によって特定され、横軸に同じ順序で出現する）およびスペーサー間距離（図４３、縦軸、１４〜６０ｂｐ）に対して示し；右側の灰色の目盛の縦棒はインデルのパーセンテージである。所与のスペーサー間距離での各測定値は、４つの標的部位（標的部位1つあたりｎ＝１）にわたる平均編集を表す。操作されたＦｏｋＩ−カスケードオーソログ複合体の大部分での編集は、試験された標的部位にわたり検出限界未満であり、一方、操作されたコレラ菌Ｌ１５株（Ｉ−Ｆ型）ＦｏｋＩ−カスケード複合体を用いた編集は、検出限界未満から最大で約２％のインデルの範囲であり、２６ｂｐと２８ｂｐとの間のスペーサー間距離で最高の編集が観察された。操作されたコレラ菌ＨＥ４８株（Ｉ−Ｆｖ２型）ＦｏｋＩ−カスケード複合体で、４２ｂｐと４６ｂｐとの間のスペーサー間距離でもまた、検出限界未満〜約１．５％の範囲の編集が観察された。

本実施例のデータは、ゲノム編集に効果的な相同カスケード複合体を同定するために本明細書に記載される方法を有効に適用できることを例証している。

細胞における欠失長を制限するためのｍＣａｓ３タンパク質の使用
本実施例は、結果としてもたらされたＣａｓ３誘導欠失が、ゲノム編集（例えば、ヒト細胞における）に使用するためにｗｔＣａｓ３タンパク質を用いて生成される欠失よりも短いようにＣａｓ３タンパク質を突然変異させる方法を例証する。

Ａ．カスケードおよびＣａｓ３ＤＮＡ鋳型構成要素の産生
ヒトゲノム中のｃｈｒ２（ＨＺＧＪ遺伝子）上にＡＡＧＰＡＭを有するゲノム座位に大腸菌カスケード（Ｅｃｏカスケード）ＲＮＰ複合体を標的化するために最小ＣＲＩＳＰＲアレイを設計した。次に、３つのオリゴヌクレオチド（配列番号１５１３〜配列番号１５１５；実施例２０Ａ）および「リピート−スペーサー−リピート−スペーサー−リピート」配列をコードするユニークなプライマーを使用するＰＣＲベースのアセンブリーにより最小ＣＲＩＳＰＲアレイを生成して、ＥｃｏカスケードＲＮＰ標的化を可能にした（配列番号１８１８）。結果としてもたらされたアンプリコンは、最小ＣＲＩＳＰＲアレイの発現を推進するｈｕ６プロモーターを含有する。この最小ＣＲＩＳＰＲアレイのために、両方のスペーサー配列について同一の配列を使用した。ＰＣＲで組み立てられた最小ＣＲＩＰＳＲアレイを、ＳＰＲＩｓｅｌｅｃｔ（登録商標）ビーズ（ＢｅｃｋｍａｎＣｏｕｌｔｅｒ、Ｐａｓａｄｅｎａ、ＣＡ）を使用して精製し、濃縮した。

ＤＮＡヌクレアーゼ活性を維持しながらＤＮＡに対する突然変異タンパク質のＤＮＡトランスロケーションプロセッシビティ（すなわち、ＤＮＡの長さに沿った移動）を減少させるために、大腸菌Ｃａｓ３（ＥｃｏＣａｓ３）突然変異バリアントのパネルを設計した。

一本鎖ＤＮＡ基質に結合したサーモビフィダ・フスカ（Ｔｈｅｒｍｏｂｉｆｉｄａｆｕｓｃａ）Ｃａｓ３の結晶構造（Ｈｕｏ、Ｙ．ら、Ｎａｔ．Ｓｔｒｕｃｔ．Ｍｏｌ．Ｂｉｏｌ．（９）：７７１〜７７７（２０１４年））、機能的タンパク質ドメインの位置、および他のＣａｓ３オーソログとの相同性を参照し、ＥｃｏＣａｓ３（大腸菌（Ｐ３８０３６）Ｃａｓ３アミノ酸配列：ＵｎｉＰｒｏｔＫＢ − Ｐ３８０３６（ＣＡＳ３＿ＥＣＯＬＩ））における２４個の互いに異なる突然変異のセットを作製して、ヘリカーゼドメインにおけるＡＴＰ結合／加水分解領域（すなわち、Ｇ３１７Ａ、Ｓ３１８Ａ、Ｇ３１９Ａ、Ｋ３２０Ｎ、Ｔ３２１Ｎ、Ｑ２９７Ｅ、Ｄ４５２Ｅ、Ｅ４５３Ｎ、Ｒ６６２Ａ、Ｒ６６５Ｑ）またはｓｓＤＮＡループ結合／ヘリカーゼドメインのｓｓＤＮＡ経路保存領域（すなわち、Ｔ３４６Ａ、Ｑ３４７Ｎ、Ｇ３７５Ａ、Ｋ４１２Ｇ、Ｔ４２３Ａ、Ｄ４２５Ｈ、Ｑ４２６Ｔ、Ｈ６０１Ａ、Ａ６０２Ｖ、Ｒ６０３Ｑ、Ｒ６０９Ｓ、Ｔ６３５Ａ、Ｑ６３６Ａ、Ｑ６４０Ｈ）のいずれかを調節した。表４８は、ＥｃｏＣａｓ３野生型タンパク質および突然変異型タンパク質、配列（ヌクレオチド配列）をコードするプラスミド、ならびに対応するアミノ酸配列を挙げるものである。

ＥｃｏカスケードＲＮＰタンパク質構成要素をコードする遺伝子ならびに野生型（ｗｔ）および突然変異型ＥｃｏＣａｓ３遺伝子を、ＣＭＶプロモーターを含むベクターにクローニングして、哺乳動物細胞における送達および発現を可能にした。ＥｃｏカスケードＲＮＰｃａｓ遺伝子を、２Ａ「リボソームスキップ」配列を介して連結し、コードされるタンパク質を核に方向づけるためにすべての遺伝子はＮ末端ＮＬＳ配列を含んでいた（Ｅｃｏカスケード多シストロン性プラスミド、ヌクレオチド配列の配列番号１８７１、多シストロン性アミノ酸配列１８７２）。

Ｂ．操作されたＥｃｏカスケードＲＮＰ、野生型ＥｃｏＣａｓ３タンパク質、および突然変異型ＥｃｏＣａｓ３タンパク質をコードするベクターのトランスフェクション
トランスフェクション条件を、本質的に実施例８Ｂに記載されるものに以下の改変を加えて行った。ヌクレオフェクションの前に、ＤＮＡ鋳型を含有する溶液６μＬを９６ウェルプレートの個別のウェルに移し−ウェルは、Ｅｃｏカスケード複合体タンパク質をコードするプラスミド３μｇ、野生型または突然変異型ＥｃｏＣａｓ３タンパク質をコードするプラスミド１μｇ、および最小ＣＲＩＳＰＲアレイをコードする直鎖状ＰＣＲ産物０．２μｇを含んだ。トランスフェクションの約４日後にｇＤＮＡを回収した。

Ｃ．トランスフェクトされた細胞からのｇＤＮＡのディープシークエンシング
ディープシークエンシングを、本質的に実施例８Ｃに記載されるように行った。しかし、実施例８Ｃの表３６からのプライマーＹおよびＺの代わりに、標的特異的プライマーは配列番号１８７３〜配列番号１８７４であり；また、ＭｉＳｅｑ試薬キットｖ３、６００サイクル（Ｉｌｌｕｍｉｎａ、ＳａｎＤｉｅｇｏ、ＣＡ）を使用した。ディープシークエンシングデータの解析を、本質的に実施例８Ｄに記載されるものに以下の改変を加えて行った：（１）少なくとも１つのリードを有し、アンプリコン（アンプリコン位置：ｃｈｒ２：６８１５６９８７〜６８１５７５１０；長さ＝５２４ヌクレオチド）ウィンドウ内のいずれかの位置に３つよりも多いヌクレオチド欠失を有するユニークなリードクラスを集計した（本明細書において「ユニークな欠失クラス」と称する；長い欠失を有する産物について増幅バイアスがリードカウントに影響する場合があるので、クラスにリードカウントによる重み付けをしなかった）、（２）挿入または複数の欠失を有するリードクラスを捨て、かつ（３）サンプル間で比較して欠失開始部位および終止部位をマッピングした。

図４５Ａ、図４５Ｂ、図４５Ｃ、および図４５Ｄは、野生型ＥｃｏＣａｓ３タンパク質（ｎ＝２１）、欠損ＥｃｏＣａｓ３タンパク質（ｎ＝３）、または突然変異型ＥｃｏＣａｓ３タンパク質（ｎ＝３）のいずれかを含むＥｃｏカスケードＲＮＰ複合体を用いたＨＺＧＪ座位でのゲノム編集を示す。図４５Ａは、縦軸にユニークな欠失クラスの数（図４５Ａ、０〜６００）および横軸にＥｃｏＣａｓ３タンパク質バリアント（図４５Ａ、左から右、野生型対照（ＷＴ）、Ｃａｓ３なしのタンパク質対照、および表４８に示される順序のｍ１Ｃａｓ３タンパク質〜ｍ２４Ｃａｓ３タンパク質）を示す。ここで、５２４ｂｐのアンプリコンウィンドウ内のユニークな欠失クラスの数に増加をもたらしたＣａｓ３突然変異型バリアントは、トランスロケーションプロセッシビティ（すなわち、ＤＮＡの長さに沿った移動）低減の候補であった。図４５Ｂは、縦軸に塩基対単位の平均欠失長を、横軸にＥｃｏＣａｓ３タンパク質バリアントを示す（図４５Ａと同じ順序）。ユニークな欠失クラスの測定と同様に、５２４ｂｐのアンプリコンウィンドウ内により短い欠失長を生じたＣａｓ３突然変異型バリアントは、トランスロケーションプロセッシビティ低減の候補であった。図４５Ｃは、縦軸にＥｃｏカスケードＰＡＭの６ｂｐ上流の部位（すなわち、Ｃａｓ３ニッキング部位の近く）と比べた平均欠失開始位置（ｂｐ）および横軸にＥｃｏＣａｓ３タンパク質バリアント（図４５Ａと同じ順序）を示す。図４５Ｄは、縦軸にＥｃｏカスケードＰＡＭの６ｂｐ上流の部位（すなわち、予想されるＣａｓ３ニッキング部位近く）と比べた平均欠失終止位置（ｂｐ）、および横軸にＥｃｏＣａｓ３タンパク質バリアントを示す（図４５Ａと同じ順序）。ここで、ＥｃｏＣａｓ３の予測されるニッキング部位のより近くに欠失の開始および終止位置を示したＣａｓ３突然変異体は、トランスロケーションプロセッシビティ（すなわち、ＤＮＡの長さに沿った移動）低減の強力な候補と見なされた。まとめると、アンプリコンウィンドウ内のユニークな欠失のクラスの増加と、アンプリコンウィンドウ内の短縮化された欠失のクラスと、アンプリコンウィンドウ内の位置がシフトした欠失クラスとのある組み合わせを示したＣａｓ３突然変異体は、トランスロケーションプロセッシビティ低減の強力な候補であった。

いくつかの突然変異体が、低減した欠失長を指し示す修復パターンの変化を与えた。野生型ＥｃｏＣａｓ３タンパク質と比べて、突然変異型ＥｃｏＣａｓ３タンパク質Ｄ４５２ＨおよびＡ６０２Ｖは、両方とも、（１）欠失の短縮化を指し示す可能性があるアンプリコンウィンドウ内のユニークな欠失クラスの数における大きな増加、および（２）これも欠失の短縮化を指し示す可能性がある、アンプリコンウィンドウ内の野生型ＥｃｏＣａｓ３タンパク質と比べて欠失のＥｃｏＣａｓ３開始部位近くへのシフトを示した。突然変異型ＥｃｏＣａｓ３タンパク質Ａ６０２Ｖはまた、野生型ＥｃｏＣａｓ３タンパク質と比べてアンプリコンウィンドウ内の欠失の縮小を示した。突然変異Ｄ４５２ＨおよびＡ６０２Ｖの両方は、ｓｓＤＮＡループの結合に影響することが予測されている。本実施例におけるデータは、ヒト細胞に導入および発現される場合、カスケードＲＮＰ複合体と会合したＣａｓ３タンパク質に突然変異を導入して、ｗｔＣａｓ３タンパク質と比べて欠失長を低減し、細胞中のｇＤＮＡにおける欠失長を調節するための突然変異を含むＣａｓ３タンパク質を作製および使用する方法に関するガイダンスを提供できることを実証している。

Ｃａｓ３誘導欠失長を限定するためのロードブロックの使用
Ｃａｓ３タンパク質と会合したカスケードＲＮＰ複合体によって促進される欠失長を限定および／または定義するためのいくつかの方法が、本出願に記載される。本実施例は、Ｃａｓ３の欠失を限定するためにどのようにタンパク質ロードブロックを使用できるかを例証するものである。

Ａ．Ｃａｓ３タンパク質およびＥｃｏカスケードＲＮＰＤＮＡ鋳型構成要素の産生
ヒトゲノムにおけるｃｈｒ２（ＨＺＧＪ遺伝子）上のＡＡＧＰＡＭを有するゲノム座位に大腸菌カスケード（Ｅｃｏカスケード）ＲＮＰを標的化するために最小ＣＲＩＳＰＲアレイを設計した。次に、本質的に実施例２０Ａに記載されるように３つのオリゴヌクレオチド（配列番号１５１３〜配列番号１５１５）および「リピート−スペーサー−リピート−スペーサー−リピート」配列をコードするプライマーを使用してＥｃｏカスケードＲＮＰ標的化を可能にするＰＣＲベースのアセンブリーにより最小ＣＲＩＳＰＲアレイを生成した。この最小ＣＲＩＳＰＲアレイについて、両方のスペーサー配列は同一であった。ＰＣＲで組み立てられたガイドを、主として製造業者の説明書に従ってＳＰＲＩｓｅｌｅｃｔ（登録商標）（ＢｅｃｋｍａｎＣｏｕｌｔｅｒ、Ｐａｓａｄｅｎａ、ＣＡ）ビーズを使用して精製し、濃縮した。操作されたＥｃｏカスケードタンパク質構成要素をコードする遺伝子のみならず大腸菌Ｃａｓ３（ＥｃｏＣａｓ３）遺伝子を、ＣＭＶプロモーターを含むベクターにクローニングして哺乳動物細胞における送達および発現を可能にした。ＥｃｏカスケードＲＮＰｃａｓ遺伝子を、２Ａ「リボソームスキップ」配列（プラスミドヌクレオチド配列、配列番号１８７１；多シストロン性タンパク質配列、配列番号１８７２）を介して連結し、すべての遺伝子は、コードされるタンパク質を核に方向づけるためにＮ末端ＮＬＳ配列を含んでいた。

Ｂ．ｄＣａｓ９−ＶＰ６４／ｓｇＲＮＡＲＮＰ複合体の産生
カスケードＲＮＰ複合体と会合したＣａｓ３タンパク質のトランスロケーションプロセッシビティ（すなわち、ＤＮＡに沿った移動）を止めるためのロードブロックとして使用すべきｄＣａｓ９−ＶＰ６４／ｓｇＲＮＡＲＮＰ複合体のｓｇＲＮＡ構成要素をｉｎｖｉｔｒｏ転写（Ｔ７ＱｕｉｃｋＨｉｇｈＹｉｅｌｄＲＮＡＳｙｎｔｈｅｓｉｓＫｉｔ、ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ、Ｉｐｓｗｉｃｈ、ＭＡ）によって産生した。５’重複プライマーを使用するＰＣＲを用いて、ｓｇＲＮＡ構成要素の転写のためのｄｓＤＮＡ鋳型をアセンブルした。ｄｓＤＮＡ鋳型は、ＤＮＡ配列の５’末端にＴ７プロモーターを組み入れていた。ｓｇＲＮＡ鋳型を産生するために使用される構成要素、鋳型、およびプライマーを表４９に示す。

ｓｇＲＮＡＤＮＡ鋳型をアセンブルするためのＰＣＲ反応を、以下を含む反応混合物を用いて以下のように実行した：濃度４０ｎＭの１つの「内部」ＤＮＡプライマー（配列番号１８８９〜配列番号１８９９）、濃度５００ｎＭの２つの「外部」ＤＮＡプライマー（配列番号１８８７および配列番号１８８８；Ｔ７プロモーターおよびＲＮＡ配列の３’末端を含む）。本質的に製造業者の説明書に従ってＱ５ＨｏｔＳｔａｒｔＨｉｇｈ−Ｆｉｄｅｌｉｔｙ２ＸＭａｓｔｅｒＭｉｘ（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ、Ｉｐｓｗｉｃｈ、ＭＡ）を使用してＰＣＲ反応を行った。以下のサーマルサイクリング条件を用いてＰＣＲアセンブリー反応を実行した：９８℃２分間と、９８℃で１０秒、５８℃で２０秒、７２℃で２０秒の１１サイクルと、７２℃で１分間の最終伸長と。

Ｔ７ＨｉｇｈＹｉｅｌｄＲＮＡＳｙｎｔｈｅｓｉｓＫｉｔ（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ、Ｉｐｓｗｉｃｈ、ＭＡ）を使用して約０．２５〜０．５μｇの間の各ｓｇＲＮＡのＤＮＡ鋳型を３７℃で約１６時間転写した。転写反応物をＤＮアーゼＩ（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ、Ｉｐｓｗｉｃｈ、ＭＡ）で処理した。ＶＰ６４エフェクタードメインがＣ末端に融合したｄＣａｓ９タンパク質（Ｄ１０ＡおよびＨ８４０Ａ；例えば、Ｓａｎｄｅｒ、Ｊ．Ｄ．ら、Ｎａｔ．Ｂｉｏｔｅｃｈｎｏｌ．３２：３４７〜３５５（２０１４年）参照）、およびＮＬＳタグをＶＰ６４のＣ末端に付加し（Ｎ−ＮＬＳ−ＶＰ６４コーディング配列−ｄＣａｓ９コーディング配列−Ｃ）、大腸菌における細菌発現ベクター（ＢＬ２１（ＤＥ３））から発現させ、本質的にＪｉｎｅｋ、Ｍ．ら、Ｓｃｉｅｎｃｅ３３７：８１６〜８２１（２０１２年）によって記載されるようにアフィニティークロマトグラフィー、イオン交換クロマトグラフィー（ＩＥＣ）、およびサイズ排除クロマトグラフィー（ＳＥＣ）を用いて精製した。

Ｃ．ＥｃｏＣａｓ３およびＥｃｏカスケードＲＮＰ複合体構成要素の構成要素のみならず、ｄＣａｓ９−ＶＰ６４／ｓｇＲＮＡＲＮＰ複合体をコードするベクターのトランスフェクション
ＨＥＫ２９３細胞のトランスフェクションを、本質的に実施例８Ｂに記載されるものに以下の改変を加えて行った：

Ｃａｓ３／ＥｃｏカスケードＲＮＰ複合体の形成のために、ＥｃｏＣａｓ３タンパク質およびＥｃｏカスケードタンパク質をコードするＤＮＡ鋳型を含有する溶液４μＬを９６ウェルプレートの個別のウェルに移し、その際、前記ウェルは、Ｅｃｏカスケードタンパク質をコードするプラスミド３μｇ、最小ＣＲＩＳＰＲアレイをコードする直鎖状ＰＣＲ産物０．２μｇ、およびＥｃｏＣａｓ３をコードするプラスミド０、１、または３μｇを含み；
Ｃａｓ３−ＥｃｏカスケードＲＮＰ複合体の形成のために、Ｃａｓ３−Ｅｃｏカスケードタンパク質構成要素をコードするプラスミドであって、Ｃａｓ３が１７−ａａリンカーでＣａｓ８タンパク質に連結したプラスミド３μｇ、および最小ＣＲＩＳＰＲアレイをコードする直鎖状ＰＣＲ産物０．２μｇを含んでいた。

次に、ｄＣａｓ９−ＶＰ６４／ｓｇＲＮＡＲＮＰ複合体をアセンブルした。具体的には、ｓｇＲＮＡを９５℃で２分間インキュベートし、次いで室温に約５分間平衡化させた。ｄＣａｓ９−ＶＰ６４タンパク質を反応緩衝液（２０ｍＭＨＥＰＥＳ、ｐＨ７．５、１００ｍＭＫＣＬ、５ｍＭＭｇＣｌ₂、５％グリセリン）中で１：３の比のｓｇＲＮＡと３７℃で１０分間混合した。アセンブルしたｄＣａｓ９−ＶＰ６４／ｓｇＲＮＡＲＮＰ複合体を細胞内へのトランスフェクションのために様々な用量で９６ウェルプレートのウェルに移し、マトリックスを確立し、その際、各Ｃａｓ３／ＥｃｏカスケードまたはＣａｓ３−Ｅｃｏカスケード混合物には０、５、２０、または５０ｐｍｏｌのいずれかのｄＣａｓ９−ＶＰ６４ロードブロックを加えた。ヌクレオフェクションの４日後に細胞からｇＤＮＡを回収した。

Ｄ．トランスフェクトされた細胞からのｇＤＮＡのディープシークエンシング
ディープシークエンシングおよびデータ解析を本質的に実施例２３Ｃに記載されるように行った。図４６Ａ、図４６Ｂ、および図４６Ｃは、Ｃａｓ３／Ｅｃｏカスケード（それぞれ図４６Ａおよび図４６ＢでＣａｓ３発現プラスミド１μｇまたは３μｇを用いる）またはＣａｓ３−Ｅｃｏカスケード（図４６Ｃ）のいずれかについてｄＣａｓ９−ＶＰ６４／ｓｇＲＮＡＲＮＰ複合体ロードブロックの非存在下または存在下で、表示されるｄＣａｓ９−ＶＰ６４／ｓｇＲＮＡＲＮＰ複合体が結合するために標的化された位置（すなわち、ロードブロックの位置、図４６Ａ、図４６Ｂ、図４６Ｃ、黒い矢印）に関してＨＺＧＪ座位での欠失開始部位の頻度を実証する一連のヒートマップを示す（図４６Ａ、図４６Ｂ、および図４６Ｃ、白い矢印は予想されるＣａｓ３ニッキング部位を示す）。全体として、１１個のロードブロック（Ｆ１〜Ｆ６およびＲ１〜Ｒ５）をＨＺＧＪ座位で評価した。図４６Ａ、図４６Ｂ、および図４６Ｃにおいて、「Ｆ」は、ｄＣａｓ９−ＶＰ６４／ｓｇＲＮＡＲＮＰ複合体のフォワード方向を指し、その際、フォワード方向は、ＥｃｏカスケードＲＮＰ複合体の核酸標的結合部位のＰＡＭに向いたｄＣａｓ９−ＶＰ６４／ｓｇＲＮＡＲＮＰ複合体の核酸標的結合部位に付随するＰＡＭを意味し；「Ｒ」は、ｄＣａｓ９−ＶＰ６４／ｓｇＲＮＡＲＮＰ複合体の逆方向を指し、その際、逆方向は、ｄＣａｓ９−ＶＰ６４／ｓｇＲＮＡＲＮＰ複合体の核酸標的結合部位に付随するＰＡＭがＥｃｏカスケードＲＮＰ複合体の核酸標的結合部位のＰＡＭに向いていなかったことを意味する。標的部位指標（Ｆ１〜Ｆ６およびＲ１〜Ｒ５）の右の数字１、２、３、および４は、それぞれ０、５、２０、または５０ｐｍｏｌのｄＣａｓ９−ＶＰ６４／ｓｇＲＮＡＲＮＰ複合体に対応する。各ヒートマップの上の数字（−４４０〜＋１００）はアンプリコンウィンドウ内のｂｐに対応し、その際、０部位はＥｃｏカスケードＲＮＰＰＡＭの６ｂｐ上流を表す。各ヒートマップの左の灰色のスケールバーは、突然変異型クラスの割合を表す（０．０〜０．５）。欠失開始部位は、ロードブロックＦ４、Ｆ５、およびＦ６についてのｄＣａｓ９−ＶＰ６４／ｓｇＲＮＡＲＮＰ複合体ロードブロックの配置部位近くに高度に濃縮されているように見えた。

図４７Ａおよび図４７Ｂは、Ｃａｓ３−Ｅｃｏカスケード３μｇおよびｄＣａｓ９−ＶＰ６４／ｓｇＲＮＡＲＮＰ複合体ロードブロック０ｐｍｏｌ（図４７Ａ）または５０ｐｍｏｌ（図４７Ｂ）のいずれかをヌクレオフェクションされたサンプルについてアンプリコンウィンドウ内の欠失のすべてについてのデータを示す。図４７Ａおよび図４７Ｂにおいて、白い矢印は、ＥｃｏＣａｓ３タンパク質ニック部位の相対位置を示す。図４７Ｂにおいて、黒い矢印はロードブロックの配置を示す（すなわち、ｄＣａｓ９−ＶＰ６４／ｓｇＲＮＡＲＮＰ複合体についての標的結合部位）。図４７Ａおよび図４７Ｂにおいて、縦軸は、欠失の３’末端を表し、単位はアンプリコンウィンドウ内のｂｐであり、「０」部位は、ＥｃｏカスケードＲＮＰＰＡＭの６ｂｐ上流を表す部位であり；横軸は、欠失の５’末端を表し、単位はアンプリコンウィンドウ内のｂｐであり、「０」部位はＥｃｏカスケードＲＮＰＰＡＭの６ｂｐ上流を表した。図４７Ａおよび図４７Ｂにおいて、横の破線は、欠失の３’末端の平均位置を表し、縦の破線は欠失の５’末端の平均位置を表す。図４７Ａおよび４７Ｂのそれぞれの上部の棒グラフは、欠失の５’末端の分布に対応し、曲線は、欠失の５’末端のカーネル密度推定値を表す。同様に、図４７Ａおよび４７Ｂのそれぞれの右の棒グラフは欠失の３’末端の分布に対応し、曲線は欠失の３’末端のカーネル密度の推定値を表す。欠失開始部位は図４７Ｂにおける黒の矢印近くに高度に濃縮されており、これは、Ｃａｓ３がロードブロック上流のｇＤＮＡを欠失するのをロードブロックが阻止したことを強く示唆している。

本実施例におけるデータは、カスケードＲＮＰ複合体と会合したＣａｓ３タンパク質によって媒介される欠失の長さを制御するためのタンパク質ロードブロックの使用を支持するものであり；したがって、カスケードＲＮＰ複合体と会合したＣａｓ３タンパク質を使用して、細胞のｇＤＮＡに所定の長さを有する欠失が形成することを促進するための方法を提供する。

対形成したニッキングによる標的化ゲノム欠失を誘導するためのカスケード複合体に連結したＡＴＰアーゼ欠失突然変異体の使用
本実施例は、どのようにＣａｓ３ＡＴＰアーゼ欠失突然変異型タンパク質（ｍＣａｓ３タンパク質）を使用してゲノムＤＮＡの反対鎖への対形成ニッキングを促進して、標的化欠失を誘導するかを例証するものである。

Ａ．ｍＣａｓ３タンパク質／ＥｃｏカスケードおよびｍＣａｓ３タンパク質−ＥｃｏカスケードＲＮＰ複合体ＤＮＡ鋳型構成要素の産生
２つの大腸菌カスケード（Ｅｃｏカスケード）（配列番号１８７１）ＲＮＰ複合体を、ヒトゲノムにおけるｇＤＮＡの反対鎖上の隣接座位に標的化するために最小ＣＲＩＳＰＲアレイを作製した。大腸菌Ｄ４５２ＡｍＣａｓ３タンパク質（ｍＣａｓ３［Ｄ４５２Ａ］）、ヘリカーゼ活性を有さず、したがってニッキング活性のみを有するＡＴＰアーゼ欠損バリアント（例えば、Ｍｕｌｅｐａｔｉ、Ｓ．ら、Ｊ．Ｂｉｏｌ．Ｃｈｅｍ．２８８：２２１８４〜２２１９２（２０１３年）参照）を設計して、ＥｃｏカスケードＲＮＰ複合体の動員後の対形成ニッキングを介して標的化欠失を誘導した。ｍＣａｓ３［Ｄ４５２Ａ］タンパク質を、Ｅｃｏカスケードと離れた単一の構成要素（配列番号１９００）、または１７アミノ酸ポリペプチドリンカーによりＥｃｏカスケードＲＮＰ複合体内のＣａｓ８タンパク質に連結した融合タンパク質（配列番号１９０１）のいずれかとして発現させた。ｍＣａｓ３［Ｄ４５２Ａ］タンパク質が単一の構成要素として発現された場合、コーディング配列は発現ベクター上に存在し、その際、その発現はＣＭＶプロモーターの制御下であった。Ｃａｓ３［Ｄ４５２Ａ］タンパク質／Ｅｃｏカスケードは、Ｅｃｏカスケードから別の構成要素として発現されるｍＣａｓ３［Ｄ４５２Ａ］タンパク質を指す。ｍＣａｓ３［Ｄ４５２Ａ］タンパク質−カスケードＲＮＰは、ＥｃｏカスケードＲＮＰ複合体内のＣａｓ８タンパク質に連結した融合タンパク質としてのｍＣａｓ３［Ｄ４５２Ａ］を指す。ｍＣａｓ３［Ｄ４５２Ａ］タンパク質−カスケードＲＮＰタンパク質構成要素をコードする遺伝子を、以下を含むベクター中にクローニングして、ｍＣａｓ３［Ｄ４５２Ａ］−Ｃａｓ８融合タンパク質を作製した：哺乳動物細胞における送達および発現を可能にするためのＣＭＶプロモーター、２Ａ「リボソームスキップ」配列を介して連結したｃａｓ遺伝子、および１７−ａａリンカーでＣａｓ８に結合したＣａｓ３のＡＴＰアーゼ欠失突然変異体バリアント（Ｄ４５２Ａ）（配列番号１９０１）。ｍＣａｓ３［Ｄ４５２Ａ］タンパク質がＣａｓ８タンパク質との融合タンパク質として発現された場合、融合タンパク質はＥｃｏカスケードＲＮＰ複合体（ｍＣａｓ３［Ｄ４５２Ａ］タンパク質−ＥｃｏカスケードＲＮＰ複合体）の部分としてアセンブルした。

２つのガイド標的配列の間の距離（ガイドオフセット）は、１ｂｐと１２０ｂｐとの間であった。ＰＡＭがガイドＲＮＡ標的配列に対して内向き（ＰＡＭ−イン）または外向き（ＰＡＭ−アウト）のいずれかであるようにＥｃｏカスケードＲＮＰ複合体を配向させた。核酸標的配列に付随するＰＡＭ配列を以下から選択した：ＡＡＴ、ＡＴＡ、ＡＡＣ、ＡＡＡ、ＧＡＧ、ＡＴＧ、ＡＧＧ、またはＡＡＧ。

３つのオリゴヌクレオチド（配列番号１５１３〜配列番号１５１５）および「リピート−スペーサー−リピート−スペーサー−リピート」配列をコードするユニークなプライマーを使用して隣接座位へのカスケードＲＮＰの標的化を可能にするＰＣＲベースのアセンブリーを用いて最小ＣＲＩＳＰＲアレイを生成した。結果としてもたらされたアンプリコンは、ガイドについてのコーディング配列を含む最小ＣＲＩＳＰＲアレイの発現を推進するｈｕ６プロモーターを含むであろう（例えば、実施例２０Ａ；図４２Ａ参照）。本質的に製造業者の説明書に従ってＳＰＲＩｓｅｌｅｃｔ（登録商標）（ＢｅｃｋｍａｎＣｏｕｌｔｅｒ、Ｐａｓａｄｅｎａ、ＣＡ）ビーズを使用して、ＰＣＲでアセンブルされた最小ＣＲＩＳＰＲアレイを精製し、濃縮した。

Ｂ．ＦｏｋＩ−カスケードＲＮＰ複合体構成要素をコードするベクターのトランスフェクション
トランスフェクション条件は、本質的に実施例８Ｂに記載されるものに以下の改変を加えて行った。ヌクレオフェクションの前に、ＤＮＡ鋳型を含有する溶液５μＬを９６ウェルプレートの個別のウェルに移した。ｍＣａｓ３［Ｄ４５２Ａ］タンパク質／ＥｃｏカスケードＲＮＰ複合体の発現のために、ウェルは、ｍＣａｓ３［Ｄ４５２Ａ］タンパク質をコードするプラスミド１．５μｇおよびＥｃｏカスケードをコードするプラスミド１．５μｇのみならず、最小ＣＲＩＳＰＲアレイをコードする直鎖状ＰＣＲ産物０．３μｇを含んでいた。ｍＣａｓ３［Ｄ４５２Ａ］タンパク質−ＥｃｏカスケードＲＮＰ複合体の発現について、ウェルは、ｍＣａｓ３［Ｄ４５２Ａ］−Ｅｃｏカスケードタンパク質（ｍＣａｓ３［Ｄ４５２Ａ］−Ｃａｓ８融合タンパク質を含む）をコードするプラスミド３μｇのみならず、最小ＣＲＩＳＰＲアレイをコードする直鎖状ＰＣＲ産物０．３μｇを含んでいた。

Ｃ．トランスフェクトされた細胞からのｇＤＮＡのディープシークエンシング
多数の標的部位を含む６つの座位をｇＤＮＡの反対鎖上の対形成ニッキングについて試験した（ＨＺＧＪ座位、３０標的部位；ＮＰＨＰ３−ＡＣＡＤ１１座位、６０標的部位；ＪＡＫ１座位１、４９標的部位；ＪＡＫ１座位２、３３標的部位；ＮＭＮＡＴ２座位、３８標的部位；およびＥＲＢＢ２座位、２６標的部位）。ｇＤＮＡの反対鎖上の対形成ニッキングを、標的部位へのカスケード複合体の結合を方向づけたガイドを含むｍＣａｓ３［Ｄ４５２Ａ］タンパク質／ＥｃｏカスケードＲＮＰ複合体およびｍＣａｓ３［Ｄ４５２Ａ］タンパク質−ＥｃｏカスケードＲＮＰ複合体の両方について試験した。

本質的に実施例８Ｃに記載されるようにディープシークエンシングを行い、上記標的に対応して異なる標的特異的プライマーを使用したことを除き、実施例８Ｄに記載されるように解析を行った。

表５０は、表示の標的部位に標的化されるｍＣａｓ３［Ｄ４５２Ａ］タンパク質−ＥｃｏカスケードＲＮＰ複合体についての３０個のＨＺＧＪ標的部位にわたる例示的な編集データを示す。図４８は、ｍＣａｓ３［Ｄ４５２Ａ］／ＥｃｏカスケードまたはｍＣａｓ３［Ｄ４５２Ａ］−Ｅｃｏカスケードのいずれかを用いる３０個のＨＺＧＪ標的部位での例示的なゲノム編集データを示す。図４８において、縦軸はインデルの％であり、横軸はｂｐ単位のスペーサー間距離である。ここで、カスケード複合体の対毎に、１つのＲＮＰを特定の標的部位に固定し、第２のＲＮＰを異なる標的部位から上流または下流の距離範囲に方向付けた。図４８において、黒丸およびそれらを結びつける黒線は、ｍＣａｓ３−Ｅｃｏカスケードを用いた編集に対応し、灰色の丸およびそれらを接続する灰色の線は、ｍＣａｓ３／Ｅｃｏカスケードを用いた編集に対応する。ｍＣａｓ３／Ｅｃｏカスケードを用いた編集は、大多数の部位について検出限界未満であり、一方でｍＣａｓ３−Ｅｃｏカスケードを用いた編集は、検出限界未満から最大で約４％までのインデルの範囲であった。ｍＣａｓ３−Ｅｃｏカスケードは、ガイドＲＮＡオフセットの範囲にわたる標的化欠失を可能にしたが、ＰＡＭ−アウト立体配置の場合に最高であった。

本実施例に示されるものと本質的に同じプロトコールに従う追加的な座位からのデータは、ｍＣａｓ３［Ｄ４５２Ａ］−ＥｃｏカスケードサンプルでカスケードＲＮＰ複合体がＰＡＭ−アウト立体配置で配向している場合に最良のゲノム編集が達成されたことを示した。検出限界を超える編集がｍＣａｓ３［Ｄ４５２Ａ］／Ｅｃｏカスケードを用いて２３８個中２６個の標的部位で見られ、０．１％を超える編集が２３８個中１つの標的部位で見られた（すなわち、大部分の部位で検出限界未満）が、一方で、ｍＣａｓ３［Ｄ４５２Ａ］−Ｅｃｏカスケードを用いて検出限界を超える編集が、２４２個中１２８個の標的部位で見られ、０．１％を超える編集が２３８個中１つの標的部位で見られた。ｍＣａｓ３［Ｄ４５２Ａ］−Ｅｃｏカスケードは、ガイドオフセットの範囲にわたる標的化欠失を可能にし、最高は、カスケードＲＮＰ複合体がＰＡＭ−アウト立体配置の場合であった。

本実施例におけるデータは、ｍＣａｓ３タンパク質を含むカスケードＲＮＰ複合体を使用して、ｇＤＮＡの反対鎖上に対形成ニッキングを提供することができ、したがって宿主細胞（例えば、ヒト細胞）のゲノムにおける標的化欠失を促進することを示す。

ゲノム欠失の生成のためのＣａｓ３ＡＴＰアーゼ欠失突然変異体
Ｃａｓ３タンパク質に結合するカスケードＲＮＰ複合体によって促進される欠失長を限定および／または規定するためのいくつかの方法を本出願に記載する。本実施例は、対形成していないＡＴＰアーゼ欠失突然変異型Ｃａｓ３タンパク質を使用して標的化ゲノム欠失をどのように生成し；したがって、単一のカスケードＲＮＰ複合体を使用して単一部位にニッキングを提供するかを例証する。

Ａ．標的細胞へのトランスフェクションのためのシュードモナス属種Ｓ−６−２Ｃａｓ３バリアントおよびＰｓｅカスケードＲＮＰ複合体構成要素の産生
ヒトゲノムのＴＲＡＣ座位における８つの標的（配列番号１９０２〜配列番号１９０９）にシュードモナス属種Ｓ−６−２カスケード（Ｐｓｅカスケード）ＲＮＰ複合体を標的化するために最小ＣＲＩＳＰＲアレイを設計した。これらの配列を表５１に示す。

３つのオリゴヌクレオチド（配列番号１５１３〜配列番号１５１５）および「リピート−スペーサー−リピート−スペーサー−リピート」配列をコードするユニークなプライマーを使用して本質的に実施例２５Ａに記載されるようにＰｓｅカスケードＲＮＰ複合体の標的化を可能にするために、ＰＣＲベースのアセンブリーを用いて最小ＣＲＩＳＰＲアレイを生成した。この最小ＣＲＩＳＰＲアレイについて、両方のスペーサー配列は同一であった。最小ＣＲＩＳＰＲアレイを生成するためのオリゴヌクレオチド配列の全セットを表５２に示す。

ＰＣＲで組み立てたガイドを、主として製造業者の説明書に従ってＳＰＲＩｓｅｌｅｃｔ（登録商標）（ＢｅｃｋｍａｎＣｏｕｌｔｅｒ、Ｐａｓａｄｅｎａ、ＣＡ）ビーズを使用して精製し、濃縮した。

ＡＴＰアーゼ／ヘリカーゼ活性を有さず、したがってニッキング活性だけを有する、シュードモナス属種Ｓ−６−２Ｃａｓ３（ＰｓｅＣａｓ３；配列番号１９１８）のＤ４４８ＡＡＴＰアーゼ突然変異型バリアント（ｍＰｓｅＣａｓ３と名づける；配列番号１９１９）を設計して、標的化欠失を誘導した。基準点として、ＰｓｅＣａｓ３のＤ７５Ａヌクレアーゼデッドバリアント（配列番号１９２０）（ｄＰｓｅＣａｓ３＊と名づける）のみならず、ＰｓｅＣａｓ３のＡＴＰアーゼ−ヌクレアーゼ二重突然変異型バリアント（配列番号１９２１）（ｄｂｌｍＰｓｅＣａｓ３と名づける）も生成した。各標的についてのＰＡＭ配列はＡＡＧであった。

ＰｓｅカスケードＲＮＰ複合体タンパク質構成要素をコードする遺伝子のみならず、突然変異型Ｐｓｅｃａｓ３遺伝子を、ＣＭＶプロモーターを含むベクターにクローニングして、哺乳動物細胞における送達および発現を可能にした。ＰｓｅカスケードＲＮＰ複合体ｃａｓ遺伝子を、２Ａ「リボソームスキップ」配列を介して連結し、すべての遺伝子は、コードされるタンパク質を核に方向づけるためのＮ末端ＮＬＳ配列を含んでいた。配列を表５３に示す。

Ｂ．ＦｏｋＩ−カスケードＲＮＰ複合体構成要素をコードするベクターのトランスフェクション
トランスフェクション条件は、本質的に実施例８Ｂに記載されるものに以下の改変を加えて行った。ヌクレオフェクションの前に、ＤＮＡ鋳型を含有する溶液６μＬを９６ウェルプレートの個別のウェルに移した。その際、ウェルは、Ｐｓｅカスケードタンパク質構成要素をコードするプラスミド３μｇ、最小ＣＲＩＳＰＲアレイをコードする直鎖状ＰＣＲ産物０．２μｇ、およびｍＰｓｅＣａｓ３、ｄＰｓｅＣａｓ３＊、またはｄｂｌｍＣａｓ３のいずれかをコードするプラスミド１μｇを含んでいた。

Ｃ．トランスフェクトされた細胞からのｇＤＮＡのディープシークエンシング
ディープシークエンシングは、本質的に実施例８Ｃに記載されるように行った。しかし、実施例８Ｃの表３６からのプライマーＹおよびＺの代わりに、ＴＲＡＣ１〜ＴＲＡＣ８標的部位のそれぞれについてフォワードおよびリバース標的特異的プライマーのみならず、ＭｉＳｅｑ試薬キットｖ３、６００サイクル（Ｉｌｌｕｍｉｎａ、ＳａｎＤｉｅｇｏ、ＣＡ）を使用した。

図４９は、ｍＰｓｅＣａｓ３、ｄＰｓｅＣａｓ３＊、またはｄｂｌｍＣａｓ３（ｎ＝２）のそれぞれに結合するＰｓｅカスケードＲＮＰ複合体を用いた８つのＴＲＡＣ標的部位でのゲノム編集を示す。図４９では、縦軸は編集％であり、横軸はＴＲＡＣ座位における標的部位を示す。横軸に沿った棒線の順序は、ｍＰｓｅＣａｓ３（黒棒線）、ｄＰｓｅＣａｓ３＊（灰色棒線）、およびｄｂｌｍＣａｓ３（縞棒線）である。標的部位での編集は、ｄＰｓｅＣａｓ３＊またはｄｂｌｍＰｓｅＣａｓ３ＰｓｅカスケードＲＮＰ複合体でまれに観察されたが、ｍＰｓｅＣａｓ３ＰｓｅカスケードＲＮＰ複合体を用いて標的部位での欠失によって検出する場合、最大で約７％のゲノム編集に達した。これらのデータは、ＡＴＰアーゼ／ヘリカーゼ活性を有さず、したがってニッキング活性だけを有するｍＰｓｅＣａｓ３タンパク質を単一の標的でのＰｓｅカスケードＲＮＰ複合体に使用して（すなわち、対形成ニッキング立体配置ではない）、予想される切断部位に欠失を生成することができることを示している。

当業者に明らかなように、本発明の精神および範囲から逸脱せずに上記実施形態の様々な改変および変形を行うことができる。そのような改変および変形は、本発明の範囲内である。

Claims

組成物であって：
第１のＣｓｅ２サブユニットタンパク質、第１のＣａｓ５サブユニットタンパク質、第１のＣａｓ６サブユニットタンパク質、および第１のＣａｓ７サブユニットタンパク質と、
第１のＣａｓ８サブユニットタンパク質および第１のＦｏｋＩを含む第１の融合タンパク質であって、該第１のＣａｓ８サブユニットタンパク質のＮ末端または該第１のＣａｓ８サブユニットタンパク質のＣ末端は、第１のリンカーポリペプチドによって、該第１のＦｏｋＩのＣ末端またはＮ末端にそれぞれ共有結合されており、該第１のリンカーポリペプチドは、長さが１０アミノ酸〜４０アミノ酸である、前記第１の融合タンパク質と、
第１の核酸標的配列に結合することができる第１のスペーサーを含む第１のガイドポリヌクレオチドと
を含む第１の操作されたクラス１Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体と；
第２のＣｓｅ２サブユニットタンパク質、第２のＣａｓ５サブユニットタンパク質、第２のＣａｓ６サブユニットタンパク質、および第２のＣａｓ７サブユニットタンパク質と、
第２のＣａｓ８サブユニットタンパク質および第２のＦｏｋＩを含む第２の融合タンパク質であって、該第２のＣａｓ８サブユニットタンパク質のＮ末端または該第２のＣａｓ８サブユニットタンパク質のＣ末端は、第２のリンカーポリペプチドによって、該第２のＦｏｋＩのＣ末端またはＮ末端にそれぞれ共有結合されており、該第２のリンカーポリペプチドは、長さが１０アミノ酸〜４０アミノ酸である、前記第２の融合タンパク質と、
第２の核酸標的配列に結合することができる第２のスペーサーを含む第２のガイドポリヌクレオチドと
を含む第２の操作されたクラス１Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体と
を含み、
該第２の核酸標的配列のプロトスペーサー隣接モチーフ（ＰＡＭ）および該第１の核酸標的配列のＰＡＭは、スペーサー間距離が２０塩基対〜４２塩基対である、前記組成物。
第１のリンカーポリペプチドは、長さが１５アミノ酸〜３０アミノ酸、または１７アミノ酸〜２０アミノ酸である、請求項１に記載の組成物。
第２のリンカーポリペプチドは、長さが１５アミノ酸〜３０アミノ酸、または１７アミノ酸〜２０アミノ酸である、請求項１または２に記載の組成物。
第１のリンカーポリペプチドの長さと第２のリンカーポリペプチドの長さは、同じ長さである、請求項１〜３のいずれか１項に記載の組成物。
第２の核酸標的配列および第１の核酸標的配列は、それぞれスペーサー間距離が２２塩基対〜４０塩基対であり、それぞれスペーサー間距離が２６塩基対〜３６塩基対であり、それぞれスペーサー間距離が２９塩基対〜３４塩基対であり、またはそれぞれスペーサー間距離が３０塩基対〜３２塩基対である、請求項１〜４のいずれか１項に記載の組成物。
第１のＦｏｋＩおよび第２のＦｏｋＩは、ホモダイマーを形成するように会合することができるモノマーサブユニットである、請求項１〜５のいずれか１項に記載の組成物。
第１のＦｏｋＩおよび第２のＦｏｋＩは、ヘテロダイマーを形成するように会合することができる、互いに異なるモノマーサブユニットである、請求項１〜５のいずれか１項に記載の組成物。
第１のＣａｓ８サブユニットタンパク質のＮ末端は、第１のリンカーポリペプチドによって、第１のＦｏｋＩのＣ末端に共有結合されており、かつ／または第１のＣａｓ８サブユニットタンパク質のＣ末端は、第１のリンカーポリペプチドによって、第１のＦｏｋＩのＮ末端に共有結合されている、請求項１〜７のいずれか１項に記載の組成物。
第２のＣａｓ８サブユニットタンパク質のＮ末端は、第２のリンカーポリペプチドによって、第２のＦｏｋＩのＣ末端に共有結合されており、かつ／または第２のＣａｓ８サブユニットタンパク質のＣ末端は、第２のリンカーポリペプチドによって、第２のＦｏｋＩのＮ末端に共有結合されている、請求項１〜８のいずれか１項に記載の組成物。
第１のＣａｓ８サブユニットタンパク質および第２のＣａｓ８サブユニットタンパク質は、それぞれ同一のアミノ酸配列を含む、請求項１〜９のいずれか１項に記載の組成物。
第１のＣｓｅ２サブユニットタンパク質および第２のＣｓｅ２サブユニットタンパク質は、それぞれ同一のアミノ酸配列を含み、第１のＣａｓ５サブユニットタンパク質および第２のＣａｓ５サブユニットタンパク質は、それぞれ同一のアミノ酸配列を含み、第１のＣａｓ６サブユニットタンパク質および第２のＣａｓ６サブユニットタンパク質は、それぞれ同一のアミノ酸配列を含み、そして第１のＣａｓ７サブユニットタンパク質および第２のＣａｓ７サブユニットタンパク質は、それぞれ同一のアミノ酸配列を含む、請求項１〜１０のいずれか１項に記載の組成物。
第１のガイドポリヌクレオチドはＲＮＡを含み、かつ／または第２のガイドポリヌクレオチドはＲＮＡを含む、請求項１〜１１のいずれか１項に記載の組成物。
ゲノムＤＮＡは、第２の核酸標的配列のＰＡＭおよび第１の核酸標的配列のＰＡＭを含む、請求項１〜１２のいずれか１項に記載の組成物。
第１の操作されたクラス１Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体は、サルモネラ・エンテリカ（Ｓａｌｍｏｎｅｌｌａｅｎｔｅｒｉｃａ）、ゲオテルモバクター（Ｇｅｏｔｈｅｒｍｏｂａｃｔｅｒ）属種（ＥＰＲ−Ｍ株）、メタノセラ・アルボリザエ（Ｍｅｔｈａｎｏｃｅｌｌａａｒｖｏｒｙｚａｅ）ＭＲＥ５０、ストレプトコッカス・サーモフィルス（Ｓｔｒｅｐｔｏｃｏｃｃｕｓｔｈｅｒｍｏｐｈｉｌｕｓ）、シュードモナス（Ｐｓｅｕｄｏｍｏｎａｓ）属種Ｓ−６−２、および大腸菌（Ｅｓｃｈｅｒｉｃｈｉａｃｏｌｉ）からなる群から選択される１つまたはそれ以上の生物のＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体に基づく、請求項１〜１３のいずれか１項に記載の組成物。
第２の操作されたクラス１Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体は、サルモネラ・エンテリカ（Ｓａｌｍｏｎｅｌｌａｅｎｔｅｒｉｃａ）、ゲオテルモバクター（Ｇｅｏｔｈｅｒｍｏｂａｃｔｅｒ）属種（ＥＰＲ−Ｍ株）、メタノセラ・アルボリザエ（Ｍｅｔｈａｎｏｃｅｌｌａａｒｖｏｒｙｚａｅ）ＭＲＥ５０、ストレプトコッカス・サーモフィルス（Ｓｔｒｅｐｔｏｃｏｃｃｕｓｔｈｅｒｍｏｐｈｉｌｕｓ）、シュードモナス（Ｐｓｅｕｄｏｍｏｎａｓ）属種Ｓ−６−２、および大腸菌（Ｅｓｃｈｅｒｉｃｈｉａｃｏｌｉ）からなる群から選択される１つまたはそれ以上の生物のＩ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体に基づく、請求項１〜１４のいずれか１項に記載の組成物。
宿主細胞であって：
請求項１〜１５のいずれか１項に記載の組成物
を含む前記宿主細胞。
真核細胞である、請求項１６に記載の宿主細胞。
請求項１〜１５のいずれか１項に記載の第１のＣｓｅ２サブユニットタンパク質、第１のＣａｓ５サブユニットタンパク質、第１のＣａｓ６サブユニットタンパク質、第１のＣａｓ７サブユニットタンパク質、第１の融合タンパク質、および第１のガイドポリヌクレオチドをコードする、１つもしくはそれ以上の核酸配列；ならびに／または請求項１〜１５のいずれか１項に記載の第２のＣｓｅ２サブユニットタンパク質、第２のＣａｓ５サブユニットタンパク質、第２のＣａｓ６サブユニットタンパク質、第２のＣａｓ７サブユニットタンパク質、第２の融合タンパク質、および第２のガイドポリヌクレオチドをコードする、１つもしくはそれ以上の核酸配列。
第１の核酸標的配列および第２の核酸標的配列を含むポリヌクレオチドを、宿主細胞内または生化学反応において切断する方法であって、該方法は：
請求項１〜１５のいずれか１項に記載の組成物を、宿主細胞または生化学反応中に導入することによって、該第１の核酸標的配列との第１の操作されたクラス１Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の接触、および該第２の核酸標的配列との操作された第２のクラス１Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体の接触を促進して、第１の操作されたクラス１Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体による該第１の核酸標的配列の切断、および第２の操作されたクラス１Ｉ型ＣＲＩＳＰＲ−Ｃａｓエフェクター複合体による該第２の核酸標的配列の切断をもたらすこと
を含み；
場合により、該方法は、該宿主細胞内で実行され、該宿主細胞は、ヒト体外のヒト細胞である、前記方法。
宿主細胞はさらに、ドナーポリヌクレオチドを含み、ドナーポリヌクレオチドの少なくとも一部は、ｄｓＤＮＡ内に組み込まれる、請求項１９に記載の方法。
野生型Ｉ型ＣＲＩＳＰＲＣａｓ３タンパク質（「ｗｔＣａｓ３タンパク質」）よりも低減された、ＤＮＡに沿った移動が可能な操作されたＩ型ＣＲＩＳＰＲＣａｓ３突然変異タンパク質（「ｍＣａｓ３タンパク質」）であって、該ｍＣａｓ３タンパク質は：
対応するｗｔＣａｓ３タンパク質と９５％以上の配列同一性と、
アミノ末端、カルボキシ末端、またはアミノ末端およびカルボキシ末端の双方にて共有結合する核局在化シグナルと、
ヘリカーゼ活性を下方調節する１つまたはそれ以上の突然変異と
を含み、該操作されたＩ型ＣＲＩＳＰＲＣａｓ３突然変異タンパク質は、ヌクレアーゼ活性を保持しており；
該ＤＮＡは、核酸標的配列を含む標的領域を含む二本鎖ＤＮＡ（ｄｓＤＮＡ）であり；
該ｗｔＣａｓ３タンパク質が、対応するカスケード核タンパク質複合体と会合し（「カスケードＮＰ複合体／ｗｔＣａｓ３タンパク質」）、かつ該カスケードＮＰ複合体が、該核酸標的配列と相補的なスペーサーを含むガイドを含む場合、該カスケードＮＰ複合体／ｗｔＣａｓ３タンパク質の、該核酸標的配列への結合が、該ＤＮＡの該標的領域内の切断を促進することによって、欠失（「ｗｔＣａｓ３−欠失」）をもたらし；
該ｍＣａｓ３タンパク質は、該カスケードＮＰ複合体と会合し（「カスケードＮＰ複合体／ｍＣａｓ３タンパク質）、該核酸標的配列に結合する場合、該ＤＮＡの該標的領域内の切断を促進することによって、該ｗｔＣａｓ３−欠失よりも短い欠失をもたらす、前記ｍＣａｓ３タンパク質。
１つまたはそれ以上の突然変異は、ｗｔＣａｓ３タンパク質よりも、一本鎖ＤＮＡ（ｓｓＤＮＡ）へのｍＣａｓ３タンパク質の結合を下方調節する、請求項２１に記載のｍＣａｓ３タンパク質。
１つまたはそれ以上の突然変異は、ｗｔＣａｓ３タンパク質よりも、ｍＣａｓ３タンパク質によるアデノシン三リン酸（ＡＴＰ）の加水分解を下方調節し、またはｍＣａｓ３タンパク質へのＡＴＰの結合を下方調節する、請求項２１または２２に記載のｍＣａｓ３タンパク質。
ｍＣａｓ３タンパク質のコーディング配列は、カスケードＮＰ複合体のＣａｓタンパク質のコーディング配列のアミノ末端またはカルボキシ末端に共有結合している、請求項２１〜２３のいずれか１項に記載のｍＣａｓ３タンパク質。
ＤＮＡは細胞内にある、請求項２１〜２４のいずれか１項に記載のｍＣａｓ３タンパク質。
細胞は真核細胞である、請求項２１〜２５のいずれか１項に記載のｍＣａｓ３タンパク質。
請求項２１〜２６のいずれか１項に記載のｍＣａｓ３タンパク質を含むＩ型ＣＲＩＳＰＲカスケード核タンパク質複合体。