JP2022530055A

JP2022530055A - 拡張されたｄｎａ標的化範囲を有する操作されたｃａｓ９

Info

Publication number: JP2022530055A
Application number: JP2021563030A
Authority: JP
Inventors: リーコン，
Original assignee: Leland Stanford Junior University
Current assignee: Leland Stanford Junior University
Priority date: 2019-04-25
Filing date: 2020-04-24
Publication date: 2022-06-27
Also published as: WO2020219908A1; MX2021012966A; AU2020261071A1; EP3958914A4; EP3958914A1; BR112021021306A2; SG11202111814XA; KR20220025708A; CA3137903A1; US20220204954A1; IL287541A; CN114206394A

Abstract

本開示は、プロトスペーサー隣接モチーフ（ＰＡＭ）配列に対する改変された特異性を有するバリアントＳｔａｐｈｙｌｏｃｏｃｃｕｓａｕｒｅｕｓＣａｓ９（ＳａＣａｓ９）タンパク質を提供する。本開示は、ＣＲＩＳＰＲ／Ｃａｓ９系およびバリアントＳａＣａｓ９タンパク質を使用してゲノムＤＮＡ配列を改変する方法も対象とする。改変されたＰＡＭ特異性を有するバリアントＣａｓ９タンパク質を生成する方法も開示されている。本発明は、拡張されたＤＮＡ標的化範囲を有する操作されたＣＡＳ９タンパク質、ならびにそれを使用する方法、キット、組成物および系に関する。

Description

［関連出願の相互参照］
本願は、２０１９年４月２５日に出願された米国仮特許出願第６２／８３８，４９８号の恩典を主張し、その全体は、参照により、本明細書に組み込まれる。

本発明は、拡張されたＤＮＡ標的化範囲を有する操作されたＣＡＳ９タンパク質、ならびにそれを使用する方法、キット、組成物および系に関する。

細菌および古細菌中に最初に見出されたクラスター化して規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）系は、ＲＮＡによってガイドされるタンパク質機構と複雑な分子機序とを使用する微生物免疫を提供するために外来遺伝物質に適応的に抵抗することができる（Ｍｏｊｉｃａら、Ｊ．Ｍｏｌ．Ｅｖｏｌ．，６０：１７４－１８２（２００５）；Ｂｏｌｏｔｉｎら、Ｍｉｃｒｏｂｉｏｌｏｇｙ，１５１：２５５１－２５６１（２００５）；Ｂａｒｒａｎｇｏｕら、Ｓｃｉｅｎｃｅ，３１５：１７０９－１７１２（２００７）；Ｇａｒｎｅａｕら、Ｎａｔｕｒｅ，４６８：６７（２０１０）；Ｄｅｌｔｃｈｅｖａら、Ｎａｔｕｒｅ，４７１：６０２（２０１１）；Ｓａｐｒａｎａｕｓｋａｓら、Ｎｕｃｌ．ＡｃｉｄｓＲｅｓ．，３９：９２７５－９２８２（２０１１）；Ｊｉｎｅｋら、Ｓｃｉｅｎｃｅ，３３７：８１６－８２１（２０１２）；Ｇａｓｉｕｎａｓら、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ，１０９：Ｅ２５７９－Ｅ２５８６（２０１２）；およびＷｉｅｄｅｎｈｅｆｔら、Ｎａｔｕｒｅ，４８２：３３１（２０１２））。最近の進歩により、真核生物におけるゲノム編集のために、カスタマイズされたＣＲＩＳＰＲ系を利用することが可能である（Ｃｏｎｇら、Ｓｃｉｅｎｃｅ，３３９：８１９－８２３（２０１３）；Ｍａｌｉら、Ｓｃｉｅｎｃｅ，３３９：８２３－８２６（２０１３）；Ｊｉａｎｇら、ＮａｔｕｒｅＢｉｏｔｅｃｈ．，３１：２３３－２３９（２０１３）；Ｊｉｎｅｋら、Ｅｌｉｆｅ，２：ｅ００４７１（２０１３）；Ｃｈｏら、ＮａｔｕｒｅＢｉｏｔｅｃｈ．，３１：２３０（２０１３）；およびＨｗａｎｇら、ＮａｔｕｒｅＢｉｏｔｅｃｈ．，３１：２２７（２０１３））。例示的なＩＩ型ＣＲＩＳＰＲ系は、シングルガイドＲＮＡ（ｓｇＲＮＡ）と複合体を形成したＣａｓ９タンパク質を使用し、二本鎖ＤＮＡ（ｄｓＤＮＡ）標的を切断するプログラム可能なエンドヌクレアーゼを形成する。ｄｓＤＮＡ基質は、ｓｇＲＮＡ中のガイド配列に相補的な標的鎖（Ｊｉｎｅｋら、Ｓｃｉｅｎｃｅ，３３７：８１６－８２１（２０１２））と、標的認識のために必要とされるプロトスペーサー隣接モチーフ（ＰＡＭ）を有する非標的鎖（Ｍｏｊｉｃａら、Ｊ．Ｍｏｌ．Ｅｖｏｌ．，６０：１７４－１８２（２００５）；Ｂｏｌｏｔｉｎら、Ｍｉｃｒｏｂｉｏｌｏｇｙ，１５１：２５５１－２５６１（２００５））とを含有する。

Ｓｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓ由来の広く使用されているＣａｓ９（ＳｐＣａｓ９）はＰＡＭ配列ＮＧＧを認識する（Ｊｉｎｅｋら、上記）のに対して、Ｓｔａｐｈｙｌｏｃｏｃｃｕｓａｕｒｅｕｓ由来の新たに同定されたＣａｓ９（ＳａＣａｓ９）はＮＮＧＲＲＴというより長いＰＡＭ配列を認識する（Ｒａｎら、Ｎａｔｕｒｅ，５２０：１８６－１９１（２０１５））。ＳａＣａｓ９はＳｐＣａｓ９よりも有意に小さく、遺伝子治療用途のために、その送達がより便利で、効率的になる（Ｒａｎら、上記）。そのコンパクトなサイズ故に、臨床移転が有望であるにもかかわらず、ＳａＣａｓ９のより長いＰＡＭは、例えば、そのＰＡＭが疾患関連遺伝子座に近接していない場合に、ＳａＣａｓ９の標的化範囲および応用の可能性を制限する。最近、一連の三重変異Ｅ７８２Ｋ／Ｎ９６８Ｋ／Ｒ１０１５Ｈ（ＫＫＨ）が、ＳａＣａｓ９ＰＡＭの特異性をＮＮＧＲＲＴからＮＮＮＲＲＴへと効果的に改変することが判明した（Ｋｌｅｉｎｓｔｉｖｅｒら、ＮａｔｕｒｅＢｉｏｔｅｃｈ．，３３：１２９３－１２９８（２０１５））。さらに、ｓｇＲＮＡ／ＤＮＡと結合した野生型ＳａＣａｓ９の構造が解明されており（Ｎｉｓｈｉｍａｓｕら、Ｃｅｌｌ，１６２：１１１３－１１２６（２０１５））、ＳａＣａｓ９機能の分子的基礎に関する貴重な洞察を与える。
しかしながら、より広いＰＡＭ特異性を有するＣａｓ９タンパク質およびＣａｓ９タンパク質のＰＡＭ特異性を改変するための方法に対する要求がなお存在する。

Ｍｏｊｉｃａら、Ｊ．Ｍｏｌ．Ｅｖｏｌ．，６０：１７４－１８２（２００５）Ｂｏｌｏｔｉｎら、Ｍｉｃｒｏｂｉｏｌｏｇｙ，１５１：２５５１－２５６１（２００５）；Ｂａｒｒａｎｇｏｕら、Ｓｃｉｅｎｃｅ，３１５：１７０９－１７１２（２００７）

本開示は、例えば、アミノ酸残基Ｅ７８２、Ｎ９６８、Ｎ９８６およびＲ９９１のうちの１またはそれより多くが異なるアミノ酸で置換されている、配列番号１のアミノ酸配列を含むバリアントＳｔａｐｈｙｌｏｃｏｃｃｕｓａｕｒｅｕｓＣａｓ９（ＳａＣａｓ９）タンパク質を提供する。バリアントＳａＣａｓ９タンパク質をコードする核酸配列およびベクター、ならびに宿主細胞中の標的ゲノムＤＮＡ配列を改変するための系および方法も提供される。

本開示は、所望のＰＡＭ特異性を有するバリアントＣａｓ９タンパク質を生成する方法であって、（ａ）１またはそれを超える変異体Ｃａｓ９タンパク質の所望のＰＡＭへの結合を分子的にシミュレートすることと、（ｂ）（ａ）の前記シミュレーションにおいて前記所望のＰＡＭに結合する１またはそれを超える変異体Ｃａｓ９タンパク質を合成的に生成することと、（ｃ）宿主細胞中の標的ＤＮＡ配列に相補的なガイドＲＮＡ配列と組み合わせて、前記宿主細胞中で、前記１またはそれを超える変異体Ｃａｓ９タンパク質を発現させることであって、前記宿主細胞ゲノムは、前記標的ＤＮＡ配列および前記所望のＰＡＭを含む、発現させることと、（ｄ）前記もう１つの変異体Ｃａｓ９タンパク質の切断活性を測定することと、（ｅ）前記所望のＰＡＭに結合し、前記標的ＤＮＡ配列を切断する１またはそれを超える変異体Ｃａｓ９タンパク質を選択することであって、それにより、所望のＰＡＭ特異性を有するバリアントＣａｓ９が生成される、選択することと、を含む、方法も提供する。

本明細書に記載の方法のいずれかを実施するために有用な、必要な、または十分な１またはそれを超える試薬または他の成分を含むキットがさらに提供される。例えば、キットは、ＣＲＩＳＰＲ試薬（Ｃａｓ９タンパク質、ガイド配列、プラスミドなど）、形質移入または投与試薬、陰性および陽性対照試料（例えば、細胞、テンプレートＤＮＡ）、細胞、１またはそれを超える成分を収容する容器（例えば、微量遠心管、箱）、検出可能な標識、検出および分析機器、ソフトウェア、指示（ｉｎｓｔｒｕｃｔｉｏｎ）などを含み得る。

図１Ａは、結合したＤＮＡおよびＲＮＡを有するＳａＣａｓ９のＭＤシミュレーションのためのモデル系を図解する模式図である。ＤＮＡのＰＡＭ領域とその周囲のタンパク質残基の間の相互作用が拡大されている。図１Ｂは、対Ｅ７８２－Ｋ９１０およびＥ７８２－Ｇ０の時間依存性距離を示すグラフである。図１Ｃは、対Ｎ９６８－Ｇ３およびＲ１０１５－Ｇ３の時間依存性距離を示すグラフである。図１Ｄは、０、５７および８０ｎｓにおけるＥ７８２の配位を示す一連の画像である。Ｅ７８２Ｋ変異のＦＥＰ計算において、図１Ｄ中のＮａ＋イオンは、新たに出現したＫ７８２との好ましくない衝突（または静電的反発）を回避するために、Ｅ７８２とともに消滅させた。したがって、遊離状態のＦＥＰ計算においては、電解質中の余分なＮａ＋（タンパク質複合体に近接していない）はＥ７８２と同時に消滅させた。

図２Ａ～２Ｃは、結晶化したＳａＣａｓ９複合体の原子構造の模式図である。図２Ａは、Ａ、Ｂ、ＣおよびＤと表示された４つの複雑なコピーを含む単位セルを示している。図２Ｂは、コピーＡとＢ、またはＣとＤの間の結晶の接触の拡大図を示している。図２Ｃは、コピーＢとＣの間の結晶接触の拡大図を示している。

図３Ａ～３Ｃは、ＳａＣａｓ９複合体のＭＤシミュレーションの模式図である。図３Ａは、約２００ｎｓのシミュレーション中のタンパク質、ＤＮＡおよびＲＮＡ骨格の二乗平均平方根偏差（ＲＭＳＤ）を示している図３Ｂは、ＳａＣａｓ９中のＰＩドメインと非標的ＤＮＡ鎖中のＰＡＭとの間の原子配位を示している。図３Ｃは、結晶構造（灰色）と最終的なシミュレート構造（緑色）の重なりを示している。

図４は、結合したｓｇＲＮＡのみを有するＳａＣａｓ９に対するＭＤシミュレーションにおけるタンパク質骨格の二乗平均平方根偏差を示すグラフである。挿入図：ＭＤシミュレーションの最後での複合体のスナップショット。

図５Ａは、変異Ｒ１０１５ＨのΔΔＧを計算するための熱力学的サイクルを示す一連の模式図である。ΔＧ_ＡおよびΔＧ_Ｂは、それぞれ、野生型および変異体タンパク質に結合するｄｓＤＮＡの自由エネルギーの変化であり、ΔＧ_１およびΔＧ_２は、それぞれ、ＤＮＡ結合状態およびＤＮＡ遊離状態において生じる、該変異の自由エネルギーの変化である。タンパク質残基９９３および１０１５中の原子は、ファンデルワールス球として強調表示されている。図５Ｂは、ＰＡＭ認識に関与する選択された残基に対するアラニンスキャニングの自由エネルギー変化を示すグラフである。図５Ｃは、計算解析において実行された変異スキャニングに対応する分子構築物を使用する哺乳動物細胞実験で測定された正規化されたＣａｓ９効率を示すグラフである。図５Ｄは、ＦＥＰの結果と実験的なＣａｓ９効率の間の頑強な線形相関を示すグラフであり、ＣＯＭＥＴワークフローの妥当性を実証している。線形回帰は、ΔΔＧと野生型対照に対する試験された各変異体Ｃａｓ９の効率比の自然対数（ｎａｔｕｒａｌｌｏｇ）（ｌｎ）とを用いて行った。決定係数による適合度は０．９２であった。

図６Ａは、ＫＫＨＳａＣａｓ９変異体と関連する様々な変異の自由エネルギー変化を示すグラフである。図６Ｂは、ＳａＣａｓ９中のＥ７８２Ｋ変異を示す模式図である。タンパク質残基Ｋ７８２およびＫ９１０中の原子は、ファンデルワールス球として強調表示されている。図６Ｃは、Ｅ７８２ＫおよびＮ９６８Ｋ変異における水の役割を示す模式図である。図６Ｄは、ＫＫＨ－ＳａＣａｓ９タンパク質と結合したＤＮＡとの間の鍵となる相互作用の斜視図の模式図である。

図７Ａは、拡張されたＰＡＭ範囲を有するＳａＣａｓ９バリアントのＣＯＭＥＴをベースとした最適化のための様々な変異に対するＦＥＰ計算を示すグラフである。図７Ｂは、ＮＮＧＲＲＴ＝Ｃ＝Ｇ＝ＡＰＡＭを標的とする操作されたｓａＣａｓ９バリアントの正規化されたＣａｓ９効率を示すグラフである。図７Ｃは、ＤＮＡ骨格とのＲ９８６の配位、およびＲ９８６とＬ９９１の間の疎水性相互作用（Ｒ９９１Ｌ変異後）の模式図である。図７Ｄは、ＣＯＭＥＴワークフローを通じて発見された新規ＳａＣａｓ９バリアントの内因性ゲノム標的化活性を示すグラフであり、破線は、正規化の基礎としての野生型ＳａＣａｓ９活性を表す。Ｘ軸上に示されている各ＰＡＭ配列について、異なる標的からの結果をエラーバーとして平均値の標準誤差（Ｓ．Ｅ．Ｍ．）とともに表した。図７Ｅは、ＣＲＩＳＰＲゲノム編集ツールを理解し、操作するための、複合アプローチに対するＣＯＭＥＴをまとめた図である。

図８は、その標的化範囲をさらに増強するために、Ｎ９８６Ｒと追加のＲ９９１コンビナトリアル変異とを有するＳａＣａｓ９バリアントの実験的検証および特性決定を示すグラフであり、野生型ＳａＣａｓ９に対して正規化されたＳａＣａｓ９バリアントのＣａｓ９効率が示されている。異なる色のバー（ｂａｒｄｓ）は、異なるＰＡＭ配列を有する標的を表し、標的の最後の位置は、４つのＤＮＡ塩基全てを含むように変えられている。

図９Ａ～９Ｄは、異なるＰＡＭ配列群にわたって野生型ＳａＣａｓ９と比較した異なるＳａＣａｓ９バリアントの活性を示すグラフであり、アッセイにおいて試験された個々のゲノム部位を列挙している。各データバーは、独立した反復から得た結果を表し、エラーバーは平均値の標準誤差を示す。

図１０は、ＰＡＭ認識を増強するＳａＣａｓ９の追加の残基に対する構造分析の模式図である。

図１１は、変異の組み合わせを有するＳａＣａｓ９バリアントのＣａｓ９活性を示すグラフであり、標的ＤＮＡ上のＰＡＭ二重鎖の認識に焦点を当てている。結果は、異なるＰＡＭ配列を有するＤＮＡ標的への結合によって色分けされている。

図１２は、変異の組み合わせを有するＳａＣａｓ９バリアントのＣａｓ９活性を示すグラフであり、標的ＤＮＡの一般的結合親和性の増強に焦点を当てている。結果は、異なるＰＡＭ配列を有するＤＮＡ標的への結合によって色分けされている。

図１３は、ゲノム標的の切断によって測定されたＳａＣａｓ９バリアントのＣａｓ９活性を示すグラフであり、標的ＤＮＡに対する切断活性は、図７で測定された結合活性とは異なるであろう。異なる色は、異なるＰＡＭ配列を有するＤＮＡ標的の切断から得られた結果を表している。

本開示は、少なくとも部分的には、改変されたＰＡＭ特異性を有するバリアントＣａｓ９タンパク質を同定するための計算解析および実験的アッセイを組み合わせる方法の開発に基づいている。特に、開示された方法は、以前には標的とすることができなかった配列に対する遺伝子編集のために拡張されたＰＡＭ活性を有するバリアントＳａＣａｓ９タンパク質の設計を可能にする。本明細書に記載されている方法論は、計算物理化学と遺伝子編集の力を兼ね備える非天然ＣＲＩＳＰＲユーティリティを探索する上で一般的なモチーフとしての役割を果たし得る。
定義

本技術の理解を容易にするために、いくつかの用語および句を以下に定義する。追加の定義は、詳細な説明全体に記載されている。

本明細書で使用される場合、「核酸」または「核酸配列」は、ピリミジンおよび／またはプリン塩基、好ましくはそれぞれシトシン、チミン、およびウラシル、ならびにアデニンおよびグアニンのポリマーまたはオリゴマーを指す（ＡｌｂｅｒｔＬ．Ｌｅｈｎｉｎｇｅｒ，ＰｒｉｎｃｉｐｌｅｓｏｆＢｉｏｃｈｅｍｉｓｔｒｙ，ａｔ７９３－８００（ＷｏｒｔｈＰｕｂ．１９８２）を参照）。本技術は、任意のデオキシリボヌクレオチド、リボヌクレオチドまたはペプチド核酸成分、ならびにこれらの任意の化学的バリアント、例えば、これらの塩基のメチル化された形態、ヒドロキシメチル化された形態またはグリコシル化された形態などを企図する。ポリマーまたはオリゴマーは、組成が不均一または均一であり得、天然に存在する供給源から単離され得るか、または人工的もしくは合成的に生成され得る。さらに、核酸は、ＤＮＡもしくはＲＮＡまたはこれらの混合物であり得、ホモ二本鎖、ヘテロ二本鎖およびハイブリッド状態を含む一本鎖または二本鎖形態で恒久的にまたは移行的に存在し得る。いくつかの実施形態において、核酸または核酸配列は、例えば、ＤＮＡ／ＲＮＡヘリックス、ペプチド核酸（ＰＮＡ）、モルホリノ核酸（例えば、ＢｒａａｓｃｈおよびＣｏｒｅｙ，Ｂｉｏｃｈｅｍｉｓｔｒｙ，４１（１４）：４５０３－４５１０（２００２））および米国特許第５，０３４，５０６号を参照）、ロックされた核酸（ＬＮＡ；Ｗａｈｌｅｓｔｅｄｔら、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．Ｕ．Ｓ．Ａ．，９７：５６３３－５６３８（２０００）を参照）、シクロヘキセニル核酸（Ｗａｎｇ，Ｊ．Ａｍ．Ｃｈｅｍ．Ｓｏｃ．，１２２：８５９５－８６０２（２０００）参照）および／またはリボザイムなどの他の種類の核酸構造を含む。したがって、「核酸」または「核酸配列」という用語は、天然ヌクレオチドと同じ機能を示すことができる、非天然ヌクレオチド、修飾されたヌクレオチドおよび／または非ヌクレオチド基本要素（例えば、「ヌクレオチド類似体」）を含む鎖も包含し得、さらに、本明細書で使用される「核酸配列」という用語は、オリゴヌクレオチド、ヌクレオチドまたはポリヌクレオチドおよびこれらの断片または部分、ならびに一本鎖または二本鎖であり得、センス鎖またはアンチセンス鎖を表し得るゲノムまたは合成起源のＤＮＡまたはＲＮＡを指す。「核酸」、「ポリヌクレオチド」、「ヌクレオチド配列」および「オリゴヌクレオチド」という用語は、交換可能に使用される。「核酸」、「ポリヌクレオチド」、「ヌクレオチド配列」および「オリゴヌクレオチド」という用語は、デオキシリボヌクレオチドもしくはリボヌクレオチドのいずれかまたはこれらの類似体である、任意の長さのヌクレオチドのポリマー形態を指す。

「相補的」および「相補性」という用語は、従来のワトソン－クリック塩基対形成またはその他の非従来の型の対形成のいずれかによって別の核酸配列と水素結合（複数可）を形成する核酸の能力を指す。２つの核酸配列間の相補性の程度は、第２の核酸配列と水素結合（例えば、ワトソン－クリック塩基対形成）を形成することができる核酸配列中のヌクレオチドの百分率によって示すことができる（例えば、５０％、６０％、７０％、８０％、９０％および１００％相補的）。核酸配列の全ての連続するヌクレオチドが第２の核酸配列中の同じ数の連続するヌクレオチドと水素結合すれば、２つの核酸配列は「完全に相補的」である。２つの核酸配列間の相補性の程度が、少なくとも８ヌクレオチド（例えば、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、３０、３５、４０、４５、５０またはそれを超えるヌクレオチド）の領域にわたって少なくとも６０％（例えば、６５％、７０％、７５％、８０％、８５％、９０％、９５％、９７％、９８％、９９％または１００％）であれば、または２つの核酸配列が少なくとも中程度の、好ましくは高いストリンジェンシー条件下でハイブリッドを形成すれば、２つの核酸配列は「実質的に相補的」である。例示的な中程度のストリンジェンシー条件には、２０％ホルムアミド、５×ＳＳＣ（１５０ｍＭＮａＣｌ、１５ｍＭクエン酸三ナトリウム）、５０ｍＭリン酸ナトリウム（ｐＨ７．６）、５×デンハルト溶液、１０％デキストラン硫酸および２０ｍｇ／ｍｌの変性した剪断されたサケ精子ＤＮＡを含む溶液中において、３７℃で一晩インキュベートした後、約３７～５０℃で１×ＳＳＣ中において、または実質的に同様の条件、例えば、以下のＳａｍｂｒｏｏｋらに記載されている中程度にストリンジェントな条件でフィルタを洗浄することが含まれる。高ストリンジェンシー条件は、例えば、（１）洗浄のために、５０°Ｃで０．０１５Ｍ塩化ナトリウム／０．００１５Ｍクエン酸ナトリウム／０．１％ドデシル硫酸ナトリウム（ＳＤＳ）などの低イオン強度および高温を使用する、（２）ハイブリダイゼーション中に変性剤、例えば、ホルムアミド、例えば、ｐＨ６．５の０．１％ウシ血清アルブミン（ＢＳＡ）／０．１％フィコール／０．１％ポリビニルピロリドン（ＰＶＰ）／５０ｍＭリン酸ナトリウム緩衝液を含む５０％（ｖ／ｖ）ホルムアミドを７５０ｍＭ塩化ナトリウムおよび７５ｍＭクエン酸ナトリウムとともに４２°Ｃで使用する、または（３）５０％ホルムアミド、５×ＳＳＣ（０．７５ＭＮａＣｌ、０．０７５Ｍクエン酸ナトリウム）、５０ｍＭリン酸ナトリウム（ｐＨ６．８）、０．１％ピロリン酸ナトリウム、５×デンハルト溶液、超音波処理したサケ精子ＤＮＡ（５０μｇ／ｍｌ）、０．１％ＳＤＳおよび１０％デキストラン硫酸を４２℃で使用し、（ｉ）０．２×ＳＳＣ中において４２℃、（ｉｉ）５０％ホルムアミド中において５５℃および（ｉｉｉ）０．１×ＳＳＣ中において５５℃（好ましくは、ＥＤＴＡと組み合わせて）で洗浄する条件である。ハイブリダイゼーション反応のストリンジェンシーのさらなる詳細および説明は、例えば、Ｓａｍｂｒｏｏｋら、ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ，３ｒｄｅｄ．，ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＰｒｅｓｓ，ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒ，Ｎ．Ｙ．（２００１）およびＡｕｓｕｂｅｌら、ＣｕｒｒｅｎｔＰｒｏｔｏｃｏｌｓｉｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ，ＧｒｅｅｎｅＰｕｂｌｉｓｈｉｎｇＡｓｓｏｃｉａｔｅｓａｎｄＪｏｈｎＷｉｌｅｙ＆Ｓｏｎｓ，ＮｅｗＹｏｒｋ（１９９４）に提供されている。

本明細書で使用される場合、「パーセント配列同一性」という用語は、２つの配列を整列させ、必要であれば、最大のパーセント同一性を達成するためにギャップを導入した後に、参照配列中の対応するヌクレオチドまたはアミノ酸と同一である、核酸配列中のヌクレオチドもしくはヌクレオチド類似体、またはアミノ酸配列中のアミノ酸の百分率を指す。したがって、本技術による核酸が参照配列よりも長い場合には、参照配列と整列しない核酸中の追加のヌクレオチドは、配列同一性を決定するために考慮されない。整列のための方法およびコンピュータプログラムは、ＢＬＡＳＴ、Ａｌｉｇｎ２およびＦＡＳＴＡを含み、当技術分野において周知である。

「相同性」および「相同な」という用語は、同一性の程度を指す。部分的な相同性または完全な相同性が存在し得る。部分的に相同な配列は、別の配列と１００％未満同一である配列である。

本明細書で使用される場合、「ハイブリダイゼーション」という用語は、相補的な核酸の対形成に関して使用される。ハイブリダイゼーションおよびハイブリダイゼーションの強度（すなわち、核酸間の会合の強度）は、核酸間の相補性の程度、関与する条件のストリンジェンシーおよび形成されたハイブリッドのＴ_ｍなどの要因によって影響を受ける。「ハイブリダイゼーション」法は、ある核酸を別の相補的核酸、例えば、相補的ヌクレオチド配列を有する核酸にアニーリングすることを含む。相補的な配列を含む核酸の２つのポリマーがお互いを見出し、塩基対形成相互作用を介して「アニーリング」または「ハイブリッド形成」することができる能力は、よく認識された現象である。ＭａｒｍｕｒａｎｄＬａｎｅ、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ，４６：４５３（１９６０）およびＤｏｔｙら、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ，４６：４６１（１９６０）による「ハイブリダイゼーション」過程の最初の観察に続いて、この過程は洗練され、現代生物学の不可欠なツールになった。例えば、ハイブリダイゼーションおよび洗浄条件は現在周知であり、Ｓａｍｂｒｏｏｋ，Ｊ．，Ｆｒｉｔｓｃｈ，Ｅ．Ｆ．ａｎｄＭａｎｉａｔｉｓ，Ｔ．ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ，ＳｅｃｏｎｄＥｄｉｔｉｏｎ，ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙＰｒｅｓｓ，ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒ（１９８９）、特に第１１章とその中の表１１．１；およびＳａｍｂｒｏｏｋ，Ｊ．ａｎｄＲｕｓｓｅｌｌ，Ｗ．，ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ，ＴｈｉｒｄＥｄｉｔｉｏｎ，ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙＰｒｅｓｓ，ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒ（２００１）に例示されている。温度とイオン強度の条件が、ハイブリダイゼーションの「ストリンジェンシー」を決定する。

本明細書で使用される場合、「二本鎖核酸」は、核酸の一部、より長い核酸の領域、または核酸全体であり得る。「二本鎖核酸」は、例えば、これらに限定されないが、二本鎖ＤＮＡ、二本鎖ＲＮＡ、二本鎖ＤＮＡ／ＲＮＡハイブリッドなどであり得る。二次構造（例えば、塩基対形成した二次構造）および／またはより高次の構造（例えば、ステムループ構造）を有する一本鎖核酸は、「二本鎖核酸」を構成する。例えば、三重構造は「二本鎖」と見なされる。いくつかの実施形態において、任意の塩基対形成した核酸は「二本鎖核酸」である。

「遺伝子」という用語は、非コード機能を有するＲＮＡ（例えば、リボソームＲＮＡまたはトランスファーＲＮＡ）、ポリペプチドまたは前駆体の産生に必要な制御およびコード配列を含むＤＮＡ配列を指す。ＲＮＡまたはポリペプチドは、完全長コード配列によって、または所望の活性もしくは機能が保持されている限り、コード配列の任意の一部によってコードされ得る。したがって、「遺伝子」は、生物内で果たすべき機能的役割を有するポリペプチドまたはＲＮＡ鎖をコードするＤＮＡもしくはＲＮＡまたはこれらの一部を指す。本開示において、遺伝子は、そのような調節配列がコード配列および／または転写される配列に隣接しているか否かを問わず、遺伝子産物の産生を調節する領域を含むと考えることができる。したがって、遺伝子には、プロモーター配列、ターミネーター、リボソーム結合部位および内部リボソーム進入部位などの翻訳調節配列、エンハンサー、サイレンサー、インスレーター、境界エレメント、複製起点、マトリックス付着部位および遺伝子座制御領域が含まれるが、必ずしもこれらに限定されない。

「野生型」という用語は、天然に存在する供給源から単離された場合にその遺伝子または遺伝子産物の特徴を有する遺伝子または遺伝子産物を指す。野生型遺伝子は、集団で最も頻繁に観察される遺伝子であり、したがって、遺伝子の「正常」または「野生型」形態と任意に指定される。対照的に、「修飾された」、「変異体」または「多形性の」という用語は、野生型遺伝子または遺伝子産物と比較した場合に、配列および／または機能的特性の修飾（すなわち、改変された特性）を示す遺伝子または遺伝子産物を指す。天然に存在する変異体を単離できることに留意すべきであり、これらは、野生型遺伝子または遺伝子産物と比較した場合、改変された特性を有するという事実によって特定される。

本明細書で使用される場合、「バリアント」という用語は、自然界で発生するものから逸脱するパターンを有する性質の発出を表す。いくつかの実施形態において、バリアントは変異体でもあり得る。

「天然に存在しない」または「操作された（ｅｎｇｉｎｅｅｒｅｄ）」という用語は互換的に使用され、人間の手の関与を示す。これらの用語は、核酸分子またはポリペプチドに言及する場合、その核酸分子またはポリペプチドは、自然界でそれらが天然に会合し、自然界で見出されるように少なくとも１つの他の成分を少なくとも実質的に含まないことを意味する。

本明細書で使用される「オリゴヌクレオチド」という用語は、２またはそれを超えるデオキシリボヌクレオチドまたはリボヌクレオチド、好ましくは少なくとも５ヌクレオチド、より好ましくは少なくとも約１０～１５ヌクレオチド、より好ましくは少なくとも約１５～５０ヌクレオチド（例えば、１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９または５０またはそれを超えるヌクレオチド）を含む分子として定義される。正確なサイズは多くの要因に依存し、これは次いでオリゴヌクレオチドの最終的な機能または使用に依存する。オリゴヌクレオチドは、化学合成、ＤＮＡ複製、逆転写、ＰＣＲまたはこれらの組み合わせを含む任意の様式で生成され得る。

「ペプチド」および「ポリペプチド」および「タンパク質」という用語は、本明細書では互換的に使用され、コードおよび非コードアミノ酸、化学的にまたは生化学的に修飾されたまたは誘導体化されたアミノ酸、および修飾されたペプチド骨格を有するポリペプチドを含むことができる任意の長さのアミノ酸のポリマー形態を指す。

本明細書で使用される「結合」（例えば、ポリペプチドのＲＮＡ結合ドメインに関して）は、高分子間（例えば、タンパク質と核酸の間）での非共有結合性相互作用を指す。非共有結合性相互作用の状態にある間、高分子は「会合した」または「相互作用している」または「結合している」と称される（例えば、分子Ｘが分子Ｙと相互作用すると称される場合、分子Ｘは、非共有結合性の様式で分子Ｙに結合することを意味する。）。結合相互作用の全ての成分が配列特異的であることを必要とするわけではない（例えば、ＤＮＡ骨格中のホスファート残基との接触）が、結合相互作用のいくつかの部分は配列特異的であり得る。結合相互作用は、一般に、１０^－６Ｍ未満、１０^－７Ｍ未満、１０^－８Ｍ未満、１０^－９Ｍ未満、１０^－１０Ｍ未満、１０^－１１Ｍ未満、１０^－１２Ｍ未満、１０^－１３Ｍ未満、１０^－１４Ｍ未満または１０^－１５Ｍ未満の解離定数（Ｋ_ｄ）によって特徴付けられる。「親和性」は、結合の強度を表し、増加した結合親和性はより低いＫ_ｄと相関する。

「結合ドメイン」とは、別の分子に非共有結合的に結合することができるタンパク質ドメインを意味する。結合ドメインは、例えば、ＤＮＡ分子（ＤＮＡ結合タンパク質）、ＲＮＡ分子（ＲＮＡ結合タンパク質）および／またはタンパク質分子（タンパク質結合タンパク質）に結合することができる。タンパク質ドメイン結合タンパク質の場合には、タンパク質ドメイン結合タンパク質はそれ自体に結合して（ホモ二量体、ホモ三量体などを形成する）ことができ、および／または１もしくは複数の異なるタンパク質の１もしくはそれを超える分子に結合することができる。

本明細書で使用される「組換え」は、特定の核酸（ＤＮＡまたはＲＮＡ）が、クローニング、制限、ポリメラーゼ連鎖反応（ＰＣＲ）および／または連結ステップの様々な組み合わせの産物であり、自然系において見られる内因性核酸と区別可能な構造的コードまたは非コード配列を有する構築物をもたらすことを意味する。ポリペプチドをコードするＤＮＡ配列は、細胞中または無細胞転写および翻訳系中に含有される組換え転写ユニットから発現されることができる合成核酸を提供するために、ｃＤＮＡ断片からまたは一連の合成オリゴヌクレオチドから組み立てることができる。組換え遺伝子または転写ユニットの形成において、関連する配列を含むゲノムＤＮＡも使用することができる。オープンリーディングフレームから５’または３’に、翻訳されないＤＮＡの配列が存在し得、このような配列はコード領域の操作または発現を妨害せず、様々な機序によって所望の産物の産生をモジュレートするように実際に作用し得る）。あるいは、翻訳されないＲＮＡ（例えば、ＤＮＡ標的化ＲＮＡ）をコードするＤＮＡ配列も、組換え体と見なされ得る。したがって、例えば、「組換え」核酸という用語は、天然に存在しない核酸、例えば、ヒトの介入を通じて、そうでなければ分離されていた２つの配列セグメントの人工的な組み合わせによって作られる核酸を表す。この人工的な組み合わせは、化学合成手段によって、または例えば遺伝子工学技術による核酸の単離されたセグメントの人工的な操作によってしばしば達成される。このようなことは、通常、コドンを、同じアミノ酸、保存的アミノ酸、または非保存的アミノ酸をコードするコドンで置き換えるために行われる。あるいは、所望の機能の核酸セグメントを一緒に結合して、機能の所望の組み合わせを生成するために行われる。この人工的な組み合わせは、化学合成手段によって、または例えば遺伝子工学技術による核酸の単離されたセグメントの人工的な操作によってしばしば達成される。組換えポリヌクレオチドがポリペプチドをコードする場合、コードされるポリペプチドの配列は、天然に存在することができ（「野生型」）、または天然に存在する配列のバリアント（例えば、変異体）であり得る。したがって、「組換え」ポリペプチドという用語は、必ずしも、その配列が天然に存在しないポリペプチドを指すとは限らない。むしろ、「組換え」ポリペプチドは、組換えＤＮＡ配列によってコードされるが、ポリペプチドの配列は、天然に存在することができ（「野生型」）または天然に存在しないことができる（例えば、バリアント、変異体など）。したがって、「組換え」ポリペプチドは、ヒトの介入の結果であるが、天然に存在するアミノ酸配列であり得る。

「ベクター」または「発現ベクター」は、付着されたセグメントの細胞中での複製をもたらすように、別のＤＮＡセグメント、すなわち「挿入物」が付着されまたは組み込まれ得るレプリコン、例えば、プラスミド、ファージ、ウイルスまたはコスミドである。

外因性ＤＮＡが細胞内に導入されている場合に、細胞は、外因性ＤＮＡ、例えば、組換え発現ベクターによって、「遺伝子改変」、「形質転換」または「形質移入」されている。外因性ＤＮＡの存在は、恒久的なまたは一過性の遺伝的変化をもたらす。形質転換ＤＮＡは、細胞のゲノム中に組み込まれる（共有結合される）ことがあり得、または組み込まれないことがあり得る。例えば、原核生物、酵母および哺乳動物細胞では、形質転換ＤＮＡは、プラスミドなどのエピソームエレメント上に維持され得る。真核細胞に関して、安定して形質転換された細胞とは、形質転換ＤＮＡが染色体複製を通じて娘細胞によって受け継がれるように、形質転換ＤＮＡが染色体中に組み込まれた細胞である。この安定性は、形質転換ＤＮＡを含有する娘細胞の集団を含む細胞系またはクローンを確立する真核細胞の能力によって実証される。「クローン」は、有糸分裂によって単一の細胞または共通の祖先から生じる細胞の集団である。「細胞系」は、何世代にもわたってインビトロで安定した成長が可能な初代細胞のクローンである。

ＣＲＩＳＰＲ／Ｃａｓ遺伝子編集系は、真核細胞内の関心対象の特定の遺伝子への標的とされた修飾を可能にするために開発された。ＣＲＩＳＰＲ／Ｃａｓ遺伝子編集系は、ＩＩ型原核生物のクラスター化して規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）適応免疫系からのＲＮＡ誘導型Ｃａｓ９ヌクレアーゼに基づいている（例えば、Ｊｉｎｅｋら、Ｓｃｉｅｎｃｅ，３３７：８１６（２０１２）；Ｇａｓｉｕｎａｓら、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．Ｕ．Ｓ．Ａ．，１０９，Ｅ２５７９（２０１２）；Ｇａｒｎｅａｕら、Ｎａｔｕｒｅ，４６８：６７（２０１０）；Ｄｅｖｅａｕら、Ａｎｎｕ．Ｒｅｖ．Ｍｉｃｒｏｂｉｏｌ．，６４：４７５（２０１０）；ＨｏｒｖａｔｈａｎｄＢａｒｒａｎｇｏｕ，Ｓｃｉｅｎｃｅ，３２７：１６７（２０１０）；Ｍａｋａｒｏｖａら、Ｎａｔ．Ｒｅｖ．Ｍｉｃｒｏｂｉｏｌ．，９，４６７（２０１１）；Ｂｈａｙａら、Ａｎｎｕ．Ｒｅｖ．Ｇｅｎｅｔ．，４５：２７３（２０１１）；およびＣｏｎｇら、Ｓｃｉｅｎｃｅ，３３９：８１９－８２３（２０１３）を参照）。細菌および古細菌では、ＣＲＩＳＰＲ／Ｃａｓ系は、侵入するファージ、ウイルスおよびプラスミドＤＮＡの断片をＣＲＩＳＰＲ遺伝子座に組み込み、対応するＣＲＩＳＰＲＲＮＡ（「ｃｒＲＮＡ」）を使用して相同配列の分解を誘導することにより、免疫を提供する。各ＣＲＩＳＰＲ遺伝子座は、リピート配列によって隔てられている獲得された「スペーサー」をコードする。ＣＲＩＳＰＲ遺伝子座の転写により「プレｃｒＲＮＡ」が生成され、プレｃｒＲＮＡは処理されて、スペーサーに相補的なｄｓＤＮＡ配列を切断するようにエフェクターヌクレアーゼ複合体をガイドするスペーサー・リピート断片を含有するｃｒＲＮＡが生成される。

ＩＩ型ＣＲＩＳＰＲ遺伝子座は、Ｃａｓ９タンパク質をコードする遺伝子を含む４つの遺伝子、２つの非コードｃｒＲＮＡ：トランス活性化ｃｒＲＮＡ（ｔｒａｃｒＲＮＡ）および同一のダイレクトリピート（ＤＲ）によって間隔が空けられたヌクレアーゼガイド配列（「スペーサー」とも呼ばれる）を含有する前駆体ｃｒＲＮＡ（プレｃｒＲＮＡ）アレイを含む（Ｃｏｎｇら、上記）。ｔｒａｃｒＲＮＡは、プレｃｒＲＮＡの処理およびＣａｓ９複合体の形成に重要である。ＣＲＩＳＰＲによって誘導される病原性配列の分解は、３段階で起こる。第一に、ｔｒａｃｒＲＮＡがプレｃｒＲＮＡのリピート領域にハイブリッド形成する。第二に、内因性リボヌクレアーゼＩＩＩがハイブリッド形成したｃｒＲＮＡ－ｔｒａｃｒＲＮＡを切断し、第二の事象が各スペーサーの５’末端を除去して、ｔｒａｃｒＲＮＡとＣａｓ９の両方に会合したままの成熟ｃｒＲＮＡを生成する。第三に、各成熟複合体は、標的二本鎖ＤＮＡ（ｄｓＤＮＡ）配列の位置を特定し、両方の鎖を切断する。

真核細胞において使用するためのＣＲＩＳＰＲ／Ｃａｓ系の改変操作は、典型的には、ｃｒＲＮＡ－ｔｒａｃｒＲＮＡ－Ｃａｓ９複合体の再構成を伴う。ヒト細胞では、例えば、適切な核局在化シグナルを含めるために、Ｃａｓ９アミノ酸配列をコドン最適化および修飾することができ、ＲＮＡポリメラーゼＩＩプロモーターを介して、個別にまたは単一のキメラ分子としてｃｒＲＮＡおよびｔｒａｃｒＲＮＡ配列を発現させ得る。典型的には、ｃｒＲＮＡとｔｒａｃｒＲＮＡ配列はキメラとして発現され、まとめて「ガイドＲＮＡ」（ｇＲＮＡ）またはシングルガイドＲＮＡ（ｓｇＲＮＡ）と呼ばれる。したがって、「ガイドＲＮＡ」、「シングルガイドＲＮＡ」および「合成ガイドＲＮＡ」という用語は、本明細書では互換的に使用され、ガイド配列を含有するｔｒａｃｒＲＮＡとプレｃｒＲＮＡのアレイを含む核酸配列を指す。「ガイド配列」、「ガイド」および「スペーサー」という用語は、本明細書では互換的に使用され、標的部位を特定するガイドＲＮＡ内の約２０ヌクレオチド配列を指す。ＣＲＩＳＰＲ／Ｃａｓ９系では、ガイドＲＮＡは、２０ヌクレオチドのガイド配列とこれに後続する、ワトソン－クリック塩基対形成を介してＣａｓ９を標的配列に誘導するプロトスペーサー隣接モチーフ（ＰＡＭ）とを含有する（Ｄｅｖｅａｕら、Ａｎｎｕ．Ｒｅｖ．Ｍｉｃｒｏｂｉｏｌ．，６４：４７５－４９３（２０１０）；Ｊｉｎｅｋら、Ｓｃｉｅｎｃｅ，３３７：８１６－８２１（２０１２）；およびＸｉｅら、ＧｅｎｏｍｅＲｅｓ．，２４（９）：１５２６－１５３３（２０１４））。標準的なＰＡＭ配列は、ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓのＣａｓ９についてはＮＧＧまたはＮＡＧであり、髄膜炎菌（Ｎｅｉｓｓｅｒｉａｍｅｎｉｎｇｉｔｉｄｉｓ）のＣａｓ９についてはＮＮＮＮＧＡＴＴである。

本開示は、バリアントＣａｓタンパク質を提供する。バリアントＣａｓタンパク質は、任意の適切なＣａｓタンパク質（またはその相同体または修飾されたバージョン）に基づき得る、またはこれらに由来し得る。Ｃａｓタンパク質の非限定的な例には、Ｃａｓ１、Ｃａｓ１Ｂ、Ｃａｓ２、Ｃａｓ３、Ｃａｓ４、Ｃａｓ５、Ｃａｓ６、Ｃａｓ７、Ｃａｓ８、Ｃａｓ９（Ｃｓｎ１およびＣｓｘ１２としても知られる）、Ｃａｓ１０、Ｃｓｙ１、Ｃｓｙ２、Ｃｓｙ３、Ｃｓｅ１、Ｃｓｅ２、Ｃｓｃ１、Ｃｓｃ２、Ｃｓａ５、Ｃｓｎ２、Ｃｓｍ２、Ｃｓｍ３、Ｃｓｍ４、Ｃｓｍ５、Ｃｓｍ６、Ｃｍｒ１、Ｃｍｒ３、Ｃｍｒ４、Ｃｍｒ５、Ｃｍｒ６、Ｃｓｂ１、Ｃｓｂ２、Ｃｓｂ３、Ｃｓｘ１７、Ｃｓｘ１４、Ｃｓｘ１０、Ｃｓｘ１６、ＣｓａＸ、Ｃｓｘ３、Ｃｓｘ１、Ｃｓｘ１５、Ｃｓｆ１、Ｃｓｆ２、Ｃｓｆ３およびＣｓｆ４が含まれる。Ｃａｓタンパク質ファミリーは、例えば、Ｈａｆｔら、ＰＬｏＳＣｏｍｐｕｔ．Ｂｉｏｌ．，１（６）：ｅ６０（２００５）にさらに詳細に記載されている。一実施形態において、バリアントＣａｓタンパク質は、野生型Ｃａｓ９タンパク質に基づき、または野生型Ｃａｓ９タンパク質に由来する。Ｃａｓ９タンパク質は任意の適切な微生物から得ることができ、多くの細菌がＣａｓ９タンパク質バリアントを発現する。ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓおよびＳ．ｔｈｅｒｍｏｐｈｉｌｕｓ由来のＣａｓ９は当技術分野で広く使用されているが、他のＣａｓ９タンパク質は、Ｓ．ｐｙｏｇｅｎｅｓのＣａｓ９と高レベルの配列同一性を有し、同一のガイドＲＮＡを使用する。他の種のＣａｓ９タンパク質は当技術分野において公知であり（例えば、米国特許出願公開第２０１７／００５１３１２号を参照）、本開示に関連して使用され得る。Ｃａｓ９タンパク質は、例えば、Ｍａｌｉら、ＮａｔＭｅｔｈｏｄｓ，１０（１０）：９５７－９６３（２０１３）にさらに記載されており、様々な種からのＣａｓタンパク質のアミノ酸配列は、ＧｅｎＢａｎｋおよびＵｎｉＰｒｏｔデータベースを通じて公に入手可能である。

一実施形態において、バリアントＣａｓ９タンパク質は、ＳｔａｐｈｙｌｏｃｏｃｃｕｓａｕｒｅｕｓＣａｓ９（ＳａＣａｓ９）タンパク質、理想的には野生型Ｓ．ａｕｒｅｕｓＣａｓ９タンパク質から得られ、またはこれらに基づく。ＳａＣａｓ９は、小さく、効率的で、広範囲に標的化するＣａｓ９オルソログの検索において最近同定され、遺伝子治療用途のために、それらの送達がより便利で、効率的になった（Ｒａｎら、Ｎａｔｕｒｅ，５２０（７５４６）：１８６－１９１（２０１５））。ＳａＣａｓ９は、２１～２３ｎｔの長さのガイドＲＮＡ配列を使用して、哺乳動物細胞中で最も高い公知の編集効率を達成し、ダイレクトリピート：アンチリピート領域に関して一連の長さに適応することができる。ＳａＣａｓ９はＮＮＧＲＲＴのＰＡＭ配列を介して最も効率的にゲノム標的を切断するが、全てのＮＮＧＲＲＰＡＭはＳａＣａｓ９によって切断することができる（Ｒａｎら、上記；およびＦｒｉｅｄｌａｎｄら、ＧｅｎｏｍｅＢｉｏｌｏｇｙ，１６：２５７（２０１５））。例示的な野生型ＳａＣａｓ９アミノ酸配列には、ＵｎｉＰｒｏｔデータベースにアクセッション番号Ｊ７ＲＵＡ５（ＣＡＳ９＿ＳＴＡＡＵ）で寄託されたアミノ酸配列、および配列番号１が含まれる。ＳａＣａｓ９をコードする核酸配列を含むプラスミドは、Ａｄｄｇｅｎｅリポジトリから公に入手可能である。

一実施形態において、バリアントＳａＣａｓ９タンパク質は、配列番号１のアミノ酸配列を含むが、配列番号１の１またはそれを超えるアミノ酸残基の置換をさらに含む。アミノ酸の「置き換え」または「置換」は、所与の位置または残基における１つのアミノ酸の、ポリペプチド配列内の同じ位置または残基における別のアミノ酸による置き換えを指す。アミノ酸は、「芳香族」または「脂肪族」として広く分類される。芳香族アミノ酸は芳香環を含む。「芳香族」アミノ酸の例には、ヒスチジン（ＨまたはＨｉｓ）、フェニルアラニン（ＦまたはＰｈｅ）、チロシン（ＹまたはＴｙｒ）およびトリプトファン（ＷまたはＴｒｐ）が含まれる。非芳香族アミノ酸は、「脂肪族」として広く分類される。「脂肪族」アミノ酸の例には、グリシン（ＧまたはＧｌｙ）、アラニン（ＡまたはＡｌａ）、バリン（ＶまたはＶａｌ）、ロイシン（ＬまたはＬｅｕ）、イソロイシン（ＩまたはＨｅ）、メチオニン（ＭまたはＭｅｔ）、セリン（ＳまたはＳｅｒ）、スレオニン（ＴまたはＴｈｒ）、システイン（ＣまたはＣｙｓ）、プロリン（ＰまたはＰｒｏ）、グルタミン酸（ＥまたはＧｌｕ）、アスパラギン酸（ＡまたはＡｓｐ）、アスパラギン（ＮまたはＡｓｎ）、グルタミン（ＱまたはＧｉｎ）、リジン（ＫまたはＬｙｓ）およびアルギニン（ＲまたはＡｒｇ）が含まれる。

脂肪族アミノ酸は４つのサブグループに細分され得る。「大きな脂肪族非極性サブグループ」は、バリン、ロイシンおよびイソロイシンからなる。「脂肪族のわずかに極性のサブグループ」は、メチオニン、セリン、スレオニンおよびシステインでからなる。「脂肪族極性／荷電サブグループ」は、グルタミン酸、アスパラギン酸、アスパラギン、グルタミン、リジンおよびアルギニンからなる。「小残基サブグループ」は、グリシンおよびアラニンからなる。荷電／極性アミノ酸のグループは、リジンおよびアルギニンからなる「正に荷電したサブグループ」、グルタミン酸およびアスパラギン酸からなる「負に荷電したサブグループ」ならびにアスパラギンおよびグルタミンからなる「極性サブグループ」という３つのサブグループに細分され得る。

芳香族アミノ酸は、ヒスチジンおよびトリプトファンからなる「窒素環サブグループ」ならびにフェニルアラニンおよびチロシンからなる「フェニルサブグループ」という２つのサブグループに細分され得る。

アミノ酸の置き換えまたは置換は、保存的、半保存的または非保存的であり得る。「保存的アミノ酸置換」または「保存的変異」という句は、あるアミノ酸を共通の特性を有する別のアミノ酸によって置き換えることを指す。個々のアミノ酸間の共通の特性を定義するための機能的な方法は、相同的生物の対応するタンパク質間のアミノ酸変化の正規化された頻度を分析することである（ＳｃｈｕｌｚａｎｄＳｃｈｉｒｍｅｒ，ＰｒｉｎｃｉｐｌｅｓｏｆＰｒｏｔｅｉｎＳｔｒｕｃｔｕｒｅ，Ｓｐｒｉｎｇｅｒ－Ｖｅｒｌａｇ，ＮｅｗＹｏｒｋ（１９７９））。このような分析によれば、グループ内のアミノ酸が互いと優先的に交換し、したがって、全体的なタンパク質構造に対するそれらの影響において互いに最も類似している場合に、アミノ酸のグループが定義され得る（ＳｃｈｕｌｚおよびＳｃｈｉｒｍｅｒ、前出）。

保存的アミノ酸置換の例には、上記のサブグループ内でのアミノ酸の置換、例えば、正電荷が維持され得るようにアルギニンをリジンに、およびその逆、負電荷が維持され得るようにアスパラギン酸をグルタミン酸に、およびその逆、遊離－ＯＨが維持され得るようにスレオニンをセリンに、および遊離－ＮＨ_２が維持され得るようにアスパラギンをグルタミンに置換することが含まれる。

「半保存的変異」には、上に列記された同じグループ内であるが、同じサブグループ内ではないアミノ酸のアミノ酸置換が含まれる。例えば、アスパラギンをアスパラギン酸に、またはリジンをアスパラギンに置換することは、同じグループ内であるが、異なるサブグループのアミノ酸を含む。「非保存的変異」は、例えば、トリプトファンをリジンに、またはセリンをフェニルアラニンに置換するなど、異なるグループ間でのアミノ酸置換を含む。

バリアントＳａＣａｓ９タンパク質は、該バリアントＳａＣａｓ９が親ＳａＣａｓ９タンパク質の有用な活性を保持している限り、または、より好ましくは、親タンパク質と比較して増強された活性または特性（例えば、ヌクレアーゼ活性、ガイドＲＮＡおよび標的ＤＮＡと相互作用する能力など）を示す限り、配列番号１の適切なアミノ酸置換の任意の１つもしくはそれらの組み合わせを含み得る、配列番号１の適切なアミノ酸置換の任意の１つもしくはそれらの組み合わせから本質的になり得る、または配列番号１の適切なアミノ酸置換の任意の１つもしくはそれらの組み合わせからなり得る。一実施形態において、バリアントＳａＣａｓ９タンパク質は、アミノ酸残基Ｅ７８２、Ｎ９６８、Ｎ９８６およびＲ９９１の１またはそれより多くが異なるアミノ酸で置換されていることを除いて、配列番号１のアミノ酸配列を含む。これらの位置のアミノ酸はそれぞれ個別に修飾され得、または組み合わせが修飾され得る（例えば、位置９８６および９９１、位置９６８および９８６、位置７８２および９８６、位置７８２、９８６および９９１、位置９６８、９８６および９９１が修飾されている）。配列番号１の９８６位のアスパラギン残基は、例えば、アラニン（Ｎ９８６Ａ）、アルギニン（Ｎ９８６Ｒ）、リジン（Ｎ９８６Ｋ）またはヒスチジン（Ｎ９８６Ｈ）などの任意の適切なアミノ酸残基で置換され得る。同様に、配列番号１の９９１位のアルギニン残基は、例えば、アラニン（Ｒ９９１Ａ）、リジン（Ｒ９９１Ｋ）、ロイシン（Ｒ９９１Ｌ）、システイン（Ｒ９９１Ｃ）またはバリン（Ｒ９９１Ｖ）などの任意の適切なアミノ酸残基で置換され得る。配列番号１の７８２位のグルタミン酸残基は、例えば、リジン（Ｅ７８２Ｋ）、アルギニン（Ｅ７８２Ｒ）またはヒスチジン（Ｅ７８２Ｈ）などの任意の適切なアミノ酸残基で置換され得る。配列番号１の９６８位のアスパラギン残基は、例えば、リジン（Ｎ９６８Ｋ）、アルギニン（Ｎ９６８Ｒ）またはヒスチジン（Ｎ９６８Ｈ）などの任意の適切なアミノ酸残基で置換され得る。

いくつかの実施形態において、バリアントＳａＣａｓ９タンパク質は、Ｎ８８５（アスパラギン、Ａｓｎ）、Ｋ８８６（リジン、Ｋ）、Ｌ８８７（ロイシン、Ｌ）、Ｎ８８８（アスパラギン、Ａｓｎ）、Ａ８８９（アラニン、Ａｌａ）、Ｒ１０１５（アルギニン、Ａｒｇ）およびＴ１０１９（スレオニン、Ｔｈｒ）から選択される配列番号１の１またはそれを超える残基のアミノ酸置換をさらに含み得る。配列番号１の８８５位のアスパラギン残基は、例えば、リジン（Ｎ８８５Ｋ）などの任意の適切なアミノ酸残基で置換され得る。配列番号１の８８６位のリジン残基は、例えば、アスパラギン（Ｋ８８６Ｎ）またはアルギニン（Ｋ８８６Ｒ）などの任意の適切なアミノ酸残基で置換され得る。配列番号１の８８７位のリジン残基は、例えば、ロイシン（Ｌ８８７Ｋ）などの任意の適切なアミノ酸残基で置換され得る。配列番号１の８８８位のリジン残基は、例えば、アスパラギン（Ｎ８８８Ｋ）などの任意の適切なアミノ酸残基で置換され得る。配列番号１の８８９位のアラニン残基は、例えば、ヒスチジン（Ａ８８９Ｈ）、リジン（Ａ８８９Ｋ）またはアスパラギン（Ａ８８９Ｎ）などの任意の適切なアミノ酸残基で置換され得る。配列番号１の１０１５位のアルギニン残基は、例えば、ヒスチジン（Ｒ１０１５Ｈ）などの任意の適切なアミノ酸残基で置換され得る。配列番号１の１０１９位のスレオニンは、例えば、アルギニン（Ｔ１０１９Ｒ）、リジン（Ｔ１０１９Ｋ）またはヒスチジン（Ｔ１０１９Ｈ）などの任意の適切なアミノ酸残基で置換され得る。

バリアントＳａＣａｓ９タンパク質は、配列番号１の上記アミノ酸置換の任意の１つもしくはそれらの組み合わせを含み得る、配列番号１の上記アミノ酸置換の任意の１つもしくはそれらの組み合わせから本質的になり得る、または配列番号１の上記アミノ酸置換の任意の１つもしくはそれらの組み合わせからなり得る。いくつかの実施形態において、バリアントＣａｓ９タンパク質は、配列番号１のアミノ酸配列および２またはそれを超える（例えば、２、３、４、５またはそれを超える）アミノ酸置換を含む。例えば、バリアントＳａＣａｓ９タンパク質は、Ｎ９８６ＲおよびＲ９９１Ａ；Ｎ９８６ＲおよびＲ９９１Ｋ；Ｎ９８６ＲおよびＲ９９１Ｌ；Ｎ８８５ＫおよびＮ９８６Ｒ；Ｋ８８６ＮおよびＮ９８６Ｒ；Ｋ８８６ＲおよびＮ９８６Ｒ；Ｌ８８７ＫおよびＮ９８６Ｒ；Ｎ８８８ＫおよびＮ９８６Ｒ；Ａ８８９ＨおよびＮ９８６Ｒ；Ａ８８９ＫおよびＮ９８６Ｒ；Ａ８８９ＮおよびＮ９８６Ｒ；Ｅ７８２ＫおよびＮ９８６Ｒ；Ｎ９６８ＫおよびＮ９８６Ｒ；Ｅ７８２ＫおよびＮ９８６Ｒ；Ｎ９６８ＫおよびＮ９８６Ｒまたは前述の置換の２つの任意のその他の組み合わせを含むがこれらに限定されない、配列番号１の２つのアミノ酸残基の置換を含み得る、配列番号１の２つのアミノ酸残基の置換から本質的になり得る、または配列番号１の２つのアミノ酸残基の置換からなり得る。他の実施形態において、バリアントＳａＣａｓ９タンパク質は、Ｎ９８６Ｒ、Ｒ９９１ＡおよびＴ１０１９Ｒ；Ｎ９８６Ｒ、Ｒ９９１ＡおよびＴ１０１９Ｋ；Ｎ９８６Ｒ、Ｒ９９１ＡおよびＴ１０１９Ｈ；Ｎ９８６Ｒ、Ｒ９９１ＫおよびＴ１０１９Ｒ；Ｎ９８６Ｒ、Ｒ９９１ＫおよびＴ１０１９Ｋ；Ｎ９８６Ｒ、Ｒ９９１ＫおよびＴ１０１９Ｈ；Ｎ９８６Ｒ、Ｒ９９１ＬおよびＴ１０１９Ｒ；Ｎ９８６Ｒ、Ｒ９９１ＬおよびＴ１０１９Ｋ；Ｎ９８６Ｒ、Ｒ９９１ＬおよびＴ１０１９Ｈ；Ｎ９８６Ｒ、Ｒ９９１ＣおよびＴ１０１９Ｒ；Ｎ９８６Ｒ、Ｒ９９１ＣおよびＴ１０１９Ｋ；Ｎ９８６Ｒ、Ｒ９９１ＣおよびＴ１０１９Ｈ；Ｎ９８６Ｒ、Ｒ９９１ＶおよびＴ１０１９Ｒ；Ｎ９８６Ｒ、Ｒ９９１ＶおよびＴ１０１９Ｋ；Ｎ９８６Ｒ、Ｒ９９１ＶおよびＴ１０１９Ｈ；Ｎ８８５Ｋ、Ｎ９８６ＲおよびＲ９９１Ｌ；Ｋ８８６Ｎ、Ｎ９８６ＲおよびＲ９９１Ｌ；Ｋ８８６Ｒ、Ｎ９８６ＲおよびＲ９９１Ｌ；Ｌ８８７Ｋ、Ｎ９８６ＲおよびＲ９９１Ｌ；Ｎ８８８Ｋ、Ｎ９８６ＲおよびＲ９９１Ｌ；Ａ８８９Ｈ、Ｎ９８６ＲおよびＲ９９１Ｌ；Ａ８８９Ｋ、Ｎ９８６ＲおよびＲ９９１Ｌ；Ａ８８９Ｎ、Ｎ９８６ＲおよびＲ９９１Ｌ；Ｅ７８２Ｋ、Ｎ９６８ＫおよびＮ９８６Ｒ；Ｅ７８２Ｋ、Ｎ９８６ＲおよびＲ１０１５Ｈ；Ｎ９６８Ｋ、Ｎ９８６ＲおよびＲ１０１５Ｈ；Ｅ７８２Ｋ、Ｎ９８６ＲおよびＲ９９１Ｌ；Ｎ９６８Ｋ、Ｎ９８６ＲおよびＲ９９１Ｌ；または前述の置換の３つの任意の組み合わせを含むがこれらに限定されない、配列番号１の３つのアミノ酸残基の置換を含み得る、配列番号１の３つのアミノ酸残基の置換から本質的になり得る、または配列番号１の３つのアミノ酸残基の置換からなり得る。他の実施形態において、バリアントＳａＣａｓ９タンパク質は、Ｅ７８２Ｋ、Ｎ９６８Ｋ、Ｎ９８６ＲおよびＲ１０１５Ｈ；Ｅ７８２Ｋ、Ｎ９６８Ｋ、Ｎ９８６ＲおよびＲ９９１Ｌ；Ｅ７８２Ｋ、Ｎ９８６Ｒ、Ｒ９９１ＬおよびＲ１０１５Ｈ；Ｎ９６８Ｋ、Ｎ９８６Ｒ、Ｒ９９１ＬおよびＲ１０１５Ｈ、または前述の置換の４つの任意の組み合わせを含むがこれらに限定されない、配列番号１の４つのアミノ酸残基の置換を含み得る、配列番号１の４つのアミノ酸残基の置換から本質的になり得る、または配列番号１の４つのアミノ酸残基の置換からなり得る。いくつかの実施形態において、バリアントＳａＣａｓ９タンパク質は、Ｅ７８２Ｋ、Ｎ９６８Ｋ、Ｎ９８６Ｒ、Ｒ９９１ＬおよびＲ１０１５Ｈ、または前述の置換の５つの任意の組み合わせを含むがこれらに限定されない、配列番号１の５つのアミノ酸残基の置換を含み得る、配列番号１の５つのアミノ酸残基の置換から本質的になり得る、または配列番号１の５つのアミノ酸残基の置換からなり得る。５を超えるアミノ酸置換（例えば、６、７、８、９、１０またはそれを超える置換）を含むバリアントＳａＣａｓ９タンパク質も、本開示の範囲内である。

いくつかの実施形態において、本開示は、本明細書に記載されているアミノ酸置換のいずれかを有するまたは有さない、配列番号１と少なくとも９０％同一（例えば、少なくとも９１％、少なくとも９２％、少なくとも９３％、少なくとも９４％、少なくとも９５％、少なくとも９６％、少なくとも９７％、少なくとも９８％、少なくとも９９％、または１００％同一）であるアミノ酸配列を含むＣａｓ９タンパク質を提供する。核酸またはアミノ酸配列の同一性は、本明細書に記載されるように、関心対象の核酸またはアミノ酸配列を参照核酸またはアミノ酸配列と比較することによって決定することができる。

本開示は、本明細書に記載のバリアントＳａＣａｓ９タンパク質をコードする単離されたまたは精製された核酸配列も提供する。宿主細胞（例えば、哺乳動物細胞）中での核酸配列の発現を与える１またはそれを超える発現制御配列（例えば、プロモーター、エンハンサー、ポリアデニル化シグナル、転写ターミネーター、内部リボソーム進入部位（ＩＲＥＳ）など）に必要に応じて機能的に連結された、前記単離された核酸を含むベクターも提供される。ベクターは、例えば、プラスミド、エピソーム、コスミド、ウイルスベクター（例えば、レトロウイルス、アデノウイルス、レンチウイルスまたはアデノ随伴ウイルスベクター）、またはファージであり得る。適切なベクターおよびベクター調製の方法は当技術分野で周知である（例えば、Ｓａｍｂｒｏｏｋら、ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ，ａＬａｂｏｒａｔｏｒｙＭａｎｕａｌ，３ｒｄｅｄｉｔｉｏｎ，ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＰｒｅｓｓ，ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒ，Ｎ．Ｙ．（２００１）およびＡｕｓｕｂｅｌら、ＣｕｒｒｅｎｔＰｒｏｔｏｃｏｌｓｉｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ，ＧｒｅｅｎｅＰｕｂｌｉｓｈｉｎｇＡｓｓｏｃｉａｔｅｓａｎｄＪｏｈｎＷｉｌｅｙ＆Ｓｏｎｓ，ＮｅｗＹｏｒｋ，Ｎ．Ｙ．（１９９４）参照）。ベクター系における遺伝子発現を制御するための例示的な発現制御配列には、例えば、Ｇｏｅｄｄｅｌ，ＧｅｎｅＥｘｐｒｅｓｓｉｏｎＴｅｃｈｎｏｌｏｇｙ：ＭｅｔｈｏｄｓｉｎＥｎｚｙｍｏｌｏｇｙ，Ｖｏｌ．１８５，ＡｃａｄｅｍｉｃＰｒｅｓｓ，ＳａｎＤｉｅｇｏ，Ｃａｌｉｆ．（１９９０），Ｓａｍｂｒｏｏｋら、前出；およびＡｕｓｕｂｅｌら、前出に記載されている原核生物および真核生物の配列が含まれる。

プロモーターなどの発現制御配列の選択は、本明細書に記載のベクターおよび系の特定の用途に依存する。様々な異なる供給源からの構成的、誘導性および抑制性プロモーターを含む多数のプロモーターが当技術分野で周知である。プロモーターの代表的な供給源には、例えば、ウイルス、哺乳動物、昆虫、植物、酵母および細菌が含まれ、これらの供給源からの適切なプロモーターは、容易に入手可能であり、または、例えば、ＡＴＣＣなどの寄託機関および他の商業的なまたは個人的な供給源から公に入手可能な配列に基づいて、合成的に作製することができる。プロモーターは、一方向（すなわち、一方向に転写を開始する）または双方向（すなわち、３’または５’方向に転写を開始する）であり得る。プロモーターの非限定的な例には、例えば、Ｔ７細菌発現系、ｐＢＡＤ（ａｒａＡ）細菌発現系、サイトメガロウイルス（ＣＭＶ）プロモーター、ＳＶ４０プロモーター、ＲＳＶプロモーターが含まれる。誘導性プロモーターには、例えば、Ｔｅｔ系（米国特許第５，４６４，７５８号および同第５，８１４，６１８号）、エクジソン誘導系（Ｎｏら、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．，９３：３３４６－３３５１（１９９６））、Ｔ－ＲＥＸ（商標）系（Ｉｎｖｉｔｒｏｇｅｎ，Ｃａｒｌｓｂａｄ，Ｃａｌｉｆ．）、ＬＡＣＳＷＩＴＣＨ（商標）系（Ｓｔｒａｔａｇｅｎｅ，ＳａｎＤｉｅｇｏ，Ｃａｌｉｆ．）、およびＣｒｅ－ＥＲＴタモキシフェン誘導性リコンビナーゼ系（Ｉｎｄｒａら、Ｎｕｃ．Ａｃｉｄ．Ｒｅｓ．，２７：４３２４－４３２７（１９９９）；Ｎｕｃ．Ａｃｉｄ．Ｒｅｓ．，２８：ｅ９９（２０００）；米国特許第７，１１２，７１５号；およびＫｒａｍｅｒ＆Ｆｕｓｓｅｎｅｇｇｅｒ，ＭｅｔｈｏｄｓＭｏｌ．Ｂｉｏｌ．，３０８６：１２３－１４４（２００５））が含まれる。

バリアントＳａＣａｓ９タンパク質をコードする核酸配列は、同族のガイドＲＮＡ配列（ｓｇＲＮＡ）と同じベクター上で（すなわち、シスで）細胞に提供することができる。このような実施形態では、各核酸配列の発現を制御するために、一方向性プロモーターを使用することができる。別の実施形態では、複数の核酸配列の発現を制御するために、双方向性プロモーターと一方向性プロモーターの組み合わせを使用することができる。他の実施形態では、バリアントＳａＣａｓ９タンパク質をコードする核酸配列およびその同族のガイドＲＮＡ配列は、別個のベクター上で（すなわち、トランスで）細胞に提供され得る。別個のベクターの各々における核酸配列の各々は、同一のまたは異なる発現制御配列を含むことができる。別個のベクターは、同時にまたは逐次に細胞に提供することができる。

バリアントＳａＣａｓ９タンパク質をコードする核酸配列を含むベクターは、任意の適切な原核細胞または真核細胞を含む、該ベクターによってコードされるポリペプチドを発現することができる宿主細胞中に導入することができる。したがって、本開示は、本明細書に開示されるベクターまたは核酸配列を含む単離された細胞を提供する。好ましい宿主細胞は、容易かつ確実に成長させることができ、適度に速い成長速度を有し、十分に特徴付けられた発現系を有し、容易かつ効率的に形質転換または形質移入することができるものである。適切な原核細胞の例には、Ｂａｃｉｌｌｕｓ属（ＢａｃｉｌｌｕｓｓｕｂｔｉｌｉｓおよびＢａｃｉｌｌｕｓｂｒｅｖｉｓなど）、Ｅｓｃｈｅｒｉｃｈｉａ属（大腸菌など）、Ｐｓｅｕｄｏｍｏｎａｓ属、Ｓｔｒｅｐｔｏｍｙｃｅｓ属、Ｓａｌｍｏｎｅｌｌａ属およびＥｎｖｉｎｉａ属からの細胞が含まれるが、これらに限定されない。適切な真核細胞は当技術分野で公知であり、例えば、酵母細胞、昆虫細胞および哺乳動物細胞が含まれる。適切な酵母細胞の例には、Ｋｌｕｙｖｅｒｏｍｙｃｅｓ属、Ｐｉｃｈｉａ属、Ｒｈｉｎｏ－ｓｐｏｒｉｄｉｕｍ属、Ｓａｃｃｈａｒｏｍｙｃｅｓ属およびＳｃｈｉｚｏｓａｃｃｈａｒｏｍｙｃｅｓ属からの細胞が含まれる。例示的な昆虫細胞には、Ｓｆ－９およびＨＩＳ（Ｉｎｖｉｔｒｏｇｅｎ，Ｃａｒｌｓｂａｄ，Ｃａｌｉｆ．）が含まれ、例えば、Ｋｉｔｔｓら、Ｂｉｏｔｅｃｈｎｉｑｕｅｓ，１４：８１０－８１７（１９９３）；Ｌｕｃｋｌｏｗ，Ｃｕｒｒ．Ｏｐｉｎ．Ｂｉｏｔｅｃｈｎｏｌ．，４：５６４－５７２（１９９３）；およびＬｕｃｋｌｏｗら、Ｊ．Ｖｉｒｏｌ．，６７：４５６６－４５７９（１９９３）に記載されている。望ましくは、宿主細胞は哺乳動物細胞であり、いくつかの実施形態において、宿主細胞はヒト細胞である。多くの適切な哺乳動物およびヒト宿主細胞が当技術分野で公知であり、多くはアメリカ培養細胞系統保存機関（ＡＴＣＣ、Ｍａｎａｓｓａｓ、Ｖａ．）から入手可能である。適切な哺乳動物細胞の例には、チャイニーズハムスター卵巣細胞（ＣＨＯ）（ＡＴＣＣ番号ＣＣＬ６１）、ＣＨＯＤＨＦＲ細胞（Ｕｒｌａｕｂら、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ，９７：４２１６－４２２０（１９８０））、ヒト胎児由来腎臓（ＨＥＫ）２９３または２９３Ｔ細胞（ＡＴＣＣ番号ＣＲＬ１５７３）および３Ｔ３細胞（ＡＴＣＣ番号ＣＣＬ９２）が含まれるが、これらに限定されない。他の適切な哺乳動物細胞系は、サルＣＯＳ－１（ＡＴＣＣ番号ＣＲＬ１６５０）およびＣＯＳ－７細胞系（ＡＴＣＣ番号ＣＲＬ１６５１）、ならびにＣＶ－１細胞系（ＡＴＣＣ番号ＣＣＬ７０）である。さらなる例示的な哺乳動物宿主細胞には、形質転換された細胞系を含む、霊長類、齧歯類およびヒト細胞系が含まれる。正常な二倍体細胞、初代組織のインビトロ培養に由来する細胞株、ならびに初代外植片も適切である。他の適切な哺乳動物細胞系には、マウス神経芽細胞腫Ｎ２Ａ細胞、ＨｅＬａ、マウスＬ－９２９細胞、およびＢＨＫまたはＨａＫハムスター細胞系が含まれるが、これらに限定されず、これらは全て、ＡＴＣＣから入手可能である。適切な哺乳動物宿主細胞を選択するための方法、ならびに細胞の形質転換、培養、増幅、スクリーニングおよび精製のための方法は、当技術分野で公知である。

本開示は、本明細書に記載のバリアントＳａＣａｓ９タンパク質を含むＣＲＩＳＰＲ／Ｃａｓ系を提供する。本明細書で使用される場合、「ＣＲＩＳＰＲ／Ｃａｓ系」は、Ｃａｓ遺伝子、Ｃａｓタンパク質、ｔｒａｃｒ（トランス活性化ＣＲＩＳＰＲ）配列（例えば、ｔｒａｃｒＲＮＡまたは活性を有する部分的ｔｒａｃｒＲＮＡ）、ｃｒ（ＣＲＩＳＰＲ）配列（例えば、ｃｒＲＮＡまたは活性を有する部分的ｃｒＲＮＡ）をコードする配列またはＣＲＩＳＰＲ遺伝子座からのその他の配列および転写物を含む、ＣＲＩＳＰＲ関連（「Ｃａｓ」）遺伝子の発現および／またはその活性の誘導に関わる転写物およびその他の要素を総称する。いくつかの実施形態において、ＣＲＩＳＰＲ系の１またはそれを超える要素は、Ｉ型、ＩＩ型またはＩＩＩ型のＣＲＩＳＰＲ系に由来する。いくつかの実施形態において、ＣＲＩＳＰＲ系の１またはそれを超える要素は、ＳｔａｐｈｙｌｏｃｏｃｃｕｓａｕｒｅｕｓまたはＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓなどの内因性ＣＲＩＳＰＲ系を含む特定の生物に由来する。ある特定の実施形態において、Ｃａｓ９タンパク質は、ベクターとは別個の、ベクターと関連する、またはベクターによってコードされる系中に含まれ得る。したがって、本開示は、（ａ）宿主細胞中の標的ゲノムＤＮＡ配列に相補的なガイドＲＮＡ配列であって、前記標的ゲノムＤＮＡ配列が少なくとも１つの遺伝子産物をコードする、ガイドＲＮＡ配列と、（ｂ）本明細書に記載のバリアントＳａＣａｓ９タンパク質をコードする核酸配列を含む核酸分子と、を含む系を提供する。他の実施形態において、本開示は、（ａ）宿主細胞中の標的ゲノムＤＮＡ配列に相補的なガイドＲＮＡ配列であって、前記標的ゲノムＤＮＡ配列が少なくとも１つの遺伝子産物をコードする、ガイドＲＮＡ配列と、（ｂ）本明細書に記載のバリアントＳａＣａｓ９タンパク質と、を含む系を提供する。系がガイドＲＮＡ配列とバリアントＳａＣａｓ９タンパク質をコードする核酸配列とを含む場合、上記のように、ガイドＲＮＡ配列およびバリアントＳａＣａｓ９タンパク質をコードする核酸分子は、異なるベクター中に存在し得る、または同一のベクター中に存在し得る。Ｃａｓ９タンパク質がベクターとは別個の系に含まれる場合、Ｃａｓ９タンパク質は、望ましくは、単独でまたはガイドＲＮＡ配列を含むベクターと組み合わせて単一の組成物（例えば、薬学的組成物）中に含まれ、物理的または化学的にベクターには結合されない。他の実施形態では、Ｃａｓ９タンパク質がベクターに物理的にまたは化学的に連結または結合されていれば、Ｃａｓ９タンパク質とベクターの間で複合体が形成されるように（例えば、Ｃａｓ９タンパク質とウイルスベクターの間の複合体）、Ｃａｓ９タンパク質を、ガイドＲＮＡ配列を含むベクターと「会合」させ得る。Ｃａｓ９タンパク質を、当技術分野で公知のタンパク質－タンパク質連結またはタンパク質－ウイルス連結のための任意の適切な方法を使用して、ベクターと会合させることができる。

「標的配列」、「標的核酸」および「標的部位」（例えば、「標的ゲノムＤＮＡ配列」）という用語は、ガイド配列（例えば、ガイドＲＮＡ）がそれに対して相補性を有するように設計されている宿主細胞中のポリヌクレオチド（核酸、遺伝子、染色体、ゲノムなど）を表すために、本明細書で互換的に使用され、標的配列とガイド配列間のハイブリダイゼーションは、結合のために十分な条件が存在すれば、ＣＲＩＳＰＲ複合体の形成を促進する。本明細書で使用される「ゲノム（ｇｅｎｏｍｉｃ）」という用語は、細胞内の染色体上に位置する核酸配列（例えば、遺伝子または遺伝子座）を指す。ハイブリダイゼーションを引き起こし、ＣＲＩＳＰＲ複合体の形成を促進するのに十分な相補性が存在すれば、標的配列とガイド配列は完全な相補性を示す必要はない。標的配列は、ＤＮＡまたはＲＮＡなどの任意のポリヌクレオチドを含み得る。適切なＤＮＡ／ＲＮＡ結合条件には、細胞中に通常存在する生理学的条件が含まれる。他の適切なＤＮＡ／ＲＮＡ結合条件（例えば、無細胞系における条件）は当技術分野で公知であり、例えば、本明細書で参照され、参照により組み込まれるＳａｍｂｒｏｏｋを参照されたい。ＤＮＡを標的とするＲＮＡに相補的で、該ＲＮＡとハイブリッドを形成する標的ＤＮＡの鎖は「相補鎖」と呼ばれ、「相補鎖」に相補的である（したがって、ＤＮＡを標的とするＲＮＡに対しては相補的でない）標的ＤＮＡの鎖は「非相補鎖（ｎｏｎｃｏｍｐｌｅｍｅｎｔａｒｙｓｔｒａｎｄ）」または「非－相補鎖（ｎｏｎ－ｃｏｍｐｌｅｍｅｎｔａｒｙｓｔｒａｎｄ）」と呼ばれる。

標的ゲノムＤＮＡ配列は、望ましくは、遺伝子産物をコードする。本明細書で使用される「遺伝子産物」という用語は、遺伝子の発現から生じる任意の生化学的産物を指す。遺伝子産物はＲＮＡまたはタンパク質であり得る。ＲＮＡ遺伝子産物には、ｔＲＮＡ、ｒＲＮＡ、マイクロＲＮＡ（ｍｉＲＮＡ）、低分子干渉ＲＮＡ（ｓｉＲＮＡ）などの非コードＲＮＡ、およびメッセンジャーＲＮＡ（ｍＲＮＡ）などのコードＲＮＡが含まれる。いくつかの実施形態において、標的ゲノムＤＮＡ配列は、タンパク質またはポリペプチドをコードする。

本開示は、宿主細胞中の標的ゲノムＤＮＡ配列を改変する方法であって、標的ゲノムＤＮＡ配列を含む宿主細胞を、本明細書に記載の系と接触させることを含み、（ａ）前記ガイドＲＮＡ配列は前記宿主細胞中で発現され、前記宿主細胞ゲノム中の前記標的ゲノムＤＮＡ配列に結合し、（ｂ）前記バリアントＳａＣａｓ９タンパク質は前記宿主細胞中で発現され、前記標的ゲノムＤＮＡ配列中に二本鎖切断を誘導し、それによって前記宿主細胞中の前記標的ゲノムＤＮＡ配列を改変する、方法も提供する。本発明の系に関連して上記したバリアントＳａＣａｓ９タンパク質、ガイドＲＮＡ配列、宿主細胞、標的ゲノムＤＮＡ配列およびこれらの構成成分の説明は、宿主細胞中の標的ゲノムＤＮＡ配列を改変する方法にも該当し得る。

本明細書で使用される「ＤＮＡ配列を改変する」という句は、関心対象の野生型ＤＮＡ配列の少なくとも１つの物理的特徴を修飾することを指す。ＤＮＡの改変には、例えば、一本鎖または二本鎖ＤＮＡの切断、１またはそれを超えるヌクレオチドの欠失または挿入、およびＤＮＡ配列の構造的完全性またはヌクレオチド配列に影響を与えるその他の修飾が含まれる。一実施形態において、この方法は、標的ＤＮＡ配列中に一本鎖または二本鎖切断を導入する。この点で、バリアントＳａＣａｓ９タンパク質は、標的ゲノムＤＮＡ配列内および／または標的配列の相補物（ｃｏｍｐｌｅｍｅｎｔ）内など、標的ＤＮＡ配列の一方または両方の鎖の切断を誘導する。いくつかの実施形態において、バリアントＳａＣａｓ９タンパク質は、標的配列の最初または最後のヌクレオチドから約１、２、３、４、５、６、７、８、９、１０、１５、２０、２５、５０、１００、２００、５００またはそれを超える塩基対以内で、標的配列の一方または両方の鎖の切断を誘導する。

望ましくは、開示された方法は、標的ＤＮＡ配列の発現をモジュレートするように、すなわち、標的ＤＮＡ配列の発現が増加または減少するように、宿主細胞内の標的ゲノムＤＮＡ配列を改変する。一実施形態において、バリアントＳａＣａｓ９タンパク質は、宿主細胞の標的ＤＮＡ配列を切断して、二本鎖ＤＮＡ切断を生成する。二本鎖切断は、非相同末端結合（ＮＨＥＪ）または相同組換えのいずれかによって宿主細胞によって修復することができる。ＮＨＥＪでは、二本鎖切断は、切断端を互いに直接連結することによって修復される。そのため、ＤＮＡ切断位置中に新たな核酸材料は挿入されないが、一部の核酸材料が失われることがあり得、欠失をもたらす。相同組換え修復では、切断された標的ＤＮＡ配列の修復のためのテンプレートとして、切断された標的ＤＮＡ配列に対して相同性を有する別のＤＮＡ配列を含むドナー核酸分子が使用され、ドナー核酸分子から標的ＤＮＡへの遺伝情報の伝達が生じる。その結果、新たな核酸材料がＤＮＡ切断部位中に挿入／コピーされる。ＮＨＥＪおよび／または相同組換え修復による標的配列の修飾は、例えば、遺伝子修正、遺伝子置換、遺伝子タグ付け、導入遺伝子挿入、ヌクレオチド欠失、遺伝子破壊、遺伝子変異、遺伝子ノックダウンなどをもたらす。

いくつかの実施形態において、本明細書に記載の系および方法は、遺伝子中の１またはそれを超える欠陥または変異を修正するために使用され得る（「遺伝子修正（ｇｅｎｅｃｏｒｒｅｃｔｉｏｎ）」と呼ばれる）。このような事例では、標的ゲノムＤＮＡ配列は遺伝子の欠陥のあるバージョンをコードし、ＣＲＩＳＰＲ／Ｃａｓ系は、該遺伝子の野生型または修正されたバージョンをコードするドナー核酸分子をさらに含む。したがって、言い換えれば、標的ゲノムＤＮＡ配列は「疾患関連」遺伝子である。「疾患関連遺伝子」という用語は、その遺伝子産物が、疾患に罹患していない個体から得られた組織または細胞と比較して、疾患に罹患した個体から得られた細胞において異常なレベルでまたは異常な形態で発現される任意の遺伝子またはポリヌクレオチドを指す。疾患関連遺伝子は、異常に高いレベルまたは異常に低いレベルで発現され得、変化した発現は、疾患の発生および／または進行と相関する。疾患関連遺伝子は、その変異または遺伝的変異（ｇｅｎｅｔｉｃｖａｒｉａｔｉｏｎ）が直接的に原因である遺伝子、または疾患の病因に関与する遺伝子（複数可）と連鎖不平衡にある遺伝子も指す。このような「単一遺伝子（ｓｉｎｇｌｅｇｅｎｅ）」または「単一遺伝子（ｍｏｎｏｇｅｎｉｃ）」疾患の原因となる遺伝子の例には、アデノシンデアミナーゼ、α－１アンチトリプシン、嚢胞性線維症膜貫通コンダクタンス調節因子（ＣＦＴＲ）、β－ヘモグロビン（ＨＢＢ）、眼皮膚白皮症ＩＩ（ＯＣＡ２）、ハンチンチン（ＨＴＴ）、筋緊張性ジストロフィータンパク質キナーゼ（ＤＭＰＫ）、低密度リポタンパク質受容体（ＬＤＬＲ）、アポリポタンパク質Ｂ（ＡＰＯＢ）、ニューロフィブロミン１（ＮＦ１）、多嚢胞性腎疾患１（ＰＫＤ１）、多嚢胞性腎疾患２（ＰＫＤ２）、凝固因子ＶＩＩＩ（Ｆ８）、ジストロフィン（ＤＭＤ）、リン酸調節エンドペプチダーゼホモログ、Ｘ連鎖性（ＰＨＥＸ）、メチル－ＣｐＧ結合タンパク質２（ＭＥＣＰ２）およびユビキチン特異的ペプチダーゼ９Ｙ、Ｙ連鎖性（ＵＳＰ９Ｙ）が含まれるが、これらに限定されない。他の単一遺伝子（ｓｉｎｇｌｅｇｅｎｅ）または単一遺伝子（ｍｏｎｏｇｅｎｉｃ）疾患は当技術分野で公知であり、例えば、Ｃｈｉａｌ，Ｈ．ＲａｒｅＧｅｎｅｔｉｃＤｉｓｏｒｄｅｒｓ：ＬｅａｒｎｉｎｇＡｂｏｕｔＧｅｎｅｔｉｃＤｉｓｅａｓｅＴｈｒｏｕｇｈＧｅｎｅＭａｐｐｉｎｇ，ＳＮＰｓ，ａｎｄＭｉｃｒｏａｒｒａｙＤａｔａ，ＮａｔｕｒｅＥｄｕｃａｔｉｏｎ１（１）：１９２（２００８）；ＯｎｌｉｎｅＭｅｎｄｅｌｉａｎＩｎｈｅｒｉｔａｎｃｅｉｎＭａｎ（ＯＭＩＭ）（ｗｗｗ．ｎｃｂｉ．ｎｉｍ．ｎｉｈ．ｇｏｖ／ｅｎｔｒｅｚ／ｑｕｅｒｙ．ｆｃｇｉ？ｄｂ＝ＯＭＩＭ）；およびＨｕｍａｎＧｅｎｅＭｕｔａｔｉｏｎＤａｔａｂａｓｅ（ＨＧＭＤ）（ｗｗｗ．ｈｇｍｄ．ｃｆ．ａｃ．ｕｋ）に記載されている。別の実施形態において、標的ゲノムＤＮＡ配列は、その変異が、他の遺伝子中の変異と相まって特定の疾患に寄与する遺伝子を含むことができる。単純な（すなわち、メンデル）遺伝パターンを欠く、複数の遺伝子の寄与によって引き起こされる疾患は、当技術分野では「多因子性」または「多遺伝子性」疾患と呼ばれている。多因子性または多遺伝子性疾患の例には、喘息、糖尿病、てんかん、高血圧、双極性障害および統合失調症が含まれるが、これらに限定されない。ある特定の発達異常も、多因子性または多遺伝子性パターンで遺伝することがあり得、例えば、口唇裂／口蓋裂、先天性心欠損および神経管欠損が含まれる。

別の実施形態において、標的ゲノムＤＮＡ配列を改変する方法は、標的配列を切断し、外因的に提供されたドナー核酸分子の非存在下において宿主細胞が切断された配列を修復できるようにすることによって、宿主細胞中の標的配列から核酸を欠失させるために使用することができる。この様式での核酸配列の欠失は、例えば、神経細胞中の疾患を引き起こすトリヌクレオチドリピート配列を除去するために、遺伝子ノックアウトまたはノックダウンを作製するために、および研究において疾患モデルのために変異を生成するためになど、様々な用途において使用することができる。

本明細書で論述されているように、バリアントＳａＣａｓ９タンパク質は、野生型ＳａＣａｓ９タンパク質と比較して、変更されたおよび改善されたＰＡＭ特異性を示す。改変されたＰＡＭ特異性により、ＳａＣａｓ９バリアントは、現在標的とすることができないゲノム遺伝子座を効率的に破壊することができる。したがって、いくつかの実施形態において、バリアントＳａＣａｓ９タンパク質は、標的ゲノムＤＮＡ配列に隣接して位置する核酸配列ＮＮＧＲＲ［Ｔ／Ａ／Ｃ／Ｇ］（「Ｎ」はグアニン、アデニン、チミンまたはシトシンであり、「Ｒ」はグアニンまたはアデニンである。）を含むプロトスペーサー隣接モチーフ（ＰＡＭ）を含む宿主細胞ゲノムにおいて活性を有する。ＰＡＭは、典型的には、標的配列の直後に続くという点で、標的ゲノムＤＮＡ配列に「隣接」している。特定のバリアントＳａＣａｓ９タンパク質によって認識されるＰＡＭ配列は、バリアント中に存在する特定のアミノ酸置換に応じて異なる。ある特定の実施形態において、開示されたバリアントＳａＣａｓ９タンパク質によって認識されるＰＡＭは、核酸配列ＮＮＧＲＲＴ、ＮＮＧＲＲＣ、ＮＮＧＲＲＡまたはＮＮＧＲＲＧを含む。

本明細書に記載の系および方法では、適宜、当技術分野で公知の任意の適切なＣＲＩＳＰＲ／Ｃａｓ遺伝子編集系の任意の要素を使用することができる。ＣＲＩＳＰＲ／Ｃａｓ遺伝子編集技術は、例えば、Ｃｏｎｇら、前出；Ｘｉｅら、前出；米国特許出願公開第２０１４／００６８７９７号；米国特許第８，６９７，３５９号；同第８，７７１，９４５号；および同第８，９４５，８３９号；米国特許出願公開第２０１０／００７６０５７号；同第２０１１／０１８９７７６号；同第２０１１／０２２３６３８号；同第２０１３／０１３０２４８号；国際公開第２００８／１０８９８９号；同第２０１０／０５４１０８号；同第２０１２／１６４５６５号；同第２０１３／０９８２４４号；同第２０１３／１７６７７２号；米国特許出願公開第２０１５００５０６９９号；同第２０１５００４５５４６号；同第２０１５００３１１３４号；同第２０１５００２４５００号；同第２０１４０３７７８６８号；同第２０１４０３５７５３０号；同第２０１４０３４９４００号；同第２０１４０３３５６２０号；同第２０１４０３３５０６３号；同第２０１４０３１５９８５号；同第２０１４０３１０８３０号；同第２０１４０３１０８２８号；同第２０１４０３０９４８７号；同第２０１４０３０４８５３号；同第２０１４０２９８５４７号；同第２０１４０２９５５５６号；同第２０１４０２９４７７３号；同第２０１４０２８７９３８号；同第２０１４０２７３２３４号；同第２０１４０２７３２３２号；同第２０１４０２７３２３１号；同第２０１４０２７３２３０号；同第２０１４０２７１９８７号；同第２０１４０２５６０４６号；同第２０１４０２４８７０２号；同第２０１４０２４２７０２号；同第２０１４０２４２７００号；同第２０１４０２４２６９９号；同第２０１４０２４２６６４号；同第２０１４０２３４９７２号；同第２０１４０２２７７８７号；同第２０１４０２１２８６９号；同第２０１４０２０１８５７号；同第２０１４０１９９７６７号；同第２０１４０１８９８９６号；同第２０１４０１８６９５８号；同第２０１４０１８６９１９号；同第２０１４０１８６８４３号；同第２０１４０１７９７７０号；同第２０１４０１７９００６；および同第２０１４０１７０７５３号；Ｍａｋａｒｏｖａら、ＮａｔｕｒｅＲｅｖｉｅｗｓＭｉｃｒｏｂｉｏｌｏｇｙ，９（６）：４６７－４７７（２０１１）；Ｗｉｅｄｅｎｈｅｆｔら、Ｎａｔｕｒｅ，４８２：３３１－３３８（２０１２）；Ｇａｓｉｕｎａｓら、ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＮａｔｉｏｎａｌＡｃａｄｅｍｙｏｆＳｃｉｅｎｃｅｓＵＳＡ，１０９（３９）：Ｅ２５７９－Ｅ２５８６（２０１２）；Ｊｉｎｅｋら、Ｓｃｉｅｎｃｅ，３３７：８１６－８２１（２０１２）；Ｃａｒｒｏｌｌ，ＭｏｌｅｃｕｌａｒＴｈｅｒａｐｙ，２０（９）：１６５８－１６６０（２０１２）；Ａｌ－Ａｔｔａｒら、ＢｉｏｌＣｈｅｍ．，３９２（４）：２７７－２８９（２０１１）；およびＨａｌｅら、ＭｏｌｅｃｕｌａｒＣｅｌｌ，４５（３）：２９２－３０２（２０１２）に詳しく記載されている。

本開示は、さらに、分子動力学および実験的標的検証を組み合わせた、所望のＰＡＭ特異性を有するバリアントＣａｓ９タンパク質を生成する方法を提供する。この方法は、（ａ）１またはそれを超える変異体Ｃａｓ９タンパク質の所望のＰＡＭへの結合を分子的にシミュレートすることと、（ｂ）（ａ）の前記シミュレーションにおいて前記所望のＰＡＭに結合する１またはそれを超える変異体Ｃａｓ９タンパク質を合成的に生成することと、（ｃ）宿主細胞中の標的ＤＮＡ配列に相補的なガイドＲＮＡ配列と組み合わせて、前記宿主細胞中で、前記１またはそれを超える変異体Ｃａｓ９タンパク質を発現させることであって、前記宿主細胞ゲノムは、前記標的ＤＮＡ配列および前記所望のＰＡＭを含む、発現させることと、（ｄ）前記もう１つの変異体Ｃａｓ９タンパク質の切断活性を測定することと、（ｅ）前記所望のＰＡＭに結合し、前記標的ＤＮＡ配列を切断する１またはそれを超える変異体Ｃａｓ９タンパク質を選択することであって、それにより、所望のＰＡＭ特異性を有するバリアントＣａｓ９が生成される、選択することと、を含む。

本明細書で使用される「分子動力学（ＭＤ）」という用語は、原子および分子の物理的運動を研究するためのコンピュータシミュレーション方法を指す。原子および分子を一定期間相互作用させて、系の動的発展についての視点を与える。実験的研究を補完するＭＤシミュレーションは、タンパク質とＤＮＡの相互作用を理解する上で効果的であることが証明されている。（Ｐａｌｅｒｍｏら、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ，１１４：７２６０－７２６５（２０１７）；およびＣｏｎｇら、Ｎａｔ．Ｃｏｍｍｕｎ．，３：９６８（２０１２））。ＰＡＭ配列とのＣａｓ９結合相互作用を含む、ＣＲＩＳＰＲ／Ｃａｓ９系の様々な構造的構成成分を探索するための方法は、当技術分野において記載されており、本開示に関連して使用することができる（例えば、Ｅｓｔａｒｅｌｌａｓら、ＢｉｏｃｈｉｍＢｉｏｐｈｙｓＡｃｔａ，１８５０（５）：１０７２－１０９０（２０１５）；Ｐａｌｅｒｍｏら、ＪＡｍＣｈｅｍＳｏｃ．，１３９（４５）：１６０２８－１６０３１（２０１７）；Ｐａｌｅｒｍｏら、ＡＣＳＣｅｎｔＳｃｉ．，２（１０）：７５６－７６（２０１６）；Ｈｕａｉら、ＮａｔＣｏｍｍｕｎ．，８（１）：１３７５（２０１７）；およびＷａｎら、ＳｃｉＲｅｐ．，９（１）：３１８８（２０１９）を参照）。本明細書に記載のバリアントＳａＣａｓ９タンパク質の詳細なＭＤシミュレーション方法論は、実施例に記載されている。変異体Ｃａｓ９タンパク質は、本明細書に記載されているものなど、任意の種に由来する任意の適切な野生型Ｃａｓ９タンパク質に基づき得る、またはこれに由来し得る。

いくつかの実施形態において、１またはそれを超える変異体Ｃａｓ９タンパク質の所望のＰＡＭへの結合を分子的にシミュレートすることは、自由エネルギー摂動（ＦＥＰ）計算を含む。本明細書で使用される「自由エネルギー摂動」という用語は、分子動力学から自由エネルギー差を計算するための計算化学において使用される統計力学に基づく方法を指す。ＦＥＰ計算は、タンパク質のインシリコ変異誘発研究のために、ならびにホスト－ゲスト結合エネルギー、ｐＫａ予測、反応に対する溶媒効果および酵素反応を研究するために広く使用されている。ＦＥＰ法は、例えば、Ｃｈｉｐｏｔ、Ｃ．；Ｐｏｈｏｒｉｌｌｅ，Ａ．（ｅｄｓ．），ＦｒｅｅＥｎｅｒｇｙＣａｌｃｕｌａｔｉｏｎｓ，Ｓｐｒｉｎｇｅｒ（２００７）；およびＳｔｅｉｎｂｒｅｃｈｅｒら、ＪＭｏｌＢｉｏｌ．，４２９（７）：９２３－９２９（２０１７）に詳しく記載されている。

分子動力学的シミュレーションにより、ＰＡＭ特異性を変化（例えば、改善または拡張）させ得るＣａｓ９タンパク質中の潜在的アミノ酸置換の特定が可能となる。したがって、１またはそれを超える変異体Ｃａｓ９タンパク質の所望のＰＡＭ配列への結合を分子的にシミュレートした後に、前記方法は、（ａ）のシミュレーションにおいて所望のＰＡＭ配列に結合する１またはそれを超える変異体Ｃａｓ９タンパク質を合成的に生成することを含む。１またはそれを超える変異体Ｃａｓ９タンパク質は、当技術分野で公知の組換えＤＮＡ技術および／またはインビトロタンパク質合成方法を使用して合成的に生成され得る（例えば、Ｓａｍｂｒｏｏｋら、前出を参照のこと）。野生型Ｃａｓ９アミノ酸配列は、Ｃａｓ９変異体を生成するために、例えば、挿入、欠失および／または置換などの当技術分野で公知の任意の適切な方法によって変異させることができる。例えば、変異は、野生型Ｃａｓ９タンパク質をコードする核酸配列中に、ランダムにまたは部位特異的に導入され得る。ランダムな変異は、例えば、Ｃａｓ９テンプレート配列のエラープローンＰＣＲによって生成され得る。部位特異的変異は、例えば、修飾された部位を含む合成されたオリゴヌクレオチドを発現ベクター中に連結することによって導入することができる。あるいは、Ｗａｌｄｅｒら、Ｇｅｎｅ，４２：１３３（１９８６）；Ｂａｕｅｒら、Ｇｅｎｅ，３７：７３（１９８５）；Ｃｒａｉｋ，Ｂｉｏｔｅｃｈｎｉｑｕｅｓ，１２－１９（Ｊａｎｕａｒｙ１９９５）；および米国特許第４，５１８，５８４号および同第４，７３７，４６２号に開示されているようなオリゴヌクレオチド指定部位特異的変異誘発手順を使用することができる。

分子動力学シミュレーションによって予測された１またはそれを超えるＣａｓ９変異体タンパク質のＰＡＭ特異性を評価するために、宿主細胞中の標的ＤＮＡ配列に相補的なガイドＲＮＡ配列と組み合わせて、１またはそれを超える変異体Ｃａｓ９タンパク質を宿主細胞中で発現させることができ、ここで、宿主細胞ゲノムは標的ＤＮＡ配列および所望のＰＡＭを含む。本発明の系および核酸配列を改変する方法に関連して上記した宿主細胞、ガイドＲＮＡ配列、標的ＤＮＡ配列およびこれらの構成成分の説明は、バリアントＣａｓ９タンパク質を生成する方法にも適用し得る。宿主細胞中で発現されたら、１またはそれを超える変異体Ｃａｓ９タンパク質の切断活性は、エンドヌクレアーゼ活性を測定するための任意の適切なアッセイを使用して測定することができる。このようなアッセイは、例えば、Ａｎｄｅｒ，Ｃ．ａｎｄＭ．Ｊｉｎｅｋ，ＭｅｔｈｏｄｓＥｎｚｙｍｏｌ．，５４６：１－２０（２０１４）；ＭａｒｉａＪ．ＹｅｂｒａａｎｄＡｓｈｏｋＳ．Ｂｈａｇｗａｔ，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓｅａｒｃｈ，２１（２４）：５７９７－５７９８（１９９３）；Ｚｈａｎｇら、ＣｈｅｍＳｃｉ．，７（８）：４９５１－４９５（２０１６）；およびＳｅａｍｏｎら、Ａｎａｌ．Ｃｈｅｍ．，９０（１１）：６９１３－６９２１（２０１８）に記載されている。本明細書に記載されている操作戦略は、標的とすることが可能なＰＡＭの範囲をさらに多様化するために、任意の野生型もしくは合成Ｃａｓ９タンパク質またはこれらの誘導体を使用して実行され得る。

以下の実施例は、本発明をさらに例示するが、もちろん、その範囲を限定するものと決して解釈されるべきではない。

材料および方法
ＭＤシミュレーション
図１Ａに示されているように、０．１５ＭＮａＣｌ電解質中で溶媒和されている、結合されたＤＮＡありまたはなしのＳａＣａｓ９－ｓｇＲＮＡ複合体に対して、全原子分子動力学（ＭＤ）シミュレーションを実行した。タンパク質折り畳み動態を研究するため（Ｚｈｏｕら、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ，１００：１３２８０－１３２８５（２００３）；Ｌｉｕら、Ｎａｔｕｒｅ，４３７：１５９－１６２（２００５））、タンパク質－リガンド結合における分子機構を発見するため（Ｗａｎｔら、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ，１０９：１９３７－１９４２（２０１２）；およびＣｈｉｐｏｔ，Ｃ．ａｎｄＡ．Ｐｏｈｏｒｉｌｌｅ，ＦｒｅｅＥｎｅｒｇｙＣａｌｃｕｌａｔｉｏｎｓ；Ｓｐｒｉｎｇｅｒ（２００７））、バイオナノ界面での相互作用を調べるため（Ｇｅら、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ，１０８：１６９６８－１６９７３（２０１１）、Ｔｕら、ＮａｔｕｒｅＮａｎｏｔｅｃｈｎｏｌ．，８：５９４－６０１（２０１３）；Ｌｕａｎら、ＡＣＳＮａｎｏ，９：６６３－６６９（２０１５）；Ｌｕａｎら、ＡＣＳＮａｎｏ，１１：１２６１５－１２６２３（２０１７））などに使用された以前のプロトコルに従って、全てのＭＤシミュレーションおよびＦＥＰ計算は、ソフトウェアパッケージＮＡＭＤ２．１１（Ｐｈｉｌｌｉｐｓら、Ｊ．Ｃｏｍｐ．Ｃｈｅｍ．，２６：１７８１－１８０２（２００５））を用いて行った。各エッジが約１２６．３Åである立方体のウォーターボックス中で複合体（ＰＤＢＩＤ：５ＣＺＺ）を溶媒和した後、２４９Ｎａ^＋と１７５Ｃｌ^－を系中に添加し、複合体の電荷を中和し、イオン濃度を、実験的に検証されたＳａＣａｓ９の活性条件に対応する０．１５Ｍに設定した（Ｒａｎら、Ｎａｔｕｒｅ，５２０：１８６－１９１（２０１５））。Ｍｇ２＋または類似の二価金属イオンはＳａＣａｓ９中のＲｕｖＣおよびＨＮＨドメインのＤＮＡ切断活性にとって重要であるが、ヌクレアーゼドメインの活性部位に位置しており、ここに記載されている研究が注目するＰＡＭ認識プロセスに結合することも、それに影響を及ぼすこともない。したがって、このシミュレーションには２価イオンは含まれなかった。図１Ａに示されている最終的な系は、２０６，９８４原子を含み、１０ｐｓ間最小化され、ＮＰＴアンサンブル（圧力約１ｂａｒおよび温度約３００Ｋ）でさらに１０ｎｓ間平衡化され、骨格内の原子は調和的に拘束されている（ばね定数ｋ＝１ｋｃａｌ／ｍｏｌ／Å２）。Ｓ９拘束を除去した後、次いで、ＮＰＴアンサンブルで系全体をさらに５ｎｓ間平衡化し、その後、ＮＶＴアンサンブルでプロダクションランを実行した。

タンパク質、ＤＮＡおよびＲＮＡ分子には、ＣＨＡＲＭＭ力場（ＭａｃＫｅｒｅｌｌら、Ｊ．Ｐｈｙｓ．Ｃｈｅｍ．Ｂ，１０２：３５８６－３６１６（１９９８））を適用し、水には、ＴＩＰ３Ｐモデル（Ｊｏｒｇｅｎｓｅｎら、Ｊ．Ｃｈｅｍ．Ｐｈｙｓ．，７９：９２６－９３５（１９８３）；Ｎｅｒｉａら、Ｊ．Ｃｈｅｍ．Ｐｈｙｓ．，１０５：１９０２－１９２１（１９９６））を選択し、イオンには、標準的な力場（Ｂｅｇｌｏｖ，Ｄ．ａｎｄＢ．Ｒｏｕｘ，Ｊ．Ｃｈｅｍ．Ｐｈｙｓ．，１００：９０５０－９０６３（１９９４））を使用した。３つの次元全てに、周期的境界条件（ＰＢＣ）を適用した。長距離クーロン相互作用は、各次元約１Åのグリッドサイズで、粒子メッシュ・エバルト（ＰＭＥ）完全静電学を使用して計算された。原子間のファンデルワールス（ｖｄＷ）エネルギーは、スムーズな（１０～１２Å）カットオフを使用して計算された。水中の全ての酸素原子およびシミュレートされた分子中の骨格原子に対してランジュバンサーモスタット（Ａｌｌｅｎ，Ｍ．Ｐ．ａｎｄＴｉｌｄｅｓｌｅｙ，Ｄ．Ｊ．，ＣｏｍｐｕｔｅｒＳｉｍｕｌａｔｉｏｎｏｆＬｉｑｕｉｄｓ；ＯｘｆｏｒｄＵｎｉｖｅｒｓｉｔｙＰｒｅｓｓ：ＮｅｗＹｏｒｋ（１９８７））を適用することによって、温度Ｔを３００Ｋに維持した。Ｎｏｓｅ－Ｈｏｏｖｅｒ法（Ｍａｒｔｉｎｅｚ，Ｔ．ａｎｄＫ．Ｓｃｈｕｌｔｅｎ，Ｎｅｕｒ．Ｎｅｔｗ．，７：５０７－５２２（１９９４））を使用して、圧力を１バールで一定に保った。全ての結合を堅固に保つことを可能にしたＳＥＴＴＬＥアルゴリズム（Ｍｉｙａｍｏｔｏら、Ｊ．Ｃｏｍｐ．Ｃｈｅｍ．，１３：９５２－９６２（１９９２））を用いて、結合したおよび結合していない（例えば、ｖｄＷ、角度および二面角）相互作用に対しては、シミュレーション時間ステップは２ｆｓであり、電気的相互作用は、複数時間ステップアルゴリズムを使用して４ｆｓごとに計算した（Ｔｕｃｋｅｒｍａｎら、ＴｈｅＪｏｕｒｎａｌｏｆＣｈｅｍｉｃａｌＰｈｙｓｉｃｓ，９７：１９９０－２００１（１９９２）；およびＭｏｒｒｏｎｅら、ＪｏｕｒｎａｌｏｆＣｈｅｍｉｃａｌＴｈｅｏｒｙａｎｄＣｏｍｐｕｔａｔｉｏｎ，６：１７９８－１８０４（２０１０））。
自由エネルギー摂動計算

自由エネルギー摂動（ＦＥＰ）法は、Ｃｈｉｐｏｔ，Ｃ．；Ｐｏｈｏｒｉｌｌｅ，Ａ．Ｆｒｅｅｅｎｅｒｇｙｃａｌｃｕｌａｔｉｏｎｓ；Ｓｐｒｉｎｇｅｒ，２００７に記載されている。ここでは、複合体の平衡化された結合状態および遊離状態を取得した後、ＳａＣａｓ９上のそれぞれの提案された変異に対して結合自由エネルギーの変化を計算するために、この方法を使用した。図２Ａは、変異Ｒ１０１５Ｈに関して自由エネルギー差ΔΔＧを計算するためにＦＥＰ法において使用された熱力学的サイクルを示す。ΔＧ_ＡおよびΔＧ_Ｂは、それぞれ、野生型ＳａＣａｓ９および変異されたＳａＣａｓ９に結合しているｄｓＤＮＡの自由エネルギー変化であり、ΔＧ_１およびΔＧ_２は、それぞれ、結合（ｄｓＤＮＡあり）状態および遊離（ｄｓＤＮＡなし）状態で、Ｒ１０１５を消滅させて同時にＨ１０１５を作り出すための自由エネルギーの変化である。

Ｒ１０１５Ｈ変異については、ｄｓＤＮＡの結合自由エネルギー間の差は、次の式によって計算できる。

一般に、ΔＧ_ＡおよびΔＧ_Ｂの直接計算は困難であり、代わりにΔＧ_１およびΔＧ_２を計算することによって回避することができる（上記式１を参照）。以下のアンサンブル平均（Ｃｈｉｐｏｔ、前出）から、ΔＧ_１およびΔＧ_２は次の式を使用して理論的に計算することができる。

式中、ｋ_Ｂはボルツマン定数であり、Ｔは温度であり、Ｈ_ｉおよびＨ_ｆは、それぞれ最初（ｉ）および最終（ｆ）の段階のハミルトニアンである。例えば、Ｒ１０１５Ｈ変異の場合、最初の状態は野生型ＳａＣａｓ９であり、最終の状態はＲ１０１５がＨ１０１５に置き換えられた状態である。摂動法を使用して、精度を向上させるために、そのハミルトニアンがＨ（λ）＝λＨ_ｆ＋（１－λ）Ｈ_ｉである多くの中間段階（λによって表される）を最初の状態と最終の状態の間に挿入すべきである。ΔＧ_１およびΔＧ_２の計算では、ソフトコアポテンシャルが使用可能な１８個の摂動ウィンドウ内で、λは０から１まで変化し、それぞれＲ１０１５およびＨ１０１５の段階的な消滅および創出過程を生成する。
ＳａＣａｓ９実験

実験的アッセイは、エンジニアリング設計または計算シミュレーションに対応する変異または改変を導入するために分子クローニングを用いた元のＳａＣａｓ９研究からの構築物を使用して行った。使用した骨格ベクターは、Ｒａｎら、Ｎａｔｕｒｅ，５２０：１８６－１９（２０１５）に以前に記載されているように、ｐＸ６０１－ＳａＣａｓ９プラスミド（Ａｄｄｇｅｎｅから入手可能）であった。簡単に説明すると、オリゴプライマー（ＩＤＴＤＮＡ）は、ＳａＣａｓ９構築物の望ましい変異を含むＤＮＡ断片を増幅するように設計され、テンプレートｐＸ６０１プラスミドとともにＰＣＲ反応で使用された。得られたＰＣＲ産物をＰＣＲ精製キット（ＱＩＡＧＥＮ）を使用して精製し、アガロースゲル電気泳動によるさらなる分離に供し、次いで、ゲル抽出キット（ＱＩＡＧＥＮ）で再度精製した後、下流でのアセンブリ用に正規化した。ベクターの最終的なクローニングは、ギブソンアセンブリ法を使用して実行され、プラスミドを単離するために細菌に形質転換された。ＳａｎｇｅｒＳｅｑｕｅｎｃｉｎｇ（Ｇｅｎｅｗｉｚ）によって全てのプラスミドを確認し、細胞形質移入実験のために保存した。

哺乳動物細胞でのＳａＣａｓ９活性を測定するために、ＦＢＳおよびＧｌｕｔａＭＡＸ（ＴｈｅｒｍｏＦｉｓｈｅｒ）を補充したダルベッコ改変イーグル培地（ＤＭＥＭ）中において、３７°Ｃで、５％ＣＯ_２を供給したインキュベータ中でヒト胎児腎臓２９３ＦＴ細胞（ＴｈｅｒｍｏＦｉｓｈｅｒ）を維持した。形質移入の約２４時間前に、細胞を２４ウェルプレート（Ｃｏｒｎｉｎｇ）中に２．５×１０^５細胞／ウェルの密度で播種し、Ｌｉｐｏｆｅｃｔａｍｉｎｅ２０００（ＴｈｅｒｍｏＦｉｓｈｅｒ）を使用して、メーカーの推奨プロトコルに従って適切な培養密度で形質移入した。２４ウェルプレートの各ウェルに対して合計６００ｎｇのＤＮＡを使用した。次いで、いつでも回収できるようになるまで細胞をインキュベートした。ゲノム修飾の検出および定量は、例えば、Ｃｏｎｇら、Ｓｃｉｅｎｃｅ，３３９：８１９－８２３（２０１３）；およびＮｉｓｈｉｍａｓｕら、Ｃｅｌｌ，１６２：１１１３－１１２６（２０１５）に記載されているものと同様のワークフローを使用して行われた。簡単に説明すると、形質移入の約７２時間後に、段階的インキュベーション法とともにＱｕｉｃｋＥｘｔｒａｃｔＤＮＡＥｘｔｒａｃｔｉｏｎＳｏｌｕｔｉｏｎ（Ｅｐｉｃｅｎｔｒｅ）を使用して、形質移入された細胞からのゲノムＤＮＡを回収し、その後、前述のようにＳＵＲＶＥＹＯＲアッセイを使用してＩｎＤｅｌ分析を行った（Ｃｏｎｇら、前出）。全ての標的についてアンプリコンサイズが５００～９００ｂｐのＳＵＲＶＥＹＯＲアッセイ用のプライマーを使用して、標的とされたゲノム領域を増幅した。ＳＵＲＶＥＹＯＲアッセイでは、精製されたＰＣＲ産物は再アニーリングされ、ＳＵＲＶＥＹＯＲヌクレアーゼ消化に供され、次いで、ポリアクリルアミドゲル電気泳動によって分析および定量された（Ｃｏｎｇら、前出）。誤差統計を取得するために、アッセイで起こりうる技術的ノイズを考慮して、全ての実験は３連で行った。
実施例１

本実施例は、ＳａＣａｓ９複合体の全原子分子動力学シミュレーションを実証する。

高解像度ＳａＣａｓ９複合体構造（Ｎｉｓｈｉｍａｓｕら、前出）の検査を行った（ただし、結晶接触が局所構造に影響を与え得る。図２を参照）。天然状態にあるＳａＣａｓ９複合体の動力学的な詳細を確立するために、分子動力学（ＭＤ）法を使用して、生理学的条件下で複合体をモデル化した。実験的研究を補完するＭＤシミュレーションは、タンパク質－ＤＮＡ相互作用を理解する上で効果的であることが証明されている（Ｐａｌｅｒｍｏら、ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＮａｔｉｏｎａｌＡｃａｄｅｍｙｏｆＳｃｉｅｎｃｅｓ，１１４：７２６０－７２６５（２０１７）；およびＣｏｎｇら、Ｎａｔ．Ｃｏｍｍｕｎ．，３：９６８（２０１２））。ＤＮＡ標的のＳａＣａｓ９－ｓｇＲＮＡ複合体との結合の分子機構を特徴づけるために、全原子ＭＤシミュレーションを実施した（図１Ａを参照）。

ＭＤ分析において、標的ＤＮＡ基質との結合した状態での平衡化後に（図３Ａ）、結晶構造に対して計算された飽和二乗平均平方根偏差（ＲＭＳＤ）の平均はいずれも約２．５Åであったので、ＲＮＡおよびＤＮＡ分子の二次構造は安定していた。同様のプロトコルに従って、結合したＤＮＡがない平衡化された複合体が独立して得られた。大局的に見ると、骨格原子の飽和ＲＭＳＤは、基質ＤＮＡとのＳａＣａｓ９複合体ではわずか約３．２Åであったが（図３Ａ）、結晶環境中において隣接するタンパク質からの認識（ＲＥＣ）ローブによって遮断されていない（図２Ｃ）ヌクレアーゼ（ＮＵＣ）ローブのＨＮＨドメイン（ＨＮＨドメインはガイドＲＮＡ配列に相補的なＤＮＡ鎖を切断する）は、標的ＤＮＡ鎖上の切断部位の方向に７．６Åの距離を移動し、これは、生理学的プロセスを正確に再現した（図３Ｃ）。同様に、ＲＥＣローブおよびＤＮＡ－ＲＮＡヘテロ二本鎖の末端断片は、ＮＵＣローブに近づいた（図３Ｃ）。他方、結合したＤＮＡがないＳａＣａｓ９の場合（図４）、ＲＭＳＤは増加して、７．５Åで飽和し、これは、関連するドメインの立体構造の変化がより大きいことを示している。それにもかかわらず、（提案された変異が存在する）ＤＮＡ結合領域のＲＭＳＤは小さいままであった（約３．５Å）（図４）。これらの観察結果は全て、以前の報告における生化学的および生物物理学的分析と一致している（Ｓｔｅｒｎｂｅｒｇら、Ｎａｔｕｒｅ，５２７：１１０（２０１５）；Ｊｉａｎｇら、Ｓｃｉｅｎｃｅ，３５１：８６７－８７１（２０１６）；Ｄａｇｄａｓら、ＳｃｉｅｎｃｅＡｄｖａｎｃｅｓ，３：ｅａａｏ００２７（２０１７）；およびＣｈｅｎら、Ｎａｔｕｒｅ，５５０：４０７（２０１７））。実験的知見とよく関連する、結合状態と遊離状態の両方から得たこれらの平衡構造を使用して、次いで、ＳａＣａｓ９ＰＡＭ認識の分子的基礎を調べ、新規ＳａＣａｓ９バリアントの変異に対して自由エネルギー摂動（ＦＥＰ）計算を行った（すなわち、インシリコ変異誘発研究）。

図１Ａ中で拡大および強調表示されているように、ＰＡＭ相互作用（ＰＩ）ドメイン中の結合部位は、その特異性が改変されたＮＮＧＲＲＴ中のＧとともに、ＫＫＨＳａＣａｓ９からの３つの残基全て、すなわちＥ７８２、Ｎ９６８、Ｒ１０１５を含有する（Ｋｌｅｉｎｓｔｉｖｅｒら、ＮａｔｕｒｅＢｉｏｔｅｃｈ．，３３：１２９３－１２９８（２０１５））。以下では、ＰＡＭの３番目の位置（ＫＫＨＳａＣａｓ９ＰＡＭで変更された塩基）を表すためにＧ３を使用し、標的ＤＮＡ鎖上のＰＡＭ近位末端における最初のヌクレオチドを表すために、Ｇ０を使用した。ＭＤの結果から、全ての鍵となるＰＡＭ認識残基の相互作用が結晶構造において観察された。すなわち、それぞれ、Ｒ１０１５はＧ３に配位し、Ｎ９８５は４番目の位置のＡに配位し、Ｒ９９１は、５番目および６番目の位置のＡおよびＴの両方に動的に配位する（図３Ｂを参照）。５番目の位置のＡ（または、一般的にはＲ）に配位する上でのＲ９９１の役割は、いずれの残基もこのＡと接触していない（静的）結晶構造からは得ることができなかった。

より細かい細部を間近に見ると、ＰＩドメインの近くに位置するいくつかの鍵となる残基が、結晶内での位置と比較して側鎖位置を調整することが観察された。これは、インビボでの活性状態により類似する環境によるものであり得る。残基対の距離（非水素原子間の最短距離として定義した）を計算することにより、残基Ｅ７８２はＫ９１０またはＧ０のいずれかに近接し得ることが見出され、ＰＡＭ相互作用に直接関与している可能性があることを示唆した（図１Ｂを参照）。他方、柔軟なＮ９６８はＧ３に近かったが、直接接触を形成するほど十分には近接していなかった（図１Ｃを参照）。とりわけ、Ｋ９１０は結晶構造では示されない動的配位を形成した。図１Ｄは、負に帯電したＥ７８２とＧ３に挟まれたＫ９１０の（０ｎｓにおける結晶環境中での）立体構造を示している。しかしながら、Ｋ９１０中の正に帯電したアミン基（ＮＨ３＋）は、Ｅ７８２のカルボキシル基（ＣＯＯ^－）やＧ３のリン酸基（ＰＯ_４ ^－１）のいずれとも塩橋を形成しなかった。ＭＤシミュレーション中に、Ｋ９１０はＥ７８２に向かって移動し、５７ｎｓ後にＥ７８２と塩橋を形成した（図１Ｄ）。この塩橋は、後に、Ｎａ＋がこの領域中に拡散した後で破壊された。図１Ｄは、８０ｎｓで、Ｋ９１０がＧ３と新しい塩橋を形成し、同時にＥ７８２がこのＮａ＋を結合し、標的ＤＮＡ鎖中のＧ０のリン酸基をさらに配位してｄｓＤＮＡ結合を安定化することを示している。これらの配位は、基質のない状態では存在せず、ＳａＣａｓ９の強力なＰＡＭ認識のための、動的な立体構造遷移の極めて重要な役割をさらに実証する。
実施例２

本実施例では、Ｃａｓ９ＰＡＭ認識を探索するための自由エネルギー摂動と実験的アッセイの使用について記載する。

系平衡化およびＭＤ分析を完了することによって、これまで正しく評価されていなかったＰＡＭ認識の動力学が明らかになり、標的認識へのタンパク質残基の寄与をどのようにして定量的に伝えるかという、ゲノム編集ツールのモデル化における基本的な課題の１つに対処した。この目的のために、構造的な洞察が計算解析を導き、Ｃａｓ９バリアント活性のさらなる計算マッピングを正しいとする標的化遺伝子編集実験がそれに続く複合的な方法が使用され、そしてそこでは、インシリコ予測は実験的なＣａｓ９編集効率と相関し得る。

まず、ＳａＣａｓ９ＰＡＭ認識へのＰＩドメイン残基の寄与を、自由エネルギー摂動（ＦＥＰ）計算を用いて定量した（図５Ａ）。ＰＡＭ配列のすぐ近くの残基のアラニンスキャン分析を行った。図５Ｂは、変異Ｒ９９１ＡおよびＲ１０１５Ａは結合自由エネルギーを有意に低下させたのに対して、Ｎ９８６Ａは（ΔΔＧの値が小さいために）はるかに重要ではなかったことを示している。変異Ｎ９８５ＡおよびＥ９９３Ａも、ΔΔＧの約２～４ｋｃａｌ／ｍｏｌの増加をもたらし、ＰＡＭ結合を不安定にする可能性がある。実験的に、標的化されたアラニン変異を有する対応するＳａＣａｓ９変異体を生成し、３つの異なるゲノム標的にわたる切断効率として測定されたＣａｓ９活性を定量的に評価するために、ガイドＲＮＡ（ｇＲＮＡ）とともに発現させた。アラニン変異を導入した後の活性の低下が試験された当該残基の重要性を示すように、野生型Ｃａｓ９に対する効率を正規化した（図５Ｃ）。次に、計算データと実験データの相関関係を調べるために、図５Ｃ（挿入図）にプロットされているように、各アラニン変異対実験的対応物の変換された活性（野生型対照に対して変異体ＳａＣａｓ９効率の自然対数を取ることによって計算された）からＤＤＧの線形フィッティングを行った。測定された生物学的活性は、０．９２に達する適合度によって示されるように、ＦＥＰ計算とよく一致した（図５Ｃ挿入図）。全体として、これらの結果は、この分子動力学と実験的標的を組み合わせた（ＣＯｍｂｉｎｅｄＭｏｌｅｃｕｌａｒｄｙｎａｍｉｃｓａｎｄＥｘｐｅｒｉｍｅｎｔａｌＴａｒｇｅｔ）（「ＣＯＭＥＴ」）検証アプローチの強力な予測可能性を明らかにし、内因性ゲノムコンテキストなどの計算－実験解釈に影響を及ぼし得る、可能性がある非線形因子が示された。
実施例３

本実施例では、その拡張されたＰＡＭの分子機構を明らかにするためのＫＫＨＳａＣａｓ９バリアントの分析について記載する。

ＳａＣａｓ９のＫＫＨ変異体は、Ｅ７８２Ｋ、Ｎ９６８ＫおよびＲ１０１５Ｈという３つの置換を含む（Ｋｌｅｉｎｓｔｉｖｅｒら、ＮａｔｕｒｅＢｉｏｔｅｃｈ．，３３：１２９３－１２９８（２０１５））。Ｒ１０１５Ｈの熱力学的サイクルが図５Ａに図解されている。結合状態では、Ｒ１０１５はＧ３を２つの水素結合によって結合し、ＰＡＭ特異性ＮＮＧＲＲＴに関与している。この相互作用は、Ｒ１０１５の立体構造的変動を有意に低減することができるＥ９９３とＲ１０１５間の塩橋によってさらに安定化された。図５Ａに示されるように、同じ塩橋は、ＳａＣａｓ９の遊離状態にも存在する。Ｒ１０１５Ｈ変異後、結合状態では、Ｈ１０１５はＧ３から離れるように移動し、それによってＮＮＧＲＲＴＰＡＭ中のＧ３に対する特異性を解放した。しかしながら、このような変異（図５Ａでは、ΔＧ１によって表されている）は、結合自由エネルギー（または結合親和性）を有意に低下させた。遊離状態での同じ変異プロセス（図５Ａでは、ΔＧ２によって表されている）と比較して、結合自由エネルギーの正味の変化は＋１１．３ｋｃａｌ／ｍｏｌであった（図３Ａ）。これは結合親和性の有意な低下であり、Ｒ１０１５Ａ変異のΔΔＧ（約１６．９ｋｃａｌ／ｍｏｌ、図５Ｂを参照）と比較すると、さらに不利であった。したがって、ＰＡＭ特異性が低下しているにもかかわらず、ＳａＣａｓ９のＰＩドメインとｄｓＤＮＡのＰＡＭ領域の間の結合はＲ１０１５Ｈによって不安定化された。これを補い、タンパク質－ＤＮＡ結合を安定化させるために、以前の研究（Ｋｌｅｉｎｓｔｉｖｅｒら、前出）では追加の変異（Ｅ７８２ＫおよびＮ９６８Ｋ）が導入された。図１Ｄに示されているように、Ｅ７８２Ｋ変異は、局所的な配位に対して多大な変化を有すると予想された。すなわち、１）Ｋ７８２のＮＨ^３＋基は標的ＤＮＡ鎖中のＧ０のリン酸基に直接結合し、２）Ｋ７８２によって反発されたＫ９１０はＧ３により安定的に結合する。実際、ＦＥＰ計算の最終段階において、Ｋ９１０およびＫ７８２は、アミンおよびリン酸基によって形成された塩橋を介して、それぞれ、２つの相補的ＤＮＡ鎖中のＧ３およびＧ０に結合され（図６Ｂ）、ＤＮＡ－タンパク質結合自由エネルギーを有意に増加させることができる。これと一致して、Ｅ７８２Ｋ変異の計算されたΔΔＧは－１３．１ｋｃａｌ／ｍｏｌであり、これは、約１．１ｋｃａｌ／ｍｏｌの計算されたＤＤＧで局所配位（Ｅ７８２－Ｎａ^＋－Ｇ０、図１Ｄ）を不安定化したＥ７８２Ａ変異よりもはるかに有利であった（図６Ａ）。さらに、Ｎ９６８Ｋ変異は基質結合を増強することが示唆された（Ｋｌｅｉｎｓｔｉｖｅｒら、前出）。実験結果と一致して、ＦＥＰ計算は、この残基変化のΔΔＧが約－２．３ｋｃａｌ／ｍｏｌであることを明らかにした（図６Ａ）。結合状態のＦＥＰ分析の最後には、Ｋ９６８中のアミン基とＧ３中のリン酸基間の静電引力により、Ｋ９６８はＰＡＭ配列中のＧ３に近づくことがあり得る。Ｋ９１０は、Ｇ３にも一瞬で結合することがあり得る（図１Ｄ）。したがって、Ｅ７８２Ｋと比較してＮ９６８Ｋ変異の自由エネルギーの低下がより小さかったのは、Ｋ９１０とＫ９６８間の一時的な静電反発、すなわち、Ｋ９６８とＰＡＭのＧ３間の結合がより弱いことの結果であった。

Ｎ９６８をアラニンに変異させることは、タンパク質－ＤＮＡ結合に対してほとんど影響がなく（ΔΔＧ＝０．５ｋｃａｌ／ｍｏｌ）、野生型ＳａＣａｓ９でのＰＡＭ認識に対するその相対的な中立性が示され、ＭＤシミュレーションから得られた以前の結果を裏付ける（図１Ｃ）。二重変異Ｅ７８２ＫおよびＮ９６８Ｋ（ＫＫ）は、さらに強力なタンパク質－ＤＮＡ結合をもたらし、結合自由エネルギーを１４．２ｋｃａｌ／ｍｏｌ増加させた（図６Ａ）。単純な相加的方法によって作用する場合、ＫＫ二重変異は、（２つの－ΔΔＧ値の加算を通じて）少なくとも結合自由エネルギーを１５．３ｋｃａｌ／ｍｏｌ増加させると予想された。Ｅ７８２Ｋ変異の結果として、Ｋ９１０はＰＡＭ配列中のＧ３に安定的に結合することができる。しかしながら、Ｋ９６８も、同じＧ３と競合的に相互作用することができる。このため、ＫＫ変異の－ΔΔＧの変化は、２つの独立した－ΔΔＧの変化の単純な加算よりも小さく、これらの変異された残基間での複雑な相互作用を示している最後に、同時三重変異Ｅ７８２Ｋ、Ｎ９６８ＫおよびＲ１０１５Ｈ（ＫＫＨ）は、－３．９ｋｃａｌ／ｍｏｌのΔΔＧ、すなわち、結合自由エネルギーの正味の増加をもたらした（図６Ａ）。予想通り、Ｒ１０１５とＧ３間の特異的結合が解放されると、エントロピー計算によって示されるように、非標的ＤＮＡ鎖上のＰＡＭ領域は、より大きな立体構造の変動を許容された。簡単に説明すると、ＫＫＨ変異のＦＥＰ計算の前（ｌ＝０）および後（ｌ＝１）に、ＰＡＭ配列ＴＴＧＡＡＴ中のトリプレットＴＧＡの立体構造をサンプリングするために、シミュレーション系をさらに２ｎｓ間実行した。Ｒ１０１５Ｈ変異後には、ＰＡＭ配列中のヌクレオチドＧはＰＩドメインによる配位がより少なくなり、より大きな変動を有し得ると予想された。ＫＫＨ変異の前および後の立体構造のエントロピーを計算するためのＳｃｈｌｉｔｔｅｒ法（Ｓｃｈｌｉｔｔｅｒ，Ｊ．，ＣｈｅｍｉｃａｌＰｈｙｓｉｃｓＬｅｔｔｅｒｓ，２１５：６１７－６２１（１９９３））。結果は、ＫＫＨ変異によって、トリプレットの立体構造エントロピーが１４００Ｊ／（ｍｏｌ・Ｋ）から１３４１Ｊ／（ｍｏｌ・Ｋ）に変化したことを示している。その結果、ＦＥＰ計算は、Ｋ９６８がＴ（ＴＴＧＡＡＴＰＡＭ中のＧ３の１ヌクレオチド前）のリン酸基に結合することができ、Ｋ９１０がＧ３に結合することができることを示し、これが、Ｋ９６８とＫ９１０間の静電的反発を軽減し、タンパク質－ＤＮＡ結合の親和性を向上させる（図６Ｃ）。

Ｋ９６８とＴによって形成される塩橋は水に十分に曝露されており、塩橋の４Å以内に１２個の水分子が存在する（図６Ｃ）。しかしながら、Ｋ７８２とＧ０によって形成される塩橋は、複合体内にかなり埋もれており、塩橋の４Å以内に６つの水分子しか存在しない。このように、誘電環境の相違のため、Ｋ９６８－Ｔ塩橋からの結合自由エネルギーの増強は、Ｋ７８２－Ｇ０塩橋よりはるかに小さくなり得る（Ｚｈｏｕ，Ｒ．，Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ，１００：１３２８０－１３２８５（２００３））。したがって、ＦＥＰ計算に基づけば、ＫＫＨ変異は、分析の誤差を考慮に入れると、タンパク質－ＤＮＡ結合をわずかに増強することしかできなかった（図６Ａ）。ＫＫＨ変異の分子機構は、図３Ｄに要約されており、Ｅ７８２ＫおよびＮ９６８Ｋが、ＰＡＭ中のＧ３への拘束を取り除くＲ１０１５Ｈ変異による自由エネルギーの喪失を補うので、そのエネルギー特性を損なうことなくＫＫＨＳａＣａｓ９の標的化範囲の拡張をもたらす。

エネルギー計算に加えて、シミュレーションにより、野生型ＳａＣａｓ９と結合したＤＮＡ間の他の全ての配位が保持されていることが明らかになった。例えば、リン酸ロッカー（ｐｈｏｓｐｈａｔｅｌｏｃｋｅｒ）Ｔ７８７は、Ｇ０（図６Ｄ）と水素結合を形成し、Ｒ９９１は、ＴＴＧＡＡＴＰＡＭ中のＡＴを配位し、これらはいずれも、標的ＤＮＡ結合に関与する極めて重要な残基である。
実施例４

本実施例は、ＰＡＭ範囲を拡張するためのＣＯＭＥＴをベースとするＳａＣａｓ９バリアントのエンジニアリングを記載する。

上記ＫＫＨＳａＣａｓ９の分析およびそれが以前の実験と一致したことから、ＰＡＭ特異性を改変するための新たなＳａＣａｓ９設計の合理的な探索にＣＯＭＥＴアプローチを拡張した。この目的のために、ＳａＣａｓ９ＰＡＭの残りのゆらぎのない位置、すなわち、遺伝子編集用途における主要な制約であるＮＮＧＲＲＴの最後の（６番目の）Ｔ塩基を標的とした。構造の情報および上記のＭＤシミュレーションから、Ｎ９８６はこのＰＡＭ位置に配位するための重要な残基として機能する。したがって、最初の段階として、ＣＯＭＥＴワークフローを使用してＮ９８６に対して様々な変異のスクリーニングを行い、Ｎ９８６を代わりのアミノ酸（タンパク質－ＤＮＡ相互作用を維持するために、多くは荷電している）に変化させ、一連のＦＥＰ計算を行って下流の実験を導いた（図７Ａ）。自由エネルギーの結果に基づくと、最も有望な候補はＮ９８６Ｈ／Ｋ／Ｒ変異体であった。Ｎ９８６Ａ、Ｎ９８６ＥおよびＮ９８６Ｑ変異体のエネルギー予測は好ましくなかったので、これらのバリアントが実験的な試験から除外され得るように、実験上の努力を行った。ここで、Ｃａｓ９ＰＡＭの特異性を定めるために、標的位置における４つの異なる塩基にわたる編集部位の完全なセット、すなわち、ＮＮＧＲＲＴ＝Ｃ＝Ｇ＝Ａに対して個々の各変異体を試験しなければならないことを考えると、ＣＯＭＥＴワークフローは、有意な時間およびコストを節約した。ＳａＣａｓ９Ｎ９８６Ｈ／Ｋ／Ｒバリアントに対する標的化実験によって、それらのＰＡＭ認識プロファイルが実際に様々な程度に修飾され、ＳａＣａｓ９Ｎ９８６Ｒが単一の最も注目すべき候補であることが明らかになった（図７Ｂ）。野生型と比較すると、ＳａＣａｓ９Ｎ９８６Ｒは、非天然のＰＡＭであるＮＮＧＲＲＧをやや好み、ＮＮＧＲＲＴに対する活性は減少していたが、６番目のＰＡＭ位置における他の塩基のＰＡＭ認識活性をほぼ維持していた予想された通り、単一の変異は強力な新しいバリアントに影響を与えることはできるが、強力な新しいバリアントを十分に作出することはできず、ＣＯＭＥＴをさらに繰り返して、追加の変異から得られる組み合わせ効果を探索する必要がある。

コンビナトリアル変異誘発のためのさらなる標的残基の選択の指針とするために、最も上位にランクされたＳａＣａｓ９Ｎ９８６Ｒバリアントに対して新たなＭＤシミュレーションモデル化を行って、そのＰＡＭ認識プロセスを探索した（図７Ｃ）。残基配位の分子的詳細から、Ｒ９９１は、Ｎ９８６Ｒに極めて近接して、Ｎ９８６Ｒとネガティブな様式で相互作用する可能性があるという仮説を立てた。このため、Ｒ９９１上の可能な変異を計算でスクリーニングした後、Ｒ９９１Ａ／Ｌ／ＫバリアントをＮ９８６Ｒと組み合わせて、その非ＴのＰＡＭ認識をさらに強化した。ＣＯＭＥＴワークフローから得られたこの手掛かりを基にして、これらのコンビナトリアルＳａＣａｓ９バリアントの最後のＰＡＭ位置の塩基選好性を試験するために、ＤＮＡ標的化アッセイを適用し、同じく野生型参照と比較した。

その結果、標的内因性ゲノム配列に対して適用された場合に、異なる標的にわたって若干改善されたＮＮＧＲＲＡＰＡＭ結合活性を示したのみならず、ＮＮＧＲＲＣおよびＮＮＧＲＲＧの有意に増強された認識を示した非ＴＰＡＭＳａＣａｓ９バリアントである別の候補、ＳａＣａｓ９Ｎ９８６Ｒ＋Ｒ９９１Ｌが得られた（図８参照）。元のＳａＣａｓ９と比較すると、両バリアントの活性は、以前にはこの小さなＣａｓ９に接近できなかった新たなＰＡＭ配列の効率的な標的化を初めて可能にし、ヒト細胞において実証されているように、ＳａＣａｓ９の作用の範囲が潜在的に３重または４重に拡張する（図７Ｄ、図９）。哺乳動物細胞環境内の複数の標的に対して確認されたこれらの有望な結果により、これらの新しいバリアントは、ＳａＣａｓ９－ＮＲ（ＳａＣａｓ９Ｎ９８６Ｒに対して）およびＳａＣａｓ９－ＲＬ（ＳａＣａｓ９Ｎ９８６Ｒ＋Ｒ９９１Ｌに対して）と名付けられるに至った。これらのＳａＣａｓ９バリアントは、ＳａＣａｓ９天然ＰＡＭ中の最後の位置が編集戦略の最適な設計を妨げる疾患関連遺伝子座を標的とするためのＣａｓ９ツールのファミリーにおける有望な要素としての役割を果たす。特に、増強のために、ＳａＣａｓ９－ＮＲおよびＳａＣａｓ９－ＲＬを他の強力なＣａｓ９ベースのツールと組み合わせることができることに鑑みると、この拡張は、利用できる小さなＣａｓ９ツールの範囲を増加させ得る（Ｓｌａｙｍａｋｅｒら、Ｓｃｉｅｎｃｅ，３５１：８４（２０１６））。

これらの結果は、修飾された特性を有する新規Ｃａｓ９タンパク質を設計するＣＯＭＥＴの能力を実証した。
実施例５

本実施例は、ＰＡＭ二重鎖とのより強い相互作用を提供し、より高い活性を有するさらなるＳａＣａｓ９変異体について説明する。

エンジニアリング設計または計算シミュレーションに対応する変異または改変を導入するために分子クローニングを使用して、新しいＳａＣａｓ９バリアントを生成した。使用した骨格ベクターは、前述したとおりのｐＸ６０１－ＳａＣａｓ９プラスミド（Ａｄｄｇｅｎｅから入手可能）であった。簡単に説明すると、オリゴプライマー（ＩＤＴＤＮＡ）は、ＳａＣａｓ９構築物の望ましい変異を含むＤＮＡ断片を増幅するように設計され、テンプレートｐＸ６０１プラスミドとともにＰＣＲ反応で使用された。得られたＰＣＲ産物をＰＣＲ精製キット（ＱＩＡＧＥＮ）を使用して精製し、アガロースゲル電気泳動によるさらなる分離に供し、ゲル抽出キット（ＱＩＡＧＥＮ）で再度精製した後、下流でのアセンブリ用に正規化した。ベクターの最終的なクローニングは、ギブソンアセンブリ法を使用して実行され、プラスミドを単離するために細菌に形質転換された。ＳａｎｇｅｒＳｅｑｕｅｎｃｉｎｇ（Ｇｅｎｅｗｉｚ）によって全てのプラスミドを確認し、細胞形質移入実験のために保存した。

哺乳動物細胞でのＳａＣａｓ９活性を測定するために、ＦＢＳおよびＧｌｕｔａＭＡＸ（ＴｈｅｒｍｏＦｉｓｈｅｒ）を補充したダルベッコ改変イーグル培地（ＤＭＥＭ）中において、３７°Ｃで、５％ＣＯ_２を供給したインキュベータ中でヒト胎児腎臓２９３Ｔ細胞を維持した。形質移入の約２４時間前に、細胞を２４ウェルプレート（Ｃｏｒｎｉｎｇ）中に播種し、Ｌｉｐｏｆｅｃｔａｍｉｎｅ２０００（ＴｈｅｒｍｏＦｉｓｈｅｒ）を使用して、メーカーの推奨プロトコルに従って適切な培養密度で形質移入した。２４ウェルプレートの各ウェルに対して合計６００ｎｇ～８００ｎｇのＤＮＡを使用した。次いで、いつでも収集できるようになるまで細胞をインキュベートした。

さらなる構造および計算解析により、ＳａＣａｓ９のＰＡＭ認識活性を改善するための潜在的な候補として、ＳａＣａｓ９タンパク質内に追加のアミノ酸残基が同定された。これらは、本発明者らの既存のバリアントと相乗作用し得ると結論付けられた。実験的に試験されたアミノ酸残基は、Ｎ８８５；Ｋ８８６；Ｌ８８７；Ｎ８８８；Ａ８８９であった。図１０に示されるように、これらの残基は、標的ＤＮＡ部位内に位置するＰＡＭ二重鎖との比較的短い距離を有する。したがって、２つの上位バリアント：（１）図１０において９８６Ｒと表記されているＳａＣａｓ９－Ｎ９８６Ｒ（ＳａＣａｓ９－ＮＲ）；（２）図１０において９８６Ｒ／９９１Ｌと表記されているＳａＣａｓ９－Ｎ９８６Ｒ／Ｒ９９１Ｌ（ＳａＣａｓ９－ＲＬ）と組み合わせて、さらなるアミノ酸変異を有する新たなＳａＣａｓ９バリアントを作製した。元の９８６Ｒおよび９８６Ｒ／９９１Ｌバリアントを、参照として試験に含めた。

これらの新たなバリアントでは、図１１に示されているように、より高い結合活性を得るためにＰＡＭ二重鎖とのより強く、より有利な相互作用を与えるために、元のアミノ酸残基は高度に帯電した残基に変異された。
実施例６

本実施例では、Ｅ７８２、Ｎ９６８に対する変異が、既存のＳａＣａｓ９バリアントに対して組み合わせ増強を有することを示す追加の構造モデリングと実験について説明する。

これまでの一連の変異は、ＳａＣａｓ９タンパク質の追加の分析ならびに変異および試験するべきさらなる残基の提案につながった。これらの新しいアミノ酸残基、すなわちＥ７８２およびＮ９６８は、標的ＤＮＡ部位のＰＡＭ二重鎖への結合に焦点を当てた実施例５において変異された残基の群（Ｎ８８５；Ｋ８８６；Ｌ８８７；Ｎ８８８；Ａ８８９）とは構造的に異なる領域に位置している。代わりに、この分析におけるＥ７８２およびＮ９６８残基は、必ずしもＰＡＭ二重鎖に限定されるとは限らないが、ＳａＣａｓ９のその標的ＤＮＡとの一般的な結合を潜在的に強化し得る。したがって、これらの残基の変異を本明細書に記載されている他のバリアントと組み合わせることによって、非天然ＰＡＭ配列を有するＤＮＡ標的を結合する能力をさらに強化し、より高い遺伝子編集活性を有するＳａＣａｓ９－ＮＲおよびＳａＣａｓ９－ＲＬバリアントの「ｖ２．０」が作出され得る。注目すべきことに、これらの２つの残基は、異なるＰＡＭ配列を結合することが以前に示された設計の一部であった（Ｋｌｅｉｎｓｔｉｖｅｒら、上記）。

ＳａＣａｓ９－ＮＲおよびＳａＣａｓ９－ＲＬ変異と組み合わせてＥ７８２ＫまたはＮ９６８Ｋのいずれかを有する変異体は、既存のバリアントを強化することができた。Ｅ７８２Ｋ／Ｎ９８６Ｒ、Ｎ９６８Ｋ／Ｎ９８６Ｒ、Ｅ７８２Ｋ／Ｎ９８６Ｒ／Ｒ９９１Ｌ、Ｎ９６８Ｋ／Ｎ９８６Ｒ／Ｒ９９１Ｌが、非天然のＰＡＭ配列ＮＮＧＲＲ［Ａ／Ｃ／Ｇ］に対してより高い効率を有する最上位のバリアントであった。これらのバリアントは、表１に示されている一連のｖ２．０ＳａＣａｓ９バリアントを構成する。
表１

結合と切断の差（デカップリング）は、結合（図１２）およびゲノム切断／編集（図１３）を測定する試験によって明らかになった。例えば、ＳａＣａｓ９－Ｅ７８２Ｋ／Ｎ９８６Ｒは高い結合活性を有していなかったが、高いゲノム切断活性を示した。他方で、ＳａＣａｓ９－Ｎ９６８Ｋ／Ｎ９８６Ｒ／Ｒ９９１Ｌは、標的への結合において優れていたが、ゲノムＤＮＡ部位の切断についてはそれほど効率的ではなかった。

本明細書に記載されている追加の「ｖ２．０」ＳａＣａｓ９は、結合をベースとした遺伝子活性化／抑制または切断をベースとした遺伝子編集のために使用することができる。最適な結果を得るために、所望の用途に基づいて、特定のＳａＣａｓ９バリアントが選択され得る。
配列番号１

本明細書で引用されている刊行物、特許出願、および特許を含む全ての参考文献は、各参考文献が個別にかつ具体的に参照により組み込まれることが示され、その全体が本明細書に記載される場合と同じ程度まで、参照により本明細書に組み込まれる。

本発明を記載する文脈における（特に、以下の特許請求の範囲との関係における）用語「ａ」および「ａｎ」および「ｔｈｅ」および「少なくとも１つの（ａｔｌｅａｓｔｏｎｅ）」および類似の指示語の使用は、本明細書に別段の記載がなければまたは文脈上明確に矛盾しなければ、単数形と複数形の両方を包含するものと解釈すべきである。１またはそれを超える項目の列記が後続する用語「少なくとも１つ」（例えば、「ＡおよびＢの少なくとも１つ」）の使用は、列記された項目から選択される１つの項目（ＡまたはＢ）を意味する、または本明細書に別段の記載がない限りもしくは文脈上明確に矛盾しない限り、列記された項目の２もしくはそれより多くの任意の組み合わせ（ＡおよびＢ）を意味すると解釈すべきである。用語「含む（ｃｏｍｐｒｉｓｉｎｇ）」、「有する（ｈａｖｉｎｇ）」、「含む（ｉｎｃｌｕｄｉｎｇ）」および「含有する（ｃｏｎｔａｉｎｉｎｇ）」は、別段の記載がなければ、非限定的な用語（すなわち、「含むが、限定されない」という意味）として解釈されなければならない。本明細書に別段の記載がなければ、本明細書における値の範囲の記述は、この範囲内に属する各個別の値を個別的に表すことの簡略な方法としての役割を果たすことが単に意図され、各個別の値は、個別的に本明細書に記載されているごとく、本明細書に組み込まれる。本明細書に別段の記載がなければ、または文脈上明らかに矛盾しなければ、本明細書に記載されている全ての方法は、任意の適切な順序で実施することができる。本明細書中に提供されるあらゆる全ての例または例示的な語句（例えば、「など（ｓｕｃｈａｓ）」の使用は、本発明を単によりよく明らかにすることが意図され、別段の主張がなければ、本発明の範囲に限定を加えるものではない。本明細書中のいずれの語句も、権利主張されていないいずれかの要素が本発明の実施に不可欠であることを示すものと解釈すべきではない。

本発明を実施するための本発明者らが知る最良の態様を含む本発明の好ましい実施形態が本明細書に記載されている。前記記載を読めば、これらの好ましい実施形態の変形が当業者に自明なものとなり得る。本発明者らは、当業者が適宜このような変形を利用することを予期し、本発明者らは、本発明が本明細書に具体的に記載されているものとは異なって実施されることを意図する。したがって、本発明は、適法される法によって許容されるところにより、本明細書に添付された特許請求の範囲に記載された主題の全ての改変および均等物を含む。さらに、本明細書に別段の記載がなければ、または文脈上明らかに矛盾しなければ、全ての可能なその変形中での上記要素のあらゆる組み合わせが本発明によって包含される。

Claims

Ｅ７８２、Ｎ９６８、Ｎ９８６およびＲ９９１の１またはそれを超える残基が異なるアミノ酸で置換されている、配列番号１のアミノ酸配列を含むバリアントＳｔａｐｈｙｌｏｃｏｃｃｕｓａｕｒｅｕｓＣａｓ９（ＳａＣａｓ９）タンパク質。
配列番号１のアミノ酸残基Ｎ９８６が異なるアミノ酸で置換されている、請求項１に記載のバリアントＳａＣａｓ９タンパク質。
前記アミノ酸置換がＮ９８６Ａ、Ｎ９８６Ｒ、Ｎ９８６ＫおよびＮ９８６Ｈから選択される、請求項１または請求項２に記載のバリアントＳａＣａｓ９タンパク質。
配列番号１のアミノ酸残基Ｒ９９１が異なるアミノ酸で置換されている、請求項１に記載のバリアントＳａＣａｓ９タンパク質。
前記アミノ酸置換がＲ９９１Ａ、Ｒ９９１Ｋ、Ｒ９９１Ｌ、Ｒ９９１ＣおよびＲ９９１Ｖから選択される、請求項１または請求項４に記載のバリアントＳａＣａｓ９タンパク質。
配列番号１のアミノ酸残基Ｎ９８６およびＲ９９１の両方が異なるアミノ酸で置換されている、請求項１～５のいずれか一項に記載のバリアントＳａＣａｓ９タンパク質。
Ｅ７８２、Ｎ８８５、Ｋ８８６、Ｌ８８７、Ｎ８８８、Ａ８８９、Ｎ９６８、Ｒ１０１５およびＴ１０１９から選択される配列番号１の１またはそれを超える残基のアミノ酸置換をさらに含む、請求項１～６のいずれか一項に記載のバリアントＳａＣａｓ９タンパク質。
以下のアミノ酸置換：Ｅ７８２Ｋ、Ｎ８８５Ｋ、Ｋ８８６Ｎ、Ｋ８８６Ｒ、Ｌ８８７Ｋ、Ｎ８８８Ｋ、Ａ８８９Ｈ、Ａ８８９Ｋ、Ａ８８９Ｎ、Ｎ９６８Ｋ、Ｒ１０１５Ｈ、Ｔ１０１９Ｒ、Ｔ１０１９ＫおよびＴ１０１９Ｈの１またはそれより多くをさらに含む、請求項７に記載のバリアントＳａＣａｓ９タンパク質。
配列番号１のアミノ酸配列と、
（ａ）Ｎ９８６ＲおよびＲ９９１Ａ；
（ｂ）Ｎ９８６ＲおよびＲ９９１Ｋ；
（ｃ）Ｎ９８６ＲおよびＲ９９１Ｌ；
（ｄ）Ｎ９８６Ｒ、Ｒ９９１ＡおよびＴ１０１９Ｒ；
（ｅ）Ｎ９８６Ｒ、Ｒ９９１ＡおよびＴ１０１９Ｋ；
（ｆ）Ｎ９８６Ｒ、Ｒ９９１ＡおよびＴ１０１９Ｈ；
（ｇ）Ｎ９８６Ｒ、Ｒ９９１ＫおよびＴ１０１９Ｒ；
（ｈ）Ｎ９８６Ｒ、Ｒ９９１ＫおよびＴ１０１９Ｋ；
（ｉ）Ｎ９８６Ｒ、Ｒ９９１ＫおよびＴ１０１９Ｈ；
（ｊ）Ｎ９８６Ｒ、Ｒ９９１ＬおよびＴ１０１９Ｒ；
（ｋ）Ｎ９８６Ｒ、Ｒ９９１ＬおよびＴ１０１９Ｋ；
（ｌ）Ｎ９８６Ｒ、Ｒ９９１ＬおよびＴ１０１９Ｈ；
（ｍ）Ｎ９８６Ｒ、Ｒ９９１ＣおよびＴ１０１９Ｒ；
（ｎ）Ｎ９８６Ｒ、Ｒ９９１ＣおよびＴ１０１９Ｋ；
（ｏ）Ｎ９８６Ｒ、Ｒ９９１ＣおよびＴ１０１９Ｈ；
（ｐ）Ｎ９８６Ｒ、Ｒ９９１ＶおよびＴ１０１９Ｒ；
（ｑ）Ｎ９８６Ｒ、Ｒ９９１ＶおよびＴ１０１９Ｋ；
（ｒ）Ｎ９８６Ｒ、Ｒ９９１ＶおよびＴ１０１９Ｈ；
（ｓ）Ｎ８８５ＫおよびＮ９８６Ｒ；
（ｔ）Ｋ８８６ＮおよびＮ９８６Ｒ；
（ｕ）Ｋ８８６ＲおよびＮ９８６Ｒ；
（ｖ）Ｌ８８７ＫおよびＮ９８６Ｒ；
（ｗ）Ｎ８８８ＫおよびＮ９８６Ｒ；
（ｘ）Ａ８８９ＨおよびＮ９８６Ｒ；
（ｙ）Ａ８８９ＫおよびＮ９８６Ｒ；
（ｚ）Ａ８８９ＮおよびＮ９８６Ｒ；
（ａａ）Ｎ８８５Ｋ、Ｎ９８６ＲおよびＲ９９１Ｌ；
（ｂｂ）Ｋ８８６Ｎ、Ｎ９８６ＲおよびＲ９９１Ｌ；
（ｃｃ）Ｋ８８６Ｒ、Ｎ９８６ＲおよびＲ９９１Ｌ；
（ｄｄ）Ｌ８８７Ｋ、Ｎ９８６ＲおよびＲ９９１Ｌ；
（ｅｅ）Ｎ８８８Ｋ、Ｎ９８６ＲおよびＲ９９１Ｌ；
（ｆｆ）Ａ８８９Ｈ、Ｎ９８６ＲおよびＲ９９１Ｌ；
（ｇｇ）Ａ８８９Ｋ、Ｎ９８６ＲおよびＲ９９１Ｌ；
（ｈｈ）Ａ８８９Ｎ、Ｎ９８６ＲおよびＲ９９１Ｌ；
（ｉｉ）Ｅ７８２ＫおよびＮ９８６Ｒ；
（ｊｊ）Ｎ９６８ＫおよびＮ９８６Ｒ；
（ｋｋ）Ｅ７８２Ｋ、Ｎ９６８ＫおよびＮ９８６Ｒ；
（ｌｌ）Ｅ７８２Ｋ、Ｎ９８６ＲおよびＲ１０１５Ｈ；
（ｍｍ）Ｎ９６８Ｋ、Ｎ９８６ＲおよびＲ１０１５Ｈ；
（ｎｎ）Ｅ７８２Ｋ、Ｎ９６８Ｋ、Ｎ９８６ＲおよびＲ１０１５Ｈ；
（ｏｏ）Ｅ７８２Ｋ、Ｎ９８６ＲおよびＲ９９１Ｌ；
（ｐｐ）Ｎ９６８Ｋ、Ｎ９８６ＲおよびＲ９９１Ｌ；
（ｑｑ）Ｅ７８２Ｋ、Ｎ９６８Ｋ、Ｎ９８６ＲおよびＲ９９１Ｌ；
（ｒｒ）Ｅ７８２Ｋ、Ｎ９８６Ｒ、Ｒ９９１ＬおよびＲ１０１５Ｈ；
（ｓｓ）Ｎ９６８Ｋ、Ｎ９８６Ｒ、Ｒ９９１ＬおよびＲ１０１５Ｈ；ならびに
（ｔｔ）Ｅ７８２Ｋ、Ｎ９６８Ｋ、Ｎ９８６Ｒ、Ｒ９９１ＬおよびＲ１０１５Ｈ；
から選択される２またはそれを超えるアミノ酸置換とを含む、請求項８に記載のバリアントＳａＣａｓ９タンパク質。
請求項１～９のいずれか一項に記載のＳａＣａｓ９タンパク質と少なくとも９５％のアミノ酸配列同一性を含むバリアントＳａＣａｓ９タンパク質。
請求項１～１０のいずれか一項に記載のバリアントＳａＣａｓ９タンパク質をコードする単離された核酸配列。
請求項１１に記載の核酸配列を含むベクター。
（ａ）宿主細胞中の標的ゲノムＤＮＡ配列に相補的なガイドＲＮＡ配列であって、前記標的ゲノムＤＮＡ配列が少なくとも１つの遺伝子産物をコードする、ガイドＲＮＡ配列と、
（ｂ）請求項１～１０のいずれか一項に記載のバリアントＳａＣａｓ９タンパク質をコードする核酸配列を含む核酸分子と、
を含む系。
（ａ）の前記ガイドＲＮＡ配列と（ｂ）の前記核酸分子が異なるベクター中に存在する、請求項１３に記載の系。
（ａ）の前記ガイドＲＮＡ配列と（ｂ）の前記核酸分子が同一のベクター中に存在する、請求項１３に記載の系。
（ａ）宿主細胞中の標的ゲノムＤＮＡ配列に相補的なガイドＲＮＡ配列であって、前記標的ゲノムＤＮＡ配列が少なくとも１つの遺伝子産物をコードする、ガイドＲＮＡ配列と、
（ｂ）請求項１～１０のいずれか一項に記載のバリアントＳａＣａｓ９タンパク質と、
を含む系。
宿主細胞中の標的ゲノムＤＮＡ配列を改変する方法であって、標的ゲノムＤＮＡ配列を含む宿主細胞を、請求項１３～１６のいずれか一項に記載の系と接触させることを含み、
（ａ）前記ガイドＲＮＡ配列は前記宿主細胞中で発現され、前記宿主細胞ゲノム中の前記標的ゲノムＤＮＡ配列に結合し、
（ｂ）前記バリアントＳａＣａｓ９タンパク質は前記宿主細胞中で発現され、前記標的ゲノムＤＮＡ配列中に二本鎖切断を誘導し、それによって前記宿主細胞中の前記標的ゲノムＤＮＡ配列を改変する、
方法。
前記宿主細胞ゲノムが、前記標的ゲノムＤＮＡ配列に隣接して位置する核酸配列ＮＮＧＲＲ［Ｔ／Ａ／Ｃ／Ｇ］を含むプロトスペーサー隣接モチーフ（ＰＡＭ）を含み、「Ｎ」はグアニン、アデニン、チミンまたはシトシンであり、「Ｒ」はグアニンまたはアデニンである、請求項１７に記載の方法。
前記ＰＡＭが、核酸配列ＮＮＧＲＲＴ、ＮＮＧＲＲＣ、ＮＮＧＲＲＡまたはＮＮＧＲＲＧを含む、請求項１８に記載の方法。
前記標的ゲノムＤＮＡ配列がタンパク質をコードする、請求項１７～１９のいずれか一項に記載の方法。
前記宿主細胞が哺乳動物細胞である、請求項１７～２０のいずれか一項に記載の方法。
前記宿主細胞がヒト細胞である、請求項２１に記載の方法。
宿主細胞中の標的ＤＮＡ配列の改変のための、請求項１３～１６のいずれか一項に記載の系の使用。
所望のＰＡＭ特異性を有するバリアントＣａｓ９タンパク質を生成する方法であって、
（ａ）１またはそれを超える変異体Ｃａｓ９タンパク質の所望のＰＡＭへの結合を分子的にシミュレートすることと、
（ｂ）（ａ）の前記シミュレーションにおいて前記所望のＰＡＭに結合する１またはそれを超える変異体Ｃａｓ９タンパク質を合成的に生成することと、
（ｃ）宿主細胞中の標的ＤＮＡ配列に相補的なガイドＲＮＡ配列と組み合わせて、前記宿主細胞中で、前記１またはそれを超える変異体Ｃａｓ９タンパク質を発現させることであって、前記宿主細胞ゲノムは、前記標的ＤＮＡ配列および前記所望のＰＡＭを含む、発現させることと、
（ｄ）前記もう１つの変異体Ｃａｓ９タンパク質の切断活性を測定することと、
（ｅ）前記所望のＰＡＭに結合し、前記標的ＤＮＡ配列を切断する１またはそれを超える変異体Ｃａｓ９タンパク質を選択することであって、それにより、所望のＰＡＭ特異性を有するバリアントＣａｓ９が生成される、選択することと、
を含む、方法。
１またはそれを超える変異体Ｃａｓ９タンパク質の所望のＰＡＭへの結合を分子的にシミュレートすることが、自由エネルギー摂動（ＦＥＰ）計算を含む、請求項２４に記載の方法。