JP2018522544A

JP2018522544A - 熱安定性ｃａｓ９ヌクレアーゼ

Info

Publication number: JP2018522544A
Application number: JP2017564480A
Authority: JP
Inventors: デル，ジョンウースト，ファン; ヨハネスアルノルダスダース，マーティナス; ウィルヘルムスマリアケンゲン，セルヴァティウス; メインデルトヴォス，デ，ウィレム
Original assignee: Purac Biochem BV
Current assignee: Purac Biochem BV
Priority date: 2015-06-12
Filing date: 2016-06-06
Publication date: 2018-08-16
Anticipated expiration: 2036-06-06
Also published as: CA2989084A1; KR20180019655A; US10731142B2; WO2016198361A1; CN107922931A; BR112017026719A8; US11802277B2; AU2016274452A1; BR112017026719A2; EA201890032A1; PH12017502281A1; AU2016274452B2; US20200385697A1; AU2016274452C1; CN107922931B; US20180171314A1; EA038500B1; EP3307883A1; GB201510296D0; JP7088528B2

Abstract

熱安定性Ｃａｓ９ヌクレアーゼ。本発明は、遺伝子工学の分野に関し、さらに詳細には核酸編集およびゲノム改変に関する。本発明は、配列番号１のアミノ酸配列またはそれと少なくとも７７％の同一性の配列を有する単離されたＣａｓタンパク質またはそのポリペプチド断片であって、５０℃から１００℃までの範囲の温度でＤＮＡを切断することができるＣａｓタンパク質またはポリペプチドを提供する。本発明は、前記Ｃａｓ９ヌクレアーゼをコードする単離された核酸分子、発現ベクターおよび宿主細胞をさらに提供する。本明細書に開示されるＣａｓ９ヌクレアーゼは、高温での遺伝子工学のための新規のツールとなり、好熱性生物、特に微生物の遺伝子操作において特に価値がある。

Description

本発明は、遺伝子工学の分野に関し、さらに詳細には核酸編集およびゲノム改変に関する。本発明は、遺伝物質の配列依存部位特異的ニッキングまたは切断のために構成することができるヌクレアーゼ；その上、遺伝物質の配列特異的部位にヌクレアーゼ活性を働かせるリボ核タンパク質、ならびにマーカーとして使用するための修飾ヌクレアーゼおよびリボ核タンパク質の形態での遺伝子工学ツールに関する。したがって、本発明は、細胞内でのヌクレアーゼおよびガイドＲＮＡの送達および発現のための関連発現構築物にも関する。さらに、本発明は、ｉｎｖｉｔｒｏまたはｉｎｖｉｖｏでの核酸の配列特異的編集およびそれを達成するのに使用される方法に関する。本発明が関係する特定の分野は、好熱性生物、特に微生物の遺伝子操作である。

ＣＲＩＳＰＲ−Ｃａｓが多くの細菌および大半の古細菌での適応免疫系であることは２００７年に初めて実証された（Barrangou et al., 2007, Science 315: 1709-1712）、Brouns et al., 2008, Science 321: 960-964）。機能的および構造的判断基準に基づいて、３種類のＣＲＩＳＰＲ−Ｃａｓ系がこれまで特徴付けられており、その大半が相補的ＤＮＡ配列を標的にするためのガイドとして小型ＲＮＡ分子を使用している（Makarova et al., 2011, Nat Rev Microbiol 9: 467-477；Van der Oost et al., 2014, Nat Rev Microbiol 12: 479-492）。

Ｄｏｕｄｎａ／Ｃｈａｒｐｅｎｔｉｅｒ研究室による最近の研究では、ＩＩ型ＣＲＩＳＰＲ−Ｃａｓ系（Ｃａｓ９）のエフェクター酵素の徹底的な特徴付けが実施され、設計されたＣＲＩＳＰＲＲＮＡガイド（特異的スペーサー配列を有する）の導入によりプラスミド上の相補的配列（プロトスペーサー）が標的にされ、このプラスミドの二本鎖切断が引き起こされることが実証された（Jinek et al., 2012, Science 337: 816-821）。Jinek et al., 2012に続いて、Ｃａｓ９はゲノム編集のためのツールとして使用される。

Ｃａｓ９は様々な真核細胞（例えば、魚、植物、ヒト）のゲノムを操作するのに使用されてきた（Charpentier and Doudna, 2013, Nature 495: 50-51）。

さらに、Ｃａｓ９は、特定の組換え事象を選び出すことにより細菌での相同組換えの収率を改善するのに使用されてきた（Jiang et al., 2013, Nature Biotechnol 31: 233-239）。これを達成するためには、毒性断片（ターゲティング構築物）に所望の変化をもつレスキュー断片（編集構築物、点突然変異または欠失を有する）を共トランスフェクトする。ターゲティング構築物は、デザインＣＲＩＳＰＲと組み合わせたＣａｓ９および宿主染色体上で所望の組換え部位を規定する抗生物質耐性マーカーからなり、対応する抗生物質の存在下では宿主染色体でのターゲティング構築物の組込みが選択される。ＣＲＩＳＰＲ標的部位を有する編集構築物の追加の組換えが宿主染色体の他の場所で起こる場合のみ、宿主は自己免疫問題から逃れることが可能である。したがって、抗生物質の存在下では、所望の（マーカーなし）突然変異体のみが生き延びて成長することができる。染色体から組み込まれたターゲティング構築物のその後の除去を選ぶ関連戦略も提起されており、本物のマーカーなし突然変異体を生み出している。

ＣＲＩＳＰＲ−Ｃａｓ媒介ゲノム編集は遺伝子工学のための有用なツールを成すことが近年確立された。原核生物ＣＲＩＳＰＲ系が適応免疫系としてその宿主に役立ち（Jinek et al., 2012, Science 337: 816-821）、迅速で効果的な遺伝子工学のために使用することが可能であり（例えば、Mali et al., 2013, Nat Methods 10:957-963）、目的の配列を標的にするためにはガイド配列の改変のみが必要であることが確立されている。

しかし、遺伝子研究およびゲノム編集の分野での応用のために種々の実験条件下で改良された配列特異的核酸検出、切断および操作ができる作用因子の開発の必要性が続けて存在している。特に、Ｃａｓ９を含む現在利用可能な配列特異的ゲノム編集ツールは、あらゆる条件または生物での使用に適用可能なわけではなく、例えば、配列特異的ヌクレアーゼは相対的に熱感受性であり、したがって、厳密に好熱性の微生物（４１℃と１２２℃の間で成長することができ、最適には６０℃超から８０℃の温度範囲で成長し、超好熱菌は８０℃より上で最適成長できる）、例えば、工業用発酵においてまたは高温で行われるｉｎｖｉｔｒｏ実験工程のために使用される微生物での使用には適用可能ではない。

好熱菌において活性Ｃａｓ９タンパク質についての実験的証拠は現在まで存在しない。細菌におけるＣａｓ９の存在下でのChylinski et al. (2014; Nucleic Acids Research 42: 6091-6105)による比較ゲノムスクリーニングに基づいて、ＩＩ−Ｃ型ＣＲＩＳＰＲ−Ｃａｓ系はすべての細菌ゲノムのおおよそ３．３％に存在するだけであることが見出された。好熱性細菌のなかで、ＩＩ型系は統計分析（Ｐ＝０．００１９）に基づいて過小に見積もられている。さらに、古細菌ではＩＩ型系は見出されていないが、これはおそらく古細菌にはリボヌクレアーゼＩＩＩタンパク質（ＩＩ型系に関与する）が存在しないせいであろう。Chylinski, et al., (2014; Nucleic Acids Research 42: 6091-6105)は、ＩＩ型ＣＲＩＳＰＲ−Ｃａｓ系の分類および進化を過去に報告しており、特に、これらの系を示す２つの種が同定されているが、これらの種は最大５５℃で成長し、最適成長温度が６０〜８０℃であり、超好熱菌では８０℃より上で最適に成長できる厳密に好熱性の成長を示してはいない。

細菌ゲノムにおけるＣＲＩＳＰＲ−Ｃａｓ系の希少性、特に、Ｃａｓ９が最適成長温度が４５℃よりも低い細菌（古細菌ではない）でしか見つかっていないという事実にもかかわらず、本発明者らは、驚くべきことに、ゲノム編集を高温で実行するのを可能にするいくつかの熱安定性Ｃａｓ９変異体を発見した。これらのＣａｓ９ヌクレアーゼは、高温での遺伝子工学のための新規のツールとなり、好熱性生物、特に微生物の遺伝子操作で特に価値がある。

したがって、本発明は、
ａ．アミノ酸モチーフＥＫＤＧＫＹＹＣ［配列番号２］；および／または
ｂ．アミノ酸モチーフＸ_１Ｘ_２ＣＴＸ_３Ｘ_４［配列番号３］（式中、Ｘ_１はイソロイシン、メチオニンまたはプロリンから独立して選択され、Ｘ_２はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、Ｘ_３はグルタミン酸またはリシンから独立して選択され、Ｘ_４はアラニン、グルタミン酸またはアルギニンのうちの１つである）；および／または
ｃ．アミノ酸モチーフＸ_５ＬＫＸ_６ＩＥ［配列番号４］（式中、Ｘ_５はメチオニンまたはフェニルアラニンから独立して選択され、Ｘ_６はヒスチジンまたはアスパラギンから独立して選択される）；および／または
ｄ．アミノ酸モチーフＸ_７ＶＹＳＸ_８Ｋ［配列番号５］（式中、Ｘ_７はグルタミン酸またはイソロイシンであり、Ｘ_８はトリプトファン、セリンまたはリシンのうちの１つである）；および／または
ｅ．アミノ酸モチーフＸ_９ＦＹＸ_１０Ｘ_１１ＲＥＱＸ_１２ＫＥＸ_１３［配列番号６］（式中、Ｘ_９はアラニンまたはグルタミン酸であり、Ｘ_１０はグルタミンまたはリシンであり、Ｘ_１１はアルギニンまたはアラニンであり、Ｘ_１２はアスパラギンまたはアラニンであり、Ｘ_１３はリシンまたはセリンである）
を含む、単離されたＣａｓ（ＣＲＩＳＰＲ（ｃｌｕｓｔｅｒｅｄｒｅｇｕｌａｒｌｙｉｎｔｅｒｓｐａｃｅｄｓｈｏｒｔｐａｌｉｎｄｒｏｍｉｃｒｅｐｅａｔ：クラスター化し規則的に間隔を置いた短い回文配列の繰り返し）ａｓｓｏｃｉａｔｅｄ：ＣＲＩＳＰＲ関連）タンパク質またはポリペプチドを提供する。

本発明の状況でのポリペプチドは、よい。そのような断片は不活性であり、遺伝物質の編集または切断と直接関連のない方完全長Ｃａｓタンパク質の断片と見なしても法でおよび目的のために、例えば、アッセイでの標準または抗体を産生するなどのために使用してもよい。

しかし、好ましい実施形態では、Ｃａｓタンパク質またはポリペプチドは、少なくとも１つのターゲティングＲＮＡ分子、およびターゲティングＲＮＡ分子により認識される標的核酸配列を含むポリヌクレオチドと会合すると、５０℃から１００℃までの範囲の温度で機能的であり、ＤＮＡを切断することができる。

特定の実施形態では、本発明は、アミノ酸モチーフＥＫＤＧＫＹＹＣ［配列番号２］を含むＣａｓタンパク質またはポリペプチドを提供することができる。他の実施形態では、Ｃａｓタンパク質またはポリペプチドはアミノ酸モチーフＸ_１Ｘ_２ＣＴＸ_３Ｘ_４［配列番号３］（式中、Ｘ_１はイソロイシン、メチオニンまたはプロリンから独立して選択され、Ｘ_２はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、Ｘ_３はグルタミン酸またはリシンから独立して選択され、Ｘ_４はアラニン、グルタミン酸またはアルギニンのうちの１つである）をさらに含んでいてもよい。

他の実施形態では、本明細書で定義されるＣａｓタンパク質またはポリペプチドはアミノ酸モチーフＸ_５ＬＫＸ_６ＩＥ［配列番号４］（式中、Ｘ_５はメチオニンまたはフェニルアラニンから独立して選択され、Ｘ_６はヒスチジンまたはアスパラギンから独立して選択される）を追加でさらに含んでいてもよい。

他の実施形態では、本明細書で定義されるＣａｓタンパク質またはポリペプチドはアミノ酸モチーフＸ_７ＶＹＳＸ_８Ｋ［配列番号５］（式中、Ｘ_７はグルタミン酸またはイソロイシンであり、Ｘ_８はトリプトファン、セリンまたはリシンのうちの１つである）を追加でさらに含んでいてもよい。

他の実施形態では、本明細書で定義されるＣａｓタンパク質またはポリペプチドはアミノ酸モチーフＸ_９ＦＹＸ_１０Ｘ_１１ＲＥＱＸ_１２ＫＥＸ_１３［配列番号６］（式中、Ｘ_９はアラニンまたはグルタミン酸であり、Ｘ_１０はグルタミンまたはリシンであり、Ｘ_１１はアルギニンまたはアラニンであり、Ｘ_１２はアスパラギンまたはアラニンであり、Ｘ_１３はリシンまたはセリンである）を追加でさらに含んでいてもよい。

本発明に従えば、本発明のＣａｓタンパク質またはポリペプチドは配列番号２から６のモチーフのうちのいずれでも、単独でまたは組み合わせて含むことができることが認識されうる。以下は、本発明のＣａｓタンパク質またはポリペプチドを特徴付けることができるモチーフの組合せのそれぞれを要約している。

ＥＫＤＧＫＹＹＣ［配列番号２］

ＥＫＤＧＫＹＹＣ［配列番号２］；およびＸ_１Ｘ_２ＣＴＸ_３Ｘ_４［配列番号３］（式中、Ｘ_１はイソロイシン、メチオニンまたはプロリンから独立して選択され、Ｘ_２はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、Ｘ_３はグルタミン酸またはリシンから独立して選択され、Ｘ_４はアラニン、グルタミン酸またはアルギニンのうちの１つである）。

ＥＫＤＧＫＹＹＣ［配列番号２］；およびＸ_１Ｘ_２ＣＴＸ_３Ｘ_４［配列番号３］（式中、Ｘ_１はイソロイシン、メチオニンまたはプロリンから独立して選択され、Ｘ_２はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、Ｘ_３はグルタミン酸またはリシンから独立して選択され、Ｘ_４はアラニン、グルタミン酸またはアルギニンのうちの１つである）；およびＸ_５ＬＫＸ_６ＩＥ［配列番号４］（式中、Ｘ_５はメチオニンまたはフェニルアラニンから独立して選択され、Ｘ_６はヒスチジンまたはアスパラギンから独立して選択される）。

ＥＫＤＧＫＹＹＣ［配列番号２］；およびＸ_１Ｘ_２ＣＴＸ_３Ｘ_４［配列番号３］（式中、Ｘ_１はイソロイシン、メチオニンまたはプロリンから独立して選択され、Ｘ_２はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、Ｘ_３はグルタミン酸またはリシンから独立して選択され、Ｘ_４はアラニン、グルタミン酸またはアルギニンのうちの１つである）；およびＸ_５ＬＫＸ_６ＩＥ［配列番号４］（式中、Ｘ_５はメチオニンまたはフェニルアラニンから独立して選択され、Ｘ_６はヒスチジンまたはアスパラギンから独立して選択される）；およびＸ_７ＶＹＳＸ_８Ｋ［配列番号５］（式中、Ｘ_７はグルタミン酸またはイソロイシンであり、Ｘ_８はトリプトファン、セリンまたはリシンのうちの１つである）。

ＥＫＤＧＫＹＹＣ［配列番号２］；およびＸ_１Ｘ_２ＣＴＸ_３Ｘ_４［配列番号３］（式中、Ｘ_１はイソロイシン、メチオニンまたはプロリンから独立して選択され、Ｘ_２はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、Ｘ_３はグルタミン酸またはリシンから独立して選択され、Ｘ_４はアラニン、グルタミン酸またはアルギニンのうちの１つである）；およびＸ_５ＬＫＸ_６ＩＥ［配列番号４］（式中、Ｘ_５はメチオニンまたはフェニルアラニンから独立して選択され、Ｘ_６はヒスチジンまたはアスパラギンから独立して選択される）；およびＸ_７ＶＹＳＸ_８Ｋ［配列番号５］（式中、Ｘ_７はグルタミン酸またはイソロイシンであり、Ｘ_８はトリプトファン、セリンまたはリシンのうちの１つである）；およびＸ_９ＦＹＸ_１０Ｘ_１１ＲＥＱＸ_１２ＫＥＸ_１３［配列番号６］（式中、Ｘ_９はアラニンまたはグルタミン酸であり、Ｘ_１０はグルタミンまたはリシンであり、Ｘ_１１はアルギニンまたはアラニンであり、Ｘ_１２はアスパラギンまたはアラニンであり、Ｘ_１３はリシンまたはセリンである）。

ＥＫＤＧＫＹＹＣ［配列番号２］；およびＸ_１Ｘ_２ＣＴＸ_３Ｘ_４［配列番号３］（式中、Ｘ_１はイソロイシン、メチオニンまたはプロリンから独立して選択され、Ｘ_２はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、Ｘ_３はグルタミン酸またはリシンから独立して選択され、Ｘ_４はアラニン、グルタミン酸またはアルギニンのうちの１つである）；およびＸ_５ＬＫＸ_６ＩＥ［配列番号４］（式中、Ｘ_５はメチオニンまたはフェニルアラニンから独立して選択され、Ｘ_６はヒスチジンまたはアスパラギンから独立して選択される）；およびＸ_９ＦＹＸ_１０Ｘ_１１ＲＥＱＸ_１２ＫＥＸ_１３［配列番号６］（式中、Ｘ_９はアラニンまたはグルタミン酸であり、Ｘ_１０はグルタミンまたはリシンであり、Ｘ_１１はアルギニンまたはアラニンであり、Ｘ_１２はアスパラギンまたはアラニンであり、Ｘ_１３はリシンまたはセリンである）。

ＥＫＤＧＫＹＹＣ［配列番号２］；およびＸ_１Ｘ_２ＣＴＸ_３Ｘ_４［配列番号３］（式中、Ｘ_１はイソロイシン、メチオニンまたはプロリンから独立して選択され、Ｘ_２はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、Ｘ_３はグルタミン酸またはリシンから独立して選択され、Ｘ_４はアラニン、グルタミン酸またはアルギニンのうちの１つである）；およびＸ_７ＶＹＳＸ_８Ｋ［配列番号５］（式中、Ｘ_７はグルタミン酸またはイソロイシンであり、Ｘ_８はトリプトファン、セリンまたはリシンのうちの１つである）；およびＸ_９ＦＹＸ_１０Ｘ_１１ＲＥＱＸ_１２ＫＥＸ_１３［配列番号６］（式中、Ｘ_９はアラニンまたはグルタミン酸であり、Ｘ_１０はグルタミンまたはリシンであり、Ｘ_１１はアルギニンまたはアラニンであり、Ｘ_１２はアスパラギンまたはアラニンであり、Ｘ_１３はリシンまたはセリンである）。

ＥＫＤＧＫＹＹＣ［配列番号２］；およびＸ_５ＬＫＸ_６ＩＥ［配列番号４］（式中、Ｘ_５はメチオニンまたはフェニルアラニンから独立して選択され、Ｘ_６はヒスチジンまたはアスパラギンから独立して選択される）；およびＸ_７ＶＹＳＸ_８Ｋ［配列番号５］（式中、Ｘ_７はグルタミン酸またはイソロイシンであり、Ｘ_８はトリプトファン、セリンまたはリシンのうちの１つである）；およびＸ_９ＦＹＸ_１０Ｘ_１１ＲＥＱＸ_１２ＫＥＸ_１３［配列番号６］（式中、Ｘ_９はアラニンまたはグルタミン酸であり、Ｘ_１０はグルタミンまたはリシンであり、Ｘ_１１はアルギニンまたはアラニンであり、Ｘ_１２はアスパラギンまたはアラニンであり、Ｘ_１３はリシンまたはセリンである）。

ＥＫＤＧＫＹＹＣ［配列番号２］；およびＸ_５ＬＫＸ_６ＩＥ［配列番号４］（式中、Ｘ_５はメチオニンまたはフェニルアラニンから独立して選択され、Ｘ_６はヒスチジンまたはアスパラギンから独立して選択される）。

ＥＫＤＧＫＹＹＣ［配列番号２］；およびＸ_７ＶＹＳＸ_８Ｋ［配列番号５］（式中、Ｘ_７はグルタミン酸またはイソロイシンであり、Ｘ_８はトリプトファン、セリンまたはリシンのうちの１つである）。

ＥＫＤＧＫＹＹＣ［配列番号２］；およびＸ_９ＦＹＸ_１０Ｘ_１１ＲＥＱＸ_１２ＫＥＸ_１３［配列番号６］（式中、Ｘ_９はアラニンまたはグルタミン酸であり、Ｘ_１０はグルタミンまたはリシンであり、Ｘ_１１はアルギニンまたはアラニンであり、Ｘ_１２はアスパラギンまたはアラニンであり、Ｘ_１３はリシンまたはセリンである）。

ＥＫＤＧＫＹＹＣ［配列番号２］；およびＸ_５ＬＫＸ_６ＩＥ［配列番号４］（式中、Ｘ_５はメチオニンまたはフェニルアラニンから独立して選択され、Ｘ_６はヒスチジンまたはアスパラギンから独立して選択される）；およびＸ_７ＶＹＳＸ_８Ｋ［配列番号５］（式中、Ｘ_７はグルタミン酸またはイソロイシンであり、Ｘ_８はトリプトファン、セリンまたはリシンのうちの１つである）。

ＥＫＤＧＫＹＹＣ［配列番号２］；およびＸ_５ＬＫＸ_６ＩＥ［配列番号４］（式中、Ｘ_５はメチオニンまたはフェニルアラニンから独立して選択され、Ｘ_６はヒスチジンまたはアスパラギンから独立して選択される）；およびＸ_９ＦＹＸ_１０Ｘ_１１ＲＥＱＸ_１２ＫＥＸ_１３［配列番号６］（式中、Ｘ_９はアラニンまたはグルタミン酸であり、Ｘ_１０はグルタミンまたはリシンであり、Ｘ_１１はアルギニンまたはアラニンであり、Ｘ_１２はアスパラギンまたはアラニンであり、Ｘ_１３はリシンまたはセリンである）。

ＥＫＤＧＫＹＹＣ［配列番号２］；およびＸ_７ＶＹＳＸ_８Ｋ［配列番号５］（式中、Ｘ_７はグルタミン酸またはイソロイシンであり、Ｘ_８はトリプトファン、セリンまたはリシンのうちの１つである）；およびＸ_９ＦＹＸ_１０Ｘ_１１ＲＥＱＸ_１２ＫＥＸ_１３［配列番号６］（式中、Ｘ_９はアラニンまたはグルタミン酸であり、Ｘ_１０はグルタミンまたはリシンであり、Ｘ_１１はアルギニンまたはアラニンであり、Ｘ_１２はアスパラギンまたはアラニンであり、Ｘ_１３はリシンまたはセリンである）。

Ｘ_１Ｘ_２ＣＴＸ_３Ｘ_４［配列番号３］（式中、Ｘ_１はイソロイシン、メチオニンまたはプロリンから独立して選択され、Ｘ_２はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、Ｘ_３はグルタミン酸またはリシンから独立して選択され、Ｘ_４はアラニン、グルタミン酸またはアルギニンのうちの１つである）；およびＸ_５ＬＫＸ_６ＩＥ［配列番号４］（式中、Ｘ_５はメチオニンまたはフェニルアラニンから独立して選択され、Ｘ_６はヒスチジンまたはアスパラギンから独立して選択される）。

Ｘ_１Ｘ_２ＣＴＸ_３Ｘ_４［配列番号３］（式中、Ｘ_１はイソロイシン、メチオニンまたはプロリンから独立して選択され、Ｘ_２はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、Ｘ_３はグルタミン酸またはリシンから独立して選択され、Ｘ_４はアラニン、グルタミン酸またはアルギニンのうちの１つである）；およびＸ_５ＬＫＸ_６ＩＥ［配列番号４］（式中、Ｘ_５はメチオニンまたはフェニルアラニンから独立して選択され、Ｘ_６はヒスチジンまたはアスパラギンから独立して選択される）；およびＸ_７ＶＹＳＸ_８Ｋ［配列番号５］（式中、Ｘ_７はグルタミン酸またはイソロイシンであり、Ｘ_８はトリプトファン、セリンまたはリシンのうちの１つである）。

Ｘ_１Ｘ_２ＣＴＸ_３Ｘ_４［配列番号３］（式中、Ｘ_１はイソロイシン、メチオニンまたはプロリンから独立して選択され、Ｘ_２はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、Ｘ_３はグルタミン酸またはリシンから独立して選択され、Ｘ_４はアラニン、グルタミン酸またはアルギニンのうちの１つである）；およびＸ_５ＬＫＸ_６ＩＥ［配列番号４］（式中、Ｘ_５はメチオニンまたはフェニルアラニンから独立して選択され、Ｘ_６はヒスチジンまたはアスパラギンから独立して選択される）；およびＸ_７ＶＹＳＸ_８Ｋ［配列番号５］（式中、Ｘ_７はグルタミン酸またはイソロイシンであり、Ｘ_８はトリプトファン、セリンまたはリシンのうちの１つである）；およびＸ_９ＦＹＸ_１０Ｘ_１１ＲＥＱＸ_１２ＫＥＸ_１３［配列番号６］（式中、Ｘ_９はアラニンまたはグルタミン酸であり、Ｘ_１０はグルタミンまたはリシンであり、Ｘ_１１はアルギニンまたはアラニンであり、Ｘ_１２はアスパラギンまたはアラニンであり、Ｘ_１３はリシンまたはセリンである）。

Ｘ_１Ｘ_２ＣＴＸ_３Ｘ_４［配列番号３］（式中、Ｘ_１はイソロイシン、メチオニンまたはプロリンから独立して選択され、Ｘ_２はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、Ｘ_３はグルタミン酸またはリシンから独立して選択され、Ｘ_４はアラニン、グルタミン酸またはアルギニンのうちの１つである）；およびＸ_７ＶＹＳＸ_８Ｋ［配列番号５］（式中、Ｘ_７はグルタミン酸またはイソロイシンであり、Ｘ_８はトリプトファン、セリンまたはリシンのうちの１つである）；およびＸ_９ＦＹＸ_１０Ｘ_１１ＲＥＱＸ_１２ＫＥＸ_１３［配列番号６］（式中、Ｘ_９はアラニンまたはグルタミン酸であり、Ｘ_１０はグルタミンまたはリシンであり、Ｘ_１１はアルギニンまたはアラニンであり、Ｘ_１２はアスパラギンまたはアラニンであり、Ｘ_１３はリシンまたはセリンである）。

Ｘ_１Ｘ_２ＣＴＸ_３Ｘ_４［配列番号３］（式中、Ｘ_１はイソロイシン、メチオニンまたはプロリンから独立して選択され、Ｘ_２はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、Ｘ_３はグルタミン酸またはリシンから独立して選択され、Ｘ_４はアラニン、グルタミン酸またはアルギニンのうちの１つである）；およびＸ_７ＶＹＳＸ_８Ｋ［配列番号５］（式中、Ｘ_７はグルタミン酸またはイソロイシンであり、Ｘ_８はトリプトファン、セリンまたはリシンのうちの１つである）。

Ｘ_１Ｘ_２ＣＴＸ_３Ｘ_４［配列番号３］（式中、Ｘ_１はイソロイシン、メチオニンまたはプロリンから独立して選択され、Ｘ_２はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、Ｘ_３はグルタミン酸またはリシンから独立して選択され、Ｘ_４はアラニン、グルタミン酸またはアルギニンのうちの１つである）；およびＸ_９ＦＹＸ_１０Ｘ_１１ＲＥＱＸ_１２ＫＥＸ_１３［配列番号６］（式中、Ｘ_９はアラニンまたはグルタミン酸であり、Ｘ_１０はグルタミンまたはリシンであり、Ｘ_１１はアルギニンまたはアラニンであり、Ｘ_１２はアスパラギンまたはアラニンであり、Ｘ_１３はリシンまたはセリンである）。

Ｘ_５ＬＫＸ_６ＩＥ［配列番号４］（式中、Ｘ_５はメチオニンまたはフェニルアラニンから独立して選択され、Ｘ_６はヒスチジンまたはアスパラギンから独立して選択される）；およびＸ_７ＶＹＳＸ_８Ｋ［配列番号５］（式中、Ｘ_７はグルタミン酸またはイソロイシンであり、Ｘ_８はトリプトファン、セリンまたはリシンのうちの１つである）；およびＸ_９ＦＹＸ_１０Ｘ_１１ＲＥＱＸ_１２ＫＥＸ_１３［配列番号６］（式中、Ｘ_９はアラニンまたはグルタミン酸であり、Ｘ_１０はグルタミンまたはリシンであり、Ｘ_１１はアルギニンまたはアラニンであり、Ｘ_１２はアスパラギンまたはアラニンであり、Ｘ_１３はリシンまたはセリンである）。

Ｘ_５ＬＫＸ_６ＩＥ［配列番号４］（式中、Ｘ_５はメチオニンまたはフェニルアラニンから独立して選択され、Ｘ_６はヒスチジンまたはアスパラギンから独立して選択される）；およびＸ_７ＶＹＳＸ_８Ｋ［配列番号５］（式中、Ｘ_７はグルタミン酸またはイソロイシンであり、Ｘ_８はトリプトファン、セリンまたはリシンのうちの１つである）。

Ｘ_５ＬＫＸ_６ＩＥ［配列番号４］（式中、Ｘ_５はメチオニンまたはフェニルアラニンから独立して選択され、Ｘ_６はヒスチジンまたはアスパラギンから独立して選択される）；およびＸ_９ＦＹＸ_１０Ｘ_１１ＲＥＱＸ_１２ＫＥＸ_１３［配列番号６］（式中、Ｘ_９はアラニンまたはグルタミン酸であり、Ｘ_１０はグルタミンまたはリシンであり、Ｘ_１１はアルギニンまたはアラニンであり、Ｘ_１２はアスパラギンまたはアラニンであり、Ｘ_１３はリシンまたはセリンである）。

Ｘ_７ＶＹＳＸ_８Ｋ［配列番号５］（式中、Ｘ_７はグルタミン酸またはイソロイシンであり、Ｘ_８はトリプトファン、セリンまたはリシンのうちの１つである）；およびＸ_９ＦＹＸ_１０Ｘ_１１ＲＥＱＸ_１２ＫＥＸ_１３［配列番号６］（式中、Ｘ_９はアラニンまたはグルタミン酸であり、Ｘ_１０はグルタミンまたはリシンであり、Ｘ_１１はアルギニンまたはアラニンであり、Ｘ_１２はアスパラギンまたはアラニンであり、Ｘ_１３はリシンまたはセリンである）。

別の態様では、本発明は、配列番号１のアミノ酸配列またはそれと少なくとも７７％の同一性の配列を有する単離されたＣａｓタンパク質またはそのポリペプチド断片であって、５０℃から１００℃までの範囲の温度でＤＮＡを切断することができるＣａｓタンパク質またはポリペプチドを提供する。

好ましくは、Ｃａｓタンパク質またはポリペプチドは６０℃から８０℃までの範囲の温度でＤＮＡを切断することができる。例えば、ＤＮＡ切断は、６１℃、６２℃、６３℃、６４℃、６５℃、６６℃、６７℃、６８℃、６９℃、７０℃、７１℃、７２℃、７３℃、７４℃、７５℃、７６℃、７７℃、７８℃、７９℃または８０℃の温度で起こる。より好ましくは、Ｃａｓタンパク質またはポリペプチドは、６０℃から６５℃の範囲の温度でＤＮＡを切断することができる。好ましい態様では、本発明のＣａｓタンパク質またはポリペプチド断片は、配列番号１に対して少なくとも７５％の同一性；好ましくは少なくとも８５％；より好ましくは少なくとも９０％；さらにより好ましくは少なくとも９５％の同一性のアミノ酸配列を含むことができる。

さらに詳細には、本発明のＣａｓタンパク質またはポリペプチドは、配列番号１と以下の通り：少なくとも６０％、少なくとも６１％、少なくとも６２％、少なくとも６３％、少なくとも６４％、少なくとも６５％、少なくとも６６％、少なくとも６７％、少なくとも６８％、少なくとも６９％、少なくとも７０％、少なくとも７１％、少なくとも７２％、少なくとも７３％、少なくとも７４％、少なくとも７５％、少なくとも７６％、少なくとも７７％、少なくとも７８％、少なくとも７９％、少なくとも８０％、少なくとも８１％、少なくとも８２％、少なくとも８３％、少なくとも８４％、少なくとも８５％、少なくとも８６％、少なくとも８７％、少なくとも８８％、少なくとも８９％、少なくとも９０％、少なくとも９１％、少なくとも９２％、少なくとも９３％、少なくとも９４％、少なくとも９５％、少なくとも９６％、少なくとも９７％、少なくとも９８％、少なくとも９９％、少なくとも９９．５％または少なくとも９９．８％のパーセント同一性を有するアミノ酸配列を含むことができる。

配列番号１とのパーセントアミノ酸配列同一性は、２つの配列の最適整列のために導入する必要があるギャップの数およびそれぞれのギャップの長さを考慮に入れて、選択された比較窓において配列により共有されている同一の位置の数の関数として決定可能である。

本発明のＣａｓタンパク質またはポリペプチド断片は、基準配列の配列番号１とパーセント配列同一性により定義されるその任意の前述のパーセント変異体の両方の点から、単独でまたは本質的特徴としての前述のアミノ酸モチーフ（すなわち、配列番号２および／または３および／または４および／または５および／または６）のいずれかと組み合わせて、特徴付けることができる。

その上、本発明は本発明の前述のタンパク質またはポリペプチドのいずれかをコードする核酸を提供する。核酸は単離されていても発現構築物の形態であってもよい。

本発明のすべての前述の態様では、アミノ酸残基は保存的にも非保存的にも置換されていてよい。保存的アミノ酸置換とは、アミノ酸残基が類似する化学的特性（例えば、電荷または疎水性）を有する他のアミノ酸残基で置換され、したがって、得られるポリペプチドの機能的特性を変化させないアミノ酸置換のことである。

同様に、核酸配列がポリペプチドの機能に影響を与えずに保存的にも非保存的にも置換されうることは当業者であれば認識している。保存的に改変された核酸とは、アミノ酸配列の同一のまたは機能的に同一の変異体をコードする核酸で置換された核酸のことである。核酸のそれぞれのコドン（ＡＵＧおよびＵＧＧを除く；典型的にはそれぞれメチオニンまたはトリプトファンの唯一のコドン）は改変して機能的に同一の分子を生じることが可能であることは当業者であれば認識している。したがって、ポリヌクレオチドまたはポリペプチドのそれぞれのサイレント変異（すなわち、同義コドン）は、本発明のポリペプチドをコードし、それぞれの記載されているポリペプチド配列に潜在的に含まれている。

切断温度
本発明のＣａｓタンパク質のヌクレアーゼ活性の最適温度範囲を含む温度範囲は、既知のＣａｓ９タンパク質よりも著しく高い。その上、本発明のＣａｓタンパク質がヌクレアーゼ活性を保持する範囲の最上方は、既知のＣａｓ９タンパク質よりもはるかに高い。より高い最適温度および機能範囲は高温での遺伝子工学に、したがって、例えば、好熱性生物のゲノムの編集に著しい利点を与え、この好熱性生物の多くが高温で行われる様々な工業、農業および製薬工程において有用性がある。

有利なことに、本発明のＣａｓタンパク質またはポリペプチドは２０℃から１００℃で核酸を切断することができるが、高温、例えば、４１℃と１２２℃の間、好ましくは５０℃と１００℃の間で特に有用である。本発明のＣａｓタンパク質およびポリペプチドは、ＤＮＡ、ＲＮＡおよび合成核酸を切断することができる。本発明のＣａｓタンパク質またはポリペプチドは、例えば、２０から４０℃の範囲の温度でヌクレアーゼ活性および遺伝子編集適用に操作性を与えることもできる。

好ましくは、本発明のＣａｓタンパク質またはポリペプチドは、ポリヌクレオチド分子（複数可）中の、切断され、標識されまたは改変される標的配列を認識する適切なｇＲＮＡ（ガイドＲＮＡ）と会合する場合、５０℃から１００℃の範囲の、任意選択で５５℃から１００℃、６０℃から１００℃、６５℃から１００℃、７０℃から１００℃、７５℃から１００℃、８０℃から１００℃、８５℃から１００℃、９０℃から１００℃、９５℃から１００℃の範囲の温度で会合する。より好ましくは、本発明のＣａｓタンパク質は、５１℃から９９℃、５２℃から９８℃、５３℃から９７℃、５４℃から９６℃、５５℃から９５℃、５６℃から９４℃、５７℃から９３℃、５８℃から９２℃、５９℃から９１℃、６０℃から９０℃、６１℃から８９℃、６２℃から８８℃、６３℃から８７℃、６４℃から８６℃、６５℃から８５℃、６６℃から８４℃、６７℃から８３℃、６８℃から８２℃、６９℃から８１℃、７０℃から８０℃、７１℃から７９℃、７２℃から７８℃、７３℃から７７℃、７４℃から７６℃、７５℃の範囲の温度で核酸を切断する、標識または改変する。好ましくは、本発明のＣａｓタンパク質は、６０℃から８０℃、６１℃から７９℃、６２℃から７８℃、６３℃から７７℃、６４℃から７６℃、６０℃から７５℃、６０℃から７０℃の範囲の温度で核酸を切断する、標識または改変する。本発明のＣａｓタンパク質は、６０℃から６５℃の範囲の温度で、好ましくは６５℃で、核酸を切断、標識または改変するのが最適である。

本発明のすべての態様では、Ｃａｓタンパク質またはポリペプチドは、細菌、古細菌またはウイルスから入手するもしくはこれらに由来してもよく、または代わりに新規に合成してもよい。好ましい実施形態では、本発明のＣａｓタンパク質またはポリペプチドは、古細菌または細菌として分類してもよい、しかし好ましくは細菌である好熱性原核生物に由来する。より好ましくは、本発明のＣａｓタンパク質またはポリペプチドは、好熱性細菌に由来することになる。本明細書では、用語好熱性は、相対的に高い温度で生存し成長することができる、例えば、本発明の文脈では、４１℃と１２２℃（１０６と２５２゜Ｆ）の間で核酸を切断することができることを意味すると理解されるべきである。好ましくは、本発明のＣａｓタンパク質またはポリペプチドは、１つまたは複数の好熱性細菌から単離することができ、６０℃よりも上で機能する。好ましくは、本発明のＣａｓタンパク質またはポリペプチドは、１つまたは複数の好熱性細菌から単離することができ、６０℃から８０℃の範囲で、最適には６０℃と６５℃の間で機能する。好ましい実施形態では、本発明のＣａｓタンパク質またはポリペプチドは、ゲオバチルス種（Geobacillus sp.）に由来する。より好ましくは、本発明のＣａｓタンパク質はゲオバチルス・サーモデニトリフィカンス（Geobacillus thermodenitrificans）に由来する。さらにより好ましくは、本発明のＣａｓタンパク質はゲオバチルス・サーモデニトリフィカンス（Geobacillus thermodenitrificans）Ｔ１２に由来する。本発明のＣａｓタンパク質またはポリペプチドはウイルスに由来してもよい。

ＲＮＡガイドおよび標的配列
本発明のＣａｓタンパク質は、高温での標的核酸の配列特異的切断、タグ付け、標識付けまたは改変を可能にする。標的核酸は、ＤＮＡ（一本鎖または二本鎖）でもＲＮＡでも合成核酸でもよい。本発明の特に有用な応用は、ゲノムＤＮＡの標的配列に相補的に結合する１つまたは複数のガイドＲＮＡ（ｇＲＮＡ）と複合した本発明の１つまたは複数のＣａｓタンパク質によるゲノムＤＮＡの配列特異的ターゲティングおよび改変である。したがって、標的核酸は好ましくは二本鎖ＤＮＡである。そのようなターゲティングはｉｎｖｉｔｒｏでもｉｎｖｉｖｏでも実施することができる。好ましくは、そのようなターゲティングはｉｎｖｉｖｏで実施される。この方法で、本発明のＣａｓタンパク質を使用して細胞のゲノムＤＮＡに位置する特定のＤＮＡ配列を標的にして改変することができる。Ｃａｓ系を使用して、異なる生物の種々の細胞型でおよび／または異なる生物でゲノムを改変することができることが想定されている。

したがって、本発明は、上文に記載される本発明のＣａｓタンパク質またはポリペプチドを含み、標的ポリヌクレオチド中の特定のヌクレオチド配列を認識するという点でターゲティング機能を有する少なくとも１つのＲＮＡ分子をさらに含むリボ核タンパク質複合体を提供する。好ましくは、ＲＮＡ分子は、一本鎖ＲＮＡ分子、例えば、ＣＲＩＳＰＲＲＮＡ（ｃｒＲＮＡ）であり、例えば、ハイブリダイゼーションによりｔｒａｃｒＲＮＡと会合する。ターゲティングＲＮＡはｃｒＲＮＡとｔｒａｃｒＲＮＡのキメラでもよい。前述のＲＮＡ分子は、標的ヌクレオチド配列に対して少なくとも９０％の同一性、または相補性のリボヌクレオチド配列を有することができる。任意選択で、ＲＮＡ分子は、標的ヌクレオチド配列に対して少なくとも９０％、少なくとも９１％、少なくとも９２％、少なくとも９３％、少なくとも９４％、少なくとも９５％、少なくとも９６％、少なくとも９７％、少なくとも９８％、少なくとも９９％もしくは１００％の同一性または相補性のリボヌクレオチド配列を有する。好ましい標的ヌクレオチド配列はＤＮＡである。

好ましい態様では、本発明は、少なくとも１つのターゲティングＲＮＡ分子が標的ＤＮＡ配列にその長さに沿って実質的に相補的である、上文に記載されるリボ核タンパク質複合体を提供する。

したがって、本発明のＣａｓタンパク質と会合するＲＮＡガイドの配列を変化させると、Ｃａｓタンパク質をガイドＲＮＡに相補的である部位で二本鎖ＤＮＡを標識または切断するようプログラムすることが可能になる。

好ましくは、本発明のリボ核タンパク質複合体中の少なくとも１つのターゲティングＲＮＡ分子の長さは、３５から１３５残基の範囲、任意選択で、３５から１３４残基、３５から１３３残基、３５から１３２残基、３５から１３１残基、３５から１３０残基、３５から１２９残基、３５から１２８残基、３５から１２７残基、３５から１２６残基、３５から１２５残基、３５から１２４残基、３５から１２３残基、３５から１２２残基、３５から１２１残基、３５から１２０残基、３５から１１９残基、３５から１１８残基、３５から１１７残基、３５から１１６残基、３５から１１５残基、３５から１１４残基、３５から１１３残基、３５から１１２残基、３５から１１１残基、３５から１００残基、３５から１０９残基、３５から１０８残基、３５から１０７残基、３５から１０６残基、３５から１０５残基、３５から１０４残基、３５から１０３残基、３５から１０２残基、３５から１０１残基、３５から１００残基、３５から９９残基、３５から９８残基、３５から９７残基、３５から９６残基、３５から９５残基、３５から９４残基、３５から９３残基、３５から９２残基、３５から９１残基、３５から９０残基、３５から８９残基、３５から８８残基、３５から８７残基、３５から８６残基、３５から８５残基、３５から８４残基、３５から８３残基、３５から８２残基、３５から８１残基、３５から８０残基、３５から７９残基、３５から７８残基、３５から７７残基、３５から７６残基、３５から７５残基、３５から７４残基、３５から７３残基、３５から７２残基、３５から７１残基、３５から７０残基、３５から６９残基、３５から６８残基、３５から６７残基、３５から６６残基、３５から６５残基、３５から６４残基、３５から６３残基、３５から６２残基、３５から６１残基、３５から６０残基、３５から５９残基、３５から５８残基、３５から５７残基、３５から５６残基、３５から５５残基、３５から５４残基、３５から５３残基、３５から５２残基、３５から５１残基、３５から５０残基、３５から４９残基、３５から４８残基、３５から４７残基、３５から４６残基、３５から４５残基、３５から４４残基、３５から４３残基、３５から４２残基、３５から４１残基、３５から４０残基、３５から３９残基、３５から３８残基、３５から３７残基、３５から３６残基、または３５残基の範囲である。好ましくは、少なくとも１つのＲＮＡ分子の長さは、３６から１７４残基、３７から１７３残基、３８から１７２残基、３９から１７１残基、４０から１７０残基、４１から１６９残基、４２から１６８残基、４３から１６７残基、４４から１６６残基、４５から１６５残基、４６から１６４残基、４７から１６３残基、４８から１６２残基、４９から１６１残基、５０から１６０残基、５１から１５９残基、５２から１５８残基、５３から１５７残基、５４から１５６残基、３６から７４残基、３７から７３残基、３８から７２残基、３９から７１残基、４０から７０残基、４１から６９残基、４２から６８残基、４３から６７残基、４４から６６残基、４５から６５残基、４６から６４残基、４７から６３残基、４８から６２残基、４９から６１残基、５０から６０残基、５１から５９残基、５２から５８残基、５３から５７残基、５４から５６残基の範囲である。

好ましい態様では、本発明は、少なくとも１つのＲＮＡ分子の相補的部分が少なくとも３０残基長である、リボ核タンパク質複合体を提供する。代わりに、少なくとも１つのＲＮＡ分子の相補的部分は、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、５１、５２、５３、５４、５５、５６、５７、５８、５９、６０、６１、６２、６３、６４、６５、６６、６７、６８、６９、７０、７１、７２、７３、７４または７５残基長でもよい。

ターゲティングＲＮＡ分子は、好ましくは、標的核酸配列に対する高い特異性および親和性を必要とすることになる。未変性ゲル電気泳動、または代わりに等温滴定熱量測定、表面プラズモン共鳴、もしくは蛍光ベースの滴定法により決定することができる場合、１μＭから１ｐＭ、好ましくは１ｎＭから１ｐＭ、より好ましくは１〜１００ｐＭの範囲の解離定数（Ｋ_ｄ）が望ましい。親和性は、ゲル遅延度アッセイとも呼ばれる電気泳動移動度シフトアッセイ（ＥＭＳＡ）を使用して決定してもよい（Semenova E et al. (2011) PNAS 108: 10098-10103参照）。

ターゲティングＲＮＡ分子は、好ましくは、ＣＲＩＳＰＲＲＮＡ（ｃｒＲＮＡ）分子として原核生物の性質から分かっていることに合わせて作られる。ｃｒＲＮＡ分子の構造はすでに確立されており、Jore et al., 2011, Nature Structural & Molecular Biology 18: 529-537でさらに詳細に説明されている。手短に言えば、Ｉ−Ｅ型の成熟ｃｒＲＮＡは、多くの場合、６１ヌクレオチド長であり、８ヌクレオチドの５’「ハンドル」領域、３２ヌクレオチドの「スペーサー」配列、およびテトラヌクレオチドループを有するヘアピンを形成する２１ヌクレオチドの３’配列からなる（図５）。Ｉ型系はＩＩ型（Ｃａｓ９）とは異なり、異なる系の詳細はVan der Oost 2014 Nat Rev Micr 12: 479-492に記載されている。ＩＩ型（Ｃａｓ９）系には異なるプロセシング機構が存在しており、第２のＲＮＡ（ｔｒａｃｒＲＮＡ）および２つのリボヌクレアーゼを利用している。ヘアピンよりはむしろ、ＩＩ型中の成熟ｃｒＲＮＡはｔｒａｃｒＲＮＡの断片に結合したままである（図５）。しかし、本発明で使用されるＲＮＡは、長さであれ、領域であれまたは特定のＲＮＡ配列であれ、天然に存在するｃｒＲＮＡの設計に厳密に合わせて設計する必要はない。しかし、明白なのは、本発明で使用するためのＲＮＡ分子は、公開データベース中のまたは新たに発見された遺伝子配列情報に基づいて設計され、次に、例えば、化学合成により全体をまたは部分を人工的に作ってもよいことである。本発明のＲＮＡ分子は、遺伝的に改変された細胞または無細胞発現系での発現のために設計および作製されてもよく、この選択肢にはＲＮＡ配列の一部または全部の合成が含まれてもよい。

ＩＩ型（Ｃａｓ９）中のｃｒＲＮＡの構造および必要条件もJinek et al., 2012 ibidに記載されている。Ｉ型には、スペーサー配列の５’末端を形成し、そこの５’で８ヌクレオチドの５’ハンドルと隣接しているいわゆる「シード（SEED）」部分が存在する。Semenova et al. (2011, PNAS 108: 10098-10103)は、シード配列のすべての残基が標的配列に相補的であるはずであるが、６位の残基ではミスマッチが許容されうることを見出した（図５）。ＩＩ型には、スペーサーの３’末端に位置している１０〜１２ヌクレオチドのシードが存在する（図５）（Van der Oost 2014 ibid.により概説されている）。同様に、標的遺伝子座（すなわち、配列）に向けられている本発明のリボ核タンパク質複合体のＲＮＡ成分を設計し作る場合、ＩＩ型シード配列についての必要なマッチおよびミスマッチルールを適用することが可能である。

したがって、本発明は、標的核酸分子において単一塩基変化を検出するおよび／または位置付ける方法であって、核酸試料を上文に記載される本発明のリボ核タンパク質複合体と、または上文に記載される本発明のＣａｓタンパク質もしくはポリペプチドおよび別のターゲティングＲＮＡ成分と接触させることを含み、ターゲティングＲＮＡの配列（リボ核タンパク質複合体中にある場合を含めて）は、例えば、８ヌクレオチド残基の連続する配列の６位での単一塩基変化に基づいて正常対立遺伝子と突然変異対立遺伝子を区別するようになっている、方法を含む。

特定の理論に縛られたくはないが、本発明のリボ核タンパク質複合体のターゲティングＲＮＡ成分を調製するのに使用してもよいデザインルールは、標的ポリヌクレオチド鎖にいわゆる「ＰＡＭ」（プロトスペーサー隣接モチーフ）配列を含む。ＰＡＭ配列は、大腸菌（E.coli）のＩ−Ｅ型系中のヌクレオチド残基の保存されたトリプレット、５’−ＣＴＴ−３’、５’−ＣＡＴ−３’、５’−ＣＣＴ−３’、５’−ＣＡＣ−３’、５’−ＴＴＴ−３’、５’−ＡＴＴ−３’、および５’−ＡＷＧ−３’でもよく、ＷはＡ、ＴまたはＵである。Ｉ型では、標的鎖に位置しているＰＡＭ配列は通常、シードの５’に対応する位置にある。しかし、ＩＩ型では、ＰＡＭは、シードの３’に対応する位置で、ｃｒＲＮＡスペーサーの３’末端に近い置換鎖上のもう一方の末端に位置している（図５）（Jinek et al., 2012, op. cit.）。化膿性連鎖球菌（Streptococcus pyogenes）Ｃａｓ９では、ＰＡＭ配列は保存された対のヌクレオチド残基、５’−ＮＧＧ−３’を有する。最近、異なるＣａｓ９変異体（ＩＩＡ型およびＩＩＣ型）（Ran et al., 2015 Nature 520:186-191）−図１Ａ）が特徴付けられ、ＰＡＭが明らかにされた（Ran et al., 2015, ibid.参照−図１Ｃ）。現在確立されているＣａｓ９ＰＡＭは、ＩＩＡ型５’−ＮＧＧＮＮＮＮ−３’（化膿性連鎖球菌（Streptococcus pyogenes））、５’−ＮＮＧＴＮＮＮ−３’（ストレプトコッカス・パスツリアヌス（Streptococcus pasteurianus））、５’−ＮＮＧＧＡＡＮ−３’（ストレプトコッカス・サーモフィルス（Streptococcus thermophilus））、５’−ＮＮＧＧＧＮＮ−３’（黄色ブドウ球菌（Staphylococcus aureus））、およびＩＩＣ型５’−ＮＧＧＮＮＮＮ−３’（ジフテリア菌（Corynebacterium difteriae））、５’−ＮＮＧＧＧＴＮ−３’（カンピロバクター・ラリ（Campylobacter lari））、５’−ＮＮＮＣＡＴＮ−３’（パルビバクラム・ラバメンティボランス（Parvobaculum lavamentivorans））、５’−ＮＮＮＮＧＴＡ−３’（ナイセリア・シネレア（Neiseria cinerea））を含む。ゲオバチルス・サーモデニトリフィカンス（Geobacillus thermodenitrificans）Ｔ１２のＣａｓ９（本発明）はＩＩＣ型に属する（Ran et al., 2015, ibid.）。したがって、特定の理論に縛られたくはないが、本発明者らは、ＰＡＭ配列のほうがＩＩＣ型Ｃａｓ９リボ核タンパク質複合体について確立された配列にもっと密接に近似すると予想している。

本発明の実施形態では、ターゲティングＲＮＡ分子は３５〜７５残基の範囲の長さを有していてもよい。好ましい実施形態では、ＲＮＡのうち所望の核酸配列に相補的であり、これを標的にするために使用される部分は３１または３２残基長である。天然に存在するｃｒＲＮＡの文脈では、これは、例えば、Semenova et al. (2011 ibid.)の図１に示されているスペーサー部分と一致する。

本発明のリボ核タンパク質複合体は、ＤＮＡ標的配列に実質的な相補性を有するＲＮＡ配列の５’にＣＲＩＳＰＲ繰り返しに由来する８残基を含むターゲティング成分を有していてもよい。ＤＮＡ標的配列に相補性を有するＲＮＡ配列は、スペーサー配列であるｃｒＲＮＡの文脈で一致すると理解される。ＲＮＡの５’隣接配列は、例えば、Semenova et al. (2011 ibid.)の図１に示されているように、ｃｒＲＮＡの５’ハンドルに一致すると見なされるであろう。

本発明のリボ核タンパク質複合体は、ＤＮＡ標的配列に相補性を有するターゲティングＲＮＡ配列の３’に、すなわち、例えば、Semenova et al. (2011 ibid.)の図１に示されているように、ｃｒＲＮＡ中のスペーサー配列に隣接する３’ハンドルに一致するものの３’にヘアピンおよびテトラヌクレオチドループ形成配列を有していてもよい。

特定の理論に縛られたくはないが、好ましいリボ核タンパク質複合体では、リボ核タンパク質複合体のターゲティングＲＮＡと対合しない標的配列ＤＮＡ鎖は、５’−ＮＧＧＮＮＮＮ−３’、５’−ＮＮＧＴＮＮＮ−３’、５’−ＮＮＧＧＡＡＮ−３’、５’−ＮＮＧＧＧＮＮ−３’、５’−ＮＧＧＮＮＮＮ−３’、５’−ＮＮＧＧＧＴＮ−３’、５’−ＮＮＮＣＡＴＮ−３’、５’−ＮＮＮＮＧＴＡ−３’から選択される直接３’隣接トリプレットを含んでもよく、前記トリプレット残基はそれぞれがそれぞれの相補的ＤＮＡ鎖残基と対合しない。しかし、他のトリプレットまたはヌクレオチドの組合せを所望の応用に応じて使用してもよいことは認識されている。これらのトリプレットは、天然に存在するｃｒＲＮＡの文脈で「プロトスペーサー隣接モチーフ」または「ＰＡＭ」と呼ばれているものと一致している。ＩＩＣ型ＣＲＩＳＰＲ／Ｃａｓ系では、これらのＰＡＭトリプレットは、天然系標的でも、したがって好ましくは本発明に従ったＲＮＡでも、標的配列に対するｃｒＲＮＡの高度な特異性を保証するために、そのｄｓＤＮＡ標的とのＣａｓｃａｄｅ／ｃｒＲＮＡ複合体の安定な相互作用に必要とされる。

機能的部分
有利なことに、任意のポリヌクレオチド配列を配列特異的に標的にする本発明のＣａｓタンパク質、ポリペプチドおよびリボ核タンパク質複合体の能力は、何らかの方法で、例えば、標的核酸を切断および／または標識および／または修飾することにより、標的核酸を改変するために利用することができる。したがって、これを達成するためにはＣａｓタンパク質またはポリペプチドと共に追加のタンパク質を提供してもよいことが認識されよう。したがって、本発明のＣａｓタンパク質、ポリペプチドまたはリボ核タンパク質複合体は、少なくとも１つのさらなるタンパク質を含むタンパク質複合体の一部として提供されてもよい。好ましい態様では、本発明は、Ｃａｓタンパク質または少なくとも１つのさらなるタンパク質が少なくとも１つの機能的部分をさらに含む、Ｃａｓタンパク質、ポリペプチドまたはリボ核タンパク質複合体を提供する。少なくとも１つの機能的部分は、Ｃａｓタンパク質に融合または連結していてもよい。好ましくは、少なくとも１つの機能的部分は、天然のまたは人工的タンパク質発現系での発現を通じてＣａｓタンパク質に翻訳によって融合してもよい。代わりに、少なくとも１つの機能的部分は、化学合成ステップによりＣａｓタンパク質に共有結合によって連結してもよい。好ましくは、少なくとも１つの機能的部分は、Ｃａｓタンパク質のＮ終端および／またはＣ終端、好ましくはＮ終端に融合または連結している。

少なくとも１つの機能的部分はタンパク質であることが望ましい。タンパク質は、異種タンパク質であってもよく、または代わりにＣａｓタンパク質が由来した細菌種に固有であってもよい。少なくとも１つの機能的部分はタンパク質であってもよく、任意選択で、ヘリカーゼ、ヌクレアーゼ、ヘリカーゼ−ヌクレアーゼ、ＤＮＡメチラーゼ、ヒストンメチラーゼ、アセチラーゼ、ホスファターゼ、キナーゼ、転写（共）活性化因子、転写リプレッサー、ＤＮＡ結合タンパク質、ＤＮＡ構築タンパク質、マーカータンパク質、レポータータンパク質、蛍光タンパク質、リガンド結合タンパク質、シグナルペプチド、細胞内局在配列、抗体エピトープまたは親和性精製タグから選択されうる。

特に好ましい態様では、本発明は、少なくとも１つの機能的部分がマーカータンパク質、例えば、ＧＦＰである、Ｃａｓタンパク質、ポリペプチドまたはリボ核タンパク質複合体を提供する。

ヌクレアーゼ活性
本発明の任意の態様のＣａｓリボ核タンパク質は、５０℃と１００℃の間で核酸切断活性を有する。本発明のリボ核タンパク質は、ＤＮＡ、ＲＮＡまたは合成核酸を切断することができる。好ましい態様では、本発明のＣａｓリボ核タンパク質は、ＤＮＡを、特に二本鎖ＤＮＡを配列特異的に切断することができる。

本発明のいかなる態様でも、本発明のＣａｓタンパク質、ポリペプチドまたはリボ核タンパク質は、１つよりも多いヌクレアーゼドメインを有してもよい。部位特異的ヌクレアーゼは、ＤＮＡの鎖に沿って選択された位置で二本鎖切断（ＤＳＢ）を生じさせることができる。標的宿主細胞では、これによりゲノム内の特定の前選択した位置でＤＳＢを作ることができる。部位特異的ヌクレアーゼによるそのような切断の作製に促されて、目的のゲノム内の所望の位置でＤＮＡを挿入、欠失または改変するために内在性細胞修復機構が別の目的で利用される。

タンパク質またはポリペプチド分子の１つまたは複数のヌクレアーゼ活性部位は、例えば、タンパク質またはポリペプチドに連結または融合している別の機能的な部分、例えば、Ｆｏｋ１ヌクレアーゼの活性を可能にするように不活化させてもよい。

したがって、本発明のＣａｓタンパク質、ポリペプチドおよびリボ核タンパク質がある特定の応用のために内在性ヌクレアーゼ活性を有するにもかかわらず、Ｃａｓタンパク質の天然のヌクレアーゼ活性を不活化し、天然のＣａｓ９ヌクレアーゼ活性が不活化されＣａｓタンパク質が少なくとも１つの機能的部分に連結しているＣａｓタンパク質またはリボ核タンパク質複合体を提供するのが望ましい場合がある。天然のＣａｓ９ヌクレアーゼ活性の相補性によるミスターゲティング事象の発生率を減らすことは１つのそのような応用である。これは、望ましくは、Ｃａｓタンパク質またはリボ核タンパク質複合体の天然のＣａｓ９ヌクレアーゼ活性を不活化させ、好ましくはＣａｓタンパク質に融合している、異種ヌクレアーゼを提供することにより達成することもできる。したがって、本発明は、少なくとも１つの機能的部分がヌクレアーゼドメイン、好ましくはＦｏｋＩヌクレアーゼドメインである、Ｃａｓタンパク質またはリボ核タンパク質複合体を提供する。特に好ましい態様では、ＦｏｋＩヌクレアーゼドメインに融合している本発明のＣａｓタンパク質またはリボ核タンパク質複合体は、好ましくは、ＦｏｋＩヌクレアーゼドメインに融合している本発明の別のＣａｓタンパク質またはリボ核タンパク質複合体を含み、２つの複合体が標的ゲノムＤＮＡの反対の鎖を標的にする、タンパク質複合体の一部として提供される。

いくつかの応用では、例えば、Ｃａｓタンパク質またはリボ核タンパク質複合体が核酸中の特定の標的配列を認識し改変する、例えば、その標的配列を診断検査の一部として標識するのに利用する応用では、Ｃａｓタンパク質、ポリペプチドまたはリボ核タンパク質のヌクレアーゼ活性を完全に減弱させるのが望ましい場合がある。そのような応用では、Ｃａｓタンパク質のヌクレアーゼ活性は不活化されてもよく、Ｃａｓタンパク質に融合している機能的部分はタンパク質でもよく、任意選択で、ヘリカーゼ、ヌクレアーゼ、ヘリカーゼ−ヌクレアーゼ、ＤＮＡメチラーゼ、ヒストンメチラーゼ、アセチラーゼ、ホスファターゼ、キナーゼ、転写（共）活性化因子、転写リプレッサー、ＤＮＡ結合タンパク質、ＤＮＡ構築タンパク質、マーカータンパク質、レポータータンパク質、蛍光タンパク質、リガンド結合タンパク質、シグナルペプチド、細胞内局在配列、抗体エピトープまたは親和性精製タグから選択されうる。

特に好ましい態様では、本発明は、Ｃａｓタンパク質のヌクレアーゼ活性が不活化され少なくとも１つの機能的部分がマーカータンパク質、例えば、ＧＦＰである、Ｃａｓタンパク質またはリボ核タンパク質複合体を提供する。この方法で、目的の核酸配列を特異的に標的にし、光シグナルを発生させるマーカーを使用してその核酸配列を可視化することが可能になりうる。適切なマーカーは、例えば、蛍光レポータータンパク質、例えば、緑色蛍光タンパク質（ＧＦＰ）、黄色蛍光タンパク質（ＹＦＰ）、赤色蛍光タンパク質（ＲＦＰ）、シアン蛍光タンパク質（ＣＦＰ）またはｍＣｈｅｒｒｙを含んでいてもよい。そのタンパク質の発現は蛍光測定により簡単に直接的にアッセイすることが可能なので、そのような蛍光レポーター遺伝子はタンパク質発現の可視化に適したマーカーを提供する。代わりに、レポーター核酸は、ルシフェラーゼ（例えば、ホタルルシフェラーゼ）など発光タンパク質をコードしてもよい。代わりに、レポーター遺伝子は、光シグナルを発生させるのに使用することが可能な発色酵素、例えば、発色酵素（ベータ−ガラクトシダーゼ（ＬａｃＺ）またはベータ−グルクロニダーゼ（Ｇｕｓ）など）でもよい。発現の測定に使用されるレポーターは、抗原ペプチドタグでもよい。他のレポーターまたはマーカーは当技術分野では公知であり、必要に応じて使用してもよい。

マーカーは可視化することができるので、標的核酸がＲＮＡ、具体的にはｍＲＮＡであるある特定の実施形態では、特に、マーカーにより発生する光シグナルが発現産物の量に正比例している場合、マーカーにより発生する光シグナルの検出および定量化により遺伝子の転写活性を定量化することが可能でありうる。したがって、本発明の好ましい実施形態では、本発明のＣａｓタンパク質またはリボ核タンパク質を使用して、目的の遺伝子の発現産物をアッセイすることができる。

初めから終わりまで、本発明のＣａｓタンパク質の基準配列は、アミノ酸配列をコードするヌクレオチド配列として定義することができる。例えば、配列番号２から６に定義されるモチーフのアミノ酸配列は、そのアミノ酸配列をコードするすべての核酸配列も含む。

したがって、本発明は、
ａ．アミノ酸モチーフＥＫＤＧＫＹＹＣ［配列番号２］；および／または
ｂ．アミノ酸モチーフＸ_１Ｘ_２ＣＴＸ_３Ｘ_４［配列番号３］（式中、Ｘ_１はイソロイシン、メチオニンまたはプロリンから独立して選択され、Ｘ_２はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、Ｘ_３はグルタミン酸またはリシンから独立して選択され、Ｘ_４はアラニン、グルタミン酸またはアルギニンのうちの１つである）；および／または
ｃ．アミノ酸モチーフＸ_５ＬＫＸ_６ＩＥ［配列番号４］（式中、Ｘ_５はメチオニンまたはフェニルアラニンから独立して選択され、Ｘ_６はヒスチジンまたはアスパラギンから独立して選択される）；および／または
ｄ．アミノ酸モチーフＸ_７ＶＹＳＸ_８Ｋ［配列番号５］（式中、Ｘ_７はグルタミン酸またはイソロイシンであり、Ｘ_８はトリプトファン、セリンまたはリシンのうちの１つである）；および／または
ｅ．アミノ酸モチーフＸ_９ＦＹＸ_１０Ｘ_１１ＲＥＱＸ_１２ＫＥＸ_１３［配列番号６］（式中、Ｘ_９はアラニンまたはグルタミン酸であり、Ｘ_１０はグルタミンまたはリシンであり、Ｘ_１１はアルギニンまたはアラニンであり、Ｘ_１２はアスパラギンまたはアラニンであり、Ｘ_１３はリシンまたはセリンである）
を含むＣａｓタンパク質であって、
少なくとも１つのターゲティングＲＮＡ分子、およびターゲティングＲＮＡ分子により認識される標的核酸配列を含むポリヌクレオチドと会合すると５０℃と１００℃の間でＤＮＡを切断することができるＣａｓタンパク質をコードする単離された核酸分子も提供する。

別の態様では、本発明は、配列番号１のアミノ酸配列またはそれと少なくとも７７％の同一性の配列を有するＣａｓ（ＣＲＩＳＰＲ（ｃｌｕｓｔｅｒｅｄｒｅｇｕｌａｒｌｙｉｎｔｅｒｓｐａｃｅｄｓｈｏｒｔｐａｌｉｎｄｒｏｍｉｃｒｅｐｅａｔ）ａｓｓｏｃｉａｔｅｄ）タンパク質をコードする単離された核酸分子も提供する。

別の態様では、本発明は、翻訳されるとＣａｓタンパク質に融合するペプチドをコードする少なくとも１つの核酸配列をさらに含む、単離された核酸分子も提供する。

別の態様では、本発明は、Ｃａｓタンパク質をコードする核酸分子に融合する少なくとも１つの核酸配列が、ヘリカーゼ、ヌクレアーゼ、ヘリカーゼ−ヌクレアーゼ、ＤＮＡメチラーゼ、ヒストンメチラーゼ、アセチラーゼ、ホスファターゼ、キナーゼ、転写（共）活性化因子、転写リプレッサー、ＤＮＡ結合タンパク質、ＤＮＡ構築タンパク質、マーカータンパク質、レポータータンパク質、蛍光タンパク質、リガンド結合タンパク質、シグナルペプチド、細胞内局在配列、抗体エピトープまたは親和性精製タグから選択されるタンパク質をコードする、単離された核酸分子も提供する。

発現ベクター
本発明の核酸は単離されていてもよい。しかし、核酸感知構築物の発現が選ばれた細胞で実行されうるように、Ｃａｓタンパク質またはリボ核タンパク質をコードするポリヌクレオチド配列は、好ましくは、発現構築物中に提供されている。いくつかの実施形態では、Ｃａｓタンパク質またはリボ核タンパク質をコードするポリヌクレオチドは、適切な発現ベクターの一部として提供されることになる。ある特定の実施形態では、本発明の発現ベクター（発現するとＣａｓタンパク質に融合するアミノ酸残基をコードするヌクレオチド配列ありまたはなしで）は、上文に定義されているターゲティングＲＮＡ分子をコードするヌクレオチド配列をさらに含んでいてもよい。したがって、そのような発現ベクターを適切な宿主で使用して、所望のヌクレオチド配列を標的にすることが可能な本発明のリボ核タンパク質複合体を産生することができる。代わりに、上文に定義されるターゲティングＲＮＡ分子をコードするヌクレオチド配列は別の発現ベクターで提供してもよく、または代わりに他の手段によって標的細胞に送達してもよい。

適切な発現ベクターは受容細胞に応じて変化することになり、適宜、標的細胞での発現を可能にし、好ましくは高レベルの発現を促進する調節エレメントを組み込んでもよい。そのような調節配列は、例えば、開始、正確さ、速度、安定性、下流プロセシングおよび可動性の点で遺伝子または遺伝子産物の転写または翻訳に影響を与えることができてもよい。

そのようなエレメントは、例えば、強力なおよび／または構成プロモーター、５’および３’ＵＴＲ、転写および／または翻訳エンハンサー、転写因子またはタンパク質結合配列、開始部位および終結配列、リボソーム結合部位、組換え部位、ポリアデニル化配列、センスまたはアンチセンス配列、転写の正確な開始を確実にする配列ならびに任意選択で、宿主細胞における転写の終結および転写物安定化を確実にするポリＡシグナルを含んでいてもよい。調節配列は、植物、動物、細菌、真菌またはウイルス由来でもよく、好ましくは、宿主細胞と同じ生物に由来してもよい。適切な調節エレメントが目的の宿主細胞に応じて変化することになるのは明らかである。例えば、大腸菌（E.coli）などの原核宿主細胞で高レベルの発現を促進する調節エレメントはｐＬａｃ、Ｔ７、Ｐ（Ｂｌａ）、Ｐ（Ｃａｔ）、Ｐ（Ｋａｔ）、ｔｒｐまたはｔａｃプロモーターを含んでいてもよい。真核宿主細胞で高レベルの発現を促進する調節エレメントは、酵母ではＡＯＸ１またはＧＡＬ１プロモーターあるいは動物細胞ではＣＭＶもしくはＳＶ４０プロモーター、ＣＭＶエンハンサー、ＳＶ４０エンハンサー、単純ヘルペスウイルス（Herpes simplex virus）ＶＩＰ１６転写活性化因子またはグロビンイントロンの包含を含んでいてもよい。植物では、構成的高レベルの発現は、例えば、トウモロコシ（Zea mays）ユビキチン１プロモーターまたはカリフラワーモザイクウイルスの３５Ｓおよび１９Ｓプロモーターを使用して得ることができる。

適切な調節エレメントは構成的であってよく、この調節エレメントは大半の環境条件または発生段階、特異的もしくは誘導性の発生段階下で発現を指示する。好ましくは、プロモーターは誘導性であり、温度、光、化学物質、乾燥、および他の刺激などの環境的、化学的または発生的合図に応答して発現を指示する。適宜、特定の発生段階であるいは細胞外もしくは細胞内状態、シグナル、または外部から与えられる刺激に応答して目的のタンパク質の発現を可能にするプロモーターを選んでもよい。例えば、大腸菌（E.coli）で使用するための、特定の成長段階で（例えば、ｏｓｍＹ静止期プロモーター）または特定の刺激に応答して（例えば、ＨｔｐＧ熱ショックプロモーター）高レベルの発現を与える様々なプロモーターが存在する。

適切な発現ベクターは、適切な宿主細胞においておよび／または特定の条件下で前記ベクターの選択を可能にする選択可能マーカーをコードする追加の配列を含んでいてもよい。

本発明は、細胞中で標的核酸を改変する方法であって、細胞を上文に記載される発現ベクターのうちのいずれかでトランスフェクト、形質転換または形質導入することを含む方法も含む。トランスフェクション、形質転換または形質導入の方法は当業者には周知のタイプのものである。本発明のリボ核タンパク質複合体の発現を生み出すのに使用される１つの発現ベクターが存在する場合、およびターゲティングＲＮＡが細胞に直接添加される場合、トランスフェクション、形質転換または形質導入の同じまたは異なる方法を使用してもよい。同様に、次に、本発明のリボ核タンパク質複合体の発現を生み出すのに使用される１つの発現ベクターが存在し、別の発現ベクターが発現を介してターゲティングＲＮＡをｉｎｓｉｔｕで生み出すのに使用されている場合、トランスフェクション、形質転換または形質導入の同じまたは異なる方法を使用してもよい。

他の実施形態では、Ｃａｓタンパク質またはポリペプチドをコードするｍＲＮＡは、細胞中でＣａｓｃａｄｅ複合体が発現されるように細胞内に導入される。Ｃａｓタンパク質複合体を所望の標的配列まで導くターゲティングＲＮＡも、ｍＲＮＡと同時でも、別々にでもまたは逐次でも、必要なリボ核タンパク質複合体が細胞中で形成されるように、細胞内に導入される。

したがって、本発明は、標的核酸を改変する、すなわち、切断、タグ付け、標識または結合する方法であって、核酸を上文で定義されるリボ核タンパク質複合体と接触させることを含む方法も提供する。

さらに、本発明は標的核酸を改変する方法であって、核酸を、上文で定義されるターゲティングＲＮＡ分子に加えて、上文で定義されるＣａｓタンパク質またはポリペプチドと接触させることを含む方法も含む。

上記方法に従って、標的核酸の改変は、したがって、ｉｎｖｉｔｒｏでおよび無細胞環境で実行することができる。無細胞環境では、標的核酸、Ｃａｓタンパク質およびターゲティングＲＮＡ分子のそれぞれの添加は、同時でも、逐次でも（希望通りのいかなる順番でも）、または別々でもよい。したがって、標的核酸とターゲティングＲＮＡが反応混合物に同時に添加され、次に、本発明のＣａｓタンパク質またはポリペプチドが後の段階で別々に添加されることが可能である。

同様に、標的核酸の改変は、単離された細胞であれ多細胞組織、器官または生物の一部としてであれ、ｉｎｖｉｖｏ、すなわち、細胞中ｉｎｓｉｔｕで行うことができる。全組織および器官の文脈では、ならびに生物の文脈では、方法はｉｎｖｉｖｏで実行されるのが望ましい場合があり、または代わりに、全組織、器官もしくは生物から細胞を単離し、方法に従って細胞をリボ核タンパク質複合体で処理し、それに続いてリボ核タンパク質複合体で処理された細胞を、同じ生物内であれ異なる生物内であれ、その前の位置に、もしくは異なる位置に戻すことにより実行してもよい。

これらの実施形態では、リボ核タンパク質複合体またはＣａｓタンパク質もしくはポリペプチドは、細胞内への適切な形態の送達を必要とする。そのような適切な送達系および方法は当業者には周知であり、細胞質または核マイクロインジェクションを含むがこれらに限定されない。好ましい送達様式では、アデノ随伴ウイルス（ＡＡＶ）が使用され、この送達系はヒトでは病因性ではなく、欧州では臨床使用に承認されている。

したがって、本発明は標的核酸を改変する方法であって、核酸を、
ａ．上文で定義されるリボ核タンパク質複合体、または
ｂ．上文で定義されるタンパク質もしくはタンパク質複合体および上文で定義されるＲＮＡ分子
と接触させることを含む方法を提供する。

さらなる態様では、本発明は細胞中で標的核酸を改変する方法であって、細胞を上文で定義されるリボ核タンパク質複合体をコードするヌクレオチド配列を含む発現ベクターで形質転換、トランスフェクトもしくは形質導入すること、または代わりに細胞を上文で定義されるタンパク質もしくはタンパク質複合体をコードするヌクレオチド配列を含む発現ベクターおよび上文で定義されるターゲティングＲＮＡ分子をコードするヌクレオチド配列を含むさらなる発現ベクターで形質転換、トランスフェクトもしくは形質導入することを含む方法を提供する。

さらなる態様では、本発明は細胞中で標的核酸を改変する方法であって、細胞を上文で定義されるタンパク質もしくはタンパク質複合体をコードするヌクレオチド配列を含む発現ベクターで形質転換、トランスフェクトまたは形質導入し、次いで上文で定義されるターゲティングＲＮＡ分子を細胞内に送達することを含む方法を提供する。

ガイド（すなわち、ターゲティング）ＲＮＡ（ｇＲＮＡ）分子およびＣａｓタンパク質またはポリペプチドが、リボ核タンパク質複合体の一部としてというよりむしろ別々に提供される実施形態では、ｇＲＮＡ分子は、Ｃａｓタンパク質またはタンパク質複合体と同時であれ、別々にであれ、逐次であれ、細胞内への適切な形態の送達を必要とする。ＲＮＡを細胞内に導入するそのような形態は当業者には周知であり、従来のトランスフェクション法を介したｉｎｖｉｔｒｏまたはｅｘｖｉｖｏ送達を含んでもよい。マイクロインジェクションおよび電気穿孔法、ならびにカルシウム共沈、ならびに市販のカチオンポリマーおよび脂質、ならびに細胞透過性ペプチド、細胞透過性（微粒子銃）粒子などの物理的方法をそれぞれ使用してもよい。例えば、ウイルス、特に好ましくはＡＡＶを、例えば、本発明のＣａｓタンパク質複合体または本発明のリボ核タンパク質複合体のウイルス粒子への（可逆的）融合を介して、細胞質にであれおよび／または核にであれ送達媒体として使用してもよい。

別の態様では、本発明は標的核酸を改変する方法であって、少なくとも１つの機能的部分がマーカータンパク質またはレポータータンパク質であり、マーカータンパク質またはレポータータンパク質が標的核酸と会合し、好ましくは、マーカーが蛍光タンパク質、例えば、緑色蛍光タンパク質（ＧＦＰ）である、方法を提供する。

標的核酸を改変する上述の方法では、機能的部分はマーカーでもよく、マーカーは標的核酸と会合し、好ましくは、マーカーはタンパク質であり、任意選択で、蛍光タンパク質、例えば、緑色蛍光タンパク質（ＧＦＰ）、黄色蛍光タンパク質（ＹＦＰ）、赤色蛍光タンパク質（ＲＦＰ）またはｍＣｈｅｒｒｙである。ｉｎｖｉｔｒｏであれ、ｅｘｖｉｖｏであれ、またはｉｎｖｉｖｏであれ、本発明の方法を使用すれば、好ましくは、高次コイルのプラスミドもしくは染色体などの高次構造、またはｍＲＮＡなどの一本鎖標的核酸の形態で、核酸分子中の標的遺伝子座を直接可視化することが可能である。標的遺伝子座の直接可視化は電子顕微鏡写真、または蛍光顕微鏡法を使用してもよい。しかし、本発明の方法の文脈では、有機色素分子、放射性標識および小分子でもよいスピン標識を含む、他の種類の標識をマーカーとして使用してもよいことは認識される。

標的核酸がｄｓＤＮＡである標的核酸を改変するための本発明の方法では、機能的部分はヌクレアーゼでもヘリカーゼ−ヌクレアーゼでもよく、改変は好ましくは所望の遺伝子座での一本鎖または二本鎖切断である。この方法で、ＤＮＡの独特な配列特異的切断は、リボ核タンパク質複合体に融合している適切な機能的部分を使用することにより操作することが可能である。最終的なリボ核タンパク質複合体のＲＮＡ成分の選ばれた配列は、機能的部分の作用に対する所望の配列特異性を提供する。

したがって、本発明は、ｄｓＤＮＡ分子からヌクレオチド配列の少なくとも一部を取り除くための、任意選択で遺伝子（単数または複数）の機能をノックアウトするための、細胞中の所望の遺伝子座でのｄｓＤＮＡ分子の非相同末端結合の方法であって、上文に記載される標的核酸を改変する方法のうちのいずれかを使用して二本鎖切断を作ることを含む方法も提供する。

本発明は、既存のヌクレオチド配列を改変する、または所望のヌクレオチド配列を挿入するために、細胞中の所望の遺伝子座でｄｓＤＮＡ分子内に核酸を相同組換えする方法であって、上文に記載される標的核酸を改変する方法のうちのいずれかを使用して所望の遺伝子座で二本鎖切断を作ることを含む方法をさらに提供する。

したがって、本発明は、上文に記載される方法のうちのいずれかに従って標的核酸配列を改変することを含む、生物中で遺伝子発現を改変する方法であって、核酸がｄｓＤＮＡであり、機能的部分がＤＮＡ修飾酵素（例えば、メチラーゼまたはアセチラーゼ）、転写活性化因子または転写リプレッサーから選択される、方法も提供する。

本発明は、上文に記載される方法のうちのいずれかに従って標的核酸配列を改変することを含む、生物中で遺伝子発現を改変する方法であって、核酸がｍＲＮＡであり、機能的部分はリボヌクレアーゼであり、任意選択でエンドヌクレオアーゼ、３’エキソヌクレアーゼまたは５’エキソヌクレアーゼから選択される、方法をさらに提供する。

本明細書に記載される本発明の方法の任意の態様では、標的核酸はＤＮＡ、ＲＮＡまたは合成核酸でもよい。好ましくは、標的核酸はＤＮＡ、好ましくはｄｓＤＮＡである。

しかし、標的核酸はＲＮＡ、好ましくはｍＲＮＡでも可能である。代わりに、したがって、本発明は、標的核酸を改変する方法であって、標的核酸がＲＮＡである、方法も提供する。

別の態様では、本発明は、標的核酸を改変する方法であって、核酸がｄｓＤＮＡであり、少なくとも１つの機能的部分がヌクレアーゼまたはヘリカーゼ−ヌクレアーゼであり、改変が所望の遺伝子座での一本鎖または二本鎖切断である、方法を提供する。

別の態様では、本発明は、細胞中で標的核酸を改変する方法であって、改変により所望の遺伝子座で遺伝子発現のサイレンシングが生じ、
ａ．ｄｓＤＮＡ分子で二本鎖切断を作るステップと、
ｂ．非相同末端結合（ＮＨＥＪ）により細胞中でｄｓＤＮＡ分子を修復するステップと
を含む方法を提供する。

別の態様では、本発明は、細胞中で標的核酸を改変する方法であって、既存のヌクレオチド配列が改変もしくは欠失され、および／または所望の位置で所望のヌクレオチド配列が挿入され、
ａ．所望の遺伝子座で二本鎖切断を作るステップと、
ｂ．相同組換えにより細胞中でｄｓＤＮＡ分子を修復するステップと
を含む方法を提供する。

別の態様では、本発明は、上文に記載の標的核酸配列を改変することを含む、細胞中で遺伝子発現を改変する方法であって、核酸がｄｓＤＮＡであり、機能的部分がＤＮＡ修飾酵素（例えば、メチラーゼまたはアセチラーゼ）、転写活性化因子または転写リプレッサーから選択される、方法を提供する。

別の態様では、本発明は、上文に記載の標的核酸配列を改変することを含む、細胞中で遺伝子発現を改変する方法であって、核酸がｍＲＮＡであり、機能的部分がリボヌクレアーゼであり、任意選択でエンドヌクレオアーゼ、３’エキソヌクレアーゼまたは５’エキソヌクレアーゼから選択される、方法を提供する。

別の態様では、本発明は上文に記載の標的核酸を改変する方法であって、５０℃と１００℃の間の温度で実行される方法を提供する。好ましくは、方法は６０℃でまたはそれよりも高い温度で実行される。より好ましくは、方法は６０℃と８０℃の間の温度で実行される。最適には、方法は６０℃と６５℃の間の温度で実行される。

上文に記載される標的核酸を改変する方法のうちのいずれにおいても、細胞は原核細胞でもよく、または代わりに真核細胞でもよい。

宿主細胞
有利なことに、本発明は広範な適用性があり、本発明の宿主細胞は、培養することが可能であるいかなる遺伝的に扱いやすい生物に由来してもよい。したがって、本発明は上文に記載される方法により形質転換される宿主細胞を提供する。

適切な宿主細胞は原核生物でも真核生物でもよい。特に、遺伝的に利用しやすく、培養することが可能である原核または真核細胞、例えば、原核細胞、真菌細胞、植物細胞およびヒト細胞を含む（が胚性幹細胞は含まない）動物細胞を含む、一般に使用されている宿主細胞を、本発明に従って使用するために選択することができる。好ましくは、宿主細胞は原核細胞、真菌細胞、植物細胞、原生生物細胞または動物細胞から選択されることになる。本発明に従って使用するための好ましい宿主細胞は、典型的には高成長速度を示し、容易に培養されおよび／もしくは形質転換され、短い世代時間を示す種、付随する確立した遺伝資源を有する種または特定の条件下で異種タンパク質の最適発現のために選択され、改変されもしくは合成された種に一般に由来している。目的のタンパク質が最終的には特定の工業的、農業的、化学的または治療的状況で使用されることになる本発明の好ましい実施形態では、適切な宿主細胞は、目的のタンパク質が配置されることになる所望の特定の条件または細胞状況に基づいて選択してもよい。好ましくは、宿主細胞は原核細胞になる。好ましい実施形態では、宿主細胞は細菌細胞である。宿主細胞は、例えば、大腸菌（Escherichia coli（E. coli））細胞でもよい。好ましくは、宿主細胞は好熱性細菌の細胞になる。

本発明は、今や特定の実施形態に関連しておよび添付図に関連して詳細に説明されることになる。

図１はＣａｓ９タンパク質配列の近隣結合樹を示す図である。ｐＢＬＡＳＴまたはＰＳＩ−ＢＬＡＳＴに基づいて菌株Ｔ１２と４０％を超える配列類似性を有するすべての配列、ならびに現在十分に特徴付けられている配列（化膿性連鎖球菌（S. pyogenes）、ストレプトコッカス・サーモフィルス（S. thermophiles）およびアクチノマイセス・ネスランディ（A. naeslundii））、ならびに、これらの配列が４０％より低い同一性であった場合、現在同定されている好熱性配列も含まれた。すべての好熱性配列では、Ｔ１２に対するパーセント同一性は菌株名の後に示される。遺伝子識別子（ｇｉ）番号は種名の前に示される。説明文：閉環：好熱性（最適６０℃より高い）Ｃａｓ９配列、閉四角：熱耐性（最適＜５０℃）Ｃａｓ９配列、開三角：中温性起源由来のゲノム編集目的で現在最も使用されているＣａｓ９配列；符号なし：中温性Ｃａｓ９。結節点の値は１０００レプリケートブートストラップ値を表し；スケールバーは部位当たりの推定アミノ酸置換を表す。図２はＣａｓ９遺伝子配列の近隣結合樹を示す図である。遺伝子レベルでの同一性は極端に乏しかった；タンパク質整列のために使用された生物と同じ生物由来の配列を遺伝子整列のために使用した。遺伝子識別子（ｇｉ）番号は種名の前に示されている。説明文：閉環：好熱性（最適６０℃より高い）Ｃａｓ９配列、閉四角：熱耐性（最適＜５０℃）Ｃａｓ９配列、開三角：中温性起源由来のゲノム編集目的で現在最も使用されているＣａｓ９配列；符号なし：中温性Ｃａｓ９。結節点の値は１０００レプリケートブートストラップ値を表す。図３は、Ｔ１２−Ｃａｓ９（配列番号１）（ＩＩ−Ｃ型）と十分に特徴付けられているＩＩ−Ｃ型（アクチノマイセス・ネスランディ（A. naeslundii）｜「ａｎａ」；配列番号８）およびＩＩ−Ａ型（化膿性連鎖球菌（S. pyogenes）｜「ｐｙｏ」；配列番号９およびストレプトコッカス・サーモフィルス（S. thermophilus））Ｃａｓ９配列とのタンパク質配列整列を示す図である。重要な活性部位残基はよく保存されており、黒色矢印で示されている。Ａｎａ−Ｃａｓ９およびＰｙｏ−Ｃａｓ９について記載されているタンパク質ドメイン（Jinek, et al., 2014, Science 343: 1247997）は斜線囲みおよび類似の色付き文字で示されている。ＰＡＭ認識ドメインは、化膿性連鎖球菌（S. pyogenes）ＩＩ−Ａ型系では決定されているが、いかなるＩＩ−Ｃ型系についても決定されておらず、したがって、化膿性連鎖球菌（S. pyogenes）配列でのみ示されている。図３は、Ｔ１２−Ｃａｓ９（配列番号１）（ＩＩ−Ｃ型）と十分に特徴付けられているＩＩ−Ｃ型（アクチノマイセス・ネスランディ（A. naeslundii）｜「ａｎａ」；配列番号８）およびＩＩ−Ａ型（化膿性連鎖球菌（S. pyogenes）｜「ｐｙｏ」；配列番号９およびストレプトコッカス・サーモフィルス（S. thermophilus））Ｃａｓ９配列とのタンパク質配列整列を示す図である。重要な活性部位残基はよく保存されており、黒色矢印で示されている。Ａｎａ−Ｃａｓ９およびＰｙｏ−Ｃａｓ９について記載されているタンパク質ドメイン（Jinek, et al., 2014, Science 343: 1247997）は斜線囲みおよび類似の色付き文字で示されている。ＰＡＭ認識ドメインは、化膿性連鎖球菌（S. pyogenes）ＩＩ−Ａ型系では決定されているが、いかなるＩＩ−Ｃ型系についても決定されておらず、したがって、化膿性連鎖球菌（S. pyogenes）配列でのみ示されている。図４はアクチノマイセス・ネスランディ（A. naeslundii）Ｃａｓ９（Ｃａｓ９−Ａｎａ）のタンパク質構成を示す図である（Jinek et al., 2014）。Ｔ１２−Ｃａｓ９は同じＩＩ−Ｃ型ＣＲＩＳＰＲ系に属し、活性部位残基を同定することができた。図５は相補的ｄｓＤＮＡのｃｒＲＮＡガイドターゲティングの比較を示す図である。塩基対合は破線で示されている。ＲＮＡは黒色で、ＤＮＡは灰色で描かれている。ｃｒＲＮＡスペーサーと標的プロトスペーサー間の塩基対合は太い黒色破線で示され、ＤＮＡ鎖間およびＲＮＡ鎖間の塩基対合は太い灰色破線で示されている。ｃｒＲＮＡの５’末端が示されている。Ｉ型中のＰＡＭ（小さい白色囲み）は標的鎖（プロトスペーサー）の下流に存在し、ＩＩ型ではＰＡＭは置き換えられた鎖のもう一方の末端に存在することに注目されたい。同様に、シード（標的ＤＮＡ鎖との塩基対合が始まり、ミスマッチが許されないガイドの予想配列）はＰＡＭの近くに位置しており、したがって、Ｉ型とＩＩ型で異なる（Van der Oost, 2014 ibid.）。パネルＡは大腸菌（E. coli）のＩ型Ｃａｓｃａｄｅ系の模式図を示している。ｃｒＲＮＡは、内部スペーサー（灰色囲み、標的認識を可能にする３１〜３２ヌクレオチド）を有し、８ヌクレオチド５’ハンドルおよびステムループ構造（ヘアピン）からなる２９ヌクレオチド３’ハンドルで隣接している（Jore 2011 ibid.）。パネルＢは化膿性連鎖球菌（S. pyogenes）のＩＩ型Ｃａｓ９系の模式図を示している。ｃｒＲＮＡはｔｒａｃｒＲＮＡと塩基対合し、リボヌクレアーゼＩＩＩによるプロセシングを可能にする（向かい合った黒色三角）。さらに、ｃｒＲＮＡの５’末端はリボヌクレアーゼにより刈り込まれ（黒色三角）、典型的には２０ヌクレオチドスペーサーを生じる。合成ループを導入してｃｒＲＮＡとｔｒａｃｒＲＮＡを連結し、単一ガイドＲＮＡ（ｓｇＲＮＡ）を生じてもよいことに注目されたい（Jinek et al., 2012 ibid.）。

以下は、本発明に従って使用されるＣａｓタンパク質のポリヌクレオチドおよびアミノ酸配列である。

［配列番号１］ゲオバチルス・サーモデニトリフィカンス（Geobacillus thermodenitrificans）Ｔ１２Ｃａｓ９タンパク質アミノ酸配列

［配列番号７］ゲオバチルス・サーモデニトリフィカンス（Geobacillus thermodenitrificans）Ｔ１２Ｃａｓ９ＤＮＡ配列

ゲオバチルス・サーモデニトリフィカンス（G. thermodenitrificans）の単離
驚くべきことに、ゲオバチルス・サーモデニトリフィカンス（G. thermodenitrificans）は、嫌気性条件下でリグノセルロース基質を分解することができる好熱菌についての±５００単離菌のライブラリーの探索中に発見された。当初、±５００単離菌のライブラリーが確立され、これはセルロースおよびキシラン上での単離により数回の選択ラウンド後に、１１０単離菌にまで削減された。１１０単離菌のこのライブラリーはゲオバチルス（Geobacillus）単離菌のみからなり、ゲオバチルス・サーモデニトリフィカンス（G. thermodenitrificans）がライブラリーの７９％を占めていた。

単離されたゲオバチルス・サーモデニトリフィカンス（G. thermodenitrificans）菌株は「Ｔ１２」と命名された。

ゲオバチルス・サーモデニトリフィカンス（Geobacillus thermodenitrificans）でのＣａｓ９について必須のコンセンサス配列を定義する
以下のデータベース探索および整列が実施された。
ｐＢＬＡＳＴおよびｎＢＬＡＳＴは社内ＢＬＡＳＴサーバーで実施し、ゲオバチルス・サーモデニトリフィカンス（G. thermodenitrificans）Ｔ１２のタンパク質または遺伝子配列を問い合わせ配列として使用した。このデータベースは２０１４年５月に最後にアップデートされ、したがって、最も最近に追加されたゲオバチルス（Geobacillus）ゲノムを含有していないが、通常のオンラインＢＬＡＳＴはＴ１２配列の公開を防ぐために使用されなかった。これの最も関連性の高い配列である、社内ｐＢＬＡＳＴのエクセルフォーマットでの結果は添付物１を参照されたい（４０％よりも大きな配列同一性は図１に含まれている）。

もっと最近の配列データを含めるために、ゲオバチルス（Geobacillus）ＭＡＳ１（Ｔ１２Ｃａｓ９に最も密接に関係している）の配列を使用してＮＣＢＩウェブサイト上でＰＳＩ−ＢＬＡＳＴを実施した（Johnson et al., 2008 Nucleic Acids Res. 36(Web Server issue): W5-9）。２連続ラウンドのＰＳＩ−ＢＬＡＳＴが実施され、そこでは以下の基準：第１のラウンドでは最小配列包括度９６％、ならびに第２および第３のラウンドでは９７％、最小同一性４０％、種当たり１つの菌株のみを満たした配列のみが次のラウンドで使用された。

ＰＳＩ−ＢＬＡＳＴから生じる配列、ならびに内部サーバーｐＢＬＡＳＴ由来のＴ１２に対して４０％よりも大きな同一性を有し、ＰＳＩ−ＢＬＡＳＴには現われなかった配列を、現在十分に特徴付けられている中温性配列と、および、これらの配列がもっと離れた関係にある場合には、現在同定されているすべての好熱性配列とも整列させ、それから近隣結合樹を構築した（図１参照）。整列はＣｌｕｓｔａｌＷを使用してＭｅｇａ６で実施し、この後近隣結合法を使用して樹を構築し、ブートストラップ解析は１０００レプリケートを使用して実施した。

問い合わせ配列としてゲオバチルス（Geobacillus）属種ＭＡＳ１を使用してＢＬＡＳＴｎを実施した場合、ゲオバチルス（Geobacillus）属種ＪＦ８Ｃａｓ９のみが８８％の同一性で同定され、遺伝子レベルでは相同性が極めて少ないことを示していた。図２はＣｌｕｓｔａｌ整列Ｃａｓ９遺伝子配列の近隣結合樹である。

ゲオバチルス・サーモデニトリフィカンス（G. thermodenitrificans）Ｔ１２、アクチノマイセス・ネスランディ（A. naeslundii）および化膿性連鎖球菌（S. pyogenes）のタンパク質配列は、デフォルト設定のＢＬＯＳＵＭ６２を使用してＣｌｏｎｅＭａｎａｇｅｒでその配列を整列させることによりタンパク質ドメイン相同性についてさらに解析した（図３参照）。

ＣＡＳ９の機能に不可欠であるコアアミノ酸モチーフおよび好熱性Ｃａｓ９ヌクレアーゼの熱安定性を与えるコアアミノ酸モチーフを同定する
上記整列されたタンパク質配列のパーセント同一性は図１に与えられている。Ｔ１２−Ｃａｓ９はＩＩ−Ｃ型に属している。ＩＩ−Ｃ型系の最もよく研究され、最近結晶化された構造はアクチノマイセス・ネスランディ（Actinomyces naeslundii）由来である（Jinek et al., 2014, Science 343: 1247997）。このタンパク質配列はＴ１２−Ｃａｓ９に対して２０％の同一性しか示していないが、高度に保存された残基を推定するのに使用することが可能である。２つの十分に特徴付けられているＩＩ−Ａ型系（化膿性連鎖球菌（S. pyogenes）およびストレプトコッカス・サーモフィルス（S. thermophilus））も分析に含まれた（Jinek et al., 2014, Science 343: 1247997；Nishimasu et al., 2014, Cell 156: 935-949）。これら４つのタンパク質配列の整列は図３に示されており、図４はアクチノマイセス・ネスランディ（A. naeslundii）について決定されたタンパク質構成（「Ａｎａ−Ｃａｓ９」）を示している（Jinek et al., 2014, Science 343: 1247997）。Ｔ１２およびアクチノマイセス・ネスランディ（Actinomyces naeslundii）由来のＣａｓ９の長さは極めて類似しており（アクチノマイセス・ネスランディ（A. naeslundii）１１０１アミノ酸、Ｔ１２１０８２アミノ酸）、Ｔ１２は類似するタンパク質構成を有すると予想されるが、Ｃａｓ９−Ａｎａに対する全体の配列同一性が２０％にすぎないために、これはまだ確定されていない。Jinek et al.（Jinek et al., 2014, Science 343: 1247997）により記載されているアクチノマイセス・ネスランディ（A. naeslundii）および化膿性連鎖球菌（S. pyogenes）由来のＣａｓ９中の活性部位残基はすべてＴ１２−Ｃａｓ９において同定することができた（図３参照）。ＰＡＭ結合ドメインは化膿性連鎖球菌（S. pyogenes）ＩＩ−Ａ型系については決定されているが、いかなるＩＩ−Ｃ型系についても決定されておらず、したがって、化膿性連鎖球菌（S. pyogenes）配列においてのみ示されている。さらに、ＰＡＭ認識部位は、ＣＲＩＳＰＲ系間だけでなく、同じ系を含有する種間でも大きく変化する。ＰＡＭに関するさらなる情報については、問題点４および将来計画を参照されたい。

ゲオバチルス・サーモデニトリフィカンス（G. thermodenitrificans）Ｔ１２Ｃａｓ９のＰＡＭ配列の決定
原核生物ＣＲＩＳＰＲ系が適応免疫系としてその宿主に役立ち（Jinek et al., 2012, Science 337: 816-821）、迅速で効果的な遺伝子工学のために使用することが可能であること（Mali et al., 2013, Nat Methods 10: 957-963）は確立されている。

Ｃａｓ９タンパク質はＩＩ型ＣＲＩＳＰＲ系のための配列特異的ヌクレアーゼとして機能する（Makarova et al., 2011, Nat Rev Micro 9: 467-477）。小型ｃｒＲＮＡ分子は、繰り返し領域に連結している「スペーサー」（標的）からなり、ＣＲＩＳＰＲ遺伝子座の転写およびプロセシング産物である。「スペーサー」は天然にはバクテリオファージのゲノムおよび可動遺伝要素に起源をもつが、遺伝子工学工程中に特定のヌクレオチド配列を標的にするように設計することも可能である（Bikard et al., 2013, Nucleic Acids Research 41: 7429-7437）。ｃｒＲＮＡ分子はそのＤＮＡ標的の同定のためのガイドとしてＣａｓ９により用いられる。スペーサー領域は、切断ＤＮＡ領域の標的物、「プロトスペーサー」と同一である（Brouns et al., 2012, Science 337: 808-809）。ＰＡＭ（プロトスペーサー隣接モチーフ）は、プロトスペーサーの隣にあり、Ｃａｓ９による標的の認識に必要である（Jinek et al., 2012, Science 337: 816-821）。

無作為化されたＰＡＭを有する標的生成
ゲオバチルス・サーモデニトリフィカンス（G. thermodenitrificans）Ｔ１２菌株のＣＲＩＳＰＲＩＩ遺伝子座由来の２つの異なるスペーサーを、鋳型としてゲオバチルス・サーモデニトリフィカンス（G. thermodenitrificans）Ｔ１２ゲノムＤＮＡを使用してＰＣＲにより増幅させた。２対の縮重プライマーをそれぞれのスペーサーの増幅のために使用した。

第１に、「プロトスペーサー」断片の上流に６つの無作為ヌクレオチドの導入を引き起こす対を使用し、無作為化されたＰＡＭ配列を有するプロトスペーサーのプールを作製した。

第２に、「プロトスペーサー」断片の下流に６つの無作為ヌクレオチドの導入を引き起こす対を使用し、無作為化されたＰＡＭ配列を有するプロトスペーサーのプールを作製した。

作製された断片はｐＮＷ３３ｎベクターにライゲートされ、６ヌクレオチド長ＰＡＭそれぞれの考えられる４０９６の異なる組合せすべてを有する「プロトスペーサー」構築物の４プールを作製した。構築されたＤＮＡはゲオバチルス・サーモデニトリフィカンス（G. thermodenitrificans）Ｔ１２細胞の形質転換のために使用された。細胞はクロラムフェニコール選択上に蒔かれ、それぞれのプロトスペーサープールから２×１０^６を超える細胞がプールされることになる。プラスミドＤＮＡはプールから抽出され、標的領域はＰＣＲ増幅されることになり、その産物はディープシークエンシングのために送られた。最も少ないリードを有するＰＡＭは活性であると見なされ、その工程はこれらのＰＡＭを有するスペーサーを含有するｐＮＷ３３ｎ構築物のみを用いて繰り返されることになる。ゲオバチルス・サーモデニトリフィカンス（G. thermodenitrificans）Ｔ１２の形質転換効率が減少していることはＰＡＭの活性を立証することになる。

ゲオバチルス・サーモデニトリフィカンス（Geobacillus thermodenitrificans）Ｃａｓ９のための機能的温度範囲
一般公開されているいかなるＣａｓ９タンパク質にも今日まで温度範囲実験は実行されたことがない。研究で使用されるＣａｓ９タンパク質はすべて中温性起源を有し、宿主生物化膿性連鎖球菌（Streptococcus pyogenes）（ＡＴＣＣ＿７００２９４）で最大成長温度４５℃である。

ここで、ゲオバチルス・サーモデニトリフィカンス（Geobacillus thermodenitrificans）由来のＣａｓ９が安定で機能的である温度およびさらにそのＣａｓ９の活性が最適である温度の範囲が実験的に決定された。さらに、他のゲオバチルス（Geobacillus）属種由来のＣａｓ９ヌクレアーゼについての機能的で好ましい温度範囲も決定された。

ゲオバチルス・サーモデニトリフィカンス（Geobacillus thermodenitrificans）Ｔ１２Ｃａｓ９ヌクレアーゼの温度範囲は、単一ガイドＲＮＡ（ｓｇＲＮＡ）を使用することによりｉｎｖｉｔｒｏで決定された。ｓｇＲＮＡは単一キメラ転写物にした内在性細菌ｃｒＲＮＡとｔｒａｃｒＲＮＡからなり、２０塩基対（ｂｐ）標的配列に続くｃｒＲＮＡ：ｔｒａｃｒＲＮＡ骨格を含有するｐＴ７クローニングベクターを使用することにより生み出された（Jao et al., 2013, PNAS 110: 13904-13909）。標的配列は２０ｂｐ標的で開始しＴ１２ＰＡＭ配列（実施例４由来の）で終わる。所望の単一ターゲティングｓｇＲＮＡは、プラスミドを直線化した後、Ｔ７プロモーターからのｉｎｖｉｔｒｏ転写により生み出された。標準クローニングベクターｐＵＣ１９は我々のｉｎｖｉｔｒｏ活性アッセイでは標的として使用されてきた。プラスミド中の標的部位（２０ヌクレオチド＋ＰＡＭ）は、アニールされｓｇＲＮＡクローニングベクターにライゲートされた２つの相補的オリゴにより構築された。生成されたｓｇＲＮＡは、２０℃から１００℃までに及ぶ温度でＴ１２のＣａｓ９ヌクレアーゼと一緒にインキュベートされた。Ｃａｓ９切断活性はアガロースゲル電気泳動によりアッセイされた。

ここで単離され特徴付けられた生物（Ｔ１２）は、そのＣａｓ９タンパク質についての最適温度も表す６５℃の最適成長温度を有する。Ｃａｓ９タンパク質が活性である温度範囲は２０℃から１００℃まで、特に２０℃から８０℃である。

ゲオバチルス（Geobacillus）属種由来のＣａｓ９の最適温度範囲は今日まで特徴付けられているＣａｓ９タンパク質よりもはるかに高い。同様に、ゲオバチルス（Geobacillus）属種由来のＣａｓ９がヌクレアーゼ活性を保持する範囲の最上方は既知のＣａｓ９タンパク質よりもはるかに高い。より高い最適温度および機能的範囲は高温での遺伝子工学に、したがって、好熱性生物のゲノムの編集に著しい利点を与え、これは高温で実行される様々な工業、農業および製薬工程において有用性がある。

Claims

配列番号１のアミノ酸配列またはそれと少なくとも７７％の同一性の配列を有する、単離されたＣａｓタンパク質またはポリペプチド断片であって、前記Ｃａｓタンパク質が、標的核酸配列を認識する少なくとも１つのＲＮＡ分子と会合すると、５０℃と１００℃の間で前記標的配列を含むポリヌクレオチドを切断することができる、単離されたＣａｓタンパク質またはポリペプチド断片。
５０℃と７５℃の間で、好ましくは６０℃より上で、より好ましくは６０℃と８０℃の間で、さらにより好ましくは６０℃と６５℃の間で核酸を切断することができる、請求項１に記載のＣａｓタンパク質またはポリペプチド断片。
前記核酸の切断がＤＮＡの切断である、請求項１または請求項２に記載のＣａｓタンパク質またはポリペプチド断片。
前記Ｃａｓタンパク質が細菌、古細菌またはウイルスから入手可能である、請求項１から３のいずれかに記載のＣａｓタンパク質またはポリペプチド断片。
前記Ｃａｓタンパク質がゲオバチルス（Geobacillus）属種から、好ましくはゲオバチルス・サーモデニトリフィカンス（Geobacillus thermodenitrificans）から入手可能である、請求項１から４のいずれかに記載のＣａｓタンパク質またはポリペプチド断片。
請求項１から５のいずれかに記載のＣａｓタンパク質を含み、標的ポリヌクレオチド中の配列を認識する少なくとも１つのターゲティングＲＮＡ分子を含む、リボ核タンパク質複合体。
前記ターゲティングＲＮＡ分子がｃｒＲＮＡおよび任意選択でｔｒａｃｒＲＮＡを含む、請求項６に記載のリボ核タンパク質複合体。
前記少なくとも１つのＲＮＡ分子の長さが３５〜１３５ヌクレオチド残基の範囲である、請求項６または請求項７に記載のリボ核タンパク質複合体。
前記標的配列が３１または３２ヌクレオチド残基長である、請求項６または請求項７に記載のリボ核タンパク質複合体。
前記タンパク質またはポリペプチドが、少なくとも１つのさらなる機能的または非機能的タンパク質を含むタンパク質複合体の一部として提供される、請求項１から５のいずれかに記載のＣａｓタンパク質もしくはポリペプチドまたは請求項６から９のいずれかに記載のリボ核タンパク質複合体。
前記Ｃａｓタンパク質もしくはポリペプチドおよび／または前記少なくとも１つのさらなるタンパク質が少なくとも１つの機能的部分をさらに含む、請求項１０に記載のＣａｓタンパク質、ポリペプチド、またはリボ核タンパク質複合体。
前記少なくとも１つの機能的部分が、前記Ｃａｓタンパク質、ポリペプチドまたはリボ核タンパク質複合体のＮ終端および／またはＣ終端、好ましくはＮ終端に融合または連結している、請求項１１に記載のＣａｓタンパク質もしくはポリペプチド、またはリボ核タンパク質複合体。
前記少なくとも１つの機能的部分がタンパク質であり、任意選択で、ヘリカーゼ、ヌクレアーゼ、ヘリカーゼ−ヌクレアーゼ、ＤＮＡメチラーゼ、ヒストンメチラーゼ、アセチラーゼ、ホスファターゼ、キナーゼ、転写（共）活性化因子、転写リプレッサー、ＤＮＡ結合タンパク質、ＤＮＡ構築タンパク質、マーカータンパク質、レポータータンパク質、蛍光タンパク質、リガンド結合タンパク質、シグナルペプチド、細胞内局在配列、抗体エピトープまたは親和性精製タグから選択される、請求項１１または請求項１２に記載のＣａｓタンパク質もしくはポリペプチド、またはリボ核タンパク質複合体。
Ｃａｓ９ヌクレアーゼの天然の活性が不活化されており、Ｃａｓタンパク質が少なくとも１つの機能的部分に連結している、請求項１３に記載のＣａｓタンパク質もしくはポリペプチド、またはリボ核タンパク質複合体。
前記少なくとも１つの機能的部分がヌクレアーゼドメイン、好ましくはＦｏｋＩヌクレアーゼドメインである、請求項１３または請求項１４に記載のＣａｓタンパク質もしくはポリペプチド、またはリボ核タンパク質複合体。
前記少なくとも１つの機能的部分がマーカータンパク質である、請求項１３から１５のいずれかに記載のＣａｓタンパク質もしくはポリペプチド、またはリボ核タンパク質複合体。
配列番号１のアミノ酸配列もしくはそれと少なくとも７７％の同一性の配列を有するＣａｓ（ＣＲＩＳＰＲ（ｃｌｕｓｔｅｒｅｄｒｅｇｕｌａｒｌｙｉｎｔｅｒｓｐａｃｅｄｓｈｏｒｔｐａｌｉｎｄｒｏｍｉｃｒｅｐｅａｔ：クラスター化し規則的に間隔を置いた短い回文配列の繰り返し）ａｓｓｏｃｉａｔｅｄ：ＣＲＩＳＰＲ関連）タンパク質、またはそのポリペプチド断片をコードする単離された核酸分子。
翻訳されると前記Ｃａｓタンパク質またはポリペプチドと融合するアミノ酸配列をコードする少なくとも１つの核酸配列をさらに含む、請求項１７に記載の単離された核酸分子。
前記Ｃａｓタンパク質またはポリペプチドをコードする核酸分子に融合する前記少なくとも１つの核酸配列が、ヘリカーゼ、ヌクレアーゼ、ヘリカーゼ−ヌクレアーゼ、ＤＮＡメチラーゼ、ヒストンメチラーゼ、アセチラーゼ、ホスファターゼ、キナーゼ、転写（共）活性化因子、転写リプレッサー、ＤＮＡ結合タンパク質、ＤＮＡ構築タンパク質、マーカータンパク質、レポータータンパク質、蛍光タンパク質、リガンド結合タンパク質、シグナルペプチド、細胞内局在配列、抗体エピトープまたは親和性精製タグから選択されるタンパク質をコードする、請求項１８に記載の単離された核酸分子。
請求項１７から１９のいずれかに記載の核酸分子を含む発現ベクター。
少なくとも１つのターゲティングＲＮＡ分子をコードするヌクレオチド配列をさらに含む、請求項２０に記載の発現ベクター。
標的核酸を改変する方法であって、前記核酸を、
ａ．請求項６から９のいずれかに記載のリボ核タンパク質複合体、または
ｂ．請求項１０から１６のいずれかに記載のタンパク質またはタンパク質複合体および請求項４から９のいずれかに記載の少なくとも１つのターゲティングＲＮＡ分子
と接触させることを含む方法。
細胞中で標的核酸を改変する方法であって、前記細胞を請求項２１に記載の発現ベクターで形質転換、トランスフェクトもしくは形質導入すること、または代わりに前記細胞を請求項２０に記載の発現ベクターおよび請求項４から９のいずれかに記載のターゲティングＲＮＡ分子をコードするヌクレオチド配列を含むさらなる発現ベクターで形質転換、トランスフェクトもしくは形質導入することを含む方法。
細胞中で標的核酸を改変する方法であって、前記細胞を請求項２０に記載の発現ベクターで形質転換、トランスフェクトもしくは形質導入し、次いで、請求項４から９のいずれかに記載のターゲティングＲＮＡ分子を前記細胞に、または前記細胞内に送達することを含む方法。
請求項２２から２４のいずれかに記載の標的核酸を改変する方法であって、前記少なくとも１つの機能的部分がマーカータンパク質またはレポータータンパク質であり、前記マーカータンパク質またはレポータータンパク質が前記標的核酸と会合し、好ましくは前記マーカーが蛍光タンパク質、例えば、緑色蛍光タンパク質（ＧＦＰ）である、方法。
前記標的核酸がＤＮＡ、好ましくはｄｓＤＮＡである、請求項２２から２５のいずれかに記載の方法。
前記標的核酸がＲＮＡである、請求項２２から２５のいずれかに記載の方法。
請求項２６に記載の標的核酸を改変する方法であって、前記核酸がｄｓＤＮＡであり、前記少なくとも１つの機能的部分がヌクレアーゼまたはヘリカーゼ−ヌクレアーゼであり、前記改変が所望の遺伝子座での一本鎖または二本鎖切断である、方法。
請求項２３、２４、２６または２８に記載の方法のいずれかに従って所望の遺伝子座で遺伝子発現をサイレンシングする方法。
請求項２３、２４、２６または２８に記載の方法のいずれかに従って所望の位置で所望のヌクレオチド配列を改変または欠失および／もしくは挿入する方法。
請求項２２から２６のいずれかに記載の方法に記載の標的核酸配列を改変することを含む、細胞中で遺伝子発現を改変する方法であって、前記核酸がｄｓＤＮＡであり、前記機能的部分がＤＮＡ修飾酵素（例えば、メチラーゼまたはアセチラーゼ）、転写活性化因子または転写リプレッサーから選択される、方法。
請求項２７に記載の方法に記載の標的核酸配列を改変することを含む、細胞中で遺伝子発現を改変する方法であって、前記核酸がｍＲＮＡであり、前記機能的部分がリボヌクレアーゼであり、任意選択でエンドヌクレアーゼ、３’エキソヌクレアーゼまたは５’エキソヌクレアーゼから選択される、方法。
５０℃と１００℃の間の温度で実行される、請求項２２から３２のいずれかに記載の標的核酸を改変する方法。
６０℃または６０℃より上、好ましくは６０℃と８０℃の間、より好ましくは６０℃と６５℃の間の温度で実行される、請求項３３に記載の標的核酸を改変する方法。
前記細胞が原核細胞である、請求項２２から３４のいずれかに記載の方法。
前記細胞が真核細胞である、請求項２２から３５のいずれかに記載の方法。
請求項２２から３３のいずれかに記載の方法により形質転換される宿主細胞。