JP2023539569A

JP2023539569A - ヌクレアーゼを含む組成物及びその使用

Info

Publication number: JP2023539569A
Application number: JP2023511933A
Authority: JP
Inventors: デイビッドエー．スコット，; デイビッドアール．チェン，; ウィンストンエックス．ヤン，; ティアエム．ディトマソ，
Original assignee: アーバーバイオテクノロジーズ，インコーポレイテッド
Priority date: 2020-08-17
Filing date: 2021-08-17
Publication date: 2023-09-15
Also published as: CA3189662A1; EP4196576A1; US20240011031A1; WO2022040224A1; AU2021329314A1

Abstract

本発明は、ヌクレアーゼ、ヌクレアーゼの特性を決定するためのプロセス、ヌクレアーゼを含む組成物、及びヌクレアーゼを使用するための方法に関する。

Description

関連出願の相互参照
本出願は、２０２０年８月１７日に提出された米国仮特許出願第６３／０６６６６９号明細書の利益を主張する。上述の出願の内容は、これによって、その全体が参照によって援用される。

配列表
本出願は、ＡＳＣＩＩ形式で電子的に提出され、これによってその全体が参照によって援用される配列表を含有する。２０２１年８月１６日に作成された前記ＡＳＣＩＩのコピーは、Ａ２１８６－７０３９ＷＯ＿ＳＬ．ｔｘｔというファイル名で、サイズが２７５，９９６バイトである。

クラスター化され、規則的に間隔が空いた短い回文構造のリピート（ＣｌｕｓｔｅｒｅｄＲｅｇｕｌａｒｌｙＩｎｔｅｒｓｐａｃｅｄＳｈｏｒｔＰａｌｉｎｄｒｏｍｉｃＲｅｐｅａｔｓ）（ＣＲＩＳＰＲ）及びＣＲＩＳＰＲ関連（Ｃａｓ）遺伝子は、ＣＲＩＳＰＲ－Ｃａｓ又はＣＲＩＳＰＲ／Ｃａｓシステムと総称されており、個々の種を外来遺伝因子から防御する、古細菌及び細菌における適応免疫システムである。

上記の背景技術を踏まえて、本発明は、先行技術に勝る、確かな利益及び進歩を提供する。

本明細書において開示される本発明は、特定の利益又は有用性に限定されないが、本発明は、（ａ）ヌクレアーゼ又はヌクレアーゼをコードする核酸であって、ヌクレアーゼは、配列番号１～３７及び配列番号２２１～２２４のいずれか１つに対して少なくとも８０％の同一性を有するアミノ酸配列を含む、核酸；並びに（ｂ）ＲＮＡガイド又はＲＮＡガイドをコードする核酸であって、ＲＮＡガイドは、ダイレクトリピート配列及びスペーサー配列を含む、核酸を含む組成物を提供し、ヌクレアーゼは、ＲＮＡガイドに結合し、スペーサー配列は、標的核酸に結合する。

多様な態様において、ヌクレアーゼは、ＲｕｖＣドメイン又は分断ＲｕｖＣドメインを含む。

いくつかの態様において、ヌクレアーゼは、触媒残基（例えばアスパラギン酸又はグルタミン酸）を含む。

いくつかの態様において、ヌクレアーゼは、以下の配列の一つ以上を含む：（ａ）Ｘ_１Ｘ_２Ｘ_３Ｘ_４ＧＸ_５Ｘ_６（配列番号２３３）（式中、Ｘ_１はＶ又はＡ又はＣであり、Ｘ_２はＹ又はＦであり、Ｘ_３はＫ又はＱであり、Ｘ_４はＹ又はＦであり、Ｘ_５はＬ又はＡ又はＭ又はＣ又はＴであり、Ｘ_６はＩ又はＶ又はＬである）；（ｂ）ＬＸ_１ＮＸ_２ＬＶ（配列番号２３４）（式中、Ｘ_１はＷ又はＫ又はＲであり、Ｘ_２はＮ又はＴ又はＫ又はＳ又はＤ又はＱである）；（ｃ）ＦＤＸ_１Ｘ_２Ｇ（配列番号２３５）（式中、Ｘ_１はＧ又はＹであり、Ｘ_２はＴ又はＳ又はＭである）；（ｄ）Ｘ_１Ｘ_２ＨＲＸ_３Ｘ_４Ｐ（配列番号２３６）（式中、Ｘ_１はＩ又はＬ又はＶであり、Ｘ_２はＹ又はＬ又はＭ又はＦであり、Ｘ_３はＰ又はＨ又はＤ又はＥであり、Ｘ_４はＬ又はＩ又はＶ又はＭである）；（ｅ）ＧＸ_１ＤＸ_２ＧＸ_３Ｒ（配列番号２３７）（式中、Ｘ_１はＩ又はＬ又はＶであり、Ｘ_２はＩ又はＶ又はＬであり、Ｘ_３はＦ又はＹである）；（ｆ）ＲＸ_１Ｘ_２Ｘ_３ＹＲ（配列番号２３８）（式中、Ｘ_１はＫ又はＱ又はＥであり、Ｘ_２はＨ又はＤ又はＥであり、Ｘ_３はＦ又はＶ又はＬ又はＩである）；及び（ｇ）Ｘ_１ＤＸ_２ＤＸ_３ＮＡＡＸ_４Ｎ（配列番号２３９）（式中、Ｘ_１はＨ又はＹであり、Ｘ_２はＲ又はＱ又はＶであり、Ｘ_３はＥ又はＴ又はＩ又はＨ又はＫ又はＱ又はＤであり、Ｘ_４はＮ又はＲ又はＩ又はＶ又はＫである）。

いくつかの態様において、ヌクレアーゼは、配列番号１～３７及び配列番号２２１～２２４のいずれか１つに対して少なくとも９５％の同一性を有するアミノ酸配列を含む。

いくつかの態様において、ヌクレアーゼは、配列番号１～３７及び配列番号２２１～２２４のいずれか１つにおいて記載されるアミノ酸配列を含む。

いくつかの態様において、組成物は、ｔｒａｃｒＲＮＡを含まない。

いくつかの態様において、ダイレクトリピート配列は、以下の配列の一つ以上を含む：（ａ）Ｘ_１Ｘ_２ＣＣＣＴＸ_３（配列番号２４０）（式中、Ｘ_１はＧ又はＡであり、Ｘ_２はＡ又はＣであり、Ｘ_３はＧ又はＡである）；及び（ｂ）Ｘ_１ＧＧＧＸ_２Ｘ_３Ｘ_４Ｘ_５Ｘ_６Ａ（配列番号２４１）（式中、Ｘ_１はＴ又はＧであり、Ｘ_２はＴ又はＧであり、Ｘ_３はＴ又はＧであり、Ｘ_４はＡ又はＧであり、Ｘ_５はＴ又はＡであり、Ｘ_６はＡ又はＧ又はＣである）。

いくつかの態様において、ダイレクトリピート配列は、配列番号３８～１２６又は配列番号２４３～２５０のいずれか１つに対して少なくとも９５％の配列同一性を有するヌクレオチド配列を含む。

いくつかの態様において、ダイレクトリピート配列は、配列番号３８～１２６又は配列番号２４３～２５０のいずれか１つにおいて記載されるヌクレオチド配列を含む。

いくつかの態様において、ヌクレアーゼは、配列番号２に対して少なくとも９５％の同一性を有するアミノ酸配列を含む。いくつかの態様において、ヌクレアーゼは、配列番号２において記載されるアミノ酸配列を含む。いくつかの態様において、ダイレクトリピート配列は、配列番号４０又は配列番号４１に対して少なくとも９５％の配列同一性を有するヌクレオチド配列を含む。いくつかの態様において、ダイレクトリピート配列は、配列番号４０又は配列番号４１において記載されるヌクレオチド配列を含む。いくつかの態様において、ダイレクトリピート配列は、配列番号１１１又は配列番号２４３に対して少なくとも９５％の配列同一性を有するヌクレオチド配列を含む。

いくつかの態様において、スペーサー配列は、長さが１５～２４の間のヌクレオチドを含む。いくつかの態様において、スペーサー配列は、長さが約１９又は２０のヌクレオチドを含む。

いくつかの態様において、標的核酸は、スペーサー配列中のヌクレオチド配列に対して相補的な配列を含む。

いくつかの態様において、標的核酸は、プロトスペーサー隣接モチーフ（ＰＡＭ）配列に隣接しており、ここで、ＰＡＭ配列は、５’－ＣＮ－３’、５’－ＣＣＮ－３’、５’－ＮＣＮ－３’、５’－ＮＣＣＮ－３’、又は５’－ＮＮＣＮ－３’として記載されるヌクレオチド配列を含み、式中、「Ｎ」は任意の核酸塩基である。いくつかの態様において、ＰＡＭ配列は、５’－ＡＣＣＮ－３’、５’－ＤＣＣＮ－３’、５’－ＤＴＴＮ－３’、５’－ＤＹＹＮ－３’、５’－ＧＣＣＮ－３’、５’－ＧＴＴＮ－３’、５’－ＧＹＹＮ－３’、５’－ＨＣＮ－３’、５’－ＨＮＣＮ－３’、５’－ＨＮＣＲ－３’、５’－ＨＮＣＶ－３’、５’－ＲＣＣＮ－３’、５’－ＲＣＣＲ－３’、５’－ＲＹＣＮ－３’、５’－ＴＮＣＮ－３’として記載されるヌクレオチド配列を含み、式中、「Ｄ」はＡ又はＧ又はＴであり、「Ｈ」はＡ又はＣ又はＴであり、「Ｎ」は任意の核酸塩基であり、「Ｒ」はＡ又はＧであり、「Ｖ」はＡ又はＣ又はＧであり、「Ｙ」はＣ又はＴである。いくつかの態様において、ＰＡＭ配列は、５’－ＣＣＡ－３’、５’－ＣＣＣ－３’、５’－ＣＣＴ－３’、５’－ＣＣＧ－３’、５’－ＡＣＣＧ－３’、５’－ＣＣＣＡ－３’、５’－ＣＣＣＧ－３’、５’－ＴＣＣＡ－３’、又は５’－ＴＣＣＴ－３’として記載されるヌクレオチド配列を含む。

いくつかの態様において、ヌクレアーゼは、標的核酸を切断する。

いくつかの態様において、標的核酸は、一本鎖ＤＮＡ又は二本鎖ＤＮＡである。

いくつかの態様において、組成物は、基準組成物よりも少なくとも１０％大きな酵素活性、例えば、基準組成物のヌクレアーゼ活性よりも少なくとも１０％大きなヌクレアーゼ活性を含む。

いくつかの態様において、ヌクレアーゼは、ペプチドタグ、蛍光タンパク質、塩基編集ドメイン、ＤＮＡメチル化ドメイン、ヒストン残基修飾ドメイン、局在化因子、転写修飾因子、光作動性制御因子、化学的誘導性因子、又はクロマチン可視化因子をさらに含む。

いくつかの態様において、ヌクレアーゼをコードする核酸は、細胞における発現のためにコドン最適化される。

いくつかの態様において、ヌクレアーゼをコードする核酸は、プロモーターに作動可能に連結される。

いくつかの態様において、ヌクレアーゼをコードする核酸は、ベクター中にある。いくつかの態様において、ベクターは、レトロウイルスベクター、レンチウイルスベクター、ファージベクター、アデノウイルスベクター、アデノ随伴ベクター、又は単純ヘルペスベクターを含む。

いくつかの態様において、組成物は、ナノ粒子、リポソーム、エキソソーム、微小胞、又は遺伝子銃を含む送達媒体中に存在する。

本発明は、本発明の組成物を含む細胞をさらに提供する。

多様な態様において、細胞は、真核細胞又は原核細胞である。いくつかの態様において、細胞は、哺乳類細胞又は植物細胞である。いくつかの態様において、細胞は、ヒト細胞である。

本発明は、本発明の組成物を、細胞中の標的核酸に結合させるための方法であって、（ａ）組成物を提供すること及び（ｂ）組成物を細胞に送達することを含み、細胞は、標的核酸を含み、ヌクレアーゼは、ＲＮＡガイドに結合する、及びスペーサー配列は、標的核酸に結合する、方法をさらに提供する。

いくつかの実施形態において、ヌクレアーゼは、ＲｕｖＣドメイン又は分断ＲｕｖＣドメインを含む。

ある実施形態において、ヌクレアーゼは、触媒残基（例えばアスパラギン酸又はグルタミン酸）を含む。

いくつかの実施形態において、ヌクレアーゼは、以下の配列の一つ以上を含む：
（ａ）Ｘ_１Ｘ_２Ｘ_３Ｘ_４ＧＸ_５Ｘ_６（配列番号２３３）（式中、Ｘ_１はＶ又はＡ又はＣであり、Ｘ_２はＹ又はＦであり、Ｘ_３はＫ又はＱであり、Ｘ_４はＹ又はＦであり、Ｘ_５はＬ又はＡ又はＭ又はＣ又はＴであり、Ｘ_６はＩ又はＶ又はＬである）；
（ｂ）ＬＸ_１ＮＸ_２ＬＶ（配列番号２３４）（式中、Ｘ_１はＷ又はＫ又はＲであり、Ｘ_２はＮ又はＴ又はＫ又はＳ又はＤ又はＱである）；
（ｃ）ＦＤＸ_１Ｘ_２Ｇ（配列番号２３５）（式中、Ｘ_１はＧ又はＹであり、Ｘ_２はＴ又はＳ又はＭである）；
（ｄ）Ｘ_１Ｘ_２ＨＲＸ_３Ｘ_４Ｐ（配列番号２３６）（式中、Ｘ_１はＩ又はＬ又はＶであり、Ｘ_２はＹ又はＬ又はＭ又はＦであり、Ｘ_３はＰ又はＨ又はＤ又はＥであり、Ｘ_４はＬ又はＩ又はＶ又はＭである）；
（ｅ）ＧＸ_１ＤＸ_２ＧＸ_３Ｒ（配列番号２３７）（式中、Ｘ_１はＩ又はＬ又はＶであり、Ｘ_２はＩ又はＶ又はＬであり、Ｘ_３はＦ又はＹである）；
（ｆ）ＲＸ_１Ｘ_２Ｘ_３ＹＲ（配列番号２３８）（式中、Ｘ_１はＫ又はＱ又はＥであり、Ｘ_２はＨ又はＤ又はＥであり、Ｘ_３はＦ又はＶ又はＬ又はＩである）；及び
（ｇ）Ｘ_１ＤＸ_２ＤＸ_３ＮＡＡＸ_４Ｎ（配列番号２３９）（式中、Ｘ_１はＨ又はＹであり、Ｘ_２はＲ又はＱ又はＶであり、Ｘ_３はＥ又はＴ又はＩ又はＨ又はＫ又はＱ又はＤであり、Ｘ_４はＮ又はＲ又はＩ又はＶ又はＫである）。

ある実施形態において、ヌクレアーゼは、配列番号２に対して少なくとも９５％の同一性を有するアミノ酸配列を含む。

いくつかの実施形態において、ヌクレアーゼは、配列番号２において記載されるアミノ酸配列を含む。

ある実施形態において、組成物は、ｔｒａｃｒＲＮＡを含まない。

いくつかの実施形態において、ダイレクトリピート配列は、以下の配列の一つ以上を含む：
（ａ）Ｘ_１Ｘ_２ＣＣＣＴＸ_３（配列番号２４０）（式中、Ｘ_１はＧ又はＡであり、Ｘ_２はＡ又はＣであり、Ｘ_３はＧ又はＡである）；及び
（ｂ）Ｘ_１ＧＧＧＸ_２Ｘ_３Ｘ_４Ｘ_５Ｘ_６Ａ（配列番号２４１）（式中、Ｘ_１はＴ又はＧであり、Ｘ_２はＴ又はＧであり、Ｘ_３はＴ又はＧであり、Ｘ_４はＡ又はＧであり、Ｘ_５はＴ又はＡであり、Ｘ_６はＡ又はＧ又はＣである）。

ある実施形態において、ダイレクトリピート配列は、配列番号４０又は配列番号４１に対して少なくとも９５％の配列同一性を有するヌクレオチド配列を含む。ある実施形態において、ダイレクトリピート配列は、配列番号４０又は配列番号４１において記載されるヌクレオチド配列を含む。いくつかの実施形態において、ダイレクトリピート配列は、配列番号１１１又は配列番号２４３に対して少なくとも９５％の配列同一性を有するヌクレオチド配列を含む。いくつかの実施形態において、ダイレクトリピート配列は、配列番号１１１又は２４３において記載されるヌクレオチド配列を含む。

ある実施形態において、スペーサー配列は、長さが１５～２４の間のヌクレオチドを含む。いくつかの実施形態において、スペーサー配列は、長さが約１９又は２０のヌクレオチドを含む。

いくつかの実施形態において、標的核酸は、スペーサー配列中のヌクレオチド配列に対して相補的な配列を含む。

ある実施形態において、標的核酸は、ＰＡＭ配列に隣接しており、ここで、ＰＡＭ配列は、５’－ＣＮ－３’、５’－ＣＣＮ－３’、５’－ＮＣＮ－３’、５’－ＮＣＣＮ－３’、又は５’－ＮＮＣＮ－３’として記載されるヌクレオチド配列を含み、式中、「Ｎ」は任意の核酸塩基である。いくつかの実施形態において、ＰＡＭ配列は、５’－ＡＣＣＮ－３’、５’－ＤＣＣＮ－３’、５’－ＤＴＴＮ－３’、５’－ＤＹＹＮ－３’、５’－ＧＣＣＮ－３’、５’－ＧＴＴＮ－３’、５’－ＧＹＹＮ－３’、５’－ＨＣＮ－３’、５’－ＨＮＣＮ－３’、５’－ＨＮＣＲ－３’、５’－ＨＮＣＶ－３’、５’－ＲＣＣＮ－３’、５’－ＲＣＣＲ－３’、５’－ＲＹＣＮ－３’、５’－ＴＮＣＮ－３’として記載されるヌクレオチド配列を含み、式中、「Ｄ」はＡ又はＧ又はＴであり、「Ｈ」はＡ又はＣ又はＴであり、「Ｎ」は任意の核酸塩基であり、「Ｒ」はＡ又はＧであり、「Ｖ」はＡ又はＣ又はＧであり、「Ｙ」はＣ又はＴである。ある実施形態において、ＰＡＭ配列は、５’－ＣＣＡ－３’、５’－ＣＣＣ－３’、５’－ＣＣＴ－３’、５’－ＣＣＧ－３’、５’－ＡＣＣＧ－３’、５’－ＣＣＣＡ－３’、５’－ＣＣＣＧ－３’、５’－ＴＣＣＡ－３’、又は５’－ＴＣＣＴ－３’として記載されるヌクレオチド配列を含む。

いくつかの実施形態において、ヌクレアーゼは、標的核酸を切断する。

ある実施形態において、標的核酸は、一本鎖ＤＮＡ又は二本鎖ＤＮＡである。

いくつかの実施形態において、組成物は、基準組成物よりも少なくとも１０％大きな酵素活性、例えば、基準組成物のヌクレアーゼ活性よりも少なくとも１０％大きなヌクレアーゼ活性を含む。

ある実施形態において、ヌクレアーゼは、ペプチドタグ、蛍光タンパク質、塩基編集ドメイン、ＤＮＡメチル化ドメイン、ヒストン残基修飾ドメイン、局在化因子、転写修飾因子、光作動性制御因子、化学的誘導性因子、又はクロマチン可視化因子をさらに含む。

いくつかの実施形態において、ヌクレアーゼをコードする核酸は、細胞における発現のためにコドン最適化される。

いくつかの実施形態において、ヌクレアーゼをコードする核酸は、プロモーターに作動可能に連結される。

ある実施形態において、ヌクレアーゼをコードする核酸は、ベクター中にある。ある実施形態において、ベクターは、レトロウイルスベクター、レンチウイルスベクター、ファージベクター、アデノウイルスベクター、アデノ随伴ベクター、又は単純ヘルペスベクターを含む。

いくつかの実施形態において、組成物は、ナノ粒子、リポソーム、エキソソーム、微小胞、又は遺伝子銃を含む送達媒体中に存在する。

一態様において、本開示は、本明細書において記載される態様又は実施形態のいずれかの組成物を含む細胞を提供する。いくつかの実施形態において、細胞は、真核細胞又は原核細胞である。ある実施形態において、細胞は、哺乳類細胞又は植物細胞である。いくつかの実施形態において、細胞は、ヒト細胞である。

別の態様において、本開示は、本明細書において記載される態様又は実施形態のいずれか１つの組成物を細胞内の標的核酸に結合させる方法であって、
（ａ）組成物を提供すること及び
（ｂ）組成物を細胞に送達すること
を含み、細胞は、標的核酸を含み、ヌクレアーゼは、ＲＮＡガイドに結合し、及びスペーサー配列は、標的核酸に結合する、方法を提供する。

定義
本発明は、特定の実施形態に関して、ある特定の図を参照して記載されるが、本発明は、それらに限定されず、請求項によってのみ限定される。以下に記載される用語は、概して、特に明記しない限り、それらの一般的な意味で理解される。

本明細書において使用されるように、用語「触媒残基」は、触媒作用を活性化するアミノ酸を指す。触媒残基は、触媒作用に関与する（例えば直接関与する）アミノ酸である。

本明細書において使用されるように、用語「ドメイン」及び「タンパク質ドメイン」は、ポリペプチドの明確な機能的及び／又は構造的単位を指す。いくつかの実施形態において、ドメインは、保存アミノ酸配列を含んでいてもよい。本明細書において使用されるように、用語「ＲｕｖＣドメイン」は、ヌクレアーゼ（例えばエンドヌクレアーゼ）活性を有するアミノ酸の保存ドメイン又はモチーフを指す。本明細書において使用されるように、分断ＲｕｖＣドメインを有するタンパク質は、配列内で配列として離れた部位にあり、三次構造において相互作用し、ＲｕｖＣドメインを形成する、二つ以上のＲｕｖＣモチーフを有するタンパク質を指す。

本明細書において使用されるように、用語「エフェクター活性」は、生物学的活性を指す。いくつかの実施形態において、エフェクター活性は、酵素活性、例えば、エフェクターの触媒能力を含む。例えば、エフェクター活性は、ヌクレアーゼ活性を含むことができる。

本明細書において使用されるように、用語「ヌクレアーゼ」は、ホスホジエステル結合を切断することが可能な酵素を指す。ヌクレアーゼは、核酸骨格中のホスホジエステル結合を加水分解する。本明細書において使用されるように、用語「エンドヌクレアーゼ」は、ヌクレオチド間のホスホジエステル結合を切断することが可能な酵素を指す。

本明細書において使用されるように、用語「親」、「親ポリペプチド」、及び「親配列」は、本発明の変異ポリペプチドを産生するために改変がなされる元のポリペプチド（例えば、開始ポリペプチド）を指す。いくつかの実施形態において、親は、一つ以上の指定される位置に、変異体と同一のアミノ酸配列を有するエフェクターである。親は、天然に存在する（野生型）ポリペプチドであってもよい。特定の実施形態において、親は、配列番号１～３７及び配列番号２２１～２２４のいずれか１つのポリペプチドに対して少なくとも６０％、少なくとも６１％、少なくとも６２％、少なくとも６３％、少なくとも６４％、少なくとも６５％、少なくとも７０％、少なくとも７２％、少なくとも７３％、少なくとも７４％、少なくとも７５％、少なくとも８０％、少なくとも８１％、少なくとも８２％、少なくとも８３％、少なくとも８４％、少なくとも８５％、少なくとも９０％、少なくとも９１％、少なくとも９２％、少なくとも９３％、少なくとも９４％、少なくとも９５％、少なくとも９６％、少なくとも９７％、少なくとも９８％、少なくとも９９％、又は１００％の同一性を有するエフェクターである。

本明細書において使用されるように、用語「プロトスペーサー隣接モチーフ」又は「ＰＡＭ」は、エフェクター及びＲＮＡガイドを含む複合体が結合する標的配列に隣接するＤＮＡ配列を指す。いくつかの実施形態において、酵素活性にはＰＡＭが必要である。本明細書において使用されるように、用語「隣接」は、複合体のＲＮＡガイドが、ＰＡＭに直接隣接する標的配列と特異的に結合、相互作用、又は会合する場合を含む。そのような場合、標的配列とＰＡＭの間にヌクレオチドはない。用語「隣接する」はまた、ターゲティング成分が結合する標的配列とＰＡＭとの間に少数（例えば、１、２、３、４、又は５個）のヌクレオチドが存在する場合も含む。

本明細書において使用されるように、用語「基準組成物」、「基準配列」、及び「基準」は、ネガティブコントロールなどのコントロール又は親（例えば親配列、親タンパク質、野生型タンパク質、若しくは親配列を含む複合体）を指す。

本明細書において使用されるように、用語「ＲＮＡガイド」又は「ＲＮＡガイド配列」は、本明細書において記載されるポリペプチドの標的核酸へのターゲティングを容易にする任意のＲＮＡ分子を指す。例えば、ＲＮＡガイドは、標的核酸を認識する（例えば、それに結合する）分子とすることができる。ＲＮＡガイドは、特異的な核酸配列に対して相補的となるように設計されてもよい。ＲＮＡガイドは、ＤＮＡターゲティング配列及びダイレクトリピート（ＤＲ）配列を含む。用語ＣＲＩＳＰＲＲＮＡ（ｃｒＲＮＡ）、ｐｒｅ－ｃｒＲＮＡ、成熟ｃｒＲＮＡ、及びｇＲＮＡもまた、ＲＮＡガイドを指すために本明細書において使用される。本明細書において使用されるように、用語「ｐｒｅ－ｃｒＲＮＡ」は、ＤＲ－スペーサー－ＤＲ配列を含むプロセシングされていないＲＮＡ分子を指す。本明細書において使用されるように、用語「成熟ｃｒＲＮＡ」は、プロセシングされた形態のｐｒｅ－ｃｒＲＮＡを指し；成熟ｃｒＲＮＡは、ＤＲスペーサー配列を含んでもよく、ここで、ＤＲは、ｐｒｅ－ｃｒＲＮＡのＤＲの切断型であり、且つ／又はスペーサーは、ｐｒｅ－ｃｒＲＮＡのスペーサーの切断型である。

本明細書において使用されるように、用語「ターゲティング成分」は、別の分子又は構成要素の標的核酸へのターゲティングを容易にする分子又は構成要素（例えば、核酸及び／又はＲＮＡガイド）を指す。いくつかの実施形態において、ターゲティング成分は、標的核酸と特異的に相互作用又は会合する。

本明細書において使用されるように、用語「実質的に同一の」は、基準配列に対して一定の程度の同一性を有する配列、ポリヌクレオチド、又はポリペプチドを指す。

本明細書において使用されるように、用語「標的核酸」及び「標的配列」は、ターゲティング成分（例えば、ＲＮＡガイド）が特異的に結合する核酸配列を指す。いくつかの実施形態において、ＲＮＡガイドのＤＮＡターゲティング配列は、標的核酸に結合する。

本明細書において使用されるように、用語「トランス活性化ｃｒＲＮＡ」及び「ｔｒａｃｒＲＮＡ」は、ターゲティング成分（例えば、ＲＮＡガイド）の標的核酸への結合に関与する又は必要とされるＲＮＡ分子を指す。

本明細書において使用されるように、用語「バリアントポリペプチド」は、親ポリペプチドと比較して、１つ以上の残基位置に、改変、例えば置換、挿入、欠失及び／又は融合を含むポリペプチドを指す。

図１Ａ、図１Ｂ、図１Ｃ、図１Ｄ、図１Ｅ、図１Ｆ、図１Ｇ、図１Ｈ、図１Ｉ、図１Ｊ、図１Ｋ、及び図１Ｌは、配列番号１～３７及び配列番号２２１～２２４のエフェクターのアラインメントを集合的に示す。コンセンサス配列は、アラインメントの上に示される。同上。同上。同上。同上。同上。同上。同上。同上。同上。同上。同上。図２は、出現順に、それぞれ、配列番号２４３、２４３～２４５、２４３、２４６～２４８、２４３、２４９、２４９、２４９、２４７、２４３～２４４、及び２５０のダイレクトリピート配列のアラインメントを示す。コンセンサス配列は、アラインメントの上に示される。配列のＤＮＡバージョンが示され、対応するＲＮＡバージョンは典型的にＴｓの代わりにＵｓを含むであろうことが理解される。対応するＲＮＡバージョンは、本明細書において配列番号１１１～１２６として提供される。図３Ａは、実施例４のｄｓＤＮＡ標的切断実験のための標識ｄｓＤＮＡ基質の生成を示す概略図を示す図である。図３Ｂは、配列番号２のエフェクター及び配列番号２０２の成熟ｃｒＲＮＡを含むリボ核タンパク質（ＲＮＰ）によって誘導される標的Ａ（配列番号２０１）のスペーサー相補鎖の切断を示すＴＢＥ－尿素変性ゲルである。図３Ｃは、配列番号２のエフェクター及び配列番号２０２の成熟ｃｒＲＮＡを含むＲＮＰによって誘導される標的Ａ（配列番号２０１）の非スペーサー相補鎖の切断を示すＴＢＥ－尿素変性ゲルである。図３Ｄは、標的Ａに対し相補性を有するように設計された、配列番号２のエフェクター及び成熟ｃｒＲＮＡを含むＲＮＰを使用して、非標的Ｂ（配列番号２０４）のトップ鎖において切断が観察されないことを示すコントロールＴＢＥ－尿素変性ゲルである。図３Ｅは、標的Ａに対し相補性を有するように設計された、配列番号２のエフェクター及び成熟ｃｒＲＮＡを含むＲＮＰを使用して、非標的Ｂ（配列番号２０４）のボトム鎖において切断が観察されないことを示すコントロールＴＢＥ－尿素変性ゲルである。図４Ａは、実施例５のｓｓＤＮＡ標的切断実験のための標識ｓｓＤＮＡ基質の生成を示す概略図を示す図である。図４Ｂは、配列番号２のエフェクター及び配列番号２０２の成熟ｃｒＲＮＡを含むＲＮＰによる一本鎖標的Ａ（配列番号２０１）の切断を示すＴＢＥ－尿素変性ゲルである。図４Ｃは、標的Ａに対し相補性を有するように設計された、配列番号２のエフェクター及び成熟ｃｒＲＮＡを含むＲＮＰを使用して、一本鎖の非標的Ｂ（配列番号２０４）において切断が観察されないことを示すコントロールＴＢＥ－尿素変性ゲルである。図５Ａは、配列番号２のエフェクターの活性を測定するための、実施例６において記載される蛍光枯渇アッセイの概略図である。図５Ｂは、標的１（配列番号２０８）、標的２（配列番号２１０）、標的３（配列番号２１２）、標的４（配列番号２１４）、及び標的５（配列番号２１６）に対する配列番号２のエフェクターのＧＦＰ枯渇比（非標的／標的）のプロットを示す。図５Ｂにおける枯渇率の値は、１２時間にわたって得られた測定値から計算された。図６は、ＨＥＫ２９３細胞におけるＡＡＶＳ１標的遺伝子座（配列番号２１８）で配列番号２のエフェクターによって誘導されたインデルを示す。

本開示は、新規なヌクレアーゼ及びその使用のための方法に関する。いくつかの態様において、一つ以上の特性を有する本発明のヌクレアーゼを含む組成物が、本明細書において記載される。いくつかの態様において、本発明のヌクレアーゼを産生するための方法が、記載される。いくつかの態様において、本発明のヌクレアーゼを含む組成物を送達するための方法が、記載される。

組成物
いくつかの態様において、本明細書において記載される本発明は、ヌクレアーゼを含む組成物を含む。いくつかの実施形態において、本発明の組成物は、ヌクレアーゼを含み、組成物は、ヌクレアーゼ活性を有する。いくつかの態様において、本明細書において記載される本発明は、ヌクレアーゼ及びターゲティング成分を含む組成物を含む。いくつかの実施形態において、本発明の組成物は、ヌクレアーゼ及びＲＮＡガイド配列を含み、ＲＮＡガイド配列は、ヌクレアーゼ活性を部位特異的な標的に導く。いくつかの実施形態において、本発明の組成物のヌクレアーゼは、組換えヌクレアーゼである。

いくつかの実施形態において、本明細書において記載される組成物は、ＲＮＡ誘導型ヌクレアーゼを含む（例えば、複数の構成要素を含むヌクレアーゼ）。いくつかの実施形態において、本発明のヌクレアーゼは、酵素活性を含む（例えば、タンパク質は、ＲｕｖＣドメイン又は分断ＲｕｖＣドメインを含む）。いくつかの実施形態において、組成物は、ターゲティング成分（例えばＲＮＡガイド）を含む。いくつかの実施形態において、組成物は、ヌクレアーゼ及びターゲティング成分（例えばＲＮＡガイド）を含むリボ核タンパク質（ＲＮＰ）を含む。

ヌクレアーゼ
いくつかの実施形態において、本発明の組成物は、本明細書において記載されるエフェクター（例えばヌクレアーゼ）を含む。

本明細書において記載されるヌクレアーゼをコードする核酸配列は、ヌクレアーゼをコードする核酸が、基準核酸配列に対して、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％、又は少なくとも約９９．５％の配列同一性を有する配列を含む場合、基準核酸配列と実質的に同一であってもよい。このような２つの核酸の間の同一性パーセントは、２つの最適にアラインメントされた核酸配列の目視検査によって手作業で又は標準的なパラメーターを使用するソフトウェアプログラム若しくはアルゴリズム（例えばＢＬＡＳＴ、ＡＬＩＧＮ、ＣＬＵＳＴＡＬ）を使用することによって決定することができる。２つの核酸配列が実質的に同一であるという１つの目安は、２つの核酸分子がストリンジェントな（例えば、中～高ストリンジェンシーの範囲内の）条件下で互いにハイブリダイズするといったものである。

いくつかの実施形態において、本明細書において記載されるヌクレアーゼは、基準核酸配列に対して、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％、又は少なくとも約９９．５％の配列同一性を有する核酸配列によってコードされる。

本明細書において記載されるヌクレアーゼは、ヌクレアーゼが、基準ポリペプチドのアミノ酸配列に対して、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％、又は少なくとも約９９．５％の配列同一性を有するアミノ酸配列を含む場合、基準ポリペプチドと実質的に同一であってもよい。このような２つのポリペプチドの間の同一性パーセントは、２つの最適にアラインメントされたポリペプチド配列の目視検査によって手作業で又は標準的なパラメーターを使用するソフトウェアプログラム若しくはアルゴリズム（例えばＢＬＡＳＴ、ＡＬＩＧＮ、ＣＬＵＳＴＡＬ）を使用することによって決定することができる。２つのポリペプチドが実質的に同一であるという１つの目安は、第１のポリペプチドが第２のポリペプチドと免疫学的に交差反応性であるといったものである。典型的に、保存的アミノ酸の置換によって異なるポリペプチドは、免疫学的に交差反応性である。ゆえに、例えば、２つのペプチドが、保存的アミノ酸の置換又は一つ以上の保存的アミノ酸の置換によってのみ異なる場合、ポリペプチドは、第２のポリペプチドと実質的に同一である。

いくつかの実施形態において、本発明のヌクレアーゼは、配列番号１～３７及び配列番号２２１～２２４のいずれか１つに対して５０、６０、６５、７０、７５、８０、８５、９０、９１、９２、９３、９４、９５、９６、９７、９８、９９、又は１００％の同一性を有するポリペプチド配列を含む。いくつかの実施形態において、本発明のヌクレアーゼは、配列番号１～３７及び配列番号２２１～２２４のいずれか１つに対して５０、６０、６５、７０、７５、８０、８５、９０、９１、９２、９３、９４、９５、９６、９７、９８、９９を超える、又は１００％の同一性を有するポリペプチド配列を含む。配列番号１～３７及び配列番号２２１～２２４に対応するアミノ酸配列を表１に示す。図１Ａ～１Ｌのアラインメントにおいて示されるように、本明細書において記載されるヌクレアーゼのファミリーは、配列類似性を有する領域を含む。

いくつかの実施形態において、本発明のヌクレアーゼは、一つ以上の基準ポリペプチドに対して、指定される程度のアミノ酸配列同一性、例えば、配列番号１～３７及び配列番号２２１～２２４のいずれか１つのアミノ酸配列に対して、少なくとも６０％、少なくとも６５％、少なくとも７０％、少なくとも７５％、少なくとも８０％、少なくとも８５％、少なくとも９０％、少なくとも９１％、少なくとも９２％、少なくとも９３％、少なくとも９４％、少なくとも９５％、少なくとも９６％、少なくとも９７％、少なくとも９８％、又はさらに少なくとも９９％の配列同一性を有するヌクレアーゼである。相同性又は同一性は、例えば、本明細書において記載されるように、ＢＬＡＳＴ、ＡＬＩＧＮ、又はＣＬＵＳＴＡＬなどのプログラムを使用して、アミノ酸配列アラインメントによって決定することができる。いくつかの実施形態において、１つ以上の基準ポリペプチドに対して、指定される程度のアミノ酸配列同一性を有するヌクレアーゼは、１つ以上の基準ポリペプチドとして、１つ以上の特徴、例えば、ヌクレアーゼ活性を保持する。

いくつかの実施形態において、本発明のヌクレアーゼは、基準アミノ酸配列に対して、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％、又は少なくとも約９９．５％の配列同一性を有するアミノ酸配列を有するタンパク質を含む。いくつかの実施形態において、１つ以上の基準ポリペプチドに対して、指定される程度のアミノ酸配列同一性を有するヌクレアーゼは、基準アミノ酸配列として、１つ以上の特徴、例えば、ヌクレアーゼ活性を保持する。

酵素活性、例えばヌクレアーゼ活性を有し且つ前に記載されたアラインメント方法のいずれかを使用してアラインメントされた場合に、５０以下、４０以下、３５以下、３０以下、２５以下、２０以下、１９以下、１８以下、１７以下、１６以下、１５以下、１４以下、１３以下、１２以下、１１以下、１０以下、９以下、８以下、７以下、６以下、５以下、４以下、３以下、２以下、又は１以下のアミノ酸残基が、配列番号１～３７及び配列番号２２１～２２４のいずれか１つのいずれか１つのアミノ酸配列と異なるアミノ酸配列を含む本発明のヌクレアーゼもまた、提供される。

いくつかの実施形態において、本発明のヌクレアーゼは、ＲｕｖＣドメインを含む。いくつかの実施形態において、本発明のヌクレアーゼは、分断ＲｕｖＣドメイン又は二つ以上の部分的なＲｕｖＣドメインを含む。例えば、ヌクレアーゼは、ヌクレアーゼの一次アミノ酸配列に関して連続していないが、一度タンパク質がフォールドするとＲｕｖＣドメインを形成するＲｕｖＣモチーフを含む。いくつかの実施形態において、ＲｕｖＣモチーフの触媒残基は、グルタミン酸残基及び／又はアスパラギン酸残基である。例えば、配列番号２のヌクレアーゼは、次の触媒残基を含む：Ｄ２８０、Ｅ４３９、Ｄ５６０。例えば、実施例１を参照されたい。

いくつかの実施形態において、本発明は、ＲｕｖＣドメインを含む単離、組換え、実質的に純粋な、又は天然に存在しないヌクレアーゼを含み、ここで、ヌクレアーゼは、酵素活性、例えばヌクレアーゼ活性を有し、ヌクレアーゼは、配列番号１～３７及び配列番号２２１～２２４のいずれか１つに対して、少なくとも約６０％、６５％、７０％、７５％、８０％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、又は１００％の配列同一性を有するアミノ酸配列を含む。

いくつかの実施形態において、本明細書において記載されるヌクレアーゼは、図１Ａ～１Ｌに示されるコンセンサス配列を含む。いくつかの実施形態において、本明細書において記載されるヌクレアーゼは、図１Ａ～１Ｌにおいて示されるコンセンサス配列の一部、例えば、図１Ａ～１Ｌのいずれか１つの保存配列を含む。例えば、いくつかの実施形態において、ヌクレアーゼは、Ｘ_１Ｘ_２Ｘ_３Ｘ_４ＧＸ_５Ｘ_６（配列番号２３３）として記載される配列を含み、式中、Ｘ_１はＶ又はＡ又はＣであり、Ｘ_２はＹ又はＦであり、Ｘ_３はＫ又はＱであり、Ｘ_４はＹ又はＦであり、Ｘ_５はＬ又はＡ又はＭ又はＣ又はＴであり、Ｘ_６はＩ又はＶ又はＬである。いくつかの実施形態において、配列番号２３３において記載される配列は、Ｎ末端配列である。いくつかの実施形態において、ヌクレアーゼは、ＬＸ_１ＮＸ_２ＬＶ（配列番号２３４）として記載される配列を含み、式中、Ｘ_１はＷ又はＫ又はＲであり、Ｘ_２はＮ又はＴ又はＫ又はＳ又はＤ又はＱである。いくつかの実施形態において、配列番号２３４として記載される配列は、Ｎ末端配列である。いくつかの実施形態において、ヌクレアーゼは、ＦＤＸ_１Ｘ_２Ｇ（配列番号２３５）として記載される配列を含み、式中、Ｘ_１はＧ又はＹであり、Ｘ_２はＴ又はＳ又はＭである。いくつかの実施形態において、配列番号２３５として記載される配列は、Ｎ末端配列である。いくつかの実施形態において、ヌクレアーゼは、Ｘ_１Ｘ_２ＨＲＸ_３Ｘ_４Ｐ（配列番号２３６）として記載される配列を含み、式中、Ｘ_１はＩ又はＬ又はＶであり、Ｘ_２はＹ又はＬ又はＭ又はＦであり、Ｘ_３はＰ又はＨ又はＤ又はＥであり、Ｘ_４はＬ又はＩ又はＶ又はＭである。いくつかの実施形態において、ヌクレアーゼは、ＧＸ_１ＤＸ_２ＧＸ_３Ｒ（配列番号２３７）として記載される配列を含み、式中、Ｘ_１はＩ又はＬ又はＶであり、Ｘ_２はＩ又はＶ又はＬであり、Ｘ_３はＦ又はＹである。いくつかの実施形態において、ヌクレアーゼは、ＲＸ_１Ｘ_２Ｘ_３ＹＲ（配列番号２３８）として記載される配列を含み、式中、Ｘ_１はＫ又はＱ又はＥであり、Ｘ_２はＨ又はＤ又はＥであり、Ｘ_３はＦ又はＶ又はＬ又はＩである。いくつかの実施形態において、配列番号２３８として記載される配列は、Ｃ末端配列である。いくつかの実施形態において、ヌクレアーゼは、Ｘ_１ＤＸ_２ＤＸ_３ＮＡＡＸ_４Ｎ（配列番号２３９）として記載される配列を含み、式中、Ｘ_１はＨ又はＹであり、Ｘ_２はＲ又はＱ又はＶであり、Ｘ_３はＥ又はＴ又はＩ又はＨ又はＫ又はＱ又はＤであり、Ｘ_４はＮ又はＲ又はＩ又はＶ又はＫである。いくつかの実施形態において、配列番号２３９として記載される配列は、Ｃ末端配列である。

いくつかの実施形態において、本明細書において記載されるヌクレアーゼは、配列番号１～３７及び配列番号２２１～２２４のいずれか１つの配列に対する挿入を含む。いくつかの実施形態において、挿入は、１残基～約１０残基の長さ（例えば、１、２、３、４、５、６、７、８、９、又は１０残基）を含む。いくつかの実施形態において、挿入は、グリシン、セリン、アスパラギン酸、又はアスパラギン残基の一つ以上を含む。いくつかの実施形態において、挿入は、１残基挿入（例えば、１つのグリシン、１つのセリン、１つのアスパラギン酸塩、又は１つのアスパラギン）を含む。いくつかの実施形態において、挿入は、２残基挿入（例えば、２つのグリシン、２つのセリン、２つのアスパラギン酸塩、又は２つのアスパラギン）を含む。いくつかの実施形態において、挿入は、少なくとも１つのグリシンを含む２残基挿入を含む。いくつかの実施形態において、挿入は、３残基挿入（例えば、３つのグリシン、３つのセリン、３つのアスパラギン酸塩、又は３つのアスパラギン）を含む。いくつかの実施形態において、挿入は、少なくとも１つのグリシンを含む３残基挿入を含む。いくつかの実施形態において、挿入は、４残基挿入（例えば、４つのグリシン、４つのセリン、４つのアスパラギン酸塩、又は４つのアスパラギン）を含む。いくつかの実施形態において、挿入は、少なくとも１つのグリシンを含む４残基挿入を含む。いくつかの実施形態において、挿入は、５残基挿入（例えば、５つのグリシン、５つのセリン、５つのアスパラギン酸塩、又は５つのアスパラギン）を含む。いくつかの実施形態において、挿入は、少なくとも１つのグリシンを含む５残基挿入を含む。いくつかの実施形態において、本明細書において記載されるヌクレアーゼは、配列番号１～３７及び配列番号２２１～２２４のいずれか１つの配列に対する、グリシン－グリシン、セリン－セリン、アスパラギン酸－アスパラギン酸、アスパラギン－アスパラギン、グリシン－セリン、グリシン－アスパラギン酸、グリシン－アスパラギン、セリン－グリシン、アスパラギン酸－グリシン、又はアスパラギン－グリシン挿入を含む。

生化学的特性
いくつかの実施形態において、本明細書において記載されるヌクレアーゼの生化学的特徴は、一つ以上のアッセイを使用して分析される。いくつかの実施形態において、本発明のヌクレアーゼの生化学的特徴は、実施例４及び５において記載されるように、ＲＮＡガイド（例えば、成熟ｃｒＲＮＡ）と共にインキュベートされた精製ヌクレアーゼ及び標的ＤＮＡ分子を使用してインビトロにおいて分析される。いくつかの実施形態において、本発明のヌクレアーゼの生化学的特徴は、実施例６において記載されるように、蛍光枯渇アッセイを使用してインビトロで分析される。いくつかの実施形態において、本発明のヌクレアーゼの生化学的特徴は、実施例７において記載されるように、哺乳類細胞において分析される。

本発明のヌクレアーゼに関する組成物及び方法が、本明細書において記載される。組成物及び方法は、本発明のクローニングし、発現させたエフェクターが、ヌクレアーゼ活性を有するといった観察に部分的に基づく。

いくつかの実施形態において、本明細書において記載されるヌクレアーゼ及びＲＮＡガイドは、複合体（例えばＲＮＰ）を形成する。いくつかの実施形態において、複合体は、他の構成要素を含む。いくつかの実施形態において、複合体は、ＲＮＡガイドにおけるスペーサー配列に相補性を有する核酸基質（例えば標的核酸）への結合に際して活性化される。いくつかの実施形態において、標的核酸は、二本鎖ＤＮＡ（ｄｓＤＮＡ）である。いくつかの実施形態において、標的核酸は、一本鎖ＤＮＡ（ｓｓＤＮＡ）である。いくつかの実施形態において、標的核酸は、一本鎖ＲＮＡ（ｓｓＲＮＡ）である。いくつかの実施形態において、標的核酸は、二本鎖ＲＮＡ（ｄｓＲＮＡ）である。いくつかの実施形態において、配列特異性は、標的基質に対するＲＮＡガイドにおけるスペーサー配列の完全なマッチを必要とする。他の実施形態において、配列特異性は、標的基質に対するＲＮＡガイドにおけるスペーサー配列の部分的な（連続した又は非連続の）マッチを必要とする。

いくつかの実施形態において、複合体は、標的基質への結合に際して活性化される。いくつかの実施形態において、活性化複合体は、「マルチプルターンオーバー」活性を呈し、それによって、標的核酸に対する作用（例えば切断）に際して、活性化複合体は、活性化状態のまま残る。いくつかの実施形態において、活性化複合体は、「シングルターンオーバー」活性を呈し、それによって、標的核酸に対する作用に際して、複合体は、不活性状態に戻る。

いくつかの実施形態において、本明細書において記載されるヌクレアーゼは、ＲＮＡガイドと標的核酸との間の相補性の領域によって定められる配列で、標的核酸に結合する。いくつかの実施形態において、本明細書において記載されるヌクレアーゼのＰＡＭ配列は、標的核酸の標的配列のすぐ上流に（例えば、標的配列のすぐ５’側に）位置する。いくつかの実施形態において、本明細書において記載されるヌクレアーゼのＰＡＭ配列は、標的核酸の非相補鎖（例えば非標的鎖）のすぐ５’側に位置する。本明細書において使用されるように、「相補鎖」は、ＲＮＡガイドにハイブリダイズする。本明細書において使用されるように、「非相補鎖」は、ＲＮＡに直接ハイブリダイズしない。

いくつかの実施形態において、本発明のヌクレアーゼは、ＰＡＭに隣接する配列を標的とし、ここで、ＰＡＭは、５’－ＣＮ－３’、５’－ＣＣＮ－３’、５’－ＮＣＮ－３’、５’－ＮＣＣＮ－３’、又は５’－ＮＮＣＮ－３’として記載されるヌクレオチド配列を含み、式中、「Ｎ」は、任意の核酸塩基である。例えば、いくつかの実施形態において、配列番号２のヌクレアーゼは、５’－ＣＣＮ－３’（例えば、５’－ＣＣＡ－３’）又は５’－ＮＣＣＮ－３’のＰＡＭ配列を認識する。いくつかの実施形態において、本発明のヌクレアーゼは、ＰＡＭに隣接する配列を標的とし、ここで、ＰＡＭは、表２において記載されるヌクレオチド配列を含み、式中、「Ｄ」はＡ又はＧ又はＴであり、「Ｈ」はＡ又はＣ又はＴであり、「Ｎ」は任意の核酸塩基であり、「Ｒ」はＡ又はＧであり、「Ｖ」はＡ又はＣ又はＧであり、「Ｙ」はＣ又はＴである。いくつかの実施形態において、本発明のヌクレアーゼ（例えば、配列番号２のヌクレアーゼ）は、ＰＡＭ配列に隣接する配列を標的とし、ここで、ＰＡＭは、５’－ＣＣＡ－３’、５’－ＣＣＣ－３’、５’－ＣＣＴ－３’、５’－ＣＣＧ－３’、５’－ＡＣＣＧ－３’、５’－ＣＣＣＡ－３’、５’－ＣＣＣＧ－３’、５’－ＴＣＣＡ－３’、又は５’－ＴＣＣＴ－３’として記載されるヌクレオチド配列を含む。

いくつかの実施形態において、本明細書において記載されるヌクレアーゼは、ｓｓＤＮＡを切断する。いくつかの実施形態において、本明細書において記載されるヌクレアーゼは、ｄｓＤＮＡを切断する。いくつかの実施形態において、本明細書において記載されるヌクレアーゼは、ニッカーゼである（例えば、ヌクレアーゼは、二本鎖の標的核酸の一方の鎖を切断する）。

いくつかの実施形態において、本発明のヌクレアーゼは、広範囲のｐＨ条件にわたって、酵素活性、例えばヌクレアーゼ活性を有する。いくつかの実施形態において、ヌクレアーゼは、約３．０～約１２．０のｐＨで、酵素活性、例えばヌクレアーゼ活性を有する。いくつかの実施形態において、ヌクレアーゼは、約４．０～約１０．５のｐＨで、酵素活性を有する。いくつかの実施形態において、ヌクレアーゼは、約５．５～約８．５のｐＨで、酵素活性を有する。いくつかの実施形態において、ヌクレアーゼは、約６．０～約８．０のｐＨで、酵素活性を有する。いくつかの実施形態において、ヌクレアーゼは、約７．０のｐＨで、酵素活性を有する。

いくつかの実施形態において、本発明のヌクレアーゼは、約１０℃～約１００℃の温度範囲で、酵素活性、例えばヌクレアーゼ活性を有する。いくつかの実施形態において、本発明のヌクレアーゼは、約２０℃～約９０℃の温度範囲で、酵素活性を有する。いくつかの実施形態において、本発明のヌクレアーゼは、約２０℃～約２５℃の温度で又は約３７℃の温度で、酵素活性を有する。

本発明のヌクレアーゼが標的核酸（例えば、ゲノムＤＮＡ）において二本鎖切断又は一本鎖切断を誘導するいくつかの実施形態において、二本鎖切断は、相同性指向組換え（ＨＤＲ）、非相同末端結合（ＮＨＥＪ）、又は代替非相同末端結合（Ａ－ＮＨＥＪ）を含む、細胞内因性ＤＮＡ修復経路を刺激することができる。ＮＨＥＪは、相同な鋳型を必要とせずに、切断された標的核酸を修復できる。これは、標的遺伝子座における１つ以上のヌクレオチドの欠失又は挿入をもたらすことができる。ＨＤＲは、ドナーＤＮＡなどの相同な鋳型で発生することができる。相同な鋳型は、標的核酸切断部位に隣接する配列に相同な配列を含むことができる。いくつかの場合において、ＨＤＲは、外因性ポリヌクレオチド配列を切断標的遺伝子座に挿入することができる。ＮＨＥＪ及び／又はＨＤＲによる標的ＤＮＡの修飾は、例えば、突然変異、欠失、改変、統合、遺伝子修正、遺伝子置換、遺伝子タグ付け、導入遺伝子ノックイン、遺伝子破壊、及び／又は遺伝子ノックアウトをもたらすことができる。

いくつかの実施形態において、細胞内の標的遺伝子座へのヌクレアーゼ／ＲＮＡガイド複合体の結合は、ＤＮＡ修復経路以外の１つ以上の内因性細胞分子又は経路を動員して、標的核酸を修飾する。いくつかの実施形態において、ヌクレアーゼ／ＲＮＡガイド複合体の結合は、標的核酸への１つ以上の内因性細胞分子又は経路のアクセスをブロックし、それによって、標的核酸を修飾する。例えば、ヌクレアーゼ／ＲＮＡガイド複合体の結合は、標的核酸の発現を減少させるために、内因性の転写又は翻訳機構をブロックしてもよい。

変異体
いくつかの実施形態において、本発明は、本明細書において記載されるヌクレアーゼの変異体を含む。いくつかの実施形態において、本明細書において記載されるヌクレアーゼは、一つ以上の機能的活性を修飾するために、一つ以上のアミノ酸残基で突然変異させることができる。例えば、いくつかの実施形態において、本発明のヌクレアーゼは、そのヌクレアーゼ活性（例えば切断活性）を修飾するために、一つ以上のアミノ酸残基で突然変異させる。例えば、いくつかの実施形態において、ヌクレアーゼは、ヌクレアーゼが標的核酸を切断する能力を増加させる一つ以上の突然変異を含んでいてもよい。いくつかの実施形態において、ヌクレアーゼは、ＲＮＡガイドと機能的に結びつくその能力を修飾するために、一つ以上のアミノ酸残基で突然変異させる。いくつかの実施形態において、ヌクレアーゼは、標的核酸と機能的に結びつくその能力を修飾するために、一つ以上のアミノ酸残基で突然変異させる。

いくつかの実施形態において、変異ヌクレアーゼは、保存的又は非保存的アミノ酸の置換、欠失、又は追加を有する。いくつかの実施形態において、変異ヌクレアーゼは、サイレント置換、欠失、若しくは追加又は保存的置換を有し、これらのどれも、本発明のポリペプチド活性を改変しない。保存的置換の典型的な例は、脂肪族アミノ酸Ａｌａ、Ｖａｌ、Ｌｅｕ、及びＩｌｅの中での交換、ヒドロキシル残基ＳｅｒとＴｈｒとの間での交換、酸性残基ＡｓｐとＧｌｕとの間での交換、アミド残基ＡｓｎとＧｌｎとの間での置換、塩基性残基ＬｙｓとＡｒｇとの間での交換、及び芳香族残基ＰｈｅとＴｙｒとの間での置換など、あるアミノ酸が、別のものに交換される置換を含む。いくつかの実施形態において、本明細書において開示されるヌクレアーゼの一つ以上の残基は、Ａｒｇ残基に突然変異させる。いくつかの実施形態において、本明細書において開示されるヌクレアーゼの一つ以上の残基は、Ｇｌｙ残基に突然変異させる。

本発明の変異ヌクレアーゼをコードする修飾ポリヌクレオチドを生成するのに適している種々の方法が、当技術分野において知られており、例えば、部位飽和突然変異誘発（ｓｉｔｅ－ｓａｔｕｒａｔｉｏｎｍｕｔａｇｅｎｅｓｉｓ）、系統的突然変異誘発（ｓｃａｎｎｉｎｇｍｕｔａｇｅｎｅｓｉｓ）、挿入突然変異誘発、欠失突然変異誘発、ランダム突然変異誘発、部位特異的突然変異誘発、及び指向性進化法並びに多様な他のリコンビナトリアル（ｒｅｃｏｍｂｉｎａｔｏｒｉａｌ）アプローチを含むが、これらに限定されない。修飾ポリヌクレオチド及びタンパク質（例えばヌクレアーゼ）を作製するための方法は、ＤＮＡシャフリング法、ＩＴＣＨＹ（Ｏｓｔｅｒｍｅｉｅｒｅｔａｌ．，７：２１３９－４４［１９９９］を参照されたい）、ＳＣＲＡＣＨＹ（Ｌｕｔｚｅｔａｌ．９８：１１２４８－５３［２００１］を参照されたい）、ＳＨＩＰＲＥＣ（Ｓｉｅｂｅｒｅｔａｌ．，１９：４５６－６０［２００１］を参照されたい）、及びＮＲＲ（Ｂｉｔｔｋｅｒｅｔａｌ．，２０：１０２４－９［２００１］；Ｂｉｔｔｋｅｒｅｔａｌ．，１０１：７０１１－６［２００４］を参照されたい）などの遺伝子の非相同組換えに基づく方法、並びにランダム及び標的突然変異、欠失、及び／又は挿入を挿入するためにオリゴヌクレオチドの使用に依存する方法（Ｎｅｓｓｅｔａｌ．，２０：１２５１－５［２００２］；Ｃｏｃｏｅｔａｌ．，２０：１２４６－５０［２００２］；Ｚｈａｅｔａｌ．，４：３４－９［２００３］；Ｇｌａｓｅｒｅｔａｌ．，１４９：３９０３－１３［１９９２］を参照されたい）を含む。

いくつかの実施形態において、本発明のヌクレアーゼは、ヌクレアーゼにおける一つ以上の（例えば数個の）アミノ酸での改変を含み、少なくとも１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、５１、５２、５３、５４、５５、５６、５７、５８、５９、６０、６１、６２、６３、６４、６５、６６、６７、６８、６９、７０、７１、７２、７３、７４、７５、７６、７７、７８、７９、８０、８１、８２、８３、８４、８５、８６、８７、８８、８９、９０、９１、９２、９３、９４、９５、９６、９７、９８、９９、１００、１０１、１０２、１０３、１０４、１０５、１０６、１０７、１０８、１０９、１１０、１１１、１１２、１１３、１１４、１１５、１１６、１１７、１１８、１１９、１２０、１２１、１２２、１２３、１２４、１２５、１２６、１２７、１２８、１２９、１３０、１３１、１３２、１３３、１３４、１３５、１３６、１３７、１３８、１３９、１４０、１４１、１４２、１４３、１４４、１４５、１４６、１４７、１４８、１４９、１５０、１５１、１５２、１５３、１５４、１５５、１５６、１５７、１５８、１５９、１６０、１６１、１６２、１６２、１６４、１６４、１６５、１６６、１６７、１６８、１６９、１７０、１７１、１７２、１７３、１７４、１７５、１７６、１７７、１７８、１７９、１８０、１８１、１８２、１８３、１８４、１８５、１８６、１８７、１８８、１８９、１９０、１９１、１９３、１９４、１９５、１９６、１９７、１９８、１９９、２００、又はそれ以上である。

本明細書において使用されるように、「生物学的活性部分」は、ヌクレアーゼの機能を維持する（例えば、完全に、部分的に、最小限に）部分である（例えば、「最小限の」又は「コア」ドメイン）。いくつかの実施形態において、ヌクレアーゼ融合タンパク質は、本明細書において記載される方法において有用である。したがって、いくつかの実施形態において、融合ヌクレアーゼをコードする核酸は、本明細書において記載される。いくつかの実施形態において、ヌクレアーゼ融合タンパク質の一つ以上の構成要素のすべて又は一部は、単一の核酸配列においてコードされる。

本明細書において記載される変化が、一つ以上のアミノ酸の変化であってもよいが、ヌクレアーゼに対する変化はまた、アミノ末端及び／又はカルボキシ末端延長としてのポリペプチドの融合などの独立した存在の性質のものであってもよい。例えば、ヌクレアーゼは、追加のペプチド、例えば、一つ以上のペプチドを含有してもよい。追加のペプチドの例は、ポリヒスチジンタグ（Ｈｉｓ－タグ）、Ｍｙｃ、及びＦＬＡＧなどの標識のためのエピトープペプチドを含んでいてもよい。いくつかの実施形態において、本明細書において記載されるヌクレアーゼは、蛍光タンパク質（例えば、緑色蛍光タンパク質（ＧＦＰ）又は黄色蛍光タンパク質（ＹＦＰ））などの、検出可能な成分に融合することができる。

本明細書において記載されるヌクレアーゼは、減弱したヌクレアーゼ活性、例えば、基準ヌクレアーゼと比較して、少なくとも５０％、少なくとも６０％、少なくとも７０％、少なくとも８０％、少なくとも９０％、少なくとも９５％、少なくとも９７％、又は１００％のヌクレアーゼ不活性化を有するように修飾することができる。ヌクレアーゼ活性は、当技術分野において知られている数個の方法、例えば、突然変異をＲｕｖＣドメイン（例えば、ＲｕｖＣドメインの一つ以上の触媒残基）に導入することによって減弱させることができる。非限定的な例において、残基Ｄ２８０、残基Ｅ４３９、及び／又は残基Ｄ５６０における突然変異を含む配列番号２の変異体は、減弱したヌクレアーゼ活性を示すか、又はヌクレアーゼ活性を示さない。

いくつかの実施形態において、本明細書において記載されるヌクレアーゼは、自己不活性化することができる。その全体が参照によって援用されるＥｐｓｔｅｉｎｅｔａｌ．，“ＥｎｇｉｎｅｅｒｉｎｇａＳｅｌｆ－ＩｎａｃｔｉｖａｔｉｎｇＣＲＩＳＰＲＳｙｓｔｅｍｆｏｒＡＡＶＶｅｃｔｏｒｓ，”Ｍｏｌ．Ｔｈｅｒ．，２４（２０１６）：Ｓ５０を参照されたい。

本明細書において記載されるヌクレアーゼをコードする核酸分子は、さらにコドン最適化することができる。核酸は、細菌細胞又は哺乳類細胞などの特定の宿主細胞において使用するためにコドン最適化することができる。

ターゲティング成分
いくつかの実施形態において、本明細書において記載される組成物は、ターゲティング成分を含む。

ターゲティング成分は、ターゲティング成分が、基準核酸配列に対して、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％、又は少なくとも約９９．５％の配列同一性を有する配列を含む場合、基準核酸配列と実質的に同一であってもよい。このような２つの核酸の間の同一性パーセントは、２つの最適にアラインメントされた核酸配列の目視検査によって手作業で又は標準的なパラメーターを使用するソフトウェアプログラム若しくはアルゴリズム（例えばＢＬＡＳＴ、ＡＬＩＧＮ、ＣＬＵＳＴＡＬ）を使用することによって決定することができる。２つの核酸配列が実質的に同一であるという１つの目安は、２つの核酸分子がストリンジェントな（例えば、中～高ストリンジェンシーの範囲内の）条件下で互いにハイブリダイズするといったものである。

いくつかの実施形態において、ターゲティング成分は、基準核酸配列に対して、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％、又は少なくとも約９９．５％の配列同一性を有する。

ＲＮＡガイド配列
いくつかの実施形態において、ターゲティング成分は、ＲＮＡガイド配列を含む又はＲＮＡガイド配列である。いくつかの実施形態において、ＲＮＡガイド配列は、本明細書において記載されるヌクレアーゼを特定の核酸配列に導く。特定の種類のＲＮＡガイド配列についての下記の実施例を読む当業者らは、いくつかの実施形態において、ＲＮＡガイド配列が、部位特異的であることを理解するであろう。すなわち、いくつかの実施形態において、ＲＮＡガイド配列は、非標的核酸配列（例えば、非特異的なＤＮＡ又はランダム配列）にではなく、一つ以上の標的核酸配列（例えば、特異的なＤＮＡ又はゲノムＤＮＡ配列）と特異的に結びつく。

いくつかの実施形態において、本明細書において記載される組成物は、本明細書において記載されるヌクレアーゼと結びつき、ヌクレアーゼを標的核酸配列（例えばＤＮＡ）に導くＲＮＡガイド配列を含む。ＲＮＡガイド配列は、核酸配列と結びつき、ヌクレアーゼの機能性を改変してもよい（例えば、分子に対するヌクレアーゼの親和性を、例えば、少なくとも１０％、１５％、２０％、２５％、３０％、３５％、４０％、４５％、５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、又はそれ以上、改変する）。

ＲＮＡガイド配列は、配列、例えば、部位特異的配列又は部位特異的標的の一つ以上のヌクレオチドを標的にしてもよい（例えば、結びついてもよい、導かれてもよい、接触してもよい、又は結合してもよい）。いくつかの実施形態において、ヌクレアーゼ（例えば、ヌクレアーゼとＲＮＡガイド）は、ＲＮＡガイドにおけるスペーサー配列に相補的である核酸基質（例えば、配列特異的基質又は標的核酸）への結合に際して、活性化される。

いくつかの実施形態において、ＲＮＡガイド配列は、スペーサー配列を含む。いくつかの実施形態において、ＲＮＡガイド配列のスペーサー配列は、概して、１６～２４の間のヌクレオチド長（例えば、１８、１９、２０、又は２１ヌクレオチド）を有し且つ特異的な核酸配列に相補的となるように、設計されてもよい。いくつかの実施形態において、スペーサーの長さは、表３に示される長さである。いくつかの特定の実施形態において、ＲＮＡガイド配列は、例えばゲノム遺伝子座の特異的なＤＮＡ鎖に相補的となるように、設計されていてもよい。いくつかの実施形態において、スペーサー配列は、例えばゲノム遺伝子座の特異的なＤＮＡ鎖に相補的となるように設計される。

ある実施形態において、ＲＮＡガイド配列は、配列又はスペーサー配列に連結されたダイレクトリピート配列を含む（ｉｎｃｌｕｄｅ）、それから本質的になる、又はそれを含む（ｃｏｍｐｒｉｓｅ）。いくつかの実施形態において、ＲＮＡガイド配列は、ダイレクトリピート配列及びスペーサー配列又はダイレクトリピート－スペーサー－ダイレクトリピート配列を含む。いくつかの実施形態において、ＲＮＡガイド配列は、切断されたダイレクトリピート配列及びスペーサー配列を含み、これは、プロセシングされた又は成熟ｃｒＲＮＡの典型である。いくつかの実施形態において、ヌクレアーゼは、ＲＮＡガイド配列と複合体を形成し、ＲＮＡガイド配列は、少なくとも一部のＲＮＡガイド配列に相補的である部位特異的標的核酸と結びつくように、複合体を導く。

いくつかの実施形態において、ＲＮＡガイド配列は、標的核酸配列に対して、少なくとも８０％、少なくとも９０％、少なくとも９５％、少なくとも９６％、少なくとも９７％、少なくとも９８％、少なくとも９９％相補的な配列、例えばＲＮＡ配列を含む。いくつかの実施形態において、ＲＮＡガイド配列は、ＤＮＡ配列に対して、少なくとも８０％、少なくとも９０％、少なくとも９５％、少なくとも９６％、少なくとも９７％、少なくとも９８％、少なくとも９９％相補的な配列を含む。いくつかの実施形態において、ＲＮＡガイド配列は、標的核酸配列に対して、少なくとも８０％、少なくとも９０％、少なくとも９５％、少なくとも９６％、少なくとも９７％、少なくとも９８％、少なくとも９９％相補的な配列を含む。いくつかの実施形態において、ＲＮＡガイド配列は、ゲノム配列に対して、少なくとも８０％、少なくとも９０％、少なくとも９５％、少なくとも９６％、少なくとも９７％、少なくとも９８％、少なくとも９９％相補的な配列を含む。いくつかの実施形態において、ＲＮＡガイド配列は、ゲノム配列に対して相補的な配列又は少なくとも８０％、少なくとも９０％、少なくとも９５％、少なくとも９６％、少なくとも９７％、少なくとも９８％、少なくとも９９％のゲノム配列に対する相補性を含む配列を含む。

いくつかの実施形態において、本明細書において記載されるヌクレアーゼは、一つ以上の（例えば、２、３、４、５、６、７、８、又はそれ以上の）ＲＮＡガイド配列、例えばＲＮＡガイドを含む。

いくつかの実施形態において、ＲＮＡガイドは、例えば国際公開第２０１４／０９３６２２号パンフレット及び国際公開第２０１５／０７００８３号パンフレットと同様の構成を有し、これらのそれぞれの全内容は、参照によって本明細書に援用される。

いくつかの実施形態において、本発明のＲＮＡガイド配列は、表４のダイレクトリピート配列に対して、８０、８５、９０、９１、９２、９３、９４、９５、９６、９７、９８、９９、又は１００％の同一性を有するダイレクトリピート配列を含む。いくつかの実施形態において、本発明のＲＮＡガイドは、表４のダイレクトリピート配列に対して、８０、８５、９０、９１、９２、９３、９４、９５、９６、９７、９８、９９を超える、又は１００％の同一性を有するダイレクトリピート配列を含む。

いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質及びＲＮＡガイド（例えば、ダイレクトリピート及びスペーサーを含むＲＮＡガイド）は、複合体を形成する。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質及びＲＮＡガイド（例えば、ダイレクトリピート－スペーサー－ダイレクトリピート配列又はｐｒｅ－ｃｒＲＮＡを含むＲＮＡガイド）は、複合体を形成する。いくつかの実施形態において、複合体は、標的核酸に結合する。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号１のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号３８又は配列番号３９のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号２のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号４０又は配列番号４１のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号３のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号４２又は配列番号４３のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号４のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号４４又は配列番号４５のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号４のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号４４又は配列番号４５のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号５のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号４６又は配列番号４７のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号６のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号４８又は配列番号４９のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号７のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号５０又は配列番号５１のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号８のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号５２又は配列番号５３のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号９のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号５４又は配列番号５５のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号１０のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号５６又は配列番号５７のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号１１のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号５８又は配列番号５９のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号１２のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号６０又は配列番号６１のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号１３のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号６２又は配列番号６３のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号１４のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号６４又は配列番号６５のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号１５のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号６６又は配列番号２２０のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号１６のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、

９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号６７又は配列番号６８のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号１７のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号６９又は配列番号７０のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号１８のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号７１又は配列番号７２のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号１９のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号７３又は配列番号７４のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号２０のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号７５又は配列番号７６のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号２２のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号７９又は配列番号８０のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号２３のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号８１又は配列番号８２のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号２４のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号８３又は配列番号８４のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号２５のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号８５又は配列番号８６のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号２６のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号８７又は配列番号８８のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号２７のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号８９又は配列番号９０のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号２８のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号９１又は配列番号９２のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号２９のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号９３又は配列番号９４のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号３０のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号９５又は配列番号９６のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号３１のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号９７又は配列番号９８のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号３２のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号９９又は配列番号１００のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号３３のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号１０１又は配列番号１０２のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号３４のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、

８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号１０３又は配列番号１０４のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号３５のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号１０５又は配列番号１０６のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号３６のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号１０７又は配列番号１０８のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号３７のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号１０９又は配列番号１１０のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。

いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質及びＲＮＡガイド（例えば、ダイレクトリピート及びスペーサーを含むＲＮＡガイド）は、複合体を形成する。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質及びＲＮＡガイド（例えば、ダイレクトリピート－スペーサー－ダイレクトリピート配列又はｐｒｅ－ｃｒＲＮＡを含むＲＮＡガイド）は、複合体を形成する。いくつかの実施形態において、複合体は、標的核酸に結合する。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号２のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号４０のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号５のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号４６のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号６のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号４８のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号７のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号５０のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号１０のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号５６のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号１１のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号５８のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号１３のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号６２のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号１５のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号６６のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号１６のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号６７のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号１７のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号６９のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号１８のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号７１のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号１９のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号７３のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号２０のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号７５のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号２３のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号８１のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号２７のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号８９のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号３１のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号９７のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号３４のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号１０３のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％

、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号３５のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号１０５のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号３６のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号１０７のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号３７のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号１０９のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、複合体は、標的核酸に結合する。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号２２１のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号２２５又は配列番号２２６のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、複合体は、標的核酸に結合する。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号２２２のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号２２７又は配列番号２２８のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、複合体は、標的核酸に結合する。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号２２３のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号２２９又は配列番号２３０のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、複合体は、標的核酸に結合する。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号２２４のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号２３１又は配列番号２３２のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。

いくつかの実施形態において、本発明のＲＮＡガイド配列は、表５のダイレクトリピート配列に対して、８０、８５、９０、９１、９２、９３、９４、９５、９６、９７、９８、９９、又は１００％の同一性を有するダイレクトリピート配列を含む。いくつかの実施形態において、本発明のＲＮＡガイドは、表５のダイレクトリピート配列に対して、８０、８５、９０、９１、９２、９３、９４、９５、９６、９７、９８、９９を超える、又は１００％の同一性を有するダイレクトリピート配列を含む。

いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質及びＲＮＡガイド（例えば、ダイレクトリピート及びスペーサーを含むＲＮＡガイド）は、複合体を形成する。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質及びＲＮＡガイド（例えば、ダイレクトリピート－スペーサー又は成熟ｃｒＲＮＡを含むＲＮＡガイド）は、複合体を形成する。いくつかの実施形態において、複合体は、標的核酸に結合する。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号２のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号１１１のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号５のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号１１２のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号７のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号１１３のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号１３のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号１１４のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号１４のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号１１５のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号１６のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号１１６のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号１８のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号１１７のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号１９のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号１１８のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号２１のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号１１９のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号２７のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号１２０又は配列番号１２１のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号２８のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号１２２のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号３１のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号１２３のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号３５のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号１２４のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。いくつかの実施形態において、ＣＲＩＳＰＲ関連タンパク質は、配列番号３７のアミノ酸配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号１２５又は配列番号１２６のヌクレオチド配列と少なくとも８０％（例えば、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％）同一であるヌクレオチド配列を含む。

いくつかの実施形態において、ＲＮＡガイドは、図２において記載されるダイレクトリピート配列を含む。例えば、いくつかの実施形態において、ＲＮＡガイドは、図２において示されるコンセンサス配列のダイレクトリピート又は図２において示されるコンセンサス配列の一部を含む。例えば、いくつかの実施形態において、ＲＮＡガイドは、Ｘ_１Ｘ_２ＣＣＣＴＸ_３として記載される配列を有するダイレクトリピートを含み、式中、Ｘ_１はＧ又はＡであり、Ｘ_２はＡ又はＣであり、Ｘ_３はＧ又はＡである。いくつかの実施形態において、ＲＮＡガイドは、Ｘ_１ＧＧＧＸ_２Ｘ_３Ｘ_４Ｘ_５Ｘ_６Ａとして記載される配列を有するダイレクトリピートを含み、式中、Ｘ_１はＴ又はＧであり、Ｘ_２はＴ又はＧであり、Ｘ_３はＴ又はＧであり、Ｘ_４はＡ又はＧであり、Ｘ_５はＴ又はＡであり、Ｘ_６はＡ又はＧ又はＣである（配列番号２４２）。

いくつかの実施形態において、本明細書において記載されるＲＮＡガイドは、ウラシル（Ｕ）を含む。いくつかの実施形態において、本明細書において記載されるＲＮＡガイドは、チミン（Ｔ）を含む。いくつかの実施形態において、本明細書において記載されるＲＮＡガイドのダイレクトリピート配列は、ウラシル（Ｕ）を含む。いくつかの実施形態において、本明細書において記載されるＲＮＡガイドのダイレクトリピート配列は、チミン（Ｔ）を含む。いくつかの実施形態において、表４又は表５によるダイレクトリピート配列は、表４又は表５の対応する配列においてチミンとして示される１つ以上の場所に、ウラシルを含む配列を含む。

いくつかの実施形態において、本発明のＲＮＡガイドは、任意選択で、表６のｔｒａｃｒＲＮＡに対して、８０、８５、９０、９１、９２、９３、９４、９５、９６、９７、９８、９９、又は１００％の同一性を有するｔｒａｃｒＲＮＡ配列を含む。いくつかの実施形態において、本発明のターゲティング成分は、表６のｔｒａｃｒＲＮＡに対して、８０、８５、９０、９１、９２、９３、９４、９５、９６、９７、９８、９９を超える、又は１００％の同一性を有するダイレクトリピート配列を含む。いくつかの実施形態において、本発明のＲＮＡガイドは、ｔｒａｃｒＲＮＡ配列、例えば、表６のｔｒａｃｒＲＮＡを含まない。いくつかの実施形態において、本発明のヌクレアーゼ、例えば、配列番号１～３７又は配列番号２２１～２２４のいずれか１つのヌクレアーゼは、活性（例えば、ヌクレアーゼ活性）を有するのにｔｒａｃｒＲＮＡ配列、例えば、表６のｔｒａｃｒＲＮＡ配列を必要としない。

特に断りのない限り、本明細書において提供されるすべての組成物及びヌクレアーゼは、その組成物又はヌクレアーゼの活性レベルを基準にして作製され、市販されている原料中に存在する可能性がある不純物、例えば残留溶媒又は副産物を除いてある。ヌクレアーゼ構成要素の重量は、総活性タンパク質に基づく。パーセンテージ及び比はすべて、特に明記されない限り、重量で計算される。パーセンテージ及び比はすべて、特に明記されない限り、全組成物に基づいて計算される。例示される組成物において、ヌクレアーゼレベルは、全組成物のうちの純粋な酵素によって重量で表現され、特に指定のない限り、内容物は、全組成物のうちの重量によって表現される。

修飾
ＲＮＡガイド配列又はヌクレアーゼをコードする核酸配列のいずれも、基準配列、特に親ポリリボヌクレオチドに関して、一つ以上の共有結合性修飾を含んでいてもよく、これらは、本発明の範囲内に含まれる。

例示的な修飾は、糖、核酸塩基、ヌクレオシド間の連結（例えば、連結しているリン酸への／ホスホジエステル結合への／ホスホジエステル骨格への）、及びその任意の組み合わせへの任意の修飾を含むことができる。本明細書において提供される例示的な修飾のいくつかは、以下に詳細に記載される。

ＲＮＡガイド配列又はヌクレアーゼの構成要素をコードする核酸配列のいずれも、糖、核酸塩基、又はヌクレオシド間の連結（例えば、連結しているリン酸への／ホスホジエステル結合への／ホスホジエステル骨格への）など、任意の有用な修飾を含んでいてもよい。ピリミジン核酸塩基の一つ以上の原子は、任意選択で置換されたアミノ、任意選択で置換されたチオール、任意選択で置換されたアルキル（例えば、メチル若しくはエチル）、又はハロ（例えば、クロロ若しくはフルオロ）と置き換えられてもよい又は置換されてもよい。ある実施形態において、修飾（例えば、一つ以上の修飾）は、糖及びヌクレオシド間の連結のそれぞれにおいて存在する。修飾は、リボ核酸（ＲＮＡ）の、デオキシリボ核酸（ＤＮＡ）、トレオース核酸（ＴＮＡ）、グリコール核酸（ＧＮＡ）、ペプチド核酸（ＰＮＡ）、ロックド核酸（ＬＮＡ）、又はそのハイブリッド）への修飾であってもよい。追加の修飾は、本明細書において記載される。

いくつかの実施形態において、修飾は、化学的又は細胞誘発性の修飾を含んでいてもよい。例えば、細胞内ＲＮＡ修飾のいくつかの非限定的な例は、ＬｅｗｉｓａｎｄＰａｎｉｎ“ＲＮＡｍｏｄｉｆｉｃａｔｉｏｎｓａｎｄｓｔｒｕｃｔｕｒｅｓｃｏｏｐｅｒａｔｅｔｏｇｕｉｄｅＲＮＡ－ｐｒｏｔｅｉｎｉｎｔｅｒａｃｔｉｏｎｓ”ｆｒｏｍＮａｔＲｅｖｉｅｗｓＭｏｌＣｅｌｌＢｉｏｌ，２０１７，１８：２０２－２１０によって記載される。

様々な糖修飾、ヌクレオチド修飾、及び／又はヌクレオシド間の連結（例えば骨格構造）が、配列中の多様な位置に存在してもよい。当業者は、ヌクレオチド類似体又は他の修飾が、配列の機能が実質的に減少しないような、配列の任意の位置に位置してもよいことをよく理解するであろう。配列は、約１％～約１００％（全体的なヌクレオチド含有量に関して又はヌクレオチドの一つ以上のタイプ、すなわち、任意の一つ以上のＡ、Ｇ、Ｕ、若しくはＣに関して）或いは任意の間のパーセンテージ（例えば、１％～２０％＞、１％～２５％、１％～５０％、１％～６０％、１％～７０％、１％～８０％、１％～９０％、１％～９５％、１０％～２０％、１０％～２５％、１０％～５０％、１０％～６０％、１０％～７０％、１０％～８０％、１０％～９０％、１０％～９５％、１０％～１００％、２０％～２５％、２０％～５０％、２０％～６０％、２０％～７０％、２０％～８０％、２０％～９０％、２０％～９５％、２０％～１００％、５０％～６０％、５０％～７０％、５０％～８０％、５０％～９０％、５０％～９５％、５０％～１００％、７０％～８０％、７０％～９０％、７０％～９５％、７０％～１００％、８０％～９０％、８０％～９５％、８０％～１００％、９０％～９５％、９０％～１００％、及び９５％～１００％）の修飾ヌクレオチドを含んでいてもよい。

いくつかの実施形態において、配列の一つ以上のリボヌクレオチドの糖修飾（例えば、２’位若しくは４’位で）又は糖の置き換え及び骨格修飾は、ホスホジエステル結合の修飾又は置き換えを含んでいてもよい。配列の特定の例は、修飾された骨格を含む又はホスホジエステル結合の修飾若しくは置き換えを含む、ヌクレオシド間の修飾などの天然のヌクレオシド間の連結を含まない配列を含むが、これらに限定されない。修飾された骨格を有する配列は、とりわけ、骨格中にリン原子を有していない配列を含む。本出願の目的のために、また、時に当技術分野において言及されるように、それらのヌクレオシド間の骨格中にリン原子を有していない修飾ＲＮＡはまた、オリゴヌクレオシドとみなすこともできる。特定の実施形態において、配列は、そのヌクレオシド間の骨格中にリン原子を有するリボヌクレオチドを含む。

修飾された配列骨格は、例えば、ホスホロチオエート、キラルホスホロチオエート、ホスホロジチオエート、リン酸トリエステル、アミノアルキルリン酸トリエステル、３’－アルキレンホスホネート及びキラルホスホネートなどのメチル及び他のアルキルホスホネート、ホスフィネート、３’－アミノホスホロアミデート及びアミノアルキルホスホロアミデートなどのホスホロアミデート、チオノホスホロアミデート、チオノアルキルホスホネート、チオノアルキルリン酸トリエステル、並びに通常の３’－５’連結を有するボラノリン酸、これらの２’－５’連結アナログ、及びヌクレオシド単位の隣接する対が、３’－５’～５’－３’又は２’－５’～５’－２’に連結される、逆の極性を有するものを含んでいてもよい。多様な塩、混合塩、及び遊離酸形態もまた、含まれる。いくつかの実施形態において、配列は、負に又は正に荷電していてもよい。

配列に組み込まれてもよい修飾ヌクレオチドは、ヌクレオシド間の連結（例えばリン酸骨格）に対して修飾することができる。本明細書において、ポリヌクレオチド骨格に関して、語句「リン酸」及び「ホスホジエステル」は、区別なく使用される。骨格リン酸基は、一つ以上の酸素原子を異なる置換基と置き換えることによって修飾することができる。さらに、修飾ヌクレオシド及びヌクレオチドは、無修飾リン酸成分の、本明細書において記載される別のヌクレオシド間の連結との全面的な置き換えを含むことができる。修飾リン酸基の例は、ホスホロチオエート、ホスホロセレナート（ｐｈｏｓｐｈｏｒｏｓｅｌｅｎａｔｅ）、ボラノリン酸、ボラノリン酸エステル、水素ホスホネート（ｈｙｄｒｏｇｅｎｐｈｏｓｐｈｏｎａｔｅ）、ホスホロアミデート、ホスホロジアミデート、アルキル又はアリールホスホネート、及びリン酸トリエステルを含むが、これらに限定されない。ジチオリン酸は、両方の非連結酸素が硫黄によって置き換えられている。リン酸リンカーはまた、連結酸素の、窒素（架橋ホスホロアミデート）、硫黄（架橋ホスホロチオエート）、及び炭素（架橋メチレンホスホネート）との置き換えによって修飾することもできる。

α－チオ置換リン酸成分は、非天然ホスホロチオエート骨格連結を通してＲＮＡ及びＤＮＡポリマーに安定性を与えるために提供される。ホスホロチオエートＤＮＡ及びＲＮＡは、ヌクレアーゼ抵抗性が増加しており、続いて、細胞環境においてより長い半減期を有する。

特定の実施形態において、修飾ヌクレオシドは、アルファ－チオ－ヌクレオシド（例えば５’－Ｏ－（１－チオホスフェート）－アデノシン、５’－Ｏ－（１－チオホスフェート）－シチジン（ａ－チオ－シチジン）、５’－Ｏ－（１－チオホスフェート）－グアノシン、５’－Ｏ－（１－チオホスフェート）－ウリジン、又は５’－Ｏ－（１－チオホスフェート）プソイドウリジン）を含む。

リン原子を含有しないヌクレオシド間の連結を含む、本発明に従って用いられてもよい他のヌクレオシド間の連結は、本明細書において記載される。

いくつかの実施形態において、配列は、一つ以上の細胞毒性ヌクレオシドを含んでいてもよい。例えば、細胞毒性ヌクレオシドは、二官能性修飾などのように、配列に組み込まれてもよい。細胞毒性ヌクレオシドは、アデノシンアラビノシド、５－アザシチジン、４’－チオ－アラシチジン、シクロペンテニルシトシン、クラドリビン、クロファラビン、シタラビン、シトシンアラビノシド、１－（２－Ｃ－シアノ－２－デオキシ－ベータ－Ｄ－アラビノ－ペントフラノシル）－シトシン、デシタビン、５－フルオロウラシル、フルダラビン、フロクシウリジン、ゲムシタビン、テガフール及びウラシルの組み合わせ、テガフール（（ＲＳ）－５－フルオロ－１－（テトラヒドロフラン－２－イル）ピリミジン－２，４（１Ｈ，３Ｈ）－ジオン）、トロキサシタビン、テザシタビン、２’－デオキシ－２’－メチリデンシチジン（ＤＭＤＣ）、並びに６－メルカプトプリンを含んでいてもよいが、これらに限定されない。追加の例は、フルダラビンホスフェート、Ｎ４－ベヘノイル－１－ベータ－Ｄ－アラビノフラノシルシトシン、Ｎ４－オクタデシル－１－ベータ－Ｄ－アラビノフラノシルシトシン、Ｎ４－パルミトイル－１－（２－Ｃ－シアノ－２－デオキシ－ベータ－Ｄ－アラビノ－ペントフラノシル）シトシン、及びＰ－４０５５（シタラビン５’－エライジン酸エステル）を含む。

いくつかの実施形態において、配列は、一つ以上の転写後修飾を含む（例えばキャッピング、切断、ポリアデニル化、スプライシング、ポリＡ配列、メチル化、アシル化、リン酸化、リシン残基及びアルギニン残基のメチル化、アセチル化、並びにチオール基及びチロシン残基のニトロシル化等）。一つ以上の転写後修飾は、ＲＮＡにおいて確認された１００を超える様々なヌクレオシド修飾のいずれかなどの、任意の転写後修飾とすることができる（Ｒｏｚｅｎｓｋｉ，Ｊ，Ｃｒａｉｎ，Ｐ，ａｎｄＭｃＣｌｏｓｋｅｙ，Ｊ．（１９９９）．ＴｈｅＲＮＡＭｏｄｉｆｉｃａｔｉｏｎＤａｔａｂａｓｅ：１９９９ｕｐｄａｔｅ．ＮｕｃｌＡｃｉｄｓＲｅｓ２７：１９６－１９７）いくつかの実施形態において、第１の単離核酸は、メッセンジャーＲＮＡ（ｍＲＮＡ）を含む。いくつかの実施形態において、ｍＲＮＡは、ピリジン－４－オンリボヌクレオシド、５－アザ－ウリジン、２－チオ－５－アザ－ウリジン、２－チオウリジン、４－チオ－プソイドウリジン、２－チオ－プソイドウリジン、５－ヒドロキシウリジン、３－メチルウリジン、５－カルボキシメチル－ウリジン、１－カルボキシメチル－プソイドウリジン、５－プロピニル－ウリジン、１－プロピニル－プソイドウリジン、５－タウリノメチルウリジン、１－タウリノメチル－プソイドウリジン、５－タウリノメチル－２－チオ－ウリジン、１－タウリノメチル－４－チオ－ウリジン、５－メチル－ウリジン、１－メチル－プソイドウリジン、４－チオ－１－メチル－プソイドウリジン、２－チオ－１－メチル－プソイドウリジン、１－メチル－１－デアザ－プソイドウリジン、２－チオ－１－メチル－１－デアザ－プソイドウリジン、ジヒドロウリジン、ジヒドロプソイドウリジン、２－チオ－ジヒドロウリジン、２－チオ－ジヒドロプソイドウリジン、２－メトキシウリジン、２－メトキシ－４－チオ－ウリジン、４－メトキシ－プソイドウリジン、及び４－メトキシ－２－チオ－プソイドウリジンからなる群から選択される少なくとも１つのヌクレオシドを含む。いくつかの実施形態において、ｍＲＮＡは、５－アザ－シチジン、プソイドイソシチジン、３－メチル－シチジン、Ｎ４－アセチルシチジン、５－ホルミルシチジン、Ｎ４－メチルシチジン、５－ヒドロキシメチルシチジン、１－メチル－プソイドイソシチジン、ピロロ－シチジン、ピロロ－プソイドイソシチジン、２－チオ－シチジン、２－チオ－５－メチル－シチジン、４－チオ－プソイドイソシチジン、４－チオ－１－メチル－プソイドイソシチジン、４－チオ－１－メチル－１－デアザ－プソイドイソシチジン、１－メチル－１－デアザ－プソイドイソシチジン、ゼブラリン、５－アザ－ゼブラリン、５－メチル－ゼブラリン、５－アザ－２－チオ－ゼブラリン、２－チオ－ゼブラリン、２－メトキシ－シチジン、２－メトキシ－５－メチル－シチジン、４－メトキシ－プソイドイソシチジン、及び４－メトキシ－１－メチル－プソイドイソシチジンからなる群から選択される少なくとも１つのヌクレオシドを含む。いくつかの実施形態において、ｍＲＮＡは、２－アミノプリン、２，６－ジアミノプリン、７－デアザ－アデニン、７－デアザ－８－アザアデニン、７－デアザ－２－アミノプリン、７－デアザ－８－アザ－２－アミノプリン、７－デアザ－２，６－ジアミノプリン、７－デアザ－８－アザ－２，６－ジアミノプリン、１－メチルアデノシン、Ｎ６－メチルアデノシン、Ｎ６－イソペンテニルアデノシン、Ｎ６－（シス－ヒドロキシイソペンテニル）アデノシン、２－メチルチオ－Ｎ６－（シス－ヒドロキシイソペンテニル）アデノシン、Ｎ６－グリシニルカルバモイルアデノシン、Ｎ６－スレオニルカルバモイルアデノシン、２－メチルチオ－Ｎ６－スレオニルカルバモイルアデノシン、Ｎ６，Ｎ６－ジメチルアデノシン、７－メチルアデニン、２－メチルチオ－アデニン、及び２－メトキシ－アデニンからなる群から選択される少なくとも１つのヌクレオシドを含む。いくつかの実施形態において、ｍＲＮＡは、イノシン、１－メチル－イノシン、ワイオシン、ワイブトシン、７－デアザ－グアノシン、７－デアザ－８－アザ－グアノシン、６－チオ－グアノシン、６－チオ－７－デアザグアノシン、６－チオ－７－デアザ－８－アザ－グアノシン、７－メチル－グアノシン、６－チオ－７－メチルグアノシン、７－メチルイノシン、６－メトキシ－グアノシン、１－メチルグアノシン、Ｎ２－メチルグアノシン、Ｎ２，Ｎ２－ジメチルグアノシン、８－オキソ－グアノシン、７－メチル－８－オキソ－グアノシン、１－メチル－６－チオ－グアノシン、Ｎ２－メチル－６－チオ－グアノシン、及びＮ２，Ｎ２－ジメチル－６－チオ－グアノシンからなる群から選択される少なくとも１つのヌクレオシドを含む。

配列は、分子の全長に沿って、均一に修飾されてもよい又は修飾されなくてもよい。例えば、一つ以上の又はすべてのタイプのヌクレオチド（例えば、天然に存在するヌクレオチド、プリン、若しくはピリミジン又は任意の一つ以上の若しくはすべてのＡ、Ｇ、Ｕ、Ｃ、Ｉ、ｐＵ）は、配列において又はその所定の、あらかじめ決められた配列領域において、均一に修飾されてもよい又は修飾されなくてもよい。いくつかの実施形態において、配列は、プソイドウリジンを含む。いくつかの実施形態において、配列は、イノシンを含み、これは、内在性ＲＮＡ対ウイルスＲＮＡとして配列の特性を決定する免疫システムを助けてもよい。イノシンの組み込みはまた、ＲＮＡ安定性の改善／分解の低下を実現してもよい。例えば、その全体が参照によって援用されるＹｕ，Ｚ．ｅｔａｌ．（２０１５）ＲＮＡｅｄｉｔｉｎｇｂｙＡＤＡＲ１ｍａｒｋｓｄｓＲＮＡａｓ“ｓｅｌｆ”．ＣｅｌｌＲｅｓ．２５，１２８３－１２８４を参照されたい。

ベクター
本発明は、本明細書において記載されるヌクレアーゼを発現するためのベクターを提供する又は本明細書において記載されるヌクレアーゼをコードする核酸は、ベクターに組み込まれてもよい。いくつかの実施形態において、本発明のベクターは、本明細書において記載されるヌクレアーゼをコードするヌクレオチド配列を含む。いくつかの実施形態において、本発明のベクターは、本明細書において記載されるヌクレアーゼをコードするヌクレオチド配列を含む。

本発明はまた、本明細書において記載されるヌクレアーゼ又は本明細書において記載されるヌクレアーゼを含む組成物の調製のために使用されてもよいベクターをも提供する。いくつかの実施形態において、本発明は、細胞中に、本明細書において記載される組成物又はベクターを含む。いくつかの実施形態において、本発明は、細胞において、本発明のヌクレアーゼ又はヌクレアーゼをコードするベクター若しくは核酸を含む組成物を発現させるための方法を含む。方法は、組成物、例えば、ベクター又は核酸を提供するステップ及び組成物を細胞に送達するステップを含んでいてもよい。

天然又は合成ポリヌクレオチドの発現は、関連する遺伝子をコードするポリヌクレオチド、例えば、本発明のヌクレアーゼをコードするヌクレオチド配列を、プロモーターに作動可能に連結し、構築物を発現ベクターに組み込むことによって、典型的に達成される。発現ベクターは、本発明のヌクレアーゼをコードするポリヌクレオチドを含み且つ真核細胞における複製及び統合に適し得る限り、特に制限されない。

典型的な発現ベクターは、所望されるポリヌクレオチドの発現に有用な転写及び翻訳ターミネーター、開始配列、並びにプロモーターを含む。例えば、ＲＮＡポリメラーゼに対する認識配列を運搬するプラスミドベクター（ｐＳＰ６４、ｐＢｌｕｅｓｃｒｉｐｔ等）が、使用されてもよい。レンチウイルスなどのレトロウイルスに由来するベクターを含むベクターは、導入遺伝子の長期的で、安定した統合及び娘細胞におけるその増殖を可能にするので、長期的遺伝子移入を達成するための適したツールとなる。ベクターの例は、発現ベクター、複製ベクター、プローブ生成ベクター（ｐｒｏｂｅｇｅｎｅｒａｔｉｏｎｖｅｃｔｏｒ）、及びシークエンシングベクターを含む。発現ベクターは、ウイルスベクターの形態で細胞に提供されてもよい。

ウイルスベクター技術は、当技術分野においてよく知られており、種々のウイルス学及び分子生物学のマニュアルにおいて記載される。ベクターとして有用であるウイルスは、ファージウイルス、レトロウイルス、アデノウイルス、アデノ随伴ウイルス、ヘルペスウイルス、及びレンチウイルスを含むが、これらに限定されない。一般に、適したベクターは、少なくとも１つの生物において機能的な複製開始点、プロモーター配列、便利な制限エンドヌクレアーゼ部位、及び一つ以上の選択可能なマーカーを含有する。

ベクターの種類は、特に制限されず、宿主細胞において発現することができるベクターは、適切に選択することができる。具体的には、宿主細胞の種類に依存して、ポリヌクレオチドからの本発明のヌクレアーゼの発現を確実にするためのプロモーター配列は、適切に選択され、このプロモーター配列及びポリヌクレオチドは、発現ベクターの調製のために、多様なプラスミドのいずれかに挿入される等する。

追加のプロモーターエレメント、例えば増強配列は、転写開始の頻度を調節する。典型的に、これらは、スタート部位から３０～１１０ｂｐ上流の領域に位置するが、多くのプロモーターが、スタート部位の下流にも機能的なエレメントを含有することが最近示された。プロモーターに依存して、個々のエレメントは、転写を活性化するために協力して又は独立して機能することができるように思われる。

さらに、本開示は、恒常的プロモーターの使用に制限されるべきではない。誘導性プロモーターもまた、本開示の一部として想定される。誘導性プロモーターの使用は、このような発現が所望される場合に、誘導性プロモーターに有効に連結されているポリヌクレオチド配列の発現をオンにする又は発現が所望されない場合に、発現をオフにすることが可能な分子スイッチを提供する。誘導性プロモーターの例は、メタロチオニン（ｍｅｔａｌｌｏｔｈｉｏｎｉｎｅ）プロモーター、グルココルチコイドプロモーター、プロゲステロンプロモーター、及びテトラサイクリンプロモーターを含むが、これらに限定されない。

導入される発現ベクターはまた、ウイルスベクターを通してトランスフェクトしようと又は感染させようと試みた細胞の集団からの発現細胞の確認及び選択を容易にするために、選択可能なマーカー遺伝子若しくはリポーター遺伝子又はその両方を含有することもできる。他の態様において、選択可能なマーカーは、ＤＮＡの別々のピースで運搬されてもよく、同時トランスフェクション手順において使用されてもよい。選択可能なマーカー及びリポーター遺伝子の両方は、宿主細胞における発現を可能にするために、適切な転写コントロール配列が側面に位置してもよい。このようなマーカーの例は、真核細胞培養のためのジヒドロ葉酸還元酵素遺伝子及びネオマイシン耐性遺伝子；並びに大腸菌（Ｅ．ｃｏｌｉ）及び他の細菌の培養のためのテトラサイクリン耐性遺伝子及びアンピシリン耐性遺伝子を含む。このような選択マーカーの使用によって、本発明のヌクレアーゼをコードするポリヌクレオチドが宿主細胞に移入され、次いで、確実に発現されたかどうかを確かめることができる。

組換え発現ベクターのための調製方法は、特に制限されず、その例は、プラスミド、ファージ、又はコスミドを使用する方法を含む。

細胞
本明細書において記載されるヌクレアーゼは、多様な細胞に導入することができる。いくつかの実施形態において、細胞は、単離細胞である。いくつかの実施形態において、細胞は、細胞培養物中にある。いくつかの実施形態において、細胞は、エクスビボである。いくつかの実施形態において、細胞は、生物から得られ、細胞培養物中に維持される。いくつかの実施形態において、細胞は、単細胞生物である。

いくつかの実施形態において、細胞は、原核細胞である。いくつかの実施形態において、細胞は、細菌細胞であるか、又は細菌細胞に由来する。いくつかの実施形態において、細胞は、古細菌細胞であるか、又は古細菌細胞に由来する。

いくつかの実施形態において、細胞は、真核細胞である。いくつかの実施形態において、細胞は、植物細胞であるか、又は植物細胞に由来する。いくつかの実施形態において、細胞は、真菌細胞であるか、又は真菌細胞に由来する。いくつかの実施形態において、細胞は、動物細胞であるか、又は動物細胞に由来する。いくつかの実施形態において、細胞は、無脊椎動物細胞であるか、又は無脊椎動物細胞に由来する。いくつかの実施形態において、細胞は、脊椎動物細胞であるか、又は脊椎動物細胞に由来する。いくつかの実施形態において、細胞は、哺乳類細胞であるか、又は哺乳類細胞に由来する。いくつかの実施形態において、細胞は、ヒト細胞である。いくつかの実施形態において、細胞は、ゼブラフィッシュ細胞である。いくつかの実施形態において、細胞は、げっ歯類細胞である。いくつかの実施形態において、細胞は、合成的に作製され、人工細胞と呼ばれることもある。

いくつかの実施形態において、細胞は、細胞株に由来する。組織培養のための多種多様な細胞株が当技術分野で知られている。細胞株の例は、２９３Ｔ、ＭＦ７、Ｋ５６２、ＨｅＬａ、及びそれらのトランスジェニック変種を含むが、これらに限定されない。細胞株は、当業者に知られている多様な供給源から入手可能である（例えば、ＡｍｅｒｉｃａｎＴｙｐｅＣｕｌｔｕｒｅＣｏｌｌｅｃｔｉｏｎ（ＡＴＣＣ）（Ｍａｎａｓｓａｓ，Ｖａ．を参照されたい））。いくつかの実施形態において、１つ以上のベクター由来配列を含む新しい細胞株を確立して、標的核酸又は標的遺伝子座に対する修飾を含む新しい細胞株を確立するために、１つ以上の核酸（ベクター及びＲＮＡガイドをコードするヌクレアーゼポリペプチドなど）でトランスフェクトされた細胞が使用される。いくつかの実施形態において、細胞は、不死細胞又は不死化細胞である。

いくつかの実施形態において、細胞は、初代細胞である。いくつかの実施形態において、細胞は、全能性（ｔｏｔｉｐｏｔｅｎｔ）幹細胞（例えば、全能性（ｏｍｎｉｐｏｔｅｎｔ））、多能性（ｐｌｕｒｉｐｏｔｅｎｔ）幹細胞、多能性（ｍｕｌｔｉｐｏｔｅｎｔ）幹細胞、少能性幹細胞、又は単能性幹細胞などの幹細胞である。いくつかの実施形態において、細胞は、人工多能性幹細胞（ｉＰＳＣ）であるか、又はｉＰＳＣに由来する。いくつかの実施形態において、細胞は、分化細胞である。例えば、いくつかの実施形態において、分化細胞は、筋肉細胞（例えば、筋細胞）、脂肪細胞（ｆａｔｃｅｌｌ）（例えば、脂肪細胞（ａｄｉｐｏｃｙｔｅ））、骨細胞（ｂｏｎｅｃｅｌｌ）（例えば、骨芽細胞、骨細胞（ｏｓｔｅｏｃｙｔｅ）、破骨細胞）、血液細胞（例えば、単球、リンパ球、好中球、好酸球、好塩基球、マクロファージ、赤血球、又は血小板）、神経細胞（例えば、ニューロン）、上皮細胞、免疫細胞（例えば、リンパ球、好中球、単球、又はマクロファージ）、肝臓細胞（例えば、肝細胞）、線維芽細胞、又は性細胞である。いくつかの実施形態において、細胞は、最終分化細胞である。例えば、いくつかの実施形態において、最終分化細胞は、神経細胞、脂肪細胞、心筋細胞、骨格筋細胞、表皮細胞、又は腸細胞である。いくつかの実施形態において、細胞は、哺乳類細胞、例えば、ヒト細胞又はマウス細胞である。いくつかの実施形態において、マウス細胞は、野生型マウス、免疫抑制マウス、又は疾患特異的マウスモデルに由来する。

産生
いくつかの実施形態において、本発明のヌクレアーゼは、（Ｉ）本発明のヌクレアーゼを産生する細菌を培養すること、ヌクレアーゼを単離すること、及び任意選択で、ヌクレアーゼを精製することによって、調製することができる。ヌクレアーゼはまた、（ＩＩ）既知の遺伝子操作技術、詳細には、本発明のヌクレアーゼをコードする遺伝子を細菌から単離すること、組換え発現ベクターを構築すること、及び次いで、組換えタンパク質の発現のために適切な宿主細胞にベクターを移入することによって、調製することもできる。その代わりに、ヌクレアーゼは、（ＩＩＩ）インビトロ共役転写－翻訳システムによって調製することができる。本発明のヌクレアーゼの調製のために使用することができる細菌は、本発明のヌクレアーゼを産生することができる限り、特に制限されない。細菌のいくつかの非限定的な例は、本明細書において記載される大腸菌（Ｅ．ｃｏｌｉ）細胞を含む。

発現の方法
本発明は、タンパク質発現のための方法であって、本明細書において記載されるヌクレアーゼを翻訳することを含む方法を含む。

いくつかの実施形態において、本明細書において記載される宿主細胞は、ヌクレアーゼを発現させるために使用される。宿主細胞は、特に制限されず、多様な既知の細胞を、好ましくは、使用することができる。宿主細胞の特定の例は、大腸菌（Ｅ．ｃｏｌｉ）などの細菌、酵母（出芽酵母、サッカロマイセス・セレビシエ（Ｓａｃｃｈａｒｏｍｙｃｅｓｃｅｒｅｖｉｓｉａｅ）及び分裂酵母、シゾサッカロミセス・ポンベ（Ｓｃｈｉｚｏｓａｃｃｈａｒｏｍｙｃｅｓｐｏｍｂｅ））、線形動物（線虫（Ｃａｅｎｏｒｈａｂｄｉｔｉｓｅｌｅｇａｎｓ））、アフリカツメガエル（Ｘｅｎｏｐｕｓｌａｅｖｉｓ）卵母細胞、並びに動物細胞（例えば、ＣＨＯ細胞、ＣＯＳ細胞、及びＨＥＫ２９３細胞）を含む。上記の発現ベクターを宿主細胞に移入するための方法、すなわち、形質転換方法は、特に制限されず、エレクトロポレーション、リン酸カルシウム法、リポソーム法、及びＤＥＡＥデキストラン法などの既知の方法を、使用することができる。

宿主を発現ベクターにより形質転換した後、宿主細胞は、ヌクレアーゼの産生のために、培養されてもよい、発育させてもよい、育てられてもよい。ヌクレアーゼの発現の後、宿主細胞を、収集し、ヌクレアーゼを、従来の方法（例えば、ろ過、遠心分離、細胞破壊、ゲルろ過クロマトグラフィー、イオン交換クロマトグラフィー等）に従って、培養物等から精製することができる。

いくつかの実施形態において、ヌクレアーゼ発現のための方法は、少なくとも５アミノ酸、少なくとも１０アミノ酸、少なくとも１５アミノ酸、少なくとも２０アミノ酸、少なくとも５０アミノ酸、少なくとも１００アミノ酸、少なくとも１５０アミノ酸、少なくとも２００アミノ酸、少なくとも２５０アミノ酸、少なくとも３００アミノ酸、少なくとも４００アミノ酸、少なくとも５００アミノ酸、少なくとも６００アミノ酸、少なくとも７００アミノ酸、少なくとも８００アミノ酸、少なくとも９００アミノ酸、又は少なくとも１０００アミノ酸のヌクレアーゼの翻訳を含む。いくつかの実施形態において、タンパク質発現のための方法は、約５アミノ酸、約１０アミノ酸、約１５アミノ酸、約２０アミノ酸、約５０アミノ酸、約１００アミノ酸、約１５０アミノ酸、約２００アミノ酸、約２５０アミノ酸、約３００アミノ酸、約４００アミノ酸、約５００アミノ酸、約６００アミノ酸、約７００アミノ酸、約８００アミノ酸、約９００アミノ酸、約１０００アミノ酸、又はそれ以上のヌクレアーゼの翻訳を含む。

種々の方法は、宿主細胞における成熟ヌクレアーゼの産生のレベルを決定するために使用することができる。このような方法は、例えば、ヌクレアーゼに特異的なポリクローナル抗体又はモノクローナル抗体を利用する方法を含むが、これらに限定されない。例示的な方法は、酵素結合免疫吸着アッセイ（ＥＬＩＳＡ）、ラジオイムノアッセイ（ＭＡ）、蛍光イムノアッセイ（ＦＩＡ）、及び蛍光活性化細胞選別（ＦＡＣＳ）を含むが、これらに限定されない。これらの及び他のアッセイは、当技術分野においてよく知られている（例えばＭａｄｄｏｘｅｔａｌ．，Ｊ．Ｅｘｐ．Ｍｅｄ．１５８：１２１１［１９８３］を参照されたい）。

本開示は、細胞におけるヌクレアーゼのインビボ発現の方法であって、ヌクレアーゼをコードするポリリボヌクレオチドを宿主細胞に提供すること、ここで、ポリリボヌクレオチドは、ヌクレアーゼをコードする、細胞においてヌクレアーゼを発現させること、及び細胞からヌクレアーゼを得ることを含む方法を提供する。

送達
本明細書において記載される組成物は、製剤され、例えば、キャリア及び／又はポリマーのキャリア、例えばリポソームなどのキャリアを含み、既知の方法によって、細胞（例えば、原核、真核、植物、哺乳類等）に送達されてもよい。このような方法は、トランスフェクション（例えば、脂質媒介性、カチオンポリマー、リン酸カルシウム、デンドリマー）；エレクトロポレーション又は膜破壊の他の方法（例えばｎｕｃｌｅｏｆｅｃｔｉｏｎ）、ウイルス送達（例えば、レンチウイルス、レトロウイルス、アデノウイルス、ＡＡＶ）、マイクロインジェクション、微粒子銃（「遺伝子銃」）、ｆｕｇｅｎｅ、直接音波負荷（ｄｉｒｅｃｔｓｏｎｉｃｌｏａｄｉｎｇ）、細胞スクイージング（ｃｅｌｌｓｑｕｅｅｚｉｎｇ）、光学的トランスフェクション、プロトプラスト融合、インペイルフェクション（ｉｍｐａｌｅｆｅｃｔｉｏｎ）、マグネトフェクション（ｍａｇｎｅｔｏｆｅｃｔｉｏｎ）、エキソソーム媒介性の移入、脂質ナノ粒子媒介性の移入、及びその任意の組み合わせを含むが、これらに限定されない。別の態様において、本開示は、本明細書において記載されるＡＡＶベクターを含むＡＡＶ粒子を部分的に対象とする。いくつかの実施形態において、ＡＡＶ粒子は、ＡＡＶ１、ＡＡＶ２、ＡＡＶ３、ＡＡＶ４、ＡＡＶ５、ＡＡＶ６、ＡＡＶ７、ＡＡＶ８、ＡＡＶ９、ＡＡＶ１０、又はＡＡＶ１１粒子（例えば、ＡＡＶ８、ＡＡＶ３、又はＡＡＶ２粒子）である。いくつかの実施形態において、ＡＡＶ粒子はＡＡＶカプシドを含む。いくつかの実施形態において、ＡＡＶカプシドは、１つ以上のＡＡＶ１、ＡＡＶ２、ＡＡＶ３、ＡＡＶ４、ＡＡＶ５、ＡＡＶ６、ＡＡＶ７、ＡＡＶ８、ＡＡＶ９、ＡＡＶ１０、又はＡＡＶ１１タンパク質を含む。いくつかの実施形態において、ＡＡＶカプシドのすべてのタンパク質構成要素は、同じＡＡＶ血清型のタンパク質（例えば、すべてのＡＡＶ１、ＡＡＶ２、ＡＡＶ３、ＡＡＶ４、ＡＡＶ５、ＡＡＶ６、ＡＡＶ７、ＡＡＶ８、ＡＡＶ９、ＡＡＶ１０、又はＡＡＶ１１タンパク質）である。

いくつかの実施形態において、方法は、１つ以上の核酸（例えば、ヌクレアーゼ、ＲＮＡガイド、ドナーＤＮＡなどをコードする核酸）、１つ以上のその転写物、及び／又は予め形成されたヌクレアーゼ／ＲＮＡガイド複合体を細胞に送達することを含む。例示的な細胞内送達方法は、ウイルス又はウイルス様物質；リン酸カルシウム、デンドリマー、リポソーム、又はカチオン性ポリマー（例えば、ＤＥＡＥ－デキストラン又はポリエチレンイミン）を使用するものなどの、化学ベースのトランスフェクション方法；マイクロインジェクション、エレクトロポレーション、細胞スクイージング（ｃｅｌｌｓｑｕｅｅｚｉｎｇ）、ソノポレーション、光学的トランスフェクション、インペイルフェクション、プロトプラスト融合、細菌接合、プラスミド又はトランスポゾンの送達などの非化学的方法；遺伝子銃、マグネクトフェクション又は磁性補助トランスフェクション、粒子衝撃を使用するなどの粒子ベースの方法；及びヌクレオフェクションなどのハイブリッド法を含むが、これらに限定されない。いくつかの実施形態において、本願は、そのような方法によって産生された細胞、及びそのような細胞を含むか、又はそのような細胞から産生された生物（動物、植物、又は真菌など）をさらに提供する。

本明細書において引用されるすべての参考文献及び刊行物は、参照によってこれによって援用される。

以下の例は、本発明のいくつかの実施形態をさらに例証するために提供され、本発明の範囲を限定することを意図するものではない；それらの例示的な内容によって、当業者らに知られている他の手順、方法論、又は技術が、代わりに使用されてもよいことが理解されるであろう。

実施例１－エフェクター配列の分析
本実施例において、配列番号１～３７及び配列番号２２１～２２４の配列のアミノ酸配列を、可能性として考えられる機能的タンパク質ドメインを同定するために分析した。アミノ酸配列は、Ｃ末端ＲｕｖＣドメインと思われるドメインを含むことが決定された。触媒残基は、ＲｕｖＣドメインの保存配列モチーフ（Ｉ、ＩＩ、及びＩＩＩ）中に存在することもまた決定された。３つの代表的なエフェクターの予測される触媒残基及びＲｕｖＣドメイン範囲を表７に示す。

図１Ａ～１Ｌにおいて示されるように、配列番号１～３７及び配列番号２２１～２２４のアミノ酸配列をさらにアラインメントして、配列類似性を有する領域を同定した。コンセンサス配列は、図１Ａ～１Ｌの上に記載される。コンセンサス配列の下にある棒グラフは、配列類似性を示し、最も高い棒は最も高い配列類似性を有する残基を示す。配列類似性の非限定的領域を表８に示す。

本実施例は、配列番号１～３７及び配列番号２２１～２２４のエフェクターが、ヌクレアーゼを代表する保存Ｃ末端ＲｕｖＣドメインを有するファミリーとして分類されたことを示す。

実施例２－大腸菌（Ｅ．ｃｏｌｉ）におけるエフェクターの発現
本実施例において、配列番号２、５～７、１０、１１、１３～２１、２３、２７、２８、３１、及び３４～３７のいずれか１つのエフェクターを個別に含むシステムを操作し、大腸菌（Ｅ．ｃｏｌｉ）に導入した。

各エフェクターについて、エフェクターをコードするポリヌクレオチドを、大腸菌（Ｅ．ｃｏｌｉ）についてコドン最適化し、合成し（Ｇｅｎｓｃｒｉｐｔ）、ｐＥＴ－２８ａ（＋）に由来する特注の発現系（ＥＭＤ－Ｍｉｌｌｉｐｏｒｅ）に、個別にクローニングした。ベクターは、ｌａｃプロモーターのコントロール下の各エフェクターをコードするポリヌクレオチド及び大腸菌（Ｅ．ｃｏｌｉ）リボソーム結合配列を含んだ。ベクターは、エフェクターのオープンリーディングフレームに続くＪ２３１１９プロモーターによって駆動されるｐｒｅ－ｃｒＲＮＡ（ダイレクトリピート－スペーサー－ダイレクトリピート）の部位も含んだ。各エフェクターについて、テストしたダイレクトリピート配列が表４に記載される。スペーサーは、ｐＡＣＹＣ１８４プラスミド及び大腸菌（Ｅ．ｃｏｌｉ）の必須遺伝子の配列を標的とするように設計された。

エフェクター／ｐｒｅ－ｃｒＲＮＡプラスミドを、Ｅ．Ｃｌｏｎｉ大腸菌（Ｅ．ｃｏｌｉ）エレクトロコンピテント（Ｌｕｃｉｇｅｎ）にエレクトロポレーションした。エフェクター／ｐｒｅ－ｃｒＲＮＡプラスミドを、精製ｐＡＣＹＣ１８４プラスミドで同時形質転換するか、又はｐＡＣＹＣ１８４含有Ｅ．Ｃｌｏｎｉ大腸菌（Ｅ．ｃｏｌｉ）エレクトロコンピテント（Ｌｕｃｉｇｅｎ）に直接形質転換し、適切な抗生物質を含有する寒天上で平板培養し、３７℃で１０～１２時間インキュベートした。

大腸菌（Ｅ．ｃｏｌｉ）における操作されたエフェクター／ｐｒｅ－ｃｒＲＮＡシステムの活性の代用となるものについて調査し、ここで、細菌細胞死は、システム活性の代用となるものとして使用した。ｐｒｅ－ｃｒＲＮＡと関連する活性エフェクターは、スペーサー配列標的、例えば、ｐＡＣＹＣ１８４プラスミド配列又は大腸菌（Ｅ．ｃｏｌｉ）必須遺伝子の発現を破壊し、細胞死をもたらし得る。この代用となるものを使用して、本明細書において開示されるエフェクターが、大腸菌（Ｅ．ｃｏｌｉ）において活性を有することが決定された。

ゆえに、本実施例は、配列番号２、５～７、１０、１１、１３～２１、２３、２７、２８、３１、及び３４～３７のエフェクターが細菌細胞において発現され得ることを示唆する。ｐｒｅ－ｃｒＲＮＡ（ダイレクトリピート－スペーサー－ダイレクトリピート）では、配列番号２、５～７、１０、１１、１３－２１、２３、２７、２８、３１、及び３４～３７のエフェクターが細菌細胞において活性を有することが示された。

実施例３－配列番号２のエフェクターの精製
本実施例は、配列番号２のエフェクターの発現及び精製を記載する。

ＮＥＢＮｉＣｏ２１（ＤＥ３）細胞を、配列番号２のエフェクターのＨｉｓタグバージョンをコードするポリヌクレオチドを含む発現プラスミドで形質転換した。ＯＤ_６００が０．６～１．０に達するまで、細胞を３７℃で成長させた。培養物にＩＰＴＧを最終濃度０．２ｍＭで追加し、１６℃で１２～１６時間、細胞成長を継続した。次いで、細胞をペレット化し、１００ｍＬのバッファーＡ（５０ｍＭＨＥＰＥＳＫＯＨｐＨ７．８、５００ｍＭＮａＣｌ、１０ｍＭＭｇＣｌ_２、２０ｍＭイミダゾール、１４ｍＭ β－メルカプトエタノール、及び５％グリセロール）に再懸濁した。再懸濁した細胞を４℃で３０～４５分間混合し、続いて、高圧細胞破砕器を使用して溶解した。溶解した細胞を４５，０００×ｇ、４℃で３０分間遠心分離し、上清を新しいチューブに移し、４５，０００×ｇ、４℃で３０分間遠心分離した。

次に、上清をＨｉｓＴｒａｐＮｉｃｋｅｌ５ｍＬカラムに注ぎ、溶出したタンパク質画分をＳＤＳ－ＰＡＧＥで分析した。次いで、精製エフェクタータンパク質を含む画分を合わせ、１０ｋＤａＭＷＣＯを使用して透析し、濃縮した。ブラッドフォードアッセイを用いて最終タンパク質濃度を測定した。

ゆえに、本実施例は、配列番号２のエフェクターを発現させ、ヌクレアーゼ活性アッセイのために精製することができたことを説明し、これは次の実施例において記載される。

実施例４－配列番号２のエフェクターによる二本鎖ＤＮＡ切断
本実施例は、配列番号２のエフェクターによる二本鎖ＤＮＡ（ｄｓＤＮＡ）切断について説明する。

配列番号２のエフェクターのＲＮＡガイドは、インビトロ転写（ＩＶＴ）を使用して調製した。配列番号２０３において記載される配列番号２０２のＲＮＡガイドのスペーサー配列は、標的Ａ（配列番号２０１）に相補的であるように設計された。標的Ｂ（配列番号２０４）は、スペーサー配列（配列番号２０３）に対して相補性を有しておらず、ゆえに、非標的コントロールとして使用した。表９における標的Ａ（配列番号２０１）の太字部分は、配列番号２０２の成熟ｃｒＲＮＡが結合する配列に対応する。ＩＶＴ反応用のｄｓＤＮＡ鋳型は、第二鎖補充法を使用して調製した。Ｔ７プロモーター配列を含有するオリゴ鋳型は市販用に合成され（ＩＤＴ）、リバースプライマーにアニーリングされた後、第２鎖を補充するために伸長された（クレノウポリメラーゼ、大断片、ＮＥＢ）。ＩＶＴは、ｄｓＤＮＡ鋳型を、Ｔ７ＲＮＡポリメラーゼ（ＨｉＳｃｒｉｂｅＴ７ＱｕｉｃｋＨｉｇｈＹｉｅｌｄＲＮＡｓｙｎｔｈｅｓｉｓｋｉｔＮＥＢ）と共にインキュベートすることによって実行し、その後、ＤＮＡ鋳型を除去するために、ＤＮａｓｅ（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ）により処理した。ＩＶＴ産物を、ＲＮＡ調製キット（ＺｙｍｏＲｅｓｅａｒｃｈ）を使用してクリーニングした。

ＩＲ８００標識フォワードプライマー（ＩＤＴ）及びＩＲ７００標識リバースプライマー（ＩＤＴ）を使用して、二重標識ｄｓＤＮＡ標的（標的Ａ）及び非標的（標的Ｂ）基質を、ＰＣＲを介して生成した。得られたＰＣＲ産物は、図３Ａにおいて示されるように、非スペーサー相補（ＮＳＣ）鎖上のＩＲ７００標識及びスペーサー相補鎖上のＩＲ８００標識を含んだ。これらの基質はＳＰＲＩビーズ（Ａｇｉｌｅｎｔ）を使用して精製され、濃度はｎａｎｏｄｒｏｐ（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ）を使用して測定された。ＩＲ７００及びＩＲ８００標識は、クロスオーバーなく別々の蛍光チャネルにおいて視覚化でき、ゆえに、標的の両方の鎖の切断を視覚化できた。

ｄｓＤＮＡ標的切断アッセイは、反応バッファー（１ＸＮＥＢｕｆｆｅｒ２、ＮＥＢ）において調整した。複合ＲＮＰ（エフェクターとＲＮＡガイド）は、精製されたエフェクターをＲＮＡガイドと１：２の比率でインキュベートすることによって形成した。複合体を形成したＲＮＰを、次いで、４０ｎＭｄｓＤＮＡ基質に追加し、インキュベートした。エフェクターなしの又はＲＮＡガイドなしのネガティブコントロールもまた、テストした。反応物をＲＮａｓｅカクテルで処理し、インキュベートした後、プロテイナーゼＫで処理し、インキュベートした。

ｄｓＤＮＡ切断を検出するために、反応由来のＤＮＡ産物を、１５％ＴＢＥ－尿素ゲルで分析した。ゲルは、ＩＲ８００及びＩＲ７００の両方の蛍光について、蛍光デジタル画像処理システム（ＬＩ－ＣＯＲＢｉｏｓｃｉｅｎｃｅｓ）で画像処理した。

図３Ｂ及び図３Ｃにおいて示されるように、配列番号２のエフェクター及び配列番号２０２のＲＮＡガイドを含むＲＮＰを使用して、標的特異的な二本鎖切断が観察された。図３Ｂは、ｄｓＤＮＡ標的のスペーサー相補鎖の切断を示し（ＩＲ８００画像）、図３Ｃは、ｄｓＤＮＡ標的の非スペーサー相補鎖の切断を示す（ＩＲ７００画像）。図３Ｂのレーン６～９及び図３Ｃのレーン６～９において示されるように、切断は、エフェクター濃度と正の相関があった。図３Ｂのレーン２～５及び図３Ｃのレーン２～５にそれぞれ示されるように、ＲＮＡガイドの非存在下及び／又はエフェクターの非存在下において、検出可能な切断活性は観察されなかった。さらに、検出可能な切断活性は、図３Ｄ及び図３Ｅにおいて示されるように、非ターゲティングＲＮＡガイドと複合体を形成した配列番号２のエフェクターについて観察されなかった。例えば、標的Ａのために設計されたＲＮＡガイドを使用した場合、標的Ｂスペーサー相補鎖（図３Ｄ）又は標的Ｂ非スペーサー相補鎖（図３Ｅ）について、検出可能な切断は観察されなかった。

ゆえに、本実施例は、配列番号２のエフェクターがヌクレアーゼ活性を有し、標的特異的ｄｓＤＮＡ切断を触媒することを示す。

実施例５－配列番号２のエフェクターによる一本鎖ＤＮＡ切断
本実施例は、配列番号２のエフェクターによる一本鎖ＤＮＡ（ｓｓＤＮＡ）切断について説明する。

図４Ａにおいて示されるように標識ｓｓＤＮＡ標的を生成するために、メーカーのプロトコールに従って、５’標識キット（ＶｅｃｔｏｒＬａｂｓ）を使用して、ＩＤＴのｓｓＤＮＡオリゴを近赤外蛍光色素（ＩＲ－８００）で標識した。ｓｓＤＮＡ標的切断アッセイは、実施例４において記載されるように、反応バッファー（ＮＥＢｕｆｆｅｒ２）において調整した。エフェクターなしの又は非標的ｓｓＤＮＡによるネガティブコントロールもまた、テストした。

ＲＮＰ複合体は、実施例４の（及び図４Ａにおいて示される）標的Ａの近赤外蛍光色素標識ｓｓＤＮＡ（配列番号２０１）を追加し、インキュベートする前に、配列番号２のエフェクターを、ＲＮＡガイド（配列番号２０２）と共に、アッセイバッファー中、１：２の比率でインキュベートすることにより、生成した。ネガティブコントロール非標的ｓｓＤＮＡ（配列番号２０４）を、同様に、配列番号２のエフェクター及び配列番号２０２のＲＮＡガイドを含むＲＮＰと共にインキュベートした。実施例４において記載されるように、反応物を最初にＲＮａｓｅカクテル及びプロテイナーゼＫで処理した。ｓｓＤＮＡ切断産物を検出するために、実施例４において記載されるように、反応を、１５％ＴＢＥ－尿素ゲルで分析し、画像処理した。

図４Ｂのレーン６～９において示されるように、全長のバンドが存在しないことによって証明される、標的特異的ｓｓＤＮＡ切断が観察された。図４Ｃのレーン６～９において示されるように、非標的ｓｓＤＮＡについて有意な切断は観察できない。配列番号２のエフェクターは、テストした最も低いＲＮＰ濃度でも完全な切断が観察されるように、ｓｓＤＮＡ標的に対する効率的な切断活性を示した（１２５ｎＭ－レーン６、図４Ｂ）。レーン２に示されるように、テストした最高のＲＮＰ濃度（１μＭ）でも、非標的ｓｓＤＮＡについて検出可能な切断産物は観察されなかった。

ゆえに、本実施例は、配列番号２のエフェクターがヌクレアーゼ活性を有し、標的特異的ｓｓＤＮＡ切断を触媒することを示す。

実施例６－配列番号２のエフェクターによるＧＦＰのインビトロターゲティング
本実施例は、配列番号２のエフェクターの活性を測定するための蛍光枯渇アッセイ（ＦＤＡ）の使用について記載する。

このアッセイでは、ＧＦＰを標的とするように設計された活性なＣＲＩＳＰＲシステムが、ＧＦＰをコードする二本鎖ＤＮＡ領域に結合し、切断し、ＧＦＰ蛍光の枯渇をもたらす。ＦＤＡアッセイは、インビトロ転写及び翻訳を含み、これにより、ダイレクトリピート（ＤＲ）－スペーサー－ダイレクトリピート（ＤＲ）（スペーサーはＧＦＰを標的とする）を有するＴ７プロモーター下で、ＣＬＵＳＴ．２００９１６エフェクターをコードするＤＮＡ鋳型、及びｐｒｅ－ｃｒＲＮＡ配列を含むＤＮＡ鋳型から、ＲＮＰの産生が可能となる。同じワンポット反応において、ＧＦＰ及びＲＦＰも、標的及び蛍光レポーターの両方として産生された（図５Ａ）。標的ＧＦＰプラスミド配列は、配列番号２０５において記載され、蛍光レポーターＲＦＰプラスミド配列は、配列番号２０６において記載される。ＧＦＰ及びＲＦＰ蛍光値は、ＴＥＣＡＮＩｎｆｉｎｉｔｅＦＰｌｅｘプレートリーダーを使用して、３７℃で１２時間、２０分ごとに測定した。ＲＦＰは標的とされていないため、その蛍光は影響を受けず、したがって、内部シグナルコントロールとして使用された。

配列番号２０５：

配列番号２０６：

配列番号２のエフェクターをスクリーニングするために、５つのＧＦＰ標的（＋１つの非標的）を設計した。ＦＤＡアッセイに使用されるＲＮＡガイド配列、標的配列、及び非標的コントロール配列を表１０において列挙する。表１０において示されるｐｒｅ－ｃｒＲＮＡ配列は、インビトロ転写及び翻訳混合物中に存在するヌクレアーゼによってＲＮＡが分解されないようにするため、５’末端のＴ７プロモーター、及びＲＮＡの３’末端をキャップするヘアピンモチーフをさらに含む。

ＧＦＰシグナルをＲＦＰシグナルに対して標準化した後、各時点で３つの技術的複製の平均蛍光を取得した。ＧＦＰ蛍光枯渇は、非ＧＦＰターゲティングＲＮＡガイド（代わりにカナマイシン耐性遺伝子を標的とする）とインキュベートしたエフェクターのＧＦＰシグナルを、ＧＦＰターゲティングＲＮＡガイドとインキュベートしたエフェクターのＧＦＰシグナルで割ることによって計算された。結果として得られる値は、図５Ｂにおいて「枯渇」と呼ばれる。

１又はおよそ１の枯渇は、非ＧＦＰターゲティングｐｒｅ－ｃｒＲＮＡ及びＧＦＰターゲティングｐｒｅ－ｃｒＲＮＡに関してＧＦＰ枯渇に違いがほとんどない～全くないことを示した（例えば、１０ＲＦＵ／１０ＲＦＵ＝１）。１を超える枯渇は、非ＧＦＰターゲティングｐｒｅ－ｃｒＲＮＡ及びＧＦＰターゲティングｐｒｅ－ｃｒＲＮＡに関してＧＦＰ枯渇に違いがあることを示した（例えば、１０ＲＦＵ／５ＲＦＵ＝２）。ＧＦＰシグナルの枯渇は、エフェクターが機能的なＲＮＰを形成し、ＧＦＰコード領域内に二本鎖ＤＮＡ切断を導入することによってＧＦＰの生成を妨害したことを示した。ＧＦＰ枯渇の程度は、配列番号２のエフェクターの特異的な活性と大きく相関していた。

図５Ｂは、各ＧＦＰ標的について２０分ごとに測定される値を使用して、配列番号２のエフェクターによって形成されるＲＮＰについての枯渇曲線を示す。各標的において、配列番号２のエフェクターで形成されたＲＮＰの枯渇値は１を超えるものであった。

これは、配列番号２のエフェクターが、ＧＦＰの産生を妨害できる機能的ＲＮＰを形成することを示した。

実施例７－配列番号２のエフェクターによる哺乳類遺伝子のターゲティング
本実施例は、一時的なトランスフェクションによって哺乳類細胞に導入した配列番号２のエフェクターによる哺乳類ＡＡＶＳ１標的についてのインデルについての判定を記載する。

配列番号２のエフェクターをｐｃｄａ３．１骨格（Ｉｎｖｉｔｒｏｇｅｎ）にクローニングした。プラスミドを、次いで、マキシプレップし、１μｇ／μＬまで希釈した。ＲＮＡガイドの調製のために、ＲＮＡガイドをコードするｄｓＤＮＡ断片を、標的配列骨格を含有するｕｌｔｒａｍｅｒ及びＵ６プロモーターから得た。Ｕｌｔｒａｍｅｒを、７．５のｐＨの１０ｍＭＴｒｉｓ・ＨＣｌ中で１００μＭの最終原液濃度まで再懸濁した。標準原液（ｗｏｒｋｉｎｇｓｔｏｃｋ）を、続いて、ここでも１０ｍＭＴｒｉｓ・ＨＣｌを使用して１０μＭまで希釈し、ＰＣＲ反応の鋳型として取り扱った。ＲＮＡガイドの増幅は、以下の構成要素を有する５０μＬ反応液中で行った：０．０２μｌの上述の鋳型、２．５μｌフォワードプライマー、２．５μｌリバースプライマー、２５μＬＮＥＢＨｉＦｉＰｏｌｙｍｅｒａｓｅ、及び２０μｌ水。サイクリング条件は、以下の通りとした：１×（９８℃で３０秒）、３０×（９８℃で１０秒、６７℃で１５秒）、１×（７２℃で２分）。ＰＣＲ産物は、１．８ＸＳＰＲＩ処理によりクリーニングし、２５ｎｇ／μＬに標準化した。テストしたＡＡＶＳ１標的遺伝子座の配列は、ＧＣＧＡＧＴＧＡＡＧＡＣＧＧＣＡＴＧＧ（配列番号２１８）であり、対応するｃｒＲＮＡ配列は、ＡＵＡＡＣＧＡＣＣＣＵＧＣＧＡＡＧＵＧＧＧＧＵＧＵＡＡＣＵＵＣＧＡＣＧＣＧＡＧＵＧＡＡＧＡＣＧＧＣＡＵＧＧ（配列番号２１９）であった。

トランスフェクションのおよそ１６時間前に、ＤＭＥＭ／１０％ＦＢＳ＋Ｐｅｎ／Ｓｔｒｅｐ中２５，０００ＨＥＫ２９３Ｔ細胞の１００μｌを、９６ウェルプレートの各ウェルで平板培養した。トランスフェクションの日に、細胞は、７０～９０％コンフルエントとした。トランスフェクトする各ウェルについて、０．５μｌのＬｉｐｏｆｅｃｔａｍｉｎｅ２０００及び９．５μｌのＯｐｔｉ－ＭＥＭの混合物を、調製し、次いで、５～２０分間、室温でインキュベートした（溶液１）。インキュベーション後、ｌｉｐｏｆｅｃｔａｍｉｎｅ：ＯｐｔｉＭＥＭ混合物を、１８２ｎｇのエフェクタープラスミド及び１４ｎｇのｃｒＲＮＡ及び１０μＬ以下の水を含有する別々の混合物に追加した（溶液２）。ネガティブコントロールの場合、ｃｒＲＮＡを、溶液２に含めなかった。溶液１及び溶液２の混合物を、上下にピペットすることによって混合し、次いで、２５分間、室温でインキュベートした。インキュベーション後に、２０μＬの溶液１及び溶液２の混合物を、細胞を含有する９６ウェルプレートの各ウェルに滴下した。トランスフェクションの７２時間後、細胞は、各ウェルの中心に１０μＬのＴｒｙｐＬＥを追加することによって、トリプシン処理し、およそ５分間インキュベートする。１００μＬのＤ１０培地を、次いで、各ウェルに追加し、細胞を再懸濁するために混合した。細胞を、次いで、１０分間、５００ｇで遠心沈殿し、上清を、廃棄した。ＱｕｉｃｋＥｘｔｒａｃｔバッファーを、元々の細胞懸濁液の体積の量の１／５まで追加した。細胞を、１５分間６５℃、１５分間６８℃、及び１０分間９８℃でインキュベートした。

次世代シークエンシングのためのサンプルを、２回のＰＣＲによって調製した。第１回（ＰＣＲ１）は、標的に依存する特異的なゲノム領域を増幅するために使用した。ＰＣＲ１産物は、カラム精製によって精製した。２回目のＰＣＲ（ＰＣＲ２）は、Ｉｌｌｕｍｉｎａアダプター及びインデックスを追加するために行った。反応を、次いで、プールし、カラム精製によって精製した。シークエンシングの実行は、１５０ｃｙｃｌｅＮｅｘｔＳｅｑｖ２．５ｍｉｄ又はｈｉｇｈｏｕｔｐｕｔｋｉｔにより行った。

図６は、配列番号２のエフェクターによるトランスフェクション後のＨＥＫ２９３Ｔ細胞におけるＡＡＶＳ１標的遺伝子座におけるインデルパーセントを示す。丸は２つの生物学的反復において測定されたインデルパーセントを反映し、バーは２つの生物学的反復において測定されたインデル平均パーセントを反映する。黒丸は配列番号２のエフェクターによって誘導されたインデルを表し、白丸はネガティブコントロールサンプルにおいて測定されたインデルを表す。配列番号２のエフェクターについて、インデルパーセントはネガティブコントロールのインデルパーセントよりも高かった。

本実施例は、配列番号２のエフェクターが哺乳動物細胞においてヌクレアーゼ活性を有することを示唆する。

Claims

（ａ）ヌクレアーゼ又は前記ヌクレアーゼをコードする核酸であって、前記ヌクレアーゼは、配列番号１～３７及び配列番号２２１～２２４のいずれか１つに対して少なくとも８０％の同一性を有するアミノ酸配列を含む、核酸；並びに
（ｂ）ＲＮＡガイド又は前記ＲＮＡガイドをコードする核酸であって、前記ＲＮＡガイドは、ダイレクトリピート配列及びスペーサー配列を含む、核酸
を含む組成物であって、
前記ヌクレアーゼは、前記ＲＮＡガイドに結合し、前記スペーサー配列は、標的核酸に結合する、組成物。
前記ヌクレアーゼは、ＲｕｖＣドメイン又は分断ＲｕｖＣドメインを含む、請求項１に記載の組成物。
前記ヌクレアーゼは、触媒残基（例えば、アスパラギン酸又はグルタミン酸）を含む、請求項１又は２に記載の組成物。
前記ヌクレアーゼが、以下の配列：
（ａ）Ｘ_１Ｘ_２Ｘ_３Ｘ_４ＧＸ_５Ｘ_６（配列番号２３３）（式中、Ｘ_１はＶ又はＡ又はＣであり、Ｘ_２はＹ又はＦであり、Ｘ_３はＫ又はＱであり、Ｘ_４はＹ又はＦであり、Ｘ_５はＬ又はＡ又はＭ又はＣ又はＴであり、Ｘ_６はＩ又はＶ又はＬである）；
（ｂ）ＬＸ_１ＮＸ_２ＬＶ（配列番号２３４）（式中、Ｘ_１はＷ又はＫ又はＲであり、Ｘ_２はＮ又はＴ又はＫ又はＳ又はＤ又はＱである）；
（ｃ）ＦＤＸ_１Ｘ_２Ｇ（配列番号２３５）（式中、Ｘ_１はＧ又はＹであり、Ｘ_２はＴ又はＳ又はＭである）；
（ｄ）Ｘ_１Ｘ_２ＨＲＸ_３Ｘ_４Ｐ（配列番号２３６）（式中、Ｘ_１はＩ又はＬ又はＶであり、Ｘ_２はＹ又はＬ又はＭ又はＦであり、Ｘ_３はＰ又はＨ又はＤ又はＥであり、Ｘ_４はＬ又はＩ又はＶ又はＭである）；
（ｅ）ＧＸ_１ＤＸ_２ＧＸ_３Ｒ（配列番号２３７）（式中、Ｘ_１はＩ又はＬ又はＶであり、Ｘ_２はＩ又はＶ又はＬであり、Ｘ_３はＦ又はＹである）；
（ｆ）ＲＸ_１Ｘ_２Ｘ_３ＹＲ（配列番号２３８）（式中、Ｘ_１はＫ又はＱ又はＥであり、Ｘ_２はＨ又はＤ又はＥであり、Ｘ_３はＦ又はＶ又はＬ又はＩである）；及び
（ｇ）Ｘ_１ＤＸ_２ＤＸ_３ＮＡＡＸ_４Ｎ（配列番号２３９）（式中、Ｘ_１はＨ又はＹであり、Ｘ_２はＲ又はＱ又はＶであり、Ｘ_３はＥ又はＴ又はＩ又はＨ又はＫ又はＱ又はＤであり、Ｘ_４はＮ又はＲ又はＩ又はＶ又はＫである）
の一つ以上を含む、請求項１～３のいずれか一項に記載の組成物。
前記ヌクレアーゼが、配列番号１～３７及び配列番号２２１～２２４のいずれか１つに対して少なくとも９５％の同一性を有するアミノ酸配列を含む、請求項１～４のいずれか一項に記載の組成物。
前記ヌクレアーゼが、配列番号１～３７及び配列番号２２１～２２４のいずれか１つにおいて記載されるアミノ酸配列を含む、請求項１～５のいずれか一項に記載の組成物。
前記組成物が、ｔｒａｃｒＲＮＡを含まない、請求項１～６のいずれか一項に記載の組成物。
前記ダイレクトリピート配列が、以下の配列：
（ａ）Ｘ_１Ｘ_２ＣＣＣＴＸ_３（配列番号２４０）（式中、Ｘ_１はＧ又はＡであり、Ｘ_２はＡ又はＣであり、Ｘ_３はＧ又はＡである）；及び
（ｂ）Ｘ_１ＧＧＧＸ_２Ｘ_３Ｘ_４Ｘ_５Ｘ_６Ａ（配列番号２４１）（式中、Ｘ_１はＴ又はＧであり、Ｘ_２はＴ又はＧであり、Ｘ_３はＴ又はＧであり、Ｘ_４はＡ又はＧであり、Ｘ_５はＴ又はＡであり、Ｘ_６はＡ又はＧ又はＣである）
の一つ以上を含む、請求項１～７のいずれか一項に記載の組成物。
前記ダイレクトリピート配列が、配列番号３８～１２６のいずれか１つに対して少なくとも９５％の配列同一性を有するヌクレオチド配列を含む、請求項１～８のいずれか一項に記載の組成物。
前記ダイレクトリピート配列は、配列番号３８～１２６のいずれか１つにおいて記載されるヌクレオチド配列を含む、請求項１～９のいずれか一項に記載の組成物。
前記スペーサー配列は、長さが１５～２４の間のヌクレオチドを含む、請求項１～１０のいずれか一項に記載の組成物。
前記標的核酸は、前記スペーサー配列中のヌクレオチド配列に対して相補的な配列を含む、請求項１～１１のいずれか一項に記載の組成物。
前記標的核酸が、プロトスペーサー隣接モチーフ（ＰＡＭ）配列に隣接しており、前記ＰＡＭ配列が、５’－ＣＮ－３’、５’－ＣＣＮ－３’、５’－ＮＣＮ－３’、５’－ＮＣＣＮ－３’、又は５’－ＮＮＣＮ－３’として記載されるヌクレオチド配列を含み、式中、「Ｎ」は任意の核酸塩基である、請求項１～１２のいずれか一項に記載の組成物。
前記ＰＡＭ配列が、５’－ＡＣＣＮ－３’、５’－ＤＣＣＮ－３’、５’－ＤＴＴＮ－３’、５’－ＤＹＹＮ－３’、５’－ＧＣＣＮ－３’、５’－ＧＴＴＮ－３’、５’－ＧＹＹＮ－３’、５’－ＨＣＮ－３’、５’－ＨＮＣＮ－３’、５’－ＨＮＣＲ－３’、５’－ＨＮＣＶ－３’、５’－ＲＣＣＮ－３’、５’－ＲＣＣＲ－３’、５’－ＲＹＣＮ－３’、５’－ＴＮＣＮ－３’として記載されるヌクレオチド配列を含み、式中、「Ｄ」はＡ又はＧ又はＴであり、「Ｈ」はＡ又はＣ又はＴであり、「Ｎ」は任意の核酸塩基であり、「Ｒ」はＡ又はＧであり、「Ｖ」はＡ又はＣ又はＧであり、「Ｙ」はＣ又はＴである、請求項１３に記載の組成物。
前記ＰＡＭ配列が、５’－ＣＣＡ－３’、５’－ＣＣＣ－３’、５’－ＣＣＴ－３’、５’－ＣＣＧ－３’、５’－ＡＣＣＧ－３’、５’－ＣＣＣＡ－３’、５’－ＣＣＣＧ－３’、５’－ＴＣＣＡ－３’、又は５’－ＴＣＣＴ－３’として記載されるヌクレオチド配列を含む、請求項１３に記載の組成物。
前記ヌクレアーゼは、前記標的核酸を切断する、請求項１～１５のいずれか一項に記載の組成物。
前記標的核酸は、一本鎖ＤＮＡ又は二本鎖ＤＮＡである、請求項１～１６のいずれか一項に記載の組成物。
前記組成物は、基準組成物よりも少なくとも１０％大きな酵素活性、例えば、基準組成物のヌクレアーゼ活性よりも少なくとも１０％大きなヌクレアーゼ活性を含む、請求項１～１７のいずれか一項に記載の組成物。
前記ヌクレアーゼが、ペプチドタグ、蛍光タンパク質、塩基編集ドメイン、ＤＮＡメチル化ドメイン、ヒストン残基修飾ドメイン、局在化因子、転写修飾因子、光作動性制御因子、化学的誘導性因子、又はクロマチン可視化因子をさらに含む、請求項１～１８のいずれか一項に記載の組成物。
前記ヌクレアーゼをコードする前記核酸が、細胞における発現のためにコドン最適化される、請求項１～１９のいずれか一項に記載の組成物。
前記ヌクレアーゼをコードする前記核酸が、プロモーターに作動可能に連結される、請求項１～２０のいずれか一項に記載の組成物。
前記ヌクレアーゼをコードする前記核酸が、ベクター中にある、請求項１～２１のいずれか一項に記載の組成物。
前記ベクターが、レトロウイルスベクター、レンチウイルスベクター、ファージベクター、アデノウイルスベクター、アデノ随伴ベクター、又は単純ヘルペスベクターを含む、請求項２２に記載の組成物。
前記組成物が、ナノ粒子、リポソーム、エキソソーム、微小胞、又は遺伝子銃を含む送達媒体中に存在する、請求項１～２３のいずれか一項に記載の組成物。
請求項１～２４のいずれか一項に記載の組成物を含む、細胞。
前記細胞が、真核細胞又は原核細胞である、請求項２５に記載の細胞。
前記細胞が、哺乳類細胞又は植物細胞である、請求項２５に記載の細胞。
前記細胞が、ヒト細胞である、請求項２５に記載の細胞。
請求項１～２８のいずれか一項に記載の組成物を細胞中の前記標的核酸に結合させるための方法であって、
（ａ）前記組成物を提供すること；及び
（ｂ）前記組成物を前記細胞に送達すること
を含み、前記細胞が、前記標的核酸を含み、前記ヌクレアーゼが、前記ＲＮＡガイドに結合し、前記スペーサー配列が、前記標的核酸に結合する、方法。
（ａ）ヌクレアーゼ又は前記ヌクレアーゼをコードする核酸であって、前記ヌクレアーゼが、配列番号２と少なくとも８０％の同一性を有するアミノ酸配列を含む、核酸；及び
（ｂ）ＲＮＡガイド又は前記ＲＮＡガイドをコードする核酸であって、前記ＲＮＡガイドが、ダイレクトリピート配列及びスペーサー配列を含む、核酸
を含む組成物であって、前記ヌクレアーゼが、前記ＲＮＡガイドに結合し、前記スペーサー配列が、標的核酸に結合する、組成物。
前記ヌクレアーゼが、ＲｕｖＣドメイン又は分断ＲｕｖＣドメインを含む、請求項３０に記載の組成物。
前記ヌクレアーゼが、触媒残基（例えば、アスパラギン酸又はグルタミン酸）を含む、請求項３０又は３１に記載の組成物。
前記ヌクレアーゼが、以下の配列：
（ａ）Ｘ_１Ｘ_２Ｘ_３Ｘ_４ＧＸ_５Ｘ_６（配列番号２３３）（式中、Ｘ_１はＶ又はＡ又はＣであり、Ｘ_２はＹ又はＦであり、Ｘ_３はＫ又はＱであり、Ｘ_４はＹ又はＦであり、Ｘ_５はＬ又はＡ又はＭ又はＣ又はＴであり、Ｘ_６はＩ又はＶ又はＬである）；
（ｂ）ＬＸ_１ＮＸ_２ＬＶ（配列番号２３４）（式中、Ｘ_１はＷ又はＫ又はＲであり、Ｘ_２はＮ又はＴ又はＫ又はＳ又はＤ又はＱである）；
（ｃ）ＦＤＸ_１Ｘ_２Ｇ（配列番号２３５）（式中、Ｘ_１はＧ又はＹであり、Ｘ_２はＴ又はＳ又はＭである）；
（ｄ）Ｘ_１Ｘ_２ＨＲＸ_３Ｘ_４Ｐ（配列番号２３６）（式中、Ｘ_１はＩ又はＬ又はＶであり、Ｘ_２はＹ又はＬ又はＭ又はＦであり、Ｘ_３はＰ又はＨ又はＤ又はＥであり、Ｘ_４はＬ又はＩ又はＶ又はＭである）；
（ｅ）ＧＸ_１ＤＸ_２ＧＸ_３Ｒ（配列番号２３７）（式中、Ｘ_１はＩ又はＬ又はＶであり、Ｘ_２はＩ又はＶ又はＬであり、Ｘ_３はＦ又はＹである）；
（ｆ）ＲＸ_１Ｘ_２Ｘ_３ＹＲ（配列番号２３８）（式中、Ｘ_１はＫ又はＱ又はＥであり、Ｘ_２はＨ又はＤ又はＥであり、Ｘ_３はＦ又はＶ又はＬ又はＩである）；及び
（ｇ）Ｘ_１ＤＸ_２ＤＸ_３ＮＡＡＸ_４Ｎ（配列番号２３９）（式中、Ｘ_１はＨ又はＹであり、Ｘ_２はＲ又はＱ又はＶであり、Ｘ_３はＥ又はＴ又はＩ又はＨ又はＫ又はＱ又はＤであり、Ｘ_４はＮ又はＲ又はＩ又はＶ又はＫである）
の一つ以上を含む、請求項３０～３２のいずれか一項に記載の組成物。
前記ヌクレアーゼが、配列番号２に対して少なくとも９５％の同一性を有するアミノ酸配列を含む、請求項３０～３３のいずれか一項に記載の組成物。
前記ヌクレアーゼが、配列番号２において記載される前記アミノ酸配列を含む、請求項３０～３４のいずれか一項に記載の組成物。
前記組成物が、ｔｒａｃｒＲＮＡを含まない、請求項３０～３５のいずれか一項に記載の組成物。
前記ダイレクトリピート配列が、以下の配列：
（ａ）Ｘ_１Ｘ_２ＣＣＣＴＸ_３（配列番号２４０）（式中、Ｘ_１はＧ又はＡであり、Ｘ_２はＡ又はＣであり、Ｘ_３はＧ又はＡである）；及び
（ｂ）Ｘ_１ＧＧＧＸ_２Ｘ_３Ｘ_４Ｘ_５Ｘ_６Ａ（配列番号２４１）（式中、Ｘ_１はＴ又はＧであり、Ｘ_２はＴ又はＧであり、Ｘ_３はＴ又はＧであり、Ｘ_４はＡ又はＧであり、Ｘ_５はＴ又はＡであり、Ｘ_６はＡ又はＧ又はＣである）
の一つ以上を含む、請求項３０～３６のいずれか一項に記載の組成物。
前記ダイレクトリピート配列が、配列番号４０又は配列番号４１に対して少なくとも９５％の配列同一性を有するヌクレオチド配列を含む、請求項３０～３７のいずれか一項に記載の組成物。
前記ダイレクトリピート配列が、配列番号４０又は配列番号４１において記載されるヌクレオチド配列を含む、請求項３０～３８のいずれか一項に記載の組成物。
前記ダイレクトリピート配列が、配列番号１１１に対して少なくとも９５％の配列同一性を有するヌクレオチド配列を含む、請求項３０～３７のいずれか一項に記載の組成物。
前記ダイレクトリピート配列が、配列番号１１１において記載される前記ヌクレオチド配列を含む、請求項３０～３７又は４０のいずれか一項に記載の組成物。
前記スペーサー配列が、長さが１５～２４の間のヌクレオチドを含む、請求項３０～４１のいずれか一項に記載の組成物。
前記スペーサー配列が、長さが約１９又は２０のヌクレオチドを含む、請求項３０～４２のいずれか一項に記載の組成物。
前記標的核酸が、前記スペーサー配列中のヌクレオチド配列に対して相補的な配列を含む、請求項３０～４３のいずれか一項に記載の組成物。
前記標的核酸が、ＰＡＭ配列に隣接しており、前記ＰＡＭ配列が、５’－ＣＮ－３’、５’－ＣＣＮ－３’、５’－ＮＣＮ－３’、５’－ＮＣＣＮ－３’、又は５’－ＮＮＣＮ－３’として記載されるヌクレオチド配列を含み、式中、「Ｎ」は任意の核酸塩基である、請求項３０～４４のいずれか一項に記載の組成物。
前記ＰＡＭ配列が、５’－ＡＣＣＮ－３’、５’－ＤＣＣＮ－３’、５’－ＤＴＴＮ－３’、５’－ＤＹＹＮ－３’、５’－ＧＣＣＮ－３’、５’－ＧＴＴＮ－３’、５’－ＧＹＹＮ－３’、５’－ＨＣＮ－３’、５’－ＨＮＣＮ－３’、５’－ＨＮＣＲ－３’、５’－ＨＮＣＶ－３’、５’－ＲＣＣＮ－３’、５’－ＲＣＣＲ－３’、５’－ＲＹＣＮ－３’、５’－ＴＮＣＮ－３’として記載されるヌクレオチド配列を含み、式中、「Ｄ」はＡ又はＧ又はＴであり、「Ｈ」はＡ又はＣ又はＴであり、「Ｎ」は任意の核酸塩基であり、「Ｒ」はＡ又はＧであり、「Ｖ」はＡ又はＣ又はＧであり、「Ｙ」はＣ又はＴである、請求項４５に記載の組成物。
前記ＰＡＭ配列が、５’－ＣＣＡ－３’、５’－ＣＣＣ－３’、５’－ＣＣＴ－３’、５’－ＣＣＧ－３’、５’－ＡＣＣＧ－３’、５’－ＣＣＣＡ－３’、５’－ＣＣＣＧ－３’、５’－ＴＣＣＡ－３’、又は５’－ＴＣＣＴ－３’として記載されるヌクレオチド配列を含む、請求項４５に記載の組成物。
前記ヌクレアーゼが、前記標的核酸を切断する、請求項３０～４７のいずれか一項に記載の組成物。
前記標的核酸が、一本鎖ＤＮＡ又は二本鎖ＤＮＡである、請求項３０～４８のいずれか一項に記載の組成物。
前記組成物が、基準組成物よりも少なくとも１０％大きな酵素活性、例えば、基準組成物のヌクレアーゼ活性よりも少なくとも１０％大きなヌクレアーゼ活性を含む、請求項３０～４９のいずれか一項に記載の組成物。
前記ヌクレアーゼが、ペプチドタグ、蛍光タンパク質、塩基編集ドメイン、ＤＮＡメチル化ドメイン、ヒストン残基修飾ドメイン、局在化因子、転写修飾因子、光作動性制御因子、化学的誘導性因子、又はクロマチン可視化因子をさらに含む、請求項３０～５０のいずれか一項に記載の組成物。
前記ヌクレアーゼをコードする前記核酸は、細胞における発現のためにコドン最適化される、請求項３０～５１のいずれか一項に記載の組成物。
前記ヌクレアーゼをコードする前記核酸は、プロモーターに作動可能に連結される、請求項３０～５２のいずれか一項に記載の組成物。
前記ヌクレアーゼをコードする前記核酸は、ベクター中にある、請求項３０～５３のいずれか一項に記載の組成物。
前記ベクターは、レトロウイルスベクター、レンチウイルスベクター、ファージベクター、アデノウイルスベクター、アデノ随伴ベクター、又は単純ヘルペスベクターを含む、請求項５４に記載の組成物。
前記組成物は、ナノ粒子、リポソーム、エキソソーム、微小胞、又は遺伝子銃を含む送達媒体中に存在する、請求項３０～５５のいずれか一項に記載の組成物。
請求項３０～５６のいずれか一項に記載の組成物を含む細胞。
前記細胞が、真核細胞又は原核細胞である、請求項５７に記載の細胞。
前記細胞が、哺乳類細胞又は植物細胞である、請求項５７に記載の細胞。
前記細胞が、ヒト細胞である、請求項５７に記載の細胞。
請求項３０～６０のいずれか一項に記載の組成物を細胞中の前記標的核酸に結合させるための方法であって、
（ａ）前記組成物を提供すること；及び
（ｂ）前記組成物を前記細胞に送達すること
を含み、前記細胞が、前記標的核酸を含み、前記ヌクレアーゼが、前記ＲＮＡガイドに結合し、前記スペーサー配列が、前記標的核酸に結合する、方法。