JP2022552409A

JP2022552409A - Ｃａｓ１２ａヌクレアーゼの変異体ならびにその作製方法および使用方法

Info

Publication number: JP2022552409A
Application number: JP2022523132A
Authority: JP
Inventors: ジョセフマシューワッツ; サシャシーラジャリ
Original assignee: ペアーワイズプランツサービシズ，インコーポレイテッド
Priority date: 2019-10-17
Filing date: 2020-10-15
Publication date: 2022-12-15
Also published as: US20240076639A1; KR20220097408A; US11866745B2; BR112022007125A2; IL292117A; MX2022004549A; US20240076640A1; US20210115421A1; AU2020366358A1; EP4045643A4; CA3157707A1; WO2021076682A1; CN114829595A; CL2022000937A1; EP4045643A1

Abstract

本発明は、変更されたプロトスペーサー隣接モチーフ認識特異性を有するＣａｓ１２ａヌクレアーゼの変異体に関する。本発明はさらに、ＣＲＩＳＰＲ－ＣＡＳヌクレアーゼ変異体を作製する方法および変異体を用いて核酸を改変する方法に関する。【選択図】図１

Description

［配列リストの電子出願に関する陳述］
連邦規則法典第３７巻１．８２１条の下で提出されたＡＳＣＩＩテキスト形式の配列リストであって、２０２０年１０月１３日に作成されてＥＦＳ－Ｗｅｂを介して提出された、２５７，７７４バイトのサイズの１４９９．７ＷＯ＿ＳＴ２５．ｔｘｔと題されたものは、紙のコピーの代わりに提供される。この配列リストは、その開示に関して参照により本明細書中に援用される。

［優先権の陳述］
本出願は、合衆国法典第３５巻第１１９条（ｅ）の下で、２０１９年１０月１７日に出願された米国仮出願番号６２／９１６，３９２の利益を主張し、その内容全体は参照により本明細書中に援用される。

［本発明の分野］
本発明は、変更されたプロトスペーサー隣接モチーフ認識特異性を有するＣａｓ１２ａＣＲＩＳＰＲ－Ｃａｓヌクレアーゼの変異体に関する。本発明はさらに、ＣＲＩＳＰＲ－ＣＡＳヌクレアーゼ変異体を作製する方法、および、変異体を用いて核酸を改変する方法に関する。

ゲノム編集／改変は、標的のゲノム位置にバリエーションを導入するために、部位特異的ヌクレアーゼ、例えば、ＣＲＩＳＰＲ－Ｃａｓヌクレアーゼを利用するプロセスである。最も広く使用されるゲノム改変のためのヌクレアーゼであるＣａｓ９は、ＮＧＧモチーフ（例えば、プロトスペーサー隣接モチーフ（ＰＡＭ））の上流のゲノム領域において突然変異を導入することができる。他のＣａｓヌクレアーゼは、異なるＰＡＭ認識特異性を有する。これらのヌクレアーゼのＰＡＭ特異性が特に厳密である場合、それらは、そのヌクレアーゼによる改変に利用可能なゲノム標的部位の数を制限することにより、ゲノム改変のためのヌクレアーゼの有用性を減少させ得る。

当該分野における短所を対処するために、本発明は、改善されたＰＡＭ特異性を有する改変されたＣＲＩＳＰＲ－Ｃａｓヌクレアーゼ、およびそのようなＣＲＩＳＰＲ－Ｃａｓヌクレアーゼを設計、特定、および選択するための方法を提供する。

本発明の一態様は、改変されたＬａｃｈｎｏｓｐｉｒａｃｅａｅｂａｃｔｅｒｉｕｍＣＲＩＳＰＲ（ＣｌｕｓｔｅｒｅｄＲｅｇｕｌａｒｌｙＩｎｔｅｒｓｐａｃｅｄＳｈｏｒｔＰａｌｉｎｄｒｏｍｉｃＲｅｐｅａｔｓ）Ｃａｓ１２ａ（ＬｂＣａｓ１２ａ）ポリペプチドを提供し、ここで、改変されたＬｂＣａｓ１２ａポリペプチドは、配列番号１（ＬｂＣａｓ１２ａ）のアミノ酸配列と少なくとも８０％同一性および配列番号１の位置ナンバリングに関して以下の位置：Ｋ１１６、Ｋ１２０、Ｋ１２１、Ｄ１２２、Ｅ１２５、Ｔ１４８、Ｔ１４９、Ｔ１５２、Ｄ１５６、Ｅ１５９、Ｑ５２９、Ｇ５３２、Ｄ５３５、Ｋ５３８、Ｄ５４１、Ｙ５４２、Ｌ５８５、Ｋ５９１、Ｍ５９２、Ｋ５９５、Ｖ５９６、Ｓ５９９、Ｋ６００、Ｋ６０１、Ｙ６１６、Ｙ６４６、および／またはＷ６４９の１つまたは複数（例えば、１、２、３、４、５、６、７、８、９、１０、１１、１２、１３またはそれよりも多く）における任意の組み合わせでの突然変異（配列番号１の位置ナンバリングに関して以下の位置：Ｋ１１６、Ｋ１２０、Ｋ１２１、Ｄ１２２、Ｅ１２５、Ｔ１５２、Ｄ１５６、Ｅ１５９、Ｇ５３２、Ｄ５３５、Ｋ５３８、Ｄ５４１、および／またはＫ５９５の１つまたは複数における任意の組み合わせでの突然変異であってもよい）を有する、アミノ酸配列を含む、から本質的になる、またはからなる。

本発明の第２の態様は、以下を含むＶ型ＣｌｕｓｔｅｒｅｄＲｅｇｕｌａｒｌｙＩｎｔｅｒｓｐａｃｅｄＳｈｏｒｔＰａｌｉｎｄｒｏｍｉｃＲｅｐｅａｔｓ（ＣＲＩＳＰＲ）関連（Ｃａｓ）（ＣＲＩＳＰＲ－Ｃａｓ）システムを提供する：（ａ）（ｉ）本発明の改変されたＬｂＣａｓ１２ａポリペプチドまたは本発明の改変されたＬｂＣａｓ１２ａポリペプチドをコードする核酸、および（ｉｉ）目的ポリペプチドまたは目的ポリペプチドをコードする核酸を含む、融合タンパク質；および（ｂ）スペーサー配列とリピート配列とを含むガイド核酸（ＣＲＩＳＰＲＲＮＡ、ＣＲＩＳＰＲＤＮＡ、ｃｒＲＮＡ、ｃｒＤＮＡ）、ここで、ガイド核酸は、改変されたＬｂＣａｓ１２ａポリペプチドまたは融合タンパク質と複合体を形成することが可能であり、スペーサー配列は、標的核酸にハイブリダイズすることが可能であり、それにより、改変されたＬｂＣａｓ１２ａポリペプチドおよび目的ポリペプチドを標的核酸にガイドし、それにより、標的核酸が改変または調整される。

本発明の第３の態様は、標的核酸を改変する方法を提供し、その方法は、標的核酸を、（ａ）（ｉ）本発明の改変されたＬｂＣａｓ１２ａポリペプチド、または本発明の改変されたＬｂＣａｓ１２ａポリペプチドを含む融合タンパク質、および（ｉｉ）ガイド核酸（例えば、ＣＲＩＳＰＲＲＮＡ、ＣＲＩＳＰＲＤＮＡ、ｃｒＲＮＡ、ｃｒＤＮＡ）；（ｂ）本発明の改変されたＬｂＣａｓ１２ａポリペプチドおよびガイド核酸を含む複合体；（ｃ）（ｉ）本発明の改変されたｌｂＣａｓ１２ａポリペプチド、または本発明の融合タンパク質、および（ｉｉ）ガイド核酸を含む組成物；および／または、（ｄ）本発明のシステムと接触させるステップを含み、それにより標的核酸を改変する。

本発明の第４の態様は、標的核酸を改変する方法を提供し、その方法は、標的核酸を含む細胞または無細胞系を、（ａ）（ｉ）本発明の改変されたＬｂＣａｓ１２ａポリペプチドをコードするポリヌクレオチド、またはそれを含む発現カセットまたはベクター、および（ｉｉ）ガイド核酸、またはそれを含む発現カセットまたはベクター；および／または（ｂ）（ｉ）本発明の改変されたＬｂＣａｓ１２ａポリペプチドを含む複合体または融合タンパク質、および（ｉｉ）ガイド核酸をコードする、核酸構築物、またはそれを含む発現カセットまたはベクターと接触させるステップを含み、それにより標的核酸を改変する。

本発明の第５態様は、標的核酸を編集する方法を提供し、その方法は、標的核酸を、（ａ）（ｉ）本発明の改変されたＬｂＣａｓ１２ａポリペプチドを含む融合タンパク質および（ａ）（ｉｉ）ガイド核酸；（ｂ）本発明の融合タンパク質、およびガイド核酸を含む複合体；（ｃ）本発明の融合タンパク質およびガイド核酸を含む組成物；および／または、（ｄ）本発明のシステムと接触させるステップを含み、それにより標的核酸を編集する。

本発明の第６の態様は、標的核酸を編集する方法を提供し、その方法は、標的核酸を含む細胞または無細胞系を、（ａ）（ｉ）本発明の改変されたＬｂＣａｓ１２ａポリペプチドを含む融合タンパク質をコードするポリヌクレオチド、またはそれを含む発現カセットまたはベクター、および（ａ）（ｉｉ）ガイド核酸、またはそれを含む発現カセットまたはベクター；および／または（ｂ）本発明の改変されたＬｂＣａｓ１２ａポリペプチドを含む融合タンパク質、およびガイド核酸を含む複合体をコードする、核酸構築物、またはそれを含む発現カセットまたはベクター；および／または（ｃ）本発明のシステムと接触させるステップを含み、それにより標的核酸を編集する。

本発明の第７の態様は、プロトスペーサーの５’末にＰＡＭ認識部位を有するＣＲＩＳＰＲ－Ｃａｓヌクレアーゼのプロトスペーサー隣接モチーフ（ＰＡＭ）の要件／特異性を判定するための二本鎖核酸分子を含むランダム化ＤＮＡライブラリーを構築する方法を提供し、その方法は、以下のステップを含む２以上の二本鎖核酸分子を調製するステップ：（ａ）２以上の二本鎖核酸分子のそれぞれのための非標的オリゴヌクレオチド（第１）鎖および標的オリゴヌクレオチド（第２）鎖を合成するステップ（ここで、非標的オリゴヌクレオチド鎖は５’から３’に以下を含む：（ｉ）約５～約１５ヌクレオチドを有する第１の配列、（ｉｉ）少なくとも４つのランダム化ヌクレオチドを有する第２の配列、（ｉｉｉ）約１６～約２５ヌクレオチドを含むプロトスペーサー配列、および（ｉｖ）約５～約２０ヌクレオチドを有する第３の配列、ここで（ｉ）の約５～１５ヌクレオチドを有する第１の配列は、（ｉｉ）の第２の配列の５’末にすぐ隣接しており、（ｉｉ）の第２の配列は（ｉｉｉ）のプロトスペーサー配列の５’末にすぐ隣接しており、プロトスペーサー配列は、（ｉｖ）の第３の配列の５’末にすぐ隣接しており；標的オリゴヌクレオチド（第２）鎖は、非標的オリゴヌクレオチド鎖に相補である）；および、（ｂ）非標的オリゴヌクレオチド鎖を相補の標的オリゴヌクレオチド鎖にアニーリングさせて二本鎖核酸分子を産生するステップ（ここで、第１の配列は制限部位を（その５’末に）含み、第３の配列は制限部位を（その３’末に）含み、ここで、２以上の二本鎖核酸分子のそれぞれの第１の配列（ｉ）、プロトスペーサー配列（ｉｉｉ）および第３の配列（ｉｖ）は同一である）を含み、それにより、二本鎖核酸分子を含むランダム化ＤＮＡライブラリーを構築する。

本発明の第８の態様は、プロトスペーサーの３’末にＰＡＭ認識部位を有するＣＲＩＳＰＲ－Ｃａｓヌクレアーゼのプロトスペーサー隣接モチーフ（ＰＡＭ）の要件／特異性を判定するための二本鎖核酸分子を含むランダム化ＤＮＡライブラリーを構築する方法を提供し、その方法は、以下のステップを含む２以上の二本鎖核酸分子を調製するステップ：（ａ）２以上の二本鎖核酸分子のそれぞれのための非標的オリゴヌクレオチド（第１）鎖および標的オリゴヌクレオチド（第２）鎖を合成するステップ（ここで、非標的オリゴヌクレオチド鎖は５’から３’に以下を含む：（ｉ）約５～約２０ヌクレオチドを有する第１の配列、（ｉｉ）約１６～約２５ヌクレオチドを含むプロトスペーサー配列、（ｉｉｉ）少なくとも４つのランダム化ヌクレオチドを有する第２の配列、および（ｉｖ）約５～約１５ヌクレオチドを有する第３の配列、ここで（ｉ）の約５～２０ヌクレオチドを有する第１の配列は（ｉｉ）のプロトスペーサー配列の５’末にすぐ隣接しており、（ｉｉｉ）の第２の配列は（ｉｉｉ）のプロトスペーサー配列の３’末にすぐ隣接しており、（ｉｖ）の第３の配列は（ｉｉｉ）の第２の配列の３’末にすぐ隣接しており；標的オリゴヌクレオチド（第２）鎖は非標的オリゴヌクレオチド鎖に相補である）；および（ｂ）非標的オリゴヌクレオチド鎖を相補の標的オリゴヌクレオチド鎖にアニーリングさせて二本鎖核酸分子を産生するステップ（ここで、第１の配列（ｉ）は制限部位を（その５’末に）含み、第３の配列（ｉｖ）は制限部位を（その３’末に）含み、ここで、２以上の二本鎖核酸分子のそれぞれの第１の配列（ｉ）、プロトスペーサー配列（ｉｉ）および第３の配列（ｉｖ）は同一である）を含み、それにより、二本鎖核酸分子を含むランダム化ＤＮＡライブラリーを構築する。

本発明の第９の態様は、プロトスペーサーの５’末にＰＡＭ認識部位を有するＣＲＩＳＰＲ－Ｃａｓヌクレアーゼのプロトスペーサー隣接モチーフ（ＰＡＭ）の要件／特異性を判定するためのランダム化ＤＮＡライブラリーを提供し、ランダム化ＤＮＡライブラリーは、２以上の二本鎖核酸分子を含み、それぞれが以下を含む：（ａ）非標的オリゴヌクレオチド（第１）鎖および標的オリゴヌクレオチド（第２）鎖、ここで、非標的オリゴヌクレオチド鎖は、５’から３’に、（ｉ）約５～約１５ヌクレオチド（例えば、約５、６、７、８、９、１０、１１、１２、１３、１４、または１５ヌクレオチド、およびその中の任意の範囲または値）を有する第１の配列、（ｉｉ）少なくとも４つのランダム化ヌクレオチド（例えば、少なくとも４、５、６、７、８、９、１０、またはそれよりも多く、およびその中の任意の範囲または値）を有する第２の配列、（ｉｉｉ）約１６～約２５ヌクレオチド、例えば、約１６、１７、１８、１９、２０、２１、２２、２３、２４、または２５ヌクレオチドを含む、プロトスペーサー配列、および（ｉｖ）約５～約２０ヌクレオチド（例えば、約５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０ヌクレオチド、およびその中の任意の範囲または値）を有する第３の配列を含み、ここで、（ｉ）の約５～１５ヌクレオチドを有する第１の配列は、（ｉｉ）の第２の配列の５’末にすぐ隣接しており、（ｉｉ）の第２の配列は（ｉｉｉ）のプロトスペーサー配列の５’末にすぐ隣接しており、プロトスペーサー配列は（ｉｖ）の第３の配列の５’末にすぐ隣接しており；標的オリゴヌクレオチド（第２）鎖は非標的オリゴヌクレオチド鎖に相補である；および（ｂ）非標的オリゴヌクレオチド鎖は、相補の標的オリゴヌクレオチド鎖にアニーリングして、二本鎖核酸分子を産生し、ここで、第１の配列は制限部位を（その５’末に）含み、第３の配列は制限部位を（その３’末に）含み、ここで、２以上の二本鎖核酸分子のそれぞれの第１の配列（ｉ）、プロトスペーサー配列（ｉｉｉ）および第３の配列（ｉｖ）は同一である。

本発明の第１０の態様は、プロトスペーサーの３’末にＰＡＭ認識部位を有するＣＲＩＳＰＲ－Ｃａｓヌクレアーゼのプロトスペーサー隣接モチーフ（ＰＡＭ）の要件／特異性を判定するためのランダム化ＤＮＡライブラリーを提供し、ランダム化ＤＮＡライブラリーは、２以上の二本鎖核酸分子を含み、それぞれが以下を含む：（ａ）非標的オリゴヌクレオチド（第１）鎖および標的オリゴヌクレオチド（第２）鎖、ここで、非標的オリゴヌクレオチド鎖は、５’から３’に、（ｉ）約５～約２０ヌクレオチド（例えば、約５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０ヌクレオチド、およびその中の任意の範囲または値）を有する第１の配列、（ｉｉ）約１６～約２５ヌクレオチド、例えば、約１６、１７、１８、１９、２０、２１、２２、２３、２４、または２５ヌクレオチドを含む、プロトスペーサー配列、（ｉｉｉ）少なくとも４つのランダム化ヌクレオチド（例えば、少なくとも４、５、６、７、８、９、１０、またはそれよりも多く、およびその中の任意の範囲または値）を有する第２の配列、および（ｉｖ）約５～約１５ヌクレオチド（例えば、約５、６、７、８、９、１０、１１、１２、１３、１４、１５ヌクレオチド、およびその中の任意の範囲または値）を有する第３の配列を含み、ここで（ｉ）の約５～２０ヌクレオチドを有する第１の配列は（ｉｉ）のプロトスペーサー配列の５’末にすぐ隣接しており、（ｉｉｉ）の第２の配列は（ｉｉｉ）のプロトスペーサー配列の３’末にすぐ隣接しており、（ｉｖ）の第３の配列は（ｉｉｉ）の第２の配列の３’末にすぐ隣接しており；標的オリゴヌクレオチド（第２）鎖は非標的オリゴヌクレオチド鎖に相補である；および（ｂ）非標的オリゴヌクレオチド鎖は、相補の標的オリゴヌクレオチド鎖にアニーリングして、二本鎖核酸分子を産生し、ここで、第１の配列は制限部位を（その５’末に）含み、第３の配列は制限部位を（その３’末に）含み、ここで、２以上の二本鎖核酸分子のそれぞれの第１の配列（ｉ）、プロトスペーサー配列（ｉｉ）および第３の配列（ｉｖ）は同一である。

本発明はさらに、本発明のＣＲＩＳＰＲ－Ｃａｓヌクレアーゼおよび／または融合タンパク質をコードするポリヌクレオチドを含む発現カセットおよび／またはベクター、および／または、本発明のポリヌクレオチド、ポリペプチドおよび／または融合タンパク質を含む細胞、および／または、それを含むキットを提供する。

本発明のこれらのおよび他の態様は、以下の本発明の説明においてより詳細に示される。

［配列の簡単な説明］
配列番号１～１７、４９、５０および５１は、Ｃａｓ１２ａヌクレアーゼをコードする例示的なヌクレオチド配列である。
配列番号１８～２２は、例示的なアデノシンデアミナーゼである。
配列番号２３～２５および配列番号４２～４８は、例示的なシトシンデアミナーゼである。
配列番号２６は、ウラシル－ＤＮＡグリコシラーゼ阻害剤（ＵＧＩ）をコードする例示的なヌクレオチド配列である。
配列番号２７～２９は、Ｖ型ＣＲＩＳＰＲ－Ｃａｓ１２ａヌクレアーゼに関するプロトスペーサー隣接モチーフ位置の一例を提供する。
配列番号３０～３９は、例えばインビトロ切断アッセイにおいて用いるための本発明のランダム化ライブラリーを産生するのに有用なヌクレオチド配列の例を示す。
配列番号４０～４１は、プロモーターおよびイントロンをコードする例示的な調節配列である。
配列番号５２は、例示の発現カセットのヌクレオチド配列を提供する。
配列番号５３は、例示のベクターのヌクレオチド配列を提供する。
配列番号５４～６１は、例示のスペーサー配列を提供する。
配列番号６２は、例示のＣＲＩＳＰＲＲＮＡを提供する。

本発明の例示のＰＡＭライブラリー調製のダイアグラムを示す。この方法では、５’リン酸化オリゴヌクレオチドをアニーリングさせて、ＥｃｏＲＩおよびＳｐｈＩで消化したｐＵＣ１９ベクター内にクローニングする。ＳｃａＩを用いてベクターを線状化する（ＡＧＴＡＣＴ配列はＬｂｃｐｆ１によって認識されない）。上の鎖（配列番号３２）；下の鎖（配列番号３３）。トウモロコシ（上パネル）およびダイズ（下パネル）に関するコード配列内の遺伝子あたりの平均のプロトスペーサー隣接モチーフ（ＰＡＭ）を示す。ＬｂＣｐｆ１遺伝子は、Ｃａｓ９変異体よりもはるかに少ない遺伝子配列にアクセスし得る。トウモロコシ（パネルＡ、Ｃ）およびダイズ（パネルＢ、Ｄ）における、ＰＡＭによって制限された、平均のアクセス可能なシトシン（パネルＡ、Ｂ）およびアデニン（パネルＣ、Ｄ）を示す。示されるように、ＬｂＣｐｆ１シトシンおよびアデニンは、Ｃａｓ９変異体よりもはるかに少ないシトシンおよびアデニンにアクセスし得る。Ｇａｏｅｔａｌ．（ＮａｔＢｉｏｔｅｃｈｎｏｌ３５（８）：７８９－７９２（２０１７））の単純化されたＰＡＭ決定アッセイを示すダイアグラムを提供する。増幅したフラグメントは、ＣＲＩＳＰＲ－Ｃａｓヌクレアーゼによって切断されなかった配列を表わし、増幅されないフラグメントはＣＲＩＳＰＲ－Ｃａｓヌクレアーゼによって切断されたものである。シーケンシングおよび酵素なしコントロールとの比較によって、増幅されなかった核酸配列が特定され（すなわち、コントロール集団内に存在するが編集された集団内には存在しないもの）、したがって、ヌクレアーゼによって認識され切断される配列が特定される。上パネル：上の配列（配列番号３６）、中央の配列（配列番号３７）、下の配列（配列番号３８）；中央パネル：上の配列（配列番号３９）、中央の配列（配列番号３７）；下パネル：上の配列（配列番号３６）、中央の配列（配列番号３７）。カウント数の最も高いものから最も低いものにプロットしたＰＡＭＤＡライブラリーの３ＩｌｌｕｍｉｎａＭｉＳｅｑＮＧＳリードの平均。ＮＮＮＮＮを含む１０２４のライブラリーメンバーが、平均３９リードの正規分布に従う。ｗｔＬｂＣａｓ１２ａおよびプラスミドスペーサーを標的化しなかったｃｒＲＮＡを含む、ネガティブコントロールの細胞選別結果。ｗｔＬｂＣａｓ１２ａおよびプラスミドスペーサーを標的化するｃｒＲＮＡの細胞選別結果。ＬｂＣａｓ１２ａ－Ｋ５９５Ｙおよびプラスミドスペーサーを標的化するｃｒＲＮＡの細胞選別結果。ＬｂＣａｓ１２ａ－Ｇ５３２Ｒ－Ｋ５９５Ｒ二重突然変異コントロールおよびプラスミドスペーサーを標的化するｃｒＲＮＡの細胞選別結果。プラスミドスペーサーを標的化するｃｒＲＮＡと、ＬｂＣａｓ１２ａ－Ｔ１５２Ｒ－Ｋ５９５Ｙ二重突然変異（この試験における２つの点突然変異の組み合わせ）の細胞選別結果。プラスミドスペーサーを標的化するｃｒＲＮＡと、ＬｂＣａｓ１２ａ－Ｔ１５２Ｒ－Ｋ５３８Ｗ－Ｋ５９５Ｙ三重突然変異（３つの点突然変異の組み合わせ）の細胞選別結果。２つの別個のｃｒＲＮＡなしコントロールおよび野生型ｄＬｂＣａｓ１２ａおよびレポーターライブラリーに関する合計の正規化されたＮＧＳカウント。２５６個の４ヌクレオチドＰＡＭのそれぞれに関する、単一点突然変異の正規化されたＰＡＭ－ＳＣＡＮＲスコア。グラフを通る線は、２つのネガティブコントロールのいずれかに関する最も高い観察スコア、１．６７を示す。２５６個の４ヌクレオチドＰＡＭのそれぞれに関する、コンビナトリアル突然変異の正規化されたＰＡＭ－ＳＣＡＮＲスコア。突然変異体Ｋ５３８ＷおよびＫ５９５Ｙの組み合わせにより、固有のＰＡＭ認識配列を有する酵素ＬｂＣａｓ１２ａ－Ｋ５３８Ｗ－Ｋ５９５Ｙが生じることを示す。いくつかの場合において、Ｋ５３８Ｗ（垂直陰影）またはＫ５９５Ｙ（水平陰影）由来の共有ＰＡＭ認識モチーフが、組み合わせ突然変異体によって認識されるが、しばしば、その組み合わせは、完全に新規のＰＡＭ認識配列（ｔｈａｔｃｈｅｄ）を生じさせる。複数の拡大されたＰＡＭ突然変異の組み合わせにより、相加的なこともあるがしばしば固有のＰＡＭ認識配列を産生することができることを示す。Ｋ５９５Ｙ（左）およびＴ１５２Ｒ（右）に対するＰＡＮ－ＳＣＡＮＲによって１．６７スコアよりも上を示した全ての非ＴＴＴＶＰＡＭ（灰色のボックス）を比較する。１．６７カットオフよりも上のＰＡＭ－ＳＣＡＮＲポジティブＰＡＭの全て（１つを除く）が、９．２カットオフよりも上のＰＡＭ枯渇スコアをインビトロで有した。それぞれのＴＴＴＶ含有スペーサーに関する、ＨＥＫ２９３Ｔ細胞において形成されたインデルのパーセンテージを示す。個々のインデルのパーセンテージを、ＴＴＴＣ、ＴＴＴＡ、およびＴＴＴＧについてそれぞれ、丸、四角、または三角で示す。また、各スペーサーに関して、平均線と小数点以下を四捨五入した値も表示されている。試験されたＰＡＭあたりの、ＬｂＣａｓ１２ａ＿Ｋ５９５ＹＨＥＫ２９３Ｔの最大の観察されたインデルのパーセンテージを示す。０．１％よりも上の値は、シーケンシングのノイズの外側であり、真正インデルを表わす。試験されたＰＡＭあたりの、ＬｂＣａｓ１２ａ＿Ｔ１５２ＲＨＥＫ２９３Ｔの最大の観察されたインデルのパーセンテージを示す。０．１％よりも上の値は、シーケンシングのノイズの外側であり、真正インデルを表わす。試験されたＰＡＭあたりの、ＬｂＣａｓ１２ａ＿Ｋ５３８ＷＨＥＫ２９３Ｔの最大の観察されたインデルのパーセンテージを示す。０．１％よりも上の値は、シーケンシングのノイズの外側であり、真正インデルを表わす。ＬｂＣａｓ１２ａ－Ｔ１５２Ｒ（図２２Ａ）およびＬｂＣａｓ１２ａ－Ｋ５９５Ｙ（図２２Ｂ）に関する、インデル％（最大）および正規化された細菌ＰＡＭ－ＳＣＡＮＲスコアの間の線形相関。

本発明は、本発明の実施態様が示されている付随する図面および実施例に関して以下に説明されている。この説明は、本発明が実施され得る全ての異なる方法または本発明に加えられ得る全ての特徴の詳細なカタログであることを意図しない。例えば、一実施態様に関して例示される特徴が他の実施態様に組み込まれてよく、特定の実施態様に関して例示される特徴がその実施態様から削除されてよい。したがって、本発明は、本発明の一部の実施態様では、本明細書中に示される任意の特徴または特徴の組み合わせを除外または省略することができると考えられる。さらに、本明細書中に示唆される様々な実施態様に対する非常に多くのバリエーションおよび追加は、本開示に照らして当業者に明らかであり、本発明から逸脱しない。それ故に、以下の説明は、本発明の一部の特定の実施態様を例示することを意図し、それらの全ての並べ替え、組み合わせおよびバリエーションを網羅的に特定することを意図しない。

別段の定義がない限り、本明細書中で用いられる全ての技術的および科学的用語は、本発明が属する分野における通常の知識を有する者によって一般に理解されるのと同じ意味を有する。本明細書中、本発明の説明において用いられる専門用語は、特定の実施態様を説明する目的のためのみであり、本発明の限定を意図しない。

本明細書中で引用される全ての刊行物、特許出願、特許および他の参考文献は、参考文献が示されている文章および／または段落に関連のある教示に関して、それらの全体で参照により援用される。

文脈が別段の提示をしない限り、本明細書中に記載される本発明の様々な特徴は、任意の組み合わせで用いることができることが明確に意図される。さらに、本発明はまた、本発明の一部の実施態様では、本明細書中に示される任意の特徴または特徴の組み合わせを除外または省略することができると考えられる。例示すると、組成物が構成要素Ａ、ＢおよびＣを含むと明細書が記載する場合は、Ａ、ＢまたはＣのいずれか、またはそれらの組み合わせを、単独または任意の組み合わせで省略および否定することができることが明確に意図される。

本発明の説明および添付の特許請求の範囲において用いられる、単数形「ａ」、「ａｎ」および「ｔｈｅ」は、文脈が明確に別段の提示をしない限り、複数形も含むことを意図する。

また、本明細書において用いられる「および／または」は、関係がある列挙された事項の１つまたは複数の任意および全てのあり得る組み合わせ、ならびに、選択的に解釈される場合は（「または（ｏｒ）」）、組み合わせの欠如を指し、および包含する。

本明細書において用いられる用語「約」は、例えば量または濃度などの測定可能な値を指す場合、指定された値と同様に、指定された値の±１０％、±５％、±１％、±０．５％、または実に±０．１％の変動を包含することを意味する。例えば、「約Ｘ」は、Ｘが測定可能な値である場合、Ｘおよび、Ｘの±１０％、±５％、±１％、±０．５％、または実に±０．１％の変動を含むことを意味する。測定可能な値について本明細書中で提供される範囲は、その中の任意の他の範囲および／または個々の値を含んでよい。

本明細書において用いられる、「ＸとＹの間」および「約ＸとＹの間」のような語句は、ＸおよびＹを含むと解釈すべきである。本明細書において用いられる「約ＸとＹの間」のような語句は、「約Ｘと約Ｙの間」を意味し、「約ＸからＹまで」のような語句は、「約Ｘから約Ｙまで」を意味する。

本明細書における値の範囲の列挙は、本明細書において別段の指示がない限り、その範囲内に入るそれぞれの個々の値を個々に言及する省略表現方法としての役割を単に意図しており、それぞれの個々の値は、あたかも本明細書において個々に列挙されたかのように本明細書中に組み込まれる。例えば、範囲１０～１５が開示された場合、１１、１２、１３、および１４もまた開示される。

本明細書において用いられる用語「含む（ｃｏｍｐｒｉｓｅ）」、「含む（ｃｏｍｐｒｉｓｅｓ）」および「含む（ｃｏｍｐｒｉｓｉｎｇ）」は、記載される特徴、整数、ステップ、操作、エレメント、および／または構成要素の存在を特定するが、１つまたは複数の他の特徴、整数、ステップ、操作、エレメント、構成要素、および／またはそれらの群の存在または追加を排除しない。

本明細書において用いられる移行句「から本質的になる（ｃｏｎｓｉｓｔｉｎｇｅｓｓｅｎｔｉａｌｌｙｏｆ）」は、特許請求の範囲が、特許請求の範囲において列挙される指定の材料またはステップおよび特許請求の範囲に記載される発明の基本的および新規の特徴（単数または複数）に実質的に影響を及ぼさないものを包含すると解釈すべきであることを意味する。したがって、用語「から本質的になる」は、本発明の請求項において用いられる場合、「含む（ｃｏｍｐｒｉｓｉｎｇ）」と同等であると解釈されることを意図しない。

本明細書において用いられる用語「増大する（ｉｎｃｒｅａｓｅ）」、「増大する（ｉｎｃｒｅａｓｉｎｇ）」、「増強する（ｅｎｈａｎｃｅ）」、「増強する（ｅｎｈａｎｃｉｎｇ）」「改善する（ｉｍｐｒｏｖｅ）」および「改善する（ｉｍｐｒｏｖｉｎｇ）」（およびそれらの文法上のバリエーション）は、コントロールと比較して、少なくとも約２５％、５０％、７５％、１００％、１５０％、２００％、３００％、４００％、５００％またはそれよりも多くの増加を説明する。

本明細書において用いられる用語「減少する（ｒｅｄｕｃｅ）」、「減少した（ｒｅｄｕｃｅｄ）」、「減少する（ｒｅｄｕｃｉｎｇ）」、「減少（ｒｅｄｕｃｔｉｏｎ）」、「減る（ｄｉｍｉｎｉｓｈ）」および「低減する（ｄｅｃｒｅａｓｅ）」（およびそれらの文法上のバリエーション）は、例えば、コントロールと比較して、少なくとも約５％、１０％、１５％、２０％、２５％、３５％、５０％、７５％、８０％、８５％、９０％、９５％、９７％、９８％、９９％、または１００％の低減を説明する。特定の実施態様では、減少は、検出可能な活性または量を生じさせることができず、または本質的に生じさせることができない（すなわち、ささいな量、例えば、約１０％未満または実に５％）。

「異種」または「組み換え」ヌクレオチド配列は、それが導入される宿主細胞と天然に関連しないヌクレオチド配列であり、天然起源ヌクレオチド配列の非天然起源の複数コピーを含む。

「ネイティブ」または「野生型」の核酸、ヌクレオチド配列、ポリペプチドまたはアミノ酸配列は、天然起源または内因性の核酸、ヌクレオチド配列、ポリペプチドまたはアミノ酸配列を指す。したがって、例えば、「野生型ｍＲＮＡ」は、生物において天然起源のｍＲＮＡまたは生物にとって内因性のｍＲＮＡである。「同種」核酸配列は、それが導入される宿主細胞と天然に関連するヌクレオチド配列である。

本明細書において用いられる用語「核酸」、「核酸分子」、「ヌクレオチド配列」および「ポリヌクレオチド」は、線状または分岐の一本鎖または二本鎖であるＲＮＡまたはＤＮＡ、またはそれらのハイブリッドを指す。その用語はまた、ＲＮＡ／ＤＮＡハイブリッドも包含する。ｄｓＲＮＡが合成的に生産される場合、より一般的でない塩基、例えばイノシン、５－メチルシトシン、６－メチルアデニン、ヒポキサンチンおよびその他を、アンチセンス、ｄｓＲＮＡ、およびリボザイムのペアリングに用いることもできる。例えば、ウリジンおよびシチジンのＣ－５プロピン類似体を含むポリヌクレオチドは、高い親和性でＲＮＡに結合すること、および、遺伝子発現の強力なアンチセンス阻害剤であることが示されている。他の改変、例えばＲＮＡのホスホジエステル主鎖、またはリボース糖基内の２’－ヒドロキシに対する改変を行なうこともできる。

本明細書において用いられる用語「ヌクレオチド配列」は、ヌクレオチドのヘテロポリマーまたは核酸分子の５’から３’末へのこれらのヌクレオチドの配列を指し、ｃＤＮＡ、ＤＮＡフラグメントまたは部分、ゲノムＤＮＡ、合成（例えば化学合成）ＤＮＡ、プラスミドＤＮＡ、ｍＲＮＡ、およびアンチセンスＲＮＡを含むＤＮＡまたはＲＮＡ分子を含み、これらのいずれも、一本鎖または二本鎖であってよい。用語「ヌクレオチド配列」、「核酸」、「核酸分子」、「核酸構築物」、「オリゴヌクレオチド」および「ポリヌクレオチド」はまた、本明細書において相互交換可能にも用いられて、ヌクレオチドのヘテロポリマーを指す。本明細書中に提供される核酸分子および／またはヌクレオチド配列は本明細書において、５’から３’の方向で、左から右に示され、米国配列規則、３７ＣＦＲ§§１．８２１～１．８２５および世界知的所有権機関（ＷＩＰＯ）基準ＳＴ．２５に記載のヌクレオチド記号を表わすのに標準的なコードを用いて表される。本明細書において用いられる「５’領域」は、ポリヌクレオチドの５’末に最も近いポリヌクレオチドの領域を意味することができる。したがって、例えば、ポリヌクレオチドの５’領域内のエレメントは、ポリヌクレオチドの５’末に位置する１つ目のヌクレオチドからポリヌクレオチドの途中に位置するヌクレオチドまでのどこかに位置することができる。本明細書において用いられる「３’領域」は、ポリヌクレオチドの３’末に最も近いポリヌクレオチドの領域を意味することができる。したがって、例えば、ポリヌクレオチドの３’領域内のエレメントは、ポリヌクレオチドの３’末に位置する１つ目のヌクレオチドからポリヌクレオチドの途中に位置するヌクレオチドまでのどこかに位置することができる。

本明細書において用いられる用語「遺伝子」は、ｍＲＮＡ、アンチセンスＲＮＡ、ｍｉＲＮＡ、抗マイクロＲＮＡアンチセンスオリゴデオキシリボヌクレオチド（ＡＭＯ）などを生産するために用いることのできる核酸分子を指す。遺伝子は、機能性タンパク質または遺伝子産物を生産するために用いることが可能であってよく、または可能でなくてもよい。遺伝子は、コード領域および非コード領域の両方（例えば、イントロン、調節エレメント、プロモーター、エンハンサー、終結配列および／または５’および３’非翻訳領域）を含むことができる。遺伝子は「単離され」てよく、それにより、その天然の状態において核酸と関連して通常見られる構成要素から実質的または本質的にフリーである核酸を意味する。そのような構成要素には、他の細胞材料、組み換え生産による培養培地、および／または、核酸の化学合成で用いられる様々な化学物質が含まれる。

用語「突然変異」は、点突然変異（例えば、ミスセンス、またはナンセンス、または、フレームシフトを生じさせる単一塩基対の挿入もしくは欠失）、挿入、欠失、および／またはトランケーションを指す。突然変異が、アミノ酸配列内の残基の別の残基による置換、または、配列内の１つまたは複数の残基の欠失または挿入である場合は、突然変異は典型的に、元の残基の後に、配列内のその残基の位置、および新たに置換された残基の識別（ｉｄｅｎｔｉｔｙ）を特定することによって記載される。

本明細書において用いられる用語「相補（ｃｏｍｐｌｅｍｅｎｔａｒｙ）」または「相補性（ｃｏｍｐｌｅｍｅｎｔａｒｉｔｙ）」は、許容的な塩および温度条件下での塩基対合によるポリヌクレオチドの自然な結合を指す。例えば、配列「Ａ－Ｇ－Ｔ」（５’から３’）は、相補配列「Ｔ－Ｃ－Ａ」（３’から５’）に結合する。２つの一本鎖分子間の相補性は、ヌクレオチドのほんの一部が結合する「部分的」であってよく、または、一本鎖分子の間に全体的な相補性が存在する「完全」であってよい。核酸鎖の間の相補性の程度は、核酸鎖の間のハイブリダイゼーションの効率および強度に重大な効果を有する。

本明細書において用いられる「相補（ｃｏｍｐｌｅｍｅｎｔ）」は、コンパレーターヌクレオチド配列との１００％相補性を意味することができ、または、１００％未満の相補性（例えば、約７０％、７１％、７２％、７３％、７４％、７５％、７６％、７７％、７８％、７９％、８０％、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％などの相補性）を意味することができる。

本発明のヌクレオチド配列の「部分」または「フラグメント」は、参照核酸またはヌクレオチド配列と比較して減少した長さのヌクレオチド配列であって（例えば、１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０またはそれよりも多くのヌクレオチドが減少している）、参照核酸またはヌクレオチド配列と同一またはほぼ同一（例えば、７０％、７１％、７２％、７３％、７４％、７５％、７６％、７７％、７８％、７９％、８０％、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％同一）の連続したヌクレオチドのヌクレオチド配列を含む、から本質的になる、および／またはからなることを意味することが理解される。本発明によるそのような核酸フラグメントまたは部分は、適切な場合は、それが成分となっている、より大きなポリヌクレオチド内に含まれてよい。一例として、本発明のガイド核酸のリピート配列は、野生型ＣＲＩＳＰＲ－Ｃａｓリピート配列（例えば、野生型Ｃａｓ９リピート、野生型Ｃａｓ１２ａリピートなど）の一部を含んでよい。

相同性を有する異なる核酸またはタンパク質は、本明細書において「ホモログ」と呼ばれる。用語「ホモログ」は、同一および他の種由来の相同配列および同一および他の種由来のオルソロガス配列を含む。「相同性」は、位置同一性のパーセントの観点からの、２以上の核酸および／またはアミノ酸配列の間の類似性のレベルを指す（すなわち配列類似性または同一性）。相同性はまた、異なる核酸またはタンパク質の間の似ている機能特性の概念を指す。したがって、本発明の組成物および方法は、本発明のヌクレオチド配列およびポリペプチド配列に対するホモログをさらに含む。本明細書において用いられる「オルソロガス」は、種分化中に共通の先祖遺伝子から生じた異なる種における相同ヌクレオチド配列および／またはアミノ酸配列を指す。本発明のヌクレオチド配列のホモログは、本発明の上記ヌクレオチド配列と実質的な配列同一性（例えば、少なくとも約７０％、７１％、７２％、７３％、７４％、７５％、７６％、７７％、７８％、７９％、８０％、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、９９．５％または１００％）を有する。

本明細書において用いられる「配列同一性」は、２つの最適に並べられたポリヌクレオチドまたはポリペプチド配列が、構成要素（例えばヌクレオチドまたはアミノ酸）のアライメントのウインドウ全体を通して不変である程度を指す。「同一性」は、制限されないが、ＣｏｍｐｕｔａｔｉｏｎａｌＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ（Ｌｅｓｋ，Ａ．Ｍ．，ｅｄ．）ＯｘｆｏｒｄＵｎｉｖｅｒｓｉｔｙＰｒｅｓｓ，ＮｅｗＹｏｒｋ（１９８８）；Ｂｉｏｃｏｍｐｕｔｉｎｇ：ＩｎｆｏｒｍａｔｉｃｓａｎｄＧｅｎｏｍｅＰｒｏｊｅｃｔｓ（Ｓｍｉｔｈ，Ｄ．Ｗ．，ｅｄ．）ＡｃａｄｅｍｉｃＰｒｅｓｓ，ＮｅｗＹｏｒｋ（１９９３）；ＣｏｍｐｕｔｅｒＡｎａｌｙｓｉｓｏｆＳｅｑｕｅｎｃｅＤａｔａ，ＰａｒｔＩ（Ｇｒｉｆｆｉｎ，Ａ．Ｍ．，ａｎｄＧｒｉｆｆｉｎ，Ｈ．Ｇ．，ｅｄｓ．）ＨｕｍａｎａＰｒｅｓｓ，ＮｅｗＪｅｒｓｅｙ（１９９４）；ＳｅｑｕｅｎｃｅＡｎａｌｙｓｉｓｉｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ（ｖｏｎＨｅｉｎｊｅ，Ｇ．，ｅｄ．）ＡｃａｄｅｍｉｃＰｒｅｓｓ（１９８７）；ａｎｄＳｅｑｕｅｎｃｅＡｎａｌｙｓｉｓＰｒｉｍｅｒ（Ｇｒｉｂｓｋｏｖ，Ｍ．ａｎｄＤｅｖｅｒｅｕｘ，Ｊ．，ｅｄｓ．）ＳｔｏｃｋｔｏｎＰｒｅｓｓ，ＮｅｗＹｏｒｋ（１９９１）に記載されるものを含む公知の方法によって容易に計算することができる。

本明細書において用いられる用語「配列同一性パーセント」または「同一性パーセント」は、２つの配列が最適に並べられた場合の試験（「対象」）ポリヌクレオチド分子（またはその相補鎖）と比較した、参照（「クエリー」）ポリヌクレオチド分子（またはその相補鎖）の線状ポリヌクレオチド配列における同一のヌクレオチドのパーセンテージを指す。一部の実施態様では、「同一性パーセント」は、参照ポリペプチドと比較した、アミノ酸配列における同一のアミノ酸のパーセンテージを指すことができる。

２つの核酸分子、ヌクレオチド配列またはタンパク質配列の関連における、本明細書において用いられる語句「実質的に同一」または「実質的な同一性」は、以下の配列比較アルゴリズムのうちの１つを用いて測定してまたは目視検査によって、最大一致に関して比較およびアライメントした場合に、少なくとも約７０％、７１％、７２％、７３％、７４％、７５％、７６％、７７％、７８％、７９％、８０％、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、９９．５％または１００％のヌクレオチドまたはアミノ酸残基同一性を有する２以上の配列またはサブ配列を指す。本発明の一部の実施態様では、実質的な同一性は、約１０ヌクレオチド～約２０ヌクレオチド、約１０ヌクレオチド～約２５ヌクレオチド、約１０ヌクレオチド～約３０ヌクレオチド、約１５ヌクレオチド～約２５ヌクレオチド、約３０ヌクレオチド～約４０ヌクレオチド、約５０ヌクレオチド～約６０ヌクレオチド、約７０ヌクレオチド～約８０ヌクレオチド、約９０ヌクレオチド～約１００ヌクレオチド、またはそれよりも多くのヌクレオチドの長さ、およびその中の任意の範囲（配列の全長まで）である本発明のヌクレオチド配列の連続するヌクレオチドの領域にわたって存在する。一部の実施態様では、ヌクレオチド配列は、少なくとも約２０ヌクレオチド（例えば、約２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０ヌクレオチド）にわたって実質的に同一であることができる。一部の実施態様では、実質的に同一のヌクレオチドまたはタンパク質配列は、実質的に同一であるヌクレオチド（またはコードされるタンパク質配列）と実質的に同一の機能を発揮する。

配列比較のために、典型的に一方の配列は参照配列として働き、それに対して試験配列が比較される。配列比較アルゴリズムを用いる場合、試験配列および参照配列がコンピューターに入力されて、必要に応じてサブ配列座標が指定されて、配列アルゴリズムのプログラムパラメーターが指定される。それから、配列比較アルゴリズムは、指定のプログラムパラメーターに基づいて、参照配列と比較した試験配列（単数または複数）に関する配列同一性パーセントを計算する。

比較ウインドウを並べるための最適な配列アライメントは当業者によく知られており、ＳｍｉｔｈおよびＷａｔｅｒｍａｎの局所相同性アルゴリズム、ＮｅｅｄｌｅｍａｎおよびＷｕｎｓｃｈの相同性アライメントアルゴリズム、ＰｅａｒｓｏｎおよびＬｉｐｍａｎの類似性検索方法のようなツールによって実行されてよく、ＧＣＧ（登録商標）ＷｉｓｃｏｎｓｉｎＰａｃｋａｇｅ（登録商標）（ＡｃｃｅｌｒｙｓＩｎｃ．，ＳａｎＤｉｅｇｏ，ＣＡ）の一部として利用可能なＧＡＰ、ＢＥＳＴＦＩＴ、ＦＡＳＴＡ、およびＴＦＡＳＴＡなどのアルゴリズムのコンピューター化された実行によるものであってもよい。試験配列および参照配列のアライメントされたセグメントに関する「同一性分率（ｉｄｅｎｔｉｔｙｆｒａｃｔｉｏｎ）」は、２つの並べられた配列が共有する同一の構成要素の数を、参照配列セグメント内の構成要素の合計数（すなわち、参照配列全体、または参照配列のより小さな定義された部分）で割ったものである。配列同一性パーセントは、同一性分率に１００をかけたものとして表される。１つまたは複数のポリヌクレオチド配列の比較は、全長ポリヌクレオチド配列またはその一部、またはより長いポリヌクレオチド配列に対するものであってよい。本発明の目的に関して、「同一性パーセント」は、翻訳されたヌクレオチド配列についてはＢＬＡＳＴＸバージョン２．０およびポリヌクレオチド配列についてはＢＬＡＳＴＮバージョン２．０を用いて決定してもよい。

２つのヌクレオチド配列は、その２つの配列がストリンジェントな条件下で互いにハイブリダイズする場合に、実質的に相補であると考えてもよい。一部の代表的な実施態様では、実質的に相補であると考えられる２つのヌクレオチド配列は、非常にストリンジェントな条件下で互いにハイブリダイズする。

サザンおよびノーザンのハイブリダイゼーションのような核酸ハイブリダイゼーション実験の関連における「ストリンジェントなハイブリダイゼーション条件」および「ストリンジェントなハイブリダイゼーション洗浄条件」は配列依存性であり、異なる環境パラメーター下で異なる。核酸のハイブリダイゼーションに関する広範囲のガイドは、ＴｉｊｓｓｅｎＬａｂｏｒａｔｏｒｙＴｅｃｈｎｉｑｕｅｓｉｎＢｉｏｃｈｅｍｉｓｔｒｙａｎｄＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ－ＨｙｂｒｉｄｉｚａｔｉｏｎｗｉｔｈＮｕｃｌｅｉｃＡｃｉｄＰｒｏｂｅｓｐａｒｔＩｃｈａｐｔｅｒ２「Ｏｖｅｒｖｉｅｗｏｆｐｒｉｎｃｉｐｌｅｓｏｆｈｙｂｒｉｄｉｚａｔｉｏｎａｎｄｔｈｅｓｔｒａｔｅｇｙｏｆｎｕｃｌｅｉｃａｃｉｄｐｒｏｂｅａｓｓａｙｓ」Ｅｌｓｅｖｉｅｒ，ＮｅｗＹｏｒｋ（１９９３）に見られる。一般に、非常にストリンジェントなハイブリダイゼーションおよび洗浄条件は、定義されたイオン強度およびｐＨでの特異的な配列に関する熱融点（Ｔ_ｍ）よりも約５℃低くなるように選択される。

Ｔ_ｍは、標的配列の５０％が、完全に一致するプローブにハイブリダイズする温度である（定義されたイオン強度およびｐＨにおいて）。非常にストリンジェントな条件は、特定のプローブに関するＴ_ｍと同等であるように選択される。サザンブロットまたはノーザンブロットでのフィルター上の、１００を超える相補残基を有する相補ヌクレオチド配列のハイブリダイゼーションに関するストリンジェントなハイブリダイゼーション条件の一例は、４２℃で１ｍｇのヘパリンを含む５０％ホルムアミドであり、ハイブリダイゼーションを一晩行なう。非常にストリンジェントな洗浄条件の一例は、７２℃で約１５分間の０．１５ＭＮａＣｌである。ストリンジェントな洗浄条件の一例は、６５℃で１５分間の０．２×ＳＳＣ洗浄である（ＳＳＣバッファーの説明については、Ｓａｍｂｒｏｏｋ（下記）を参照）。しばしば、高ストリンジェンシー洗浄の前に、バックグラウンドのプローブシグナルを除去するために低ストリンジェンシー洗浄が行われる。例えば１００を超えるヌクレオチドのデュプレックスのための中ストリンジェンシー洗浄の一例は、４５℃で１５分間の１×ＳＳＣである。例えば１００を超えるヌクレオチドのデュプレックスのための低ストリンジェンシー洗浄の一例は、４０℃で１５分間の４～６×ＳＳＣである。短いプローブ（例えば、約１０～５０ヌクレオチド）については、ストリンジェントな条件は典型的に、約１．０ＭＮａイオン未満の塩濃度、典型的に約０．０１～１．０ＭのＮａイオン濃度（または他の塩）（ｐＨ７．０～８．３）を含み、温度は典型的に少なくとも約３０℃である。ストリンジェントな条件は、ホルムアミドなどの不安定化剤の添加によって達成することもできる。一般に、特定のハイブリダイゼーションアッセイにおいて、関係のないプローブに関して観察されるものよりも２倍の（またはそれよりも高い）シグナル対ノイズ比は、特異的なハイブリダイゼーションの検出を示す。ストリンジェントな条件下で互いにハイブリダイズしないヌクレオチド配列は、それらがコードするタンパク質が実質的に同一であれば、実質的に同一である。これは例えば、遺伝暗号によって許容される最大コドン縮退を用いてヌクレオチド配列のコピーが作られる場合に生じ得る。

本発明の任意のヌクレオチド配列、ポリヌクレオチドおよび／または組み換え核酸構築物は、任意の目的の生物における発現のためにコドン最適化することができる。コドン最適化は当技術分野でよく知られており、種特異的なコドン使用頻度表を用いたコドン使用頻度バイアスに関するヌクレオチド配列の改変を含む。コドン使用頻度表は、目的の生物／種について最も多く発現される遺伝子の配列分析に基づいて作成される。ヌクレオチド配列が核内で発現される場合は、コドン使用頻度表は、目的の種に関して多く発現される核遺伝子の配列分析に基づいて作成される。ヌクレオチド配列の改変は、ネイティブのポリヌクレオチド配列内に存在するコドンと種特異的なコドン使用頻度表を比較することによって決定される。当該分野で理解されているように、ヌクレオチド配列のコドン最適化は、ネイティブのヌクレオチド配列に対して１００％未満（例えば、約７０％、７１％、７２％、７３％、７４％、７５％、７６％、７７％、７８％、７９％、８０％、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、９９．５％、または９９．９％、およびその中の任意の範囲または値）の同一性を有するヌクレオチド配列を生じさせるが、元の、ネイティブのヌクレオチド配列によってコードされるものと同じ機能を有するポリペプチドをコードする。したがって、本発明の一部の実施態様では、本発明のポリヌクレオチド、核酸構築物、発現カセット、および／またはベクター（例えば、本発明のポリペプチド、融合タンパク質、複合体、例えば、改変されたＣＲＩＳＰＲ－Ｃａｓヌクレアーゼを含む／コードする）は、特定の目的の種、例えば、特定の植物種、特定の細菌種、特定の動物種などにおける発現のためにコドン最適化される。一部の実施態様では、本発明のコドン最適化された核酸構築物、ポリヌクレオチド、発現カセット、および／またはベクターは、コドン最適化されていない本発明のポリヌクレオチド、核酸構築物、発現カセット、および／またはベクターに対して約７０％～約９９．９％（例えば、約７０％、７１％、７２％、７３％、７４％、７５％、７６％、７７％、７８％、７９％、８０％、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、９９．５％、９９．９％または１００％）またはそれよりも高い同一性を有する。

本明細書中に記載の任意の実施態様において、本発明のポリヌクレオチドまたは核酸構築物は、植物および／または植物の細胞における発現のための様々なプロモーターおよび／または他の調節エレメントと作動可能に関連し得る。したがって、一部の実施態様では、本発明のポリヌクレオチドまたは核酸構築物は、１つまたは複数のヌクレオチド配列に動作可能に連結された、１つまたは複数のプロモーター、イントロン、エンハンサー、および／またはターミネーターをさらに含み得る。一部の実施態様では、プロモーターは、イントロンと動作可能に関連し得る（例えば、Ｕｂｉ１プロモーターおよびイントロン）。一部の実施態様では、イントロンと関連するプロモーターは、「プロモーター領域」と呼ばれ得る（例えば、Ｕｂｉ１プロモーターおよびイントロン。）

ポリヌクレオチドの言及における本明細書において用いられる「動作可能に連結された」または「動作可能に関連した」によって、示されたエレメントが互いに機能的に関連していることを意味し、また一般的に、物理的にも関連していることを意味する。したがって、本明細書において用いられる用語「動作可能に連結された」または「動作可能に関連した」は、機能的に関連がある単一の核酸分子上のヌクレオチド配列を指す。したがって、第２のヌクレオチド配列に動作可能に連結された第１のヌクレオチド配列は、第１のヌクレオチド配列が、第２のヌクレオチド配列との機能的関係において配置されている状況を意味する。例えば、プロモーターがヌクレオチド配列の転写または発現の作用があるならば、プロモーターはヌクレオチド配列と動作可能に関連している。制御配列（例えばプロモーター）は、制御配列が発現を指揮するように機能する限り、動作可能に関連しているヌクレオチド配列と連続している必要はないことを当業者は理解している。したがって、例えば、間に存在する転写されるが翻訳されない核酸配列が、プロモーターとヌクレオチド配列の間に存在してよく、プロモーターはそれでもなお、ヌクレオチド配列に「動作可能に連結されている」と考えることができる。

ポリペプチドに対する言及において本明細書で用いられる用語「連結される」は、１つのポリペプチドが別のポリペプチドに付着することを指す。ポリペプチドは、別のポリペプチドに（Ｎ末端またはＣ末端で）直接的に（例えばペプチド結合を介して）、またはリンカーを介して連結されてよい。

用語「リンカー」は、当該分野で認識されており、２つの分子または部分、例えば、融合タンパク質の２つのドメイン、例えば、ＬｂＣａｓ１２ａＣＲＩＳＰＲ－Ｃａｓヌクレアーゼドメインおよび目的ポリペプチド（例えば、核酸編集ドメイン、デアミナーゼドメイン、アデノシンデアミナーゼ、シトシンデアミナーゼ）などを連結する化学基、または分子を指す。リンカーは、単一の連結分子で構成されてよく、または、１つよりも多い連結分子を含んでもよい。一部の実施態様では、リンカーは、有機の分子、基、ポリマー、または化学部分、例えば、二価有機部分であることができる。一部の実施態様では、リンカーは、アミノ酸またはペプチドであってよい。一部の実施態様では、ペプチドリンカーは、約４～約１００またはそれよりも多くのアミノ酸の長さ、例えば、約４、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、５１、５２、５３、５４、５５、５６、５７、５８、５９、６０、６１、６２、６３、６４、６５、６６、６７、６８、６９、７０、７１、７２、７３、７４、７５、７６、７７、７８、７９、８０、８１、８２、８３、８４、８５、８６、８７、８８、８９、９０、９１、９２、９３、９４、９５、９６、９７、９８、９９、１００またはそれよりも多くのアミノ酸の長さ（例えば、約４～約４０、約４～約５０、約４～約６０、約５～約４０、約５～約５０、約５～約６０、約９～約４０、約９～約５０、約９～約６０、約１０～約４０、約１０～約５０、約１０～約６０、または約４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５アミノ酸～約２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、５１、５２、５３、５４、５５、５６、５７、５８、５９、６０、６１、６２、６３、６４、６５、６６、６７、６８、６９、７０、７１、７２、７３、７４、７５、７６、７７、７８、７９、８０、８１、８２、８３、８４、８５、８６、８７、８８、８９、９０、９１、９２、９３、９４、９５、９６、９７、９８、９９、１００またはそれよりも多くのアミノ酸の長さであってよい。一部の実施態様では、ペプチドリンカーはＧＳリンカーであってよい。

「プロモーター」は、プロモーターと動作可能に関連しているヌクレオチド配列（例えばコード配列）の転写を制御または調節するヌクレオチド配列である。プロモーターによって制御または調節されるコード配列は、ポリペプチドおよび／または機能性ＲＮＡをコードし得る。典型的に、「プロモーター」は、ＲＮＡポリメラーゼＩＩのための結合部位を含み転写の開始を指示するヌクレオチド配列を指す。一般に、プロモーターは、対応するコード配列のコード領域のスタートに対して５’、すなわち上流に見られる。プロモーターは、遺伝子発現の調節因子；例えば、プロモーター領域として作用する他のエレメントを含んでよい。これらは、ＴＡＴＡボックスコンセンサス配列、およびしばしば、ＣＡＡＴボックスコンセンサス配列を含む（ＢｒｅａｔｈｎａｃｈａｎｄＣｈａｍｂｏｎ，（１９８１）Ａｎｎｕ．Ｒｅｖ．Ｂｉｏｃｈｅｍ．５０：３４９）。植物では、ＣＡＡＴボックスはＡＧＧＡボックスによって置換され得る（Ｍｅｓｓｉｎｇｅｔａｌ．，（１９８３）ｉｎＧｅｎｅｔｉｃＥｎｇｉｎｅｅｒｉｎｇｏｆＰｌａｎｔｓ，Ｔ．Ｋｏｓｕｇｅ，Ｃ．ＭｅｒｅｄｉｔｈａｎｄＡ．Ｈｏｌｌａｅｎｄｅｒ（ｅｄｓ．），ＰｌｅｎｕｍＰｒｅｓｓ，ｐｐ．２１１－２２７）。一部の実施態様では、プロモーター領域は、少なくとも１つのイントロン（例えば、配列番号４０または配列番号４１）を含んでよい。

本発明で有用なプロモーターは、組み換え核酸分子、例えば、「合成の核酸構築物」または「タンパク質－ＲＮＡ複合体」の調製での使用のための、例えば、構成的、誘導的、時間的に調節された、発生学的に調節された、化学的に調節された、組織好適および／または組織特異的プロモーターを含むことができる。これらの様々なタイプのプロモーターは、当技術分野で知られている。

プロモーターの選択は、発現の時間的および空間的要件に応じて異なってよく、形質転換される宿主細胞に基づいて異なってもよい。多くの異なる生物のためのプロモーターは当技術分野でよく知られている。当該分野に存在する広範囲の知識に基づき、適切なプロモーターを、特定の目的の宿主生物のために選択することができる。したがって、例えば、モデル生物において非常に構成的に発現される遺伝子の上流のプロモーターについて多くが知られており、そのような知識は、適宜、他のシステムにおいて容易にアクセスして実施することができる。

一部の実施態様では、植物において機能性のプロモーターは、本発明の構築物とともに用いられ得る。植物における発現を駆動するのに有用なプロモーターの非限定的な例は、ルビスコ小サブユニット遺伝子１のプロモーター（ＰｒｂｃＳ１）、アクチン遺伝子のプロモーター（Ｐａｃｔｉｎ）、硝酸還元酵素遺伝子のプロモーター（Ｐｎｒ）および二重の（ｄｕｐｌｉｃａｔｅｄ）炭酸脱水酵素遺伝子１のプロモーター（Ｐｄｃａ１）を含む（Ｗａｌｋｅｒｅｔａｌ．ＰｌａｎｔＣｅｌｌＲｅｐ．２３：７２７－７３５（２００５）；Ｌｉｅｔａｌ．Ｇｅｎｅ４０３：１３２－１４２（２００７）；Ｌｉｅｔａｌ．ＭｏｌＢｉｏｌ．Ｒｅｐ．３７：１１４３－１１５４（２０１０）を参照）。ＰｒｂｃＳ１およびＰａｃｔｉｎは構成的プロモーターであり、ＰｎｒおよびＰｄｃａ１は誘導性プロモーターである。Ｐｎｒは、硝酸塩で誘導され、アンモニウムで抑制され（Ｌｉｅｔａｌ．Ｇｅｎｅ４０３：１３２－１４２（２００７））、Ｐｄｃａ１は塩によって誘導される（Ｌｉｅｔａｌ．ＭｏｌＢｉｏｌ．Ｒｅｐ．３７：１１４３－１１５４（２０１０））。

植物に有用な構成的プロモーターの例は、限定されないが、ケストルム（ｃｅｓｔｒｕｍ）ウイルスプロモーター（ｃｍｐ）（米国特許第７，１６６，７７０号）、米アクチン１プロモーター（Ｗａｎｇｅｔａｌ．（１９９２）Ｍｏｌ．Ｃｅｌｌ．Ｂｉｏｌ．１２：３３９９－３４０６；ならびに、米国特許第５，６４１，８７６号）、ＣａＭＶ３５Ｓプロモーター（Ｏｄｅｌｌｅｔａｌ．（１９８５）Ｎａｔｕｒｅ３１３：８１０－８１２）、ＣａＭＶ１９Ｓプロモーター（Ｌａｗｔｏｎｅｔａｌ．（１９８７）ＰｌａｎｔＭｏｌ．Ｂｉｏｌ．９：３１５－３２４）、ｎｏｓプロモーター（Ｅｂｅｒｔｅｔａｌ．（１９８７）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．ＳｃｉＵＳＡ８４：５７４５－５７４９）、Ａｄｈプロモーター（Ｗａｌｋｅｒｅｔａｌ．（１９８７）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ８４：６６２４－６６２９）、スクロースシンターゼプロモーター（Ｙａｎｇ＆Ｒｕｓｓｅｌｌ（１９９０）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ８７：４１４４－４１４８）、およびユビキチンプロモーターを含む。ユビキチン由来の構成的プロモーターが多くの細胞型において蓄積している。ユビキチンプロモーターは、トランスジェニック植物における使用のためにいくつかの植物種からクローニングされている（例えば、ヒマワリ（Ｂｉｎｅｔｅｔａｌ．，１９９１．ＰｌａｎｔＳｃｉｅｎｃｅ７９：８７－９４）、トウモロコシ（Ｃｈｒｉｓｔｅｎｓｅｎｅｔａｌ．，１９８９．ＰｌａｎｔＭｏｌｅｃ．Ｂｉｏｌ．１２：６１９－６３２）、およびシロイヌナズナ（Ｎｏｒｒｉｓｅｔａｌ．１９９３．ＰｌａｎｔＭｏｌｅｃ．Ｂｉｏｌ．２１：８９５－９０６））。トウモロコシユビキチンプロモーター（ＵｂｉＰ）は、トランスジェニック単子葉植物システムにおいて開発されており、その配列および単子葉植物形質転換のために構築されたベクターは、特許公報ＥＰ０３４２９２６に開示されている。ユビキチンプロモーターは、トランスジェニック植物、特に単子葉植物における、本発明のヌクレオチド配列の発現に適切である。さらに、ＭｃＥｌｒｏｙｅｔａｌ．（Ｍｏｌ．Ｇｅｎ．Ｇｅｎｅｔ．２３１：１５０－１６０（１９９１））によって記載されるプロモーター発現カセットは、本発明のヌクレオチド配列の発現のために容易に改変することができ、単子葉宿主での使用に特に適切である。

一部の実施態様では、組織特異的／組織好適プロモーターを、植物細胞における異種ポリヌクレオチドの発現のために用いることができる。組織特異的または好適な発現パターンは、限定されないが、緑色組織特異的または好適、根特異的または好適、茎特異的または好適、花特異的または好適または花粉特異的または好適を含む。緑色組織における発現に適切なプロモーターは、光合成に関与する遺伝子を調節するものの多くを含み、これらの多くは、単子葉植物および双子葉植物の両方からクローニングされている。一実施態様では、本発明で有用なプロモーターは、ホスホエノールカルボキシラーゼ遺伝子由来のトウモロコシＰＥＰＣプロモーターである（Ｈｕｄｓｐｅｔｈ＆Ｇｒｕｌａ，ＰｌａｎｔＭｏｌｅｃ．Ｂｉｏｌ．１２：５７９－５８９（１９８９））。組織特異的プロモーターの非限定的な例は、種子貯蔵タンパク質をコードする遺伝子と関連するもの（例えば、β－コングリシニン、クルシフェリン、ナピン（ｎａｐｉｎ）およびファゼオリン）、ゼインまたは油体タンパク質（例えばオレオシン）、または脂肪酸生合成に関与するタンパク質（アシル担体タンパク質、ステアロイル－ＡＣＰデサチュラーゼおよび脂肪酸デサチュラーゼ（ｆａｄ２－１）を含む）、および胚の発達中に発現する他の核酸（例えば、Ｂｃｅ４、例えば、Ｋｒｉｄｌｅｔａｌ．（１９９１）ＳｅｅｄＳｃｉ．Ｒｅｓ．１：２０９－２１９；ならびに欧州特許第２５５３７８号を参照）を含む。植物、特にトウモロコシにおける、本発明のヌクレオチド配列の発現に有用な、組織特異的または組織優先的プロモーターは、限定されないが、根、髄、葉または花粉における発現に向かわせるものを含む。そのようなプロモーターは、例えば、ＷＯ９３／０７２７８に開示されており、その全体で参照により本明細書中に援用される。本発明で有用な組織特異的または組織好適プロモーターの他の非限定的な例は、米国特許第６，０４０，５０４号に開示される綿ルビスコプロモーター；米国特許第５，６０４，１２１号に開示される米スクロースシンターゼプロモーター；ｄｅＦｒａｍｏｎｄ（ＦＥＢＳ２９０：１０３－１０６（１９９１）；ＥＰ０４５２２６９（Ｃｉｂａ－Ｇｅｉｇｙ））によって記載される根特異的プロモーター；米国特許第５，６２５，１３６号（Ｃｉｂａ－Ｇｅｉｇｙ）に記載されておりトウモロコシｔｒｐＡ遺伝子の発現を駆動する茎特異的プロモーター；ＷＯ０１／７３０８７に開示されるケストルム・イエロー・リーフ・カーリング（ｃｅｓｔｒｕｍｙｅｌｌｏｗｌｅａｆｃｕｒｌｉｎｇ）ウイルスプロモーター；および、制限されないが、米由来のＰｒｏＯｓＬＰＳ１０およびＰｒｏＯｓＬＰＳ１１（Ｎｇｕｙｅｎｅｔａｌ．ＰｌａｎｔＢｉｏｔｅｃｈｎｏｌ．Ｒｅｐｏｒｔｓ９（５）：２９７－３０６（２０１５））、トウモロコシ由来のＺｍＳＴＫ２＿ＵＳＰ（Ｗａｎｇｅｔａｌ．Ｇｅｎｏｍｅ６０（６）：４８５－４９５（２０１７））、トマト由来のＬＡＴ５２およびＬＡＴ５９（Ｔｗｅｌｌｅｔａｌ．Ｄｅｖｅｌｏｐｍｅｎｔ１０９（３）：７０５－７１３（１９９０））、Ｚｍ１３（米国特許第１０，４２１，９７２号）、シロイヌナズナ由来のＰＬＡ_２－δプロモーター（米国特許第７，１４１，４２４号）、および／または、トウモロコシ由来のＺｍＣ５プロモーター（国際ＰＣＴ公報番号ＷＯ１９９９／０４２５８７）を含む花粉特異的または好適プロモーターである。

植物組織特異的／組織好適プロモーターのさらなる例は、限定されないが、根毛特異的シス－エレメント（ＲＨＥ）（Ｋｉｍｅｔａｌ．ＴｈｅＰｌａｎｔＣｅｌｌ１８：２９５８－２９７０（２００６））、根特異的プロモーターＲＣｃ３（Ｊｅｏｎｇｅｔａｌ．ＰｌａｎｔＰｈｙｓｉｏｌ．１５３：１８５－１９７（２０１０））およびＲＢ７（米国特許第５４５９２５２号）、レクチンプロモーター（Ｌｉｎｄｓｔｒｏｍｅｔａｌ．（１９９０）Ｄｅｒ．Ｇｅｎｅｔ．１１：１６０－１６７；およびＶｏｄｋｉｎ（１９８３）Ｐｒｏｇ．Ｃｌｉｎ．Ｂｉｏｌ．Ｒｅｓ．１３８：８７－９８）、トウモロコシアルコール脱水素酵素１プロモーター（Ｄｅｎｎｉｓｅｔａｌ．（１９８４）ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．１２：３９８３－４０００）、Ｓ－アデノシル－Ｌ－メチオニン合成酵素（ＳＡＭＳ）（ＶａｎｄｅｒＭｉｊｎｓｂｒｕｇｇｅｅｔａｌ．（１９９６）ＰｌａｎｔａｎｄＣｅｌｌＰｈｙｓｉｏｌｏｇｙ，３７（８）：１１０８－１１１５）、トウモロコシ集光性複合体プロモーター（Ｂａｎｓａｌｅｔａｌ．（１９９２）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ８９：３６５４－３６５８）、トウモロコシヒートショックタンパク質プロモーター（Ｏ’Ｄｅｌｌｅｔａｌ．（１９８５）ＥＭＢＯＪ．５：４５１－４５８；およびＲｏｃｈｅｓｔｅｒｅｔａｌ．（１９８６）ＥＭＢＯＪ．５：４５１－４５８）、エンドウ小サブユニットＲｕＢＰカルボキシラーゼプロモーター（Ｃａｓｈｍｏｒｅ，「Ｎｕｃｌｅａｒｇｅｎｅｓｅｎｃｏｄｉｎｇｔｈｅｓｍａｌｌｓｕｂｕｎｉｔｏｆｒｉｂｕｌｏｓｅ－ｌ，５－ｂｉｓｐｈｏｓｐｈａｔｅｃａｒｂｏｘｙｌａｓｅ」ｐｐ．２９－３９Ｉｎ：ＧｅｎｅｔｉｃＥｎｇｉｎｅｅｒｉｎｇｏｆＰｌａｎｔｓ（Ｈｏｌｌａｅｎｄｅｒｅｄ．，ＰｌｅｎｕｍＰｒｅｓｓ１９８３；および、Ｐｏｕｌｓｅｎｅｔａｌ．（１９８６）Ｍｏｌ．Ｇｅｎ．Ｇｅｎｅｔ．２０５：１９３－２００）、Ｔｉプラスミドのマンノピンシンターゼプロモーター（Ｌａｎｇｒｉｄｇｅｅｔａｌ．（１９８９）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ８６：３２１９－３２２３）、Ｔｉプラスミドノパリンシンターゼプロモーター（Ｌａｎｇｒｉｄｇｅｅｔａｌ．（１９８９）、上記）、ペチュニアのカルコンイソメラーゼプロモーター（ｖａｎＴｕｎｅｎｅｔａｌ．（１９８８）ＥＭＢＯＪ．７：１２５７－１２６３）、マメのグリシンリッチタンパク質１プロモーター（Ｋｅｌｌｅｒｅｔａｌ．（１９８９）ＧｅｎｅｓＤｅｖ．３：１６３９－１６４６）、トランケートされたＣａＭＶ３５Ｓプロモーター（Ｏ’Ｄｅｌｌｅｔａｌ．（１９８５）Ｎａｔｕｒｅ３１３：８１０－８１２）、ジャガイモのパタチンプロモーター（Ｗｅｎｚｌｅｒｅｔａｌ．（１９８９）ＰｌａｎｔＭｏｌ．Ｂｉｏｌ．１３：３４７－３５４）、根細胞プロモーター（Ｙａｍａｍｏｔｏｅｔａｌ．（１９９０）ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．１８：７４４９）、トウモロコシのゼインプロモーター（Ｋｒｉｚｅｔａｌ．（１９８７）Ｍｏｌ．Ｇｅｎ．Ｇｅｎｅｔ．２０７：９０－９８；Ｌａｎｇｒｉｄｇｅｅｔａｌ．（１９８３）Ｃｅｌｌ３４：１０１５－１０２２；Ｒｅｉｎａｅｔａｌ．（１９９０）ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．１８：６４２５；Ｒｅｉｎａｅｔａｌ．（１９９０）ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．１８：７４４９；およびＷａｎｄｅｌｔｅｔａｌ．（１９８９）ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．１７：２３５４）、グロブリン－１プロモーター（Ｂｅｌａｎｇｅｒｅｔａｌ．（１９９１）Ｇｅｎｅｔｉｃｓ１２９：８６３－８７２）、α－チューブリンｃａｂプロモーター（Ｓｕｌｌｉｖａｎｅｔａｌ．（１９８９）Ｍｏｌ．Ｇｅｎ．Ｇｅｎｅｔ．２１５：４３１－４４０）、ＰＥＰＣａｓｅプロモーター（Ｈｕｄｓｐｅｔｈ＆Ｇｒｕｌａ（１９８９）ＰｌａｎｔＭｏｌ．Ｂｉｏｌ．１２：５７９－５８９）、Ｒ遺伝子複合体関連プロモーター（Ｃｈａｎｄｌｅｒｅｔａｌ．（１９８９）ＰｌａｎｔＣｅｌｌ１：１１７５－１１８３）、およびカルコンシンターゼプロモーター（Ｆｒａｎｋｅｎｅｔａｌ．（１９９１）ＥＭＢＯＪ．１０：２６０５－２６１２）を含む。

種特異的な発現に有用なものは、エンドウのビシリンプロモーター（Ｃｚａｋｏｅｔａｌ．（１９９２）Ｍｏｌ．Ｇｅｎ．Ｇｅｎｅｔ．２３５：３３－４０；ならびに米国特許第５，６２５，１３６号に開示される種特異的プロモーターである。成葉における発現に有用なプロモーターは、老化の発生においてスイッチされるもの、例えば、シロイヌナズナ由来のＳＡＧプロモーターである（Ｇａｎｅｔａｌ．（１９９５）Ｓｃｉｅｎｃｅ２７０：１９８６－１９８８）。

さらに、葉緑体において機能性のプロモーターを用いることができる。そのようなプロモーターの非限定的な例は、バクテリオファージＴ３遺伝子９５’ＵＴＲおよび米国特許第７，５７９，５１６号に開示される他のプロモーターを含む。本発明で有用な他のプロモーターは、限定されないが、Ｓ－Ｅ９小サブユニットＲｕＢＰカルボキシラーゼプロモーターおよびＫｕｎｉｔｚトリプシン阻害剤遺伝子プロモーター（Ｋｔｉ３）を含む。

本発明で有用なさらなる調節エレメントは、限定されないが、イントロン、エンハンサー、終結配列および／または５’および３’非翻訳領域を含む。

本発明で有用なイントロンは、植物において同定および単離されたイントロンであってよく、植物の形質転換において用いられる発現カセット内に挿入される。当業者によって理解されるように、イントロンは、自己切除に必要な配列を含むことができ、それは核酸構築物／発現カセット内にインフレームで組み込まれる。イントロンは、１つの核酸構築物内の複数のタンパク質コード配列を分けるためのスペーサーとして用いることができ、または、イントロンは、１つのタンパク質コード配列内で、例えばｍＲＮＡを安定化するために用いることができる。タンパク質コード配列内で用いられる場合、それらは、含められる切除部位と「インフレーム」で挿入される。イントロンは、発現を改善または改変するためのプロモーターと関連してもよい。一例として、本発明で有用なプロモーター／イントロンの組み合わせは、制限されないが、トウモロコシＵｂｉ１プロモーターおよびイントロンの組み合わせを含む。

本発明で有用なイントロンの非限定的な例は、ＡＤＨＩ遺伝子由来のイントロン（例えば、Ａｄｈ１－Ｓイントロン１、２および６）、ユビキチン遺伝子（Ｕｂｉ１）由来のイントロン、ルビスコ小サブユニット（ｒｂｃＳ）遺伝子由来のイントロン、ルビスコ大サブユニット（ｒｂｃＬ）遺伝子由来のイントロン、アクチン遺伝子由来のイントロン（例えば、アクチン－１イントロン）、ピルビン酸脱水素酵素キナーゼ遺伝子（ｐｄｋ）由来のイントロン、硝酸還元酵素遺伝子（ｎｒ）由来のイントロン、二重の炭酸脱水酵素遺伝子１（Ｔｄｃａ１）由来のイントロン、ｐｓｂＡ遺伝子由来のイントロン、ａｔｐＡ遺伝子由来のイントロン、またはそれらの任意の組み合わせを含む。非限定的な一例として、本発明の核酸構築物は、最適化ＣＲＩＳＰＲ－Ｃａｓヌクレアーゼ（例えば、配列番号１～１１または２３～２５）およびデアミナーゼを含む塩基エディタをコードしてよく、ここで核酸構築物は、イントロンを含む／と関連するプロモーターをさらに含む。さらなる非限定的な一例として、本発明の核酸構築物は、最適化ＣＲＩＳＰＲ－Ｃａｓヌクレアーゼ（例えば、配列番号１～１１または２３～２５）およびデアミナーゼを含む塩基エディタをコードしてよく、ここで、ヌクレアーゼおよび／またはデアミナーゼは１つまたは複数のイントロンを含み、核酸構築物は、イントロンを含む／と関連するプロモーターをさらに含んでもよい。

一部の実施態様では、本発明のポリヌクレオチドおよび／または核酸構築物は、「発現カセット」であってよく、または発現カセット内に含まれてよい。本明細書において用いられる「発現カセット」とは、例えば、本発明の核酸構築物（例えば、本発明の改変されたＬｂＣａｓ１２ａをコードする）を含む組み換え核酸分子を意味し、ここで、核酸構築物は、少なくとも制御配列（例えばプロモーター）と動作可能に関連する。したがって、本発明の一部の実施態様は、例えば、本発明の核酸構築物（例えば、本発明の改変されたＬｂＣａｓ１２ａをコードする本発明の核酸構築物）を発現するように設計された発現カセットを提供する。

本発明の核酸構築物を含む発現カセットはキメラであってよく、その構成要素の少なくとも１つが、その他の構成要素のうちの少なくとも１つに対して異種であることを意味する（例えば、宿主生物内で発現される目的ポリヌクレオチドに動作可能に連結された宿主生物由来のプロモーターであって、ここで、目的ポリヌクレオチドは、宿主とは異なる生物由来であり、または、そのプロモーターと関連して通常は見られない）。発現カセットは、天然起源のものであってもよいが、異種発現に有用な組み換え型で得られたものである。

発現カセットは、選択された宿主細胞において機能性である転写および／または翻訳終結領域（すなわち、終結領域）および／またはエンハンサー領域を含むこともできる。様々な転写ターミネーターおよびエンハンサーが当技術分野で知られており、発現カセットでの使用に利用可能である。転写ターミネーターは、転写終結および正しいｍＲＮＡポリアデニル化を担う。終結領域および／またはエンハンサー領域は、転写開始領域にネイティブであってよく、例えば、本発明の核酸構築物によってコードされるＬｂＣａｓ１２ａヌクレアーゼをコードする遺伝子にネイティブであってよく、宿主細胞にネイティブであってよく、または、他の由来にネイティブであってよい（例えば、プロモーター、本発明の核酸構築物によってコードされるＬｂＣａｓ１２ａヌクレアーゼをコードする遺伝子、宿主細胞、またはそれらの任意の組み合わせにとって外来または異種である）。エンハンサー領域は、本発明の核酸構築物によってコードされるＬｂＣａｓ１２ａヌクレアーゼをコードする遺伝子にネイティブであってよく、宿主細胞にネイティブであってよく、または、別の由来であってよい（例えば、プロモーター、本発明の核酸構築物によってコードされるＬｂＣａｓ１２ａヌクレアーゼをコードする遺伝子、宿主細胞、またはそれらの任意の組み合わせにとって外来または異種である）。

本発明の発現カセットは、形質転換された宿主細胞を選択するために用いることのできる選択可能マーカーをコードするヌクレオチド配列を含んでもよい。本明細書において用いられる「選択可能マーカー」は、発現されたときに、マーカーを発現している宿主細胞に別個の表現型を与え、したがって、そのような形質転換された細胞がマーカーを有していないものから区別され得る、ヌクレオチド配列を意味する。そのようなヌクレオチド配列は、化学的手段によって、例えば、選択剤（例えば抗生物質など）を用いることによって選択することのできる特徴をマーカーが与えるかどうか、または、マーカーが、観察または試験を通して、例えばスクリーニング（例えば蛍光）によって同定することのできる単純な特徴であるかどうかに応じて、選択可能マーカーまたはスクリーニング可能マーカーのいずれかをコードしてよい。適切な選択可能マーカーの多くの例が当技術分野で知られており、本明細書中に記載の発現カセットにおいて用いることができる。

発現カセットに加えて、本明細書中に記載の核酸分子／構築物およびポリヌクレオチド配列は、ベクターに関して用いられ得る。用語「ベクター」は、核酸（単数または複数）を細胞内に移行、送達、または導入するための組成物を指す。ベクターは、移行、送達、または導入されるヌクレオチド配列（単数または複数）を含む核酸構築物を含む。宿主生物の形質転換における使用のためのベクターは当技術分野でよく知られている。ベクターの一般的なクラスの非限定的な例は、ウイルスベクター、プラスミドベクター、ファージベクター、ファージミドベクター、コスミドベクター、フォスミドベクター、バクテリオファージ、人工染色体、ミニサークル、または、自己伝染性または運動性であってもよい、またはそうでなくてもよい、二本鎖または一本鎖の直鎖または環状型のアグロバクテリウム・バイナリー・ベクターを含む。一部の実施態様では、ウイルスベクターは、制限されないが、レトロウイルス、レンチウイルス、アデノウイルス、アデノ随伴、または単純ヘルペスウイルスベクターを含むことができる。本明細書において定義されるベクターは、原核生物または真核生物宿主を、細胞ゲノム内への組込みによって形質転換することができ、または、染色体外に存在することができる（例えば複製起点を有する自律複製プラスミド）。放線菌および関連種、細菌および真核生物（例えば高等植物、哺乳類、酵母または真菌細胞）から選択され得る２つの異なる宿主生物における複製が天然または設計によって可能であるＤＮＡビヒクルを意味するシャトルベクターがさらに含まれる。一部の実施態様では、ベクター内の核酸は、宿主細胞における転写のための適切なプロモーターまたは他の調節エレメントの制御下であり、それに動作可能に連結されている。ベクターは、複数の宿主において機能する二機能性発現ベクターであってよい。ゲノムＤＮＡの場合は、これは、その独自のプロモーターおよび／または他の調節エレメントを含んでよく、ｃＤＮＡの場合は、宿主細胞における発現のための適切なプロモーターおよび／または他の調節エレメントの制御下であってよい。したがって、本発明の核酸構築物および／またはそれを含む発現カセットは、本明細書中に記載されており当技術分野で知られているベクター内に含まれてよい。一部の実施態様では、ベクターは、高コピー数ベクター（例えば、高コピー数Ｅ．ｃｏｌｉベクター；例えば、ｐＵＣ、ｐＢｌｕｅｓｃｒｉｐｔ、ｐＧＥＭなど）であってよい。したがって、例えば、本発明のライブラリーは、高コピー数ベクターを用いて構築されてよい。

本明細書において用いられる、「接触させる（ｃｏｎｔａｃｔ）」、「接触させる（ｃｏｎｔａｃｔｉｎｇ）」、「接触した（ｃｏｎｔａｃｔｅｄ）」およびその文法上のバリエーションは、所望の反応の構成要素を、所望の反応（例えば、形質転換、転写制御、ゲノム編集、ニッキング、および／または切断）を行なうのに適切な条件下に一緒に置くことを指す。したがって、例えば、標的核酸は、（ａ）本発明の改変されたＬｂＣａｓ１２ａヌクレアーゼをコードする本発明のポリヌクレオチドおよび／または核酸構築物および（ｂ）ガイド核酸と、ポリヌクレオチド／核酸構築物が発現されて改変されたＬｂＣａｓ１２ａヌクレアーゼが産生される条件下で接触され得て、ここで、ヌクレアーゼはガイド核酸と複合体を形成し、複合体が標的核酸にハイブリダイズし、それにより標的核酸を改変する。一部の実施態様では、標的核酸は、（ａ）本発明の改変されたＬｂＣａｓ１２ａヌクレアーゼおよび／またはそれを含む融合タンパク質（例えば、本発明の改変されたＬｂＣａｓ１２ａヌクレアーゼおよび目的ポリペプチド（例えばデアミナーゼ））および（ｂ）ガイド核酸と接触され得て、ここで、改変されたＬｂＣａｓ１２ａヌクレアーゼはガイド核酸と複合体を形成し、複合体が標的核酸にハイブリダイズし、それにより標的核酸を改変する。本明細書中に記載のように、標的核酸は、ガイド核酸との接触の前、同時、後に、本発明のポリヌクレオチド／核酸構築物／ポリペプチドと接触され得る。

標的核酸に対する言及における、本明細書において用いられる「改変する（ｍｏｄｉｆｙｉｎｇ）」または「改変（ｍｏｄｉｆｉｃａｔｉｏｎ）」は、核酸／ヌクレオチド塩基の編集（例えば突然変異）、共有結合的改変、交換／置換、標的核酸の欠失、切断、ニッキング、および／または転写制御を含む。

目的ポリヌクレオチドの関連における「導入する（Ｉｎｔｒｏｄｕｃｉｎｇ）」、「導入する（ｉｎｔｒｏｄｕｃｅ）」、「導入される（ｉｎｔｒｏｄｕｃｅｄ）」（およびそれらの文法上のバリエーション）は、目的ヌクレオチド配列（例えば、ポリヌクレオチド、核酸構築物、および／またはガイド核酸）を、宿主生物または該生物の細胞（例えば、宿主細胞；例えば植物細胞）に、ヌクレオチド配列が細胞の内側にアクセスする様式で提示することを意味する。したがって、例えば、本明細書中に記載の改変されたＬｂＣａｓ１２ａヌクレアーゼをコードする本発明のポリヌクレオチドおよびガイド核酸は、生物の細胞内に導入され得て、それにより、改変されたＬｂＣａｓ１２ａヌクレアーゼおよびガイド核酸を用いて細胞を形質転換する。

本明細書において用いられる用語「形質転換」は、細胞内への異種核酸の導入を指す。細胞の形質転換は、安定的または一過的であってよい。したがって、一部の実施態様では、宿主細胞または宿主生物は、本発明のポリヌクレオチド／核酸分子によって安定的に形質転換されてよい。一部の実施態様では、宿主細胞または宿主生物は、本発明のポリヌクレオチド／核酸構築物によって一過的に形質転換されてよい。

ポリヌクレオチドの文脈における「一過的な形質転換」は、ポリヌクレオチドが細胞内に導入され、細胞のゲノム中に組み込まれないことを意味する。

細胞内に導入されるポリヌクレオチドの文脈における「安定的に導入する」または「安定的に導入される」によって、導入されるポリヌクレオチドが細胞のゲノム中に安定的に組み込まれ、したがって細胞がポリヌクレオチドによって安定的に形質転換されることを意図する。

本明細書において用いられる「安定的な形質転換」または「安定的に形質転換される」は、核酸分子が細胞内に導入され、細胞のゲノム中に組み込まれることを意味する。したがって、組み込まれた核酸分子は、その子孫、より具体的には複数の累代の子孫に遺伝することが可能である。本明細書において用いられる「ゲノム」は、核およびプラスチドゲノムを含み、したがって、例えば葉緑体またはミトコンドリアゲノム内への核酸の組込みを含む。本明細書において用いられる安定的な形質転換はまた、染色体外に、例えばミニ染色体またはプラスミドとして維持される導入遺伝子も指すことができる。

一過的な形質転換は、例えば、生物内に導入された１つまたは複数の導入遺伝子によってコードされるペプチドまたはポリペプチドの存在を検出することのできる酵素結合免疫吸着測定法（ＥＬＩＳＡ）またはウエスタンブロットによって検出され得る。細胞の安定的な形質転換は、例えば、生物（例えば植物）内に導入された導入遺伝子のヌクレオチド配列と特異的にハイブリダイズする核酸配列を用いた細胞のゲノムＤＮＡのサザンブロットハイブリダイゼーションアッセイによって検出することができる。細胞の安定的な形質転換は、例えば、宿主生物内に導入された導入遺伝子のヌクレオチド配列と特異的にハイブリダイズする核酸配列を用いた細胞のＲＮＡのノーザンブロットハイブリダイゼーションアッセイによって検出することができる。細胞の安定的な形質転換はまた、例えば、導入遺伝子の標的配列（単数または複数）とハイブリダイズする特異的なプライマー配列を用いて、標準的な方法に従って検出することのできる導入遺伝子配列の増幅をもたらす、ポリメラーゼ連鎖反応（ＰＣＲ）または当技術分野でよく知られている他の増幅反応によっても検出することができる。形質転換はまた、当技術分野でよく知られているダイレクトシーケンシングおよび／またはハイブリダイゼーションプロトコルによっても検出することができる。

したがって、一部の実施態様では、本発明のヌクレオチド配列、ポリヌクレオチド、および／または核酸構築物および／またはそれを含む発現カセットおよび／またはベクターは、一過的に発現されてよく、および／または、それらは宿主生物のゲノム内に安定的に組み込まれ得る。したがって、一部の実施態様では、本発明の核酸構築物（例えば、本発明の改変されたＬｂＣａｓ１２ａヌクレアーゼまたはその融合タンパク質；例えば目的ポリヌクレオチド、例えばデアミナーゼドメインに連結された改変されたＬｂＣａｓ１２ａヌクレアーゼを含む融合タンパク質をコードする）（ここで改変されたＬｂＣａｓ１２ａヌクレアーゼをコードする核酸構築物は、生物（例えば、植物、哺乳類、菌類、細菌など）における発現のためにコドン最適化される）は、ガイド核酸とともに生物の細胞内に一過的に導入されてよく、したがって、ＤＮＡは細胞内に維持されない。

本発明のポリヌクレオチド／核酸構築物は、当業者に公知の任意の方法によって細胞内に導入することができる。本発明の一部の実施態様では、細胞の形質転換は、核の形質転換を含む。他の実施態様では、細胞の形質転換は、プラスチドの形質転換（例えば、葉緑体の形質転換）を含む。さらなる実施態様では、本発明のポリヌクレオチド／核酸構築物は、従来の繁殖技術を介して細胞内に導入することができる。

真核生物および原核生物を形質転換する手順はどちらも当該分野においてよく知られておりルーチンであり、文献全体を通して記載されている（例えば、Ｊｉａｎｇｅｔａｌ．２０１３．Ｎａｔ．Ｂｉｏｔｅｃｈｎｏｌ．３１：２３３－２３９；Ｒａｎｅｔａｌ．ＮａｔｕｒｅＰｒｏｔｏｃｏｌｓ８：２２８１－２３０８（２０１３）を参照）。

したがって、ヌクレオチド配列は、宿主生物またはその細胞内に、当技術分野でよく知られている任意の数の方法で導入することができる。本発明の方法は、生物内に１つまたは複数のヌクレオチド配列を導入するために特定の方法に依存せず、生物の少なくとも１つの細胞の内側にアクセスすることのみである。１よりも多いヌクレオチド配列が導入される場合は、それらは、単一の核酸構築物の一部としてアセンブルされ得て、または別個の核酸構築物として、同一または異なる核酸構築物上に位置することができる。したがって、ヌクレオチド配列は、単一の形質転換イベントにおいて、および／または別個の形質転換において目的の細胞内に導入することができ、あるいは、関連がある場合、ヌクレオチド配列は、植物内に、例えば繁殖プロトコルの一部として組み込まれ得る。

本発明は、非天然ＰＡＭ認識部位／配列を含むように改変されたＣａｓ１２ａヌクレアーゼ（例えば、その特定のＣａｓ１２ａヌクレアーゼに関する天然ＰＡＭ認識特異性に加えて、またはその代わりに、非天然ＰＡＭ認識特異性を含むＣａｓ１２ａヌクレアーゼ）に関する。さらに、本発明は、改善されたＰＡＭ認識特異性を含む望ましい特性を有するＣａｓ１２ａヌクレアーゼを設計、特定、および選択するための方法に関する。

改変されたＣａｓ１２ａポリペプチドの言及において本明細書において用いられる、「変更されたＰＡＭ特異性」は、ヌクレアーゼのＰＡＭ特異性が野生型ヌクレアーゼのものから変更されていることを意味する（例えば、非ネイティブＰＡＭ配列が、ネイティブＰＡＭ配列に加えて、および／またはその代わりに認識される。例えば、改変されたＣａｓ１２ａヌクレアーゼは、ＴＴＴＶ（Ｖ＝Ａ、ＣまたはＧ）のネイティブＣａｓ１２ａＰＡＭ配列以外を、および／またはそれに加えてＰＡＭ配列を認識する場合は、そのＰＡＭ特異性が変更されている。

本発明は、改変されたＰＡＭ認識特異性を有するＬｂＣａｓ１２ａヌクレアーゼに関する。一部の実施態様では、本発明は、改変されたＬａｃｈｎｏｓｐｉｒａｃｅａｅｂａｃｔｅｒｉｕｍＣＲＩＳＰＲ（ＣｌｕｓｔｅｒｅｄＲｅｇｕｌａｒｌｙＩｎｔｅｒｓｐａｃｅｄＳｈｏｒｔＰａｌｉｎｄｒｏｍｉｃＲｅｐｅａｔｓ）Ｃａｓ１２ａ（ＬｂＣａｓ１２ａ）ポリペプチドを提供し、ここで、改変されたＬｂＣａｓ１２ａポリペプチドは、配列番号１（ＬｂＣａｓ１２ａ）のアミノ酸配列と少なくとも８０％同一性（例えば、約８０、８１、８２、８３、８４、８５、８６、８７、８８、８９、９０、９１、９２、９３、９４、９５、９６、９７、９８、９９、１００％同一性；例えば、約８０％～約１００％、約８５％～約１００％、約９０％～約１００％約９５％～約１００％）を有するアミノ酸配列、および、配列番号１の位置ナンバリングに関して以下の位置：Ｋ１１６、Ｋ１２０、Ｋ１２１、Ｄ１２２、Ｅ１２５、Ｔ１４８、Ｔ１４９、Ｔ１５２、Ｄ１５６、Ｅ１５９、Ｑ５２９、Ｇ５３２、Ｄ５３５、Ｋ５３８、Ｄ５４１、Ｙ５４２、Ｌ５８５、Ｋ５９１、Ｍ５９２、Ｋ５９５、Ｖ５９６、Ｓ５９９、Ｋ６００、Ｋ６０１、Ｙ６１６、Ｙ６４６、および／またはＷ６４９の１つ以上（例えば、２、３、４、５、６、７、８、９、１０、１１、１２、１３またはそれよりも多く）における突然変異を含み、配列番号１の位置ナンバリングに関して以下の位置：Ｋ１１６、Ｋ１２０、Ｋ１２１、Ｄ１２２、Ｅ１２５、Ｔ１５２、Ｄ１５６、Ｅ１５９、Ｇ５３２、Ｄ５３５、Ｋ５３８、Ｄ５４１、および／またはＫ５９５の１つ以上における突然変異であってもよい。一部の実施態様では、Ｃａｓ１２ａ（ＬｂＣａｓ１２ａ）ポリペプチドの突然変異は、配列番号１の位置ナンバリングに関して以下の位置：Ｋ１１６、Ｋ１２０、Ｋ１２１、Ｄ１２２、Ｅ１２５、Ｔ１５２、Ｄ１５６、Ｅ１５９、Ｇ５３２、Ｄ５３５、Ｋ５３８、Ｄ５４１、および／またはＫ５９５の１つ以上における任意の組み合わせでの突然変異を含む、から本質的になる、またはからなる。したがって、本発明の改変されたＬｂＣａｓ１２ａポリペプチドは、配列番号１の位置ナンバリングに関して位置：Ｋ１１６、Ｋ１２０、Ｋ１２１、Ｄ１２２、Ｅ１２５、Ｔ１４８、Ｔ１４９、Ｔ１５２、Ｄ１５６、Ｅ１５９、Ｑ５２９、Ｇ５３２、Ｄ５３５、Ｋ５３８、Ｄ５４１、Ｙ５４２、Ｌ５８５、Ｋ５９１、Ｍ５９２、Ｋ５９５、Ｖ５９６、Ｓ５９９、Ｋ６００、Ｋ６０１、Ｙ６１６、Ｙ６４６、および／またはＷ６４９のいずれか１つにおける単一突然変異を含んでよく、または、配列番号１の位置ナンバリングに関して、位置：Ｋ１１６、Ｋ１２０、Ｋ１２１、Ｄ１２２、Ｅ１２５、Ｔ１４８、Ｔ１４９、Ｔ１５２、Ｄ１５６、Ｅ１５９、Ｑ５２９、Ｇ５３２、Ｄ５３５、Ｋ５３８、Ｄ５４１、Ｙ５４２、Ｌ５８５、Ｋ５９１、Ｍ５９２、Ｋ５９５、Ｖ５９６、Ｓ５９９、Ｋ６００、Ｋ６０１、Ｙ６１６、Ｙ６４６、および／またはＷ６４９の任意の２以上における突然変異の組み合わせを含んでよい。

一部の実施態様では、Ｃａｓ１２ａ（ＬｂＣａｓ１２ａ）ポリペプチドの突然変異は、配列番号１の位置ナンバリングに関して以下の突然変異：Ｋ１１６Ｎ、Ｋ１１６Ｒ、Ｋ１２０Ｈ、Ｋ１２０Ｎ、Ｋ１２０Ｑ、Ｋ１２０Ｒ、Ｋ１２０Ｔ、Ｋ１２１Ｄ、Ｋ１２１Ｇ、Ｋ１２１Ｈ、Ｋ１２１Ｑ、Ｋ１２１Ｒ、Ｋ１２１Ｓ、Ｋ１２１Ｔ、Ｄ１２２Ｈ、Ｄ１２２Ｋ、Ｄ１２２Ｎ、Ｄ１２２Ｒ、Ｅ１２５Ｋ、Ｅ１２５Ｑ、Ｅ１２５Ｒ、Ｅ１２５Ｙ、Ｔ１４８Ａ、Ｔ１４８Ｃ、Ｔ１４８Ｈ、Ｔ１４８Ｓ、Ｔ１４９Ｃ、Ｔ１４９Ｆ、Ｔ１４９Ｇ、Ｔ１４９Ｈ、Ｔ１４９Ｎ、Ｔ１４９Ｐ、Ｔ１４９Ｓ、Ｔ１４９Ｖ、Ｔ１５２Ｅ、Ｔ１５２Ｆ、Ｔ１５２Ｈ、Ｔ１５２Ｋ、Ｔ１５２Ｌ、Ｔ１５２Ｑ、Ｔ１５２Ｒ、Ｔ１５２Ｗ、Ｔ１５２Ｙ、Ｄ１５６Ｅ、Ｄ１５６Ｈ、Ｄ１５６Ｉ、Ｄ１５６Ｋ、Ｄ１５６Ｌ、Ｄ１５６Ｑ、Ｄ１５６Ｒ、Ｄ１５６Ｗ、Ｄ１５６Ｙ、Ｅ１５９Ｋ、Ｅ１５９Ｑ、Ｅ１５９Ｒ、Ｅ１５９Ｙ、Ｑ５２９Ａ、Ｑ５２９Ｄ、Ｑ５２９Ｆ、Ｑ５２９Ｇ、Ｑ５２９Ｈ、Ｑ５２９Ｎ、Ｑ５２９Ｐ、Ｑ５２９Ｓ、Ｑ５２９Ｔ、Ｑ５２９Ｗ、Ｇ５３２Ａ、Ｇ５３２Ｃ、Ｇ５３２Ｄ、Ｇ５３２Ｆ、Ｇ５３２Ｈ、Ｇ５３２Ｋ、Ｇ５３２Ｌ、Ｇ５３２Ｎ、Ｇ５３２Ｑ、Ｇ５３２Ｓ、Ｄ５３５Ａ、Ｄ５３５Ｈ、Ｄ５３５Ｋ、Ｄ５３５Ｎ、Ｄ５３５Ｓ、Ｄ５３５Ｔ、Ｄ５３５Ｖ、Ｋ５３８Ｃ、Ｋ５３８Ｆ、Ｋ５３８Ｇ、Ｋ５３８Ｈ、Ｋ５３８Ｌ、Ｋ５３８Ｍ、Ｋ５３８Ｑ、Ｋ５３８Ｒ、Ｋ５３８Ｖ、Ｋ５３８Ｗ、Ｋ５３８Ｙ、Ｄ５４１Ａ、Ｄ５４１Ｅ、Ｄ５４１Ｈ、Ｄ５４１Ｉ、Ｄ５４１Ｎ、Ｄ５４１Ｒ、Ｄ５４１Ｙ、Ｙ５４２Ｆ、Ｙ５４２Ｈ、Ｙ５４２Ｋ、Ｙ５４２Ｌ、Ｙ５４２Ｍ、Ｙ５４２Ｎ、Ｙ５４２Ｒ、Ｙ５４２Ｔ、Ｙ５４２Ｖ、Ｌ５８５Ｆ、Ｌ５８５Ｇ、Ｌ５８５Ｈ、Ｋ５９１Ａ、Ｋ５９１Ｆ、Ｋ５９１Ｇ、Ｋ５９１Ｈ、Ｋ５９１Ｒ、Ｋ５９１Ｓ、Ｋ５９１Ｗ、Ｋ５９１Ｙ、Ｍ５９２Ａ、Ｍ５９２Ｅ、Ｍ５９２Ｑ、Ｋ５９５Ｈ、Ｋ５９５Ｌ、Ｋ５９５Ｍ、Ｋ５９５Ｑ、Ｋ５９５Ｒ、Ｋ５９５Ｓ、Ｋ５９５Ｗ、Ｋ５９５Ｙ、Ｖ５９６Ｈ、Ｖ５９６Ｔ、Ｓ５９９Ｇ、Ｓ５９９Ｈ、Ｓ５９９Ｎ、Ｋ６００Ｇ、Ｋ６００Ｈ、Ｋ６００Ｒ、Ｋ６０１Ｈ、Ｋ６０１Ｑ、Ｋ６０１Ｒ、Ｋ６０１Ｔ、Ｙ６１６Ｅ、Ｙ６１６Ｆ、Ｙ６１６Ｈ、Ｙ６１６Ｋ、Ｙ６１６Ｒ、Ｙ６４６Ｅ、Ｙ６４６Ｈ、Ｙ６４６Ｋ、Ｙ６４６Ｎ、Ｙ６４６Ｑ、Ｙ６４６Ｒ、Ｙ６４６Ｗ、Ｗ６４９Ｈ、Ｗ６４９Ｋ、Ｗ６４９Ｒ、Ｗ６４９Ｓおよび／またはＷ６４９Ｙの１つ以上を含む、から本質的になる、またはからなる。理解されるように、２以上の突然変異を有する任意の単一Ｃａｓ１２ａポリペプチドは、任意の所定の位置に単一の突然変異のみを含む。したがって、例えば、ポリペプチドは、Ｄ５３５Ａ、Ｄ５３５Ｈ、Ｄ５３５Ｋ、Ｄ５３５Ｎ、Ｄ５３５Ｓ、Ｄ５３５Ｔ、またはＤ５３５Ｖのいずれか１つの位置Ｄ５３５における突然変異を有し得るが、同じポリペプチドは、本明細書中に記載の他の位置のいずれかの１つ以上における突然変異をさらに含み得る。一部の実施態様では、Ｃａｓ１２ａ（ＬｂＣａｓ１２ａ）ポリペプチドの突然変異は、配列番号１の残基位置ナンバリングに関してＫ１１６Ｎ、Ｋ１１６Ｒ、Ｋ１２０Ｈ、Ｋ１２０Ｎ、Ｋ１２０Ｑ、Ｋ１２０Ｒ、Ｋ１２０Ｔ、Ｋ１２１Ｄ、Ｋ１２１Ｇ、Ｋ１２１Ｈ、Ｋ１２１Ｑ、Ｋ１２１Ｒ、Ｋ１２１Ｓ、Ｋ１２１Ｔ、Ｄ１２２Ｈ、Ｄ１２２Ｋ、Ｄ１２２Ｎ、Ｄ１２２Ｒ、Ｅ１２５Ｋ、Ｅ１２５Ｑ、Ｅ１２５Ｒ、Ｅ１２５Ｙ、Ｔ１５２Ｅ、Ｔ１５２Ｆ、Ｔ１５２Ｈ、Ｔ１５２Ｋ、Ｔ１５２Ｌ、Ｔ１５２Ｑ、Ｔ１５２Ｒ、Ｔ１５２Ｗ、Ｔ１５２Ｙ、Ｄ１５６Ｅ、Ｄ１５６Ｈ、Ｄ１５６Ｉ、Ｄ１５６Ｋ、Ｄ１５６Ｌ、Ｄ１５６Ｑ、Ｄ１５６Ｒ、Ｄ１５６Ｗ、Ｄ１５６Ｙ、Ｅ１５９Ｋ、Ｅ１５９Ｑ、Ｅ１５９Ｒ、Ｅ１５９Ｙ、Ｇ５３２Ａ、Ｇ５３２Ｃ、Ｇ５３２Ｄ、Ｇ５３２Ｆ、Ｇ５３２Ｈ、Ｇ５３２Ｋ、Ｇ５３２Ｌ、Ｇ５３２Ｎ、Ｇ５３２Ｑ、Ｇ５３２Ｓ、Ｄ５３５Ａ、Ｄ５３５Ｈ、Ｄ５３５Ｋ、Ｄ５３５Ｎ、Ｄ５３５Ｓ、Ｄ５３５Ｔ、Ｄ５３５Ｖ、Ｋ５３８Ｃ、Ｋ５３８Ｆ、Ｋ５３８Ｇ、Ｋ５３８Ｈ、Ｋ５３８Ｌ、Ｋ５３８Ｍ、Ｋ５３８Ｑ、Ｋ５３８Ｒ、Ｋ５３８Ｖ、Ｋ５３８Ｗ、Ｋ５３８Ｙ、Ｄ５４１Ａ、Ｄ５４１Ｅ、Ｄ５４１Ｈ、Ｄ５４１Ｉ、Ｄ５４１Ｎ、Ｄ５４１Ｒ、Ｄ５４１Ｙ、Ｋ５９５Ｈ、Ｋ５９５Ｌ、Ｋ５９５Ｍ、Ｋ５９５Ｑ、Ｋ５９５Ｒ、Ｋ５９５Ｓ、Ｋ５９５Ｗ、および／またはＫ５９５Ｙの突然変異の１つ以上を任意の組み合わせで含む、から本質的になる、またはからなる。一部の実施態様では、Ｃａｓ１２ａ（ＬｂＣａｓ１２ａ）ポリペプチドの突然変異は、配列番号１の位置ナンバリングに関してＫ１１６Ｒ、Ｋ１１６Ｎ、Ｋ１２０Ｙ、Ｋ１２１Ｓ、Ｋ１２１Ｒ、Ｄ１２２Ｈ、Ｄ１２２Ｎ、Ｅ１２５Ｋ、Ｔ１５２Ｒ、Ｔ１５２Ｋ、Ｔ１５２Ｙ、Ｔ１５２Ｑ、Ｔ１５２Ｅ、Ｔ１５２Ｆ、Ｄ１５６Ｒ、Ｄ１５６Ｗ、Ｄ１５６Ｑ、Ｄ１５６Ｈ、Ｄ１５６Ｉ、Ｄ１５６Ｖ、Ｄ１５６Ｌ、Ｄ１５６Ｅ、Ｅ１５９Ｋ、Ｅ１５９Ｒ、Ｇ５３２Ｎ、Ｇ５３２Ｓ、Ｇ５３２Ｈ、Ｇ５３２Ｋ、Ｇ５３２Ｒ、Ｇ５３２Ｌ、Ｄ５３５Ｎ、Ｄ５３５Ｈ、Ｄ５３５Ｔ、Ｄ５３５、ＳＤ５３５Ａ、Ｄ５３５Ｗ、Ｋ５３８ＲＫ５３８Ｖ、Ｋ５３８Ｑ、Ｋ５３８Ｗ、Ｋ５３８Ｙ、Ｋ５３８Ｆ、Ｋ５３８Ｈ、Ｋ５３８Ｌ、Ｋ５３８Ｍ、Ｋ５３８Ｃ、Ｋ５３８Ｇ、Ｋ５３８Ａ、Ｄ５４１Ｅ、Ｋ５９５Ｒ、Ｋ５９５Ｑ、Ｋ５９５Ｙ、Ｋ５９５Ｗ、Ｋ５９５Ｈ、Ｋ５９５Ｓ、および／またはＫ５９５Ｍの突然変異の１つ以上を含む、から本質的になる、またはからなる。理解されるように、２以上の突然変異を有する任意の単一Ｃａｓ１２ａポリペプチドは、任意の所定の位置における単一突然変異を含む。したがって、例えば、ポリペプチドは、Ｄ５３５Ａ、Ｄ５３５Ｈ、Ｄ５３５Ｋ、Ｄ５３５Ｎ、Ｄ５３５Ｓ、Ｄ５３５Ｔ、またはＤ５３５Ｖのいずれか１つの位置Ｄ５３５における突然変異を有してよく、本明細書中に記載の任意の他の位置における、１つ以上における突然変異をさらに含んでよい。

一部の実施態様では、突然変異は、配列番号１の位置ナンバリングに関してＤ１５６Ｒ、Ｇ５３２Ｒ、Ｋ５３８Ｒ、Ｋ５３８Ｖ、Ｙ５４２ＲまたはＫ５９５Ｒの突然変異を含まない、それらから本質的になるものではない、または、それらからなるものではない。一部の実施態様では、Ｃａｓ１２ａ（ＬｂＣａｓ１２ａ）ポリペプチドの突然変異は、配列番号１の位置ナンバリングに関して、Ｇ５３２ＲおよびＫ５９５Ｒの突然変異の組み合わせ、Ｇ５３２Ｒ、Ｋ５３８ＶおよびＹ５４２Ｒの突然変異の組み合わせ、または、Ｄ１５６Ｒ、Ｇ５３２ＲおよびＫ５３２Ｒの突然変異の組み合わせを含まない、それらから本質的になるものではない、または、それらからなるものではない。

一部の実施態様では、改変されたＬｂＣａｓ１２ａポリペプチドは、表２（実施例２にある）に記載の配列番号１の１つまたは複数のアミノ酸突然変異を含んでよい。

一部の実施態様では、改変されたＬｂＣａｓ１２ａポリペプチドは、野生型ＬｂＣａｓ１２ａ（例えば、配列番号１）と比較して変更されたプロトスペーサー隣接モチーフ（ＰＡＭ）特異性を含んでよい。本発明の改変されたＬｂＣａｓ１２ａポリペプチドは、変更されたＰＡＭ特異性を含んでよく、変更されたＰＡＭ特異性は、制限されないが、ＮＮＮＧ、ＮＮＮＴ、ＮＮＮＡ、ＮＮＮＣ、ＮＮＧ、ＮＮＴ、ＮＮＣ、ＮＮＡ、ＮＧ、ＮＴ、ＮＣ、ＮＡ、ＮＮ、ＮＮＮ、ＮＮＮＮを含み、ここで各配列の各Ｎは独立に、Ｔ、Ｃ、Ｇ、またはＡのいずれかから選択される。一部の実施態様では、変更されたＰＡＭ特異性は、制限されないが、ＴＴＴＡ、ＴＴＴＣ、ＴＴＴＧ、ＴＴＴＴ、ＴＴＣＡ、ＴＴＣＣ、ＴＴＣＧ、ＴＴＣＴ、ＡＴＴＣ、ＣＴＴＡ、ＣＴＴＣ、ＣＴＴＧ、ＧＴＴＣ、ＴＡＴＡ、ＴＡＴＣ、ＣＴＣＣ、ＴＣＣＧ、ＴＡＣＡ、ＴＣＣＧ、ＴＡＣＡ、ＴＣＣＧ、ＴＣＣＣ、ＴＣＣＡ、および／またはＴＡＴＧを含んでよい。一部の実施態様では、変更されたＰＡＭ特異性はＮＮＮＮであってよく、ここで各配列の各Ｎは独立に、Ｔ、Ｃ、Ｇ、またはＡのいずれかから選択される。

変更されたＰＡＭ認識特異性を有することに加えて、改変されたＬｂＣａｓ１２ａヌクレアーゼは、ヌクレアーゼ活性部位（例えば、ＲｕｖＣドメイン）内に突然変異をさらに含んでよい（例えば、ｄｅａｄＬｂＣａｓ１２ａ、ｄＬｂＣａｓ１２ａ）。そのような改変は、ヌクレアーゼ活性（例えば、ニッカーゼ活性）が減少したＬｂＣａｓ１２ａポリペプチドまたはヌクレアーゼ活性のないＬｂＣａｓ１２ａポリペプチドを生じさせ得る。

一部の実施態様では、Ｖ型ＣｌｕｓｔｅｒｅｄＲｅｇｕｌａｒｌｙＩｎｔｅｒｓｐａｃｅｄＳｈｏｒｔＰａｌｉｎｄｒｏｍｉｃＲｅｐｅａｔｓ（ＣＲＩＳＰＲ）関連（Ｃａｓ）（ＣＲＩＳＰＲ－Ｃａｓ）システムが提供され、該システムは、以下を含む：（ａ）以下を含む融合タンパク質：（ｉ）本発明の改変されたＬｂＣａｓ１２ａヌクレアーゼまたは本発明の改変されたＬｂＣａｓ１２ａヌクレアーゼをコードする核酸、および（ｉｉ）目的ポリペプチドまたは目的ポリペプチドをコードする核酸；および（ｂ）スペーサー配列とリピート配列とを含むガイド核酸（ＣＲＩＳＰＲＲＮＡ、ＣＲＩＳＰＲＤＮＡ、ｃｒＲＮＡ、ｃｒＤＮＡ）（ここで、ガイド核酸は改変されたＬｂＣａｓ１２ａヌクレアーゼまたは融合タンパク質と複合体を形成することが可能であり、スペーサー配列は、標的核酸にハイブリダイズすることが可能である）、それにより、改変されたＬｂＣａｓ１２ａヌクレアーゼおよび目的ポリペプチドを標的核酸にガイドし、それにより、該システムは、標的核酸を改変（例えば切断または編集）または調整（例えば転写調整）することが可能である。一部の実施態様では、該システムは、改変されたＬｂＣａｓ１２ａヌクレアーゼのＣ末端および／またはＮ末端に連結された目的ポリペプチド（例えば融合タンパク質）を含み、ペプチドリンカーを介してもよい。

さらに、本発明の改変されたＣａｓ１２ａヌクレアーゼを含む融合タンパク質が本明細書において提供される。一部の実施態様では、融合タンパク質は、改変されたＬｂＣａｓ１２ａのＣ末端および／またはＮ末端に連結された目的ポリペプチドを含んでよい。一部の実施態様では、本発明は、改変されたＬｂＣａｓ１２ａを含む（および目的ポリペプチドを連結する介在リンカーを含んでもよい）、融合タンパク質を提供する。

融合タンパク質の活性と干渉しないことが当技術分野で知られているか、または後に同定される、任意のリンカーを用いてよい。融合タンパク質の活性と「干渉」しないリンカーは、融合タンパク質のポリペプチド（例えば、ヌクレアーゼおよび／または目的ポリペプチド）の活性を減少または消去しないリンカーであり；すなわち、ヌクレアーゼ活性、核酸結合活性、編集活性、および／またはヌクレアーゼまたは目的ペプチドの任意の他の活性は、ヌクレアーゼおよび目的ポリペプチドがリンカーを介して互いにつなげられている融合タンパク質において維持される。一部の実施態様では、ペプチドリンカーは、（例えばそのＮ末端において）、改変されたＬｂＣａｓ１２ａのＣ末端に連結されてよく、融合タンパク質は、リンカーのＣ末端に連結された目的ポリペプチドをさらに含んでもよい。一部の実施態様では、ペプチドリンカーは、（例えばそのＣ末端において）、改変されたＬｂＣａｓ１２ａのＮ末端に連結されてよく、融合タンパク質は、リンカーのＮ末端に連結された目的ポリペプチドをさらに含んでもよい。一部の実施態様では、本発明の改変されたＬｂＣａｓ１２ａは、そのＣ末端およびＮ末端の両方において、リンカーおよび／または目的ポリペプチドに連結されてよい（直接、またはリンカーを介して）。

一部の実施態様では、本発明で有用なリンカーは、アミノ酸またはペプチドであってよい。一部の実施態様では、本発明で有用なペプチドリンカーは、約４～約１００またはそれよりも多くのアミノ酸の長さ、例えば、約４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、５１、５２、５３、５４、５５、５６、５７、５８、５９、６０、６１、６２、６３、６４、６５、６６、６７、６８、６９、７０、７１、７２、７３、７４、７５、７６、７７、７８、７９、８０、８１、８２、８３、８４、８５、８６、８７、８８、８９、９０、９１、９２、９３、９４、９５、９６、９７、９８、９９、１００またはそれよりも多くのアミノ酸の長さ（例えば、約４～約４０、約４～約５０、約４～約６０、約５～約４０、約５～約５０、約５～約６０、約９～約４０、約９～約５０、約９～約６０、約１０～約４０、約１０～約５０、約１０～約６０、または約４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５アミノ酸～約２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、５１、５２、５３、５４、５５、５６、５７、５８、５９、６０、６１、６２、６３、６４、６５、６６、６７、６８、６９、７０、７１、７２、７３、７４、７５、７６、７７、７８、７９、８０、８１、８２、８３、８４、８５、８６、８７、８８、８９、９０、９１、９２、９３、９４、９５、９６、９７、９８、９９、１００またはそれよりも多くのアミノ酸の長さ）であってよい。一部の実施態様では、ペプチドリンカーはＧＳリンカーであってよい。

本発明によって有用な目的ポリペプチドは、制限されないが、デアミナーゼ（脱アミノ化）活性、ニッカーゼ活性、リコンビナーゼ活性、トランスポサーゼ活性、メチラーゼ活性、グリコシラーゼ（ＤＮＡグリコシラーゼ）活性、グリコシラーゼ阻害剤活性（例えば、ウラシル－ＤＮＡグリコシラーゼ阻害剤（ＵＧＩ））．デメチラーゼ活性、転写活性化活性、転写抑制活性、転写終結因子（ｔｒａｎｓｃｒｉｐｔｉｏｎｒｅｌｅａｓｅｆａｃｔｏｒ）活性、ヒストン修飾活性、ヌクレアーゼ活性、一本鎖ＲＮＡ切断活性、二本鎖ＲＮＡ切断活性、制限エンドヌクレアーゼ活性（例えば、Ｆｏｋ１）、核酸結合活性、メチルトランスフェラーゼ活性、ＤＮＡ修復活性、ＤＮＡ損傷活性、ジスムターゼ活性、アルキル化活性、脱プリン活性、酸化活性、ピリミジンダイマー形成活性、インテグラーゼ活性、トランスポサーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、および／またはフォトリアーゼ活性を有するポリペプチドまたはタンパク質ドメインを含むことできる。

一部の実施態様では、目的ポリペプチドは、デアミナーゼ活性を有する少なくとも１つのポリペプチドまたはタンパク質ドメインを含んでよい。一部の実施態様では、少なくとも１つのポリペプチドまたはタンパク質ドメインは、アデニンデアミナーゼドメインであってよい。本発明で有用なアデニンデアミナーゼ（またはアデノシンデアミナーゼ）は、任意の公知のまたは後の同定される、任意の生物由来のアデニンデアミナーゼであってよい（例えば、米国特許第１０，１１３，１６３号を参照し、それはアデニンデアミナーゼのその開示について参照により本明細書中に援用される）。アデニンデアミナーゼは、アデニンまたはアデノシンの加水分解性の脱アミノ化を触媒することができる。一部の実施態様では、アデニンデアミナーゼは、アデノシンまたはデオキシアデノシンの、それぞれイノシンまたはデオキシイノシンへの加水分解性の脱アミノ化を触媒し得る。一部の実施態様では、アデノシンデアミナーゼは、ＤＮＡにおけるアデニンまたはアデノシンの加水分解性の脱アミノ化を触媒し得る。一部の実施態様では、本発明の核酸構築物によってコードされるアデニンデアミナーゼは、標的核酸のセンス（例えば、「＋」；テンプレート）鎖におけるＡ→Ｇ変換または標的核酸のアンチセンス（例えば、「－」、相補）鎖におけるＴ→Ｃ変換を産生し得る。

一部の実施態様では、アデノシンデアミナーゼは、天然起源アデニンデアミナーゼの変異体であってよい。したがって、一部の実施態様では、本発明で有用なアデノシンデアミナーゼは、野生型アデニンデアミナーゼと約７０％～１００％同一であってよい（例えば、天然起源アデニンデアミナーゼと約７０％、７１％、７２％、７３％、７４％、７５％、７６％、７７％、７８％、７９％、８０％、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、または１００％同一、およびその中の任意の範囲または値）。一部の実施態様では、デアミナーゼまたはデアミナーゼは、天然に生じず、操作された、突然変異した、または進化したアデノシンデアミナーゼと呼ばれ得る。したがって、例えば、操作された、突然変異した、または進化したアデニンデアミナーゼポリペプチドまたはアデニンデアミナーゼドメインは、天然起源アデニンデアミナーゼポリペプチド／ドメインと約７０％～９９．９％同一であってよい（例えば、天然起源アデニンデアミナーゼポリペプチドまたはアデニンデアミナーゼドメインと約７０％、７１％、７２％、７３％、７４％、７５％、７６％、７７％、７８％、７９％、８０％、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、９９．１％、９９．２％、９９．３％、９９．４％、９９．５％、９９．６％、９９．７％、９９．８％または９９．９％同一、およびその中の任意の範囲または値）。一部の実施態様では、アデノシンデアミナーゼは、細菌、（例えば、大腸菌、黄色ブドウ球菌、インフルエンザ菌、カウロバクター・クレセンタスなど）由来であってよい。一部の実施態様では、アデニンデアミナーゼポリペプチド／ドメインをコードするポリヌクレオチドは、生物における発現のためにコドン最適化されてよい。

一部の実施態様では、アデニンデアミナーゼドメインは、野生型ｔＲＮＡ特異的アデノシンデアミナーゼドメイン、例えば、ｔＲＮＡ特異的アデノシンデアミナーゼ（ＴａｄＡ）および／または突然変異／進化したアデノシンデアミナーゼドメイン、例えば、突然変異／進化したｔＲＮＡ特異的アデノシンデアミナーゼドメイン（ＴａｄＡ^＊）であってよい。一部の実施態様では、ＴａｄＡドメインはＥ．ｃｏｌｉ由来であってよい。一部の実施態様では、ＴａｄＡは、改変されてよく、例えば、トランケートされてよく、全長ＴａｄＡに対して１つまたは複数のＮ末端および／またはＣ末端アミノ酸が欠失していてよい（例えば、全長ＴａｄＡと比較して、１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、６、１７、１８、１９、または２０個のＮ末端および／またはＣ末端アミノ酸残基が欠失してよい。一部の実施態様では、ＴａｄＡポリペプチドまたはＴａｄＡドメインは、Ｎ末端メチオニンを含まない。一部の実施態様では、野生型Ｅ．ｃｏｌｉＴａｄＡは、配列番号１８のアミノ酸配列を含む。一部の実施態様では、突然変異／進化したＥ．ｃｏｌｉＴａｄＡ^＊は、配列番号１９～２２のアミノ酸配列を含む。一部の実施態様では、ＴａｄＡ／ＴａｄＡ^＊をコードするポリヌクレオチドは、生物における発現のためにコドン最適化されてよい。

本発明で有用なシトシンデアミナーゼ（またはシチジンデアミナーゼ）は、任意の公知のまたは後の同定される、任意の生物由来のシトシンデアミナーゼであってよい（例えば、米国特許第１０，１６７，４５７号を参照し、それは、シトシンデアミナーゼのその開示について参照により本明細書中に援用される）。一部の実施態様では、少なくとも１つのポリペプチドまたはタンパク質ドメインは、シトシンデアミナーゼポリペプチドまたはドメインであってよい。一部の実施態様では、シトシンデアミナーゼポリペプチド／ドメインは、アポリポタンパク質ＢｍＲＮＡ編集触媒ポリペプチド様（ＡＰＯＢＥＣ）ドメインであってよい。一部の実施態様では、目的ポリペプチドは、グリコシラーゼ阻害剤活性を有する少なくとも１つのポリペプチドまたはタンパク質ドメインを含んでよい。一部の実施態様では、目的ポリペプチドは、ウラシル－ＤＮＡグリコシラーゼ阻害剤（ＵＧＩ）ポリペプチド／ドメインであってよい。一部の実施態様では、本発明の改変されたＬｂＣａｓ１２ａヌクレアーゼおよびシトシンデアミナーゼドメインをコードする（例えば、改変されたＬｂＣａｓ１２ａヌクレアーゼおよびシトシンデアミナーゼドメインを含む融合タンパク質をコードする）核酸構築物は、ウラシル－ＤＮＡグリコシラーゼ阻害剤（ＵＧＩ）をさらにコードしてよく、ここでＵＧＩは、生物における発現のためにコドン最適化される。一部の実施態様では、本発明は、改変されたＬｂＣａｓ１２ａヌクレアーゼ、シトシンデアミナーゼドメイン、およびＵＧＩを含む融合タンパク質、および／またはそれをコードする１つまたは複数のポリヌクレオチドを提供し、ここで１つまたは複数のポリヌクレオチドは、生物における発現のためにコドン最適化されてもよい。

シトシンデアミナーゼは、シチジンまたはデオキシシチジンの、それぞれウリジンまたはデオキシウリジンへの加水分解性の脱アミノ化を触媒する。一部の実施態様では、デアミナーゼまたはデアミナーゼドメインは、ウラシルへのシトシンの加水分解性の脱アミノ化を触媒するシチジンデアミナーゼドメインであってよい。一部の実施態様では、シトシンデアミナーゼは、制限されないが、霊長類（例えば、ヒト、サル、チンパンジー、ゴリラ）、イヌ、ウシ、ラットまたはマウスを含む、天然起源シトシンデアミナーゼの変異体であってよい。したがって、一部の実施態様では、本発明で有用なシトシンデアミナーゼは、野生型シトシンデアミナーゼと約７０％～約１００％同一であってよい（例えば、天然起源シトシンデアミナーゼと約７０％、７１％、７２％、７３％、７４％、７５％、７６％、７７％、７８％、７９％、８０％、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、または１００％同一、およびその中の任意の範囲または値）。一部の実施態様では、シトシンデアミナーゼポリペプチド／ドメインをコードするポリヌクレオチドは、生物における発現のためにコドン最適化されてよい。

一部の実施態様では、本発明で有用なシトシンデアミナーゼは、アポリポタンパク質ＢｍＲＮＡ編集複合体（ＡＰＯＢＥＣ）ファミリーデアミナーゼであってよい。一部の実施態様では、シトシンデアミナーゼは、ＡＰＯＢＥＣ１デアミナーゼ、ＡＰＯＢＥＣ２デアミナーゼ、ＡＰＯＢＥＣ３Ａデアミナーゼ、ＡＰＯＢＥＣ３Ｂデアミナーゼ、ＡＰＯＢＥＣ３Ｃデアミナーゼ、ＡＰＯＢＥＣ３Ｄデアミナーゼ、ＡＰＯＢＥＣ３Ｆデアミナーゼ、ＡＰＯＢＥＣ３Ｇデアミナーゼ、ＡＰＯＢＥＣ３Ｈデアミナーゼ、ＡＰＯＢＥＣ４デアミナーゼ、ヒト活性化誘導性デアミナーゼ（ｈＡＩＤ）、ｒＡＰＯＢＥＣ１、ＦＥＲＮＹ、および／またはＣＤＡ１であってよく、ｐｍＣＤＡ１、ａｔＣＤＡ１（例えば、Ａｔ２ｇ１９５７０）、およびその進化したバージョンであってもよい。一部の実施態様では、シトシンデアミナーゼは、配列番号２３、配列番号４４または配列番号４６のアミノ酸配列を有するＡＰＯＢＥＣ１デアミナーゼであってよい。一部の実施態様では、シトシンデアミナーゼは、配列番号２４のアミノ酸配列を有するＡＰＯＢＥＣ３Ａデアミナーゼであってよい。一部の実施態様では、シトシンデアミナーゼはＣＤＡ１デアミナーゼであってよく、配列番号２５または配列番号４３のアミノ酸配列を有するＣＤＡ１であってもよい。一部の実施態様では、シトシンデアミナーゼはＦＥＲＮＹデアミナーゼであってよく、配列番号４２または配列番号４５のアミノ酸配列を有するＦＥＲＮＹであってもよい。一部の実施態様では、シトシンデアミナーゼは、配列番号４７または配列番号４８のアミノ酸配列を有するヒト活性化誘導性デアミナーゼ（ｈＡＩＤ）であってよい。一部の実施態様では、本発明で有用なシトシンデアミナーゼは、天然起源シトシンデアミナーゼのアミノ酸配列と約７０％～約１００％同一（例えば、７０％、７１％、７２％、７３％、７４％、７５％、７６％、７７％、７８％、７９％、８０％、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、９９．５％または１００％同一）であってよい（例えば、進化したデアミナーゼ）。一部の実施態様では、本発明で有用なシトシンデアミナーゼは、配列番号２３、配列番号２４、配列番号２５または配列番号４２～４８のアミノ酸配列と約７０％～約９９．５％同一（例えば、約７０％、７１％、７２％、７３％、７４％、７５％、７６％、７７％、７８％、７９％、８０％、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、または９９．５％同一）（例えば、配列番号２３、配列番号２４、配列番号２５または配列番号４２～４８のアミノ酸配列と少なくとも８０％、少なくとも８５％、少なくとも９０％、少なくとも９２％、少なくとも９５％、少なくとも９６％、少なくとも９７％、少なくとも９８％、少なくとも９９％、または少なくとも９９．５％同一）であってよい。一部の実施態様では、シトシンデアミナーゼをコードするポリヌクレオチドは、生物における発現のためにコドン最適化されてよく、コドン最適化ポリペプチドは、参照ポリヌクレオチドと約７０％～９９．５％同一であってよい。

本発明で有用な「ウラシルグリコシラーゼ阻害剤」（ＵＧＩ）は、ウラシル－ＤＮＡグリコシラーゼ塩基除去修復酵素を阻害することが可能な任意のタンパク質であってよい。一部の実施態様では、ＵＧＩドメインは、野生型ＵＧＩまたはそのフラグメントを含む。一部の実施態様では、本発明で有用なＵＧＩドメインは、天然起源ＵＧＩドメインのアミノ酸配列に対して、約７０％～約１００％同一（例えば、約７０％、７１％、７２％、７３％、７４％、７５％、７６％、７７％、７８％、７９％、８０％、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、９９．５％または１００％同一およびその中の任意の範囲または値）であってよい。一部の実施態様では、ＵＧＩドメインは、配列番号２６のアミノ酸配列または配列番号２６のアミノ酸配列に対して約７０％～約９９．５％同一性を有するポリペプチド（例えば、配列番号２６のアミノ酸配列に対して、少なくとも８０％、少なくとも８５％、少なくとも９０％、少なくとも９２％、少なくとも９５％、少なくとも９６％、少なくとも９７％、少なくとも９８％、少なくとも９９％、または少なくとも９９．５％同一）を含んでよい。例えば、一部の実施態様では、ＵＧＩドメインは、配列番号２６のアミノ酸配列の連続ヌクレオチドの一部（例えば、約１０、１５、２０、２５、３０、３５、４０、４５、５０、５５、６０、６５、７０、７５、８０個の連続ヌクレオチド；例えば、約１０、１５、２０、２５、３０、３５、４０、４５、～約５０、５５、６０、６５、７０、７５、８０個の連続ヌクレオチド）に対して１００％同一である配列番号２６のアミノ酸配列のフラグメントを含んでよい。一部の実施態様では、ＵＧＩドメインは、公知のＵＧＩに対して７０％～約９９．５％同一性（例えば、約７０％、７１％、７２％、７３％、７４％、７５％、７６％、７７％、７８％、７９％、８０％、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、９９．５％同一性、およびその中の任意の範囲または値）を有する、公知のＵＧＩ（例えば、配列番号２６）の変異体であってよい。一部の実施態様では、ＵＧＡをコードするポリヌクレオチドは、生物における発現のためにコドン最適化されてよく、コドン最適化ポリペプチドは、参照ポリヌクレオチドに対して約７０％～約９９．５％同一であってよい。

一部の実施態様では、改変されたＬｂＣａｓ１２ａヌクレアーゼは、そのヌクレアーゼ活性部位（例えば、ＲｕｖＣ）内に突然変異を含んでよい。そのヌクレアーゼ活性部位（単数または複数）内に突然変異を有しておりヌクレアーゼ活性をもはや含まない改変されたＬｂＣａｓ１２ａヌクレアーゼは一般に、「ｄｅａｄ」と呼ばれる（例えば、ｄＬｂＣａｓ１２ａ）。一部の実施態様では、そのヌクレアーゼ活性部位（単数または複数）内に突然変異を有する改変されたＬｂＣａｓ１２ａドメインまたはポリペプチドは、突然変異のない同一のＬｂＣａｓ１２ａヌクレアーゼと比較して損なわれた活性または減少した活性（例えば、ニッカーゼ活性）を有し得る。

本発明の改変されたＬｂＣａｓ１２ａヌクレアーゼは、改変されたＬｂＣａｓ１２ａヌクレアーゼと機能するように設計されたガイドＲＮＡ（ｇＲＮＡ、ＣＲＩＳＰＲアレイ、ＣＲＩＳＰＲＲＮＡ、ｃｒＲＮＡ）と組み合わせて用いられて、標的核酸を改変し得る。本発明で有用なガイド核酸は、少なくともスペーサー配列およびリピート配列を含む。ガイド核酸は、改変されたＬｂＣａｓ１２ａヌクレアーゼをコードする本発明のポリヌクレオチド／核酸構築物によってコードおよび発現されるＬｂＣａｓ１２ａヌクレアーゼドメインと複合体を形成することが可能であり、スペーサー配列は、標的核酸にハイブリダイズすることが可能であり、それにより、核酸構築物（例えば、改変されたＬｂＣａｓ１２ａヌクレアーゼ（および／または目的ポリペプチド））を標的核酸にガイドし、ここで、標的核酸は、改変されたＬｂＣａｓ１２ａヌクレアーゼ（および／またはコードされるデアミナーゼドメインおよび／または目的ポリペプチド）によって、改変（例えば、切断または編集）または調整（例えば転写調整）され得る。一例として、シトシンデアミナーゼドメインに連結されたＬｂＣａｓ１２ａドメイン（例えば融合タンパク質）をコードする核酸構築物は、ＬｂＣａｓ１２ａガイド核酸と組み合わせて用いられて標的核酸を改変し得て、ここで、融合タンパク質のシトシンデアミナーゼドメインは標的核酸内のシトシン塩基を脱アミノ化し、それにより標的核酸を編集する。さらなる一例では、アデニンデアミナーゼドメインに連結されたＬｂＣａｓ１２ａドメイン（例えば融合タンパク質）をコードする核酸構築物は、ＬｂＣａｓ１２ａガイド核酸と組み合わせて用いられて標的核酸を改変し得て、ここで、融合タンパク質のアデニンデアミナーゼドメインは、標的核酸内のアデノシン塩基を脱アミノ化し、それにより標的核酸を編集する。

本明細書において用いられる「ガイド核酸」、「ガイドＲＮＡ」、「ｇＲＮＡ」、「ＣＲＩＳＰＲＲＮＡ／ＤＮＡ」、「ｃｒＲＮＡ」または「ｃｒＤＮＡ」は、標的核酸（例えば、プロトスペーサー）に相補である（およびハイブリダイズする）少なくとも１つのスペーサー配列、および少なくとも１つのリピート配列（例えば、Ｖ型Ｃａｓ１２ａＣＲＩＳＰＲ－Ｃａｓシステムのリピート、またはそのフラグメントまたは部分）を含む核酸を意味し、ここで、リピート配列は、スペーサー配列の５’末および／または３’末に連結され得る。本発明のｇＲＮＡの設計は、Ｖ型Ｃａｓ１２ａシステムに基づき得る。

一部の実施態様では、Ｃａｓ１２ａｇＲＮＡは、５’から３’に、リピート配列（全長またはその一部（「ハンドル」）；例えば、シュードノット様構造）およびスペーサー配列を含んでよい。

一部の実施態様では、ガイド核酸は、１つよりも多い「リピート配列－スペーサー」配列（例えば、２、３、４、５、６、７、８、９、１０、またはそれよりも多いリピート－スペーサー配列）（例えば、リピート－スペーサー－リピート、例えば、リピート－スペーサー－リピート－スペーサー－リピート－スペーサー－リピート－スペーサー－リピート－スペーサーなど）を含んでよい。本発明のガイド核酸は、合成の、人が作製した、天然に見られないものである。ｇＲＮＡは、かなり長くすることができ、アプタマーとして（ＭＳ２動員ストラテジーのように）、またはスペーサーにぶら下がる（ｈａｎｇｉｎｇｏｆｆ）他のＲＮＡ構造として用いられ得る。

本明細書において用いられる「リピート配列」は、例えば、野生型Ｃａｓ１２ａ遺伝子座（例えばＬｂＣａｓ１２ａ遺伝子座）の任意のリピート配列、または、本発明の核酸構築物によってコードされるＬｂＣａｓ１２ａヌクレアーゼと機能性である合成ｃｒＲＮＡのリピート配列を指す。本発明で有用なリピート配列は、任意の公知のまたは後の同定される、Ｃａｓ１２ａ遺伝子座のリピート配列であることができ、または、Ｃａｓ１２ａＶ型ＣＲＩＳＰＲ－Ｃａｓシステムにおいて機能するように設計された合成のリピートであることができる。リピート配列は、ヘアピン構造および／またはステムループ構造を含んでよい。一部の実施態様では、リピート配列は、その５’末においてシュードノット様構造を形成してよい（例えば、「ハンドル」）。したがって、一部の実施態様では、リピート配列は、野生型ＶＣＲＩＳＰＲ－Ｃａｓ遺伝子座（例えば、野生型Ｃａｓ１２ａ遺伝子座）由来のリピート配列と同一または実質的に同一であることができる。野生型Ｃａｓ１２ａ遺伝子座由来のリピート配列は、確立されたアルゴリズムによって、例えば、ＣＲＩＳＰＲｄｂによって提供されるＣＲＩＳＰＲｆｉｎｄｅｒを用いて決定され得る（Ｇｒｉｓｓａｅｔａｌ．ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．３５（ＷｅｂＳｅｒｖｅｒｉｓｓｕｅ）：Ｗ５２－７を参照）。一部の実施態様では、リピート配列またはその一部は、その３’末においてスペーサー配列の５’末に連結され、それにより、リピート－スペーサー配列（例えば、ガイドＲＮＡ、ｃｒＲＮＡ）を形成する。

一部の実施態様では、リピート配列は、特定のリピートに応じて、および、リピートを含むガイドＲＮＡがプロセッシングされるか否かにかかわらず、少なくとも１０ヌクレオチドを含む、から本質的になる、またはからなる（例えば、約１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０～１００またはそれよりも多くのヌクレオチド、またはその中の任意の範囲または値；例えば、約）。一部の実施態様では、リピート配列は、約１０～約２０、約１０～約３０、約１０～約４５、約１０～約５０、約１５～約３０、約１５～約４０、約１５～約４５、約１５～約５０、約２０～約３０、約２０～約４０、約２０～約５０、約３０～約４０、約４０～約８０、約５０～約１００、またはそれよりも多くのヌクレオチドを含む、から本質的になる、またはからなる。

スペーサー配列の５’末に連結されたリピート配列は、リピート配列の一部（野生型リピート配列の、例えば、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５またはそれよりも多くの連続するヌクレオチド）を含むことができる。一部の実施態様では、スペーサー配列の５’末に連結されたリピート配列の部分は、約５～約１０個の連続するヌクレオチドの長さ（例えば、約５、６、７、８、９、１０ヌクレオチド）であることができ、野生型ＣＲＩＳＰＲＣａｓリピートヌクレオチド配列の同一領域（例えば、５’末）に対して、少なくとも９０％同一性（例えば、少なくとも約９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、またはそれよりも多く）を有することができる。一部の実施態様では、リピート配列の部分は、その５’末にシュードノット様構造を含んでよい（例えば、「ハンドル」）。

本明細書において用いられる「スペーサー配列」は、標的核酸（例えば、標的ＤＮＡ）（例えば、プロトスペーサー）に相補のヌクレオチド配列である。スペーサー配列は、標的核酸と完全に相補または実質的に相補（例えば、少なくとも約７０％相補（例えば、約７０％、７１％、７２％、７３％、７４％、７５％、７６％、７７％、７８％、７９％、８０％、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、またはそれよりも多く、およびその中の任意の範囲または値））であることができる。したがって、一部の実施態様では、スペーサー配列は、標的核酸と比較して１、２、３、４、または５個のミスマッチを有することができ、そのミスマッチは連続または不連続であることができる。一部の実施態様では、スペーサー配列は、標的核酸に対して約７０％相補性を有することができる。他の実施態様では、スペーサーヌクレオチド配列は、標的核酸に対して約８０％相補性を有することができる。さらに他の実施態様では、スペーサーヌクレオチド配列は、標的核酸（プロトスペーサー）に対して、約８５％、９０％、９５％、９６％、９７％、９８％、９９％または９９．５％相補性などを有することができる。一部の実施態様では、スペーサー配列は、標的核酸に対して１００％相補である。スペーサー配列は、約１５ヌクレオチド～約３０ヌクレオチドの長さ（例えば、約１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、または３０ヌクレオチド、またはその中の任意の範囲または値）を有してよい。したがって、一部の実施態様では、スペーサー配列は、少なくとも約１５ヌクレオチド～約３０ヌクレオチドの長さであり得る標的核酸（例えば、プロトスペーサー）の領域にわたって完全な相補性または実質的な相補性を有してよい。一部の実施態様では、スペーサーは、約２０、２１、２２、２３、２４、または２５ヌクレオチドの長さであってよい。一部の実施態様では、スペーサーは、２３ヌクレオチドの長さであってよい。

一部の実施態様では、ガイドＲＮＡのスペーサー配列の５’領域は標的核酸と同一であってよく、一方でスペーサーの３’領域は標的核酸と実質的に相補であってよい（例えば、Ｖ型ＣＲＩＳＰＲ－Ｃａｓ）か、または、ガイドＲＮＡのスペーサー配列の３’領域は標的核酸と同一であってよく、一方でスペーサーの５’領域は標的核酸と実質的に相補であってよく（例えば、ＩＩ型ＣＲＩＳＰＲ－Ｃａｓ）、したがって、標的核酸に対するスペーサー配列の全体的な相補性は、１００％未満であってよい。したがって、例えば、Ｖ型ＣＲＩＳＰＲ－Ｃａｓシステムのためのガイドでは、例えば、２０ヌクレオチドスペーサー配列の５’領域内の最初の１、２、３、４、５、６、７、８、９、１０ヌクレオチド（すなわち、シード領域）は、標的核酸と１００％相補であってよく、スペーサー配列の３’領域内の残りのヌクレオチドは、標的核酸と実質的に相補（例えば、少なくとも約７０％相補）であってよい。一部の実施態様では、スペーサー配列の５’末の最初の１～８ヌクレオチド（例えば、最初の１、２、３、４、５、６、７、８、ヌクレオチド、およびその中の任意の範囲）は、標的核酸と１００％相補であってよく、スペーサー配列の３’領域内の残りのヌクレオチドは、標的核酸と実質的に相補（例えば、少なくとも約５０％相補（例えば、約５０％、５５％、６０％、６５％、７０％、７１％、７２％、７３％、７４％、７５％、７６％、７７％、７８％、７９％、８０％、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、またはそれよりも多く））であってよい。

一部の実施態様では、スペーサーのシード領域は、約８～約１０ヌクレオチドの長さ、約５～約６ヌクレオチドの長さ、または約６ヌクレオチドの長さであってよい。

本明細書において用いられる「標的核酸」、「標的ＤＮＡ」、「標的ヌクレオチド配列」、「標的領域」、または「ゲノム中の標的領域」は、本発明のガイドＲＮＡ内のスペーサー配列と完全に相補（１００％相補）または実質的に相補（例えば、少なくとも７０％相補（例えば、約７０％、７１％、７２％、７３％、７４％、７５％、７６％、７７％、７８％、７９％、８０％、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％またはそれよりも多く、およびその中の任意の範囲または値））である生物のゲノムの領域を指す。一部の実施態様では、Ｖ型ＣＲＩＳＰＲ－Ｃａｓシステム（例えば、ＬｂＣａｓ１２ａ）に有用な標的領域は、生物のゲノム（例えば、植物ゲノム、動物ゲノム、細菌ゲノム）において、ＰＡＭ配列のすぐ３’に位置する。一部の実施態様では、標的領域は、ＰＡＭ配列にすぐ隣接して位置する任意の少なくとも１５個の連続するヌクレオチド（例えば、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０またはそれよりも多くのヌクレオチド、およびその中の任意の範囲または値；例えば、約１９～約２５ヌクレオチド、約２０～約２４ヌクレオチドの長さなど）から選択され得る。

「プロトスペーサー配列」は、標的核酸を指し、具体的には、ＣＲＩＳＰＲリピート－スペーサー配列（例えば、ガイドＲＮＡ、ＣＲＩＳＰＲアレイ、ｃｒＲＮＡ）のスペーサー配列と完全または実質的に相補である（およびハイブリダイズする）標的核酸の部分（例えば、またはゲノム内の標的領域）を指す。

Ｖ型ＣＲＩＳＰＲ－ＣａｓＣａｓ１２ａシステムの場合では、プロトスペーサー配列は、プロトスペーサー隣接モチーフ（ＰＡＭ）にフランキングしている（すぐ隣接している）。ＰＡＭは、非標的鎖の５’末および標的鎖の３’末に位置する（一例として以下を参照）。

標準的なＣａｓ１２ａＰＡＭはＴリッチである。一部の実施態様では、標準的なＣａｓ１２ａＰＡＭ配列は、５’－ＴＴＮ、５’－ＴＴＴＮ、または５’－ＴＴＴＶであってよい。

本発明のポリペプチド、融合タンパク質および／またはシステムは、ポリヌクレオチドまたは核酸構築物によってコードされてよい。一部の実施態様では、本発明のポリペプチド、融合タンパク質および／またはシステムをコードするポリヌクレオチド／核酸構築物は、本明細書中に記載されるように目的生物および／または目的生物の細胞における発現のための調節エレメント（例えば、プロモーター、ターミネーターなど）と動作可能に関連してよい。一部の実施態様では、本発明のポリペプチド、融合タンパク質および／またはシステムをコードするポリヌクレオチド／核酸構築物は、生物における発現のためにコドン最適化されてよい。

一部の実施態様では、本発明は、（ａ）本発明の改変されたＬｂＣａｓ１２ａポリペプチドまたは本発明の融合タンパク質および（ｂ）ガイド核酸（例えば、ＣＲＩＳＰＲＲＮＡ、ＣＲＩＳＰＲＤＮＡ、ｃｒＲＮＡ、ｃｒＤＮＡ）を含む複合体を提供する。

一部の実施態様では、本発明は、（ａ）本発明の改変されたＬｂＣａｓ１２ａポリペプチドまたは本発明の融合タンパク質および（ｂ）ガイド核酸を含む組成物を提供する。

一部の実施態様では、本発明は、本発明のポリヌクレオチド／核酸構築物を含む発現カセットおよび／またはベクターを提供する。一部の実施態様では、本発明のポリヌクレオチド／核酸構築物および／または１つまたは複数のガイド核酸を含む発現カセットおよび／またはベクターが提供され得る。一部の実施態様では、本発明の改変されたＣＲＩＳＰＲ－Ｃａｓヌクレアーゼおよび／または改変されたＣＲＩＳＰＲ－Ｃａｓヌクレアーゼを含む融合タンパク質をコードする核酸構築物は、ガイド核酸を含むものと同一または別個の発現カセットまたはベクター内に含まれてよい。核酸構築物が、ガイド核酸を含むものとは別個の発現カセットまたはベクター内に含まれる場合、標的核酸は、ガイド核酸を含む発現カセットが提供される（例えば標的核酸と接触される）前に、同時に、または後に、本発明の核酸構築物を含む発現カセットまたはベクターと接触（例えば提供）されてよい。

一部の実施態様では、本発明は、本発明の組成物および／または複合体をコードする、または本発明のシステムを含む、発現カセットおよび／またはベクターを提供する。

一部の実施態様では、生物における発現のために最適化されている本発明のポリヌクレオチド、核酸構築物、発現カセットおよび／またはベクターは、同一の本発明の改変されたＣＲＩＳＰＲ－Ｃａｓヌクレアーゼまたは融合タンパク質をコードするが生物における発現のためにコドン最適化されていないポリヌクレオチド、核酸構築物、発現カセットおよび／またはベクターに対して、約７０％から約１００％同一（例えば、約７０％、７１％、７２％、７３％、７４％、７５％、７６％、７７％、７８％、７９％、８０％、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、９９．５％または１００％、およびその中の任意の値または範囲）であってよい。ポリヌクレオチドまたは核酸構築物が最適化され得る生物は、制限されないが、動物、植物、菌類、古細菌、または細菌を含んでよい。一部の実施態様では、本発明のポリヌクレオチドまたは核酸構築物は、植物における発現のためにコドン最適化される。

一部の実施態様では、本発明は、本発明の１つまたは複数のポリヌクレオチド、ガイド核酸、核酸構築物、システム、発現カセットおよび／またはベクターを含む細胞を提供する。

本発明の核酸構築物（例えば、本発明の改変されたＣＲＩＳＰＲ－Ｃａｓヌクレアーゼおよび／または本発明の改変されたＣＲＩＳＰＲ－Ｃａｓヌクレアーゼを含む融合タンパク質をコードする）およびそれを含む発現カセット／ベクターは、標的核酸および／またはそれらの発現を、インビボで（例えば、生物または生物（例えば植物）の細胞において）、およびインビトロで（例えば、細胞または無細胞系において）、改変するために用いられ得る。

本発明は、Ｃａｓ１２ａポリペプチドのＰＡＭ特異性を変更する方法をさらに提供する。一部の実施態様では、Ｃａｓ１２ａポリペプチド内に突然変異を導入するステップを含むＰＡＭ特異性を変更する方法が提供され、ここで、突然変異は、配列番号１の位置ナンバリングに関してアミノ酸残基Ｋ１１６、Ｋ１２０、Ｋ１２１、Ｄ１２２、Ｅ１２５、Ｔ１４８、Ｔ１４９、Ｔ１５２、Ｄ１５６、Ｅ１５９、Ｑ５２９、Ｄ５３５、Ｋ５３８、Ｄ５４１、Ｙ５４２、Ｌ５８５、Ｋ５９１、Ｍ５９２、Ｋ５９５、Ｖ５９６、Ｓ５９９、Ｋ６００、Ｋ６０１、Ｙ６１６、Ｙ６４６、Ｗ６４９におけるものである。一部の実施態様では、Ｃａｓ１２ａポリペプチド内に導入される突然変異は、配列番号１の位置ナンバリングに関して、Ｋ１１６Ｒ、Ｋ１１６Ｎ、Ｋ１２０Ｒ、Ｋ１２０Ｈ、Ｋ１２０Ｎ、Ｋ１２０Ｔ、Ｋ１２０Ｙ、Ｋ１２０Ｑ、Ｋ１２１Ｓ、Ｋ１２１Ｔ、Ｋ１２１Ｈ、Ｋ１２１Ｒ、Ｋ１２１Ｇ、Ｋ１２１Ｄ、Ｋ１２１Ｑ、Ｄ１２２Ｒ、Ｄ１２２Ｋ、Ｄ１２２Ｈ、Ｄ１２２Ｅ、Ｄ１２２Ｎ、Ｅ１２５Ｒ、Ｅ１２５Ｋ、Ｅ１２５Ｑ、Ｅ１２５Ｙ、Ｔ１４８Ｈ、Ｔ１４８Ｓ、Ｔ１４８Ａ、Ｔ１４８Ｃ、Ｔ１４９Ａ、Ｔ１４９Ｃ、Ｔ１４９Ｓ、Ｔ１４９Ｇ、Ｔ１４９Ｈ、Ｔ１４９Ｐ、Ｔ１４９Ｆ、Ｔ１４９Ｎ、Ｔ１４９Ｄ、Ｔ１４９Ｖ、Ｔ１５２Ｒ、Ｔ１５２Ｋ、Ｔ１５２Ｗ、Ｔ１５２Ｙ、Ｔ１５２Ｈ、Ｔ１５２Ｑ、Ｔ１５２Ｅ、Ｔ１５２Ｌ、Ｔ１５２Ｆ、Ｄ１５６Ｒ、Ｄ１５６Ｋ、Ｄ１５６Ｙ、Ｄ１５６Ｗ、Ｄ１５６Ｑ、Ｄ１５６Ｈ、Ｄ１５６Ｉ、Ｄ１５６Ｖ、Ｄ１５６Ｌ、Ｄ１５６Ｅ、Ｅ１５９Ｋ、Ｅ１５９Ｒ、Ｅ１５９Ｈ、Ｅ１５９Ｙ、Ｅ１５９Ｑ、Ｑ５２９Ｎ、Ｑ５２９Ｔ、Ｑ５２９Ｈ、Ｑ５２９Ａ、Ｑ５２９Ｆ、Ｑ５２９Ｇ、Ｑ５２９Ｇ、Ｑ５２９Ｓ、Ｑ５２９Ｐ、Ｑ５２９Ｗ、Ｑ５２９Ｄ、Ｇ５３２Ｄ、Ｇ５３２Ｎ、Ｇ５３２Ｓ、Ｇ５３２Ｈ、Ｇ５３２Ｆ、Ｇ５３２Ｋ、Ｇ５３２Ｒ、Ｇ５３２Ｑ、Ｇ５３２Ａ、Ｇ５３２Ｌ、Ｇ５３２Ｃ、Ｄ５３５Ｎ、Ｄ５３５Ｈ、Ｄ５３５Ｖ、Ｄ５３５Ｔ、Ｄ５３５、ＳＤ５３５Ａ、Ｄ５３５Ｗ、Ｄ５３５Ｋ、Ｋ５３８ＲＫ５３８Ｖ、Ｋ５３８Ｑ、Ｋ５３８Ｗ、Ｋ５３８Ｙ、Ｋ５３８Ｆ、Ｋ５３８Ｈ、Ｋ５３８Ｌ、Ｋ５３８Ｍ、Ｋ５３８Ｃ、Ｋ５３８Ｇ、Ｋ５３８Ａ、Ｋ５３８Ｐ、Ｄ５４１Ｎ、Ｄ５４１Ｈ、Ｄ５４１Ｒ、Ｄ５４１Ｋ、Ｄ５４１Ｙ、Ｄ５４１Ｉ、Ｄ５４１Ａ、Ｄ５４１Ｓ、Ｄ５４１Ｅ、Ｙ５４２Ｒ、Ｙ５４２Ｋ、Ｙ５４２Ｈ、Ｙ５４２Ｑ、Ｙ５４２Ｆ、Ｙ５４２Ｌ、Ｙ５４２Ｍ、Ｙ５４２Ｐ、Ｙ５４２Ｖ、Ｙ５４２Ｎ、Ｙ５４２Ｔ、Ｌ５８５Ｇ、Ｌ５８５Ｈ、Ｌ５８５Ｆ、Ｋ５９１Ｗ、Ｋ５９１Ｆ、Ｋ５９１Ｙ、Ｋ５９１Ｈ、Ｋ５９１Ｒ、Ｋ５９１Ｓ、Ｋ５９１Ａ、Ｋ５９１Ｇ、Ｋ５９１Ｐ、Ｍ５９２Ｒ、Ｍ５９２Ｋ、Ｍ５９２Ｑ、Ｍ５９２Ｅ、Ｍ５９２Ａ、Ｋ５９５Ｒ、Ｋ５９５Ｑ、Ｋ５９５Ｙ、Ｋ５９５Ｌ、Ｋ５９５Ｗ、Ｋ５９５Ｈ、Ｋ５９５Ｅ、Ｋ５９５Ｓ、Ｋ５９５Ｄ、Ｋ５９５Ｍ、Ｖ５９６Ｔ、Ｖ５９６Ｈ、Ｖ５９６Ｇ、Ｖ５９６Ａ、Ｓ５９９Ｇ、Ｓ５９９Ｈ、Ｓ５９９Ｎ、Ｓ５９９Ｄ、Ｋ６００Ｒ、Ｋ６００Ｈ、Ｋ６００Ｇ、Ｋ６０１Ｒ、Ｋ６０１Ｈ、Ｋ６０１Ｑ、Ｋ６０１Ｔ、Ｙ６１６Ｋ、Ｙ６１６Ｒ、Ｙ６１６Ｅ、Ｙ６１６Ｆ、Ｙ６１６Ｈ、Ｙ６４６Ｒ、Ｙ６４６Ｅ、Ｙ６４６Ｋ、Ｙ６４６Ｈ、Ｙ６４６Ｑ、Ｙ６４６Ｗ、Ｙ６４６Ｎ、Ｗ６４９Ｈ、Ｗ６４９Ｋ、Ｗ６４９Ｙ、Ｗ６４９Ｒ、Ｗ６４９Ｅ、Ｗ６４９Ｓ、Ｗ６４９Ｖ、および／またはＷ６４９Ｔである。一部の実施態様では、Ｃａｓ１２ａポリペプチド内に導入される突然変異は、配列番号１の位置ナンバリングに関してアミノ酸残基位置：Ｋ１１６、Ｋ１２０、Ｋ１２１、Ｄ１２２、Ｅ１２５、Ｔ１５２、Ｄ１５６、Ｅ１５９、Ｇ５３２、Ｄ５３５、Ｋ５３８、Ｄ５４１、および／またはＫ５９５であり、ここで突然変異は、配列番号１の位置ナンバリングに関してＫ１１６Ｒ、Ｋ１１６Ｎ、Ｋ１２０Ｙ、Ｋ１２１Ｓ、Ｋ１２１Ｒ、Ｄ１２２Ｈ、Ｄ１２２Ｎ、Ｅ１２５Ｋ、Ｔ１５２Ｒ、Ｔ１５２Ｋ、Ｔ１５２Ｙ、Ｔ１５２Ｑ、Ｔ１５２Ｅ、Ｔ１５２Ｆ、Ｄ１５６Ｒ、Ｄ１５６Ｗ、Ｄ１５６Ｑ、Ｄ１５６Ｈ、Ｄ１５６Ｉ、Ｄ１５６Ｖ、Ｄ１５６Ｌ、Ｄ１５６Ｅ、Ｅ１５９Ｋ、Ｅ１５９Ｒ、Ｇ５３２Ｎ、Ｇ５３２Ｓ、Ｇ５３２Ｈ、Ｇ５３２Ｋ、Ｇ５３２Ｒ、Ｇ５３２Ｌ、Ｄ５３５Ｎ、Ｄ５３５Ｈ、Ｄ５３５Ｔ、Ｄ５３５、ＳＤ５３５Ａ、Ｄ５３５Ｗ、Ｋ５３８ＲＫ５３８Ｖ、Ｋ５３８Ｑ、Ｋ５３８Ｗ、Ｋ５３８Ｙ、Ｋ５３８Ｆ、Ｋ５３８Ｈ、Ｋ５３８Ｌ、Ｋ５３８Ｍ、Ｋ５３８Ｃ、Ｋ５３８Ｇ、Ｋ５３８Ａ、Ｄ５４１Ｅ、Ｋ５９５Ｒ、Ｋ５９５Ｑ、Ｋ５９５Ｙ、Ｋ５９５Ｗ、Ｋ５９５Ｈ、Ｋ５９５Ｓ、および／またはＫ５９５Ｍであってもよい。導入される突然変異は単一の突然変異であってよく、または２以上の突然変異の組み合わせであってよい。理解されるように、２以上の突然変異を有する任意の単一Ｃａｓ１２ａポリペプチドは、任意の所定の位置に単一の突然変異のみを含む。一部の実施態様では、本発明の方法によってＰＡＭ特異性が変更されたＣａｓ１２ａポリペプチドは、ＬｂＣａｓ１２ａポリペプチド（Ｌａｃｈｎｏｓｐｉｒａｃｅａｅｂａｃｔｅｒｉｕｍ）である。

本発明の改変されたＣａｓ１２ａポリペプチドまたはヌクレアーゼ（例えば、ＬｂＣａｓ１２ａヌクレアーゼ）は、細胞または無細胞系において標的核酸を改変するために（例えば、標的核酸を変更するために、細胞／生物のゲノムを変更するために）用いられ得る。したがって、一部の実施態様では、標的核酸を改変する方法が提供され、その方法は、標的核酸を、（ａ）（ｉ）本発明の改変されたＬｂＣａｓ１２ａポリペプチド、または本発明の融合タンパク質（例えば、本発明の改変されたＬｂＣａｓ１２ａポリペプチドおよび目的ポリペプチド（例えば、デアミナーゼ））、および（ｉｉ）ガイド核酸；（ｂ）（ｉ）本発明の改変されたＬｂＣａｓ１２ａポリペプチドまたは融合タンパク質、および（ｉｉ）ガイド核酸を含む本発明の複合体；（ｃ）（ｉ）本発明の改変されたＬｂＣａｓ１２ａポリペプチド、または本発明の融合タンパク質、および（ｉｉ）ガイド核酸を含む組成物；および／または（ｄ）本発明のシステムと接触させるステップを含み、それにより標的核酸を改変する。一部の実施態様では、細胞または生物のゲノムを改変／変更する方法が提供され、その方法は、細胞／生物のゲノム内の標的核酸を、（ａ）（ｉ）本発明の改変されたＬｂＣａｓ１２ａポリペプチド、または本発明の融合タンパク質（例えば、本発明の改変されたＬｂＣａｓ１２ａポリペプチドおよび目的ポリペプチド（例えば、デアミナーゼ））、および（ｉｉ）ガイド核酸；（ｂ）（ｉ）本発明の改変されたＬｂＣａｓ１２ａポリペプチドまたは融合タンパク質、および（ｉｉ）ガイド核酸を含む本発明の複合体；（ｃ）（ｉ）本発明の改変されたＣＲＩＳＰＲ－Ｃａｓヌクレアーゼ（例えば、改変されたＬｂＣａｓ１２ａポリペプチド）、または本発明の融合タンパク質、および（ｉｉ）ガイド核酸を含む組成物；および／または（ｄ）本発明のシステムと接触させるステップを含み、それにより、細胞または生物のゲノムを改変／変更する。一部の実施態様では、細胞または生物は、植物細胞または植物である。

一部の実施態様では、標的核酸を改変する方法が提供され、その方法は、標的核酸を含む細胞または無細胞系を、（ａ）（ｉ）本発明のポリヌクレオチド（例えば、本発明の改変されたＬｂＣａｓ１２ａポリペプチドをコードする、または、本発明の改変されたＬｂＣａｓ１２ａポリペプチドおよび目的ポリペプチド（例えばデアミナーゼ）を含む融合タンパク質をコードする）、またはそれを含む発現カセットまたはベクター、および（ｉｉ）ガイド核酸、またはそれを含む発現カセットおよび／またはベクター；および／または（ｂ）本発明の改変されたＬｂＣａｓ１２ａポリペプチド、または本発明の改変されたＬｂＣａｓ１２ａポリペプチドおよび目的ポリペプチド（例えばデアミナーゼ）を含む融合タンパク質を含む本発明の複合体をコードする核酸構築物、またはそれを含む発現カセットおよび／またはベクターと接触させるステップを含み、ここで、接触させるステップは、ポリヌクレオチドおよび／または核酸構築物が発現され、改変されたＬｂＣａｓ１２ａポリペプチドおよび／または融合タンパク質が産生されて、それがガイド核酸と複合体を形成する条件下で行なわれ、それにより標的核酸を改変する。一部の実施態様では、細胞および／または生物のゲノムを改変／変更する方法が提供され、その方法は、標的核酸を含む細胞および／または生物内の細胞を、（ａ）（ｉ）本発明のポリヌクレオチド（例えば、本発明の改変されたＬｂＣａｓ１２ａポリペプチドをコードする、または、本発明の改変されたＬｂＣａｓ１２ａポリペプチドおよび目的ポリペプチド（例えばデアミナーゼ）を含む融合タンパク質をコードする）、またはそれを含む発現カセットまたはベクター、および（ｉｉ）ガイド核酸、またはそれを含む発現カセットおよび／またはベクター；および／または（ｂ）本発明の改変されたＬｂＣａｓ１２ａポリペプチド、または本発明の改変されたＬｂＣａｓ１２ａポリペプチドと目的ポリペプチド（例えばデアミナーゼ）とを含む融合タンパク質を含む本発明の複合体をコードする核酸構築物、またはそれを含む発現カセットおよび／またはベクターと接触させるステップを含み、ここで、接触させるステップは、ポリヌクレオチドおよび／または核酸構築物が発現され、改変されたＬｂＣａｓ１２ａポリペプチドおよび／または融合タンパク質が産生されて、それがガイド核酸と複合体を形成する条件下であり、それにより標的核酸を改変する。

一部の実施態様では、本発明は、標的核酸を編集する方法を提供し、その方法は、標的核酸を、（ａ）（ｉ）本発明の融合タンパク質（本発明の改変されたＬｂＣａｓ１２ａポリペプチドおよび目的ポリペプチド（例えばデアミナーゼ）を含む）、および（ａ）（ｉｉ）ガイド核酸；（ｂ）本発明の融合タンパク質、およびガイド核酸を含む複合体；（ｃ）本発明の融合タンパク質およびガイド核酸を含む組成物；および／または（ｄ）本発明のシステムと接触させるステップを含み、それにより標的核酸を編集する。

一部の実施態様では、本発明は、標的核酸を編集する方法を提供し、その方法は、標的核酸を含む細胞または無細胞系を、（ａ）（ｉ）本発明の融合タンパク質（例えば、本発明の改変されたＬｂＣａｓ１２ａポリペプチドおよび目的ポリペプチド（例えばデアミナーゼ））をコードするポリヌクレオチドまたはそれを含む発現カセットおよび／またはベクター、および（ａ）（ｉｉ）ガイド核酸、またはそれを含む発現カセットおよび／またはベクター；（ｂ）本発明の融合タンパク質、およびガイド核酸を含む複合体をコードする、核酸構築物、またはそれを含む発現カセットおよび／またはベクター；および／または（ｃ）本発明のシステムと接触させるステップを含み、ここで、接触させるステップは、ポリヌクレオチドおよび／または核酸構築物が発現され、改変されたＣＲＩＳＰＲ－Ｃａｓヌクレアーゼおよび／または融合タンパク質が産生されて、それがガイド核酸と複合体を形成する条件下で行なわれ、それにより標的核酸を編集する。

改変されたＰＡＭ認識特異性を有するＣＲＩＳＰＲ－Ｃａｓヌクレアーゼは、制限されないが、インデルの作製（ＮＨＥＪ）、相同性が指揮する修復において、ヌクレアーゼ機能のないゲノム認識エレメントとして（ｄｅａｄＣｐｆ１）、部分的に機能性ヌクレアーゼを有するゲノム認識エレメントとして（ニッカーゼＣｐｆ１）、ゲノムＤＮＡの触媒による編集のための融合タンパク質において（ＤＮＡ塩基エディタ）、ＲＮＡの触媒による編集のための融合タンパク質において（ＲＮＡ塩基エディタ）、特定のゲノム領域への他の高分子の標的化のため；特定のゲノム領域への小さな化学物質の標的化のため、特定のゲノム領域を標識するため、および／またはＣＲＩＳＰＲが指揮するゲノム組み換えストラテジーを含む、多くの方法において使用され得る。

異なる核酸構築物、発現ベクター、および／またはベクター上に提供される場合、本発明の核酸構築物は、ガイド核酸と標的核酸を接触させる前に、同時に、または後に、標的核酸と接触され得る。

本発明の改変されたＣＲＩＳＰＲ－Ｃａｓヌクレアーゼおよびポリペプチドおよびそれをコードする核酸構築物は、制限されないが、動物、植物、菌類、古細菌、または細菌を含む任意の生物における標的核酸を改変するために用いられ得る。動物は、制限されないが、哺乳類、昆虫、魚類、鳥類などを含むことができる。本発明が有用であり得る例示的な哺乳類は、限定されないが、霊長類（ヒトおよび非ヒト（例えば、チンパンジー、ヒヒ、サル、ゴリラなど））、ネコ、イヌ、マウス、ラット、フェレット、アレチネズミ、ハムスター、ウシ、ブタ、ウマ、ヤギ、ロバ、またはヒツジを含む。

任意の植物または植物部分の標的核酸は、本発明の核酸構築物を用いて改変および／または編集（例えば、突然変異、例えば、塩基編集、切断、ニッキングなど）され得る。被子植物、裸子植物、単子葉植物、双子葉植物、Ｃ３、Ｃ４、ＣＡＭ植物、コケ植物、シダ植物および／またはシダ綱以外のシダ（ｆｅｒｎａｌｌｙ）、微細藻類、および／または大型藻類を含む任意の植物（または、例えば属、またはより高次の分類への植物のグループ化）は、本発明の核酸構築物を用いて改変され得る。本発明で有用な植物および／または植物部位は、任意の植物種／変種／品種の植物および／または植物部位であってよい。本明細書において用いられる用語「植物部位」は、制限されないが、胚、花粉、胚珠、種子、葉、茎、芽、花、枝、果実、穀粒、穂、穂軸、穀皮、葉柄、根、根端、葯、植物細胞（植物および／または植物の部位、植物プロトプラスト、植物組織、植物細胞組織培養物、植物カルス、植物クランプなどにおける無傷の植物細胞を含む）を含む。本明細書において用いられる「芽」は、葉および茎を含む地面より上の部位を指す。さらに、本明細書において用いられる「植物細胞」は、植物の構造的および生理学的単位を指し、細胞壁を含み、プロトプラストも指してよい。植物細胞は、単離された単一細胞の形態であることができ、または培養された細胞であることができ、または、例えば植物組織または植物器官のようなより高度の組織化された単位の一部であることができる。

本発明で有用な植物の非限定的な例は、芝草（例えば、ブルーグラス、ベントグラス、ライグラス、ウシノケグサ）、クサヨシの変種（ｆｅａｔｈｅｒｒｅｅｄｇｒａｓｓ）、ヒロハノコメススキ（ｔｕｆｔｅｄｈａｉｒｇｒａｓｓ）、ススキ、アルンド（ａｒｕｎｄｏ）、スイッチグラス、以下を含む野菜作物：チョウセンアザミ、コールラビ、アルギュラ、ニラネギ、アスパラガス、レタス（例えば、葉球、葉、ロメイン）、マランガ、メロン（例えば、マスクメロン、スイカ、クレンショウ、ハネデュー、カンタループ）、アブラナ属作物（例えば、芽キャベツ、キャベツ、カリフラワー、ブロッコリー、コラード、ケール、白菜、チンゲンサイ）、カルドン（ｃａｒｄｏｎｉ）、ニンジン、ナパ（ｎａｐａ）、オクラ、タマネギ、セロリ、パセリ、ヒヨコマメ、パースニップ、チコリ、コショウ、ジャガイモ、ウリ科植物（例えば、ペポカボチャ、キュウリ、ズッキーニ、トウナス、カボチャ、ハネデューメロン、スイカ、カンタループ）、ラディッシュ、乾球オニオン、ルタバガ、ナス、セイヨウゴボウ、エンダイブ、エシャロット、エンダイブ、ニンニク、ホウレンソウ、長葱、トウナス、葉菜類、ビート（例えば、テンサイおよび飼料ビート）、サツマイモ、チャード、ホースラディッシュ、トマト、カブ、およびスパイス；果実作物、例えば、リンゴ、アンズ、チェリー類（ｃｈｅｒｒｉｅｓ）、ネクタリン、桃、西洋ナシ、プラム、プルーン、チェリー（ｃｈｅｒｒｙ）、マルメロ、イチジク、ナッツ（例えば、クリ、ペカン、ピスタチオ、ヘーゼルナッツ、ピスタチオ、ピーナッツ、クルミ、マカデミアナッツ、アーモンドなど）、柑橘類（例えば、クレメンタイン、キンカン、オレンジ、グレープフルーツ、タンジェリン、マンダリン、レモン、ライムなど）、ブルーベリー、ブラックラズベリー、ボイセンベリー、クランベリー、スグリ、グーズベリー、ローガンベリー、キイチゴ、イチゴ、ブラックベリー、ブドウ（例えば、ワインおよびテーブル）、アボカド、バナナ、キウイ、カキ、ザクロ、パイナップル、トロピカルフルーツ、梨状果、メロン、マンゴー、パパイヤ、およびライチ、農作物植物、例えば、クローバー、アルファルファ、オオアワガエリ、マツヨイグサ、メドウフォーム、コーン／トウモロコシ（例えば、フィールド、スイート、ポップコーン）、ホップ、ホホバ、ソバ、ベニバナ、キノア、小麦、米、大麦、ライ麦、キビ、モロコシ、オート麦、ライコ麦、モロコシ、タバコ、カポック、マメ科植物（マメ（例えば、グリーンおよび乾燥）、レンズマメ、エンドウマメ、ダイズ）、油料種子植物（例えば、セイヨウアブラナ、キャノーラ、マスタード、ケシ、オリーブ、ヒマワリ、ココナッツ、ヒマシ油植物、ココア豆、落花生、アブラヤシ、ダイズ、アマナズナ属など）、ウキクサ、シロイヌナズナ、繊維植物（綿、亜麻、大麻、ジュート）、アサ（例えば、Ｃａｎｎａｂｉｓｓａｔｉｖａ、Ｃａｎｎａｂｉｓｉｎｄｉｃａ、およびＣａｎｎａｂｉｓｒｕｄｅｒａｌｉｓ）、クスノキ科（例えば、シナモン、樟脳）、または植物、例えばコーヒー、サトウキビ、茶、および天然ゴム植物；および／または、花壇用の草花、例えば、顕花植物、サボテン、多肉多汁植物および／または観賞植物（例えば、バラ、チューリップ、スミレ）、ならびに樹木、例えば森林樹（広葉樹および常緑樹、例えば針葉樹；例えば、ニレ、トネリコ、オーク、カエデ、モミ、トウヒ、ヒマラヤスギ、マツ、カバノキ、イトスギ、ユーカリ、ヤナギ）、ならびに、低木および他の苗木を含む。一部の実施態様では、本発明の核酸構築物および／またはそれをコードする発現カセットおよび／またはベクターは、トウモロコシ、ダイズ、小麦、キャノーラ、米、トマト、コショウ、ヒマワリ、キイチゴ、ブラックベリー、ブラックラズベリーおよび／またはチェリーを改変するために用いられ得る。

本発明は、本発明の方法を実施するためのキットをさらに含む。本発明のキットは、試薬、バッファー、および／または混合、測定、選別、標識などのための器具、ならびに、標的核酸を改変するのに適切な説明書などを含むことができる。

一部の実施態様では、本発明は、本発明の１つまたは複数のポリヌクレオチドおよび／または核酸構築物、および／またはそれを含む発現カセットおよび／またはベクターを含むキットであって、その使用のための説明書を含んでもよいキットを提供する。一部の実施態様では、キットは、目的ポリペプチドおよび／またはそれをコードするポリヌクレオチドおよびそれを含む発現カセットおよび／またはベクターさらに含んでよい。一部の実施態様では、ガイド核酸は、本発明の核酸構築物と同一の発現カセットおよび／またはベクター上に提供され得る。一部の実施態様では、ガイド核酸は、本発明の核酸構築物を含むものとは別個の発現カセットまたはベクター上に提供され得る。

したがって、一部の実施態様では、（ａ）本明細書において提供される改変されたＣＲＩＳＰＲ－Ｃａｓヌクレアーゼをコードするポリヌクレオチドおよび（ｂ）（ａ）のポリヌクレオチドの発現を駆動するプロモーターを含む、核酸構築物を含むキットが提供される。一部の実施態様では、キットは、ガイド核酸をコードする核酸構築物をさらに含んでよく、ここで構築物は、ガイド核酸の主鎖へ標的核酸配列と同一または相補の核酸配列をクローニングするためのクローニング部位を含む。

一部の実施態様では、キットは、１つまたは複数の核局在化シグナルを含む／コードする核酸構築物を含んでよく、ここで核局在化シグナルは、ＣＲＩＳＰＲ－Ｃａｓヌクレアーゼに融合される。一部の実施態様では、本発明の改変されたＣＲＩＳＰＲ－Ｃａｓヌクレアーゼをコードする本発明の核酸構築物、または、および／または、それを含む発現カセットおよび／またはベクターを含むキットが提供され、ここで、核酸構築物、発現カセットおよび／またはベクターは、形質転換体を同定するのに有用な１つまたは複数の選択可能マーカーをさらにコードしてよい（例えば、抗生物質耐性遺伝子、除草剤耐性遺伝子などをコードする核酸）。一部の実施態様では、核酸構築物は、コードされるＣＲＩＳＰＲ－Ｃａｓヌクレアーゼ内に１つまたは複数のイントロンをコードするｍＲＮＡであってよい。一部の実施態様では、キットは、本発明のポリペプチドおよび核酸構築物の発現において用いるためのプロモーター、およびプロモーターとイントロンを含んでよい。

ＣＲＩＳＰＲ－ＣａｓヌクレアーゼのＰＡＭ特異性を改変するための方法および関連する組成物
ＣＲＩＳＰＲ－Ｃａｓシステムは、２つの主な基準：標的化ＤＮＡ配列に対するガイドＲＮＡの相同性、および特定の配列のプロトスペーサー隣接モチーフ（ＰＡＭ）の存在を用いて、標的核酸に向けられる。異なるＣＲＩＳＰＲ－Ｃａｓヌクレアーゼは、異なるＰＡＭ配列の要件を有する（例えば、ＳｐＣａｓ９についてＮＧＧ、またはＬｂＣａｓ１２ａ（Ｃｐｆ１）についてＴＴＴＶ（式中Ｖは、任意の非チミジンヌクレオチドである））。新規のＣＲＩＳＰＲヌクレアーゼまたはその突然変異体を、それらのＰＡＭ要件についてスクリーニングすることは、非常に多くの反復の可能性があるので、複雑で予測不可能であり得る。インビトロアッセイ、特にＰＡＭ決定アッセイ（ＰＡＭＤＡ）は、任意の特定のＣＲＩＳＰＲヌクレアーゼまたはその突然変異体に関するＰＡＭ特異性をスクリーニングするために用いられ得る。これらのアッセイは、定義された／公知のプロトスペーサー配列に隣接するＤＮＡのランダム化された部分に依拠する。ガイドＲＮＡは、公知のプロトスペーサー配列を標的化するように設計することができ、ランダム化されたＰＡＭ領域が適切なＤＮＡ配列を含む場合は（例えば、ＣＲＩＳＰＲヌクレアーゼまたはその突然変異体によって認識される）、ＣＲＩＳＰＲヌクレアーゼは、標的に結合して切断することができる。

ＣＲＩＳＰＲ－ＣａｓヌクレアーゼのためのＰＡＭ認識部位は、ＰＡＭ部位枯渇アッセイ（例えば、ＰＡＭ枯渇アッセイ）またはＰＡＭ決定アッセイ（ＰＡＭＤＡ）を用いて評価され得る（Ｋｌｅｉｎｓｔｉｖｅｒｅｔａｌ．ＮａｔＢｉｏｔｅｃｈｎｏｌ３７：２７６－２８２（２０１９））。ＰＡＭ枯渇アッセイについては、プロトスペーサーに隣接するランダム化ヌクレオチド（塩基対）を有するプラスミドのライブラリーが、細菌（例えば、Ｅ．ｃｏｌｉ）におけるＣＲＩＳＰＲヌクレアーゼによる切断について試験される。プラスミドは、例えば、ランダム化ＰＡＭ配列に隣接する、抗生物質耐性を与えるポリヌクレオチドを含んでよい。ＣＲＩＳＰＲ－Ｃａｓヌクレアーゼに対する曝露の際に切断されない配列は、抗生物質耐性遺伝子の存在に起因して抗生物質の存在下で細胞が生存することを可能にし、一方で、標的化可能なＰＡＭを有するプラスミドは切断され、細胞死に起因してライブラリーから枯渇する。プラスミドの生存する（切断されない）集団のシーケンシングは、選択後（ｐｏｓｔ－ｓｅｌｅｃｔｉｏｎ）のＰＡＭ枯渇値の計算を可能にし、それが、ＣＲＩＳＰＲ－Ｃａｓヌクレアーゼに曝されていないライブラリーと比較される。実験的ライブラリー内の配列プールから枯渇される配列は、ＣＲＩＳＰＲ－Ｃａｓヌクレアーゼによって認識されるＰＡＭ配列（単数または複数）を含む。

ＰＡＭ配列を同定するために用いられ得る別の方法は、ＰＡＭ決定アッセイ（ＰＡＭＤＡ）である（Ｋｌｅｉｎｓｔｉｖｅｒｅｔａｌ．ＮａｔＢｉｏｔｅｃｈｎｏｌ３７：２７６－２８２（２０１９））。この場合において、切断は生細胞の外で行なわれる。ＰＡＭＤＡでは、定義されたプロトスペーサー配列の隣のヌクレオチドのランダム化部分を有する単一ＤＮＡ鎖が合成される。オリゴヌクレオチドは、合成されたＤＮＡ鎖の３’末にアニーリングして、エキソヌクレアーゼ・マイナス（－エキソ）Ｋｌｅｎｏｗフラグメントを用いて伸長し、定義された配列およびランダム化配列にわたって重合する。これによりデュプレックス・ライブラリーが産生され、それから、全ＤＮＡを増幅するために、制限エンドヌクレアーゼで切断して細菌内にクローニングされる。プラスミドを抽出して、別の制限エンドヌクレアーゼを用いて線状化して、線状テンプレートを作製する。そのテンプレートを、ＣＲＩＳＰＲ－Ｃａｓヌクレアーゼ－ガイドＲＮＡ複合体と接触させる。ＣＲＩＳＰＲ－Ｃａｓヌクレアーゼによって認識されるＰＡＭを含む配列のみが切断される。それから、実験的ライブラリーおよびコントロールライブラリー（ＣＲＩＳＰＲ－Ｃａｓヌクレアーゼに曝されない）の両方をＰＣＲによって増幅する。ＣＲＩＳＰＲ－Ｃａｓヌクレアーゼによって切断されない配列のみが増幅される。コントロールライブラリーおよび実験的ライブラリー（ＣＲＩＳＰＲ－Ｃａｓヌクレアーゼで処理される）由来のＰＣＲ増幅配列をシーケンシングおよび比較する。コントロール（ＣＲＩＳＰＲ－Ｃａｓヌクレアーゼに曝されない）ライブラリー内に存在するが実験的ライブラリー内には存在しないＰＡＭ配列は、ＣＲＩＳＰＲ－Ｃａｓヌクレアーゼによって認識されるＰＡＭ配列である（それにより、プロトスペーサーが切断されるのを可能にする）。

ヌクレアーゼの要件のインビトロでの評価のために、ランダム化されたＰＡＭライブラリーを調製する。この方法に関して説明されるステップは、評価される全ＰＡＭ配列を含んでいるバイアスのないランダム化ＤＮＡライブラリーの調製、プラスミド内へのクローニング、出発ＤＮＡの合計量を増加させるための細菌内へのライブラリーの導入、プラスミドの抽出、スーパーコイルを除去するための制限酵素を用いたプラスミドの線状化、ＣＲＩＰＳＲ－Ｃａｓヌクレアーゼに対する線状化分子の曝露、フラグメントの増幅（例えば、ＰＣＲ）、および最終的な配列解析（例えば、次世代シーケンシング、ＮＧＳ）を含む。バイアスのないライブラリーの作製および制限消化の最初のステップは、少なくとも２つの制限酵素、Ｋｌｅｎｏｗ伸長、および、ベクター内へのライゲーション前の産物の洗浄を必要とする。２～３種の制限酵素の使用により、典型的にライブラリーからいくつかのＰＡＭ配列が除去されて、ライブラリーにバイアスが導入される。さらに、後に続くＫｌｅｎｏｗ伸長および洗浄ステップによってもＰＡＭ配列が除去され得て、それにより、さらにバイアスがライブラリー内に導入される。配列の喪失を避けるため、より完全かつバイアスのないライブラリーを産生するために、本発明は、制限エンドヌクレアーゼおよびＫｌｅｎｏｗ伸長の代わりに、オーバーハングを有する重複する固体合成オリゴヌクレオチド（例えば、アニーリングしたオリゴヌクレオチド）を用いてランダム化されたＰＡＭライブラリーを作製するための新規の方法を提供する（例えば図１ｂを参照）。それから、本発明の方法を用いて生産されるランダム化ＰＡＭライブラリーを用いて、従来技術の方法によって生産されるライブラリーによって以前に利用可能であったものよりも高精度でＣＲＩＳＰＲ－ＣａｓヌクレアーゼのＰＡＭ特異性を試験することができる。

したがって、一部の実施態様では、本発明は、プロトスペーサーの５’末にＰＡＭ認識部位を有するＣＲＩＳＰＲ－Ｃａｓヌクレアーゼのプロトスペーサー隣接モチーフ（ＰＡＭ）の要件／特異性を判定するための二本鎖核酸分子を含むランダム化ＤＮＡライブラリーを構築する方法を提供し、その方法は、以下のステップを含む２以上の二本鎖核酸分子を調製するステップ：（ａ）２以上の二本鎖核酸分子のそれぞれのための非標的オリゴヌクレオチド（第１）鎖および標的オリゴヌクレオチド（第２）鎖を合成するステップ、ここで非標的オリゴヌクレオチド鎖は５’から３’に以下を含む：（ｉ）約５～約１５ヌクレオチド（例えば、約５、６、７、８、９、１０、１１、１２、１３、１４、または１５ヌクレオチド、およびその中の任意の範囲）を有する第１の配列、（ｉｉ）（ｉｉ）少なくとも４つのランダム化ヌクレオチド（例えば、少なくとも４、５、６、７、８、９、１０、またはそれよりも多く、およびその中の任意の範囲）を有する第２の配列、（ｉｉ）約１６～約２５ヌクレオチド（例えば、約１６、１７、１８、１９、２０、２１、２２、２３、２４、または２５ヌクレオチド、およびその中の任意の範囲）を含むプロトスペーサー配列、および（ｉｖ）約５～約２０ヌクレオチド（例えば、約５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０ヌクレオチド、およびその中の任意の範囲）を有する第３の配列、ここで（ｉ）の約５～１５ヌクレオチドを有する第１の配列は、（ｉｉ）の第２の配列の５’末にすぐ隣接しており、（ｉｉ）の第２の配列は（ｉｉｉ）のプロトスペーサー配列の５’末にすぐ隣接しており、プロトスペーサー配列は（ｉｖ）の第３の配列の５’末にすぐ隣接しており；標的オリゴヌクレオチド（第２）鎖は非標的オリゴヌクレオチド鎖に相補である；および（ｂ）非標的オリゴヌクレオチド鎖を相補の標的オリゴヌクレオチド鎖にアニーリングさせて二本鎖核酸分子を産生するステップを含み、ここで第１の配列は制限部位を（その５’末に）含み、第３の配列は制限部位を（その３’末に）含み、ここで、２以上の二本鎖核酸分子のそれぞれの第１の配列（ｉ）、プロトスペーサー配列（ｉｉｉ）および第３の配列（ｉｖ）は同一であり、それにより、二本鎖核酸分子を含むランダム化ＤＮＡライブラリーを構築する。一部の実施態様では、標的鎖および／または非標的鎖は、５’リン酸化されてよい。

一部の実施態様では、本発明は、プロトスペーサーの３’末にＰＡＭ認識部位を有するＣＲＩＳＰＲ－Ｃａｓヌクレアーゼのプロトスペーサー隣接モチーフ（ＰＡＭ）の要件／特異性を判定するための二本鎖核酸分子を含むランダム化ＤＮＡライブラリーを構築する方法を提供し、その方法は、以下のステップを含む２以上の二本鎖核酸分子を調製するステップ：（ａ）２以上の二本鎖核酸分子のそれぞれのための非標的オリゴヌクレオチド（第１）鎖および標的オリゴヌクレオチド（第２）鎖を合成するステップ、ここで非標的オリゴヌクレオチド鎖は５’から３’に以下を含む：（ｉ）約５～約２０ヌクレオチド（例えば、約５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０ヌクレオチド、およびその中の任意の範囲）を有する第１の配列、（ｉｉ）約１６～約２５ヌクレオチド（例えば、約１６、１７、１８、１９、２０、２１、２２、２３、２４、または２５ヌクレオチド、およびその中の任意の範囲）を含むプロトスペーサー配列、（ｉｉｉ）少なくとも４つのランダム化ヌクレオチド（例えば、少なくとも４、５、６、７、８、９、１０、またはそれよりも多く、およびその中の任意の範囲）を有する第２の配列、および（ｉｖ）約５～約１５ヌクレオチド（例えば、約５、６、７、８、９、１０、１１、１２、１３、１４、１５ヌクレオチド、およびその中の任意の範囲）を有する第３の配列、ここで（ｉ）の約５～２０ヌクレオチドを有する第１の配列は（ｉｉ）のプロトスペーサー配列の５’末にすぐ隣接しており、（ｉｉｉ）の第２の配列は（ｉｉｉ）のプロトスペーサー配列の３’末にすぐ隣接しており、（ｉｖ）の第３の配列は（ｉｉｉ）の第２の配列の３’末にすぐ隣接しており；標的オリゴヌクレオチド（第２）鎖は非標的オリゴヌクレオチド鎖に相補である；および（ｂ）非標的オリゴヌクレオチド鎖を相補の標的オリゴヌクレオチド鎖にアニーリングさせて二本鎖核酸分子を産生するステップを含み、ここで第１の配列（ｉ）は制限部位を（その５’末に）含み、第３の配列（ｉｖ）は制限部位を（その３’末に）含み、ここで、２以上の二本鎖核酸分子のそれぞれの第１の配列（ｉ）、プロトスペーサー配列（ｉｉ）および第３の配列（ｉｖ）は同一であり、それにより、二本鎖核酸分子を含むランダム化ＤＮＡライブラリーを構築する。一部の実施態様では、標的鎖および／または非標的鎖は５’リン酸化されてよい。

一部の実施態様では、二本鎖核酸分子がベクターにライゲーションされて、ランダム化ＤＮＡライブラリーを含むベクターが生産され得る。一部の実施態様では、ベクターは高コピー数ベクターであってよい。一部の実施態様では、ランダム化ＤＮＡライブラリーは、例えば、ランダム化ＤＮＡライブラリーを含むベクターを１つまたは複数の細菌細胞内に導入して、該１つまたは複数の細菌細胞を培養することによって増幅され得る。一部の実施態様では、ランダム化ＤＮＡライブラリーを含むベクターは、培養後に１つまたは複数の細菌細胞から単離され得る。それから、単離されたベクターは、例えば、ＣＲＩＳＰＲ－ＣａｓヌクレアーゼのＰＡＭ認識特異性の分析における使用のために、（例えば、ベクターを１つまたは複数の制限酵素；例えば、ＳｃａＩまたはＰｆｏＩと接触させることにより）線状化され得る。一部の実施態様では、単離されたベクターを線状化するためにＰｆｏ１が用いられ得る。

一部の実施態様では、ランダム化ＤＮＡライブラリーが、プロトスペーサーの５’末にＰＡＭ認識部位を有するＣＲＩＳＰＲ－Ｃａｓヌクレアーゼのプロトスペーサー隣接モチーフ（ＰＡＭ）の要件／特異性を判定するために提供され得て、ランダム化ＤＮＡライブラリーは２以上の二本鎖核酸分子を含んでおり、そのそれぞれが、（ａ）非標的オリゴヌクレオチド（第１）鎖および標的オリゴヌクレオチド（第２）鎖を含み、ここで、非標的オリゴヌクレオチド鎖は、５’から３’に、（ｉ）約５～約１５ヌクレオチド（例えば、約５、６、７、８、９、１０、１１、１２、１３、１４、または１５ヌクレオチド、およびその中の任意の範囲）を有する第１の配列、（ｉｉ）少なくとも４つのランダム化ヌクレオチド（例えば、少なくとも４、５、６、７、８、９、１０、またはそれよりも多く、およびその中の任意の範囲）を有する第２の配列、（ｉｉｉ）約１６～約２５ヌクレオチド（例えば、約１６、１７、１８、１９、２０、２１、２２、２３、２４、または２５ヌクレオチド、およびその中の任意の範囲）を含むプロトスペーサー配列、および（ｉｖ）約５～約２０ヌクレオチド（例えば、約５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０ヌクレオチド、およびその中の任意の範囲）を有する第３の配列を含み、ここで（ｉ）の約５～１５ヌクレオチドを有する第１の配列は、（ｉｉ）の第２の配列の５’末にすぐ隣接しており、（ｉｉ）の第２の配列は（ｉｉｉ）のプロトスペーサー配列の５’末にすぐ隣接しており、プロトスペーサー配列は（ｉｖ）の第３の配列の５’末にすぐ隣接しており；標的オリゴヌクレオチド（第２）鎖は非標的オリゴヌクレオチド鎖に相補である；および（ｂ）非標的オリゴヌクレオチド鎖は、相補の標的オリゴヌクレオチド鎖にアニーリングして、二本鎖核酸分子を産生し、ここで第１の配列は制限部位を（その５’末に）含み、第３の配列は制限部位を（その３’末に）含み、ここで、２以上の二本鎖核酸分子のそれぞれの第１の配列（ｉ）、プロトスペーサー配列（ｉｉｉ）および第３の配列（ｉｖ）は同一である。一部の実施態様では、標的鎖および／または非標的鎖は５’リン酸化されてよい。

一部の実施態様では、プロトスペーサーの３’末にＰＡＭ認識部位を有するＣＲＩＳＰＲ－Ｃａｓヌクレアーゼのプロトスペーサー隣接モチーフ（ＰＡＭ）の要件／特異性を判定するためのランダム化ＤＮＡライブラリーが提供され得て、ランダム化ＤＮＡライブラリーは２以上の二本鎖核酸分子を含み、そのそれぞれが、（ａ）非標的オリゴヌクレオチド（第１）鎖および標的オリゴヌクレオチド（第２）鎖を含み、ここで、非標的オリゴヌクレオチド鎖は、５’から３’に、（ｉ）約５～約２０ヌクレオチド（例えば、約５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０ヌクレオチド、およびその中の任意の範囲）を有する第１の配列、（ｉｉ）約１６～約２５ヌクレオチド（例えば、約１６、１７、１８、１９、２０、２１、２２、２３、２４、または２５ヌクレオチド、およびその中の任意の範囲）を含むプロトスペーサー配列、（ｉｉｉ）少なくとも４つのランダム化ヌクレオチド（例えば、少なくとも４、５、６、７、８、９、１０、またはそれよりも多く、およびその中の任意の範囲）を有する第２の配列、および（ｉｖ）約５～約１５ヌクレオチド（例えば、約５、６、７、８、９、１０、１１、１２、１３、１４、１５ヌクレオチド、およびその中の任意の範囲）を有する第３の配列を含み、ここで（ｉ）の約５～２０ヌクレオチドを有する第１の配列は（ｉｉ）のプロトスペーサー配列の５’末にすぐ隣接しており、（ｉｉｉ）の第２の配列は（ｉｉｉ）のプロトスペーサー配列の３’末にすぐ隣接しており、（ｉｖ）の第３の配列は（ｉｉｉ）の第２の配列の３’末にすぐ隣接しており；標的オリゴヌクレオチド（第２）鎖は非標的オリゴヌクレオチド鎖に相補である；および（ｂ）非標的オリゴヌクレオチド鎖は、相補の標的オリゴヌクレオチド鎖にアニーリングして、二本鎖核酸分子を産生し、ここで第１の配列は制限部位を（その５’末に）含み、第３の配列は制限部位を（その３’末に）含み、ここで、２以上の二本鎖核酸分子のそれぞれの第１の配列（ｉ）、プロトスペーサー配列（ｉｉ）および第３の配列（ｉｖ）は同一である。一部の実施態様では、標的鎖および／または非標的鎖は５’リン酸化されてよい。

一部の実施態様では、本発明は、ＣＲＩＳＰＲ－Ｃａｓヌクレアーゼのプロトスペーサー隣接モチーフ（ＰＡＭ）特異性を判定する方法を提供し、その方法は、ＣＲＩＳＰＲ－Ｃａｓヌクレアーゼを本発明のランダム化ＤＮＡライブラリーと接触させるステップ；および、ランダム化ＤＮＡライブラリーの二本鎖核酸分子を、ＣＲＩＳＰＲ－Ｃａｓヌクレアーゼとの接触前（例えばコントロール）および接触後にシーケンシングするステップを含み、ここで、ＣＲＩＳＰＲ－Ｃａｓヌクレアーゼとの接触前にランダム化ＤＮＡライブラリー内に存在するがＣＲＩＳＰＲ－Ｃａｓヌクレアーゼとの接触後にランダム化ＤＮＡライブラリー内に存在しない二本鎖核酸分子は、ＣＲＩＳＰＲ－ＣａｓヌクレアーゼのＰＡＭ認識配列を特定し、それにより、ＣＲＩＳＰＲ－ＣａｓヌクレアーゼのＰＡＭ特異性を判定する。

一部の実施態様では、ＣＲＩＳＰＲ－Ｃａｓヌクレアーゼのプロトスペーサー隣接モチーフ（ＰＡＭ）特異性を判定する方法は、以下のステップ：ＣＲＩＳＰＲ－Ｃａｓヌクレアーゼを本発明のランダム化ＤＮＡライブラリーと接触させるステップ；ランダム化ＤＮＡライブラリーの二本鎖核酸分子を、ＣＲＩＳＰＲ－Ｃａｓヌクレアーゼとの接触前（例えばコントロール）および接触後にシーケンシングするステップ、および、ヌクレアーゼのＰＡＭ認識配列を同定するステップを含み、ここで、同定するステップは、ＣＲＩＳＰＲ－Ｃａｓヌクレアーゼとの接触前にライブラリー内に存在する二本鎖核酸分子を、ＣＲＩＳＰＲ－Ｃａｓヌクレアーゼとの接触後にライブラリー内に存在する二本鎖核酸分子と比較するステップを含み、ここで、ＣＲＩＳＰＲ－Ｃａｓヌクレアーゼとの接触前にランダム化ＤＮＡライブラリー内に存在するがＣＲＩＳＰＲ－Ｃａｓヌクレアーゼとの接触後にランダム化ＤＮＡライブラリーに存在しない二本鎖核酸分子は、ＣＲＩＳＰＲ－ＣａｓヌクレアーゼのＰＡＭ特異性を特定する。

接触前のランダム化ライブラリーのシーケンシングの結果は、接触後のシーケンシングの結果に対するコントロールとしての役割を果たすことができる。一部の実施態様では、ＣＲＩＳＰＲ－ＣａｓヌクレアーゼのＰＡＭ特異性を判定するステップは、核酸シーケンシングを行なうステップを含んでよい。一部の実施態様では、シーケンシングは次世代シーケンシング（ＮＧＳ）を含んでよい。

任意のＣＲＩＳＰＲ－Ｃａｓヌクレアーゼが、ＰＡＭ認識特異性を改変するために本発明の方法で用いられ得る。したがって、野生型と比較して異なるＰＡＭ特異性を有するように改変され得るＣＲＩＳＰＲ－Ｃａｓヌクレアーゼは、制限されないが、Ｃａｓ９、Ｃ２ｃ１、Ｃ２ｃ３、Ｃａｓ１２ａ（Ｃｐｆ１とも呼ばれる）、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ、Ｃａｓ１２ｄ、Ｃａｓ１２ｅ、Ｃａｓ１３ａ、Ｃａｓ１３ｂ、Ｃａｓ１３ｃ、Ｃａｓ１３ｄ、Ｃａｓｌ、ＣａｓｌＢ、Ｃａｓ２、Ｃａｓ３、Ｃａｓ３’、Ｃａｓ３’’、Ｃａｓ４、Ｃａｓ５、Ｃａｓ６、Ｃａｓ７、Ｃａｓ８、Ｃａｓ９（ＣｓｎｌおよびＣｓｘ１２としても知られる）、Ｃａｓ１０、Ｃｓｙｌ、Ｃｓｙ２、Ｃｓｙ３、Ｃｓｅｌ、Ｃｓｅ２、Ｃｓｃｌ、Ｃｓｃ２、Ｃｓａ５、Ｃｓｎ２、Ｃｓｍ２、Ｃｓｍ３、Ｃｓｍ４、Ｃｓｍ５、Ｃｓｍ６、Ｃｍｒｌ、Ｃｍｒ３、Ｃｍｒ４、Ｃｍｒ５、Ｃｍｒ６、Ｃｓｂｌ、Ｃｓｂ２、Ｃｓｂ３、Ｃｓｘｌ７、Ｃｓｘｌ４、Ｃｓｘ１０、Ｃｓｘ１６、ＣｓａＸ、Ｃｓｘ３、Ｃｓｘｌ、Ｃｓｘｌ５、Ｃｓｆｌ、Ｃｓｆ２、Ｃｓｆ３、Ｃｓｆ４（ｄｉｎＧ）、および／またはＣｓｆ５ポリペプチドまたはドメインを含むことができる。

Ｃａｓ１２ａは、Ｐｒｅｖｏｔｅｌｌａ種およびＦｒａｎｃｉｓｅｌｌａ種において元々同定されたＶ型ＣｌｕｓｔｅｒｅｄＲｅｇｕｌａｒｌｙＩｎｔｅｒｓｐａｃｅｄＳｈｏｒｔＰａｌｉｎｄｒｏｍｉｃＲｅｐｅａｔｓ（ＣＲＩＳＰＲ）－Ｃａｓヌクレアーゼである。Ｃａｓ１２ａ（以前はＣｐｆ１と呼ばれる）は、よりよく知られているＩＩ型ＣＲＩＳＰＲＣａｓ９ヌクレアーゼとはいくつかの点で異なる。例えば、Ｃａｓ９は、そのガイドＲＮＡ（ｇＲＮＡ、ｓｇＲＮＡ）結合部位（プロトスペーサー、標的核酸、標的ＤＮＡ）に対して３’であるＧリッチのプロトスペーサー隣接モチーフ（ＰＡＭ）（３’－ＮＧＧ）を認識するが、Ｃａｓ１２ａは、結合部位（プロトスペーサー、標的核酸、標的ＤＮＡ）に対して５’に位置するＴリッチのＰＡＭ（５’－ＴＴＮ、５’－ＴＴＴＮ）を認識する。実際に、Ｃａｓ９およびＣａｓ１２ａがそれらのガイドＲＮＡを結合する方向は、それらのＮおよびＣ末端に関してほとんど逆である。さらに、Ｃａｓ１２ａ酵素は、天然のＣａｓ９システムで見られるデュアルのガイドＲＮＡ（ｓｇＲＮＡ（例えば、ｃｒＲＮＡおよびｔｒａｃｒＲＮＡ））ではなく単一のガイドＲＮＡ（ｇＲＮＡ、ＣＲＩＳＰＲアレイ、ｃｒＲＮＡ）を使用し、Ｃａｓ１２ａは、それ自体のｇＲＮＡを処理する。加えて、Ｃａｓ１２ａヌクレアーゼ活性は、Ｃａｓ９ヌクレアーゼ活性によって生じる平滑末端の代わりに突出ＤＮＡ二本鎖切断を生じさせ、Ｃａｓ１２ａは両ＤＮＡ鎖を切断するために単一のＲｕｖＣドメインに依拠するが、Ｃａｓ９は切断のためにＨＮＨドメインおよびＲｕｖＣドメインを利用する。

本発明で有用なＣＲＩＳＰＲＣａｓ１２ａポリペプチドまたはＣＲＩＳＰＲＣａｓ１２ａドメインは、任意の公知のまたは後の同定されるＣａｓ１２ａヌクレアーゼであってよい（例えば、米国特許第９，７９０，４９０号を参照し、Ｃｐｆ１（Ｃａｓ１２ａ）配列のその開示について参照により援用される）。用語「Ｃａｓ１２ａ」、「Ｃａｓ１２ａポリペプチド」または「Ｃａｓ１２ａドメイン」は、Ｃａｓ１２ａポリペプチド、またはそのフラグメントを含む、ＲＮＡによってガイドされるヌクレアーゼを指し、それは、Ｃａｓ１２ａのガイド核酸結合ドメイン、および／または、Ｃａｓ１２ａの活性の、非活性の、または部分的に活性のＤＮＡ切断ドメインを含む。一部の実施態様では、本発明で有用なＣａｓ１２ａは、ヌクレアーゼ活性部位（例えば、Ｃａｓ１２ａドメインのＲｕｖＣ部位）内に突然変異を含んでよい。そのヌクレアーゼ活性部位内に突然変異を有しており、したがってもはやヌクレアーゼ活性を含まないＣａｓ１２ａドメインまたはＣａｓ１２ａポリペプチドは一般に、ｄｅａｄＣａｓ１２ａ（例えば、ｄＣａｓ１２ａ）と呼ばれる。一部の実施態様では、そのヌクレアーゼ活性部位内に突然変異を有するＣａｓ１２ａドメインまたはＣａｓ１２ａポリペプチドは、同一の突然変異を有さない同一のＣａｓ１２ａポリペプチドと比較して、損なわれた／減少した活性を有し得る（例えば、ニッカーゼ活性）。

一部の実施態様では、Ｃａｓ１２ａドメインは、制限されないが、配列番号１～１７（例えば、配列番号１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６および／または１７）のいずれか１つのアミノ酸配列、またはそれをコードするポリヌクレオチドを含むことができる。一部の実施態様では、本発明の融合タンパク質は、ＬａｃｈｎｏｓｐｉｒａｃｅａｅｂａｃｔｅｒｉｕｍＮＤ２００６Ｃａｓ１２ａ（ＬｂＣａｓ１２ａ）由来のＣａｓ１２ａドメインを含んでよい（例えば、配列番号１）。

本発明で有用なＣＲＩＳＰＲＣａｓ９ポリペプチドまたはＣＲＩＳＰＲＣａｓ９ドメインは、任意の公知のまたは後の同定されるＣａｓ９ヌクレアーゼであってよい。一部の実施態様では、本発明で有用なＣａｓ９ポリペプチドは、任意の公知のＣａｓ９のアミノ酸配列に対して、少なくとも７０％同一性（例えば、約７０％、７１％、７２％、７３％、７４％、７５％、７６％、７７％、７８％、７９％、８０％、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％など）を含む。ＣＲＩＳＰＲ－Ｃａｓ９システムは当技術分野でよく知られており、限定されないが、Ｌｅｇｉｏｎｅｌｌａｐｎｅｕｍｏｐｈｉｌａｓｔｒ．Ｐａｒｉｓ、ＳｔｒｅｐｔｏｃｏｃｃｕｓｔｈｅｒｍｏｐｈｉｌｕｓＣＮＲＺ１０６６、ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＭＩ、またはＮｅｉｓｓｅｒｉａｌａｃｔａｍｉｃａ０２０－０６など由来のＣａｓ９ポリペプチドを含む。

新規のＰＡＭ認識配列を同定するために本発明で有用であり得る他のヌクレアーゼは、限定されないが、Ｃ２ｃ１、Ｃ２ｃ３、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ、Ｃａｓ１２ｄ、Ｃａｓ１２ｅ、Ｃａｓ１３ａ、Ｃａｓ１３ｂ、Ｃａｓ１３ｃ、Ｃａｓ１３ｄ、Ｃａｓｌ、ＣａｓｌＢ、Ｃａｓ２、Ｃａｓ３、Ｃａｓ３’、Ｃａｓ３’’、Ｃａｓ４、Ｃａｓ５、Ｃａｓ６、Ｃａｓ７、Ｃａｓ８、Ｃａｓ９（ＣｓｎｌおよびＣｓｘ１２としても知られる）、Ｃａｓ１０、Ｃｓｙｌ、Ｃｓｙ２、Ｃｓｙ３、Ｃｓｅｌ、Ｃｓｅ２、Ｃｓｃｌ、Ｃｓｃ２、Ｃｓａ５、Ｃｓｎ２、Ｃｓｍ２、Ｃｓｍ３、Ｃｓｍ４、Ｃｓｍ５、Ｃｓｍ６、Ｃｍｒｌ、Ｃｍｒ３、Ｃｍｒ４、Ｃｍｒ５、Ｃｍｒ６、Ｃｓｂｌ、Ｃｓｂ２、Ｃｓｂ３、Ｃｓｘｌ７、Ｃｓｘｌ４、Ｃｓｘ１０、Ｃｓｘ１６、ＣｓａＸ、Ｃｓｘ３、Ｃｓｘｌ、Ｃｓｘｌ５、Ｃｓｆｌ、Ｃｓｆ２、Ｃｓｆ３、Ｃｓｆ４（ｄｉｎＧ）、および／またはＣｓｆ５を含む。

本発明はここで、以下の実施例に関して説明する。これらの実施例は、特許請求の範囲をその発明に限定することを意図せず、むしろ特定の実施態様の例示であることを意図することが理解されるべきである。当業者が想到する例示された方法における任意のバリエーションは本発明の範囲内に含まれることが意図される。

実施例１．
ランダム化ライブラリー
効率的および費用効果的なインビトロ切断アッセイ（ＰＡＭ決定アッセイ（ＰＡＭＤＡ））のためのライブラリーの効率的かつ費用効果的な作製のための本発明の方法の一例が提供される。２つのライブラリーがプロトスペーサー１および２について作製された（表１参照）。ランダム化された５ヌクレオチド配列を５’末に有するオリゴヌクレオチドを合成し、各プロトスペーサー配列が等しいモル比を占めるように確証した（ＩｎｔｅｇｒａｔｅｄＤＮＡＴｅｃｈｎｏｌｏｇｉｅｓ）（表１）。プロトスペーサー１に関するオリゴヌクレオチド（ＰＭ０５１８、ＰＭ０５１９）およびプロトスペーサー２に関するオリゴヌクレオチド（ＰＭ０５２０、ＰＭ０５２１）を、混合物をサーマルサイクラー中に９５℃で５分間置き、２５℃／室温まで０．１℃／秒でクールダウンさせることによってアニーリングさせた。

アニーリングした二本鎖フラグメントを、ＳｐｈＩおよびＥｃｏＲＩで消化したｐＵＣ１９ベクターに直接ライゲーションした。ライゲーションしたプロトスペーサー構築物を用いてＸＬ１－ブルーエレクトロコンピテントＥ．ｃｏｌｉ細胞（Ａｇｉｌｅｎｔ）を形質転換して、１ｍｌのＳＯＣ培地中３７℃で１時間回復させた。カルベニシリンプレートを用いてＥ．ｃｏｌｉ細胞中のライゲーションした産物の存在について調べた。形質転換されたＥ．ｃｏｌｉ細胞を、カルベニシリン（５０ｍｇ／ｍＬ）が補充されたＬＢブロス（２００ｍｌ）中で１６時間増殖させた。プロトスペーサー構築物を含むプラスミドを、Ｚｙｍｏミディプレップキットを用いて精製した。プラスミド／ベクターをディープ配列解析に供して、ＩｌｌｕｍｉｎａＭｉｓｅｑを用いてそれぞれのＰＡＭ位置におけるＡ／Ｔ／Ｇ／Ｃの頻度を計算した。

この方法を用いて、選択の任意のプロトスペーサーオリゴヌクレオチド（単数または複数）を用いたＰＡＭ決定のためのライブラリーを作製することができ、ここで、アニーリングされるオリゴヌクレオチドは、ライブラリー内のＰＡＭ配列の完全な相補（ｆｕｌｌｃｏｍｐｌｅｍｅｎｔ）を維持するように選択される任意の適切な制限部位を含んでよい。

実施例２
ＬａｃｈｎｏｓｐｉｒａｃｅａｅｂａｃｔｅｒｉｕｍＮＤ２００６Ｃｐｆ１（ＬｂＣｐｆ１）は、非常に特異的なプロトスペーサー隣接モチーフ（ＰＡＭ）を必要とする。「ＴＴＴＶ」配列は、ランダムヌクレオチドと比較して、８５塩基のうちたったの約１塩基のみ生じる。このことは、ランダムＤＮＡにおいて１６塩基中約１塩基で生じるＳｐＣａｓ９に関するＮＧＧ、ランダムＤＮＡにおいて１６塩基中約１塩基で生じるＡａＣ２ｃ１に関するＴＴＮ、および、ＮＧＰＡＭ要件が４塩基中約１塩基で生じるｘＣａｓ９／Ｃａｓ９－ＮＧの相対的な無差別性（ｐｒｏｍｉｓｃｕｉｔｙ）と対照的である。Ｃｐｆ１ＰＡＭは、トウモロコシおよびダイズ遺伝子において、Ｃａｓ９ＰＡＭよりもかなり少ない量である（図２）。さらに、アデニンおよびシトシン（塩基エディタのための現在の標的）は、その厳格なＰＡＭ要件に基づきＬｂＣｐｆ１へのアクセス可能性がより一層低い（図３）。

ＣＲＩＳＰＲ－Ｃａｓヌクレアーゼに関して図３に示されるような厳密性は、潜在的標的および新たな形質の発生を大いに減少させる。本発明は、アクセス可能なＰＡＭ配列の改善された比を有するＣＲＩＳＰＲ－Ｃａｓヌクレアーゼ、特に、ＬｂＣｐｆ１（Ｃａｓ１２ａ）ヌクレアーゼ（例えば、約１：４またはそれより良好の比で生じるＰＡＭ認識部位を有するヌクレアーゼ）の作製に関する。そのような操作されたＣａｓ１２ａＰＡＭ突然変異体は、ヌクレアーゼ（ＮＨＥＪまたはＨＤＲ用途のため）として用いられ得て、または、不活化バージョンは、ゲノム編集ツールにおけるゲノム認識エレメントとして用いることができる。

ＰＡＭＤＡアッセイ
ＰＡＭ決定アッセイ（ＰＡＭＤＡ）は、未知のＰＡＭ認識を有するＣＲＩＳＰＲ酵素に関するＰＡＭ要件を試験するのに有用である。ＰＡＭ結合が成功した後にのみ標的配列を切断するＣＲＩＳＰＲ－Ｃａｓヌクレアーゼの能力を利用するインビトロアッセイが存在する。手短には、ランダム化ＰＡＭ配列を有するＤＮＡ基質のライブラリーを、ＣＲＩＳＰＲヌクレアーゼとともにインキュベートし、それからＰＣＲによってＤＮＡを増幅する。インタクトなフラグメント（例えば、ヌクレアーゼによって認識されないもの）のみが増幅される。切断されたフラグメント（ヌクレアーゼによって認識されるもの）は増幅されない。ヌクレアーゼに曝されるライブラリーおよびコントロールライブラリー（ヌクレアーゼに曝されない）の両方からのＤＮＡをシーケンシングする。２組のシーケンシング結果を比較して、どの配列が、切断されたか、したがって、ヌクレアーゼに対する曝露後のシーケンシングのアセンブリ中に存在しないかを決定する（一例として図４を参照）。複数の時点を使用する改変ＰＡＭＤＡを用いて、ＰＡＭ結合およびその後の切断を決定した。

ＬｂＣｐｆ１突然変異誘発
１８６個の点突然変異（表２）を設計し、本明細書中に記載されるようにＰＡＭＤＡアッセイにおいて個々に試験した。成功的なエンジニアリングは、ＰＡＭ認識配列を変更させて、新規のＰＡＭ認識ＬｂＣｐｆ１を生じさせ得て、または、ＰＡＭ厳密性を緩めて、より無差別の（ｐｒｏｍｉｓｃｕｏｕｓ）ＬｂＣｐｆ１をもたらし得る。

個々の突然変異に加えて、ＰＡＭ認識を変更する突然変異の組み合わせを組み合わせてＰＡＭＤＡによって評価し、第２世代のＬｂＣｐｆ１突然変異を提供する。

実施例３．
３つの方法を用いて１８６個の突然変異を試験した：
（１）ＰＡＭＤＡアッセイとして知られるインビトロ方法（Ｋｌｅｉｎｓｔｉｖｅｒｅｔａｌ．ＮａｔＢｉｏｔｅｃｈｎｏｌ３７，：２７６－２８２（２０１９））は、精製されたタンパク質およびプラスミドライブラリーを用いて、ライブラリーにわたるそれぞれの点突然変異を試験する。ライブラリーメンバーの枯渇を、次世代シーケンシング（ＮＧＳ）を用いてスコア化した。枯渇は、ライブラリー自体に対して（特定のＰＡＭに対する絶対的な活性を決定するため）、または野生型ＬｂＣａｓ１２ａによる切断に対して計算した（突然変異が野生型と比較して新たなＰＡＭ認識を与えるかどうか決定するため）。
（２）ＰＡＭ－ＳＣＡＮＲとして知られる細菌方法（Ｌｅｅｎａｙｅｔａｌ．ＭｏｌＣｅｌｌ６２：１３７－１４７（２０１６））は、Ｅｓｃｈｅｒｉｃｈｉａｃｏｌｉにおけるライブラリーを用いて、２５６個のあり得るＰＡＭＮＮＮＮ変異体に対するＣａｓ１２ａ突然変異の結合を試験する。それは、切断は試験せず、結合のみ試験する。作られた突然変異は触媒領域付近にはどこにもなかったので、結合は切断も反映すると予測される（２９３Ｔアッセイにおいて後に検証）。ＰＡＭ－ＳＣＡＮＲの利点は、点突然変異を急速に試験する能力だけでなく、迅速かつ正確な方法でアミノ酸点突然変異の組み合わせを試験する能力である。このアッセイは、インビトロ切断アッセイよりも厳密であり得る。
（３）ヒトＨＥＫ２９３Ｔ細胞におけるインデルアッセイ。このアッセイは貴重な真核生物インデルデータを提供する。真核生物における挿入および欠失を得るために、複数の基準が満たされなければならない：ＣＲＩＳＰＲ酵素が発現されて細胞内で安定である必要があり、ｃｒＲＮＡはが発現されて正しくプロセッシングされる必要があり、タンパク質：ＲＮＡ複合体が形成される必要があり、複合体が安定である必要があり、複合体が十分な量で核内に移行する必要があり、標的ＤＮＡがアクセス可能である必要があり、ＤＮＡが特定のガイドＲＮＡ設計によって良好に標的化されなければならず、二本鎖切断が、挿入または欠失（インデル）によって時折のＤＮＡ修復ミスを生じるのに十分高い割合で生じる必要がある。このことは、真核生物アッセイを、この試験における最も厳密なアッセイにさせる。実験が低スループットであることに起因して、２５６個全てではなく以下に記載する３個の点突然変異体のそれぞれについて数ダースのＰＡＭを試験した。特定のガイドはしばしば標的アクセス可能性に起因して効果的でないので、偽陰性を避けるために３つの異なる標的をそれぞれのＰＡＭ突然変異体の組み合わせに選択した。

１．ＰＡＭ結合および切断のインビトロでの判定
ＰＡＭプラスミドに基づくライブラリーの構築
２３ヌクレオチドスペーサー配列の直接５’の５個のランダムヌクレオチドからなるＤＮＡライブラリーを調製した。ＬｂＣａｓ１２ａは、４ヌクレオチドのプロトスペーサー隣接モチーフ（ＰＡＭ）を有することが知られているが、本発明者らは、実験内のレプリケーションを許容するために４個ではなく５個のランダムヌクレオチドを用いることにした。用いたスペーサー配列は５’－ＧＧＡＡＴＣＣＣＴＴＣＴＧＣＡＧＣＡＣＣＴＧＧ（配列番号３０）であった。ライブラリーは、配列５’－ＮＮＮＮＮＧＧＡＡＴＣＣＣＴＴＣＴＧＣＡＧＣＡＣＣＴＧＧ（配列番号３６）を含んでいた。５個のランダムヌクレオチドを有することは、このライブラリーにおいてアッセイされる１０２４個のあり得るＰＡＭをもたらす。

本発明者らは、このライブラリーを産生するために新規の方法を用いた。以前に説明されたようにＰＡＭ－スペーサー融合の単一のランダム化プールを用いて、そしてポリメラーゼを用いて相補鎖を産生するのではなく（Ｋｌｅｉｎｓｔｉｖｅｒｅｔａｌ．ＮａｔＢｉｏｔｅｃｈｎｏｌ３７，：２７６－２８２（２０１９））、本発明者らは、より直接的な方法を選択した。２つの５’－リン酸化配列を合成した：
５’ｐｈｏｓ／ＣＧＡＴＧＴＮＮＮＮＮＧＧＡＡＴＣＣＣＴＴＣＴＧＣＡＧＣＡＣＣＴＧＧＧＣＧＣＡＧＧＴＣＡＣＧＡＧＧ（配列番号３２）および
ＡＡＴＴＣＣＴＣＧＴＧＡＣＣＴＧＣＧＣＣＣＡＧＧＴＧＣＴＧＣＡＧＡＡＧＧＧＡＴＴＣＣＮＮＮＮＮＡＣＡＴＣＧＣＡＴＧ／５’ｐｈｏｓ（配列番号３５）。

加熱およびアニーリングすると、２つのＮＮＮＮＮ配列間の相補配列がアニーリングし、生じる末端は、ＳｐｈＩおよびＥｃｏＲＩ制限エンドヌクレアーゼによって生じるオーバーハングに対応するオーバーハングを有する。２つのオリゴヌクレオチドを、サーマルサイクラー中、９５℃で５分間、等しいモル比でアニーリングさせて、０．１℃／秒で２５℃／室温まで冷却した。

アニーリングした二本鎖フラグメントを、ＳｐｈＩおよびＥｃｏＲＩで消化したｐＵＣ１９ベクターに直接ライゲーションした。ライゲーションしたスペーサー構築物を用いてＸＬ１－ブルーエレクトロコンピテントＥ．ｃｏｌｉ細胞（Ａｇｉｌｅｎｔ）を形質転換し、１ｍｌのグルコース含有ＳｕｐｅｒＯｐｔｉｍａｌブロス（ＳＯＣ）培地中で３７℃にて１時間回復させた。ある割合のアリコートをカルベニシリンプレート上にプレーティングして、ライゲーションした産物の存在を確認した。残りの形質転換された細胞を、５０ｍｇ／ｍＬカルベニシリンで補充された２００ｍｌのＬｕｒｉａブロス（ＬＢ）中で１６時間増殖させた。スペーサープラスミドを、プラスミドミディプレップキット（ＺｙｍｏＲｅｓｅａｒｃｈ）を用いて精製した。

ＰＡＭライブラリーの検証
スペーサーベクターをディープ配列解析に供して、ＩｌｌｕｍｉｎａＭｉＳｅｑを製造元のプロトコルに従って用いて、ＰＡＭのそれぞれの位置におけるＡ／Ｔ／Ｇ／Ｃの頻度を計算した。手短には、１０ｎｇのＤＮＡをＰＣＲのためのテンプレートとして用いた。フェージング（Ｐｈａｓｉｎｇ）遺伝子特異的なフォワードおよびリバースＰＣＲプライマーを設計して、標的部位にわたって増幅させた。アンプリコンライブラリーを、２ステップＰＣＲ方法を用いて生産し、ここで、５’テールを用いた一次ＰＣＲは、Ｉｌｌｕｍｉｎａｉ５およびｉ７アダプター配列および多重化サンプルをソーティングするためのバーコードを二次ＰＣＲが付けるのを可能にした。ＰＣＲ増幅を、以下のパラメーターを用いて行なった：９８℃３０秒間；ＰＣＲ１について２５サイクルおよびＰＣＲ２について８サイクル（９８℃１０秒、５５℃２０秒、７２℃３０秒）；７２℃５分間；１２℃で維持。ＰＣＲ反応を、Ｑ５Ｈｉｇｈ－ＦｉｄｅｌｉｔｙＤＮＡＰｏｌｙｍｅｒａｓｅ（ＮｅｗＥｎｇｌａｎｄＢｉｏＬａｂｓ，Ｂｅｖｅｒｌｙ，ＭＡ，ＵｎｉｔｅｄＳｔａｔｅｓ）を用いて行なった。二次ＰＣＲアンプリコンサンプルを、ＡＭＰｕｒｅＸＰビーズを製造元（ＢｅｃｋｍａｎＣｏｕｌｔｅｒ，Ｂｒｅａ，ＣＡ，ＵｎｉｔｅｄＳｔａｔｅｓ）の説明書に従って用いて個々に精製し；全ての精製されたサンプルを、プレートリーダーを用いて定量化し、等しいモル比でプールし、ＡＡＴＩフラグメント分析器で実行した（ＡｇｉｌｅｎｔＴｅｃｈｎｏｌｏｇｉｅｓ，ＰａｌｏＡｌｔｏ，ＣＡ，ＵｎｉｔｅｄＳｔａｔｅｓ）。プールされたアンプリコンライブラリーを、ＭｉＳｅｑＲｅａｇｅｎｔキットｖ２（Ｉｌｌｕｍｉｎａ，ＳａｎＤｉｅｇｏ，ＣＡ，ＵｎｉｔｅｄＳｔａｔｅｓ）を用いてＩｌｌｕｍｉｎａＭｉＳｅｑ（２Ｘ２５０ペアエンド）でシーケンシングした。

３つの別個のリードをライブラリーについて生産し平均した。生じた１０２４個のライブラリーメンバーは、３９リードの平均リードカウントおよび１１．９リードの標準偏差を有していた。任意のＰＡＭ配列に関する平均リードの最大数は７４であり、最小数は１２であった。ＰＡＭカウントは正規分布に従った（図５）。

ＬｂＣａｓ１２ａ突然変異体のクローニング
ヌクレオプラスミンＮＬＳおよび６ｘヒスチジンタグが後に続くＬｂＣａｓ１２ａ配列からなるＤＮＡカセットを合成し（ＧｅｎｅＷｉｚ）（配列番号５２）、ｐＥＴ２８ａベクター内にＮｃｏＩとＸｈｏＩの間にクローニングして、ｐＷＩＳＥ４５０（配列番号５３）を生成した。さらなるグリシンをＭｅｔ－１とＳｅｒ－２の間の配列に加えて、クローニングを容易にさせた。この書類の全体で、ナンバリングは、この過剰なグリシンを除く。その結果、１８６個の異なるアミノ酸点突然変異（表２）が、１８６個の異なるプラスミドベクターを生じる同様のストラテジーを用いて作製された。

ＬｂＣａｓ１２ａ突然変異体の発現および精製
ＢＬ２１Ｓｔａｒ（ＤＥ３）細胞（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ）におけるそれぞれの突然変異体のグリセロールストックを用いて、２４ウェルブロックにおいて、５０μｇ／ｍＬのカナマイシンを含む１ｍＬの培地に接種した。ＡｉｒＰｏｒｅテープシート（Ｑｉａｇｅｎ）を用いて培養を密封し、３７℃で振とうしながら一晩増殖させた。翌朝、カナマイシンを含む４ｍＬのＺＹＰ自己誘導培地に１００μＬの一晩培養物を接種して、３７℃で振とうしながら、０．２～０．５のＯＤ６００ｎｍ範囲までインキュベートした。温度を１８℃まで下げ、培養物をタンパク質発現のために一晩増殖させた。遠心分離によって細胞を回収して、ペレットを－８０℃で保管した。

以下のバッファーを細胞溶解および精製に用いた。非イオン性洗浄剤、溶解剤、還元剤、プロテアーゼ阻害剤、バッファー、および塩類を含む溶解バッファー。この溶液は、細菌を溶解させ、粘性を減少させ、干渉するヌクレアーゼを含まない酵素の下流の精製を可能にすることができた。バッファーＡは、２０ｍＭのＨｅｐｅｓ－ＫＯＨ（ｐＨ７．５）、０．５ＭＮａＣｌ、１０％グリセロール、２ｍＭＴＣＥＰおよび１０ｍＭイミダゾール（ｐＨ７．５）からなる。バッファーＢはバッファーＡと同じであるが２０ｍＭのイミダゾールも含む。バッファーＣは、２０ｍＭのＨｅｐｅｓ－ＫＯＨ（ｐＨ７．５）、１５０ｍＭＮａＣｌ、１０％グリセロール、０．５ｍＭＴＣＥＰ、および２００ｍＭイミダゾール（ｐＨ７．５）を含んでいた。

精製は、マルチウェルのフォーマットを用いて行なった。２つのステンレススチール５／３２’’ＢＢを、細胞ペレットを含むすべてのウェルに添加した。０．５ｍＬの冷却溶解バッファー中にペレットを再懸濁して、室温で３０分間、軌道混合でインキュベートした。粗溶解物（０．５ｍＬ）を、事前に平衡化されたＨｉｓＭｕｌｔｉＴｒａｐ（商標）プレート（ＣｙｔｉｖａＬｉｆｅＳｃｉｅｎｃｅｓ）に添加した。プレートを５分間室温でインキュベートして、タンパク質を結合させた。残りのステップを製造元の説明書に従って行なった。手短には、プレートを０．５ｍＬのバッファーＡで２回洗浄後、０．５ｍＬのバッファーＢで１回洗浄し、その後に、０．２ｍＬのバッファーＣ中に溶出させた。タンパク質濃度を、Ｐｉｅｒｃｅ（商標）ＣｏｏｍａｓｓｉｅＰｌｕｓ（Ｂｒａｄｆｏｒｄ）アッセイ試薬を用いて決定した。タンパク質溶出液を４℃で保管した。

ｗｔＬｂＣａｓ１２ａによるＰＡＭライブラリーの試験切断
事前試験を行なって実験の３側面を評価した：実験が非特異的ヌクレアーゼを含んでいなかったことを確認する、ｃｒＲＮＡガイドの添加の際にライブラリーからのＮＴＴＴＶＰＡＭにおける枯渇が存在したことを確認する、および、ＣＴＴＴＡのスパイクされたサンプルについて１５分における枯渇の程度を見る。

試験枯渇に関する反応条件は以下であった：ヌクレアーゼを含まない水、３μＬのＮＥＢバッファー２．１（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）、３００ｎＭのｃｒＲＮＡの３μＬストック（５’－ＡＡＵＵＵＣＵＡＣＵＡＡＧＵＧＵＡＧＡＵＧＧＡＡＵＣＣＣＵＵＣＵＧＣＡＧＣＡＣＣＵＧＧ－３’（配列番号６２）、ＳｙｎｔｈｅｇｏＣｏｒｐｏｒａｔｉｏｎ）、および１μＭストックでの精製されたｗｔＬｂＣａｓ１２ａ（１μＬ）を含む２７μＬの全容量を、室温で１０分間インキュベートした。３μＬの１０ｎｇ／μＬストックを添加して反応を開始した。ライブラリーをそのまま添加し、または、１μＬのＣＴＴＴＡ含有プラスミドを０．７５ｎｇ／μＬで最初に添加した。全容量は全て３０μＬであった。反応物を３７℃で１５分間インキュベートした。

表３は実験の結果を提供する。ＴＴＴＶ配列に関するライブラリーのカウントは２１９～５１５カウントであり（カラム２）、ｃｒＲＮＡの不存在下で説明されるとおりに精製された野生型タンパク質を添加することは、ライブラリーメンバーの枯渇をもたらさず（カラム３）、ｃｒＲＮＡおよびタンパク質の添加は、ＰＡＭを含む全てのＮＴＴＴＶの枯渇をもたらし（カラム４）、ライブラリーにＣＴＴＴＡをスパイクすることは、およそ３５倍ものＣＴＴＴＡＮＧＳカウントもたらし（カラム５）、ｗｔＬｂＣａｓ１２ａおよびｃｒＲＮＡの添加は、全てのライブラリーメンバーの枯渇をもたらした（１０，７７６から１９３カウントへのＣＴＴＴＡの低減を含む）。また、ＡＣＧＡはＬｂＣａｓ１２ａによって認識されるＰＡＭではないので予期されるように、試験された条件下で枯渇を示さないＮＡＣＧＡＰＡＭ含有ライブラリーメンバーも示された。したがって、表３に示されるように、ＮＴＴＴＶＰＡＭライブラリーメンバーは、ｗｔＬｂＣａｓ１２ａによって効率的に切断および枯渇化され、一方で、ｗｔＬｂＣａｓ１２ａによって認識されないＰＡＭ（ＮＡＣＧＡ）は切断および枯渇化されない。

表３における結果は、（１）ｗｔＬｂＣＡｓ１２ａの効果的およびヌクレアーゼを含まない精製が達成されたこと、（２）ライブラリーが、ＰＡＭ基質を含むメンバーについて試験された条件下で枯渇され得ること、（３）枯渇が、スペーサー－標的化ｃｒＲＮＡの添加の際に生じること、および（４）大量のＣＴＴＴＡ基質が基質の枯渇を変更しないので、酵素－ｃｒＲＮＡ複合体は個々のライブラリーメンバーを大きく上回ることを示す。

ＬｂＣａｓ１２ａ突然変異体によるＰＡＭライブラリーの切断
同一の反応条件を、ｗｔＬｂＣａｓ１２ａの試験例において示されたとおりに１８６個のＰＡＭ突然変異体のそれぞれについて試験した。３つの時点を各突然変異について選択した：３７℃で、７５、４３５、および９００秒。ライブラリー単独のコントロールを複数含んだ。産物をＩｌｌｕｍｉｎａＨｉＳｅｑ分析（Ｇｅｎｅｗｉｚ）に供した。データを表４に報告する。

絶対的な枯渇スコアの処理
本発明者らは、任意の５ヌクレオチドＰＡＭについて４つの可能性の間で、枯渇の違いをほとんど観察しなかった。換言すれば：任意の４ヌクレオチド配列についてＡＮＮＮＮ、ＣＮＮＮＮ、ＧＮＮＮＮ、およびＴＮＮＮＮは、同様のＰＡＭ枯渇を有していた。これは、ＮＴＴＴＶ配列が、ＮがＡ、Ｃ、Ｇ、またはＴであるかにかかわらず、同様の量で全て枯渇したことを示した野生型ＬｂＣＡｓ１２ａ実験において本発明者らが観察したのと一致した（表３）。第二に、本発明者らは、７５、４３５、および９００秒の３つの時点の全てが同様の枯渇を有することを観察した。このことは、反応が３７℃で７５秒の直後にほぼ完了することを示していた。したがって本発明者らは、５ｎｔライブラリーからの全ての４個の４ｎｔＰＡＭを平均し、全ての３つの時点を平均して、各ＰＡＭについて１２個のデータポイントを効果的に得ることができた。それから本発明者らは、その平均を、各ＰＡＭに関する中央値ライブラリー値で割った。これにより、全ての１８６個の突然変異体に対するそれぞれの４ヌクレオチドＰＡＭに関する枯渇スコアが得られた。枯渇１０は、その４ｎｔＰＡＭを有する４個の親プラスミドライブラリーメンバーの９０％が枯渇したことを示し、スコア２０は９５％の枯渇を示す。

野生型ＬｂＣａｓ１２ａに関する枯渇スコアはＴＴＴＶ配列に関して９．２であり、したがって、この９．２スコア以上でＰＡＭを切断する任意の突然変異体は、野生型をベンチマークとして用いて効果的であると考えた。例えば、表４は、突然変異体ＬｂＣａｓ１２ａ－Ｋ５９５Ｙが、ｗｔＬｂＣａｓ１２ａによるＴＴＴＶ含有配列の切断以上に、ライブラリーからの４５個の異なるＰＡＭ４マーをインビトロで枯渇させることを示す。この分析を用いて１８６個の突然変異体のそれぞれをスコア化し、突然変異体のそれぞれによるインビトロでのＰＡＭ認識および切断を判定した。認識配列を含むデータを表４に示し、それにより、ＴＴＴＶ含有配列に対するｗｔＬｂＣａｓ１２ａスコア（９．２）以上のＬｂＣａｓ１２ａ－Ｋ５９５ＹのＰＡＭＤＡ枯渇スコアを示す。

本発明者らは、２つのＬｂＣａｓ１２ａコントロールを用いて、インビトロで切断された３６個の固有のＰＡＭ配列を観察した。これは、インビトロでｗｔＬｂＣａｓ１２ａがＴＴＴＶだけでなくより多くの配列を認識し切断することができるという観察と一致する。ＴＴＣＮ、ＣＴＴＮ、ＴＣＴＮなどは、ＬｂＣａｓ１２ａによってインビトロで認識され切断されることが示されているが、ＡｓＣａｓ１２ａはＴＴＴＮを切断することが示されただけである（Ｚｅｔｓｃｈｅｅｔａｌ．Ｃｅｌｌ１６３：７５９－７７１（２０１５））。

突然変異体のいくつかは、ｗｔＬｂＣａｓ１２ａと比較して、インビトロでのＰＡＭ配列の認識および切断の合計数を増大させた（表５）。このことは、絶対的なＰＡＭ認識配列ではなく、個々の突然変異によって与えられる全体的な無差別性（ｐｒｏｍｉｓｃｕｉｔｙ）を物語っている。いくつかの個々の点突然変異体は、野生型よりも無差別（ｐｒｏｍｉｓｃｕｏｕｓ）であった。例えば、Ｔ１５２Ｒは５７個の異なるＰＡＭを認識し、Ｋ９５９Ｙは４５個を認識した。

野生型ＬｂＣａｓ１２ａに対する、枯渇の比較
インビトロｗｔＬｂＣａｓ１２ａは、ＴＴＴＶだけよりも多くの配列を認識して切断することができる（Ｚｅｔｓｃｈｅｅｔａｌ．Ｃｅｌｌ１６３：７５９－７７１（２０１５））。ＴＴＣＮ、ＣＴＴＮ、ＴＣＴＮなどは、インビトロでＬｂＣａｓ１２ａによって認識され切断されることが示されているが、ＡｓＣａｓ１２ａはＴＴＴＮを切断することが示されただけである（Ｚｅｔｓｃｈｅｅｔａｌ．Ｃｅｌｌ１６３：７５９－７７１（２０１５））。この研究の目的は、ＬｂＣａｓ１２ａのＰＡＭ認識を、その野生型の能力を超えて拡大することであった。この目的を達成するために、本発明者らは、ライブラリー枯渇スコア単独とは異なる分析を用いた。これらのスコアは、インビトロでの絶対的なＰＡＭ認識および切断を判定するのに重要であるが、導入される点突然変異に起因する、酵素によるＰＡＭ認識に対する変更を容易に強調するものではない。

第一に、前述のとおり、５ヌクレオチド枯渇の結果は、４ヌクレオチドＰＡＭＳに降下した（ｃｏｌｌａｐｓｅｄｉｎｔｏ）。それぞれの時点は個々に維持された。それぞれの突然変異体－時点のＮＧＳ合計カウントを、ＰＡＭあたり１００カウントに正規化して、ＮＧＳチップ上のローディングの違いを考慮した。それから、それぞれの４ｎｔＰＡＭに関する全体的な中央値をそれぞれの突然変異体－時点と比較した。これにより、全ライブラリーと比較した枯渇ではなく野生型と比較した枯渇が提供された。結果は、どの突然変異がＰＡＭ認識プロファイルを変更したか強調する。本発明者らは保守的な手法をとり、突然変異体による新たなＰＡＭ認識の示度として４以上の枯渇スコアを選択した。枯渇スコア４は、その特定のＰＡＭ含有ライブラリーメンバーが野生型の中央値と比較して４倍切断されることを示した。例えば、１００ＮＧＳカウントが、野生型について、ＧＣＧＣを有するＰＡＭに関して残っていて、２５カウントが特定の突然変異体－時点について残っているならば、スコア４と計算した。

１８６個の突然変異のそれぞれの要約を以下の表６に示す。ボールド体で提供される突然変異は、突然変異が、４よりも上のスコアで、野生型と比較して３つよりも多くの新たなＰＡＭ配列を認識および切断したことを示す。イタリック体で提供される突然変異は、突然変異体が、４よりも上のスコアで、野生型と比較して１～３個の新たなＰＡＭ配列を得たことを示す。通常のフォントの突然変異（ボールド体またはイタリック体でない）は、点突然変異が、４よりも上のスコアで、野生型と比較して新たなＰＡＭ配列を切断しなかったことを示す。特定のアミノ酸、例えばＴ１４９は、タンパク質のＰＡＭ認識ドメイン付近であり１０個の新しいアミノ酸を試験したにも関わらず、新たなＰＡＭ認識が得られなかった。他のアミノ酸、例えばＤ１５６は、新たなＰＡＭ認識モチーフをエンジニアリングするためのホットスポットであることが分かった。アスパラギン酸１５６は、１０個の異なるアミノ酸に変更した場合、ｗｔＬｂＣＡｓ１２ａと比較して、７個の突然変異は複数の新たなＰＡＭを認識し、１個はいくつかの新たなＰＡＭを示し、２個は新たなＰＡＭが得られなかった。一般に、野生型と比較してＰＡＭ認識および切断に違いを示した任意の位置は、ＰＡＭ認識をさらに変更するために二重、三重、または多重の突然変異に組み合わせることができる。合計で１３０／１８６の点突然変異は、ｗｔＬｂＣａｓ１２ａに対して、スコア４よりも上の新たなＰＡＭが得られず（通常のフォント／ボールド体またはイタリック体でない）、４０／１８６は多くの新たなＰＡＭを得て（ボールド体のフォント）、１６／１８６は１～３個の新たなＰＡＭを得た（イタリック体のフォント）。全体で３０％の成功率（５６／１８６）は、ＬｂＣａｓ１２ａに対して点突然変異を作製することにより新規のＰＡＭ認識モチーフを設計するために効果的な方法が用いられたことを示す。

表６．１８６個のＬｂＣａｓ１２ａ点突然変異に関する要約の表（参照配列：配列番号１）。

点突然変異の多くは、ＬｂＣａｓ１２ａに対して新規のＰＡＭ認識を与え、これらの配列が前にあるＤＮＡをインビトロで切断することを可能にした。いくつかの突然変異は全体的な無差別性（ｐｒｏｍｉｓｃｕｉｔｙ）の増大をもたらしたが、設計および試験された他のものは、ｗｔＬｂＣａｓ１２ａの認識および切断を変更することが示されなかった。合計で１３０／１８６の点突然変異は、スコア４よりも上のｗｔＬｂＣａｓ１２ａに対する新たなＰＡＭを獲得せず（表６、通常のフォント／イタリック体またはボールド体でない）、４０／１８６は多くの新たなＰＡＭを獲得し（表６、ボールド体のフォント）、１６／１８６は１～３個の新たなＰＡＭを獲得した（表６、イタリック体のフォント）。全体で３０％の成功率（５６／１８６）は、ＬｂＣａｓ１２ａに対して点突然変異を作製することにより新規のＰＡＭ認識モチーフを設計するために効果的な方法が用いられたことを示す。

２．原核生物における点突然変異体および組み合わせの結合の判定
個々の突然変異の組み合わせは、単一の突然変異よりもさらに多くのＰＡＭ認識を変更することができる。しかしながら、そのような実験は、急速に規模が拡大して多数の組み合わせを試験しなければならない。３個以上の新たなＰＡＭを認識するＬｂＣａｓ１２ａを生じさせる４０個の突然変異のみを用いて、二重突然変異体のライブラリーを作製し、合計で４０^２すなわち１，６００の酵素を試験することができた。三重突然変異体ライブラリーを作製すると、レプリケートで精製およびアッセイされるべき４０^３すなわち６４，０００の酵素がもたらされ、それは現実的でない。したがって本発明者らは、ＰＡＭ－ＳＣＡＮＲ（Ｌｅｅｎａｙｅｔａｌ．ＭｏｌＣｅｌｌ６２，１３７－１４７（２０１６））として知られる細菌方法を採用してコンビナトリアル突然変異を評価した。本発明者らは、大腸菌におけるライブラリーを用いて、２５６個のあり得るＰＡＭＮＮＮＮ変異体に対するＣａｓ１２ａ突然変異の結合を試験した。このアッセイは切断を試験せず、むしろインビボでの結合を試験する。作られた突然変異は触媒領域付近にはどこにもなかったので、結合は切断も反映すると予測される（これは、２９３Ｔアッセイにおいて後に検証された）。ＰＡＭ－ＳＣＡＮＲの利点は、点突然変異を急速に試験する能力だけでなく、迅速かつ正確な方法でアミノ酸点突然変異の組み合わせを試験する能力である。インビトロ切断アッセイよりも厳密な傾向もある。

レポータープラスミド
プラスミドｐＷＩＳＥ１９６３を、２５６個のＰＡＭＳのそれぞれを有するレポーターを作製するための基礎ベクターとして用いた。プラスミドは、スペクチノマイシン耐性、ＣｏｌＥ１複製起点、ＬａｃＩ、およびｅＧＦＰ（ｌａｃプロモーターの制御下）を含む。ＮｏｔＩとＳｍａＩ制限部位の間のフラグメントを含む２５６個の遺伝子ブロック（ｌａｃＩプロモーターのすぐ５’からｌａｃＩ遺伝子まで）を、ＴｗｉｓｔＢｉｏｓｃｉｅｎｃｅによって合成した。各フラグメントは、ｌａｃＩプロモーターのすぐ５’に異なる４マーのＰＡＭを含んでいた。各遺伝子ブロックを、制限およびライゲーションによってｐＷＩＳＥ１９６３内にクローニングした。各変異体についてクローンを選択し、ＰＡＭの同一性をサンガーシーケンシングによって確認した。

ＣＲＩＳＰＲ－Ｃａｓプラスミド
プラスミドｐＷＩＳＥ２０３１を基礎ベクターとして全てのＣＲＩＳＰＲ－Ｃａｓプラスミドの作製に用いた。プラスミドは、クロラムフェニコール耐性、ＣｌｏＤＦ１３複製起点、プロモーターＢｂａＪ２３１０８によって駆動されるｄＬｂＣａｓ１２ａ、および、ＢｂａＪ２３１１９プロモーターによって駆動されるｌａｃＩプロモーターを標的化するｃｒＲＮＡを有するＬｂＣａｓ１２ａを含む。ネガティブコントロールプラスミドであるｐＷＩＳＥ１９６１は、非標的化ｃｒＲＮＡを用いたことを除きｐＷＩＳＥ２０３１と同一の構成要素を含む。それぞれの点突然変異体およびコンビナトリアル突然変異体（ｐＷＩＳＥ２９８４－ｐＷＩＳＥ３００７）を、ｐＷＩＳＥ２０３１（Ｇｅｎｅｗｉｚ）の部位特異的突然変異誘発を介して構築した。

細胞株
ｌａｃＩ遺伝子の染色体欠失を含むＥ．ｃｏｌｉ細胞株であるＪＷ０３３６を、ＤｈａｒｍａｃｏｎＨｏｒｉｚｏｎＤｉｓｃｏｖｅｒｙから取得した。記載されるプロトコルに従ってエレクトロコンピテント細胞を調製した（Ｓａｍｂｒｏｏｋ，Ｊ．，ａｎｄＲｕｓｓｅｌｌ，Ｄ．Ｗ．（２００６）．ＴｒａｎｓｆｏｒｍａｔｉｏｎｏｆＥ．ｃｏｌｉｂｙＥｌｅｃｔｒｏｐｏｒａｔｉｏｎ．ＣｏｌｄＳｐｒｉｎｇＨａｒｂＰｒｏｔｏｃ２００６，ｐｄｂ．ｐｒｏｔ３９３３）。Ｅ．ｃｏｌｉＪＷ０３３６を全てのライブラリー形質転換および細胞選別実験において用いた。

レポーターライブラリーの調製
上記セクションに記載の各レポータープラスミド１０ｎｇを単一チューブ内にプールし、形質転換および増幅のためのライブラリーを産生した。プールされたプラスミドライブラリーの２０分の１（およそ０．５ｎｇの各レポーター）を、製造元の説明書に従ってスーパーコンピテントＸＬ１－ブルー内に形質転換した。２２５ｒｐｍで振とうしながら３７℃で回復させた１時間後に、形質転換体の全体を１ＬのＬＢスペクチノマイシンに移し、２２５ｒｐｍで振とうしながら３７℃で一晩増殖させた。翌日、プラスミドＤＮＡを、ＺｙｍｏＰＵＲＥプラスミドギガプレップキットを製造元の説明書に従って用いて一晩培養物からから抽出した。ＤＮＡをナノドロップによって定量化し、全てのその後のライブラリー形質転換において用いた。

ライブラリー形質転換および細胞選別
１００ｎｇのレポータープラスミドライブラリーおよび１００ｎｇのＣｒｉｓｐｒ／Ｃａｓプラスミドを、４０ｕＬのＪＷ０３３６中にエレクトロポレーションによって共形質転換した。形質転換体を、２２５ｒｐｍで１時間振とうしながら３７℃で回復させた。回復の最後に、１０ｕＬの形質転換体を取り出し、９０ｕＬのＬＢと混合し、クロラムフェニコールおよびスペクチノマイシンを含むＬＢ寒天プレート上にプレーティングして、形質転換効率を決定した。回収（ｒｅｃｏｖｅｒｙ）の残りの量（９９０ｕＬ）を、スペクチノマイシンおよびクロラムフェニコールを有する２９ｍＬのＬＢを含む一晩培養物に移した。培養物を、２２５ｒｐｍで振とうしながら３７℃で一晩増殖させた。翌朝、形質転換プレート上のコロニーをカウントして形質転換効率を決定した；２つを除く全ての形質転換は＞２，０００の形質転換体を示し、レポーターライブラリーの１０倍以上のカバレッジに相当した。１０倍以上のカバレッジを示さなかった２つのサンプルを繰り返した。それから、一晩培養物のグリセロールストックを調製して－８０℃で保管し、各培養物の６ｍＬを、Ｑｉａｇｅｎミニプレップキットを製造元の説明書に従って用いてミニプレップした。これらのミニプレップは「ソーティング前（ｐｒｅ－ｓｏｒｔ）」とラベルし、４℃で保管した。

それぞれの一晩ライブラリー培養物の１光学密度（ＯＤ）を卓上微量遠心機において８，０００ｒｐｍ、４℃で５分間スピンダウンした。上清をピペットで除去し、１ｍＬのフィルター滅菌１×ＰＢＳバッファーを各チューブに添加した。ペレットを注意深くピペッティングによって再懸濁した。１×ＰＢＳでの洗浄をさらに２回繰り返し、最後の再懸濁後、細胞（１×ＰＢＳ中、約１０^８細胞／ｍＬ）を氷上に置いた。各サンプルをＢｅｃｋｍａｎ－ＣｏｕｌｔｅｒＭｏＦｌｏＸＤＰ細胞ソーターで選別した。ネガティブコントロール（ＷＴ－ｄＬｂＣａｓ１２ａ＋非標的化ｃｒＲＮＡ＋レポーターライブラリー）およびポジティブコントロール（ＷＴ－ｄＬｂＣａｓ１２ａ＋標的化ｃｒＲＮＡ＋レポーターライブラリー）を用いて、細胞選別のためのゲーティングパラメーターを設定した。サンプルを単細胞純度モード、電圧４２５、ｓｓｃ電圧５３５、ｆｓｃ電圧（ゲイン）４．０でソーティングした。ソーティングの典型的な速度は約４０００イベント／秒であった。各サンプルは、最小で１．０×１０^６イベントを有し；細胞選別を、５０，０００ＧＦＰポジティブイベントが集められるまで、またはサンプルが枯渇するまで行なった。サンプルが枯渇した場合は、最小で２００ＧＦＰポジティブイベントを集めた。ＧＦＰ陽性イベントを、スペクチノマイシンおよびクロラムフェニコールを有する２ｍＬのＬＢを含むチューブ内に集めた。ソーティング後、スペクチノマイシンおよびクロラムフェニコールを有するさらなるＬＢでサンプルを６ｍＬに希釈し、それから、２２５ｒｐｍで振とうしながら３７℃で一晩増殖させた。

ソーティングの例を図６～１１に提供する。図６は、ｗｔＬｂＣａｓ１２ａおよびプラスミドスペーサーを標的化しなかったｃｒＲＮＡを含むネガティブコントロールの細胞選別結果を示す。ＧＦＰｈｉｇｈサンプルからソーティングされた細胞は、ソーティング画分中の細胞（左パネル）、および、単一ピークによって示されるＧＦＰシグナルの単一集団（右パネル）を示さない。図７は、ｗｔＬｂＣａｓ１２ａおよびプラスミドスペーサーを標的化するｃｒＲＮＡの細胞選別結果を示す。ＧＦＰｈｉｇｈサンプルからソーティングされた細胞は、ソーティング画分中の細胞（左パネル、ＧＦＰｈｉ）、および、２つの主なピークによって示されるＧＦＰシグナルの２つの集団（右パネル、ＧＦＰｎｅｇおよびＧＦＰＨｉｇｈ）を示す。また、ＧＦＰｈｉｇｈにソーティングされた細胞が蛍光を発しているのも示される（下の右パネル）。図８は、ＬｂＣａｓ１２ａ－Ｋ５９５Ｙおよびプラスミドスペーサーを標的化するｃｒＲＮＡの細胞選別結果を示す。ＧＦＰｈｉｇｈサンプルからソーティングされた細胞は、ソーティング画分中の細胞（左パネル、ＧＦＰｈｉ）、および、２つの主なピークによって示される集団（右パネル、ＧＦＰｎｅｇおよびＧＦＰｈｉｇｈ）を示す。図９は、ＬｂＣａｓ１２ａ－Ｇ５３２Ｒ－Ｋ５９５Ｒ二重突然変異コントロール（Ｇａｏｅｔａｌ．ＮａｔＢｉｏｔｅｃｈｎｏｌ３５，ｎｂｔ．３９００（２０１７））およびプラスミドスペーサーを標的化するｃｒＲＮＡの細胞選別結果を示す。ＧＦＰｈｉｇｈサンプルからソーティングされた細胞は、ソーティング画分中の細胞（左パネル、ＧＦＰｈｉ）、および、２つの主なピークによって示される集団（右パネル）を示す。図１０は、プラスミドスペーサーを標的化するｃｒＲＮＡとともに用いた点突然変異の２つの組み合わせであるＬｂＣａｓ１２ａ－Ｔ１５２Ｒ－Ｋ５９５Ｙ二重突然変異の細胞選別結果を示す。ＧＦＰｈｉｇｈサンプルからソーティングされた細胞は、ソーティング画分中の細胞（左パネル、ＧＦＰｈｉ）、および、２つの主なピークによって示される集団（右パネル）を示す。図１１は、プラスミドスペーサーを標的化するｃｒＲＮＡとともに用いた点突然変異の３つの組み合わせであるＬｂＣａｓ１２ａ－Ｔ１５２Ｒ－Ｋ５３８Ｗ－Ｋ５９５Ｙ三重突然変異の細胞選別結果を示す。ＧＦＰｈｉｇｈサンプルからソーティングされた細胞は、ソーティング画分中の細胞（左、ＧＦＰｈｉ）および示される集団（右、緑の線）を示す。

次世代シーケンシング
翌朝、ソーティングした後に、それぞれの一晩培養物のグリセロールストックを調製して－８０Ｃで保管した。各６ｍＬ培養物の残りの量を、Ｑｉａｇｅｎミニプレップキットを製造元の説明書に従って用いてミニプレップした。これらのミニプレップは、「ソーティング後（ｐｏｓｔ－ｓｏｒｔ）」とラベルし、４℃で保管した。ソーティング前およびソーティング後のミニプレップをナノドロップにより定量化し、１０倍希釈して、ＩｌｌｕｍｉｎａＭｉ－Ｓｅｑでのシーケンスに渡した（ｈａｎｄｅｄｏｆｆ）。

スペーサーベクターをディープ配列解析に供して、ＩｌｌｕｍｉｎａＭｉＳｅｑを製造元のプロトコルに従って用いて、ＰＡＭのそれぞれの位置におけるＡ／Ｔ／Ｇ／Ｃの頻度を計算した。手短には、１０ｎｇのＤＮＡをＰＣＲのためのテンプレートとして用いた。フェージング（Ｐｈａｓｉｎｇ）遺伝子特異的なフォワードおよびリバースＰＣＲプライマーを設計して、標的部位にわたって増幅させた。アンプリコンライブラリーを、２ステップＰＣＲ方法を用いて生産し、ここで、５’テールを用いた一次ＰＣＲは、Ｉｌｌｕｍｉｎａｉ５およびｉ７アダプター配列および多重化サンプルをソーティングするためのバーコードを二次ＰＣＲが付けるのを可能にした。ＰＣＲ増幅を、以下のパラメーターを用いて行なった：９８℃３０秒間；ＰＣＲ１について２５サイクルおよびＰＣＲ２について８サイクル（９８℃１０秒、５５℃２０秒、７２℃３０秒）；７２℃５分間；１２℃で維持。ＰＣＲ反応を、Ｑ５Ｈｉｇｈ－ＦｉｄｅｌｉｔｙＤＮＡＰｏｌｙｍｅｒａｓｅ（ＮｅｗＥｎｇｌａｎｄＢｉｏＬａｂｓ，Ｂｅｖｅｒｌｙ，ＭＡ，ＵｎｉｔｅｄＳｔａｔｅｓ）を用いて行なった。二次ＰＣＲアンプリコンサンプルを、ＡＭＰｕｒｅＸＰビーズを製造元（ＢｅｃｋｍａｎＣｏｕｌｔｅｒ，Ｂｒｅａ，ＣＡ，ＵｎｉｔｅｄＳｔａｔｅｓ）の説明書に従って用いて個々に精製し；全ての精製されたサンプルを、プレートリーダーを用いて定量化し、等しいモル比でプールし、ＡＡＴＩフラグメント分析器で実行した（ＡｇｉｌｅｎｔＴｅｃｈｎｏｌｏｇｉｅｓ，ＰａｌｏＡｌｔｏ，ＣＡ，ＵｎｉｔｅｄＳｔａｔｅｓ）。プールされたアンプリコンライブラリーを、ＭｉＳｅｑＲｅａｇｅｎｔキットｖ２（Ｉｌｌｕｍｉｎａ，ＳａｎＤｉｅｇｏ，ＣＡ，ＵｎｉｔｅｄＳｔａｔｅｓ）を用いてＩｌｌｕｍｉｎａＭｉＳｅｑ（２Ｘ２５０ペアエンド）でシーケンシングした。

高い蛍光にソーティングされた細胞のシーケンシング結果
２５６メンバーのレポーターライブラリーの存在下で、ｗｔｄＬｂＣａｓ１２ａおよび非標的化ｃｒＲＮＡを含む２つのネガティブコントロールサンプルを実行した。１．０に正規化した後、ライブラリーの各メンバーに関する値をヒストグラムとしてプロットした（図１２）。図１２は、２つの別個のｃｒＲＮＡなしコントロールおよび野生型ｄＬｂＣａｓ１２ａおよびレポーターライブラリーに関する合計の正規化されたＮＧＳカウントを示す。２つの別個のサンプルを分析して組み合わせた（合計５１２個のポイントは２５６個のＰＡＭ×２を表わす）。本発明者らは、保守的な（ｃｏｎｓｅｒｖａｔｉｖｅ）１．６７値（最も高いカウント）をこれらの実験に関するカットオフとして選択し、それよりも上をＰＡＭ結合としてスコア化した。標準偏差は０．１６であった。本発明者らは、カットオフとして標準偏差の何倍かを選ぶのではなく、２つのネガティブコントロールのいずれかに見られる絶対最大値である１．６７を選択した。このことは、データの標準偏差の１０倍を超える非常に厳密なカットオフを与えた。実際、３個のＰＡＭ配列のみが１．５よりも上に見られた。

ソーティング前のプールを、ソーティング前に全てシーケンシングした。平均リード／ＰＡＭはサンプルに応じて約２５０～５００ＮＧＳリードであった。高い蛍光のソーティング後のプールをシーケンシングし、約２５０～５００リード／ＰＡＭで同様のリードカウント／ＰＡＭを有していた。それから、両方のサンプルを、それぞれのＮＧＳ実験における小さなローディング差に関してコントロールに対して正規化した。それから２つの値を引き算して１．０に対して正規化した。多くのＰＡＭ配列が、１．６７カットオフよりも上で点突然変異ライブラリーによって結合された（図１３、表７）。

本発明者らは、３つの点突然変異Ｔ１５２Ｒ、Ｋ５３８Ｗ、およびＫ５９５Ｙを様々な組み合わせで組み合わせて、二重および三重ｄＬｂＣａｓ１２ａ突然変異体（Ｔ１５２Ｒ＋Ｋ５３８Ｗ、Ｋ５３８Ｗ＋Ｋ５９５Ｙ、およびＴ１５２Ｒ＋Ｋ５３８Ｗ＋Ｋ５９５Ｙ）を作製した。これを、ＬｂＣａｓ１２ａ突然変異がＧ５３２Ｒ＋Ｋ５９５Ｒコントロールに相当する、「ＲＲ」として知られるＡｓＣａｓ１２ａにおいて開発された以前に説明されたコントロールと比較した（Ｇａｏｅｔａｌ．ＮａｔＢｉｏｔｅｃｈｎｏｌ３５（８）：７８９－７９２（２０１７））。「ＲＲ」は、ＡｓＣａｓ１２ａおよびそれに続いてＬｂＣａｓ１２ａにおいてＴＹＣＶ＋ＣＣＣＣ配列内にインデルを生じさせることが可能であると記載されている。

同じ方法論を適用してコンビナトリアル突然変異をスコア化した。ＰＡＭライブラリーメンバーあたり平均約２５０～５００ＭｉＳｅｑＮＧＳリードをそれぞれ有するソーティング前およびソーティング後のプールをシーケンシングした。ソーティング前およびソーティング後のプールを正規化し、引き算をして、差を１．０に対して正規化した。多くのＰＡＭ配列が、１．６７カットオフよりも上で組み合わせによって結合された（図１４、表８）。

ＰＡＭ－ＳＣＡＮＲデータの全体的な分析
野生型ＬｂＣａｓ１２ａは強いＴＴＴＶ結合を示し、ＬｂＣａｓ１２ａ－Ｇ５３２Ｒ－Ｋ５９５Ｒコントロールは強いＴＹＣＶおよびＣＣＣＣ結合を示した。「ＲＲ」と呼ばれるこの突然変異は、ＡｓＣａｓ１２ａにおいて開発され、ＴＹＣＶおよびＣＣＣＣに結合することが示された（Ｇａｏｅｔａｌ．ＮａｔＢｉｏｔｅｃｈｎｏｌ３５（８）：７８９－７９２（２０１７））。しかしながら、インビトロでｗｔＬｂＣａｓ１２ａは、ＴＴＣＮ、ＣＴＴＮ、ＴＣＴＮなどを認識して切断することができ、ＡｓＣａｓ１２ａはＴＴＴＮを切断することのみ示された（Ｚｅｔｓｃｈｅｅｔａｌ．，Ｃｅｌｌ１６３：７５９－７７１（２０１５））。本発明者らは、ＬｂＣａｓ１２ａコンテキストにおいて配置された「ＲＲ」突然変異が、ＡｓＣａｓ１２ａコンテキストにおいて配置された場合よりも無差別（ｐｒｏｍｉｓｃｕｏｕｓ）であると推測し、これは、このコントロールについて観察されたものであり、ＬｂＣａｓ１２ａ－ＲＲは４５個の配列を認識した。野生型およびＬｂＣａｓ１２ａ－ＲＲの結果は両方とも、選択およびソーティングのパラメーターの妥当性を示す。

試験された突然変異は、新規のＰＡＭが、インビトロで同定された個々の点突然変異によって、インビボで認識されることを明確に示した。例えば、Ｋ５９５Ｙは、１．６７閾値よりも上で１３個のＰＡＭに結合し、そのうち１１個はｗｔＬｂＣａｓ１２ａによって認識されず、Ｃａｓ１２ａによって結合されることが知られるＴＴＴＶ配列を含むものはなかった。同様に、Ｔ１５２Ｒは１５個の別個のＰＡＭを認識したが、この場合、野生型のＴＴＴＶを維持していた。試験された１２個の点突然変異の全てが、それぞれ、標準的なＴＴＴＶモチーフ以外の、ｄＬｂＣａｓ１２ａコントロールとは異なる新規のＰＡＭ結合配列を有していた。

組合せの効果
本発明者らは、複数の点突然変異を組み合わせても、点突然変異のＰＡＭ配列の線形加算（ｌｉｎｅａｒａｄｄｉｔｉｏｎ）をもたらさないことを見いだした（図１５）。例えば、ＬｂＣａｓ１２ａ点突然変異体Ｋ５３８ＷおよびＫ５９５Ｙの組み合わせは、酵素ＬｂＣａｓ１２ａ－Ｋ５３８Ｗ－Ｋ５９５Ｙをもたらし、それは場合によっては、ＰＡＭ認識モチーフをＫ５３８Ｗ（垂直陰影）またはＫ５９５Ｙ（水平陰影）と共有するが、完全に新規のＰＡＭ認識配列（ｔｈａｔｃｈｅｄ）をもたらすことの方が多い。同じ例を用いて、Ｋ５３８ＷはＡＧＣＴを認識するが、Ｋ５３８Ｗ＋Ｋ５９５Ｙは認識しない。Ｋ５９５ＹはＡＣＧＣを認識するが、Ｋ５３８Ｗ＋Ｋ５９５Ｙは認識しない。ＣＣＣＣはＫ５３８ＷによってもＫ５９５Ｙによっても認識されないが、二重突然変異体は高い親和性でそれに結合する。

概して、突然変異の組み合わせは、線形拡大（ｌｉｎｅａｒｅｘｐａｎｓｉｏｎ）よりも多くのＰＡＭ認識をもたらす。例えば、Ｋ５３８Ｗは６個のＰＡＭ配列を認識し、Ｋ５９５Ｙは１３個を認識するが、合わさるとそれらは３２個の配列を認識する（図１５）。単純な相加的効果は、本発明者らが観察した３２個ではなく、二重突然変異体について１９個のＰＡＭをもたらすだろう。さらに、二重突然変異体によって認識された３２個の配列のうち１１個のみが、２つの単一突然変異のいずれかによって認識される。同様のパターンが３つの突然変異を組み合わせた場合に観察される（図１６）。Ｔ１５２Ｒ、Ｋ５３８Ｗ、およびＫ５９５Ｙの組み合わせは、３つの個々の突然変異単独のいずれとも異なるＰＡＭ認識を有する三重突然変異をもたらす。例えば：ＧＧＣＡ、ＧＧＣＣ、ＧＧＧＣ、およびＧＧＧＧは、全ての３つの突然変異がＬｂＣａｓ１２ａに対してなされた場合にのみ認識される。これらのＰＡＭのいずれも単一または二重突然変異のいずれによっても結合されないが、Ｔ１５２Ｒ、Ｋ５３８Ｗ、およびＫ５９５Ｙが一緒に全て突然変異した場合にのみ結合する。

ＰＡＭ－ＳＣＡＮＲ対インビトロＰＡＭＤＡにおける点突然変異ＰＡＭ認識の比較
試験された１２個の点突然変異について全体として考えると、１．６７よりも上のＰＡＭ－ＳＣＡＮＲヒットは、インビトロＰＡＭＤＡ枯渇アッセイにおいてよく表わされていた。Ｋ５９５ＹおよびＴ１５２Ｒの例を示す（図１７）。図１７は、Ｋ５９５Ｙ（左パネル）およびＴ１５２Ｒ（右パネル）に対するＰＡＮ－ＳＣＡＮＲによって１．６７スコアよりも上を示した全ての非ＴＴＴＶＰＡＭ（灰色のボックス）を比較する。１．６７カットオフよりも上のＰＡＭ－ＳＣＡＮＲポジティブＰＡＭの全て（１つを除く）が、９．２カットオフよりも上のＰＡＭ枯渇スコアをインビトロで有した。しかしながら、ＰＡＭ－ＳＣＡＮＲ方法および分析は、インビトロでのアッセイおよび分析よりも厳密であった。例えば、１３個の異なるＰＡＭをソーティングし、シーケンシングして、ＰＡＭ－ＳＣＡＮＲにおいて１．６７よりも上の値を有するように正規化した。それは、４５個の配列をインビトロで容易に切断されるものとして同定したＰＡＭＤＡアッセイと対照的である。これは、試験管内に対する細胞内側の相対的濃度の関数であると考えられるが、ＰＡＭ－ＳＣＡＮＲに関する厳密すぎるカットオフまたはＰＡＭＤＡアッセイに関する寛容すぎるカットオフの設定の関数でもあり得る。

データセット間には、触媒部位から離れた残基の本発明者らのエンジニアリングが、触媒作用ではなくＰＡＭ認識および結合に影響を及ぼすことを示す相関がある。これらの残基における突然変異がＰＡＭ結合とともにヌクレアーゼ活性にも影響を与えるならば、ＰＡＭ－ＳＣＡＮＲアッセイ（結合を測定するが切断は測定しない）では多くのヒットがあり、それはＰＡＭＤＡアッセイでは切断を示さなかっただろう。本発明者らはそのパターンを見ていない。本発明者らは、結合の変化に影響を与えた（ＰＡＭ－ＳＣＡＮＲ）突然変異が、インビトロでの切断ももたらした（ＰＡＭＤＡ）ことを観察している。

３．真核生物における結合、切断、およびインデル形成の判定
本発明者らは、３つの突然変異Ｔ１５２Ｒ、Ｋ５３８Ｗ、およびＫ５９５Ｙを選択して、それらが真核生物ＨＥＫ２９３Ｔ細胞において挿入または欠失（インデル）を生じさせる能力を試験した。このアッセイは貴重な真核生物インデルデータを与える。真核生物における挿入および欠失を得るために、複数の基準がすべて満たされなければならない：ＣＲＩＳＰＲ酵素が発現されて細胞内で安定である必要があり、ｃｒＲＮＡが発現されて正しくプロセッシングされる必要があり、タンパク質：ＲＮＡ複合体が形成される必要があり、複合体が安定である必要があり、複合体が十分な量で核内に移行する必要があり、標的ＤＮＡがアクセス可能である必要があり、ＤＮＡが特定のガイドＲＮＡ設計によって良好に標的化されなければならず、二本鎖切断が、挿入または欠失（インデル）によって時折のＤＮＡ修復ミスを生じるのに十分高い割合で生じる必要がある。このことは、真核生物アッセイを、この試験における最も厳密なアッセイにさせる。実験が低スループットであることに起因して、２５６個全てではなく以下に記載する３個の点突然変異体のそれぞれについて数ダースのＰＡＭを試験した。特定のガイドはしばしば標的アクセス可能性に起因して効果的でないので、偽陰性を避けるために３つの異なる標的をそれぞれのＰＡＭ突然変異体の組み合わせに選択した。

ＨＥＫ２９３Ｔ細胞の試験
真核生物ＨＥＫ２９３Ｔ（ＡＴＣＣＣＲＬ－３２１６）細胞を、ダルベッコ改変イーグル培地＋１０％（ｖ／ｖ）ＦＢＳ（ＦＢＳ）で補充されたＧｌｕｔａＭａｘ（ＴｈｅｒｍｏＦｉｓｈｅｒ）中、３７℃にて５％ＣＯ２で培養した。野生型および突然変異体ＬｂＣａｓ１２を、固体合成を用いて合成して、続いて、プラスミド内へ、ＣＭＶプロモーターの後ろにクローニングした。ＣＲＩＳＰＲＲＮＡ（ｃｒＲＮＡ）を、ヒトＵ６プロモーターの後ろにクローニングした（表９）。ＨＥＫ２９３Ｔ細胞を、４８ウェルのコラーゲン被覆ＢｉｏＣｏａｔプレート（Ｃｏｒｎｉｎｇ）上に播種した。細胞を約７０％密集度でトランスフェクトした。７５０ｎｇのタンパク質プラスミドおよび２５０ｎｇのｃｒＲＮＡ発現プラスミドを、製造元のプロトコルに従ってウェルあたり１．５μｌのリポフェクタミン３０００（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ）を用いてトランスフェクトした。トランスフェクトされた細胞由来のゲノムＤＮＡを３日後に採取し、インデルを検出し、ハイスループットＩｌｌｕｍｉｎａアンプリコン・シーケンシングを用いて定量化した。

野生型コントロール
野生型ＬｂＣａｓ１２ａ（ｗｔＬｂＣａｓ１２ａ）は、ＴＴＴＶ（ＴＴＴＡ、ＴＴＴＣ、およびＴＴＴＧ）を認識する。本発明者らは、２３ヌクレオチドスペーサー標的を含むｃｒＲＮＡスペーサー（表９）を用いて、ＴＴＴＶに対して野生型タンパク質を試験した（図１８）。

タンパク質および標的の選択
ＰＡＭＤＡインビトロアッセイにおいてＰＡＭアクセス可能性の増大を示した多くの点突然変異が存在した。内因性２９３Ｔ細胞標的に対する効果的なＰＡＭ突然変異体の全てを試験することは、本発明者らの多くの点突然変異および２５６個のあり得る４ヌクレオチド（ｎｔ）ＰＡＭを考慮すると、実験の複雑性、費用、および時間に起因して、効率的に不可能である。したがって本発明者らは、ＰＡＭのサブセットに対して試験する３つの点突然変異を選択した。３つの試験された点突然変異は、Ｔ１５２Ｒ、Ｋ５３８Ｗ、およびＫ５９５Ｙである。

２９３Ｔ細胞におけるゲノム標的は、それらのＰＡＭ配列に基づいて選択した。３つの点突然変異に関するゲノム標的は、適切な４ｎｔＰＡＭを有すること、および、そのＰＡＭから下流の２３ヌクレオチドを選択すること以外、特定の規則を用いずにランダムに選択した。３つの異なるスペーサーは、それぞれのＰＡＭをアッセイするように選択した。これは、ＣＲＩＳＰＲ酵素の活性が標的特異的であり、しばしば予測することができないという観察によるものである。

平均して、本発明者らは、試験された２３ヌクレオチドｗｔＬｂＣａｓ１２ａスペーサーの約半分が正しいＰＡＭＴＴＴＶ配列を有しているにもかかわらず効果がないことを観察した。各ＰＡＭに関するたった３つのデータポイントしかないことと、標的の約５０％がインデルを産生しないという観察から、ランダムに設計されたスペーサーに関する平均よりむしろ、ＰＡＭあたりの最大インデルパーセンテージを可視化することによりＰＡＭ認識を評価することがより有益である（図１９～２１）。各ＰＡＭについてより多くの数のスペーサーをアッセイした場合は、統計試験を用いてそれらの平均編集効率を評価し得る。

本発明者らの全体的なトランスフェクションおよびアッセイ条件は、ＴＴＴＣについておよそ１１～２６％、ＴＴＴＡについて１０％、ＴＴＴＧについて４～１０％で、ＨＥＫ２９３Ｔ細胞におけるインデルを生じる野生型ＬｂＣＡｓ１２ａをもたらす（図１８）。これらは、文献から前に定義されたＨＥＫ２９３Ｔ標的部位およびガイドであり、したがって、任意のランダムに選択されたガイドよりも効果的であることが予測される。突然変異体に関するｃｒＲＮＡガイドのランダムな設計にもかかわらず、多くの新たなＣａｓ１２ａＰＡＭ認識部位が、ＴＴＴＶ配列において、野生型と同様の割合でインデルを生じさせた（図１９～２１）。０．１％よりも上の任意のインデルは、１０，０００ＮＧＳリード深度で読まれたシーケンシングアッセイのノイズよりも上である。

Ｋ５９５Ｙは、ＡＣＣＧにおいて２５．５％、ＣＣＧＣにおいて１０．９％、ＴＣＧＣにおいて１０．１％、ＣＣＣＧにおいて９．５％、ＧＣＧＣにおいて８．３％、ＣＴＧＧにおいて７．８％、ＡＣＧＧにおいて６．３％、ＣＣＣＧにおいて６．０％、ＴＧＧＣにおいて５．３％などでインデルを生じさせることができた（図１９）。これらの数字は全て、ランダムに設計されたにもかかわらず、ｗｔＬｂＣａｓ１２ａに関するＴＴＴＶコントロールの範囲内である。Ｃａｓ１２ａタンパク質の１つの主なホールマークは、ＴリッチなＰＡＭを認識することである（Ｚｅｔｓｃｈｅｅｔａｌ．Ｃｅｌｌ１６３：７５９－７７１（２０１５））。このことは、ゲノム編集技術におけるそれらの有用性を制限する。Ｋ５９５Ｙは明らかにＣおよびＧリッチのＰＡＭを好み、このことは、Ｃａｓ２ａの有用性を、以前は主にＧリッチＰＡＭを利用するＣａｓ９ＣＲＩＳＰＲ酵素の標的であった標的に拡大させる（Ｊｉｎｅｋｅｔａｌ．Ｓｃｉｅｎｃｅ３３７，８１６－８２１（２０１２））。Ｋ５９５Ｙについて、合計２５６個のあり得る４ヌクレオチドＰＡＭのうち３１個のみが２９３Ｔ細胞において試験された（または１２％）。真核生物細胞においてＫ５９５Ｙによって認識されてインデルを生じさせ得る多くの他のＰＡＭが存在する可能性がある。

Ｔ１５２Ｒは、ＣＣＴＣにおいて１１．５％、ＣＣＴＧにおいて１０．０％、ＣＣＣＡにおいて９．６％、ＧＣＣＡにおいて８．４％、ＧＣＣＣにおいて７．２％、ＣＴＧＣにおいて５．１％などでインデルを生じさせることができた（図２０）。興味深いことに、Ｔ１５２Ｒは、ＴＴＴＣにおいて３４．９％、ＴＴＴＡにおいて１０．２％、およびＴＴＴＧにおいて６．２％で、インデルを生じさせることにより、ｗｔＬｂＣａｓ１２ａのＴＴＴＶ認識を維持した。それはまた、ＴＴＴＴ認識もピックアップし（ｐｉｃｋｅｄｕｐ）、８．３％でインデルを生じさせた。Ｔ１５２Ｒについて、合計２５６個のあり得る４ヌクレオチドＰＡＭの２２個のみが２９３Ｔ細胞において試験された（または９％）。真核生物細胞においてＴ１５２Ｒによって認識されてインデルを生じさせ得る多くの他のＰＡＭが存在する可能性がある。

図２１に示されるように、２８個のＰＡＭ標的のうち２２個が、０．１％のバックグラウンドよりも上の活性を有しており、試験されたＰＡＭの７９％がこの酵素によって認識され切断されることが示唆されたが、一部の適用については所望され得るよりも低いこともある。試験された６個のＰＡＭは、３つの選択された標的に関して、バックグラウンドよりも上の編集がなかった。３つのＴＴＴＶ標的は全て、ＴＴＴＣ、ＴＴＴＧ、およびＴＴＴＡについて、それぞれ１５．６％、６．２％、および５．８％で良好な活性を依然として有していた。１％よりも上のインデル形成を有する他のＰＡＭ配列は、ＡＴＴＡ（３．５％）、ＴＴＴＴ（３．２％）、ＴＧＴＣ（１．８％）、ＡＧＣＧ（１．８％）、ＡＧＴＣ（１．６％）、ＡＧＣＡ（１．４％）、およびＧＧＴＣ（１．１％）を含んでいた。この点突然変異は、ＰＡＭ－ＳＣＡＮＲ実験においてＴ１５２Ｒおよび／またはＫ５９５Ｙと組み合わせて用いて多種多様のＰＡＭ認識が産生されたが、それ自体では、そのアッセイを用いて相対的に少ないＰＡＭに結合した。将来的に、単独よりむしろ二重突然変異を用いてＨＥＫ２９３Ｔ細胞においてインデルを産生することが優れた選択であり得る。他の２つの点突然変異と同様に、あり得る２５６個の４ヌクレオチドＰＡＭのうちの２８個のみが試験され（１１％）、この突然変異体が、ここで試験されていないＰＡＭまたは標的を認識し得る可能性がある。

ＨＥＫ２９３ＴインデルおよびＰＡＭ－ＳＣＡＮＲ結合の間の相関
Ｔ１５２ＲおよびＫ５９５Ｙに関して、観察された最大インデルパーセンテージおよびＰＡＭ－ＳＣＡＮＲスコアの間で相関が観察された（図２２Ａ～２２Ｂ）。図２２Ａ～２２Ｂは、インデル％（最大）および正規化された細菌ＰＡＭ－ＳＣＡＮＲスコアの間の線形相関を、ＬｂＣａｓ１２ａ－Ｔ１５２Ｒ（図２２Ａ）およびＬｂＣａｓ１２ａ－Ｋ５９５Ｙ（図２２Ｂ）について示す。

とりわけ、試験された１．５よりも上のＰＡＭ－ＳＣＡＮＲスコアを有する任意の点突然変異は、２９３Ｔ細胞において、５％よりも高い割合でインデルを産生した。このことは、（本発明者らの厳密な１．６７カットオフよりむしろ）１．５よりも上の正規化されたスコアを有する、ＰＡＭ－ＳＣＡＮＲ実験において試験された任意の突然変異が、大部分の真核生物適用に有用な割合でインデルを産生することができる可能性があることを示唆している。

前述したものは本発明の例示であり、その限定と解釈すべきでない。本発明は以下の特許請求の範囲によって定義され、その等価物は本明細書中に含まれる。

Claims

改変されたＬａｃｈｎｏｓｐｉｒａｃｅａｅｂａｃｔｅｒｉｕｍＣＲＩＳＰＲ（ＣｌｕｓｔｅｒｅｄＲｅｇｕｌａｒｌｙＩｎｔｅｒｓｐａｃｅｄＳｈｏｒｔＰａｌｉｎｄｒｏｍｉｃＲｅｐｅａｔｓ）Ｃａｓ１２ａ（ＬｂＣａｓ１２ａ）ポリペプチドであって、
前記改変されたＬｂＣａｓ１２ａポリペプチドは、配列番号１（ＬｂＣａｓ１２ａ）のアミノ酸配列と少なくとも８０％同一性および配列番号１の位置ナンバリングに関して以下の位置：Ｋ１１６、Ｋ１２０、Ｋ１２１、Ｄ１２２、Ｅ１２５、Ｔ１４８、Ｔ１４９、Ｔ１５２、Ｄ１５６、Ｅ１５９、Ｑ５２９、Ｄ５３５、Ｋ５３８、Ｄ５４１、Ｙ５４２、Ｌ５８５、Ｋ５９１、Ｍ５９２、Ｋ５９５、Ｖ５９６、Ｓ５９９、Ｋ６００、Ｋ６０１、Ｙ６１６、Ｙ６４６、Ｗ６４９の１つ以上における突然変異を有するアミノ酸配列を含み、配列番号１の位置ナンバリングに関して以下の位置：Ｋ１１６、Ｋ１２０、Ｋ１２１、Ｄ１２２、Ｅ１２５、Ｔ１５２、Ｄ１５６、Ｅ１５９、Ｇ５３２、Ｄ５３５、Ｋ５３８、Ｄ５４１、および／またはＫ５９５の１つ以上における突然変異であってもよい、
改変されたＬｂＣａｓ１２ａポリペプチド。
前記改変されたＬｂＣａｓ１２ａポリペプチドが、配列番号１の位置ナンバリングに関して、Ｋ１１６Ｒ、Ｋ１１６Ｎ、Ｋ１２０Ｒ、Ｋ１２０Ｈ、Ｋ１２０Ｎ、Ｋ１２０Ｔ、Ｋ１２０Ｙ、Ｋ１２０Ｑ、Ｋ１２１Ｓ、Ｋ１２１Ｔ、Ｋ１２１Ｈ、Ｋ１２１Ｒ、Ｋ１２１Ｇ、Ｋ１２１Ｄ、Ｋ１２１Ｑ、Ｄ１２２Ｒ、Ｄ１２２Ｋ、Ｄ１２２Ｈ、Ｄ１２２Ｅ、Ｄ１２２Ｎ、Ｅ１２５Ｒ、Ｅ１２５Ｋ、Ｅ１２５Ｑ、Ｅ１２５Ｙ、Ｔ１４８Ｈ、Ｔ１４８Ｓ、Ｔ１４８Ａ、Ｔ１４８Ｃ、Ｔ１４９Ａ、Ｔ１４９Ｃ、Ｔ１４９Ｓ、Ｔ１４９Ｇ、Ｔ１４９Ｈ、Ｔ１４９Ｐ、Ｔ１４９Ｆ、Ｔ１４９Ｎ、Ｔ１４９Ｄ、Ｔ１４９Ｖ、Ｔ１５２Ｒ、Ｔ１５２Ｋ、Ｔ１５２Ｗ、Ｔ１５２Ｙ、Ｔ１５２Ｈ、Ｔ１５２Ｑ、Ｔ１５２Ｅ、Ｔ１５２Ｌ、Ｔ１５２Ｆ、Ｄ１５６Ｒ、Ｄ１５６Ｋ、Ｄ１５６Ｙ、Ｄ１５６Ｗ、Ｄ１５６Ｑ、Ｄ１５６Ｈ、Ｄ１５６Ｉ、Ｄ１５６Ｖ、Ｄ１５６Ｌ、Ｄ１５６Ｅ、Ｅ１５９Ｋ、Ｅ１５９Ｒ、Ｅ１５９Ｈ、Ｅ１５９Ｙ、Ｅ１５９Ｑ、Ｑ５２９Ｎ、Ｑ５２９Ｔ、Ｑ５２９Ｈ、Ｑ５２９Ａ、Ｑ５２９Ｆ、Ｑ５２９Ｇ、Ｑ５２９Ｇ、Ｑ５２９Ｓ、Ｑ５２９Ｐ、Ｑ５２９Ｗ、Ｑ５２９Ｄ、Ｇ５３２Ｄ、Ｇ５３２Ｎ、Ｇ５３２Ｓ、Ｇ５３２Ｈ、Ｇ５３２Ｆ、Ｇ５３２Ｋ、Ｇ５３２Ｒ、Ｇ５３２Ｑ、Ｇ５３２Ａ、Ｇ５３２Ｌ、Ｇ５３２Ｃ、Ｄ５３５Ｎ、Ｄ５３５Ｈ、Ｄ５３５Ｖ、Ｄ５３５Ｔ、Ｄ５３５、ＳＤ５３５Ａ、Ｄ５３５Ｗ、Ｄ５３５Ｋ、Ｋ５３８ＲＫ５３８Ｖ、Ｋ５３８Ｑ、Ｋ５３８Ｗ、Ｋ５３８Ｙ、Ｋ５３８Ｆ、Ｋ５３８Ｈ、Ｋ５３８Ｌ、Ｋ５３８Ｍ、Ｋ５３８Ｃ、Ｋ５３８Ｇ、Ｋ５３８Ａ、Ｋ５３８Ｐ、Ｄ５４１Ｎ、Ｄ５４１Ｈ、Ｄ５４１Ｒ、Ｄ５４１Ｋ、Ｄ５４１Ｙ、Ｄ５４１Ｉ、Ｄ５４１Ａ、Ｄ５４１Ｓ、Ｄ５４１Ｅ、Ｙ５４２Ｒ、Ｙ５４２Ｋ、Ｙ５４２Ｈ、Ｙ５４２Ｑ、Ｙ５４２Ｆ、Ｙ５４２Ｌ、Ｙ５４２Ｍ、Ｙ５４２Ｐ、Ｙ５４２Ｖ、Ｙ５４２Ｎ、Ｙ５４２Ｔ、Ｌ５８５Ｇ、Ｌ５８５Ｈ、Ｌ５８５Ｆ、Ｋ５９１Ｗ、Ｋ５９１Ｆ、Ｋ５９１Ｙ、Ｋ５９１Ｈ、Ｋ５９１Ｒ、Ｋ５９１Ｓ、Ｋ５９１Ａ、Ｋ５９１Ｇ、Ｋ５９１Ｐ、Ｍ５９２Ｒ、Ｍ５９２Ｋ、Ｍ５９２Ｑ、Ｍ５９２Ｅ、Ｍ５９２Ａ、Ｋ５９５Ｒ、Ｋ５９５Ｑ、Ｋ５９５Ｙ、Ｋ５９５Ｌ、Ｋ５９５Ｗ、Ｋ５９５Ｈ、Ｋ５９５Ｅ、Ｋ５９５Ｓ、Ｋ５９５Ｄ、Ｋ５９５Ｍ、Ｖ５９６Ｔ、Ｖ５９６Ｈ、Ｖ５９６Ｇ、Ｖ５９６Ａ、Ｓ５９９Ｇ、Ｓ５９９Ｈ、Ｓ５９９Ｎ、Ｓ５９９Ｄ、Ｋ６００Ｒ、Ｋ６００Ｈ、Ｋ６００Ｇ、Ｋ６０１Ｒ、Ｋ６０１Ｈ、Ｋ６０１Ｑ、Ｋ６０１Ｔ、Ｙ６１６Ｋ、Ｙ６１６Ｒ、Ｙ６１６Ｅ、Ｙ６１６Ｆ、Ｙ６１６Ｈ、Ｙ６４６Ｒ、Ｙ６４６Ｅ、Ｙ６４６Ｋ、Ｙ６４６Ｈ、Ｙ６４６Ｑ、Ｙ６４６Ｗ、Ｙ６４６Ｎ、Ｗ６４９Ｈ、Ｗ６４９Ｋ、Ｗ６４９Ｙ、Ｗ６４９Ｒ、Ｗ６４９Ｅ、Ｗ６４９Ｓ、Ｗ６４９Ｖ、および／またはＷ６４９Ｔのアミノ酸突然変異の１つ以上を含み、配列番号１の位置ナンバリングに関してＫ１１６Ｒ、Ｋ１１６Ｎ、Ｋ１２０Ｙ、Ｋ１２１Ｓ、Ｋ１２１Ｒ、Ｄ１２２Ｈ、Ｄ１２２Ｎ、Ｅ１２５Ｋ、Ｔ１５２Ｒ、Ｔ１５２Ｋ、Ｔ１５２Ｙ、Ｔ１５２Ｑ、Ｔ１５２Ｅ、Ｔ１５２Ｆ、Ｄ１５６Ｒ、Ｄ１５６Ｗ、Ｄ１５６Ｑ、Ｄ１５６Ｈ、Ｄ１５６Ｉ、Ｄ１５６Ｖ、Ｄ１５６Ｌ、Ｄ１５６Ｅ、Ｅ１５９Ｋ、Ｅ１５９Ｒ、Ｇ５３２Ｎ、Ｇ５３２Ｓ、Ｇ５３２Ｈ、Ｇ５３２Ｋ、Ｇ５３２Ｒ、Ｇ５３２Ｌ、Ｄ５３５Ｎ、Ｄ５３５Ｈ、Ｄ５３５Ｔ、Ｄ５３５、ＳＤ５３５Ａ、Ｄ５３５Ｗ、Ｋ５３８ＲＫ５３８Ｖ、Ｋ５３８Ｑ、Ｋ５３８Ｗ、Ｋ５３８Ｙ、Ｋ５３８Ｆ、Ｋ５３８Ｈ、Ｋ５３８Ｌ、Ｋ５３８Ｍ、Ｋ５３８Ｃ、Ｋ５３８Ｇ、Ｋ５３８Ａ、Ｄ５４１Ｅ、Ｋ５９５Ｒ、Ｋ５９５Ｑ、Ｋ５９５Ｙ、Ｋ５９５Ｗ、Ｋ５９５Ｈ、Ｋ５９５Ｓ、および／またはＫ５９５Ｍのアミノ酸突然変異の１つ以上を含んでもよい、請求項１に記載の改変されたＬｂＣａｓ１２ａポリペプチド。
前記改変されたＬｂＣａｓ１２ａポリペプチドが、変更されたＰＡＭ（プロトスペーサー隣接モチーフ）特異性を有する、請求項１または２に記載の改変されたＬｂＣａｓ１２ａポリペプチド。
ヌクレアーゼ活性部位（例えば、ＲｕｖＣドメイン）内に突然変異をさらに含む、請求項１または２に記載の改変されたＬｂＣａｓ１２ａポリペプチド（例えば、ｄｅａｄＬｂＣａｓ１２ａ、ｄＬｂＣａｓ１２ａ）。
請求項１～４のいずれか一項に記載の改変されたＬｂＣａｓ１２ａポリペプチド、および、ペプチドリンカーであってもよいリンカーを含む、融合タンパク質。
前記ペプチドリンカーが前記改変されたＬｂＣａｓ１２ａポリペプチドのＣ末端および／またはＮ末端に連結される、請求項５に記載の融合タンパク質。
請求項１～４のいずれか一項に記載の改変されたＬｂＣａｓ１２ａポリペプチド、および目的ポリペプチドを含む、融合タンパク質。
前記目的ポリペプチドが、前記改変されたＬｂＣａｓ１２ａポリペプチドに連結される、請求項７に記載の融合タンパク質。
前記目的ポリペプチドが、前記改変されたＬｂＣａｓ１２ａポリペプチドのＣ末端および／またはＮ末端に連結される、請求項７または８に記載の融合タンパク質。
前記目的ポリペプチドが、前記改変されたＬｂＣａｓ１２ａポリペプチドに、ペプチドリンカーであってもよいリンカーを介して連結される、請求項７～９のいずれか一項に記載の融合タンパク質。
前記目的ポリペプチドが、デアミナーゼ（脱アミノ化）活性、ニッカーゼ活性、リコンビナーゼ活性、トランスポサーゼ活性、メチラーゼ活性、グリコシラーゼ（ＤＮＡグリコシラーゼ）活性、グリコシラーゼ阻害剤活性（例えば、ウラシル－ＤＮＡグリコシラーゼ阻害剤（ＵＧＩ））、デメチラーゼ活性、転写活性化活性、転写抑制活性、転写終結因子（ｔｒａｎｓｃｒｉｐｔｉｏｎｒｅｌｅａｓｅｆａｃｔｏｒ）活性、ヒストン修飾活性、ヌクレアーゼ活性、一本鎖ＲＮＡ切断活性、二本鎖ＲＮＡ切断活性、制限エンドヌクレアーゼ活性（例えば、Ｆｏｋ１）、核酸結合活性、メチルトランスフェラーゼ活性、ＤＮＡ修復活性、ＤＮＡ損傷活性、ジスムターゼ活性、アルキル化活性、脱プリン活性、酸化活性、ピリミジンダイマー形成活性、インテグラーゼ活性、トランスポサーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、および／またはフォトリアーゼ活性を有する少なくとも１つのポリペプチドまたはタンパク質ドメインを含む、請求項７～９のいずれか一項に記載の融合タンパク質。
前記目的ポリペプチドが、デアミナーゼ活性を有する少なくとも１つのポリペプチドまたはタンパク質ドメインを含む、請求項７～１１のいずれか一項に記載の融合タンパク質。
デアミナーゼ活性を有する前記少なくとも１つのポリペプチドまたはタンパク質ドメインが、シトシンデアミナーゼドメインまたはアデニンデアミナーゼドメインである、請求項１２に記載の融合タンパク質。
前記シトシンデアミナーゼドメインが、アポリポタンパク質ＢｍＲＮＡ編集触媒ポリペプチド様（ＡＰＯＢＥＣ）ドメインである、請求項１３に記載の融合タンパク質。
前記アデニンデアミナーゼドメインが、ＴａｄＡ（ｔＲＮＡ特異的アデノシンデアミナーゼ）および／またはＴａｄＡ^＊（進化したｔＲＮＡ特異的アデノシンデアミナーゼ）である、請求項１３に記載の融合タンパク質。
前記少なくとも１つのポリペプチドが、グリコシラーゼ阻害剤活性を有しており、前記少なくとも１つのポリペプチドは、ウラシル－ＤＮＡグリコシラーゼ阻害剤（ＵＧＩ）であってもよい、請求項７～１４のいずれか一項に記載の融合タンパク質。
請求項１～４のいずれか一項に記載の改変されたＬｂＣａｓ１２ａポリペプチド、または請求項５～１６のいずれか一項に記載の融合タンパク質をコードする、ポリヌクレオチド。
前記改変されたＬｂＣａｓ１２ａポリペプチドをコードするポリヌクレオチドまたは前記融合タンパク質をコードするポリヌクレオチドが、プロモーターと作動可能に関連しており、前記プロモーターは、イントロンを含むプロモーター領域であってもよい、請求項１７に記載のポリヌクレオチド。
前記ポリヌクレオチドが、生物における発現のためにコドン最適化されている、請求項１７または１８に記載のポリヌクレオチド。
前記生物が、動物、植物、菌類、古細菌、または細菌である、請求項１７～１９のいずれか一項に記載のポリヌクレオチド。
請求項１～４のいずれか一項に記載の改変されたＬｂＣａｓ１２ａポリペプチド、または請求項５～１６のいずれか一項に記載の融合タンパク質、およびガイド核酸（例えば、ＣＲＩＳＰＲＲＮＡ、ＣＲＩＳＰＲＤＮＡ、ｃｒＲＮＡ、ｃｒＤＮＡ）を含む、複合体。
請求項２１に記載の複合体をコードする、核酸構築物。
（ａ）請求項１～４のいずれか一項に記載の改変されたＬｂＣａｓ１２ａポリペプチド、または請求項５～１６のいずれか一項に記載の融合タンパク質、および（ｂ）ガイド核酸を含む、組成物。
請求項１７～２０のいずれか一項に記載のポリヌクレオチド、または請求項２２に記載の核酸構築物を含む、発現カセットまたはベクター。
Ｖ型ＣｌｕｓｔｅｒｅｄＲｅｇｕｌａｒｌｙＩｎｔｅｒｓｐａｃｅｄＳｈｏｒｔＰａｌｉｎｄｒｏｍｉｃＲｅｐｅａｔｓ（ＣＲＩＳＰＲ）関連（Ｃａｓ）（ＣＲＩＳＰＲ－Ｃａｓ）システムであって、
以下を含み：
（ａ）以下を含む融合タンパク質：（ｉ）請求項１～４のいずれか一項に記載の改変されたＬｂＣａｓ１２ａポリペプチドまたは請求項１～４のいずれか一項に記載の改変されたＬｂＣａｓ１２ａポリペプチドをコードする核酸、および（ｉｉ）目的ポリペプチドまたは前記目的ポリペプチドをコードする核酸；および
（ｂ）スペーサー配列とリピート配列とを含むガイド核酸（ＣＲＩＳＰＲＲＮＡ、ＣＲＩＳＰＲＤＮＡ、ｃｒＲＮＡ、ｃｒＤＮＡ）、
ここで前記ガイド核酸は、前記改変されたＬｂＣａｓ１２ａポリペプチドまたは前記融合タンパク質と複合体を形成することが可能であり、前記スペーサー配列は、標的核酸にハイブリダイズすることが可能であり、それにより、前記改変されたＬｂＣａｓ１２ａポリペプチドおよび前記目的ポリペプチドを前記標的核酸にガイドし、それにより、前記標的核酸が改変（例えば切断または編集）または調整（例えば転写調整）される、
システム。
前記改変されたＬｂＣａｓ１２ａポリペプチドが、ヌクレアーゼ活性部位（例えば、ＲｕｖＣドメイン）内に突然変異を含む（例えば、ｄｅａｄＣａｓ１２ａ、ｄＣａｓ１２ａ）、請求項２５に記載のシステム。
前記目的ポリペプチドが、前記改変されたＬｂＣａｓ１２ａポリペプチドのＣ末端および／またはＮ末端に連結される、請求項２５または２６に記載のシステム。
前記目的ポリペプチドが、前記改変されたＬｂＣａｓ１２ａポリペプチドのＣ末端および／またはＮ末端に、ペプチドリンカーであってもよいリンカーを介して連結される、請求項２５～２７のいずれか一項に記載のシステム。
前記目的ポリペプチドが、デアミナーゼ（脱アミノ化）活性、ニッカーゼ活性、リコンビナーゼ活性、トランスポサーゼ活性、メチラーゼ活性、グリコシラーゼ（ＤＮＡグリコシラーゼ）活性、グリコシラーゼ阻害剤活性（例えば、ウラシル－ＤＮＡグリコシラーゼ阻害剤（ＵＧＩ））．デメチラーゼ活性、転写活性化活性、転写抑制活性、転写終結因子（ｔｒａｎｓｃｒｉｐｔｉｏｎｒｅｌｅａｓｅｆａｃｔｏｒ）活性、ヒストン修飾活性、ヌクレアーゼ活性、一本鎖ＲＮＡ切断活性、二本鎖ＲＮＡ切断活性、制限エンドヌクレアーゼ活性（例えば、Ｆｏｋ１）、核酸結合活性、メチルトランスフェラーゼ活性、ＤＮＡ修復活性、ＤＮＡ損傷活性、ジスムターゼ活性、アルキル化活性、脱プリン活性、酸化活性、ピリミジンダイマー形成活性、インテグラーゼ活性、トランスポサーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、および／またはフォトリアーゼ活性を有する少なくとも１つのポリペプチドまたはタンパク質ドメインを含む、請求項２５～２８のいずれか一項に記載のシステム。
前記目的ポリペプチドが、デアミナーゼ活性を有する少なくとも１つのポリペプチドまたはタンパク質ドメインを含む、請求項２５～２９のいずれか一項に記載のシステム。
デアミナーゼ活性を有する前記少なくとも１つのポリペプチドまたはタンパク質ドメインが、シトシンデアミナーゼドメインまたはアデニンデアミナーゼドメインである、請求項３０に記載のシステム。
前記シトシンデアミナーゼドメインが、アポリポタンパク質ＢｍＲＮＡ編集触媒ポリペプチド様（ＡＰＯＢＥＣ）ドメインである、請求項３１に記載のシステム。
前記アデニンデアミナーゼドメインが、ＴａｄＡ（ｔＲＮＡ特異的アデノシンデアミナーゼ）および／またはＴａｄＡ^＊（進化したｔＲＮＡ特異的アデノシンデアミナーゼ）である、請求項３１に記載のシステム。
前記目的ポリペプチドが、ウラシル－ＤＮＡグリコシラーゼ阻害剤（ＵＧＩ）を含む、請求項２５～３２のいずれか一項に記載のシステム。
（ａ）および（ｂ）の一方または両方が、１つまたは複数の発現カセットおよび／またはベクター内に含まれる、請求項２５～３４のいずれか一項に記載のシステム。
請求項１７～２０のいずれか一項に記載のポリヌクレオチド、請求項２２に記載の核酸構築物、請求項２４に記載の発現カセットまたはベクター、または請求項２５～３５のいずれか一項に記載のシステムを含む、細胞。
標的核酸を改変する方法であって、
前記標的核酸を、
（ａ）（ｉ）請求項１～４のいずれか一項に記載の改変されたＬｂＣａｓ１２ａポリペプチド、または請求項５～１６のいずれか一項に記載の融合タンパク質、および（ｉｉ）ガイド核酸（例えば、ＣＲＩＳＰＲＲＮＡ、ＣＲＩＳＰＲＤＮＡ、ｃｒＲＮＡ、ｃｒＤＮＡ）；
（ｂ）請求項２１に記載の複合体およびガイド核酸；
（ｃ）（ｉ）請求項１～４のいずれか一項に記載の改変されたＬｂＣａｓ１２ａポリペプチド、または請求項５～１６のいずれか一項に記載の融合タンパク質、および（ｉｉ）ガイド核酸を含む組成物；および／または
（ｄ）請求項２５～３５のいずれか一項に記載のシステム
と接触させるステップを含み、それにより前記標的核酸を改変する、
方法。
標的核酸を改変する方法であって、
前記標的核酸を含む細胞または無細胞系を、
（ａ）（ｉ）請求項１７～２０のいずれか一項に記載のポリヌクレオチド、またはそれを含む発現カセットまたはベクター、および（ｉｉ）ガイド核酸、またはそれを含む発現カセットまたはベクター；および／または
（ｂ）請求項２２に記載の核酸構築物、またはそれを含む発現カセットまたはベクター、
と接触させるステップを含み、それにより前記標的核酸を改変する、
方法。
標的核酸を編集する方法であって、
前記標的核酸を、
（ａ）（ｉ）請求項７～１６のいずれか一項に記載の融合タンパク質、および（ａ）（ｉｉ）ガイド核酸；
（ｂ）請求項７～１６のいずれか一項に記載の融合タンパク質、およびガイド核酸を含む、複合体；
（ｃ）請求項７～１６のいずれか一項に記載の融合タンパク質およびガイド核酸を含む、組成物；および／または、
（ｄ）請求項２５～３５のいずれか一項に記載のシステム、
と接触させるステップを含み、それにより前記標的核酸を編集する、
方法。
標的核酸を編集する方法であって、
前記標的核酸を含む細胞または無細胞系を、
（ａ）（ｉ）請求項７～１６のいずれか一項に記載の融合タンパク質をコードするポリヌクレオチド、またはそれを含む発現カセットまたはベクター、および（ａ）（ｉｉ）ガイド核酸、またはそれを含む発現カセットまたはベクター；および／または
（ｂ）請求項７～１６のいずれか一項に記載の融合タンパク質およびガイド核酸を含む複合体をコードする、核酸構築物、またはそれを含む発現カセットまたはベクター；および／または
（ｃ）請求項２５～３５のいずれか一項に記載のシステム、
と接触させるステップを含み、それにより前記標的核酸を編集する、
方法。
プロトスペーサーの５’末にＰＡＭ認識部位を有するＣＲＩＳＰＲ－Ｃａｓヌクレアーゼのプロトスペーサー隣接モチーフ（ＰＡＭ）の要件／特異性を判定するための二本鎖核酸分子を含むランダム化ＤＮＡライブラリーを構築する方法であって、
前記方法は以下を含み：
以下のステップを含む２以上の二本鎖核酸分子を調製するステップ：
（ａ）前記２以上の二本鎖核酸分子のそれぞれのための非標的オリゴヌクレオチド（第１）鎖および標的オリゴヌクレオチド（第２）鎖を合成するステップ、
ここで、前記非標的オリゴヌクレオチド鎖は、５’から３’に、以下：
（ｉ）約５～約１５ヌクレオチドを有する第１の配列、
（ｉｉ）少なくとも４つのランダム化ヌクレオチドを有する第２の配列、
（ｉｉｉ）約１６～約２５ヌクレオチドを含むプロトスペーサー配列、および
（ｉｖ）約５～約２０ヌクレオチドを有する第３の配列
を含み、
ここで（ｉ）の約５～１５ヌクレオチドを有する第１の配列は、（ｉｉ）の第２の配列の５’末にすぐ隣接しており、（ｉｉ）の第２の配列は（ｉｉｉ）のプロトスペーサー配列の５’末にすぐ隣接しており、前記プロトスペーサー配列は（ｉｖ）の第３の配列の５’末にすぐ隣接しており；前記標的オリゴヌクレオチド（第２）鎖は前記非標的オリゴヌクレオチド鎖と相補である；および
（ｂ）前記非標的オリゴヌクレオチド鎖を前記相補の標的オリゴヌクレオチド鎖にアニーリングさせて二本鎖核酸分子を産生するステップ、
ここで、前記第１の配列は制限部位を（その５’末に）含み、前記第３の配列は制限部位を（その３’末に）含み、ここで、前記２以上の二本鎖核酸分子のそれぞれの前記第１の配列（ｉ）、前記プロトスペーサー配列（ｉｉｉ）および前記第３の配列（ｉｖ）は同一であり、それにより、二本鎖核酸分子を含む前記ランダム化ＤＮＡライブラリーを構築する、
方法。
プロトスペーサーの３’末にＰＡＭ認識部位を有するＣＲＩＳＰＲ－Ｃａｓヌクレアーゼのプロトスペーサー隣接モチーフ（ＰＡＭ）の要件／特異性を判定するための二本鎖核酸分子を含むランダム化ＤＮＡライブラリーを構築する方法であって、
前記方法は以下を含み：
以下のステップを含む２以上の二本鎖核酸分子を調製するステップ：
（ａ）前記２以上の二本鎖核酸分子のそれぞれのための非標的オリゴヌクレオチド（第１）鎖および標的オリゴヌクレオチド（第２）鎖を合成するステップ、
ここで、前記非標的オリゴヌクレオチド鎖は、５’から３’に、以下：
（ｉ）約５～約２０ヌクレオチドを有する第１の配列、
（ｉｉ）約１６～約２５ヌクレオチドを含むプロトスペーサー配列、
（ｉｉｉ）少なくとも４つのランダム化ヌクレオチドを有する第２の配列、および
（ｉｖ）約５～約１５ヌクレオチドを有する第３の配列
を含み、
ここで（ｉ）の約５～２０ヌクレオチドを有する第１の配列は（ｉｉ）のプロトスペーサー配列の５’末にすぐ隣接しており、（ｉｉｉ）の第２の配列は（ｉｉｉ）のプロトスペーサー配列の３’末にすぐ隣接しており、（ｉｖ）の第３の配列は（ｉｉｉ）の第２の配列の３’末にすぐ隣接しており；前記標的オリゴヌクレオチド（第２）鎖は前記非標的オリゴヌクレオチド鎖に相補である；および
（ｂ）前記非標的オリゴヌクレオチド鎖を前記相補の標的オリゴヌクレオチド鎖にアニーリングさせて二本鎖核酸分子を産生するステップ、
ここで、前記第１の配列（ｉ）は制限部位を（その５’末に）含み、前記第３の配列（ｉｖ）は制限部位を（その３’末に）含み、ここで、前記２以上の二本鎖核酸分子のそれぞれの前記第１の配列（ｉ）、前記プロトスペーサー配列（ｉｉ）および前記第３の配列（ｉｖ）は同一であり、それにより、二本鎖核酸分子を含む前記ランダム化ＤＮＡライブラリーを構築する、
方法。
前記二本鎖核酸分子をベクターにライゲーションして、前記ランダム化ＤＮＡライブラリーを含むベクターを生産するステップをさらに含む、請求項４１または４２に記載の方法。
前記ランダム化ＤＮＡライブラリーを増幅するステップをさらに含む、請求項４１～４３のいずれか一項に記載の方法。
増幅するステップが、前記ランダム化ＤＮＡライブラリーを含むベクターを１つまたは複数の細菌細胞内に導入するステップ、および、前記１つまたは複数の細菌細胞を培養するステップを含む、請求項４４に記載の方法。
前記ランダム化ＤＮＡライブラリーを含むベクターを、前記１つまたは複数の細菌細胞から単離するステップをさらに含む、請求項４５に記載の方法。
前記ベクターを線状化して前記ランダム化ＤＮＡライブラリーを提供するステップをさらに含む、請求項４６に記載の方法。
前記線状化するステップが、前記ベクターを制限酵素と接触させるステップを含む、請求項４７に記載の方法。
前記制限酵素がＳｃａＩまたはＰｆｏＩである、請求項４８に記載の方法。
請求項４１～４９のいずれか一項に記載の方法によって生産される、ランダム化ＤＮＡライブラリー。
プロトスペーサーの５’末にＰＡＭ認識部位を有するＣＲＩＳＰＲ－Ｃａｓヌクレアーゼのプロトスペーサー隣接モチーフ（ＰＡＭ）の要件／特異性を判定するためのランダム化ＤＮＡライブラリーが提供され得て、
前記ランダム化ＤＮＡライブラリーは、２以上の二本鎖核酸分子を含み、それぞれが以下を含む：
（ａ）非標的オリゴヌクレオチド（第１）鎖および標的オリゴヌクレオチド（第２）鎖、
ここで、前記非標的オリゴヌクレオチド鎖は、５’から３’に、以下を含む：
（ｉ）約５～約１５ヌクレオチド（例えば、約５、６、７、８、９、１０、１１、１２、１３、１４、または１５ヌクレオチド、およびその中の任意の範囲または値）を有する第１の配列、
（ｉｉ）少なくとも４つのランダム化ヌクレオチド（例えば、少なくとも４、５、６、７、８、９、１０、またはそれよりも多く、およびその中の任意の範囲または値）を有する第２の配列、
（ｉｉｉ）約１６～約２５ヌクレオチド、例えば、約１６、１７、１８、１９、２０、２１、２２、２３、２４、または２５ヌクレオチドを含む、プロトスペーサー配列、および
（ｉｖ）約５～約２０ヌクレオチド（例えば、約５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０ヌクレオチド、およびその中の任意の範囲または値）を有する第３の配列、
ここで、（ｉ）の約５～１５ヌクレオチドを有する第１の配列は、（ｉｉ）の第２の配列の５’末にすぐ隣接しており、（ｉｉ）の第２の配列は（ｉｉｉ）のプロトスペーサー配列の５’末にすぐ隣接しており、前記プロトスペーサー配列は（ｉｖ）の第３の配列の５’末にすぐ隣接しており；前記標的オリゴヌクレオチド（第２）鎖は前記非標的オリゴヌクレオチド鎖に相補である；および
（ｂ）前記非標的オリゴヌクレオチド鎖は、前記相補の標的オリゴヌクレオチド鎖にアニーリングして、二本鎖核酸分子を産生し、ここで前記第１の配列は制限部位を（その５’末に）含み、前記第３の配列は制限部位を（その３’末に）含み、ここで、前記２以上の二本鎖核酸分子のそれぞれの前記第１の配列（ｉ）、前記プロトスペーサー配列（ｉｉｉ）および前記第３の配列（ｉｖ）は同一である。
プロトスペーサーの３’末にＰＡＭ認識部位を有するＣＲＩＳＰＲ－Ｃａｓヌクレアーゼのプロトスペーサー隣接モチーフ（ＰＡＭ）の要件／特異性を判定するためのランダム化ＤＮＡライブラリーが提供され得て、
前記ランダム化ＤＮＡライブラリーは、２以上の二本鎖核酸分子を含み、それぞれが以下を含む：
（ａ）非標的オリゴヌクレオチド（第１）鎖および標的オリゴヌクレオチド（第２）鎖、
ここで、前記非標的オリゴヌクレオチド鎖は、５’から３’に、以下を含む：
（ｉ）約５～約２０ヌクレオチド（例えば、約５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０ヌクレオチド、およびその中の任意の範囲または値）を有する第１の配列、
（ｉｉ）約１６～約２５ヌクレオチド、例えば、約１６、１７、１８、１９、２０、２１、２２、２３、２４、または２５ヌクレオチドを含む、プロトスペーサー配列、
（ｉｉｉ）少なくとも４つのランダム化ヌクレオチド（例えば、少なくとも４、５、６、７、８、９、１０、またはそれよりも多く、およびその中の任意の範囲または値）を有する第２の配列、および
（ｉｖ）約５～約１５ヌクレオチド（例えば、約５、６、７、８、９、１０、１１、１２、１３、１４、１５ヌクレオチド、およびその中の任意の範囲または値）を有する第３の配列、
ここで（ｉ）の約５～２０ヌクレオチドを有する第１の配列は（ｉｉ）のプロトスペーサー配列の５’末にすぐ隣接しており、（ｉｉｉ）の第２の配列は（ｉｉｉ）のプロトスペーサー配列の３’末にすぐ隣接しており、（ｉｖ）の第３の配列は（ｉｉｉ）の第２の配列の３’末にすぐ隣接しており；前記標的オリゴヌクレオチド（第２）鎖は前記非標的オリゴヌクレオチド鎖に相補である；および
（ｂ）前記非標的オリゴヌクレオチド鎖は、前記相補の標的オリゴヌクレオチド鎖にアニーリングして、二本鎖核酸分子を産生し、ここで前記第１の配列は制限部位を（その５’末に）含み、前記第３の配列は制限部位を（その３’末に）含み、ここで、前記２以上の二本鎖核酸分子のそれぞれの前記第１の配列（ｉ）、前記プロトスペーサー配列（ｉｉ）および前記第３の配列（ｉｖ）は同一である。
ＣＲＩＳＰＲ－Ｃａｓヌクレアーゼのプロトスペーサー隣接モチーフ（ＰＡＭ）特異性を判定する方法であって、
前記方法は、
前記ＣＲＩＳＰＲ－Ｃａｓヌクレアーゼを請求項５１または５２に記載のランダム化ＤＮＡライブラリーと接触させるステップ；および
前記ヌクレアーゼとの接触前（コントロール）および接触後に前記ランダム化ＤＮＡライブラリーの二本鎖核酸分子をシーケンシングするステップ、
を含み、
ここで、前記ヌクレアーゼとの接触前は前記ランダム化ＤＮＡライブラリー内に存在するが前記ヌクレアーゼとの接触後は前記ランダム化ＤＮＡライブラリー内に存在しない二本鎖核酸分子は、前記ＣＲＩＳＰＲ－ＣａｓヌクレアーゼのＰＡＭ認識配列を特定し、それにより、前記ＣＲＩＳＰＲ－Ｃａｓヌクレアーゼの前記ＰＡＭ特異性を判定する、
方法。
前記シーケンシングするステップが、次世代シーケンシングを含む、請求項５３に記載の方法。
請求項１７～２０または２２のいずれか一項に記載のポリヌクレオチド、および／または、それを含む発現カセットまたはベクターを含み、その使用のための説明書を含んでもよい、キット。
ＣＲＩＳＰＲ－Ｃａｓ１２ａガイド核酸および／またはそれを含む発現カセットまたはベクターをさらに含む、請求項５５に記載のキット。
前記ガイド核酸が、標的核酸配列と同一または相補の核酸配列を前記ガイド核酸の主鎖にクローニングするためのクローニング部位を含む、請求項５６に記載のキット。
前記ポリヌクレオチドが１つまたは複数の核局在化シグナルをさらにコードしており、前記１つまたは複数の核局在化シグナルが前記ＣＲＩＳＰＲ－Ｃａｓ１２ａヌクレアーゼに融合されている、請求項５５～５７のいずれか一項に記載のキット。
前記ポリヌクレオチド、発現カセットまたはベクターが、１つまたは複数の選択可能マーカーをさらにコードする、請求項５５～５８のいずれか一項に記載のキット。
前記ポリヌクレオチドがｍＲＮＡであり、コードされるＣＲＩＳＰＲ－Ｃａｓ１２ａヌクレアーゼ内に１つまたは複数のイントロンをコードする、請求項５５～５９のいずれか一項に記載のキット。