JP2022526982A

JP2022526982A - 線状組換えＤＮＡコンストラクトを使用してバチルス（Ｂａｃｉｌｌｕｓ）のゲノムにドナーＤＮＡ配列を組み込むための方法及びその組成物

Info

Publication number: JP2022526982A
Application number: JP2021559248A
Authority: JP
Inventors: エルフリッシュ、ライアン; アイリーンロビダスタッブス、ステイシー; ソ、ウォンチュル; ジョゼフジマー、デレク
Original assignee: ダニスコ・ユーエス・インク
Priority date: 2019-04-05
Filing date: 2020-04-03
Publication date: 2022-05-27
Also published as: CA3136114A1; WO2020206202A1; KR20210148269A; MX2021012158A; EP3947662A1; US20220177923A1

Abstract

バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノムに、前記ゲノムへの選択マーカーの組込みを伴わずにドナーＤＮＡ配列を組み込むための方法及び組成物が提供される。方法は、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞へのガイドＲＮＡ／Ｃａｓエンドヌクレアーゼの導入のために、Ｃａｓ９エンドヌクレアーゼ及びガイドＲＮＡをコードする組換えＤＮＡコンストラクトと組み合わせて、長いホモロジーアーム（それぞれ少なくとも１０００のヌクレオチド長）によって隣接されるドナーＤＮＡを含む線状組換えＤＮＡコンストラクトを利用し、且つしたがって、前記バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノムにおいて選択マーカーを組み込む必要性を伴わずに、前記バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノムにドナーＤＮＡ配列を組み込むための非常に効率的な系を提供する。【選択図】図１

Description

関連出願の相互参照
本出願は、全体として参照により本明細書に組み込まれる、２０１９年４月５日に出願された米国仮特許出願第６２／８２９６６２号明細書の利益を主張するものである。

本発明は、細菌分子生物学の分野、特にバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノム上の標的部位に、前記ゲノムへの選択マーカーの組込みを伴わずにドナーＤＮＡ配列を組み込むための組成物及び方法に関する。

電子的に提出された配列表の参照
配列表の認証謄本は、２０２０年３月２０日に作成され、７７キロバイトのサイズを有する、２０２００３２０＿ＮＢ４１３２９ＰＣＴ＿ＳＴ２５というファイル名の１ＡＳＣＩＩフォーマットの配列表としてＥＦＳ－Ｗｅｂを介して電子的に提出され、本明細書と同時に出願される。このＡＳＣＩＩフォーマット文書に含まれる配列表は、本明細書の一部であり、その全体が参照により本明細書に組み込まれる。

組換えＤＮＡ技術により、標的のゲノム位置にＤＮＡ配列を挿入することが可能になった。部位特異的組換え系を使用する部位特異的組込み技術は、他の組換え技術と同様に、様々な生物体における目的の遺伝子の標的挿入の生成に使用されてきた。Ｃａｓ系の部位特異的性質を前提として、例えば哺乳動物細胞中における、これらの系に基づくゲノム操作技術が説明されている（例えば、Ｈｓｕｅｔａｌ．，２０１４を参照されたい）。Ｃａｓベースのゲノム操作は、意図したとおりに機能する場合、ｃｒＲＮＡのＤＮＡターゲティング領域（すなわち可変ターゲティングドメイン）がゲノム中の所望の標的部位に対して相同である組換えｃｒＲＮＡ（又は均等に機能するガイドＲＮＡ）を設計し、このｃｒＲＮＡとＣａｓエンドヌクレアーゼとを宿主細胞中で（任意の好都合な及び従来の手段によって）機能的複合体に組み合わせることにより、複雑なゲノム内での任意の特定の位置を実質的に標的とする能力を付与する。Ｃａｓ９のＲＮＡ構成要素の配列は、Ｃａｓ９が、（ｉ）ＲＮＡ構成要素の一部と相補的な配列、及び（ｉｉ）プロトスペーサー隣接モチーフ（ＰＡＭ）配列を含有するＤＮＡを認識して切断するように設計され得る。

Ｃａｓベースのゲノム操作技術は、いくつかの異なる宿主細胞型に適用されているが、これらの技術は、既知の制限を有する。

バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノムへの遺伝子組込みのための以前の方法は、自発的な二本鎖切断の発生及び短いホモロジーアームとともに線状ＤＮＡ断片上で同じ場所に位置する選択マーカー（ゲノムに挿入されることになる目的の遺伝子（ＧＯＩ）と、そのゲノムに組み込まれる目的の遺伝子を有したバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞の同定も可能にするようにゲノムに挿入された選択マーカーとの両方を含む）の使用に依拠する（２００２年２月２１日に公開された国際公開第０２／１４４９０号パンフレット）。選択マーカー及びＧＯＩは、通常、細胞内のＤＮＡとの組換え時にＧＯＩ及び選択マーカーの両方が細胞のＤＮＡ中に組み込まれることになるように、２つの短いホモロジーアームによって隣接された。バチルス（Ｂａｃｉｌｌｕｓ）細胞へのゲノム組込みのための短いホモロジーアームによる、そのような線状断片の形質転換中の選択マーカーの使用は、ゲノムの特定の位置の効率的な改変のために選択することが必要となる。マーカーは、発現のための正確な遺伝子座に組み込む必要があり、この組込みは、集団内及びゲノム内の確率的な様式で発生する希有な自発的ＤＮＡ損傷に依拠する。この希有な事象は、マーカーの使用及び染色体組込みを組み合わせることによってのみ選択され得る。（２００２年２月２１日に公開された国際公開第０２／１４４９０号パンフレット）。

本開示は、集団の大部分を、所望の遺伝子座でＤＮＡ損傷を含有する細胞に本質的に変換する部位特異的ＤＮＡ損傷（ゲノム中の標的部位での）を生成するための方法を記載する。したがって、染色体座位を改変するための制限的な工程がもはやなく；代わりに、制限的な特徴は、形質転換の効率であり、したがって、選択マーカーは、形質転換されていない細胞から、形質転換された細胞を区別するために必要となる。

バチルス・サブチリス（Ｂａｃｉｌｌｕｓｓｕｂｔｉｌｉｓ）において、Ｃａｓ／ＲＮＡガイド系と組み合わせた単一のプラスミド系の使用は、遺伝子欠失及び遺伝子における点変異の導入を可能にすることに関して記載されている（ＡｌｔｅｎｂｕｃｈｎｅｒＪ．，２０１６，ＡｐｐｌｉｅｄａｎｄＥｎｖｉｒｏｎｍｅｎｔａｌＭｉｃｒｏｂｉｏｌｏｇｙ，ｖｏｌ．８２（１７）ｐｇ．５４２１－５４２７）。

ドナーＤＮＡ配列（目的のポリヌクレオチド、目的の遺伝子、単一コピーの遺伝子発現カセット又は複数コピーの遺伝子発現カセットなどであるが、これらに限定されない）をバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノムの標的部位に組み込むための効果的、効率的又は他の点でより堅牢若しくは柔軟なＣａｓベースの方法及びその組成物を開発することが依然として必要とされている。

本開示は、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノムに、前記ゲノムへの選択マーカーの組込みを伴わずにドナーＤＮＡ配列を組み込むための方法及び組成物を含む。方法は、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞へのガイドＲＮＡ／Ｃａｓエンドヌクレアーゼ系（ＲＮＡ誘導型エンドヌクレアーゼ、ＲＧＥＮとも称される）の導入のために、Ｃａｓ９エンドヌクレアーゼ及び任意選択によりガイドＲＮＡをコードする組換えＤＮＡコンストラクトと組み合わせて、長いホモロジーアーム（１０００を超えるヌクレオチド長）によって隣接されるドナーＤＮＡ配列を含む線状組換えＤＮＡコンストラクトを利用し、且つしたがって、前記バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノムにおいて選択マーカーを組み込む必要性を伴わずに、前記バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノムにドナーＤＮＡ配列を組み込むための非常に効率的な系を提供する。

一実施形態では、方法は、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノム上の標的部位に、前記ゲノムへの選択マーカーの組込みを伴わずにドナーＤＮＡ配列を組み込む方法であって、少なくとも線状組換えＤＮＡコンストラクト及び環状組換えＤＮＡコンストラクトをバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞に同時に導入することを含み、前記線状組換えＤＮＡコンストラクトは、ドナーＤＮＡ配列を含み、前記ドナーＤＮＡ配列は、上流のホモロジーアーム（ＨＲ１）及び下流のアーム（ＨＲ２）によって隣接され、各ホモロジーアームは、１０００を超えるヌクレオチド長であり、前記環状組換えＤＮＡコンストラクトは、ガイドＲＮＡをコードするＤＮＡ配列と、Ｃａｓエンドヌクレアーゼをコードするヌクレオチド配列に作動可能に連結された構成的プロモーターとを含み、前記Ｃａｓ９エンドヌクレアーゼは、前記バチルス（Ｂａｃｉｌｌｕｓ）細胞のゲノムにおける標的部位又はその近傍で二本鎖切断を導入する、方法である。

一実施形態では、ドナーＤＮＡ配列は、上流のホモロジーアーム（ＨＲ１）及び下流のホモロジーアーム（ＨＲ２）によって隣接され、各ホモロジーアームは、１０００、１１００、１２００、１３００、１４００、１５００、１６００、１７００、１８００、１９００、２０００、２１００、２２００、２３００、２４００、２５００、２６００、２７００、２８００、２９００、３０００、３１００、３２００、３３００、３４００、３５００、３６００、３７００、３８００、３９００、４０００、５０００を超え、且つ最大で６０００のヌクレオチド長であり、及びバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノム上の前記標的部位に対する配列相同性を含む。

一実施形態では、ドナーＤＮＡ配列は、目的のポリヌクレオチド、目的の遺伝子、転写調節配列、翻訳調節配列、分泌シグナル配列、プロモーター配列、ターミネーター配列、トランスジェニック核酸配列、メッセンジャーＲＮＡの少なくとも一部と相補的なアンチセンス配列、異種配列又はこれらのいずれか１つの組合せからなる群から選択されるヌクレオチド配列を含む。

一態様では、線状組換えＤＮＡは、スタッファー配列をさらに含み得る。

一実施形態では、線状組換えＤＮＡコンストラクトは、一本鎖ＤＮＡコンストラクトである。

一実施形態では、線状組換えＤＮＡコンストラクトは、二本鎖ＤＮＡコンストラクトである。

一態様では、方法は、前記バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞からの子孫細胞を増殖させ、且つバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）子孫細胞であって、そのゲノム中に安定に組み込まれたドナーＤＮＡ配列を有するバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）子孫細胞を選択することをさらに含む。

一実施形態では、方法は、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノム上の標的部位に、前記ゲノムへの選択マーカーの組込みを伴わずにドナーＤＮＡ配列を組み込む方法であって、少なくとも線状組換えＤＮＡコンストラクト及び環状組換えＤＮＡコンストラクトをバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞に同時に導入することを含み、前記線状組換えＤＮＡコンストラクトは、ドナーＤＮＡ配列を含み、前記ドナーＤＮＡ配列は、上流のホモロジーアーム（ＨＲ１）及び下流のアーム（ＨＲ２）によって隣接され、各ホモロジーアームは、１０００を超えるヌクレオチド長であり、前記環状組換えＤＮＡコンストラクトは、ガイドＲＮＡをコードするＤＮＡ配列と、Ｃａｓエンドヌクレアーゼをコードするヌクレオチド配列に作動可能に連結された構成的プロモーターとを含み、前記Ｃａｓ９エンドヌクレアーゼは、前記バチルス（Ｂａｃｉｌｌｕｓ）細胞のゲノムにおける標的部位又はその近傍で二本鎖切断を導入し、及び前記方法は、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞に、１０００ヌクレオチドの上流のホモロジーアーム（ＨＲ１）及び下流のホモロジーアーム（ＨＲ２）によって隣接される前記ドナーＤＮＡ配列を含む線状組換えＤＮＡコンストラクトと、前記環状組換えＤＮＡコンストラクトとを導入することを含む対照方法における目的の遺伝子の前記遺伝子の組込みの頻度と比較して、少なくとも約２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１～最大で２３倍高い、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノムへのドナーＤＮＡ配列の組込みの頻度を有する、方法である。

一実施形態では、方法は、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノム上の標的部位に、前記ゲノムへの選択マーカーの組込みを伴わずにドナーＤＮＡ配列を組み込む方法であって、少なくとも線状組換えＤＮＡコンストラクト及び環状組換えＤＮＡコンストラクトをバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞に同時に導入することを含み、前記線状組換えＤＮＡコンストラクトは、ドナーＤＮＡ配列を含み、前記ドナーＤＮＡ配列は、上流のホモロジーアーム（ＨＲ１）及び下流のアーム（ＨＲ２）によって隣接され、各ホモロジーアームは、１０００を超えるヌクレオチド長であり、前記環状組換えＤＮＡコンストラクトは、ガイドＲＮＡをコードするＤＮＡ配列と、Ｃａｓエンドヌクレアーゼをコードするヌクレオチド配列に作動可能に連結された構成的プロモーターとを含み、前記Ｃａｓ９エンドヌクレアーゼは、前記バチルス（Ｂａｃｉｌｌｕｓ）細胞のゲノムにおける標的部位又はその近傍で二本鎖切断を導入し、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノム上の標的部位は、染色体上のヌクレオチド配列、エピソーム上のヌクレオチド配列、遺伝子導入座位、内在性標的部位及び異種標的部位からなる群から選択される、方法である。

一態様では、本明細書に記載される方法は、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノムに、前記ゲノムへの選択マーカーの組込みを伴わずに目的の遺伝子の複数のコピーを組み込む方法であって、少なくとも線状組換えＤＮＡコンストラクト及び環状組換えＤＮＡコンストラクトをバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞に同時に導入することを含み、前記線状組換えＤＮＡコンストラクトは、上流のホモロジーアーム（ＨＲ１）及び下流のアーム（ＨＲ２）によって隣接されるドナーＤＮＡ配列を含み、前記ドナーＤＮＡは、目的の前記遺伝子の複数のコピーを含み、各ホモロジーアームは、１０００を超えるヌクレオチド長であり、前記環状組換えＤＮＡコンストラクトは、ガイドＲＮＡをコードするＤＮＡ配列と、Ｃａｓエンドヌクレアーゼをコードするヌクレオチド配列に作動可能に連結された構成的プロモーターとを含み、前記Ｃａｓ９エンドヌクレアーゼは、前記バチルス（Ｂａｃｉｌｌｕｓ）細胞のゲノムにおける標的部位又はその近傍で二本鎖切断を導入する、方法である。

バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞へのガイドＲＮＡ／Ｃａｓエンドヌクレアーゼ系の導入のための、本明細書に記載されるドナーＤＮＡを含む線状組換えＤＮＡコンストラクト並びにＣａｓ９エンドヌクレアーゼ及びガイドＲＮＡをコードする環状組換えＤＮＡコンストラクトを使用する、目的の遺伝子（ＧＯＩ）を含むドナーＤＮＡ配列（黒色の箱で示される）の、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）ゲノム上の標的部位（標的）への組込みを示す。この図示において、線状組換えＤＮＡコンストラクトは、１０００を超えるヌクレオチド長の２つのホモロジーアーム（一方は、５’上流のアーム、ＨＲ１であり、及び一方は、３’下流のアーム、ＨＲ２である）によって隣接されるドナーＤＮＡを含む。線状組換えＤＮＡコンストラクトは、ガイドＲＮＡをコードするＤＮＡ配列と、Ｃａｓエンドヌクレアーゼをコードするヌクレオチド配列に作動可能に連結された構成的プロモーターとを含む環状組換えＤＮＡとともにバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞に同時に導入され、前記Ｃａｓ９エンドヌクレアーゼは、前記バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノム中の標的部位又はその近傍で二本鎖切断を導入する。バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞へのガイドＲＮＡ／Ｃａｓエンドヌクレアーゼ系の導入のための、本明細書に記載される線状組換えＤＮＡコンストラクト及び環状組換えＤＮＡコンストラクトを使用する、目的の遺伝子（ＧＯＩ）を含むドナーＤＮＡ配列（黒色の箱で示される）の、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）ゲノムへの組込みを示す。この図示において、線状組換えＤＮＡコンストラクトは、各々が１０００ｂｐを超える長さの２つのホモロジーアームによって隣接されるドナーＤＮＡ配列及びガイドＲＮＡをコードするＤＮＡ配列を含む。線状組換えＤＮＡコンストラクトは、Ｃａｓエンドヌクレアーゼをコードするヌクレオチド配列に作動可能に連結された構成的プロモーターを含む環状組換えＤＮＡと合わせてバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞に同時に導入され、前記Ｃａｓ９エンドヌクレアーゼは、前記バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノム中の標的部位又はその近傍で二本鎖切断を導入する。

本開示は、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノム上の標的部位に、前記ゲノムへの選択マーカーの組込みを伴わずにドナーＤＮＡ配列を組み込むための方法及び組成物を含む。方法は、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞へのガイドＲＮＡ／Ｃａｓエンドヌクレアーゼ系（ＲＧＥＮ）の導入のために、Ｃａｓ９エンドヌクレアーゼ（及びいずれかの組換えコンストラクト上に配置され得るガイドＲＮＡ）をコードする環状組換えＤＮＡコンストラクトと組み合わせて、長いホモロジーアーム（＞１０００ヌクレオチド長）によって隣接されるドナーＤＮＡ配列を含む線状組換えＤＮＡコンストラクトを利用し、且つしたがって、前記バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノムにおいて選択マーカーを組み込む必要性を伴わずに、前記バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノムにドナーＤＮＡ配列を組み込むための非常に効率的な系を提供する。

本明細書は、読み易くするためにいくつかの節で編成されている。しかしながら、読者は、１つの節でなされた記載が他の節に適用され得ることを理解するであろう。このように、本開示の異なる節で使用された見出しを限定的であると解釈すべきではない。

本明細書に示した見出しは、本明細書全体を参照することによって得ることができる本組成物及び方法の様々な態様又は実施形態を限定するものではない。したがって、直下で定義する用語は、本明細書全体を参照することによってより詳細に定義される。

他に定義されていない限り、本明細書で使用される全ての技術用語及び科学用語は、本発明の組成物及び方法が属する技術分野の当業者が一般に理解する意味と同一の意味を有する。本明細書に記載のものに類似の又は均等な任意の方法及び材料も本発明の組成物及び方法を実施又は試験するために使用できるが、以下では、例示的な方法及び材料について記載する。

本明細書に引用されている全ての刊行物及び特許は、個々の刊行物又は特許が、参照により組み込まれ、それらの刊行物が関連して引用される方法及び／又は材料を開示し、記載するように具体的且つ個別に示されているかのように、参照により本明細書に組み込まれる。

本明細書で使用する場合、用語「開示」又は「開示される開示」は、限定することを意味するものではなく、特許請求の範囲で定義されるか又は本明細書に記載される本開示のいずれかに一般的に適用される。これらの用語は、本明細書では互換的に用いられる。

Ｃａｓ遺伝子及びタンパク質
ＣＲＩＳＰＲ（クラスター化して規則的な配置の短い回文配列リピート）遺伝子座は、例えば、外来ＤＮＡを破壊するために細菌及び古細菌細胞によって使用される、ＤＮＡ切断系の成分をコードする特定の遺伝子座を指す（ＨｏｒｖａｔｈａｎｄＢａｒｒａｎｇｏｕ，２０１０，Ｓｃｉｅｎｃｅ３２７：１６７－１７０；２００７年３月１日公開の国際公開第２００７／０２５０９７号パンフレット）。ＣＲＩＳＰＲ遺伝子座は、短い可変ＤＮＡ配列（「スペーサー」と呼ばれる）によって分離された短いダイレクトリピート（ＣＲＩＳＰＲリピート）を含むＣＲＩＳＰＲアレイからなり得、これは、多様なＣａｓ（ＣＲＩＳＰＲ関連）遺伝子によって隣接され得る。所与のＣＲＩＳＰＲ遺伝子座におけるＣＲＩＳＰＲ関連遺伝子の数は、種によって変わり得る。マルチサブユニットエフェクター複合体（Ｉ型、ＩＩＩ型及びＩＶ型サブタイプを含む）を有するクラス１系及び単一タンパク質エフェクター（Ｃａｓ９、Ｃｐｆ１、Ｃ２ｃ１、Ｃ２ｃ２、Ｃ２ｃ３などであるが、これらに限定されないＩＩ型及びＶ型サブタイプを含む）を有するクラス２系を含む複数のＣＲＩＳＰＲ／Ｃａｓ系が記載されている。クラス１系（参照により本明細書に組み込まれるＭａｋａｒｏｖａｅｔａｌ．２０１５，ＮａｔｕｒｅＲｅｖｉｅｗｓ；ＭｉｃｒｏｂｉｏｌｏｇｙＶｏｌ．１３：１－１５；Ｚｅｔｓｃｈｅｅｔａｌ．，２０１５，Ｃｅｌｌ１６３，１－１３；Ｓｈｍａｋｏｖｅｔａｌ．，２０１５，Ｍｏｌｅｃｕｌａｒ＿Ｃｅｌｌ６０，１－１３；Ｈａｆｔｅｔａｌ．，２００５，ＣｏｍｐｕｔａｔｉｏｎａｌＢｉｏｌｏｇｙ，ＰＬｏＳＣｏｍｐｕｔＢｉｏｌ１（６）：ｅ６０．ｄｏｉ：１０．１３７１／ｊｏｕｒｎａｌ．ｐｃｂｉ．００１００６０及び２０１３年１１月２３日に公開された国際公開第２０１３／１７６７７２Ａ１号パンフレット）。細菌由来のＩＩ型ＣＲＩＳＰＲ／Ｃａｓ系は、ＣａｓエンドヌクレアーゼをそのＤＮＡ標的に誘導するために、ｃｒＲＮＡ（ＣＲＩＳＰＲＲＮＡ）及びｔｒａｃｒＲＮＡ（トランス活性化ＣＲＩＳＰＲＲＮＡ）を使用する。ｃｒＲＮＡは、二本鎖ＤＮＡ標的の一方の鎖に相補的なスペーサー領域及びｔｒａｃｒＲＮＡ（トランス活性化ＣＲＩＳＰＲＲＮＡ）と塩基対合し、Ｃａｓエンドヌクレアーゼを導いて、ＤＮＡ配列を切断させるＲＮＡ二本鎖を形成する領域を含有する。スペーサーは、Ｃａｓ１及びＣａｓ２タンパク質を伴う十分に解明されていないプロセスによって得られる。全てのＩＩ型ＣＲＩＳＰＲ／Ｃａｓ遺伝子座は、ｃａｓ９遺伝子に加えて、ｃａｓ１及びｃａｓ２遺伝子を含有する（Ｃｈｙｌｉｎｓｋｉｅｔａｌ．，２０１３，ＲＮＡＢｉｏｌｏｇｙ１０：７２６－７３７；Ｍａｋａｒｏｖａｅｔａｌ．２０１５，ＮａｔｕｒｅＲｅｖｉｅｗｓＭｉｃｒｏｂｉｏｌｏｇｙＶｏｌ．１３：１－１５）。ＩＩ型ＣＲＩＳＰＲ－Ｃａｓ遺伝子座は、それぞれのＣＲＩＳＰＲアレイ内のリピートに部分的に相補的なｔｒａｃｒＲＮＡをコードすることができ、Ｃｓｎ１及びＣｓｎ２などの他のタンパク質を含むことができる。Ｃａｓ１及びｃａｓ２遺伝子の近傍にｃａｓ９が存在することがＩＩ型遺伝子座の特徴である（Ｍａｋａｒｏｖａｅｔａｌ．２０１５，ＮａｔｕｒｅＲｅｖｉｅｗｓＭｉｃｒｏｂｉｏｌｏｇｙＶｏｌ．１３：１－１５）。Ｉ型ＣＲＩＳＰＲ－Ｃａｓ（ＣＲＩＳＰＲ関連）系は、侵入しているウイルスＤＮＡに対して防御するための単一のＣＲＩＳＰＲＲＮＡ（ｃｒＲＮＡ）及びＣａｓ３とともに機能するＣａｓｃａｄｅ（抗ウイルス防御のためのＣＲＩＳＰＲ関連複合体）と呼ばれるタンパク質の複合体からなる（全体として本明細書に組み込まれるＢｒｏｕｎｓ，Ｓ．Ｊ．Ｊ．ｅｔａｌ．Ｓｃｉｅｎｃｅ３２１：９６０－９６４；Ｍａｋａｒｏｖａｅｔａｌ．２０１５，ＮａｔｕｒｅＲｅｖｉｅｗｓ；ＭｉｃｒｏｂｉｏｌｏｇｙＶｏｌ．１３：１－１５）。

本明細書における用語「Ｃａｓ遺伝子」は、一般に、隣接しているＣＲＩＳＰＲ遺伝子座と結合するか、会合するか若しくは近接するか又は近傍にある遺伝子を指す。用語「Ｃａｓ遺伝子」、「ｃａｓ遺伝子」、「ＣＲＩＳＰＲ関連（Ｃａｓ）遺伝子」及び「クラスター化して規則的な配置の短い回文配列リピート関連遺伝子」は、本明細書で互換的に使用される。

用語「Ｃａｓタンパク質」又は「Ｃａｓポリペプチド」は、Ｃａｓ（ＣＲＩＳＰＲ関連）遺伝子によってコードされるポリペプチドを指す。Ｃａｓタンパク質は、Ｃａｓエンドヌクレアーゼを含む。

Ｃａｓタンパク質は、細菌タンパク質又は古細菌タンパク質であり得る。本明細書におけるＩ～ＩＩＩ型ＣＲＩＳＰＲＣａｓタンパク質は、典型的には、起源が原核生物であり；例えば、Ｉ型及びＩＩＩ型Ｃａｓタンパク質は、細菌種又は古細菌種に由来し得るが、ＩＩ型Ｃａｓタンパク質（すなわちＣａｓ９）は、細菌種に由来し得る。他の態様において、Ｃａｓタンパク質は、Ｃａｓ１、Ｃａｓ１Ｂ、Ｃａｓ２、Ｃａｓ３、Ｃａｓ４、Ｃａｓ５、Ｃａｓ６、Ｃａｓ７、Ｃａｓ８、Ｃａｓ９、Ｃａｓ１０、Ｃｓｙ１、Ｃｓｙ２、Ｃｓｙ３、Ｃｓｅ１、Ｃｓｅ２、Ｃｓｃ１、Ｃｓｃ２、Ｃｓａ５、Ｃｓｎ２、Ｃｓｍ２、Ｃｓｍ３、Ｃｓｍ４、Ｃｓｍ５、Ｃｓｍ６、Ｃｍｒ１、Ｃｍｒ３、Ｃｍｒ４、Ｃｍｒ５、Ｃｍｒ６、Ｃｓｂ１、Ｃｓｂ２、Ｃｓｂ３、Ｃｓｘ１７、Ｃｓｘ１４、Ｃｓｘ１０、Ｃｓｘ１６、ＣｓａＸ、Ｃｓｘ３、Ｃｓｘ１、Ｃｓｘ１５、Ｃｓｆ１、Ｃｓｆ２、Ｃｓｆ３、Ｃｓｆ４、それらのホモログ又はそれらの改変型の１つ以上を含む。Ｃａｓタンパク質としては、Ｃａｓ９タンパク質、Ｃｐｆ１タンパク質、Ｃ２ｃ１タンパク質、Ｃ２ｃ２タンパク質、Ｃ２ｃ３タンパク質、Ｃａｓ３、Ｃａｓ３－ＨＤ、Ｃａｓ５、Ｃａｓ７、Ｃａｓ８、Ｃａｓ１０又はこれらの組合せ若しくは複合体が挙げられる。

用語「Ｃａｓエンドヌクレアーゼ」は、好適なポリヌクレオチド成分と複合体を形成するとき、特定のＤＮＡ標的配列の全て又は一部を認識し、それに結合し、且つ任意選択により切れ目を入れるか又は切断をすることができるＣａｓポリペプチド（Ｃａｓタンパク質）を指す。Ｃａｓエンドヌクレアーゼは、ガイドポリヌクレオチドによりガイドされて、二本鎖ＤＮＡ中の特定の標的部位の全て又は一部を（例えば、細胞のゲノム中の標的部位で）認識し、それに結合し、且つ任意選択により切れ目を入れるか又は切断する。本明細書に記載されるＣａｓエンドヌクレアーゼは、１つ以上のヌクレアーゼドメインを含む。本明細書に記載されるドナーＤＮＡ挿入方法で用いられるＣａｓエンドヌクレアーゼは、標的部位でＤＮＡに一本鎖又は二本鎖切断を導入するエンドヌクレアーゼである。代わりに、Ｃａｓエンドヌクレアーゼは、好適なＲＮＡ成分と複合体を形成するとき、ＤＮＡ切断活性又はニッキング活性を欠く可能性があるが、ＤＮＡ標的配列に依然として特異的に結合することができる。

本明細書で使用する場合、「Ｃａｓ９」と称されるポリペプチド（Ｃａｓ５、Ｃｓｎ１又はＣｓｘ１２と以前に称された）、又は「Ｃａｓ９エンドヌクレアーゼ」、又は「Ｃａｓ９エンドヌクレアーゼ活性」を有することは、ＤＮＡ標的配列の全て又は一部に特異的に結合し、且つ任意選択により切れ目を入れるか又は切断するためのｃｒヌクレオチド及びｔｒａｃｒヌクレオチド又はシングルガイドポリヌクレオチドと複合体を形成するＣａｓエンドヌクレアーゼを指す。Ｃａｓ９エンドヌクレアーゼは、ＲｕｖＣヌクレアーゼドメイン及びＨＮＨ（Ｈ－Ｎ－Ｈ）ヌクレアーゼドメインを含み、これらは、それぞれ標的配列において一本鎖ＤＮＡを切断することができる（両方のドメインが協調して作用すると、ＤＮＡ二本鎖が切断されるが、一方のドメインの活性ではニックに至る）。一般に、ＲｕｖＣドメインは、サブドメインＩ、ＩＩ及びＩＩＩを含み、ドメインＩは、Ｃａｓ９のＮ末端近傍に位置し、サブドメインＩＩ及びＩＩＩは、タンパク質の中央に位置し、ＨＮＨドメインに隣接している（Ｍａｋａｒｏｖａｅｔａｌ．２０１５，ＮａｔｕｒｅＲｅｖｉｅｗｓＭｉｃｒｏｂｉｏｌｏｇｙＶｏｌ．１３：１－１５、Ｈｓｕｅｔａｌ，２０１３，Ｃｅｌｌ１５７：１２６２－１２７８）。Ｃａｓ９エンドヌクレアーゼは、通常、少なくとも１つのポリヌクレオチド成分と複合体を形成するＣａｓ９エンドヌクレアーゼを利用するＤＮＡ切断系を含むＩＩ型ＣＲＩＳＰＲ系に由来する。例えば、Ｃａｓ９は、ＣＲＩＳＰＲＲＮＡ（ｃｒＲＮＡ）及びトランス活性化ＣＲＩＳＰＲＲＮＡ（ｔｒａｃｒＲＮＡ）との複合体中に存在し得る。別の例では、Ｃａｓ９は、シングルガイドＲＮＡとの複合体中に存在し得る（Ｍａｋａｒｏｖａｅｔａｌ．２０１５，ＮａｔｕｒｅＲｅｖｉｅｗｓＭｉｃｒｏｂｉｏｌｏｇｙＶｏｌ．１３：１－１５）。

Ｃａｓエンドヌクレアーゼの「機能的断片」、「機能的に均等である断片」及び「機能的に均等な断片」は、本明細書では互換的に使用され、標的部位を認識し、それに結合し、且つ任意選択によりほどき、切れ目を入れるか又は切断する（一本鎖又は二本鎖切断を導入する）能力が保持されているＣａｓエンドヌクレアーゼの一部又は部分配列を指す。

本開示のＣａｓエンドヌクレアーゼの「機能的バリアント」、「機能的に均等であるバリアント」及び「機能的に均等なバリアント」という用語は、本明細書では互換的に使用され、標的配列の全て又は一部を認識し、それに結合し、且つ任意選択によりほどくか、切れ目を入れるか又は切断する能力が保持されている、本開示のＣａｓエンドヌクレアーゼのバリアントを指す。

特定の標的ＤＮＡ配列に向かう本明細書のＣａｓタンパク質の結合活性及び／又はヌクレオチド鎖切断活性の決定は、参照により本明細書に開示される、米国特許第８６９７３５９号明細書に開示されるような、当技術分野において知られる任意の好適なアッセイによって評価され得る。例えば、宿主細胞／生物体中でＣａｓタンパク質及び好適なＲＮＡ成分を発現させ、続いてインデルの存在について予測されるＤＮＡ標的部位を試験することによって決定することができる（この特定のアッセイにおけるＣａｓタンパク質は、ヌクレオチド鎖切断活性［一本鎖又は二本鎖切断活性］を有するであろう）。予測される標的部位でのインデルの存在についての試験は、例えば、ＤＮＡシークエンシング法を介して又は標的配列の機能の消失についてアッセイすることによってインデル形成を推測することによって行われるであろう。別の例において、Ｃａｓタンパク質活性は、標的部位又はその近傍の配列に相同な配列を含むドナーＤＮＡが提供された宿主細胞／生物体において、Ｃａｓタンパク質及び好適なＲＮＡ成分を発現させることによって決定され得る。標的部位でのドナーＤＮＡ配列（例えば、ドナーと標的配列との正常なＨＲによって予測されることになるもの）の存在は、ターゲティングが発生したことを示すであろう。

本明細書におけるＣａｓエンドヌクレアーゼの非限定的な例は、以下の属のいずれかに由来するＣａｓエンドヌクレアーゼであり得る：アエロピルム（Ａｅｒｏｐｙｒｕｍ）、ピロバクルム（Ｐｙｒｏｂａｃｕｌｕｍ）、スルホロブス（Ｓｕｌｆｏｌｏｂｕｓ）、アーキオグロブス（Ａｒｃｈａｅｏｇｌｏｂｕｓ）、ハロアーキュラ（Ｈａｌｏａｒｃｕｌａ）、メタノバクテリウム（Ｍｅｔｈａｎｏｂａｃｔｅｒｉｕｍｎ）、メタノコッカス（Ｍｅｔｈａｎｏｃｏｃｃｕｓ）、メタノサルシナ（Ｍｅｔｈａｎｏｓａｒｃｉｎａ）、メタノパイラス（Ｍｅｔｈａｎｏｐｙｒｕｓ）、ピロコッカス（Ｐｙｒｏｃｏｃｃｕｓ）、ピクロフィラス（Ｐｉｃｒｏｐｈｉｌｕｓ）、テルモプラズマ（Ｔｈｅｒｎｉｏｐｌａｓｎｉａ）、コリネバクテリウム（Ｃｏｒｙｎｅｂａｃｔｅｒｉｕｍ）、マイコバクテリウム（Ｍｙｃｏｂａｃｔｅｒｉｕｍ）、ストレプトマイセス（Ｓｔｒｅｐｔｏｍｙｃｅｓ）、アクウィフェクス（Ａｑｕｉｆｒｘ）、ポルフィロモナス（Ｐｏｒｐｈｖｒｏｍｏｎａｓ）、クロロビウム（Ｃｈｌｏｒｏｂｉｕｍ）、サーマス（Ｔｈｅｒｍｕｓ）、バチルス（Ｂａｃｉｌｌｕｓ）、リステリア（Ｌｉｓｔｅｒｉａ）、スタフィロコッカス（Ｓｔａｐｈｙｌｏｃｏｃｃｕｓ）、クロストリジウム（Ｃｌｏｓｔｒｉｄｉｕｍ）、サーモアナエロバクター（Ｔｈｅｒｍｏａｎａｅｒｏｂａｃｔｅｒ）、マイコプラズマ（Ｍｙｃｏｐｌａｓｍａ）、フソバクテリウム（Ｆｕｓｏｂａｃｔｅｒｉｕｍ）、アゾアルカス（Ａｚａｒｃｕｓ）、クロモバクテリウム（Ｃｈｒｏｍｏｂａｃｔｅｒｉｕｍ）、ナイセリア（Ｎｅｉｓｓｅｒｉａ）、ニトロソモナス（Ｎｉｔｒｏｓｏｍｏｎａｓ）、デスルホビブリオ（Ｄｅｓｕｌｆｏｖｉｂｒｉｏ）、ゲオバクター（Ｇｅｏｂａｃｔｅｒ）、ミロコッカス（Ｍｙｒｏｃｏｃｃｕｓ）、キャンピロバクター（Ｃａｍｐｙｌｏｂａｃｔｅｒ）、ウォリネラ（Ｗｏｌｉｎｅｌｌａ）、アシネトバクター（Ａｃｉｎｅｔｏｂａｃｔｅｒ）、エルウィニア（Ｅｒｗｉｎｉａ）、エシェリキア（Ｅｓｃｈｅｒｉｃｈｉａ）、レジオネラ（Ｌｅｇｉｏｎｅｌｌａ）、メチロコッカス（Ｍｅｔｈｙｌｏｃｏｃｃｕｓ）、パスツレラ（Ｐａｓｔｅｕｒｅｌｌａ）、フォトバクテリウム（Ｐｈｏｔｏｂａｃｔｅｒｉｕｍ）、サルモネラ（Ｓａｌｍｏｎｅｌｌａ）、キサントモナス（Ｘａｎｔｈｏｍｏｎａｓ）、エルシニア（Ｙｅｒｓｉｎｉａ）、ストレプトコッカス（Ｓｔｒｅｐｔｏｃｏｃｃｕｓ）、トレポネーマ（Ｔｒｅｐｏｎｅｍａ）、フランシセラ（Ｆｒａｎｃｉｓｅｌｌａ）又はサーモトガ（Ｔｈｅｒｍｏｔｏｇａ）。さらに、本明細書におけるＣａｓエンドヌクレアーゼは、例えば、参照により本明細書に組み込まれる米国特許出願公開第２０１０／００９３６１７号明細書において開示されるとおりの配列番号４６２～４６５、４６７～４７２、４７４～４７７、４７９～４８７、４８９～４９２、４９４～４９７、４９９～５０３、５０５～５０８、５１０～５１６又は５１７～５２１のいずれかによってコードされ得る。

さらに、本明細書におけるＣａｓ９エンドヌクレアーゼは、例えば、ストレプトコッカス（Ｓｔｒｅｐｔｏｃｏｃｃｕｓ）属（例えば、Ｓ．ピオゲネス（Ｓ．ｐｙｏｇｅｎｅｓ）、Ｓ．ニューモニエ（Ｓ．ｐｎｅｕｍｏｎｉａｅ）、Ｓ．サーモフィルス（Ｓ．ｔｈｅｒｍｏｐｈｉｌｕｓ）、Ｓ．アガラクティエ（Ｓ．ａｇａｌａｃｔｉａｅ）、Ｓ．パラサングイニス（Ｓ．ｐａｒａｓａｎｇｕｉｎｉｓ）、Ｓ．オラリス（Ｓ．ｏｒａｌｉｓ）、Ｓ．サリバリウス（Ｓ．ｓａｌｉｖａｒｉｕｓ）、Ｓ．マカカエ（Ｓ．ｍａｃａｃａｅ）、Ｓ．ディスガラクティエ（Ｓ．ｄｙｓｇａｌａｃｔｉａｅ）、Ｓ．アンギノサス（Ｓ．ａｎｇｉｎｏｓｕｓ）、Ｓ．コンステラトゥス（Ｓ．ｃｏｎｓｔｅｌｌａｔｕｓ）、Ｓ．シュードポルシヌス（Ｓ．ｐｓｅｕｄｏｐｏｒｃｉｎｕｓ）、Ｓ．ミュータンス（Ｓ．ｍｕｔａｎｓ））、リステリア（Ｌｉｓｔｅｒｉａ）属（例えば、Ｌ．イノキュア（Ｌ．ｉｎｎｏｃｕａ））、スピロプラズマ（Ｓｐｉｒｏｐｌａｓｍａ）属（例えば、Ｓ．アピス（Ｓ．ａｐｉｓ）、Ｓ．シルフィディコーラ（Ｓ．ｓｙｒｐｈｉｄｉｃｏｌａ））、ペプトストレプトコッカス科（Ｐｅｐｔｏｓｔｒｅｐｔｏｃｏｃｃａｃｅａｅ）、アトポビウム（Ａｔｏｐｏｂｉｕｍ）属、ポルフィロモナス（Ｐｏｒｐｈｙｒｏｍｏｎａｓ）属（例えば、Ｐ．カトニエ（Ｐ．ｃａｔｏｎｉａｅ））、プレボテーラ（Ｐｒｅｖｏｔｅｌｌａ）属（例えば、Ｐ．インターメディア（Ｐ．ｉｎｔｅｒｍｅｄｉａ））、ベイロネラ（Ｖｅｉｌｌｏｎｅｌｌａ）属、トレポネーマ（Ｔｒｅｐｏｎｅｍａ）属（例えば、Ｔ．ソクランスキィ（Ｔ．ｓｏｃｒａｎｓｋｉｉ）、Ｔ．デンティコラ（Ｔ．ｄｅｎｔｉｃｏｌａ））、カプノシトファガ（Ｃａｐｎｏｃｙｔｏｐｈａｇａ）属、フィネゴルディア（Ｆｉｎｅｇｏｌｄｉａ）属（例えば、Ｆ．マグナ（Ｆ．ｍａｇｎａ））、コリオバクテリア（Ｃｏｒｉｏｂａｃｔｅｒｉａｃｅａｅ）科（例えばＣ．バクテリウム（Ｃ．ｂａｃｔｅｒｉｕｍ））、オルセネラ（Ｏｌｓｅｎｅｌｌａ）属（例えば、Ｏ．プロフューザ（Ｏ．ｐｒｏｆｕｓａ））、ヘモフィルス（Ｈａｅｍｏｐｈｉｌｕｓ）属（例えば、Ｈ．スプトルム（Ｈ．ｓｐｕｔｏｒｕｍ）、Ｈ．ピットマニエ（Ｈ．ｐｉｔｔｍａｎｉａｅ））、パスツレラ（Ｐａｓｔｅｕｒｅｌｌａ）属（例えば、Ｐ．ベッティエ（Ｐ．ｂｅｔｔｙａｅ））、オリビバクター（Ｏｌｉｖｉｂａｃｔｅｒ）属（例えば、Ｏ．シティエンシス（Ｏ．ｓｉｔｉｅｎｓｉｓ））、エピリソニモナス（Ｅｐｉｌｉｔｈｏｎｉｍｏｎａｓ）属（例えばＥ．テナックス（Ｅ．ｔｅｎａｘ））、メソニア（Ｍｅｓｏｎｉａ）属（例えば、Ｍ．モビリス（Ｍ．ｍｏｂｉｌｉｓ））、ラクトバシラス（Ｌａｃｔｏｂａｃｉｌｌｕｓ）属（例えば、Ｌ．プランタルム（Ｌ．ｐｌａｎｔａｒｕｍ））、バチルス（Ｂａｃｉｌｌｕｓ）属（例えばＢ．セレウス（Ｂ．ｃｅｒｅｕｓ））、アクイマリーナ（Ａｑｕｉｍａｒｉｎａ）属（例えば、Ａ．ムエレリ（Ａ．ｍｕｅｌｌｅｒｉ））、クリセオバクテリウム（Ｃｈｒｙｓｅｏｂａｃｔｅｒｉｕｍ）属（例えば、Ｃ．パルストレ（Ｃ．ｐａｌｕｓｔｒｅ））、バクテロイデス（Ｂａｃｔｅｒｏｉｄｅｓ）属（例えば、Ｂ．グラミニソルベンス（Ｂ．ｇｒａｍｉｎｉｓｏｌｖｅｎｓ））、ナイセリア（Ｎｅｉｓｓｅｒｉａ）属（例えば、Ｎ．メニンギティディス（Ｎ．ｍｅｎｉｎｇｉｔｉｄｉｓ））、フランシセラ（Ｆｒａｎｃｉｓｅｌｌａ）属（例えば、Ｆ．ノビシダ（Ｆ．ｎｏｖｉｃｉｄａ））又はフラボバクテリウム（Ｆｌａｖｏｂａｃｔｅｒｉｕｍ）属（例えば、Ｆ．フリギダリウム（Ｆ．ｆｒｉｇｉｄａｒｉｕｍ）、Ｆ．ソリ（Ｆ．ｓｏｌｉ））種に由来し得る。一態様では、Ｓ．ピオゲネス（Ｓ．ｐｙｏｇｅｎｅｓ）のＣａｓ９エンドヌクレアーゼが本明細書に記載される。別の例として、Ｃａｓ９エンドヌクレアーゼは、参照により本明細書に組み込まれるＣｈｙｌｉｎｓｋｉｅｔａｌ．（ＲＮＡＢｉｏｌｏｇｙ１０：７２６－７３７）において開示されるＣａｓ９タンパク質のいずれかであり得る。

したがって、本明細書におけるＣａｓ９エンドヌクレアーゼの配列は、例えば、参照により組み込まれるＧｅｎＢａｎｋアクセッション番号Ｇ３ＥＣＲ１（Ｓ．サーモフィルス（Ｓ．ｔｈｅｒｍｏｐｈｉｌｕｓ））、ＷＰ＿０２６７０９４２２、ＷＰ＿０２７２０２６５５、ＷＰ＿０２７３１８１７９、ＷＰ＿０２７３４７５０４、ＷＰ＿０２７３７６８１５、ＷＰ＿０２７４１４３０２、ＷＰ＿０２７８２１５８８、ＷＰ＿０２７８８６３１４、ＷＰ＿０２７９６３５８３、ＷＰ＿０２８１２３８４８、ＷＰ＿０２８２９８９３５、Ｑ０３ＪＩ６（Ｓ．サーモフィルス（Ｓ．ｔｈｅｒｍｏｐｈｉｌｕｓ））、ＥＧＰ６６７２３、ＥＧＳ３８９６９、ＥＧＶ０５０９２、ＥＨＩ６５５７８（Ｓ．シュードポルシヌス（Ｓ．ｐｓｅｕｄｏｐｏｒｃｉｎｕｓ））、ＥＩＣ７５６１４（Ｓ．オラリス（Ｓ．ｏｒａｌｉｓ））、ＥＩＤ２２０２７（Ｓ．コンステラツス（Ｓ．ｃｏｎｓｔｅｌｌａｔｕｓ））、ＥＩＪ６９７１１、ＥＪＰ２２３３１（Ｓ．オラリス（Ｓ．ｏｒａｌｉｓ））、ＥＪＰ２６００４（Ｓ．アンギノサス（Ｓ．ａｎｇｉｎｏｓｕｓ））、ＥＪＰ３０３２１、ＥＰＺ４４００１（Ｓ．ピオゲネス（Ｓ．ｐｙｏｇｅｎｅｓ））、ＥＰＺ４６０２８（Ｓ．ピオゲネス（Ｓ．ｐｙｏｇｅｎｅｓ））、ＥＱＬ７８０４３（Ｓ．ピオゲネス（Ｓ．ｐｙｏｇｅｎｅｓ））、ＥＱＬ７８５４８（Ｓ．ピオゲネス（Ｓ．ｐｙｏｇｅｎｅｓ））、ＥＲＬ１０５１１、ＥＲＬ１２３４５、ＥＲＬ１９０８８（Ｓ．ピオゲネス（Ｓ．ｐｙｏｇｅｎｅｓ））、ＥＳＡ５７８０７（Ｓ．ピオゲネス（Ｓ．ｐｙｏｇｅｎｅｓ））、ＥＳＡ５９２５４（Ｓ．ピオゲネス（Ｓ．ｐｙｏｇｅｎｅｓ））、ＥＳＵ８５３０３（Ｓ．ピオゲネス（Ｓ．ｐｙｏｇｅｎｅｓ））、ＥＴＳ９６８０４、ＵＣ７５５２２、ＥＧＲ８７３１６（Ｓ．ディスガラクトシエ（Ｓ．ｄｙｓｇａｌａｃｔｉａｅ））、ＥＧＳ３３７３２、ＥＧＶ０１４６８（Ｓ．オラリス（Ｓ．ｏｒａｌｉｓ））、ＥＨＪ５２０６３（Ｓ．マカカエ（Ｓ．ｍａｃａｃａｅ））、ＥＩＤ２６２０７（Ｓ．オラリス（Ｓ．ｏｒａｌｉｓ））、ＥＩＤ３３３６４、ＥＩＧ２７０１３（Ｓ．パラサングイニス（Ｓ．ｐａｒａｓａｎｇｕｉｎｉｓ））、ＥＪＦ３７４７６、ＥＪＯ１９１６６（ストレプトコッカス属（Ｓｔｒｅｐｔｏｃｏｃｃｕｓｓｐ．）ＢＳ３５ｂ）、ＥＪＵ１６０４９、ＥＪＵ３２４８１、ＹＰ＿００６２９８２４９、ＥＲＦ６１３０４、ＥＲＫ０４５４６、ＥＴＪ９５５６８（Ｓ．アガラクティエ（Ｓ．ａｇａｌａｃｔｉａｅ））、ＴＳ８９８７５、ＥＴＳ９０９６７（ストレプトコッカス属（Ｓｔｒｅｐｔｏｃｏｃｃｕｓｓｐ．）ＳＲ４）、ＥＴＳ９２４３９、ＥＵＢ２７８４４（ストレプトコッカス属（Ｓｔｒｅｐｔｏｃｏｃｃｕｓｓｐ．）ＢＳ２１）、ＡＦＪ０８６１６、ＥＵＣ８２７３５（ストレプトコッカス属（Ｓｔｒｅｐｔｏｃｏｃｃｕｓｓｐ．）ＣＭ６）、ＥＷＣ９２０８８、ＥＷＣ９４３９０、ＥＪＰ２５６９１、ＹＰ＿００８０２７０３８、ＹＰ＿００８８６８５７３、ＡＧＭ２６５２７、ＡＨＫ２２３９１、ＡＨＢ３６２７３、Ｑ９２７Ｐ４、Ｇ３ＥＣＲ１又はＱ９９ＺＷ２（Ｓ．ピオゲネス（Ｓ．ｐｙｏｇｅｎｅｓ））に開示されるＣａｓ９アミノ酸配列のいずれかを含むことができる。代わりに、本明細書におけるＣａｓ９タンパク質は、例えば、米国特許出願公開第２０１０／００９３６１７号明細書（参照により本明細書に組み込まれる）に開示されるとおりの配列番号４６２（Ｓ．サーモフィルス（Ｓ．ｔｈｅｒｍｏｐｈｉｌｕｓ））、４７４（Ｓ．サーモフィルス（Ｓ．ｔｈｅｒｍｏｐｈｉｌｕｓ））、４８９（Ｓ．アガラクティエ（Ｓ．ａｇａｌａｃｔｉａｅ））、４９４（Ｓ．アガラクティエ（Ｓ．ａｇａｌａｃｔｉａｅ））、４９９（Ｓ．ミュータンス（Ｓ．ｍｕｔａｎｓ））、５０５（Ｓ．ピオゲネス（Ｓ．ｐｙｏｇｅｎｅｓ））又は５１８（Ｓ．ピオゲネス（Ｓ．ｐｙｏｇｅｎｅｓ））のいずれかによってコードされ得る。

あるアミノ酸が、互いに類似した構造的特徴及び／又は電荷の特徴を共有する（すなわち保存されている）ならば、Ｃａｓ９中の各位置のアミノ酸は、開示される配列に与えられるそのものであるか、又は以下のとおりに保存アミノ酸残基で置換され得る（「保存的アミノ酸置換」）：
１．以下の小さい脂肪族の非極性又は弱極性の残基は、相互に置換することができる：Ａｌａ（Ａ）、Ｓｅｒ（Ｓ）、Ｔｈｒ（Ｔ）、Ｐｒｏ（Ｐ）、Ｇｌｙ（Ｇ）；
２．以下の極性の負電荷を有する残基及びそれらのアミドは、相互に置換することができる：Ａｓｐ（Ｄ）、Ａｓｎ（Ｎ）、Ｇｌｕ（Ｅ）、Ｇｌｎ（Ｑ）；
３．以下の極性の正電荷を有する残基は、相互に置換することができる：Ｈｉｓ（Ｈ）、Ａｒｇ（Ｒ）、Ｌｙｓ（Ｋ）；
４．以下の脂肪族の非極性残基は、相互に置換することができる：Ａｌａ（Ａ）、Ｌｅｕ（Ｌ）、Ｉｌｅ（Ｉ）、Ｖａｌ（Ｖ）、Ｃｙｓ（Ｃ）、Ｍｅｔ（Ｍ）；及び
５．以下の大きい芳香族残基は、相互に置換することができる：Ｐｈｅ（Ｆ）、Ｔｙｒ（Ｙ）、Ｔｒｐ（Ｗ）。

断片及びバリアントは、部位特異的変異誘発法及び合成的構築などの方法により得ることができる。エンドヌクレアーゼ活性を測定するための方法は、当技術分野でよく知られており、参照により本明細書に組み込まれる２０１３年５月１日に出願されたＰＣＴ／米国特許出願公開第１３／３９０１１号明細書、２０１６年５月１２日に出願されたＰＣＴ／米国特許出願公開第１６／３２０７３号明細書、２０１６年５月１２日に出願されたＰＣＴ／米国特許出願公開第１６／３２０２８号明細書などであるが、これらに限定されない。

Ｃａｓエンドヌクレアーゼは、Ｃａｓポリペプチドの改変形態を含むことができる。Ｃａｓポリペプチドの改変形態としては、Ｃａｓタンパク質の自然に存在するヌクレアーゼ活性を低下させるアミノ酸変化（例えば、欠失、挿入又は置換）を挙げることができる。例えば、いくつかの例では、Ｃａｓタンパク質の改変形態は、対応する野生型Ｃａｓポリペプチドの５０％未満、４０％未満、３０％未満、２０％未満、１０％未満、５％未満又は１％未満のヌクレアーゼ活性を有する（２０１４年３月６日に公開された米国特許出願公開第２０１４００６８７９７Ａ１号明細書）。いくつかの例では、Ｃａｓポリペプチドの改変形態は、ヌクレアーゼ活性を実質的に有さず、触媒的に「不活化されたＣａｓ」又は「失活したＣａｓ（ｄＣａｓ）」と呼ばれる。不活化されたＣａｓ／失活したＣａｓは、失活したＣａｓエンドヌクレアーゼ（ｄＣａｓ）を含む。触媒的に不活性なＣａｓは、異種配列に融合され得る。他のＣａｓ９バリアントは、ＨＮＨ又はＲｕｖＣヌクレアーゼドメインのいずれかの活性を欠き、したがってＤＮＡの１本の鎖のみを切断する能力がある（ニッカーゼバリアント）。

本明細書に記載されるＣａｓエンドヌクレアーゼを発現する組換えＤＮＡコンストラクトは、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞に一過的に組み込まれ得るか、又はバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノムに安定に組み込まれ得る。

Ｃａｓタンパク質融合物
Ｃａｓエンドヌクレアーゼは、１つ以上の異種タンパク質ドメイン（例えば、Ｃａｓポリペプチドに加えて、１つ、２つ、３つ又はそれを超えるドメイン）を含む融合タンパク質の一部であり得る。そのような融合タンパク質は、任意のさらなるタンパク質配列及び任意選択により任意の２つのドメイン間、例えばＣａｓポリペプチドと第１の異種ドメインとの間にリンカー配列を含み得る。Ｃａｓポリペプチドに融合され得るタンパク質ドメインの例としては、エピトープタグ（例えば、ヒスチジン［Ｈｉｓ］、Ｖ５、ＦＬＡＧ、インフルエンザ赤血球凝集素［ＨＡ］、ｍｙｃ、ＶＳＶ－Ｇ、チオレドキシン［Ｔｒｘ］）、レポーター（例えば、グルタチオン－５－トランスフェラーゼ［ＧＳＴ］、西洋ワサビペルオキシダーゼ［ＨＲＰ］、クロラムフェニコールアセチルトランスフェラーゼ［ＣＡＴ］、ベータ－ガラクトシダーゼ、ベータ－グルクロニダーゼ［ＧＵＳ］、ルシフェラーゼ、緑色蛍光タンパク質［ＧＦＰ］、ＨｃＲｅｄ、ＤｓＲｅｄ、シアン蛍光タンパク質［ＣＦＰ］、黄色蛍光タンパク質［ＹＦＰ］、青色蛍光タンパク質［ＢＦＰ］）及び以下の活性の１つ以上を有するドメインが挙げられるが、これらに限定されない：メチル化酵素活性、脱メチル化酵素活性、転写活性化活性（例えば、ＶＰ１６又はＶＰ６４）、転写抑制活性、転写放出因子活性、ヒストン修飾活性、ＲＮＡ切断活性及び核酸結合活性。Ｃａｓエンドヌクレアーゼは、ＤＮＡ分子又は他の分子、例えばマルトース結合タンパク質（ＭＢＰ）、Ｓ－タグ、ＬｅｘＡＤＮＡ結合ドメイン（ＤＢＤ）、ＧＡＬ４ＡＤＮＡ結合ドメイン及び単純ヘルペスウィルス（ＨＳＶ）ＶＰ１６と結合するタンパク質との融合物中にも存在し得る。

Ｃａｓエンドヌクレアーゼは、核移行配列（ＮＬＳ）などの異種調節エレメントを含み得る。異種ＮＬＳアミノ酸配列は、本明細書における細胞の核内で検出可能な量のＣａｓエンドヌクレアーゼの蓄積を駆動するのに十分な強度のものであり得る。ＮＬＳは、塩基性の、正の荷電を有する残基（例えば、リジン及び／又はアルギニン）の１つ（例えば、単節型）又は複数（例えば、双節型）の短い配列（例えば、２～２０残基）を含み得、タンパク質表面上に曝されるのであれば、Ｃａｓアミノ酸配列中のいずれの箇所にも配置され得る。ＮＬＳは、例えば、本明細書におけるＣａｓタンパク質のＮ末端又はＣ末端に作動可能に連結され得る。例えば、２つ以上のＮＬＳ配列がＣａｓタンパク質、例えばＣａｓタンパク質のＮ末端及びＣ末端に連結され得る。Ｃａｓ遺伝子は、Ｃａｓコドン領域の上流のＳＶ４０核標的シグナル及びＣａｓコドン領域の下流の双節型ＶｉｒＤ２核移行シグナル（Ｔｉｎｌａｎｄｅｔａｌ．（１９９２）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ８９：７４４２－６）に作動可能に連結され得る。本明細書における好適なＮＬＳ配列の非限定的な例としては、米国特許第６６６０８３０号明細書及び同第７３０９５７６号明細書に開示されるものが挙げられる（これらの文献は、いずれも参照により本明細書に組み込まれる）。異種ＮＬＳアミノ酸配列は、植物、ウイルス及び哺乳動物核移行シグナルを含む。

触媒的活性及び／又は不活性Ｃａｓエンドヌクレアーゼは、異種配列に融合することができる（２０１４年３月６日に公開された米国特許出願公開第２０１４００６８７９７Ａ１号明細書）。好適な融合パートナーとしては、限定はされないが、標的ＤＮＡ又は標的ＤＮＡに関連するポリペプチド（例えば、ヒストン又は他のＤＮＡ結合性タンパク質）に直接的に作用することにより、転写を間接的に増加させる活性をもたらすポリペプチドが挙げられる。さらなる好適な融合パートナーとしては、限定はされないが、メチルトランスフェラーゼ活性、デメチラーゼ活性、アセチルトランスフェラーゼ活性、デアセチラーゼ活性、キナーゼ活性、ホフファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、ＳＵＭＯ化活性、脱ＳＵＭＯ化活性、リボシル化活性、脱リボシル化活性、ミリストイル化活性又は脱ミリストイル化活性をもたらすポリペプチドが挙げられる。さらなる好適な融合パートナーとしては、限定はされないが、標的核酸の転写増加を直接的にもたらすポリペプチド（例えば、転写活性化因子又はその断片、転写活性化因子、小分子／薬剤反応性転写調節因子などをリクルートするタンパク質又はその断片）が挙げられる。触媒的に不活性なＣａｓ９エンドヌクレアーゼは、二本鎖切断を生成するＦｏｋＩヌクレアーゼに融合することもできる（Ｇｕｉｌｉｎｇｅｒｅｔａｌ．Ｎａｔｕｒｅｂｉｏｔｅｃｈｎｏｌｏｇｙ，ｖｏｌｕｍｅ３２，ｎｕｍｂｅｒ６，Ｊｕｎｅ２０１４）。

ガイドポリヌクレオチド、ガイドＲＮＡ
本明細書で使用する場合、用語「ガイドポリヌクレオチド」は、Ｃａｓエンドヌクレアーゼと複合体を形成することができ、ＣａｓエンドヌクレアーゼがＤＮＡ標的部位を認識し、それに結合し、且つ任意選択により切れ目を入れるか又は切断することを可能にするポリヌクレオチド配列に関する。ガイドポリヌクレオチドは、一本鎖分子又は二本鎖分子であり得る。ガイドポリヌクレオチド配列は、ＲＮＡ配列、ＤＮＡ配列又はこれらの組合せ（ＲＮＡ－ＤＮＡ組合せ配列）であり得る。任意選択により、ガイドポリヌクレオチドは、ロックド核酸（ＬＮＡ）、５－メチルｄＣ、２，６－ジアミノプリン、２’－フルオロＡ、２’－フルオロＵ、２’－Ｏ－メチルＲＮＡ、ホスホロチオエート結合、コレステロール分子との結合、ポリエチレングリコール分子との結合、スペーサー１８（ヘキサエチレングリコール鎖）分子との結合又は環化をもたらす５’から３’への共有結合などであるが、これらに限定されない少なくとも１つのヌクレオチド、ホスホジエステル結合又は結合修飾を含み得る。リボ核酸のみを含むガイドポリヌクレオチドは、「ガイドＲＮＡ」又は「ｇＲＮＡ」とも呼ばれる。

ガイドポリヌクレオチドは、ｃｒヌクレオチド配列及びｔｒａｃｒヌクレオチド配列を含む二本鎖分子（二本鎖ガイドポリヌクレオチドとも呼ばれる）であり得る。ｃｒヌクレオチドは、標的ＤＮＡ中のヌクレオチド配列にハイブリダイズすることができる第１のヌクレオチド配列ドメイン（可変ターゲティングドメイン又はＶＴドメインと呼ばれる）及びＣａｓエンドヌクレアーゼ認識（ＣＥＲ）ドメインの一部である第２のヌクレオチド配列（ｔｒａｃｒメイト配列とも呼ばれる）を含む。ｔｒａｃｒメイト配列は、相補性領域に沿ってｔｒａｃｒヌクレオチド配列にハイブリダイズすることができ、Ｃａｓエンドヌクレアーゼ認識ドメイン又はＣＥＲドメインを一緒に形成することができる。ＣＥＲドメインは、Ｃａｓエンドヌクレアーゼポリペプチドと相互作用することができる。二本鎖ガイドポリヌクレオチドのｃｒヌクレオチド及びｔｒａｃｒヌクレオチドは、ＲＮＡ、ＤＮＡ及び／又はＲＮＡ－ＤＮＡ組合せ配列であり得る。（両方とも参照により本明細書に組み込まれる２０１５年３月１９日に公開された米国特許出願公開第２０１５００８２４７８号明細書及び２０１５年２月２６日に公開された米国特許出願公開第２０１５００５９０１０号明細書）。いくつかの実施形態では、二本鎖ガイドポリヌクレオチドのｃｒヌクレオチド分子は、（連続的な一続きのＤＮＡヌクレオチドで構成される場合）「ｃｒＤＮＡ」と称されるか、（連続的な一続きのＲＮＡヌクレオチドで構成される場合）「ｃｒＲＮＡ」と称されるか、又は（ＤＮＡヌクレオチドとＲＮＡヌクレオチドとの組合せで構成される場合）「ｃｒＤＮＡ－ＲＮＡ」と称される。ｃｒヌクレオチドは、細菌及び古細菌中に天然に存在するｃｒＲＮＡの断片を含むことができる。本明細書で開示されるｃｒヌクレオチド中に存在し得る細菌及び古細菌中に天然に存在するｃｒＲＮＡの断片のサイズは、限定されないが、２個、３個、４個、５個、６個、７個、８個、９個、１０個、１１個、１２個、１３個、１４個、１５個、１６個、１７個、１８個、１９個、２０個又はより多くのヌクレオチドの範囲であり得る。いくつかの実施形態では、ｔｒａｃｒヌクレオチドは、（連続的な一続きのＲＮＡヌクレオチドで構成される場合）「ｔｒａｃｒＲＮＡ」と称されるか、（連続的な一続きのＤＮＡヌクレオチドで構成される場合）「ｔｒａｃｒＤＮＡ」と称されるか、又は（ＤＮＡヌクレオチドとＲＮＡヌクレオチドとの組合せで構成される場合）「ｔｒａｃｒＤＮＡ－ＲＮＡ」と称される。特定の実施形態では、ＲＮＡ／Ｃａｓ９エンドヌクレアーゼ複合体を誘導するＲＮＡは、二本鎖ｃｒＲＮＡ－ｔｒａｃｒＲＮＡを含む二本鎖ＲＮＡである。

ガイドポリヌクレオチドは、少なくとも１つのｔｒａｃｒＲＮＡに（非共有結合的に）連結された天然に存在しないキメラｃｒＲＮＡを含む二重ＲＮＡ分子を含む。天然に存在しないキメラｃｒＲＮＡは、天然には一緒に見出されない領域を含むｃｒＲＮＡを含む（すなわち、それらは、互いに異種である）。例えば、天然に存在しないｃｒＲＮＡは、天然に存在するスペーサー配列が異種の可変ターゲティングドメインについて交換されるｃｒＲＮＡである。天然に存在しないｃｒＲＮＡは、第２のヌクレオチド配列（ｔｒａｃｒメイト配列とも呼ばれる）に連結された、標的ＤＮＡ中のヌクレオチド配列にハイブリダイズすることができる第１のヌクレオチド配列ドメイン（可変ターゲティングドメイン又はＶＴドメインと呼ばれる）を含み、その結果、第１の配列と第２の配列とは、天然には一緒に連結されて見出されない。

ガイドポリヌクレオチドは、ｔｒａｃｒヌクレオチド配列に連結したｃｒヌクレオチド配列を含む単一分子（シングルガイドポリヌクレオチドとも呼ばれる）でもあり得る。シングルガイドポリヌクレオチドは、標的ＤＮＡ中のヌクレオチド配列にハイブリダイズすることができる第１のヌクレオチド配列ドメイン（可変ターゲティングドメイン又はＶＴドメインと呼ばれる）及びＣａｓエンドヌクレアーゼポリペプチドと相互作用するＣａｓエンドヌクレアーゼ認識ドメイン（ＣＥＲドメイン）を含む。「ドメイン」は、ＲＮＡ、ＤＮＡ及び／又はＲＮＡ－ＤＮＡ組合せ配列であり得る連続的な一続きのヌクレオチドを意味する。シングルガイドポリヌクレオチドのＶＴドメイン及び／又はＣＥＲドメインは、ＲＮＡ配列、ＤＮＡ配列又はＲＮＡ－ＤＮＡ組合せ配列を含み得る。ｃｒヌクレオチド及びｔｒａｃｒヌクレオチド由来の配列で構成されているシングルガイドポリヌクレオチドは、（連続的な一続きのＲＮＡヌクレオチドで構成される場合）「シングルガイドＲＮＡ」又は（連続的な一続きのＤＮＡヌクレオチドで構成される場合）「シングルガイドＤＮＡ」又は（ＲＮＡ及びＤＮＡヌクレオチドの組合せで構成される場合）「シングルガイドＲＮＡ－ＤＮＡ」と称され得る。シングルガイドポリヌクレオチドは、Ｃａｓエンドヌクレアーゼと複合体を形成することができ、前記ガイドポリヌクレオチド／Ｃａｓエンドヌクレアーゼ複合体（ガイドポリヌクレオチド／Ｃａｓエンドヌクレアーゼ系とも呼ばれる）は、Ｃａｓエンドヌクレアーゼをゲノム標的部位に導くことができ、Ｃａｓエンドヌクレアーゼがその標的部位を認識し、標的部位に結合し、且つ任意選択により標的部位に切れ目を入れるか又は切断する（一本鎖又は二本鎖切断を導入する）ことを可能にする。

用語「可変ターゲティングドメイン」又は「ＶＴドメイン」は、本明細書では互換的に使用され、二本鎖ＤＮＡ標的部位の１本の鎖（ヌクレオチド配列）にハイブリダイズできる（相補的である）ヌクレオチド配列を含む。第１のヌクレオチド配列ドメイン（ＶＴドメイン）と標的配列との間の％相補性は、少なくとも５０％、５１％、５２％、５３％、５４％、５５％、５６％、５７％、５８％、５９％、６０％、６１％、６２％、６３％、６３％、６５％、６６％、６７％、６８％、６９％、７０％、７１％、７２％、７３％、７４％、７５％、７６％、７７％、７８％、７９％、８０％、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％であり得る。可変ターゲティングドメインの長さは、少なくとも１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９又は３０ヌクレオチドであり得る。

可変ターゲティングドメインは、連続的な一続きの１２～３０、１２～２９、１２～２８、１２～２７、１２～２６、１２～２５、１２～２６、１２～２５、１２～２４、１２～２３、１２～２２、１２～２１、１２～２０、１２～１９、１２～１８、１２～１７、１２～１６、１２～１５、１２～１４、１２～１３、１３～３０、１３～２９、１３～２８、１３～２７、１３～２６、１３～２５、１３～２６、１３～２５、１３～２４、１３～２３、１３～２２、１３～２１、１３～２０、１３～１９、１３～１８、１３～１７、１３～１６、１３～１５、１３～１４、１４～３０、１４～２９、１４～２８、１４～２７、１４～２６、１４～２５、１４～２６、１４～２５、１４～２４、１４～２３、１４～２２、１４～２１、１４～２０、１４～１９、１４～１８、１４～１７、１４～１６、１４～１５、１５～３０、１５～２９、１５～２８、１５～２７、１５～２６、１５～２５、１５～２６、１５～２５、１５～２４、１５～２３、１５～２２、１５～２１、１５～２０、１５～１９、１５～１８、１５～１７、１５～１６、１６～３０、１６～２９、１６～２８、１６～２７、１６～２６、１６～２５、１６～２４、１６～２３、１６～２２、１６～２１、１６～２０、１６～１９、１６～１８、１６～１７、１７～３０、１７～２９、１７～２８、１７～２７、１７～２６、１７～２５、１７～２４、１７～２３、１７～２２、１７～２１、１７～２０、１７～１９、１７～１８、１８～３０、１８～２９、１８～２８、１８～２７、１８～２６、１８～２５、１８～２４、１８～２３、１８～２２、１８～２１、１８～２０、１８～１９、１９～３０、１９～２９、１９～２８、１９～２７、１９～２６、１９～２５、１９～２４、１９～２３、１９～２２、１９～２１、１９～２０、２０～３０、２０～２９、２０～２８、２０～２７、２０～２６、２０～２５、２０～２４、２０～２３、２０～２２、２０～２１、２１～３０、２１～２９、２１～２８、２１～２７、２１～２６、２１～２５、２１～２４、２１～２３、２１～２２、２２～３０、２２～２９、２２～２８、２２～２７、２２～２６、２２～２５、２２～２４、２２～２３、２３～３０、２３～２９、２３～２８、２３～２７、２３～２６、２３～２５、２３～２４、２４～３０、２４～２９、２４～２８、２４～２７、２４～２６、２４～２５、２５～３０、２５～２９、２５～２８、２５～２７、２５～２６、２６～３０、２６～２９、２６～２８、２６～２７、２７～３０、２７～２９、２７～２８、２８～３０、２８～２９又は２９～３０個のヌクレオチドを含み得る。

可変ターゲティングドメインは、ＤＮＡ配列、ＲＮＡ配列、改変ＤＮＡ配列、改変ＲＮＡ配列又はこれらの任意の組合せで構成され得る。ＶＴドメインは、原核生物又は真核生物ＤＮＡに由来する標的配列に相補的であり得る。

用語（ガイドポリヌクレオチドの）「Ｃａｓエンドヌクレアーゼ認識ドメイン」又は「ＣＥＲドメイン」は、本明細書では互換的に使用され、Ｃａｓエンドヌクレアーゼポリペプチドと相互作用するヌクレオチド配列を含む。ＣＥＲドメインは、ｔｒａｃｒヌクレオチドメイト配列を含み、その後にｔｒａｃｒヌクレオチド配列が続く。ＣＥＲドメインは、ＤＮＡ配列、ＲＮＡ配列、改変ＤＮＡ配列、改変ＲＮＡ配列（例えば、２０１５年２月２６日に公開された米国特許出願公開第２０１５－００５９０１０Ａ１号明細書（全体として参照により本明細書に組み込まれる）を参照されたい）又はこれらの任意の組合せで構成され得る。

シングルガイドポリヌクレオチドのｃｒヌクレオチドとｔｒａｃｒヌクレオチドとを連結するヌクレオチド配列は、ＲＮＡ配列、ＤＮＡ配列又はＲＮＡ－ＤＮＡ組合せ配列を含むことができる。一実施形態では、シングルガイドポリヌクレオチドのｃｒヌクレオチドとｔｒａｃｒヌクレオチドとを連結するヌクレオチド配列（「ループ」とも呼ばれる）は、少なくとも３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、５１、５２、５３、５４、５５、５６、５７、５８、５９、６０、６１、６２、６３、６４、６５、６６、６７、６８、６９、７０、７１、７２、７３、７４、７５、７６、７７、７８、７８、７９、８０、８１、８２、８３、８４、８５、８６、８７、８８、８９、９０、９１、９２、９３、９４、９５、９６、９７、９８、９９又は１００個のヌクレオチド長であり得る。ループは、３～４、３～５、３～６、３～７、３～８、３～９、３～１０、３～１１、３～１２、３～１３、３～１４、３～１５、３～２０、３～３０、３～４０、３～５０、３～６０、３～７０、３～８０、３～９０、３～１００、４～５、４～６、４～７、４～８、４～９、４～１０、４～１１、４～１２、４～１３、４～１４、４～１５、４～２０、４～３０、４～４０、４～５０、４～６０、４～７０、４～８０、４～９０、４～１００、５～６、５～７、５～８、５～９、５～１０、５～１１、５～１２、５～１３、５～１４、５～１５、５～２０、５～３０、５～４０、５～５０、５～６０、５～７０、５～８０、５～９０、５～１００、６～７、６～８、６～９、６～１０、６～１１、６～１２、６～１３、６～１４、６～１５、６～２０、６～３０、６～４０、６～５０、６～６０、６～７０、６～８０、６～９０、６～１００、７～８、７～９、７～１０、７～１１、７～１２、７～１３、７～１４、７～１５、７～２０、７～３０、７～４０、７～５０、７～６０、７～７０、７～８０、７～９０、７～１００、８～９、８～１０、８～１１、８～１２、８～１３、８～１４、８～１５、８～２０、８～３０、８～４０、８～５０、８～６０、８～７０、８～８０、８～９０、８～１００、９～１０、９～１１、９～１２、９～１３、９～１４、９～１５、９～２０、９～３０、９～４０、９～５０、９～６０、９～７０、９～８０、９～９０、９～１００、１０～２０、２０～３０、３０～４０、４０～５０、５０～６０、７０～８０、８０～９０又は９０～１００ヌクレオチド長であり得る。

別の態様では、シングルガイドポリヌクレオチドのｃｒヌクレオチドとｔｒａｃｒヌクレオチドとを連結するヌクレオチド配列は、限定はされないが、ＧＡＡＡテトラループ配列などのテトラループ配列を含み得る。

シングルガイドポリヌクレオチドは、天然に存在しないキメラシングルガイドＲＮＡを含む。用語「シングルガイドＲＮＡ」及び「ｓｇＲＮＡ」は、本明細書では互換的に使用され、ｔｒａｃｒＲＮＡ（トランス活性化ＣＲＩＳＰＲＲＮＡ）に融合した（ｔｒａｃｒＲＮＡにハイブリダイズするｔｒａｃｒメイト配列に連結した）可変ターゲティングドメインを含むｃｒＲＮＡ（ＣＲＩＳＰＲＲＮＡ）である２つのＲＮＡ分子の合成融合に関する。天然に存在しないキメラガイドＲＮＡは、天然には一緒に見出されない領域を含む（すなわち、それらは、互いに異種である）。例えば、天然に存在しないキメラガイドＲＮＡは、Ｃａｓエンドヌクレアーゼを認識することができる第２のヌクレオチド配列に連結された、標的ＤＮＡ中のヌクレオチド配列にハイブリダイズすることができる第１のヌクレオチド配列ドメイン（可変ターゲティングドメイン又はＶＴドメインと呼ばれる）を含み、その結果、第１のヌクレオチド配列と第２のヌクレオチド配列とは、天然には一緒に連結されて見出されない。

天然に存在しないキメラガイドＲＮＡは、ＩＩ型Ｃａｓエンドヌクレアーゼと複合体を形成することができるＩＩ型ＣＲＩＳＰＲ／Ｃａｓ系のｃｒＲＮＡ又は及びｔｒａｃｒＲＮＡを含み得、前記ガイドＲＮＡ／Ｃａｓエンドヌクレアーゼ複合体は、ＣａｓエンドヌクレアーゼをＤＮＡ標的部位に導くことができ、ＣａｓエンドヌクレアーゼがそのＤＮＡ標的部位を認識し、それに結合し、且つ任意選択によりそれに切れ目を入れるか又は切断する（一本鎖又は二本鎖切断を導入する）ことを可能にする。

ガイドポリヌクレオチドは、ガイドポリヌクレオチドを化学的に合成すること（以下に限定されないが、Ｈｅｎｄｅｌｅｔａｌ．２０１５，ＮａｔｕｒｅＢｉｏｔｅｃｈｎｏｌｏｇｙ３３，９８５－９８９など）、ガイドポリヌクレオチドのインビトロでの生成及び／又はガイドＲＮＡの自己スプライシング（以下に限定されないが、Ｘｉｅｅｔａｌ．，２０１５，ＰＮＡＳ１１２：３５７０－３５７５など）を含む、当技術分野で知られる任意の方法によって作製され得る。

Ｃａｓ９に媒介されるＤＮＡターゲティングを実施するための原核細胞におけるガイドＲＮＡなどのＲＮＡ成分を発現する方法が記載されている（２０１６年６月２３日に公開された国際公開第２０１６／０９９８８７号パンフレット及び２０１８年８月３０日に公開された国際公開第２０１８／１５６７０５号パンフレット）。

いくつかの態様では、対象の核酸（例えば、ガイドポリヌクレオチド、ガイドポリヌクレオチドをコードするヌクレオチド配列を含む核酸；Ｃａｓタンパク質をコードする核酸；ｃｒＲＮＡ又はｃｒＲＮＡをコードするヌクレオチド、ｔｒａｃｒＲＮＡ又はｔｒａｃｒＲＮＡをコードするヌクレオチド、ＶＴドメインをコードするヌクレオチド、ＣＰＲドメインをコードするヌクレオチドなど）は、追加の望ましい特徴（例えば、修飾されたか又は調節された安定性；細胞内ターゲティング；トラッキング、例えば蛍光ラベル；タンパク質又はタンパク質複合体のための結合部位など）を備える修飾又は配列を含む。ガイドポリヌクレオチド、ＶＴドメイン及び／又はＣＥＲドメインのヌクレオチド配列修飾は、５’キャップ、３’ポリアデニル化テイル、リボスイッチ配列、安定性制御配列、ｄｓＲＮＡ二本鎖を形成する配列、ガイドポリヌクレオチドを細胞内位置にターゲティングする修飾若しくは配列、トラッキングを提供する修飾若しくは配列、タンパク質のための結合部位を提供する修飾若しくは配列、ロックド核酸（ＬＮＡ）、５－メチルｄＣヌクレオチド、２，６－ジアミノプリンヌクレオチド、２’－フルオロＡヌクレオチド、２’－フルオロＵヌクレオチド；２’－Ｏ－メチルＲＮＡヌクレオチド、ホスホロチオエート結合、コレステロール分子への結合、ポリエチレングリコール分子への結合、スペーサー１８分子への結合、５’から３’への共有結合又はこれらの任意の組合せからなる群から選択することができるが、これらに限定されない。これらの修飾は、少なくとも１種の追加の有益な特徴をもたらすことができ、ここで、この追加の有益な特徴は、修飾若しくは調節された安定性、細胞内ターゲティング、トラッキング、蛍光標識、タンパク質若しくはタンパク質複合体のための結合部位、相補的標的配列に対する修飾された結合親和性、細胞分解に対する修飾耐性及び増加した細胞透過性の群から選択される。

誘導型Ｃａｓ系
用語「ガイドＲＮＡ／Ｃａｓエンドヌクレアーゼ複合体」、「ガイドＲＮＡ／Ｃａｓエンドヌクレアーゼ系」、「ガイドＲＮＡ／Ｃａｓ複合体」、「ガイドＲＮＡ／Ｃａｓ系」、「ｇＲＮＡ／Ｃａｓ複合体」、「ｇＲＮＡ／Ｃａｓ系」、「ＲＮＡ誘導型エンドヌクレアーゼ」、「ＲＧＥＮ」は、本明細書では互換的に使用され、複合体を形成することができる少なくとも１つのＲＮＡ成分及び少なくとも１つのＣａｓエンドヌクレアーゼを指し、ここで、前記ガイドＲＮＡ／Ｃａｓエンドヌクレアーゼ複合体は、ＣａｓエンドヌクレアーゼをＤＮＡ標的部位に導くことができ、ＣａｓエンドヌクレアーゼがＤＮＡ標的部位を認識し、それに結合し、且つ任意選択により切れ目を入れるか又は切断する（一本鎖又は二本鎖切断を導入する）ことを可能にする。

本開示は、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞において、標的配列の全て又は一部を認識し、それに結合し、且つ任意選択により切れ目を入れるか、ほどくか、又は切断することができるガイドＲＮＡ／Ｃａｓ系を発現させるための発現コンストラクトをさらに提供する。

発現カセット及び組換えＤＮＡコンストラクト
目的のポリヌクレオチド、目的の合成配列、目的の異種配列、目的の同種配列、目的の遺伝子などの本明細書で開示されるポリヌクレオチドは、目的の生物体における発現のための発現カセット（ＤＮＡコンストラクトとも呼ばれる）において提供され得る。

本明細書で使用する場合、用語「発現」は、前駆体又は成熟形態のいずれかにおける機能的な最終産物（例えば、ｃｒＲＮＡ、ｔｒａｃｒＲＮＡ、ｍＲＮＡ、ガイドＲＮＡ、ｓＲＮＡ、ｓｉＲＮＡ、アンチセンスＲＮＡ又はポリペプチド（タンパク質））の産生を指す。用語「発現」は、以下に限定されないが、転写、転写後修飾、翻訳、翻訳後修飾及び分泌を含むポリペプチドの産生に関与する任意の段階を含む。

発現カセットは、５’及び３’調節配列並びに又は本明細書で開示されるとおりのポリヌクレオチドに作動可能に連結されたタグ及び合成配列を含み得る。

本明細書で開示される発現カセットは、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）（宿主）細胞において機能する転写、転写及び翻訳開始領域（すなわちプロモーター）、５’非翻訳領域、様々なタンパク質タグ及び配列をコードするポリヌクレオチド、目的のポリヌクレオチド並びに転写及び翻訳終結領域（すなわち終結領域）を５’－３’方向に含み得る。発現カセットは、本明細書の別の箇所で記載される調節領域の転写調節下にあるポリヌクレオチドの挿入のための複数の制限部位及び／又は組換え部位と一緒にも提供される。調節領域（すなわちプロモーター、転写調節領域及び翻訳終結領域）及び／又は目的のポリヌクレオチドは、宿主細胞に対して又は互いに天然／類似のものであり得る。様々なタンパク質配列をコードする他のポリヌクレオチド配列は、目的のポリヌクレオチドの５’又は３’末端のいずれかに付加され得る。代わりに、調節領域及び／又は目的のポリヌクレオチドは、宿主細胞に対して又は互いに異種であり得る。

特定の実施形態では、本明細書で開示されるポリヌクレオチドは、本明細書の別の箇所で開示されるか又は当技術分野において知られるとおりの目的のポリヌクレオチド配列又は発現カセットの任意の組合せとともに積み重ねられ得る。積み重ねられたポリヌクレオチドは、最初のポリヌクレオチドと同じプロモーターに作動可能に連結され得るか、又は別々のプロモーターポリヌクレオチドに作動可能に連結され得る。

発現カセットは、対応する終結領域とともに目的のポリヌクレオチドに作動可能に連結されたプロモーターを含み得る。終結領域は、転写開始領域に対して天然のものであるか、作動可能に連結された目的のポリヌクレオチド若しくはプロモーター配列に対して天然のものであるか、宿主生物体に対して天然のものであるか、又は別の供給源（すなわち外来若しくは異種）に由来し得る。従来の終結領域は、ファージ配列、例えばラムダファージｔ０終結領域又は原核生物リボソームＲＮＡオペロン若しくは細胞外タンパク質の分泌に関与する遺伝子（例えば、Ｂ．サブチリス（Ｂ．ｓｕｂｔｉｌｉｓ）由来のａｐｒＥ、Ｂ．リケニフォルミス（Ｂ．ｌｉｃｈｅｎｉｆｏｒｍｉｓ）由来のａｐｒＬ）由来の強力なターミネーターから入手可能である。適切な終結領域は、オクトピン合成酵素終結領域及びノパリン合成酵素終結領域などのＡ．ツメファシエンス（Ａ．ｔｕｍｅｆａｃｉｅｎｓ）のＴｉ－プラスミドから入手可能である。また、Ｇｕｅｒｉｎｅａｕｅｔａｌ．（１９９１）Ｍｏｌ．Ｇｅｎ．Ｇｅｎｅｔ．２６２：１４１－１４４；Ｐｒｏｕｄｆｏｏｔ（１９９１）Ｃｅｌｌ６４：６７１－６７４；Ｓａｎｆａｃｏｎｅｔａｌ．（１９９１）ＧｅｎｅｓＤｅｖ．５：１４１－１４９；Ｍｏｇｅｎｅｔａｌ．（１９９０）ＰｌａｎｔＣｅｌｌ２：１２６１－１２７２；Ｍｕｎｒｏｅｅｔａｌ．（１９９０）Ｇｅｎｅ９１：１５１－１５８；Ｂａｌｌａｓｅｔａｌ．（１９８９）ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．１７：７８９１－７９０３；及びＪｏｓｈｉｅｔａｌ．（１９８７）ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．１５：９６２７－９６３９を参照されたい。

適切な場合、目的のポリヌクレオチドは、形質転換又はターゲティングされた生物体における発現を増加させるために最適化され得る。例えば、ポリヌクレオチドは、発現の向上に関して生物体に好ましいコドンを使用するために合成又は改変され得る。

細胞宿主中で遺伝子発現を増強するために、追加の配列改変が知られる。これらには、遺伝子発現に有害であり得る、疑似ポリアデニル化シグナルをコードする配列、エクソン－イントロンスプライス部位シグナルをコードする配列、トランスポゾン様リピートをコードする配列及び他のそのようなよく特徴付けられた配列の除去が含まれる。配列のＧ－Ｃ含有量は、宿主細胞中で発現される既知の遺伝子を参照することによって算出される、所与の細胞宿主の平均的なレベルに調節され得る。可能な場合、予想されるヘアピン二次ｍＲＮＡ構造を避けるように配列を改変する。

発現カセットは、５’リーダー配列をさらに含有し得る。そのようなリーダー配列は、翻訳又はＲＮＡ安定性のレベルを増強するように作用し得る。５’非翻訳領域と互換的に使用される５’リーダー配列は、バチルス・サブチリス（Ｂａｃｉｌｌｕｓｓｕｂｔｉｌｉｓ）ａｐｒＥ遺伝子若しくはバチルス・リケニフォルミス（Ｂａｃｉｌｌｕｓｌｉｃｈｅｎｉｆｏｒｍｉｓ）ａｍｙＬ遺伝子又は任意の細菌リボソームタンパク質遺伝子に由来するものなど、よく知られ且つよく特徴付けられた細菌ＵＴＲから得られるであろう。翻訳リーダーは、当技術分野で既知であり、下記が挙げられる：ピコルナウイルスリーダー、例えばＥＭＣＶリーダー（脳心筋炎５’非コード領域）（Ｅｌｒｏｙ－Ｓｔｅｉｎ，ｅｔａｌ．（１９８９）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ８６：６１２６－６１３０）；ポティウイルスリーダー、例えばＴＥＶリーダー（タバコエッチウイルス）（Ｇａｌｌｉｅｅｔａｌ．（１９９５）Ｇｅｎｅ１６５（２）：２３３－２３８）、ＭＤＭＶリーダー（トウモロコシ萎縮モザイクウイルス）（Ｊｏｈｎｓｏｎｅｔａｌ．（１９８６）Ｖｉｒｏｌｏｇｙ１５４：９－２０）及びヒト免疫グロブリン重鎖結合タンパク質（ＢｉＰ）（Ｍａｃｅｊａｋｅｔａｌ．（１９９１）Ｎａｔｕｒｅ３５３：９０－９４）；アルファルファモザイクウイルスのコートタンパク質ｍＲＮＡ由来の非翻訳リーダー（ＡＭＶＲＮＡ４）（Ｊｏｂｌｉｎｇｅｔａｌ．（１９８７）Ｎａｔｕｒｅ３２５：６２２－６２５）；タバコモザイクウイルスリーダー（ＴＭＶ）（Ｇａｌｌｉｅｅｔａｌ．（１９８９）ｉｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙｏｆＲＮＡ，ｅｄ．Ｃｅｃｈ（Ｌｉｓｓ，ＮｅｗＹｏｒｋ），ｐｐ．２３７－２５６）；並びにトウモロコシ退緑斑紋ウイルスリーダー（ＭＣＭＶ）（Ｌｏｍｍｅｌｅｔａｌ．（１９９１）Ｖｉｒｏｌｏｇｙ８１：３８２－３８５）。また、Ｄｅｌｌａ－Ｃｉｏｐｐａｅｔａｌ．（１９８７）ＰｌａｎｔＰｈｙｓｉｏｌ．８４：９６５－９６８も参照されたい。翻訳を増強することで知られている他の方法、例えばイントロンなども使用することができる。

発現カセットの調製において、様々なＤＮＡ断片が、適当な向きで、必要に応じて適当なリーディングフレームにおいてＤＮＡ配列を提供するように操作され得る。この目標に向かって、アダプター又はリンカーがＤＮＡ断片の結合に使用され得るか、又は適当な制限部位、不要なＤＮＡの除去、制限部位の除去などを提供するための他の操作が行われ得る。この目的のために、インビトロの変異誘発、プライマー修復、制限、アニーリング、再置換、例えば移行及びトランスバージョンが行われ得る。

いくつかの実施形態では、ガイドＲＮＡ及び／又はＣａｓタンパク質をコードするヌクレオチド配列は、制御エレメント、例えばプロモーターなどの転写制御エレメントに作動可能に連結される。転写制御エレメントは、真核細胞又は原核細胞（例えば、細菌又はバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞）のいずれかにおいて機能的であり得る。

バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞内での遺伝子の発現において使用するための好適な原核生物プロモーター（原核細胞において機能的なプロモーター）及びプロモーター配列領域、それらのオープンリーディングフレーム（ＯＲＦ）並びに／又はそれらのバリアント配列の非限定的な例は、一般に当業者に知られている。本開示のプロモーター配列は、一般に、それらがバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞（例えば、Ｂ．リケニフォルミス（Ｂ．ｌｉｃｈｅｎｉｆｏｒｍｉｓ）細胞、Ｂ．サブチリス（Ｂ．ｓｕｂｔｉｌｉｓ）細胞など）において機能的であるように選択される。同様に、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞内での遺伝子発現を駆動するために有用なプロモーターとしては、バチルス・リケニフォルミス（Ｂａｃｉｌｌｕｓｌｉｃｈｅｎｉｆｏｒｍｉｓ）アミラーゼ遺伝子（ａｍｙＬ）のプロモーター、バチルス・ステアロサーモフィルス（Ｂａｃｉｌｌｕｓｓｔｅａｒｏｔｈｅｒｍｏｐｈｉｌｕｓ）マルトース生成アミラーゼ遺伝子（ａｍｙＭ）のプロモーター、バチルス・アミロリケファシエンス（Ｂａｃｉｌｌｕｓａｍｙｌｏｌｉｑｕｅｆａｃｉｅｎｓ）アミラーゼ（ａｍｙＱ）のプロモーター、バチルス・サブチリス（Ｂａｃｉｌｌｕｓｓｕｂｔｉｌｉｓ）ｘｙｌＡ及びｘｙｌＢ遺伝子のプロモーター、バチルス・サブチリス（Ｂａｃｉｌｌｕｓｓｕｂｔｉｌｉｓ）アルカリプロテアーゼ（ａｐｒＥ）プロモーター（Ｓｔａｈｌｅｔａｌ．，１９８４）、バチルス・サブチリス（Ｂａｃｉｌｌｕｓｓｕｂｔｉｌｉｓ）のα－アミラーゼプロモーター（Ｙａｎｇｅｔａｌ．，１９８３）、バチルス・アミロリケファシエンス（Ｂａｃｉｌｌｕｓａｍｙｌｏｌｉｑｕｅｆａｃｉｅｎｓ）のα－アミラーゼプロモーター（Ｔａｒｋｉｎｅｎｅｔａｌ．，１９８３）、バチルス・サブチリス（Ｂａｃｉｌｌｕｓｓｕｂｔｉｌｉｓ）由来の中性プロテアーゼ（ｎｐｒＥ）プロモーター（Ｙａｎｇｅｔａｌ．，１９８４）、変異体ａｐｒＥプロモーター（国際公開第２００１／５１６４３号パンフレット）又はバチルス・リケニフォルミス（Ｂａｃｉｌｌｕｓｌｉｃｈｅｎｉｆｏｒｍｉｓ）若しくは他の関連するバチルス綱（Ｂａｃｉｌｌｉ）由来の任意の他のプロモーターが挙げられるが、これらに限定されない。特定の他の実施形態では、プロモーターは、米国特許出願公開第２０１４／０３２９３０９号明細書に開示されたリボソームタンパク質プロモーター又はリボソームＲＮＡプロモーター（例えば、ｒｒｎＩプロモーター）である。ｓｐａｃのような合成プロモーターは、他の副因子に依存して構成的又は誘導性であり得る。ｎ２５、ラムダｐＬ又はｐＲのようなファージプロモーターも同様に構成的又は誘導性であり得る。バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞においてある範囲の活性（プロモーター強度）を有するプロモーターライブラリーをスクリーニング及び作製する方法は、国際公開第２００３／０８９６０４号パンフレットに記載されている。

いくつかの実施形態では、Ｃａｓ９エンドヌクレアーゼをコードするヌクレオチド配列は、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞において機能的な構成的プロモーターに作動可能に連結される。バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）内で機能的な構成的プロモーターとしては、バチルス・リケニフォルミス（Ｂａｃｉｌｌｕｓｌｉｃｈｅｎｉｆｏｒｍｉｓ）アミラーゼ遺伝子（ａｍｙＬ）のプロモーター、バチルス・ステアロサーモフィルス（Ｂａｃｉｌｌｕｓｓｔｅａｒｏｔｈｅｒｍｏｐｈｉｌｕｓ）マルトース生成アミラーゼ遺伝子（ａｍｙＭ）のプロモーター、バチルス・アミロリケファシエンス（Ｂａｃｉｌｌｕｓａｍｙｌｏｌｉｑｕｅｆａｃｉｅｎｓ）アミラーゼ（ａｍｙＱ）のプロモーター、バチルス・サブチリス（Ｂａｃｉｌｌｕｓｓｕｂｔｉｌｉｓ）アルカリプロテアーゼ（ａｐｒＥ）プロモーター、バチルス・サブチリス（Ｂａｃｉｌｌｕｓｓｕｂｔｉｌｉｓ）のα－アミラーゼプロモーター（Ｙａｎｇｅｔａｌ．，１９８３）、バチルス・アミロリケファシエンス（Ｂａｃｉｌｌｕｓａｍｙｌｏｌｉｑｕｅｆａｃｉｅｎｓ）のα－アミラーゼプロモーター（Ｔａｒｋｉｎｅｎｅｔａｌ．，１９８３）、バチルス・サブチリス（Ｂａｃｉｌｌｕｓｓｕｂｔｉｌｉｓ）由来の中性プロテアーゼ（ｎｐｒＥ）プロモーター（Ｙａｎｇｅｔａｌ．，１９８４）が挙げられるが、これらに限定されない。

本明細書で使用する場合、「組換え」は、例えば、化学合成又は遺伝子工学技術による核酸の単離セグメントの操作により、２つのさもなければ分離している配列セグメントの人工的組合せを指す。用語「組換え体」は、生物学的構成要素又は組成物（例えば、細胞、核酸、ポリペプチド／酵素、ベクターなど）に関連して使用されるとき、それらの生物学的構成要素又は組成物が天然で見られない状態のものであることを示す。換言すると、この生物学的構成要素又は組成物は、人の介入により天然の状態から改変されている。例えば、組換え細胞は、天然（すなわち非組換え）細胞中に見出されない１つ以上の遺伝子を発現する細胞、１つ以上の天然遺伝子を天然細胞と異なる量で発現する細胞及び／又は１つ以上の天然遺伝子を天然細胞と異なる条件下で発現する細胞を包含する。組換え核酸は、天然配列と１つ以上のヌクレオチドが異なり、異種配列（例えば、異種プロモーター、非天然又はバリアントシグナル配列をコードする配列など）に作動可能に連結され、イントロン配列を欠き、且つ／又は単離された形態であり得る。組換えポリペプチド／酵素は、天然配列と１つ以上のアミノ酸が異なり、異種配列と融合され、トランケートされるか若しくはアミノ酸の内部欠失を有し、天然細胞に見られない様式で（例えば、ポリペプチドをコードする発現ベクターが細胞中に存在することにより、ポリペプチドを過剰発現する組換え細胞から）発現され、且つ／又は単離された形態であり得る。いくつかの実施形態では、組換えポリヌクレオチド又はポリペプチド／酵素は、その野生型対応物と同一の配列を有するが、非天然形態（例えば、単離又は濃縮された形態）であることが強調される。

本明細書で使用する場合、「組換えＤＮＡ」又は「組換えＤＮＡコンストラクト」は、核酸断片の人工的組合せを含む少なくとも１つの発現カセットを含むＤＮＡ配列を指す。組換えＤＮＡコンストラクトは、本明細書で開示されるとおりの目的のポリヌクレオチドに作動可能に連結された５’及び３’調節配列を含み得る。例えば、組換えＤＮＡコンストラクトは、異なる供給源に由来する調節配列及びコード配列を含み得る。そのような組換えＤＮＡコンストラクトは、単独で使用され得るか、又は本明細書で環状組換えＤＮＡコンストラクトとも呼ばれるベクターとともに使用され得る。ベクターの選択は、当業者によく知られているように、宿主細胞にベクターを導入するために使用されることになる方法に依存する。例えば、プラスミドベクターを使用することができる。当業者であれば、宿主細胞を問題なく形質転換し、選択し、且つ繁殖させるためにベクター上に存在しなければならない遺伝要素について熟知している。

本明細書で使用される標準的な組換えＤＮＡ及び分子クローニング技術は、当技術分野でよく知られており、Ｓａｍｂｒｏｏｋｅｔａｌ．，ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ；ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙ：ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒ，ＮＹ（１９８９）においてより詳細に説明されている。

本明細書で使用する場合、「線状組換えＤＮＡコンストラクト」は、線状である組換えＤＮＡコンストラクトを指す。

本明細書で使用する場合、「環状組換えＤＮＡコンストラクト」又は「環状組換えＤＮＡ」は、環状である組換えＤＮＡコンストラクトを指す。用語「環状組換えＤＮＡコンストラクト」は、任意の供給源に由来するか、又は合成的な（すなわち天然に存在しない）自律的に複製する配列、ゲノム組込み配列（単一又は複数コピーの遺伝子発現カセットなどであるが、これらに限定されない）、ファージ又はヌクレオチド配列を含む環状の追加の染色体外エレメントを含み、その中において、いくつかのヌクレオチド配列は、目的のポリヌクレオチドを細胞に導入することができる固有の構成に結合されているか又は組み換えられている。

一態様では、環状組換えＤＮＡコンストラクトは、ベクター骨格及びＣａｓエンドヌクレアーゼをコードするＤＮＡ配列に作動可能に連結されたプロモーター配列を含む。

別の態様では、環状組換えＤＮＡコンストラクトは、ベクター骨格並びにＣａｓエンドヌクレアーゼをコードするＤＮＡ配列に作動可能に連結された第１のプロモーター及びガイドＲＮＡをコードするＤＮＡ配列に作動可能に連結された第２のプロモーターを含む。

いくつかの実施形態では、環状組換えＤＮＡコンストラクトは、ベクター骨格及びバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞において機能的な構成的プロモーターに作動可能に連結されたＣａｓ９エンドヌクレアーゼをコードするＣａｓ９エンドヌクレアーゼＤＮＡを含む。

一態様では、環状組換えＤＮＡコンストラクトは、本明細書で開示されるＣａｓ９エンドヌクレアーゼに作動可能に連結された異種５’及び３’調節配列を含む。これらの調節配列としては、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞において機能的な転写及び翻訳開始領域（すなわちプロモーター）、核移行シグナル並びに転写及び翻訳終結領域（すなわち終結領域）が挙げられるが、これらに限定されない。

一態様では、組換えＤＮＡコンストラクトは、本明細書に記載されるＣａｓ９エンドヌクレアーゼをコードするＤＮＡを含み、前記Ｃａｓ９エンドヌクレアーゼは、核移行配列（ＮＬＳ）などの異種調節エレメントに作動可能に連結されるか又はそれを含む。

一態様では、組換えＤＮＡコンストラクトは、本明細書に記載されるＣａｓ９エンドヌクレアーゼをコードするＤＮＡを含み、前記Ｃａｓ９エンドヌクレアーゼは、タンパク質不安定化ドメイン（例えば、ｄｅｇタグ）に作動可能に連結されるか又はそれを含む。

一態様では、組換えＤＮＡコンストラクトは、本明細書に記載されるＣａｓ９エンドヌクレアーゼをコードするＤＮＡを含み、前記Ｃａｓ９エンドヌクレアーゼは、タンパク質タグ（例えば、ポリヒスチジンタグ）に作動可能に連結されるか又はそれを含む。

一態様では、組換えＤＮＡコンストラクトは、本明細書に記載されるＣａｓ９エンドヌクレアーゼをコードするＤＮＡを含み、前記Ｃａｓ９エンドヌクレアーゼは、蛍光タンパク質（例えば、ＧＦＰ）に作動可能に連結されるか又はそれを含む。

一態様では、組換えＤＮＡコンストラクトは、本明細書に記載されるＣａｓ９エンドヌクレアーゼをコードするＤＮＡを含み、前記Ｃａｓ９エンドヌクレアーゼは、ＤＮＡ結合ドメイン（例えば、ｍｕｇａｍ、ｔｅｔＲ）に作動可能に連結されるか又はそれを含む。

標的部位
用語「標的部位」、「標的配列」、「標的部位配列」、「標的ＤＮＡ」、「標的遺伝子座」、「ゲノム標的部位」、「ゲノム標的配列」、「ゲノム標的遺伝子座」及び「プロトスペーサー」は、本明細書で互換的に使用され、限定はされないが、ガイドポリヌクレオチド／Ｃａｓエンドヌクレアーゼ複合体が認識し、結合し、且つ任意選択により切れ目を入れるか又は切断することができる、細胞の染色体、エピソーム、遺伝子導入座位又はゲノム中の任意の他のＤＮＡ分子（染色体、プラスミドＤＮＡを含む）上のヌクレオチド配列などのポリヌクレオチド配列を指す。

標的部位は、細胞のゲノム中の内在性部位であり得るか、又は代わりに、標的部位は、細胞に対して異種であるため、細胞のゲノム中で天然に存在し得ないか、又は標的部位は、天然に存在する場所と比較して異種のゲノム位置で見出すことができる。本明細書で使用される場合、用語「内在性標的配列」及び「天然標的配列」は、本明細書中で互換的に使用され、細胞のゲノムに内在するか又は天然のものであり、細胞のゲノム中のその標的配列の内在性又は天然の位置に存在する標的配列を指す。「人工標的部位」又は「人工標的配列」は、本明細書で互換的に使用され、細胞のゲノムに導入された標的配列を指す。そのような人工標的配列は、細胞のゲノム中の内在性標的配列又は天然標的配列と配列が同一であり得るが、細胞のゲノム中の異なる位置（すなわち非内在性位置又は非天然位置）に配置され得る。

「改変標的部位」、「改変標的配列」、「修飾標的部位」、「修飾標的配列」は、本明細書では互換的に使用され、改変されていない標的配列と比較した場合に少なくとも１つの改変を含む本明細書に開示される標的配列を指す。そのような「改変」としては、例えば、（ｉ）少なくとも１つのヌクレオチドの置換、（ｉｉ）少なくとも１つのヌクレオチドの欠失、（ｉｉｉ）少なくとも１つのヌクレオチドの挿入、又は（ｉｖ）（ｉ）～（ｉｉｉ）の任意の組合せが挙げられる。

Ｃａｓエンドヌクレアーゼのための標的部位は、非常に特異的であり、正確なヌクレオチド位置に定義され得ることが多いが、ある場合には、所望のゲノム改変のための標的部位は、ＤＮＡ切断が起こる部位のみと比べて広く定義され得る（例えば、ゲノムから欠失されるゲノム遺伝子座又は領域）。そのため、特定の場合（Ｃａｓ／ガイドＲＮＡの活性により起こるゲノム改変）、ＤＮＡ切断が「標的部位又は標的部位の近傍で」起こると説明される。

「標的部位を修飾する」及び「標的部位を改変する」ための方法は、本明細書では互換的に使用され、改変標的部位を生成するための方法を指す。

スクリーニング可能なマーカーの表現型を使用せずに標的部位又は標的部位の近傍で改変ゲノムを有するそれらの細胞を同定するために、様々な方法を利用することができる。そのような方法は、ＰＣＲ法、シークエンシング法、ヌクレアーゼ消化法、サザンブロット法及びそれらの任意の組合せを含むが、これらに限定されない、標的配列内の何らかの変化を検出するために標的配列を直接的に分析することであるとみなすことができる。

標的ＤＮＡ配列（標的部位）の長さは、変動する可能性があり、例えば長さが少なくとも１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０ヌクレオチド以上である標的部位が含まれる。さらに、標的部位は、回文構造であり得ることも考えられ、すなわち、一方の鎖上の配列は、相補鎖上で反対方向に同一配列を読み取ることが可能である。ニック／切断部位は、標的配列内に存在する可能性があるか、又はニック／切断部位は標的配列の外側に存在する可能性がある。別の変形形態では、切断が互いに直接向かい合ったヌクレオチド位置で生じて平滑末端切断を生成する可能性があるか、又は他の場合、切り込みが互い違いに配置されて、５’オーバーハング又は３’オーバーハングのいずれかであり得る一本鎖オーバーハング（「粘着末端」とも呼ばれる）を生成する可能性がある。ゲノム標的部位の活性バリアントも使用され得る。そのような活性バリアントは、所与の標的部位に対して少なくとも６５％、７０％、７５％、８０％、８５％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又はそれを超える配列同一性を含むことができ、活性バリアントは、生物学的活性を保持し、したがってＣａｓエンドヌクレアーゼにより認識及び切断することができる。

エンドヌクレアーゼによる標的部位の一本鎖又は二本鎖切断を測定するためのアッセイは、当技術分野で知られており、一般には、認識部位を含有するＤＮＡ基質に対する作用物質の全体的活性及び特異性を測定する。

プロトスペーサー隣接モチーフ（ＰＡＭ）
本明細書における「プロトスペーサー隣接モチーフ」（ＰＡＭ）は、ガイドポリヌクレオチド／Ｃａｓエンドヌクレアーゼ（ＰＧＥＮ）系により認識される（標的とされる）標的配列（プロトスペーサー）に隣接する短いヌクレオチド配列を指す。Ｃａｓエンドヌクレアーゼは、標的ＤＮＡ配列の後にＰＡＭ配列がなければ、その標的ＤＮＡ配列を正しく認識しない可能性がある。本明細書におけるＰＡＭの配列及び長さは、使用されるＣａｓタンパク質又はＣａｓタンパク質複合体に応じて異なり得る。ＰＡＭ配列は、任意の長さであり得るが、典型的には１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９又は２０ヌクレオチド長である。

本明細書におけるＰＡＭは、通常、利用されているＲＧＥＮの型を鑑みて選択される。本明細書におけるＰＡＭ配列は、例えば、Ｃａｓが由来し得る、本明細書で開示される種のいずれかに由来する、本明細書に記載されるＣａｓ９バリアントなどのＣａｓを含むＰＧＥＮによって認識されるものであり得る。特定の実施形態では、ＰＡＭ配列は、Ｓ．ピオゲネス（Ｓ．ｐｙｏｇｅｎｅｓ）、Ｓ．サーモフィルス（Ｓ．ｔｈｅｒｍｏｐｈｉｌｕｓ）、Ｓ．アガラクティエ（Ｓ．ａｇａｌａｃｔｉａｅ）、Ｎ．メニンギティディス（Ｎ．ｍｅｎｉｎｇｉｔｉｄｉｓ）、Ｔ．デンティコラ（Ｔ．ｄｅｎｔｉｃｏｌａ）又はＦ．ノビシダ（Ｆ．ｎｏｖｉｃｉｄａ）に由来するＣａｓ９を含むＲＧＥＮによって認識されるものであり得る。例えば、本明細書に記載されるＣａｓ９Ｙ１５５バリアントを含むＳ．ピオゲネス（Ｓ．ｐｙｏｇｅｎｅｓ）に由来する好適なＣａｓ９は、ＮＧＧ（Ｎは、Ａ、Ｔ、Ｃ、Ｔ又はＧであり得る）のＰＡＭを有する標的ゲノム配列に対して使用され得る。他の例として、好適なＣａｓ９は、以下のＰＡＭ配列を有するＤＮＡ配列を標的化するときに以下の種のいずれかに由来し得る：Ｓ．サーモフィルス（Ｓ．ｔｈｅｒｍｏｐｈｉｌｕｓ）（ＮＮＡＧＡＡ）、Ｓ．アガラクティエ（Ｓ．ａｇａｌａｃｔｉａｅ）（ＮＧＧ）、ＮＮＡＧＡＡＷ［Ｗは、Ａ又はＴである］、ＮＧＧＮＧ）、Ｎ．メニンギティディス（Ｎ．ｍｅｎｉｎｇｉｔｉｄｉｓ）（ＮＮＮＮＧＡＴＴ）、Ｔ．デンティコラ（Ｔ．ｄｅｎｔｉｃｏｌａ）（ＮＡＡＡＡＣ）又はＦ．ノビシダ（Ｆ．ｎｏｖｉｃｉｄａ）（ＮＧ）（これらの特定のＰＡＭ配列の全てにおけるＮは、Ａ、Ｃ、Ｔ又はＧである）。本明細書で有用なＣａｓ９／ＰＡＭの他の例としては、参照により本明細書に組み込まれるＳｈａｈｅｔａｌ．（ＲＮＡＢｉｏｌｏｇｙ１０：８９１－８９９）及びＥｓｖｅｌｔｅｔａｌ．（ＮａｔｕｒｅＭｅｔｈｏｄｓ１０：１１１６－１１２１）において開示されるものが挙げられる。

バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）での効率的なドナーＤＮＡ組込みにおける、少なくとも１０００ヌクレオチド長の長いホモロジーアームによって隣接されるドナーＤＮＡ配列を含む線状組換えＤＮＡコンストラクトの使用
本開示は、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノム上の標的部位に、前記ゲノムへの選択マーカーの組込みを伴わずにドナーＤＮＡを含む線状組換えＤＮＡコンストラクトを使用してドナーＤＮＡ配列を組み込むための方法及び組成物を含む。

本出願人らは、驚くべきことに且つ予想外にも、長いホモロジーアーム（＞１０００ヌクレオチド）によって隣接されるドナーＤＮＡを含む線状組換えＤＮＡコンストラクト並びにＣａｓ９エンドヌクレアーゼ及びガイドＲＮＡをコードする環状組換えＤＮＡコンストラクト（バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞へのガイドＲＮＡ／Ｃａｓエンドヌクレアーゼ系の導入のための）が、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞に同時に導入されるとき、１０００ヌクレオチド長の短いホモロジーアームによって隣接される前記同じドナーＤＮＡ配列を除いて全て同じ成分を有する対照系と比較して、ドナーＤＮＡ配列の組込みにおける効率の増加が観察されることを見出した（図１）。さらに、本明細書に記載される方法は、前記バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノムへの選択マーカーの組込みを必要としない。

一実施形態によれば、方法は、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノム上の標的部位に、前記ゲノムへの選択マーカーの組込みを伴わずにドナーＤＮＡ配列を組み込む方法であって、少なくとも線状組換えＤＮＡコンストラクト及び環状組換えＤＮＡコンストラクトをバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞に同時に導入することを含み、前記線状組換えＤＮＡコンストラクトは、ドナーＤＮＡ配列を含み、前記ドナーＤＮＡ配列は、上流のホモロジーアーム（ＨＲ１）及び下流のアーム（ＨＲ２）によって隣接され、各ホモロジーアームは、１０００を超えるヌクレオチド長であり、前記環状組換えＤＮＡコンストラクトは、ガイドＲＮＡをコードするＤＮＡ配列と、Ｃａｓエンドヌクレアーゼをコードするヌクレオチド配列に作動可能に連結された構成的プロモーターとを含み、前記Ｃａｓ９エンドヌクレアーゼは、前記バチルス（Ｂａｃｉｌｌｕｓ）細胞のゲノムにおける標的部位又はその近傍で二本鎖切断を導入する、方法である。

一態様では、ドナーＤＮＡ配列は、上流のホモロジーアーム（ＨＲ１）及び下流のホモロジーアーム（ＨＲ２）によって隣接され、各ホモロジーアームは、１０００、１１００、１２００、１３００、１４００、１５００、１６００、１７００、１８００、１９００、２０００、２１００、２２００、２３００、２４００、２５００、２６００、２７００、２８００、２９００、３０００、３１００、３２００、３３００、３４００、３５００、３６００、３７００、３８００、３９００、４０００、５０００を超え、且つ最大で６０００のヌクレオチド長であり、及びバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノム上の前記標的部位に対する配列相同性を含む。

一態様では、ドナーＤＮＡ配列は、目的のポリヌクレオチド、目的の遺伝子、転写調節配列、翻訳調節配列、プロモーター配列、ターミネーター配列、トランスジェニック核酸配列、メッセンジャーＲＮＡの少なくとも一部と相補的なアンチセンス配列、異種配列又はこれらのいずれか１つの組合せからなる群から選択されるヌクレオチド配列を含む。

いくつかの実施形態では、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞は、バチルス・サブチリス（Ｂａｃｉｌｌｕｓｓｕｂｔｉｌｉｓ）、バチルス・リケニフォルミス（Ｂａｃｉｌｌｕｓｌｉｃｈｅｎｉｆｏｒｍｉｓ）、バチルス・レンツス（Ｂａｃｉｌｌｕｓｌｅｎｔｕｓ）、バチルス・ブレビス（Ｂａｃｉｌｌｕｓｂｒｅｖｉｓ）、バチルス・ステアロサーモフィルス（Ｂａｃｉｌｌｕｓｓｔｅａｒｏｔｈｅｒｍｏｐｈｉｌｕｓ）、バチルス・アルカロフィルス（Ｂａｃｉｌｌｕｓａｌｋａｌｏｐｈｉｌｕｓ）、バチルス・アミロリケファシエンス（Ｂａｃｉｌｌｕｓａｍｙｌｏｌｉｑｕｅｆａｃｉｅｎｓ）、バチルス・クラウシイ（Ｂａｃｉｌｌｕｓｃｌａｕｓｉｉ）、バチルス・ハロデュランス（Ｂａｃｉｌｌｕｓ．ｈａｌｏｄｕｒａｎｓ）、バチルス・メガテリウム（Ｂａｃｉｌｌｕｓ．ｍｅｇａｔｅｒｉｕｍ）、バチルス・コアギュランス（Ｂａｃｉｌｌｕｓｃｏａｇｕｌａｎｓ）、バチルス・サーキュランス（Ｂａｃｉｌｌｕｓｃｉｒｃｕｌａｎｓ）、バチルス・ラウツス（Ｂａｃｉｌｌｕｓｌａｕｔｕｓ）及びバチルス・チューリンギエンシス（Ｂａｃｉｌｌｕｓｔｈｕｒｉｎｇｉｅｎｓｉｓ）からなる群から選択される。

本開示の線状組換えＤＮＡコンストラクトは、少なくとも１０００ヌクレオチドのホモロジーアームによって隣接されるドナーＤＮＡを含み得、且つ任意選択により、ガイドＲＮＡをコードするＤＮＡ断片を含み得（図２）、前記ガイドＲＮＡは、ＣａｓエンドヌクレアーゼとともにＲＧＥＮを形成することができ、前記ＲＧＥＮは、前記バチルス（Ｂａｃｉｌｌｕｓ）細胞のゲノムにおける標的部位又はその近傍で二本鎖切断を導入できる。線状組換えＤＮＡコンストラクト上のドナーＤＮＡに関するガイドＲＮＡの位置は、ドナーＤＮＡが隣接するＨＲ２アーム（３’ホモロジーアーム）の３’（下流）であり得る（図２において示されるとおり）。ガイドＲＮＡをコードするＤＮＡは、ＨＲ２アームに直接的に連結され得るか、又はＨＲ２アームのさらに下流にあり得る（例えば、ＨＲ２アームと、ガイドＲＮＡをコードするＤＮＡとの間にヌクレオチドを有する）。線状組換えＤＮＡコンストラクト上のドナーＤＮＡに関するガイドＲＮＡの位置は、ドナーＤＮＡが隣接するＨＲ１アーム（５’ホモロジーアーム）の５’（上流）でもあり得る（図において示されない）。ガイドＲＮＡをコードするＤＮＡは、ＨＲ１ホモロジーアームに直接的に連結され得るか、又はＨＲ１アームのさらに上流にあり得る（例えば、ＨＲ１アームと、ガイドＲＮＡをコードするＤＮＡとの間にヌクレオチドを有する）。

バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノムへの遺伝子組込みのための以前の方法は、自発的な二本鎖切断の発生及び短いホモロジーアームとともに線状ＤＮＡ断片上で同じ場所に位置する選択マーカー（ゲノムに挿入されることになる目的の遺伝子と、そのゲノムに組み込まれる目的の遺伝子を有したバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞の同定も可能にするようにゲノムに挿入された選択マーカーとの両方を含む）の使用に依拠する（２００２年２月２１日に公開された国際公開第０２／１４４９０号パンフレット）。選択マーカー及びＧＯＩは、通常、細胞内のＤＮＡとの組換え時にＧＯＩ及び選択マーカーの両方が細胞のＤＮＡ中に組み込まれることになるように、２つの短いホモロジーアームによって隣接された。バチルス（Ｂａｃｉｌｌｕｓ）細胞へのゲノム組込みのための短いホモロジーアームによる、そのような線状断片の形質転換中の選択マーカーの使用は、ゲノムの特定の位置の効率的な改変のために選択することが必要となる。マーカーは、発現のための正確な遺伝子座に組み込む必要があり、この組込みは、集団内及びゲノム内の確率的な様式で発生する希有な自発的ＤＮＡ損傷に依拠する。この希有な事象は、マーカーの使用及び染色体組込みを組み合わせることによってのみ選択され得る。（２００２年２月２１日に公開された国際公開第０２／１４４９０号パンフレット）。

対照的に、本開示は、集団の大部分を、所望の遺伝子座でＤＮＡ損傷を含有する細胞に本質的に変換する部位特異的ＤＮＡ二本鎖切断（ＤＮＡ損傷）を生成し、そのため、希有な自発的ＤＮＡ損傷に依拠しない方法を記載する。したがって、ＤＮＡ二本鎖切断の生成は、もはや染色体座位を改変するための制限的な工程ではなく（２００年２月２１日に公開された国際公開第０２／１４４９０号パンフレットにおける場合のように）、代わりに、本開示は、単に、形質転換効率の上昇を可能にするためにのみ、任意選択により（組換えＤＮＡコンストラクト上に配置される）選択マーカーを使用して非形質転換細胞から形質転換細胞を区別する。

本明細書に記載されるとおり、本出願人らは、驚くべきことに且つ予想外にも、長いホモロジーアーム（＞１０００ヌクレオチド長）によって隣接されるドナーＤＮＡを含む線状組換えＤＮＡコンストラクトが、ＲＧＥＮをコードする組換えＤＮＡコンストラクトと同時に導入されるとき、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）ゲノム標的部位上の標的部位への高い効率の遺伝子組込みが前記ゲノムへの選択マーカーの組込みを伴わずに観察されることを見出した。

一実施形態では、方法は、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノム上の標的部位に、前記ゲノムへの選択マーカーの組込みを伴わずにドナーＤＮＡ配列を組み込む方法であって、少なくとも線状組換えＤＮＡコンストラクト及び環状組換えＤＮＡコンストラクトをバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞に同時に導入することを含み、前記線状組換えＤＮＡコンストラクトは、ドナーＤＮＡ配列を含み、前記ドナーＤＮＡ配列は、上流のホモロジーアーム（ＨＲ１）及び下流のアーム（ＨＲ２）によって隣接され、各ホモロジーアームは、１０００を超えるヌクレオチド長であり、前記環状組換えＤＮＡコンストラクトは、ガイドＲＮＡをコードするＤＮＡ配列と、Ｃａｓエンドヌクレアーゼをコードするヌクレオチド配列に作動可能に連結された構成的プロモーターとを含み、前記Ｃａｓ９エンドヌクレアーゼは、前記バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノムにおける標的部位又はその近傍で二本鎖切断を導入し、前記環状組換えＤＮＡコンストラクトは、前記バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）子孫細胞のゲノムに組み込まれない選択マーカーを含む、方法である。

一実施形態では、方法は、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノム上の標的部位に、前記ゲノムへの選択マーカーの組込みを伴わずにドナーＤＮＡ配列を組み込む方法であって、少なくとも線状組換えＤＮＡコンストラクト及び環状組換えＤＮＡコンストラクトをバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞に同時に導入することを含み、前記線状組換えＤＮＡコンストラクトは、ドナーＤＮＡ配列を含み、前記ドナーＤＮＡ配列は、上流のホモロジーアーム（ＨＲ１）及び下流のアーム（ＨＲ２）によって隣接され、各ホモロジーアームは、１０００を超えるヌクレオチド長であり、前記環状組換えＤＮＡコンストラクトは、ガイドＲＮＡをコードするＤＮＡ配列と、Ｃａｓエンドヌクレアーゼをコードするヌクレオチド配列に作動可能に連結された構成的プロモーターとを含み、前記Ｃａｓ９エンドヌクレアーゼは、前記バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノムにおける標的部位又はその近傍で二本鎖切断を導入し、前記選択マーカーは、前記バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）子孫細胞のゲノムに安定に組み込まれない、方法である。

用語「ノックイン」、「遺伝子ノックイン」、「遺伝子挿入」及び「遺伝的ノックイン」は、本明細書では互換的に使用される。ノックインは、Ｃａｓタンパク質を用いたターゲティングによって（例えば、好適なドナーＤＮＡポリヌクレオチドも使用される相同組換え（ＨＲ）によって）細胞内の特定のＤＮＡ配列でのＤＮＡ配列の置換又は挿入を表す。ノックインの例は、遺伝子のコード領域中の異種アミノ酸コード配列の特異的な挿入又は遺伝子座中への転写調節エレメントの特異的な挿入である。

本明細書に記載される線状組換えＤＮＡは、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノムに目的のポリヌクレオチド又は遺伝子を組み込むための方法において使用され得る。

一態様では、本方法は、標的部位での目的のポリヌクレオチド又は遺伝子の組込みを提供するために相同組換え（ＨＲ）を利用する。

本明細書で使用する場合、「ドナーＤＮＡ」及び「ドナーＤＮＡ配列」は、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノム上に配置されるＣａｓエンドヌクレアーゼの標的部位に挿入されることになるヌクレオチド配列を含むＤＮＡ配列を指す。ドナーＤＮＡ配列は、第１（ＨＲ１）及び第２（ＨＲ２）の相同領域（ホモロジーアームとも呼ばれる）によって隣接され得る。ドナーＤＮＡ配列に隣接する第１及び第２の相同性の領域は、それぞれ細胞又は生物体ゲノムの標的部位中に存在するか又はそれに隣接する第１の及び第２のゲノム領域に対する相同性を共有する。

本明細書で使用する場合、「ホモロジーアーム」は、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）ゲノム内の配列と相同である核酸配列を指す。より具体的には、ホモロジーアームは、標的配列に直接隣接する領域と約８０～１００％の配列同一性、約９０～１００％の配列同一性又は約９５～１００％の配列同一性を有する上流又は下流の領域である。

一態様では、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）ゲノムに組み込まれることになる目的のヌクレオチド配列を含む二本鎖ドナーＤＮＡ配列に隣接し、且つ本明細書に記載される線状二本鎖組換えＤＮＡ上に配置される本開示のホモロジーアームは、約１００１塩基対（ｂｐ）～２０００ｂｐ；２０００ｂｐ～３０００ｂｐ；２０００ｂｐ～４０００ｂｐ；２０００ｂｐ～５０００ｂｐ；２０００ｂｐ～６０００ｂｐ、３０００ｂｐ～４０００ｂｐ；３０００ｂｐ～５０００ｂｐ；３０００ｂｐ～６０００ｂｐ、４０００ｂｐ～５０００ｂｐ；４０００ｂｐ～６０００ｂｐ、５０００ｂｐ～最大で６０００ｂｐを含む。

一態様では、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）ゲノムに組み込まれることになる目的のヌクレオチド配列を含む一本鎖ドナーＤＮＡ配列に隣接し、且つ本明細書に記載される線状一本鎖組換えＤＮＡ上に配置される本開示のホモロジーアームは、約１００１ヌクレオチド～２０００ヌクレオチド；２０００ヌクレオチド～３０００ヌクレオチド；２０００ヌクレオチド～４０００ヌクレオチド；２０００ヌクレオチド～５０００ヌクレオチド；２０００ヌクレオチド～６０００ヌクレオチド；３０００ヌクレオチド～４０００ヌクレオチド；３０００ヌクレオチド～５０００ヌクレオチド；３０００ヌクレオチド～６０００ヌクレオチド；４０００ヌクレオチド～５０００ヌクレオチド；４０００ヌクレオチド～６０００ヌクレオチド；５０００ヌクレオチド～最大で６０００ヌクレオチドを含む。

本明細書で使用する場合、対照実験において使用されるドナーＤＮＡ配列は、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）ゲノムに組み込まれることになる目的のヌクレオチド配列を含む（且つ本明細書に記載される線状組換えＤＮＡ上に配置される）ドナーＤＮＡ配列と同一であるが、対照線状組換えＤＮＡにおいてドナーＤＮＡ配列に隣接するホモロジーアームは、１０００ヌクレオチド長の短いホモロジーアームによって隣接される。

一態様では、ドナーＤＮＡ配列は、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）ゲノムに組み込まれることになる目的のヌクレオチド配列を含み、前記目的のヌクレオチド配列は、目的のポリヌクレオチド、目的の遺伝子、転写調節配列、翻訳調節配列、プロモーター配列、ターミネーター配列、トランスジェニック核酸配列、メッセンジャーＲＮＡの少なくとも一部と相補的なアンチセンス配列、異種配列又はこれらのいずれか１つの組合せからなる群から選択される。

いくつかの実施形態では、目的の遺伝子の５’及び３’末端は、ホモロジーアームによって隣接され、ホモロジーアームは、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞の標的化されるゲノム遺伝子座に直接隣接する核酸配列を含む。

一実施形態では、方法は、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノム上の標的部位に、前記ゲノムへの選択マーカーの組込みを伴わずにドナーＤＮＡ配列を組み込む方法であって、少なくとも線状組換えＤＮＡコンストラクト及び環状組換えＤＮＡコンストラクトをバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞に同時に導入することを含み、前記線状組換えＤＮＡコンストラクトは、ドナーＤＮＡ配列を含み、前記ドナーＤＮＡ配列は、上流のホモロジーアーム（ＨＲ１）及び下流のアーム（ＨＲ２）によって隣接され、各ホモロジーアームは、１０００を超えるヌクレオチド長であり、前記環状組換えＤＮＡコンストラクトは、ガイドＲＮＡをコードするＤＮＡ配列と、Ｃａｓエンドヌクレアーゼをコードするヌクレオチド配列に作動可能に連結された構成的プロモーターとを含み、前記Ｃａｓ９エンドヌクレアーゼは、前記バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノムにおける標的部位又はその近傍で二本鎖切断を導入し、前記方法は、前記バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞に由来する子孫細胞を増殖させ、且つバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）子孫細胞であって、線状組換えＤＮＡ及び／又は環状組換えＤＮＡコンストラクトを含有しない（且つ環状組換えＤＮＡ上に含まれる任意選択の選択マーカーを含有しない）が、そのゲノム中に安定に組み込まれる目的の遺伝子を有するバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）子孫細胞を選択することをさらに含む、方法である。

一実施形態では、方法は、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノム上の標的部位に、前記ゲノムへの選択マーカーの組込みを伴わずにドナーＤＮＡ配列を組み込む方法であって、少なくとも線状組換えＤＮＡコンストラクト及び環状組換えＤＮＡコンストラクトをバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞に同時に導入することを含み、前記線状組換えＤＮＡコンストラクトは、ドナーＤＮＡ配列を含み、前記ドナーＤＮＡ配列は、上流のホモロジーアーム（ＨＲ１）及び下流のアーム（ＨＲ２）によって隣接され、各ホモロジーアームは、１０００を超えるヌクレオチド長であり、前記環状組換えＤＮＡコンストラクトは、ガイドＲＮＡをコードするＤＮＡ配列と、Ｃａｓエンドヌクレアーゼをコードするヌクレオチド配列に作動可能に連結された構成的プロモーターとを含み、前記Ｃａｓ９エンドヌクレアーゼは、前記バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノムにおける標的部位又はその近傍で二本鎖切断を導入し、前記方法は、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞に、１０００ヌクレオチドの上流のホモロジーアーム（ＨＲ１）及び下流のホモロジーアーム（ＨＲ２）によって隣接される前記ドナーＤＮＡ配列を含む線状組換えＤＮＡコンストラクトと、構成的プロモーターに作動可能に連結された前記ガイドＲＮＡ及び前記Ｃａｓ９エンドヌクレアーゼＤＮＡ配列をコードする前記ＤＮＡ配列を含む環状組換えＤＮＡコンストラクトとを導入することを含む対照方法の組込みの頻度と比較して、少なくとも約２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１～最大で２３倍高い、ドナーＤＮＡ配列の組込みの頻度をもたらす、方法である。

エピソームＤＮＡ分子も二本鎖切断中にライゲートされ得、例えば染色体二本鎖切断へのＴ－ＤＮＡの組込みがなされ得る（ＣｈｉｌｔｏｎａｎｄＱｕｅ，（２００３）ＰｌａｎｔＰｈｙｓｉｏｌ１３３：９５６－６５；ＳａｌｏｍｏｎａｎｄＰｕｃｈｔａ，（１９９８）ＥＭＢＯＪ１７：６０８６－９５）。二本鎖切断の周囲の配列が、例えば、二本鎖切断の成熟に関与するエキソヌクレアーゼ活性によって改変されると、遺伝子変換経路は、非分裂体細胞中の相同染色体又はＤＮＡ複製後の姉妹染色分体などの相同配列を利用できる場合、原初の構造を回復させることができる（Ｍｏｌｉｎｉｅｒｅｔａｌ．，２００４，ＰｌａｎｔＣｅｌｌ１６：３４２－５２）。異所性及び／又は後成的ＤＮＡ配列も相同組換えのＤＮＡ修復鋳型として機能し得る（Ｐｕｃｈｔａ，（１９９９）Ｇｅｎｅｔｉｃｓ１５２：１１７３－８１）。

相同組換え修復（ＨＤＲ）は、二本鎖及び一本鎖ＤＮＡ切断を修復する細胞内の機構である。相同組換え修復としては、相同組換え（ＨＲ）及び一本鎖アニーリング（ＳＳＡ）が挙げられる（Ｌｉｅｂｅｒ．２０１０Ａｎｎｕ．Ｒｅｖ．Ｂｉｏｃｈｅｍ．７９：１８１－２１１）。ＨＤＲの最も一般的な形態は、ドナーＤＮＡとアクセプターＤＮＡとの間の最も長い配列相同性の要件を有する相同組換え（ＨＲ）と呼ばれる。ＨＤＲの他の形態には、一本鎖アニーリング（ＳＳＡ）及び切断誘導性複製が含まれ、これらは、ＨＲと比較してより短い配列相同性を必要とする。ニック（一本鎖切断）に対する相同組換え修復は、二本鎖切断に対するＨＤＲと異なる機構で起こり得る（ＤａｖｉｓａｎｄＭａｉｚｅｌｓ．ＰＮＡＳ（００２７－８４２４），１１１（１０），ｐ．Ｅ９２４－Ｅ９３２）。

「相同性」は、類似するＤＮＡ配列を意味する。例えば、ドナーＤＮＡ上で見出される「ゲノム領域に対する相同領域」とは、細胞又は生物体ゲノムの所与の「ゲノム領域」と類似する配列を有するＤＮＡの領域のことである。相同領域は、切断される標的部位での相同組換えを促進するのに十分な任意の長さであり得る。例えば、相同領域は、この相同領域が、対応するゲノム領域との相同組換えを受けるのに十分な相同性を有するように、少なくとも５～１０、５～１５、５～２０、５～２５、５～３０、５～３５、５～４０、５～４５、５～５０、５～５５、５～６０、５～６５、５～７０、５～７５、５～８０、５～８５、５～９０、５～９５、５～１００、５～２００、５～３００、５～４００、５～５００、５～６００、５～７００、５～８００、５～９００、５～１０００、５～１１００、５～１２００、５～１３００、５～１４００、５～１５００、５～１６００、５～１７００、５～１８００、５～１９００、５～２０００、５～２１００、５～２２００、５～２３００、５～２４００、５～２５００、５～２６００、５～２７００、５～２８００、５～２９００、５～３０００、５～３１００個又はより多い塩基の長さを含むことができる。「十分な相同性」は、２種のポリヌクレオチド配列が相同組換え反応のための基質として作用するのに十分な構造的類似性を有することを示す。この構造的類似性には、各ポリヌクレオチド断片の全長及びポリヌクレオチドの配列類似性が含まれる。配列類似性は、配列の全長にわたる配列同一性パーセント並びに／又は１００％配列同一性を有する連続ヌクレオチドなどの局在化した類似性を含む保存領域及び配列の長さの一部にわたる配列同一性パーセントで説明することができる。

標的及びドナーポリヌクレオチドにより共有される相同性又は配列同一性の量は、多様であり得、約１～２０ｂｐ、２０～５０ｂｐ、５０～１００ｂｐ、７５～１５０ｂｐ、１００～２５０ｂｐ、１５０～３００ｂｐ、２００～４００ｂｐ、２５０～５００ｂｐ、３００～６００ｂｐ、３５０～７５０ｂｐ、４００～８００ｂｐ、４５０～９００ｂｐ、５００～１０００ｂｐ、６００～１２５０ｂｐ、７００～１５００ｂｐ、８００～１７５０ｂｐ、９００～２０００ｂｐ、１～２．５ｋｂ、１．５～３ｋｂ、２～４ｋｂ、２．５～５ｋｂ、３～６ｋｂ、３．５～７ｋｂ、４～８ｋｂ、５～１０ｋｂの範囲で単位整数値を有する全長及び／又は全領域を含むか、又は最大で標的部位の全長を含む。これらの範囲には、この範囲内の全ての整数が含まれ、例えば、１～２０ｂｐの範囲には、１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９及び２０ｂｐが含まれる。相同性の量は、２種のポリヌクレオチドの完全にアラインされた長さ全体にわたる配列同一性パーセントで記載することもでき、それには、少なくとも約５０％、５５％、６０％、６５％、７０％、７１％、７２％、７３％、７４％、７５％、７６％、７７％、７８％、７９％、８０％、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％の配列同一性パーセントが含まれる。十分な相同性は、ポリヌクレオチドの長さと、全体的な配列同一性パーセントと、任意選択的に連続ヌクレオチドの保存領域又は局所的な配列同一性パーセントとの任意の組合せを含み、例えば、十分な相同性は、標的遺伝子座の領域に対して少なくとも８０％の配列同一性を有する７５～１５０ｂｐの領域と説明することができる。十分な相同性は、高ストレンジェンシー条件下で特異的にハイブリダイズする２つのポリヌクレオチドの予測能力によっても説明することができ、例えばＳａｍｂｒｏｏｋｅｔａｌ．，（１９８９）ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ，（ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙＰｒｅｓｓ，ＮＹ）；ＣｕｒｒｅｎｔＰｒｏｔｏｃｏｌｓｉｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ，Ａｕｓｕｂｅｌｅｔａｌ．，Ｅｄｓ（１９９４）ＣｕｒｒｅｎｔＰｒｏｔｏｃｏｌｓ，（ＧｒｅｅｎｅＰｕｂｌｉｓｈｉｎｇＡｓｓｏｃｉａｔｅｓ，Ｉｎｃ．ａｎｄＪｏｈｎＷｉｌｅｙ＆Ｓｏｎｓ，Ｉｎｃ．）；及びＴｉｊｓｓｅｎ（１９９３）ＬａｂｏｒａｔｏｒｙＴｅｃｈｎｉｑｕｅｓｉｎＢｉｏｃｈｅｍｉｓｔｒｙａｎｄＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ－－ＨｙｂｒｉｄｉｚａｔｉｏｎｗｉｔｈＮｕｃｌｅｉｃＡｃｉｄＰｒｏｂｅｓ，（Ｅｌｓｅｖｉｅｒ，ＮｅｗＹｏｒｋ）を参照されたい。

本明細書で使用する場合、「ゲノム領域」とは、標的部位のいずれかの側上に存在する、細胞のゲノム中の染色体のセグメントのことであるか、又は代わりに標的部位の一部も含むセグメントのことである。このゲノム領域は、このゲノム領域が対応する相同領域との相同組換えを受けるのに十分な相同性を有するように、少なくとも５～１０、５～１５、５～２０、５～２５、５～３０、５～３５、５～４０、５～４５、５～５０、５～５５、５～６０、５～６５、５～７０、５～７５、５～８０、５～８５、５～９０、５～９５、５～１００、５～２００、５～３００、５～４００、５～５００、５～６００、５～７００、５～８００、５～９００、５～１０００、５～１１００、５～１２００、５～１３００、５～１４００、５～１５００、５～１６００、５～１７００、５～１８００、５～１９００、５～２０００、５～２１００、５～２２００、５～２３００、５～２４００、５～２５００、５～２６００、５～２７００、５～２８００、５～２９００、５～３０００、５～３１００個又はそれを超える塩基を含むことができる。

所定のゲノム領域と、ドナーＤＮＡ上で見出される対応する相同性領域との間の構造的類似性は、相同組換えが発生することを可能にする任意の程度の配列同一性であり得る。例えば、ドナーＤＮＡの「相同領域」及び生物体ゲノムの「ゲノム領域」によって共有される相同性又は配列同一性の量は、それらの配列が相同組換えを受けるように、少なくとも５０％、５５％、６０％、６５％、７０％、７５％、８０％、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％又は１００％の配列同一性であり得る。

ドナーＤＮＡ上の相同領域は、標的部位に隣接する任意の配列に対する相同性を有する可能性がある。いくつかの例では、相同領域は、標的部位に直接隣接するゲノム配列に対して相当の配列相同性を共有するが、この相同領域を、標的部位に対してさらに５’又は３’であり得る領域に対して十分な相同性を有するように設計できることが認識される。相同領域は、下流のゲノム領域に加えて、標的部位の断片との相同性も有することができる。

一実施形態では、第１の相同領域は、標的部位の第１の断片をさらに含み、第２の相同領域は、標的部位の第２の断片を含み、これらの第１の断片及び第２の断片は、異なる。

本明細書で使用する場合、「相同組換え」には、相同性部位で２つのＤＮＡ分子間のＤＮＡ断片の交換が含まれる。相同組換えの頻度は、いくつかの因子によって影響を受ける。様々な生物体は、相同組換えの量及び相同組換え対非相同組換えの相対比率に関して変動する。相同組換えを観察するのに必要となる相同領域（ホモロジーアーム）の長さは、種間で変動する。

例えば、相同組換え（ＨＲ）を介した原核細胞又は生物体細胞のゲノムの改変は、遺伝子操作のための強力なツールである。相同組換えは、他の生物体においても実施されてきた。例えば、寄生原虫であるリーシュマニア（Ｌｅｉｓｈｍａｎｉａ）属における相同組換えのために、少なくとも１５０～２００ｂｐの相同性が必要とされ（ＰａｐａｄｏｐｏｕｌｏｕａｎｄＤｕｍａｓ，（１９９７）ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ２５：４２７８－８６）、１５０～２００ｂｐの相同性は、プロトバクテリアのＥ．コリ（Ｅｃｏｌｉ）における効率的な組換えに必要となる（Ｌｏｖｅｔｔｅｔａｌ（２００２）Ｇｅｎｅｔｉｃｓ１６０：８５１－８５９）。バチルス（Ｂａｃｉｌｌｕｓ）細胞において、わずか７０ｂｐの相同性の長さでも相同組換えに関与できるが、２５ｂｐのホモロジーアームの長さでは不可能である（ＫａｈｓａｎｏｖＦＫｅｔａｌＭｏｌＧｅｎＧｅｎｅｔｉｃｓ（１９９２）２３４：４９４－４９７）。

遺伝子発現カセットの複数のコピーの導入
酵素産生のためのバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）宿主の開発におけるボトルネックの１つは、染色体における複数コピーの酵素発現カセットの抗生物質耐性マーカー（ＡＲＭ）を含まない組込みである。組込みベクター、Ｃｒｅ／ｌｏｘＰシステム及び栄養要求性マーカーを使用するなどの既存の手法は、多くの時間を要し、編集効率が比較的低い。

本明細書に記載される方法は、上流のホモロジーアーム（ＨＲ１）及び下流のアーム（ＨＲ２）によって隣接されるドナーＤＮＡを使用して目的の遺伝子（目的の遺伝子発現カセット）の複数のコピーの組込みを可能にし、各ホモロジーアームは、１０００を超えるヌクレオチド長であり、高い効率の遺伝子組込みをもたらす。

複数コピーの遺伝子発現カセット又は複数コピーの発現カセットは、本明細書で互換的に使用され、少なくとも１つの目的の遺伝子を含む同じ発現カセットの複数のコピーを指す。一態様では、前記遺伝子発現カセットの複数のコピーは、２コピー、３コピー、４コピー、５コピー、６コピー、７コピー、８コピー、９コピー及び最大で１０コピーからなる群から選択される。

一態様では、前記遺伝子発現カセットの複数のコピーは、２コピー、３コピー、４コピー、５コピー、６コピー、７コピー、８コピー、９コピー及び最大で１０コピーからなる群から選択される。

多重化
本明細書におけるターゲティング法は、例えば、この方法で２つ以上のＤＮＡ標的部位が標的化されるように実施することができる。そのような方法は、任意選択により、多重法として特徴付けられ得る。特定の実施形態では、２つ、３つ、４つ、５つ、６つ、７つ、８つ、９つ、１０又はそれを超える標的部位が同時に標的化され得る。多重法は、通常、複数の異なるＲＮＡ成分（そのそれぞれは、ガイドポリヌクレオチド／Ｃａｓエンドヌクレアーゼ複合体を固有のＤＮＡ標的部位に誘導するように設計されている）が提供される、本明細書におけるターゲティング法により実施される。

定義
他に定義されていない限り、本明細書で使用する全ての技術用語及び科学用語は、本発明の組成物及び方法が属する技術分野の当業者が一般に理解する意味と同一の意味を有する。

「対立遺伝子」又は「対立遺伝子バリアント」は、染色体上の所定の遺伝子座を占有する遺伝子の数種の代替形の１つである。染色体上の所定の遺伝子座に存在する対立遺伝子全部が同一である場合、その生物は、その遺伝子座でホモ接合性である。染色体上の所定の遺伝子座に存在する対立遺伝子が異なる場合、その生物は、その遺伝子座でヘテロ接合性である。ポリペプチドの対立遺伝子バリアントは、遺伝子の対立遺伝子バリアントによってコードされるポリペプチドである。

本明細書で使用する場合、「宿主細胞」は、新たに導入されるＤＮＡ配列のための宿主又は発現媒体として作用する能力を有する細胞を指す。したがって、本開示の特定の実施形態では、宿主細胞は、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞である。

「組換え宿主細胞」（「遺伝子改変宿主細胞」とも呼ばれる）は、異種核酸、例えば組換えＤＮＡコンストラクトが導入されているか、又は本明細書に記載されるガイドＲＮＡ／Ｃａｓエンドヌクレアーゼ系などのゲノム改変系が導入されており、それを含む宿主細胞である。例えば、対象の細菌宿主細胞は、好適なバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞への外来核酸（例えば、プラスミド又は環状組換えＤＮＡコンストラクト）の導入により、遺伝子改変バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞を含む。

本明細書で定義されるとおり、「親細胞」又は「親（宿主）細胞」は、互換的に使用され得、「未改変」親細胞を指す。例えば、「親」細胞は、「親」細胞のゲノムが（例えば、親細胞に導入された１つ以上の変異／改変によって）変更されて、その改変「娘」細胞を生成する微生物の任意の細胞又は株を指す。

本明細書で使用する場合、「改変細胞」又は「改変（宿主）細胞」は、互換的に使用され得、改変細胞が由来する「親」宿主細胞中に存在しない少なくとも１つの遺伝子改変を含む組換え（宿主）細胞を指す。

本明細書で使用する場合、「バチルス（Ｂａｃｉｌｌｕｓ）属」又は「バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）」細胞には、当業者に知られる「バチルス（Ｂａｃｉｌｌｕｓ）」属内の全ての種、例えば、以下に限定されないが、バチルス・サブチリス（Ｂａｃｉｌｌｕｓｓｕｂｔｉｌｉｓ）、バチルス・リケニフォルミス（Ｂａｃｉｌｌｕｓｌｉｃｈｅｎｉｆｏｒｍｉｓ）、バチルス・レンツス（Ｂａｃｉｌｌｕｓｌｅｎｔｕｓ）、バチルス・ブレビス（Ｂａｃｉｌｌｕｓｂｒｅｖｉｓ）、バチルス・ステアロサーモフィルス（Ｂａｃｉｌｌｕｓｓｔｅａｒｏｔｈｅｒｍｏｐｈｉｌｕｓ）、バチルス・アルカロフィルス（Ｂａｃｉｌｌｕｓａｌｋａｌｏｐｈｉｌｕｓ）、バチルス・アミロリケファシエンス（Ｂａｃｉｌｌｕｓａｍｙｌｏｌｉｑｕｅｆａｃｉｅｎｓ）、バチルス・クラウシイ（Ｂａｃｉｌｌｕｓｃｌａｕｓｉｉ）、バチルス・ハロデュランス（Ｂａｃｉｌｌｕｓ．ｈａｌｏｄｕｒａｎｓ）、バチルス・メガテリウム（Ｂａｃｉｌｌｕｓ．ｍｅｇａｔｅｒｉｕｍ）、バチルス・コアギュランス（Ｂａｃｉｌｌｕｓｃｏａｇｕｌａｎｓ）、バチルス・サーキュランス（Ｂａｃｉｌｌｕｓｃｉｒｃｕｌａｎｓ）、バチルス・ラウツス（Ｂａｃｉｌｌｕｓｌａｕｔｕｓ）及びバチルス・チューリンギエンシス（Ｂａｃｉｌｌｕｓｔｈｕｒｉｎｇｉｅｎｓｉｓ）が含まれる。バチルス（Ｂａｃｉｌｌｕｓ）属が分類学的再編成を受け続けていることは、認識されている。したがって、この属は、再分類された種、例えば、限定はしないが、現在、「ゲオバチルス・ステアロサーモフィルス（Ｇｅｏｂａｃｉｌｌｕｓｓｔｅａｒｏｔｈｅｒｍｏｐｈｉｌｕｓ）」と称されているＢ．ステアロサーモフィルス（Ｂ．ｓｔｅａｒｏｔｈｅｒｍｏｐｈｉｌｕｓ）などの生物体を含むものとする。

本明細書で使用する場合、用語「増加した」は、量又は活性の増加が比較されている量又は活性より少なくとも１％、２％、３％、４％、５％、６％、７％、８％、９％、１０％、１１％、１２％、１３％、１４％、１５％、１６％、１７％、１８％、１９％、２０％、２５％、３０％、３５％、４０％、４５％、５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、１００％又は少なくとも約２、３、４、５、６、７、８、９、１０、１１、１２、１３，１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、５０、６０、７０、８０、９０、１００、１１０、１２０、１３０、１４０、１５０、１６０、１７０、１８０、１９０、２００、２１０、２２０、２３０、２４０、２５０、２６０、２７０、２８０、２９０、３００、３１０、３２０、３３０、３４０、３５０、３６０、３７０、３８０、３９０，４００、４１０、４２０，４３０、４４０、４４０、４５０、４６０、４７０、４８０、４９０若しくは５００倍多い量又は活性を指し得る。用語「増加した」、「～より大きい」及び「改善された」は、本明細書で互換的に使用される。用語「増加した」は、本明細書に記載される対照方法と比較して、本明細書に記載される多成分の方法によって得られる形質転換又は遺伝子編集効率を特徴付けるために使用され得る。

一態様では、増加は、目的の遺伝子を含むドナーＤＮＡ配列を含む線状組換えＤＮＡコンストラクトを使用することによって得られる、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞への目的の遺伝子の組込み効率の増加であり、前記ドナーＤＮＡ配列は、上流のホモロジーアーム（ＨＲ１）及び下流のアーム（ＨＲ２）によって隣接され、各ホモロジーアームは、１０００ヌクレオチドの短いホモロジーアームを有する対照組換えＤＮＡによって得られるバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞への前記目的の遺伝子の組込み効率と比較して、１０００ヌクレオチドを超える長さである。一態様では、増加は、少なくとも約２、３、４、５、６、７、８、９、１０、１１、１２、１３，１４、１５、１６、１７、１８、１９、２０、２１～最大で２３倍の組込み効率における増加である。

本明細書で使用する場合、用語「組込み効率」は、そのゲノムに組み込まれる目的の所望の遺伝子を有する形質転換された細胞の数を、形質転換された細胞の総数で割ることによって定義される。この数に１００を掛けて、％としてそれを表すことができる。
組込み効率（％）＝（ゲノムに組み込まれる目的の遺伝子を有する形質転換された細胞の数／形質転換された細胞の総数）＊１００。

用語「保存ドメイン」又は「モチーフ」は、進化的に関連するタンパク質のアラインメントされた配列に沿って特定位置で保存された１セットのアミノ酸を意味する。他の位置のアミノ酸は、相同タンパク質間で変動し得る一方、特定の位置に高度に保存されるアミノ酸は、タンパク質の構造、安定性又は活性に必須のアミノ酸を示す。それらは、そのタンパク質ホモログのファミリーのアラインされた配列の高い保存度によって同定されるため、新しく決定された配列を有するタンパク質が予め同定されたタンパク質ファミリーに属するか否かを決定する識別子又は「シグネチャー」として使用することができる。

本明細書で使用する場合、「核酸」は、ポリヌクレオチドを意味し、デオキシリボヌクレオチド塩基又はリボヌクレオチド塩基の一本鎖又は二本鎖ポリマーを含む。核酸は、断片及び修飾ヌクレオチドも含み得る。したがって、用語「ポリヌクレオチド」、「核酸配列」、「ヌクレオチド配列」及び「核酸断片」は、一本鎖又は二本鎖であるＲＮＡ、及び／又はＤＮＡ、及び／又はＲＮＡ－ＤＮＡのポリマーを示すために互換的に使用され、任意選択により合成ヌクレオチド塩基、非天然ヌクレオチド塩基又は改変ヌクレオチド塩基を含有する。ヌクレオチド（通常、５’－一リン酸塩形態で見出される）は、単一文字表示により、以下のように称される：アデノシン又はデオキシアデノシン（それぞれＲＮＡ又はＤＮＡに対して）に対して「Ａ」、シトシン又はデオキシシトシンに対して「Ｃ」、グアノシン又はデオキシグアノシンに対して「Ｇ」、ウリジンに対して「Ｕ」、デオキシチミジンに対して「Ｔ」、プリン（Ａ又はＧ）に対して「Ｒ」、ピリミジン（Ｃ又はＴ）に対して「Ｙ」、Ｇ又はＴに対して「Ｋ」、Ａ又はＣ又はＴに対して「Ｈ」、イノシンに対して「Ｉ」及び任意のヌクレオチドに対して「Ｎ」（例えば、ＤＮＡ配列について言及する場合、Ｎは、Ａ、Ｃ、Ｔ又はＧであり得；ＲＮＡ配列について言及する場合、Ｎは、Ａ、Ｃ、Ｕ又はＧであり得る）。

本明細書に記載されるポリヌクレオチド（又は核酸分子）は、「遺伝子」、「ベクター」及び「プラスミド」を含むことが理解される。

用語「遺伝子」は、あるタンパク質のコード配列の全て又は一部を含む特定のアミノ酸配列などであるが、これらに限定されない機能的な分子をコードするポリヌクレオチドを指し、例えば遺伝子が発現される条件を決定するプロモーター配列などの調節（非転写）配列を含み得る。遺伝子の転写領域は、イントロン、５’－非翻訳領域（ＵＴＲ）及び３’－ＵＴＲを含む非翻訳領域（ＵＴＲ）並びにコード配列を含み得る。「天然遺伝子」は、それ自体の調節配列とともに天然に見出される遺伝子を指す。

「コドン改変遺伝子」、又は「コドン優先遺伝子」、又は「コドン最適化遺伝子」とは、宿主細胞の好ましいコドン使用頻度を模倣するように設計されているコドン使用頻度を有する遺伝子のことである。遺伝子をコドン最適化するために行われる核酸変更は、親遺伝子のコードされるポリペプチドのアミノ酸配列を変更しないことを意味する「同義」である。しかしながら、天然遺伝子及びバリアント遺伝子の両方を特定の宿主細胞用にコドン最適化することができ、したがって、これに関して、制限は、意図されていない。コドン優先遺伝子を合成するための方法は、当技術分野で利用可能である。例えば、米国特許第５，３８０，８３１号明細書及び同第５，４３６，３９１号明細書並びにＭｕｒｒａｙｅｔａｌ．（１９８９）ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．１７：４７７－４９８（参照により本明細書に組み込まれる）を参照されたい。

宿主生物体中で遺伝子発現を増強するために、追加の配列改変が知られる。これらとしては、例えば、疑似のポリアデ二ル化シグナルをコードする１つ以上の配列の除去、１つ以上のエクソン－イントロンスプライス部位シグナルの除去、１つ以上のトランスポゾン様リピートの除去及び遺伝子発現に有害である可能性のあるそうしたよく特徴付けられた他の配列の除去が挙げられる。配列のＧ－Ｃ含有量は、宿主細胞中で発現する既知の遺伝子を参照することによって算出される、所与の宿主生物体の平均的なレベルに調節され得る。可能な場合、１つ以上のｍＲＮＡの予測されるヘアピン二次構造を避けるために配列を改変する。

本明細書で使用する場合、用語「コード配列」は、その（コードされた）タンパク質産物のアミノ酸配列を直接的に指定するヌクレオチド配列を指す。コード配列の境界は、一般にオープンリーディングフレーム（以下では「ＯＲＦ」）によって決定され、それは、通常、ＡＴＧ開始コドンで開始する。コード配列には、通常、ＤＮＡ、ｃＤＮＡ及び組換えヌクレオチド配列が含まれる。

本明細書で定義する場合、「オープンリーディングフレーム」（以下では「ＯＲＦ」）という用語は、（ｉ）開始コドン、（ｉｉ）アミノ酸を示す一連の２以上のコドン、及び（ｉｉｉ）終結コドンからなる連続するリーディングフレームを含む核酸又は核酸配列（天然に存在するか、天然に存在しないか、又は合成であるかにかかわらず）を意味し、ＯＲＦは、５’から３’の方向に読まれる（又は翻訳される）。

本明細書で使用する場合、用語「染色体組込み」は、目的のポリヌクレオチドがバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）染色体に組み込まれるプロセスを指す。線状ドナーＤＮＡコンストラクト（ホモロジーアームによって隣接される線状ドナーＤＮＡ）のホモロジーアームは、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）染色体の相同領域と整列されることになる。その後、ホモロジーアーム間の配列は、２つの交差（すなわち相同組換え）において目的のポリヌクレオチドによって置き換えられる。

「調節配列」は、コード配列の上流（５’非コード配列）、コード配列内又はコード配列の下流（３’非コード配列）に位置するヌクレオチド配列を指し、それは、関連するコード配列の転写、ＲＮＡプロセシング若しくは安定性又は翻訳に影響を及ぼす。調節配列としては、以下に限定されないが、プロモーター、翻訳リーダー配列、５’非翻訳配列、３’非翻訳配列、イントロン、ポリアデニル化標的配列、ＲＮＡプロセシング部位、エフェクター結合部位及びステムループ構造が挙げられる。

本明細書で使用する場合、用語「プロモーター」は、コード配列又は機能的ＲＮＡの発現を制御できる核酸配列を指す。一般に、コード配列は、プロモーター配列の３’（下流）に位置する。プロモーターは、それらの全体が天然遺伝子に由来し得るか、又は天然に見出される種々のプロモーターに由来する種々のエレメントから構成され得るか、又はさらに合成核酸セグメントを含み得る。種々のプロモーターは、種々の細胞型において、又は種々の発生段階において、又は種々の環境若しくは生理的条件に応答して、遺伝子の発現を指示し得ることが当業者に理解される。大多数の場合にほとんどの細胞型で遺伝子の発現をもたらすプロモーターは、一般に、「構成的プロモーター」と呼ばれる。ほとんどの場合、調節配列の正確な境界は、完全には明らかになっていないため、種々の長さのＤＮＡ断片が同一プロモーター活性を有し得ることがさらに認識されている。

「作動可能に連結される」は、２つ以上のエレメント間の機能的連結を意味するものとする。例えば、目的のポリヌクレオチドと調節配列（例えば、プロモーター）との間の作動可能な連結は、目的のポリヌクレオチドの発現を可能にする機能的連結である（すなわち、目的のポリヌクレオチドは、プロモーターの転写制御下にある）。作動可能に連結したエレメントは、連続的又は非連続的であり得る。コード配列（例えば、ＯＲＦ）は、センス又はアンチセンス方向で調節配列に作動可能に連結され得る。２つのタンパク質コード領域の結合を指すために使用される場合、コード領域が同じリーディングフレームに存在することは、作動可能に連結されることによって意図される。

核酸は、それが別の核酸配列と機能的関連性に置かれている場合、「作動可能に連結されて」いる。例えば、分泌リーダー（すなわちシグナルペプチド）をコードするＤＮＡは、ポリペプチドの分泌に関与するプレタンパク質として発現している場合、ポリペプチドのためのＤＮＡに作動可能に連結しているか；プロモーター又はエンハンサーは、それが配列の転写に影響を及ぼす場合、そのコード配列に作動可能に連結しているか；又はリボソーム結合部位は、翻訳を促進するように配置されている場合、コード配列に作動可能に連結している。一般に、「作動可能に連結された」は、連結されているＤＮＡ配列が連続していること及び分泌リーダーの場合、連続しており且つ読み取り枠内にあることを意味する。しかしながら、エンハンサーは、隣接している必要はない。連結は、便宜的な制限部位でのライゲーションによって行われる。そのような部位が存在しない場合、従来の手法に従い、合成オリゴヌクレオチドアダプター又はリンカーが使用される。

本明細書で使用する場合、「目的のタンパク質コード配列の遺伝子に連結した目的の遺伝子の発現を制御する機能的プロモーター配列（又はそれらのオープンリーディングフレーム）」は、バチルス属（Ｂａｃｉｌｌｕｓ）におけるコード配列の転写及び翻訳を制御するプロモーター配列を指す。例えば、特定の実施形態では、本開示は、５’プロモーター（又は５’プロモーター領域若しくはタンデム５’プロモーターなど）を含むポリヌクレオチドであって、そのプロモーター領域は、目的のタンパク質をコードする核酸配列に作動可能に連結している、ポリヌクレオチドを対象とする。したがって、特定の実施形態では、機能的プロモーター配列は、目的のタンパク質をコードする目的の遺伝子の発現を制御する。他の実施形態では、機能的プロモーター配列は、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞における目的のタンパク質をコードする異種遺伝子又は内在性遺伝子の発現を制御する。

プロモーター配列は、近位及びより遠位の上流エレメントからなり、後者のエレメントは、エンハンサーと称されることが多い。「エンハンサー」は、プロモーター活性を刺激することができるＤＮＡ配列であり、プロモーターの固有のエレメントであり得るか、又はプロモーターのレベル若しくは組織特異性を増強するために挿入された異種エレメントであり得る。

本明細書で開示される線状組換えＤＮＡ及び環状組換えＤＮＡは、当技術分野において知られる任意の方法を使用してバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞に導入され得る。

本明細書で定義する場合、「導入する」という用語は、少なくとも１つの組換えＤＮＡ、ポリヌクレオチド又はその遺伝子若しくはそのベクターを「細菌細胞に導入する」又は「バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞に導入する」などの句で使用する場合、ポリヌクレオチドを細胞に導入するための当技術分野で知られる方法を含み、こうした方法としては、以下に限定されないが、プロトプラスト融合、天然又は人工形質転換（例えば、塩化カルシウム、エレクトロポレーション、熱ショック）、形質導入、トランスフェクション、接合などが挙げられる（例えば、Ｆｅｒｒａｒｉｅｔａｌ．，１９８９を参照されたい）。

「導入する」は、成分が生物体の細胞の内部又は細胞自体へ侵入するような方法において、細胞又は生物体などの生物体に、本明細書で開示される線状組換えＤＮＡ及び／又は環状組換えＤＮＡを提供することを意味することが意図される。方法及び組成物は、生物体又は細胞に配列を導入するための特定の方法に依存せず、この生物体の少なくとも１つの細胞の内部に、本明細書で開示される線状組換えＤＮＡ及び／又は環状組換えＤＮＡを単に侵入させるのみである。導入することは、核酸が細胞のゲノム内に組み込まれ得る（統合され得る）、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞内への核酸の組込みに関する言及を含み、且つ細胞への核酸の一過性（直接的）提供についての言及を含む。

細胞又は生物体にポリヌクレオチド、発現カセット、組換えＤＮＡを導入するための方法は、当技術分野において知られており、自然形質転換能（国際公開第２０１７／０７５１９５号パンフレット、国際公開第２００２／１４４９０号パンフレット及び国際公開第２００８／７９８９号パンフレットに記載されるとおり）、マイクロインジェクション（Ｃｒｏｓｓｗａｙｅｔａｌ．，（１９８６）Ｂｉｏｔｅｃｈｎｉｑｕｅｓ４：３２０－３４及び米国特許第６，３００，５４３号明細書）、メリステム形質転換（米国特許第５，７３６，３６９号明細書）、エレクトロポレーション（Ｒｉｇｇｓｅｔａｌ．，（１９８６）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ８３：５６０２－６）、安定形質転換法、一過性形質転換法、弾道粒子加速法（微粒子銃）（米国特許第４，９４５，０５０号明細書；同第５，８７９，９１８号明細書；同第５，８８６，２４４号明細書；同第５，９３２，７８２号明細書）、ウイスカー媒介性形質転換（Ａｉｎｌｅｙｅｔａｌ．２０１３，ＰｌａｎｔＢｉｏｔｅｃｈｎｏｌｏｇｙＪｏｕｒｎａｌ１１：１１２６－１１３４；ＳｈａｈｅｅｎＡ．ａｎｄＭ．Ａｒｓｈａｄ２０１１ＰｒｏｐｅｒｔｉｅｓａｎｄＡｐｐｌｉｃａｔｉｏｎｓｏｆＳｉｌｉｃｏｎＣａｒｂｉｄｅ（２０１１），３４５－３５８Ｅｄｉｔｏｒ（ｓ）：Ｇｅｒｈａｒｄｔ，Ｒｏｓａｒｉｏ．Ｐｕｂｌｉｓｈｅｒ：ＩｎＴｅｃｈ，Ｒｉｊｅｋａ，Ｃｒｏａｔｉａ．ＣＯＤＥＮ：６９ＰＱＢＰ；ＩＳＢＮ：９７８－９５３－３０７－２０１－２）、アグロバクテリウム（Ａｇｒｏｂａｃｔｅｒｉｕｍ）媒介性形質転換（米国特許第５，５６３，０５５号明細書及び同第５，９８１，８４０号明細書）、直接的遺伝子移入（Ｐａｓｚｋｏｗｓｋｉｅｔａｌ．，（１９８４）ＥＭＢＯＪ３：２７１７－２２）、ウイルス媒介性導入（米国特許第５，８８９，１９１号明細書、同第５，８８９，１９０号明細書、同第５，８６６，７８５号明細書、同第５，５８９，３６７号明細書及び同第５，３１６，９３１号明細書）、トランスフェクション、形質導入、細胞透過性ペプチド、メソポーラスシリカナノ粒子（ＭＳＮ）媒介性の直接的タンパク質送達、局所適用、雄雌交雑、雌雄育種及びこれらの任意の組合せを含むが、これらに限定されない。安定形質転換は、生物体に導入されたヌクレオチドコンストラクトが生物体のゲノムに組み込まれ、その子孫に受け継がれ得ることを意味することが意図される。一過性形質転換は、ポリヌクレオチドが生物体に（直接的又は間接的に）導入されるが、この生物体のゲノムに組み込まれないか、又はポリペプチドが生物体に導入されることを意味することが意図される。一過性形質転換は、導入された組成物は、生物体内で一時的にのみ発現又は存在することを示す。

ゲノムの標的部位又はその近傍への挿入がなされたそれらの細胞を同定するために様々な方法が利用可能である。そのような方法は、ＰＣＲ法、シークエンシング法、ヌクレアーゼ消化法、サザンブロット法及びそれらの任意の組合せを含むが、これらに限定されない、標的配列内の何らかの変化を検出するために標的配列を直接的に分析することであるとみなすことができる。例えば、本明細書に記載される方法に必要な範囲で参照により本明細書に組み込まれる米国特許出願第１２／１４７，８３４号明細書を参照されたい。方法は、ゲノムに組み込まれた目的のポリヌクレオチドを含む細胞から生物体を回収することも含む。

用語「ゲノム」、細菌（宿主）細胞「ゲノム」又はバチルス（Ｂａｃｉｌｌｕｓ）（宿主）細胞「ゲノム」は、核内に見出される染色体ＤＮＡのみならず、細胞の細胞内成分内に見出されるオルガネラＤＮＡ（染色体外ＤＮＡ）を含む。

本明細書で使用する場合、用語「プラスミド」、「ベクター」及び「カセット」は、多くの場合、細胞の中心的な代謝に通常関与しない遺伝子を有し、通常、二本鎖ＤＮＡ分子の形態の染色体外エレメントを指す。そのようなエレメントは、任意の供給源に由来する、線状又は環状の一本鎖又は二本鎖のＤＮＡ又はＲＮＡである自己複製配列、ゲノム組込み配列ファージ又はヌクレオチド配列であり得、ここで、いくつかのヌクレオチド配列は、選択された遺伝子産物のためのプロモーター断片及びＤＮＡ配列を適切な３’非翻訳配列とともに細胞に導入することができる固有の構成に結合又は組み換えられている。

用語「ベクター」は、細胞内で複製（増殖）することができ、新たな遺伝子又はＤＮＡセグメントを細胞中に運ぶことができる任意の核酸を含む。ベクターとしては、「エピソーム」（すなわち自律的に複製するか、又は宿主生物体の染色体に組み込むことができる）である、ウイルス、バクテリオファージ、プロウイルス、プラスミド、ファージミド、トランスポゾン及びＢＡＣ（細菌人工染色体）などの人工染色体が挙げられる。

用語「発現カセット」及び「発現ベクター」は、細胞内の特定の核酸の転写を許容する一連の特定の核酸要素を用いて、組換え的又は合成的に生成された核酸コンストラクトを指す。組換え発現カセットは、プラスミド、染色体、ミトコンドリアＤＮＡ、プラスチドＤＮＡ、ウイルス又は核酸断片内に組み込むことができる。通常、発現ベクターの組換え発現カセット部分には、他の配列の中でも、転写対象の核酸配列及びプロモーターが含まれる。いくつかの実施形態では、ＤＮＡコンストラクトには、標的細胞内の特定の核酸の転写を許容する一連の特定の核酸要素も含まれる。特定の実施形態では、本開示のＤＮＡコンストラクトは、本明細書で定義する選択マーカー及び不活化染色体若しくは遺伝子セグメント又はＤＮＡセグメントを含む。多数の原核生物発現ベクターが市販されており、当業者に知られている。適切な発現ベクターの選択は、当業者の知識の範囲内である。

本明細書で使用する場合、「ターゲティングベクター」は、その中にターゲティングベクターが形質転換される宿主細胞の染色体内の領域に相同なポリヌクレオチド配列を含み、その領域で相同組換えを駆動できるベクターである。例えば、ターゲティングベクターは、相同組換えによって宿主細胞の染色体に変異を導入する際に使用される。いくつかの実施形態では、ターゲティングベクターは、例えば、末端に付加された他の非相同配列（すなわちスタッファー配列又は隣接配列）を含む。末端は、例えば、ベクターへの挿入などのように、ターゲティングベクターが閉環を形成するように閉じることができる。適切なベクターの選択及び／又は構成は、十分に当業者の知識の範囲内である。

本明細書で使用する場合、用語「プラスミド」は、クローニングベクターとして使用され、且つ多くの細菌及び一部の真核生物において染色体外の自己複製遺伝要素を形成する環状の二本鎖（ｄｓ）ＤＮＡコンストラクトを指す。いくつかの実施形態では、プラスミドは、宿主細胞のゲノムに組み込まれる。

目的のポリヌクレオチドは、本明細書にさらに記載され、商業市場及び酵素の生産（細菌の発酵によって酵素を生産することを介するが、これに限定されない）に関与する人々の関心を反映するポリヌクレオチドを含む。

目的のポリヌクレオチドは、１つ以上の目的のタンパク質をコードできる。それは、他の生体機能を有し得る。目的のポリヌクレオチドは、形質転換されることになるバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノム、すなわち同種又は異種配列のいずれかに既に存在しても又はしなくてもよい。

目的のヌクレオチドは、標的化される目的の遺伝子配列に関するメッセンジャーＲＮＡ（ｍＲＮＡ）の少なくとも一部に相補的なアンチセンス配列を含み得る。アンチセンスヌクレオチドは、対応するｍＲＮＡとハイブリダイズするように構成されている。アンチセンス配列は、その配列が対応するｍＲＮＡにハイブリダイズして、その発現を妨げる限り、改変され得る。この方法において、対応するアンチセンス配列に対して７０％、８０％又は８５％の配列同一性を有するアンチセンス構築物を使用し得る。さらに、アンチセンスヌクレオチドの部分は、標的遺伝子の発現を妨げるために使用され得る。一般に、少なくとも５０ヌクレオチド、１００ヌクレオチド、２００ヌクレオチド又はそれを超える配列が使用され得る。

さらに、目的のポリヌクレオチドは、生物体の内在性遺伝子の発現を抑制するセンス方向でも使用され得る。センス方向のポリヌクレオチドを使用して生物体の遺伝子発現を抑制するための方法は、当技術分野で知られている。この方法には、一般に、内在性遺伝子の転写に対応するヌクレオチド配列の少なくとも一部に作動可能に連結した、生物体内での発現を駆動するプロモーターを含むＤＮＡコンストラクトで生物体を形質転換することが含まれる。通常、そのようなヌクレオチド配列は、内在性遺伝子の転写配列に対する実質的な配列同一性、一般に約６５％を超える配列同一性、約８５％を超える配列同一性又は約９５％を超える配列同一性を有する。米国特許第５，２８３，１８４号明細書及び同第５，０３４，３２３号明細書（参照により本明細書に組み込まれる）を参照されたい。

表現型マーカーは、陽性選択マーカーであるか又は陰性選択マーカーであるかにかかわらず、視覚マーカー及び選択マーカーを含むスクリーニング可能又は選択マーカーである。任意の表現型マーカーを使用することができる。詳細には、選択マーカー又はスクリーニング可能マーカーは、多くの場合に特定の条件下において、１つの分子若しくはそれを含有する細胞を同定するか、又はこの分子若しくは細胞に有利若しくは不利に選択することを可能にするＤＮＡセグメントを含む。これらのマーカーは、ＲＮＡ、ペプチド若しくはタンパク質の産生などであるが、これらに限定されない活性をコードすることができるか、又はＲＮＡ、ペプチド、タンパク質、無機化合物及び有機化合物若しくは組成物などのための結合部位を提供することができる。

用語「選択マーカー」及び「選択マーカーをコードするヌクレオチド配列」は、（宿主）細胞内で発現することができ、選択マーカーの発現が、発現した遺伝子を含有する細胞に、対応する選択的作用物質の存在下又は必須栄養素の欠如下で増殖する能力を付与するヌクレオチド配列を指す。一態様では、選択マーカーは、ベクターを含有するそれらの宿主の選択を容易にできる、宿主細胞内で発現することができる核酸（例えば、遺伝子）を指す。そのような選択マーカーの例としては、抗菌剤が挙げられるが、これらに限定されない。

用語「選択マーカー」は、宿主細胞が目的の入来ＤＮＡを取り込んだか、又は何らかの他の反応が発生したことの兆候を提供する遺伝子を含む。通常、選択マーカーは、形質転換中に外来配列を受け入れていない細胞から外来ＤＮＡを含有する細胞を区別することを可能にする抗菌剤耐性又は代謝的優位性を宿主細胞に付与する遺伝子である。

「存在する選択マーカー」は、形質転換されることになる微生物の染色体上に位置するものである。存在する可能マーカーは、形質転換ＤＮＡコンストラクト上の選択マーカーと異なる遺伝子をコードする。選択マーカーは、当業者によく知られている。上記で示したように、マーカーは、抗微生物耐性マーカー（例えば、ａｍｐ^Ｒ、ｐｈｌｅｏ^Ｒ、ｓｐｅｃ^Ｒ、ｋａｎ^Ｒ、ｅｒｙ^Ｒ、ｔｅｔ^Ｒ、ｃｍｐ^Ｒ及びｎｅｏ^Ｒ（例えば、Ｇｕｅｒｏｔ－Ｆｌｅｕｒｙ，１９９５；Ｐａｌｍｅｒｏｓｅｔａｌ．，２０００；及びＴｒｉｅｕ－Ｃｕｏｔｅｔａｌ．，１９８３を参照されたい）であり得る。いくつかの実施形態では、本発明は、クロラムフェニコール耐性遺伝子（例えば、ｐＣ１９４上に存在する遺伝子及びバチルス・リケニフォルミス（Ｂａｃｉｌｌｕｓｌｉｃｈｅｎｉｆｏｒｍｉｓ）のゲノム内に存在する耐性遺伝子）を提供する。この耐性遺伝子は、本発明において且つ染色体に組み込まれたカセット及び組込み型プラスミドの染色体増幅を包含する実施形態において特に有用である（例えば、ＡｌｂｅｒｔｉｎｉａｎｄＧａｌｉｚｚｉ，１９８５；ＳｔａｈｌａｎｄＦｅｒｒａｒｉ，１９８４を参照されたい）。本発明に従って有用な他のマーカーとしては、セリン、リシン、トリプトファンなどの栄養要求性マーカー及びβ－ガラクトシダーゼなどの検出マーカーが挙げられるが、これらに限定されない。

目的のポリヌクレオチドは、他の形質と組み合わせて積み重ねられ得るか又は使用され得る遺伝子を含む。

本明細書で使用する場合、用語「ポリペプチド」及び「タンパク質」は、互換的に使用され、ペプチド結合によって連結されたアミノ酸残基を含む任意の長さのポリマーを指す。本明細書では、アミノ酸残基に関して従来の１文字コード又は３文字コードを使用する。ポリペプチドは、直鎖状又は分岐鎖状であり得、改変アミノ酸を含み得、且つ非アミノ酸によって分断され得る。ポリポチペプチドという用語は、自然に又は介入；例えばジスルフィド結合形成、グリコシル化、脂質化、アセチル化、リン酸化若しくは標識化成分との結合などの任意の他の操作若しくは改変によって改変されているアミノ酸ポリマーも包含する。また、この定義の範囲には、例えば、アミノ酸の１つ以上のアナログ（例えば、非天然アミノ酸などを含む）を含有するポリペプチド及び当技術分野において知られる他の改変も含まれる。

用語「目的のタンパク質」又は「ＰＯＩ」は、改変されたバチルス（Ｂａｃｉｌｌｕｓ）（娘）細胞において発現することが所望される目的のポリペプチドを指す。したがって、本明細書で使用する場合、ＰＯＩは、酵素、基質結合タンパク質、表面活性タンパク質、構造タンパク質、受容体タンパク質、抗体などであり得る。

本明細書で使用する場合、「目的の遺伝子」又は「ＧＯＩ」は、ＰＯＩをコードする核酸配列（例えば、ポリヌクレオチド、遺伝子又はＯＲＦ）を指す。「目的のタンパク質」をコードする「目的の遺伝子」は、天然に存在する遺伝子、変異遺伝子又は合成遺伝子であり得る。

特定の実施形態では、本開示の目的の遺伝子は、酵素（例えば、アセチルエステラーゼ、アミノペプチダーゼ、アミラーゼ、アラビナーゼ、アラビノフラノシダーゼ、炭酸脱水酵素、カルボキシペプチダーゼ、カタラーゼ、セルラーゼ、キチナーゼ、キモシン、クチナーゼ、デオキシリボヌクレアーゼ、エピメラーゼ、エステラーゼ、α－ガラクトシダーゼ、β－ガラクトシダーゼ、α－グルカナーゼ、グルカンリザーゼ（ｇｌｕｃａｎｌｙｓａｓｅ）、エンド－β－グルカナーゼ、グルコアミラーゼ、グルコースオキシダーゼ、α－グルコシダーゼ、β－グルコシダーゼ、グルクロニダーゼ、グリコシルヒドロラーゼ、ヘミセルラーゼ、ヘキソースオキシダーゼ、ヒドロラーゼ、インベルターゼ、イソメラーゼ、ラッカーゼ、リパーゼ、リアーゼ、マンノシダーゼ、オキシダーゼ、酸化還元酵素、ペクチン酸リアーゼ、ペクチンアセチルエステラーゼ、ペクチンデポリメラーゼ、ペクチンメチルエステラーゼ、ペクチン分解酵素、ペルヒドロラーゼ、ポリオールオキシダーゼ、ペルオキシダーゼ、フェノールオキシダーゼ、フィターゼ、ポリガラクツロナーゼ、プロテアーゼ、ペプチダーゼ、ラムノ－ガラクツロナーゼ、リボヌクレアーゼ、トランスフェラーゼ、輸送タンパク質、トランスグルタミナーゼ、キシラナーゼ、ヘキソースオキシダーゼ及びこれらの組合せ）などの商業的に関連する工業用の目的のタンパク質をコードする。

「変異」は、核酸配列内の任意の変化又は変更を指す。点変異、欠失変異、サイレント変異、フレームシフト変異、スプライシング変異などを含む数種類の変異が存在する。変異は、特異的に（例えば、部位特異的変異誘発によって）又はランダムに（例えば、化学薬品、修復マイナス細菌株による継代によって）行われ得る。

「変異遺伝子」は、ヒトが介入して改変された遺伝子である。そのような「変異遺伝子」は、少なくとも１個のヌクレオチドの付加、欠失又は置換により、対応する非変異遺伝子の配列と異なる配列を有する。本開示の特定の実施形態では、この変異遺伝子は、本明細書で開示されるとおりのガイドポリヌクレオチド／Ｃａｓタンパク質系の結果として生じる変更を含む。変異細胞又は生物体は、変異遺伝子を含む細胞又は生物体である。

本明細書で使用する場合、「標的化変異」は、誘導型Ｃａｓタンパク質系を含む方法を含む、当業者に知られる任意の方法を使用して標的遺伝子内の標的配列を改変することによって作製された、天然遺伝子を含む、遺伝子（標的遺伝子と呼ばれる）中の変異である。Ｃａｓタンパク質がｃａｓエンドヌクレアーゼである場合、ガイドポリヌクレオチド／Ｃａｓエンドヌクレアーゼ誘導標的化変異は、Ｃａｓエンドヌクレアーゼによって認識及び切断されるゲノム標的部位の内又は外に位置するヌクレオチド配列内で発生し得る。

本明細書で使用する場合、ポリペプチド又はその配列に関連して、用語「置換」は、１つのアミノ酸の別のアミノ酸との置き換え（すなわち置換）を意味する。

本明細書で定義する場合、「内在性遺伝子」は、生物体のゲノム中の天然の位置に存在する遺伝子を指す。

本明細書で使用する場合、ポリヌクレオチド又はポリペプチド配列に関連した「異種」は、外来種を起源とする配列であるか、又は同種からのものであれば、組成及び／又はゲノム遺伝子座が意図的な人的介入により天然の形態から実質的に改変されている配列である。例えば、異種ポリヌクレオチドに作動可能に連結されたプロモーターは、このポリヌクレオチドが由来した種と異なる種からのものであるか、又は同一／類似種からのものであれば、一方若しくは両方が元の形態及び／若しくはゲノム遺伝子座から実質的に改変されているか、又はこのプロモーターが、作動可能に連結されたポリヌクレオチドの天然プロモーターではない。本明細書で使用する場合、別段の指定がない限り、キメラポリヌクレオチドは、コード配列に対して異種である転写開始領域に作動可能に連結したコード配列を含む。

本明細書で定義する場合、「異種」遺伝子、「非内在性」遺伝子又は「外来」遺伝子は、通常、宿主生物体に見出されないが、遺伝子導入によって宿主生物体に導入される遺伝子（又はＯＲＦ）を指す。本明細書で使用する場合、用語「外来」遺伝子は、非天然生物中に挿入された天然遺伝子（若しくはＯＲＦ）及び／又は天然若しくは非天然生物中に挿入されたキメラ遺伝子を含む。

本明細書で定義する場合、「異種」核酸コンストラクト又は「異種」核酸配列は、その中でそれが発現する細胞に対して天然ではない配列の部分を有する。

本明細書で定義する場合、「異種制御配列」は、天然では目的の遺伝子の発現を調節（制御）するために機能しない遺伝子発現制御配列（例えば、プロモーター又はエンハンサー）を指す。一般に、異種核酸配列は、その中にそれらが存在する細胞又はゲノムの一部に対して内在性（天然）ではなく、感染、トランスフェクション、形質転換、マイクロインジェクション、エレクトロポレーションなどによって細胞に付加されている。「異種」核酸コンストラクトは、天然宿主細胞内で見出される制御配列／ＤＮＡコード配列の組み合わせと同一の又は異なる制御配列／ＤＮＡコード（ＯＲＦ）配列の組合せを含有し得る。

本明細書で使用する場合、用語「シグナル配列」及び「シグナルペプチド」は、成熟タンパク質又はタンパク質の前駆体形の分泌又は直接輸送に関与する可能性があるアミノ酸残基の配列を指す。シグナル配列は、一般的には、前駆体又は成熟タンパク質配列のＮ末端に位置する。シグナル配列は、内在性又は外来性であり得る。シグナル配列は、通常、成熟タンパク質に存在しない。シグナル配列は、一般的には、タンパク質が輸送された後にシグナルペプチダーゼによってタンパク質から切断される。

用語「由来する」には、用語「～から生じた」、「～から得られた」、「～から入手可能な」及び「～から作製された」が含まれ、一般には、１つの特定の材料若しくは組成物が別の材料若しくは組成物にその起源が見出されるか、又は他の特定の材料若しくは組成物を参照して記載できる特徴を有することを示す。

本明細書で使用する場合、「隣接配列」は、考察対象の配列の上流又は下流にある任意の配列を指す（例えば、遺伝子Ａ－Ｂ－Ｃでは、遺伝子ＢがＡ及びＣの遺伝子配列によって隣接される）。特定の実施形態では、入来配列は、両側でホモロジーアームによって隣接される。いくつかの実施形態では、隣接配列は、一方の側（３’又は５’）にのみ存在するが、他の実施形態では、隣接されている配列の両側に存在する。各ホモロジーアームの配列は、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）ゲノム（バチルス（Ｂａｃｉｌｌｕｓ）染色体など）中の配列に相同である。

本明細書で使用する場合、用語「スタッファー配列」は、ホモロジーアーム（一般的にはベクター配列）に隣接している任意の余分なＤＮＡを指す。しかし、この用語は、任意の非相同ＤＮＡ配列を包含する。いかなる理論によっても限定されるものではないが、スタッファー配列は、細胞がＤＮＡ取り込みを開始するために重要ではない標的を提供する。

核酸配列又はポリペプチド配列に関連して、配列同一性」又は「同一性」は、特定の比較ウィンドウ全体にわたり最大の一致のために整列された場合に同一である２つの配列における核酸塩基又はアミノ酸残基を意味する。

用語「配列同一性のパーセンテージ」は、比較ウィンドウ全体にわたり２つの最適に整列された配列を比較することにより決定される値を指し、比較ウィンドウ中のポリヌクレオチド配列又はポリペプチド配列の部分は、これらの２つの配列を最適に整列させるために、参照配列（付加又は欠失を含まない）と比較して付加又は欠失（すなわちギャップ）を含む場合がある。パーセンテージは、両方の配列内で同一の核酸塩基又はアミノ酸残基が生じる位置の数を求めて、マッチした位置の数を得て、マッチした位置の数を比較ウィンドウ内の位置の総数で除して、その結果に１００を乗じて配列同一性のパーセンテージを得ることによって算出される。配列同一性パーセントの有用な例としては、５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％若しくは９５％又は５０％～１００％の任意の整数パーセンテージが挙げられるが、これらに限定されない。これらの同一性は、本明細書に記載したプログラムのいずれかを使用して決定することができる。

配列アラインメント及び同一性又は類似性のパーセントの計算は、ＬＡＳＥＲＧＥＮＥバイオインフォマティクスコンピューティングスイート（ＤＮＡＳＴＡＲＩｎｃ．，Ｍａｄｉｓｏｎ，ＷＩ）のＭｅｇＡｌｉｇｎ（商標）プログラム（これに限定されない）を含む、相同配列を検出するために設計された様々な比較方法を使用して決定することができる。本出願に関連して、配列分析ソフトウェアが分析に使用される場合、他に規定されない限り、分析結果は、言及したプログラムの「デフォルト値」をベースとすることが理解されるであろう。本明細書で使用する「デフォルト値」は、最初に初期化されると、ソフトウェアで最初にロードされる数値又はパラメーターの任意のセットを意味するであろう。

「アラインメントのＣｌｕｓｔａｌＶ法」は、ＣｌｕｓｔａｌＶ（ＨｉｇｇｉｎｓａｎｄＳｈａｒｐ，（１９８９）ＣＡＢＩＯＳ５：１５１－１５３；Ｈｉｇｇｉｎｓｅｔａｌ．，（１９９２）ＣｏｍｐｕｔＡｐｐｌＢｉｏｓｃｉ８：１８９－１９１により説明されている）と表示され、ＬＡＳＥＲＧＥＮＥバイオインフォマティクスコンピューティングスイート（ＤＮＡＳＴＡＲＩｎｃ．，Ｍａｄｉｓｏｎ，ＷＩ）のＭｅｇＡｌｉｇｎ（商標）プログラム中に見出されるアラインメント法に対応する。多重アラインメントの場合、デフォルト値は、ＧＡＰＰＥＮＡＬＴＹ＝１０及びＧＡＰＬＥＮＧＴＨＰＥＮＡＬＴＹ＝１０に対応する。Ｃｌｕｓｔａｌ法を使用したタンパク質配列のペアワイズアラインメント及び同一性パーセントの算出のためのデフォルトパラメーターは、ＫＴＵＰＬＥ＝１、ＧＡＰＰＥＮＡＬＴＹ＝３、ＷＩＮＤＯＷ＝５及びＤＩＡＧＯＮＡＬＳＳＡＶＥＤ＝５である。核酸の場合、これらのパラメーターは、ＫＴＵＰＬＥ＝２、ＧＡＰＰＥＮＡＬＴＹ＝５、ＷＩＮＤＯＷ＝４及びＤＩＡＧＯＮＡＬＳＳＡＶＥＤ＝４である。ＣｌｕｓｔａｌＶプログラムを使用した配列のアラインメント後、同一プログラム中の「配列距離」表を調べることにより、「同一性パーセント」を得ることができる。

「アラインメントのＣｌｕｓｔａｌＷ法」は、ＣｌｕｓｔａｌＷ（ＨｉｇｇｉｎｓａｎｄＳｈａｒｐ，（１９８９）ＣＡＢＩＯＳ５：１５１－１５３；Ｈｉｇｇｉｎｓｅｔａｌ．，（１９９２）ＣｏｍｐｕｔＡｐｐｌＢｉｏｓｃｉ８：１８９－１９１により説明されている）と表示され、ＬＡＳＥＲＧＥＮＥバイオインフォマティクスコンピューティングスイート（ＤＮＡＳＴＡＲＩｎｃ．，Ｍａｄｉｓｏｎ，ＷＩ）のＭｅｇＡｌｉｇｎ（商標）ｖ６．１プログラム中に見出されるアラインメント法に対応する。多重アラインメントのためのデフォルトパラメーター（ＧＡＰＰＥＮＡＬＴＹ＝１０、ＧＡＰＬＥＮＧＴＨＰＥＮＡＬＴＹ＝０．２、ＤｅｌａｙＤｉｖｅｒｇｅｎＳｅｑｓ（％）＝３０、ＤＮＡＴｒａｎｓｉｔｉｏｎＷｅｉｇｈｔ＝０．５、ＰｒｏｔｅｉｎＷｅｉｇｈｔＭａｔｒｉｘ＝ＧｏｎｎｅｔＳｅｒｉｅｓ、ＤＮＡＷｅｉｇｈｔＭａｔｒｉｘ＝ＩＵＢ）。ＣｌｕｓｔａｌＷプログラムを使用した配列のアラインメント後、同一プログラム中の「配列距離」表を調べることにより、「同一性パーセント」を得ることができる。

別途指定しない限り、本明細書に示される配列同一性／類似性値は、以下のパラメーターを用いるＧＡＰＶｅｒｓｉｏｎ１０（ＧＣＧ、Ａｃｃｅｌｒｙｓ，ＳａｎＤｉｅｇｏ，ＣＡ）を使用して得られた値を指す：ヌクレオチド配列の同一性％及び類似性％は、ギャップ生成ペナルティウエイト５０、ギャップ長伸長ペナルティウエイト３及びｎｗｓｇａｐｄｎａ．ｃｍｐスコアリングマトリックスを使用；アミノ酸配列の同一性％及び類似性％は、ギャップ生成ペナルティウエイト８、ギャップ長伸長ペナルティ２及びＢＬＯＳＵＭ６２スコアリングマトリックスを使用（ＨｅｎｉｋｏｆｆａｎｄＨｅｎｉｋｏｆｆ，（１９８９）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ８９：１０９１５）。ＧＡＰは、ＮｅｅｄｌｅｍａｎａｎｄＷｕｎｓｃｈ，（１９７０）ＪＭｏｌＢｉｏｌ４８：４４３－５３のアルゴリズムを使用して、一致した数を最大化し、ギャップ数を最小限に抑える２種の配列全体のアラインメントを見出す。ＧＡＰは、全ての可能なアラインメント及びギャップ位置を考慮し、一致した塩基の単位でギャップ生成ペナルティ及びギャップ伸長ペナルティを使用して、一致した塩基の最大数及び最小のギャップを有するアラインメントを作成する。

「ＢＬＡＳＴ」は、国立生物工学情報センター（（ＮＣＢＩ）によって提供されている、生物学的配列の類似領域を見出すために使用される検索アルゴリズムである。このプログラムでは、ヌクレオチド配列又はタンパク質配列を配列データベースと比較し、一致の統計学的有意性を計算して、問い合わせ配列に十分類似した配列を、類似性がランダムに起こったと予想されないように特定する。ＢＬＡＳＴは、特定された配列及びそれらの問い合わせ配列に対するローカルアラインメントを報告する。

多くのレベルの配列同一性は、他の種からの又は天然に若しくは合成により改変されているポリペプチド（そのようなポリペプチドは、同一の又は類似した機能又は活性を有する）の特定に有用であることが当業者によく理解されるであろう。同一性パーセントの有用な例としては、限定はされないが、５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％若しくは９５％又は５０％～１００％の任意の整数パーセンテージが挙げられる。実際に、５０％～１００％の任意の整数のアミノ酸同一性、例えば５１％、５２％、５３％、５４％、５５％、５６％、５７％、５８％、５９％、６０％、６１％、６２％、６３％、６４％、６５％、６６％、６７％、６８％、６９％、７０％、７１％、７２％、７３％、７４％、７５％、７６％、７７％、７８％、７９％、８０％、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％又は９９％の同一性は、本開示の説明に有用であり得る。

「翻訳リーダー配列」は、遺伝子のプロモーター配列とコード配列との間に位置するポリヌクレオチド配列を指す。翻訳リーダー配列は、ｍＲＮＡの翻訳開始配列の上流に存在する。翻訳リーダー配列は、ｍＲＮＡへの一次転写物のプロセシング、ｍＲＮＡの安定性又は翻訳効率に影響し得る。翻訳リーダー配列の例が記載されている（例えば、ＴｕｒｎｅｒａｎｄＦｏｓｔｅｒ，（１９９５）ＭｏｌＢｉｏｔｅｃｈｎｏｌ３：２２５－２３６を参照されたい）。

「３’非コード配列」、「転写ターミネーター」又は「終結配列」は、コード配列の下流に位置するＤＮＡ配列を指し、ポリアデニル化認識配列及びｍＲＮＡプロセシング又は遺伝子の発現に影響を及ぼすことができる、調節シグナルをコードする他の配列を含む。ポリアデニル化シグナルは、通常、ｍＲＮＡ前駆体の３’末端へのポリアデニル酸区域の付加に影響を及ぼすことによって特徴付けられる。様々な３’非コード配列の使用は、Ｉｎｇｅｌｂｒｅｃｈｔｅｔａｌ．，（１９８９）ＰｌａｎｔＣｅｌｌ１：６７１－６８０によって例示されている。

本明細書で使用する場合、「ＲＮＡ転写物」は、ＲＮＡポリメラーゼにより触媒されるＤＮＡ配列の転写により生じる産物を指す。ＲＮＡ転写物が、ＤＮＡ配列の完全に相補的なコピーである場合、それは、一次転写物又はプレｍＲＮＡと呼ばれる。ＲＮＡ転写物が、一次転写物プレｍＲＮＡの転写後のプロセシングで得られたＲＮＡ配列である場合、それは、成熟ＲＮＡ又はｍＲＮＡと呼ばれる。「メッセンジャーＲＮＡ」又は「ｍＲＮＡ」は、イントロンを有しておらず、細胞によりタンパク質に翻訳され得るＲＮＡを指す。「ｃＤＮＡ」は、ｍＲＮＡ鋳型に相補的であり、且つ逆転写酵素を使用してｍＲＮＡ鋳型から合成されるＤＮＡを指す。ｃＤＮＡは、単鎖であるか、又はＤＮＡポリメラーゼＩのクレノウ断片を使用して二本鎖形態に変換され得る。「センス」ＲＮＡは、ｍＲＮＡを含むＲＮＡ転写物を指し、細胞内又はインビトロでタンパク質に翻訳することができる。「アンチセンスＲＮＡ」は、標的一次転写物又はｍＲＮＡの全部又は一部に対して相補的であり、標的遺伝子の発現を遮断するＲＮＡ転写物を指す（例えば、米国特許第５，１０７，０６５号明細書を参照されたい）。アンチセンスＲＮＡの相補性は、特定の遺伝子転写物の任意の部分、すなわち５’非コード配列、３’非コード配列、イントロン又はコード配列との相補性であり得る。「機能的ＲＮＡ」は、アンチセンスＲＮＡ、リボザイムＲＮＡ又は翻訳され得ないが、それにもかかわらず細胞内プロセスに影響を及ぼす他のＲＮＡを指す。用語「相補体」及び「逆相補体」は、ｍＲＮＡ転写物に関して本明細書では互換的に使用され、メッセージのアンチセンスＲＮＡを定義することが意図されている。

「成熟」タンパク質は、翻訳後にプロセシングされたポリペプチド（すなわち一次翻訳産物中に存在する任意のプレペプチド又はプロペプチドが除去されているもの）を指す。「前駆体」タンパク質は、ｍＲＮＡの翻訳の一次産物（すなわちプレペプチド及びプロペプチドが依然として存在する）を指す。プレペプチド及びプロペプチドは、細胞内局在化シグナルであり得るが、これに限定されない。

タンパク質は、アミノ酸の置換、欠失、トランケーション及び挿入を含む様々な方法で改変され得る。そのような操作のための方法は、一般に知られている。例えば、タンパク質のアミノ酸配列バリアントは、ＤＮＡ内の変異によって調製することができる。変異誘発及びヌクレオチド配列改変の方法としては、例えば、Ｋｕｎｋｅｌ，（１９８５）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ８２：４８８－９２；Ｋｕｎｋｅｌｅｔａｌ．，（１９８７）ＭｅｔｈＥｎｚｙｍｏｌ１５４：３６７－８２；米国特許第４，８７３，１９２号明細書；ＷａｌｋｅｒａｎｄＧａａｓｔｒａ，ｅｄｓ．（１９８３）ＴｅｃｈｎｉｑｕｅｓｉｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ（ＭａｃＭｉｌｌａｎＰｕｂｌｉｓｈｉｎｇＣｏｍｐａｎｙ，ＮｅｗＹｏｒｋ）及びそこで引用された文献が挙げられる。タンパク質の生物学的活性に影響を与えそうにないアミノ酸置換についてのガイダンスは、例えば、Ｄａｙｈｏｆｆｅｔａｌ．，（１９７８）ＡｔｌａｓｏｆＰｒｏｔｅｉｎＳｅｑｕｅｎｃｅａｎｄＳｔｒｕｃｔｕｒｅ（ＮａｔｌＢｉｏｍｅｄＲｅｓＦｏｕｎｄ，Ｗａｓｈｉｎｇｔｏｎ，Ｄ．Ｃ．）のモデルに見出される。１つのアミノ酸を類似の特性を有する別のアミノ酸と交換するなどの保存的置換が好ましい可能性がある。保存的な欠失、挿入及びアミノ酸置換は、タンパク質の特性に過激な変化を引き起こさないことが予期され、置換、欠失、挿入又はこれらの組合せの影響は、通例のスクリーニング分析で評価することができる。二本鎖切断誘発活性の分析法が知られており、一般に、標的部位を含有するＤＮＡ基質上における試薬の全体の活性及び特異性を測定する。

標準のＤＮＡ単離、精製、分子クローニング、ベクター構築及び検証／特徴付けの方法は、十分に確立されており、例えばＳａｍｂｒｏｏｋｅｔａｌ．，（１９８９）ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ，（ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙＰｒｅｓｓ，ＮＹ）を参照されたい。ベクター及びコンストラクトは、環状プラスミド及び線形ポリヌクレオチドを含み、これらは、目的のポリヌクレオチド及び任意選択により、リンカー、アダプター、調節要素又は分析要素を含む他の構成要素を含む。いくつかの実施例では、認識部位及び／又は標的部位は、イントロン、コード配列、５’ＵＴＲ、３’ＵＴＲ及び／又は調節領域内に含有され得る。

略語の意味は、以下のとおりである：「ｓｅｃ」は、秒を意味し、「ｍｉｎ」は、分を意味し、「ｈ」は、時間を意味し、「ｄ」は、日を意味し、「μＬ」は、マイクロリットルを意味し、「ｍＬ」は、ミリリットルを意味し、「Ｌ」は、リットルを意味し、「μＭ」は、マイクロモルを意味し、「ｍＭ」は、ミリモルを意味し、「Ｍ」は、モルを意味し、「ｍｍｏｌ」は、ミリモルを意味し、「μｍｏｌｅ」は、マイクロモルを意味し、「ｇ」は、グラムを意味し、「μｇ」は、マイクログラムを意味し、「ｎｇ」は、ナノグラムを意味し、「Ｕ」は、単位を意味し、「ｂｐ」は、塩基対を意味し、及び「ｋｂ」は、キロベースを意味する。

本明細書で開示する組成物及び方法の非限定的な例は、下記のとおりである。

１．バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノム上の標的部位に、前記ゲノムへの選択マーカーの組込みを伴わずにドナーＤＮＡ配列を組み込む方法であって、少なくとも線状組換えＤＮＡコンストラクト及び環状組換えＤＮＡコンストラクトをバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞に同時に導入することを含み、前記線状組換えＤＮＡコンストラクトは、ドナーＤＮＡ配列を含み、前記ドナーＤＮＡ配列は、上流のホモロジーアーム（ＨＲ１）及び下流のアーム（ＨＲ２）によって隣接され、各ホモロジーアームは、１０００を超えるヌクレオチド長であり、前記環状組換えＤＮＡコンストラクトは、ガイドＲＮＡをコードするＤＮＡ配列と、Ｃａｓエンドヌクレアーゼをコードするヌクレオチド配列に作動可能に連結された構成的プロモーターとを含み、前記Ｃａｓ９エンドヌクレアーゼは、前記バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノムにおける標的部位又はその近傍で二本鎖切断を導入する、方法。

２．ドナーＤＮＡ配列は、上流のホモロジーアーム（ＨＲ１）及び下流のホモロジーアーム（ＨＲ２）によって隣接され、各ホモロジーアームは、１０００、１１００、１２００、１３００、１４００、１５００、１６００、１７００、１８００、１９００、２０００、２１００、２２００、２３００、２４００、２５００、２６００、２７００、２８００、２９００、３０００、３１００、３２００、３３００、３４００、３５００、３６００、３７００、３８００、３９００、４０００、５０００を超え、且つ最大で６０００のヌクレオチド長であり、及びバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノム上の前記標的部位に対する配列相同性を含む、実施形態１の方法。

３．ドナーＤＮＡ配列は、目的のポリヌクレオチド、目的の遺伝子、転写調節配列、翻訳調節配列、プロモーター配列、ターミネーター配列、トランスジェニック核酸配列、メッセンジャーＲＮＡの少なくとも一部と相補的なアンチセンス配列、異種配列又はこれらのいずれか１つの組合せからなる群から選択されるヌクレオチド配列を含む、先行する実施形態のいずれかの方法。

４．線状組換えＤＮＡコンストラクトは、スタッファー配列をさらに含む、先行する実施形態のいずれかの方法。

５．線状組換えＤＮＡコンストラクトは、一本鎖ＤＮＡである、先行する実施形態のいずれかの方法。

６．線状組換えＤＮＡコンストラクトは、二本鎖ＤＮＡである、先行する実施形態のいずれかの方法。

７．前記バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞からの子孫細胞を増殖させ、且つバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）子孫細胞であって、そのゲノム中に安定に組み込まれたドナーＤＮＡ配列を有するバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）子孫細胞を選択することをさらに含む、先行する実施形態のいずれかの方法。

８．前記環状組換えＤＮＡコンストラクトは、前記バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）子孫細胞のゲノムに組み込まれない選択マーカーを含む、先行する実施形態のいずれかの方法。

９．前記選択マーカーは、前記バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）子孫細胞のゲノムに安定に組み込まれない、実施形態８の方法。

１０．線状組換えＤＮＡコンストラクト及び第２の環状組換えＤＮＡコンストラクトを含有しないバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）子孫細胞をさらに選択する、実施形態８の方法。

１１．バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノム上の標的部位は、染色体上のヌクレオチド配列、エピソーム上のヌクレオチド配列、遺伝子導入座位、内在性標的部位及び異種標的部位からなる群から選択される、先行する実施形態のいずれかの方法。

１２．ドナーＤＮＡは、目的の遺伝子を含む、実施形態３の方法。

１３．バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞に、１０００ヌクレオチドの上流のホモロジーアーム（ＨＲ１）及び下流のホモロジーアーム（ＨＲ２）によって隣接される前記ドナーＤＮＡ配列を含む線状組換えＤＮＡコンストラクトと、前記環状組換えＤＮＡコンストラクトとを導入することを含む対照方法における目的の遺伝子の前記遺伝子の組込みの頻度と比較して、少なくとも約２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１～最大で２３倍高い、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノムへのドナーＤＮＡ配列の組込みの頻度を有する、先行する実施形態のいずれかの方法。

１４．バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞は、バチルス・サブチリス（Ｂａｃｉｌｌｕｓｓｕｂｔｉｌｉｓ）、バチルス・リケニフォルミス（Ｂａｃｉｌｌｕｓｌｉｃｈｅｎｉｆｏｒｍｉｓ）、バチルス・レンツス（Ｂａｃｉｌｌｕｓｌｅｎｔｕｓ）、バチルス・ブレビス（Ｂａｃｉｌｌｕｓｂｒｅｖｉｓ）、バチルス・ステアロサーモフィルス（Ｂａｃｉｌｌｕｓｓｔｅａｒｏｔｈｅｒｍｏｐｈｉｌｕｓ）、バチルス・アルカロフィルス（Ｂａｃｉｌｌｕｓａｌｋａｌｏｐｈｉｌｕｓ）、バチルス・アミロリケファシエンス（Ｂａｃｉｌｌｕｓａｍｙｌｏｌｉｑｕｅｆａｃｉｅｎｓ）、バチルス・クラウシイ（Ｂａｃｉｌｌｕｓｃｌａｕｓｉｉ）、バチルス・ハロデュランス（Ｂａｃｉｌｌｕｓ．ｈａｌｏｄｕｒａｎｓ）、バチルス・メガテリウム（Ｂａｃｉｌｌｕｓ．ｍｅｇａｔｅｒｉｕｍ）、バチルス・コアギュランス（Ｂａｃｉｌｌｕｓｃｏａｇｕｌａｎｓ）、バチルス・サーキュランス（Ｂａｃｉｌｌｕｓｃｉｒｃｕｌａｎｓ）、バチルス・ラウツス（Ｂａｃｉｌｌｕｓｌａｕｔｕｓ）及びバチルス・チューリンギエンシス（Ｂａｃｉｌｌｕｓｔｈｕｒｉｎｇｉｅｎｓｉｓ）からなる群から選択される、先行する実施形態のいずれかの方法。

１５．線状組換えＤＮＡコンストラクト及び第２の環状組換えＤＮＡコンストラクトは、プロトプラスト融合、天然又は人工形質転換（例えば、塩化カルシウム、エレクトロポレーション、熱ショック）、形質導入、トランスフェクション、接合、ファージ送達、交配、自然形質転換能、誘導性形質転換能及びこれらの任意の組合せからなる群から選択される１つの手段を介してバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞に同時に導入される、先行する実施形態のいずれかの方法。

１６．バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノムに、前記ゲノムへの選択マーカーの組込みを伴わずに目的の遺伝子の複数のコピーを組み込む方法であって、少なくとも線状組換えＤＮＡコンストラクト及び環状組換えＤＮＡコンストラクトをバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞に同時に導入することを含み、前記線状組換えＤＮＡコンストラクトは、上流のホモロジーアーム（ＨＲ１）及び下流のアーム（ＨＲ２）によって隣接されるドナーＤＮＡ配列を含み、前記ドナーＤＮＡは、目的の前記遺伝子の複数のコピーを含み、各ホモロジーアームは、１０００を超えるヌクレオチド長であり、前記環状組換えＤＮＡコンストラクトは、ガイドＲＮＡをコードするＤＮＡ配列と、Ｃａｓエンドヌクレアーゼをコードするヌクレオチド配列に作動可能に連結された構成的プロモーターとを含み、前記Ｃａｓ９エンドヌクレアーゼは、前記バチルス（Ｂａｃｉｌｌｕｓ）細胞のゲノムにおける標的部位又はその近傍で二本鎖切断を導入する、方法。

１７．バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノム上の標的部位に、前記ゲノムへの選択マーカーの組込みを伴わずに目的の遺伝子を組み込む方法であって、少なくとも線状組換えＤＮＡコンストラクト及び環状組換えＤＮＡコンストラクトをバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞に同時に導入することを含み、前記線状組換えＤＮＡコンストラクトは、前記目的の遺伝子を含むドナーＤＮＡ配列を含み、前記ドナーＤＮＡ配列は、上流のホモロジーアーム（ＨＲ１）及び下流のアーム（ＨＲ２）によって隣接され、各ホモロジーアームは、１０００を超えるヌクレオチド長であり、前記環状組換えＤＮＡコンストラクトは、ガイドＲＮＡをコードするＤＮＡ配列と、Ｃａｓエンドヌクレアーゼをコードするヌクレオチド配列に作動可能に連結された構成的プロモーターとを含み、前記Ｃａｓ９エンドヌクレアーゼは、前記バチルス（Ｂａｃｉｌｌｕｓ）細胞のゲノムにおける標的部位又はその近傍で二本鎖切断を導入する、方法。

１８．少なくとも線状組換えＤＮＡコンストラクト及び第２の環状組込みＤＮＡコンストラクトを含む改変されたバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞であって、前記線状組換えＤＮＡコンストラクトは、上流（５’）ホモロジーアーム及び下流（３’）ホモロジーアームによって隣接されるドナーＤＮＡ配列を含み、各ホモロジーアームは、１０００を超えるヌクレオチド長であり、前記環状組換えＤＮＡコンストラクトは、ガイドＲＮＡをコードするＤＮＡ配列と、Ｃａｓエンドヌクレアーゼをコードするヌクレオチド配列に作動可能に連結された構成的プロモーターとを含み、前記ガイドＲＮＡは、前記バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞の染色体又はエピソーム上の標的部位配列に相補的な配列を含み、前記Ｃａｓ９エンドヌクレアーゼＤＮＡ配列は、ＲＮＡ誘導型エンドヌクレアーゼ（ＲＧＥＮ）を形成できるＣａｓ９エンドヌクレアーゼをコードし、前記ＲＧＥＮは、標的部位配列の全て又は一部に結合し、且つ任意選択により切断する、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞。

１９．前記目的の遺伝子は、前記バチルス（Ｂａｃｉｌｌｕｓ）細胞のゲノムに組み込まれる、実施形態１０のバチルス（Ｂａｃｉｌｌｕｓ）細胞。

２０．バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノムに、前記ゲノムへの選択マーカーの導入を伴わずに目的の遺伝子を組み込む方法であって、少なくとも線状組換えＤＮＡコンストラクト及び環状組換えＤＮＡコンストラクトをバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞に同時に導入することを含み、前記線状組換えＤＮＡコンストラクトは、前記目的の遺伝子を含むドナーＤＮＡ配列を含み、前記ドナーＤＮＡ配列は、上流のホモロジーアーム（ＨＲ１）及び下流のアーム（ＨＲ２）によって隣接され、各ホモロジーアームは、１０００を超えるヌクレオチド長であり、前記線状組換えＤＮＡコンストラクトは、ガイドＲＮＡをコードするＤＮＡ配列をさらに含み、前記環状組換えＤＮＡコンストラクトは、Ｃａｓエンドヌクレアーゼをコードするヌクレオチド配列に作動可能に連結された構成的プロモーターを含み、前記Ｃａｓ９エンドヌクレアーゼは、前記バチルス（Ｂａｃｉｌｌｕｓ）細胞のゲノムにおける標的部位又はその近傍で二本鎖切断を導入する、方法。

開示される本開示は、以下の実施例においてさらに定義される。これらの実施例は、本開示の特定の好ましい態様を示すが、例示のためにのみ示されていることが理解されるべきである。上の議論及びこれらの実施例から、当業者であれば本開示の特徴の本質を確認することができ、またその趣旨及び範囲から逸脱することなく、本開示を様々な用途及び条件に適応させるために本開示の様々な変更形態及び変形形態をなし得る。

実施例１
ａｐｒＥＣａｓ９ターゲティングベクターの構築
Ｎ末端核移行配列（ＮＬＳ；「ＡＰＫＫＫＲＫＶ」；配列番号２）、Ｃ末端ＮＬＳ（「ＫＫＫＫＬＫ」；配列番号３）及びデカ－ヒスチジンタグ（「ＨＨＨＨＨＨＨＨＨＨ」；配列番号４）を含むストレプトコッカス・ピオゲネス（Ｓｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓ）由来のＣａｓ９タンパク質をコードする合成ポリヌクレオチド（配列番号１）は、バチルス・サブチリス（Ｂａｃｉｌｌｕｓｓｕｂｔｉｌｉｓ）由来のａｐｒＥプロモーター（配列番号５）に作動可能に連結され、製造業者の使用説明書に従ってＱ５ＤＮＡポリメラーゼ（ＮＥＢ）を使用し、フォワード（配列番号６）及びリバース（配列番号７）プライマー対を用いて増幅された。プラスミドｐＫＢ３２０（配列番号９）の骨格（配列番号８）は、製造業者の使用説明書に従ってＱ５ＤＮＡポリメラーゼ（ＮＥＢ）を使用し、フォワード（配列番号１０）及びリバース（配列番号１１）プライマー対を用いて増幅された。

ＰＣＲ産物を、Ｚｙｍｏｃｌｅａｎａｎｄｃｏｎｃｅｎｔｒａｔｅ５カラムを製造業者の使用説明書に従って使用して精製した。続いて、２つの断片を等モル比で混合するＱ５ポリメラーゼ（ＮＥＢ）を用いて、長時間オーバーラップ伸長ＰＣＲ（ＰＯＥ－ＰＣＲ）により、ＰＣＲ産物を組み立てた。以下のＰＯＥ－ＰＣＲ反応サイクルを実行した：９８℃で５秒間、６４℃で１０秒間、７２℃で４分１５秒間を３０サイクル。５μｌのＰＯＥ－ＰＣＲ（ＤＮＡ）を製造業者の使用説明書に従ってＴｏｐ１０Ｅ．コリ（Ｅ．ｃｏｌｉ）（Ｉｎｖｉｔｒｏｇｅｎ）に形質転換し、５０μｇ／ｍｌの硫酸カナマイシンを含有し、１．５％寒天で固化させた溶原（Ｌ）培地（Ｍｉｌｌｅｒ処方；１％（ｗ／ｖ）トリプトン、０．５％酵母抽出物（ｗ／ｖ）、１％ＮａＣｌ（ｗ／ｖ））で選択した。コロニーを３７℃で１８時間増殖させた。コロニーを採取し、ＱｉａｐｒｅｐＤＮＡミニプレップキットを製造業者の使用説明書に従って使用してプラスミドＤＮＡを調製し、５５μｌのｄｄＨ_２Ｏ中に溶出した。このプラスミドＤＮＡについてサンガーシークエンシングを行い、シークエンシングプライマー（配列番号１２～２０）を使用して、正しい組み立てを確認した。

正しく組み立てられたプラスミドｐＲＦ６９４（配列番号２１）を使用して、中間体プラスミドｐＲＦ７４８（配列番号２２）を組み立てた。プラスミドｐＲＦ７４８の構築は、中断された合成ｇＲＮＡカセットをプラスミドｐＲＦ６９４のＮｃｏＩ／ＳａｌＩ部位にクローニングすることによって作製した。このカセットは、ＩＤＴによって合成的に生成され、Ｂ．サブチリス（Ｂ．ｓｕｂｔｉｌｉｓ）ｒｒｎＩプロモーター（配列番号２３）、合成ダブルターミネーター（配列番号２４）、Ｅ．コリ（Ｅ．ｃｏｌｉ）ｒｐｓＬ遺伝子（配列番号２５）、Ｃａｓ９エンドヌクレアーゼ認識ドメインをコードするＤＮＡ（配列番号２６）及びラムダファージＴ０ターミネーター（配列番号２７）を含有する。

ｇＲＮＡ発現カセットを含有するＤＮＡ断片を、標準的な分子生物学的技術を用いてｐＲＦ６９４に組み入れてプラスミドｐＲＦ７４８を生成し、Ｃａｓ９発現カセット及びｇＲＮＡ発現カセットを含有するＥ．コリ（Ｅ．ｃｏｌｉ）－Ｂ．サブチリス（Ｂ．ｓｕｂｔｉｌｉｓ）シャトルプラスミドを生成することができる。

中間体プラスミドｐＲＦ７４８を用いて、Ｂ．サブチリス（Ｂ．ｓｕｂｔｉｌｉｓ）のａｐｒＥ遺伝子座に発現カセットを導入するためのプラスミドを組み立てた。より詳細には、Ｂ．サブチリス（Ｂ．ｓｕｂｔｉｌｉｓ）のａｐｒＥ遺伝子座におけるｙｈｆＮ遺伝子（配列番号２８）は、Ｃａｓ９標的部位（配列番号２９）を含有する。標的部位は、ＰＡＭ配列（配列番号３１の最後の３塩基）を除去することにより、可変ターゲティング（ＶＴ）ドメインをコードするＤＮＡ配列（配列番号３０）に変換され得る。ＶＴドメインをコードするＤＮＡ配列（配列番号３０）は、細胞内のＲＮＡポリメラーゼによって転写された場合に機能性ｇＲＮＡ（配列番号３２）を生成するように、Ｃａｓ９エンドヌクレアーゼ認識ドメイン（ＣＥＲ；配列番号２６）をコードするＤＮＡ配列に作動可能に融合され得る。ｇＲＮＡをコードするＤＮＡ（配列番号３３）は、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞において作動可能なプロモーター（例えば、Ｂ．サブチリス（Ｂ．ｓｕｂｔｉｌｉｓ）由来のｒｒｎＩプロモーター；配列番号２３）及びバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞において作動可能なターミネーター（例えば、ラムダファージのｔ０ターミネーター；配列番号２７）に作動可能に連結され得るが、その結果、プロモーターを、ｇＲＮＡをコードするＤＮＡの５’側に配置し、ターミネーターを、ｇＲＮＡをコードするＤＮＡの３’側に配置して、ｇＲＮＡ発現カセット（配列番号３４）を作製する。

Ｂ．サブチリス（Ｂ．ｓｕｂｔｉｌｉｓ）のｙｈｆＮ遺伝子座（配列番号３６）を標的化するプラスミドｐＲＦ７９３（配列番号３５）を、製造者の使用説明書に従ってＱ５を使用し、フォワード（配列番号３７）及びリバース（配列番号３８）プライマー対を用いてプラスミドｐＲＦ７４８（配列番号２２）を増幅することにより作製した。これらのプライマーは、５’及び３’末端が重複し、ｙｈｆＮ可変ターゲティングドメインを含有する断片を作製するｇＲＮＡの可変ターゲティング領域を除いて、プラスミド全体（ｐＲＦ７４８）を増幅する。このＰＣＲ産物を、製造業者の使用説明書に従ってＮＥＢｕｉｌｄｅｒ（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）を用いて分子内集合反応に使用して、プラスミドｐＲＦ７９３（配列番号３５）を作製し、Ｃａｓ９発現カセット及びｙｈｆＮを標的とするｇＲＮＡをコードするｇＲＮＡ発現カセットを含有するＥ．コリ（Ｅ．ｃｏｌｉ）－Ｂ．サブチリス（Ｂ．ｓｕｂｔｉｌｉｓ）シャトルプラスミドを生成した。

実施例２
ａｐｒＥ発現カセットを発現するバチルス・サブチリス（Ｂａｃｉｌｌｕｓｓｕｂｔｉｌｉｓ）細胞の作製
本実施例は、バチルス・サブチリス（Ｂａｃｉｌｌｕｓｓｕｂｔｉｌｉｓ）細胞のゲノムへのプロテアーゼ発現カセットの組込みを記載する。より具体的には、これらの発現カセットは、Ｂ．サブチリス（Ｂ．ｓｕｂｔｉｌｉｓ）細胞において作動可能なプロモーター（例えば、天然のＢ．サブチリス（Ｂ．ｓｕｂｔｉｌｉｓ）ｒｒｎＩプロモーター；配列番号２３）をコードするＤＮＡ配列に作動可能に融合されたｙｈｆＮ遺伝子（配列番号３９）の隣接領域５’に相同なＤＮＡ配列を含有し、これは、プロモーターが成熟遺伝子をコードするＤＮＡの５’に配置され、且つターミネーターが成熟遺伝子をコードするＤＮＡの３’に配置されるように、Ｂ．アミロリケファシエンス（Ｂ．ａｍｙｌｏｌｉｑｕｅｆａｃｉｅｎｓ）ａｐｒターミネーターをコードするＤＮＡ配列（配列番号４０）に作動可能に融合されたプロテアーゼバリアント成熟遺伝子をコードするＤＮＡ配列に作動可能に融合される。上記の発現カセットは、ｙｈｆＮ遺伝子の隣接領域３’に相同なＤＮＡ配列（配列番号４１）に作動可能に融合された。

発現のためにＰｘｙｌＡ誘導性プロモーターを使用してａｍｙＥ遺伝子座で導入されたＢ．サブチリス（Ｂ．ｓｕｂｔｉｌｉｓ）ｃｏｍＫ遺伝子（配列番号４２）を含有する親Ｂ．サブチリス（Ｂ．ｓｕｂｔｉｌｉｓ）細胞を、１２５ｍｌのバッフル付きフラスコにおいて、１５ｍｌのＬ培地（１％ｗ・ｖ^－１トリプトン、０．５％酵母抽出物ｗ・ｖ^－１、１％ＮａＣｌｗ・ｖ^－１）中、３７℃及び２５０ＲＰＭで一晩増殖させた。一晩培養したものを、１２５ｍｌバッフル付きフラスコにおいて、１０ｍｌの新鮮なＬ培地中で０．２（ＯＤ_６００単位）に希釈した。培養物が３７℃（２５０ＲＰＭ）で０．９（ＯＤ_６００単位）に達するまで、細胞を増殖させた。Ｄ－キシロースを３０％（ｗ／ｖ）のストックから０．３％（ｗ／ｖ）に加えた。細胞を３７℃（２５０ＲＰＭ）でさらに２．５時間増殖させ、７分間にわたり１７００×ｇでペレット化した。細胞を、使用済み培地を使用して元の培養の４分の１量に再懸濁させた。１００μｌの濃縮細胞を、およそ１μｇの天然のｒｒｎＩプロモーター（配列番号２３）を含有するバリアントプロテアーゼ発現カセット及び製造業者の使用説明書に従って１８時間のローリングサークル増幅（Ｓｙｎｇｉｓ）を使用して増幅された前の実施例において記載されるｐＲＦ７９３プラスミド（配列番号３５）と混合した。細胞／ＤＮＡ形質転換混合物を、１０μｇ／ｍＬカナマイシン、１．６％（ｗ／ｖ）スキムミルクを含有し、１．５％（ｗ／ｖ）寒天で固化させたＬ培地（ｍｉｌｌｅｒ）にプレーティングした。３７℃でコロニーを形成させた。カナマイシン及びスキムミルクを含有するＬ寒天上で増殖し、コロニーに隣接する領域に目に見える透明ゾーンを生成したコロニー（タンパク質分解活性を示す）を採取し、１．６％（ｗ／ｖ）スキムミルクを含有する寒天プレート上にストリークした。

組込み効率は、タンパク分解活性を示すコロニーに隣接する目に見える透明なゾーンを有するコロニーのコロニー数と比較した、コロニーに隣接する目に見える透明なゾーンを有しないコロニーのコロニー数によってアッセイされた。

驚くべきことに且つ予想外にも、プラスミドｐＲＦ７９３（配列番号３５）及び線状発現カセットを使用して親Ｂ．サブチリス（Ｂ．ｓｕｂｔｉｌｉｓ）株においてａｐｒＥ遺伝子座で組み込まれたプロテアーゼバリアント発現カセットに関する組込み効率は、発現カセット内のホモロジーアームの長さに依存して変動した。より長いホモロジーアーム（３Ｋｂの長さ）が使用されたときに利点が観察され、それにより組込みの頻度を６パーセント～最大で７５パーセント向上させた（表１）。

実施例３
ｓｋｆＡＣａｓ９ターゲティングベクターの構築
実施例１に記載されるとおりの正しく組み立てられたプラスミドｐＲＦ６９４（配列番号２１）を使用して、中間体プラスミドｐＲＦ７４７（配列番号４３）を組み立てた。プラスミドｐＲＦ７４７の構築は、中断された合成ｇＲＮＡカセットをプラスミドｐＲＦ６９４のＮｃｏＩ／ＳａｌＩ部位にクローニングすることによって作製した。このカセットは、ＩＤＴによって合成的に生成され、Ｂ．サブチリス（Ｂ．ｓｕｂｔｉｌｉｓ）ｎａｒＫｐプロモーター（配列番号４４）、合成ダブルターミネーター（配列番号２４）、Ｅ．コリ（Ｅ．ｃｏｌｉ）ｒｐｓＬ遺伝子（配列番号２５）、Ｃａｓ９エンドヌクレアーゼ認識ドメインをコードするＤＮＡ（配列番号２６）及びラムダファージＴ０ターミネーター（配列番号２７）を含有する。ｇＲＮＡ発現カセットを含有するＤＮＡ断片を、標準的な分子生物学的技術を用いてｐＲＦ６９４に組み入れてプラスミドｐＲＦ７４７を生成し、Ｃａｓ９発現カセット及びｇＲＮＡ発現カセットを含有するＥ．コリ（Ｅ．ｃｏｌｉ）－Ｂ．サブチリス（Ｂ．ｓｕｂｔｉｌｉｓ）シャトルプラスミドを生成した。中間体プラスミドｐＲＦ７４７を使用して、Ｂ．サブチリス（Ｂ．ｓｕｂｔｉｌｉｓ）のｓｋｆ遺伝子座に発現カセットを導入するためのプラスミドを組み立てた。より詳細には、Ｂ．サブチリス（Ｂ．ｓｕｂｔｉｌｉｓ）のｓｋｆ遺伝子座におけるｓｋｆＣ遺伝子（配列番号４５）は、Ｃａｓ９標的部位（配列番号４６）を含有する。標的部位は、ＰＡＭ配列（配列番号４８の最後の３塩基）を除去することにより、可変ターゲティング（ＶＴ）ドメインをコードするＤＮＡ配列（配列番号４７）に変換され得る。ＶＴドメインをコードするＤＮＡ配列（配列番号４７）は、細胞内のＲＮＡポリメラーゼによって転写された場合に機能性ｇＲＮＡ（配列番号４９）を生成するように、Ｃａｓ９エンドヌクレアーゼ認識ドメイン（ＣＥＲ；配列番号２６）をコードするＤＮＡ配列に作動可能に融合され得る。ｇＲＮＡをコードするＤＮＡ（配列番号５０）は、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞において作動可能なプロモーター（例えば、Ｂ．サブチリス（Ｂ．ｓｕｂｔｉｌｉｓ）由来のｒｒｎＩプロモーター；配列番号２３）及びバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞において作動可能なターミネーター（例えば、ラムダファージのｔ０ターミネーター；配列番号２７）に作動可能に連結され得るが、その結果、プロモーターを、ｇＲＮＡをコードするＤＮＡの５’側に配置し、ターミネーターを、ｇＲＮＡをコードするＤＮＡの３’側に配置して、ｇＲＮＡ発現カセット（配列番号５１）を作製する。Ｂ．サブチリス（Ｂ．ｓｕｂｔｉｌｉｓ）のｓｋｆＣ遺伝子（配列番号４５）を標的化するプラスミドｐＲＦ７７６（配列番号５２）を、製造者の使用説明書に従ってＱ５を使用し、フォワード（配列番号５３）及びリバース（配列番号５４）プライマー対を用いてプラスミドｐＲＦ７４７（配列番号４３）を増幅することにより作製した。これらのプライマーは、５’及び３’末端が重複し、ｓｋｆＣ可変ターゲティングドメインを含有する断片を作製するｇＲＮＡの可変ターゲティング領域を除いて、プラスミド全体（ｐＲＦ７４７）を増幅する。このＰＣＲ産物を、製造業者の使用説明書に従ってＮＥＢｕｉｌｄｅｒ（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）を用いて分子内集合反応に使用して、プラスミドｐＲＦ７７６（配列番号５２）を作製し、Ｃａｓ９発現カセット及びｓｋｆＣを標的とするｇＲＮＡをコードするｇＲＮＡ発現カセットを含有するＥ．コリ（Ｅ．ｃｏｌｉ）－Ｂ．サブチリス（Ｂ．ｓｕｂｔｉｌｉｓ）シャトルプラスミドを生成した。

実施例４
ｓｋｆＡ実施例発現カセットを発現するバチルス・サブチリス（Ｂａｃｉｌｌｕｓｓｕｂｔｉｌｉｓ）細胞の作製
本実施例は、バチルス・サブチリス（Ｂａｃｉｌｌｕｓｓｕｂｔｉｌｉｓ）細胞のゲノムへのプロテアーゼ発現カセットの組込みを記載する。より具体的には、これらの発現カセットは、Ｂ．サブチリス（Ｂ．ｓｕｂｔｉｌｉｓ）細胞において作動可能なプロモーター（例えば、天然のＢ．サブチリス（Ｂ．ｓｕｂｔｉｌｉｓ）ｒｒｎＩプロモーター；配列番号２３）をコードするＤＮＡ配列に作動可能に融合されたｓｋｆ遺伝子（配列番号５５）の隣接領域５’に相同なＤＮＡ配列を含有し、これは、プロモーターが成熟遺伝子をコードするＤＮＡの５’に配置され、且つターミネーターが成熟遺伝子をコードするＤＮＡの３’に配置されるように、バチルス・アミロリケファシエンス（Ｂａｃｉｌｌｕｓａｍｙｌｏｌｉｑｕｅｆａｃｉｅｎｓ）ａｐｒターミネーターをコードするＤＮＡ配列（配列番号４０）に作動可能に融合されたプロテアーゼバリアント成熟遺伝子をコードするＤＮＡ配列に作動可能に融合される。上記の発現カセットは、ｓｋｆ遺伝子の隣接領域３’に相同なＤＮＡ配列（配列番号５６）に作動可能に融合される。

発現のためにＰｘｙｌＡ誘導性プロモーターを使用してａｍｙＥ遺伝子座で導入されたＢ．サブチリス（Ｂ．ｓｕｂｔｉｌｉｓ）ｃｏｍＫ遺伝子（配列番号４２）を含有する親Ｂ．サブチリス（Ｂ．ｓｕｂｔｉｌｉｓ）細胞を、１２５ｍｌのバッフル付きフラスコにおいて、１５ｍｌのＬ培地（１％ｗ・ｖ^－１トリプトン、０．５％酵母抽出物ｗ・ｖ^－１、１％ＮａＣｌｗ・ｖ^－１）中、３７℃及び２５０ＲＰＭで一晩増殖させた。一晩培養したものを、１２５ｍｌバッフル付きフラスコにおいて、１０ｍｌの新鮮なＬ培地中で０．２（ＯＤ_６００単位）に希釈した。培養物が３７℃（２５０ＲＰＭ）で０．９（ＯＤ_６００単位）に達するまで、細胞を増殖させた。Ｄ－キシロースを３０％（ｗ／ｖ）のストックから０．３％（ｗ／ｖ）に加えた。細胞を３７℃（２５０ＲＰＭ）でさらに２．５時間増殖させ、７分間にわたり１７００×ｇでペレット化した。細胞を、使用済み培地を使用して元の培養の４分の１量に再懸濁させた。１００μｌの濃縮細胞を、およそ１μｇのバリアントプロテアーゼ発現カセット及び製造業者の使用説明書に従って１８時間のローリングサークル増幅（Ｓｙｎｇｉｓ）を使用して増幅された上記のｐＲＦ７７６プラスミド（配列番号５２）と混合した。細胞／ＤＮＡ形質転換混合物を、１０μｇ／ｍＬカナマイシン、１．６％（ｗ／ｖ）スキムミルクを含有し、１．５％（ｗ／ｖ）寒天で固化させたＬ培地（ｍｉｌｌｅｒ）にプレーティングした。３７℃でコロニーを形成させた。カナマイシン及びスキムミルクを含有するＬ寒天上で増殖し、コロニーに隣接する領域に目に見える透明ゾーンを生成したコロニー（タンパク質分解活性を示す）を採取し、１．６％（ｗ／ｖ）スキムミルクを含有する寒天プレート上にストリークした。

驚くべきことに且つ予想外にも、プラスミドｐＲＦ７７６（配列番号５２）及び線状発現カセットを使用して親Ｂ．サブチリス（Ｂ．ｓｕｂｔｉｌｉｓ）株においてｓｋｆ遺伝子座で組み込まれたプロテアーゼバリアント発現カセットに関する組込み効率は、発現カセット内のホモロジーアームの長さに依存して変動した。より長いホモロジーアーム（３Ｋｂの長さ）が使用されたときに利点が観察され、それにより組込みの頻度を０パーセント～最大で６０パーセント向上させた（表２）。

実施例５
ｐｋｓＲＣａｓ９ターゲティングベクターの構築
中間体プラスミドｐＲＦ８０１（配列番号５７）を、Ｃａｓ９標的部位を導入するプライマー（配列番号５９）を使用して、Ｂ．サブチリス（Ｂ．ｓｕｂｔｉｌｉｓ）由来のａｐｒＥプロモーター（配列番号５）に作動可能に融合されたＣａｓ９タンパク質をコードする合成ポリヌクレオチド（配列番号１）、ｇＲＮＡ発現カセット及びプラスミドｐＫＢ３２０（配列番号９）の骨格（配列番号８）を含有するプラスミドｐＲＦ７８７由来の２つの断片を増幅することによって構築した。標的部位は、ＰＡＭ配列（配列番号６１の最後の３塩基）を除去することにより、可変ターゲティング（ＶＴ）ドメインをコードするＤＮＡ配列（配列番号６０）に変換され得る。ＶＴドメインをコードするＤＮＡ配列（配列番号６０）は、細胞内のＲＮＡポリメラーゼによって転写された場合に機能性ｇＲＮＡ（配列番号６２）を生成するように、Ｃａｓ９エンドヌクレアーゼ認識ドメイン（ＣＥＲ；配列番号２６）をコードするＤＮＡ配列に作動可能に連結されるように配置された。ｇＲＮＡをコードするＤＮＡ（配列番号６３）は、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞において作動可能なプロモーター（例えば、Ｂ．サブチリス（Ｂ．ｓｕｂｔｉｌｉｓ）由来のｒｒｎＩプロモーター；配列番号２３）及びバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞において作動可能なターミネーター（例えば、ラムダファージのｔ０ターミネーター；配列番号２７）に作動可能に連結され得るが、その結果、プロモーターを、ｇＲＮＡをコードするＤＮＡの５’側に配置し、ターミネーターを、ｇＲＮＡをコードするＤＮＡの３’側に配置して、ｇＲＮＡ発現カセット（配列番号６４）を作製する。

第１のプラスミド断片は、Ｃａｓ９エンドヌクレアーゼ認識ドメインをコードする配列（ＣＥＲ；配列番号２６）、ラムダｔ０ターミネーター（配列番号２７）並びにプラスミドｐＫＢ３２０（配列番号９）の骨格（配列番号８）及びプラスミドｐＫＢ３２０（配列番号９）の骨格（配列番号８）を含有し、製造業者の使用説明書に従ってＱ５並びにフォワード（配列番号６５）及びリバース（配列番号６６）プライマー対を使用して増幅された。第２のプラスミド断片は、ｇＲＮＡ発現カセット及びＣａｓ９発現カセットに関するプロモーターを含有し、製造業者の使用説明書に従ってＱ５並びにフォワード（配列番号６７）及びリバース（配列番号６８）プライマー対セットを使用して増幅された。

ｓｅｒＡ上流領域（配列番号６９）及びｓｅｒＡ下流領域（配列番号７０）に対応する２つのＤＮＡ断片は、製造業者の使用説明書に従ってＱ５並びにｓｅｒＡ上流領域に関するフォワード（配列番号７１）及びリバース（配列番号７２）プライマー対並びにｓｅｒＡ下流領域に関するフォワード（配列番号７３）及びリバース（配列番号７４）プライマー対を使用して増幅された。

ＤＮＡ断片を、製造業者の使用説明書に従ってＮＥＢｕｉｌｄｅｒ（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）を用いて分子内集合反応に使用して、プラスミドｐＲＦ８０１（配列番号５７）を作製し、Ｃａｓ９発現カセット及びｓｅｒＡを標的とするｇＲＮＡをコードするｇＲＮＡ発現カセットを含有するＥ．コリ（Ｅ．ｃｏｌｉ）－Ｂ．サブチリス（Ｂ．ｓｕｂｔｉｌｉｓ）シャトルプラスミドを生成した。正しく組み立てられたプラスミドｐＲＦ８０１（配列番号５７）を使用して、フォワード（配列番号７６）及びリバース（配列番号７７）プライマー対による部位特異的変異誘発を使用してＣａｓ９バリアント（配列番号７５）を作製した。これらのプライマーは、プラスミド（ｐＲＦ８０１）全体を増幅し、Ｃａｓ９バリアントと関連する置換を組み込むために設計される。部位特異的変異誘発反応は、ＤｐｎＩで消化され、Ｃａｓ９バリアント発現カセット及びｓｅｒＡを標的とするｇＲＮＡをコードするｇＲＮＡ発現カセットを含有するＥ．コリ（Ｅ．ｃｏｌｉ）－Ｂ．サブチリス（Ｂ．ｓｕｂｔｉｌｉｓ）シャトルプラスミドを生成するプラスミドｐＲＦ８２７（配列番号７８）を作製するために使用された。

中間体プラスミドｐＲＦ８２７を使用して、Ｂ．サブチリス（Ｂ．ｓｕｂｔｉｌｉｓ）のｐｋｓＲ遺伝子座に発現カセットを導入するためのプラスミドを組み立てた。より詳細には、Ｂ．サブチリス（Ｂ．ｓｕｂｔｉｌｉｓ）のｐｋｓ遺伝子座におけるｐｋｓＲ遺伝子（配列番号７９）は、Ｃａｓ９標的部位（配列番号８０）を含有する。標的部位は、ＰＡＭ配列（配列番号８２の最後の３塩基）を除去することにより、可変ターゲティング（ＶＴ）ドメインをコードするＤＮＡ配列（配列番号８１）に変換され得る。ＶＴドメインをコードするＤＮＡ配列（配列番号８１）は、細胞内のＲＮＡポリメラーゼによって転写された場合に機能性ｇＲＮＡ（配列番号８３）を生成するように、Ｃａｓ９エンドヌクレアーゼ認識ドメイン（ＣＥＲ；配列番号２６）をコードするＤＮＡ配列に作動可能に融合され得る。ｇＲＮＡをコードするＤＮＡ（配列番号８４）は、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞において作動可能なプロモーター（例えば、Ｂ．サブチリス（Ｂ．ｓｕｂｔｉｌｉｓ）由来のｓｐａｃプロモーター；配列番号８５）及びバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞において作動可能なターミネーター（例えば、ラムダファージのｔ０ターミネーター；配列番号２７）に作動可能に連結され得るが、その結果、プロモーターを、ｇＲＮＡをコードするＤＮＡの５’側に配置し、ターミネーターを、ｇＲＮＡをコードするＤＮＡの３’側に配置して、ｇＲＮＡ発現カセット（配列番号８６）を作製する。

Ｂ．サブチリス（Ｂ．ｓｕｂｔｉｌｉｓ）のｐｋｓＲ遺伝子（配列番号７９）を標的化するプラスミドｐＳＲＳ０４１（配列番号８７）を、製造業者の使用説明書に従ってＱ５並びに骨格に関するフォワード（配列番号８８）及びリバース（配列番号８９）プライマー対並びにフォワード（配列番号９０）及びリバース（配列番号９１）を使用して、２つの断片（一方のプラスミド骨格並びにもう一方のＣａｓ９及びｇＲＮＡ発現カセット）においてプラスミドｐＲＦ８２７（配列番号７８）を増幅することによって作製した。これらのプライマーは、５’及び３’末端が重複し、ｐｋｓＲ可変ターゲティングドメインを含有する断片を作製するｇＲＮＡの可変ターゲティング領域を除いて、プラスミド全体（ｐＲＦ８２７）の２つの断片を増幅する。これらのＰＣＲ産物を、製造業者の使用説明書に従ってＮＥＢｕｉｌｄｅｒ（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）を用いて分子内集合反応に使用して、プラスミドｐＳＲＳ０４１（配列番号８７）を作製し、Ｃａｓ９発現カセット及びｐｋｓＲを標的とするｇＲＮＡをコードするｇＲＮＡ発現カセットを含有するＥ．コリ（Ｅ．ｃｏｌｉ）－Ｂ．サブチリス（Ｂ．ｓｕｂｔｉｌｉｓ）シャトルプラスミドを生成した。

実施例６
ｐｋｓＲ実施例発現カセットを発現するバチルス・サブチリス（Ｂａｃｉｌｌｕｓｓｕｂｔｉｌｉｓ）細胞の作製
本実施例は、バチルス・サブチリス（Ｂａｃｉｌｌｕｓｓｕｂｔｉｌｉｓ）細胞のゲノムへのプロテアーゼ発現カセットの組込みを記載する。より具体的には、これらの発現カセットは、Ｂ．サブチリス（Ｂ．ｓｕｂｔｉｌｉｓ）細胞において作動可能なプロモーター（例えば、天然のＢ．サブチリス（Ｂ．ｓｕｂｔｉｌｉｓ）ｒｒｎＩプロモーター；配列番号２３）をコードするＤＮＡ配列に作動可能に融合されたｐｋｓＲ遺伝子（配列番号９２）の隣接領域５’に相同なＤＮＡ配列を含有し、これは、プロモーターが成熟遺伝子をコードするＤＮＡの５’に配置され、且つターミネーターが成熟遺伝子をコードするＤＮＡの３’に配置されるように、Ｂ．アミロリケファシエンス（Ｂ．ａｍｙｌｏｌｉｑｕｅｆａｃｉｅｎｓ）ａｐｒターミネーターをコードするＤＮＡ配列（配列番号４０）に作動可能に融合されたプロテアーゼバリアント成熟遺伝子をコードするＤＮＡ配列に作動可能に融合される。上記の発現カセットは、ｐｋｓＲ遺伝子の隣接領域３’に相同なＤＮＡ配列（配列番号９３）に作動可能に融合される。

したがって、本実施例において、発現のためにＰｘｙｌＡ誘導性プロモーターを使用してａｍｙＥ遺伝子座で導入されたＢ．サブチリス（Ｂ．ｓｕｂｔｉｌｉｓ）ｃｏｍＫ遺伝子（配列番号４２）を含有する親Ｂ．サブチリス（Ｂ．ｓｕｂｔｉｌｉｓ）細胞を、１２５ｍｌのバッフル付きフラスコにおいて、１５ｍｌのＬ培地（１％ｗ・ｖ^－１トリプトン、０．５％酵母抽出物ｗ・ｖ^－１、１％ＮａＣｌｗ・ｖ^－１）中、３７℃及び２５０ＲＰＭで一晩増殖させた。一晩培養したものを、１２５ｍｌバッフル付きフラスコにおいて、１０ｍｌの新鮮なＬ培地中で０．２（ＯＤ_６００単位）に希釈した。培養物が３７℃（２５０ＲＰＭ）で０．９（ＯＤ_６００単位）に達するまで、細胞を増殖させた。Ｄ－キシロースを３０％（ｗ／ｖ）のストックから０．３％（ｗ／ｖ）に加えた。細胞を３７℃（２５０ＲＰＭ）でさらに２．５時間増殖させ、７分間にわたり１７００×ｇでペレット化した。細胞を、使用済み培地を使用して元の培養の４分の１量に再懸濁させた。１００μｌの濃縮細胞を、およそ１μｇのバリアントプロテアーゼ発現カセット及び製造業者の使用説明書に従って１８時間のローリングサークル増幅（Ｓｙｎｇｉｓ）を使用して増幅された上記のｐＳＲＳ０４１プラスミド（配列番号８７）と混合した。細胞／ＤＮＡ形質転換混合物を、１０μｇ／ｍＬカナマイシン、１．６％（ｗ／ｖ）スキムミルクを含有し、１．５％（ｗ／ｖ）寒天で固化させたＬ培地（ｍｉｌｌｅｒ）にプレーティングした。３７℃でコロニーを形成させた。カナマイシン及びスキムミルクを含有するＬ寒天上で増殖し、コロニーに隣接する領域に目に見える透明ゾーンを生成したコロニー（タンパク質分解活性を示す）を採取し、１．６％（ｗ／ｖ）スキムミルクを含有する寒天プレート上にストリークした。

驚くべきことに且つ予想外にも、プラスミドｐＳＲＳ０４１（配列番号８７）及び線状発現カセットを使用して親Ｂ．サブチリス（Ｂ．ｓｕｂｔｉｌｉｓ）株においてｐｋｓ遺伝子座で組み込まれたプロテアーゼバリアント発現カセットに関する組込み効率は、発現カセット内のホモロジーアームの長さに依存して変動した。より長いホモロジーアーム（３Ｋｂの長さ）が使用されたときに利点が観察され、組込みの頻度を１パーセント～最大で４６パーセント向上させた（表３）。

Claims

バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノム上の標的部位に、前記ゲノムへの選択マーカーの組込みを伴わずにドナーＤＮＡ配列を組み込む方法であって、少なくとも線状組換えＤＮＡコンストラクト及び環状組換えＤＮＡコンストラクトをバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞に同時に導入することを含み、前記線状組換えＤＮＡコンストラクトは、ドナーＤＮＡ配列を含み、前記ドナーＤＮＡ配列は、上流のホモロジーアーム（ＨＲ１）及び下流のアーム（ＨＲ２）によって隣接され、各ホモロジーアームは、１０００を超えるヌクレオチド長であり、前記環状組換えＤＮＡコンストラクトは、ガイドＲＮＡをコードするＤＮＡ配列と、Ｃａｓエンドヌクレアーゼをコードするヌクレオチド配列に作動可能に連結された構成的プロモーターとを含み、前記Ｃａｓ９エンドヌクレアーゼは、前記バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞の前記ゲノムにおける標的部位又はその近傍で二本鎖切断を導入する、方法。
前記ドナーＤＮＡ配列は、上流のホモロジーアーム（ＨＲ１）及び下流のホモロジーアーム（ＨＲ２）によって隣接され、各ホモロジーアームは、１０００、１１００、１２００、１３００、１４００、１５００、１６００、１７００、１８００、１９００、２０００、２１００、２２００、２３００、２４００、２５００、２６００、２７００、２８００、２９００、３０００、３１００、３２００、３３００、３４００、３５００、３６００、３７００、３８００、３９００、４０００、５０００を超え、且つ最大で６０００のヌクレオチド長であり、及び前記バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞の前記ゲノム上の前記標的部位に対する配列相同性を含む、請求項１に記載の方法。
前記ドナーＤＮＡ配列は、目的のポリヌクレオチド、目的の遺伝子、転写調節配列、翻訳調節配列、プロモーター配列、ターミネーター配列、トランスジェニック核酸配列、メッセンジャーＲＮＡの少なくとも一部と相補的なアンチセンス配列、異種配列又はこれらのいずれか１つの組合せからなる群から選択されるヌクレオチド配列を含む、請求項１に記載の方法。
前記線状組換えＤＮＡコンストラクトは、一本鎖ＤＮＡである、請求項１に記載の方法。
前記線状組換えＤＮＡコンストラクトは、二本鎖ＤＮＡである、請求項１に記載の方法。
前記線状組換えＤＮＡコンストラクトは、スタッファー配列をさらに含む、請求項１に記載の方法。
前記バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞からの子孫細胞を増殖させ、且つバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）子孫細胞であって、そのゲノム中に安定に組み込まれた前記ドナーＤＮＡ配列を有するバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）子孫細胞を選択することをさらに含む、請求項１に記載の方法。
前記環状組換えＤＮＡコンストラクトは、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）子孫細胞のゲノムに組み込まれない選択マーカーを含む、請求項１に記載の方法。
前記選択マーカーは、前記バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）子孫細胞の前記ゲノムに安定に組み込まれない、請求項８に記載の方法。
前記線状組換えＤＮＡコンストラクト及び第２の環状組換えＤＮＡコンストラクトを含有しないバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）子孫細胞をさらに選択する、請求項８に記載の方法。
前記バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞の前記ゲノム上の前記標的部位は、染色体上のヌクレオチド配列、エピソーム上のヌクレオチド配列、遺伝子導入座位、内在性標的部位及び異種標的部位からなる群から選択される、請求項１に記載の方法。
前記ドナーＤＮＡは、目的の遺伝子を含む、請求項３に記載の方法。
バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞に、１０００ヌクレオチドの上流のホモロジーアーム（ＨＲ１）及び下流のホモロジーアーム（ＨＲ２）によって隣接される前記ドナーＤＮＡ配列を含む線状組換えＤＮＡコンストラクトと、前記環状組換えＤＮＡコンストラクトとを導入することを含む対照方法における目的の遺伝子の前記遺伝子の組込みの頻度と比較して、少なくとも約２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１～最大で２３倍高い、バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノムへの前記ドナーＤＮＡ配列の組込みの頻度を有する、請求項１に記載の方法。
前記バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞は、バチルス・サブチリス（Ｂａｃｉｌｌｕｓｓｕｂｔｉｌｉｓ）、バチルス・リケニフォルミス（Ｂａｃｉｌｌｕｓｌｉｃｈｅｎｉｆｏｒｍｉｓ）、バチルス・レンツス（Ｂａｃｉｌｌｕｓｌｅｎｔｕｓ）、バチルス・ブレビス（Ｂａｃｉｌｌｕｓｂｒｅｖｉｓ）、バチルス・ステアロサーモフィルス（Ｂａｃｉｌｌｕｓｓｔｅａｒｏｔｈｅｒｍｏｐｈｉｌｕｓ）、バチルス・アルカロフィルス（Ｂａｃｉｌｌｕｓａｌｋａｌｏｐｈｉｌｕｓ）、バチルス・アミロリケファシエンス（Ｂａｃｉｌｌｕｓａｍｙｌｏｌｉｑｕｅｆａｃｉｅｎｓ）、バチルス・クラウシイ（Ｂａｃｉｌｌｕｓｃｌａｕｓｉｉ）、バチルス・ハロデュランス（Ｂａｃｉｌｌｕｓ．ｈａｌｏｄｕｒａｎｓ）、バチルス・メガテリウム（Ｂａｃｉｌｌｕｓ．ｍｅｇａｔｅｒｉｕｍ）、バチルス・コアギュランス（Ｂａｃｉｌｌｕｓｃｏａｇｕｌａｎｓ）、バチルス・サーキュランス（Ｂａｃｉｌｌｕｓｃｉｒｃｕｌａｎｓ）、バチルス・ラウツス（Ｂａｃｉｌｌｕｓｌａｕｔｕｓ）及びバチルス・チューリンギエンシス（Ｂａｃｉｌｌｕｓｔｈｕｒｉｎｇｉｅｎｓｉｓ）からなる群から選択される、請求項１に記載の方法。
前記線状組換えＤＮＡコンストラクト及び第２の環状組換えＤＮＡコンストラクトは、プロトプラスト融合、天然又は人工形質転換（例えば、塩化カルシウム、エレクトロポレーション、熱ショック）、形質導入、トランスフェクション、接合、ファージ送達、交配、自然形質転換能、誘導性形質転換能及びこれらの任意の組合せからなる群から選択される１つの手段を介して前記バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞に同時に導入される、請求項１に記載の方法。
バチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞のゲノムに、前記ゲノムへの選択マーカーの組込みを伴わずに目的の遺伝子の複数のコピーを組み込む方法であって、少なくとも線状組換えＤＮＡコンストラクト及び環状組換えＤＮＡコンストラクトをバチルス属（Ｂａｃｉｌｌｕｓｓｐ．）細胞に同時に導入することを含み、前記線状組換えＤＮＡコンストラクトは、上流のホモロジーアーム（ＨＲ１）及び下流のアーム（ＨＲ２）によって隣接されるドナーＤＮＡ配列を含み、前記ドナーＤＮＡは、前記目的の遺伝子の複数のコピーを含み、各ホモロジーアームは、１０００を超えるヌクレオチド長であり、前記環状組換えＤＮＡコンストラクトは、ガイドＲＮＡをコードするＤＮＡ配列と、Ｃａｓエンドヌクレアーゼをコードするヌクレオチド配列に作動可能に連結された構成的プロモーターとを含み、前記Ｃａｓ９エンドヌクレアーゼは、前記バチルス（Ｂａｃｉｌｌｕｓ）細胞の前記ゲノムにおける標的部位又はその近傍で二本鎖切断を導入する、方法。