JP2023518051A

JP2023518051A - 改良されたガイドｒｎａを含む組成物及び方法

Info

Publication number: JP2023518051A
Application number: JP2022555737A
Authority: JP
Inventors: イー．ピーターズ，ジョセフ
Original assignee: Cornell University
Current assignee: Cornell University
Priority date: 2020-03-16
Filing date: 2021-03-16
Publication date: 2023-04-27
Also published as: US20230114119A1; WO2021188553A1; CN116096887A; CA3171941A1; EP4121531A1

Abstract

ＣＲＩＳＰＲベースのＤＮＡ編集において使用するための組成物、方法、システム、及びキットを提供する。前記組成物は、１つ以上の非定型リピートを含み、切断されたスペーサーを含みうるＲＮＡポリヌクレオチドを含む。前記ＲＮＡポリヌクレオチドは、ＣＲＩＳＰＲ及びトランスポゾン遺伝子、又はこれらの遺伝子によってコードされるタンパク質を含むシステムにおいて、タンパク質と共に使用される。前記遺伝子には、トランスポゾン遺伝子ｔｎｓＡ、ｔｎｓＢ、ｔｎｓＣ、及びｔｎｉＱ、Ｃａｓ遺伝子ｃａｓ８ｆ、ｃａｓ５ｆ、ｃａｓ７ｆ、及びｃａｓ６ｆが含まれる。前記ＲＮＡポリヌクレオチドを、非定型リピートを含むガイドＲＮＡとして、トランスポゾン及びＣＲＩＳＰＲタンパク質とともに使用することは、非定型リピートを含まないガイドＲＮＡと比べて、転位を増強する。代表的なＩＦ-３ｂシステムを用いて、増強された転位が実証される。【選択図】なし

Description

関連出願の相互参照

この出願は、2020年3月16日に出願された米国仮出願第62/990,111号、及びに2020年7月1日に出願された米国仮出願第63/047,209号に基づく優先権を主張し、それらのそれぞれの開示は、その全体が参照により本明細書に包含される。

［連邦政府の資金による研究又は開発に関する言及］
本発明は、国立衛生研究所によって付与された認可番号R01GM129118の下で、政府の支援をうけて発明された。政府は本発明に所定の権利を有する。

［配列表］
本願は、ASCIIフォーマットで電子的に提出された配列表を含み、参照によりその全体が本明細書に組み込まれる。前記ASCIIコピーは、2021年3月12日に作成され、018617_01284_SL.txtと名付けられ、そのサイズは、2,176,959バイトである。

本開示は、一般に、DNAを改変するための方法に関し、より詳細には、非定型リピート配列を含む配列を有するガイドRNAを使用する、CRISPRに基づく編集のための改善された組成物及び方法に関する。ガイドRNAは、それに加えて、又はその代わりに、短縮されたスペーサーを含んでもよい。

多種多様の「clustered regularly interspaced short palindromic repeats(CRISPR)アレイ」が、過去数年にわたって研究されてきた。CRISPRアレイは、典型的には、AT-リッチなリーダー配列と、それに続く短い複数のリピート配列とを含み、リピート配列は、複数のスぺーサー(それぞれが別個の配列を含む)によって分離されている。CRISPRリピート配列は、典型的には、28～37の塩基対の長さに及ぶが、より短い配列及びより長い配列が報告されている。

CRISPRアレイから転写されたRNAポリヌクレオチドは、いわゆるガイドRNA(一般にgRNAとも称される)を使用する、ポリヌクレオチドのRNA-誘導編集を促進するために、種々のメカニズムによって処理される。任意の細胞種において、DNA配列を事実上標的化するためのガイドRNAの合理的な設計を可能にする知識及びリソースの増加に従って、多数のCRISPRベースのRNA誘導DNA編集システム及び技術の採用が、近年劇的に増加した。しかしながら、これらのアプローチを向上させるための改善された組成物及び方法に対する継続的かつ満たされていないニーズが残っている。本開示は、このニーズに関連する。

本開示は、CRISPRに基づくDNA編集において使用するための組成物、方法、システム、及びキットを提供する。本開示は、プライベート化されたガイドRNAを使用する特定のCRISPRシステムが、改善された転位効率を示すことを実証する。高められた転位効率は、DNA基質(染色体又はプラスミドなど)内の所定の位置にカーゴ(cargo)DNAを挿入するために本明細書に記載のシステムを使用することを後押しする。

プライベート化されたガイドRNAは、本明細書でさらに説明されるように、１つ又は複数の非定型(atypical)リピート配列を含み、切断スペーサーを含むこともできる。非定型リピートは、ある実施形態において、CRISPRアレイ内のスペーサー(これは、アレイ内の、もっとも最近獲得されたスペーサーではない)の隣にある１つ又は複数のリピートに由来する。

一実施形態において、本開示は、CRISPRシステム(特定の例では、タイプI-F3b CRISPRシステムである)で使用するためのRNAポリヌクレオチド(例えば、ガイドRNA、これはgRNAとも呼ばれる)を提供する。

複数の実施形態において、RNAポリヌクレオチドは、5'から3'の方向に、隣接して、i）第一のCRISPRリピート配列を含む5'末端セグメント；ii）DNA標的中のプロトスペーサー(例えば、標的配列)に相補的な標的化配列を含むスペーサー配列；及び、iii）第二のCRISPRリピート配列を含む3'末端セグメント；を含む。5'末端セグメント、3'末端セグメント、又はその両方は、第一の参照リピート配列(基準リピート配列)又は第二の参照リピート配列それぞれに対して、１つ又は複数のヌクレオチド変化を含み、又はそのようなヌクレオチド変化の組合せを含む。複数の実施形態において、前記RNAポリヌクレオチドは、タイプIF-3b CRISPRシステムで機能的であり、タイプIF-3b CRISPRシステムにおいてガイドRNA(このガイドRNAは、前記１つ又は複数のヌクレオチド変化を含まない。例えば、このガイドRNAは、非定型リピートを含まない)として使用されるRNAポリヌクレオチドよりも、前記プロトスペーサーを含むDNAテンプレートのより効率的な改変を示す。複数の実施形態において、ガイドRNAは、8ヌクレオチドを含む、又は8ヌクレオチドからなる5'末端セグメントを含む。複数の実施形態において、ガイドRNAは、20ヌクレオチドを含むか、又は20ヌクレオチドからなる3'末端セグメントを含み、及び任意で、前記20ヌクレオチドの3'末端はGである。複数の実施形態において、ガイドRNAの3'末端セグメントは、回文配列(パリンドローム配列)を含むステムループを形成する。

非限定的な例では、本開示のRNAポリヌクレオチドは、参照配列(基準配列)として、第一の発生リピート配列(内在性原核生物CRISPRアレイにおけるCas6コード配列の3'側にある)によってコードされる第一のリピート参照配列を含む。複数の実施形態において、第二の参照リピート配列は、第二の発生リピート配列(内在性原核生物CRISPRアレイにおけるCas6コード配列の3'側にある)によってコードされる。複数の実施形態において、第一及び/又は第二の参照リピート配列は、細菌又は古細菌中に存在するリピート配列と同じであり、ここで、細菌又は古細菌中の前記リピート配列は、CRISPRアレイ中のスペーサー(細菌によってもっとも最近に獲得されたスペーサーではない)と隣接しており、例えば、第一リピートの3'末端は、スペーサー(アレイに挿入されたもっとも最近のスペーサーではない)の5'末端に隣接している。同様に、スペーサーの3'末端は、本明細書に記載のリピート-スペーサー-リピートセグメント中の第二リピートの5'ヌクレオチドに隣接する。複数の実施形態において、内在性原核生物CRISPRアレイは、ガンマプロテオバクテリアCRISPRアレイであってもよい。非限定的な実施形態において、参照リピート、及び/又は非定型リピートは、A.salmonicida CRISPRアレイから得ることができる。

本開示は、リボ核タンパク質(RNP)複合体の成分として提供される、本明細書に記載のRNAポリヌクレオチドを含む。複数の実施形態において、RNPは、本明細書に記載のガイドRNAとタンパク質(Cas5、Cas6、Cas7、Cas8、及びそれらの任意の組み合わせから選択される)を含む。１つの実施形態において、RNPはCas6を含み、RNP内のCas6によって、非定型リピートの3'末端セグメントの少なくとも一部を含むステムループが認識される。複数の実施形態において、ガイドRNAの標的化配列は、ガイドRNAに加工されるRNAポリヌクレオチドに含めるために選択される（このRNAポリヌクレオチドが、プロトスペーサーを含む既知のDNA標的配列のCRISPRベース改変で使用するのに適するように）。複数の実施形態において、ガイドRNA中の標的化配列(例えば、スペーサー)は、プロトスペーサーと完全に同一であってもよく、又はスペーサーとプロトスペーサーとの間にある種のミスマッチが含まれてもよい。特定の実施形態において、スペーサーは、長さ29ヌクレオチド以下であり、したがって、切断型スペーサーを構成してもよい。複数の実施形態において、本開示のRNAポリヌクレオチドは、１つのリピート-スペーサー-配列のみ、又は２つ以上のリピート-スペーサー-リピート配列を含み、ここでリピート配列のうちの少なくとも１つは非定型リピートである。複数の実施形態において、本明細書に記載のリピート-スペーサー-リピート配列中のスペーサー(RNAポリヌクレオチド中に２つ以上のリピート-スペーサー-リピートセグメントが存在する場合)は、同じスペーサー配列であってもよく、又は異なるスペーサー配列が使用されてもよい。

本開示は、本明細書に記載されるすべてのRNAポリヌクレオチドをコードする発現ベクターを含む(すべての非定型リピート、及び非定型リピートのすべての組み合わせを含むが、これらに限定されない)。このような発現ベクターから転写された単離RNAポリヌクレオチドも含まれる。前記発現ベクターを含む細胞(真核細胞及び原核細胞を含む)も含まれる。

一態様において、本開示は、１つ以上の細胞において遺伝的標的を改変するためのシステムを提供する。このシステムは、本明細書に記載のRNAポリヌクレオチド、又はそれらをコードする１つ以上のベクターを含み、及び、第一セットのトランスポゾン遺伝子tnsA、tnsB、tnsC、及びtniQ、Cas遺伝子cas8f、cas5f、cas7f、及びcas6f、及び任意で、転写調節因子をコードするxre遺伝子、又は任意で、１つ以上の前記遺伝子によってコードされる１つ以上のタンパク質も含む。複数の実施形態において、本明細書に記載のタンパク質の少なくとも２つが、融合タンパク質中に存在してもよい。

このシステムはまた、DNA標的内のプロトスペーサーに近位の位置で、DNA中に導入することができるDNAカーゴを含む。非限定的な実施形態において、本明細書に記載のシステムで使用される遺伝子又は前記遺伝子によってコードされるタンパク質は、任意で、参照配列に対して１つ以上のアミノ酸変化を含む。複数の実施形態において、アミノ酸変化は、tnsA遺伝子、tnsB遺伝子、tnsC遺伝子、又は前記システムのコンポーネントとして本明細書に記載される他の遺伝子及びタンパク質中に存在してもよい。

一態様において、本開示は、細胞に本明細書に記載のシステムを導入すること、又は細胞内で本明細書に記載のシステムを発現することを含む方法を包含する。複数の実施形態において、この方法は、原核細胞又は真核細胞を改変するのに適している。複数の実施形態において、本明細書に記載のガイドRNAを含むRNAポリヌクレオチド中の標的化配列は、細胞中の染色体又はプラスミド中のプロトスペーサーを標的とする。本明細書に記載の方法は、細胞にカーゴDNAを導入することを含む。カーゴDNAは、プロトスペーサーに近位の位置で、染色体又はプラスミドに挿入される。複数の実施形態において、DNAカーゴは、プロトスペーサーの末端から48ヌクレオチドの位置で染色体又はプラスミドに挿入される。特定の実施形態において、DNAカーゴは、トランスポゾンの左右の端部を含む。

別の態様では、本開示は、複数の生物由来のCRISPRアレイを分析すること、CRISPRアレイ内のスペーサーに隣接するリピート配列を決定すること、より早くに獲得されたスペーサーに隣接するリピート配列を、より遅くに獲得されたスペーサーに隣接するリピート配列と比較すること、より早くに獲得されたスペーサーに隣接するリピート配列と、より遅くに獲得されたスペーサーに隣接するリピート配列との間の違いを決定すること、CRISPRに基づくDNA改変に使用するためのガイドRNAの設計に使用するための候補として、より遅くに獲得されたスペーサーに隣接するリピート配列とは異なる、より早くに獲得されたスペーサーに隣接するリピート配列を指定すること、を含む方法を提供する。複数の実施形態において、本開示は、本明細書に記載の方法を使用して同定された配列を含むRNAポリヌクレオチドを生成することを含む。本開示はさらに、CRISPRに基づくDNA改変(染色体又はプラスミドへのカーゴDNAの挿入を含み得る)において、本明細書に記載の方法を用いて同定されたRNAポリヌクレオチドを使用することを含む。したがって、複数の実施形態において、本開示は、異なるスペーサー及び/又はリピート配列を有する解析されたCRISPRアレイにおいて、スペーサー又はリピートの置換、又はそれらの組合せを含むRNAポリヌクレオチドを提供すること、及び使用することを含む。複数の実施形態において、スペーサーは、長さが29ヌクレオチド以下であってもよい。本開示は、本明細書に記載の方法に従って同定及び生成されたRNAポリヌクレオチドを含むライブラリーを含み、ここで、前記RNAポリヌクレオチドは、DNAのセグメントを標的とするスペーサーを含む。スペーサー配列は、システムのユーザによって設計されてもよい。

本開示はまた、本明細書に記載の方法によって同定された配列を含む複数のエントリーを含むデータベースを含む。本開示はさらに、本明細書に記載のデータベースから配列を選択すること、同定された配列を含む発現ベクター及び/又はRNAポリヌクレオチドを生成することを含む。

別の態様では、本開示は、CRISPRに基づくDNA改変に使用するための発現ベクターを生成するためのキットを含む。これは、所望のスペーサーをクローニングするために構成された１つ以上の制限エンドヌクレアーゼ認識部位を含む発現ベクターを含み、前記スペーサーは、請求項の方法に従って同定された１つ以上のリピート配列、又は本明細書にさらに記載されるような他の非定型リピート配列と隣接する。キットはまた、tnsA、tnsB、tnsC、及びtniQ遺伝子、Cas遺伝子cas8f、cas5f、cas7f、及びcas6f、及び任意でxre遺伝子のいくつか又はすべてを含む発現ベクター、又はこれらの遺伝子のうちの１つ以上によってコードされる１つ以上のタンパク質を含んでもよい。

［図１］ガンマ-プロテオバクテリア中に見られるI-F3 CRISPR-Casシステムを伴うTn7-様エレメント
宿主株によって表記される802のエレメントを表すTnsAタンパク質類似性ツリー。＞90％同一であったエレメントは、単一の代表例で示されている。リピートについて、類似性スコアを計算し、黒色(高い)から灰色(低い)の陰影で示した。スペーサーは、四角形で示されている(より短い四角形は、切断型スペーサーを示す)。

［図２］I-F3 CRISPR-Casシステムを有するTn7-様エレメントの４つのatt-サイトファミリーから選択された代表的例
３つの主要ファミリー(attサイト；yciA、guaC、及びffs)と、１つのマイナーファミリー(rsmJ)の代表例が、宿主によって示されている。
（A）転位遺伝子(tnsA、tnsB、tnsC、及びtniQ/tnsD)、Cas遺伝子cas6、cas7、及びcas8/5、及び調節因子xreが示されている。CRISPRアレイは、図１のように示されている。エレメントの左末端(L)及び右末端(R)が示されており、推定上のXre結合部位(アスタリスク)が示される。
（B）ガイドRNAとプロトスペーサーとの間の一致が、各遺伝子上に示されており(ブロック状矢印)、エレメントの右末端(灰色のボックス)及び宿主が示されている。プロトスペーサーから標的部位重複(TSD、灰色・括弧で囲まれている)までの距離が示される。図2Bは、出現する順に、配列番号5731～5741をそれぞれ開示している。
（C）CRISPRアレイが、リーダー領域及びスペーサー(S#)とともに示され、表記されたリピート(R#)は、リピートの配列を示している。第一のリピートとの配列の違い(赤)、ステムを維持する注目の変化(薄青)、ステムを作る逆方向反復(囲み)が示されている。アレイ中のギャップのサイズは、推定Xre調節部位に示されている。図2Cは、配列番号4762、4762～4766、374～376、3021、3021～3024及び1286～1289を、それぞれカラムの順に開示している。

［図３］エロモナス・サルモニシダ(A.salmonicida)に由来するI-F3b Tn6900エレメントは、定型及び非定型リピートとともに、RNA-誘導転位を可能にする。
種々の転位標的を、A.salmonicida S44天然アレイ、又は個々のリピート-スペーサーリピート単位を用いて試験した。
（A）転位/CRISPR-関連遺伝子、CRISPRアレイ(図１のように示されている)及び得られた定型及び非定型ガイドRNA(5'及び3'ハンドルとともに示される)の簡略化表示。Cas6プロセシングの位置が示される(ハサミ)。図5Aは、出現順に、配列番号5742～5744をそれぞれ開示している。
（B）Fプラスミド中に構築された標的を用いて、天然A.salmonicida S44アレイで見い出された転位の頻度；A.salmonicida S44プラスミドpS44-1(pS44-1)、染色体ffs attサイト(ffs)、又は陰性対照であるlacZ遺伝子(lacZ)。
（C-E）F-プラスミド中に構築された表記の標的を用いて、Tn6900由来の定型又は非定型リピートとスペーサーとの種々の組み合わせにおいて、単一のリピート-スペーサー-リピート単位で見い出される転位頻度。すべてのデータは、平均±標準偏差を示す(n=3)。

［図４］Tn7-CRISPR-Casエレメント、Tn6677及びTn6900中の非定型リピート配列の分析
（A）アレイ中の位置の関数としての、定型(typical)及び非定型(atypical)リピートのコンセンサス配列。記号は、ステム-ループを有する先の図と同様である(上：I-F3aについてn=85、I-F3bについてn=74)(中：I-F3aについてn=51、I-F3bについてn=41)(下：I-F3aについてn=51、I-F3bについてn=41)。
（B-D）表記のスペーサー及びそれらに関連する標的(ターゲット)を伴う、Tn6900(B)又はTn6677(C及びD)についての、定型及び非定型ガイドRNA中の変化と共に見い出される転位頻度。図4Bは、出現の順に、配列番号5743、5745～5746及び5744をそれぞれ開示している。図4Dは、出現の順に、配列番号5747～5750をそれぞれ開示している。定型ガイドRNAを試験し、非定型リピート(赤)又は操作された変異(下線)から自然発生する変化と比較した。すべてのデータは、平均±標準偏差を示す(n=3)。

［図５］P.aeruginosa タイプI-F1カスケードは、プラスミド干渉アッセイにおいて異種I-F3 CRISPRアレイを利用することができるが、ミスマッチ及びI-F3b非定型ガイドRNAは、プライベート化を可能にする。種々のアレイを伴うP.aeruginosa Casタンパク質の発現は、プロトスペーサーを含むプラスミドの形質転換効率を低下させるが、制御はしない。ffsスペーサーを有するP.aeruginosa PA14及びA.salmonicida S44 Tn6900、ならびに、guaCスペーサーを有するV. cholerae HE-45 Tn6677からの単一ユニットアレイを、表記の定型及び非定型リピート配置で試験した。スペーサーは、プロトスペーサーと完全にマッチするか、又は天然のミスマッチを含んでいた。リピート構成配列は図10Bに示される。すべてのデータは、平均±標準偏差を示す(n=3)。

［図６］Xreタンパク質は、RNA誘導転位のコンポーネントを調節する。
（A-B）I-F3a及びI-Fbエレメント中の推定Xre結合モチーフのためのコンセンサス配列。
（C-D）EMSAによって解像されたXre結合。転写制御領域を有するDNA断片を、電気泳動前に、各エレメント由来のXreタンパク質と共にインキュベートした(Xreタンパク質の量を増加させて)(100nM DNA；タンパク質：DNA比＝0、2、5、10、20：1)。
（E-F）種々のアラビノースにてミラー単位によりモニターされるLacZ発現によって解像されたプロモーター機能は、Xre発現レベルを制御した。転写制御領域は、V.cholerae HE-45 Tn6677 (Vc)、V.parahaemolyticus RIMD221063 (Vp)、A.salmonicida S44 Tn6900 (As)、及びVibrio sp. 10N.286.45.B6 (VB6)から示される。

［図７］Xre調節プログラムは、接合伝達の後、新しい宿主において転位機能プロモーターの接合誘導を可能にする。
Xre転写制御領域に融合されたlaczの移行は、ナイーブ受容体株において発現のバーストを生じるが、Xre調節タンパク質を発現するレシピエントでは生じない。ドナー及びレシピエントは、接合のために共に蒔かれるか(実線)、又は対照とするために別々に蒔かれた(破線)。細胞を収集し、対照を混合し、LacZ発現を表記のようにミラー単位によってモニターした。すべてのデータは、平均±標準偏差を示す(n=3)。

［図８］Aeromonasエレメントの特徴及び転位
（A）最近の活動を示唆する異なる細菌種において見い出された２つのほぼ同一のI-F3b Tn7-CRISPR-Casエレメントの概略図。基本的な特徴は、図2Aと同様に示される。エレメントは、A.hydrophila AFG_SD03中の染色体ffsサイトに位置するか、又はA.salmonicida S44中の大型接合プラスミド(pS44-1)上に見い出されたホスホアデノシンホスホ硫酸レダクターゼ遺伝子(cysH)中に挿入される。A.hydrophilaエレメントは、見かけのISエレメント挿入によって中断された複数のコンティグにわたって分割される。
（B）A.salmonicida S44及びA.hydrophila AFG_SD03 CRISPRアレイのリーダー-隣接位置内のスペーサーは、プラスミドにコードされたcysH中のプロトスペーサーと一致する。プロトスペーサーの相対位置が示されている。A.salmonicida S44スペーサーと一致するプロトスペーサーの端から、標的部位重複(TSD：target site duplication)(5bp TSD：下線を付す)の中心位置までの距離、及びトランスポゾン端部の末端配列が示されている。図8Bは、出現の順に、配列番号5751～5752をそれぞれ開示している。
（C）A.salmonicida S44、及び、A.hydrophila AFG_SD03における、Tn7-様CRISPRアレイからのリピート及びスペーサー。リピートは図2Cと同様に注釈付けされている。最初のリピートとの違いは、赤色で示される。ガイドRNAとプロトスペーサーとの間の一致は、短い鉛直線によって示される。推定I-F PAMには下線が付されている。図8Cは、カラムの順に、配列番号5802～5803、5753、5754、5804、5755～5758、777～781、5759、5760、5757、5805をそれぞれ開示している。
（D）染色体又はFプラスミド上のプロトスペーサーは、非定型ガイドRNA複合体により高効率で標的化される。同じ３つのlacZガイドRNA複合体を、F::lacZプラスミド又は染色体(その本来の位置にあるlacZ)のいずれかを用いて試験し、挿入事象は、MacConkey'sのラクトース指示薬培地上で、白色 vs 赤色コロニーを生成することによって示した。グラフは、３つの生物学的複製の平均±標準偏差及び白色コロニー数及び観察された全コロニー数を示す。
（E）染色体上の異なる遺伝子は、大腸菌染色体において非定型ガイド-RNA指向性転位の標的とされることができる。ガラクトース(galK)及びソルビトール(srlD)の２つのスペーサーそれぞれ(トップストランド及びボトムストランド)を用いて試験された２つの遺伝子。糖異化の減少を導く遺伝子不活性化をモニターすることによって転位頻度をアッセイした(適切なMacConkeyの指示薬培地上で、白色 vs 赤色コロニーによって可視化される)。グラフは、３つの生物学的複製の平均±標準偏差を示す。

［図９］完全な転位頻度及び位置のアッセイ
（A）メイトアウト(mate out)アッセイの概略図。適切なプロトスペーサーを有する標的DNAを、Fプラスミド上に組換え、転位遺伝子及びアレイを発現ベクターに供給して、染色体に位置するmini-Tnドナーエレメントを動員する(方法)。導入後、Fプラスミドの集団をドナー株に接合し、表示のようにトランス接合体中の抗生物質マーカーの存在を定量することによって、転位頻度を決定する。
（B）トランス接合体における転位位置及び配向は、PCRにより決定される。内部プライマー及び標的部位に隣接する２つのプライマーは、挿入の配向をキャプチャーする。Tn6900では、pS44-1-標的挿入をモニターし；Tn6677では、guaC^Vc-標的挿入をモニターした。Tn6900定型アレイ挿入単離体12、13及び14については、第一のPCR反応は失敗し、同じテンプレート株を用いて繰り返した。
（C）転位位置及び標的部位重複は、サンガー配列決定によって、Tn6900転移のために確認される。矢印は、単離転位事象(標的化pS44-1)について、標的部位重複の中央塩基の位置を示し、プロトスペーサーから、標的部位重複の中央位置までの距離も示され(８つの転位事象についてリストされる)、以前に記述された標的部位のゆらぎを確認する。グラフは、実際の標的部位重複(TSD)の１つの代表例を示す。図9Cは、出現順に、それぞれ、配列番号5759、5761～5765、及び5763を開示している。

［図１０］干渉アッセイリピート配列
干渉アッセイにおいて使用されるリピート配列(出現順に、それぞれ、配列番号5766～5770)。P.aeruginosaリピートとの差異は灰色で示されている。ボックスは、I-Fリピートにおける推定ステムループを含む、以前に確立された保存領域を示す。N32は、スペーサーにコードされる位置を示す。

［図１１］制限-修飾Cタンパク質により２つのクレードに分類されるI-F3 Xreクラスター
（A）関連Cタンパク質であるC.AhdI及びC.Csp231I(ティール及びフクシアで記されている)によるXreの類似性ツリー(ミッドポイントルート)は、２つのブランチにおけるクラスタリングを示している。特徴は、図1と同様に示される。
（B）Xre及び関連Cタンパク質の予測調節配列。保存された逆方向モチーフ配列は、太字のテキスト及び黒の矢印で示される。下流遺伝子の開始コドンに下線を付したが、pAttGuide配列については、att-標的化スペーサー(ターゲティングスペーサー)の最初の３つの塩基に下線が付されている。図11Bは、出現順に、それぞれ、配列番号5792～5801を開示している。

［図１２］リーディングフレームに関するスペーサーとプロトスペーサーとの比較
４つの主要なatt-サイト標的化スペーサーが、各宿主におけるプロトスペーサー(標的)と比較される：ffs、guaC、yciA、及びrsmJ。ミスマッチのパーセンテージは、スペーサー内の位置によって示されており、これは、ユニークなスペーサー-プロトスペーサーの組み合わせを比較する(フリップアウトされると予測される第6位を赤色で示す、ガイドRNAの図に関連する)。アミノ酸配列は、コード配列に関連することが示されている(ffsはRNAとして機能し、yciA遺伝子は、guaC及びrsmJの逆ストランド上にコードされることに注意)。ユニークなスペーサー及びプロトスペーサーのコンセンサス配列は、Weblogoとして示されている。スペーサー-プロトスペーサー当たりのミスマッチの総数は、I-Fシステムにおけるカスケード複合体においてフリップアウトされる第6位を除いて示されている。作表に含まれる数が示される(n)。図12は、出現の順に、それぞれ、配列番号5771～5773を開示している。

［図１３］短縮されたスペーサーを有するエレメント及びそれらの挿入位置
（A）ffs-組み込みエレメント(出現の順に、それぞれ、配列番号5737、5738、5774～5780、5778、5781、5780)
（B）araC-様組み込みエレメント(出現の順に、それぞれ、配列番号5782～5785、5782～5784、5786～5788、5784、5789、5787、5790、5784、及び5791)。
特徴は、図2Bと同様に示される。アレイが各エレメントについて示されており、リピート配列は暗灰色で記され、スペーサーは明灰色で記され、保存されたCas6結合モチーフには下線が付されている。

［図１４］parEの下流に挿入されたエレメントの概略図
TniQタンパク質の類似性ツリーは、Parashewanella curva C51が、parE attサイトを標的とするエレメント及びI-F3 CRISPR-Casシステムを使用するエレメントを分類する代表例を有することを示す。２つのTniQがエレメントに見い出される場合、類似性ツリーに使用される方は、ハイライトで表示される。

［図１５］
酵素を描写する模式図であって、プロセシングされたガイドRNA(頂部)、ならびに、例示的な上流及び下流リピート配列、マッチドスペーサー、リピートの3'及び5'ハンドルセグメント、スペーサー、リピートセグメント(CRISPRアレイの)を伴う。ヌクレオチドのグラフィカル表示を含む。一般的なタイプIシステムが示される。Sタンパク質は、IF-3システムには存在しない小サブユニットタンパク質である。I-F3システムでは、Cas8及びCas5タンパク質は融合タンパク質中に存在する。

［図１６］
図3B及び9Aに記載の実験的アプローチを用いてメイアウトアッセイにより決定された転位効率のグラフ表示(FプラスミドlacZ標的、シングルガイドRNA、lacZ4スペーサーを用いる)(図3Eも参照)。ガイドRNAは、A.salmonicida S44からの非定型リピートを含んでいた。854GC構築物は、TnsAタンパク質とTnsBタンパク質との融合物を含み、TnsAタンパク質のC末端においてHGの欠失、及び欠失部位でのAの挿入を伴う。TnsA-TnsB 855GCは、TnsAタンパク質とTnsBタンパク質との融合物を含み、TnsAタンパク質のC末端においてHGの欠失、及び欠失部位でのRの挿入を伴う。K. ocytocaリンカー構築物は、TnsAタンパク質-TnsBタンパク質の融合物を含み、以下に記載するように、K. ocytocaからの8アミノ酸リンカーの挿入によって分離されている。NLS-Strep構築物は、TnsA-TnsBの融合物を含み、ここで、この２つのタンパク質セグメントは、N-C末端方向に連続する配列において、GSGリンカー、核局在化シグナル、Strepアフィニティータグ、別のGSGリンカーによって、分離されている。TnsABCベクターは、非融合TnsA及びTnsA及びTnsCタンパク質を、コントロールとして発現する。すべての実験は、TniQ及びカスケードタンパク質を含んだ(これらは本明細書でさらに記載される)。データは、特定のアミノ酸(すなわち、HG)の除去、アミノ酸(例えば、A及びR)の追加、タグ(例えば、Strepタグ)の追加、及びリンカー(例えば、GSG及びK.ocytocaリンカー)の追加が許容されること、及び、本明細書に記載のシステムが、それらの転位機能を保持することを実証する。

本開示は、DNA修飾において使用するためのCRISPRシステムに関する組成物及び方法を提供する。特に、本開示は、以下にさらに説明するように、ガイドRNA(gRNA)及び前記gRNAをコードする発現ベクターを提供し、ここで、gRNAは、以下にさらに説明するように、非定型リピート配列(例えば、CRISPRアレイにおいて見い出されるもののような、非定型リピート配列のRNA等価物である配列)を含む。gRNAはまた、切断されたスペーサーを含んでもよい。gRNAは、強化されたDNA編集において使用するためのシステムを形成するために、タンパク質と協働する。

本明細書で特に定義しない限り、本開示で使用されるすべての技術用語及び科学用語は、本開示が関係する当業者によって一般的に理解されるのと同じ意味を有する。

本明細書を通して与えられるすべての数値範囲は、その上下の値、並びに、その範囲内にあるより狭い各数値範囲を、そのような狭い数値範囲がすべて本明細書に明示的に記載されているかのように含む。

本開示は、本明細書に記載のすべてのポリヌクレオチド及びアミノ酸配列を含む。各RNA配列はそのDNA等価物を含み、各DNA配列はそのRNA等価物を含む。相補的及び逆平行ポリヌクレオチド配列が含まれる。本明細書に開示されるポリペプチドをコードする各DNA及びRNA配列が、本開示に包含される。すべてのタンパク質のアミノ酸配列及びそれらをコードするすべてのポリヌクレオチド配列もまた包含される(配列アラインメントの方法によって含まれる配列を含むが、これらに限定されない)。本開示の任意の配列(アミノ酸配列及びヌクレオチド配列)と80.00％～99.99％同一の配列が含まれる。

本開示は、データベースエントリーを介して本明細書で特定されるすべてのポリヌクレオチド配列及びすべてのアミノ酸配列を含む。このような配列は、それらが、この出願又は特許の出願日にデータベース中に存在するので、本明細書に組み込まれる。未処理(例えば、本明細書に記載のCRISPRタンパク質によってトリミングされていないRNA)及び処理RNAポリヌクレオチド(例えば、本明細書に記載のCRISPRタンパク質によってトリミングされるRNA)が、本開示に含まれる。本開示は、配列表及び図に提示されたすべての配列、これらの配列の各々を含むより長い配列、例えば、5'及び3'末端に追加の配列を有する本明細書に記載の配列を含むか、又はそれからなる配列、及び本明細書に記載の配列のすべての連続セグメントを含む。複数の実施形態において、本明細書に記載のgRNA配列は、28～37ヌクレオチド長であり、すべての非定型リピート配列及びスペーサー配列(切断型スペーサー配列を含むが、これらに限定されない)を含むが、これらに限定させない。複数の実施形態において、gRNAは、長さが29ヌクレオチドであるスペーサーを含んでいてもよい。本開示には、別個の配列及びそれらのセグメントの組み合わせが含まれる。各配列についてのRNA等価物(例えば、TとUの置換)もまた含まれる(そのようなRNA等価物を含むgRNAも同様。スペーサーを含む、任意の付加的な配列とは無関係に)。本明細書に記載されるリピート配列の任意の１つ又は任意の組合せをコードする発現ベクターが含まれる。前記配列のcDNA配列が含まれる。遺伝子が記載されている場合、本開示は、遺伝子によってコードされるタンパク質を含む。

本開示の任意のRNAポリヌクレオチドは、最初に、ガイドRNA前駆体として転写されてもよく(crRNAを含むがこれに限定されない)、１つのリピート-スペーサー-セグメントのみを、又は２つ以上のリピート-スペーサー-セグメントを含むDNAテンプレートから転写されてもよく、後者のものは、CRISPRアレイのすべて又は一部を含むが、これらに限定されない(例えば、２つ以上のリピート-スペーサー-リピートセグメントをコードするDNAセグメント)。本開示はまた、ハイブリッドアレイを含み、このハイブリッドアレイにおいて、少なくとも１つ又はいくつかのリピート配列は、以下に説明するように、非定型リピートを含むが、他のリピートは、以下に説明するように、１つ以上の参照リピートと同じであってもよい。

本開示のガイドRNA(時に「gRNA」と称する)は、多数のCRISPRシステムにおいて使用するのに適し得ると予想される。本開示のgRNAは、DNAリピート配列のRNA等価物である完全な配列として本明細書に明示的に記載される配列、又は本明細書に記載される特定の位置でヌクレオチド位置において変化し得る配列を含むが、これらに限定されない。本開示はまた、gRNA及びその使用を含み、これには、本明細書に記載の方法に従って製造することができるgRNAが含まれる。

複数の実施形態において、本開示のgRNAは、クラス1又は2のCRISPRシステムのいずれかとともに機能してもよい。複数の実施形態において、本開示のgRNAは、CRISPRシステム、例えば、トランスポゾンタンパク質を含む細菌又は古細菌において最初に見い出されたCRISPRシステムと共に使用される。複数の実施形態において、本開示のgRNAは、タイプI-F又はタイプI-BのCRISPR-Casシステムと共に使用される。複数の実施形態において、本開示は、Tn7様トランスポゾンに関連するCRISPRシステムで使用するためのgRNAを提供する。特に、細菌ゲノムは、多くのTn7様トランスポゾンが、融合したcas8f及びcas5f、cas7f及びcas6f遺伝子、及び短CRISPRアレイを含む「最小」のタイプI-F CRISPR-Casシステムを含むことを示す。複数の実施形態において、本開示のgRNAは、I-F CRISPR/Casエレメントと共に使用される。このようなシステムは、本明細書に記載のさらなるコンポーネントと共に、本開示の少なくとも１つの態様であるgRNAの代表的な使用を提供する。

使用されるCRISPRシステムのタイプにかかわらず、CRISPR-促進遺伝的編集(挿入を含むが、これに限定されるものではない)の最近の分析は、すべての挿入をガイドRNAによって説明することができることを示す。さらに、染色体に見い出され且つ複数回使用される特定のCRISPRシステムに由来する、保存された挿入部位のファミリーには、付着部位(attachment site、省略すると「att」サイト)が含まれる。

複数の実施形態において、ガイドRNAは、特定のCRISPRアレイにおいて同定されたリピート配列のセグメントのRNA等価物であるリピート配列を含み(同じアレイにおける他のリピートに対して、変異を有する)、そのようなリピート配列は、本明細書において、時に「非定型」と呼ばれる。本明細書で使用される「RNA」等価物は、RNAポリヌクレオチドが、本明細書に記載のDNA配列と同じ配列と同じ配向を有することを意味する(RNAポリヌクレオチド中では、チミンがウラシルに通常通り置換されることを除いて)。

いかなる特定の理論に拘束されることも意図しないが、「より古い」リピート、例えば、より早くに獲得されたスペーサーに隣接するリピートは、前記リピート及びより早く獲得されたスペーサー配列を含むガイドRNAの機能を妨害する変異を有する、と従前から考えられている。しかしながら、本開示において明らかにされるように、非定型リピート(これは、切断型スペーサーに隣接していても隣接していなくてもよい)を含むgRNAは、ある種のCas酵素によって優先的に複合体化され、処理され得ると考えられており、前記Cas酵素は、例えば、5'及び3'リピートを認識する(5'->3'配向された、介在スペーサーに関連して)、Cas5及びCas6などであり、より活性なガイドRNA-Casタンパク質複合体を形成する。代わりに、又は追加的に、得られたガイドRNA-Casタンパク質複合体は、定型リピートで形成された複合体には見い出されない増強された活性を有する。

複数の実施形態において、本開示は、本明細書にさらに記載されるように、DNAのCRISPRベースの修飾に使用するためのRNAポリヌクレオチド(例えば、gRNA)を提供する。複数の実施形態において、RNAポリヌクレオチドは、明確化のために、A、B及びCとして列挙された以下のコンポーネントを、5'から3'配向に連続的に含む：
A）第一RNA配列を含む5'末端セグメント、この第一RNA配列は、ガイドRNAをコードするDNAテンプレート(CRISPRアレイを含むがこれに限定されない)中の非定型第一リピート配列のRNA等価物であるか、当該非定型第一リピート配列から転写される。複数の実施形態において、例えば、あるリピート配列から誘導されるガイドRNAの5'末端セグメントは、オペレーション(例えば、RNA-タンパク質複合体とDNAの結合中に、例えば、DNAテンプレートの挿入を促進する)のときは、8ヌクレオチドを含むか、又は8ヌクレオチドからなる。
B）DNA標的化のためのRNA配列(標的化配列、例えば、スペーサー)、ここで、前記標的化配列は、DNA中のプロトスペーサーと相補的であり、ここで、スペーサーは、本明細書にさらに記載されるようなヌクレオチド長を有し得る。
C）第二RNA配列を含む3'末端セグメント、この第二RNA配列は、ガイドRNAをコードするDNAテンプレート中の第二非定型リピート配列のRNA等価物であるか、当該第二非定型リピート配列から転写され、ここで、任意で、前記3'末端セグメントは20ヌクレオチドを含むか、又は20ヌクレオチドからなる。しかし、以下にさらに記載するように、付加的なヌクレオチドを含めることができる。

本明細書に記載のRNAポリヌクレオチド、例えば、本明細書に記載のガイドRNAは、本明細書に記載のシステムのユーザによって選択され得る、スペーサー配列(切断型スペーサー配列を含むが、これに限定されない)を含み、CRISPRシステムをDNA基質中の選択された位置に向けることができ、それによって、所定の位置に、任意の所望のDNAテンプレートを挿入することを促進する。

複数の実施形態において、RNAポリヌクレオチドは、組換えRNAポリヌクレオチドである。「組換え」ポリヌクレオチドは、天然に存在するRNAポリヌクレオチドに対して実験的に変化させたRNAポリヌクレオチドを意味する。従って、組換えRNAポリヌクレオチドは、例えば、DNA配列を標的とするために選択されたスペーサーを含むように設計されている。組換えRNAポリヌクレオチドはまた、選択されたスペーサーの前後に配置された１つ以上の非定型リピートを含んでもよい。組換えポリヌクレオチドは、所望のRNAをコードするように設計された発現ベクターから発現されるRNAを含むことができ、又は化学的に合成されてもよい。組換えRNAポリヌクレオチドはまた、本明細書にさらに記載される修飾を含んでもよい。本開示はまた、例えば、本明細書に記載のRNAポリヌクレオチド及び/又はタンパク質をコードする組換えDNA分子を含む。

本開示のある態様が、図15を参照して一般的に示される。図15は、天然アレイのセッティングにおいて、適切なプロトスペーサー隣接モチーフ(PAM)を有するプロトスペーサーから誘導される、代表的な「上流」及び「下流」リピート配列(例えば、介在スペーサーの5'及び3'側)を示す。DNA配列は、5'->3'方向に示され、挿入図に示されるように、表示のCasタンパク質と複合体を形成することができるガイドRNAをコードする。単純化のために、CRISPRアレイのリピート-スペーサー-リピートセグメントを含むDNAの一本鎖のみが示されている。図15に示される配列は、ガイドRNAと同一である(各TがUで置換されることを除いて)。CRISPRタンパク質と単一のユニットとして会合するガイドRNAのセグメントをコードするDNAのセグメントは、「この領域は、上記のガイドRNAに対応する」と表記されている。このように、記載の領域は、シングルガイドRNAとして処理されるであろうもの、及び、DNAテンプレートとのその相互作用を示す。マッチドスペーサーの上は、二本鎖DNA標的中のPAMの相対的位置とともに、処理されたシングルガイドRNA(「crRNA」と表記)を示す模式図である。Cas6切断部位は鋏によって示されている。図15において、アレイ中のリピートに関連して番号が付されているヌクレオチドは、介在スペーサーに隣接する5'及び3'セグメント境界を示している。本開示によるガイドRNAとして使用するためのRNAポリヌクレオチドは、「マッチドスペーサー」セグメントに示されるように、DNA基質を標的とするRNA配列を含む。本開示によって提供されるガイドRNAは、上流及び下流リピートに対するRNA等価物であるRNAヌクレオチド配列を含み、これは、ヌクレオチドの相対的サイズによって説明される可変ヌクレオチド位置を伴う(図15を非限定的な例示として用いる)。

図15に関連して、本明細書に記載されるCRISPR-ベースのDNA改変技術において使用されるRNAポリヌクレオチドは、少なくとも１つのリピート-スペーサーリピート配列を含む二本鎖DNAテンプレートから産生されてもよく、ここで、図15は、CRISPRアレイ中に代表的かつ非限定的な上流及び下流リピートを含むシングルDNA配列を示す。

いかなる特定の理論に拘束されることも意図しないが、本明細書に記載の非定型リピートを規定するヌクレオチドは、その少なくとも一部が、本開示のガイドRNA中に組み込まれ、本明細書に記載のCRISPRシステムの機能に影響を及ぼすと考えられる。しかしながら、理論に拘束されることを意図するものではないが、DNA中の上流及び下流の非定型リピート配列中に存在するヌクレオチドは、そのようなRNA等価物ヌクレオチドが最終的に処理されたガイドRNAに存在しない場合でさえ、標的DNAのCRISPRベース改変の性能に影響を及ぼし得ると考えられる。例えば、非限定的な例示として図15を使用すると、特定の実施形態において、本開示のガイドRNAの第一の5'末端セグメントは、上流リピートに対応するヌクレオチド21～28のみを含んでもよいが、このセグメント、ならびにヌクレオチド21のさらに上流のDNAテンプレート中のヌクレオチドは、参照リピート配列と異なってもよく、そしてそのような逸脱した非定型配列は、現在提供されているシステムの性能の改善にも寄与し得る。このように、特定の実施形態において、本開示のRNAポリヌクレオチドの第一の(非定型)5'/上流セグメントリピートにおける任意の１又は複数のヌクレオチドは、上流リピートのヌクレオチド位置21、22、23、24、25、26、27又は28の１つ又は任意の組み合わせにおいて、参照リピートと異なっていてもよい。複数の実施形態において、このようなヌクレオチドの1、2、3、4、5、6、7個のみ、又は8個すべてが、参照リピートに対して変化する。特定の実施形態において、上流リピートにおけるヌクレオチド21は、参照リピートと同じであっても異なっていてもよい。同じことが、非定型リピート中のさらに上流のヌクレオチド位置にも適用され(例えば、上流リピートの22～41位の任意の１つ又は任意の組み合わせにおける非定型ヌクレオチド)、本開示のシステムの機能に影響を与え、及び改善し得る。これは、そのような非定型ヌクレオチドが、処理された後に特定のガイドRNAの配列中に存在しない場合であっても、標的化DNAセグメントによって少なくとも部分的に決定される配列の改変において機能すると考えられる。同様に、本開示のガイドRNAの3'末端セグメント(例えば、「下流」セグメント)は、下流リピートのヌクレオチド1～20を含んでもよく、これらは、参照下流リピートとは異なる少なくともいくつかのヌクレオチドを含むことができるが、本開示は、下流リピートにおいてヌクレオチド20を越えて伸長し得るRNAポリヌクレオチドを含む。

特定の実施形態において、3'セグメントは、一般的に、しかし必ずしも常ではないが、機能的ガイドRNAの成分として、その3'末端ヌクレオチドとしてGを含む(例えば、図15の模式図に示されるようなガイドRNA)。特定の実施形態において、下流リピートにおけるヌクレオチド変化は、図15の模式図に示されるように、ヌクレオチド6～9及び16～20内の参照リピート配列を保持し、適切な3'ヘアピン構造の形成を容易にする。しかしながら、本開示は、変更されたヌクレオチドが、ガイドRNAプロセシングに必要と考えられるヘアピン構造を集合的に形成することができる限り、参照リピートに対して、下流リピート中のヌクレオチド6～9及び16～20の変化を含む。従って、本開示は、DNAテンプレート内の下流リピートの21～28位に非定型ヌクレオチドを含むテンプレートに由来する処理後(プロセシング後)ガイドRNAとして機能するであろうRNAポリヌクレオチドを作製することを含む(例え、そのような配列のRNA等価物が、目的とする標的DNAを改変するために機能する処理後RNA中には存在しない場合であっても)。

特定の実施形態において、DNA標的化配列(例えば、スペーサー)を標的とするRNA配列は、プロトスペーサー配列に相補的である。DNA標的化配列は、RNAポリヌクレオチド中に含めるために選択される(このRNAポリヌクレオチドが、既知のDNA標的配列のCRISPRベース改変で使用するのに適切であるように。これは、RNAポリヌクレオチド中に標的とされるDNA配列に相補的な配列を含んでいる)。複数の実施形態において、ガイドRNAとして本明細書に記載されるRNAポリヌクレオチドを使用するDNAのCRISPR改変は、染色体又はプラスミドの一部であるDNAに、転位因子を導入することを含む。

非限定的な例では、RNAポリヌクレオチドの5'末端セグメントにおいて、及び/又は3'末端セグメントにおいて、ヌクレオチド5'末端又は3'末端セグメント配列のヌクレオチド位置1～4内の少なくとも１つのヌクレオチドが、参照リピート配列中の同じヌクレオチド位置に対して、第一及び/又は第二の配列において変化する。非定型リピートにおけるヌクレオチド変動の位置の非限定的な例は、本開示の図に示されており、配列表に提供される。5'及び3'末端配列は、参照リピート位置に対して1～10の位置(包括的)で変化してもよい。複数の実施形態において、本明細書に記載のRNAポリヌクレオチドを含むリボ核タンパク質複合体は、Cas5、Cas6、Cas7、及びCas8の１つ又は任意の組み合わせを有する複合体中に存在する。このような複合体は、インビトロ又はインビボ(例えば、原核細胞又は真核細胞中)であってもよい。

複数の実施形態において、本明細書に記載のRNAポリヌクレオチドの5'末端セグメント及び3'末端セグメントは、参照リピート配列(単数又は複数)中の回文配列と同じであるか、又は異なっている回文配列を含む。複数の実施形態において、第一及び/又は第二の参照リピート配列は、細菌中、又は古細菌中に存在するリピート配列と同じであり、ここで、細菌中のリピート配列は、生物によって獲得された最後のスペーサーと隣接しているか、又は、同じアレイ内の別のスペーサーよりも早く獲得されたスペーサーと隣接している。本明細書に記載のガイドRNAと共に使用するのに適したタンパク質は、以下にさらに説明される。

本明細書に記載される、又は本明細書に記載の方法によって同定される非定型リピート(例えば、非定型リピートの又はそのようなリピートのある部分のRNA等価物であるRNA配列)を含むRNAポリヌクレオチドをコードする発現ベクターが、本開示に含まれる。複数の実施形態において、本開示は、このような発現ベクターから転写されたRNAポリヌクレオチドを含み、ここで、前記RNAポリヌクレオチドは、単離され及び/又は精製されてもよい。このようなRNAポリヌクレオチド及びそれらをコードする発現ベクターを含む細胞も含まれる。

非限定的な実施形態において、本明細書に記載のシステムで使用されるタンパク質は、I-F3bトランスポゾンを含む１つ以上の生物に由来するタンパク質又は前記生物から派生するタンパク質を少なくとも１つ含む。複数の実施形態において、タンパク質は生物から派生する(本明細書にさらに記載されるように、例えば、発現ベクターを使用してタンパク質を発現することによって、又はDNAテンプレートを改変する本明細書に記載のシステムのユーザによって生成されるmRNAを使用してタンパク質を発現することによって)。天然に存在するタンパク質から派生したタンパク質は、核局在化シグナル、及び精製タグのような修飾を有していてもよい。

複数の実施形態において、１つ以上のI-F3bタンパク質には、I-F3bトランスポゾンタンパク質TnsA、TnsB、TnsC、TniQ、ならびに、I-F3b Casタンパク質Cas8、Cas5、Cas7、及びCas6が含まれる。前記タンパク質の１つ以上は、一緒になって融合していてもよい(他のタンパク質を伴っても、伴わなくてもよい)。複数の実施形態において、Cas8及びCas5は、単一の融合タンパク質中に存在する。複数の実施形態において、TnsA及びtnsBは、単一の融合タンパク質中に存在する。複数の実施形態において、tniQは、本明細書に記載のタンパク質の別のものに融合される。複数の実施形態において、TniCとTniQは互いに融合している。複数の実施形態において、本明細書に記載の３つ以上のタンパク質が、融合タンパク質中に存在してもよい。複数の実施形態において、タンパク質は、アミノ酸を連結することなく、互いに融合される。別の実施形態において、連結アミノ酸を含めることができる。非限定的な実施形態において、連結アミノ酸はフレキシブルなリンカーを形成してもよく、及びそのようなものは、フレキシビリティを提供するために１つ以上のアミノ酸を含んでもよい(例えば、グリシンリッチリンカー)。非限定的な実施形態において、リンカーはグリシン及びセリンを含む。一実施形態において、リンカーは、1～12個のアミノ酸を含む。一実施形態において、リンカーは、GSG配列を含むか、又はGSG配列からなる。複数の実施形態において、２つ以上のリンカーを使用することができる。一実施形態において、リンカーは、K.oxytoca由来のタンパク質のセグメントを含む。一実施形態において、K.oxytocaリンカーは、N末端からC末端方向に連続する配列を含み、これは、KYA、QQN、SLF、ICS、及びFPのすべてを含む。複数の実施形態において、本開示のタンパク質は、タグ、例えば精製タグ、又は他のタグを含んでもよい。一実施形態において、タグは、Strep-タグを含む。適切なStrep-タグのアミノ酸配列は、当該技術分野で既知である。一実施形態において、Strepタグは、N末端からC末端方向に、WSH、PQF、及びEKのすべてを含む。複数の実施形態において、本開示のタンパク質は、核局在化シグナル(NLS)を含む。適切なNLS配列は、当該技術分野で既知である。一実施形態において、NLSは、N末端からC末端方向に連続する配列を含み、これは、PKK、KRK、及びVのすべてを含む。一実施形態において、本開示のタンパク質は、N末端からC末端方向に、リンカー、NLS、Strepタグ、及びもう一つのリンカー(最初のリンカーと同じ配列を含んでいてもよい)を含む連続配列を含む。一実施形態において、本明細書に記載のアミノ酸配列の変化は、アミノ酸の欠失を含む。一実施形態において、末端HG、例えば、Aeromonas salmonicida 株S44プラスミドpS44-1によってコードされるTnsAの末端HGは、融合タンパク質中で欠失されてもよい。複数の実施形態において、HGの欠失は、その欠失位置にてA又はRの挿入を伴う。代表的な融合タンパク質が構築され、標準的なメイトアウトアッセイで転移のための機能が測定されており(前記アッセイは、図3B及び9Aとともに記載されている)、これは、FプラスミドlacZ標的、シングルガイドRNA、lacZ4スペーサー(図3E参照)を、非定型リピートとの関連において伴う。このような融合タンパク質を使用する結果は、図16に示されている。複数の実施形態において、本明細書に記載のシステムから発現されるタンパク質は、リボソームスキッピング配列を含むコード配列から発現されてもよい。リボソームスキッピング配列は当技術分野で知られており、非限定的な実施形態において、リボソームスキッピングペプチドT2A、P2A、E2A、及びF2Aを含む。

本明細書に記載のシステムはまた、DNA基質への挿入に使用するためのDNAカーゴ配列を提供する。DNAカーゴ配列は、左末端及び右末端トランスポゾン配列を含むことができる。トランスポゾン左末端及び右末端配列もまた、DNAカーゴとともに挿入されてもよい。DNAカーゴ配列は、本明細書に記載のタンパク質と標的化RNAとの協働によりDNA基質に挿入され、DNA編集を生じる。当業者であれば、「左」及び「右」トランスポゾン配列という用語を理解することができ、及びそのよう配列を認識することができるであろう。

I-F3bシステムで使用するために、１つ以上のI-F3bタンパク質が、本明細書(本文、表、及び図面を含む)に記載されるI-F3bタンパク質をコードする任意の生物から得られてもよく、所望により改変されてもよい。複数の実施形態において、I-F3bタンパク質は、本明細書に記載のI-F3bトランスポゾンを含む生物のサブセットの任意のメンバーに由来するか、又はそこから派生する。複数の実施形態において、I-F3bタンパク質は、シグナル認識粒子をコードするffs遺伝子の下流付着部位を有する生物のゲノムによってコードされ、それらは、rsmJ遺伝子の下流にある。

適切なI-F3bタンパク質及びそれらを使用する生物は、例えば図面に示されている。機能性IF-3bシステムを含むこのような生物はまた、他の転移因子を含んでもよい。

複数の実施形態において、I-F3bタンパク質は機能的であり、本明細書にさらに記載されるように、29ヌクレオチドより短いスペーサー配列を含む標的化RNAを伴い、IF-3aシステムのような他のI-Fタンパク質で達成されるものよりも高い転位頻度を示すことができる。さらに、転位頻度の増加は、１つ以上の非定型リピート配列の存在によって影響を受ける可能性があり、それからの少なくともいくつかのヌクレオチドは、標的化RNAに含まれる(それがDNA編集において操作可能である場合)。従って、複数の実施形態において、DNAテンプレート(そこから標的化RNAが生成される)は、以下にさらに説明するように、１つ以上の非定型リピートを含む。非定型リピートの代表的な例は、本明細書(図面、本文、配列表を含む)に記載されている。複数の実施形態において、標的化RNAは、CRISPRアレイ中のリピート配列のセグメントのRNA等価物であるリピート配列を含み、このようなリピート配列は、非定型リピートを含んでいる。

先に述べたように、より早く獲得されたスペーサーに隣接するより古いリピートは、当該リピートを含むガイドRNAの機能を妨害する変異を含む、と従前から考えられてきた。複数の実施形態において、より古いリピートの位置は、前記リピートが最初に挿入されるCRISPRアレイのAT-リッチなリーダー領域から次第に遠ざかる。当業者は、CRISPRアレイリーダー配列を認識することができるであろう。さらに、当該技術分野で知られているように、新たなスペーサー/リピートの組み合わせが、cas6-コード遺伝子の近くのリーダー領域に追加される。

本開示は、標的化RNAを含み、この標的化RNAには、前駆体(例えば、CRISPRアレイから転写され、Casタンパク質によって認識及び/又は処理されるより長いRNAポリヌクレオチド)が含まれてもよく、これは、CRISPRアレイに挿入されたもっとも最近のスペーサーではないスペーサーに隣接するリピート配列に由来するヌクレオチド配列を利用する。複数の実施形態において、標的化RNAは、CRISPRアレイ中の最も古いスペーサー、又はもっとも最近に獲得されたものではないスペーサーに隣接する１つ以上のリピート配列を含むテンプレートによってコードされる。複数の実施形態において、CRISPRアレイは、少なくとも２つのスペーサーを含むが、本開示は、１つのスペーサーのみを含むCRISPR RNAコーディングテンプレートに存在し得る非定型リピート配列の使用を必ずしも排除しない。

より詳細には、DNA複製に起因する変異は、より長い期間CRISPRアレイ中に存在するリピート中(リピート-スペーサー-リピートセグメント中)で生じやすく持続しやすく(より最近獲得された対応物に比べて)、変性リピート配列(生存可能なガイドRNAエフェクター複合体へとプロセシングするのに機能的ではないと従前から考えられてきた)を生じる。特に、そのような変異配列が観察される範囲内において、CRISPRアレイ中の変性リピートは、ガイドRNAを生成するために使用された場合、ガイドRNAを、そのCRISPR編集機能において非機能性又は低機能性にすると仮定されている。しかしながら、本開示は、いくつかの場合において、少なくとも特定のタイプのトランスポゾン因子がプロセスに関与している限り、変化したリピートが、強化された編集機能を実際に有することを実証する(以下にさらに説明する)。上記のように、強化された機能を有するこれらのリピートは、「非定型」リピートと呼ばれる。複数の実施形態において、変性リピートは、組換えプロセスから生じる変化とは異なっていてもよく、又は相同性により駆動される別のプロセス(DNAポリメラーゼが、リピートのテンプレートDNA上のヌクレオチドをスキップして次のリピートに移り、欠失を引き起こす)によって生じる変化とは異なっていてもよい。

再度、いかなる特定の解釈によって拘束されることも意図しないが、非定型リピートは、5'リピート及び3'リピート(5’->3’配向、スペーサーが介在)(リピートのRNA等価物を含むが、必ずしもこれに限定されるわけではない)を認識するCas5及びCas6のようなある種のCas酵素によって優先的に複合体化され、処理(プロセシング)され、それぞれ、より活性なガイドRNA-Casタンパク質複合体を形成し得ると考えられる。それに代わって、又はそれに加えて、得られたガイドRNA/Casタンパク質複合体は、定型リピートで形成された複合体には見い出されない増強された活性を有する。従って、複数の実施形態において、本開示は、DNAのCRISPRベース改変において使用できるRNAポリヌクレオチドを提供し、このRNAポリヌクレオチドは、5'から3'方向に連続的に：第一RNA配列を含む5'末端セグメント(第一RNA配列は、ガイドRNAをコードするDNAテンプレート中の非定型第一リピート配列のRNA等価物である)；DNA標的化のためのRNA配列(標的化配列)(ここで、前記標的化配列は、標的とされるDNA中のプロトスペーサーに完全に又は少なくとも部分的に相補的である)；第二RNA配列を含む3'末端セグメント(第二RNA配列は、ガイドRNAをコードするDNAテンプレート中の第二非定型リピート配列のRNA等価物である)を含んでいる。5'末端セグメント、3'末端セグメント、又はその両方は、それぞれ、第一の参照リピート配列(基準リピート配列)、及び/又は第二の参照リピート配列に対して、１つ以上のヌクレオチド変化を含む。複数の実施形態において、RNAポリヌクレオチドの5'末端セグメント及び3'末端セグメントの各々は、以下にさらに説明するように、それぞれ、第一及び第二の参照リピート配列に対して１つ以上のヌクレオチド変化を含む。

参照配列(基準配列)は、RNAポリヌクレオチドの成分である第一及び/又は第二リピート配列とは異なる任意の適切な配列であってもよく、そして、プロセシングされたガイドRNA(DNA編集中に使用される)には必ずしも含まれていないリピート中で見い出される追加の配列を含んでもよい。複数の実施形態において、参照配列は、非定型リピートと同じアレイ内の、より最近獲得されたスペーサーのすぐ隣にあるリピート配列を含む。このように、複数の実施形態において、標的化RNAの、5'末端セグメント、3'末端セグメント、又はその両方は、それぞれ、第一及び第二の参照リピート配列に対して１つ又は複数のヌクレオチド変化を含む。従って、本開示は、より早くに獲得されたスペーサーに隣接するリピート配列の使用を含む。この点に関して、当技術分野で特定のCRISPRシステムについて一般的に知られているように、CRISPRアレイ中のリピートは、Casタンパク質によって結合されるガイドRNA「ハンドル」をコードし、前記ガイドRNAはcrRNAからプロセシングされる。

定型及び非定型リピートを含むcrRNAの処理(プロセシング)の非限定的な例示が、図3(図15に加えて)、及び本開示の他の図面に示されている。図3Aにおいて、下部パネルの左から１つ目のR1は、未処理のCRISPRアレイ転写物の5'末端を示す。左から２つ目のR1は、定型リピートから転写された5'ハンドルを示し、その切断部位は、第一の鋏及び鉛直線によって示される。S1は、CRISPRアレイにおいてより最近獲得された(S2スペーサーと比べて)代表的な32ヌクレオチドのスペーサーの位置を示す。第二のR2は、定型3'ステムループを示す。第二の鋏及び垂直線は、第一の(例えば、より最近獲得されたスペーサーの)3'末端、及び、定型3'ステムループを有する下流のリピートを生成するための切断位置を示す。第二の鋏の右には、第二の鋏によって示される切断によって生成される非定型5'ハンドルが示され、それに続いて、より後に獲得されたスペーサーS2と、R3と表される非定型3'ステムループが示されている。リピート-スペーサー-リピートセグメント間の差は、S2に先行する２つのUUヌクレオチド、S2の直後のA、ステムループの第一ストランドの前のUUU配列、及びステムループの非定型ループ部分の第四位のAにおいて、明らかである。図3B、3C及び3Dは、本明細書に記載のより早く及びより遅く獲得されたスペーサーから転写される標的化RNAの使用を比較するデータのグラフィカル表現である。これらのデータは、非定型リピートを含むテンプレートから転写され処理された標的化RNAが、定型リピート配列を含むテンプレートのセグメントから転写される標的化RNAと比較して、DNAエレメントの転位の増強を促進できることを示す。従って、本開示は、非定型リピートを含むテンプレートから転写される標的化RNAの使用が、転位効率に有益な効果を提供することを実証する。図3のより詳細な説明は、以下の実施例において提供される。

従って、非定型リピートを含むDNAテンプレートから転写される標的化RNAの使用は、任意のガイド-RNA指向型CRISPRシステムの機能を改善する可能性があり、本開示は、タイプIF-3bシステムとともに本明細書に記載のgRNAを使用するある種の利点を説明し、本開示は、任意の適切なCRISPRシステムとともに非定型リピートを使用することを含み、これは、任意のTn7-CRISPR/Casエレメントを含むがこれに限定されず、任意のI-Fエレメント、及びタイプI、II、III、IV、V、VIシステム、タイプ1及びタイプ2のCRISPRシステム、Cas12K及び多重タイプI-Bシステムを含むが、これらに限定されない。さらに、本明細書に記載の非定型リピートは、本明細書に記載のハンドルを認識することができる任意の他のCas酵素と共に使用されてもよい。このようなシステムは、短縮されたスペーサーのような、変化したスペーサーを含んでもよい。この点に関して、本開示は、非定型リピートを含むテンプレートから転写される標的化RNAが、Cas12K及び多重タイプI-Bシステムと共に使用される場合、転位頻度を増加させるのに有効と考えられることを実証することによって、非定型リピートの増強された機能の実証を拡張する。さらに、増強された転位は、例えば、I-F3bシステムにより達成できる(ただし、図3に示されるものより短いスペーサー(これは、１つ又は２つの非定型リピートを伴ってもよい)が使用される場合)。例えば、図3は、32ヌクレオチドのスペーサー([N32])を示すが、本開示は、転位効率を高めるためのより短いスペーサーの使用を含み、複数の実施形態において、I-F3bシステムを用いて実施される。本明細書で使用される「システム」は、タンパク質とガイドRNAとの組み合わせを意味し(ともに必須であり、DNA修飾を達成するのに十分である)、その非限定的な例が、本明細書で説明される。

前述の説明にもかかわらず、ある実施態様において、本明細書に記載のガイドRNAの使用は、本明細書にさらに記載されるように、IF-3bシステムと共に使用するのに適切であると考えられる。さらに、本開示は、本明細書に記載のIF-3bシステムの使用が、IF-3aシステムのような対照と比較して、転位効率の増加を示すことを実証する。従って、複数の実施形態において、本開示は、CRISPRアレイを含んでもよく及び／又はCRISPRアレイから転写されてもよい、本明細書に記載のガイドRNAの使用を提供し、前記CRISPRアレイは、少なくとも１つの非定型リピートを含み、短縮化スペーサーも含んでもよい。

この開示の一部として含まれる配列表は、ある種の生物からのスペーサー(わずか31ヌクレオチドの長さ)を含むことに注目すべきである。ある種のシステムは、一般に32ヌクレオチド長であるスペーサーを使用するが、長さの変動が存在してもよく、本開示の切断型スペーサーと同じような転位の増強はいまだ提供しないと考えられる。従って、複数の実施形態において、本開示は、29ヌクレオチド未満の長さであってもよいスペーサー配列を含む標的化RNAを提供する。この点に関して、短い(例えば、18～20ヌクレオチド)スペーサーを有する標的化RNAは、例えば、I-F3aシステムと共に使用された場合に、転位機能を減少させるか又は転位機能が検出できないことが示されている(Klompe et. al. 2019a)。

切断されたスペーサーが、I-F3bシステムにおいて機能的であることを示す非限定的な実証が、図面において提供される。このように、本開示は、非定型リピートを含むテンプレートから転写された標的化RNA(ターゲティングRNA)を使用する、及び、切断型スペーサーを使用する予想外の利点を提供する。このように、本開示は、１つ又は２つの非定型リピート、及び任意で、切断型スペーサーを含むテンプレートから転写される標的化RNAを含む。複数の実施形態において、本開示のガイドRNAは、１つのみの非定型リピートから転写されたセグメント、又は非定型リピートから転写されたセグメントより多くを含んでもよく、ここで、各セグメントは、前記非定型リピートと同じ配列を含む。複数の実施形態において、本開示のガイドRNAは、同じ非定型リピートのコピーを２つ以上含む。複数の実施形態において、本開示のガイドRNAは、同じ又は異なるスペーサーに隣接する２つの非定型リピートを含んでもよい。複数の実施形態において、ガイドRNAは、１つのスペーサーのみ、又は同じスペーサーの２つ以上のコピー、又は２つ以上の異なるスペーサーを含んでもよい。ガイドRNAは、少なくとも、選択されたスペーサーが非定型リピートの前後に自然には現れないことから、天然に産生されたものとは異なる。本開示のガイドRNAは、選択されたスペーサー(内在的に発生するCRISPRアレイにはコードされていなかったもの)とともに作動するように構成された非定型リピートから転写される少なくとも１つのセグメントを有することにより、天然に現れるものとは異なっていてもよい。

複数の実施形態において、本開示のスペーサーは、18、19、20、21、22、23、又は24個のヌクレオチドからなってもよい。複数の実施形態において、スペーサーは、本明細書にさらに記載されるように、CRISPRアレイにおいて非定型リピート配列として指定されるものから転写される、1、2、3、4、又は5個のヌクレオチドを含む。複数の実施形態において、本明細書に記載のRNAポリヌクレオチドの5'末端セグメント及び3'末端セグメントは、参照リピート配列(単数又は複数)中の回文配列と同じであるか、又は異なる回文配列を含む。複数の実施形態において、スペーサーは、ループ構造の大きさを減少させることによって、非定型になる。

複数の実施形態において、本開示のガイドRNAのハンドルは、CCUACである5'ヌクレオチド配列、又はUACであるこの配列のトランケーションを含み、前記配列はCRISPRアレイによってコードされており、これは非定型リピート配列をコードする配列を含むことができる。複数の実施形態において、CC配列は、リピート配列の一部、又はスペーサー配列の一部、又はその両方であり、これは、スペーサーのどの末端が考慮されているかによる。

より詳細には、ガイドRNA(上述のように、標的化RNAとも呼ばれる)は、CRISPR構築物(CRISPRアレイを含むが、必ずしもこれに限定されない)によってコードされてもよい。複数の実施形態において、適切なガイドRNA又はガイドRNA前駆体は、１つのスペーサー配列に隣接する非定型リピートを一組のみ含み、又は、同じ又は異なるスペーサー配列に隣接する、二組以上の同じ又は異なる非定型リピートを使用してもよい。本開示に基づいて、この開示の一態様である任意のガイドRNAを用いて、適切な標的化RNAを製造することができると予期される(例えば、ガイドRNAを形成する定型5'末端又は3'末端を、遺伝子操作して、非定型リピートのRNA等価物である配列を形成することができる)。

上述したように、本明細書に記載のI-F3bシステムは、I-F3b CRISPR関連タンパク質(又はCasタンパク質)を使用し、ガイドRNA配列と一致するDNAを標的とする複合体(Casタンパク質＋ガイドRNA)を形成し、これは、本明細書にさらに記載するように、スペーサーとプロトスペーサーとの間のある種のミスマッチに対する寛容性を有する。天然に存在するエレメントは進化して、I-F3b Casタンパク質(Cas8/5f、Cas7f、及びCas6f)のサブセットを使用し、ガイドRNAを含む同族CRISPRアレイを処理して、同族エレメントを標的にして、ガイドRNA配列と一致するDNAに隣接する転位を導く(ここでも、ある種の潜在的ミスマッチを有する)。I-F3b Cas8/5f(Cas8-5とも呼ばれる)は天然に融合しており、本開示はこのような融合タンパク質を含む。I-F3bトランスポゾンタンパク質である、TnsA、TnsB、TnsC、及びTnsD/TniQは、標的となるDNA基質中に又は挿入DNAテンプレート中に存在し得る、同族の「左」及び「右」トランスポゾンDNA配列を認識する。当該技術分野で知られているように、各左及び右末端配列ペアは、通常、tnsA、tnsB及びtnsC遺伝子の特定のセットと関連しており、そして左及び右末端配列は、特定のtnsA、tnsB及びtnsCカセットに関して「同族」であると考えられている。

本開示は、本明細書に記載される無傷のタンパク質を含み、また、その機能的フラグメントも含む。「機能的フラグメント」は、本明細書に記載のポリペプチドの連続アミノ酸の１つ以上のセグメントを意味し、これは、DNA挿入テンプレートの標的RNAプログラム化挿入に関与するのに十分な能力を保持する。したがって、複数の実施形態において、機能的フラグメントは、例えば、コアドメイン、触媒ドメイン、ポリヌクレオチド結合ドメインなどを含んでもよく、又はそれらからなってもよい。１つのドメイン、又は２つ以上のドメインが、機能的フラグメント中に存在し得る。

複数の実施形態において、天然に存在するタンパク質の組み合わせが使用され、ここで、前記タンパク質は別個のソースに由来する。

複数の実施形態において、本開示の組成物及び方法は、異種系において機能的である。本明細書で使用される「異種」とは、系(システム)、例えば細胞タイプを意味し、ここで、前記系の１つ以上の成分は、細胞/系を改変することなく産生されない。異種系の非限定的な実施態様は、エロモナス・サルモニシダ(Aeromonas salmonicida株S44を含むが、必ずしもこれに限定されない)ではない任意の細菌である。複数の実施形態において、代表的及び非限定的な異種系は、任意のタイプのE.coliである。異種系はまた、任意の真核細胞を含む。複数の実施形態において、異種細胞は、I-F3bシステムを内因的に使用しない任意のグループのメンバーである。複数の実施形態において、本開示は、任意のタンパク質、リピート配列、及びガイドRNA配列(配列表及び図面に記載されている)(長さが31ヌクレオチドより少ないマッチドスペーサー長を有する)を適応させることを含む。

複数の実施形態において、本明細書に記載されているシステムは、DNA挿入テンプレートを、細菌ゲノム、任意のエピソームエレメント、又は真核生物染色体中の実質的に任意の位置に、配向依存様式で挿入するために使用されるが、ある場合には、PAM配列を必要とすることがある。複数の実施形態において、前記システムは、標的化RNAを介して、真核細胞内の染色体中の配列を、又は真核細胞内のDNA染色体外エレメント(DNAウイルスゲノムなど)を、標的にする。従って、本開示は、真核生物染色体、及び真核細胞の染色体外エレメント(任意のオルガネラにおけるDNAなど)を改変することを含む。このように、本明細書に記載の組成物及び方法に従って改変することができる染色体外エレメントのタイプは、特に限定されない。

複数の実施形態において、本開示のシステムは、真核生物染色体又は染色体外エレメント、又は原核生物の場合は、染色体又はプラスミドへ挿入するためのDNAカーゴを含む。したがって、トランスポゾンが通常機能する方法でゲノムの既存のセグメントを転位する代わりに、本開示は、DNAカーゴ(システムのユーザが選択できる)の挿入を提供する。DNAカーゴは、例えば、円形又は線状のDNA分子として提供されてもよい。DNAカーゴは、本開示のシステムを細胞に導入する前に、又は同時に、又は後に、細胞内に導入することができる。DNAカーゴの配列は、システムのタンパク質によって認識される適切な右末端及び左末端の要求以外は、特に限定されない。認識に必要な右末端及び左末端配列は、典型的には、約90～150bpの長さである。当該技術分野で知られているように、このような90～150bp長は、各端部のエレメントにおいてI-F3b TnsB転移酵素用の複数の22bp結合部位を含み、これは重複していてもよく又は間隔を置いていてもよい。

DNAカーゴの最小長さは、典型的には約700bpであるが、700bpから120kbまでが使用でき、挿入できると予想される。本開示は、トランスポゾンについて当該分野で知られているように、二本鎖を壊すことなく、かつ既存の配列を破壊することなく(挿入部位における残留ヌクレオチドを除いて)、DNAカーゴを挿入することを提供する。複数の実施形態において、DNAカーゴの挿入は、標的(例えば、染色体又はプラスミド)配列中のプロトスペーサーから約47、48、又は49ヌクレオチドの位置で生じる。

いかなる特定の理論に拘束されることも意図しないが、本明細書に記載されるI-F3b配列とともに機能する特定の配列への要求以外に、本開示により提供されるシステムは、DNA挿入テンプレートのDNA配列に対して両価性であると考えられる。したがって、複数の実施形態において、DNA挿入テンプレートは、転写され得る任意の配列を欠いていてもよく、そのため、転写的に不活性であってもよい。このような配列は、例えば、ゲノム中の調節配列、例えば、プロモーター、エンハンサー、miRNA結合部位、又は転写因子結合部位を改変して、内在性遺伝子のノックアウトをもたらすか、又はdsDNA基質中で２つの遺伝子座の間に間隔を提供するために使用されてもよく、これらは、遺伝性疾患の治療、所望の表現型の増強、遺伝子効果の研究、クロマチンモデリング、エンハンサー分析、DNA結合タンパク質分析、メチル化研究などを含むが、これらに限定されない様々な目的のために使用されてもよい。

複数の実施形態において、DNA配列は、任意のRNAポリメラーゼ(例えば、真核RNAポリメラーゼ、例えばRNAポリメラーゼI、RNAポリメラーゼII、又はRNAポリメラーゼIII)によって転写され得る配列を含む。複数の実施形態において、転写RNAは、タンパク質をコードしていても、していなくてもよく、又はタンパク質をコードするセグメントと、非コーディング配列(機能性である)とを含んでいてもよい。例えば、機能性RNAには、任意の触媒RNA、又はRNAi介在性プロセスに関与することができるRNAが含まれる。複数の実施形態において、機能性RNAには、siRNA、shRNA、tRNA、スプライセオソームRNA、又は任意のタイプのマイクロRNA(miRNA)、snoRNAなどのすべて又はそれらのフラグメントが含まれる。複数の実施形態において、タンパク質をコードしないRNAは、長鎖ノンコーディングRNA(lncRNA)をコードする。

複数の実施形態において、機能性RNAは、触媒セグメントを含んでもよく、したがって、リボザイムとして提供され得る。複数の実施形態において、リボザイムは、ハンマーヘッド型リボザイム、ヘアピンリボザイム、又は肝炎デルタウイルスリボザイムを含む。このような剤は、例えば、それらが標的とする任意のRNAを調節するために使用することができる。

複数の実施形態において、DNA挿入テンプレートは、１つ以上のプロモーターを含む。プロモーターは恒常性であっても誘導性であってもよい。プロモーターは、任意のタンパク質又はペプチドをコードする配列、又は機能性RNAに作動可能に連結されてもよい。

複数の実施形態において、DNA挿入テンプレートは、１つ以上のスプライスジャンクションを含む。このように、挿入テンプレートは、コーディング配列の5'末端付近のGUと、コーディング配列の3'末端付近の分岐部位とを含んでもよい。複数の実施形態において、DNA挿入テンプレートは、エクソンスキップをもたらすか、又は相互排他的エクソンを提供するか、又は、ドナー部位としての代替5'スプライスジャンクション、又は、アクセプター部位としての代替3'スプライスジャンクション、又はそれらの組合せを提供する。複数の実施形態において、DNA挿入テンプレートは、イントロン保持を低減又は削除する。

複数の実施形態において、DNA挿入テンプレートは、少なくとも１つのオープンリーディングフレームを含み、これは、DNA挿入テンプレートとともに含まれるプロモーターに作動可能に連結されてもよく、又はDNA挿入テンプレートは、組み込まれた内在性細胞プロモーターに連結される。オープンリーディングフレーム、及び、それによってコードされるタンパク質は、限定されない。非限定的な実施形態において、DNA挿入テンプレートは、ペプチドをコードするオープンリーディングフレームを含み、ここで、ペプチドは、例えば、翻訳されることができるペプチドであり、及び、例えば長さが数個から50個のアミノ酸であってもよい(より長い配列はタンパク質と考えられる)。

複数の実施形態において、DNA挿入テンプレートによってコードされるタンパク質は、細胞局在化シグナルを含み、したがって、任意の特定の細胞区画に輸送されてもよい。複数の実施形態において、コードされるタンパク質には、分泌シグナルが含まれる。複数の実施形態において、コードされるタンパク質には、膜貫通ドメインが含まれ、したがって、細胞膜に輸送され、そして細胞膜に固定されてもよい。複数の実施形態において、固定されるタンパク質は、細胞内ドメイン及び細胞外ドメインのいずれか又は両方を含んでもよく、したがって、細胞表面に表示されてもよく、さらに、例えば、シグナル伝達に関与してもよい(例えば、タンパク質は、表面レセプターを含む)。複数の実施形態において、DNAインテグレートテンプレートによってコードされるタンパク質は、核局在化シグナルを含む。複数の実施形態において、DNAインテグレートテンプレートによってコードされるタンパク質は、１つ以上のグリコシル化部位を含む。

複数の実施形態において、DNA挿入テンプレートによってコードされるタンパク質は、少なくとも１つの抗原決定基、例えばエピトープを含み、したがって、抗原提示細胞のような細胞を産生するために使用されてもよく、このような細胞は、MHC(例えば、HLA)提示を介して細胞表面上にエピトープを含むペプチドを提示してもよい。

複数の実施形態において、DNA挿入テンプレートによってコードされるタンパク質は、結合パートナー(抗体又は抗体の抗原結合フラグメントなど)をコードする。複数の実施形態において、結合パートナーは、無傷の免疫グロブリン、又は免疫グロブリンのフラグメントを含み、前記フラグメントには、抗原結合(Fab)フラグメント、Fab'フラグメント、(Fab')₂フラグメント、Fd(重鎖のN-末端部分)フラグメント、Fvフラグメント(２つの可変ドメイン)、dAbフラグメント、シングルドメインフラグメント又はシングルモノマー可変抗体ドメイン、単離されたCDR領域、単鎖可変フラグメント(scFv)、及び抗原結合機能を保持する他の抗体フラグメントが含まれるが、必ずしもこれらに限定されない。複数の実施形態において、１つ以上の結合パートナーが、DNA挿入テンプレートによってコードされ、そして、二重特異性T細胞エンゲージャー(BiTE：Bi-specific T-cell engager)、二重特異性キラー細胞エンゲージャー(BiKE：bispecific killer cell engager)、又はキメラ抗原レセプター(CAR)のすべてを、又はそれらのコンポーネントをコードする(例えば、キメラ抗原レセプターT細胞(例えば、CAR T細胞)を産生するため)。複数の実施形態において、結合パートナーは多価であり、それゆえ、三重特異性抗体又は他の三重特異性結合パートナーを含み得る。

複数の実施形態において、DNA挿入テンプレートは、T細胞レセプターをコードし、したがって、α及びβ鎖T細胞レセプターの両方をコードしてもよく、又は別個のDNA挿入テンプレートが使用されてもよい。

複数の実施形態において、DNA挿入テンプレートは、酵素；構造タンパク質；シグナル伝達タンパク質、調節タンパク質；輸送タンパク質；感覚タンパク質(sensory protein)；モータタンパク質；防御タンパク質；又は貯蔵タンパク質をコードする。複数の実施形態において、DNA挿入テンプレートは、タンパク質又はペプチドホルモンをコードする。複数の実施形態において、DNA挿入テンプレートはヘモグロビンをコードする。複数の実施形態において、DNA挿入テンプレートは、ジストロフィンのすべて又はそのセグメントをコードする。複数の実施形態において、DNA挿入テンプレートは、ロッド(rod)又はコーン(cone)タンパク質をコードする。複数の実施形態において、DNA挿入テンプレートは、選択可能又は検出可能なマーカーをコードする。複数の実施形態において、検出可能なマーカーは、緑色蛍光タンパク質(GFP)、高感度GFP(eGFP)、mCherryなどのような蛍光タンパク質を含む。複数の実施形態において、DNA挿入テンプレートは、栄養要求性マーカーをコードする(例えば、酵母において使用するため)。複数の実施形態において、DNA挿入テンプレートは、代謝経路に関与する１つ以上のタンパク質をコードする。

複数の実施形態において、DNA挿入テンプレートは、免疫応答(体液性及び/又は細胞媒介性免疫応答であってもよい)を刺激することを意図するペプチド又はタンパク質をコードし、及び、寛容を誘発することを意図するペプチド又はタンパク質も含んでもよい(自己免疫疾患又はアレルギーの場合など)。複数の実施形態において、DNA挿入テンプレートは、Toll様レセプター(TLR)、又はTLRリガンド(アゴニスト又はアンタゴニストTLRリガンドであってもよい)をコードする。

複数の実施形態において、DNA挿入テンプレートは、遺伝子又は遺伝子のセグメントを破壊又は置換することを意図する配列を含む。従って、本開示は、細胞においてノックイン及びノックアウト遺伝子改変の両方を生成すること、及び、そのような細胞を含むトランスジェニック非ヒト動物を生成すること、ならびに、同様の方法で改変された原核細胞を生成することを含む。

複数の実施形態において、転位性DNAカーゴ配列は、プロトスペーサーの3'末端に対して47ヌクレオチド3'側に位置するヌクレオチドを含む5ヌクレオチド配列内で、染色体又は染色体外エレメントに挿入される。複数の実施形態において、DNAカーゴ挿入は、5bp標的部位重複(TSD)の中心での挿入を含む。このように、非限定的な実施形態において、適切なガイドRNAが、編集複合体を、プロトスペーサーと同種である、PAMを含むDNA標的に誘導するので、DNAカーゴの正確な組み込みを達成することができる。複数の実施形態において、PAMは、TACC又はCC、NC又はCNを含むか、又はそれから構成されている(ここで、Nは任意のヌクレオチドである)。

I-F3bトランスポゾン及びI-F3b Cas遺伝子、又は任意の他の適切なシステム由来のものは、多種多様な既存のメカニズムのいずれかから発現させることができ、これは、細胞内で別々に複製することができるか、又は宿主細胞ゲノム内に組み込まれることができる。あるいは、それらは、維持されないであろう発現システムから一過性に発現されることができる。特定の実施形態では、タンパク質自体が、宿主株に直接的にトランスフォームされて、その機能を発揮することができる。本開示は、別個のトランスポゾン遺伝子カセットの複数のコピー、Cas遺伝子の複数のコピー、複数のCRISPRアレイ、及び複数の別個のカーゴコーディング配列の導入を可能にし、同じ細胞内で遺伝物質を改変することを可能にする。複数の実施形態において、第一セットのI-F3b遺伝子 tnsA、tnsB、tnsC、及び１つ以上のI-F3b tniQ遺伝子、及びI-F3b Cas遺伝子 cas8f、cas5f、cas7f、及びcas6f、及び、少なくとも第一のガイドRNAをコードする配列(これは、Cas遺伝子によってコードされるI-F3bタンパク質とともに作動する)において、第一セットのI-Fbトランスポゾン遺伝子、I-F3b Cas遺伝子、又は第一のガイドRNAをコードする配列の少なくとも１つが、組換えポリヌクレオチド内に存在するか、及び／又は、組換えポリヌクレオチドによってコードされ、この組換えポリヌクレオチドは、異種細菌、又は真核細胞に導入される。本開示は、このように、別個のI-F3bトランスポゾン遺伝子、I-F3b Cas遺伝子、及び別個のカーゴコーディング配列の第二、第三、第四、第五、又はそれより多くのコピーを含む。

送達ベクターは、原核生物において使用される場合、任意の数のプラスミド、バクテリオファージ又は別の遺伝エレメントに基づくことができる。ベクターを、それが維持されるように、又は維持されないように操作することができる(任意の数の既存のプラスミド、バクテリオファージ又は他の遺伝的エレメントを使用して)。細菌におけるこれらのDNA構築物の送達は、接合、バクテリオファージ、又は対象となる細菌宿主中で機能する任意の形質転換プロセスによって行うことができる。

このシステムの改変は、真核生物又は古細菌宿主における発現を可能にするために、発現システムを適合させることを含んでもよい。複数の実施形態において、真核細胞について、本開示は、１つ以上のタンパク質中で少なくとも１つの核局在化シグナル(NLS)を使用することを含む。一般に、適切なNLSは、タンパク質表面上に露出した正に荷電したリジン又はアルギニンの１つ以上の短い配列を含む。複数の実施形態において、本開示のシステムは、例えば、１つ以上の発現ベクターを使用して、又は、リボ核タンパク質(RNP)を直接導入することによって、真核細胞に導入される。複数の実施形態において、発現ベクターは、ウイルスベクターを含む。複数の実施形態において、ウイルス発現ベクターが使用される。ウイルス発現ベクターは、ネイキッドポリヌクレオチドとして使用されてもよく、又は任意のウイルス粒子を含んでもよく、前記ウイルス粒子には、不完全干渉粒子(defective interfering particle)又は他の複製欠損ウイルス構築物、及びウイルス様粒子が含まれるが、これらに限定されない。複数の実施形態において、発現ベクターは、例えば、アデノウイルス、ヘルペスウイルス、又はレトロウイルス(レンチウイルスベクターなど)に由来する改変ウイルスポリヌクレオチドを含む。複数の実施形態において、バキュロウイルスベクターが使用されてもよい。複数の実施形態において、任意のタイプの組換えアデノ随伴ウイルス(rAAV)ベクターが使用されてもよい。複数の実施形態において、組換えアデノ随伴ウイルス(rAAV)ベクターが使用されてもよい。rAAVベクターは、例えば、TAKARA BIO^{(登録商標)}及び他の商業的販売業者から市販されており、本開示の利益の下、本明細書に記載のシステムと共に使用できるように適合されてもよい。複数の実施形態において、rAAVベクターを製造するために、プラスミドベクターは、周知のrep、cap及びアデノ-ヘルパー成分のすべて又は一部をコードしてもよい。特定の実施形態において、発現ベクターは、自己相補的アデノ随伴ウイルス(scAAV)である。適切なssAAVベクターは、市販されており(例えば、CELL BIOLABS, INC^{(登録商標)}から)、本開示の利益の下、本明細書に提示された実施形態で使用するために適合させることができる。

このアプローチのさらなる改変は、このプロセスに必要とされるタンパク質の発現及び単離を含むことができ、新規なDNA基質の構築を可能にするために、インビトロでプロセスの一部又は全部を実施することができる。これらのDNA基質は、続いて、生きている宿主細胞に送達されるか、又は他の手順のために直接使用され得る。したがって、本開示は、DNA編集のために本アプローチで使用するための組成物、方法、ベクター、及びキットを含む。

一例では、本開示は、細菌及び/又は真核細胞において遺伝的標的を改変するためのシステムを提供する。本システムは、第一セットのI-F3bトランスポゾン遺伝子tnsA、tnsB、tnsC、１つ以上のI-F3b tniQ、Cas遺伝子cas8f、cas5f、cas7f、及びcas6f、及び本明細書に記載の第一のガイドRNAをコードする配列(少なくともI-F3b Cas遺伝子によってコードされるタンパク質とともに機能を発揮する)を含み、ここで、第一セットのトランスポゾン遺伝子、Cas遺伝子、及び/又は第一のガイドRNAをコードする配列の少なくとも１つは、組換えポリヌクレオチド内に存在する、及び/又は、組換えポリヌクレオチドによってコードされる。

複数の実施形態において、本明細書に記載のI-F3bシステムの使用は、転位参照頻度(転位基準頻度)よりも大きな転位頻度を示す。複数の実施形態において、本明細書に記載のI-F3bシステムの使用は、同じセットのタンパク質及びガイドRNAを使用し、タンパク質がI-F3aシステムに由来する場合の転位頻度よりも、大きな転位頻度を示す。複数の実施形態において、例えば、細菌において、転位頻度は、例えば、バクテリオファージ(すなわち、ウイルス)ベクター(複製できない、又はアッセイで使用される細菌株に組み込みできない)を使用して決定することができる。それゆえ、ウイルスベクターはそのDNAを細胞内に注入するが、それは細胞複製中に失われる。ファージDNA中にコードされるのは、ミニチュアTn7エレメントであり、ここでエレメントの右末端及び左末端は、抗生物質(カナマイシン(KanR)など)に対する耐性をコードする遺伝子に隣接する。トランスポゾンがバクテリオファージDNA上に残っている場合、バクテリオファージはその特定の株の細菌では維持されることができないので、細胞は依然として抗生物質によって殺されるであろう。しかしながら、TnsA、TnsB、TnsC及び他の必要なI-F3bトランスポゾンタンパク質及びヌクレオチド配列(本明細書に記載されるような)が細胞に添加される場合、転移が発生する(これは、トランスポゾンが、バクテリオファージDNAから染色体(又はプラスミド)に移動することができ、そこで維持され、抗生物質耐性である細菌のコロニーを成長させることができるからである)。それゆえ、感染性バクテリオファージ粒子の数がアッセイにおいて既知である場合、それは、実験で使用されたバクテリオファージ当たりの細菌の抗生物質耐性コロニーとして、転位の頻度を計算することを可能にする。このように、複数の実施形態において、本明細書に記載されるI-F3bタンパク質の１つ又はそれらの組合せを使用することは、転位頻度を増加させる。したがって、複数の実施形態において、本明細書に記載される１つ以上のI-F3bタンパク質及びガイドRNAエレメントは、本明細書に記載されるトランスポゾンベースの構築物を伴うCRISPR介在性挿入を増強するために使用されてもよい。

代替的な実施形態において、検出可能なマーカー及び選択エレメントを使用することができる。複数の実施形態において、転位頻度は、例えば、レポーター遺伝子の発現の変化によって測定することができる。任意の適切なレポーター遺伝子を使用することができ、その非限定的な例には、視覚的に検出可能な読み出しを生成する標準的な酵素反応の適応が含まれる。複数の実施形態において、β-ガラクトシダーゼ(LacZ)アッセイの適応が用いられる。複数の実施形態において、１つの染色体位置から別の染色体位置へ、又はプラスミドから染色体へ、又は染色体からプラスミドへのエレメントの転位は、LacZなどのレポータータンパク質の発現に変化をもたらす。複数の実施形態において、本明細書に記載されるシステムの使用は、細胞集団において、LacZ又は任意の他の適切なマーカーの発現に変化を引き起こす。複数の実施形態において、転位効率は、転位事象を経験する集団内の細胞の数を測定することによって決定され、これは、任意の適切なアプローチを使用して、例えば、レポーター発現によって、及び/又は任意の他の適切なマーカーによって、及び/又は選択基準によって決定され得る。複数の実施形態において、本開示は、例えば、細胞集団内で、対照に対して、転位の増加を提供する。上述したように、対照は、任意の適切な対照であってもよく、例えば、基準値、又はI-F3aトランスポゾンタンパク質による対照実験を用いた任意の値である。複数の実施形態において、基準値は、標準化曲線(単数又は複数)、カットオフ又は閾値などを含む。複数の実施形態において、転位効率は、本開示のシステムを使用して、DNAのすべて又はセグメントを、同一又は別個の染色体内の１つの位置から別の位置へ、染色体からプラスミドへ、又はプラスミドもしくは他のDNAカーゴから染色体へ転位することを含む。複数の実施形態において、転位効率は、本明細書に記載のシステムを用いる転位効率から得られる又は導き出される対照値よりも大きい。

ある態様において、本開示は、１つ以上の細胞において、遺伝的標的を改変するためのシステムを提供し、このシステムは、第一セットのトランスポゾン遺伝子tnsA、tnsB、tnsC、及びtniQ、Cas遺伝子cas8f、cas5f、cas7f、及びcas6f、及び任意で、転写調節因子をコードするxre遺伝子、又は任意で、前記遺伝子の１つ以上によってコードされる１つ以上のタンパク質(ここで、前記タンパク質の少なくとも２つが、融合タンパク質内にあってもよい)、及び、部分的又は完全に非定型リピートのRNA等価物である配列を含むRNAポリヌクレオチドをコードする配列を含む。野生型又は改変遺伝子、及び野生型又は改変遺伝子によってコードされるタンパク質が、使用されてもよい。例えば、非限定的な実施形態において、tnsA遺伝子は、tnsA遺伝子によってコードされるTnsAタンパク質中の少なくとも１つのアミノ酸が、その野生型配列に対して変化するような配列変化を任意で含む。複数の実施形態において、以下の少なくとも１つが真である：
i）tnsB遺伝子は、tnsB遺伝子によってコードされるTnsBタンパク質中の少なくとも１つのアミノ酸が、その野生型配列に対して変化するような配列の変化を含み、あるいは、タンパク質が使用される場合、当該タンパク質が前記変化を含む；
ii）tnsC遺伝子は、tnsC遺伝子によってコードされるTnsCタンパク質中の少なくとも１つのアミノ酸が、その野生型配列に対して変化するような配列の変化を含み、あるいは、タンパク質が使用される場合、当該タンパク質が前記変化を含む。

複数の実施形態において、TnsAタンパク質の変化は、Aeromonas salmonicida TnsAタンパク質の125位のAlaの変化を含み、ここで、任意で、その変化はAspであるか、又は相同的なTnsAタンパク質における相同的な変化である。

別の実施形態において、本開示は、細胞中で、上記のRNAポリヌクレオチドを発現することを含む方法を提供し、これは、第一のトランスポゾン遺伝子tnsA、tnsB、tnsC、及び任意で少なくとも１つのtniQ、Cas遺伝子、cas8f、cas5f、cas7f、及びcas6f、及び任意でxreを含んでおり、ここで任意で、第一セットのトランスポゾン遺伝子又はCas遺伝子の少なくとも１つが、組換えポリヌクレオチド内に存在する。複数の実施形態において、スペーサーはRNAポリヌクレオチド内にあり、細胞中の染色体又はプラスミド中のDNAセグメントを標的とし、これはプロトスペーサーを含んでもよく、そして適切なPAMに隣接していてもよい。

別の実施形態において、本開示は、本明細書に記載されるようなRNAポリヌクレオチドを産生するためのテンプレートとして使用することができる非定型リピート配列及び/又は切断型スペーサー配列を同定及び使用する方法を提供する。この方法は、CRISPRアレイを分析すること、CRISPRアレイ内のスペーサーに隣接するリピート配列を決定すること、より早くに獲得されたスペーサーに隣接するリピート配列を、より遅くに獲得されたスペーサーに隣接するリピート配列と比較すること、より早く獲得されたスペーサー及びより遅くに獲得されたスペーサーに隣接するリピート配列の間の差を決定すること、及び、より遅くに獲得されたスペーサーに隣接するリピート配列とは異っている、より早くに獲得されたスペーサーに隣接する配列を、向上した効率(より遅くに獲得されたスペーサーに隣接するリピート配列のRNA等価物であるセグメントを含むRNAを用いるCRISPRベースのDNA改変と比べて)を有するCRISPRベースのDNA改変に使用するための候補として指定することを含む。同じアプローチは、切断型スペーサー、例えば、正常なスペーサー長に対して、ヌクレオチド長が短いスペーサーを同定することに適用される(以前は、非機能性である、又は低い機能を示すと考えられていた)。

複数の実施形態において、前記方法は、より早く獲得されたスペーサーに隣接するリピートのRNA等価物である5'及び3'末端を含むRNAポリヌクレオチドを生成することをさらに含む(そして、任意の適切なプロトスペーサーを標的とするために以前に使用されたものよりも短いスペーサーを含んでもよい)。複数の実施形態において、この方法は、CRISPR-ベースのDNA修飾において、本明細書に記載のRNAポリヌクレオチドを使用することをさらに含む。複数の実施形態では、前記方法において、RNAポリヌクレオチドは、分析されたCRISPRアレイ中のスペーサーを、染色体又はプラスミド中に存在する所定のDNA配列を標的とする異なる配列で置換することを含む。本開示は、本明細書に記載の方法に従って製造されたRNAポリヌクレオチド、及びこのようなRNAポリヌクレオチドをコードする発現ベクターを含む。一実施形態において、非定型リピート配列のライブラリーが提供される。複数の実施形態において、本明細書に記載の方法によって同定されたRNAポリヌクレオチドをコードする発現ベクターのライブラリーが提供される。

別の実施形態において、本開示は、複数のエントリーを含むデータベースを提供し、前記エントリーは、本開示の方法に従って同定される、より早くに獲得されたスペーサーに隣接するリピート配列を含むか、又はそれからなり、及びそれゆえ、このようなリピート配列の完全な又は部分的なRNA等価物であるRNA配列も含む。複数の実施形態において、本開示は、データベースから１つ以上のリピート配列を選択すること、及び、前記１つ以上のリピートのすべて又は一部のRNA等価物であるセグメントをコードする発現ベクターを作製すること、及び/又は、前記１つ以上のRNA等価配列を含むRNAポリヌクレオチド(任意のプロトスペーサーを標的とする配列を含んでも、含んでいなくてもよい)を生成することを含む。

別の実施形態において、本開示は、CRISPRに基づくDNA改変に使用するための発現ベクターを産生するためのキットを提供し、このキットは、所望の標的化DNAをクローニングするように構成された１つ以上の制限エンドヌクレアーゼ認識部位を含むベクターを含み、ここで、前記標的化DNAは、本開示の方法に従って同定されるリピート配列のRNA等価物である１つ以上の配列、及び／又は、本明細書に記載される任意の特定の非定型リピート配列と隣接している。

DNAのCRISPRベースの改変に使用するためのRNAポリヌクレオチド(例えば、ガイドRNA)は、5'から3'方向に連続的に、以下のものを含んでいる：
A）ガイドRNAをコードするDNAテンプレート中の非定型第一リピート配列のRNA等価物である第一RNA配列、又は前記非定型第一リピート配列から転写された第一RNA配列を含む5'末端セグメント。複数の実施形態において、ガイドRNAの5'末端セグメントは、作動中は、CRISPRタンパク質と会合しており(例えば、DNAテンプレートの挿入を促進するために、例えば、RNA-タンパク質複合体がDNAと結合している間)、8ヌクレオチドを含むか、又は8ヌクレオチドからなる；
B）DNA標的化のためのRNA配列(標的化配列、例えば、スペーサー)、ここで、前記標的化配列は、DNA中のプロトスペーサーと相補的である；及び
C）ガイドRNAをコードするDNAテンプレート中の第二非定型リピート配列のRNA等価物である第二RNA配列、又は前記第二非定型リピート配列から転写された第二RNA配列を含む3'末端セグメントであって、任意で、前記3'末端セグメントは、20ヌクレオチドを含むか、又は20ヌクレオチドからなる(ただし、以下にさらに説明するように、追加のヌクレオチドを含んでもよい)。
本明細書に記載のRNAポリヌクレオチド、例えば、本明細書に記載のガイドRNAは、本明細書に記載のシステムのユーザによって選択されるスぺーサー配列であって、CRISPRシステムを、DNA基質内の選択された位置に向けるためのスペーサー配列を含んでもよく、それによって、DNAテンプレート(本明細書に記載のシステムのユーザによって選択されてもよい)の挿入を促進する。

複数の実施形態において、転位頻度の増加は、１つ以上の非定型リピート配列の存在によって影響されると考えられ、それからの少なくともいくつかのヌクレオチドは、標的化RNAに含まれる(それがDNA編集において作動可能であるときに)。従って、本開示は、同じガイドRNAを用いるIF-3aシステムを用いた転位頻度に対して、I-F3bシステムを用いることによる転位効率の増加を実証する。

上述したように、代表的なIF-3bシステムは、本明細書に記載のガイドRNA、及びAeromonas salmonicida(Aeromonas salmonicida株S44を含むが、必ずしもこれに限定されない)から得られるか、又はそれに由来するタンパク質を含む。IF-3bシステムを含むさらなる生物が、表Ａに提供される。しかしながら、非IF-3bシステムが、これらの生物のいずれかに存在する場合、本明細書に記載のガイドRNA及びCRISPRシステムと共に使用された場合に、増強された転位を示さないと考えられる。

［表Ａ－１］

［表Ａ－２］

［表Ａ－３］

［表Ａ－４］

［表Ａ－５］

［表Ａ－６］

［表Ａ－７］

［表Ａ－８］

［表Ａ－９］

［表Ａ－１０］

［表Ａ－１１］

［表Ａ－１２］

［表Ａ－１３］

CRISPR I-F3システムのエレメント、例えば、タンパク質、又はそのようなタンパク質をコードする核酸配列は、表Ａ又は表Ｂに示される生物のいずれか１つに由来してもよい。いくつかの実施形態において、I-F3システムはI-F3bシステムであり、I-F3bシステムのタンパク質又はエレメントは、表Ａの生物に由来してもよく、表Ａの生物から得られてもよい。表Ａ及び表Ｂの両方に列挙されている生物は、それらが従来のガイドRNAのみで機能し得る非I-F3bシステムを発現する限り、表Ｂリストから除外されてもよい。一般に、以下にさらに説明するように、I-F3aシステムは、主に、yciA及びguaC(IMPDH)遺伝子に隣接する付着部位を使用すると考えられる。I-F3bエレメントは主として、シグナル認識粒子のRNA成分をコードするffs遺伝子の下流付着部位で、及びrsmJ 遺伝子の下流に存在するエレメントを伴うマイナーブランチで見いだされる。

［表Ｂ－１］

［表Ｂ－２］

［表Ｂ－３］

［表Ｂ－４］

［表Ｂ－５］

［表Ｂ－６］

［表Ｂ－７］

［表Ｂ－８］

［表Ｂ－９］

［表Ｂ－１０］

［表Ｂ－１１］

［表Ｂ－１２］

［表Ｂ－１３］

［表Ｂ－１４］

［表Ｂ－１５］

［表Ｂ－１６］

［表Ｂ－１７］

［表Ｂ－１８］

［表Ｂ－１９］

［表Ｂ－２０］

［表Ｂ－２１］

［表Ｂ－２２］

表Ａ及び表Ｂに記載されているすべての細菌は、それらのゲノム配列と同様に、当業者に利用可能である。

複数の実施形態において、非IF-3bシステムを含む生物は、本明細書に記載の非定型ガイドRNAで機能することが期待されないか、又は少なくとも、それらは、非定型リピート及びスペーサー(表Ａに記載の生物からの)を含む本明細書に記載の非定型ガイドRNAによる転位の増強を示さないと考えられる。

本開示のいくつかのアプローチでは、発現ベクター(プラスミドなど)を用いて、前記システムの１つ又は２つ以上の構築物及び/又は成分、及びそれらのクローニングステップ又は中間体のいずれかを製造する。当該分野で既知の種々の適切な発現ベクターは、本開示の成分を産生するように適合されることができ、前記ベクターには、任意の望ましいカーゴ(ただし、本明細書に記載される他の成分との関連で)、及び非定型リピートを含むベクターが含まれる。

複数の実施形態において、本開示の組成物及び方法は、異種系において機能的である。本明細書で使用される「異種」とは、系(システム)、例えば細胞タイプを意味し、ここで、前記系の１つ以上の成分は、細胞/系を改変することなく産生されない。異種系の非限定的な実施態様は、エロモナス・サルモニシダ(Aeromonas salmonicida株S44を含むが、必ずしもこれに限定されない)ではない任意の細菌である。複数の実施形態において、代表的及び非限定的な異種系は、任意のタイプのE.coliである。

複数の実施形態において、本開示の任意のタンパク質は、Aeromonas salmonicida株S44タンパク質、又はその誘導体であってもよい(例外として、TnsAタンパク質は、Aeromonas salmonicida株S44によって、例えば、本明細書にさらに記載されるタイプの組換エンジニアリングによる改変無しでは産生されない)。複数の実施形態において、本明細書に記載のシステムは、Aeromonas salmonicida S44から作られ、Aeromonas hydrophila AFG_SD03から作られたシステムよりも高い転位効率を示す。

複数の実施形態において、非定型リピート及び/又は非定型スペーサーを有するgRNAを含む本明細書に記載のシステムは、遺伝子のブロックを、細菌ゲノム、任意のエピソームエレメント、又は真核生物染色体中の実質的に任意の位置に誘導するために使用される(配向依存的様式で)。従って、複数の実施形態において、本システムは、真核細胞における染色体中の配列を、又は真核細胞中のDNA染色体外エレメント(DNAウイルスゲノムなど)を標的とする。従って、本開示は、真核生物染色体及び真核生物の染色体外エレメントを改変することを含む。よって、本明細書に記載の組成物及び方法に従って改変され得る染色体外エレメントのタイプは、特に限定されない。

当該技術分野で知られているように、トランスポゾンは、あらゆる種類の生物において見い出されると思われる、ゲノム内で移動することができる遺伝的エレメントである。上記のgRNAに加えて、本開示は、一部分において、あるバージョンのTn7-様エレメントを使用することを含み、ここで、それはターゲティングのメカニズムとしてCRISPR-Casシステムを適合させ(トランスポゾンが移動する)、及びさらに、ある種のTn-関連タンパク質における変異を含む(これは、トランスポゾンタンパク質を用いるCRISPR-Casベースの編集を増強する)。

本開示は、単一位置(一配向においてガイドRNAと一致する部分に近接する位置)へのエレメントの挿入を標的とするために、トランスポゾン及びCRISPR-Casシステムを細胞内で使用できることを実証する。このシステムは、組換アプローチを用いて繰り返されてきた(トランスポゾンタンパク質及びCasタンパク質が細胞内の任意の位置で発現されることができ、そしてそれらが細胞内の他の場所で見い出されるCRISPRアレイ及びトランスポゾン末端配列に作用するように)。

本明細書に記載される遺伝子の各セットはまた、転写調節因子をコードする適切なxre遺伝子を含むことができる。さらに、いずれかのtns遺伝子は、本明細書にさらに記載されるように、天然で産生されるタンパク質(すなわち改変Tnsタンパク質を産生するように遺伝子操作されていない細菌によって産生されるタンパク質)とは異なるタンパク質をtns遺伝子がコードするような、変異を含んでいてもよい。

特に、関心のある任意の細胞を、トランスポゾン及びCasタンパク質を発現するように適応させることができる。細菌では、これは、独立的複製プラスミド又はバクテリオファージDNA又は他のエレメント、又はゲノム中に組み込まれるベクター、又はその後に維持されるか又は維持されない代替的送達ベクターによってもよい。一実施形態において、ユーザは、本明細書に記載のガイドRNA(例えば、１つ、２つ、又はより多くの非定型リピートを含み、所望の挿入ポイントに近接する配列とマッチするスペーサーを含むガイドRNA)を設計する。本開示によるガイドRNAの設計では、任意の隣接モチーフ(PAM配列と呼ばれる)によって決定される任意の配列要件を考慮してもよい。改良されたガイドRNAをコードする配列は、リピート間で送達ベクターにクローン化され、前記リピートの少なくとも１つは非定型リピートを含む(例えば、図3、4、及び17参照)。

本開示は、少なくとも１つのtniQ遺伝子を使用することを含み、従って、２つ以上の異なるtniQ遺伝子を使用してもよい。tniQ遺伝子は、本システムの任意部分であるTniQタンパク質を産生する。構築物中にこの遺伝子を含むことで、tniQタンパク質によって認識される１つの特定の同族部位に転位事象が誘導されるであろう。いかなる特定の理論によって拘束されることも意図しないが、tniQはまた、CRISPR/Casと相互作用してもよく、ガイドRNA標的化に必要とされ得ると考えられる。細菌株又は他の適切な細胞に送達される、関心対象の遺伝子は、既存の標準的なlab技術(図2、パネルB)を使用して、送達ベクター中のマルチクローニングサイト(MCS)にクローニングされる。MCSは、左(L)右(R)の合成トランスポゾン末端配列の間に位置する。特定の実施形態において、最終挿入の向きが重要である場合、エレメントの右末端は、選択されたガイドRNAとの一致部分の近位にある。送達ベクターは、必要に応じて維持されないコンディショナルベクターとして設計することができる。必要に応じて、選択可能な遺伝子マーカーが、このベクターに含まれてもよい。送達ベクターが維持されない場合、標的化転移プロセスによるDNAの組込みを、直接的に選択することができる。効率が十分に高い場合には、この選択可能なマーカーは必要とされない。

このシステムは、原核生物又は真核生物ゲノム中の任意の遺伝子を不活性化するためにも使用することができる。多くの選択可能なマーカーのいずれか１つを、ガイドRNAによって標的とされる遺伝子の不活性化を可能にするために、送達ベクター中に含めることができる。この種の技術は、産業、研究及び治療用途のための新しい細菌株及び真核細胞のエンジニアリングに広く適用可能である。

既存のCRISPRベースの編集技術とは対照的に、本明細書に記載されているgRNAに加えて、本システムの１つの利点は、セパレートDNAブレイクが使用されないことであり；代わりに、目的のDNAフラグメントは、ユーザによって決定された１つの位置でゲノムに直接ジョイントされることである。従って、一実施形態において、本開示は、二本鎖DNA切断を生じることなく標的DNAを編集することを提供する。

非限定的な実証において、本開示は、本明細書に記載のシステムにおいて、非定型スペーサーを有するガイドRNAの使用をサポートし、そして組換え的に産生されたタンパク質(Casタンパク質はTniQの有無にかかわらず、場合によっては「カスケード」と呼ばれる)を含み、プロトスペーサーを含むDNA基質を特異的に認識し、結合することができる。特定の実施例で使用される場合、カスケードは、Cas8-5(融合Casタンパク質をコードする)、Cas7、Cas6、及びガイドRNA(１つ以上のTniQタンパク質を伴うか又は伴わない)を含む。この組み合わせは、Tn7-様エレメントに関連するバリアントI-Fシステムのカスケードを説明する。

以下に記載の本開示の実施態様は、本開示の一態様である任意のガイドRNAを用いて実現することができ、例えば、ガイドRNAを形成する定型5'末端又は3'末端は、非定型リピートのRNA等価物である配列を形成するように遺伝子操作されることができ、得られたガイドRNAにおいて活性の増強を示すと予想される。このようなガイドRNA中に、非定型リピート配列とマッチする配列を含めることは、以下に記載する結果を改善したと考えられる。

例えば、本開示の実施例及び図面に示されるように、カスケードのインビトロ結合は、プロトスペーサーを含むDNA基質に対する特異性を伴って発生し、カスケード複合体は適切なガイドRNAを使用してそれに指向され、このことは、非定型リピートを有する本明細書で提供されるガイドRNAを使用するために適合されてもよい。同様に、図面及び実施例は、tniQ及びカスケードを含む複合体の同時精製を実証する。従って、本開示は、組換えにより産生されたTinQ及びカスケードが、物理的会合を形成することを示す。さらに、上記の説明及び図面に記載されているように、本開示は、生きた異種システムにおいて、前記システムの機能性を実証する(大腸菌を用いて実証される)。特に、図面は、接合プラスミド中の特定の位置に特異的な転位誘導を示し、この転位はPAM特異的である。特に、内因性Aeromonasにおいて、挿入はプロトスペーサーから48塩基対であった。従って、本開示は、生細胞における組換えアプローチを使用するシステムの機能性を実証し、これは、本明細書に記載されている改変なしでは、指向性転移事象を生じない。さらに、本開示は、染色体中の１つの位置からその染色体中の別の位置への転位を実証し、代表的な例として大腸菌を用いて、異種システムで得られる結果も実証する。

複数の実施形態において、本開示のシステムは、真核生物染色体又は染色体外エレメントに、又は、原核生物の場合は、染色体又はプラスミドに挿入するためのDNAカーゴを含む。トランスポゾンが通常機能する方法でゲノムの既存のセグメントを転位する代わりに、本開示は、DNAカーゴ(システムのユーザが選択できる)の挿入を提供する。DNAカーゴは、例えば、円形又は線状のDNA分子として提供されることができる。DNAカーゴは、本開示のシステムを細胞に導入する前に、導入と同時に、又は導入した後に、細胞に導入することができる。DNAカーゴの配列は、システムのタンパク質によって認識される適切な右末端及び左末端が必要であること以外は、特に限定されない。認識に必要な左右の末端配列は、典型的には約90～150bpの長さである。当該技術分野で知られているように、このような90～150bpの長さは、各端部内のエレメント中にTnsB転移酵素のための複数の22bp結合部位を含む(重複していてもよく、間隔を空けていてもよい)。

複数の実施形態において、転移性DNAカーゴ配列は、プロトスペーサーの3'末端に対して47ヌクレオチド3'側に位置するヌクレオチドを含む5ヌクレオチド配列内で、染色体又は染色体外エレメントに転位される。複数の実施形態において、DNAカーゴ挿入には、5bp標的部位重複(TSD)の中心での挿入が含まれる。従って、本明細書に記載されているような、プロトスペーサーと同族であるガイドRNAを提供することにより、DNAカーゴの正確かつPAM特異的組込みを達成することができる。複数の実施形態において、PAMは、TACC又はCC、又は、NC及びCNの変異体(図2bの非限定的な実施形態に示されるように、CG、CA、及びTCのいずれかを含む)を含むか、又はそれらからなる。

トランスポゾン及びCas遺伝子は、細胞中で別々に複製することができるか又は宿主細胞ゲノムに組み込むことができる、広範囲の既存の任意のメカニズムから発現させることができる。あるいは、それらは、維持されないであろう発現システムから一過性に発現させることができた。複数の実施形態において、タンパク質自体が、宿主株に直接的にトランスフォームされて、それらの機能を発揮することができた。本開示は、別個のトランスポゾン遺伝子カセットの複数のコピー、Cas遺伝子の複数のコピー、複数のCRISPRアレイ、及び複数の別個のカーゴコーディング配列の導入を可能にし、同じ細胞内で遺伝物質を改変することを可能にする。複数の実施形態において、第一セットのトランスポゾン遺伝子 tnsA、tnsB、tnsC、及び任意で１つ以上のtniQ遺伝子、Cas遺伝子 cas8f、cas5f、cas7f、及びcas6f、及び、xre遺伝子、及び、少なくとも第一のガイドRNAをコードする配列(本明細書に記載されており、Cas遺伝子によってコードされるタンパク質とともに作動する)において、第一セットのトランスポゾン遺伝子、Cas遺伝子、又は第一のガイドRNAをコードする配列の少なくとも１つは、組換えポリヌクレオチド内に存在するか、及び／又は、組換えポリヌクレオチドによってコードされ、この組換えポリヌクレオチドは、細菌、又は真核細胞に導入される。本開示は、このように、別個のトランスポゾン遺伝子、Cas遺伝子、及び別個のカーゴコーディング配列の第二、第三、第四、第五、又はそれより多くのコピーを含む。

一例では、本開示は、細菌及び/又は真核細胞において遺伝的標的を改変するためのシステムを提供する。本システムは、第一セットのトランスポゾン遺伝子tnsA、tnsB、tnsC、及び任意で１つ以上のtniQ、Cas遺伝子cas8f、cas5f、cas7f、及びcas6f、及び、転写調節因子をコードするxre遺伝子、及び、本明細書に記載の第一のガイドRNAをコードする配列(前記Cas遺伝子によってコードされるタンパク質とともに機能を発揮する)を含み、ここで、第一セットのトランスポゾン遺伝子、Cas遺伝子、及び/又は第一のガイドRNAをコードする配列の少なくとも１つは、組換えポリヌクレオチド内に存在し、及び/又は、組換えポリヌクレオチドによってコードされる。いかなる特定の理論にも拘束されることを意図しないが、xre遺伝子は、転写調節因子として注記されているが、本明細書に記載される転位複合体をより効率的にすることもできると考えられる。

複数の実施形態において、１つ以上のtns遺伝子、及びそれゆえ、それらがコードするタンパク質は、以下により詳細に記載されるように、改変される。この開示から、及び当業者に知られている他の情報の基づいて、相同タンパク質は、認識され、整列されることができ、そしてタンパク質のアミノ酸変化は、タンパク質が本明細書に記載のものと同様の方法にて機能するように作製され得る。このような相同タンパク質及びその変異体はすべて、本開示に含まれる。本開示はまた、天然に存在する配列の１つ以上が、１つ以上の組換えベクターから発現され得ることを例外として、天然に存在する遺伝子及びタンパク質の組み合わせを含む。複数の実施形態において、相同タンパク質は、任意の細菌(プロテオバクテリアを含むが、これに限定されない)に由来する。

本開示に含まれるタンパク質における、変異の特定の実施形態が、以下に提供される。変異は、tnsA遺伝子、tnsB遺伝子、及びtnsC遺伝子によってコードされるタンパク質のいずれか１つ、又は任意の組み合わせにおいて生じ得る。

複数の実施形態において、本開示によって提供されるTnsタンパク質は、野生型配列に対する変異を含む。本明細書で使用される「野生型」配列とは、配列変化を実験的にエンジニアリングすることなく、天然に以前から存在する配列を意味する。複数の実施形態において、野生型配列は、転位エレメントの配列であり、その非限定的な例は、Aeromonas salmonicida株S44プラスミドpS44-1の配列であり、これは、受入番号CP022176(Version CP022176.1)によりアクセスできる(例えば、www.ncbi.nlm.nih.gov/nuccore/CP022176により)。

複数の実施形態において、以下のi）、ii）及びiii）に記載の変異は、対照構築物から得られる値と類似する、又はより高い転位頻度の増加を提供する。複数の実施形態において、対照構築物は、１つ以上のtns遺伝子(本明細書に記載される変異が存在しない)を含み、及び/又は、前記対照は、定型リピートを認識する１つ以上のセグメントを有するガイドRNAを含み、ここで、転位効率の増加は、非定型リピートを認識する１つ以上の配列を含む本開示のガイドRNAにより達成される。複数の実施形態において、対照転位頻度は、Aeromonas hydrophila株AFG_SD03(受入れ番号PUTQ01000019[Version PUTQ01000019.1]から特定できる)からの転位エレメントによって示される頻度であり、これは、以下に記載する代表的なアミノ酸配列を含む(表記される変異を除いて)。Aeromonas hydrophila株AFG_SD03の関連配列は、例えば、www.ncbi.nlm.nih.gov/nuccore/1427716682により、アクセスできる。Aeromonas salmonicida Cas8/5アミノ酸配列は、受入番号ASI2565、www.ncbi.nlm.nih.gov/protein/ASI25653.1のもとで利用可能である；Aeromonas salmonicida Cas7アミノ酸配列は、受入番号 ASI25654、www.ncbi.nlm.nih.gov/protein/ASI25654.1のもとで利用可能である；Aeromonas salmonicida Cas6アミノ酸配列は、受入番号 ASI25655、www.ncbi.nlm.nih.gov/protein/ASI25655.1のもとで利用可能である。ある実施形態において、対照は、以下にさらに記載するように、Tn6677エレメントに存在するシステムを含む。

例示のためのみに仮定すると、複数の実施形態において、0.0001％の転位効率は、対照値である(これは、転位頻度が、代表的なアッセイにおいて測定できなかったためである。例えば、野生型TnsAタンパク質を用いる本明細書に記載のシステムで、仮定上、100,000細胞中の１つのみが、転位事象を経験する)。これに関連して、本開示は、対照転位頻度に対して、転位効率の1倍～200倍(包括的であり、それらの間に存在するすべての数値及び範囲を、小数第一位まで含む)の増加を提供する。複数の実施形態において、転位効率は、ユーザ指定のDNAテンプレートの挿入(DNA基質内の選択された位置に挿入される)に、等しくてもよい。

複数の実施形態において、本明細書で提供されるCRISPRガイドRNA及びシステムは、DNA標的配列の改変(例えば、転位によるDNA標的配列へのある配列の挿入)を生じさせる。DNA標的配列は、挿入のためのDNAカーゴ配列を含んでもよい。いくつかの実施形態において、ガイドRNAは、対照ガイドRNAを用いた改変効率と比較して、改変効率の増加を促進する。いくつかの実施形態において、ガイドRNAは、非定型ガイドRNAであり、改変(修飾)は、本明細書に記載のタイプI-F3b CRISPR複合体で行われ、対照ガイドRNAは、本明細書に記載の逸脱リピートを含まないガイドRNA(例えば「定型ガイド」RNA)である。複数の実施形態において、改変(例えば、転位)効率は、対照ガイドRNAを用いた対照改変効率よりも、少なくとも1.5倍大きい。複数の実施形態において、改変効率は、対照ガイドRNAを用いた対照改変効率よりも、少なくとも2倍大きい。複数の実施形態において、改変効率は、対照ガイドRNAを用いた対照改変効率よりも、少なくとも4倍大きい。複数の実施形態において、本開示は、対照に対する転位効率の増加を促進し、例えば、染色体からプラスミドへの転位を、対照値より、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188倍高める。同様の転位効率は、転位事象(ここで、転位には、エレメントをcisで転移することが含まれる)、例えば、染色体中の１つの位置から同じ染色体中の異なる位置への転位について、測定されることができる。

i）本開示の一実施形態において、tnsA遺伝子は、tnsA遺伝子によってコードされるTnsAタンパク質中の少なくとも１つのアミノ酸が、その野生型配列に対して変化するような、配列変化を含む。ある実施形態において、TnsAタンパク質の変化は、Aeromonas salmonicida TnsAタンパク質の125位のAlaの変化を含み、ここで任意で、その変化はAspであるか、又は相同的なTnsAタンパク質における相同的な変化である。代表的なTnsAアミノ酸配列を以下に示す。これに関連して、我々は、この構築物は、多数の挿入を導入することができるが、その変化がなければ、挿入はほとんどバックグラウンドレベルか、又は検出不可能であることを実証した。

ii）複数の実施形態において、本開示は、tnsB遺伝子によってコードされるTnsBタンパク質中の少なくとも１つのアミノ酸が、その野生型配列に対して変化している配列変化を含むtnsB遺伝子を含む。一実施形態において、tnsBタンパク質の変化は、Aeromonas salmonicida TsnBタンパク質のアミノ酸位置167の変化を含み、ここで、任意でその変化はSerであるか、又は相同的なTnsBタンパク質の相同位置における相同的な変化である。代表的なTnsBアミノ酸配列を以下に示す。

iii）TnsA及びTnsBタンパク質と同様に、複数の実施形態において、本開示は、tnsC遺伝子によってコードされるTnsCタンパク質中の少なくとも１つのアミノ酸が、その野生型配列に対して変化している配列変化を含む改変tnsC遺伝子を含む。複数の実施形態において、その変化は、任意で、TnsC Walker Bモチーフ内に位置する。複数の実施形態において、Walker Bモチーフの変化は、例えば、Aeromonas salmonicida TnsCタンパク質の135位、136位、137位、138位、139位又は140位にあり、その代表的な例は以下に示される。一実施形態において、この変化は、TnsCタンパク質中の140位のアミノ酸についてであり、例えば、アミノ酸140は、Ala又はGlnに変化し、又は相同的なTnsCタンパク質の相同位置における相同的な変化が生じる。

iii）tnsC遺伝子は、tnsC遺伝子によってコードされるTnsCタンパク質中の少なくとも１つのアミノ酸が、その野生型配列に対して変化している配列変化を含み、ここで、その変化は、任意でTnsC Walker Bモチーフ中である。

複数の実施形態において、本開示の任意の組成物、システム、又は方法は、TnsEトランスポゾンタンパク質の非存在下で実施されてもよい。TnsEトランスポゾンタンパク質は、当該技術分野で既知である。非限定的な実施態様において、本開示の任意の組成物、システム、及び/又は方法は、以下のアミノ酸配列を含むか又はそれからなるE.coli TnsEタンパク質の非存在下及び/又は関与なしで、実施されてもよい。

複数の実施形態において、本開示の任意の組成物、システム、及び/又は方法は、任意のTnsEタンパク質(前述の配列の相同体であるが、大腸菌ではない細菌種に由来するもの)の非存在下及び/又は関与なしで、実施されてもよい。

変異及び/又は変異位置を含むアミノ酸配列の非限定的な実施態様は、以下のアミノ酸配列及び受入番号によって、本明細書に記載されている。拡大、太字及びイタリック体で表されたアミノ酸は、本開示に包含される変異の非限定的な例を表す。拡大された配列は、他の変異が生じ得る位置であり、これらもまた、本開示に含まれる。

Aeromonas salmonicida株S44 プラスミドpS44-1からのXre(gene 91099..91428、Locus tag CE463_00475)。
本開示は相同なXre配列を含む。以下の配列は、Aeromonas hydrophila株AFG_SD03中のXreタンパク質と同一である。

前述の変異のいずれかに加えて、本開示はまた、追加のアミノ酸変化を含み(例えば、TnsC中の変化)、これは、標準的なTn7(例えば、相同タンパク質)における活性獲得型変異を含んでもよく、TnsABC(A225V)、TnsABC(E233K)、TnsABC(E233A)、及びTnsABC(E233Q)を含むが、これらに限定されない。

ある面において、本開示には、本明細書に記載の１つ以上のCas又は他の酵素をコードする１つ以上の発現ベクターを含むキットが含まれる。ある種のアプローチにおける発現ベクターは、ポリ-クローニング部位などのクローニング部位を含み、任意の所望のカーゴ遺伝子をクローニング部位にクローン化することができ、システムが導入されるか又はすでに含んでいる任意の標的細胞内で発現される。キットは、さらに、１つ以上の容器、適切なベクターを製造するために発現ベクターをどのように作製し及び／又は使用するかについての指示を提供する印刷物、及び、発現ベクターを細胞に導入するための試薬を含むことができる。キットは、システムの成分の製造に使用するための１つ以上の細菌株をさらに含んでもよい。細菌株は、細菌の増殖が制限される組成物(例えば、グリセロール等の１種以上の凍結保護剤を含む凍結培養物)中で提供されてもよい。複数の実施形態において、キットは、ユーザが選択したスペーサーを含むガイドRNA発現用のベクターを含む。発現ベクターは、少なくとも１つの非定型リピートを含むガイドRNAの少なくとも一部をコードする。発現ベクターは、ユーザが選択したスペーサーを、少なくとも１つの非定型リピートに隣接して発現ベクター中にクローン化できるように構成されることができる。クローニング部位は、一対の非定型リピートが、発現ベクター中にクローン化されるスペーサーに隣接するように構成されることができる。

別の面において、本開示は、本開示のシステムを介してDNAカーゴを細胞に送達することを含む。この方法は、一般的に、本開示の１つ以上のポリヌクレオチド、又は、タンパク質及び前記タンパク質をコードするポリヌクレオチドの混合物(本明細書に記載のガイドRNAのような、RNAポリヌクレオチドが提供されてもよい)を、１つ以上の細菌又は真核細胞に導入することを含み、それにより、Cas及びトランスポゾン酵素/タンパク質が発現され、Cas酵素とトランスポゾンの組み合わせによって、染色体又は他のDNA標的の編集が生じる。

非限定的な実施形態において、本開示は、真核細胞、及び本明細書に記載のシステムによって編集されやすい任意の微生物を標的とするのに適していると考えられる。複数の実施形態において、微生物には、１種以上の抗生物質に対して耐性である細菌が含まれ、本システムによる編集が、前記抗生物質耐性菌を殺すか又はその増殖を減少させ、及び/又は、前記システムは、例えば、染色体又はプラスミド上に存在し得る抗生物質耐性遺伝子を標的とするカーゴの使用により、細菌を抗生物質に対して増感させる。本開示は、それゆえ、細菌染色体又はエピソームエレメント(例えば、プラスミド)を標的とするのに適している。複数の実施形態において、細菌染色体又はプラスミドの改変は、細菌を病原性から非病原性に変化させる。

複数の実施形態において、細菌は死滅する。複数の実施形態において、本明細書に記載されるシステムの成分の１つ又はすべてを、医薬製剤中に提供することができる。従って、複数の実施形態において、DNA、RNA、タンパク質、及びそれらの組み合わせが、少なくとも１つの薬学的に許容される添加剤を含む組成物中に提供されてもよい。

複数の実施形態において、本開示の方法は、細菌細胞を減少又は根絶するために使用され、及び、生残細菌及び／又は休止状態の生存可能であるが培養不能(VBNC：viable but non-culturable)細菌を、個体又は無生物表面、又は食品から減少又は根絶するために使用されてもよい。

複数の実施形態において、及び上述のように、本開示は、真核細胞を編集するのに適していると考えられる。複数の実施形態において、本開示のアプローチにより改変される真核細胞は、改変がなされるとき、全能性、多能性、複能性、又は少能性幹細胞である。複数の実施形態において、細胞は神経幹細胞である。複数の実施形態において、細胞は造血幹細胞である。複数の実施形態において、細胞は白血球である。複数の実施形態において、白血球は骨髄性又はリンパ系である。複数の実施形態において、細胞は胚性幹細胞又は成体幹細胞である。複数の実施形態において、細胞は、表皮幹細胞又は上皮幹細胞である。複数の実施形態において、細胞は、癌細胞、又は癌幹細胞である。複数の実施形態において、細胞は、改変が行われるとき分化細胞である。複数の実施形態において、細胞は哺乳動物細胞である。複数の実施形態において、細胞はヒトであるか、又は非ヒト動物細胞である。複数の実施形態において、非ヒト真核細胞には、真菌、植物又は昆虫細胞が含まれる。１つのアプローチにおいて、細胞は、検出可能な又は選択可能なマーカー、又はそれらの組み合わせを発現するように操作される。

複数の実施形態において、本開示は、個体から細胞を獲得すること、本明細書に記載のCRISPRシステムを用いてエクスビボで細胞を改変すること、細胞又はそれらの子孫を、状態、疾患又は障害の予防及び/又は治療のために、又は損傷、外傷又は解剖学的欠陥を治療するために個体に再導入することことを含む。複数の実施形態において、本明細書に記載のようにエクスビボで改変された細胞は、自家的に(autologously)使用される。

複数の実施形態において、本開示に従って改変された細胞は、細胞株として提供される。複数の実施形態において、細胞は、タンパク質又は他の化合物を産生するように操作され、細胞自体、又はそれらが産生するタンパク質又は化合物は、予防的又は治療的用途のために使用される。

様々な実施形態において、本開示に従って真核細胞に導入される改変は、ホモ接合性又はヘテロ接合性である。複数の実施形態において、改変は、表現型又はコンディションと相関するホモ接合性の優性もしくはホモ接合性の劣性又はヘテロ接合性の優性もしくはヘテロ接合性の劣性変異を含み、従ってそのような表現型又はコンディションをモデル化するのに有用である。複数の実施形態において、改変は、悪性細胞を非悪性表現型に戻す。

特定の態様において、本開示は、本明細書に記載のシステムの１つ以上の成分を含む医薬品製剤を含む。医薬品製剤は、１種以上の薬学的に許容される添加剤を含み、その多くは当該技術分野で知られている。いくつかの実施形態において、医薬組成物は、ヒトへの投与に適した薬学的に許容される担体を含む。いくつかの実施形態において、医薬組成物は、眼内注射に適した薬学的に許容される担体を含む。いくつかの実施形態において、医薬組成物は、局所適用に適した薬学的に許容される担体を含む。いくつかの実施形態において、医薬組成物は、静脈内注射に適した薬学的に許容される担体を含む。いくつかの実施形態において、医薬組成物は、動脈への注射に適した薬学的に許容される担体を含む。いくつかの実施形態において、医薬組成物は、経口又は局所投与に適している。本明細書に記載の投与経路のすべてが、本開示に包含される。

複数の実施形態において、発現ベクター、タンパク質、RNP、ポリヌクレオチド、及びそれらの組み合わせを、医薬品製剤として提供することができる。医薬品製剤は、本明細書に記載の成分を、任意の適切な医薬添加剤、緩衝液などと混合することによって調製することができる。薬学的に許容される担体、賦形剤及び安定剤の例は、例えば、「Remington: The Science and Practice of Pharmacy (2005) 21st Edition, Philadelphia, PA. Lippincott Williams & Wilkins」に記載されており、その開示は、参照により本明細書に包含される。さらに、種々の治療用送達剤の任意のものを使用することができ、前記送達剤には、ナノ粒子、脂質ナノ粒子(LNP)、エキソソームなどが含まれるが、これらに限定されない。複数の実施形態において、生分解性材料を使用することができる。複数の実施形態において、ポリ(ラクチド-コ-ガラクトチド)(PLGA：poly[lactide-co-galactide])は、代表的な生分解性材料である。複数の実施形態において、生分解性材料には、生分解性ポリマーが含まれるが、必ずしもこれに限定されない。PLGAの代わりに、生分解性材料は、ポリ(グリコリド)(PGA)、ポリ(L-ラクチド)(PLA)、又はポリ(β-アミノエステル)を含んでもよい。複数の実施形態において、生分解性材料は、ヒドロゲル、アルギネート、又はコラーゲンであってもよい。一実施形態において、生分解性材料は、ポリエステル、ポリアミド、又はポリエチレングリコール(PEG)を含んでもよい。複数の実施形態において、脂質安定化マイクロ粒子及びナノ粒子を使用することができる。

特定のアプローチにおいて、本明細書に記載のシステムを含む本開示の組成物、及び本明細書に記載のシステムを用いて改変された細胞は、それを必要とする個体において状態又は障害を治療するために使用される。本明細書で使用される用語「治療」は、治療されている特定の状態又は疑いのある状態の存在に関連する１つ又は複数の症状又は特徴の軽減を意味する。治療は必ずしも完全な治癒又は寛解を意味するものではなく、再発又は再燃を排除するものではない。治療は、短期間、中期間にわたって行うことができ、又は、長期間の治療であってもよい(例えば、維持療法)。治療は、連続的であっても、断続的であってもよい。

複数の実施形態において、本開示のシステムは、治療上有効な量で個体に投与される。複数の実施形態において、治療上有効な量の本開示の組成物が使用される。本明細書で使用される「治療的に有効な量」という用語は、単一の又は複数の用量において、治療の意図された目的を達成するのに十分な量の薬剤を意味する。所望の又は必要とされる量は、使用される特定の化合物又は組成、その投与形態、患者の詳細等に応じて変化する。適切な有効量は、日常的な実験を用いて本開示による情報を得た当業者によって決定され得る。例えば、治療上有効な量、例えば用量を、まず細胞培養アッセイ又は動物モデルのいずれかで推定することができる。動物モデルを使用して、適切な濃度範囲、及び投与経路を決定することもできる。次いで、そのような情報を使用して、ヒトにおける又は非ヒト動物における、有用な用量及び投与経路を決定することができる。正確な投与量は、治療すべき患者の観点から選択することができる。投与量及び投与は、所望の効果、例えば、閾値数の細胞において改変を達成するのに十分なレベルの成分を提供するように調節することができる。考慮することができる追加的な因子には、関与する特定の遺伝子又は他の遺伝子エレメント、患者の状態、年齢、体重、性別、所望の治療時間、投与方法、投与の時間と頻度、薬剤の組み合わせ、反応感受性、及び治療に対する耐性/応答が含まれる。特定の実施形態において、治療上有効な量は、疾患の１つ以上の徴候又は症状を減少させる量であり、及び/又は疾患の重症度を減少させる量である。治療上有効な量はまた、疾患の発症又は疾患の再発を阻害又は予防することができる。複数の実施形態において、本開示に従って改変された細胞は、治療上有効な量で、その必要性のある個体に投与される。

複数の実施形態において、本開示は、治療上有効な量の本開示の組成物、又は本明細書に記載の改変された細胞を個体に導入することによって、それを必要とする個体に治療を提供することを含み、ここで、DNA挿入物を含む細胞は、１つ以上の状態、疾患又は障害の成立を治療、軽減、阻害、又は防止する。複数の実施形態において、細胞は最初に個体から得られ、本開示に従って改変され、個体に戻される。複数の実施形態において、同種異系細胞を使用することができる。複数の実施形態において、改変された真核細胞は、医薬品製剤中で提供されてもよく、そのような製剤は、本開示に含まれる。

複数の実施形態において、本開示のシステムは、１つ以上の原核細胞又は真核細胞に導入される。複数の実施形態において、原核細胞は、グラム陽性細菌又はグラム陰性細菌を含むか、又はそれからなる。細菌は、非病原性であっても、病原性であってもよい。複数の実施形態において、本明細書に記載のシステムは、宿主(例えば、ヒト、動物、又は植物宿主)との関連で、原核細胞(例えば、細菌又は古細菌細胞)に導入され、例えば、前記細菌は、宿主のマイクロバイオームの成分であるか、又はマイクロバイオームの異常成分(例えば、病原体)である。いくつかの実施形態において、本明細書に記載のシステムの送達は、組換え微生物の安定な形成をもたらす。いくつかの実施形態において、本明細書に記載のシステムによって生成される組換え微生物は、宿主、例えば、ヒト宿主の健康又は代謝を変化させることができる酵素又は代謝産物の産生をもたらす。いくつかの実施形態において、本明細書に記載のシステムの送達は、微生物の病原性決定因子(例えば、抗生物質耐性又は毒素産生)の不活性化をもたらす。いくつかの実施形態において、本明細書に記載のシステムの送達は、レシピエント細胞の死滅をもたらす。このシステムは、細胞の一部又は全部を殺すか、又は細胞を非病原性及び/又は１種以上の抗生物質に対して感受性にすることができる。複数の実施形態において、前記細菌は、食品又は飲料製品(発酵食品及び発酵飲料、及び乳製品を含むが、これらに限定されない)の成分として使用される。複数の実施形態において、このような細菌には、乳酸菌が含まれる。複数の実施形態において、特定のタイプの細菌への選択的送達は、本明細書に記載の成分のすべて又は一部を発現することができるバクテリオファージ又はパッケージド・ファージミドにより行われるが、ここで、バクテリオファージは特定のタイプの細菌に対して特異的指向性を示す。いくつかの実施形態において、送達ビヒクルは、特定の細胞を標的とするための部分特異性のみを提供し、さらなる特異性は、標的化されるDNA配列の選択によって提供される。

複数の実施形態において、本明細書に記載のシステムは、真核細胞に導入される。このような細胞としては、動物細胞、真菌、例えば、酵母、原生生物、藻類、植物細胞などが挙げられるが、必ずしもこれらに限定されない。

複数の実施形態において、本開示は、１つ以上の細胞を提供し、ここで、細胞中のDNAは、少なくとも１つの挿入されたDNA挿入テンプレートを含む。本明細書に記載の細胞は、原核細胞又は真核細胞のいずれであってもよい。従って、本開示はまた、挿入されたDNA配列を含む１つ以上の細胞を提供する。

複数の実施形態において、真核細胞は、動物細胞を含み、哺乳動物細胞又は鳥類細胞を含んでもよく、又は昆虫細胞を含んでもよい。複数の実施形態において、哺乳動物細胞は、ヒト又は非ヒト哺乳動物細胞である。複数の実施形態において、本開示の組成物は、鳥類動物に、又はイヌ、ネコ、ウマ動物に、又はウシに投与され、ウシには乳牛が含まれるが、これに限定されない。

複数の実施形態において、本開示のアプローチにより改変される細胞は、改変がなされるとき、全能性、多能性、複能性、又は少能性幹細胞である。複数の実施形態において、細胞は神経幹細胞である。複数の実施形態において、細胞は造血幹細胞である。複数の実施形態において、細胞は白血球である。複数の実施形態において、白血球は骨髄性又はリンパ系である。複数の実施形態において、細胞は胚性幹細胞、又は成体幹細胞である。複数の実施形態において、細胞は、表皮幹細胞又は上皮幹細胞である。複数の実施形態において、細胞は、癌細胞、又は癌幹細胞である。複数の実施形態において、細胞は、改変がなされるとき、分化細胞である。

複数の実施形態において、本開示は、個体から細胞を獲得すること、本明細書に記載のシステムを用いてエクスビボで細胞を改変すること、細胞又はそれらの子孫を、状態、疾患又は障害を予防及び/又は治療するため、又は、損傷、外傷又は解剖学的欠陥を治療するために、前記個体に又は免疫学的に適合した個体に再導入することを含む。複数の実施形態において、本明細書に記載のようにエクスビボで改変された細胞は、自家細胞である。複数の実施形態において、細胞は、細胞株として提供される。複数の実施形態において、細胞は、タンパク質又は他の化合物を産生するように操作され、細胞自体及び/又はそれらが産生するタンパク質もしくは化合物は、予防的又は治療的用途のために使用される。

複数の実施形態において、本開示に従って作製された真核細胞は、トランスジェニック非ヒト生物を作製するために使用することができる。

複数の実施形態において、本開示による１つ以上の改変細胞は、動物(昆虫を含むが、必ずしもこれに限定されない)の集団において遺伝子ドライブを行うために使用されもよい。

複数の実施形態において、本明細書に記載のシステムが導入される１つ以上の細胞には、植物細胞が含まれる。本明細書で使用される「植物細胞」という用語は、プロトプラスト、配偶子産生細胞を意味し、及び植物全体に再生する細胞を含む。植物細胞には、以下のものから得られる、又は以下のものに見られる細胞が含まれるが、必ずしもこれらに限定されない：種子、懸濁培養物、胚、分裂組織部位、カルス組織、葉、根、苗条、配偶体、胞子体、花粉、及び小胞子。植物細胞にはまた、上述の組織から得られる、プロトプラストのような改変細胞が含まれることが理解され得る。本開示に従って作製された植物生成物が含まれる。

複数の実施形態において、本開示は、製品(キットを含み得る)を提供する。複数の実施形態において、製品は、１つ以上のクローニングベクターを含んでもよい。１つ以上のクローニングベクターは、本明細書に記載のタンパク質及びポリヌクレオチドのいずれか１つ又は任意の組み合わせをコードしてもよい。クローニングベクターは、例えば、任意の所望の標的化RNAのような任意のタンパク質又はポリヌクレオチドをコードする配列がそこに導入され得る多重クローニング部位(MCS)を含むように適合されてもよい。製品は、上記の成分の任意のものを含む１つ以上の密封容器を含んでもよく、さらに包装及び/又は印刷物を含んでもよい。印刷物は、製品の内容物に関する情報を提供してもよく、製品の内容物の使用方法に関する指示又は他の表示を提供してもよい。一実施形態において、印刷物は、製品の内容物を使用して治療される疾患又は障害の表示を提供する。

複数の実施形態において、ポリヌクレオチドが送達される場合、それらには、改変ポリヌクレオチド又は他の改変、例えばリン酸骨格修飾、及び修飾ヌクレオチド、例えばヌクレオチドアナログが含まれてもよい。核酸アナログを作製するための適切な修飾及び方法は、当該技術分野で知られている。いくつかの例には、修飾リボヌクレオチド又はデオキシリボヌクレオチドを含むポリヌクレオチドが含まれるが、これらに限定されない。例えば、修飾リボヌクレオチドは、リボース部分の2'位のメチル化及び/又は置換を含んでもよく(1～6個の飽和又は不飽和炭素原子を含む--O--低級アルキル基で、又は2～6個の炭素原子を有する--O--アリール基で)、ここで、このようなアルキル又はアリール基は置換されていなくてもよく、置換されていてもよい(例えば、ハロ、ヒドロキシ、トリフルオロメチル、シアノ、ニトロ、アシル、アシルオキシ、アルコキシ、カルボキシル、カルボアルコキシル、又はアミノ基で；又はヒドロキシ、アミノ又はハロ基で)。複数の実施形態において、修飾ヌクレオチドには、メチル-シチジン及び/又はシュード-ウリジンが含まれる。ヌクレオチドは、ホスホジエステル結合によって又は合成結合、すなわちホスホジエステル結合以外の結合によって、連結されてもよい。本開示で使用できるポリヌクレオチド剤中のヌクレオシド間結合の例には、ホスホジエステル、アルキルホスホネート、ホスホロチオエート、ホスホロジチオエート、リン酸エステル、アルキルホスホノチオエート、ホスホロアミデート(phosphoramidate)、カルバメート、カーボネート、モルホリノ、リン酸トリエステル、アセトアミデート、カルボキシメチルエステル、又はそれらの任意の組み合わせが含まれるが、これらに限定されない。複数の実施形態において、DNAアナログは、ペプチド核酸(PNA)であってもよい。

以下の説明及び実施例は、本開示を例示するものであって、本開示を限定するものではない。

説明及び実施例は、Tn7-CRISPR-Casエレメントが、ガイドRNAカテゴリー化のシステムを進化させて、二経路のライフスタイルを達成したことを示している。多重メカニズムは、機能的に異なる転位用ガイドRNAを可能にし、従来のシステムを、新しいプラスミド及びファージ標的へのガイドRNAを獲得することができるようにし、そして第二に、新しい宿主への侵入時に染色体部位へアクセスするための長期記憶を提供する。ガイドRNAは、配列特異性、ミスマッチ耐性及び選択的調節を介して、トランスポゾンに適応したシステムによってのみ認識されるようにプライベート化され、内因性CRISPR-Cas防御システムによる毒性自己標的化を回避する。それゆえ、この説明及び実施例は、ゲノム改変のための強化されたCRISPR-Cas機能のためにガイドRNAをエンジニアリングする前記アプローチを支持する。

本開示は、とりわけ、I-F3 Tn7-CRISPR-Casエレメントの生体情報分析を提供し、ガイドRNAのカテゴリー化に関するガイドRNA-指向性転位の進化を可能にしたメカニズムを明らかにする。本開示は、I-F3 Tn7-CRISPR-Cas挿入事象が、エレメント内のCRISPRアレイ中にコードされたガイドRNAによって説明されることを示す。キュレーションの形態は、I-F3エレメントが、異なるクラスのガイドRNAを維持することを可能にして、プロトタイプTn7で見い出される(しかし、ガイドRNAのみのシステムで)二経路のライフスタイルを映す。染色体へのガイドRNA-指向性転移は、経路選択を指示する特殊な転写調節システムの制御下にあるCRISPRアレイを介して、又はガイドRNAがTn7-CRISPR-Casトランスポゾンにプライベート化されることを可能にする非定型CRISPRリピート構造(上述のように、ゲノム改変のために利用することができる)を使用して、生じる。染色体を認識するエレメントによってコードされたガイドRNAはまた、転位を指向するのには許容されるが、標準的なI-F1システムによる干渉のためには許容されないミスマッチを有する。I-F3 Tn7-CRISPR-Casエレメントにおいて見い出されるガイドRNA特性は、それらが関連タイプI-F CRISPR-Casシステムとどのように相互作用するかを説明するのに役立つ(例えば、標準的なCRISPR-Casシステムに宿主染色体を分解させる自己標的化ガイドRNAに耐えられる能力)。本開示は、上記のようなこれらの発見を利用して、DNA編集の改良されたアプローチを提供する(以下の実施例において説明されるように)。

［実施例１］
I-F3 Tn7-CRISPR-Casエレメント標的化は、非定型CRISPRアレイ構成におけるスペーサーによって説明される
我々は、Tn7-CRISPR-CasエレメントのI-F3ファミリーのバイオインフォマティクス分析を実施した。ガンマプロテオバクテリアからの53,000ゲノムにわたる分析は、タイプI-F3 CRISPR-Casシステム(２つのブランチに見い出される)をコードする、802 Tn7-様エレメントを特定した(図1)。１つ目のブランチ、I-F3aは、主として、yciA及びguaC(IMPDH)遺伝子に隣接する付着部位を使用する。２つ目のブランチ、I-F3b中のエレメントは、主として、シグナル認識粒子のRNA成分をコードするffs遺伝子の下流付着部位と、rsmJ遺伝子の下流に存在するエレメントを有するマイナーなブランチに見い出される。この分析の一部として、我々は、CRISPRアレイを再検討し、特筆すべきことを発見した(この発見は、どのようにしてI-F3エレメントすべてにわたって転位が標的化されるかに関する我々の理解を変更した)。いかなる特定の理論に拘束されることも意図しないが、本開示は、ガイドRNA指向性転位によってすべてのエレメントの挿入位置を説明できることを実証する；本質的にすべてのI-F3エレメントは、エレメント-コード化CRISPRアレイ内のスペーサーを含み、これはエレメントの右端から約48bpの領域とマッチする(図1、2a、2b、及び配列表に示されるように)。これらのケースにおいて、アレイ中のスペーサーは、yciA、guaC、ffs又はrsmJ遺伝子において同じプロトスペーサーとマッチする(図2b)。遺伝子の末端の１つに存在し、リーディングフレームのすぐ外側に転位を指示することに加えて、yciA、guaC及びrsmJ遺伝子とマッチするスペーサーは、すべて、同じリーディングフレームレジスター(コドンの可変ゆらぎ位置を、ガイドRNAの6番目の位置ごとに整列させる)内に見い出される(フリップアウトのために知られ、プロトスペーサーとマッチすることは必要とされない位置)(Fineran et al.,2014; Jackson et al.,2014; Mulepati et al.,2014; Zhao et al.,2014)。細菌ゲノム中で特定されたTn7-CRISPR-Cas挿入の約6％は、４つの主要attサイトの１つに位置していない。しかし、挿入が主要attサイトの外側であってもなお、エレメントの右端から約48bpのプロトスペーサーに特異的であるアレイ中のスペーサーを特定することができた(図1)。

４つの主要att-サイトの各々を認識するスペーサーは、エレメントコード化CRISPRアレイ(単数又は複数)内の特定の位置に配置される。この位置と、I-F3エレメントの２つの主要なブランチにおいて異なるCRISPRアレイの構成とに、トレンドがある。I-F3aエレメントのブランチでは、yciA又はguaC attサイトとマッチしたスペーサーは、tniQ、cas8/5、cas7、cas6オペロンのすぐ下流に見い出されたアレイ中で70～90bpギャップ後に配置されていた(図2a及び2c)(下記参照)。CRISPRアレイが連続していないこれらケースでは、アレイがシングルのプレ-crRNAとして転写されるかどうか、及び/又は、スペーサーのすべてが機能的ガイドRNA複合体に成熟することができるかどうか、明確ではなかった(以下に取り上げる)。ffs及びrsmJ遺伝子に関連するattサイトを認識するエレメントのI-F3bブランチでは、att-サイト特異的スペーサーは、tniQ-casオペロンの下流に配置された単一のCRISPRアレイに見い出される傾向があるが、常にアレイ内の最後のスペーサーとして見い出される傾向がある(図1及び2a)。

我々の分析では、染色体中ではなく、プラスミド中で、１つの転位事象のみが特定された。Aeromonas salmonicida S44中のTn7-CRISPR-Casエレメント、Tn6900は、接合DNAトランスファーにおいて既知の役割を有する遺伝子(tra遺伝子)の存在に基づいて移動性であると予測される大型プラスミド(pS44-1)上にあった。プラスミド上のサイトへの転位はなお、アレイ内にコードされたガイドRNAによって説明することができたが、このケースでは、スペーサーはアレイ内のリーダー-近位位置にあった(図8a～c)。興味深いことに、Aeromonas hydrophila AFG_SD03中のffs attサイトに見られる、ほぼ同一のTn7-CRISPR-Casエレメント、Tn6899は(Boehmer et al.,2018)、同じプラスミド-コード化遺伝子を認識するスペーサーを、異なる位置に有しており(図8b～c)、このことは、Aeromonas内でのこれらのエレメントの分散に重要である潜在的プラスミドベクターを示唆している。

CRISPRアレイ中でのそれらの別個の位置に加えて、attスペーサーは、新規な配列を有するリピートによって隣接されていた。新しいスペーサーは、リーダー-近位リピートを複製するプロセスにおいて、アレイのリーダー-近位末端でCRISPRアレイに追加される(Xiao et al.,2017)。従って、リピートは経時的に分化し得るが、第一及び第二のリピートは、CRISPRアレイにおいて同一で始まる。I-F3 Tn7-CRISPR-Casエレメントでは、染色体へのガイドRNA-指向性転移のために使用された末端スペーサーは、リーダー-近位リピートとは高度に異なるリピート(リーダー-近位リピートから高度に分化したリピート)に常に隣接していた(図2c及び配列表)。上述したように、本開示は、分化したリピートを「非定型」リピートと呼び、これらの配列から形成されるガイドRNAを、非定型ガイドRNAと呼ぶ。

［実施例２］
高度に分化した非定型リピート-スペーサーユニットは、機能的ガイドRNA複合体を形成する
I-F3 Tn7-CRISPR-Casエレメント中に見い出されるCRISPRアレイ構造の独特の性質を分析するために、異種性且つ遺伝的に扱いやすい系である大腸菌中で、ガイドRNA-指向性転位を確立した。Aeromonas salmonicida S44中のプラスミド中で、及びAeromonas hydrophila AFG_SD03中のffs付着部位中で同定されたエレメントは、それらがほぼ同一であるが、異なる種において別個の挿入点で見つかったので(それらが最近機能的であったことを示唆する)、特に興味深い。転位(Tns)及びCasタンパク質のために、Aeromonasで見い出された複数のエレメントにわたるコンセンサスを調べることによって、転位のために活性であると我々が予測したコード配列構成を利用した。

異種宿主においてTn7-CRISPR-Cas転位を確立しようとする以前の研究は、転位を評価するために間接PCR系技術に強く依存しているが、この技術は人為的影響を受けやすい(Rice et al.,2020; Strecker et al.,2020)。Tn7-CRISPR-Cas転位のより良い全体像を描くために、完全な転位事象をモニターするアッセイを使用した。mini-Tn7-CRISPR-Casエレメントを染色体中に配置し、本明細書に記載のアッセイにおける転位用ドナー部位を、抗生物質耐性決定基に隣接する推定TnsB-結合部位(Peters, 2014)によって予測されるcis-作用性トランスポゾン末端配列を用いて構築した。このアッセイにおいて、候補転位標的は、接合Fプラスミド上に存在した。ガイドRNA指向性転位システムの成分の発現を誘導した後、接合プラスミドをテスター株に接合させ、ミニトランスポゾン中の抗生物質耐性遺伝子をスクリーニングすることによって、完全な転位事象を検出した(図9a)。tnsABC、tniQ-Cas8/5、7、6、及びCRISPRアレイは、３つの別々の発現ベクターから発現された。

まず、A.salmonicida S44中のTn6900で見い出されたCRISPRアレイの野生型配置から生成された候補ガイドRNAを分析した。この配置では、リーダー-近位スペーサーは、天然宿主からの移動性プラスミド-コード化遺伝子と完全に一致し、第二/末端スペーサーは、ffsプロトスペーサーと変性した一致を有し、10のミスマッチを有していた(図3a、8c)。スペーサーと標的中のプロトスペーサーとの間のミスマッチのいくつかは、6位ごとに存在し、それゆえ、ffsガイドRNA標的の認識に影響を与えない(図8c)。天然アレイ構成の発現に続く転位をモニターすることにより、機能的ガイドRNAが、リーダー-近位位置で基準リピート構造を有するスペーサーと、高度に分化した非定型リピートに隣接する末端スペーサーとの両方から産生されたことを確認した(図3b)。興味深いことに、ガイドRNA媒介転位は、より高い頻度でffs-特異的スペーサーで生じた(たとえそれがミスマッチを含んでおり、非定型リピートに隣接していても)(図3b)。

スペーサー、プロトスペーサー及びリピート配列の個々の寄与を試験するために、シングルガイドRNA発現構築物として、リーダー-近位(定型)又は末端(非定型)隣接リピートを有するCRISPRアレイ構築物を設計し、種々の天然及び合成スペーサー配列を個々に試験した。非定型リピートを有するガイドRNAは機能的であるだけではなく、３つの異なるスペーサーを用いて試験した際、定型リピートと比較して、一貫してより高い転移頻度を可能にした(図3c)。さらに、ffs-特異的スペーサーは、プラスミド標的に向けられるスペーサーよりも高い転位頻度を示した(たとえプラスミドスペーサーがその標的と完全に一致し、ffsスペーサーがその標的と10個のミスマッチを有していたとしても)(いくつかは、フリップアウトされると予測される6番目の位置ではなかった)(図3c)。ffsプロトスペーサーと完全に一致するように、天然のffs-特異的スペーサーを改変すると、一貫してある程度高い転移頻度が可能になった(図3c～d)。

ガイドRNA複合体もまた、lacZ中の異なる位置にマッチするスペーサーを使用して設計された(図3d～e)。我々は、たとえ認識される配列がすべて同一の候補PAM配列を有していたとしても、転位頻度はスペーサーが異なると10倍も変化することを見い出し、結果は、高度に発現されたlacZ遺伝子において標的とされるDNA鎖では説明されなかった(図3d～e)。しかしながら、試験したスペーサーに関係なく、A.salmonicida S44からのTn7-CRISPR-Casシステム中の定型リピートと比較すると、比較的高い転位頻度が、非定型リピートを有するガイドRNAで一貫して見い出された(図3c～d)。これらの実験は、機能的ガイドRNA複合体を、非定型リピートから産生することができ、そしてこれらの複合体の機能が、定型リピートとは重要な差異を示すことを確認した。我々は、ガイドRNA指向性転位を用いて、大腸菌染色体中で複数の異なる位置も標的化できることを見い出し、このことは、これがプラスミド特異的プロセスではないという見解をサポートする(図8d-e)。

［実施例３］
非定型リピートは、A.salmonicida S44からのTn7-CRISPR-Casシステムを伴う機能的に異なるガイドRNA複合体を形成する
我々の実験は、非定型リピートから生成されたガイドRNAが機能的であって、A.salmonicida S44中のTn6900エレメントから誘導されたシステムとともに、増強された転位活性を可能にすると思われることを示唆した。リピート配列中の差異の関連性をよりよく理解するために、我々は、リーダー-近位定型リピートの配列と、末端スペーサーに隣接する非定型リピートの配列とを比較し、２つのブランチにわたる共通の傾向を探索した(図4a)。両方のブランチにおいて、ガイドRNAの3'ハンドルをコードする最終リピートにおいて共通の傾向があり、定型GTG(位置1-3)を失う傾向、最終ガイドRNAから切断される領域の保存の喪失(位置21-28)、及びループにおけるアデニンの一般的な富化を伴った(図4a)。定型及び非定型リピートの変化による機能的差異を、Tn6900を用いて試験した(ガイドRNAの5'及び3'ハンドルをコードするリピート領域を変化させることによって)(図4b)。定型リピートの3'ハンドル内でGUG領域をAUUに変化させるか(定型*)、又は非定型リピート内でAUUをGUGに変化させると(非定型*)、ガイドRNA指向性転位の頻度にわずかな変化のみが生じ(図4b)、これらの保存された位置が、非定型リピート頻度の利点を単独で担っているのではなく、より複雑な相互依存性が存在することを示唆している。

Vibrio cholerae HE-45からのTn6677エレメントで見られる異なるI-F3 Tn7-CRISPR-Casシステムを用いた以前の研究は、ガイドRNA複合体が、ガイドRNAにより大腸菌内のプログラムされた標的部位に向けられ得ることを示した(Klompe et al.,2019)。Tn6677エレメントは、エレメントのI-F3aブランチにあり、I-F3 Tn7-CRISPR-Casエレメントの２つのブランチ間の差異を理解するための良好な比較ポイントを提供した(図1)。Tn6677は、guaCの下流att-サイトに天然に存在し、上述した傾向と一致しており、このエレメントは、非定型リピート構造を有する非連続アレイ中にatt-サイト標的化スペーサーを保有する(図2)。Tn6677からのTns、Cas、及びCRISPRアレイモジュールが、ラクトース及びアラビノース発現系の下で構築され、上記Tn6900誘導体に使用される転位アッセイにおいて試験された(図9a)。Tn6677によって使用される天然のguaC付着部位への転位は、アレイ中にコードされるguaC-特異的ガイドRNAを必要とすること、及び、Tn6677中の非定型リピートも機能的であることが見い出された(図4c)。しかしながら、Tn6900誘導体とは異なり、類似した転位頻度が定型及び非定型アレイで見い出され(図4c)、又はTn6677エレメントを伴う定型及び非定型リピートにおいて中程度の変化が見い出された(図4d)。天然に存在するTn7-様及びTn7-CRISPR-Casエレメントは、それらが挿入する左から右への向きを制御する。Tn6677は、配向制御について緩和されてもよい(図9b)(Klompe et al.,2019)。Tn6900誘導体は、標準的Tn7で見い出され、24個の独立した挿入を分析したときに天然に見い出された１つの配向に対するバイアスを示した(図9b)。Tn6900誘導体の挿入は、プロトスペーサーから約48bpであり、標的部位重複を伴って生じた(図9c)。

［実施例４］
ガイドRNAは、ミスマッチ耐容能及び非定型ガイドRNAで特殊化された機能により、I-F3転位にプライベート化されることができる
Tn7-CRISPR-Casシステムで以前に取り組まれていない問題には、他のタイプI-F CRISPR-Casシステムを伴うCRISPRアレイ間のクロストーク可能性が含まれる。
染色体に特異的なガイドRNAを伴うTn7-CRISPR-Casエレメント由来のCRISPRアレイが、標準I-F1システムによって使用されることができれば、染色体attサイトは、分解のための標的になるであろう。これは、標準I-F1 CRISPR-Casシステムをコードする新しい宿主に入った場合に、I-F3 Tn7-CRISPR-Casエレメントの拡散を制限することができた。我々は、I-F3 CRISPRアレイにコードされた定型及び非定型ガイドRNAが、I-F1システムによってアクセスされ得るかどうかを調べた(Chowdhury et al.,2017)。P.aerigunosaシステムにおいて、Casタンパク質と、T7発現系を有する単一スペーサーCRISPRアレイとを共発現させた(Vorontsova et al.,2015)。P.aerigunosaからのタイプI-F1システム、タイプI-F3a V.cholerae Tn6677システム、又は、A.salmonicida Tn6900に由来するI-F3bシステムからのリピートを、プロトスペーサーを有する／有さないプラスミドを検査する形質転換効率アッセイを用いて試験した。対照実験では、P.aeruginosa PA14からのI-F1 CRISPR-Casシステムを用いて、ロバストな干渉が観察された(図5)。形質転換は、プロトスペーサーを欠くプラスミドと比較すると、プロトスペーサーをコードするプラスミドで3桁以上減少した。同様に、Tn6677及びTn6900からのI-F3システムの定型リピートはまた、プラスミド中のプロトスペーサーとの正確な一致を含む場合、プラスミド形質転換アッセイでロバストな干渉を可能にした。標準I-F1及びI-F3 Tn7-CRISPR-Casシステムからのリピートは類似しており(図10)、I-F3 Tn7-CRISPR-Casシステムがスペーサー獲得のために標準I-F1システムに依存している可能性が高い。

我々はまた、Tn7-CRISPR-Casシステムにおいて見い出されるattサイトガイドRNA中でミスマッチが共通であるという観察に基づいて、I-F1干渉システムにおけるミスマッチ耐容性を試験した。天然のミスマッチは、ガイドRNA指向性転位を機能させる能力にほとんど又は全く影響を及ぼさない一方(Tn6900誘導体は10個のミスマッチを有し(図3c)及びTn6677エレメントは7個のミスマッチを有する(図4c))、これらの同じガイドRNAは、P.aeruginosa PA14に由来するI-F1 CRISPR-Casシステムの妨害に重大な影響を及ぼした(形質転換アッセイでは観察可能な干渉は認められない)(図5)。これは、プライベート化の形態を示唆しており、そこではガイドRNAとのミスマッチは、ガイドRNA-指向性転位に最小の影響を及ぼすか、又は全く影響を及ぼさず、それらは、我々の研究で試験されたI-F1システムによって使用不能の状態にされる。

我々はまた、特殊化された非定型ガイドRNAが、標準I-F1システムによって使用されることができるかどうかを決定した。Tn6900誘導体で見い出されたI-F3bシステムに由来する非定型リピートとともにスペーサーを配置した場合、非定型リピートとともに形成されたガイドRNA複合体は、たとえ完全なスペーサー-プロトスペーサーの一致を有していても、プラスミド形質転換アッセイにおいて干渉を機能させるそれらの能力を劇的に減少させた(図5)。損なうための使用(干渉のために非定型リピートを用いる)は、I-F3bシステムによるガイドRNA-指向性転移について我々が見い出した増強のための使用とは対照的であった(図3及び4)。この結果は、染色体-標的化スペーサーを、標準I-F1 CRISPR-Casシステムを有する宿主において耐用性にすることを可能にする第二のメカニズムを示唆する(それらをI-F3bシステムにプライベートのままとすることによって)。このプライベート化は、V.choleraeに由来するTn6677 I-F3aシステムには存在しなかった。I-F3a Vcシステムでは、定型リピート又はこのエレメントとは高度に異なる非定型アレイのいずれかで、ロバストな干渉が見い出された。しかしながら、以下の結果は、I-F3a Tn7-CRISPR-Casエレメントが、自己標的化スペーサーを許容するのを助けるために別個の転写ネットワークを使用できることを示唆している。

［実施例５］
I-F3エレメントは、CRISPR-Cas成分を調節するために、Xre-ファミリー転写調節因子を利用する
I-F3 Tn7-CRISPR-Casエレメントの普及をよりよく理解するために、我々は、この群の多様なメンバー間で保存された遺伝子を探索した。I-F3 Tn7-CRISPR-Casエレメントにわたって保存されていることが見い出された他の遺伝子の一つは、予測されたXre-ファミリー転写調節因子であった。xre遺伝子は、ほぼすべてのI-F3エレメント中で、tnsABCとtniQ-cas8/5,7,6オペロンとの間の保存された位置に存在する(図2a)。I-F3エレメントの２つのブランチの各々は、xre遺伝子を有しているが、各ブランチ中の予測調節遺伝子は、制限-修飾システムに関連するコントローラ(C)タンパク質の系統的に異なるファミリーにより分離した。I-F3aエレメントは、C.AhdIに関連する68アミノ酸Xreタンパク質を有し、I-F3bエレメントは、C.Csp231Iに関連する約100アミノ酸Xreタンパク質を有する(図11a)。候補の調節特徴は、先に確立されたシステムとの相同性に基づいて、tniQ-cas及びCRISPRアレイで同定することもできた(図11b、以下参照)(Streeter et al.,2004)。

我々は、I-F3aエレメント中の推定プロモーター領域を分析し、Tn6677及びこのブランチのエレメントの他のメンバーにおいて、xreの上流、ならびにatt-標的化スペーサーのすぐ上流に、Xre-媒介調節のための候補サイトを発見した(図6a)。調節領域は、I-F3aブランチ中の２つのエレメント、V.cholerae HE-45 Tn6677(Vc)、及び、V.parahaemolyticus RIMD221063(Vp)で、インビトロで確認された(図6c)。この相互作用の機能的役割は、LacZレポーターアッセイによって示された。Xreは、それ自身のpXreプロモーターを自己調節することが見い出され、これは、Xreがないと転写を最小にし、Xreの量が少ないと活性化され、Xreの発現が増加すると抑制された(図6e)。一方、att-標的化スペーサーのために同定されたプロモーター(pAttGuide)は、Xreが存在していないときに高度に発現され、Xre誘導量が増加するにつれ、次第に抑制された(図6e)。以下に示すように、このシステムは、I-F3aエレメントを伴うguaC又はyciA attサイトに特異的である非定型ガイドRNAのバーストを提供する(接合誘発により新しい宿主に侵入した際)。

I-F3bエレメントもまた、保存されたC.Csp231I-様Xre調節因子の機能的役割を調べるために、逆方向リピートモチーフについて調査された。I-F3aエレメントと同じように、保存されたモチーフが、xreのプロモーター領域で見い出された(C.Csp231Iによって使用されるものとほとんど同一であった)(図6b及び11b)(McGeehan et al.,2011)。I-F3aエレメントとは異なり、I-F3bエレメントでは、保存モチーフは、CRISPRアレイの上流では同定できなかったが、代わりに、我々は、tniQ-cas8/5,7,6オペロンの上流にこのモチーフの単一コピーを発見した(図2a及び6b)。調節領域は、A.salmonicida S44 Tn6900(As)、及び、Vibrio sp.10N.286.45.B6(VB6)からの２つのI-F3bエレメントを用いてインビトロで確認された。Xreの上流領域における２つの予測モチーフへの結合を、２つの別々に移動する種として可視化することができた(図6d)。完全移動度シフトを達成するために必要とされる高濃度のタンパク質によって実証されるように、xre-近位調節モチーフを変異させると、相互作用が弱まった(図6d)。我々は、tniQ-cas8/5,7,6の上流のモチーフとの相互作用をさらに可視化し、相互作用を弱める変異モチーフを利用することによって、結合の配列特異性を確認した。lacZレポーターアッセイを再度使用して、調節における機能的役割を確認した。Xre調節因子は、それ自身のpXreプロモーターのリプレッサーとして作用することが示された(図6f)。興味深いことに、インビトロでの結合を損なう近位結合部位の変異は、活性化剤として作用する代わりにXre調節因子をもたらし、遠位部位との相互作用が転写を活性化する一方、近位部位との相互作用はそれを抑制することを示唆した(図6f)。I-F3aエレメントによる結果と同様に、Xre調節因子は、tniQ-cas8/5,7,6発現を抑制することができ、この抑制は、保存結合モチーフの変異によって損なわれた(図6f)。

追加のアッセイを用いて、I-F3a及びI-F3bシステム両方からの例により、調節領域の接合伝達に続く接合誘発を確認した。Tn7-CRISPR-Casエレメントで見い出されたXreタンパク質による生化学及び発現コントロールデータと一致して、及びコントローラタンパク質を用いる以前の文献と一致して、Xreタンパク質は、確立されたドナーにおいてタイトな抑制を、新しいレシピエントに伝達された場合に強力な発現バーストを可能にする(図7)。Xre調節因子を発現するレシピエント株は、コンジュゲーション後に、この発現バーストから免疫化される。Tn7-CRISPR-CasエレメントにおいてCRISPR-Casプロモーターで実証されたXre依存性コントロールを表すために、本開示は、xre遺伝子をrtaC及びrtbC(RNA-guided transposon/transposition I-F3a or I-F3b controller)と命名することを含む。

実験の考察
前述の内容から、本開示が、とりわけ、染色体部位を標的とするために使用されるスペーサーが、以下のある種の特性を示すことを実証することが認識されるであろう；アレイの最後の位置に存在することに加えて(図1)、それらは高度に分化(逸脱)したリピートと隣接しており(図2)、ガイドRNA-指向性転移にほとんど又は全く影響を示さないミスマッチを維持し(図3c及び4c)、しかし、それらを従来の1-F1システムへの干渉に使用できないようにする(図5)。定型ガイドRNAで見い出されるよりも高レベルの転位を可能にする(図3)一方、これらの非定型ガイドRNA複合体は、たとえ標的に完全にマッチした場合でも、I-F1媒介性干渉のためにはほぼ完全に使用不可能であるので(図5)、リピートの相違は、A.salmonicida S44からのタイプI-F3bエレメントに対して特に有益であると思われる。長期記憶に、転位を染色体部位へ向けることをゆるすトランスポゾン-コード化ガイドRNAは、それゆえ、ミスマッチ耐容性、特殊化された非定型ガイドRNA、及び選択的調節(標準CRISPR-Cas防御システムによる毒性の自己標的化を防ぐため)を使用して、トランスポゾン-適合I-F3システムにプライベート化される。タンパク質コード遺伝子を標的とするガイドRNAは、ゆらぎ位置と一致する第3位にてミスマッチの集中を示す(図12)。A.salmonicida S44由来のI-F3bシステムの場合、非定型リピートは、特異的に適合していると思われ、これは、より高頻度のガイドRNA標的化転位(図3及び4)、及び標準I-F1干渉システムからのプライベート化(図5)を可能にする。Tn6677由来のタイプI-F3a Tn7-CRISPR-Casシステムは、このシステムで見い出された非定型アレイによる転移の増強を示さなかった；転位頻度は、定型及び高度に逸脱した非定型リピートで同じであった(図4c及び4d)。本開示は、I-F3bエレメント内の１つのサブブランチで、最終スペーサーが、長さ10～12の塩基対に切断されることを実証する(図1及び図13)。これらの小さなスペーサーは、機能的ガイドRNAを生成する(プロトスペーサーにより近い挿入の同等自然再配置によって予測されるように)(図13)。先に述べたように、密接に関連しているCRISPR-Casシステムにおける以前の研究は、この長さのガイドRNAが、転移の標的化のために及びロバストな干渉のために機能しないことを示唆している(Klompe et al.,2019; Kuznedelov et al.,2016)。しかしながら、より短いガイドRNAに順応するI-F3bシステムの能力は、他のI-F CRISPR-Casシステムからのプライベート化の別のメカニズムを提供することができた。実験室で試験された天然に存在する最小のタイプI-F2 CRISPR-Casシステムは、同様に切断されたガイドRNAへの干渉のために機能的ではないが、R-ループ形成能のある複合体をなお形成することができる(Gleditzsch et al.,2016)。

以下の材料及び方法を用いて、前述の実施例に記載の結果を得た。
実験モデル及び対象の詳細
大腸菌(Escherichia coli)株を、溶原性ブロス(LB)中又はLBアガー(方法の詳細において別段の記載がない限り)上で30℃又は37℃で増殖させた。適切な場合、以下の濃度の抗生物質を補充した：100μg/mLのカルベニシリン、10μg/mLのゲンタマイシン、30μg/mLのクロラムフェニコール、8μg/mLのテトラサイクリン、50μg/mLのカナマイシン、100μg/mLのスペクチノマイシン。

方法の詳細
タイプI-F CRISPR-誘導Tn7-様トランスポゾンの同定
合計で、53079のゲノムを分析した。TnsA(PF08722,PF08721)、TnsB(PF00665)、TnsC(PF11426,PF05621)、TniQ(PF06527)、Cas5f(PF09614)、Cas6f(PF09618)、Cas7f(PF09615)、及びXreファミリープロテイン(PF01381)に関連するプロファイルHMM(これらは、European Bioinformatics Institute(EMBL-EBI) Pfamデータベースからダウンロードできる)を用いて、hmmサーチ(HMMER3)により相同体を検出した。

候補タンパク質を、それらの配向及び隣接に基づいて、tnsABCオペロン及びtniQ-casオペロンにグループ化した。次に、各tnsABCオペロンを、その下流のtniQ-casオペロンにより、１つのトランスポゾン機能ユニットに分類した。２つのオペロンの間に位置し、制限コントローラタンパク質に相同であるXre/HTH(helix turn helix)タンパク質(blastp、同一性＞40％)を、候補調節因子として定義した。

CRISPRアレイ検出
Tn7-CRISPR-Casエレメントの手動精選されたCRISPRリピートを用いて、DNA配列プロファイルを作成し、これを、nhmmスキャンサーチ(HMMER3)のためのクエリーとして用いて、cas6の下流20-kbの領域でCRISPRリピートを見い出した。推定リピートは、互いとの距離によってアレイに分類された。リピート間の距離は、＞55bp及び＜65bpであることが要求され、ビットスコア閾値は-1であった。最後のリピートと先のリピートとの間の距離は、43bpと55bpとの間でよかったが、そのような場合には、そのビットスコアは≧0.3である必要があった。アレイ中のリピートのビットスコアの合計は、6.0以上である。最も長い非重複アレイは、推定CRISPRアレイとして収集される。cas6の下流の最初のアレイからの最後のリピート以外に、すべてのリピートを用いて、アップデートされたリピートプロファイルを作成し、新しいプロファイルを用いてCRISPR検出手順を2回繰り返した。

プロトスペーサー検出
トランスポゾン-関連CRISPRスペーサーと一致するプロトスペーサーを検出するために、各スペーサーを位置特異的スコアリングマトリックス(PSSM)に変換し、Biopythonとの一致について、tnsAの上流1-kb DNAを探索するのに用いた(閾値＝11.0)。スペーサーの6番目ごとの塩基は、タイプI CRISPRカスケード複合体中でフリップアウトされるので、マトリックスのすべての6番目の位置は、４つすべての塩基に等しい重みを有するように設定される。

ffs(SRP-RNA)を除いて、候補プロトスペーサーを含む主要付着部位遺伝子は、NCBIが提供する注釈により分類される。付着部位SRP-RNA遺伝子(ffs)は、しばしば注釈が不十分なので、cmsearch(Infernal)及びSRP-RNAプロファイル(RF00169)(RFAM[//rfam.xfam.org/]上で利用可能)を用いて、再注釈を付けた。

類似性ツリーを構築する
TnsA、TniQ及びXreタンパク質は、90％に設定された同一性閾値によりCd-ヒットを用いてクラスター化された。代表的なもののマルチプルアライメントを、MUSCLEを用いて行った。以前に報告されているように(Peters et al.,2017)、WAG進化モデル及び離散ガンマモデル(20の速度カテゴリーを有する)を用いるFastTreeにより、類似性ツリーを作成した。ツリー、主要付着部位、CRISPRアレイ、及びマッチドスペーサーの可視化は、ETEToolkitを用いて行った。

xre及びCRISPR-Cas遺伝子の共有プロモーターモチーフを同定する
トランスポゾンは、関連xre長(I-F3aについては68a.a.、I-F3bについては約100a.a.)、ならびに、C.AhdI及びC.Csp231Iとの類似性に基づいて、２つのグループに分類された。各グループについて、xreの100bp上流、第二のCRISPRアレイ、及びtniQ-Casオペロンが収集され、dedupe.sh(BBTools)を用いて重複排除された(70％同一性又は30編集距離の閾値で)。次いで、モチーフ検出及び比較のために、配列をMEMEに送った。

染色体標的化スペーサーのコンセンサスCRISPRリピート配列を、他のスペーサーのものと比較する
CRISPRリピートのコンセンサス配列を作成するために、非冗長性TniQを有する代表的なトランスポゾンをCd-ヒットで選択し、それらの付着部位(ffs/rsmJ、又は、guaC/yciA)に基づいて２つのグループに分けた。染色体標的化スペーサーの上流及び下流のCRISPRリピート、及び、染色体標的化スペーサーと隣接していないリピートを収集し、WebLogo 3を用いて配列ロゴを作成した。

転位アッセイ
すべての転位アッセイは、MTP1191で、又はFプラスミド誘導体を有するMTP997又はMTP1196の一つで実施された。
Tn6900転移について、転移をモニターするために使用される株は、標準的な化学的方法(Peters, 2007)によってコンピテントにされ、pMTP130、pMTP140、及びpMTP150、pMTP160、pMTP170、又はpMTP190の誘導体を用いて、100μg/mLカルベニシリン、10μg/mLゲンタマイシン、30μg/mLクロラムフェニコール、及び0.2％w/vグルコースを補充したLBアガー上で形質転換された。37℃で16時間インキュベートした後、数百の形質転換体を、0.2％w/vのマルトースを補充したM9最小培地(Peters, 2007)中で洗浄し、100μg/mLカルベニシリン、10μg/mLゲンタマイシン、30μg/mLクロラムフェニコール、0.2％w/vアラビノース、及び100μM IPTGを補充したM9中で、計算OD＝0.2に希釈して転位を誘導した。

MacConkey培地上で、糖代謝の損失を通じて転位頻度をモニターする実験のために、誘導プールを、30℃で振盪しながら24時間インキュベートし、その後、LBで連続的に希釈し、1％w/vラクトース、ソルビトール、又はガラクトースを含むMacConkeyにプレーティングした。コロニーを計数する前に、プレートを37℃で16時間インキュベートした。

メイトアウトアッセイ(図9a)によって転位頻度をモニターする実験のために、30℃で振盪しながら24時間インキュベートした後、誘導培養物の一部を一度洗浄し、0.2％w/vのグルコースを補充したLBに再懸濁した。37℃で2時間インキュベートした後、誘導されたプールを、調製したmid-log CW51レシピエント株と、1：5のドナー：レシピエント比で混合し、37℃で90分間穏やかに撹拌しながらインキュベートして接合させた。インキュベーション後、培養物を撹拌し、氷上に置き、次いで、0.2％w/vグルコースを含むLBで連続的に希釈し、20μg/mLのナリジクス酸、100μg/mLのリファンピシン、100μg/mLのスペクチノマイシン、50μg/mLのX-galを補充し、50μg/mLのカナマイシンを補充した又は補充していないLB上にプレーティングし、全トランス接合体集団をサンプリングするか、又は転位のために選択した。コロニーを計数する前に、プレートを37℃で36時間インキュベートした。

Tn6677転位アッセイは、8μg/mLのテトラサイクリンをゲンタマイシンに置換したこと(存在する場合)を除いて、機能性プラスミドpMTP230、pMTP240、及び、pMTP250、pMTP260、又はpMTP270の誘導体を用いて上述のように行った。

すべての実験において、A.salmonicida S44転位については図3B、又はTn6677転位については図4D中の非-標的速度と同様の転位頻度で、非標的コントロール(スペーサーが標的Fプラスミドと一致しなかったもの)を使用した。

転位事象の選別配向
個別に単離されたCW51トランス接合体(メイトアウトアッセイからのミニエレメント挿入物を有する)を、20μg/mLのナリジクス酸、100μg/mLのリファンピシン、100μg/mLのスペクチノマイシン、50μg/mLのX-gal、及び50μg/mLのカナマイシンを補充したLB上で精製した。挿入事象の位置及び配向をキャプチャーするために、プライマーセットA(JEP1386+JEP1958)又はプライマーセットB(JEP1387＋JEP1958)を使用して、コロニーPCRを行った。

P.aeruginosa CRISPR干渉アッセイ
すべての干渉アッセイは、BL21-AIで行われた。BL21-AIは標準的化学方法(Peters, 2007)によりコンピテントにされ、pOPO322、pCsy_複合体、及びpCOLADuet-1の誘導体を用いて、100μg/mLのカルベニシリン、100μg/mLのスペクチノマイシン、30μg/mLのクロラムフェニコール、及び0.2％w/vのグルコースを補充したLBアガー上で形質転換された。100μg/mLのカルベニシリン、100μg/mLのスペクチノマイシン、30μg/mLのクロラムフェニコールを補充したLBアガー中で一晩増殖させた培養物を、100μg/mLのカルベニシリン、100μg/mLのスペクチノマイシン、30μg/mLのクロラムフェニコール、100μMのIPTG、及び1 mMのアラビノースを補充したLBで、1：50に希釈した。培養物をOD＝0.4まで増殖させ、その後、エレクトロコンピテント細胞を標準的な方法(Peters, 2007)によって調製し、1ngのpOPO275又はpOPO390で形質転換した。細胞を、SOC中で37℃にて1時間回復させ、その後、連続的に希釈し、100μg/mLのカルベニシリン、50μg/mLのカナマイシン、30μg/mLのクロラムフェニコール、及び100μg/mLのスペクチノマイシンを補充したLB上にプレーティングした。コロニーを計数する前に、プレートを37℃で16時間インキュベートした。

Xreタンパク質精製
pOPO223、pOPO239、pOPO331 又はpOPO360を、BL21(DE3)に形質転換し、これをTerrific Broth中で37℃にて培養し、対数期の間0.1mM IPTGで誘導した。細胞を、18℃でさらに12～16時間培養し、その後、遠心分離で収集し、0.15mg/mLのリゾチームを補充したニッケル緩衝液(20mM HEPES-NaOH(pH 7.5)、500mMのNaCl、30mMのイミダゾール、5％(v/v)グリセロール、5mMのβ-メルカプトエタノール)中で超音波処理することにより溶解した。ライセートを遠心分離によりクリアにし、Nickel-NTAカラムに充填し、ニッケル緩衝液で洗浄し、ニッケル緩衝液中30mM～500mMイミダゾール勾配で溶出した。選択した精製画分をプールし、透析し、緩衝液を貯蔵緩衝液(20mM HEPES-NaOH(pH 7.5)、100mM KCl、5％(v/v)グリセロール、1mM DTT)に交換した。精製したタンパク質を液体窒素で瞬間凍結し、-80℃で保存した。

電気泳動移動度シフトアッセイ(EMSA)
推定Xre調節遺伝子及びそれらの変異体のプロモーター断片をPCR増幅し、精製した。100nMのDNAを、平衡緩衝液(50mM Tris-HCl(pH 8.0)、1mM DTT、10mM MgCl₂)中で、様々な量の精製Xreタンパク質とともに25℃で20分間インキュベートし、次いでグリセロールと混合した(最終濃度6％)。6％未変性TBE PAGE(ポリアクリルアミドゲル)中で、0.5x TBEをランニング緩衝液として用いて、80Vにて室温で１時間泳動させることによって、EMSAを行った。ゲルをEtBr染色し、UVイメージャで可視化した。

DNA基質を次のようにして作製した：ArapBADをpBAD24(JEP175+JEP1364)から増幅し、pXre(Vp)及びpAttguide(Vp)をV.parahaemolyticus RIMD221063(JEP1956+JEP1957, pXre(Vp); JEP1954+JEP1955, pAttguide(Vp))から増幅し、pXre(Vc)及びpAttguide(Vc)を、gBlock11(JEP29+JEP30, pXre(Vc); JEP1553+JEP82, pAttguide(Vc))から増幅し、pXre(As)をpOPO08(JEP1321+JEP81)から増幅し、pTniQ(As)をpOPO09(JEP1322+JEP81)から増幅し、pXre*(As)をpOPO10(JEP1321+JEP81)から増幅し、pTniQ*(As)をpOPO11(JEP1322+JEP81)から増幅し、pXre(VB6)をpOPO06(JEP1553+JEP81)から増幅し、pTniQ(VB6)をpOPO07(JEP1554+JEP81)から増幅した。

In vivoプロモーターアッセイ
100μg/mLのカルベニシリン及び30μg/mLのクロラムフェニコールを補充したLBアガー上で、標準的化学方法(Peters, 2007)によってコンピテントにしたBW27783に、pOPO256、pOPO258、pOPO364、又はpOPO345、及びpOPO221誘導体を形質転換した。100μg/mLのカルベニシリン及び30μg/mLのクロラムフェニコールを補充したLB中で一晩増殖させた培養物を、100μg/mLのカルベニシリン、30μg/mLのクロラムフェニコール、及び種々の濃度のグルコース又はアラビノース(図6に示すような)を補充したLBで、1：100で希釈し、30℃でさらに20時間培養した。lacZ活性は、標準的なMillerユニットアッセイ(Malke, 1993)を用いて測定した。

接合誘導アッセイ
PO429は、標準的化学方法(Peters, 2007)によってコンピテントにされ、50μg/mLのカナマイシンを補充したLBアガー上で、pOPO392、pOPO394、又はpOPO435の１つで形質転換されて、ドナー株を生成した。DH5αは、標準的化学方法(Peters, 2007)によってコンピテントにされ、100μg/mLのカルベニシリンを補充したLBアガー上で、pETDuet-1、pOPO395、pOPO397又はpOPO438で形質転換されて、レシピエント株を生成した。ドナー及びレシピエントの培養物を、適切な抗生物質を補充したLB中で一晩増殖させ、同じ培地で1：10に希釈し、2時間増殖させ、次いでLBで3回洗浄して抗生物質を除去した。ドナー及びレシピエント株を1：2の比率で混合し、37℃で接合するためにLBアガー上にスポットした。異なる時点での接合細胞のLacZ活性を、標準的なMillerユニットアッセイ(Malke, 1993)を用いて測定した。非-接合コントロールは、ドナー及びレシピエントを別々に同一プレート上にスポットしたものとした。

株の構築
MTP997及びMTP1196は、100μg/mLのカルベニシリンを補充したLBアガー上で、標準的化学方法(Peters, 2007)によってコンピテントにされたBW27783に、pMTP112又はpMTP113を形質転換することによって構築し、30℃で増殖させた。個々のコロニーを、50μg/mLのカナマイシンを補充したLBアガー上で精製して、42℃で増殖させ、pMS26誘導体をキュアリングしながら、染色体へのminiTn7挿入のために選択した。カルベニシリン又はカナマイシンを補充したLBアガー上で個々のコロニーを30℃で精製し、カルベニシリン耐性の損失を確認した。

MTP1191は、株EMG2で増殖させたバクテリオファージを用いてMTP997のP1形質導入により構築され、lacZ欠失を野生型lacオペロンで置き換えた。形質導入体を0.2％w/vラクトースを補充したM9最小培地上で選択した。

リコンビニアリング(Datsenko and Wanner, 2000)を用いてPO429を構築して、野生型lacZを、lacZ::miniTn7(genR)対立遺伝子(miniTn7(genR)lacZ挿入ライブラリーからPCR増幅した)で置き換えた。

プラスミド構築
標準的な分子クローニング技術を用いて、以下に説明するベクターを、販売者の説明書に従って作製した。

pMTP112は、NotIでの消化後、pMS26のNotIサイトに、gBlock1を連結することによって構築された。使用したクローンは、Tn7右末端の近位にA.salmonicida左末端を有している。pMTP113は、NEBuilder Hifi(NEB)を用いて、pSL0527(pDonor)(JEP1858+JEP1859及びJEP1860+JEP1861)から増幅された２つのPCR産物、gBlock1(JEP1862+JEP1863)から増幅された１つのPCR産物、及びNotI消化されたpMS26を組み立てることによって構築された。pMTP114は、NEBuilder Hifiを用いて、Fプラスミド(JEP1398+1340及びJEP1341+1399, GenBank: AP001918.1)から増幅された２つのPCR産物、pMTP150(JEP1343+JEP1344)から増幅された１つのPCR産物、pBAD322S(JEP1345+JEP1346, GenBank: DQ131584.1)から増幅された１つのPCR産物、及びEcoRVで消化されたpTSC29を組み立てることによって構築された。pMTP115は、ゴールデンゲートクローニング(Engler et al.,2008)を用いて、EMG2(JEP1663+JEP1664, GenBank: U00096.3)から増幅されたPCR産物を、BsaIによる消化後、pMTP114に挿入することによって構築された。pMTP116は、ゴールデンゲートクローニングを用いて、BsaIで消化した後、アニーリングされたoligos(JEP1485+JEP1486)をpMTP114に挿入することによって構築された。pMTP117は、ゴールデンゲートクローニングを用いて、BsaIで消化した後、アニーリングされ、伸長されたoligos(JEP1481+JEP1482)をpMP114に挿入することによって構築された。pMTP118は、ゴールデンゲートクローニングを用いて、BsaIで消化した後、アニーリングされ、伸長されたoligos(JEP1878+JEP1879)をpMTP114に挿入することによって構築された。pMTP130は、NEBuilder Hifiを用いて、gBlock2、gBlock3、及び、DraIIによって消化されたpTA106(JEP1146+JEP1467)(ゲル精製された3800bpフラグメント)から増幅されたPCR産物を組み立てることによって構築された。pMTP140は、NEBuilder Hifiを用いて、gBlock4、gBlock5、gBlock6及びpBAD322G(NcoI及びHindIIIで消化)を組み立てることによって構築された。pMTP150は、NEBuilder Hifiを用いて、pBAD33(JEP1766+JEP1767及びJEP1768+JEP1769)から増幅された２つのPCR産物を、gBlock7及びgBlock8と組み立てることによって構築された。pMTP151は、ゴールデンゲートクローニングを用いて、BsaIで消化した後、アニーリングされたoligos(JEP1477+JEP1478)をpMTP150に挿入することによって構築された。pMTP160は、NEBuilder Hifiを用いて、pBAD33(JEP1766+JEP1767及びJEP1768+JEP1769)から増幅された２つのPCR産物と、gBlock7、及び、gBlock8(JEP1475+JEP1773)から増幅された１つのPCR産物とを組み立てることによって構築された。pMTP161-165は、アニーリングされたoligos(JEP1477+JEP1478, pMTP161; JEP1776+JEP1777, pMTP162; JEP1778+JEP1779, pMTP163; JEP1669+JEP1670, pMTP164; JEP1671+JEP1672, pMTP165)を連結することによって構築された。pMTP170は、NEBuilder Hifiを用いて、pBAD33(JEP1766+JEP1767及びJEP1770+JEP1769)から増幅された２つのPCR産物を、gBlock7(JEP1774+JEP1474)から増幅された１つのPCR産物、及びgBlock8(JEP1475+JEP1775)から増幅された１つのPCR産物と組み立てることによって構築された。pMTP171-183は、ゴールデンゲートクローニングを用いて、BsaIで消化した後、アニーリングされたoligos(JEP1784+JEP1785, pMTP171; JEP1780+1781, pMTP172; JEP1782+JEP1783, pMTP173; JEP1794+JEP1795, pMTP174; JEP1796+JEP1797, pMTP175; JEP1786+JEP1787, pMTP176; JEP1788+JEP1789, pMTP177; JEP1798+JEP1799, pMTP178; JEP1800+JEP1801, pMTP179; JEP1808+JEP1809, pMTP180; JEP1810+JEP1811, pMTP181; JEP1816+JEP1817, pMTP182; JEP1818+JEP1819, pMTP183)を、pMTP170に挿入することによって構築された。pMTP190は、NEBuilder Hifiを用いて、pBAD33(JEP1766+JEP1767及びJEP1771+JEP1769)から増幅された２つのPCR産物を組み立てることによって構築された。pMTP191及びpMTP192は、４つのoligos(JEP1928, JEP1929, JEP1930, JEP1931 : pMTP191; JEP1932, JEP1933, JEP1934, JEP1935 : pMTP192)をアニーリングすることによって、及びXmaI及びBsaIで消化したpMTP190と連結することによって構築された。

pMTP230は、NEBuilder Hifiを用いて、pBAD33(JEP1864+JEP1865)から増幅された１つのPCR産物、pMTP130(JEP1866+JEP1867)から増幅された１つのPCR産物、及びNcoI及びPflFIで消化されたpSL0284(ゲル精製された3,707bpのフラグメント)を組み立てることによって構築された。pMTP240は、NEBuilder Hifiを用いて、pBAD322(JEP1868+JEP1869)から増幅されたPCR産物を、NdeI及びBglIで消化されたpSL0284(ゲル精製された5,152bpのフラグメント)と組み立てることによって構築された。pMTP250は、NEBuilder Hifiを用いて、pCDFDuet-1(JEP1838+JEP1839)から増幅されたPCR産物、pBAD322(JEP1834+JEP1835)から増幅されたPCR産物、及びpBBR1MCS-3(JEP1836+JEP1837)から増幅されたPCR産物を組み立てることによって構築された。pMTP260及びpMTP270は、４つのoligos(JEP1870, JEP1871, JEP1872, JEP1873 : pMTP260; JEP1908, JEP1909, JEP1910, JEP1911 : pMTP270)をアニーリングすることによって、及び、XmaI及びBsaIで消化されたpMTP250と連結することによって構築された。pMTP261-264は、ゴールデンゲートクローニングを用いて、BsaIで消化した後、アニーリングされたoligos(JEP1914+JEP1915, pMTP161; JEP1912+JEP1913, pMTP162; JEP1880+JEP1881, pMTP163; JEP1882+JEP1883, pMTP164)を、pMTP260に挿入することによって構築された。pMTP271-274は、ゴールデンゲートクローニングを用いて、BsaIで消化した後、アニーリングされたオリゴoligos(JEP1914+JEP1919, pMTP271; JEP1912+JEP1917, pMTP272; JEP1880+JEP1916, pMTP273; JEP1882+JEP1917, pMTP27を、pMTP270に挿入することによって構築された。pMTP275及びpMTP276は、４つのoligos(JEP1920, JEP1921, JEP1922, JEP1923 : pMTP275; JEP1924, JEP1925, JEP1926, JEP1927 : pMTP276)をアニーリングすることによって、及びXmaI及びBsaIで消化されたpMTP250と連結することによって構築された。

すべてのF誘導体は、リコンビニアリング(Datsenko and Wanner, 2000)を用いて作成され、株EMG2(GenBank: AP001918.1)からのプラスミドFの大領域を、pMTP114誘導体(JEP1376+1386. pMTP115, FΔ(finO-fxsA)::lacZ specR; pMTP116, FΔ(finO-fxsA)::cysH^As specR; pMTP117, FΔ(finO-fxsA)::ffs^As specR; pMTP118, FΔ(finO-fxsA)::guaC^Vc specR)から増幅されたPCRフラグメントで置き換えた。

pOPO256は、NdeI及びHindIIIで消化されたgBlock9(JEP1657+JEP1757)から増幅されたPCR産物を、同じ酵素で消化されたpBAD33中に連結することによって構築された。得られた構築物を、NdeI及びXbaIで消化し、リン酸化アニーリングoligos(JEP1842+JEP1843)と連結した。pOPO258は、NEBuilder Hifiを用いて、gBlock10(JEP1764+JEP1765)から増幅されたPCR産物を、NdeI及びHindIIIで消化されたpBAD33と組み立てることによって構築された。得られた構築物をNdeI及びXbaIで消化し、リン酸化アニーリングoligos(JEP1842+JEP1843)と連結した。pOPO364は、NdeI及びHindIIIで消化されたV.parahaemolyticus RIMD221063(kindly provided by Tobias Doerr)(JEP1952+JEP1960)のgDNAから増幅されたPCR産物、及びリン酸化アニーリングoligos(JEP1842+JEP1843)を、NdeI及びHindIIIで消化されたpBAD33中に連結することによって構築された。pOPO345は、SpeI及びHindIIIで消化されたgBlock11(JEP1555+JEP1556)から増幅されたPCR産物を、XbaI及びHindIIIで消化されたpBAD33中に連結することによって構築された。pOPO221は、BsaI及びXhoIで消化されたpBAD24(JEP1759+JEP1760)から増幅されたPCR産物を、同じ酵素で消化したEMG2(JEP1761+JEP1762)から増幅されたPCR産物と連結することによって構築された。pOPO227-230、pOPO332、pOPO334、pOPO341、及びpOPO337は、XhoI及びStuIで消化されたgBlock10又はgBlock11からのフラグメント(gBlock10 : pOPO227-230; gBlock11 : pOPO332、pOPO334、pOPO341、pOPO337)を、XhoI及びSmaIで消化されたpOPO221中に連結することによって構築された。pOPO329及びpOPO330は、XhoI及びStuIで消化されたV.parahaemolyticus RIMD221063(JEP1956+JEP1957、pOPO329; JEP1954+JEP1955、pOPO330)のgDNAから増幅されたPCR産物を、XhoI及びSmaIで消化されたXhoI及びSmaI中に連結することによって構築された。pOPO223、pOPO239、pOPO331、pOPO360は、NdeI及びXhoIで消化された増幅されたPCR産物(gBlock9から, JEP1675+JEP1758, pMTP016；gBlock10から, JEP1556+JEP1764, pMTP017；V.parahaemolyticus RIMD221063のgDNA から, JEP1952+JEP1953, pMTP018； gBlock11から, JEP1950+1951, pMTP019)を、同じ酵素で消化されたpET22b(+)中に連結することによって構築された。pOPO390及びpOPO275は、アニーリングされたoligos(JEP2119, JEP2120, JEP1906+JEP1907、それぞれ)を、オリゴ(jep2119)、SapIで消化されたpCOLADuet-1(JEP1902+JEP1903)から増幅されたPCR産物中に連結することによって構築された。pOPO322は、NEBuilder Hifiを用いて、pCas1_pCas2/3(JEP1889+JEP1890)から増幅されたPCR産物とNcoI及びAvrIIで消化されたpACYCDuet-1を組み立てることによって構築された。pOPO392は、NEBuilder Hifiを用いて、V.parahaemolyticus RIMD221063(JEP2107+JEP2108)のgDNAから増幅されたPCR産物及びpOPO330(JEP2109+JEP2110)を、NsiI及びBamHIで消化されたpBBR1MCS-2と組み立てることによって構築された。pOPO394は、NEBuilder Hifiを用いて、gBlock10(JEP2111+JEP2112, JEP2113+JEP2114)から増幅されたPCR産物及びpOPO227(JEP2115+JEP2116)を、NsiI及びBamHIで消化されたpBBR1MCS-2と組み立てることによって構築された。pOPO435は、NEBuilder Hifiを用いて、gBlock11(JEP2154+JEP2155, JEP2156+JEP2157)から増幅されたPCR産物及びpOPO337(JEP2158+JEP2159)を、NsiI及びBamHIで消化されたpBBR1MCS-2と組み立てることによって構築された。pOPO395は、NEBuilder Hifiを用いて、V.parahaemolyticus RIMD221063(JEP2101+JEP2102)のgDNAから増幅されたPCR産物及びXbaI及びAvrIIで消化されたpETDuet-1を組み立てることによって構築された。pOPO397は、NEBuilder Hifiを用いて、gBlock11(JEP2160+JEP2161, JEP2162+JEP2163)から増幅されたPCR産物を、XbaI及びAvrIIで消化されたpETDuet-1と組み立てることによって構築された。pOPO438は、NEBuilder Hifiを用いて、gBlock11(JEP2160+JEP2161, JEP2162+JEP2163)から増幅されたPCR産物を、XbaI及びAvrIIで消化されたpETDuet-1と組み立てることによって構築された。

pOPO374は、BsaI消化されたpCDFDuet-1(JEP1577+JEP1891)から増幅されたPCR産物と、2対のリン酸化されたアニーリングoligos(JEP1995+JEP1996, JEP1997+JEP1998)を連結することによって構築された。pOPO376及びpOPO378は、同じ方法で構築されたが、oligos(JEP2003+JEP2004, JEP2005+JEP2006)及び(JEP2007+JEP2008, JEP2009+JEP2010)を用いた。

pMTP281-286は、BsaIで消化されたpCDFDuet-1(JEP2032+JEP2033)から増幅されたPCR産物を、４つのアニーリングされたoligos(JEP2063, JEP2064, JEP2065, JEP2066 : pMTP281; JEP2078, JEP2079, JEP2080, JEP2081 : pMTP282; JEP2035, JEP2036, JEP2037, JEP2038 : pMTP283; JEP2049, JEP2050, JEP2051, JEP2052 : pMTP284; JEP2067, JEP2068, JEP2069, JEP2066 : pMTP285; JEP2082, JEP2083, JEP2084, JEP2081 : pMTP286)と連結することによって構築された。

定量化及び統計的分析
統計の詳細は図の説明文に記載されている。３つの生物学的複製物(n=3)を用いて実験を行った。

本開示で使用されるプラスミドは以下のものである。プラスミド配列は、配列表に提供される
［プラスミド表１］

［プラスミド表２］

［プラスミド表３］

［プラスミド表４］

［プラスミド表５］

［プラスミド表６］

［プラスミド表７］

［プラスミド表８］

［プラスミド表９］

以下のオリゴヌクレオチドを本開示において使用した。
［オリゴヌクレオチド表１］

［オリゴヌクレオチド表２］

［オリゴヌクレオチド表３］

本開示で使用される合成遺伝子フラグメント(gBlock)は、以下の名称で参照される。配列は配列表に提供される。
［遺伝子フラグメント表］

以下の引用参考文献のリストは、いずれかの参考文献が特許性の材料であることを示すものではない。
［参考文献リスト１］

［参考文献リスト２］

［参考文献リスト３］

［参考文献リスト４］

本開示を、その詳細な説明を参照して説明してきたが、前述の説明は、添付の特許請求の範囲によって規定される本発明の範囲を例示することを意図するものであり、限定することを意図するものではない。他の態様、利点、及び改変は、以下の請求の範囲の範囲内である。

Claims

５'から３'方向に連続的に、
i）第一のＣＲＩＳＰＲリピート配列を含む５'末端セグメント；
ii）ＤＮＡ標的配列中のプロトスペーサーと相補的な標的化配列を含むスペーサー配列；及び
iii）第二のＣＲＩＳＰＲリピート配列を含む３'末端セグメント；
を含む組換えRNAポリヌクレオチドであって、
前記５'末端セグメント又は３'末端セグメントが、第一の参照リピート配列に対して１つ以上のヌクレオチド変化を含み、
タイプＩ-Ｆ３ＣＲＩＳＰＲ-Ｃａｓタンパク質と接触したとき、前記組換えＲＮＡポリヌクレオチドは、タイプＩ-Ｆ３ＣＲＩＳＰＲ-Ｃａｓタンパク質と相互作用して、ＤＮＡ標的配列に改変をもたらす機能性タイプＩ-Ｆ３ＣＲＩＳＰＲ-Ｃａｓ複合体を形成する、
組換えＲＮＡポリヌクレオチド。
前記３'末端セグメント又は前記５'末端セグメントが、第二の参照リピート配列に対して１つ以上のヌクレオチド変化を含む、請求項１に記載の組換えＲＮＡポリヌクレオチド。
前記５'末端セグメント及び前記３'末端セグメントの各々が、前記第一及び第二の参照リピート配列それぞれに対して１つ以上のヌクレオチド変化を含む、請求項１に記載の組換えＲＮＡポリヌクレオチド。
タイプＩ-Ｆ３ＣＲＩＳＰＲ-Ｃａｓタンパク質が、タイプＩ-Ｆ３ｂＣＲＩＳＰＲ-Ｃａｓタンパク質を含んで、機能性タイプＩ-Ｆ３ｂＣＲＩＳＰＲ-Ｃａｓ複合体を形成し、及び、
ＣＲＩＳＰＲリピート配列が、任意で５'末端に、ＧＵＧではない３つの連続するヌクレオチドを含む、請求項１に記載の組換えＲＮＡポリヌクレオチド。
前記遺伝子操作されたガイドポリヌクレオチドは、タイプＩＦ-３ｂＣＲＩＳＰＲタンパク質複合体と共にＤＮＡ標的配列と接触したとき、前記の１つ以上のヌクレオチド変化を含まない対照ガイドＲＮＡと比較して、ＤＮＡ標的配列のより効率的な改変を示す、請求項１に記載の組換えＲＮＡポリヌクレオチド。
前記改変が、ＤＮＡ標的配列へのＤＮＡカーゴの挿入を含む、請求項５に記載の組換えＲＮＡポリヌクレオチド。
前記５'末端セグメントが８ヌクレオチドを含むか又は８ヌクレオチドからなり、及び／又は、
前記３'末端セグメントが２０ヌクレオチドを含むか又は２０ヌクレオチドからなり、前記２０ヌクレオチドの３'末端がＧである、請求項５に記載の組換えＲＮＡポリヌクレオチド。
前記３'末端セグメントがステムループを形成し、前記ステムループが回文配列を含む、請求項５に記載のＲＮＡポリヌクレオチド。
前記第一の参照リピート配列が、内在性原核生物ＣＲＩＳＰＲアレイ中のＣａｓ６コード配列の３'側にある第一の発生リピート配列によってコードされ、及び/又は、前記第二の参照リピート配列が、内在性原核生物ＣＲＩＳＰＲアレイ中のＣａｓ６コード配列の３'側にある第二の発生リピート配列によってコードされ、前記内在性原核生物ＣＲＩＳＰＲアレイが、任意で、ガンマプロテオバクテリアＣＲＩＳＰＲアレイである、請求項８に記載の組換えＲＮＡポリヌクレオチド。
前記ガンマプロテオバクテリアＣＲＩＳＰＲアレイが、Ａ.ｓａｌｍｏｎｉｃｉｄａＣＲＩＳＰＲアレイを含む、請求項９に記載の組換えＲＮＡポリヌクレオチド。
前記ＲＮＡポリヌクレオチドが、リボ核タンパク質複合体中に存在する、請求項１～１０のいずれか１項に記載の組換えＲＮＡポリヌクレオチド。
前記リボ核タンパク質のタンパク質が、Ｃａｓ５、Ｃａｓ６、Ｃａｓ７、Ｃａｓ８、及びそれらの任意の組み合わせから選択される、請求項１１に記載の組換えＲＮＡポリヌクレオチド。
前記リボ核タンパク質がＣａｓ６を含み、前記３'末端セグメントの少なくとも一部を含むステムループが、前記リボ核タンパク質質複合体中のＣａｓ６によって認識される、請求項１２に記載の組換えＲＮＡポリヌクレオチド。
前記ＲＮＡポリヌクレオチドが、前記プロトスペーサーを含む既知のＤＮＡ標的配列のＣＲＩＳＰＲベースの改変において使用するのに適するように、前記標的化配列が、前記ＲＮＡポリヌクレオチドに含ませるために選択される、請求項１１に記載の組換えＲＮＡポリヌクレオチド。
前記スペーサーの長さが２９ヌクレオチド以下である、請求項１１に記載の組換えＲＮＡポリヌクレオチド。
前記第一及び/又は第二の参照リピート配列が、細菌又は古細菌中に存在するリピート配列と同じであり、ここで、前記細菌又は古細菌中のリピート配列が、細菌によってもっとも最近獲得されたスペーサーではないＣＲＩＳＰＲアレイ中のスペーサーと隣接している、請求項１～１１のいずれか１項に記載の組換えＲＮＡポリヌクレオチド。
請求項１～１１のいずれか１項に記載の遺伝子操作されたガイドポリヌクレオチドをコードする発現ベクター。
請求項１７に記載の発現ベクターから転写された単離ＲＮＡポリヌクレオチド。
請求項１７に記載の発現ベクターを含む細胞。
１つ以上の細胞において遺伝子標的を改変するためのシステムであって、前記システムが、
第一セットのトランスポゾン遺伝子ｔｎｓＡ、ｔｎｓＢ、ｔｎｓＣ、及びｔｎｉＱ、Ｃａｓ遺伝子ｃａｓ８ｆ、ｃａｓ５ｆ、ｃａｓ７ｆ、及びｃａｓ６ｆ、及び任意で、転写調節因子をコードするｘｒｅ遺伝子、又は任意で、１つ以上の前記遺伝子によってコードされる１つ以上のタンパク質（ここで、任意で、前記タンパク質の少なくとも２つが融合タンパク質内にある）、及び請求項１～１１のいずれか１項に記載の組換えＲＮＡポリヌクレオチドをコードする配列、及び任意で、プロトスペーサーに近位の位置でＤＮＡ中に導入され得るＤＮＡカーゴを含む、請求項１に記載の方法。
ｔｎｓＡ遺伝子が、ｔｎｓＡ遺伝子によってコードされるＴｎｓＡタンパク質中の少なくとも１つのアミノ酸がその野生型配列に対して変化するような配列変化を含み、又はタンパク質が使用される場合、当該タンパク質が前記変化を含む、請求項２０に記載のシステム。
i）ｔｎｓＢ遺伝子が、ｔｎｓＢ遺伝子によってコードされるＴｎｓＢタンパク質中の少なくとも１つのアミノ酸がその野生型配列に対して変化するような配列変化を含み、又はタンパク質が使用される場合、当該タンパク質が前記変化を含む；又は、
ii）ｔｎｓＣ遺伝子が、ｔｎｓＣ遺伝子によってコードされるＴｎｓＣタンパク質中の少なくとも１つのアミノ酸がその野生型配列に対して変化するような配列変化を含み、又はタンパク質が使用される場合、当該タンパク質が前記変化を含む
請求項２０に記載のシステム。
ａ）前記ＴｎｓＡタンパク質中の変化が、ＡｅｒｏｍｏｎａｓｓａｌｍｏｎｉｃｉｄａＴｎｓＡタンパク質の１２５位のＡｌａの変化を含み、ここで任意で、前記変化はＡｓｐへの変化であるか、又は相同的ＴｎｓＡタンパク質における相同的変化である；
ｂ）前記ＴｎｓＢタンパク質中の変化が、ＡｅｒｏｍｏｎａｓｓａｌｍｏｎｉｃｉｄａＴｎｓＢタンパク質のアミノ酸１６７位の変化を含み、ここで任意で、前記変化はＳｅｒへの変化であるか、又は相同的ＴｎｓＢタンパク質の相同位置における相同的変化である；
ｃ）前記ＴｎｓＣタンパク質中の変化が、ＡｅｒｏｍｏｎａｓｓａｌｍｏｎｉｃｉｄａＴｎｓＣタンパク質の１３５、１３６、１３７、１３８、１３９、又は１４０位における少なくとも１つのアミノ酸の変化を含み、ここで任意で、前記変化は、ＴｎｓＣタンパク質の１４０位のアミノ酸に対する変化であり、ここで任意で、アミノ酸１４０に対する変化は、Ａｌａ又はＧｌｎへの変化であり、又は、相同的ＴｎｓＣタンパク質の相同位置における相同的変化である
請求項２０に記載のシステム。
細胞において、請求項１～１１のいずれか１項に記載の組換えＲＮＡポリヌクレオチドを発現させることを含む方法であって、前記細胞が、第一のトランスポゾン遺伝子ｔｎｓＡ、ｔｎｓＢ、ｔｎｓＣ、及び任意で少なくとも１つのｔｎｉＱ、Ｃａｓ遺伝子Ｃａｓ８ｆ、Ｃａｓ５ｆ、Ｃａｓ７ｆ、及びＣａｓ６ｆ、及び任意でｘｒｅを含んでおり、ここで任意で、前記第一セットのトランスポゾン遺伝子の少なくとも１つ又は前記Ｃａｓ遺伝子が、組換えポリヌクレオチド内に存在している、方法。
前記標的化配列は、前記細胞中の染色体又はプラスミド中のプロトスペーサーを標的とする、請求項２４に記載の方法。
前記細胞が原核細胞である、請求項２４に記載の方法。
前記細胞が真核細胞であり、前記標的化配列が染色体を標的とする、請求項２４に記載の方法。
さらに、前記細胞内にカーゴＤＮＡを導入する工程を含み、前記ＤＮＡカーゴが、前記プロトスペーサーの近位で染色体又はプラスミドに挿入される、請求項２４に記載の方法。
前記ＤＮＡカーゴが、トランスポゾンの左端及び右端を含む、請求項２８に記載の方法。
前記ＤＮＡカーゴが、プロトスペーサーの末端から４８ヌクレオチドの位置で染色体又はプラスミドに挿入される、請求項２９に記載の方法。
複数の生物からのＣＲＩＳＰＲアレイを分析すること、
ＣＲＩＳＰＲアレイ内のスペーサーに隣接するリピート配列を決定すること、
より早くに獲得されたスペーサーに隣接するリピート配列を、より遅くに獲得されたスペーサーに隣接するリピート配列と比較すること、
より早くに獲得されたスペーサーに隣接するリピート配列と、より遅くに獲得されたスペーサーに隣接するリピート配列との間の差を決定すること、及び、
より遅くに獲得されたスペーサーに隣接するリピート配列とは異なっている、より早くに獲得されたスペーサーに隣接するリピート配列を、ＣＲＩＳＰＲベースのＤＮＡ改変に使用するためのガイドＲＮＡの設計に使用するための候補として指定すること
を含む方法であって、
ここで、任意で、ＣＲＩＳＰＲベースの改変は、より遅くに獲得されたスペーサーに隣接する配列から転写されるガイドＲＮＡを使用するＣＲＩＳＰＲベースのＤＮＡ改変に対して向上している、方法。
より早くに獲得されたリピート配列に隣接するリピート配列から転写される５'末端配列及び/又は３'末端配列を含むＲＮＡポリヌクレオチドを生成することをさらに含む、請求項３１に記載の方法。
ＣＲＩＳＰＲベースのＤＮＡ修飾において、前記ＲＮＡポリヌクレオチドを使用することをさらに含む、請求項３２に記載の方法。
前記ＲＮＡポリヌクレオチドにおいて、分析されたＣＲＩＳＰＲアレイ中のスペーサーが、染色体又はプラスミド中に存在する所定のＤＮＡ配列を標的とする異なるスペーサー配列で置換されており、ここで、前記スペーサーが、任意で、長さ２９ヌクレオチド以下である、請求項３３に記載の方法。
請求項３１記載の方法により製造されたＲＮＡポリヌクレオチド。
請求項３１記載の方法により同定されたＲＮＡポリヌクレオチドをコードする発現ベクターのライブラリー。
複数のエントリーを含むデータベースであって、前記エントリーは、請求項３１に記載の方法に従って同定された、より早くに獲得されたスペーサーに隣接するリピート配列を含むか、又はそれからなる、請求項３１に記載の方法。
請求項３７に記載のデータベースから１つ以上のリピート配列を選択すること、前記１つ以上のリピート配列をコードする発現ベクターを作製することを含む方法。
ＣＲＩＳＰＲベースのＤＮＡ改変に使用するための発現ベクターを作製するためのキットであって、前記キットは、所望のスペーサーをクローニングするために構成された１つ以上の制限エンドヌクレアーゼ認識部位を含むベクターを含み、前記スペーサーは、請求項３１に記載の方法に従って同定される１つ以上のリピート配列と隣接するものである、キット。
さらに、第一セットのトランスポゾン遺伝子ｔｎｓＡ、ｔｎｓＢ、ｔｎｓＣ、及びｔｎｉＱ、Ｃａｓ遺伝子ｃａｓ８ｆ、ｃａｓ５ｆ、ｃａｓ７ｆ、及びｃａｓ６ｆ、及び任意で、ｘｒｅ遺伝子をコードする１つ以上の発現ベクター、又は、任意で、前記遺伝子の１つ以上によってコードされる１つ以上のタンパク質を含む、請求項３９に記載のキット。
ＤＮＡ標的配列を改変する方法であって、前記ＤＮＡ標的配列を、
i）スペーサー配列及びＣＲＩＳＰＲリピート配列を含むガイドポリヌクレオチド、及び
ii）タイプＩ-ＦＣＲＩＳＰＲ-Ｃａｓタンパク質
と接触させることを含み、
ここで、前記スペーサー配列は、前記ＤＮＡ標的配列のプロトスペーサー配列に相補的な標的化配列を含んでおり、前記ＣＲＩＳＰＲリピート配列は、参照リピート配列に対してヌクレオチド変化を含んでおり、及び、ガイドポリヌクレオチドが、前記タイプＩ-ＦＣＲＩＳＰＲ-Ｃａｓタンパク質を誘導して、前記ＤＮＡ標的配列の改変を行うことを特徴とする方法。
前記ガイドポリヌクレオチドが、第二のＣＲＩＳＰＲリピート配列をさらに含み、前記第二のＣＲＩＳＰＲリピート配列が、第二の参照リピート配列に対してヌクレオチド変化を含む、請求項４１に記載の方法。
前記第一の参照リピート配列が、内在性原核生物ＣＲＩＳＰＲアレイ中のＣａｓ６コード配列の３'側にある第一の発生リピート配列によってコードされ、及び/又は、前記第二の参照リピート配列が、内在性原核生物ＣＲＩＳＰＲアレイ中のＣａｓ６コード配列の３'側にある第二の発生リピート配列によってコードされ、ここで、前記内在性原核生物ＣＲＩＳＰＲアレイは、任意で、ガンマプロテオバクテリアＣＲＩＳＰＲアレイである、請求項４１又は４２に記載の方法。
前記ＣＲＩＳＰＲリピート配列が、５'末端に、ＧＴＧ又はＧＵＧとは異なる３つの連続するヌクレオチドを含む、請求項４１～４３のいずれか１項に記載の方法。
前記改変が、タイプＩ-ＦＣＲＩＳＰＲ-Ｃａｓタンパク質、及び参照ガイドＲＮＡ(第一又は第二の参照リピート配列を含み、前記ヌクレオチド変化を含まない)によって誘導される改変と比較して、より効率的である、請求項４１～４４のいずれか１項に記載の方法。
前記タイプＩ-ＦＣＲＩＳＰＲ-Ｃａｓタンパク質が、Ｃａｓ８、Ｃａｓ５、Ｃａｓ７、又はＣａｓ６を含む、請求項４１～４５のいずれか１項に記載の方法。
前記ＤＮＡ標的配列を、Ｃａｓ８、Ｃａｓ５、Ｃａｓ７及びＣａｓ６と接触させることを含む、請求項４６に記載の方法。
Ｃａｓ８、Ｃａｓ５、Ｃａｓ７及びＣａｓ６タンパク質の２つ以上がリンカーによって連結されている、請求項４７に記載の方法。
前記ＤＮＡ標的配列を、ｔｎｓＡ、ｔｎｓＢ、ｔｎｓＣ、ｔｎｉＱ、及びｔｎｓＤからなる群より選択されるトランスポゾンタンパク質と接触させることをさらに含む、請求項４１～４８のいずれか１項に記載の方法。
前記ＴｎｓＡタンパク質が、ＴｎｓＡ参照配列において参照されるＡ１２５Ｄアミノ酸置換を含む、請求項４９に記載の方法。
前記ＴｎｓＢタンパク質が、ＴｎｓＢ参照配列において参照されるＰ１６７Ｓアミノ酸置換を含む、請求項４９に記載の方法。
前記ＴｎｓＣタンパク質が、ＴｎｓＣ参照配列中にＬ１３５、Ｉ１３６、Ｉ１３７、Ｉ１３８、Ｄ１３９、Ｅ１４０Ａ、又はＥ１４０Ｑアミノ酸置換を含む、請求項４９に記載の方法。
前記改変が、前記ＤＮＡ標的配列にＤＮＡカーゴを挿入することを含む、請求項４１～５２のいずれか１項に記載の方法。
前記改変が、前記ＤＮＡ標的配列中に二本鎖切断を生じない、請求項５３に記載の方法。
前記ＤＮＡ標的配列が、真核生物染色体である、請求項５３に記載の方法。
前記ＤＮＡ標的配列が細胞内にある、請求項４１～５５のいずれか１項に記載の方法。
前記細胞が哺乳動物細胞であり、任意で、前記細胞がヒト細胞である、請求項５６に記載の方法。
前記ＤＮＡ標的配列が、対象内にある、請求項５２～５７のいずれか１項に記載の方法。
前記対象が疾患を有しており、前記ＤＮＡカーゴが、タンパク質をコードするＤＮＡ配列を含み、前記対象における前記タンパク質の発現が、前記疾患を治療又は改善する、請求項５８に記載の方法。
それを必要とする対象において疾患を治療する方法であって、前記方法が、
請求項１～１１のいずれか１項に記載の遺伝子操作されたポリヌクレオチド、請求項１７に記載のベクター、請求項１９に記載の細胞、又は請求項２０～２３のいずれか１項に記載のシステムを、前記対象に投与することを含み、前記改変が、前記対象において疾患の症状を治療又は改善する、方法。