WO2019103020A1

WO2019103020A1 - 安定で副作用の少ないゲノム編集用複合体及びそれをコードする核酸

Info

Publication number: WO2019103020A1
Application number: PCT/JP2018/042915
Authority: WO
Inventors: 敬二西田
Original assignee: 国立大学法人神戸大学
Priority date: 2017-11-22
Filing date: 2018-11-21
Publication date: 2019-05-31
Also published as: CA3082922C; US20210024906A1; SG11202004691WA; BR112020010036A2; JPWO2019103020A1; CA3082922A1; JP7328695B2; KR102387830B1; JP2023129709A; KR20200091884A; EP3715454A4; CN111615557A; EP3715454A1

Abstract

本発明は、二本鎖DNA中の標的ヌクレオチド配列と特異的に結合する核酸配列認識モジュールと、(i)疎水性アミノ酸３残基をC末端に含むペプチド、又は(ii)該アミノ酸残基の少なくとも一部がセリンに置換されたアミノ酸３残基をC末端に含むペプチドからなるタンパク質分解タグとが結合した複合体を提供する。

Description

安定で副作用の少ないゲノム編集用複合体及びそれをコードする核酸

　本発明は、安定で副作用の少ないゲノム編集用複合体及びそれをコードする核酸、並びに該複合体を用いたゲノム編集方法に関する。

　選択マーカー遺伝子の組込みを必要とせず、同じオペロンにおける下流遺伝子の発現への影響を最小限に抑え得るようなゲノム編集は、原核生物において特に有利である。ファージ由来のRecET及びλ-Redリコンビナーゼは、組換え技術として利用されており、ドナーDNA又はオリゴヌクレオチドの相同性に依存する組込み/置換を容易にする（例えば、非特許文献１）。メチル指向性ミスマッチ修復（MMR）を欠損した株と組み合わせることで、選択マーカーを組み込むことなく、高効率の組換えを達成することができ(非特許文献２)、数日以内に複数の標的遺伝子座における遺伝的な多様性を生じさせるため、多重自動ゲノム工学法（MAGE）で利用されている。しかしながら、前記組換え技術は、MMRの欠損や、組換えDNA修復系の中心的な構成要素であるRecAのような宿主依存性因子に依存し、クローニングのための宿主として用いる大部分の大腸菌に害を与えるため、バックグラウンドの異なる細菌種に、容易に転用することができない(非特許文献３)。

　CRISPR（clustered regularly interspaced short palindromic repeats）及びCRISPR関連（Cas）タンパク質は、単一のガイドRNA（sgRNA）及びプロトスペーサー隣接モチーフ（PAM）に依存的な様式で標的DNAを切断することで、細菌の適応免疫系として働くことが知られている。ストレプトコッカス・ピオゲネス（Streptococcus pyogenes）由来のCas9ヌクレアーゼは、DNA二重鎖切断（DSB）の修復経路を有する真核生物において、強力なゲノム編集ツールとして広く使用されている(例えば、非特許文献４、５)。非相同末端結合（NHEJ）経路によるDSBの修復中に、標的DNAに小さな挿入及び/又は欠失（indels）が導入され、部位特異的な変異又は遺伝子破壊が生じる。効率は宿主細胞に依存するものの、より正確な編集のために、標的領域に対するホモロジーアームを含むドナーDNAを提供することにより、相同組換え修復（HDR）を促進することができる。

　しかしながら、現在のゲノム編集技術は宿主のDNA修復システムに依存しているため、原核生物への適用には、さらなる工夫が必要である。ほとんどの細菌では、NHEJ経路の欠如のため、人工ヌクレアーゼによるDNA切断により細胞死が生じる（非特許文献６、７）。従って、CRISPR/Cas9は、λ-Red組換えシステムのような他の方法により、遺伝子が改変された細胞のためのカウンターセレクター(counter-selector)としてのみ利用されている（例えば、非特許文献8、９）。

　最近、標的領域に対するホモロジーアームを含むドナーDNAを使用せずに、標的遺伝子座でヌクレオチドを直接編集する、デアミナーゼに媒介される標的塩基編集が実証されている（例えば、特許文献１、非特許文献１０～１２）。この技術は、ヌクレアーゼに媒介されるDNA切断の代わりに、DNA脱アミノ化を利用するため、細菌の細胞死を誘導せず、細菌のゲノム編集に適用可能であるが、その変異効率、特に複数箇所に対する同時編集の効率は、十分とはいえない。

国際公開第2015/133554号

Datsenko, K. A. & Wanner, B. L., Proc. Natl. Acad. Sci. U. S. A. 97, 6640-5 (2000). Costantino, N. & Court, D. L., Proc. Natl. Acad. Sci. U. S. A. 100, 15748-53 (2003). Wang, J. et al., Mol. Biotechnol. 32, 43-53 (2006). Mali, P. et al., Science 339, 823-827 (2013). Cong, L. et al., Science 339, 819-823 (2013). Bowater, R. & Doherty, A. J., PLoS Genet. 2,93-99 (2006). Cui, L. & Bikard, D., Nucleic Acids Res. 44, 4243-4251 (2016). Jiang, W. et al., Nat Biotechnol 31, 233-239 (2013). Li, Y. et al., Metab. Eng. 31, 1-9 (2015). Komor, A. C. et al., Nature61, 5985-91 (2016). Nishida, K. et al., Science 102, 553-563 (2016). Ma, Y. et al., Nat. Methods 1-9 (2016). doi:10.1038/nmeth.4027

　従来のゲノム編集用のベクターは、該ベクターから発現し宿主のゲノムDNAに作用する性質のゲノム編集用複合体の毒性が高いため、宿主、特に細菌にとって負担が大きく、宿主内でのベクターの不安定化を招き得る。ゲノム編集においては、非特異的な変異やオフターゲット変異が生じるなどの副作用が生じ、特に、ウラシルDNAグリコシラーゼ阻害剤(UGI)などを用いて変異効率を上げた場合に、その代償として、宿主に対して強い毒性が生じ、細胞死や非特異的な変異率の上昇等を引き起こす。従って、本発明の課題は、宿主内でも安定して増幅可能な、毒性の低いベクターなどの核酸及びその核酸にコードされるゲノム編集用複合体を提供すること、並びに該ベクター、必要に応じて核酸改変酵素を用いて、RecAのような宿主依存性因子に依存せずに広範囲の細菌に適用可能な、非特異的な変異等を抑えつつ細菌のDNAを改変することが可能なゲノム編集の手法を提供することである。

　本発明者は、宿主としての細菌にとって毒性の高いゲノム編集用複合体の細菌内での存在量を抑制することで、細菌中のベクターを安定化でき、また細菌DNAの非特異的な変異等を軽減できるのではないかとの着想を得た。そこで、ゲノム編集用複合体の存在量を抑制するために、細菌においてタンパク質の分解を促進し、半減期を短くすることが知られている、タンパク質分解タグのLVAタグに着目し、研究を進めた。その結果、ゲノム編集用複合体に該タンパク質分解タグを付加することで、標的部位への変異効率を維持しつつ、非特異的な変異を軽減できること、また、UGIを組み合わせた場合においても、非特異的な変異を軽減でき、高い効率で標的配列を改変できることを実証した（図９、図１０）。本発明者は、これらの知見に基づいてさらに研究を重ねた結果、本発明を完成するに至った。

　即ち、本発明は以下の通りである。
［１］　二本鎖DNA中の標的ヌクレオチド配列と特異的に結合する核酸配列認識モジュールと、(i)疎水性アミノ酸３残基をC末端に含むペプチド、又は(ii)該アミノ酸残基の少なくとも一部がセリンに置換されたアミノ酸３残基をC末端に含むペプチドからなるタンパク質分解タグとが結合した、複合体。
［２］　前記複合体が、核酸改変酵素がさらに結合した複合体であって、標的化された部位の１以上のヌクレオチドを他の１以上のヌクレオチドに変換し又は欠失させ、あるいは該標的化された部位に１以上のヌクレオチドを挿入する、［１］に記載の複合体。
［３］　前記アミノ酸３残基が、ロイシン-バリン-アラニン、ロイシン-アラニン-アラニン、アラニン-アラニン-バリン又はアラニン－セリン－バリンである、［１］又は［２］に記載の複合体。
［４］　前記核酸配列認識モジュールが、Casの２つのDNA切断能のうちの一方のみ、又は両方のDNA切断能が失活したCRISPR-Casシステムである、［１］～［３］のいずれかに記載の複合体。
［５］　前記複合体が、CRISPR-Casシステムと、タンパク質分解タグとが結合した複合体である、［１］～［３］のいずれかに記載の複合体。
［６］　前記核酸改変酵素が核酸塩基変換酵素又はDNAグリコシラーゼである、［２］～［４］のいずれかに記載の複合体。
［７］　前記核酸塩基変換酵素がデアミナーゼである、［６］に記載の複合体。
［８］　塩基除去修復のインヒビターがさらに結合した、［６］又は［７］に記載の複合体。
［９］　［１］～［８］のいずれかに記載の複合体をコードする核酸。
［１０］　細菌の二本鎖DNAの標的化された部位を改変する、又は該部位の近傍で二本鎖DNAにコードされる遺伝子の発現を調節する方法であって、選択された二本鎖DNA中の標的ヌクレオチド配列と特異的に結合する核酸配列認識モジュールと、(i)疎水性アミノ酸３残基をC末端に含むペプチド、又は(ii)該アミノ酸残基の少なくとも一部がセリンに置換されたアミノ酸３残基をC末端に含むペプチドからなるタンパク質分解タグとが結合した複合体を、該二本鎖DNAと接触させる工程を含む、方法。
［１１］　前記複合体が、核酸改変酵素がさらに結合した複合体であって、該標的化された部位の１以上のヌクレオチドを他の１以上のヌクレオチドに変換する又は欠失させる、あるいは該標的化された部位に１以上のヌクレオチドを挿入する工程を含む、［１０］に記載の方法。
［１２］　前記アミノ酸３残基が、ロイシン-バリン-アラニン、ロイシン-アラニン-アラニン、アラニン-アラニン-バリン又はアラニン－セリン－バリンである、［１０］又は［１１］に記載の方法。
［１３］　前記核酸配列認識モジュールが、Casの２つのDNA切断能のうちの一方のみ、又は両方のDNA切断能が失活したCRISPR-Casシステムである、［１０］～［１２］のいずれかに記載の方法。
［１４］　前記複合体が、CRISPR-Casシステムと、タンパク質分解タグとが結合した複合体である、［１０］～［１２］のいずれかに記載の方法。
［１５］　異なる標的ヌクレオチド配列とそれぞれ特異的に結合する、２種以上の核酸配列認識モジュールを用いることを特徴とする、［１０］～［１４］のいずれかに記載の方法。
［１６］　前記異なる標的ヌクレオチド配列が、異なる遺伝子内に存在する、［１５］に記載の方法。
［１７］　前記核酸改変酵素が核酸塩基変換酵素又はDNAグリコシラーゼである、［１０］～［１３］、［１５］及び［１６］のいずれかに記載の方法。
［１８］　前記核酸塩基変換酵素がデアミナーゼである、［１７］に記載の方法。
［１９］　該複合体が、塩基除去修復のインヒビターがさらに結合したものである、［１７］又は［１８］に記載の方法。
［２０］　二本鎖DNAと複合体との接触が、該二本鎖DNAを有する細菌への、該複合体をコードする核酸の導入により行われる、［１０］～［１９］のいずれかに記載の方法。

　本発明によれば、宿主細菌内でも安定して増幅可能な、毒性の低い核酸（例：ベクター）及びその核酸にコードされるゲノム編集用複合体が提供される。本発明の核酸及び核酸改変酵素を用いたゲノム編集の手法によれば、非特異的な変異等を抑えつつ宿主細菌の遺伝子を改変すること、あるいは、二本鎖DNAにコードされる遺伝子の発現を調節することが可能となる。この手法は、RecAのような宿主依存性因子に依存しないため、広範囲の細菌に適用することができる。

図１は、細菌におけるTarget-AIDシステムの概略を示す。(a)は、Target-AID(dCas9-PmCDA1/sgRNA)塩基編集の図式モデルを示す。dCas9-PmCDA1/sgRNA複合体は、二本鎖DNAに結合して、sgRNA及びPAM依存的様式でRループを形成する。PmCDA1は、PAMの上流15～20塩基内の上側の（非相補的な）鎖に位置するシトシンの脱アミノ化を触媒し、CからTへの変異誘発をもたらす。(b)は、細菌の単一のTarget-AIDプラスミドを示す。このプラスミドは、クロラムフェニコール耐性（Cm^R）遺伝子、温度感受性（ts）λ cIリプレッサー、pSC101複製起点（ori）及びRepA101（ts）を含む。λオペレーターは、cIリプレッサー（ts）が不活性化するにつれて、高温（>37℃）でdCas9-PmCDA1融合体を発現する。sgRNAは、構成的プロモーター J23119によって発現される。dCas9はD10A H840A変異を有するヌクレアーゼ欠損Cas9を示し、PmCDA1はP. marinus（ヤツメウナギ）シトシンデアミナーゼを示す。図２は、大腸菌におけるCas9及びTarget AIDベクターの形質転換効率を示す。galK遺伝子を標的とするsgRNAと共に各改変用タンパク質（Cas9、dCas、Cas9-CDA、nCas-CDA又はdCas-CDA）を発現するプラスミドを用いて大腸菌DH5α株を形質転換し、クロラムフェニコール耐性マーカーで選択した。生存細胞を計数し、形質転換されたプラスミドDNAの量当たりのコロニー形成単位（CFU）として計算した。ドットは3つの独立した実験を表し、ボックスはt検定分析による幾何平均の95％信頼区間を示す。図３は、dCas-CDA でgalK9遺伝子の特定部位に誘発した変異を示す。galK_9を標的とするsgRNAと共にdCas-CDAを発現するDH5α細胞をLB寒天プレート上にスポットし、単一のコロニーを単離した。ランダムに選んだ8個のクローンをシーケンシングし、配列をアラインメントした。翻訳されたアミノ酸配列を、各ヌクレオチド配列の底部に示した。各配列の頻度を、クローン数として示した。ボックス及び反転ボックスはそれぞれ、標的配列及びPAM配列を示す。ORF番号を上部に示した。変異した部位を黒色網掛けで強調し、変異した塩基を太字で強調した。変異したコドンには下線を引いた。図４は、薬剤耐性により評価した変異頻度を示す。(a)は、galK変異誘発及び2-DOG耐性頻度を示す。非標的化sgRNA（ベクター）又はgalK_9を標的とするssRNAと共にdCas-CDAを発現するDH5α細胞を連続希釈し、2-DOGを含む又は含まないM63培地の寒天プレート上にスポットし、コロニーカウントした。(b)は、rpoB変異誘発及びリファンピシン耐性頻度を示す。非標的化sgRNA（ベクター）又はrpoB_1を標的とするssRNAと共にdCas-CDAを発現する細胞を連続希釈し、リファンピシンを含む又は含まないLB寒天プレート上にスポットしコロニーカウントした。薬剤耐性頻度を、非選択のコロニー数に対する薬物耐性コロニー数として算出した。ドットは4つの独立した実験を表し、ボックスはt検定分析による幾何平均の95％信頼区間を示す。図５は、rpoB遺伝子の機能獲得変異誘発を示す。(a)は、dCas-CDAにより誘導されるrpoB変異のシーケンスアライメントを示す。rpoB_1を標的とするsgRNAと共にdCas-CDAを発現するDH5α細胞をLB寒天プレート上にスポットして、単一のコロニーを単離した。ランダムに選んだ8個のクローンをシーケンシングし、配列をアラインメントした。翻訳されたアミノ酸配列を、各ヌクレオチド配列の底部に示した。各配列の頻度を、クローン数として示した。ボックス及び反転ボックスは、標的配列及びPAM配列を示す。ORF番号を上部に示した。変異した部位を黒色網掛けで強調し、変異した塩基及びアミノ酸を太字で強調した。変異したコドンには下線を引いた。(b)は、rpoBを標的として変異誘発した細胞の全ゲノム配列解析の結果を示す。リファンピシンで選択した独立した3つのクローンを全ゲノムシーケンシングに付した。配列カバレージ（Sequence coverage）は、大腸菌 BW25113ゲノム配列の4,631 Mbpに亘ってマッピングした配列の塩基対の合計として計算した。親/可変的変異（Parental/variable Mutation）は、挿入、欠失、一塩基変異体（single nucleotide variant;SNV）及び多重塩基変異体（multiple nucleotide variant;MNV）を含む、50％を超える頻度で検出された変異体から、一般的な親の変異を差し引いた変異体の数で示す。検出された変異は、変異の数（count）、ゲノム遺伝子座（region/gene）、参照ゲノム配列（reference）及び変異対立遺伝子（allele）を示す。バリアントコーリング（variant calling）は、実施例で記載したように行った。(c)は、(b)で列挙した、検出された変異周辺の配列を示す。変異した部位を灰色網掛けで強調し、変異した塩基及びアミノ酸は太字で強調した。図６は、UGI-LVAの有無、並びに異なる長さのsgRNAを用いた場合の変異位置及び頻度を示す。dCas-CDA（左側の白色バー）又はdCas-CDA-UGI-LVA（右側の黒色バー）を用いて20nt長以上の標的配列（galK_8,9,11及び13）を試験し、ディープシーケンシングによって分析した。3つの独立した実験の平均をプロットした。灰色網掛け及び反転したボックスは、それぞれgalK標的配列及びPAMを示す。変異した塩基に下線を付した。図７は、Target-AIDで誘発された変異位置及び頻度に対する標的配列特性の影響を示す。dCas-CDA及び各標的化sgRNAを発現する細胞を、ディープシーケンシングによって分析した。標的配列（長さ20nt又は表示の通り）はgalK ORFの上の（+）又は下の(-）DNA鎖としたが、予想通りにミスセンス（M）又はナンセンス（N）変異が導入されていた。対応するORF番号を示した（Position）。ピークの塩基位置の変異頻度（配列中に灰色網掛けで強調した）を、3回の独立した実験の平均として得た。変異頻度が>50％、10-50％又は<10％のものを、灰色の濃淡により区別した。図８は、変異スペクトル(mutational spectrum)に対する標的の長さの影響を示す。(a)は、gsiA中の様々な長さの標的配列を用いた変異頻度を示す。遠位部位にポリCを含む標的配列を、dCas-CDA-UGI-LVAにより編集し、ディープシーケンシングにより分析した。18nt、20nt、22nt、又は24ntの長さを有するsgRNAの変異スペクトルを、灰色の濃淡で区別した。3つの独立した実験の平均を示した。反転したボックスはPAMを示す。変異した塩基に下線を付した。(b)は、ycbF及びyfiHにおける標的の変異頻度を示す。標的を下の鎖に設定した。18nt、20nt又は22ntの長さを有するsgRNAの変異スペクトルを（a）と同様に示す。(c)は、(a)及び（b）の各sgRNA長についての平均化した変異スペクトルを示す。ピーク位置に番号を付けた。図９は、galK遺伝子における多重変異誘発を示す。(a)は、リファンピシン耐性により評価した非特異的な変異誘発効果を示す。galK_10-galK_11-galK_13標的に対するタンデム-sgRNAユニットと共に各タンパク質（ベクター、dCas、dCas-CDA、dCas-CDA-LVA又はdCas-CDA1-UGI-LVA）を発現する細胞を、リファンピシンを含む、又は含まないLB寒天プレート上にスポットし、非特異的な変異の頻度を評価した。ドットは少なくとも3つの独立した実験を表し、ボックスはt検定分析による幾何平均の95％信頼区間を示す。(b)は、標的領域に誘発されたオンターゲット多重変異頻度を示す。ランダムに選んだ(a)の8つのクローンを、標的とした3つの遺伝子座でシーケンシングし、一重、二重又は三重変異体クローンの頻度を示した。(c及びd)は、変異体のシーケンスアライメントを示す。dCas-CDA-UGI-LVAを用いて、単一の標的（galK_10、galK_11又はgalK_13）(c)又は三重の標的(d)を変異させた。ランダムに選んだ8個のクローンをシーケンシングし、配列をアラインメントした。ボックス及び反転ボックスは、それぞれ標的配列及びPAM配列を示す。変異部位を黒色網掛け及び太字で強調した。図１０は、多重変異誘発を示す。(a)は、多重変異誘発のための2個のプラスミド（dCas-CDA-UGI-LVAを発現する改変用ベクター及び各3個の標的化sgRNAを含む2個のタンデム反復sgRNA-ユニットを含むプラスミド pSBP80608）の模式図を示す。(b)は、標的領域のシーケンスアライメントを示す。ランダムに選んだ8個のクローンをシーケンシングし、各標的領域でアラインメントした。クローン番号を配列の左側に示した。ボックス及び反転ボックスは、標的配列及びPAMを示す。変異した部位及び塩基を黒色網掛け及び太字で強調した。図１１は、複数のコピーのトランスポザーゼ遺伝子の同時破壊を示す。IS1,2,3及び5を、dCas-CDA-UGI-LVAを用いて同時に標的とした。sgRNAを、同じ型のトランスポザーゼの共通配列中に終止コドンを導入するように設計した。DH10B参照ゲノムから増幅することができない配列を除く全ての配列をアライメントした。翻訳されたアミノ酸配列を、各共通配列の上部に示した。各配列のゲノム領域を左側に示した。全ての標的配列を相補鎖上に設計し、対応する領域を相補的なPAM配列（反転）で合わせた。変異した塩基を黒色網掛けで強調した。図１２は、ISで編集された細胞の分離と確認方法を示す。クローンの単離及び配列の確認を段階的に実施した。単離したクローンを、各表の一番上の行に示したように番号を付し、左の列に示したIS部位で配列分析した。遺伝子型は、サンガーシーケンスのスペクトルに基づいて、標的変異を確認（mut）、変異されていない（wt）、又はmutとwtの異種遺伝子型（hetero）と判定した。図１３は、実施例５で用いた酵母発現用ベクター（バックグラウンド：pRS315ベクター）の模式図を示す。図中、Gal1pはGAL1-10 promoterを示す。

１．ゲノム編集用複合体及びそれをコードする核酸
　本発明は、二本鎖DNA中の標的ヌクレオチド配列と特異的に結合する核酸配列認識モジュールと、タンパク質分解タグとが結合したゲノム編集用複合体及び該複合体をコードする核酸を提供する。本発明のゲノム編集用複合体の一態様において、核酸改変酵素がさらに結合した複合体（即ち、核酸配列認識モジュールと、核酸改変酵素と、タンパク質分解タグとが結合した複合体）であって、標的化された部位の核酸を改変し得る複合体を提供する。一態様において、二本鎖DNAの改変効率を向上させるため、該複合体には、塩基除去修復のインヒビターがさらに結合していてもよい。また、本発明のゲノム編集用複合体の別の態様において、核酸配列認識モジュールと、タンパク質分解タグとが少なくとも結合した複合体であって、標的化された部位の近傍で二本鎖DNAにコードされる遺伝子の発現を調節し得る複合体を提供する。一態様において、該複合体には、転写調節因子がさらに結合されていてもよい。以下では、核酸改変酵素、塩基除去修復のインヒビター及び転写調節因子の少なくともいずれかが結合した複合体と、いずれも結合していない複合体とをまとめて、「本発明の複合体」又は「ゲノム編集用複合体」と称することがあり、核酸改変酵素が結合した複合体を、特に「核酸改変酵素複合体」と称することがある。また、これらの複合体をコードする核酸をまとめて、「本発明の核酸」と称することがある。

　本発明の核酸を、DNAを改変する目的ではなく、複製を目的として宿主細菌（例：大腸菌）に導入し、培養した場合に、核酸から意図せずに複合体が発現した際にも、タンパク質分解タグにより速やかに該複合体は分解されるため、宿主細菌に対する毒性が低く抑え得る。実際に、本発明の核酸を、該核酸の複製を目的として宿主細菌に導入した場合に、タンパク質分解タグをコードする核酸を含まないものを導入した場合と比較して、該宿主細菌の形質転換効率が高いことが下述の実施例で示された。従って、タンパク質分解タグをコードする配列を含む本発明の核酸は、細菌以外の宿主（例：真核生物）に対するゲノム編集用の核酸として、細菌内で安定して複製することができる。そのため、細菌以外の宿主でゲノム編集を目的とするベクターに、本発明のタンパク質分解タグをコードする配列を付加することも有用である。

　本発明において、二本鎖DNAの「改変」とは、DNA鎖上のあるヌクレオチド（例えば、dC）が、他のヌクレオチド（例えば、dT、dA又はdG）に変換されるか、欠失すること、あるいはDNA鎖上のあるヌクレオチド間にヌクレオチドもしくはヌクレオチド配列が挿入されることを意味する。ここで、改変される二本鎖DNAは、宿主細胞内に存在する二本鎖DNAであれば特に制限されないが、好ましくはゲノムDNAである。また、二本鎖DNAの「標的化された部位」とは、核酸配列認識モジュールが特異的に認識して結合する「標的ヌクレオチド配列」の全部もしくは一部、又はそれと該標的ヌクレオチド配列の近傍（5’上流及び3’下流のいずれか一方又は両方）を意味する。また、「標的ヌクレオチド配列」とは、二本鎖DNA中の核酸配列認識モジュールが結合する配列を意味する。本発明において、「ゲノム編集」との用語は、二本鎖DNAを改変することだけでなく、標的化された部位の近傍で二本鎖DNAにコードされる遺伝子の発現が促進又は抑制されることも含む意味で用いられる。

　本発明において「核酸配列認識モジュール」とは、DNA鎖上の特定のヌクレオチド配列（即ち、標的ヌクレオチド配列）を特異的に認識して結合する能力を有する分子又は分子複合体を意味する。核酸改変酵素複合体を用いる場合、核酸配列認識モジュールが標的ヌクレオチド配列に結合することにより、該モジュールに連結された核酸改変酵素及び／又は塩基除去修復のインヒビターが、二本鎖DNAの標的化された部位に特異的に作用することを可能にする。

　本発明において「核酸改変酵素」とは、核酸を修飾することで、該修飾により、直接的又は間接的にDNAの改変が生じる酵素を意味し、触媒活性を有する限り、そのペプチド断片であってもよい。このようなDNAの修飾反応としては、核酸分解酵素により触媒される、DNA鎖を切断する反応（以下「DNA鎖切断反応」ともいう）や、核酸塩基変換酵素により触媒される、DNA鎖の切断を直接伴わない反応である、核酸塩基のプリン又はピリミジン環上の置換基を他の基又は原子に変換する反応（以下、「核酸塩基変換反応」ともいう）（例：塩基の脱アミノ化反応）、DNAグリコシラーゼにより触媒される、DNAのN-グリコシド結合を加水分解する反応（以下「脱塩基反応」ともいう）などが挙げられる。下述の実施例で示す通り、核酸塩基変換酵素を含む核酸改変酵素複合体にタンパク質分解タグを付加することで、宿主細菌に対する該複合体の毒性を低減できる。よって、核酸塩基変換酵素のみならず、従来ではその毒性の強さのために細菌に適用することが困難であった、核酸分解酵素を用いたゲノム編集においても、本発明の技術を適用することができる。従って、本発明に用いられる核酸改変酵素としては、核酸分解酵素、核酸塩基変換酵素、DNAグリコシラーゼなどが挙げられる。細胞毒性の軽減の観点からは、核酸塩基変換酵素及びDNAグリコシラーゼが好ましく、これらの酵素を用いることで、標的化された部位において、二本鎖DNAの少なくとも一方の鎖を切断することなく、該標的化された部位を改変することができる。

　本発明において「タンパク質分解タグ」とは、主に疎水性アミノ酸３残基以上を含むペプチドからなり、ゲノム編集用複合体に付加することにより、付加していないものと比較して、タンパク質の半減期が短くなるペプチドを意味する。かかるアミノ酸としては、グリシン、アラニン、バリン、ロイシン、イソロイシン、メチオニン、プロリン、フェニルアラニン、トリプトファンが挙げられ、本発明のタンパク質分解タグは、これらの任意のアミノ酸３残基をC末端に含んでさえいればよく、それ以外の構成は特に制限はされず、該アミノ酸３残基からなるペプチドであってもよい。前記疎水性アミノ酸残基の一部又は全部が、セリン又はスレオニンで置換されたペプチドも、本発明のタンパク質分解タグに包含される。好ましい前記アミノ酸３残基としては、特に制限されないが、大腸菌（エシェリヒア・コリ）及びシュードモナス・プチダで高い効果が認められた（Andersen J.B. et al., Apll. Environ. Microbiol., 64:2240-2246 (1998)）、ロイシン-バリン-アラニン（LVA）、ロイシン-アラニン-アラニン(LAA)、アラニン-アラニン-バリン(AAV)などが挙げられ、セリンを含むものとしては、アラニン-セリン-バリン(ASV)などが挙げられる。また、これらのアミノ酸３残基を含むタンパク質分解タグは、tm RNAタグペプチドのデータベース（例：tmRDB、http://www.ag.auburn.edu/mirror/tmRDB/peptide/peptidephylolist.html）などを参照することができる。具体的には、大腸菌のtmRNA タグペプチドとして知られるYAASV（配列番号３２４）、YALAA（配列番号３２５）、ANDENYALAA（配列番号１８１）及びAANDENYALAA（配列番号１８２）、バチルス属菌のtmRNA タグペプチドとして知られるGKQNNLSLAA（配列番号１８３）、GKSNNNFALAA（配列番号１８４）、GKENNNFALAA（配列番号１８５）、GKTNSFNQNVALAA（配列番号１８６）、GKSNQNLALAA（配列番号１８７）及びGKQNYALAA（配列番号１８８）、シュードモナス属菌のtmRNA タグペプチドとして知られるANDDNYALAA（配列番号１８９）、ANDDQYGAALAA（配列番号１９０）、ANDENYGQEFALAA（配列番号１９１）、ANDETYGDYALAA（配列番号１９２）、ANDETYGEYALAA（配列番号１９３）、ANDETYGEETYALAA（配列番号１９４）、ANDENYGAEYKLAA（配列番号１９５）及びANDENYGAQLAA（配列番号１９６）が、レンサ球菌属菌のtmRNA タグペプチドとして知られるAKNTNSYALAA（配列番号１９７）、AKNTNSYAVAA（配列番号１９８）、AKNNTTYALAA（配列番号１９９）、AKNTNTYALAA（配列番号２００）及びAKNNTSYALAA（配列番号２０１）などが挙げられるが、これらに限定されない。タンパク質分解タグは、典型的には３～１５個のアミノ酸残基からなるが、この範囲に限定されない。一実施態様において、タンパク質分解タグは、３～５個のアミノ酸残基からなる。当業者であれば、宿主細菌の種類等に応じて、適宜タンパク質分解タグを選択することができる。本明細書において、特にことわらない限り、アルファベットの大文字はアミノ酸の１文字標記を示し、アミノ酸配列は左から右に、N末端からC末端の方向に記載する。

　本発明において「ゲノム編集用複合体」とは、上記核酸配列認識モジュールと、タンパク質分解タグとが連結された複合体を含んでなる、特定のヌクレオチド配列認識能が付与された核酸改変活性又は発現調節活性を有する分子複合体を意味し、「核酸改変酵素複合体」とは、上記核酸配列認識モジュールと、核酸改変酵素と、タンパク質分解タグとが連結された複合体を含んでなる、特定のヌクレオチド配列認識能が付与された核酸改変活性を有する分子複合体を意味する。該複合体は、さらに、塩基除去修復のインヒビターが連結されていてもよい。ここで「複合体」は、複数の分子で構成されるものだけでなく、融合タンパク質のように、上記の本発明の複合体を構成する分子を単一の分子内に有するものも包含される。さらに、制限酵素やCRISPR/Casシステムのように、核酸配列認識モジュールと核酸改変酵素が一体となって機能する分子又は分子複合体に、タンパク質分解タグが結合したものも、本発明の複合体に包含される。また、「複合体をコードする」には、複合体を構成する分子それぞれをコードすること、及び構成する分子を単一の分子内に有する融合タンパク質をコードすることの両方が包含される。

　本発明に用いられる核酸分解酵素として、上記反応を触媒し得るものであれば特に制限はなく、例えば、ヌクレアーゼ（例：Casエフェクタータンパク質（例、Cas9、Cpf1）、エンドヌクレアーゼ（例：制限酵素）、エキソヌクレアーゼ等）、リコンビナーゼ、DNAジャイレース、DNAトポイソメラーゼ、トランスポザーゼなどが挙げられる。

　本発明に用いられる核酸塩基変換酵素としては、上記反応を触媒し得るものであれば特に制限はなく、例えば、アミノ基をカルボニル基に変換する脱アミノ化反応を触媒する、核酸／ヌクレオチドデアミナーゼスーパーファミリーに属するデアミナーゼが挙げられる。好ましくは、シトシン又は5-メチルシトシンをそれぞれウラシル又はチミンに変換し得るシチジンデアミナーゼ、アデニンをヒポキサンチンに変換し得るアデノシンデアミナーゼ、グアニンをキサンチンに変換し得るグアノシンデアミナーゼ等が挙げられる。シチジンデアミナーゼとして、より好ましくは、脊椎動物の獲得免疫においてイムノグロブリン遺伝子に変異を導入する酵素である活性化誘導シチジンデアミナーゼ（以下、AIDともいう）などが挙げられる。

　核酸塩基変換酵素の由来は特に制限されないが、例えば、ヤツメウナギ由来のPmCDA1（Petromyzon marinus cytosine deaminase 1）、哺乳動物（例、ヒト、ブタ、ウシ、ウマ、サル等）由来のAID（Activation-induced cytidine deaminase; AICDA）を用いることができる。例えば、PmCDA1のcDNAの塩基配列及びアミノ酸配列は、GenBank accession No. EF094822及びABO15149を、ヒトAIDのcDNAの塩基配列及びアミノ酸配列はGenBank accession No. NM_020661及びNP_065712を、それぞれ参照することができる。酵素活性の観点からは、PmCDA1が好ましい。

　本発明に用いられるDNAグリコシラーゼとしては、上記反応を触媒し得るものであれば特に制限はなく、チミンDNAグリコシラーゼ、オキソグアニングルコシラーゼ、アルキルアデニンDNAグリコシラーゼ（例：酵母3-メチルアデニン-DNAグリコシラーゼ（MAG1）等）などが挙げられる。本発明者らは以前、DNAグリコシラーゼに、ひずみのない二重らせん構造のDNA（unrelaxed DNA）への反応性が十分に低いDNAグリコシラーゼを用いることで、細胞毒性を低減し、効率よく標的配列を改変できることを報告している（国際公開第2016/072399号）。従って、DNAグリコシラーゼとして、ひずみのない二重らせん構造のDNAへの反応性が十分に低いDNAグリコシラーゼを用いることが好ましい。かかるDNAグリコシラーゼとしては、国際公開第2016/072399号に記載された、シトシン-DNAグリコシラーゼ（CDG）活性及び／又はチミン-DNAグリコシラーゼ（TDG）活性を有するUNG（ウラシル-DNAグリコシラーゼ）の変異体、ワクシニアウイルス由来のUDG変異体が挙げられる。

　前記UNGの変異体の具体例としては、酵母UNG1のN222D/L304A二重変異体、N222D/R308E二重変異体、N222D/R308C二重変異体、Y164A/ L304A二重変異体、Y164A/R308E二重変異体、Y164A/R308C二重変異体、Y164G/ L304A二重変異体、Y164G/R308E二重変異体、Y164G/R308C二重変異体、N222D/Y164A/L304A三重変異体、N222D/Y164A/R308E三重変異体、N222D/Y164A/R308C三重変異体、N222D/Y164G/L304A三重変異体、N222D/Y164G/R308E三重変異体、N222D/Y164G/R308C三重変異体などが挙げられる。酵母UNG1に代えて別のUNGを用いる場合は、上記各変異体に対応するアミノ酸に、同様の変異が導入された変異体を用いればよい。ワクシニアウイルス由来のUDG変異体としては、N120D変異体、Y70G変異体、Y70A変異体、N120D/Y70G二重変異体、N120D/Y70A二重変異体などが挙げられる。あるいは、2つの断片に分断されたDNAグリコシラーゼであって、それぞれの断片が2つに分断された核酸配列認識モジュールのいずれか一方と結合して2つの複合体を形成し、両複合体がリフォールディングすると該核酸配列認識モジュールは標的ヌクレオチド配列と特異的に結合することができ、該特異的な結合によって該DNAグリコシラーゼが脱塩基反応を触媒することが可能となるようにデザインされたスプリット酵素であってもよい。スプリット酵素は、例えば、国際公開第2016/072399号、Nat Biotechnol. 33(2): 139-142 (2015)、PNAS 112(10): 2984-2989 (2015)の記載を参酌して設計及び作製することができる。

　本発明において「塩基除去修復」とは、生物が有するDNA修復機構の1つであり、塩基が損傷した部分を酵素によって切り取って再びつなぎ合わせることで、塩基の損傷を修復する機構を意味する。損傷のある塩基の除去は、DNAのN-グリコシド結合を加水分解する酵素であるDNAグリコシラーゼにより行われ、該酵素による脱塩基反応の結果生じた塩基の無い部位(apurinic/apyrimidic (AP) site)は、APエンドヌクレアーゼ、DNAポリメラーゼ、DNAリガーゼ等の塩基除去修復(BER)経路の下流の酵素によって処理される。これらBER経路に関与する遺伝子又はタンパク質として、UNG(NM_003362)、SMUG1(NM_014311)、MBD4(NM_003925)、TDG(NM_003211)、OGG1(NM_002542)、MYH(NM_012222)、NTHL1(NM_002528)、MPG(NM_002434)、NEIL1(NM_024608)、NEIL2(NM_145043)、NEIL3(NM_018248)、APE1(NM_001641)、APE2(NM_014481)、LIG3(NM_013975)、XRCC1(NM_006297)、ADPRT(PARP1)(NM_0016718)、ADPRTL2（PARP2）（NM_005484）などが挙げられるが（括弧内はそれぞれの遺伝子（cDNA）の塩基配列情報が登録されたrefseq番号を示す。）、これらに制限されない。

　本発明において「塩基除去修復のインヒビター」とは、上記BER経路のいずれかの段階を阻害するか、あるいは該BER経路に動員される分子の発現自体を阻害することで、結果的にBERを阻害するタンパク質を意味する。本発明に用いられる塩基除去修復のインヒビターは、結果的にBERを阻害するものであれば特に制限はないが、効率の観点からは、BER経路の上流に位置するDNAグリコシラーゼの阻害剤が好ましい。本発明で用いられるDNAグリコシラーゼの阻害剤としては、チミンDNAグリコシラーゼの阻害剤、ウラシルDNAグリコシラーゼの阻害剤、オキソグアニンDNAグリコシラーゼの阻害剤、アルキルグアニンDNAグリコシラーゼの阻害剤などが挙げられるが、これらに制限されない。例えば、核酸改変酵素としてシチジンデアミナーゼを用いる場合には、変異により生じたDNAのU:G又はG:Uミスマッチの修復を阻害するため、ウラシルDNAグリコシラーゼの阻害剤を使用することが適している。

　そのようなウラシルDNAグリコシラーゼの阻害剤としては、枯草菌（Bacillus subtilis）バクテリオファージであるPBS1由来のウラシルDNAグリコシラーゼ阻害剤(UGI)又は枯草菌バクテリオファージであるPBS2由来のウラシルDNAグリコシラーゼ阻害剤(UGI)が挙げられるが（Wang, Z., and Mosbaugh, D. W. (1988) J. Bacteriol. 170, 1082-1091）、これらに制限されず、上記DNAのミスマッチの修復阻害剤であれば、本発明に用いることができる。特に、PBS2由来のUGIは、DNA上のCからT以外の変異や切断、及び組み換えを起こさせにくくするとの効果も知られていることから、PBS2由来のUGIを使用することが適している。

　上述のように、塩基除去修復（BER）機構において、DNAグリコシラーゼによって塩基が除去されると、APエンドヌクレアーゼが無塩基部位（AP部位）にニックを入れ、さらにエキソヌクレアーゼによってAP部位は完全に除去される。AP部位が除去されると、DNAポリメラーゼが反対鎖の塩基を鋳型に新しく塩基を作り、最後にDNAリガーゼがニックを埋めて修復が完了する。酵素活性を失っているがAP部位への結合能を保持している変異APエンドヌクレアーゼは、競合的にBERを阻害することが知られている。従って、これらの変異APエンドヌクレアーゼも、本発明の塩基除去修復のインヒビターとして用いることができる。変異APエンドヌクレアーゼの由来は特に制限されないが、例えば、大腸菌、酵母、哺乳動物（例、ヒト、マウス、ブタ、ウシ、ウマ、サル等）など由来のAPエンドヌクレアーゼを用いることができる。例えば、ヒトApe1のアミノ酸配列は、UniprotKB No. P27695として参照することができる。酵素活性を失っているがAP部位への結合能を保持している変異APエンドヌクレアーゼの例としては、活性サイトや補因子であるMg結合サイトが変異したタンパク質が挙げられる。例えば、ヒトApe1の場合、E96Q、Y171A、Y171F、Y171H、D210N、D210A、N212A等が挙げられる。

　本発明において「転写調節因子」とは、標的遺伝子の転写を促進する活性、又は抑制する活性を有するタンパク質又はそのドメインを意味し、以下では、転写を促進する活性を有するものを「転写活性化因子」と、転写を抑制する活性を有するものを「転写抑制因子」と称することがある。

　本発明に用いられる転写活性化因子としては、標的遺伝子の転写を促進することができるものであれば特に限定されないが、例えば、HSV（Herpes simplex virus） VP16の活性化ドメイン、NFκBのp65サブユニット、VP64、VP160、HSF、P300及びEBウイルス（Epstein-Barr Virus） RTA、並びにこれらの融合タンパク質などが挙げられる。本発明に用いられる転写抑制因子としては、標的遺伝子の転写を抑制することができるものであれば特に限定されないが、例えば、KRAB、MBD2B、v-ErbA、SID（SIDのコンカテマー（SID4X）を含む）、MBD2、MBD３、DNMTファミリー（例：DNMT1、DNMT3A、DNMT3B）、Rb、MeCP2、ROM2及びAtHD2A、並びにこれらの融合タンパク質などが挙げられる。

　本発明の複合体の核酸配列認識モジュールにより認識される、二本鎖DNA中の標的ヌクレオチド配列は、該モジュールが特異的に結合し得る限り特に制限されず、二本鎖DNA中の任意の配列であってよい。標的ヌクレオチド配列の長さは、核酸配列認識モジュールが特異的に結合するのに十分であればよく、例えば、哺乳動物のゲノムDNA中の特定の部位に変異を導入する場合、そのゲノムサイズに応じて、12ヌクレオチド以上、好ましくは15ヌクレオチド以上、より好ましくは17ヌクレオチド以上である。長さの上限は特に制限されないが、好ましくは25ヌクレオチド以下である。

　本発明の複合体の核酸配列認識モジュールとしては、例えば、Casエフェクタータンパク質の少なくとも１つのDNA切断能が失活したCRISPR-Casシステム（以下「CRISPR-変異Cas」ともいう）、ジンクフィンガーモチーフ、TALエフェクター及びPPRモチーフ等の他、制限酵素、転写調節因子、RNAポリメラーゼ等のDNAと特異的に結合し得るタンパク質のDNA結合ドメインを含むフラグメント等が用いられ得るが、これらに限定されない。核酸改変酵素を用いる場合には、核酸配列認識モジュールと核酸改変酵素が一体となったCRISPR-Casシステム（該システムのCasエフェクタータンパク質は、DNA切断能の両方の活性が維持されている）を用いてもよい。好ましくは、CRISPR-変異Cas、ジンクフィンガーモチーフ、TALエフェクター、PPRモチーフ等が挙げられる。

　ジンクフィンガーモチーフは、Cys2His2型の異なるジンクフィンガーユニット（1フィンガーが約3塩基を認識する）を3～6個連結させたものであり、9～18塩基の標的ヌクレオチド配列を認識することができる。ジンクフィンガーモチーフは、Modular assembly法（Nat Biotechnol (2002) 20: 135-141）、OPEN法（Mol Cell (2008) 31: 294-301）、CoDA法（Nat Methods (2011) 8: 67-69）、大腸菌one-hybrid法（Nat Biotechnol (2008) 26:695-701）等の公知の手法により作製することができる。ジンクフィンガーモチーフの作製の詳細については、特許第4968498号公報を参照することができる。

　TALエフェクターは、約34アミノ酸を単位としたモジュールの繰り返し構造を有しており、1つのモジュールの12及び13番目のアミノ酸残基（RVDと呼ばれる）によって、結合安定性と塩基特異性が決定される。各モジュールは独立性が高いので、モジュールを繋ぎ合わせるだけで、標的ヌクレオチド配列に特異的なTALエフェクターを作製することが可能である。TALエフェクターは、オープンリソースを利用した作製方法（REAL法(Curr Protoc Mol Biol (2012) Chapter 12: Unit 12.15)、FLASH法(Nat Biotechnol (2012) 30: 460-465)、Golden Gate法(Nucleic Acids Res (2011) 39： e82)等）が確立されており、比較的簡便に標的ヌクレオチド配列に対するTALエフェクターを設計することができる。TALエフェクターの作製の詳細については、特表2013-513389号公報を参照することができる。

　PPRモチーフは、35アミノ酸からなり1つの核酸塩基を認識するPPRモチーフの連続によって、特定のヌクレオチド配列を認識するように構成されており、各モチーフの1、4及びii（-2）番目のアミノ酸のみで標的塩基を認識する。モチーフ構成に依存性はなく、両脇のモチーフからの干渉はないので、TALエフェクター同様、PPRモチーフを繋ぎ合わせるだけで、標的ヌクレオチド配列に特異的なPPRタンパク質を作製することが可能である。PPRモチーフの作製の詳細については、特開2013-128413号公報を参照することができる。

　また、制限酵素、転写調節因子、RNAポリメラーゼ等のフラグメントを用いる場合、これらのタンパク質のDNA結合ドメインは周知であるので、例えば、該ドメインを含み、且つDNA二重鎖切断能を有しない断片を容易に設計し、構築することができる。

　核酸改変酵素を用いる場合には、上記いずれかの核酸配列認識モジュールは、上記核酸改変酵素及び／又は塩基除去修復のインヒビターとの融合タンパク質として提供することもできるし、あるいは、SH3ドメイン、PDZドメイン、GKドメイン、GBドメイン等のタンパク質結合ドメインとそれらの結合パートナーとを、核酸配列認識モジュールと、核酸改変酵素及び／又は塩基除去修復のインヒビターとにそれぞれ融合させ、該ドメインとその結合パートナーとの相互作用を介してタンパク質複合体として提供してもよい。あるいは、核酸配列認識モジュールと、核酸改変酵素及び／又は塩基除去修復のインヒビターとにそれぞれインテイン（intein）を融合させ、各タンパク質合成後のライゲーションにより、両者を連結することもできる。タンパク質分解タグは、核酸改変酵素複合体の構成分子（核酸配列認識モジュール、核酸改変酵素及び塩基除去修復のインヒビター）のいずれに結合させてもよく、複数の構成分子に結合させてもよい。転写調節因子を用いる場合にも、上記と同様に、該転写調節因子は、核酸配列認識モジュールとの融合タンパク質として提供してもよく、あるいは上記のタンパク質結合ドメインとそれらの結合パートナーを介して核酸認識モジュールに結合させてもよい。タンパク質分解タグは、上記と同様に、融合タンパク質として結合させてもよく、あるいは上記のタンパク質結合ドメインとそれらの結合パートナーを介してゲノム編集用複合体又はその構成分子に結合させてもよい。また、該タンパク質分解タグは、ゲノム編集用複合体又はその構成分子のC末端に結合していることが好ましい。

　本発明の核酸は、核酸配列認識モジュールと、タンパク質分解タグと、必要に応じて核酸改変酵素及び／若しくは塩基除去修復のインヒビター、又は転写調節因子とが、それらの融合タンパク質をコードする核酸として、あるいは、結合ドメインやインテイン等を利用してタンパク質に翻訳後、宿主細胞内で複合体を形成し得るような形態で、それらをそれぞれコードする核酸として調製することができる。ここで核酸は、DNAであってもRNAであってもよい。DNAの場合は、好ましくは二本鎖DNAであり、宿主細胞内で機能的なプロモーターの制御下に配置した発現ベクターの形態で提供される。RNAの場合は、好ましくは一本鎖RNAである。

　ジンクフィンガーモチーフ、TALエフェクター、PPRモチーフ等の核酸配列認識モジュールをコードするDNAは、各モジュールについて上記したいずれかの方法により取得することができる。制限酵素、転写調節因子、RNAポリメラーゼ等の配列認識モジュールをコードするDNAは、例えば、それらのcDNA配列情報に基づいて、当該タンパク質の所望の部分（DNA結合ドメインを含む部分）をコードする領域をカバーするようにオリゴDNAプライマーを合成し、当該タンパク質を産生する細胞より調製した全RNAもしくはmRNA画分を鋳型として用い、RT-PCR法によって増幅することにより、クローニングすることができる。
　核酸改変酵素及び塩基除去修復のインヒビターをコードするDNAも、同様に、使用する酵素のcDNA配列情報をもとにオリゴDNAプライマーを合成し、当該酵素を産生する細胞より調製した全RNAもしくはmRNA画分を鋳型として用い、RT-PCR法によって増幅することにより、クローニングすることができる。例えば、PBS2由来のUGIをコードするDNAは、NCBI/GenBankデータベースに登録されているDNA配列（accession No. J04434）をもとに、CDSの上流及び下流に対して適当なプライマーを設計し、PBS2由来mRNAからRT-PCR法によりクローニングできる。
　クローン化されたDNAは、そのまま、又は所望により制限酵素で消化するか、適当なリンカー（例、GSリンカー、GGGARリンカー等）、スペーサー（例、FLAG配列等）及び/又は核移行シグナル（NLS）（目的の二本鎖DNAがミトコンドリアや葉緑体DNAの場合は、各オルガネラ移行シグナル）を付加して、タンパク質をコードするDNAを調製することができる。また、さらに核酸配列認識モジュールをコードするDNAとライゲーションして、融合タンパク質をコードするDNAを調製することができる。

　本発明のゲノム編集用複合体をコードするDNAは、化学的にDNA鎖を合成するか、もしくは合成した一部オーバーラップするオリゴDNA短鎖を、PCR法やGibson Assembly法を利用して接続することにより、その全長をコードするDNAを構築することも可能である。化学合成又はPCR法もしくはGibson Assembly法との組み合わせで全長DNAを構築することの利点は、該DNAを導入する宿主に合わせて使用コドンをCDS全長にわたり設計できる点にある。異種DNAの発現に際し、そのDNA配列を宿主生物において使用頻度の高いコドンに変換することで、タンパク質発現量の増大が期待できる。使用する宿主におけるコドン使用頻度のデータは、例えば（公財）かずさDNA研究所のホームページに公開されている遺伝暗号使用頻度データベース（http://www.kazusa.or.jp/codon/index.html）を用いることができ、又は各宿主におけるコドン使用頻度を記した文献を参照してもよい。入手したデータと導入しようとするDNA配列を参照し、該DNA配列に用いられているコドンの中で宿主において使用頻度の低いものを、同一のアミノ酸をコードし使用頻度の高いコドンに変換すればよい。

　本発明の複合体をコードするDNAを含む発現ベクターは、例えば、該DNAを適当な発現ベクター中のプロモーターの下流に連結することにより製造することができる。
　発現ベクターとしては、大腸菌由来のプラスミド（例、pBR322，pBR325，pUC12，pUC13）；枯草菌由来のプラスミド（例、pUB110，pTP5，pC194）；酵母由来プラスミド（例、pSH19，pSH15）；昆虫細胞発現プラスミド（例：pFast-Bac）；動物細胞発現プラスミド（例：pA1-11、pXT1、pRc/CMV、pRc/RSV、pcDNAI/Neo）；λファージなどのバクテリオファージ；バキュロウイルスなどの昆虫ウイルスベクター（例：BmNPV、AcNPV）；レトロウイルス、ワクシニアウイルス、アデノウイルスなどの動物ウイルスベクターなどが用いられる。
　プロモーターとしては、遺伝子の発現に用いる宿主に対応して適切なプロモーターであればいかなるものでもよい。核酸改変酵素として核酸分解酵素を用いる場合には、毒性のために宿主細胞の生存率が著しく低下する場合があるので、誘導プロモーターを使用して誘導開始までに細胞数を増やしておくことが望ましい。一方で、核酸改変酵素として核酸塩基変換酵素及びDNAグリコシラーゼを用いる場合、あるいは核酸改変酵素を用いない場合には、本発明の複合体を発現させても十分な細胞増殖が得られるので、構成プロモーターも制限なく使用することができる。
　例えば、宿主が動物細胞である場合、SRαプロモーター、SV40プロモーター、LTRプロモーター、CMV（サイトメガロウイルス）プロモーター、RSV（ラウス肉腫ウイルス）プロモーター、MoMuLV（モロニーマウス白血病ウイルス）LTR、HSV-TK（単純ヘルペスウイルスチミジンキナーゼ）プロモーターなどが用いられる。なかでも、CMVプロモーター、SRαプロモーターなどが好ましい。
　宿主が大腸菌である場合、J23シリーズのプロモーター(例：J23119プロモーター)、trpプロモーター、lacプロモーター、recAプロモーター、λP_Lプロモーター、lppプロモーター、T7プロモーターなどが好ましい。
　宿主がバチルス属菌である場合、SPO1プロモーター、SPO2プロモーター、penPプロモーターなどが好ましい。
　宿主が酵母である場合、Gal1/10プロモーター、PHO5プロモーター、PGKプロモーター、GAPプロモーター、ADHプロモーターなどが好ましい。
　宿主が昆虫細胞である場合、ポリヘドリンプロモーター、P10プロモーターなどが好ましい。
　宿主が植物細胞である場合、CaMV35Sプロモーター、CaMV19Sプロモーター、NOSプロモーターなどが好ましい。

　発現ベクターとしては、上記の他に、所望によりエンハンサー、スプライシングシグナル、ターミネーター、ポリＡ付加シグナル、薬剤耐性遺伝子、栄養要求性相補遺伝子等の選択マーカー、複製起点などを含有しているものを用いることができる。

　本発明の複合体をコードするRNAは、例えば、それぞれのタンパク質をコードするDNAを含むベクターを鋳型として、自体公知のインビトロ転写系にてmRNAに転写することにより調製することができる。

　本発明の核酸を複製するために用いる宿主細菌として、tmRNA (ssrA)を用いたタンパク質分解システムを持つ細菌であれば特に制限はないが、例えば、エシェリヒア属菌、バチルス属菌、シュードモナス属菌（例：シュードモナス・プチダ）、レンサ球菌属菌（例：レンサ球菌）、ストレプトマイセス属菌、ブドウ球属菌、エルシニア属菌、アシネトバクター属菌、クレブシエラ属菌、ボルデテラ属菌、ラクトコッカス属菌、ナイセリア属菌、エロモナス属菌、フランシエセラ属菌、コリネバクテリウム属菌、シトロバクター属菌、クラミジア属菌、ヘモフィルス属菌、ブルセラ属菌、マイコバクテリウム属菌、レジオネラ属菌、ロドコッカス属菌、シュードモナス属菌、ヘリコバクター属菌、サルモネラ属菌、スタフィロコッカス属菌、ビブリオ属菌、及びエリシペロスリクス属菌などが用いられる。
　エシェリヒア属菌としては、例えば、エシェリヒア・コリ（Escherichia coli）K12・DH1〔Proc. Natl. Acad. Sci. USA，60，160 (1968)〕，エシェリヒア・コリJM103〔Nucleic Acids Research，9，309 (1981)〕，エシェリヒア・コリJA221〔Journal of Molecular Biology，120，517 (1978)〕，エシェリヒア・コリHB101〔Journal of Molecular Biology，41，459 (1969)〕，エシェリヒア・コリC600〔Genetics，39，440 (1954)〕、エシェリヒア・コリDH5α、エシェリヒア・コリBW25113などが用いられる。
　バチルス属菌としては、例えば、バチルス・サブチルス（Bacillus subtilis）MI114〔Gene，24，255 (1983)〕，バチルス・サブチルス207-21〔Journal of Biochemistry，95，87 (1984)〕などが用いられる。

　核酸改変酵素として核酸塩基変換酵素又はDNAグリコシラーゼを用いる場合、核酸改変酵素及び／又は塩基除去修復のインヒビターは、上記ジンクフィンガー等との連結様式と同様の手法により、変異Casとの複合体として提供される。あるいは、核酸塩基変換酵素及び／又は塩基除去修復のインヒビターと変異Casとを、RNA aptamerであるMS2F6、PP7等とそれらとの結合タンパク質によるRNA scaffoldを利用して結合させることも出来る。ガイドRNAが標的ヌクレオチド配列と相補鎖を形成し、これに続くtracrRNAに変異CasがリクルートされてDNA切断部位認識配列PAM（プロトスペーサーアジェイセントモチーフ）（SpCas9を用いた場合、PAMはNGG（Nは任意の塩基）3塩基であり、理論上ゲノム上のどこでも標的化することができる）を認識するが、一方あるいは両方のDNAを切断することができず、変異Casに連結された核酸塩基変換酵素又はDNAグリコシラーゼの作用により、標的された部位（標的ヌクレオチド配列の全部もしくは一部を含む数百塩基の範囲内で適宜調節できる）で核酸塩基変換又は脱塩基が起こり、二本鎖DNA内にミスマッチ（例えば、PmCDA1やAIDなどのシチジンデアミナーゼを核酸塩基変換酵素として用いた場合、標的化された部位のセンス鎖もしくはアンチセンス鎖上のシトシンがウラシルに変換され、U:GもしくはG:Uミスマッチを生じる）又は無塩基部位（AP部位）が生じる。これを修復しようとする細胞のBER系のエラーにより、種々の変異が導入される。例えば、ミスマッチ又は無塩基が正しく修復されずに、反対鎖の塩基が、変換した鎖の塩基と対形成するように修復されたり（上記の例では、T-AもしくはA-T）、修復の際にさらに他のヌクレオチドに置換（例えば、U→A、G）、あるいは1ないし数十塩基の欠失もしくは挿入を生じることにより、種々の変異が導入される。塩基除去修復のインヒビターを併用することにより、細胞内のBER機構が阻害され、修復ミスの頻度が上がり、変異導入効率を向上させることができる。

　ジンクフィンガーモチーフは、標的ヌクレオチド配列に特異的に結合するジンクフィンガーの作製効率が高くなく、また、結合特異性の高いジンクフィンガーの選別が煩雑なため、実際に機能するジンクフィンガーモチーフを多数作製するのは容易ではない。TALエフェクターやPPRモチーフは、ジンクフィンガーモチーフに比べて標的核酸配列認識の自由度が高いが、標的ヌクレオチド配列に応じて巨大なタンパク質をその都度設計し、構築する必要があるので、効率面で問題が残る。
　これに対し、CRISPR-Casシステムは、標的ヌクレオチド配列に対して相補的なガイドRNAにより目的の二本鎖DNAの配列を認識するので、標的ヌクレオチド配列と特異的にハイブリッド形成し得るオリゴDNAを合成するだけで、任意の配列を標的化することができる。
　従って、本発明のより好ましい実施態様においては、核酸配列認識モジュールとして、DNA切断能の両方の活性が維持されたCRISPR-Casシステム、あるいはCasの１つのみ、又は両方のDNA切断能が失活したCRISPR-Casシステム（CRISPR-変異Cas）が用いられる。

　CRISPR-変異Casを用いた本発明の核酸配列認識モジュールは、標的ヌクレオチド配列と相補的な配列を含むCRISPR-RNA（crRNA）と、必要に応じて変異Casエフェクタータンパク質のリクルートに必要なtrans-activating RNA（tracrRNA）と（tracrRNAが必要な場合は、crRNAとのキメラRNAとして提供され得る）、変異Casエフェクタータンパク質との複合体として提供される。変異Casエフェクタータンパク質と組み合わせて核酸配列認識モジュールを構成する、crRNA単独あるいはcrRNAとtracrRNAとのキメラRNAからなるRNA分子を「ガイドRNA」と総称する。変異を導入していないCRISPR/Casシステムを用いる場合も同様である。

　本発明で使用されるCasエフェクタータンパク質は、ガイドRNAと複合体を形成して、目的遺伝子中の標的ヌクレオチド配列とそれに隣接するprotospacer adjacent motif（PAM）を認識し結合し得る限り、特に制限はないが、好ましくはCas9又はCpf1である。Cas9としては、例えばストレプトコッカス・ピオゲネス（Streptococcus pyogenes）由来のCas9（SpCas9; PAM配列NGG(NはA、G、T又はC。以下同じ)）、ストレプトコッカス・サーモフィラス（Streptococcus thermophilus）由来のCas9（StCas9; PAM配列NNAGAAW）、ナイセリア・メニンギチジス（Neisseria meningitidis）由来のCas9（NmCas9; PAM配列NNNNGATT）等が挙げられるが、それらに限定されない。好ましくはPAMによる制約が少ないSpCas9である（実質2塩基であり、理論上ゲノム上のほぼどこでも標的化することができる）。また、Cpf1としては、例えば、フランシセラ・ノヴィシダ（Francisella novicida）由来のCpf1（FnCpf1; PAM配列NTT）、アシダミノコッカス sp.（Acidaminococcus sp.）由来のCpf1（AsCpf1;PAM配列NTTT）、ラクノスピラ科細菌（Lachnospiraceae bacterium）由来のCpf1（LbCpf1; PAM配列NTTT）等が挙げられるが、それらに限定されない。本発明で用いられる変異Casエフェクタータンパク質（変異Casと略記する場合がある）としては、Casエフェクタータンパク質の二本鎖DNAの両方の鎖の切断能が失活したものと、一方の鎖の切断能のみを失活したニッカーゼ活性を有するものの、いずれも使用可能である。例えば、SpCas9の場合、10番目のAsp残基がAla残基に変換した、ガイドRNAと相補鎖を形成する鎖の反対鎖の切断能を欠く（従って、ガイドRNAと相補鎖を形成する鎖に対するニッカーゼ活性を有する）D10A変異体、あるいは、840番目のHis残基がAla残基で変換した、ガイドRNAと相補鎖を形成する鎖の切断能を欠く（従って、ガイドRNAと相補鎖を形成する鎖の反対鎖に対するニッカーゼ活性を有する）H840A変異体、さらにはその二重変異体（dCas9）を用いることができる。また、FnCpf1の場合、917番目のAsp残基がAla残基（D917A）に、あるいは1006番目のGlu残基がAla残基（E1006A）に変換した、両方の鎖の切断能を欠く変異体を用いることができる。二本鎖DNAの少なくとも一方の鎖の切断能を欠く限り、他の変異Casも同様に用いることができる。

　Casエフェクタータンパク質（変異Casを含む、以下同様）をコードするDNAは、塩基除去修復のインヒビターをコードするDNAについて上記したのと同様の方法により、該酵素を産生する細胞からクローニングすることができる。また、変異Casは、クローン化されたCasをコードするDNAに、自体公知の部位特異的変異誘発法を用いて、DNA切断活性に重要な部位のアミノ酸残基（例えば、SpCas9の場合、10番目のAsp残基や840番目のHis残基、FnCpf1の場合、917番目のAsp残基や1006番目のGlu残基等が挙げられるが、これらに限定されない）を他のアミノ酸で変換するように変異を導入することにより、取得することができる。
　あるいはCasエフェクタータンパク質をコードするDNAは、核酸配列認識モジュールをコードするDNAやDNAグリコシラーゼをコードするDNAについて上記したのと同様の方法により、化学合成又はPCR法もしくはGibson Assembly法との組み合わせで、用いる宿主細胞での発現に適したコドン使用を有するDNAとして構築することもできる。

　得られたCasエフェクタータンパク質、核酸改変酵素、塩基除去修復のインヒビター、及び／又は転写調節因子をコードするDNAは、標的細胞に応じて、上記と同様の発現ベクターのプロモーターの下流に挿入することができる。

　一方、ガイドRNAをコードするDNAは、標的ヌクレオチド配列に対して相補的なヌクレオチド配列（本明細書中、「ターゲッティング配列（targeting sequence）」ともいう）を含む、crRNA配列（例えば、Casエフェクタータンパク質としてFnCpf1をリクルートする場合、ターゲッティング配列の5’側に配列番号１９；AAUUUCUACUGUUGUAGAU を含むcrRNAを用いることができ、下線部の配列同士が塩基対を形成しステム-ループ構造をとる）のコード配列、あるいは、crRNAコード配列と必要に応じて既知のtracrRNAコード配列（例えば、Casエフェクタータンパク質としてCas9をリクルートする場合のtracrRNAコード配列として、gttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt; 配列番号１８）とを連結したオリゴDNA配列を設計し、DNA/RNA合成機を用いて、化学的に合成することができる。
　ここで「標的鎖」とは、標的ヌクレオチド配列のcrRNAとハイブリッド形成する方の鎖を意味し、その反対鎖で標的鎖とcrRNAとのハイブリッド形成により一本鎖状になる鎖を「非標的鎖（non-targeted strand）」と呼ぶこととする。また、核酸塩基変換反応は通常、一本鎖状になった非標的鎖上で起こる場合が多いと推定されるので、標的ヌクレオチド配列を片方の鎖で表現する場合（例えばPAM配列を表記する場合や、標的ヌクレオチド配列とPAMとの位置関係を表す場合等）、非標的鎖の配列で代表させるものとする。

　ターゲッティング配列の長さは、標的ヌクレオチド配列に対して特異的に結合し得る限り特に制限はないが、例えば15～30ヌクレオチド、好ましくは18～25ヌクレオチドである。標的ヌクレオチド配列の選択は、該配列の3’側（Cas9の場合）もしくは5’側（Cpf1の場合）に隣接するPAMの存在により制限されるが、後述の実施例で実証された知見によれば、CRISPR-変異Cas9とシチジンデアミナーゼとを組み合わせた本発明のシステムにおいては、標的ヌクレオチド配列が長くなるにつれて、置換され易いCは5'末端方向へシフトするという規則性があるので、標的ヌクレオチド配列（その相補鎖であるターゲッティング配列）の長さを適宜選択することにより、変異を導入できる塩基の部位をシフトさせることができる。これにより、PAM（SpCas9においてはNGG）による制約を少なくとも部分的に解除することができ、変異導入の自由度がさらに高くなる。

　ターゲッティング配列の設計は、例えば、Casエフェクタータンパク質としてCas9を用いる場合、公開のガイドRNA設計ウェブサイト（CRISPR Design Tool、CRISPRdirect等）を用いて、目的遺伝子のCDS配列の中からPAM（例えば、SpCas9の場合、NGG）を3’側に隣接する20mer配列をリストアップし、その5’端から3’方向に7ヌクレオチド以内のCをTに変換した場合に、目的遺伝子がコードするタンパク質にアミノ酸変化を生じるような配列を選択することにより行うことができる。また、20mer以外のターゲッティング配列の長さを用いる場合にも、適宜配列を選択することができる。これらの候補の中から、目的の宿主ゲノム中のオフターゲットサイト数が少ない候補配列をターゲッティング配列として用いることができる。使用するガイドRNA設計ソフトウェアに宿主ゲノムのオフターゲットサイトを検索する機能がない場合、例えば、候補配列の3’側の8～12ヌクレオチド（標的ヌクレオチド配列の識別能の高いseed配列）について、宿主ゲノムに対してBlast検索をかけることにより、オフターゲットサイトを検索することができる。

　ガイドRNAをコードするDNAも、上記と同様の発現ベクターに挿入することができるが、プロモーターとしては、pol III系のプロモーター（例、SNR6、SNR52、SCR1、RPR1、U3、U6、H1プロモーター等）及びターミネーター（例、ポリT配列（T₆配列等））を用いることが好ましい。

　ガイドRNA（crRNA又はcrRNA-tracrRNAキメラ）をコードするDNAは、標的ヌクレオチド配列の標的鎖に対して相補的な配列と、既知のtracrRNA配列（Cas9をリクルートする場合）又はcrRNAのダイレクトリピート配列（Cpf1をリクルートする場合）とを連結したオリゴRNA配列を設計し、DNA/RNA合成機を用いて、化学的に合成することができる。

２．宿主細菌の二本鎖DNAの標的化された部位の改変方法
　１．に記載した本発明の複合体や核酸を、宿主、特に細菌に導入し、当該宿主を培養することによって、宿主の二本鎖DNAの標的化された部位を改変する、あるいは標的化された部位の近傍で二本鎖DNAにコードされる遺伝子の発現を調節することができる。従って、別の実施態様において、核酸改変酵素複合体を、宿主細菌の二本鎖DNAと接触させ、標的化された部位の１以上のヌクレオチドを他の１以上のヌクレオチドに変換する又は欠失させる、あるいは該標的化された部位に１以上のヌクレオチドを挿入する工程を含む、細菌の二本鎖DNAの標的化された部位を改変する方法（以下「本発明の改変方法」ともいう）が提供される。核酸改変酵素として核酸塩基変換酵素又はDNAグリコシラーゼを用いることで、標的化された部位において、二本鎖DNAの少なくとも一方の鎖を切断することなく、該標的化された部位を改変することができる。また、さらに別の実施態様において、本発明の複合体を、宿主細菌の二本鎖DNAと接触させ、標的化された部位の近傍に位置する遺伝子の転写を調節する方法が提供される。

　本発明の複合体と、二本鎖DNAとの接触は、目的の二本鎖DNA（例、ゲノムDNA）を有する細菌に、該複合体又はそれをコードする核酸を導入することにより実施される。導入及び発現効率を考慮すると、ゲノム編集用複合体自体としてよりも、それをコードする核酸の形態で細菌に導入し、細菌内で該複合体を発現させることが望ましい。

　本発明の改変方法に用いる細菌として、１．の核酸複製のために用いられる細菌と同様のものが挙げられる。

　発現ベクターの導入は、細菌の種類に応じ、公知の方法（例えば、リゾチーム法、コンピテント法、PEG法、CaCl₂共沈殿法、エレクトロポレーション法、マイクロインジェクション法、パーティクルガン法、リポフェクション法、アグロバクテリウム法など）に従って実施することができる。
　大腸菌は、例えば、Proc. Natl. Acad. Sci. USA，69，2110 (1972)やGene，17，107 (1982)などに記載の方法に従って形質転換することができる。
　バチルス属菌は、例えば、Molecular ＆ General Genetics，168，111 (1979)などに記載の方法に従ってベクター導入することができる。

　ベクターを導入した細菌の培養は、細菌の種類に応じ、公知の方法に従って実施することができる。

　例えば、大腸菌又はバチルス属菌を培養する場合、培養に使用される培地としては液体培地が好ましい。また、培地は、形質転換体の生育に必要な炭素源、窒素源、無機物などを含有することが好ましい。ここで、炭素源としては、例えば、グルコース、デキストリン、可溶性澱粉、ショ糖などが；窒素源としては、例えば、アンモニウム塩類、硝酸塩類、コーンスチープ・リカー、ペプトン、カゼイン、肉エキス、大豆粕、バレイショ抽出液などの無機又は有機物質が；無機物としては、例えば、塩化カルシウム、リン酸二水素ナトリウム、塩化マグネシウムなどがそれぞれ挙げられる。また、培地には、酵母エキス、ビタミン類、生長促進因子などを添加してもよい。培地のpHは、好ましくは約5～約8である。

　大腸菌を培養する場合の培地としては、例えば、グルコース、カザミノ酸を含むM9培地〔Journal of Experiments in Molecular Genetics, 431-433, Cold Spring Harbor Laboratory, New York 1972〕が好ましい。必要により、プロモーターを効率よく働かせるために、例えば、3β-インドリルアクリル酸のような薬剤を培地に添加してもよい。大腸菌の培養は、通常約15～約43℃で行なわれる。必要により、通気や撹拌を行ってもよい。
　バチルス属菌の培養は、通常約30～約40℃で行なわれる。必要により、通気や撹拌を行ってもよい。
　また、本発明者らは、核酸改変酵素としてPmCDA1を用いる場合に、動物細胞や植物細胞を通常よりも低温（例えば、20～26℃、好ましくは、約25℃）で培養することにより、変異導入効率を上昇させることを確認しており、細菌を培養する場合も、上記低温で培養することも好ましい。

　本発明の複合体をコードするRNAの宿主細菌への導入は、マイクロインジェクション法、リポフェクション法等により行うことができる。RNA導入は1回もしくは適当な間隔をおいて複数回（例えば、2～5回）繰り返して行うことができる。

　本発明者らはまた、近接する複数の標的ヌクレオチド配列に対して配列認識モジュールを作製し、同時に用いることにより、単独のヌクレオチド配列を標的とするよりも、変異導入効率が大幅に上昇することを、出芽酵母を用いて確認しており、細菌においても同様の効果が期待できる。その効果は、両標的ヌクレオチド配列の一部が重複するような場合から、両者が600bp程度離れている場合でも同様に変異誘導が実現する。また、標的ヌクレオチド配列が同じ方向（標的鎖が同一鎖）である場合と、対向する（二本鎖DNAの両方の鎖が標的鎖となる）場合のどちらでも起こり得る。

　好ましい実施態様において、本発明の方法により、細菌のゲノムDNAにおいて、６箇所同時に変異を導入できることを実証しており（図１０）、変異導入効率が極めて高い。よって、本発明のゲノム配列の改変方法、又は標的遺伝子の発現調節方法においては、全く異なる位置の複数のDNA領域を標的として改変すること、又は複数の標的遺伝子の発現調節が可能である。従って、本発明の好ましい一実施態様においては、異なる標的ヌクレオチド配列（１つの目的遺伝子内であってもよいし、異なる２以上の目的遺伝子内にあってもよい。これらの目的遺伝子は同一染色体又はプラスミド上にあってもよいし、別個の染色体又はプラスミド上に位置していてもよい。）とそれぞれ特異的に結合する、２種以上の核酸配列認識モジュールを用いることができる。この場合、これらの核酸配列認識モジュールの各々１つと、核酸改変酵素及び／若しくは塩基除去修復のインヒビター、又は転写調節因子とが、タンパク質分解タグが付加された複合体を形成する。ここで、核酸改変酵素、塩基除去修復のインヒビター及び転写調節因子は共通のものを使用することができる。例えば、核酸配列認識モジュールとしてCRISPR-Casシステムを用いる場合、Casエフェクタータンパク質と、核酸改変酵素及び／若しくは塩基除去修復のインヒビター、又は転写調節因子との複合体（融合タンパク質を含む）は共通のものを用い、ガイドRNA-tracrRNAとして、異なる標的ヌクレオチド配列とそれぞれ相補鎖を形成する2以上のガイドRNAの各々と、tracrRNAとのキメラRNAを２種以上作製して用いることができる。一方、核酸配列認識モジュールとしてジンクフィンガーモチーフやTALエフェクターなどを用いる場合には、例えば、異なる標的ヌクレオチドと特異的に結合する各核酸配列認識モジュールに、核酸改変酵素及び／若しくは塩基除去修復のインヒビター、又は転写調節因子を融合させることができる。

　本発明の複合体を宿主細菌内で発現させるためには、上述のように該複合体をコードするDNAを含む発現ベクターを宿主細菌に導入するが、効率よく変異を導入するため、又は十分に標的遺伝子の発現に調節するためには、一定期間以上、一定レベル以上のゲノム編集用複合体の発現が維持されるのが望ましい。かかる観点からは、該発現ベクターが宿主ゲノムに組み込まれることが確実であるが、ゲノム編集用複合体の持続的発現はオフターゲット切断のリスクを増大させるので、首尾よく変異導入が達成された後は、速やかに除去されることが好ましい。宿主ゲノムに組み込まれたDNAを除去するための手段としては、Cre-loxP系を用いる方法やトランスポゾンを用いる方法等が挙げられる。

　あるいは、所望の時期に核酸反応が起こり、標的化された部位の改変が固定されるのに必要な期間だけ、一過的に本発明の複合体を宿主細菌内で発現させることにより、オフターゲット切断のリスクを回避しつつ宿主ゲノムの編集を効率よく実現することができる。核酸改変反応が起こり、標的化された部位の改変が固定されるのに必要な期間は、宿主細菌の種類や培養条件等によっても異なるが、少なくとも数世代の細胞分裂を経る必要があるため、2-3日程度は必要であると考えられる。当業者は、使用する培養条件等に基づいて、好適な発現誘導期間を適宜決定することができる。本発明の複合体をコードする核酸の発現誘導期間は、宿主細菌に副作用を生じさせない範囲で、上記「標的された部位の改変が固定されるのに必要な期間」を超えて延長されてもよい。

　本発明の複合体を、所望の時期に所望の期間、一過的に発現させる手段としては、該複合体をコードする核酸（変異CRISPR-Casシステムにおいては、ガイドRNAをコードするDNAと、Casエフェクタータンパク質をコードするDNAと、必要に応じて核酸改変酵素及び／若しくは塩基除去修復のインヒビター、又は転写調節因子をコードするDNA）を、発現期間を制御可能な形態で含むコンストラクト（発現ベクター）を作製し、宿主内に導入する方法が挙げられる。「発現期間を制御可能な形態」としては、具体的には、本発明の複合体をコードする核酸を、誘導性の調節領域の制御下においたものが挙げられる。「誘導性の調節領域」は特に制限されないが、例えば、温度感受性（ts）変異リプレッサーとこれに制御されるオペレーターとのオペロンが挙げられる。ts変異リプレッサーとしては、例えばλファージ由来のcIリプレッサーのts変異体が挙げられるが、これに限定されない。λファージcIリプレッサー(ts)の場合、30℃以下（例、28℃）ではオペレーターに結合して下流の遺伝子発現を抑制しているが、37℃以上（例、42℃）の高温ではオペレーターから解離するために、遺伝子発現が誘導される。従って、本発明の複合体をコードする核酸を導入した宿主細菌を、通常は30℃以下で培養し、適切な時期に温度を37℃以上に上げて一定期間培養して、核酸変換反応を行わせ、標的遺伝子に変異が導入された後は、速やかに30℃以下に戻すことにより、標的遺伝子の発現が抑制される期間を最短にすることができ、宿主細胞にとって必須遺伝子を標的化する場合でも、副作用を押さえつつ効率よく編集することができる。
　温度感受性変異を利用する場合、例えば、ベクターの自律複製に必要なタンパク質の温度感受性変異体を、本発明の複合体をコードするDNAを含むベクターに搭載することにより、該複合体の発現後、速やかに自律複製が出来なくなり、細胞分裂に伴って該ベクターは自然に脱落する。このような温度感受性変異タンパク質としては、pSC101 oriの複製に必要なRep101 oriの温度感受性変異体が挙げられるが、これに限定されない。Rep101 ori (ts)は30℃以下（例、28℃）では、pSC101 oriに作用してプラスミドの自律複製を可能にするが、37℃以上（例、42℃）になると機能を失い、プラスミドは自律複製できなくなる。従って、上記λファージのcIリプレッサー(ts)と併用することで、本発明の複合体の一過的発現と、プラスミド除去とを、同時に行うことができる。

　また、本発明の複合体をコードするDNAを、誘導プロモーター（例：lacプロモーター（IPTGで誘導）、cspAプロモーター（コールドショックで誘導）、araBADプロモーター（アラビノースで誘導）等）の制御下において宿主細菌内に導入し、適切な時期に培地に誘導物質を添加（又は培地から除去）して該複合体の発現を誘導し、一定期間培養して、核酸改変反応等を行わせ、標的遺伝子に変異が導入された後に発現誘導を停止することで、該複合体の一過的発現を実現することができる。

　以下に、本発明を実施例により説明する。ただし、本発明はこれらの実施例に限定されるものではない。

　後述の実施例では、以下のようにして実験を行った。
＜菌株、プラスミド、プライマー及び標的化gRNAデザイン＞
　大腸菌株DH5α（(F^- endA1 supE44 thi-1 recA1 relA1 gyrA96 deoR phoA Φ80dlacZ ΔM15 Δ(lacZYA-argF)U169, hsdR17 (rK^-, mK⁺), λ^-)（TaKaRa-Bio）、BW25113（lacI⁺rrnB_T14 ΔlacZ_WJ16hsdR514 ΔaraBAD_AH33 ΔrhaBAD_LD78 rph-1 Δ(araB-D)567 Δ(rhaD-B)568ΔlacZ4787(::rrnB-3) hsdR514 rph-1）及びTop10(F- mcrA Δ(mrr-hsdRMS-mcrBC) φ80lacZΔM15 ΔlacX74 nupG recA1 araD139 Δ(ara-leu)7697 galE15 galK16 rpsL(Str^R) endA1 λ^-)（Invitrogen）を使用した。実施例で用いたプラスミド及びプライマーを、それぞれ表１及び表２に挙げた。標的化gRNAベクターを構築するためのオリゴDNAのペアを、次のように設計した：5'-tagc-（標的配列）-3 '及び5'-aaac-（標的配列の逆相補的配列）-3'。

＜プラスミド構築＞
　pCas9及びpCRISPRプラスミドを、Addgeneを介して、Marraffini研究室(非特許文献８)から入手した。Nickase Cas9：nCas9（D10A又はH840A）及びヌクレアーゼ欠損Cas9：dCas9（D10A及びH840A）（配列番号１及び２）（Jinek, M. et al., Science 337, 816-822 (2012).）をPCR法により作製した。 PmCDA1（配列番号３及び４）は、121アミノ酸のペプチドリンカー（配列番号５及び６）を用いて、nCas9又はdCas9のC末端に融合した（図１）。

　人工の構成的プロモーター J23119（BBa_J23119 in the registry for standard biological parts）（http://parts.igem.org/Part:BBa_J23119）（配列番号１６）により駆動されるsgRNAユニット（配列番号１５）を保有するプラスミドpScI_dCas9-PmCDA1_J23119-sgRNAを、プライマーp346/p426を用いたPCRにより増幅した。sgRNA発現ユニットは、標的配列を挿入するための2箇所のBsaI制限酵素部位を含む。標的sgRNA配列を含む一対のオリゴDNAをアニールし、BsaIで消化したpScI_dCas9-PmCDA1_sgRNAに連結した。

　pScI及びpScI_dCas9はそれぞれ、λオペレーターのみ、及びオペレーター-dCas9を保有する。pScI_dCas9-PmCDA1はdCas9-PmCDA1遺伝子を保有する。dCas9-PmCDA1遺伝子のC末端に分解タグ（LVAタグ）及びUGI遺伝子を付加し、それぞれプラスミドpScI_dCas9-PmCDA1-LVA及びpScI_dCas9-PmCDA1-UGI-LVAを得た。

　ベクタープラスミドpTAKN-2は、pSC101に対応するpMB1複製起点を有する。プロモーターJ23119を有するsgRNAユニットを、EcoRI-HindIIIを用いて合成オリゴヌクレオチドから切り出し、クローニングベクターのpTAKN2にライゲーションした。BsaI消化-ライゲーションを用いたPCR産物のゴールデンゲートアセンブリにより(Engler, C. et al., PLoS One 4, (2009).)、タンデムな３個の標的配列（pSBP804, galK_10-galK_11-gal_13; pSBP806, galK_2-xylB_1-manA_1; pSBP808, pta_1-adhE_3-tpiA_2）を有するプラスミドを構築した。プライマーp597/598により、pSBP808（pta_1-adhE_3-tpiA_2 tandem-sequence）から増幅したPCR産物、及びプライマーp599/p600により、pSBP806 (vector and galK_2-xylB_1-manA_1 tandem-sequence)から増幅したPCR産物のギブソンアセンブリを用いて、異なる6個の標的配列を有するプラスミド（pSBP80608）を構築した。IS編集プラスミドについては、sgRNA発現ユニットをIS1、IS2、IS3及びIS5の順にタンデムに並べた。

＜変異誘発アッセイ＞
　目的のプラスミドで化学的に形質転換したDH5α又はBW25113細胞を、1 mLのSOC培地（2％ Bacto Tryptone、0.5％酵母エキス、10 mM NaCl、2.5mM KCl、1 mM MgSO₄及び20 mMグルコース）で前培養した。28℃で2～3時間インキュベートした後、細胞培養物を1 mlのルリア－ベルターニ(LB)培地又はterrific broth（TB）で1:10希釈し、必要に応じて抗生物質（クロラムフェニコール（25 μg/ml）及び/又はカナマイシン（30 μg/ml））を補充した。マキシマイザ(TAITEC)を用いて、28℃、100K rpmで一晩増殖させた。翌日、細胞培養物を再び1 ml培地で1:10に希釈し、誘導のために37℃で6時間培養し、28℃で一晩インキュベートした。次いで、細胞培養物を適切な抗生物質を補充したLB又はTB寒天プレート上に連続希釈してスポットし、28℃で一晩インキュベートして単一のコロニーを形成させた。

　galK遺伝子破壊の陽性選択のために、0.2%グリセロール及び2-deoxy-galctose (2-DOG)を含むM63最小培地（2 g/L (NH₄)₂SO₄, 13.6 g/L KH₂PO₄, 0.5 mg/L FeSO₄-7H₂O, 1 mM MgSO₄, 0.1 mM CaCl₂ 及び 10 μg/ml チアミン）(Warming, S. et al., Nucleic Acids Res. 33, 1-12 (2005).)中で、細胞を増殖させた。rpoB遺伝子のリファンピシン耐性変異の選択のために、50 μg/mlのリファンピシンを含有するLB培地中で、細胞を増殖させた。配列分析のために、コロニーを無作為に採取し、適切なプライマーを用いてPCRにより直接増幅し、3130XL Genetic Analyzer（Applied Biosystems）を用いて、サンガー法により分析した。t検定統計分析を、Excelソフトウェア（Microsoft）を用いて行った。

＜全ゲノムシーケンシング＞
　各発現コンストラクト（dCas9、dCas9-PmCDA1、dCas9-PmCDA1-LVA-UGI、及びrpoB_1標的を有するdCas9-PmCDA1）を有するBW25113細胞を一晩前培養し、1 mLのLB培地で1:10に希釈し、誘導のために37℃で6時間増殖させ、その後28℃で一晩インキュベートした。細胞をリファンピシンを含有するプレート培地上に広げて、単一のコロニーを分離した。それぞれ3個の独立したコロニーをTB培地に接種した。Wizard Genomic DNA Purification Kit（Promega）を用いて、ゲノムDNAを抽出し、次いでBioruptor UCD-200 TS Sonication System（Diagenote）を用いて超音波により断片化し、500～1000 bpのサイズ分布を有する断片を得た。ゲノムDNAライブラリーを、Illumina（New England Biolabs）のNEBNext Ultra DNA Library Prep Kitを用いて調製し、Dual Index Primerで標識した。ライブラリーのサイズ選択を、Agencourt AMPure XP（Beckman Coulter）を用いて行い、600～800bpの範囲の長さの標識断片を得た。サイズ分布を、Agilent 2100 Bioanalyzer system（Agilent Technologies）により評価した。Qibit HS dsDNA HS Assay Kit及び蛍光光度計（Thermo Fisher Scientific）を用いてDNAを定量した。ゲノムサイズの約20倍のカバレッジが期待できる、2×300bpのリード長を得るため、シーケンシングを、MiSeqシーケンシングシステム（Illumina）及びMiSeq Reagent Kit v3を用いて行った。データ解析は、CLC Genomic Workbench 9.0を用いて行った（CLC bio）。シーケンスリードを対にして、リードペア内の重複するリードをマージし、最大２のアンビギュイティで、0.01の品質限界に基づいてトリミングした。次の設定(Masking mode = no masking, Mismatch cost = 2, Insertion cost = 3, Deletion cost = 3, Length fraction = 0.5, Similarity fraction = 0.8, Global alignment = No, Auto-detect paired distances = Yes, Nonspecific match handling = ignore)で、リードをE.coli BW25113の参照ゲノムにマッピングした。ローカルリアライメントを、デフォルト設定で行った（Realign unaligned ends = Yes, Multi-pass realignment = 2）。バリアントコーリングを、次の設定（Ignore positions with coverage = 1,000,000, Ignore broken pairs = Yes, Ignore Nonspecific matches = Reads, Minimum coverage = 5, Minimum count = 2, Minimum frequency = 50%, Base quality filter = No, Read detection filter = No, Relative read direction filter = Yes, Significance = 1%, Read position filter = No, Remove pyro-error variants = No）で行った。出力ファイルを、Excel（Microsoft）を用いて並べ替えた。

＜ディープシーケンシング＞
　galK、gsiA、ycbF又はyfiH遺伝子を標的とするgRNAと共にdCas9-PmCDA1又はdCas9-PmCDA1-UGI-LVAを発現するDH5α細胞を一晩インキュベートし、1 mLのLB培地で1:10に希釈し、誘導のために37℃で6時間増殖させた。細胞培養物を収集し、ゲノムDNAを抽出した。抽出されたゲノムDNAからプライマーペア（p685～p696）を用いて、標的領域を含む断片（～0.3kb）を直接増幅した。アンプリコンをDual Index Primerで標識した。サンプル当たり平均30,000以上のリードを、MiSeqシーケンシングシステムで解析した。シーケンスリードを対にして、最大２のアンビギュイティで、0.01の品質限界に基づいてトリミングし、リードペア内の重複するリードをマージした。次の設定（Masking mode = no masking, Mismatch cost = 2, Insertion cost = 3, Deletion cost = 3, Length fraction = 0.5, Similarity fraction = 0.8, Global alignment = No, Auto-detect paired distances = Yes, Nonspecific match handling = Map randomly）で、リードをそれぞれ参照配列にマッピングした。出力ファイルを、Excelを用いて並べ替えた。

実施例１　大腸菌におけるデアミナーゼに媒介される標的の変異誘発
　デアミナーゼに媒介される標的の変異誘発が細菌に適用できるかどうかを評価するために、温度誘導性λオペレーターシステム(Wang, Y. et al., Nucleic Acids Res. 40, (2012).)下で、P.marinus（ウミヤツメ）由来のシトシンデアミナーゼPmCDA1（非特許文献１１）に融合した触媒的に不活性なCas9（dCas：D10A及びH840Aの変異）を発現し、人工の構成的プロモーター J23119（図１(b)）の下で、20ヌクレオチド（nt）の標的配列-gRNA足場のハイブリッド（sgRNA）下でCDAを発現する、細菌を標的としたAID(Target-AID)ベクターを構築した。真核生物では、より高い変異効率を達成するため、デアミナーゼと組み合わせたニッカーゼCas9（nCas：D10A変異）を使用することができるが(非特許文献１０、１１)、nCas（D10A）-CDAを発現するプラスミドでは、形質転換効率が低いことが示された。このことは、大腸菌において、完全なCas9ヌクレアーゼと同様に、nCas（D10A）-CDAが重篤な細胞増殖及び／又は細胞死を引き起こすことを示唆する（図２）。一方、nCas (H840)-CDAは、dCasやdCas-CDAと同様に高い形質転換効率を示し、細胞増殖や細胞の生存にとって有利であることが示された。
　次に標的の変異誘発の効率を定量的に評価するために、ガラクトースのアナログ 2-デオキシ-D-ガラクトース（2-DOG）により、機能の喪失を積極的に選択することができるgalK遺伝子を標的として用いた。2-DOGは、galK遺伝子産物のガラクトキナーゼによって触媒され、有害な化合物となる(Warming, S. et al., Nucleic Acids Res. 33, 1-12 (2005).)。Target-AIDは、プロトスペーサー隣接モチーフ（PAM）配列(非特許文献１１)の上流16～19塩基のコア領域内の約15～20塩基目に位置するシトシンヌクレオチド（C）において、変異を誘導することが知られている（非特許文献１１）(図１(a)）。galK遺伝子において、ストップコドンが導入されるように標的の配列（図３）を選択したところ、2-DOGに対してほぼ100％の生存率を誘導し、このことは非常に効率的な変異誘発を示唆した（図４(a)）。2-DOGを含まない培地で培養した細胞についてシーケンシング分析を行った場合、8個のコロニーのうち6個が予想通り変異していた。予想通り-17位及び/又は20位で、CからTへの置換が観察された。

　次に、RNAポリメラーゼのβ-サブユニットをコードする必須遺伝子のrpoBを標的とした。rpoBの遺伝子機能を阻害すると細胞増殖の抑制や細胞死を引き起こすが、rpoB遺伝子の特定の点変異はリファンピシン耐性を付与することが知られている(Jin, D. J. et al., J. Mol. Biol. 202, 245-253 (1988).)。標的配列を、リファンピシン耐性を付与する点変異を誘発するように設計した（図５(a)）。明白な増殖抑制がなく、形質転換細胞はほぼ100％の頻度でリファンピシン耐性を獲得した（図４(b)）。リファンピシンを含まない培地で選択したクローンのシーケンシング分析により、予想通りにPAM配列から-16位及び/又は17位（rpoB遺伝子の1545位及び1546位）で、CからTへの置換が確認された（図５(a)）。全ゲノムシーケンシングを行い、大腸菌におけるTarget-AIDの非特異的な変異誘発効果の可能性を評価した。dCas-CDA、及びrpoB_1を標的とするsgRNAを発現する3個の独立クローンを分析したところ、明らかに無関係なゲノムの位置に0～2個のユニークな一塩基変異体（single nucleotide variant;SNV）を含むことを見出した（図５(b)）。検出されたSNVの隣接配列は、rpoB標的配列との類似性を示さなかった（図５(c)）。

実施例２　変異の頻度と位置に及ぼすsgRNAの長さ及びウラシルDNAグリコシラーゼ阻害剤の効果
　変異効率と位置を総合的に分析するために、galK遺伝子の18個の標的配列を用いてディープシーケンシング分析を行った（図６、図７）。7個の標的は高い効率（61.7～95.1％）の変異誘発を示したが、一方で5個は低い（1.4～9.2％）変異誘発を示した。最も効果的な変異位置はPAMの上流17-20塩基であり、これは高等生物における以前の研究と一致した。より長い標的配列を有するsgRNAがgalK_8及びgalK_13でより高い効率を示し、galK_9及びgalK_11でより低い効率を示したことから理解できるように（図６、左側のバー）、変異頻度も標的配列の長さに依存して変化した。

　変異効率を改善するために、バクテリオファージPBS2由来のウラシルDNAグリコシラーゼ阻害剤（UGI）(Zhigang, W. et al., Gene 99, 31-37 (1991).)及びタンパク質分解タグ（LVAタグ）(Andersen, J. B. et al.,Appl. Environ. Microbiol. 64, 2240-2246 (1998).)を、dCas-CDAのC末端に融合させることによって導入した。UGIは、DNAからウラシル（シトシン脱アミノ化の直接の産物）の除去を阻害するため(非特許文献１０、１１)、シチジン脱アミノ化による変異誘発を促進する。LVAタグの使用は、過剰に発現すると潜在的に有害であり得るdCas-CDA-UGIタンパク質の半減期を減少させることにより、細胞を傷害から守り、エスケーパー細胞(escaper cell)の発生を抑制することが期待される。非特異的な変異誘発効果を評価するために、dCas、dCas-CDA及びdCas-CDA-UGI-LVAを発現する細胞について全ゲノム配列分析を行った。dCas-CDAは0～2個のSNV変異を誘導したが、dCas-CDA-UGI-LVAはゲノム全体の位置的な偏りがない21～30個の変異を誘導した（表３及び表４）。

　sgRNAを用いない各コンストラクト（dCas、dCas-CDA又はdCas-CDA-LVA-UGI）を発現するリファンピシン選択クローンを、全ゲノムシーケンシングした。dCas-CDA及びdCas-CDA-LVA-UGIのbiological triplicateを示した。配列カバレージは、大腸菌BW25113ゲノム配列の4,631Mbpに亘る配列にマッピングした塩基対の合計として計算した。ユニークな変異のリストを、表４に示した。

　dCas-CDA-UGI-LVAは、標的配列の長さ及び位置にかかわらず、すべての標的部位で強い変異誘発を示し（図６、右側のバー）、異なる長さのsgRNAを用いた変異スペクトルを比較することが可能となった。その結果、galK_9及びgalK_11では、5 '末端方向へ変異スペクトルが拡張することが示された（図６）。sgRNAの標的配列の長さへの影響をさらに特徴づけるために、18nt、20nt、22nt及び24ntの長さのCに富む標的配列を試験した（図８(a)及び(b)）。5箇所の標的部位それぞれについての変異スペクトルは一貫して、標的配列が長くなるにつれて、5'末端方向へのピークシフト及びウィンドウの拡張を示した（図８(c)）。

実施例３　多重変異誘発
　多重編集のために、sgRNA発現ユニットのタンデムなリピートを、改変用プラスミドとは別のプラスミド上に組み立てた。galK遺伝子の3箇所の部位（galK_10、galK_11及びgalK_13）を標的とするプラスミドを構築し、dCas、dCas-CDA、dCas-CDA-LVA又はdCas-CDA1-UGI-LVAを発現する改変用ベクターを有する細胞に同時導入した。まず、リファンピシン耐性変異の発生を分析することにより、非特異的な変異誘発効果を評価した（図９）。dCas-CDAはバックグラウンドの変異頻度より約10倍の増加を示したが、dCas-CDA-UGI-LVAは、dCas-CDAの変異頻度よりさらに10倍の増加を示した。dCas-CDA及びdCas-CDA-LVAでは、同時に三重変異体を得るのに十分な効率ではなかったが、１箇所の変異はどちらでも生じており、少なくとも標的の変異率は、LVAの有無によって有意な差は認められなかった。従って、LVAを付加することで、変異効率を維持しつつ非特異的な変異誘発を抑制することができることが示された。また、dCas-CDA-UGI-LVAでは、各標的に対して100％（8/8）を生じたそれぞれの単一標的の結果と比較した場合には、変異頻度は低かったものの（図９(c)及び(d)）、dCas-CDA-UGI-LVAでは、解析した8クローンのうち5クローンで3重変異を誘発することに成功した（図９(b)及び(d)）。従って、UGIとLVAを組み合わせることで、高い変異効率を達成しつつ、非特異的な変異誘発を抑制することができることが示された。

　次いで、6つの異なる遺伝子(galK、xylB（キシルロキナーゼ）、manA（マンノース-6-リン酸イソメラーゼ）、pta（リン酸アセチルトランスフェラーゼ）、adhE（アルデヒド-アルコール脱水素酵素）、及びtpiA（トリオースリン酸イソメラーゼ）を標的にして終止コドンを導入した（図１０）。6つの異なる遺伝子を標的とするsgRNAと共にdCas-CDA-UGI-LVAを発現する細胞は、8個のクローンのうち7個が、全ての標的遺伝子座で変異が導入されていることを見出した（図１０）。

実施例４　Target-AIDによる複数のコピー遺伝子編集
　複数のコピー因子は、相当量のゲノム配列を占める。組換え、又はゲノム切断を含む他の方法とは異なり、Target-AIDはゲノムの不安定性を誘導することなく、同じsgRNA配列を用いて複数の遺伝子座を一度に編集し得る。このコンセプトを証明するため、大腸菌ゲノム中の4個の主要な転移因子（TE：IS1,2,3及び5）を、4個のsgRNAを用いて同時に標的化した。IS1,2,3及び5のための、それぞれ10個、12個、5個及び14個の遺伝子座は、各遺伝子座についてユニークなPCRプライマーにより特異的に増幅することができた。sgRNAは、各TEのトランスポザーゼ遺伝子の共通配列を含むように設計し、終止コドンを導入した（図１１）。大腸菌Top10細胞を、dCas-CDA-UGI-LVA及び4個の標的sgRNAをそれぞれ発現する2個のプラスミドで形質転換した。ISを編集した細胞の分離と検証の手順を図１２に示し、以下に詳細に説明する。二重形質転換及び選択の後、コロニーをPCRで増幅し、まずIS5-1、IS5-2、IS5-11、IS5-12の部位でシーケンシングした。IS5標的は効率が悪いことが判明した。分析された4つのコロニーのうち、1つは3箇所の変異部位及び1つの異種遺伝子型の部位を含んでいた（IS5-1）。次いで、細胞を液体培地に懸濁し、プレート上に広げてコロニーを再度単離した。8個のコロニーのうち3個はIS5-1に変異を含み、そのうちの2個について、残り24個のIS遺伝子座の配列をさらにシーケンシングしたところ、全ての変異した部位を含むが、1つの不完全な、異種遺伝子型の部位（IS5-5）を含むことが示された。次いで、細胞を懸濁させて広げ、IS5-5に変異を含む6個の再単離したクローンのうちの4個のクローンを得た。そのクローンの1個をIS5部位でシーケンシングしたところ、1個の異種遺伝子型の部位（IS5-2）を含むことが判明した。8個のクローンを再度単離し、6個のクローンがIS5-2での変異を含んでいた。2個のクローンを非選択培地上に広げて、プラスミドを失った細胞を得た。次いで、細胞をゲノム抽出して、シーケンシングし、全てのIS部位で変異を確認し（図１１）、さらにゲノム全体のオフターゲット効果を評価するために、全ゲノムシーケンシングを行った。PAMに近接した1～8塩基で一致した配列を含む参照ゲノムからの34箇所の潜在的なオフターゲット部位のうち、2箇所の部位が変異していることが判明した（表５）。

　RegionはDH10Bデータベースにおける標的部位を示す。Strandは標的配列の向きを示す。予想されるオフターゲット配列を、本明細書に記載したように決定した。ミスマッチは、オンターゲット配列とオフターゲット配列との間のミスマッチ数を示す。ミスマッチヌクレオチドを、太字で強調した。灰色ボックスで強調した各配列におけるCからTへの変異の頻度を示した。

実施例５　酵母発現用ベクターによる大腸菌の形質転換効率の比較
　Casエフェクタータンパク質としてLbCpf1（配列番号３２６及び３２７）を、タンパク質分解タグとしてYAASV及びYALAAをコードする酵母発現用ベクター（ベクター3685：Cpf1-NLS-3xFlag-YAASV（配列番号３２８）、ベクター3687：Cpf1-NLS-3xFlag-YALAA（配列番号３２９））、及びタンパク質分解タグをコードする核酸を有さないコントロールベクター（ベクター3687：Cpf1-NLS-3xFlag（配列番号３３０））を、pRS315ベクターをベースとして作成した。これらのベクターを用いて、大腸菌の形質転換効率を検証した。図１３に、各ベクターの概略図を示す。下記表６に示す通り、各ベクターを含むDNA溶液を2ng/μlに調整し、20μlの大腸菌Top10コンピテントセルに、1μl(2ng)のDNA溶液を加えて形質転換した。その後、200μlのSOCを加えて37℃１時間回復培養し、氷上で5分おいて増殖停止した後に、1μlの 50mg/ml Ampを加えた。培養液の一部（1μl及び10μl）をTEで希釈してLB+Ampプレートに塗布し、37℃で一晩培養してコロニー数を計測した。結果を表６に示す。

　タンパク質分解タグをコードする核酸を有するベクター3685及びベクター3686を用いた場合において、コントロールのベクター3687を用いた場合と比較して、大腸菌の形質転換効率が高いことが示された。従って、タンパク質分解タグを用いることで、異種生物発現用のベクターであっても、大腸菌などの細菌内でのベクターの複製の際にも、複製効率の向上が期待される。

　本出願は、日本で出願された特願２０１７－２２５２２１（出願日：２０１７年１１月２２日）を基礎としており、その内容は本明細書に全て包含されるものである。

　本発明により、宿主細菌内でも安定して増幅可能な、毒性の低いベクター及びそのベクターにコードされるゲノム編集用複合体が提供される。本発明のベクター及び核酸改変酵素を用いたゲノム編集の手法によれば、非特異的な変異等を抑えつつ宿主細菌の遺伝子を改変することが可能となる。この手法は、RecAのような宿主依存性因子に依存しないため、広範囲の細菌に適用することができ、極めて有用である。

Claims

　二本鎖DNA中の標的ヌクレオチド配列と特異的に結合する核酸配列認識モジュールと、(i)疎水性アミノ酸３残基をC末端に含むペプチド、又は(ii)該アミノ酸残基の少なくとも一部がセリンに置換されたアミノ酸３残基をC末端に含むペプチドからなるタンパク質分解タグとが結合した、複合体。
　前記複合体が、核酸改変酵素がさらに結合した複合体であって、標的化された部位の１以上のヌクレオチドを他の１以上のヌクレオチドに変換し又は欠失させ、あるいは該標的化された部位に１以上のヌクレオチドを挿入する、請求項１に記載の複合体。
　前記アミノ酸３残基が、ロイシン-バリン-アラニン、ロイシン-アラニン-アラニン、アラニン-アラニン-バリン又はアラニン－セリン－バリンである、請求項１又は２に記載の複合体。
　前記核酸配列認識モジュールが、Casの２つのDNA切断能のうちの一方のみ、又は両方のDNA切断能が失活したCRISPR-Casシステムである、請求項１～３のいずれか１項に記載の複合体。
　前記複合体が、CRISPR-Casシステムと、タンパク質分解タグとが結合した複合体である、請求項１～３のいずれか１項に記載の複合体。
　前記核酸改変酵素が核酸塩基変換酵素又はDNAグリコシラーゼである、請求項２～４のいずれか１項に記載の複合体。
　前記核酸塩基変換酵素がデアミナーゼである、請求項６に記載の複合体。
　塩基除去修復のインヒビターがさらに結合した、請求項６又は７に記載の複合体。
　請求項１～８のいずれか１項に記載の複合体をコードする核酸。
　細菌の二本鎖DNAの標的化された部位を改変する、又は該部位の近傍で二本鎖DNAにコードされる遺伝子の発現を調節する方法であって、選択された二本鎖DNA中の標的ヌクレオチド配列と特異的に結合する核酸配列認識モジュールと、(i)疎水性アミノ酸３残基をC末端に含むペプチド、又は(ii)該アミノ酸残基の少なくとも一部がセリンに置換されたアミノ酸３残基をC末端に含むペプチドからなるタンパク質分解タグとが結合した複合体を、該二本鎖DNAと接触させる工程を含む、方法。
　前記複合体が、核酸改変酵素がさらに結合した複合体であって、該標的化された部位の１以上のヌクレオチドを他の１以上のヌクレオチドに変換する又は欠失させる、あるいは該標的化された部位に１以上のヌクレオチドを挿入する工程を含む、請求項１０に記載の方法。
　前記アミノ酸３残基が、ロイシン-バリン-アラニン、ロイシン-アラニン-アラニン、アラニン-アラニン-バリン又はアラニン－セリン－バリンである、請求項１０又は１１に記載の方法。
　前記核酸配列認識モジュールが、Casの２つのDNA切断能のうちの一方のみ、又は両方のDNA切断能が失活したCRISPR-Casシステムである、請求項１０～１２のいずれか１項に記載の方法。
　前記複合体が、CRISPR-Casシステムと、タンパク質分解タグとが結合した複合体である、請求項１０～１２のいずれか１項に記載の方法。
　異なる標的ヌクレオチド配列とそれぞれ特異的に結合する、２種以上の核酸配列認識モジュールを用いることを特徴とする、請求項１０～１４のいずれか１項に記載の方法。
　前記異なる標的ヌクレオチド配列が、異なる遺伝子内に存在する、請求項１５に記載の方法。
　前記核酸改変酵素が核酸塩基変換酵素又はDNAグリコシラーゼである、請求項１０～１３、１５及び１６のいずれか１項に記載の方法。
　前記核酸塩基変換酵素がデアミナーゼである、請求項１７に記載の方法。
　該複合体が、塩基除去修復のインヒビターがさらに結合したものである、請求項１７又は１８に記載の方法。
　二本鎖DNAと複合体との接触が、該二本鎖DNAを有する細菌への、該複合体をコードする核酸の導入により行われる、請求項１０～１９のいずれか１項に記載の方法。