WO2022050413A1

WO2022050413A1 - 小型化シチジンデアミナーゼを含む二本鎖ｄｎａの改変用複合体

Info

Publication number: WO2022050413A1
Application number: PCT/JP2021/032689
Authority: WO
Inventors: 敬二西田; アングリー，; 仁志光延
Original assignee: 国立大学法人神戸大学
Priority date: 2020-09-04
Filing date: 2021-09-06
Publication date: 2022-03-10
Also published as: BR112023003972A2; US20230323335A1; KR20230061474A; AU2021336262A1; EP4209589A1; JPWO2022050413A1; EP4209589A4; AU2021336262A9; CN116134141A; CA3194019A1

Abstract

本開示は、標的部位の改変効率の低下を抑えつつシチジンデアミナーゼを小型化し、かつオフターゲット効果の抑制も達成できる小型化シチジンデアミナーゼを含むDNA改変用複合体を提供する。　核酸配列認識モジュールと、シチジンデアミナーゼとが結合した複合体であって、該核酸配列認識モジュールは、二本鎖DNA中の標的ヌクレオチド配列と特異的に結合し、該シチジンデアミナーゼは、（１）配列番号１で示されるアミノ酸配列における３０位～１５０位のアミノ酸残基の領域からなるアミノ酸配列、（２）配列番号１で示されるアミノ酸配列からなるタンパク質のオルソログであって、（１）の領域に対応する領域からなるアミノ酸配列、（３）（１）若しくは（２）のアミノ酸配列において、1若しくは数個のアミノ酸が欠失、置換、挿入及び／若しくは付加されたアミノ酸配列、又は（４）（１）若しくは（２）のアミノ酸配列と９０％以上の類似性又は同一性を有するアミノ酸配列、からなり、該二本鎖DNAの標的化された部位を改変する、複合体。

Description

小型化シチジンデアミナーゼを含む二本鎖ＤＮＡの改変用複合体

　本開示は、DNAの二本鎖切断を伴わず、細胞の有する二本鎖DNAの標的化された部位の改変を可能とする、該二本鎖DNAの改変用複合体及び該複合体を用いた二本鎖DNAの改変方法に関する。

　近年、様々な生物種において目的の遺伝子・ゲノム領域を改変する技術として、ゲノム編集が注目されている。例えば、ジンクフィンガーDNA結合ドメインと非特異的なDNA切断ドメインとを連結した、ジンクフィンガーヌクレアーゼ（ZFN）を用いて、宿主の植物細胞又は昆虫細胞にDNA中の標的化された遺伝子座において組換えを行う方法（特許文献１）や、植物病原菌キサントモナス属が有するDNA結合モジュールである転写活性化因子様（TAL）エフェクターと、DNAエンドヌクレアーゼとを連結したTALENを用いて、特定のヌクレオチド配列内又はそれに隣接する部位で、標的化された遺伝子を切断・修飾する方法（特許文献２）が報告されている。あるいは、ストレプトコッカス・ピオゲネス（Streptococcuspyogenes）由来のCas9ヌクレアーゼは、DNA二重鎖切断（DSB）の修復経路を有する真核生物において、強力なゲノム編集ツールとして広く使用されている(例えば、特許文献３、非特許文献１及び２)。

　また、標的領域に対するホモロジーアームを含むドナーDNAを使用せずに、標的遺伝子座でヌクレオチドを直接編集する、シチジンデアミナーゼに媒介される標的塩基編集も実証されている（例えば、非特許文献３）。この技術は、ヌクレアーゼに媒介されるDNA切断の代わりに、DNA脱アミノ化を利用するため、細胞に対する毒性が低く、またピンポイントに変異を導入することが可能である。そのため、遺伝子改変動物作製のための分子生物学的ツールとしての利用だけでなく、遺伝子療法などの医療への応用も期待されている。

　しかしながら、医療への応用に際し、シチジンデアミナーゼを用いたゲノム編集においては、シチジンデアミナーゼを必要とするためゲノム編集に用いる複合体の分子量が増え、このことが、効率的なデリバリーを阻害する原因の１つとなっている。そこで、シチジンデアミナーゼの一部の領域を欠失させることで、シチジンデアミナーゼの分子量を低減させようとの試みがなされている（非特許文献４）。

国際公開第2003/087341号国際公開第2011/072246号国際公開第2013/176772号

Mali, P. et al., Science 339(6121):823-826 (2013) Cong, L. et al., Science 339(6121):819-823 (2013) Nishida, K. et al., Science 353(6305):aaf8729(2016) Tan J. et al., Nat Commun. 10(1):439 (2019)

　しかしながら、非特許文献４に開示された小型化したシチジンデアミナーゼとニッカーゼCas9との複合体は、野生型のシチジンデアミナーゼから欠失する部分が増えるにつれて、標的部位の改変効率が低下することが報告されている。また、該複合体には、さらにウラシル-DNAグリコシラーゼ阻害剤（UGI）も含まれているが、UGIはDNA修復に重要なウラシルDNAグリコシラーゼの機能を阻害するため、望まれないオフターゲット効果が増強すると予想される。従って、本開示は、標的部位の改変効率の低下を抑えつつシチジンデアミナーゼを小型化し、かつオフターゲット効果の抑制も達成できる小型化シチジンデアミナーゼを含む二本鎖DNAの改変用複合体を提供する。

　本発明者らは、上記非特許文献４に開示された複合体から、UGIを除いた複合体を作製した。また、該複合体のN末端側領域をさらに欠失させた複合体も作製し、これらの複合体での標的部位の改変効率を検証した。その結果、予想外にも、非特許文献４において高い改変効率が認められた、1位～161位の領域からなるCDA1（即ち、野生型CDAのC末端側32アミノ酸領域が欠失したCDAである。CDA1Δ161とも称する。）を用いた複合体でさえ、UGIを用いない場合には、野生型CDA1を用いた複合体と比較して改変効率が3分の2以下となること、また、従来型のC末端にリンカーを介して融合しているTarget-AIDと比較して改変効率が10分の1以下となることを見出した。さらには、かかる知見から、CDA1Δ161のN末端側を2アミノ酸残基以上欠失させたCDA1では、改変が顕著に低下することを見出した。かかる知見から、本発明者らは、非特許文献４に開示の複合体が高い標的部位の改変効率を達成できたのは、UGIによるDNA改変効率の向上効果（酵母ではUGIによる効果が顕著に現れることが知られている）によるところが大きく、UGIを用いない場合や他の生物種に適用する場合には、単純にCDA1の末端領域を欠失するだけでは、所望の改変効率を達成できる複合体が得られないとの結論に達した。

　そこで、単純にシチジンデアミナーゼの末端領域を欠失させるとの従来の発想を転換し、シチジンデアミナーゼの構造を慎重に見極めて、該構造に基づき構造を改変することで、標的部位の改変効率の低下を防げるのではないかとの着想を得た。該着想に基づき研究を進めた結果、シチジンデアミナーゼの内部の相互作用を考慮しながらN末端側とC末端側を同時に欠失させることで、シチジンデアミナーゼの立体構造を球状に近づけ、さらに露出した内部アミノ酸残基を疎水性から親水性のアミノ酸残基に置換することで、シチジンデアミナーゼの安定化を実現して効率を回復させることに成功した。さらに、従来はCas9の末端に融合されていたCDA1をCas9の内部に埋め込むことによっても、複合体としての安定性の向上及び基質DNAへのアクセス向上を図り、従来のものを超え得る効率を達成した。オフターゲット効果についても評価をしてみると、いずれも従来型よりもオフターゲット効果を顕著に抑制できることが認められた。また、Cas9としてSaCas9を用いることで、AAVベクターへ搭載可能なサイズのCRISPR-Casを実現した。本発明者は、これらの知見に基づいてさらに研究を重ねた結果、本開示を完成するに至った。

　したがって、本開示は以下を提供する。
（項目１）
　核酸配列認識モジュールと、デアミナーゼとが結合した複合体であって、
　該核酸配列認識モジュールは、二本鎖ＤＮＡ中の標的ヌクレオチド配列と特異的に結合し、
　該デアミナーゼは、該デアミナーゼに対応する野生型デアミナーゼよりもサイズが小さく、かつ改変した結果露出する断面の面積または該面積を示す指数が所定値以下となるように改変されており、
　該二本鎖ＤＮＡの標的化された部位を改変する能力を有する、複合体。
（項目２）
　前記デアミナーゼは、前記デアミナーゼを改変した結果露出する断面に現れる疎水性アミノ酸残基の数が、所定値以下となるように改変されており、該改変は欠失を含む、上記項目に記載の複合体。
（項目３）
　前記デアミナーゼは、改変させたアミノ酸残基の数に対する、改変した結果露出する断面に現れる疎水性残基の割合が、所定値以下となるように改変されており、該改変は欠失を含む、上記項目のいずれか一項に記載の複合体。
（項目４）
　前記デアミナーゼは、前記デアミナーゼを改変した結果露出する断面に現れる疎水性アミノ酸残基の数が、最小化するように改変される、上記項目のいずれか一項に記載の複合体。
（項目５）
　前記デアミナーゼは、改変させたアミノ酸残基の数に対する、改変した結果露出する断面に現れる疎水性残基の割合が、最小化するように改変される、上記項目のいずれか一項に記載の複合体。
（項目６）
　前記デアミナーゼは、前記野生型デアミナーゼのＮ末端側およびＣ末端側が改変される、上記項目のいずれか一項に記載の複合体。
（項目７）
　前記デアミナーゼにおける露出した疎水性の内部アミノ酸残基の少なくとも１つが、親水性のアミノ酸残基に置換される、上記項目のいずれか一項に記載の複合体。
（項目８）
　前記デアミナーゼがシチジンデアミナーゼを含む、上記項目のいずれか一項に記載の複合体。
（項目９）
　前記デアミナーゼが、
　（１）配列番号１で示されるアミノ酸配列における３０位～１５０位のアミノ酸残基の領域からなるアミノ酸配列、
　（２）配列番号１で示されるアミノ酸配列からなるタンパク質のオルソログであって、（１）の領域に対応する領域からなるアミノ酸配列、
　（３）（１）若しくは（２）のアミノ酸配列において、１若しくは数個のアミノ酸が欠失、置換、挿入及び／若しくは付加されたアミノ酸配列、又は
　（４）（１）若しくは（２）のアミノ酸配列と９０％以上の類似性又は同一性を有するアミノ酸配列、
からなる、上記項目のいずれか一項に記載の複合体。
（項目１０）
　前記（３）のアミノ酸配列が、配列番号１で示されるアミノ酸配列における１２２位、１２６位及び１３９位からなる群から選択される位置のアミノ酸残基又は該位置に対応するアミノ酸残基の親水性アミノ酸残基への１箇所以上の置換を含む、上記項目のいずれか一項に記載の複合体。
（項目１１）
　前記（３）のアミノ酸配列が、配列番号１で示されるアミノ酸配列における１２２位のアミノ酸残基及び１３９位のアミノ酸残基、又は該位置に対応するアミノ酸残基の親水性アミノ酸残基への２箇所以上の置換を含む、上記項目のいずれか一項に記載の複合体。
（項目１２）
　前記核酸配列認識モジュールが、Ｃａｓタンパク質の少なくとも１つのＤＮＡ切断能が失活したＣＲＩＳＰＲ－Ｃａｓシステム、ジンクフィンガーモチーフ、ＴＡＬエフェクター及びＰＰＲモチーフからなる群より選択される、上記項目のいずれか一項に記載の複合体。
（項目１３）
　前記核酸配列認識モジュールが、Ｃａｓタンパク質の１つのＤＮＡ切断能が失活したＣＲＩＳＰＲ－Ｃａｓシステムである、上記項目のいずれか一項に記載の複合体。
（項目１４）
　前記Ｃａｓタンパク質がＣａｓ９タンパク質である、上記項目のいずれか一項に記載の複合体。
（項目１５）
　核酸配列認識モジュールのＮ末端断片と、デアミナーゼと、核酸配列認識モジュールのＣ末端断片とが結合した複合体であって、
　該核酸配列認識モジュールのＮ末端断片とＣ末端断片とがリフォールディングした場合に、該核酸配列認識モジュールは、二本鎖ＤＮＡ中の標的ヌクレオチド配列と特異的に結合し、該二本鎖ＤＮＡの標的化された部位を改変する能力を有する、複合体。
（項目１６）
　前記デアミナーゼは、前記デアミナーゼに対応する野生型デアミナーゼよりもサイズが小さく、かつ改変した結果露出する断面の面積または該面積を示す指数が所定値以下となるように改変されている、上記項目に記載の複合体。
（項目１７）
　前記デアミナーゼは、前記デアミナーゼを改変した結果露出する断面に現れる疎水性アミノ酸残基の数が、所定値以下となるように改変されており、該改変は欠失を含む、上記項目のいずれか一項に記載の複合体。
（項目１８）
　前記デアミナーゼは、改変させたアミノ酸残基の数に対する、改変した結果露出する断面に現れる疎水性残基の割合が、所定値以下となるように改変されており、該改変は欠失を含む、上記項目のいずれか一項に記載の複合体。
（項目１９）
　前記デアミナーゼは、前記デアミナーゼを改変した結果露出する断面に現れる疎水性アミノ酸残基の数が、最小化するように改変される、上記項目のいずれか一項に記載の複合体。
（項目２０）
　前記デアミナーゼは、改変させたアミノ酸残基の数に対する、改変した結果露出する断面に現れる疎水性残基の割合が、最小化するように改変される、上記項目のいずれか一項に記載の複合体。
（項目２１）
　前記デアミナーゼは、前記野生型デアミナーゼのＮ末端側およびＣ末端側が改変される、上記項目のいずれか一項に記載の複合体。
（項目２２）
　前記デアミナーゼにおける露出した疎水性の内部アミノ酸残基の少なくとも１つが、親水性のアミノ酸残基に置換される、上記項目のいずれか一項に記載の複合体。
（項目２３）
　前記デアミナーゼがシチジンデアミナーゼを含む、上記項目のいずれか一項に記載の複合体。
（項目２４）
　前記デアミナーゼが、
　（１）配列番号１で示されるアミノ酸配列における３０位～１５０位のアミノ酸残基の領域からなるアミノ酸配列、
　（２）配列番号１で示されるアミノ酸配列からなるタンパク質のオルソログであって、（１）の領域に対応する領域からなるアミノ酸配列、
　（３）（１）若しくは（２）のアミノ酸配列において、1若しくは数個のアミノ酸が欠失、置換、挿入及び／若しくは付加されたアミノ酸配列、又は
　（４）（１）若しくは（２）のアミノ酸配列と９０％以上の類似性又は同一性を有するアミノ酸配列、
からなる、上記項目のいずれか一項に記載の複合体。
（項目２５）
　前記核酸配列認識モジュールが、Ｃａｓタンパク質の少なくとも１つのＤＮＡ切断能が失活したＣＲＩＳＰＲ－Ｃａｓシステム、ジンクフィンガーモチーフ、ＴＡＬエフェクター及びＰＰＲモチーフからなる群より選択される、上記項目のいずれか一項に記載の複合体。
（項目２６）
　上記項目のいずれか一項に記載の複合体をコードする核酸。
（項目２７）
　上記項目に記載の核酸を含むベクター。
（項目２８）
　アデノ随伴ウイルスベクターである、上記項目に記載のベクター。
（項目２９）
　細胞の有する二本鎖ＤＮＡの標的化された部位を改変する方法であって、上記項目のいずれか一項に記載の複合体を該二本鎖ＤＮＡと接触させる工程を含む、方法。
（項目３０）
　二本鎖ＤＮＡと複合体との接触が、前記細胞への、上記項目のいずれか一項に記載の核酸またはベクターの導入により行われる、上記項目に記載の方法。

　また本開示は以下も提供する。
［１］
　核酸配列認識モジュールと、シチジンデアミナーゼとが結合した複合体であって、
　該核酸配列認識モジュールは、二本鎖DNA中の標的ヌクレオチド配列と特異的に結合し、
　該シチジンデアミナーゼは、
　（１）配列番号１で示されるアミノ酸配列における３０位～１５０位のアミノ酸残基の領域からなるアミノ酸配列、
　（２）配列番号１で示されるアミノ酸配列からなるタンパク質のオルソログであって、（１）の領域に対応する領域からなるアミノ酸配列、
　（３）（１）若しくは（２）のアミノ酸配列において、1若しくは数個のアミノ酸が欠失、置換、挿入及び／若しくは付加されたアミノ酸配列、又は
　（４）（１）若しくは（２）のアミノ酸配列と９０％以上の類似性又は同一性を有するアミノ酸配列、
からなり、
　該二本鎖DNAの標的化された部位を改変する、複合体。
［２］
　前記（３）のアミノ酸配列が、配列番号１で示されるアミノ酸配列における１２２位、１２６位及び１３９位からなる群から選択される位置のアミノ酸残基又は該位置に対応するアミノ酸残基の親水性アミノ酸残基への１箇所以上の置換を含む、［１］に記載の複合体。
［３］
　前記（３）のアミノ酸配列が、配列番号１で示されるアミノ酸配列における１２２位のアミノ酸残基及び１３９位のアミノ酸残基、又は該位置に対応するアミノ酸残基の親水性アミノ酸残基への２箇所以上の置換を含む、［１］又は［２］に記載の複合体。
［４］
　前記核酸配列認識モジュールが、Casタンパク質の少なくとも１つのDNA切断能が失活したCRISPR-Casシステム、ジンクフィンガーモチーフ、TALエフェクター及びPPRモチーフからなる群より選択される、［１］～［３］のいずれかに記載の複合体。
［５］
　前記核酸配列認識モジュールが、Casタンパク質の１つのDNA切断能が失活したCRISPR-Casシステムである、［１］～［３］のいずれかに記載の複合体。
［６］
　前記Casタンパク質がCas9タンパク質である、［４］又は［５］に記載の複合体。
［７］
　核酸配列認識モジュールのN末端断片と、シチジンデアミナーゼと、核酸配列認識モジュールのC末端断片とが結合した複合体であって、
　該核酸配列認識モジュールのN末端断片とC末端断片がリフォールディングした場合に、該核酸配列認識モジュールは、該二本鎖DNA中の標的ヌクレオチド配列と特異的に結合することを特徴とする、該二本鎖DNAの標的化された部位を改変する、複合体。
［８］
　前記シチジンデアミナーゼが、
　（１）配列番号１で示されるアミノ酸配列における３０位～１５０位のアミノ酸残基の領域からなるアミノ酸配列、
　（２）配列番号１で示されるアミノ酸配列からなるタンパク質のオルソログであって、（１）の領域に対応する領域からなるアミノ酸配列、
　（３）（１）若しくは（２）のアミノ酸配列において、1若しくは数個のアミノ酸が欠失、置換、挿入及び／若しくは付加されたアミノ酸配列、又は
　（４）（１）若しくは（２）のアミノ酸配列と９０％以上の類似性又は同一性を有するアミノ酸配列、
からなる、［７］に記載の複合体。
［９］
　前記核酸配列認識モジュールが、Casタンパク質の少なくとも１つのDNA切断能が失活したCRISPR-Casシステム、ジンクフィンガーモチーフ、TALエフェクター及びPPRモチーフからなる群より選択される、［７］又は［８］に記載の複合体。
［１０］
　［１］～［９］のいずれかに記載の複合体をコードする核酸。
［１１］
　［１０］に記載の核酸を含むベクター。
［１２］
　アデノ随伴ウイルスベクターである、［１１］に記載のベクター。
［１３］
　細胞の有する二本鎖DNAの標的化された部位を改変する方法であって、［１］～［９］のいずれかに記載の複合体を該二本鎖DNAと接触させる工程を含む、方法。
［１４］
　二本鎖DNAと複合体との接触が、該細胞への、［１０］～［１２］のいずれかに記載の核酸又はベクターの導入により行われる、［１３］に記載の方法。

　本開示によれば、従来のものと比較して小型で、改変効率も高く、かつオフターゲット効果が抑制された二本鎖DNA改変用複合体が提供される。該複合体を用いることで、二本鎖DNAを切断することなく、より安全にDNAの標的化された部位を改変できる。また、該複合体をコードする核酸は、アデノ随伴ウイルスベクターにも搭載し、標的部位に複合体をデリバリーすることも容易になるため、特に遺伝子治療などの応用局面で有用となり得る。

図１は、ヒトAID(HsAIDと表記)、野生型PmCDA1及び本開示のデアミナーゼの一態様(PmCDA1-36)の配列のアライメント結果を示す。HsAIDの配列を配列番号３、野生型PmCDA1の配列を配列番号１、PmCDA1-36の配列を配列番号２として示す。図２は、実施例１で用いたプラスミドコンストラクトの概略図である。各コンストラクトにおける数字は、各配列にコードされるタンパク質のアミノ酸の位置を示す。図３は、実施例１の結果を示す。-Canavanineは、Canavanine不含有培地を示し、+CanavanineはCanavanine含有培地を示す。図４は、実施例１の結果を示す。-Canavanineは、Canavanine不含有培地を示し、+CanavanineはCanavanine含有培地を示す。図５は、実施例１の結果のグラフを示す。縦軸は変異導入率（％）を示す。一番の右のKN1251はポジティブコントロールである。図６は、CDA1の立体構造解析の結果を示す。左図は野生型CDA1の立体構造、右図はCDA1Δ161の立体構造を示す。図７は、CDA1Δ161の露出した内部アミノ酸残基を示す（右図の白色部分）。図８は、実施例２で用いたプラスミドコンストラクトの概略図である。各コンストラクトにおける数字は、各配列にコードされるタンパク質のアミノ酸の位置を示す。図９は、実施例２の結果を示す。-Canavanineは、Canavanine不含有培地を示し、+CanavanineはCanavanine含有培地を示す。図１０は、実施例２の結果を示す。-Canavanineは、Canavanine不含有培地を示し、+CanavanineはCanavanine含有培地を示す。図１１は、実施例２の結果のグラフを示す。縦軸は変異導入率（％）を示す。一番の右のKN1252はポジティブコントロールである。図１２は、実施例２で用いたプラスミドコンストラクトの概略図である。各コンストラクトにおける数字は、各配列にコードされるタンパク質のアミノ酸の位置を示す。図１３は、実施例２の立体構造における変異導入部分（白色部分）を示す。図１４は、実施例２の結果を示す。-Canavanineは、Canavanine不含有培地を示し、+CanavanineはCanavanine含有培地を示す。図１５は、実施例２の結果を示す。-Canavanineは、Canavanine不含有培地を示し、+CanavanineはCanavanine含有培地を示す。図１６は、実施例２の結果のグラフを示す。縦軸は変異導入率（％）を示す。一番の右のKN1252はポジティブコントロールである。図１７は、実施例２で用いたプラスミドコンストラクトの概略図である。各コンストラクトにおける数字は、各配列にコードされるタンパク質のアミノ酸の位置を示す。図１８は、実施例２の結果を示す。-Canavanineは、Canavanine不含有培地を示し、+CanavanineはCanavanine含有培地を示す。図１９は、実施例２の結果を示す。-Canavanineは、Canavanine不含有培地を示し、+CanavanineはCanavanine含有培地を示す。図２０は、実施例２の結果のグラフを示す。左図と右図では、ガイドRNAの標的配列が異なる。各図の縦軸は変異導入率（％）を示す。各図の一番の右のKN1252はポジティブコントロールである。図２１は、実施例３で用いたプラスミドコンストラクトの概略図である。各コンストラクトにおける数字は、各配列にコードされるタンパク質のアミノ酸の位置を示す。図２２は、実施例３の結果を示す。-Canavanineは、Canavanine不含有培地を示し、+CanavanineはCanavanine含有培地を示す。図２３は、実施例３の結果を示す。-Canavanineは、Canavanine不含有培地を示し、+CanavanineはCanavanine含有培地を示す。図２４は、実施例３の結果のグラフを示す。左図と右図では、ガイドRNAの標的配列が異なる。各図の縦軸は変異導入率（％）を示す。各図の一番の右のKN1252はポジティブコントロールである。図２５は、実施例３で用いたプラスミドコンストラクトの概略図及び本開示のデアミナーゼの一態様の三次構造を示す。各コンストラクトにおける数字は、各配列にコードされるタンパク質のアミノ酸の位置を示す。図２６は、実施例３で用いたプラスミドコンストラクトの概略図を示す。各コンストラクトにおける数字は、各配列にコードされるタンパク質のアミノ酸の位置を示す。図２７は、実施例３の結果を示す。-Canavanineは、Canavanine不含有培地を示し、+CanavanineはCanavanine含有培地を示す。図２８は、実施例３の結果を示す。-Canavanineは、Canavanine不含有培地を示し、+CanavanineはCanavanine含有培地を示す。図２９は、実施例３の結果のグラフを示す。左図と右図では、ガイドRNAの標的配列が異なる。各図の縦軸は変異導入率（％）を示す。各図の一番の右のKN1252はポジティブコントロールである。図３０は、実施例３の結果を示す。-Canavanineは、Canavanine不含有培地を示し、+CanavanineはCanavanine含有培地を示す。図３１は、実施例３の結果を示す。-Canavanineは、Canavanine不含有培地を示し、+CanavanineはCanavanine含有培地を示す。図３２は、実施例３の結果のグラフを示す。左図と右図では、ガイドRNAの標的配列が異なる。各図の縦軸は変異導入率（％）を示す。各図の一番の右のKN1252はポジティブコントロールである。図３３は、実施例４で用いたプラスミドコンストラクトの概略図を示す。各コンストラクトにおける数字は、各配列にコードされるタンパク質のアミノ酸の位置を示す。図３４は、実施例４の結果を示す。-Canavanineは、Canavanine不含有培地を示し、+CanavanineはCanavanine含有培地を示す。図３５は、実施例４の結果を示す。-Canavanineは、Canavanine不含有培地を示し、+CanavanineはCanavanine含有培地を示す。図３６は、実施例５の結果を示す。図３７は、実施例５の結果を示す。図３８は、実施例５の結果を示す。図３９は、実施例５の結果を示す。図４０は、実施例５の結果を示す。図４１は、実施例５の結果を示す。図４２は、実施例６で用いたプラスミドコンストラクトの概略図を示す。各コンストラクトにおける数字は、各配列にコードされるタンパク質のアミノ酸の位置を示すが、bpを付したものはヌクレオチド長を示す。図４３は、ガイドRNAをコードするプラスミドの概略図（上図）及び実施例６の実験手順の概略図（下図）である。図４４は、実施例６の結果を示す。配列の各ヌクレオチドにおける変異後のヌクレオチド及び変異効率を示す。図４５は、実施例６の結果のグラフを示す。縦軸は変異効率、横軸は図４４の24 well欄の数値及びReference欄の配列に対応する。左上グラフ中に記載の配列を配列番号１７、左下グラフ中に記載の配列を配列番号１８、右上グラフ中に記載の配列を配列番号１９、右下グラフ中に記載の配列を配列番号２０として示す。図４６ａは、ヒトＡＩＤとｄｓＤＮＡの複合体の構造を示すリボンモデルである。非触媒的な２本鎖ＤＮＡ結合ドメインを緑（Ｎ末端）と赤（Ｃ末端）で示し、そのアミノ酸配列を下部のＰｍＣＤＡ１のものと比較している。図４６ａ中、ＡＩＤに示される配列を左から順に配列番号２１および配列番号２２として示し、またＰｍＣＤＡ１に示される配列を左から順に配列番号２３および配列番号２４として示す。図４６ｂは、ＰｍＣＤＡ１の改変前と改変後の空間充填構造の予測図である。直接的なＤＮＡ結合部位（緑と赤）に加えて、青で示したセグメントをトリミングしてタンパク質の断面を最小化した。変異したアミノ酸（Ｗ１２２およびＷ１３９）は黄色で示した。図４６ｃは酵母のカナバニン耐性アッセイにおけるＵＧＩを含まないＴａｒｇｅｔ－ＡＩＤ、ＡＩＤ－２Ｓ、およびＡＩＤ－３Ｓのオンターゲット編集効率を示すグラフである。ＣＡＮ１－２（青い点）とＣＡＮ１－３（オレンジの点）をターゲット部位として選択し、生物学的三重構造をプロットした。図４６ｄは、本実施例で用いたＣＢＥ変異体のドメイン配置を示す模式図である。ＢＥの構造は、ｒＡＰＯＢＥＣ１の点変異を除いて、ＹＥ１、ＹＥ２、Ｒ３３Ａ＋Ｋ３４Ａと共通している。図４６ｅおよび図４６ｆは、ＨＥＫ２９３ＴのＨＥＫ２、ＨＥＫ３、ＲＮＦ２、ＶＥＧＦＡサイトでディープシーケンシングにより解析したＣＢＥバリアントのオンターゲット編集プロファイルを示すグラフである。図４６ｅでは、各ターゲットのＣ→Ｔ変換頻度が最も高いヌクレオチド位置（ターゲット配列のＰＡＭ配列側から５’側に向かって番号を付けた）を示した。図４６ｆでは、４つのターゲットの平均的な編集ウィンドウを示している。図４６ｅ、ｆ、ｈでは、平均スコア（四角棒）と標準偏差（エラーバー）を示し、ｎ＜９の場合は各生物学的複製をドットで示した。図４６ｇは、ＳａＡＩＤおよびＳａＡＩＤ－３Ｓのドメイン構造を示す模式図である。ｇＲＮＡ発現カセットを各エフェクタープラスミドに結合させている。図４６ｈはＨＥＫ２９３ＴにおけるＳａＡＩＤおよびＳａＡＩＤ－３Ｓのオンターゲット編集頻度を図４６ｅと同様に示したグラフである。トランスフェクション効率を正規化するために、プラスミドバックボーンからｉＲＦＰ６７０を発現させて細胞を選別した。図４７ａは、酵母で示されたとおりに各コンストラクト（ＡＩＤ－２Ｓ，　－３Ｓ，　ｒＡＰＯＢＥＣ１）を誘導した後、オンターゲット変異（カナバニン耐性）とオフターゲット変異（チアリシン耐性）の発生率を測定したグラフである。ＣＡＮ１－２（青色の点）とＣＡＮ１－３（オレンジ色の点）の標的部位について、生物学的繰り返しの値をプロットした。図４７ｂは、直交するＲ－ループのオフターゲット評価の模式図である。図４７ｃは７つのオフターゲットＲ－ループサイト（１～７）を選択し、オンターゲットサイト（ＨＥＫ２，　ＨＥＫ３，　ＲＮＦ２，　ＶＥＧＦＡ）の１つと共導入し、ディープシーケンサーで解析した結果を示すグラフである。オフターゲットの頻度は、変異を含むリードの割合で示した。サイト１、２～５、６、７について、それぞれｎ＝６、ｎ＝４、ｎ＝１２、ｎ＝１０のデータセットをプロットし、その平均頻度（四角棒）と標準偏差（エラーバー）を示した。図４７ｄは、本実施例の全ＣＢＥのオンターゲット編集対平均オフターゲット編集プロファイルを示すグラフである。ｙ軸はＲ－ループアッセイで使用した４つのオンターゲット部位（ＨＥＫ２、ＨＥＫ３、ＲＮＦ２、ＶＥＧＦＡ）の平均オンターゲット編集を表し、ｘ軸は７つの直交するＲ－ループ部位の平均オフターゲット編集を表している。図４７ｅは、Ｃａｓ９依存性オフターゲット効果を評価したグラフである。２つのＨＥＫ２オフターゲット部位（１～２）と４つのＶＥＧＦＡオフターゲット部位（１～４）をディープシーケンシングで解析した。データセットはｎ＝４である。図４８は、ＰｍＣＤＡ１のＣ末端を欠失させた場合の効果を示す図である。図４８ａは、Ｃ末端を欠失させたＰｍＣＤＡ１の一連の空間充填構造の予測図である。触媒作用のないｄｓＤＮＡ結合ドメインを、それぞれ緑（Ｎ末端）と赤（Ｃ末端）で示した。図４８ｂは、図４８ｃで検証したＣ末端切断型Ｔａｒｇｅｔ－ＡＩＤコンストラクトを示す模式図である。図４８ｃは酵母における切断型コンストラクトのオンターゲット編集効率の推移を示すグラフである。Ｃａｎａｖａｎｉｎｅ耐性変異体の出現率は、ＣＡＮ１遺伝子変異体として測定した。ＣＡＮ１－１とＣＡＮ１－２の標的部位について、異なるデータセット（ピンクとグレーのドット）の傾向線をプロットした。図４９は、ＰｍＣＤＡ１のＮ末端とＣ末端を欠失させた場合の効果を示す図である。図４９ａは、Ｎ末端とＣ末端を欠失させたＰｍＣＤＡ１の一連の空間充填構造の予測図である。触媒作用のないｄｓＤＮＡ結合ドメインを緑色（Ｎ末端）で示し、青色のセグメントは、タンパク質の形状を滑らかにし、断面を最小化するために切断される隣接部位を示す。図４９ｂは、図４９ｃで試験したＮ末端とＣ末端を切断したＴａｒｇｅｔ－ＡＩＤコンストラクトを示す模式図である。図４９ｃは酵母における切断コンストラクトのオンターゲット編集効率の傾向を示すグラフである。Ｃａｎａｖａｎｉｎｅ耐性変異体の出現率は、ＣＡＮ１遺伝子変異体として測定した。ＣＡＮ１－１とＣＡＮ１－２の標的部位について、異なるデータセット（ピンクとグレーのドット）の傾向線をプロットした。図５０は、切断されたＰｍＣＤＡ１（３０－１５０）におけるアミノ酸置換の効果を示す図である。切断後に露出した疎水性残基を親水性残基に置換した。オンターゲット編集効率は、図４９のようにして酵母カナバニンアッセイにより測定し、Ｔａｒｇｅｔ－ＡＩＤの平均値で正規化した。生物学的複製は、ＣＡＮ１－１（赤）とＣＡＮ１－２（青）のターゲットサイトについてプロットした。異なるデータセットは異なるドット形状で示されている。図５１は、ドメイン埋め込み型Ｔａｒｇｅｔ－ＡＩＤ３Ｓを示す図である。図５１ａはＣａｓ９のＲｕｖＣドメインの位置にドメイン埋め込み型のＡＩＤ－３Ｓ（１０５４－ｔＣＤＡ１ＥＱ－１０５５）を示す模式図である。図５１ｂは、酵母で評価したオンターゲットの編集効率を示す。ＣＡＮ１－２（青い点）とＣＡＮ１－３（オレンジの点）のターゲットサイトについて、生物学的繰り返しの値をプロットした。図５２は、ＳａＣａｓ９－ＡＩＤ変異体のオンターゲット編集プロファイルを示す図である。ｉＲＦＰ６７０セルソーティングを用いてＨＥＫＴ２９３細胞で評価したオンターゲット編集性能を示す。ＦＡＮＣＦとＶＥＧＦＡの標的部位を選択し、各ヌクレオチド位置での変異頻度を示した。各ヌクレオチド変換の平均スコア（四角棒）と標準偏差（エラーバー）を示し、各生物学的複製を点でプロットしている（ｎ＝３）。

　以下、本開示を最良の形態を示しながら説明する。
　本明細書の全体にわたり、単数形の表現は、特に言及しない限り、その複数形の概念をも含むことが理解されるべきである。従って、単数形の冠詞（例えば、英語の場合は「ａ」、「ａｎ」、「ｔｈｅ」など）は、特に言及しない限り、その複数形の概念をも含むことが理解されるべきである。また、本明細書において使用される用語は、特に言及しない限り、当該分野で通常用いられる意味で用いられることが理解されるべきである。したがって、他に定義されない限り、本明細書中で使用される全ての専門用語および科学技術用語は、本開示の属する分野の当業者によって一般的に理解されるのと同じ意味を有する。矛盾する場合、本明細書（定義を含めて）が優先する。

　本明細書において、「約」とは、後に続く数値の±１０％を意味する。

１．核酸改変酵素複合体
　本開示の一局面において、核酸配列認識モジュールと、デアミナーゼとが結合した複合体であって、該核酸配列認識モジュールは、二本鎖ＤＮＡ中の標的ヌクレオチド配列と特異的に結合し、該デアミナーゼは、該デアミナーゼに対応する野生型デアミナーゼよりもサイズが小さく、かつ改変した結果露出する断面の面積または該面積を示す指数が所定値以下となるように改変されており、該二本鎖ＤＮＡの標的化された部位を改変する能力を有する、複合体が提供される。一実施形態において、改変した結果露出する断面の面積または該面積を示す指数は、デアミナーゼの種類によって適宜設定される所定値以下とすることができ、例えば、そのような指数として、後述の露出断面指数や疎水性アミノ酸残基の数を用いることができる。

　本開示においては、デアミナーゼを小型化することにより、単一のＡＡＶベクターに搭載可能な塩基編集システムを提供することを目的とする。本発明者らは、デアミナーゼを小型化する場合に、アミノ酸を欠失等の改変をさせた際に露出する断面の面積または該面積を示す指数が所定値以下となるように、より小さく、好ましくは最小化することで構造の安定化につながることを見出した。具体的に重要と考えられる要素としては、アミノ酸を欠失または置換させた際に露出する断面に現れる疎水性アミノ酸の数を、所定値以下とし、例えば他の改変を施した場合よりも減少させ、より好ましくは最小限にすることである。

　そこで、本開示の一実施形態において、デアミナーゼは、野生型デアミナーゼのＮ末端側およびＣ末端側が、前記デアミナーゼを改変した結果露出する断面に現れる疎水性アミノ酸残基の数が所定値以下、または最小化するように改変されることができる。他の実施形態において、改変されるデアミナーゼのアミノ酸残基はＮ末端またはＣ末端に限られるものではなく、デアミナーゼを改変した結果露出する断面に現れる疎水性アミノ酸残基の数が所定値以下、または最小化するように改変されるものであれば、配列内部（末端ではない）におけるアミノ酸を改変させることもできる。

　デアミナーゼを改変させる際に、単に欠失や置換によって露出してしまうアミノ酸の数を最小化したいのであれば、大規模な改変を施さなければよいということになるものの、デアミナーゼを小型化し、かつアミノ酸を改変させた際に露出する断面に現れる疎水性アミノ酸を最小限にするために、改変させたアミノ酸の数に対する露出した疎水性残基の割合を求め、この数値（本明細書において「露出断面指数」ともいう。）を指標とすることもできる。したがって、一実施形態において、前記デアミナーゼは、改変させたアミノ酸残基の数に対する、改変した結果露出する断面に現れる疎水性アミノ酸残基の数の割合を所定以下とし、または最小化するように改変されることができる。また改変した結果露出する断面に現れる疎水性残基を親水性残基に置換させるによってその指標を減らすこともできる。したがって、一実施形態において、デアミナーゼにおける露出した疎水性の内部アミノ酸残基の少なくとも１つが、親水性のアミノ酸残基に置換されることができる。

　例えば、後述の実施例において詳述するとおり、小型化シチジンデアミナーゼであるＰｍＣＤＡ１（３０－１５０）の場合には、１４の疎水性残基（Ｙ３４，Ｌ３６，Ｆ４９，Ｗ５０，Ｙ５２，Ｙ７８，Ｙ９１，Ｌ１０５，Ｗ１２２，Ｌ１２６，Ｙ１２８，Ｉ１３６，Ｗ１３９，Ｖ１５０）が現れるところ、欠失させたアミノ酸の数（８７残基）に対する露出した疎水性残基（１４残基）の割合を算出することで、その露出断面指数を数値化することもできる。

　したがって、一実施形態において、改変させたアミノ酸残基の数に対する、改変した結果露出する断面に現れる疎水性残基の割合は、例えば、約３％以下、約４％以下、約５％以下、約６％以下、約７％以下、約８％以下、約９％以下、約１０％以下、約１２％以下、約１４％以下、約１６％以下、約１８％以下、約２０％以下、約２２％以下、約２４％以下、約２６％以下、約２８％以下、約３０％以下、約３５％以下、約４０％以下、約４５％以下、約５０％以下、約５５％以下、約６０％以下、約６５％以下、約７０％以下、約７５％以下、約８０％以下、約８５％以下、約９０％以下、または約９５％以下とすることができる。

　また一実施形態において、前記デアミナーゼを改変した結果露出する断面に現れる疎水性アミノ酸残基の数は、例えば、約１個以下、約２個以下、約３個以下、約４個以下、約５個以下、約６個以下、約７個以下、約８個以下、約９個以下、約１０個以下、約１１個以下、約１２個以下、約１３個以下、約１４個以下、約１５個以下、約１６個以下、約１７個以下、約１８個以下、約１９個以下、約２０個以下、約２２個以下、約２４個以下、約２６個以下、約２８個以下、約３０個以下、約３５個以下、約４０個以下、約４５個以下、約５０個以下、約５５個以下、約６０個以下、約６５個以下、約７０個以下、約７５個以下、約８０個以下、約８５個以下、約９０個以下、約９５個以下、または約１００個以下とすることができる。他の実施形態において、上記のような改変させたアミノ酸残基の数に対する、改変した結果露出する断面に現れる疎水性残基の割合が所定値以下となる改変であれば、前記デアミナーゼを改変した結果露出する断面に現れる疎水性アミノ酸残基の数が１００個以上となる改変であってもよい。

　本明細書において、「サイズ」とはタンパク質などの分子の物理的または化学的な大きさを意味し、分子量、占有体積、質量などの大きさを含む。サイズが小さくなるとは、当該分子の分子量、体積、または質量などが減少することを含む。好ましくは分子量がより適切な指標となり得る。

　本明細書において、「最小化」とは、改変する前と比較して、または他の改変を施した場合と比較して、ある値が少なくとも減少している、または小さいことを意味し、最小値となっている必要はない。

　本明細書において、「改変」とは、アミノ酸が欠失または置換されることを含む。

　改変した場合にあるタンパク質（デアミナーゼなど）内の特定のアミノ酸が露出するかどうかは、モデリングなどで正確に計算することができ、例えばI-TASSER（https://zhanggroup.org/I-TASSER/）などを参照してタンパク質の構造予測を行うことができる。またその構造予測の際に元となるタンパク質の構造は、例えばRCSBPDB（https://www.rcsb.org/）などから取得することができ、AIDであれば5W1C（https://www.rcsb.org/structure/5W1C）を用いることができる

　一実施形態において、本開示は、二本鎖DNA中の標的ヌクレオチド配列と特異的に結合する核酸配列認識モジュールと、小型化シチジンデアミナーゼとが結合した、二本鎖DNAの改変用複合体（以下では、「本開示の小型化複合体」と称することがある。）を提供する。下記３．で説明する通り、本開示の小型化複合体と、目的の二本鎖DNA（例：ゲノムDNA）とを接触させることで、該二本鎖DNAの標的化された部位を改変することが可能となる。

　また、下述の実施例で示される通り、従来はCas9の末端に融合されていたシチジンデアミナーゼをCasエフェクタータンパク質の内部に埋め込むことにより、複合体としての安定性の向上及び基質DNAへのアクセス向上を図り、従来の複合体を用いた場合よりも高い効率を達成した。従って、本開示の別の態様において、核酸配列認識モジュールのＮ末端断片と、シチジンデアミナーゼと、核酸配列認識モジュールのＣ末端断片とが結合した複合体（以下では、「本開示の複合体（スプリット型）」と称することがある。）が提供される。本開示の複合体（スプリット型）を構成するシチジンデアミナーゼは、野生型のものであっても高い改変効率を発揮するが、小型化やオフターゲット効果抑制の観点からは、小型化シチジンデアミナーゼであることが好ましい。本開示の複合体（スプリット型）では、核酸配列認識モジュールのN末端断片とC末端断片がリフォールディングすることで、該核酸配列認識モジュールが、該二本鎖DNA中の標的ヌクレオチド配列と特異的に結合することが可能となる。以下では、「本開示の小型化複合体」と「本開示の複合体（スプリット型）」の両方を包含する用語として、「本開示の複合体」との用語を用いることがある。

　本開示の複合体（スプリット型）は、核酸配列認識モジュールのN末端断片と、シチジンデアミナーゼと、核酸配列認識モジュールのC末端断片とを、N末端からC末端にかけて、この順であるいは逆順で含む融合タンパク質として提供してもよく、この場合には、各要素間の少なくとも一方が、適当なリンカー（例：3xFlagリンカー、GSリンカー等）を介して連結していてもよく、リンカーを介さずに結合していてもよい。あるいは、核酸配列認識モジュールとシチジンデアミナーゼとを、それぞれ2つの断片に分断し、その一方の断片同士を連結して2つの部分的複合体を形成させ、これらが会合して機能的な核酸配列認識モジュールが再構成され標的ヌクレオチド配列に結合すると、機能的なシチジンデアミナーゼが再構成されるようにデザインされたスプリット酵素を用いることもできる。例えば、核酸配列認識モジュール及びシチジンデアミナーゼを、それぞれN末側断片とC末側断片とに分断し、例えば、N末側断片同士を連結した部分的複合体と、C末側断片同士を連結した部分的複合体とを作製し、これらを会合させることにより機能的な核酸配列認識モジュール及び機能的なシチジンデアミナーゼを再構成させることができる。また、2つの部分的複合体は、別個の分子として提供されてもよく、あるいは直接若しくは適当なリンカーを介して連結することにより、1つの融合タンパク質として提供されてもよい。

　下述の実施例で示される通り、本開示の複合体（スプリット型）において、シチジンデアミナーゼを、核酸配列認識モジュールのアミノ酸配列の複数の位置に挿入したところ、いずれの位置に挿入した場合であっても、従来の複合体を用いた場合よりも高い、あるいは同程度の改変効率を達成できることが実証された。さらに、挿入する位置を調整することで、変異導入部位を調整できることが示された。従って、シチジンデアミナーゼを挿入する位置は特に限定されないが、例えば、核酸配列認識モジュールとしてCRISPR-SpCas9システムを用いる場合には、SpCas9（配列番号４）の204位～1054位（例：204位、535位、1023位、1054位）のいずれかのアミノ酸残基と、C末端側に位置を１アミノ残基分ずらしたアミノ酸残基（例：205位、536位、1024位、1055位）との間でSpCas9を分断することが好ましい。例えば、SpCas9の204位と205位のアミノ酸残基間にシチジンデアミナーゼを挿入する場合には、SpCas9のC末端断片は、1～204からなる断片となり、N末端断片は、205～1368からなる断片となる。CRISPR-SaCas9システムを用いる場合には、SaCas9（配列番号５）の127位～848位（例：127位、538位、614位、690位、735位、848位）のいずれかのアミノ酸残基と、C末端側に位置を１アミノ残基分ずらしたアミノ酸残基（例：128位、539位、615位、691位、736位、849位）との間でSaCas9を分断することが好ましい。また、シチジンデアミナーゼの分断箇所は、分断された2つの断片が機能的なシチジンデアミナーゼに再構成され得る限り特に制限はなく、1か所で分断されてN末側断片とC末側断片としてもよいし、2か所以上で分断して生じる3以上の断片を適宜連結して2つの断片とすることもできる。シチジンデアミナーゼの3次元構造は公知であり、当業者であれば、当該情報に基づいて適宜分断箇所を選択することができる。

　本明細書において、「小型化シチジンデアミナーゼ」とは、野生型シチジンデアミナーゼのアミノ酸残基の一部を欠失させることで、野生型シチジンデアミナーゼと比較して分子量が低減したシチジンデアミナーゼを意味する。かかる小型化シチジンデアミナーゼとして、具体的には、一実施形態において、
　（１）配列番号１で示されるアミノ酸配列における３０位～１５０位のアミノ酸残基の領域からなるアミノ酸配列、
　（２）配列番号１で示されるアミノ酸配列からなるタンパク質のオルソログであって、（１）の領域に対応する領域からなるアミノ酸配列、
　（３）（１）若しくは（２）のアミノ酸配列において、1若しくは数個のアミノ酸が欠
失、置換、挿入及び／若しくは付加されたアミノ酸配列、又は
　（４）（１）若しくは（２）のアミノ酸配列と９０％以上の類似性又は同一性を有するアミノ酸配列
からなるシチジンデアミナーゼが挙げられる。ただし、上記（３）及び（４）のシチジンデアミナーゼからは、野生型のシチジンデアミナーゼや、配列番号１の２８位～１６１位の領域(134アミノ酸配列からなる領域)を少なくとも含む、該シチジンデアミナーゼの断片は除かれるものとする。以下では、「小型化シチジンデアミナーゼ」と「野生型シチジンデアミナーゼ」の両方を包含する用語として、単に「シチジンデアミナーゼ」との用語を用いることがある。

　配列番号１で示されるアミノ酸配列からなるシチジンデアミナーゼは、ヤツメウナギ由来のPmCDA1（Petromyzon marinus cytosinedeaminase 1）であり、かかるPmCDA1のオルソログとしては、例えば、哺乳動物（例、ヒト、ブタ、ウシ、ウマ、サル等）由来のAID（Activation-inducedcytidine deaminase; AICDA）などが挙げられる。例えば、PmCDA1のcDNAの塩基配列及びアミノ酸配列は、GenBankaccession No. EF094822及びABO15149を、ヒトAIDのcDNAの塩基配列及びアミノ酸配列はGenBank accession No.NM_020661及びNP_065712を、それぞれ参照することができる。

　上記（３）に関し、より具体的には、（i）配列番号１に示されるアミノ酸配列中の1～50個、好ましくは1～20個、より好ましくは1～数（5、4、3若しくは2）個のアミノ酸が欠失したアミノ酸配列、（ii）配列番号１に示されるアミノ酸配列に1～50個、好ましくは1～20個、より好ましくは1～数（5、4、3若しくは2）個のアミノ酸が付加したアミノ酸配列、（iii）配列番号１に示されるアミノ酸配列に1～50個、好ましくは1～20個、より好ましくは1～数（5、4、3若しくは2）個のアミノ酸が挿入されたアミノ酸配列、（iv）配列番号１に示されるアミノ酸配列中の1～50個、好ましくは1～20個、より好ましくは1～数（5、4、3若しくは2）個のアミノ酸が他のアミノ酸で置換されたアミノ酸配列、又は（v）それらを組み合わせたアミノ酸配列を含むシチジンデアミナーゼが挙げられる。

　下述の実施例で示される通り、シチジンデアミナーゼにおける、外部に露出した疎水性アミノ酸残基を親水性アミノ酸残基に置換することで、タンパク質の安定化に起因すると推測されるシチジンデアミナーゼによる改変効率の向上効果が実証された。従って、上記シチジンデアミナーゼの外部に露出した疎水性アミノ酸残基を、親水性アミノ酸残基へと置換することが好ましい。かかる外部に露出した疎水性アミノ酸残基としては、PmCDA1を例にすれば、例えば、34位(Y)、36位(L)、50位(W)、52位(Y)、54位(V)、74位(Y)、94位(W)、105位(L)、122位(W)、126位(L)、136位(I)、139位(W)及び150位(V)、並びにヤツメウナギ以外の動物に由来するシチジンデアミナーゼにおける、これらアミノ酸残基に対応する位置から選択される位置のアミノ酸残基が挙げられる（かっこ書きのアルファベットはアミノ酸残基を示す）。中でも122位、126位及び139位からなる群から選択される位置のアミノ酸残基が好ましい。また、親水性アミノ酸残基としては、アルギニン、アスパラギン、アスパラギン酸、グルタミン酸、グルタミン、リジン、セリン及びスレオニンが挙げられる。

　シチジンデアミナーゼのアミノ酸配列は脊椎動物間で高度に保存されており、所望の動物由来のシチジンデアミナーゼのアミノ酸配列を、PmCDA1のアミノ酸配列とアラインすることにより、対応する欠失対象の部位、あるいは対応する変異部位を同定することができる。対応するアミノ酸残基が親水性アミノ酸である場合は、置換しなくてもよく、あるいは他の親水性アミノ酸残基に置換してもよい。例えば、ヒトAIDの場合、PmCDA1のS30に対応するアミノ酸は、27番目のスレオニンであり、PmCDA1のV150に対応するアミノ酸は、138番目のイソロイシンであり、PmCDA1のW122に対応するアミノ酸は、109番目のフェニルアラニンであり、PmCDA1のL126に対応するアミノ酸は、113番目のロイシンであり、PmCDA1のW139に対応するアミノ酸は、127番目のアルギニンである。これらのアミノ酸残基は、上記の任意の親水性アミノ酸残基に置換することができるが、PmCDA1を例にすれば、好ましい態様において、W122（ヒトAIDのF109）をグルタミン酸残基若しくはグルタミン酸残基に、L126（ヒトAIDのL113）をアスパラギン残基に、及び／又はW139（ヒトAIDのR127）をアルギニン残基又はグルタミン残基に置換することが好ましい。一方で、デアミナーゼ活性の触媒ドメイン（PmCDA1の66-100位の領域、ヒトAIDの56-90位の領域）に存在する、βシート間のループを形成する、などの特定のアミノ酸残基の置換は好ましくなく（換言すれば、これらのアミノ酸残基は保存されていることが好ましい）、かかる置換が好ましくないアミノ酸残基としては、PmCDA1を例にすれば、F49（ヒトAIDのD45）、I65（ヒトAIDのC55）、Y78（ヒトAIDのW68）、Y91（ヒトAIDのF81）、L112（ヒトAIDのL98）、Y128（ヒトAIDのF115）、及び上記ループを形成する145-150位の領域（ヒトAIDの133-138位の領域）、並びに、ヤツメウナギ以外の動物に由来するシチジンデアミナーゼにおける、これらアミノ酸残基に対応するアミノ酸残基が挙げられる。

　また、上記のシチジンデアミナーゼの外部に露出した疎水性アミノ酸残基の2つ以上を親水性アミノ酸残基へ置換してもよく、PmCDA1を例にすれば、例えば、122位、126位及び139位からなる群から選択される位置のアミノ酸残基の内の2箇所以上（例えば、122位及び139位）などが挙げられ、具体的には、W122E/W139R、W122E/W139Q、W122Q/W139R、W122Q/W139Qなどの変異の組み合わせを含む置換が挙げられる。

　本明細書において、アミノ酸配列の「類似性」とは、当該技術分野において公知の数学的アルゴリズムを用いて2つのアミノ酸配列をアラインさせた場合の、最適なアラインメント（好ましくは、該アルゴリズムは最適なアラインメントのために配列の一方若しくは両方へのギャップの導入を考慮し得るものである）における、オーバーラップする全アミノ酸残基に対する同一アミノ酸及び類似アミノ酸残基の割合（％）を意味する。「類似アミノ酸」とは物理化学的性質において類似したアミノ酸を意味し、例えば、芳香族アミノ酸（Phe、Trp、Tyr）、脂肪族アミノ酸（Ala、Leu、Ile、Val）、極性アミノ酸（Gln、Asn）、塩基性アミノ酸（Lys、Arg、His)、酸性アミノ酸(Glu、Asp）、水酸基を有するアミノ酸（Ser、Thr）、側鎖の小さいアミノ酸（Gly、Ala、Ser、Thr、Met）などの同じグループに分類されるアミノ酸が挙げられる。このような類似アミノ酸による置換はタンパク質の表現型に変化をもたらさない（即ち、保存的アミノ酸置換である）ことが予測される。保存的アミノ酸置換の具体例は当該技術分野で周知であり、種々の文献に記載されている（例えば、Bowieら，Science,247: 1306-1310 (1990)を参照）。本明細書におけるアミノ酸配列の類似性又は同一性は、相同性計算アルゴリズムNCBIBLAST(National Center　for Biotechnology Information Basic Local AlignmentSearch Tool)を用い、以下の条件（期待値＝10；ギャップを許す；マトリクス＝BLOSUM62；フィルタリング＝OFF）にて計算することができる。

　本明細書において、二本鎖DNAの「改変」とは、DNA鎖上のあるヌクレオチド（例えば、dC）が、他のヌクレオチド（例えば、dT、dA又はdG）に変換されるか、欠失すること、あるいはDNA鎖上のあるヌクレオチド間にヌクレオチド若しくはヌクレオチド配列が挿入されることを意味する。ここで、改変される二本鎖DNAは、宿主細胞内に存在する二本鎖DNAであれば特に制限されないが、好ましくはゲノムDNA（例：染色体DNA、ミトコンドリアDNA、葉緑体DNA等）である。従って、二本鎖DNAの標的化された部位の改変は、該標的化された部位の１以上のヌクレオチドが他の１以上のヌクレオチドへの変換、欠失、あるいは該標的化された部位への１以上のヌクレオチドの挿入を意味する。また、二本鎖DNAの「標的化された部位」とは、核酸配列認識モジュールが特異的に認識して結合する「標的ヌクレオチド配列」の全部若しくは一部、又はそれと該標的ヌクレオチド配列の近傍（5’上流及び3’下流のいずれか一方又は両方）を意味し、その範囲は目的に応じて、1塩基～数百塩基長の間で適宜調節することができる。

　本明細書において、「核酸配列認識モジュール」とは、DNA鎖上の特定のヌクレオチド配列（即ち、標的ヌクレオチド配列）を特異的に認識して結合する能力を有する分子又は分子複合体を意味する。核酸配列認識モジュールが標的ヌクレオチド配列に結合することにより、該モジュールに連結されたシチジンデアミナーゼが、二本鎖DNAの標的化された部位に特異的に作用することを可能にする。

　本開示の複合体（「核酸改変酵素複合体」ともいう。）は、上記核酸配列認識モジュールとシチジンデアミナーゼとが連結された複合体であって、特定のヌクレオチド配列認識能が付与された脱アミノ化活性を有する分子複合体を意味する。ここで「複合体」は、複数の分子で構成されるものだけでなく、融合タンパク質のように、核酸配列認識モジュールとシチジンデアミナーゼとを単一の分子内に有するものも包含される。よって、核酸配列認識モジュールとしてCRISPR-Casシステムを用いる場合には、ガイドRNAと、Casエフェクタータンパク質（Casタンパク質又はCasヌクレアーゼともいう。）と、シチジンデアミナーゼとにより構成される複合体であってもよく、また、ガイドRNAと、Casエフェクタータンパク質及びシチジンデアミナーゼの融合タンパク質とにより構成される複合体であってもよい。

　上述の通り、本開示の複合体は、塩基除去修復のインヒビターを含まずとも、効率よく二本鎖DNAを改変することができる。しかしながら、下述の実施例で示される通り、小型化シチジンデアミナーゼを用いることで、ウラシルDNAグリコシラーゼの阻害剤を併用しても、野生型シチジンデアミナーゼを用いたものよりもオフターゲット効果を顕著に低減できることが実証された。かかるオフターゲット効果の抑制は、望まれないDNAへの親和性を持つシチジンデアミナーゼのドメインが除かれたことに起因すると推察される。従って、本開示の複合体は、さらにウラシルDNAグリコシラーゼの阻害剤が連結されていてもよい。

　本開示に用いるウラシルDNAグリコシラーゼの阻害剤としては、枯草菌（Bacillus subtilis）バクテリオファージであるPBS1由来のウラシルDNAグリコシラーゼ阻害剤(UGI)又は枯草菌バクテリオファージであるPBS2由来のウラシルDNAグリコシラーゼ阻害剤(UGI)が挙げられるが（Wang,Z., and Mosbaugh, D. W. (1988) J. Bacteriol. 170, 1082-1091）、これらに限定されない。特に、PBS2由来のUGIは、DNA上のCからT以外の変異や切断、及び組み換えを起こさせにくくするとの効果も知られていることから、PBS2由来のUGIを使用することが適している。

　核酸配列認識モジュールにより認識される、二本鎖DNA中の標的ヌクレオチド配列は、該モジュールが特異的に結合し得る限り特に制限されず、二本鎖DNA中の任意の配列であってよい。標的ヌクレオチド配列の長さは、核酸配列認識モジュールが特異的に結合するのに十分であればよく、例えば、哺乳動物のゲノムDNA中の特定の部位に変異を導入する場合、そのゲノムサイズに応じて、12ヌクレオチド以上、好ましくは15ヌクレオチド以上、より好ましくは17ヌクレオチド以上である。長さの上限は特に制限されないが、好ましくは25ヌクレオチド以下である。

　かかる核酸配列認識モジュールとしては、例えば、Casの少なくとも１つのDNA切断能が失活したCRISPR-Casシステム（以下、「CRISPR-変異Casシステム」ともいう。）、ジンクフィンガーモチーフ、TALエフェクター及びPPRモチーフ等の他、制限酵素、転写因子、RNAポリメラーゼ等のDNAと特異的に結合し得るタンパク質のDNA結合ドメインを含み、DNA二本鎖切断能を有しないフラグメント等が用いられ得るが、これらに限定されない。好ましくは、CRISPR-変異Casシステム、ジンクフィンガーモチーフ、TALエフェクター、PPRモチーフ等が挙げられる。

　ジンクフィンガーモチーフは、Cys2His2型の異なるジンクフィンガーユニット（1フィンガーが約3塩基を認識する）を3～6個連結させたものであり、9～18塩基の標的ヌクレオチド配列を認識することができる。ジンクフィンガーモチーフは、Modularassembly法（Nat Biotechnol (2002) 20: 135-141）、OPEN法（Mol Cell (2008) 31: 294-301）、CoDA法（NatMethods (2011) 8: 67-69）、大腸菌one-hybrid法（Nat Biotechnol (2008) 26:695-701）等の公知の手法により作製することができる。ジンクフィンガーモチーフの作製の詳細については、特許第4968498号公報を参照することができる。

　TALエフェクターは、約34アミノ酸を単位としたモジュールの繰り返し構造を有しており、1つのモジュールの12及び13番目のアミノ酸残基（RVDと呼ばれる）によって、結合安定性と塩基特異性が決定される。各モジュールは独立性が高いので、モジュールを繋ぎ合わせるだけで、標的ヌクレオチド配列に特異的なTALエフェクターを作製することが可能である。TALエフェクターは、オープンリソースを利用した作製方法（REAL法(CurrProtoc Mol Biol (2012) Chapter 12: Unit 12.15)、FLASH法(Nat Biotechnol (2012) 30:460-465)、Golden Gate法(Nucleic Acids Res (2011) 39： e82)等）が確立されており、比較的簡便に標的ヌクレオチド配列に対するTALエフェクターを設計することができる。TALエフェクターの作製の詳細については、特表2013-513389号公報を参照することができる。

　PPRモチーフは、35アミノ酸からなり1つの核酸塩基を認識するPPRモチーフの連続によって、特定のヌクレオチド配列を認識するように構成されており、各モチーフの1、4及びii（-2）番目のアミノ酸のみで標的塩基を認識する。モチーフ構成に依存性はなく、両脇のモチーフからの干渉はないので、TALエフェクター同様、PPRモチーフを繋ぎ合わせるだけで、標的ヌクレオチド配列に特異的なPPRタンパク質を作製することが可能である。PPRモチーフの作製の詳細については、特開2013-128413号公報を参照することができる。

　また、制限酵素、転写因子、RNAポリメラーゼ等のフラグメントを用いる場合、これらのタンパク質のDNA結合ドメインは周知であるので、該ドメインを含み、且つDNA二本鎖切断能を有しない断片を容易に設計し、構築することができる。

　上記いずれかの核酸配列認識モジュールは、シチジンデアミナーゼとの融合タンパク質として提供することもできるし、あるいは、SH3ドメイン、PDZドメイン、GKドメイン、GBドメイン等のタンパク質結合ドメインとそれらの結合パートナーとを、核酸配列認識モジュールと、シチジンデアミナーゼとにそれぞれ融合させ、該ドメインとその結合パートナーとの相互作用を介してタンパク質複合体として提供してもよい。あるいは、核酸配列認識モジュールと、シチジンデアミナーゼとにそれぞれインテイン（intein）を融合させ、各タンパク質合成後のライゲーションにより、両者を連結することもできる。

　ジンクフィンガーモチーフは、標的ヌクレオチド配列に特異的に結合するジンクフィンガーの作製効率が高くなく、また、結合特異性の高いジンクフィンガーの選別が煩雑なため、実際に機能するジンクフィンガーモチーフを多数作製するのは容易ではない。TALエフェクターやPPRモチーフは、ジンクフィンガーモチーフに比べて標的核酸配列認識の自由度が高いが、標的ヌクレオチド配列に応じて巨大なタンパク質をその都度設計し、構築する必要があるので、効率面で問題が残る。
　これに対し、CRISPR-Casシステムは、標的ヌクレオチド配列に対して相補的なガイドRNAにより目的の二本鎖DNAの配列を認識するので、標的ヌクレオチド配列と特異的にハイブリッド形成し得るオリゴDNAを合成するだけで、任意の配列を標的化することができる。
　従って、本開示のより好ましい実施態様においては、核酸配列認識モジュールとして、Casの１つのみ、又は両方のDNA切断能が失活したCRISPR-変異Casシステムが用いられる。

　CRISPR-変異Casシステムは、標的ヌクレオチド配列と相補的な配列を含むCRISPR-RNA（crRNA）と、必要に応じて変異Casエフェクタータンパク質のリクルートに必要なtrans-activatingRNA（tracrRNA）と（tracrRNAが必要な場合は、crRNAとのキメラRNAとして提供され得る）、変異Casエフェクタータンパク質との複合体として提供される。変異Casエフェクタータンパク質と組み合わせて核酸配列認識モジュールを構成する、crRNA単独あるいはcrRNAとtracrRNAとのキメラRNAからなるRNA分子を「ガイドRNA」と総称する。また、本明細書において、「標的鎖(targetedstrand)」とは、crRNAとハイブリッド形成する方の鎖を意味し、その反対鎖で標的鎖とcrRNAとのハイブリッド形成により一本鎖状になる鎖を「非標的鎖（non-targetedstrand）」と呼ぶこととする。また、標的ヌクレオチド配列を片方の鎖で表現する場合（例えばPAM配列を表記する場合や、標的ヌクレオチド配列とPAMとの位置関係を表す場合等）、非標的鎖の配列で代表させるものとする。

　本開示で使用されるCasエフェクタータンパク質は、ガイドRNAと複合体を形成して、目的遺伝子中の標的ヌクレオチド配列とそれに隣接するprotospaceradjacent motif（PAM）を認識し結合し得る限り、特に制限はないが、好ましくはCas9又はCpf1である。Cas9としては、例えば、ストレプトコッカス・ピオゲネス（Streptococcuspyogenes）由来のCas9（SpCas9；PAM配列NGG（NはA、G、T又はC。以下同じ））、ストレプトコッカス・サーモフィラス（Streptococcusthermophilus）由来のCas9（StCas9；PAM配列NNAGAAW）、ナイセリア・メニンギチジス（Neisseria meningitidis）由来のCas9（NmCas9；PAM配列NNNNGATT）、スタフィロコッカス・アウレウス（Staphylococcusaureus）由来のCas9(SaCas9；PAM配列：NNGRR(T)）、カンピロバクター・ジェジュニ（Campylobacter jejuni）由来のCas9（CjCas9；PAM配列NNNVRYM(VはA、G又はC；RはA又はG；YはT又はC；MはA又はCを示す））が挙げられるが、これらに限定されない。PAMによる制約の観点からは、SpCas9が好ましい（実質2塩基であり、理論上ゲノム上のほぼどこでも標的化することができる）。また、サイズの観点からは、好ましくは、SaCas9若しくはCjCas9である。また、Cpf1としては、例えば、フランシセラ・ノヴィシダ（Francisellanovicida）由来のCpf1（FnCpf1; PAM配列NTT）、アシダミノコッカス sp.（Acidaminococcus sp.）由来のCpf1（AsCpf1;PAM配列NTTT）、ラクノスピラ科細菌（Lachnospiraceaebacterium）由来のCpf1（LbCpf1; PAM配列NTTT）等が挙げられるが、それらに限定されない。本開示で用いられる変異Casエフェクタータンパク質としては、Casエフェクタータンパク質の二本鎖DNAの両方の鎖の切断能が失活したものと、一方の鎖の切断能のみを失活したニッカーゼ活性を有するものの、いずれも使用可能である。例えば、SpCas9の場合、10番目のAsp残基がAla残基に変換した、ガイドRNAと相補鎖を形成する鎖（即ち、「標的鎖」）の反対鎖（即ち、「非標的鎖」）の切断能を欠く（従って、ガイドRNAと相補鎖を形成する鎖に対するニッカーゼ活性を有する）D10A変異体、あるいは、840番目のHis残基がAla残基で変換した、ガイドRNAと相補鎖を形成する鎖の切断能を欠く（従って、ガイドRNAと相補鎖を形成する鎖の反対鎖に対するニッカーゼ活性を有する）H840A変異体、さらにはその二重変異体（dCas9）を用いることができる。SaCas9の場合は、10番目のAsp残基をAla残基に変換し、及び／又は556番目のAsp残基、557番目のHis残基及び／又は580番目のAsn残基をAla残基に変換した変異体を作製することができる。CjCas9の場合、8番目のAsp残基をAla残基に変換し、及び／又は、559番目のHis残基をAla残基に変換した変異体を用いることもできる。また、FnCpf1の場合、917番目のAsp残基がAla残基（D917A）に、あるいは1006番目のGlu残基がAla残基（E1006A）に変換した、両方の鎖の切断能を欠く変異体を用いることができる。二本鎖DNAの少なくとも一方の鎖の切断能を欠く限り、他の変異Casエフェクタータンパク質も同様に用いることができる。

　Casエフェクタータンパク質は、上記変異の他に、さらなる欠失や変異を含んでいてもよい。例えば、野生型タンパク質とPAM認識配列が異なる変異Casエフェクタータンパク質も知られており、かかるタンパク質としては、例えば、E108G/S217A/A262T/S409I/E480K/E543D/M694I/E1219VのSpCas9の変異体(xCas93.6)、A262T/R324L/S409I/E480K/E694D/M694I/E1219VのSpCas9の変異体(xCas9 3.7) (PAM配列：NG、GAA及びGAT)(Hu JH, et al., Nature., 556(7699): 57-63 (2018))、R1335V/L1111R/D1135V/G1218R/E1219F/A1322R/T1337RのSpCas9の変異体(SpCas9-NG)(PAM配列:NGN) (Nishimasu H, et al., Science., 361(6408):1259-1262 (2018))、これらの変異を組み合わせて作製された、A262T/R324L/S409I/E480K/E543D/M694I/L1111R/D1135V/G1218R/E1219F/A1322R/R1335V/T1337RのSpCas9の変異体(xCas9-NG)(Legut M, et al., Cell Rep, 30(9): 2859-2868 (2020))、D1135L/S1136W/G1218K/E1219Q/R1335Q/T1337RのSpCas9の変異体(SpG)(PAM配列:NGN)、D1135L/S1136W/G1218K/E1219Q/R1335Q/T1337R/L1111R/A1322R/A61R/N1317R/R1333PのSpCas9の変異体(SpG)(PAM配列:NRN及びNYN) (Walton RT, et al., Science, 368(6488):290-296 (2020))、D1135V/R1335Q/T1337R/のSpCas9の変異体(SpCas9-VQR)(PAM配列：NGA)、VERE; D1135V/G1218R/R1335E/T1337RのSpCas9の変異体 (SpCas9-VERE) (PAM配列：NGCG)、E782K/N968K/R1015HのSaCas9の変異体)(SaCas9-KKH) (PAM配列：NNRRRT)や、SpCas9-NRRH, SpCas9-NRTH並びにSpCas9-NRCH)(PAM配列：それぞれNRRH,NRCH及びNRTH) (Miller SM, et al., Nat　Biotechnol. 38(4):471-481 (2020))などが挙げられる。

２．二本鎖DNA改変用複合体をコードする核酸
　また、核酸配列認識モジュールとデアミナーゼ（例えばシチジンデアミナーゼ）とが結合した複合体を含んでなる本開示の複合体と、二本鎖DNAとの接触は、目的の二本鎖DNAを有する細胞に、該複合体をコードする核酸（以下では、「本開示の核酸」と称することがある。）を導入することにより、実施されてもよい。また、本開示の核酸を用いて、分子生物学的手法により、本開示の複合体や、該複合体の各構成分子を製造することもできる。従って、核酸配列認識モジュールと、シチジンデアミナーゼとは、それらの融合タンパク質をコードする核酸として、あるいは、結合ドメインやインテイン等を利用してタンパク質に翻訳後、宿主細胞内で複合体を形成し得るような形態で、それらをそれぞれコードする核酸として調製してもよい。ここで核酸は、DNAであってもRNAであってもよい。DNAの場合は、好ましくは二本鎖DNAであり、宿主細胞内で機能的なプロモーターの制御下に配置した発現ベクターの形態で、あるいは該DNAを含む発現ベクターの形態で提供される。RNAの場合は、好ましくは一本鎖RNAである。

　本明細書において、「複合体をコードする」には、該複合体を構成する分子それぞれをコードすること、及び構成する２以上の分子を単一の分子内に有する融合タンパク質をコードすることの両方が包含される。

　ジンクフィンガーモチーフ、TALエフェクター、PPRモチーフ等の核酸配列認識モジュールをコードするDNAは、各モジュールについて上記したいずれかの方法により取得することができる。制限酵素、転写因子、RNAポリメラーゼ等の配列認識モジュールをコードするDNAは、例えば、それらのcDNA配列情報に基づいて、当該タンパク質の所望の部分（DNA結合ドメインを含む部分）をコードする領域をカバーするようにオリゴDNAプライマーを合成し、当該タンパク質を産生する細胞より調製した全RNA若しくはmRNA画分を鋳型として用い、RT-PCR法によって増幅することにより、クローニングすることができる。
　シチジンデアミナーゼをコードするDNAも、同様に、使用するシチジンデアミナーゼのcDNA配列情報をもとに、所望のアミノ酸残基の欠失が達成できるようにオリゴDNAプライマーを合成し、当該シチジンデアミナーゼを産生する細胞より調製した全RNA若しくはmRNA画分を鋳型として用い、RT-PCR法によって増幅することにより、クローニングすることができる。例えば、ヤツメウナギの小型化PmCDA1をコードするDNAは、NCBIデータベースに登録されているcDNA配列（accessionNo. EF094822）をもとに、CDSの適切な領域に対して適当なプライマーを設計し、ヤツメウナギ由来mRNAからRT-PCR法によりクローニングできる。また、ヒトAIDをコードするDNAは、NCBIデータベースに登録されているcDNA配列（accessionNo. AB040431）をもとに、同様にクローニングできる。また、標的化された部位の改変にドナーDNAを用いる場合には、該ドナーDNAも、該部位の配列情報等に基づき、上記と同様にクローニングできる。
　クローン化されたDNAは、そのまま、又は所望により制限酵素で消化するか、適当なリンカー及び/又は核移行シグナル（目的の二本鎖DNAがミトコンドリアや葉緑体DNAの場合は、各オルガネラ移行シグナル）を付加した後に、核酸配列認識モジュールをコードするDNAとライゲーションして、融合タンパク質をコードするDNAを調製することができる。あるいは、核酸配列認識モジュールをコードするDNAと、シチジンデアミナーゼをコードするDNAに、それぞれ結合ドメイン若しくはその結合パートナーをコードするDNAを融合させるか、両DNAに分離インテインをコードするDNAを融合させることにより、核酸配列認識変換モジュールとシチジンデアミナーゼとが宿主細胞内で翻訳された後に複合体を形成できるようにしてもよい。これらの場合も、所望により一方若しくは両方のDNAの適当な位置に、リンカー及び/又は核移行シグナルを連結することができる。また、標的化された部位の改変にドナーDNAを用いる場合には、該ドナーDNAAは、単一DNAとして作製してもよいし、核酸配列認識モジュール及び／又はシチジンデアミナーゼをコードする核酸を含む単一のDNAとして提供されてもよい。

　核酸配列認識モジュールをコードするDNA、シチジンデアミナーゼをコードするDNA、ドナーDNAは、化学的にDNA鎖を合成するか、若しくは合成した一部オーバーラップするオリゴDNA短鎖を、PCR法やGibsonAssembly法を利用して接続することにより、その全長をコードするDNAを構築することも可能である。ドナーDNAが一本鎖核酸の場合、化学的にDNA鎖を合成する以外の方法として、例えば、該DNAを含むプラスミドDNAを制限酵素により消化して一本鎖とし、RNAポリメラーゼによりRNAを合成した後、逆転写酵素によりｃDNAを合成し、RNaseHによりRNA鎖を分解することで作製することができる。あるいは、ニッカーゼ型制限酵素によりドナーDNAを含むプラスミドを消化し、電気泳動による分離・精製を経て作製することもできる。化学合成又はPCR法若しくはGibsonAssembly法との組み合わせで全長DNAを構築することの利点は、該DNAを導入する宿主に合わせて使用コドンをCDS全長にわたり設計できる点にある。異種DNAの発現に際し、そのDNA配列を宿主生物において使用頻度の高いコドンに変換することで、タンパク質発現量の増大が期待できる。使用する宿主におけるコドン使用頻度のデータは、例えば（公財）かずさDNA研究所のホームページに公開されている遺伝暗号使用頻度データベース（http://www.kazusa.or.jp/codon/index.html）を用いることができ、又は各宿主におけるコドン使用頻度を記した文献を参照してもよい。入手したデータと導入しようとするDNA配列を参照し、該DNA配列に用いられているコドンの中で宿主において使用頻度の低いものを、同一のアミノ酸をコードし使用頻度の高いコドンに変換すればよい。

　核酸配列認識モジュール及び/又はデアミナーゼ（例えばシチジンデアミナーゼ）をコードする核酸を含む発現ベクターは、例えば、該DNAを適当な発現ベクター中のプロモーターの下流に連結することにより製造することができる。
　発現ベクターとしては、大腸菌由来のプラスミド（例、pBR322，pBR325，pUC12，pUC13）；枯草菌由来のプラスミド（例、pUB110，pTP5，pC194）；酵母由来プラスミド（例、pSH19，pSH15）；昆虫細胞発現プラスミド（例：pFast-Bac）；動物細胞発現プラスミド（例：pA1-11、pXT1、pRc/CMV、pRc/RSV、pcDNAI/Neo）；λファージなどのバクテリオファージ；バキュロウイルスなどの昆虫ウイルスベクター（例：BmNPV、AcNPV）；レトロウイルス、ワクシニアウイルス、アデノウイルス、アデノ随伴ウイルス（AAV）などの動物ウイルスベクターなどが用いられる。遺伝子治療における利用を考慮すれば、導入遺伝子を長期にわたり発現させられる点や非病原性ウイルス由来で安全性の点からは、AAVベクターが好適に用いられる。

　本開示においては種々のデアミナーゼを用いることができ、例えばシチジンデアミナーゼは、野生型シチジンデアミナーゼと比較して分子量が低減されているため、必要に応じて核酸配列認識モジュールを分子量が低いもの（例えば、SaCas9やCjCas9など）を用いることで、核酸配列認識モジュールをコードする核酸と、シチジンデアミナーゼをコードする核酸とを、単一のAAVベクターに搭載することが可能となる。あるいは、核酸塩基モジュールの一部を欠失させることで（例えば、SpCas9の1024位～1054位を欠失させる）ことにより、分子量を低減させることもできる。即ち、核酸配列認識モジュールとしてCRISPR-Casシステムを用いる場合には、Casエフェクタータンパク質をコードする核酸と、ガイドRNAをコードする核酸と、シチジンデアミナーゼをコードする核酸とを、全て単一のAAVベクターに搭載することも可能となる。また、本明細書において、「核酸配列認識モジュール」には、野生型だけでなく、核酸配列認識能を有するその改変体（例：上記のSpCas9の改変体等）も包含されるものとする。

　ウイルスベクターを発現ベクターとして用いる場合には、目的とする組織や臓器への感染に適した血清型(serotype)に由来するベクターを用いることが好ましい。AAVベクターの例を挙げれば、中枢神経系や網膜を標的とする場合には、AAV1, 2, 3, 4, 5, 7, 8, 9又は10をベースとしたベクター、心臓を標的とする場合には、AAV 1, 3, 4, 6又は9をベースとしたベクター、肺を標的とする場合には、AAV1, 5, 6, 9又は10をベースとしたベクター、肝臓を標的とする場合には、AAV 2, 3, ,6, 7, 8, 又は9をベースとしたベクター、骨格筋を標的とする場合には、AAV1, 2, 6, 7, 8, 9をベースとしたベクターを用いることが好ましい。また、がん治療のためには、AAV 2を用いることが好ましい。AAVの血清型に関しては、例えば、WO2005/033321 A2などを参照することができる。

　プロモーターとしては、遺伝子の発現に用いる宿主に対応して適切なプロモーターであればいかなるものでもよい。DSBを伴う従来法では毒性のために宿主細胞の生存率が著しく低下する場合があるので、誘導プロモーターを使用して誘導開始までに細胞数を増やしておくことが望ましいが、本開示の複合体を発現させても十分な細胞増殖が得られるので、構成プロモーターも制限なく使用することができる。
　例えば、宿主が動物細胞である場合、SRαプロモーター、SV40プロモーター、LTRプロモーター、CMV（サイトメガロウイルス）プロモーター、RSV（ラウス肉腫ウイルス）プロモーター、MoMuLV（モロニーマウス白血病ウイルス）LTR、HSV-TK（単純ヘルペスウイルスチミジンキナーゼ）プロモーターなどが用いられる。なかでも、CMVプロモーター、SRαプロモーターなどが好ましい。
　宿主が大腸菌である場合、trpプロモーター、lacプロモーター、recAプロモーター、λP_Lプロモーター、lppプロモーター、T7プロモーターなどが好ましい。
　宿主がバチルス属菌である場合、SPO1プロモーター、SPO2プロモーター、penPプロモーターなどが好ましい。
　宿主が酵母である場合、Gal1/10プロモーター、PHO5プロモーター、PGKプロモーター、GAPプロモーター、ADHプロモーターなどが好ましい。
　宿主が昆虫細胞である場合、ポリヘドリンプロモーター、P10プロモーターなどが好ましい。
　宿主が植物細胞である場合、CaMV35Sプロモーター、CaMV19Sプロモーター、NOSプロモーターなどが好ましい。

　発現ベクターとしては、上記の他に、所望によりエンハンサー、スプライシングシグナル、ターミネーター、ポリＡ付加シグナル、薬剤耐性遺伝子、栄養要求性相補遺伝子等の選択マーカー、複製起点などを含有しているものを用いることができる。

　核酸配列認識モジュール及び/又はシチジンデアミナーゼをコードするRNAは、例えば、上記した核酸配列認識モジュール及び/又はシチジンデアミナーゼをコードするDNAを鋳型として、自体公知のインビトロ転写系にてmRNAに転写することにより調製することができる。

　ガイドRNAをコードするDNAは、標的ヌクレオチド配列に対して相補的なヌクレオチド配列（本明細書中、「ターゲッティング配列（targetingsequence）」ともいう）を含む、crRNA配列（例えば、Casエフェクタータンパク質としてFnCpf1をリクルートする場合、ターゲッティング配列の5’側に配列番号２；AAUUUCUACUGUUGUAGAUを含むcrRNAを用いることができ、下線部の配列同士が塩基対を形成しステム-ループ構造をとる）のコード配列、あるいは、crRNAコード配列と必要に応じて既知のtracrRNAコード配列（例えば、Casエフェクタータンパク質としてCas9をリクルートする場合のtracrRNAコード配列として、gttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt;配列番号６（SpCas9の場合）、又はgttttagtactctggaaacagaatctactaaaacaaggcaaaatgccgtgtttatctcgtcaacttgttggcgagattttttt；配列番号７（SaCas9の場合）など）とを連結したオリゴDNA配列を設計し、DNA/RNA合成機を用いて、化学的に合成することができる。

　ターゲッティング配列の長さは、標的ヌクレオチド配列に対して特異的に結合し得る限り特に制限はないが、例えば15～30ヌクレオチド、好ましくは18～25ヌクレオチドである。

　ターゲッティング配列の設計は、例えば、Casエフェクタータンパク質としてCas9を用いる場合、公開のガイドRNA設計ウェブサイト（CRISPR DesignTool、CRISPRdirect等）を用いて、目的遺伝子のCDS配列の中からPAM（例えば、SpCas9の場合、NGG）を3’側に隣接する20mer配列をリストアップし、その5’端から3’方向に7ヌクレオチド以内のCをTに変換した場合に、目的遺伝子がコードするタンパク質にアミノ酸変化を生じるような配列を選択することにより行うことができる。また、20mer以外のターゲッティング配列の長さを用いる場合にも、適宜配列を選択することができる。これらの候補の中から、目的の宿主ゲノム中のオフターゲットサイト数が少ない候補配列をターゲッティング配列として用いることができる。使用するガイドRNA設計ソフトウェアに宿主ゲノムのオフターゲットサイトを検索する機能がない場合、例えば、候補配列の3’側の8～12ヌクレオチド（標的ヌクレオチド配列の識別能の高いseed配列）について、宿主ゲノムに対してBlast検索をかけることにより、オフターゲットサイトを検索することができる。

　ガイドRNAをコードするDNAも、上記と同様の発現ベクターに挿入することができるが、プロモーターとしては、pol III系のプロモーター（例、SNR6、SNR52、SCR1、RPR1、U3、U6、H1プロモーター等）及びターミネーター（例、ポリT配列（T₆配列等））を用いることが好ましい。

３．二本鎖DNAの標的化された部位の改変方法
　別の実施態様において、本開示の複合体を、宿主細胞の二本鎖DNAと接触させる工程を含む、二本鎖DNAの標的化された部位を改変する方法（以下では、「本開示の改変方法」と称することがある。）が提供される。核酸配列認識モジュールとシチジンデアミナーゼとが結合した複合体（融合タンパク質を含む。）を含んでなる本開示の複合体と、二本鎖DNAとの接触は、無細胞系の酵素反応として行われてもよいが、本開示の主たる目的に沿えば、１．及び２．に記載した本開示の複合体又は核酸若しくはベクターを、宿主に導入し、当該宿主を培養することにより実施されることが望ましい。

　本発明者らは以前、核酸配列認識モジュールと、シチジンデアミナーゼとの複合体とを細胞に導入することで、標的部位におけるヌクレオチドの変換だけでなく、１以上のヌクレオチドの欠失又は挿入が生じることを実証している（国際公開第2015/133554号）。従って、標的化された部位の改変は、標的化された部位の１以上のヌクレオチドの他の１以上のヌクレオチドへの変換だけでなく、１以上のヌクレオチドの欠失であっても、標的化された部位への１以上のヌクレオチドの挿入であってもよい。さらに、本発明者らは以前、外来のドナーDNAをさらに宿主に導入することで、相同組み換え機構により、二本鎖DNA中の標的部位を外来のドナーDNAに含まれる挿入配列に置換すること、あるいは、該標的部位に該挿入配列を挿入できることを実証している（国際公開第2019/189147号）。よって、本開示の改変方法は、ドナーDNAを細胞に導入する工程を含んでいてもよい。

　核酸配列認識モジュール及び/又はデアミナーゼ（例えばシチジンデアミナーゼ）をコードする核酸又は該核酸を含む発現ベクターを宿主細胞に導入し、当該宿主細胞を培養することによって、核酸配列認識モジュールとデアミナーゼ（例えばシチジンデアミナーゼ）との複合体を細胞内で発現させることもできる。本開示の改変方法は、DNA二本鎖切断（DNAdouble-strand break:DSB）を伴わないため、毒性の低いゲノム編集が可能であり、かかる方法は幅広い生物材料に適用することができる。従って、核酸配列認識モジュール及び/又はシチジンデアミナーゼをコードする核酸が導入される細胞は、原核生物である大腸菌などの細菌や下等真核生物である酵母などの微生物の細胞から、ヒト等の哺乳動物を含む脊椎動物、昆虫、植物など高等真核生物の細胞にいたるまで、あらゆる生物種の細胞をも包含し得る。

　宿主としては、例えば、エシェリヒア属菌、バチルス属菌、酵母、昆虫細胞、昆虫、動物細胞などが用いられる。
　エシェリヒア属菌としては、例えば、エシェリヒア・コリ（Escherichia coli）K12・DH1〔Proc. Natl. Acad. Sci. USA，60，160(1968)〕，エシェリヒア・コリJM103〔Nucleic Acids Research，9，309 (1981)〕，エシェリヒア・コリJA221〔Journalof Molecular Biology，120，517 (1978)〕，エシェリヒア・コリHB101〔Journal of MolecularBiology，41，459 (1969)〕，エシェリヒア・コリC600〔Genetics，39，440 (1954)〕などが用いられる。
　バチルス属菌としては、例えば、バチルス・サブチルス（Bacillus subtilis）MI114〔Gene，24，255 (1983)〕，バチルス・サブチルス207-21〔Journalof Biochemistry，95，87 (1984)〕などが用いられる。
　酵母としては、例えば、サッカロマイセス・セレビシエ（Saccharomyces cerevisiae）AH22，AH22R^-，NA87-11A，DKD-5D，20B-12、シゾサッカロマイセス・ポンベ（Schizosaccharomycespombe）NCYC1913，NCYC2036，ピキア・パストリス（Pichia pastoris）KM71などが用いられる。

　昆虫細胞としては、例えば、ウイルスがAcNPVの場合、夜盗蛾の幼虫由来株化細胞（Spodoptera frugiperda cell；Sf細胞）、Trichoplusianiの中腸由来のMG1細胞、Trichoplusia niの卵由来のHigh Five^TM細胞、Mamestra brassicae由来の細胞、Estigmenaacrea由来の細胞などが用いられる。ウイルスがBmNPVの場合、昆虫細胞としては、蚕由来株化細胞（Bombyx mori N 細胞；BmN細胞）などが用いられる。該Sf細胞としては、例えば、Sf9細胞（ATCCCRL1711）、Sf21細胞〔以上、In Vivo, 13, 213-217 (1977)〕などが用いられる。
　昆虫としては、例えば、カイコの幼虫、ショウジョウバエ、コオロギなどが用いられる〔Nature，315，592 (1985)〕。

　動物細胞としては、例えば、サルCOS-7細胞、サルVero細胞、チャイニーズハムスター卵巣（CHO）細胞、dhfr遺伝子欠損CHO細胞、マウスL細胞，マウスAtT-20細胞、マウスミエローマ細胞，ラットGH3細胞、ヒトFL細胞などの細胞株、ヒト及び他の哺乳動物のiPS細胞やES細胞などの多能性幹細胞、種々の組織から調製した初代培養細胞が用いられる。さらには、ゼブラフィッシュ胚、アフリカツメガエル卵母細胞なども用いることができる。

　植物細胞としては、種々の植物（例えば、イネ、コムギ、トウモロコシ等の穀物、トマト、キュウリ、ナス等の商品作物、カーネーション、トルコギキョウ等の園芸植物、タバコ、シロイヌナズナ等の実験植物など）から調製した懸濁培養細胞、カルス、プロトプラスト、葉切片、根切片などが用いられる。

　発現ベクターの導入は、宿主の種類に応じ、公知の方法（例えば、リゾチーム法、コンピテント法、PEG法、CaCl₂共沈殿法、エレクトロポレーション法、マイクロインジェクション法、パーティクルガン法、リポフェクション法、アグロバクテリウム法など）に従って実施することができる。ドナーDNAも、同様の方法により細胞に導入することができる。発現ベクターとドナーDNAを異なる分子として導入する場合、発現ベクターとドナーDNAの導入は、同時に行ってもよく、異なるタイミングで行ってもよい。
　大腸菌は、例えば、Proc. Natl. Acad. Sci. USA，69，2110 (1972)やGene，17，107 (1982)などに記載の方法に従って形質転換することができる。
　バチルス属菌は、例えば、Molecular ＆ General Genetics，168，111 (1979)などに記載の方法に従ってベクター導入することができる。
　酵母は、例えば、Methods in Enzymology，194，182-187 (1991)、Proc. Natl. Acad. Sci. USA，75，1929(1978)などに記載の方法に従ってベクター導入することができる。
　昆虫細胞及び昆虫は、例えば、Bio/Technology,6，47-55 (1988)などに記載の方法に従ってベクター導入することができる。
　動物細胞は、例えば、細胞工学別冊８　新細胞工学実験プロトコール，263-267 (1995)（秀潤社発行）、Virology，52，456 (1973)に記載の方法に従ってベクター導入することができる。

　本開示の核酸を導入した細胞の培養は、宿主の種類に応じ、公知の方法に従って実施することができる。
　例えば、大腸菌又はバチルス属菌を培養する場合、培養に使用される培地としては液体培地が好ましい。また、培地は、形質転換体の生育に必要な炭素源、窒素源、無機物などを含有することが好ましい。ここで、炭素源としては、例えば、グルコース、デキストリン、可溶性澱粉、ショ糖などが；窒素源としては、例えば、アンモニウム塩類、硝酸塩類、コーンスチープ・リカー、ペプトン、カゼイン、肉エキス、大豆粕、バレイショ抽出液などの無機又は有機物質が；無機物としては、例えば、塩化カルシウム、リン酸二水素ナトリウム、塩化マグネシウムなどがそれぞれ挙げられる。また、培地には、酵母エキス、ビタミン類、生長促進因子などを添加してもよい。培地のpHは、好ましくは約5～約8である。
　大腸菌を培養する場合の培地としては、例えば、グルコース、カザミノ酸を含むM9培地〔Journal of Experiments in MolecularGenetics, 431-433, Cold Spring Harbor Laboratory, New York 1972〕が好ましい。必要により、プロモーターを効率よく働かせるために、例えば、3β-インドリルアクリル酸のような薬剤を培地に添加してもよい。大腸菌の培養は、通常約15～約43℃で行なわれる。必要により、通気や撹拌を行ってもよい。
　バチルス属菌の培養は、通常約30～約40℃で行なわれる。必要により、通気や撹拌を行ってもよい。
　酵母を培養する場合の培地としては、例えば、バークホールダー（Burkholder）最小培地〔Proc. Natl. Acad. Sci. USA，77，4505(1980)〕や0.5％カザミノ酸を含有するSD培地〔Proc. Natl. Acad. Sci. USA，81，5330 (1984)〕などが挙げられる。培地のpHは、好ましくは約5～約8である。培養は、通常約20℃～約35℃で行なわれる。必要に応じて、通気や撹拌を行ってもよい。
　昆虫細胞又は昆虫を培養する場合の培地としては、例えばGrace's Insect Medium〔Nature，195，788 (1962)〕に非働化した10％ウシ血清等の添加物を適宜加えたものなどが用いられる。培地のpHは、好ましくは約6.2～約6.4である。培養は、通常約27℃で行なわれる。必要に応じて通気や撹拌を行ってもよい。
　動物細胞を培養する場合の培地としては、例えば、約5～約20%の胎児ウシ血清を含む最小必須培地（MEM）〔Science，122，501 (1952)〕，ダルベッコ改変イーグル培地（DMEM）〔Virology，8，396(1959)〕，RPMI 1640培地〔The Journal of the American Medical Association，199，519(1967)〕，199培地〔Proceeding of the Society for the Biological Medicine，73，1 (1950)〕などが用いられる。培地のpHは、好ましくは約6～約8である。培養は、通常約30℃～約40℃で行なわれる。必要に応じて通気や撹拌を行ってもよい。
　植物細胞を培養する培地としては、MS培地、LS培地、B5培地などが用いられる。培地のpHは好ましくは約5～約8である。培養は、通常約20℃～約30℃で行なわれる。必要に応じて通気や撹拌を行ってもよい。
　以上のようにして、核酸配列認識モジュールとシチジンデアミナーゼとの複合体、即ち本開示の複合体を細胞内で発現させることができる。

　核酸配列認識モジュール及び/又は小型化デアミナーゼをコードするRNAの宿主細胞への導入は、マイクロインジェクション法、リポフェクション法等により行うことができる。RNA導入は1回若しくは適当な間隔をおいて複数回（例えば、2～5回）繰り返して行うことができる。

　本開示において「ドナーDNA」とは、外来の挿入配列を含むDNAを意味し、ドナーDNAには通常、標的部位に隣接する、標的部位の上流側及び下流側２か所の領域（以下「隣接領域」ともいう）の配列と相同な２種類の配列（以下「ホモロジーアーム」ともいう）を含む。各ホモロジーアームを区別する場合には、「5’ホモロジーアーム」と「3’ホモロジーアーム」とで区別することがある。また、二本鎖DNAの「標的部位」とは、ドナーDNAに含まれる挿入配列で置換されることとなる領域、あるいは該挿入配列が挿入されることとなるヌクレオチド間を意味し、該標的部位には、前記隣接配列は含まれない。また、標的ヌクレオチド配列とPAM配列以外の部位を標的部位とする場合は、改変後もこれらの配列が残り、シチジンデアミナーゼにより脱アミノ化が生じる可能性があるため、これらの配列が除かれるようにドナーDNAを設計するか、ホモロジーアーム上の標的ヌクレオチド配列又はPAM配列に、サイレント変異を導入することが好ましい。

　標的部位の隣接領域と相同な配列とは、完全に同一な配列だけでなく、細胞内で相同組換えが起こり得る限り、完全に同一な配列に対して、好ましくは80%以上（例：85%以上、90%以上、95%以上、96%以上、97%以上、98%以上、99%以上）の同一性を有する配列であってもよい。

　挿入配列には、必要に応じて、薬剤耐性遺伝子(例：カナマイシン耐性遺伝子、アンピシリン耐性遺伝子、ピューロマイシン耐性遺伝子など)、チミジンキナーゼ遺伝子、ジフテリアトキシン遺伝子などの選択マーカー配列、緑色蛍光タンパク質(GFP)、赤色蛍光タンパク質、βグルクロニダーゼ(GUS)、FLAGなどのレポーター遺伝子配列などを含むことができる。また、細胞の選別等が終了した後などに、これらの遺伝子を切除できるように、それらの前後にLoxP配列、FRT配列又はトランスポゾン特異性末端逆位配列（PiggyBacTerminal Repeat）を有してもよい。好ましいトランスポゾンとしては、例えば、鱗翅目昆虫由来のトランスポゾンであるpiggyBac等が挙げられる（Kaji,K. et al., Nature, 458: 771-775 (2009)、Woltjen et al., Nature, 458: 766-770(2009) 、WO 2010/012077）。あるいは、Oji A et al., Sci Rep, 6: 31666 (2016)などに記載されるように、上記薬剤耐性遺伝子を含む発現ベクターを共導入し、一過的な（数日程度の）薬剤選抜を行ってもよい。挿入配列が標的部位に挿入されていることや、標的部位と置換されているかは、配列を解読するほか、細胞から分離抽出した染色体DNAをサザンハイブリダイゼーション又はPCR法によりスクリーニングすることなどにより確認することができ、ドナーDNAに上記薬剤耐性遺伝子等が存在する場合には、それらの発現を指標として確認することもできる。

　ドナーDNAは、直鎖状（例：合成二本鎖DNA）であってもよく、環状（例：プラスミドDNA）であってもよく、また、一本鎖DNA（例：一本鎖オリゴデオキシヌクレオチド（ssODN））であってもよく、二本鎖DNAであってもよい。ドナーDNAは、挿入配列の塩基長や、宿主細胞の相同組換え活性等により、適宜設計することができる。例えば、挿入配列として100塩基長以下の場合、通常はssODN又は合成二本鎖DNAが用いられ、それより長い場合、通常は合成二本鎖DNA又はプラスミドDNAが用いられる。ドナーDNAの長さも特に制限はなく、挿入配列の長さなどにより適宜設計することができる。挿入配列の長さは、特に制限はなく、通常は１塩基長～数万塩基長の範囲（例えば、ssODNの場合には、100塩基長以下（例：70塩基以下、50塩基以下））で目的に応じて適宜設計することができる。また、各ホモロジーアームの長さも特に制限はなく、ドナーDNAがssODNの場合、通常は10塩基長～150塩基長のものが用いられ、ドナーDNAが合成二本鎖DNAの場合、通常は10～5000塩基長のものが用いられ、ドナーDNAがプラスミドDNAの場合、通常は100塩基長～5000塩基長、好ましくは500塩基長～1000塩基長のものが用いられる。これらのドナーDNAは、公知文献（例：OchiaiH, Int J Mol Sci, 16:21128-21137 (2015)、Hockemeyer D et al., Nat Biotefchnol,27:851-857 (2009)）を参酌して設計することができる。

　また、本開示の改変方法では、異なる位置の複数の標的ヌクレオチド配列を用いて標的化された部位を改変することも可能である。従って、本開示の一実施態様においては、異なる標的ヌクレオチド配列とそれぞれ特異的に結合する、２種以上の核酸配列認識モジュールを用いることができる。この場合、これらの核酸配列認識モジュールの各々１つと、シチジンデアミナーゼとが、複合体を形成する。ここでシチジンデアミナーゼは共通のものを使用することができる。例えば、核酸配列認識モジュールとしてCRISPR-変異Casシステムを用いる場合、変異Casエフェクタータンパク質とシチジンデアミナーゼとの複合体は共通のものを用い、ガイドRNA（crRNA又はcrRNA-tracrRNAキメラ）として、異なる標的ヌクレオチド配列とそれぞれ相補鎖を形成する2以上のcrRNA、あるいは2以上のcrRNAの各々と、tracrRNAとのキメラRNAを2種以上作製して用いることができる。一方、核酸配列認識モジュールとしてジンクフィンガーモチーフやTALエフェクターなどを用いる場合には、例えば、異なる標的ヌクレオチドと特異的に結合する各核酸配列認識モジュールに、シチジンデアミナーゼを結合させることができる。

　本開示の複合体を宿主細胞内で発現させるためには、上述のように該複合体をコードするDNAを含む発現ベクターを宿主細胞に導入するが、効率よく変異を導入するためには、一定期間以上、一定レベル以上の複合体の発現が維持されるのが望ましい。かかる観点からは、該発現ベクターが宿主ゲノムに組み込まれることが確実であるが、複合体の持続的発現はオフターゲット切断のリスクを増大させるので、首尾よく標的部位の改変が達成された後は、速やかに除去されることが好ましい。宿主ゲノムに組み込まれたDNAを除去するための手段としては、Cre-loxP系やFLP-FRT系を用いる方法やトランスポゾンを用いる方法等が挙げられる。

　あるいは、所望の時期に脱アミノ化反応が起こり、標的化された部位の改変が固定されるのに必要な期間だけ、一過的に本開示の複合体を宿主細胞内で発現させることにより、オフターゲット切断のリスクを回避しつつ宿主ゲノムの編集を効率よく実現することができる。当業者は、使用する培養条件等に基づいて、好適な発現誘導期間を適宜決定することができる。例えば、出芽酵母を0.02%ガラクトース誘導培地中で液体培養する場合、20～40時間の発現誘導期間が例示される。

　本開示の複合体を、所望の時期に所望の期間、一過的に発現させる手段としては、該複合体をコードする核酸を、発現期間を制御可能な形態で含むコンストラクト（発現ベクター）を作製し、宿主内に導入する方法が挙げられる。「発現期間を制御可能な形態」としては、具体的には、本開示の核酸を、誘導性の調節領域の制御下においたものが挙げられる。「誘導性の調節領域」は特に制限されないが、例えば、温度感受性（ts）変異リプレッサーとこれに制御されるオペレーターとのオペロンが挙げられる。ts変異リプレッサーとしては、例えばλファージ由来のcIリプレッサーのts変異体が挙げられるが、これに限定されない。λファージcIリプレッサー(ts)の場合、30℃以下（例、28℃）ではオペレーターに結合して下流の遺伝子発現を抑制しているが、37℃以上（例、42℃）の高温ではオペレーターから解離するために、遺伝子発現が誘導される。従って、本開示の核酸を導入した宿主細胞を、通常は30℃以下で培養し、適切な時期に温度を37℃以上に上げて一定期間培養して、脱アミノ化反応を行わせ、標的遺伝子に変異が導入された後は、速やかに30℃以下に戻すことにより、標的遺伝子の発現が抑制される期間を最短にすることができ、宿主細胞にとって必須遺伝子を標的化する場合でも、副作用を押さえつつ効率よく編集することができる。
　温度感受性変異を利用する場合、例えば、ベクターの自律複製に必要なタンパク質の温度感受性変異体を、本開示の複合体をコードするDNAを含むベクターに搭載することにより、該複合体の発現後、速やかに自律複製が出来なくなり、細胞分裂に伴って該ベクターは自然に脱落する。このような温度感受性変異タンパク質としては、pSC101oriの複製に必要なRep101 oriの温度感受性変異体が挙げられるが、これに限定されない。Rep101 ori(ts)は30℃以下（例、28℃）では、pSC101oriに作用してプラスミドの自律複製を可能にするが、37℃以上（例、42℃）になると機能を失い、プラスミドは自律複製できなくなる。従って、上記λファージのcIリプレッサー(ts)と併用することで、本開示の複合体の一過的発現と、プラスミド除去とを、同時に行うことができる。

　また、本開示の複合体をコードするDNAを、誘導プロモーター（例：lacプロモーター（IPTGで誘導）、cspAプロモーター（コールドショックで誘導）、araBADプロモーター（アラビノースで誘導）等）の制御下において宿主細胞内に導入し、適切な時期に培地に誘導物質を添加（又は培地から除去）して該複合体の発現を誘導し、一定期間培養して、核酸改変反応を行わせ、標的遺伝子に変異が導入された後複合体の一過的発現を実現することができる。

　以下に、本開示を実施例により説明する。ただし、本開示はこれらの実施例に限定されるものではない。

＜細胞株・培養・形質転換・発現誘導＞
　出芽酵母Saccharomyces cerevisiae BY4741株（ロイシン及びウラシル要求性）を用い、標準的なYPDA培地ないしSD培地の栄養要求性に合わせたDropout組成で培養した。培養は25℃から30℃の間で、寒天プレートでの静置培養又は液体培地での振とう培養を行った。形質転換は酢酸リチウム法を用い、適切な栄養要求性に合わせたSD培地で選抜を行った。ガラクトースによる発現誘導には、適切なSD培地で一晩予備培養した後、炭素源を2%グルコースから2%ラフィノースに代えたSR培地に植え継いで一晩培養、さらに炭素源を0.2%ガラクトースに代えたSGal培地に植え継いで3時間から二晩程度培養して発現誘導を行った。
　生存細胞数及びCan1変異率の測定には、細胞懸濁液をSDプレート培地及びSD-Arg+60mg/l Canavanineプレート培地あるいはSD+300mg/lCanavanineプレート培地に適宜希釈して塗布し、3日後に出現するコロニー数を生存細胞数としてカウントした。SDプレートでの生存コロニー数を全細胞数とし、Canavanineプレートでの生存コロニー数を耐性変異株数として、変異率を算出・評価した。
　オフターゲット効果の検証するため、細胞懸濁液をSDプレート培地及びSD+100 mg/lのS-aminoethyl-L-cysteine(Thialysine) に適宜希釈して塗布し、3日後に出現するコロニー数を生存細胞数としてカウントした。SDプレートでの生存コロニー数を全細胞数とし、Thialysineプレートでの生存コロニー数を耐性変異株数として、オフターゲット変異率を算出・評価した。

＜核酸操作＞
DNAは、PCR法、制限酵素処理、ライゲーション、Gibson Assembly法、人工化学合成のいずれかによって、加工・構築した。プラスミドは酵母・大腸菌シャトルベクターとしてロイシン選抜用のpRS415、及びウラシル選抜用のpRS426をバックボーンとして用いた。プラスミドは大腸菌株XL-10goldないしDH5αで増幅し、酢酸リチウム法で酵母に導入した。

＜コンストラクトの構築＞
　非特許文献３に記載の手法及びplasmidに準じ、各ドメインの切断や入れ替え、変異の導入を行った。哺乳動物発現用のSaCas9含有ベクターとして、AddgeneよりSaABEmax(#119814)を入手して改変した。Scp1配列、polyAシグナルは人工化学合成を行った。KN1086、KN1150、KN1025及びKN1149のgRNAの各標的配列を、それぞれ配列番号８～１１として示す。また、各コンストラクトの代表として、pAL008、pAL022、V5679、pAL047及びpAL050の全長配列を、それぞれ配列番号１２～１６として示す。なお、以下の実施例でコントロールとして用いたベクター1251は、従来型のdCas9-dSH3-CDA(UGIは含まない)をコードする配列を含み、ベクター1252は、従来型のnCas9-dSH3-CDA(UGIは含まない)をコードする配列を含む(dSH3はリンカーである)。また、pAL008は、CDA-nCas9をコードする配列を含み、Cas9のN末側にリンカーなしでCDAを融合している。

＜立体構造解析＞
AID（id:5W1C）の立体構造はNCBIのMMDBより入手し、ソフトウェア（Cn3D）上で解析した。アラインメントはClustalWによって行った。

＜HEK293細胞へのトランスフェクション及び変異誘導＞
ヒト胎児腎臓由来細胞（HEK293Ｔ細胞）を用いた。細胞を、100μg/mL ペニシリン-ストレプトマイシン（Life Technologies,Carlsbad, CA, USA）及び10%胎仔ウシ血清（FBS）(Biosera, Nuaille, France)を添加したDME-glutamax培地(ThermoFisher Scientific, USA)を用いて、37℃、5% CO₂条件で培養を行った。細胞の回収には5%トリプシンを用いた。　ディープフリーザーで保存したHEK293T細胞を37℃のウォーターバスにて溶解し、5x10⁶　cellsになるように75T-flaskに播種した。1-3日間培養後に細胞を回収し、0.5x10⁵ cells/wellになるように24ウェルプレートの各ウェルに播種した。1-3日培養後に60-80%コンフルエント状態の各ウェルの細胞に対して、約1μgの上記の各プラスミドDNAを3 μlのLipofectamine 2000(Life Technologies, Carlsbad, USA)を用いてトランスフェクションした。

＜シーケンシング＞
変異頻度及び変異箇所の解析は、トランスフェクション24時間ないし72時間後に培養細胞を回収してDNAを抽出、標的領域をPCRにて増幅後、次世代シーケンサーMiniseqを用いてアンプリコン解析を行った。データ処理はCLCworkbenchにて行った。場合により、細胞濃縮のため、GFPないしRFPの蛍光を指標に、コンストラクト発現細胞をセルソーターにて分取を行った。

実施例１：末端領域の欠失によるシチジンデアミナーゼの小型化の検証
　非特許文献４に開示された小型化シチジンデアミナーゼを含む核酸改変酵素複合体には、ウラシル-DNAグリコシラーゼ阻害剤（UGI）も含まれているが、UGIを用いると、望まれないオフターゲット効果が増強すると予想される。またデアミナーゼ活性を比較評価するにあたって、酵母細胞内ではUGI存在下では変異導入効率が飽和して差が見えにくい。そのため、まず、上記非特許文献４に開示された複合体から、UGIを除いた複合体を作製した。また、該複合体のN末端側領域をさらに欠失させた複合体も作製し、これらの複合体での標的部位の改変効率を検証した。本実験で用いたコンストラクトの概要を図２に、結果を図３～図５に示す。図３～図５より、予想外にも、非特許文献４において高い改変効率が認められた、CDA1Δ161を用いた複合体でさえ、UGIを用いない場合には、野生型CDA1を用いた複合体と比較して改変効率が3分の2以下となった。さらには、CDA1Δ161のN末端側を2アミノ酸残基以上欠失させたCDA1では、改変が顕著に低下した。上記結果から、本発明者らは、非特許文献４に開示の複合体が高い標的部位の改変効率を達成できたのは、酵母細胞内でのUGIによるDNA改変効率の向上効果によるところが大きく、UGIを用いない場合あるいは異なる生物種への適用の際には、単純にCDA1の末端領域を欠失するだけでは、所望の改変効率を達成できる複合体が得られないとの結論に達した。

実施例２：立体構造に基づくシチジンデアミナーゼの小型化の検証
　そこで、単純にシチジンデアミナーゼの末端領域を欠失させるのではなく、シチジンデアミナーゼの構造に基づき、シチジンデアミナーゼの欠失部位を決定することとした。まず、立体構造解析ソフトを用いて、CDA1Δ161の構造を解析したところ、歪んだ球状の形状であった（図６左図）。そこで、図６左図の白色部分（即ち、PmCDA1の30－150位の領域）だけを取り出すことで、形状をより球状に近づけた。なお、以下では、アミノ酸残基の位置は、野生型シチジンデアミナーゼのアミノ酸配列（即ち、配列番号１で示される配列）に基づき示す。このようにして作製した小型化シチジンデアミナーゼ（PmCDA1(30-150)と称する場合がある。）について、さらに構造解析より、露出した内部アミノ酸残基（ここでは、91位、122位126位、128位、及び150位のアミノ酸残基）（図７右図の白色部分）を疎水性から親水性のアミノ酸残基に置換した複合体も作製した。本実験で用いたコンストラクトの概要を図８に、結果を図９～図１１に示す。図９～図１１より、PmCDA1(30-150)では、シチジンデアミナーゼの分子量が高いCDA1Δ161と比較して、標的部位の改変効率が向上することが示された。また、PmCDA1(30-150)について、122位のトリプトファンをグルタミン酸に置換したシチジンデアミナーゼ（PmCDA1(30-150;W122E)と称する場合がある。)では、特に高い改変活性が認められた。

　さらに、PmCDA1(30-150;W122E)に対して、さらに疎水性アミノ酸を親水性アミノ酸に置換した複合体を用いて、標的部位の改変効率を検証した。本実験で用いたコンストラクトの概要を図１２に、立体構造における変異導入部分（白色部分）を図１３に、結果を図１４～図１６に示す。図１４～図１６より、PmCDA1(30-150;W122E)について、139位のトリプトファンをアルギニンに置換したシチジンデアミナーゼ（PmCDA1(30-150;W122E;W139R)と称する場合がある。)では、特に高い改変活性が認められた。

　同様に、変異箇所を替えた複合体を作製し、標的部位の改変効率を検証した。本実験で用いたコンストラクトの概要を図１７に、結果を図１８～図２０に示す。図１８～図２０より、PmCDA1(30-150;W122E)について、139位のトリプトファンをグルタミンに置換したシチジンデアミナーゼ（PmCDA1(30-150;W122E;W139Q)と称する場合がある。)では、特に高い改変活性が認められた。

実施例３：スプリットSpCas9を用いた核酸改変酵素複合体の改変効率の検証
　また、全く異なるアプローチにより、核酸改変酵素複合体の改変効率が向上できるか否か検証した。従来の核酸改変酵素複合体では、Casタンパク質の末端にシチジンデアミナーゼを融合したものが用いられているが、シチジンデアミナーゼをCasタンパク質の内部に埋め込むことにより、複合体としての安定性の向上及び基質DNAへのアクセス向上がするのではないかとの仮説の下、実証実験を行った。本実験で用いたコンストラクトの概要を図２1に、結果を図２２～図２４に示す。図２２～図２４より、作製した全ての複合体において、高い改変効率が認められた。

　次に、野生型シチジンデアミナーゼに代えて、実施例２で検証したものと同様の小型化シチジンデアミナーゼを用いて、複合体の改変効率を検証した。本実験では、小型シチジンデアミナーゼとして、PmCDA1(30-150;W122Q;W139Q)、PmCDA1(30-150;W122E;K133E;W139R)、PmCDA1(30-150;W122E;K130E;W139R)、並びにβシート間のループ領域(145-150の領域)を欠失させた、PmCDA1(30-144;W122E;W139R)を用いた。さらに、Cas9タンパク質のN末端断片及びC末端断片と、小型化シチジンデアミナーゼ（PmCDA1(30-150;W122E;W139Q)）との間にリンカーを有する複合体、並びにリンカーを有さない複合体を用いて、複合体の改変効率を検証した。本実験で用いたコンストラクトの概要を図２５及び図２６に、結果を図２７～図３２に示す。図２７～図３２より、シチジンデアミナーゼとしてPmCDA1(30-150;W122E;W139Q)を有し、かつCas9タンパク質のN末端断片及びC末端断片と、該シチジンデアミナーゼとの間にリンカーを有さない複合体において、特に高い改変効率が認められた。

実施例４：小型化シチジンデアミナーゼ及びUGIを有する核酸改変酵素複合体の改変効率の検証
　上記実施例２及び実施例３で高い改変効率が認められた複合体について、UGIをさらに併用することで、改変効率が向上するか否かを検証した。本実験で用いたコンストラクトの概要を図３３に、結果を図３４及び図３５に示す。図３４及び図３５より、作製した全ての複合体において、高い改変効率が認められた。

実施例５：核酸改変酵素複合体のオフターゲット効果の検証
　上記実施例で高い改変効率が認められた複合体について、オフターゲット効果を検証した。結果を図３６～図４１に示す。かかる結果より、作製した全ての複合体において、コントロール（KN1252_UG1を用いたもの）と比較して、オフターゲット効果が顕著に抑制されていた。

実施例６：小型のCas9(SaCas9)を用いた改変の検証
　次に、実施例３のSpCas9に代えてSaCas9を用いて、同様に改変が認められるか否かを検証した。SaCas9及び小型化デアミナーゼを用いることで、ガイドRNA発現カセット（プロモーター、gRNAコード配列及びポリT配列からなる）を含む核酸改変酵素複合体の発現カセットを、AAVベクターへ搭載可能なサイズ（約4.4kb）以下とすることが可能となった。コードする本実験で用いたコンストラクトの概要を図４２（核酸改変酵素複合体）及び図４３上図（ガイドRNA）を、実験手順の概要を図４３下図に、結果を図４４及び４５に示す。図４４及び図４５より、作製した全ての複合体において、高い改変効率が認められた。また、オフターゲット効果の抑制も期待される。さらに、興味深いことに、デアミナーゼのCas9への挿入部分により、変異が導入される確率の高い部位が変動することが示された。そのため、上記挿入部位を調整することで、変異導入部位の調整も可能となる。

実施例７：ＰｍＣＤＡ１のＤＮＡ結合領域の除去とデアミナーゼ活性の回復
　ＤＮＡデアミナーゼは、ＤＮＡに固有の親和性を持ち、非特異的な脱アミノ化を引き起こす。ＰｍＣＤＡ１のヒトホモログであるｈＡＩＤの構造から、触媒コアとは異なる領域で二本鎖ＤＮＡと複合体を形成することが明らかになっている（図４６ａ）。ｈＡＩＤとＰｍＣＤＡ１のアミノ酸配列から、ＰｍＣＤＡ１の潜在的なＤＮＡ結合部位は、タンパク質の全長２０８アミノ酸のうち、２１－２７残基と１７２－１９２残基に位置していた（図４６ａ）。予測されるＤＮＡ結合領域を削除するために、まず、Ｃ末端から一連の切断体（１－２０１、１－１９７、１－１９０、１－１８３、１－１７９、１－１７６、１－１６１）を作り、酵母Saccharomyces cerevisiae（ＢＹ４７４１）細胞で塩基編集活性を試験した（図４８）。これまでの報告では、４７アミノ酸を切断したＰｍＣＤＡ１（１－１６１）は、酵母において完全長のＰｍＣＤＡ１（１－２０８）と同等の編集効率を示すことが報告されているが、ｎＣａｓ９のＣ末端に融合し、ウラシルＤＮＡグリコシラーゼ阻害剤（ＵＧＩ）を付加していないものでは、切断が進むにつれて活性が徐々に低下した。次に、ｎＣａｓ９のＮ末端に融合させることで、１－１６１残基のＮ末端から一連の切断を行った。ＣＤＡ１（１－１６１）のＮ末端切断体では、まず活性がさらに低下したが、その後、２１および２８アミノ酸まで切断を進めると回復した（図４９）。ＣＤＡ１の予測構造から、Ｎ末端とＣ末端を同時に切断することで、断面積が最小化され、疎水性残基の露出が少ない滑らかなタンパク質表面が得られることがわかった（図４９）。さらに、酵素コアドメインをそのまま残しつつ、疎水性表面の露出を最小限に抑えた最小のものと予測されるＣＤＡ１（３０－１５０）に切り詰めたところ（図４６ｂ、図４９）、活性が回復した（図４９）。これらの結果は、その編集活性の変化が、タンパク質のコンフォメーションの安定性に起因することを示唆している。さらにその活性を向上させるために、切断後に露出した疎水性残基に一連の変異を導入した。まず６つの変異を試験したところ、Ｗ１２２ＥがＣＤＡ１（３０－１５０）に対して有意に活性を獲得することがわかった（図５０）。さらに７つの変異をＷ１２２Ｅと組み合わせて試験したところ、活性がさらに向上するＷ１３３Ｒ／Ｑが見つかった（図５０）。以下、Ｗ１２２ＥとＷ１３３Ｑを含むＣＤＡ１（３０－１５０）をｔＣＤＡ１ＥＱと呼ぶ。

　この改変デアミナーゼは、オリジナルのＰｍＣＤＡ１よりもＤＮＡへの親和性が低く、安定性も低いと考えられるため、ｎＣａｓ９融合構造がその塩基編集特性に大きな影響を与える可能性がある。ｎＣａｓ９の末端に融合する以外にも、ｎＣａｓ９ポリペプチドを分割し、タンパク質の両末端を分割部位に融合させることで、中間にデアミナーゼを埋め込むことができる。構造的には、Ｃａｓ９のＲｕｖＣドメインの１０５４アミノ酸の位置は、柔軟性のあるタンパク質表面にあり、脱アミノ化の対象となる非標的ＤＮＡ鎖に近い。Ｎ末端に融合したｔＣＤＡ１ＥＱは、ＣＡＮ１アッセイで評価した標的部位の間で編集効率にばらつきが見られたが、埋め込んだものでは、オリジナルのＴａｒｇｅｔ－ＡＩＤと同等の一貫した編集効率を示した（図４６ｄ、図５１）。

　非特異的でｇＲＮＡに依存しないオフターゲット効果を評価するために、ＵＧＩと融合させた人工的な複合体について、チアリシン耐性変異体の発生を測定した（ＬＹＰ１アッセイ）。Ｎ末端融合型および埋め込み型のｔＣＤＡ１ＥＱ複合体はいずれも、オリジナルのＴａｒｇｅｔ－ＡＩＤに比べて変異体の出現率が大幅に減少（５～７９倍）しており（図４７ａ）、ｇＲＮＡ非依存のオフターゲット効果が大幅に低減されていることがわかった。これらのＮ末端融合型および埋め込み型のｔＣＤＡ１ＥＱ複合体を、それぞれＡＩＤ－２Ｓ（Smalland Specific）、ＡＩＤ－３Ｓ（Small, Specific and Superior）と名付けた。

実施例８：哺乳類細胞におけるＡＩＤ－２ＳおよびＡＩＤ－３Ｓの評価
　次に，ヒトＨＥＫ２９３Ｔ細胞におけるＡＩＤ－２ＳとＡＩＤ－３Ｓの編集効率とウィンドウを評価し，オフターゲット効果が低減されていると報告されている既存の改良型シトシン塩基編集剤ＹＥ１，ＹＥ２，Ｒ３３Ａ＋Ｋ３４Ａと比較した。よく研究されている４つのオンターゲット部位（ＨＥＫ２、ＨＥＫ３、ＲＮＦ２、ＶＥＧＦＡ）をプラスミドＤＮＡベクターのトランスフェクションにより編集し、アンプリコンディープシークエンスにより解析した。Ｔａｒｇｅｔ－ＡＩＤ，　ＡＩＤ－２Ｓ，　ＹＥ１は、試験した４つのターゲットサイトすべてに対して一貫して高い効率を示した。ＡＩＤ－３ＳとＹＥ２は、ターゲットサイトに依存して中程度から高程度の効率を示した。Ｒ３３Ａ＋Ｋ３４ＡはＨＥＫ３のターゲットサイトでは効率が悪かった（図４６ｅ）。ＡＩＤ－２Ｓの平均編集ウィンドウ幅はＴａｒｇｅｔ－ＡＩＤよりも狭く、ＹＥ１やＹＥ２と同程度であった（図４６ｆ）。

　ｇＲＮＡに依存しないオフターゲット効果は、ＨＥＫ２９３Ｔ細胞を用いた直交ＳａＣａｓ９　Ｒ－ｌｏｏｐアッセイで評価した（図４７ｂ）。ＳａＣａｓ９のオフターゲットであるサイト１～６は、これまでの研究に基づいて選択し、さらにサイト７（ＶＥＧＦＡ遺伝子座）は、そのＣ－ｒｉｃｈなコンテクストがＣＢＥによる脱アミノ化に対して高い感受性を示す可能性があるために選択した。Ｔａｒｇｅｔ－ＡＩＤは７つのサイトすべてで検出可能なオフターゲット編集を示したが（図４７ｃ）、ＡＩＤ２Ｓはサイト１、３で検出可能なオフターゲットの発生はなく、サイト２、５、６、７ではオフターゲット編集が大幅に減少し、ＹＥ２やＲ３３Ａ＋Ｋ３４Ａと同等の結果となった。ＹＥ１はサイト６、７でやや高いオフターゲット編集を示した。ＡＩＤ－３Ｓは、７つの部位で最も低く、ほとんど検出されなかった。これは、ＤＮＡとの親和性が失われたことに加え、Ｃａｓ９が結合したＤＮＡ鎖以外への酵素のアクセスが立体的に制限されていることに起因していると考えられる。ＡＩＤ－２Ｓおよび－３Ｓは、オリジナルのＴａｒｇｅｔ－ＡＩＤと比較して、Ｒ－ループのオフターゲット編集を平均して約４．５倍および１３．７倍削減したが、オンターゲット編集の効率はほぼ維持された（図４７ｃ、４７ｄ）。酵母ＬＹＰ１アッセイと合わせて、これらの結果は、ＡＩＤ－２Ｓおよび－３Ｓでは、ゲノム全体の、ｇＲＮＡに依存しないオフターゲット効果が大幅に軽減されていることを一貫して裏付けている。さらに、報告されている６つの部位（ＨＥＫ２＿ＯＦ１，２；ＶＥＧＦＡ＿ＯＦ１，２，３，４）のディープシーケンシングを行って、ｇＲＮＡ依存性のオフターゲット効果を調べた（図４７ｅ）。ＡＩＤ－２ＳおよびＡＩＤ－３Ｓと、ＹＥ２およびＲ３３Ａ＋Ｋ３４Ａは、解析したすべての部位でオフターゲット編集が大幅に減少していた。

実施例９：シトシン塩基編集システムの最小化
　改変ＰｍＣＤＡ１（ｔＣＤＡ１ＥＱ）は、野生型（２０８アミノ酸）に比べてサイズが大幅に小さく（１２１アミノ酸）なっている。ゲノム編集コンポーネントとして分子サイズが小さいことは、特にＤＮＡの長さが４～５ｋｂに制限されているＡＡＶベクターのようなｉｎ　ｖｉｖｏデリバリーツールにとって有利である。小型のＳａＣａｓ９システムを用いても、塩基編集コンポーネントを追加すると、明らかにサイズ制限を超えてしまう（図４６ｇ）。そこで、ＡＡＶベクターに搭載可能なサイズで、必要な塩基編集コンポーネントをすべて含むＳａＡＩＤ－３Ｓを開発するために、ｔＣＤＡ１ＥＱを、ポリヌクレオチド結合クレフトに面したＨＮＨドメイン内のｎＳａＣａｓ９の６１５－６１６残基の位置に組み込んだ。また、小型のＳｃｐ１プロモーターとＳｐＡターミネーターを用いて、全長４０３６ｂｐと３３２ｂｐのｇＲＮＡ発現カセットを構成した。比較のために、従来型のＳａＣａｓ９版Ｔａｒｇｅｔ－ＡＩＤ（ＳａＡＩＤ）も開発した。このＳａＡＩＤは、全長のＰｍＣＤＡ１にリンカー、ＵＧＩ、ＣＭＶプロモーター、ＳＶ４０ターミネーターを加え、全長５２２０ｂｐとし、ｇＲＮＡカセットは加えていない。ベクターのサイズによって異なるトランスフェクション効率を正規化するために、ベクターバックボーンから発現させたｉＲＦＰ６７０の蛍光シグナルでトランスフェクションした細胞を選別した。試験した２つの標的部位において、両コンストラクトは、変異ウィンドウに違いはあるものの（図５２）、同等の編集効率を示した（図４６ｈ）。

　オフターゲットへの影響を最小限に抑え、オンターゲットへの編集を強固にすることで、植物や微生物の育種から臨床利用まで幅広い応用が期待される。ＡＩＤ－３Ｓは、ＳａＣａｓ９オルソログでも実証されており、単一のＡＡＶベクターに搭載可能な同サイズの最小の塩基編集システムを提供し、より安全な遺伝子治療への応用を容易にしている。

　（注記）
　以上のように、本開示の好ましい実施形態を用いて本開示を例示してきたが、本開示は、特許請求の範囲によってのみその範囲が解釈されるべきであることが理解される。本明細書において引用した特許、特許出願及び他の文献は、その内容自体が具体的に本明細書に記載されているのと同様にその内容が本明細書に対する参考として援用されるべきであることが理解される。本願は、日本国特許庁に２０２０年９月４日に出願された特願２０２０－１４９４１９に対して優先権主張をするものであり、その内容はその全体があたかも本願の内容を構成するのと同様に参考として援用される。

　本開示により、従来のものと比較して小型で、改変効率も高く、かつオフターゲット効果が抑制された二本鎖DNA改変用複合体が提供される。かかる複合体をコードする核酸は
、アデノ随伴ウイルスベクターにも搭載し、標的部位に複合体をデリバリーすることも容易になるため、特に遺伝子治療などの応用局面で有用となり得る。

Claims

　核酸配列認識モジュールと、デアミナーゼとが結合した複合体であって、
　該核酸配列認識モジュールは、二本鎖ＤＮＡ中の標的ヌクレオチド配列と特異的に結合し、
　該デアミナーゼは、該デアミナーゼに対応する野生型デアミナーゼよりもサイズが小さく、かつ改変した結果露出する断面の面積または該面積を示す指数が所定値以下となるように改変されており、
　該二本鎖ＤＮＡの標的化された部位を改変する能力を有する、複合体。
　前記デアミナーゼは、前記デアミナーゼを改変した結果露出する断面に現れる疎水性アミノ酸残基の数が、所定値以下となるように改変されており、該改変は欠失を含む、請求項１に記載の複合体。
　前記デアミナーゼは、改変させたアミノ酸残基の数に対する、改変した結果露出する断面に現れる疎水性残基の割合が、所定値以下となるように改変されており、該改変は欠失を含む、請求項１または２に記載の複合体。
　前記デアミナーゼは、前記デアミナーゼを改変した結果露出する断面に現れる疎水性アミノ酸残基の数が、最小化するように改変される、請求項１～３のいずれか一項に記載の複合体。
　前記デアミナーゼは、改変させたアミノ酸残基の数に対する、改変した結果露出する断面に現れる疎水性残基の割合が、最小化するように改変される、請求項１～４のいずれか一項に記載の複合体。
　前記デアミナーゼは、前記野生型デアミナーゼのＮ末端側およびＣ末端側が改変される、請求項１～５のいずれか一項に記載の複合体。
　前記デアミナーゼにおける露出した疎水性の内部アミノ酸残基の少なくとも１つが、親水性のアミノ酸残基に置換される、請求項１～６のいずれか一項に記載の複合体。
　前記デアミナーゼがシチジンデアミナーゼを含む、請求項１～７のいずれか一項に記載の複合体。
　前記デアミナーゼが、
　（１）配列番号１で示されるアミノ酸配列における３０位～１５０位のアミノ酸残基の領域からなるアミノ酸配列、
　（２）配列番号１で示されるアミノ酸配列からなるタンパク質のオルソログであって、（１）の領域に対応する領域からなるアミノ酸配列、
　（３）（１）若しくは（２）のアミノ酸配列において、１若しくは数個のアミノ酸が欠失、置換、挿入及び／若しくは付加されたアミノ酸配列、又は
　（４）（１）若しくは（２）のアミノ酸配列と９０％以上の類似性又は同一性を有するアミノ酸配列、
からなる、請求項１～８のいずれか一項に記載の複合体。
　前記（３）のアミノ酸配列が、配列番号１で示されるアミノ酸配列における１２２位、１２６位及び１３９位からなる群から選択される位置のアミノ酸残基又は該位置に対応するアミノ酸残基の親水性アミノ酸残基への１箇所以上の置換を含む、請求項９に記載の複合体。
　前記（３）のアミノ酸配列が、配列番号１で示されるアミノ酸配列における１２２位のアミノ酸残基及び１３９位のアミノ酸残基、又は該位置に対応するアミノ酸残基の親水性アミノ酸残基への２箇所以上の置換を含む、請求項９または１０に記載の複合体。
　前記核酸配列認識モジュールが、Ｃａｓタンパク質の少なくとも１つのＤＮＡ切断能が失活したＣＲＩＳＰＲ－Ｃａｓシステム、ジンクフィンガーモチーフ、ＴＡＬエフェクター及びＰＰＲモチーフからなる群より選択される、請求項１～１１のいずれか一項に記載の複合体。
　前記核酸配列認識モジュールが、Ｃａｓタンパク質の１つのＤＮＡ切断能が失活したＣＲＩＳＰＲ－Ｃａｓシステムである、請求項１～１２のいずれか一項に記載の複合体。
　前記Ｃａｓタンパク質がＣａｓ９タンパク質である、請求項１２または１３に記載の複合体。
　核酸配列認識モジュールのＮ末端断片と、デアミナーゼと、核酸配列認識モジュールのＣ末端断片とが結合した複合体であって、
　該核酸配列認識モジュールのＮ末端断片とＣ末端断片とがリフォールディングした場合に、該核酸配列認識モジュールは、二本鎖ＤＮＡ中の標的ヌクレオチド配列と特異的に結合し、該二本鎖ＤＮＡの標的化された部位を改変する能力を有する、複合体。
　前記デアミナーゼは、前記デアミナーゼに対応する野生型デアミナーゼよりもサイズが小さく、かつ改変した結果露出する断面の面積または該面積を示す指数が所定値以下となるように改変されている、請求項１５に記載の複合体。
　前記デアミナーゼは、前記デアミナーゼを改変した結果露出する断面に現れる疎水性アミノ酸残基の数が、所定値以下となるように改変されており、該改変は欠失を含む、請求項１５または１６に記載の複合体。
　前記デアミナーゼは、改変させたアミノ酸残基の数に対する、改変した結果露出する断面に現れる疎水性残基の割合が、所定値以下となるように改変されており、該改変は欠失を含む、請求項１５～１７のいずれか一項に記載の複合体。
　前記デアミナーゼは、前記デアミナーゼを改変した結果露出する断面に現れる疎水性アミノ酸残基の数が、最小化するように改変される、請求項１５～１８のいずれか一項に記載の複合体。
　前記デアミナーゼは、改変させたアミノ酸残基の数に対する、改変した結果露出する断面に現れる疎水性残基の割合が、最小化するように改変される、請求項１５～１９のいずれか一項に記載の複合体。
　前記デアミナーゼは、前記野生型デアミナーゼのＮ末端側およびＣ末端側が改変される、請求項１５～２０のいずれか一項に記載の複合体。
　前記デアミナーゼにおける露出した疎水性の内部アミノ酸残基の少なくとも１つが、親水性のアミノ酸残基に置換される、請求項１５～２１のいずれか一項に記載の複合体。
　前記デアミナーゼがシチジンデアミナーゼを含む、請求項１５～２２のいずれか一項に記載の複合体。
　前記デアミナーゼが、
　（１）配列番号１で示されるアミノ酸配列における３０位～１５０位のアミノ酸残基の領域からなるアミノ酸配列、
　（２）配列番号１で示されるアミノ酸配列からなるタンパク質のオルソログであって、（１）の領域に対応する領域からなるアミノ酸配列、
　（３）（１）若しくは（２）のアミノ酸配列において、1若しくは数個のアミノ酸が欠失、置換、挿入及び／若しくは付加されたアミノ酸配列、又は
　（４）（１）若しくは（２）のアミノ酸配列と９０％以上の類似性又は同一性を有するアミノ酸配列、
からなる、請求項１５～２３のいずれか一項に記載の複合体。
　前記核酸配列認識モジュールが、Ｃａｓタンパク質の少なくとも１つのＤＮＡ切断能が失活したＣＲＩＳＰＲ－Ｃａｓシステム、ジンクフィンガーモチーフ、ＴＡＬエフェクター及びＰＰＲモチーフからなる群より選択される、請求項１５～２４のいずれか一項に記載の複合体。
　請求項１～２５のいずれか一項に記載の複合体をコードする核酸。
　請求項２６に記載の核酸を含むベクター。
　アデノ随伴ウイルスベクターである、請求項２７に記載のベクター。
　細胞の有する二本鎖ＤＮＡの標的化された部位を改変する方法であって、請求項１～２５のいずれか一項に記載の複合体を該二本鎖ＤＮＡと接触させる工程を含む、方法。
　二本鎖ＤＮＡと複合体との接触が、前記細胞への、請求項２６～２８のいずれか一項に記載の核酸またはベクターの導入により行われる、請求項２９に記載の方法。