JP2024039190A

JP2024039190A - ゲノム編集技術

Info

Publication number: JP2024039190A
Application number: JP2022143554A
Authority: JP
Inventors: 慎一有村; Shinichi Arimura; 恵子細田; Ayako HOSODA; 一星中里; Issei NAKAZATO; 伸浩堤; Nobuhiro Tsutsumi; 秀樹 ▲高▼梨; Hideki TAKANASHI
Original assignee: University of Tokyo NUC
Current assignee: University of Tokyo NUC
Priority date: 2022-09-09
Filing date: 2022-09-09
Publication date: 2024-03-22
Also published as: WO2024053550A1

Abstract

【課題】本発明は、同一または類似のタンパク質をコードするDNAが複数存在する場合に、TALEを用いて、当該複数のDNAを改変する方法の提供を課題とする。【解決手段】本発明は、同一または類似のタンパク質をコードする複数のDNAを改変する方法であって、N、V、H、D、B、R、Y、M、W、SまたはKを認識または許容するアミノ酸で構成されているRVD（repeat variable di-residue）を含むリピート配列を少なくとも１つ含む1種類のTALE-改変因子複合体のTALE部分を、当該複数のDNAの結合領域に結合させることを含む方法である。【選択図】なし

Description

本発明は、TALE（transcription activator-like effector）を用いたゲノム編集技術に関する。

TALEは、植物病原細菌のキサントモナス（Xanthomonas）が宿主である植物に感染した際に、宿主細胞内に導入される転写因子として同定された。TALEが宿主細胞内に導入されると、当該細胞内における転写を制御し、免疫応答の抑制やキサントモナスの増殖に適した環境を誘導する機能を有している（非特許文献１、非特許文献２）。TALEのDNA結合ドメインは、約34アミノ酸残基からなるアミノ酸のリピート（繰り返し）配列がタンデムに10～30個配置された構造を有しており、ゲノム上の標的塩基配列に結合する。約34アミノ酸からなるリピート配列を構成するアミノ酸配列中には、Repeat Variable Diresidue（RVD）と称される2アミノ酸残基からなる可変領域がある。このRVDを構成する2アミノ酸残基が、標的DNA配列中のどの塩基を認識または許容するかを決定している（非特許文献３、非特許文献４）。RVDは、TALEタンパク質のリピート配列のN端側から、12番目と13番目、または13番目と14番目のアミノ酸がこれに相当する。

TALEの特異的なDNA結合性を利用して、これまでにいくつかのゲノム編集ツールが開発されている。例えば、TALEのDNA結合ドメインにエンドヌクレアーゼを連結させた人工のエンドヌクレアーゼは、RVDを所望の塩基配列を認識または許容するようにデザインすることで、配列特異的なエンドヌクレアーゼ、TALEN（transcription activator-like effector nuclease）として使用することができる（例えば、非特許文献５）。また、二重鎖DNAの修飾が可能なシチジンデアミナーゼ（cytidine deaminase：CD）もしくはアデノシンデアミナーゼ（adenosine deaminase：ADA）とTALEの融合体は、所望の塩基を特異的に改変［CDはC（シトシン）をU（ウリジン）、ADAはA（アデニン）をI（イノシン）に改変］するために使用することができる（非特許文献７、非特許文献１２、特許文献１）。

TALEを用いたゲノム編集ツールは、その後も様々な改良が行われてきた。TALENが開発された当初は、TALENのヌクレアーゼドメインとして、二量体化することでヌクレアーゼ活性を示すFokIのDNA切断ドメインが用いられていたため、センス鎖およびアンチセンス鎖の各々に結合する1対のTALENを準備する必要があった。その後、FokIヌクレアーゼドメインに替えて、バクテリオファージ由来のI-TevIの触媒領域をTALEに連結させることで、単量体で標的配列を認識および切断できるコンパクトTALENが開発された（非特許文献８、特許文献２）。また、Sakumaらは、TALEのDNA結合モジュールのRVD以外のアミノ酸配列を改変して、従来のTALENよりも高い活性もったTALEN（Platinum TALEN）を開発した（非特許文献９）。その他、TALEのDNAとの結合安定性を向上させるためにRVD領域のアミノ酸の組み合わせに関する報告もいくつか行われている（非特許文献１０、非特許文献１１、特許文献２）。

ゲノム編集技術としては、TALE以外に、CRISPR/Cas9を用いた技術もよく使用されている。CRISPR/Cas9は、20塩基の配列を認識して標的配列の編集を行うが、オフターゲットと呼ばれる標的配列に似た配列を誤って編集することがある。これに対し、TALEは約40塩基の配列を認識するため、オフターゲットの編集は少ない。しかしながら、その反面、TALEを用いた場合には、複数の類似配列を同時に編集することは困難である。

WO2022/158561 US20130117869A1 WO2011/072246

VoytasおよびJoung, Science, 326: 1491-1492 2009 Bogdanoveら, Current Opinion in Plant Biology, 13: 394-401 2010 Bochら, Science, 326: 1509-1512 2009 MoscouおよびBogdanove, Science, 326: 1501 2009 Millerら, Nature Biotechnology, 29: 143-148 2011 Mokら, Nature, 583: 631-637 2020 Mokら, Nature Communications, 13: 4038 doi.org/10.1038/s41467-022-31745-y 2022 Beurdeleyら, Nature Communications, 4: 1762 DOI: 10.1038/ncomms2782 2013 Sakumaら, Scientific Reports, 3: 3379 DOI: 10.1038/strep03379 2013 Congら, Nature Communications, 3: 968 DOI: 10.1038/ncomms1962 2012 Christianら, PLoS One, 7: e45383 2012 Choら, Cell, 185: 1764-1776 2022

多くの生物のゲノムには、あるタンパク質をコードする遺伝子は１つだけではなく、複数存在しており、かつ、その塩基配列も完全に同一ではない類似配列であることが多い。例えば、多重遺伝子やコピー遺伝子において、各遺伝子がコードするタンパク質中の同一のアミノ酸に対するコドンの3番目の塩基が、多重遺伝子毎またはコピー遺伝子毎に異なることがしばしば見出されている。また、植物ではゲノムは2 n だけでなく、3 nからそれ以上の多倍数体のものも多く、さらにそれぞれのゲノムに標的遺伝子が複数コードされていることも多い。この機能的冗長性が原因となり、これまでのゲノム編集技術で特定の一つの遺伝子配列をゲノム編集しても、その機能改変の表現型が明確に現れないことが多いという点が問題になっていた。
本発明は、上記事情に鑑み、同一遺伝子または類似遺伝子が複数存在する場合に、TALE（1種類のTALE）を用いて、当該複数の遺伝子を同時に改変するためのゲノム編集技術の提供を課題とする。

本発明者らは、Repeat Variable Di-residues（RVD）を特定のアミノ酸の組み合わせに改変したTALE（transcription activator-like effector）を用いて、上記課題の解決を試みた。
多倍数体ゲノムに存在する相同遺伝子（ホモログ）あるいは相似遺伝子（ホメオログ)、遺伝子ファミリーとして存在する遺伝子群は、同様の機能を持つタンパク質をコードする場合でも、同義置換および非同義置換のSNP（Single Nucleotide Polymorphism）により、互いの塩基配列は完全一致しないことがある。そのため、当該遺伝子群の複数の遺伝子の特定の共通領域を、TALEを用いて同時に編集する場合、TALEを結合させる塩基配列中に、当該遺伝子群の各遺伝子間で異なる塩基が存在することがある。このような場合に、当該塩基をA、T、GもしくはCの全ての塩基、または複数の塩基を認識または許容できるRVDを有するTALEを構築すれば、1つのゲノム編集酵素による1回の操作で、同様の機能をもつタンパク質、つまり相同もしくは類似するアミノ酸配列をもつタンパク質をコードする複数遺伝子であって、僅かに塩基配列が相違する複数の遺伝子を同時に改変するゲノム編集が可能となる。

シロイヌナズナゲノムのβチューブリン遺伝子TUB4は、Ser351Pheを引き起こす塩基置換が生じると、表層細胞列および一次根のねじれの表現型が生じることが知られている（Ishidaら, Proceedings of the National Academy of Sciences, 104:8544-8549 2007）。シロイヌナズナには9つのβチューブリン遺伝子が存在しており、これら9遺伝子全てにおいて、Ser351が保存されている。本発明者らは、nuclear-targeted TALE cytidine deaminase（nTALECD）（WO2022/158561などを参照のこと）を用いて、9遺伝子のうち、TUB1、TUB2、TUB3およびTUB4のSer351をコードするコドン配列に、シトシンからチミンへの塩基置換を導入することにより、351番目のSerをPhe、またはLeuへの変異を引き起こすことを試みた。TUB1、TUB2、TUB3およびTUB4のTALE認識配列（TALE leftのリピート配列が結合する配列）のうち、3箇所の塩基の構成が遺伝子間で異なっていた。そこで、本発明者らは、これらの3箇所の塩基を認識または許容するRVDを、N認識、すなわち、A、T、GまたはCを認識または許容するアミノ酸の組み合わせになるように、TALEドメインを設計した。

N認識のRVDを有するnTALECDで、シロイヌナズナのβチューブリン遺伝子のSer351をコードするコドン配列にシトシンからチミンへの塩基置換を導入したところ、T₁世代で、標的とした4つのβチューブリン遺伝子（すなわちTUB1、TUB2、TUB3、TUB4）について複数の個体で変異が導入されていた。さらに、標的ではない5つのβチューブリン遺伝子のうち、TUB5、TUB6およびTUB7についても変異が導入されている個体が見出された。これに対し、TUB4特異的に塩基置換を導入するように設計したnTALECDを用いた場合には、標的のTUB4には高効率で変異が導入されたのに対し、他の8つのβチューブリン遺伝子では1個体を除き、変異の導入は検出されなかった。
以上のように、本発明者らは、TALEのRVD領域であって、同一機能を有する複数の遺伝子配列同士で相違する塩基を認識または許容するRVDにNを対応させるようにアミノ酸を配置することで、当該複数の遺伝子の編集が可能であることを初めて見出し、本発明を完成させた。上記知見から、Nの他、V（A、CまたはG）、H（A、CまたはT）、D（A、GまたはT）、B（C、GまたはT）、R（GまたはA）、Y（CまたはT）、M（AまたはC）、W（AまたはT）、S（CまたはG）またはK（GまたはT）を認識または許容するRVDを配置したリピート配列を適宜使用することで、遺伝子の編集の標的対象の幅を広げることが可能となる。

すなわち、本発明は以下の（１）～（１４）である。
（１）同一または類似のタンパク質をコードする複数のDNAを改変する方法であって、
N、V、H、D、B、R、Y、M、W、SまたはKを認識または許容するアミノ酸で構成されているRVD（repeat variable di-residue）を含むリピート配列を少なくとも１つ含む1種類のTALE-改変因子複合体のTALE部分を、当該複数のDNAの結合領域に結合させることを含む、前記方法。
（２）細胞内における同一または類似のタンパク質をコードする複数の遺伝子を改変する方法であって、
N、V、H、D、B、R、Y、M、W、SまたはKを認識または許容するアミノ酸で構成されているRVDを含むリピート配列を少なくとも１つ含む1種類のTALE-改変因子複合体を、細胞内に導入することを含む、前記方法。
（３）細胞内における同一または類似のタンパク質をコードする複数の遺伝子が改変された細胞の作製方法であって、
N、V、H、D、B、R、Y、M、W、SまたはKを認識または許容するアミノ酸で構成されているRVDを含むリピート配列を少なくとも１つ含む1種類のTALE-改変因子複合体を、細胞内に導入することを含む、前記方法。
（４）前記RVDが認識または許容する塩基が、前記複数のDNAまたは遺伝子の塩基配列をアライメントしたときに、同じ位置に存在する塩基の1または複数が他のDNAまたは遺伝子の塩基と異なる塩基である、上記（１）から（３）までのいずれかに記載の方法。
（５）前記RVDのアミノ酸が、
Nを認識または許容するRV、CS、VR、NA、S*、RH、RLもしくはRTで構成されており、
Mを認識するHCもしくはKCで構成されており、
Vを認識するHS、HT、HV、KVもしくはRCで構成されており、または、
RもしくはVを認識するNTで構成されている、上記（１）から（３）までのいずれかに記載の方法。ただし、S*の「*」は、RVDの第2位値がギャップであることを示す。
（６）前記改変因子が、エンドヌクレアーゼの全部もしくは一部、デアミナーゼの全部もしくは一部である、上記（１）から（３）までのいずれかに記載の方法。
（７）前記遺伝子が、核遺伝子、ミトコンドリア遺伝子または色素体遺伝子である、上記（２）または（３）に記載の方法。
（８）前記細胞が植物細胞である、上記（２）に記載の方法。
（９）前記細胞が植物細胞である、上記（３）に記載の方法。
（１０）上記（９）に記載の方法で作製された植物細胞。
（１１）上記（１０）に記載の植物細胞を含む種子または植物。
（１２）TALEのリピート配列を少なくとも１つ含むDNA結合タンパク質であって、当該リピート配列に含まれるRVDが、
Nを認識または許容するRV、CS、VR、NA、S*、RH、RLもしくはRTで構成されており、
Mを認識するHCもしくはKCで構成されており、
Vを認識するHS、HT、HV、KVもしくはRCで構成されており、または、
RもしくはVを認識するNTで構成されている、前記タンパク質。ただし、S*の「*」は、RVDの第2位値がギャップであることを示す。
（１３）前記RVDがNを認識または許容するRVである、上記（１２）に記載のタンパク質。
（１４）機能性タンパク質が融合していることを特徴とする、上記（１３）に記載のタンパク質。
なお、本明細書において「～」の符号は、その左右の値を含む数値範囲を示す。

本発明によれば、同一の機能を有する複数の遺伝子の遺伝子配列に対し、当該複数の遺伝子配列同士が完全に同一ではない場合であっても、同時に、同一の改変を行うことが可能となる。

重複遺伝子を同時に標的とするTALE+の設計概要。aは、シロイヌナズナゲノムに存在する9つのβチューブリン遺伝子（TUB1～TUB9）の一部のDNA塩基配列のアライメントを示す。一般的に用いられるRVDを持つリピート配列で構成されたTUB4を特異的に標的とするTALEペア左右のDNA認識ドメイン配列（TUB4-specific TALE pair）中、その計35リピート中8リピート（ハイライトした塩基と対応）を、認識のリピート（N）に置換した（TALE+ pair 8N (3+5)：TUB1、TUB 2、TUB 3、TUB 4の4つの遺伝子座を標的とする)。下線は、TALE+ pair 8N (3+5) のリピートに対応していない塩基であって、各TUB間で異なる塩基を示す。aに示す塩基配列は、上から、配列番号３０、配列番号３１、配列番号３２、配列番号３３、配列番号３４、配列番号３５、配列番号３６、配列番号３７、配列番号３８である。bは、N認識RVD（RV）を用いたTALECDのDNA結合配列の設計の例（8NのTALE left配列）を示す。4つの標的遺伝子のすべてで同一の塩基は4塩基を特異的に認識する一般的なRVDリピートを用いて認識し、4つの遺伝子で塩基の構成が異なる箇所はN認識RVD（RV）を用いて認識または許容させる。bに示す塩基配列は、上から、配列番号３９、配列番号４０、配列番号４１、配列番号４２である TUB1、TUB2、TUB3およびTUB4で同時に変異導入が確認されたT₁個体（#17）の標的遺伝子座における、TALE左右認識配列に挟まれた15塩基長の標的ウィンドウのサンガーシーケンスの波形。標的シトシン塩基（ハイライト、青色の波形）が部分的または完全にチミン（緑色の波形）に置換されていることを示す。形質転換第一世代（T₁）の種子低温処理後14日目のジェノタイプ。h/c：野生型塩基（シトシン）と置換後塩基（チミン）のヘテロまたはキメラ；homo：完全置換。同時に標的塩基に変異が導入されたβチューブリン遺伝子の数ごとのT₁個体の割合（白：TUB4-specific、n = 8；黒：TALE+ 8N、n = 22）。 nTALECD発現ベクター構築工程の模式図。aは、TALECDのDNA結合ドメインのアセンブリーの概略を示す。各リピート配列を含むモジュールプラスミドを組み合わせて、1-4個単位の連続したリピート配列を持つ中間ベクターを構築する。次に、中間ベクターを繋ぎ合わせて、全長リピート配列、シチジンデアミナーゼ (CD half) およびウラシルグリコシラーゼインヒビター (UGI) の融合タンパク質のコード配列を持つエントリーベクターを構築する。bは、TALECDのタンデム発現コンストラクトのクローニング方法を示す。aで構築した左右TALECDの全長を発現するエントリーベクター2種類、核移行シグナル配列 (NLS) やプロモーター配列、ターミネーター配列などを持つエントリーベクターとデスティネーションベクターを用いてマルチサイトLR反応でバイナリーベクターを構築する。

以下に本発明の実施形態について説明する。
第１の実施形態は、同一のタンパク質または類似のタンパク質をコードする複数のDNAを改変する方法であって、N、V、H、D、B、R、Y、M、W、SまたはKを認識または許容するアミノ酸で構成されているRVD（repeat variable di-residue）を含むリピート配列を少なくとも１つ含む1種類のTALE-改変因子複合体のTALE部分を、当該複数のDNAの結合領域（TALE部分が結合するDNA領域）に結合させることを含む方法である（以下「本実施形態にかかるDNAの改変方法」とも記載する）。「TALE-改変因子複合体」は、TALEと改変因子の融合体（または結合体もしくは連結体）のことである。ここで、DNAの「改変」には、DNA配列の構造を変化させることの他、タンパク質をコードするDNAの転写活性を制御すること、例えば、プロモーター、エンハンサーまたはサイレンサーなどの機能を活性化または抑制すること、およびエピジェネティクス制御なども含まれる。また、「DNA配列の構造を変化させること」には、特に限定はしないが、例えば、DNA配列に対し、１または複数の塩基の置換（変化）、挿入、欠失または付加を導入すること、あるいは、DNA鎖の二重鎖切断、二重鎖切断および結合等を導入することによりDNA配列の構造を変化させることが含まれる他、DNAを構成する塩基を修飾することで配列の構造を変化させること、例えば、DNA配列中の１または複数の塩基をメチル化すること、DNA鎖にニックを導入するなど、DNA鎖またはDNAを構成する塩基に修飾を加えることも含まれる。

本実施形態におけるTALE-改変因子複合体のうち、「改変因子」は、上述したDNAの「改変」を行う機能または活性を有する因子のことで、DNAの配列構造の改変を誘導する因子として、特に限定はしないが、例えば、エンドヌクレアーゼ、デアミナーゼなどのDNAの配列構造を変化させる酵素の他、塩基に修飾を加える因子として、特に限定はしないが、例えば、DNAメチラーゼ、DNAグリコシラーゼ、ニッカーゼなどの酵素が例示される。エンドヌクレアーゼとしては、例えば、FokIヌクレアーゼドメインやバクテリオファージ由来のI-TevIなどを例示することができる。デアミナーゼとして、例えば、DNA中のシトシン（C）をウリジン（U）に改変する、バークホルデリア・セノセパシアのDddA（Burkholderia cenocepacia DddA）のシチジンデアミナーゼドメイン（以下DddA_toxとも記載する）（詳細は、WO2022/158561を参照のこと）、アデニン（A）をイノシン（I）に改変する、アデノシンデアミナーゼ（Choら, Cell, 185:1764-1776 2022などを参照のこと）などを例示することができる。さらに、タンパク質をコードするDNAの転写活性を制御する因子として、転写活性化因子および転写抑制因子やその一部ドメインなどの他、DNAメチラーゼ、ヒストン修飾酵素（例えば、ヒストンアセチル化酵素、ヒストン脱アセチル化酵素、ヒストンメチル化酵素など）などのエピジェネティクス制御因子やその一部ドメインなどを挙げることができる。

本実施形態にかかるDNA改変方法は、細胞内に存在する遺伝子の改変のみならず、無細胞系（Cell-free）におけるDNA改変にも使用することができる。本実施形態における「DNA」には、例えば、ゲノムDNAの他、cDNAなどが含まれ、無細胞系でDNA改変を行う場合、「複数のDNA」として、例えば、ゲノムDNAライブラリーやcDNAライブラリーなどに含まれるDNAを用いてもよい。「標的配列」とは、TALE部分が結合するDNA領域のことである。無細胞系で実施する場合、TALE-改変因子複合体と複数のDNAの集合体（例えば、ゲノムDNAライブラリーおよびcDNAライブラリーなど）とを混合し、TALE-改変因子複合体のTALE部分と当該DNAが接触可能な状態にする。TALE-改変因子複合体のTALE部分がDNAの標的領域に結合することにより、その近傍に存在する標的塩基が改変因子によって改変される。

本実施形態における「タンパク質」は、全長タンパク質の他に、全長タンパク質の一部であって特定の機能を有するタンパク質の一部、例えば、タンパク質ドメイン（タンパク質の配列、構造の一部で、機能を持った部分；例えば、EFハンドタンパク質ドメイン、ジンクフィンガードメインなど）が含まれる。また、「同一のタンパク質」とは、機能および活性が同じであってアミノ酸配列が100％同一である「タンパク質」のことで、「類似のタンパク質」とは、その機能および活性が同じであってアミノ酸配列が90%以上、95%以上または99%以上同一である「タンパク質」のことである。
また、「複数のDNA」とは、当該複数のDNAの全てが、「同一のタンパク質」または「類似のタンパク質」をコードするDNAのことである。ここで、同一のタンパク質または類似のタンパク質をコードする「DNA」が遺伝子（ゲノムDNA）の場合には、当該複数の遺伝子（ゲノムDNA）から転写されるmRNA配列が同一ではない複数の遺伝子（ゲノムDNA）のことである。当該複数の遺伝子（ゲノムDNA）としては、特に限定はしないが、例えは、遺伝子ファミリーを構成する遺伝子、重複遺伝子、コピー遺伝子などが挙げられる。
本実施形態におけるRVD（すなわち、TALEの少なくとも1つのリピート配列に含まれるRVD）が認識または許容する塩基は、当該複数のDNAの塩基配列をアライメントしたときに、同じ位置に存在する塩基の1または複数が他のDNAの塩基（同じ位置に存在する塩基）と異なる塩基である。

本実施形態にかかるDNA改変方法を、細胞内の遺伝子（ゲノムDNA）に適用する場合、第１の実施形態は、細胞内における同一または類似のタンパク質をコードする遺伝子（ゲノムDNA）を改変する方法であって、N、V、H、D、B、R、Y、M、W、SまたはKを認識または許容するアミノ酸で構成されているRVDを含むリピート配列を少なくとも１つ含む1種類のTALE-改変因子複合体を、細胞内に導入することを含む方法（以下「本実施形態にかかる遺伝子改変方法」とも記載する）である。

前述の通り、生物は、同一のタンパク質をコードする複数の遺伝子を有しており、かつ、複数の遺伝子配列同士が完全に同一でないことがある。そのため、このような複数の遺伝子を、TALEを用いて改変する場合に、TALEが結合する認識配列が遺伝子コピー間で相違することがある。以下の事例により本実施形態について説明を行う。

遺伝子Aには、遺伝子A-1～A-6の6つの塩基配列が存在するとする。遺伝子Aを改変するためのTALEの結合領域を、遺伝子A-1～遺伝子A-6でアライメントすると、下記のようになるとする。
遺伝子A-1・・・GGA TCT TAT CAT GGT（配列番号１）・・・
遺伝子A-2・・・GGA TCC TAT CAT GGT（配列番号２）・・・
遺伝子A-3・・・GGA TCA TAT CAT GGT（配列番号３）・・・
遺伝子A-4・・・GGA TCG TAT CAT GGT（配列番号４）・・・
遺伝子A-5・・・GGA TCC TAT CAT GGT（配列番号５）・・・
遺伝子A-6・・・GGA TCT TAT CAT GGT（配列番号６）・・・
上記6つの遺伝子配列中、下線の塩基が異なっているが、この配列がコードするアミノ酸配列は、いずれも、GSYHG（配列番号７）で同一である。このような場合に、細胞内の遺伝子Aまたは遺伝子A産物（タンパク質）に、TALEを用いて同一の改変を導入する場合、従来の方法によると、下線を付した塩基を認識するリピート配列のRVDが、例えば、Tを認識するNG（Asn-Gly）、Cを認識するHD（His-Asp）、Aを認識するNI（Asn-Ile）またはGを認識するNN（Asn-Asn）で構成される4つのTALEを準備する必要があった。これに対し、本実施形態にかかる方法のように、下線を付した塩基を認識するRVDを、N（ここで、「N」はA、T、GまたはCを表す）を認識または許容するアミノ酸構成にすれば、遺伝子A-1～A-6の全ての認識配列に結合するTALEを作製することができる。また、下線の塩基を認識するRVDを、R（ここで、「R」はAまたはGを表す）を認識するアミノ酸構成にすれば、遺伝子A-3と遺伝子A-4の認識配列に結合するTALEを作製することができ、Y（ここで、「Y」はTまたはCを表す）を認識するアミノ酸構成にすれば、遺伝子A-1、遺伝子A-2、遺伝子A-5および遺伝子A-6の標的配列に結合するTALEを作製することができる。このように、上記事例において、本実施形態のRVDは、遺伝子A-1、遺伝子A-2、遺伝子A-3、遺伝子A-4、遺伝子A-5および遺伝子A-6をアライメントした場合、配列番号１～６の6番目の塩基、すなわち、遺伝子A-1、遺伝子A-2、遺伝子A-3、遺伝子A-4、遺伝子A-5および遺伝子A-6間で異なる塩基を認識することを特徴とする。

本実施形態のTALE-改変因子融合体のTALE部分と改変因子との結合は、ペプチド結合などによる直接結合であっても、リンカーなどを介した間接結合のいずれであってもよい。また、TALE-改変因子融合体のTALE部分、すなわち、DNA結合ドメインには、約34アミノ酸からなるアミノ酸配列の繰り返し構造が含まれている（以下、約34アミノ酸からなるアミノ酸配列を「リピート配列」とも記載する）。本実施形態で使用されるTALE部分に、通常2個以上、好ましくは、6個以上、より好ましくは、16個以上、かつ、通常36個以下、好ましくは24個以下、より好ましくは20個以下のリピート配列が含まれていてもよい。

ここで、「リピート配列」としては、例えば、以下の配列番号８、配列番号９、配列番号１０、配列番号１１、配列番号１２もしくは配列番号１３で表されるアミノ酸配列、または、配列番号８、配列番号９、配列番号１０、配列番号１１、配列番号１２もしくは配列番号１３で表されるアミノ酸配列に欠失、置換または付加が起こったアミノ酸配列であって、各々、配列番号８、配列番号９、配列番号１０、配列番号１１、配列番号１２もしくは配列番号１３で表されるアミノ酸配列と80％以上の配列同一性、好ましくは、90％以上の配列同一性を有するアミノ酸配列を挙げることができる。

リピート配列の例
LTPDQVVAIASXXGGKQALETVQRLLPVLCQDHG（配列番号８；「XX」はRVDを構成する2アミノ酸である。）
LTP（D/E/A）QVVAIASXXGGKQALETVQRLLPVLCQ（D/A）HG（配列番号９；「XX」はRVDを構成する2アミノ酸である。また、「D/E/A」はD、EまたはAであることを、「D/A」はDまたはAであることを示す。）
LTPDQVVAIASXXGGKQAL (E/A) T (V/M) Q (R/A) LLPVLCQDHG（配列番号１０；「XX」はRVDを構成する2アミノ酸である。また、「E/A」はEまたはAであることを、「V/M」はVまたはMであることを、「R/A」はRまたはAであることを示す。）
LTPEQVVAIASXXGGRPALE（配列番号１１；「XX」はRVDを構成する2アミノ酸である。）
LTPDQVVAIASXXGGKQALES（配列番号１２；「XX」はRVDを構成する2アミノ酸である。）
LTPNQVVAIASXXGGKQALE（配列番号１３；「XX」はRVDを構成する2アミノ酸である。）
なお、配列番号９、配列番号１０または配列番号１１のいずれかで表されるリピート配列は、TALEのDNA結合ドメインのうちC末端の単一のリピートとして用いられることがあり、他のリピート配列よりも短い配列（約20アミノ酸）である（例えば、WO2011/072246などを参照のこと）。

RVDを構成するアミノ酸と認識塩基の対応関係については、いくつか報告がある（例えば、特許文献２、非特許文献３、非特許文献４など）。例えば、HDはCを認識し、NGはTを認識し、NIはAを認識し、NNはGまたはAを認識し、NSはA、T、CまたはGを認識し、HGはTを認識し、IGはTを認識し、HAはCを認識し、NDはCを認識し、NKはGを認識し、HIはCを認識し、HNはGを認識し、NAはGを認識し、SNはGまたはAを認識し、YGはTを認識することが報告されている。
また、RVDは、Nを認識または許容するRV、CS、VR、NA、S*（「*」はRVDの第2位値がギャップであることを示す。）、RH、RLまたはRTで構成されており、Mを認識するHCまたはKCで構成されており、Vを認識するHS、HT、HV、KVまたはRCで構成されており、RまたはVを認識するNTで構成されていてもよい。

本実施形態にかかる遺伝子改変方法および細胞の作製方法（後述）は、原核生物、真核生物いずれの遺伝子または細胞についても適用することができる。
遺伝子に関し、真核生物においては、核遺伝子のみならず、ミトコンドリア遺伝子や植物の色素体（例えば、葉緑体）遺伝子に対しても適用することができる。核遺伝子、ミトコンドリア遺伝子または色素体遺伝子中のDNAの標的塩基を特異的に改変するためには、改変因子に標的塩基を認識させる必要がある。そのために、TALE-改変因子融合体を核、ミトコンドリアまたは色素体へ導入する。より具体的には、例えば、TALE-改変因子融合体タンパク質をコードするDNAを核ゲノムDNAに導入し（核ゲノムDNAに組込み）、細胞質で発現したTALE-改変因子融合体タンパク質を、核、色素体またはミトコンドリア内に輸送（導入）してもよい。この場合、TALE-改変因子融合体タンパク質に、各種シグナルペプチド（核移行シグナルペプチド、ミトコンドリア移行シグナルペプチドまたは色素体移行シグナルペプチド）を付加（結合）させた融合体をコードするDNAを核ゲノムDNAに導入することが望ましい。

TALE-改変因子融合体タンパク質を核内に輸送する方法として、TALE-改変因子融合タンパク質に核移行（局在）シグナル（nuclear localization signal/sequence：NLS）ペプチドを融合させて発現させる方法を挙げることができる。本実施形態において使用可能な核移行シグナルペプチドは、限定はしないが、例えば、SV40ラージT抗原のNLSペプチド（PKKKRKV、配列番号１４）、ヌクレオプラズミンのNLSペプチド（AVKRPAATKKAGQAKKKKLD、配列番号１５）、EGL-13のNLSペプチド（MSRRRKANPTKLSENAKKLAKEVEN、配列番号１６）、c-MycのNLSペプチド（PAAKRVKLD、配列番号１７）、TUSタンパク質のNLSペプチド（KLKIKRPVK、配列番号１８）などを挙げることができる。これら以外にも使用可能な核移行シグナルペプチドは存在しており、例えば、核移行シグナルのデータベースであるNLSdb（https://rostlab.org/services/nlsdb/browse/signals）などを参照のこと。

TALE-改変因子融合体タンパク質をミトコンドリア内に輸送する方法として、TALE-改変因子融合体タンパク質にミトコンドリア移行シグナルペプチド（明確な高次構造や配列相同性をもたないが、例えば、塩基性アミノ酸と複数の疎水性アミノ酸が交互に現れる特徴を示すペプチドなど）を融合させて発現させる方法を挙げることができる。本実施形態において使用可能なミトコンドリア移行シグナルペプチドは、動物細胞の場合、ヒトのATPase Fb1サブユニット由来のシグナルペプチド（Payamら, EMBO Mol Med, 6:458-466 2014）、ヒトのシトクロームcオキシダーゼ第8サブユニット（Bacmanら, Gene Therapy, 17:713-720 2010）などを例示することができ、植物細胞の場合、例えば、シロイヌナズナのATPase δ’サブユニット由来のシグナルペプチド（MFKQASRLLS RSVAAASSKS VTTRAFSTEL PSTLDS、配列番号１９）、イネのALDH2a遺伝子産物由来のシグナルペプチド（MAARRAASSL LSRGLIARPS AASSTGDSAI LGAGSARGFL PGSLHRFSAA PAAAATAAAT EEPIQPPVDV KYTKLLINGN FVDAASGKTF ATVDP、配列番号２０）およびエンドウのシトクロームcオキシダーゼVb-3由来のシグナルペプチド（MWRRLFTSPH LKTLSSSSLS RPRSAVAGIR CVDLSRHVAT QSAASVKKRV EDVV、配列番号２１）の他、シロイヌナズナのATPase βサブユニット由来のシグナルペプチドおよびchaperonin CPN-60由来のシグナルペプチド（Loganら, Journal of Experimental Botany, 50 865-871 2000およびイネのF1F0-ATPase inhibitor proteinのシグナルペプチド（Nakazonoら, Plant, 210 188-194 2000）などを挙げることができる。

TALE-改変因子融合体タンパク質を色素体内に輸送する方法として、TALE-改変因子融合体タンパク質に色素体移行シグナルペプチド（明確な高次構造や配列相同性をもたないが、例えば、塩基性アミノ酸と複数の疎水性アミノ酸に富み酸性アミノ酸が少なく、タンパク質アミノ酸配列のN末端に付加することで葉緑体や色素体に特異的に選別輸送される機能を示すペプチドなど）を融合させて発現させる方法を挙げることができる。本実施形態において使用可能な色素体移行シグナルペプチドは、例えば、植物色素体に局在するタンパク質が持つシグナルペプチドが好ましい。好ましいシグナルペプチドとしては、限定はしないが、例えば、RECA1、RBCS、CAB、NEP、SIG1～5、GUN2～5などのタンパク質由来のシグナルペプチドの他、RPL12およびRPS9などの核コード葉緑体リボソームタンパク質由来のシグナルペプチド、核コード葉緑体tRNAアミノアシル転移因子由来のシグナルペプチド、核コード葉緑体ヒートショックタンパク質由来のシグナルペプチド、FtsZ、FtsH、MinC、MinD、MinEなどタンパク質由来のシグナルペプチド、核コード葉緑体光合成関連酵素複合体酵素群由来のシグナルペプチド、核コード色素体脂質代謝酵素群由来のシグナルペプチド、核コードチラコイド構成タンパク質群由来のシグナルペプチドなどがある。色素体移行シグナルペプチドについては、例えば、von HEIJNEら, European Journal of Biochemistry, 180, 535-545 1989などを参照のこと。

場合によっては、TALE-改変因子融合体タンパク質をコードするプラスミドDNA、mRNAおよびTALE-改変因子融合体タンパク質自体を直接細胞内へ導入する方法（導入方法としては、例えば、ウィルス法、パーティクルガン法、PEG法、細胞膜透過性ペプチド法など）も使用可能である。

本実施形態にかかるTALE-改変因子融合体タンパク質（シグナルペプチドが結合されたタンパク質も含んでもよい）をコードするDNAは、当該技術分野において公知の方法により作製することができる。あるいは、市販のキットを使用して作製してもよい。より具体的には、TALE部分の作製に関しては、例えば、Golden Gate法（Cermakら, Nucleic Acids Res. 39:e82 2011）に基づくキット、その改変法（Sakumaら, Genes Cells 18:315-326 2013）に基づくキット、例えば、FusX TALEN assembly system（Addgene kit #1000000063）などを挙げることができる。これらのキットは、例えば、Addgeneなどから入手可能である。

第２の実施形態は、細胞内における同一のタンパク質をコードする複数の遺伝子が改変された細胞の作製方法であって、N、V、H、D、B、R、Y、M、W、SまたはKを認識または許容するアミノ酸で構成されているRVDを含むリピート配列を少なくとも１つ含む1種類のTALE-改変因子融合体を、細胞内に導入することを含む方法（以下「本実施形態にかかる細胞の作製方法」とも記載する）である。第２の実施形態で作製された細胞は、当該細胞が由来する生物の変異個体または変異系統の作製のために使用してもよい。従って、本実施形態には、第２の実施形態にかかる方法で作製された細胞が含まれる他、当該細胞を含む生物個体も含まれる。例えば、植物を例にすると、第２の実施形態にかかる方法で作製された植物細胞、当該植物細胞を含む種子もしくは植物（植物成体）も本実施形態に含まれる。

本実施形態（第１および第２の実施形態）における「細胞」は、原核生物の細胞および真核生物の細胞のいずれであってもよい。原核生物の細胞としては、特に限定はしないが、例えば、エシェリヒア属菌（エシェリヒア・コリ（Escherichia coli）など）、バチルス属菌（バチルス・サブチルス（Bacillus subtilis）など）、アグロバクテリウム（例えば、リゾビウム属菌（例えば、Rhizobium tumefacience、Rhizobium rhizogenes）など）を用いてもよい。真核生物の細胞としては、特に限定はしないが、例えば、酵母［サッカロマイセスセレビシエ（Saccharomyces cerevisiae）など］、ほ乳動物細胞の株化された細胞、ほ乳動物の生体から採取した初代培養細胞（マウス胎児線維芽細胞MEF、初代培養神経細胞など）、ES細胞、iPS細胞、さらに、植物細胞としては、植物由来の培養細胞の他、植物由来の細胞（例えば、胚珠由来の細胞など）であってもよく、さらに、種々の形態の植物由来の植物細胞、例えば、懸濁培養細胞、プロトプラスト、葉の切片、カルス、未熟胚、花粉等が含まれる。

ほ動物としては、特に限定されず、例えば、マウス、ラット、ハムスター、モルモット、ウサギ、ブタ、ウシ、ヤギ、ウマ、ヒツジ、イヌ、ネコ、ヒトもしくは非ヒトの霊長類（例えば、サル、カニクイザル、アカゲザル、マーモセット、オランウータン、チンパンジーなど）などを挙げることができる。ほ乳動物以外では、例えば、線虫（C. elegans）、魚類（ゼブラフィッシュ）、両生類（アフリカツメガエル、ネッタイツメガエル）などを挙げることができる。

また、植物としては、特に限定されず、種子植物であれば、いかなるものであってもよい。あえて例示するならば、例えば、イネ科植物、例えば、イネ、コムギ、トウモロコシ、オオムギ、ライムギ、ソルガムなど、あるいは、アブラナ科の植物、例えば、ミヤマナズナ属、シロイヌナズナ属（シロイヌナズナなど）、セイヨウワサビ属（セイヨウワサビなど）、イワナズナ属、アブラナ属［タアサイ、カラシナ、タカナ、セイヨウアブラナ、ミズナ、ハゴロモカンラン（ケール）、ハボタン、カリフラワー、キャベツ、メキャベツ（コモチカンラン）、ブロッコリー、チンゲンサイ、ノザワナ、アブラナ、ハクサイ、コマツナ、カブなど］、アマナズナ属、ナズナ属、タネツケバナ属、カラクサナズナ属、エダウチナズナ属、イヌナズナ属、キバナスズシロ属（ルッコラなど）、ハナダイコン属、ダイコンモドキ属、マガリバナ属、イオノプシディウム属、マメグンバイナズナ属、ニワナズナ属、ゴウダソウ属、マルコルミア属、アラセイトウ属、オランダガラシ属、オオアラセイトウ属、ダイコン属（ダイコン、ハツカダイコンなど）、ミヤガラシ属、イヌガラシ属、キハナハタザオ属、グンバイナズナ属、ワサビ属（ワサビなど）などに属する植物を使用することができる。さらに、トマト、ジャガイモ、ピーマン、シシトウ、ペチュニアなどのナス科植物、ヒマワリ、タンポポなどのキク科植物、ヒルガオ、サツマイモなどのヒルガオ科植物、コンニャク、タロイモ、サトイモ、ヤツガシラなどのサトイモ科植物、ダイズ、アズキ、インゲンなどマメ科植物、カボチャ、キュウリ、メロンなどのウリ科植物、タマネギ、ネギ、ニンニクなどのヒガンバナ科植物などを例示することができる。植物由来の培養細胞の他、植物体中の細胞も含まれる。さらに、種々の形態の植物由来の植物細胞、例えば、懸濁培養細胞、プロトプラスト、葉の切片、カルス、未熟胚、花粉等が含まれる。

第３の実施形態は、TALEのリピート配列を少なくとも１つ含むDNA結合タンパク質であって、当該リピート配列に含まれるRVDが、
Nを認識または許容するRV、CS、VR、NA、S*、RH、RLまたはRTで構成されており、
Mを認識するHCまたはKCで構成されており、
Vを認識するHS、HT、HV、KVまたはRCで構成されており、または、
RまたはVを認識するNTで構成されている、前記タンパク質である。
第３の実施形態にかかるタンパク質は、複数種の塩基を認識または許容する新規のRVDを少なくとも１つ含むことを特徴とする。本実施形態におけるタンパク質のTALE部分、すなわち、DNA結合ドメインには、約34アミノ酸からなるアミノ酸配列の繰り返し構造が含まれている（以下、約34アミノ酸からなるアミノ酸配列を「リピート配列」とも記載する）。本実施形態で使用されるTALE部分に、通常2個以上、好ましくは、6個以上、より好ましくは、16個以上、かつ、通常36個以下、好ましくは24個以下、より好ましくは20個以下のリピート配列が含まれていてもよい。

ここで、「リピート配列」としては、例えば、以下の配列番号８、配列番号９、配列番号１０、配列番号１１、配列番号１２もしくは配列番号１３で表されるアミノ酸配列、または、配列番号８、配列番号９、配列番号１０、配列番号１１、配列番号１２もしくは配列番号１３で表されるアミノ酸配列に欠失、置換または付加が起こったアミノ酸配列であっ、各々、配列番号８、配列番号９、配列番号１０、配列番号１１、配列番号１２もしくは配列番号１３で表されるアミノ酸配列と80％以上の配列同一性、好ましくは、90％以上の配列同一性を有するアミノ酸配列を挙げることができる。

第３の実施形態にかかるタンパク質は、他の機能性タンパク質、すなわち、TALEとは異なる機能または活性を有するタンパク質（またはポリペプチド）と融合（または結合）していてもよい。第３の実施形態にかかるタンパク質と機能性タンパク質との結合は、ペプチド結合などによる直接結合であっても、リンカーなどを介した間接結合のいずれであってもよい。当該機能性タンパク質は、核酸配列を改変する機能を有するタンパク質の全部または一部分であってもよい。当該機能性タンパク質の他の例としては、例えば、転写活性調節因子（転写活性化因子または転写抑制因子など）などの全部または一部、エピゲノム制御因子の全部または一部、蛍光タンパク質、発光タンパク質、色素タンパク質の全体または一部分などを挙げることができる。ここで「一部分」とは、例えば、それ自体で目的の機能を発揮するか、または二量体を形成することによって目的の機能を発揮する部分のことである。

第４の実施形態は、第１の実施形態および第２の実施形態で使用される、TALE-改変因子融合体または第３の実施形態にかかるタンパク質もしくは当該タンパク質と機能性タンパク質との融合体（以下これらの融合体またはタンパク質を「本実施形態にかかるタンパク質」とも記載する）をコードする核酸（DNAなど）である。第１の実施形態および第２の実施形態で使用されるTALE-改変因子融合体、ならびに、第３の実施形態にかかるタンパク質および当該タンパク質と機能性タンパク質との融合体は、これをコードする核酸（第４の実施形態にかかる核酸）を適当な発現用ベクターに組込み、該発現用ベクターによって適当な宿主細胞を形質転換または形質移入し、これを適当な培地中で培養し、これらのタンパク質を発現させ、精製することで調製することができる。

本実施形態にかかるタンパク質発現させる宿主細胞としては、例えば、細菌細胞（例えば、Escherichia coli B strain、E. coli Kl2 strain、Corynebacterium ammoniagenes、C. glutamicum、Serratia liquefaciens、Streptomyces lividans、Pseudomonas putidaなど）、カビ（例えば、Penicillium camembertii、Acremonium chrysogenumなど）、動物細胞、植物細胞、バキュロウイルス／昆虫細胞または酵母細胞（例えば、Saccharomyces cerevisiae およびPichia pastorisなど）を使用し、これらの細胞内で発現させることができる。

本実施形態にかかるタンパク質を発現させるための発現用ベクターは、各種宿主細胞に適したベクターを用いることができる。当該発現用ベクターは、第１および第２の実施形態にかかる方法において、細胞内でタンパク質を発現させる場合にも使用することができる。発現用ベクターとしては、例えば、pBR322、pBR325、pUC118、pETなど（大腸菌宿主）、pEGF-C、pEGF-Nなど（動物細胞宿主）、pVL1392、pVL1393など（昆虫細胞宿主、バキュロウイルスベクター）、pG-1、Yep13またはpPICZなど（酵母細胞宿主）、植物細胞用のバイナリーベクター（pBG、pBI、pGreen、pCAMBIA、pLC、pSB11、pSB200、pRI）などを使用することができる。これらの発現ベクターは、各々のベクターに適した、複製開始点、選択マーカーおよびプロモーターを有しており、必要に応じて、エンハンサー、転写終結配列（ターミネーター）、リボソーム結合部位およびポリアデニル化シグナル等を有していてもよい。さらに、発現ベクターには、発現したポリペプチドの精製を容易にするため、FLAGタグ、Hisタグ、HAタグおよびGSTタグなどを融合させて発現させるための塩基配列が挿入されていてもよい。
発現用ベクターの作製は、当業者に公知の手法により実施することができ、適宜、市販のキットなどを使用して行うこともできる。また、本実施形態にかかる発現ベクターは単離または精製されていることが好ましい。

発現させたタンパク質を培養菌体または培養細胞から抽出する際には、培養後、公知の方法で菌体または培養細胞を集め、これを適当な緩衝液に懸濁し、超音波、リゾチームおよび／または凍結融解などによって菌体または細胞を破壊したのち、遠心分離や濾過により、可溶性抽出液を取得する。特に、培養細胞を宿主として用いる場合は、培養上清中に発現させたタンパク質を、上清を回収する事により取得する方が望ましい。得られた抽出液または培養上清から、公知の分離・精製法を適切に組み合わせて目的のタンパク質を取得することができる。公知の分離、精製法としては、塩析や溶媒沈澱法などの溶解度を利用する方法、透析法、限外ろ過法、ゲルろ過法、SDS-PAGE等の主として分子量の差を利用する方法、イオン交換クロマトグラフィーなどの電荷の差を利用する方法、アフィニティクロマトグラフィーなどの特異的親和性を利用する方法（例えば、GSTタグと共にポリペプチドを発現させた場合にはグルタチオンを担体に結合させた樹脂を、Hisタグと共にポリペプチドを発現させた場合にはNi-NTA樹脂やCoベースの樹脂を、HAタグと共にポリペプチドを発現させた場合には抗HA抗体樹脂を、FLAGタグと共にポリペプチドを発現させた場合には、抗FLAG抗体結合樹脂などを使用する方法）、逆相高速液体クロマトグラフィーなどの疎水性の差を利用する方法または等電点電気泳動法などの等電点の差を利用する方法などが用いられる。

本明細書において引用されたすべての文献の開示内容は、全体として明細書に参照により組み込まれる。また、本明細書全体において、単数形の「a」、「an」、および「the」の単語が含まれる場合、文脈から明らかにそうでないことが示されていない限り、単数のみならず複数のものを含むものとする。
以下に実施例を示してさらに本発明の説明を行うが、実施例は、あくまでも本発明の実施形態の例示にすぎず、本発明の範囲を限定するものではない。

１．材料と方法
１－１．N認識モジュールプラスミドの作製
Platinum Gate TALEN kit（Addgene, Kit # 1000000043）に含まれるモジュールプラスミド（p1HD/#50664、p2HD/#50668、p3HD/#50672、p4HD/#50676）をテンプレートとして、表１に記載のプライマーセットを用いてPCRすることで、HDコードをRVコードに変化させたアンプリコンを作製し、Pvu Iで切断した元のベクターとともに、In-Fusion HD Cloning反応（Takara）を行うことでp1-4のRVモジュールプラスミドを作製した。また、DNA結合ドメインのC末端のRVDリピート配列を持つエントリーベクター（E1_pENTR_L1-L4_NI_G1397-DddtoxA-N/#171727）を鋳型に同様のPCRを行い、同じベクターをKpn IおよびXba Iで制限酵素処理後、精製した線状化ベクターおよび精製したPCR産物を用いてIn-Fusion HD Cloning反応を行った。得られたp1RV、p2RV、p3RV、p4RVモジュールプラスミドおよびC末端のRVリピート配列を持つエントリーベクター（E1_pENTR_L1-L4_RV_G1397-DddtoxA-N）について、RVDリピート部分のDNA配列をサンガーシーケンス (Eurofins Genomicsに委託) で確認した。

１－２．TALECDのDNA結合ドメインの設計
シロイヌナズナゲノムのβチューブリン遺伝子tub4では、Ser351Pheを引き起こす塩基置換により表層細胞列および一次根のねじれの表現型が生じることが知られている（Ishidaら, Proceedings of the National Academy of Sciences, 104: 8544-8549 2007）。このセリン残基はシロイヌナズナゲノムに存在するβチューブリン遺伝子9つの全てで保存されており、この該当するセリン残基を標的として一斉塩基置換変異導入を目指した。シトシンからチミンへの塩基置換によって、このセリン残基についてSerからPhe、またはSerからLeuへの変異を引き起こす標的シトシン塩基を含む15塩基長の標的ウィンドウ（TALE leftおよびTALE rightの認識配列に挟まれた配列）を設定した（図１a）。
この実験で用いたTALECDは、platinum TALENのscaffoldを改変して作製し（Nakazatoら, Nature Plants 7:906-913 2021）、このscaffoldはTALEのDNA結合ドメインの認識配列の5'に隣接する塩基がチミンのときに認識配列との親和性が高くなる傾向を示す（Millerら, Nature Biotechnology, 29:143-148 2011)。認識配列の5'にチミンが隣接するように、左右それぞれ16、19塩基長の認識配列を設定し、認識配列を構成する塩基に対応するリピート配列を配する左右のTALE結合ドメインを設計した（図１aおよびa）。

１－３．nTALECD発現コンストラクト作製
nTALECDのDNA結合ドメインのアセンブリーにはPlatinum Gate TALEN kit（Addgene、ID: #1000000043、Sakumaら, Scientific Reports, 3:3379 2013）を用い、2段階のクローニングを行った。最初のステップでは、Platinum Gate TALENの16種類のモジュールプラスミド、および前項で作製したp1-4のRVモジュールプラスミドを組み合わせてアレイプラスミドにBsaI-HFv2（NEB）存在下でライゲーション反応し、連続する4つのRVDリピート配列を任意の組み合わせで持つプラスミドをクローニングした（図５a左）。2つ目のステップでは、DNA結合ドメインのC末端のRVDリピート、シチジンデアミナーゼのN末端またはC末端およびウラシルグリコシラーゼインヒビターが連結したタンパク質（あるいは、Fok Iヌクレアーゼ等）のコード配列を有するエントリーベクター（例えば、E1_pENTR_L1-L4_NI_G1397-DddtoxA-N/#171727、pENTR_E1_pF5A_L1-L4/#158728）に、最初のステップで作製した複数のアレイプラスミドをEsp3I（Thermo Fisher）存在下でライゲーション反応を行うことで組み込んだ（図５a右)。
左右のTALECDのタンパク質全長コード配列を持つそれぞれのエントリーベクター（図５ｂ、Entry vector 1およびEntry vector 3）を、シロイヌナズナRPS5Aプロモーター・核局在化シグナル（SV40NLS）・HSPターミネーター配列を有するエントリーベクター（Entry vector 2）とデスティネーションベクターおよびLR Clonase II Plus enzyme（Thermo Fisher）を混合し、multisite Gateway LR反応（Thermo Fisher）で左右TALECDタンパク質をタンデムに発現するバイナリーベクターを作製した（図５b）。

１－４．形質転換および形質転換体のスクリーニング
nTALECD発現カセットを持つバイナリーベクターを、エレクトロポレーション法でアグロバクテリウム菌株C58C1（pMP90）に導入した。シロイヌナズナ野生型Col-0にバイナリーベクターを導入したアグロバクテリウムを花序浸し法で感染させ（CloughおよびBent, The Plant Journal, 16:735-743 1998）、形質転換した。形質転換したバイナリーベクターは種子で特異的に発現するOle1プロモーター::Ole1-GFPの発現カセットを持つため、このバイナリーベクターの形質転換種子はGFP蛍光を発する（Shimadaら, The Plant Journal, 61:519-528 2010)。アグロバクテリウムに感染させた個体の自殖後代種子のうち、GFP蛍光を呈する種子を125 μg/mLクラフォラン、10 mg/mLスクロース入り1/2MS培地に播種し、得られたT₁実生を解析に用いた。

１－５．生育条件およびジェノタイピング
T₁種子は4℃で低温処理後、人工気象器に移し22℃、長日条件（16時間明期/8時間暗期）で育成した。種子低温処理後14日目の実生について本葉1枚からトータルDNAを抽出した。このトータルDNAを鋳型にPCRサンガーシーケンスを行い、標的配列のシーケンス波形データをGeneious Prime（v. 2022. 1.1）上で解析し、標的塩基についてジェノタイピングした。PCRアンプリコンの増幅およびサンガーシーケンスに使用したプライマーを表２に示す。

２．結果
２－１．複数のSNPを有する遺伝子配列を同時に認識または許容するTALEの設計
本明細書に開示する一連の実験では、実際の植物体において、通常使われていないRVDを有するリピート配列に、複数の異なる塩基を認識させることを試みた。また、同じ遺伝子ファミリーに分類されるが、若干、塩基配列が異なるいわゆる多重遺伝子について、複数塩基認識性のRVDリピートを用いてSNPを許容することで、ゲノム編集による一塩基変異を複数遺伝子座（若干塩基配列が異なる遺伝子座）に一斉導入できるか検証した。
シロイヌナズナゲノムに存在するβチューブリン遺伝子9つの全てにおいて保存されているTUB2、TUB3、TUB4、TUB6、TUB7、TUB8、TUB9のSer351、およびTUB1、TUB5のSer352において、nTALECDを用いてPheまたはLeuへの変異を引き起こすことを試みた（図１a）。図１ａの右図には、各TALE（TALE+およびTUB4-specific TALE）によって認識される標的配列の塩基のうち、各遺伝子の配列がどれくらいミスマッチなく認識されるか（ただしTALE+でのN認識RVDリピート認識塩基は除く）を示している。

TALE+ 8NのTALE leftのリピート配列の構成を例に、複数のSNPが存在する配列を同時に認識するDNA結合ドメインの設計を説明する（図１b）。標的であるTUB1、TUB2、TUB3、TUB4の該当のTALE認識配列（リピート配列が結合する16塩基長+5'に隣接する1塩基）のうち、1、4、13番目の塩基の構成が遺伝子間で異なっている。TALE leftのDNA結合ドメインは、この3箇所を従来用いられないRVというRVDを含むリピートで認識するように設計した。

２－２．変異を導入したT₁個体の解析
nTALECDの発現ベクターを核ゲノムに導入した形質転換第一世代 (T₁世代) について、種子低温処理後14日目の時点で標的ウィンドウに変異が導入されているかをPCRサンガーシーケンスで確認した。図２は、代表個体 (#17) のサンガーシーケンスの波形であり、TUB1、TUB2、TUB3およびTUB4の4つの標的遺伝子座で標的塩基への部分的、もしくは完全（ホモ）な塩基置換 (C > T) が生じたことを示している。

TALE+ 8Nペア、またはTUB4-specificペアのコンストラクトを導入したT₁世代で、各βチューブリン遺伝子の標的塩基に対して、変異が導入された個体数とその割合をまとめた（図３）。TUB4-specificペアによって標的のTUB4には高効率で変異が導入されたのに対し、他の8つのβチューブリン遺伝子ではTUB8に変異が導入された1個体を除き、変異が検出されなかった（図３ｂ）。これに対してTALE+ 8Nペアの場合、標的とした4つのβチューブリン遺伝子について複数の個体で変異が導入されており、また、標的ではない5つのβチューブリン遺伝子のうち、TUB5、TUB6およびTUB7についても変異が導入されている個体が見られた（図３a）。

次に、変異が導入されたβチューブリン遺伝子の数を各T₁個体で調べ、編集された遺伝子数に対する個体数の割合をまとめた（図４）。TUB4-specificペアによって変異が導入された遺伝子数は、TUB4単独の1遺伝子、およびTUB4とTUB8の2遺伝子であったのに対し、TALE+ 8Nペアでは1遺伝子～6遺伝子の間でばらつきがあった。
以上、図２～図４に示す結果より、N認識RVDリピートを用いた単独のTALECDペアが、従来の各塩基特異的RVDリピートのみを用いる場合と比較して認識配列内にあるSNPを許容し、複数の類似配列を同時に標的可能であることが示された。

本発明にかかる方法またはタンパク質を使用することにより、複数の遺伝子の同時改変が可能となる。従って、医療分野、農業分野および畜産分野における利用が期待される。

Claims

同一または類似のタンパク質をコードする複数のDNAを改変する方法であって、
N、V、H、D、B、R、Y、M、W、SまたはKを認識または許容するアミノ酸で構成されているRVD（repeat variable di-residue）を含むリピート配列を少なくとも１つ含む1種類のTALE-改変因子複合体のTALE部分を、当該複数のDNAの結合領域に結合させることを含む、前記方法。
細胞内における同一または類似のタンパク質をコードする複数の遺伝子を改変する方法であって、
N、V、H、D、B、R、Y、M、W、SまたはKを認識または許容するアミノ酸で構成されているRVDを含むリピート配列を少なくとも１つ含む1種類のTALE-改変因子複合体を、細胞内に導入することを含む、前記方法。
細胞内における同一または類似のタンパク質をコードする複数の遺伝子が改変された細胞の作製方法であって、
N、V、H、D、B、R、Y、M、W、SまたはKを認識または許容するアミノ酸で構成されているRVDを含むリピート配列を少なくとも１つ含む1種類のTALE-改変因子複合体を、細胞内に導入することを含む、前記方法。
前記RVDが認識または許容する塩基が、前記複数のDNAまたは遺伝子の塩基配列をアライメントしたときに、同じ位置に存在する塩基の1または複数が他のDNAまたは遺伝子の塩基と異なる塩基である、請求項１から請求項３までのいずれか１項に記載の方法。
前記RVDのアミノ酸が、
Nを認識または許容するRV、CS、VR、NA、S*、RH、RLもしくはRTで構成されており、
Mを認識するHCもしくはKCで構成されており、
Vを認識するHS、HT、HV、KVもしくはRCで構成されており、または、
RもしくはVを認識するNTで構成されている、請求項１から請求項３までのいずれか１項に記載の方法。ただし、S*の「*」は、RVDの第2位値がギャップであることを示す。
前記改変因子が、エンドヌクレアーゼの全部もしくは一部、デアミナーゼの全部もしくは一部である、請求項１から請求項３までのいずれか１項に記載の方法。
前記遺伝子が、核遺伝子、ミトコンドリア遺伝子または色素体遺伝子である、請求項２または３に記載の方法。
前記細胞が植物細胞である、請求項２に記載の方法。
前記細胞が植物細胞である、請求項３に記載の方法。
請求項９に記載の方法で作製された植物細胞。
請求項１０に記載の植物細胞を含む種子または植物。
TALEのリピート配列を少なくとも１つ含むDNA結合タンパク質であって、当該リピート配列に含まれるRVDが、
Nを認識または許容するRV、CS、VR、NA、S*、RH、RLもしくはRTで構成されており、
Mを認識するHCもしくはKCで構成されており、
Vを認識するHS、HT、HV、KVもしくはRCで構成されており、または、
RもしくはVを認識するNTで構成されている、前記タンパク質。ただし、S*の「*」は、RVDの第2位値がギャップであることを示す。
前記RVDがNを認識または許容するRVである、請求項１２に記載のタンパク質。
機能性タンパク質が融合していることを特徴とする、請求項１３に記載のタンパク質。