JP2023131616A - Dna編集システム、並びに、それを用いた標的dnaの編集方法及び標的dnaが編集された細胞の製造方法 - Google Patents

Dna編集システム、並びに、それを用いた標的dnaの編集方法及び標的dnaが編集された細胞の製造方法 Download PDF

Info

Publication number
JP2023131616A
JP2023131616A JP2022036476A JP2022036476A JP2023131616A JP 2023131616 A JP2023131616 A JP 2023131616A JP 2022036476 A JP2022036476 A JP 2022036476A JP 2022036476 A JP2022036476 A JP 2022036476A JP 2023131616 A JP2023131616 A JP 2023131616A
Authority
JP
Japan
Prior art keywords
dna
sequence
tale
type
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022036476A
Other languages
English (en)
Inventor
哲史 佐久間
Tetsushi Sakuma
卓 山本
Taku Yamamoto
奈穂子 西堀
Naoko Nishibori
忠彦 吉間
Tadahiko Yoshima
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hiroshima University NUC
Sumitomo Chemical Co Ltd
Original Assignee
Hiroshima University NUC
Sumitomo Chemical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hiroshima University NUC, Sumitomo Chemical Co Ltd filed Critical Hiroshima University NUC
Priority to JP2022036476A priority Critical patent/JP2023131616A/ja
Publication of JP2023131616A publication Critical patent/JP2023131616A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

【課題】 特異的かつ効率的に、核酸塩基変換酵素による標的DNAの編集を行うことができる方法を提供すること。【解決手段】 標的DNAを編集する方法であり、(1)DNA結合ドメイン及び核酸塩基変換酵素を含む融合タンパク質、並びに、(2)ヌクレアーゼ活性の一部又は全部を喪失したタイプI-Casタンパク質群及びそのガイドRNAを含むタイプI-CRISPR-Casシステムを標的DNAに接触させ、前記核酸塩基変換酵素活性により前記標的DNAの標的部位の塩基を編集する工程を含み、前記DNA結合ドメインが認識するDNA結合ドメイン認識配列又はその相補配列は、前記標的部位の5’側又は3’側に7~31塩基の鎖長のスペーサー1を介して存在し、かつ、前記タイプI-CRISPR-CasシステムにおけるガイドRNAが認識するガイドRNA標的配列は、前記標的部位の相補塩基を含むように存在する、方法。【選択図】 なし

Description

本発明は、DNA編集システム、並びに、それを用いた標的DNAの編集方法及び標的DNAが編集された細胞の製造方法に関し、より詳しくは、標的DNAを編集する方法、その方法を用いてゲノム編集された細胞を製造する方法、及びそれらに用いる組み合わせに関する。
細菌及び古細菌は、ウイルスや外来プラスミド等に対する免疫機構としてCRISPR-Casシステムを有している。細菌及び古細菌におけるCRISPR-Casシステムは、細胞内に侵入した外来核酸の配列に対して相補的なRNA分子をガイドとしてCasタンパク質を誘導し、Casタンパク質による当該外来核酸の切断によってその分解を促す機構である。現在、CRISPR-Casシステムは、クラス1及びクラス2の2つのクラスに分類されており、また、タイプI、タイプII、タイプIII、タイプIV、タイプV、及びタイプVIの6つのタイプにも分類されている。クラス2には、タイプIIシステム、タイプVシステム、及びタイプVIシステムが含まれ、これらは、ガイドRNAと1つのCasタンパク質とで複合体を形成して核酸を切断する。クラス1には、タイプIシステム、タイプIIIシステム、及びタイプIVシステムが含まれ、これらは、ガイドRNAと複数のCasタンパク質とで複合体(カスケード複合体)を形成し、核酸を切断する。
近年、CRISPR-Casシステムとして、タイプIIシステムやタイプVシステムを利用したゲノム編集技術が多く開発されており、特に、タイプIIシステムであるCRISPR-Cas9システムを利用した技術が盛んに開発されている。例えば、ヌクレアーゼ活性の全て又は一部が喪失したCRISPR-dCas9/nCas9とデアミナーゼ等の核酸塩基変換酵素とを組み合わせた塩基編集方法は、2016年に最初の報告(Komor et al.,Nature 533,420-424(2016)(非特許文献1))がなされて以降、その編集効率の高さとドナ-DNAを必要としない簡便さとから、急速に利用が広まり、さまざまな生物や細胞での実施例が報告されると共に、改良システムも多数開発されている(Rees and Liu,Nat Rev Genet 19,770-788(2018)(非特許文献2)等)。
例えば、塩基CからTへの塩基編集(C→T(G→A))においては、ラットのAPOBEC1(rAPOBEC1)を利用したシステム(上記初出論文でのBE3から、現在ではAncBE4maxと呼ばれるシステムへと改良が進められている;Koblan et al.,Nat Biotechnol 36,843-846(2018)(非特許文献3))と、ヤツメウナギのCDA1(PmCDA1)を利用したシステム(Target-AID;Nishida et al.,Science 353,aaf8729(2016)(非特許文献4))と、がよく用いられており、その他にAPOBEC3AやAPOBEC3B等が利用可能であることも報告されている(Gehrke et al.,Nat Biotechnol 36,977-982(2018)(非特許文献5);Martin et al.,Sci Rep 9,497(2019)(非特許文献6))。
また、例えば、塩基AからGへの塩基編集(A→G(T→C))システムとして、大腸菌に由来するTadAタンパク質をエンジニアリングして構築したAdenine Base Editor(ABE)システムも報告されている(Gaudelli et al.,Nature 551,464-471(2017)(非特許文献7))。さらに、例えば、デアミナーゼをN末ドメインとC末ドメインとに分割(split)し、ZFとnCas9とにそれぞれ融合させることで、ZF及びnCas9の両者の標的配列が近傍に存在するときに初めて塩基編集が施されるようなシステムも報告されている(国際公開第2018/218166号(特許文献1))。
一方、CRISPR-Casシステムのうち、タイプIシステムについては、近年の様々な細菌類の全ゲノム配列の解析から、複数のサブタイプに分類されており、現在では、大きく分けてサブタイプI-A、I-B、I-C、I-D、I-E、I-F、及びI-G(I-U)の7つに分類されている(Makarova et al.,Nat Rev Microbiol 18,67-83(2020)(非特許文献8)等)。
タイプIシステムを利用した技術としては、例えば、サブタイプI-B及びI-Eのシステム(Pickar-Oliver et al.,Nat.Biotechnol. 37,1493-1501(2019)(非特許文献9))や、サブタイプI-Fのシステム(Chen et al.,Nat.Commun.11,3136(2020)(特許文献10))を用いて標的遺伝子の転写活性を制御する方法等が報告されている。しかしながら、タイプIシステムについては、未だ十分に解明や研究が進んでいない。また、タイプIシステムでは、何種類ものタンパク質を発現させなくてはならない煩雑さ等から、CRISPR-Casシステムによるゲノム編集ツールとしての開発は遅れがちであった。
国際公開第2018/218166号
Komor et al.,Nature 533,420-424(2016) Rees and Liu,Nat Rev Genet 19,770-788(2018) Koblan et al.,Nat Biotechnol 36,843-846(2018) Nishida et al.,Science 353,aaf8729(2016) Gehrke et al.,Nat Biotechnol 36,977-982(2018) Martin et al.,Sci Rep 9,497(2019) Gaudelli et al.,Nature 551,464-471(2017) Makarova et al.,Nat Rev Microbiol 18,67-83(2020) Pickar-Oliver et al.,Nat.Biotechnol. 37,1493-1501(2019) Chen et al.,Nat.Commun.11,3136(2020)
しかしながら、CRISPR-Cas9システムを用いたゲノム編集技術では、塩基編集における編集可能領域(ウインドウ)が狭く、通常、数塩基から十塩基程度の塩基の編集しか導入できないため、遺伝子内の広域編集の誘導等には不向きであった。また、CRISPR-Cas9システムではガイドRNAの標的配列が短い(通常、好ましくは20塩基程度)ことから、特異性が十分ではないという課題や、このシステムのみに依存すると、PAM配列が限られるために標的配列が限定されてしまうという課題も有していた。そのため、CRISPR-Cas9システムに依存しない、従来技術よりも標的特異性が高いゲノム編集技術の開発が求められている。
本発明は、上記従来技術の有する課題に鑑みてなされたものであり、特異的かつ効率的に、核酸塩基変換酵素による標的DNAの編集を行うことができる方法、その方法を用いてゲノム編集された細胞を製造する方法、及びそれらに用いるDNA編集システムを提供することを目的とする。
本発明者らは、上記目的を達成すべく、CRISPR-Casシステムのうち、タイプIシステムを利用して標的DNAを特異的かつ効率的に編集可能なゲノム編集技術の開発を試みた。タイプIシステム(本明細書中、「タイプI-CRISPR-Casシステム」ともいう)はCRISPR-Cas9システムとPAM配列が異なるため、標的配列の制約が異なり、また、ウインドウのサイズが大きいため、CRISPR-Cas9システムでは標的とすることが困難な部位の塩基編集が可能となる。
本発明者らが鋭意研究を重ねた結果、核酸塩基変換酵素をsplit化することなくTALE等のDNA結合ドメインに融合しつつ、かかるDNA結合ドメイン-核酸塩基変換酵素融合タンパク質(例えば、TALE-デアミナーゼ融合タンパク質)と、タイプI-CRISPR-Casシステムと、の両者を標的DNAの標的部位の近傍に結合させるシステムを開発した。核酸塩基変換酵素をsplit化しない構造は、デアミナーゼの場合には、例えば既報の高活性システムであるAncBE4maxに準拠しているが、これをCasタンパク質に直接連結するのではなく、DNA結合ドメインに連結させていることにより、DNA結合ドメイン-核酸塩基変換酵素融合タンパク質のみが標的DNAに結合しても、基質となる一本鎖DNAが露出していないために塩基編集は起こらない。また、上記のタイプI-CRISPR-Casシステムでは、Casタンパク質群によるヌクレアーゼ活性を有さないため、タイプI-CRISPR-Casシステム(タイプI-Casタンパク質群+ガイドRNA)のみが標的DNAに結合しても、前記核酸塩基変換酵素が存在しないために、やはり塩基編集は起こらない。本発明者らは、上記のDNA結合ドメイン-核酸塩基変換酵素融合タンパク質とタイプI-CRISPR-Casシステムとの組み合わせにおいて、標的DNA上のDNA結合ドメイン認識配列(又はその相補配列)~標的部位間のスペーサー1、及び標的DNA上のRNA標的配列の相補配列の位置の検討により、従来のAncBE4maxシステムに近い塩基編集効率を達成できることを見出した。
したがって、本発明者らは、かかるDNA結合ドメイン-核酸塩基変換酵素融合タンパク質とタイプI-CRISPR-Casシステムとの組み合わせによれば、これら両者が、標的部位を中心として、特定の距離を置いて標的DNAにそれぞれ結合したときに初めて塩基編集が起こり、高い特異性が担保されること、及び前記核酸塩基変換酵素をDNA結合ドメインに結合させたことにより高い編集効率を実現できることを見出し、本発明を完成するに至った。
かかる知見により提供される本発明の態様は以下のとおりである。
[1]
標的DNAを編集する方法であり、
(1)DNA結合ドメイン及び核酸塩基変換酵素を含む融合タンパク質、並びに、
(2)ヌクレアーゼ活性の一部又は全部を喪失したタイプI-Casタンパク質群及びそのガイドRNAを含むタイプI-CRISPR-Casシステム
を標的DNAに接触させ、前記核酸塩基変換酵素活性により前記標的DNAの標的部位の塩基を編集する工程を含み、
前記DNA結合ドメインが認識するDNA結合ドメイン認識配列又はその相補配列は、前記標的部位の5’側又は3’側に7~31塩基の鎖長のスペーサー1を介して存在し、かつ、
前記タイプI-CRISPR-CasシステムにおけるガイドRNAが認識するガイドRNA標的配列は、前記標的部位の相補塩基を含むように存在する、
方法。
[2]
標的DNAが編集された細胞を製造する方法であり、
(1)DNA結合ドメイン及び核酸塩基変換酵素を含む融合タンパク質、並びに、
(2)ヌクレアーゼ活性の一部又は全部を喪失したタイプI-Casタンパク質群及びそのガイドRNAを含むタイプI-CRISPR-Casシステム
を細胞に導入又は細胞内で発現させて標的DNAに接触させ、前記融合タンパク質の核酸塩基変換酵素活性により前記標的DNAの標的部位の塩基を編集する工程を含み、
前記DNA結合ドメインが認識するDNA結合ドメイン認識配列又はその相補配列は、前記標的部位の5’側又は3’側に7~31塩基の鎖長のスペーサー1を介して存在し、かつ、
前記タイプI-CRISPR-CasシステムにおけるガイドRNAが認識するガイドRNA標的配列は、前記標的部位の相補塩基を含むように存在する、
方法。
[3]
前記融合タンパク質がさらに、前記DNA結合ドメインと前記核酸塩基変換酵素とを結合するリンカー1を含む、[1]又は[2]に記載の方法。
[4]
前記融合タンパク質がさらに、C末側にリンカー2を介して結合された塩基除去修復インヒビターを含む、[1]~[3]のうちのいずれか一項に記載の方法。
[5]
前記融合タンパク質におけるDNA結合ドメインがTALEである、[1]~[4]のうちのいずれか一項に記載の方法。
[6]
前記融合タンパク質における核酸塩基変換酵素がデアミナーゼである、[1]~[5]のうちのいずれか一項に記載の方法。
[7]
前記デアミナーゼが、APOBEC、PmCDA1、Anc689、及びTadAからなる群から選択される少なくとも1種である、[6]に記載の方法。
[8]
[1]~[7]のうちのいずれか一項に記載の方法に用いるためのDNA編集システムであり、
(1)DNA結合ドメイン及び核酸塩基変換酵素を含む融合タンパク質、並びに、
(2)ヌクレアーゼ活性の一部又は全部を喪失したタイプI-Casタンパク質群及びそのガイドRNAを含むタイプI-CRISPR-Casシステム
を含む、DNA編集システム。
[9]
前記融合タンパク質がさらに、前記DNA結合ドメインと前記核酸塩基変換酵素とを結合するリンカー1を含む、[8]に記載のDNA編集システム。
[10]
前記融合タンパク質がさらに、C末側にリンカー2を介して結合された塩基除去修復インヒビターを含む、[8]又は[9]に記載のDNA編集システム。
[11]
前記融合タンパク質における核酸塩基変換酵素がデアミナーゼである、[8]~[10]のうちのいずれか一項に記載の方法。
[12]
前記デアミナーゼが、APOBEC、PmCDA1、Anc689、及びTadAからなる群から選択される少なくとも1種である、[11]に記載のDNA編集システム。
本発明によれば、特異的かつ効率的に、核酸塩基変換酵素による標的DNAの編集を行うことができる方法、その方法を用いてゲノム編集された細胞を製造する方法、及びそれらに用いるDNA編集システムを提供することが可能となる。
標的DNAの編集方法の第1の態様(a)及び第2の態様(b)における融合タンパク質、タイプI-CRISPR-Casシステム、PAM配列、及び標的DNAの関係を示す概念図である。 標的DNAの編集方法の第3の態様(a)及び第4の態様(b)における融合タンパク質、タイプI-CRISPR-Casシステム、PAM配列、及び標的DNAの関係を示す概念図である。 レポータープラスミドにおけるTALE-デアミナーゼによる塩基編集の態様例を示す模式図である。図2の(a)は、挿入配列がTALE認識配列(11)の相補配列を含む場合を示し、図2の(b)は、挿入配列がTALE認識配列(11)を含む場合を示す。 TALE-デアミナーゼの構造の態様例を示す概念図である。図3の(a)は、実施例で用いたTALE-AIDシリーズの構造を示し、図3の(b)は、実施例で用いたBE4-TALEシリーズの構造を示し、図3の(c)は、実施例で用いたABE8eシリーズの構造を示す。 試験1の(1)で得られたTALE-AIDシリーズの活性値(AncBE4max活性値に対する割合)を示すグラフである((a):TypeI-F、(b):TypeI-B)。 試験1の(2)で得られたBE4-TALEシリーズの活性値(AncBE4max活性値に対する割合)を示すグラフである((a):TypeI-F、(b):TypeI-B)。 内因性DNAのCCR5遺伝子上のターゲットサイトであるAS14サイトにおけるPAM配列、gRNA-IF-1の標的配列の相補配列(crDNA-IF-1)、TALE認識配列(b、c)又はTALE認識配列の相補配列(a)の位置、並びに、これに対応するファミリー遺伝子CCR2とのアラインメントをまとめて示す概念図である。 内因性DNAのCCR5遺伝子上のターゲットサイトであるAS14サイトにおけるPAM配列、gRNA-IF-2の標的配列の相補配列(crDNA-IF-2)、TALE認識配列(b)又はTALE認識配列の相補配列(a)の位置、並びに、これに対応するファミリー遺伝子CCR2とのアラインメントをまとめて示す概念図である。 内因性DNAのHBB遺伝子上のターゲットサイトであるS1サイト及びS2サイトにおけるPAM配列、gRNA-IF-7、IB-1、IB-2の標的配列の相補配列(crDNA-IF-7、IB-1、IB-2)、TALE認識配列の相補配列の位置、並びに、これに対応するファミリー遺伝子HBDとのアラインメントをまとめて示す概念図である。 内因性DNAのAPC遺伝子上のターゲットサイトであるAPCサイトにおけるPAM配列、gRNA-APC-F2、APC-F7-Cの標的配列の相補配列(crDNA-APC-F2、APC-F7-C)、TALE認識配列の相補配列の位置を示す概念図である。 AS14サイトにおいて、TALEをTALE-AS14-2とした47-12-AIDについて、ガイドRNAをgRNA-IF-1とし、タイプI-Casタンパク質群発現プラスミドとしてTypeI-FのCasタンパク質群を発現するプラスミドを用いたときの、標的(crDNA-IF-1)範囲内の各CにおけるTの割合、並びに、TALEをTALE-AS5としたBE4-32-47及びBE4-135-63について、ガイドRNAをgRNA-IF-1とし、タイプI-Casタンパク質群発現プラスミドとしてTypeI-FのCasタンパク質群を発現するプラスミドを用いたときの、標的(crDNA-IF-1)範囲内の各CにおけるTの割合を示すグラフである。 AS14サイトにおいて、TALEをTALE-AS5としたABE8e-135-47について、ガイドRNAをgRNA-IF-1とし、タイプI-Casタンパク質群発現プラスミドとしてTypeI-FのCasタンパク質群を発現するプラスミドを用いたときの、標的(crDNA-IF-1)範囲内の各AにおけるGの割合を示すグラフである。 AS14サイトにおいて、TALEをTALE-AS14-2とした47-12-AIDについて、ガイドRNAをgRNA-IF-2とし、タイプI-Casタンパク質群発現プラスミドとしてTypeI-FのCasタンパク質群を発現するプラスミドを用いたときの、標的(crDNA-IF-2)範囲内の各CにおけるTの割合、並びに、TALEをTALE-AS14-3としたBE4-32-47及びBE4-135-63について、ガイドRNAをgRNA-IF-2とし、タイプI-Casタンパク質群発現プラスミドとしてTypeI-FのCasタンパク質群を発現するプラスミドを用いたときの、標的(crDNA-IF-2)範囲内の各CにおけるTの割合を示すグラフである。 S2サイトにおいて、TALEをTALE-S2とした47-104-AIDについて、ガイドRNAをgRNA-IF-7とし、タイプI-Casタンパク質群発現プラスミドとしてTypeI-FのCasタンパク質群を発現するプラスミドを用いたときの、標的(crDNA-IF-7)範囲内の各CにおけるTの割合を示すグラフである。 APCサイトにおいて、TALEをTALE-APC-R17とした47-12-AIDについて、ガイドRNAをgRNA-APC-F2とし、タイプI-Casタンパク質群発現プラスミドとしてTypeI-FのCasタンパク質群を発現するプラスミドを用いたときの、標的(crDNA-APC-F2)範囲内の各CにおけるTの割合を示すグラフである。 APCサイトにおいて、TALEをTALE-APC-R17とした47-12-AIDについて、ガイドRNAをgRNA-APC-F7-Cとし、タイプI-Casタンパク質群発現プラスミドとしてTypeI-FのCasタンパク質群を発現するプラスミドを用いたときの、標的(crDNA-APC-F7-C)範囲内の各CにおけるTの割合を示すグラフである。 S1サイトにおいて、TALEをTALE-S1とした47-12-AIDについて、ガイドRNAをgRNA-IB-1とし、タイプI-Casタンパク質群発現プラスミドとして、TypeI-BのCasタンパク質群を発現するプラスミドに加えて、NLS-Cas8b2-SSU1発現プラスミド又はNLS-Cas8b2-SSU2発現プラスミドを用いたときの、標的(crDNA-IB-1)範囲内の各CにおけるTの割合を示すグラフ(a)、並びに、S2サイトにおいて、TALEをTALE-S2とした47-104-AIDについて、ガイドRNAをgRNA-IB-2とし、タイプI-Casタンパク質群発現プラスミドとして、TypeI-B複合体のCasタンパク質群を発現するプラスミドに加えて、NLS-Cas8b2-SSU1発現プラスミド又はNLS-Cas8b2-SSU2発現プラスミドを用いたときの、標的(crDNA-IB-2)範囲内の各CにおけるTの割合を示すグラフ(b)である。 S1サイトにおいて、TALEをTALE-S1とした47-12-AIDについて、ガイドRNAをgRNA-IB-1とし、タイプI-Casタンパク質群発現プラスミドとしてTypeI-BのCasタンパク質群を発現するプラスミドを用いたときの、標的(crDNA-IB-1)範囲内の各CにおけるTの割合を示すグラフである。 S2サイトにおいて、TALEをTALE-S2とした47-104-AIDについて、ガイドRNAをgRNA-IB-2とし、タイプI-Casタンパク質群発現プラスミドとして、TypeI-BのCasタンパク質群を発現するプラスミドに加えて、NLS-Cas8b2-SSU2発現プラスミドを用いたときの、標的(crDNA-IB-2)範囲内の各CにおけるTの割合を示すグラフである。
以下、本発明の好ましい実施形態を例に挙げてより具体的に説明するが、本発明はこれに限定されるものではない。
<標的DNA編集方法>
本発明の標的DNA編集方法は、
標的DNAを編集する方法であり、
(1)DNA結合ドメイン及び核酸塩基変換酵素を含む融合タンパク質、並びに、
(2)ヌクレアーゼ活性の一部又は全部を喪失したタイプI-Casタンパク質群及びそのガイドRNAを含むタイプI-CRISPR-Casシステム
を標的DNAに接触させ、前記核酸塩基変換酵素活性により前記標的DNAの標的部位の塩基を編集する工程を含み、
前記DNA結合ドメインが認識するDNA結合ドメイン認識配列又はその相補配列は、前記標的部位の5’側又は3’側に7~31塩基の鎖長のスペーサー1を介して存在し、かつ、
前記タイプI-CRISPR-CasシステムにおけるガイドRNAが認識するガイドRNA標的配列は、前記標的部位の相補塩基を含むように存在する、
方法である。
(融合タンパク質)
本発明に係る融合タンパク質は、DNA結合ドメイン及び核酸塩基変換酵素を含む融合タンパク質である。本明細書においては、前記本発明に係る融合タンパク質を、場合により、「DNA結合ドメイン-核酸塩基変換酵素融合タンパク質」又は「DNA結合ドメイン-核酸塩基変換酵素」という。前記融合タンパク質としては、N末から、DNA結合ドメイン、核酸塩基変換酵素の順に結合されていても、N末から、核酸塩基変換酵素、DNA結合ドメインの順に結合されていてもよい。また、本発明に係る融合タンパク質としては、2以上(例えば2つ)の核酸塩基変換酵素を含んでいてもよく、この場合の核酸塩基変換酵素としては、1種のみであっても2種以上の組み合わせであってもよい。例えば、本発明に係る融合タンパク質が2つの核酸塩基変換酵素(第1の核酸塩基変換酵素、第2の核酸塩基変換酵素)を含む場合、これらは、第1の核酸塩基変換酵素、DNA結合ドメイン、第2の核酸塩基変換酵素の順に結合されていてもよい。これらの中でも、本発明に係る融合タンパク質としては、N末から、DNA結合ドメイン、核酸塩基変換酵素の順に結合されているか、N末から、核酸塩基変換酵素、DNA結合ドメインの順に結合されていることが好ましい。
前記DNA結合ドメインとしては、例えば、TALE、ジンクフィンガーアレイ(ZF)、PPRタンパク質(Pentatricopeptide Repeat Protein)が挙げられ、TALE及びジンクフィンガーアレイ(ZF)からなる群から選択される少なくとも1種が好ましく、TALEがより好ましい。
〔TALE〕
TALE(Transcription Activator-Like Effector:転写活性化因子様エフェクター)は、Xanthomonas種プロテオバクテリアが分泌し宿主植物の遺伝子転写を活性化するタンパク質である。本発明に係る「TALE」は、少なくとも、N末ドメイン及びTALEリピートドメインを含み、C末ドメインをさらに含んでいてもよい。
TALEリピートドメインは、右巻き超らせん(superhelical)を形成するTALE配列の、複数、例えば10~30、好ましくは13~25、より好ましくは15~20のタンデムリピート(TALEリピート)で構成される。典型的なTALEリピート1単位(1つのTALE配列)は、33~35アミノ酸からなり、その12番目と13番目の2アミノ酸残基からなる可変残基(repeat variable diresidue:RVD)によって、DNAの特定の塩基を認識する。塩基を特異的に認識するRVDの例としては、Cを認識するHD、Tを認識するNG、Aを認識するNI、G又はAを認識するNN、及びA、C、G又はTを認識するNS等が挙げられる。かかるTALEリピートドメインのDNA認識機構に基づき、特定の塩基を認識するTALE配列を人工的に連結することにより、DNA上の所望の塩基配列(TALE認識配列)を認識して結合できるTALEを作成することができる。
本発明に係るTALEの前記TALE配列は、それぞれ、TALEリピートドメインがTALE認識配列を認識して結合できるものである限り、天然型のアミノ酸配列に対して、適宜改変されたものであってもよい。例えば、前記TALE配列においては、それぞれ独立に、RVDの位置が変更されていても、RVD以外のアミノ酸残基が1個又は複数個(例えば、10個以下、9個以下、8個以下、7個以下、6個以下、好ましくは5個以下又は4個以下、さらに好ましくは3個以下又は2個以下)置換、挿入、及び/又は欠失していてもよく、また、RVDの12番目と13番目の2アミノ酸残基は、A、T、C及びGに対する特異性を増強するために他のアミノ酸残基に置換されてもよい。
また、本発明に係るTALEのTALEリピートドメインは、標的DNAの標的部位の5’側又は3’側に7~31塩基の鎖長のスペーサー1を介して存在する塩基配列又はその相補配列を認識するように、すなわち、TALEが認識するTALE認識配列又はその相補配列が、前記標的部位の5’側又は3’側に7~31塩基の鎖長のスペーサー1を介して存在する塩基配列となるように、設計される。このような所望のTALEを設計、作製する技術は公知であり(例えば、Miller et al.,Nat Biotechnol 29,143-148(2011);Sakuma et al.,Sci Rep 3,3379(2013))、例えば、Sakuma et al.(2013)に記載のPlatinum Gateシステムによって、前記塩基配列に対する高い結合活性を有するTALEを作製することができる。
本発明に係るTALEのN末ドメインとしては、天然型のアミノ酸配列(例えば、AddgeneのpTALETF_v2(ID:32185~32188)に含まれるN末ドメインのアミノ酸配列)を用いることができるが、本発明に係る融合タンパク質の機能(TALE認識配列への結合能、標的部位における編集能等)に負の影響を与えない限り、前記天然型のアミノ酸配列に対して、適宜改変されたものであってもよい。例えば、1個又は複数個(例えば、50個以下、30個以下、20個以下、10個以下、9個以下、8個以下、7個以下、6個以下、好ましくは5個以下又は4個以下、さらに好ましくは3個以下又は2個以下)のアミノ酸残基が置換、挿入、及び/又は欠失していてもよい。また、精製や検出のためのフラグタグ、TALE-核酸塩基変換酵素を細胞核へ移行するための核局在化シグナル(NLS)等を含んでいてもよい。
このようなN末ドメインとしては、N末ドメインの鎖長が、49~287アミノ酸残基であることが好ましく、80~200アミノ酸残基であることがより好ましく、120~180アミノ酸残基であることがさらに好ましい。前記N末ドメインの鎖長が前記下限未満であると、標的DNAに結合できなくなる傾向にあり、他方、前記上限を超えると、融合タンパク質を発現させる場合、その発現効率が低下する傾向にある。
本発明に係るTALEのN末ドメインの具体例としては、例えば、AddgeneのptCMV-136/63-VR-HD(ID:50699)に含まれるN末ドメインのアミノ酸配列や、AddgeneのptCMV-153/47-VR-HD(ID:50703)に含まれるN末ドメインのアミノ酸配列が挙げられるが、これに限定されるものではない。
本発明に係るTALEがC末ドメインをさらに含む場合、かかるTALEのC末ドメインとしても、天然型のアミノ酸配列(例えば、AddgeneのpTALETF_v2(ID:32185~32188)に含まれるC末ドメインのアミノ酸配列)を用いることができるが、本発明に係る融合タンパク質の機能(TALE認識配列への結合能、標的部位における編集能等)に負の影響を与えない限り、前記天然型のアミノ酸配列に対して、適宜改変されたものであってもよい。例えば、1個又は複数個(例えば、50個以下、30個以下、20個以下、10個以下、9個以下、8個以下、7個以下、6個以下、好ましくは5個以下又は4個以下、さらに好ましくは3個以下又は2個以下)のアミノ酸残基が置換、挿入、及び/又は欠失していてもよい。
本発明に係るTALEがC末ドメインをさらに含む場合、前記TALEのC末ドメインとしては、天然型のアミノ酸配列においてC末側の一部のアミノ酸配列が除去されたものであってもよい。このようなC末ドメインとしては、C末ドメインの鎖長が、1~180アミノ酸残基であることが好ましく、20~100アミノ酸残基であることがより好ましく、40~70アミノ酸残基であることがさらに好ましい。前記C末ドメインの鎖長が前記上限を超えると、融合タンパク質を発現させる場合、その発現効率が低下する傾向にある。
前記C末ドメインの具体例としては、例えば、AddgeneのpTALETF_v2(ID:32185~32188)に含まれるC末ドメインのアミノ酸配列(WT:アミノ酸数=180)、AddgeneのpTALEN_v2(ID:32189~32192)に含まれるC末ドメインのアミノ酸配列(アミノ酸数=63)、AddgeneのptCMV-153/47-VR-NG(ID:50704)に含まれるC末ドメインのアミノ酸配列(アミノ酸数=47)が挙げられるが、これに限定されるものではない。
〔ジンクフィンガーアレイ〕
本発明に係るジンクフィンガーアレイは、DNA結合領域及びヌクレアーゼドメインを含むジンクフィンガーヌクレアーゼ(ZFN)のうちのDNA結合領域を示す。ジンクフィンガーアレイは、通常、2~15、好ましくは3~8、より好ましくは4~6のジンクフィンガータンパク質からなり、各ジンクフィンガータンパク質間は直接、又はリンカーを介して結合される。各ジンクフィンガータンパク質は、1つ以上の亜鉛と特定の塩基を認識するヘリックス構造とを含み、1つのジンクフィンガーでDNAの特定の3塩基を認識する。
本発明に係るジンクフィンガーアレイは、それぞれ、DNA結合ドメイン認識配列を認識して結合できるものである限り、特に制限されず、適宜改変されたものであってもよい。例えば、1個又は複数個(例えば、50個以下、30個以下、20個以下、10個以下、9個以下、8個以下、7個以下、6個以下、好ましくは5個以下又は4個以下、さらに好ましくは3個以下又は2個以下)のアミノ酸残基が置換、挿入、及び/又は欠失していてもよい。また、本発明に係るジンクフィンガーアレイは、標的DNAの標的部位の5’側又は3’側に7~31塩基の鎖長のスペーサー1を介して存在する塩基配列又はその相補配列を認識するように、すなわち、ジンクフィンガーアレイが認識するジンクフィンガーアレイ認識配列又はその相補配列が、前記標的部位の5’側又は3’側に7~31塩基の鎖長のスペーサー1を介して存在する塩基配列となるように、設計される。このようなジンクフィンガーアレイは、例えば、Beerli et al.,Nat Biotechnol 20,135-141(2002)、Sander et al.,Nat Methods 8,67-69(2011)等に記載の方法を参照して適宜設計、作製することができる。
〔核酸塩基変換酵素〕
本発明において、核酸塩基変換酵素とは、DNA塩基のプリン又はピリミジン環上の置換基を他の基若しくは原子に変換、又は脱落させる反応を触媒することにより、DNA鎖を切断することなく、標的の塩基を他の塩基に変換又は脱落させ得る酵素を意味する。
このような核酸塩基変換酵素としては、上記の反応を触媒し得るものであれば特に制限はなく、例えば、デアミナーゼ、グリコシラーゼが挙げられ、これらのうちの1種のみであっても2種以上の組み合わせであってもよい。これらの中でも、本発明に係る核酸塩基変換酵素としては、デアミナーゼが好ましい。
(デアミナーゼ)
前記デアミナーゼは、塩基のアミノ基をカルボニル基に変換する脱アミノ化反応を触媒する酵素であり、核酸/ヌクレオチドデアミナーゼスーパーファミリーに属する。このようなデアミナーゼとしては、シトシン又は5-メチルシトシンをそれぞれウラシル又はチミンに変換し得るシチジンデアミナーゼ、アデニンをヒポキサンチンに変換し得るアデノシンデアミナーゼ、グアニンをキサンチンに変換し得るグアノシンデアミナーゼが挙げられ、目的の塩基置換に応じて、使い分けることができる。
前記デアミナーゼの由来としては特に制限されず、例えば、ヤツメウナギ;ヒト、サル、ブタ、ウシ、ウマ、ラット、マウス等の哺乳動物が挙げられる。
このようなデアミナーゼとして、シチジンデアミナーゼとしては、例えば、APOBEC(ラット由来のrAPOBEC1、ヒト由来のhAPOBEC1、hAPOBEC2、hAPOBEC3(hAPOBEC3A、3B、3C、3D(3E)、3F、3G、3H)、hAPOBEC4等);APOBECの祖先アミノ酸配列であるAnc689;哺乳動物(例、ヒト、ブタ、ウシ、ウマ、サル等)由来のAID(Activation-induced cytidine deaminase(AICDA));AIDのファミリーであり、ヤツメウナギ由来のPmCDA1(Petromyzon marinus cytosine deaminase 1)が挙げられる。また、アデノシンデアミナーゼとしては、例えば、大腸菌由来のTadAが挙げられる。上記の各デアミナーゼには、それぞれ、その改変体(例えば、TadA-8e、TadA7.10、さらにこれらの改変体等)を含む。これらの中でも、前記デアミナーゼとしては、APOBEC、PmCDA1、Anc689、及びTadA(それぞれ、その改変体を含む)からなる群から選択される少なくとも1種であることが好ましい。
また、本発明に係る融合タンパク質がデアミナーゼを2以上含む場合、これらの組み合わせは、目的の塩基置換に応じて適宜選択することができ、例えば、同一又は異なるシチジンデアミナーゼの組み合わせ、同一又は異なるアデノシンデアミナーゼの組み合わせ、同一又は異なるグアノシンデアミナーゼの組み合わせ、シチジンデアミナーゼとアデノシンデアミナーゼとの組み合わせ、シチジンデアミナーゼとグアノシンデアミナーゼとの組み合わせ、アデノシンデアミナーゼとグアノシンデアミナーゼとの組み合わせが挙げられる。これらの中でも、デアミナーゼの組み合わせとしては、TadAとPmCDA1との組み合わせが好ましい。なお、これらのデアミナーゼの塩基配列及びアミノ酸配列は公知であり、公共のデータベース(Genbank等)から取得することができる。
また、前記デアミナーゼとしては、脱アミノ化活性(デアミナーゼ活性)を有する限り、これらの公知のデアミナーゼの塩基配列及びアミノ酸配列に基づいて、改変(例えば、アミノ酸残基の置換、挿入、及び/又は欠失の導入)がされたものであってもよい。デアミナーゼ活性の有無は、公知の方法を適宜用いて確認することができる。例えば、シチジンデアミナーゼでは、シチジンを基質として酵素反応を行い、シチジンの代謝産物であるウリジンを検出、定量することにより確認することができる。
〔リンカー1〕
本発明に係る融合タンパク質としては、リンカー1をさらに含むことが好ましい。この場合、本発明に係る融合タンパク質において、DNA結合ドメイン及び前記核酸塩基変換酵素は、リンカー1により連結される。また、本発明に係る融合タンパク質が前記核酸塩基変換酵素を複数含む場合には、それに対応してリンカー1は複数であることが好ましい。本発明に係る融合タンパク質がリンカー1を複数含む場合、これらは、1種のみであっても2種以上の組み合わせであってもよい。
本発明に係る融合タンパク質がリンカー1をさらに含む場合、リンカー1の鎖長としては、特に制限されないが、1~450アミノ酸残基であることが好ましく、5~250アミノ酸残基であることがより好ましく、5~200アミノ酸残基であることがより好ましく、12~150アミノ酸残基であることがより好ましく、12~104アミノ酸残基であることがさらに好ましい。前記リンカー1の鎖長が前記上限を超えると、融合タンパク質を発現させる場合、その発現効率が低下する傾向にある。
また、リンカー1の鎖長としては、例えば、前記核酸塩基変換酵素がデアミナーゼであって、Anc689である場合には、5~250アミノ酸残基であることが好ましく、5~150アミノ酸残基であることがより好ましく、PmCDA1である場合には、12~104アミノ酸残基であることが好ましく、12~50アミノ酸残基であることがより好ましく、TadA(例えば、TadA-8e等)である場合には、5~250アミノ酸残基であることが好ましく、5~150アミノ酸残基であることがより好ましい傾向にある。
本発明に係るリンカー1としては、例えば、Yang et al.,Nat Commun 7 13330(2016)に記載の12アミノ酸、及びNishida et al.,Science 353,aaf8729(2016)に記載の104アミノ酸、Koblan et al.,Nat Biotechnol 36,843-846(2018)に記載の32アミノ酸、Sun and Zhao,Mol BioSyst 10,446-453(2014)に記載のHTS95アミノ酸配列(95アミノ酸)及びその繰り返しが挙げられるが、これに限定されるものではない。
また、本発明の融合タンパク質としては、例えば、前記DNA結合ドメインがTALEの場合、前記核酸塩基変換酵素がTALEのC末側に位置する場合には、TALEリピートドメインと前記核酸塩基変換酵素との間が、1~630アミノ酸残基離れていることが好ましい。そのため、本発明の融合タンパク質としては、前記DNA結合ドメインがTALEの場合、前記TALEのC末ドメイン及びリンカー1のうちの少なくとも1種を含むことが好ましい。この場合のTALEリピートドメインと前記核酸塩基変換酵素との間の鎖長(TALEリピートドメインのC末端のC末側に隣接するアミノ酸残基を1残基目として、核酸塩基変換酵素のN末端のN末側に隣接する残基までのアミノ酸残基の数)としては、25~300アミノ酸残基であることがより好ましく、52~174アミノ酸残基であることがさらに好ましい。前記鎖長が前記下限未満であると、塩基編集の効率が低下する傾向にあり、他方、前記上限を超えると、融合タンパク質を発現させる場合、その発現効率が低下する傾向にある。
なお、このときの前記TALEリピートドメインのC末端の残基は、前記TALEリピートドメインのC末側に位置するtruncated last half-repeat(LHR)の直前(N末側)に位置するTALE配列(好ましくは1単位:33~35アミノ酸)のC末端の残基(LHRが存在しない場合には前記TALEリピートドメインを構成する最後のTALE配列(好ましくは1単位:33~35アミノ酸)のC末端の残基)とすることができる。また、前記核酸塩基変換酵素のN末端の残基は、公知のデータベース(例えば、NCBI)から取得可能な典型的な核酸塩基変換酵素のアミノ酸配列と公知の手法(例えば、BLAST(NCBI))を用いた相同性検索で同一性が85%以上(好ましくは90%以上)であるアミノ酸配列の開始残基(通常はメチオニン)とすることができる。
〔塩基除去修復インヒビター、リンカー2〕
本発明に係る融合タンパク質としては、さらにC末側、すなわち、前記核酸塩基変換酵素のC末(前記核酸塩基変換酵素が前記DNA結合ドメインのC末側に位置する場合)又は前記DNA結合ドメインのC末(前記核酸塩基変換酵素が前記DNA結合ドメインのN末側のみに位置する場合)に、リンカー2を介して結合された塩基除去修復インヒビターを含むことが好ましい。塩基除去修復インヒビターをさらに含む場合、当該塩基除去修復インヒビターは、前記融合タンパク質あたり、1つであっても、さらにリンカー2を介して2以上(好ましくは2つ)であってもよい。また、複数である場合には、1種のみであっても2種以上の組み合わせであってもよいが、1種であることが好ましい。
本発明に係る塩基除去修復インヒビターとしては、塩基除去修復を阻害するものであれば特に制限はないが、DNAグリコシラーゼ阻害剤が好ましい。前記DNAグリコシラーゼ阻害剤としては、チミンDNAグリコシラーゼ阻害剤、ウラシルDNAグリコシラーゼ阻害剤、オキソグアニンDNAグリコシラーゼ阻害剤、アルキルグアニンDNAグリコシラーゼの阻害剤が挙げられる。例えば、前記核酸塩基変換酵素としてデアミナーゼであるシチジンデアミナーゼを用いる場合には、変異により生じたDNAのU:G又はG:Uミスマッチの修復を阻害するため、ウラシルDNAグリコシラーゼ阻害剤(UGI)を用いることが適している。この場合、デアミナーゼとUGIとが一つのポリペプチド上に存在することにより、塩基編集の効率がさらに向上する。
このようなウラシルDNAグリコシラーゼ阻害剤としては、例えば、枯草菌(Bacillus subtilis)バクテリオファージであるPBS1由来のウラシルDNAグリコシラーゼ阻害剤(UGI)又は枯草菌バクテリオファージであるPBS2由来のウラシルDNAグリコシラーゼ阻害剤(UGI)が挙げられるが、これらに制限されない。これらの塩基配列及びアミノ酸配列は公知であり、公共のデータベース(Genbank等)から取得することができる。また、本発明に係る塩基除去修復インヒビターとしては、上記DNAのミスマッチの修復阻害活性を有する限り、公知の塩基除去修復インヒビターの塩基配列及びアミノ酸配列に基づいて、改変(例えば、アミノ酸残基の置換、挿入、及び/又は欠失の導入)がされたものであってもよい。
本発明に係る融合タンパク質が前記塩基除去修復インヒビターをさらに含む場合であって、前記塩基除去修復インヒビターが複数である場合には、融合タンパク質-リンカー2-第1の塩基除去修復インヒビター-リンカー2-第2の塩基除去修復インヒビター-・・・のように、リンカー2を介して連結することができる。このときの複数あるリンカー2としては、1種のみであっても2種以上の組み合わせであってもよいが、1種であることが好ましい。
このようなリンカー2としては、特に制限されないが、鎖長が1~50アミノ酸残基であることが好ましく、5~30アミノ酸残基であることがより好ましく、8~15アミノ酸残基であることがさらに好ましい。前記リンカー2の鎖長が前記下限未満であると、前記塩基除去修復インヒビターの機能性が低下する傾向にあり、他方、前記上限を超えると、融合タンパク質を発現させる場合、その発現効率が低下する傾向にある。
本発明に係るリンカー2としては、例えば、AddgeneのpCMV_AncBE4max_P2A_GFP(ID:112100)に記載の10アミノ酸が挙げられるが、これに限定されるものではない。
〔その他〕
本発明に係る融合タンパク質としては、さらに、N末及び/又はC末に、精製や検出のためのフラグタグ、DNA結合ドメイン-核酸塩基変換酵素を細胞核へ移行するための核局在化シグナル(NLS)等を含んでいてもよく、これらは、上記のように前記DNA結合ドメイン(例えばTALEのN末ドメイン)に含まれていても、融合タンパク質のN末及び/又はC末に付加されていてもよい。
本発明に係る融合タンパク質は、例えば、上記のDNA結合ドメイン及び核酸塩基変換酵素、並びに、必要に応じてリンカー1、前記塩基除去修復インヒビター、リンカー2、及びその他アミノ酸をコードする遺伝子を一体として転写・発現させることで得ることができる。また、本発明に係る融合タンパク質は、従来公知の方法を適宜採用、改良することによって生産することができ、例えば、そのアミノ酸配列に基づいて市販の合成機によって化学的に合成する方法や、下記の標的DNAが編集された細胞の製造方法において述べるように、融合タンパク質をコードするポリヌクレオチド又は該融合タンパク質を発現するベクターを前記細胞に導入して発現させる方法によって得ることができる。
(タイプI-CRISPR-Casシステム)
本発明に係るタイプI-CRISPR-Casシステムは、ヌクレアーゼ活性の一部又は全部を喪失した(ヌクレアーゼ活性の一部又は全部を初めから有さない場合も含む。本明細書中、同様。)タイプI-Casタンパク質群及びそのガイドRNAを含む。
〔タイプI-Casタンパク質群〕
本発明に係るタイプI-Casタンパク質群は、CRISPR-Casシステムのうち、タイプIに分類されるシステム(タイプI-CRISPR-Casシステム)に係る複数のCasタンパク質を示し、下記のガイドRNAと共に複合体を形成する。本発明に係るタイプI-Casタンパク質群としては、タイプI-CRISPR-Casシステムを構成するCasタンパク質のうち、少なくともガイドRNAと複合体を形成し、一本鎖DNAを露出させるヘリカ-ゼ活性を有するエフェクター複合体を構成するCasタンパク質を含んでいればよい。タイプIシステムは、I-A、I-B、I-C、I-D、I-E、I-F、及びI-G(I-U)の7つのサブタイプに分類され、これらのサブタイプにはバリアントも含む(例えば、I-FのI-Fv1型、I-Fv2型)。
サブタイプI-AのCRISPR-Casシステムを構成するCasタンパク質の一例としては、例えば、Cas3’、Cas3’’、Cas5、Cas6、Cas7、Cas8(Cas8a1という場合もある)、Cas11(Cse5という場合もある)が挙げられ、このうち、前記エフェクター複合体を構成するCasタンパク質の一例としては、例えば、Cas5、Cas6、Cas7、Cas8、及びCas11が挙げられるが、これに限定されるものではない。
サブタイプI-BのCRISPR-Casシステムを構成するCasタンパク質の一例としては、例えば、Cas3、Cas5、Cas6、Cas7、Cas8(Cas8b2という場合もある)、Cas11が挙げられ、このうち、前記エフェクター複合体を構成するCasタンパク質の一例としては、例えば、Cas5、Cas6、Cas7、及びCas8が挙げられるが、これに限定されるものではない。
サブタイプI-CのCRISPR-Casシステムを構成するCasタンパク質の一例としては、例えば、Cas3、Cas5、Cas7、Cas8(Cas8cという場合もある)、Cas11が挙げられ、このうち、前記エフェクター複合体を構成するCasタンパク質の一例としては、例えば、Cas5、Cas7、及びCas8が挙げられるが、これに限定されるものではない。
サブタイプI-DのCRISPR-Casシステムを構成するCasタンパク質の一例としては、例えば、Cas3’、Cas3’’、Cas5、Cas6、Cas7、Cas10(Cas10dという場合もある)、Cas11が挙げられ、このうち、前記エフェクター複合体を構成するCasタンパク質の一例としては、例えば、Cas5、Cas6、Cas7、及びCas10が挙げられるが、これに限定されるものではない。
サブタイプI-EのCRISPR-Casシステムを構成するCasタンパク質の一例としては、例えば、Cas3、Cas5、Cas6、Cas7、Cas8(Cas8eという場合もある)、Cas11が挙げられ、このうち、前記エフェクター複合体を構成するCasタンパク質の一例としては、例えば、Cas5、Cas6、Cas7、Cas8、及びCas11が挙げられるが、これに限定されるものではない。
サブタイプI-FのCRISPR-Casシステムを構成するCasタンパク質の一例としては、例えば、Cas3、Cas5(Csy2という場合もある)、Cas6(Csy4、Cas6fという場合もある)、Cas7(Csy3という場合もある)、Cas8(Csy1、Cas8fという場合もある)が挙げられ、このうち、前記エフェクター複合体を構成するCasタンパク質の一例としては、例えば、Cas5、Cas6、Cas7、及びCas8が挙げられるが、これに限定されるものではない。
サブタイプI-G(I-U)のCRISPR-Casシステムを構成するCasタンパク質の一例としては、例えば、Cas3、Cas5、Cas7、Cas8(Cas8u2という場合もある)が挙げられ、このうち、前記エフェクター複合体を構成するCasタンパク質の一例としては、例えば、Cas5、Cas7、及びCas8が挙げられるが、これに限定されるものではない。
本発明に係るタイプI-Casタンパク質群は、タイプI-CRISPR-Casシステムのサブタイプに応じて、各Casタンパク質を複数含んでいてよい。例えば、サブタイプI-BのCRISPR-CasシステムやサブタイプI-FのCRISPR-Casシステムを構成するCasタンパク質群としては、本発明に係るタイプI-Casタンパク質群として、図1A~図1Bに示すように、1つのCas5(Csy2ともいう)(図中の31)と、1つのCas6(Csy4ともいう)(図中の32)と、6つのCas7(Csy3ともいう)(図中の33)と、1つのCas8(Csy1ともいう)(図中の34)と、からなるタイプI-Casタンパク質群(図中の30)とすることができる。この場合、PAM配列は、典型的に、タイプI-Casタンパク質群(30)の一末端に位置するCas8(34)/Cas5(31)複合体によって認識される。タイプI-Casタンパク質群(30)の一末端に位置する大きなサブユニットCas8(34)はガイドRNA(40)の5’末端を包み(図1A~図1Bでは説明の都合上突出している)、複数のCas7(33)がガイドRNA骨格と相互作用する。Cas6(32)は、主にガイドRNAの3’末端の繰り返し配列(少なくとも1つのヘアピン構造を含む)との会合を介して、タイプI-Casタンパク質群に会合する。
本発明に係る各タイプI-Casタンパク質群としては、Cas3等のヌクレアーゼとして機能するタンパク質を含んでいてもよいが、ヌクレアーゼ活性の一部又は全部を有さないことが必要であるため、含まないことが好ましく、含む場合には、かかるタンパク質のヌクレアーゼ活性の一部又は全部が喪失するように改変されていることが必要である。
また、本発明に係る各タイプI-Casタンパク質群としては、Cas8をコードする遺伝子から翻訳されるCas8以外のサブユニット(以下、場合により「SSU2」という)をさらに含んでいることが好ましい。SSU2は、典型的には、Listeria monocytogenes由来のサブタイプI-BのCRISPR-Casシステムを構成するCas8(Cas8b2)の遺伝子から翻訳される、12.1kDのタンパク質である。SSU2の典型的アミノ酸配列に核局在化シグナル(NLS)を付加した配列を配列番号151に示し、同アミノ酸配列をコードする好ましい塩基配列(Listeria monocytogenes由来の塩基配列をヒト細胞に対してコドン最適化等したもの)を配列番号150に示す。本発明においては、SSU2をタイプI-Casタンパク質群(例えば、サブタイプI-BのCRISPR-Casシステムを構成するCasタンパク質群)と共存させると、ゲノム編集効率がより向上する傾向にある。
現在の技術水準においては、当業者であれば、タンパク質のアミノ酸配列情報が得られた場合、そのヌクレオチド配列を改変し、コードするタンパク質の機能は維持したままで、さらにその機能を向上させたり他の機能を付したタンパク質を調製することも可能である。したがって、SSU2のアミノ酸配列としては、「配列番号151で示されるアミノ酸配列(ただしNLSは含んでいなくてもよい)において、1又は複数個(例えば、50個以下、30個以下、20個以下、10個以下、9個以下、8個以下、7個以下、6個以下、好ましくは5個以下又は4個以下、さらに好ましくは3個以下又は2個以下)のアミノ酸が置換、欠失、挿入及び/又は付加されたアミノ酸配列をコードする遺伝子」や、「配列番号151で示されるアミノ酸配列(ただしNLSは含んでいなくてもよい)と90%以上(好ましくは、95%以上(例えば、96%以上、97%以上、98%以上、99%以上))の相同性(好ましくは同一性)を有するアミノ酸配列をコードする遺伝子」であってもよい。前記アミノ酸配列の相同性及び同一性は、例えば、前記BLASTのプログラムを用いて決定することができる。
タイプI-Casタンパク質群を構成するCasタンパク質のアミノ酸配列及び塩基配列は、公開されたデータベース、例えば、GenBank(http://www.ncbi.nlm.nih.gov)に登録されており(例えば、アクセッション番号:WP_003116910.1、WP_001194012.1、WP_011176707.1(Cas5)、WP_000872476.1、KJ796485(Cas6)、WP_003139222.1、WP_000775488.1、WP_011176709.1(Cas7)、WP_003139224.1、WP_011176708.1(Cas8)等)、本発明においてはこれらを利用することができる。また、各Casタンパク質には、本発明の効果を阻害しない範囲内で、上記の他に例えば、PAM配列の認識を改変するため等の改変が適宜導入されていてもよい。例えば、公知のアミノ酸配列から、1個又は複数個(例えば、50個以下、30個以下、20個以下、10個以下、9個以下、8個以下、7個以下、6個以下、好ましくは5個以下又は4個以下、さらに好ましくは3個以下又は2個以下)のアミノ酸残基が置換、挿入、及び/又は欠失していてもよい。さらに、各Casタンパク質としては、例えば、細胞核へ移行するための核局在化シグナル(NLS)等を付加したものであってもよい。また、このようなCasタンパク質としては、市販の入手可能なプラスミド内に含まれる配列にコードされるものであってもよい。
本発明に係る各タイプI-Casタンパク質群が構成するタイプI-CRISPR-Casシステムのサブタイプとしては、サブタイプI-B、サブタイプI-D、サブタイプI-E、及びサブタイプI-Fからなる群から選択される少なくとも1種であることが好ましく、サブタイプI-B、サブタイプI-E、及びサブタイプI-Fからなる群から選択される少なくとも1種であることがより好ましく、サブタイプI-B及びサブタイプI-Fからなる群から選択される少なくとも1種であることがさらに好ましい。
前記タイプI-CRISPR-CasシステムにおけるタイプI-Casタンパク質群については、ガイドRNA標的配列が、下記の標的DNAの標的部位の相補塩基を含むように、下記のガイドRNAが設計される。なお、本発明において、標的DNAの標的部位の相補塩基とは、前記標的部位が存在する鎖の相補鎖上の、前記標的部位1塩基の相補塩基を示す。これにより、二本鎖である標的DNAにおいて、一本鎖DNAを露出させるヘリカ-ゼ活性により標的部位を特異的に露出させ、前記核酸塩基変換酵素による編集効率を向上させる。
〔ガイドRNA〕
本発明に係るタイプI-CRISPR-Casシステムにおいて、ガイドRNAは、標的となるDNA上の配列(ガイドRNA標的配列)に相補的な塩基配列を含むRNA(crRNA(CRISPR RNA)ともいう)である。前記ガイドRNAは、少なくとも1つのヘアピン構造を形成可能な繰り返し塩基配列(1単位がそれぞれ約10~70塩基、好ましくは30~50塩基)を3’側に含むため、かかるヘアピン構造(二重鎖RNA)により、タイプI-CRISPR-Casシステムを構成する1又は複数のCasタンパク質(典型的にはCas6)と相互作用する。このため、前記ガイドRNAは、下記の標的DNA上のガイドRNA標的配列を認識して結合し、当該ガイドRNAと複合体を形成するタイプI-Casタンパク質群を当該標的DNAに誘導して、誘導されたタイプI-Casタンパク質群が、そのヘリカ-ゼ活性によって、当該標的DNAの標的部位において一本鎖DNAを露出する。
下記の標的DNAにおいて、標的部位の塩基の編集は、前記ガイドRNAの塩基配列とガイドRNA標的配列との間の塩基対形成の相補性と、ガイドRNA標的配列の相補鎖の5’側に存在するPAM配列と、の両方によって決定される位置で起きる。本発明に係るタイプI-Casタンパク質群のガイドRNAは、そのガイドRNA標的配列が、前記標的部位の相補塩基を含む配列となり、当該標的部位を含むガイドRNA標的配列の相補鎖の5’側のPAM配列をタイプI-Casタンパク質群を構成するCasタンパク質(例えば、図1A及び図1BではCas8タンパク質(34))が認識可能となるように設計される。これにより、二本鎖である標的DNAにおいて、一本鎖DNAを露出させるヘリカ-ゼ活性により標的部位を特異的に露出させ、前記核酸塩基変換酵素による編集効率を向上させる。
このようなCasタンパク質のPAM配列及びガイドRNA標的配列は、標的DNAのヌクレオチド配列に応じて、適宜設計することができる。
本発明に係るタイプI-CRISPR-Casシステムは、例えば、下記の標的DNAが編集された細胞の製造方法において述べるように、上記のタイプI-Casタンパク質群、及びガイドRNAをコードする遺伝子をそれぞれ同時に転写・発現させることで得ることができる。本発明に係るタイプI-Casタンパク質群を構成するCasタンパク質、及びガイドRNAは、それぞれ、従来公知の方法を適宜採用、改良することによって生産することができ、例えば、これらをコードするポリヌクレオチド又は該ポリヌクレオチドを含む発現ベクターを前記細胞に導入して発現させる方法によって得ることができる。
(標的DNA)
本発明においては、目的とするDNA編集の対象となる標的部位を含むDNAを「標的DNA」という。本発明に係る標的DNAは二本鎖DNAであり、上記の融合タンパク質及びタイプI-CRISPR-Casシステムとの対応を示すために、便宜的に、少なくとも一方の鎖が、5’側から順に、PAM配列、前記標的部位、スペーサー1、前記DNA結合ドメイン認識配列又はその相補配列を含む構造であるか(図1Aの第1の態様及び第2の態様)、少なくとも一方の鎖が、5’側から順に、前記DNA結合ドメイン認識配列又はその相補配列、PAM配列及びスペーサー1、前記標的部位、を含む構造である(図1Bの第3の態様及び第4の態様)ものとする。
5’側又は3’側にDNA結合ドメイン認識配列の相補配列を含むとは、当該鎖の相補鎖が、DNA結合ドメイン認識配列を含むことを示す。すなわち、DNA結合ドメイン認識配列は、前記標的部位と同じ鎖上に設定しても、その相補鎖上に設定してもよい。また、当該鎖の相補鎖が、前記標的部位の相補塩基を含むように、ガイドRNA標的配列を含むものとする。
本発明に係る標的部位とは、前記核酸塩基変換酵素による編集(好ましくはデアミナーゼによる脱アミノ化)の標的とする1塩基を示す。ただし、当該1塩基の両側近傍の塩基(特に、デアミナーゼによる脱アミノ化の標的となる塩基が存在する場合。好ましくは、5’側及び3’側のそれぞれ1~10塩基、より好ましくは1~5塩基、さらに好ましくは1~2塩基)がさらに編集(デアミナーゼの場合には脱アミノ化)されることを否定するものではない。
DNA結合ドメイン認識配列は、前記DNA結合ドメインが認識する配列である。DNA結合ドメイン認識配列の塩基数としては、前記DNA結合ドメインがTALEである場合、10~30塩基であることが好ましく、13~25塩基であることが好ましく、15~20塩基であることがさらに好ましい。また、前記DNA結合ドメインがジンクフィンガーアレイである場合、6~45塩基であることが好ましく、9~24塩基であることが好ましく、12~18塩基であることがさらに好ましい。
前記DNA結合ドメイン認識配列は、前記標的部位の5’側又は3’側に7~31塩基の鎖長のスペーサー1を介して存在するように選択される。スペーサー1の鎖長がかかる範囲内にあることにより、特異的かつ高効率で前記標的部位の1塩基を脱アミノ化することができる。前記スペーサー1の鎖長は、標的部位の塩基の5’側又は3’側に隣接する塩基を1塩基目として、前記DNA結合ドメイン認識配列又はその相補配列の3’側又は5’側に隣接する塩基までの長さである。このようなスペーサー1の鎖長としては、10~31塩基であることがより好ましく、10~28塩基であることがさらに好ましく、13~25塩基であることがさらにより好ましい。
また、スペーサー1の鎖長としては、例えば、前記核酸塩基変換酵素がデアミナーゼであって、Anc689又はPmCDA1又はTad-Aである場合には、7~31塩基であることが好ましく、7~25塩基であることがより好ましい傾向にある。また、スペーサー1の鎖長としては、例えば、タイプI-Casタンパク質群がサブタイプI-BのCRISPR-Casシステムを構成するCasタンパク質群である場合、7~31塩基であることが好ましく、7~19塩基であることがより好ましく、サブタイプI-FのCRISPR-Casシステムを構成するCasタンパク質群である場合、7~31塩基であることが好ましく、13~25塩基であることがより好ましい傾向にある。
PAM(プロトスペーサー隣接モチーフ)配列は、前記タイプI-Casタンパク質群が認識する配列であり、タイプI-CRISPR-Casシステムの種類に応じてその長さは異なるが、典型的には、ガイドRNA標的配列に隣接する2~5塩基である。PAM配列としても、タイプI-CRISPR-Casシステムの種類に応じて異なるが、典型的には、例えば、前記タイプI-Casタンパク質群がListeria monocytogenes由来のサブタイプI-BのCRISPR-Casシステムを構成するCasタンパク質群やサブタイプI-FのCRISPR-Casシステムを構成するCasタンパク質群である場合、これらが認識するPAM配列としては、5’-CCA、5’-CC、5’-ACN等が挙げられ、同サブタイプI-EのCRISPR-Casシステムを構成するCasタンパク質群である場合、これらが認識するPAM配列としては、5’-AAG、5’-AGG、5’-GAG等が挙げられる。ただしこれらは、上記のとおり、前記タイプI-Casタンパク質群に含まれるCasタンパク質の改変(例えば、変異の導入)によって変更することも可能であり、これにより標的部位の選択肢を拡大することが可能である。
本発明において、前記PAM配列は前記標的部位の5’側に存在し、前記ガイドRNAが認識するガイドRNA標的配列は、前記PAM配列の位置に応じて決定される。本発明において、前記ガイドRNA標的配列の相補配列内における前記標的部位の相補塩基の位置は、特に限定されないが、例えば、第1位~第50位の間であることが好ましく、第1位~第35位の間であることがより好ましい。なお、前記ガイドRNA標的配列の相補配列内における塩基の位置は、前記ガイドRNA標的配列のPAM配列に隣接する塩基を第1位とした位置である。前記塩基位置の上限及び下限は、前記ガイドRNA標的配列の長さに依存し、前記ガイドRNAの長さを調節することにより調整可能である。
前記ガイドRNAが認識するガイドRNA標的配列は、前記標的部位の相補塩基を含む配列となるように選択される。ガイドRNA標的配列の位置をこのように選択することにより、特異的かつ高効率で前記標的部位の1塩基を編集することができる。本発明に係るガイドRNA標的配列の長さ(塩基数)としては、10~70塩基であることが好ましく、20~50塩基であることがより好ましく、30~40塩基であることがさらに好ましい。本発明では、タイプI-CRISPR-Casシステムを用いるため、ガイドRNA標的配列の長さをCRISPR-Cas9システムを用いた場合(例えば、好ましくは20塩基程度)よりも長くすることができ、ガイドRNAによる標的認識の配列特異性を増大させることが可能である。他方、ガイドRNA標的配列が前記上限を超えると、ガイドRNAとガイドRNA標的配列との間に形成される塩基対のTm値が高くなる傾向にある。
このような標的DNAの塩基配列としては、特に制限されず、DNA結合ドメイン認識配列又はその相補配列、スペーサー1、ガイドRNA標的配列の相補配列、前記ガイドRNA標的配列の相補配列に含まれる標的部位、及びPAM配列が、上記条件を満たすように、DNA結合ドメイン及びガイドRNAを設計し、目的の塩基置換に応じた核酸塩基変換酵素を選択し、及必要に応じてPAM配列の認識特異性を改変することにより、本発明のDNA編集方法の標的とすることができる。
さらに、本発明に係る標的DNAとしては、目的に応じて、細胞内に存在するDNA(内在性DNA)又は細胞外に存在するDNAとすることができる。細胞内に存在するDNAとしては、内因性DNAであっても、外因性DNAであってもよい。内因性DNAとしてはゲノムDNAが挙げられ、外因性DNAとしては、例えば、細胞内に導入したDNAが挙げられる。細胞外に存在するDNAとしては、細胞に由来するDNAであっても、細胞外で増幅、合成したDNAであってもよい。
(標的DNA編集方法)
本発明の標的DNA編集方法では、前記融合タンパク質及び前記タイプI-CRISPR-Casシステムを、前記標的DNAに接触させ、前記融合タンパク質の核酸塩基変換酵素活性により、前記標的DNAの標的部位の塩基を編集する。
前記融合タンパク質及び前記タイプI-CRISPR-Casシステムを標的DNAに接触させると、融合タンパク質のDNA結合ドメインが標的DNA上のDNA結合ドメイン認識配列を認識して結合し、DNA結合ドメインに連結された核酸塩基変換酵素を当該標的DNAに誘導する。他方、タイプI-CRISPR-CasシステムのガイドRNAは標的DNAの相補鎖上のガイドRNA標的配列を認識して結合し、当該ガイドRNAと複合体を形成するタイプI-Casタンパク質群を当該標的DNAに誘導する。これにより、標的部位において、タイプI-Casタンパク質群とガイドRNAとの複合体が構成され、タイプI-Casタンパク質群のヘリカ-ゼ活性によって一本鎖DNAを露出するため、前記核酸塩基変換酵素により、目的の塩基の置換(例えば、塩基の脱アミノ化)を効率的に起こすことができる。
本発明の標的DNAの編集方法における、前記融合タンパク質、前記タイプI-CRISPR-Casシステム、PAM配列、及び前記標的DNAの関係を、図1A~図1Bに示す概念図を例に挙げてより具体的に説明するが、本発明はこれに限定されるものではない。なお、本明細書及び図面中、同一又は相当する要素には同一の符号を付し、重複する説明は省略する。
本発明の標的DNAの編集方法の一態様としては、例えば、標的DNAを、5’側から順に、PAM配列(PAM)、標的部位(図ではC又はA)、スペーサー1(12)、DNA結合ドメイン認識配列(11)(第1の態様:図1Aの(a))、又は、5’側から順に、PAM配列(PAM)、標的部位(図ではC又はA)、スペーサー1(12)、DNA結合ドメイン認識配列(11)の相補配列(第1の態様:図1Aの(b))とする態様が挙げられる。このとき、ガイドRNA(40)の標的配列は、PAM配列(PAM)の3’側に隣接する配列の相補配列上、かつ、当該相補配列が標的部位(C又はA)を含むように設定される。これにより、ガイドRNA(40)にCas5~Cas8タンパク質(31~34)からなるタイプI-Casタンパク質群(30)が誘導されて、そのヘリカ-ゼ活性により標的部位(C又はA)を含む一本鎖を特異的に露出させる。さらに、融合タンパク質(20)のDNA結合ドメイン(22)がDNA結合ドメイン認識配列(11)を認識して結合し、その核酸塩基変換酵素(21)も標的部位(C又はA)に誘導されるため、標的部位(C又はA)の塩基の置換を効率的に起こすことができる。
本発明の標的DNAの編集方法の別の態様としては、例えば、標的DNAを、5’側から順に、DNA結合ドメイン認識配列(11)、PAM配列(PAM)及びスペーサー1(12)、標的部位(図ではC又はA)(第3の態様:図1Bの(a))、又は、5’側から順に、DNA結合ドメイン認識配列(11)の相補配列、PAM配列(PAM)及びスペーサー1(12)、標的部位(図ではC又はA)(第4の態様:図1Bの(b))とする態様が挙げられる。第3の態様及び第4の態様において、PAM配列はスペーサー1上に設定される。このとき、ガイドRNA(40)の標的配列は、PAM配列(PAM)の3’側に隣接する配列の相補配列上、かつ、当該相補配列が標的部位(C又はA)を含むように設定される。これにより、ガイドRNA(40)にCas5~Cas8タンパク質(31~34)からなるタイプI-Casタンパク質群(30)が誘導されて、そのヘリカ-ゼ活性により標的部位(C又はA)を含む一本鎖を特異的に露出させる。さらに、融合タンパク質(20)のDNA結合ドメイン(22)がDNA結合ドメイン認識配列(11)を認識して結合し、その核酸塩基変換酵素(21)も標的部位(C又はA)に誘導されるため、標的部位(C又はA)の塩基の置換を効率的に起こすことができる。
なお、本発明の標的DNAの編集方法は、図1A~図1Bに示す態様に限定されるものではない。例えば、図1A~図1Bでは、タイプI-Casタンパク質群を、サブタイプI-FのCRISPR-CasシステムやサブタイプI-BのCRISPR-Casシステムを構成するCas5~Cas8タンパク質(31~34)からなるタイプI-Casタンパク質群(30)としているが、そのサブタイプや改変体に応じて別の構成であってよい。
これにより、標的部位で1塩基の置換が起こり(例えば、C→U)、また、例えば細胞内では、二本鎖DNAのミスマッチにより、置換が起こった鎖の反対鎖の塩基が置換塩基と対形成するように修復されたり(例えば、G→A)、修復の際に他の塩基に置換されたり(例えば、U→A、G)、或いは1塩基又は十数塩基の欠失若しくは挿入を生じることにより、種々の変異が導入され得る。
したがって、本発明に係るDNAの編集には、前記核酸塩基変換酵素で変換された標的部位及びそれを含む近傍における、1以上の塩基の欠失、他の1以上の塩基への置換、若しくは1以上の塩基の挿入、又はこれらの変異の組み合わせを含む。
本発明の標的DNA編集方法は、細胞内において行っても、無細胞系において行ってもよい。本発明の標的DNA編集方法の場となる「細胞内」としては、真核細胞内であっても原核細胞内であってもよく、好ましくは真核細胞内である。前記真核細胞としては、例えば、動物細胞(哺乳類、魚類、鳥類、爬虫類、両生類、昆虫類の細胞等)、植物細胞、藻細胞、酵母が挙げられ、前記原核細胞としては、例えば、大腸菌、サルモネラ菌、枯草菌、乳酸菌、高度好熱菌が挙げられる。
「動物細胞」には、例えば、動物の個体を構成している細胞、動物から摘出された器官・組織を構成する細胞、動物の組織に由来する培養細胞等が含まれる。具体的には、例えば、卵母細胞や精子などの生殖細胞;各段階の胚の胚細胞(例えば、1細胞期胚、2細胞期胚、4細胞期胚、8細胞期胚、16細胞期胚、桑実期胚など);誘導多能性幹(iPS)細胞や胚性幹(ES)細胞などの幹細胞;線維芽細胞、造血細胞、ニューロン、筋細胞、骨細胞、肝細胞、膵臓細胞、脳細胞、腎細胞などの体細胞などが挙げられる。ゲノム編集動物の作成に用いられる卵母細胞としては、受精前及び受精後の卵母細胞を利用することができるが、好ましくは受精後の卵母細胞、すなわち受精卵である。特に好ましくは、受精卵は前核期胚のものである。卵母細胞は、凍結保存されたものを解凍して用いることができる。
「植物細胞」には、例えば、植物の個体を構成している細胞、植物から分離した器官や組織を構成する細胞、植物の組織に由来する培養細胞等が含まれる。植物の器官や組織としては、例えば、葉、茎、茎頂(生長点)、根、塊茎、カルスなどが挙げられる。
また、本発明の標的DNA編集方法の場となる「無細胞系」とは、生きた細胞(前記真核細胞、原核細胞)のない系を示す。本発明に係る無細胞系としては、前記融合タンパク質及び前記タイプI-CRISPR-Casシステムと、前記標的DNAとが接触可能な系であれば特に制限されず、例えば、緩衝液内;前記真核細胞又は原核細胞の細胞破砕液内、細胞抽出液内等が挙げられる。
前記融合タンパク質及び前記タイプI-CRISPR-Casシステムと、前記標的DNAとを接触させる方法としては特に制限されない。細胞内においては、例えば、下記の標的DNAが編集された細胞の製造方法のように、前記標的DNAを含む細胞に対して前記融合タンパク質及び前記タイプI-CRISPR-Casシステムを導入する又はこれらをコードするベクター等を細胞に導入して発現させる方法が挙げられる。無細胞系においては、例えば、標的DNAの溶液と前記融合タンパク質及び前記タイプI-CRISPR-Casシステムの溶液とを混合すればよい。これらの溶液の溶媒としては、特に制限されないが、例えば、リン酸緩衝液、Tris緩衝液、グッド緩衝液、ホウ酸緩衝液等の緩衝液が好ましい。
<標的DNAが編集された細胞の製造方法>
本発明の標的DNAが編集された細胞の製造方法は、
標的DNAが編集された細胞を製造する方法であり、
(1)DNA結合ドメイン及び核酸塩基変換酵素を含む融合タンパク質、並びに、
(2)ヌクレアーゼ活性の一部又は全部を喪失したタイプI-Casタンパク質群及びそのガイドRNAを含むタイプI-CRISPR-Casシステム
を細胞に導入又は細胞内で発現させて標的DNAに接触させ、前記融合タンパク質の核酸塩基変換酵素活性により前記標的DNAの標的部位の塩基を編集する工程を含み、
前記DNA結合ドメインが認識するDNA結合ドメイン認識配列又はその相補配列は、前記標的部位の5’側又は3’側に7~31塩基の鎖長のスペーサー1を介して存在し、かつ、
前記タイプI-CRISPR-CasシステムにおけるガイドRNAが認識するガイドRNA標的配列は、前記標的部位の相補塩基を含むように存在する、
方法である。
本発明の標的DNAが編集された細胞の製造方法(以下、場合により単に「製造方法」という)において、前記融合タンパク質、タイプI-CRISPR-Casシステム、及び標的DNAは、上記の本発明の標的DNA編集方法で述べたとおりである。本発明の製造方法における標的DNAとしては、ゲノムDNAであり、当該ゲノムDNAの編集目的に応じて、前記融合タンパク質及びタイプI-CRISPR-Casシステムを設計することができる。
また、本発明の製造方法において、融合タンパク質及びタイプI-CRISPR-Casシステムと細胞内の標的DNAとの接触は、前記融合タンパク質及びタイプI-CRISPR-Casシステムの、細胞へのタンパク質の形態での導入、細胞へのポリヌクレオチドの形態での導入、及び/又は、細胞への発現ベクターの形態での導入により細胞内で発現させることにより行う。したがって、前記融合タンパク質及びタイプI-CRISPR-Casシステムとしては、前記融合タンパク質及びタイプI-Casタンパク質群を構成する各Casタンパク質を、それぞれ独立に、タンパク質の形態で細胞に導入しても、当該タンパク質をコードするRNAやDNA(ポリヌクレオチド)の形態で細胞に導入して細胞内で発現させても、当該タンパク質を発現するベクター(発現ベクター)の形態で細胞に導入して細胞内で発現させてもよい。また、これと独立して、前記ガイドRNAを、RNA(ポリヌクレオチド)の形態で細胞に導入しても、当該RNAをコードするDNA(ポリヌクレオチド)の形態で細胞に導入して細胞内で発現させても、当該RNAを発現するベクター(発現ベクター)の形態で細胞に導入して細胞内で発現させてもよい。
前記融合タンパク質及びタイプI-CRISPR-Casシステムを発現ベクターの形態で細胞に導入して細胞内で発現させる場合には、例えば、前記融合タンパク質を発現するベクター、前記タイプI-Casタンパク質群を構成する各Casタンパク質を発現するベクター、及び前記ガイドRNAを発現するベクターをそれぞれ細胞内に導入してもよく、また、これらのうちの2種以上を組み合わせて発現するベクターを細胞内に導入してもよい。
また、前記融合タンパク質及びタイプI-CRISPR-Casシステムを発現ベクターの形態で細胞に導入して細胞内で発現させる場合、前記融合タンパク質及び前記タイプI-Casタンパク質群を構成する各Casタンパク質をコードするポリヌクレオチドとしては、それぞれ独立して、導入する細胞に応じて適宜コドン最適化されたものであってもよい。また、当該発現ベクターとしては、発現させるべきポリヌクレオチドに作動可能に連結しているプロモーター及び/又はその他の制御配列を含むことが好ましい。さらに、当該発現ベクターとしては、宿主ゲノムに組み込まれることなく、コードするタンパク質を安定して発現することができるものであることが好ましい。このような発現ベクターは、適宜従来公知の方法に準じて作製することができる。
前記融合タンパク質及び前記タイプI-CRISPR-Casシステムの、タンパク質、当該タンパク質をコードするポリヌクレオチド、当該タンパク質を発現するベクターを細胞に導入する方法としては、タンパク質やDNA、RNA断片を細胞に導入するための公知の方法を細胞の種類に応じて適宜採用することができ、このような方法としては、例えば、電気穿孔法(エレクトロポレーション法)、マイクロインジェクション法、パーティクルガン法、リン酸カルシウム法、ポリエチレンイミン(PEI)法、リポソーム法(リポフェクション法)、DEAE-デキストラン法、カチオン性脂質媒介トランスフェクション、ウイルス(アデノウイルス、レンチウイルス、アデノ随伴ウイルス、バキュロウィルス等)、アグロバクテリウム法、酢酸リチウム法、スフェロプラスト法、熱ショック法(塩化カルシウム法、塩化ルビジウム法)等が挙げられる。このような方法は、「Daviset al.,Basic methods in molecular biology,New York:Elsevier,1986」等、多くの標準的研究室マニュアルに記載されている。
前記融合タンパク質及び前記タイプI-CRISPR-Casシステムが細胞に導入又は細胞内で発現すると、前記融合タンパク質及び前記タイプI-CRISPR-Casシステムと細胞内の標的DNAとが接触し、上記の本発明の標的DNA編集方法で述べた標的DNA編集により、標的部位で目的の塩基の置換が起こり、その結果、標的DNAが編集された細胞を得ることが可能となる。
本発明はまた、前記標的DNAの編集がされた細胞を含む非ヒト個体の作製方法を提供する。この方法は、上記の製造方法により得られた細胞から非ヒト個体を作製する工程を含む。前記非ヒト個体としては、例えば、非ヒト動物及び植物が挙げられる。前記非ヒト動物としては、哺乳類(マウス、ラット、モルモット、ハムスター、ウサギ、サル、ブタ、ウシ、ヤギ、ヒツジなど)、魚類、鳥類、爬虫類、両生類、昆虫類が挙げられる。モデル動物を作製する場合、哺乳動物は、好ましくは、マウス、ラット、モルモット、ハムスターなどのげっ歯類であり、特に好ましくはマウスである。前記植物としては、例えば、穀物類、油料作物、飼料作物、果物、野菜類が挙げられる。具体的な作物としては、例えば、イネ、トウモロコシ、バナナ、ピーナツ、ヒマワリ、トマト、アブラナ、タバコ、コムギ、オオムギ、ジャガイモ、ダイズ、ワタ、カーネーションを例示することができる。
前記標的DNAの編集がされた細胞から非ヒト個体を作製する方法としては、公知の方法を利用することができる。動物において細胞から非ヒト個体を作製する場合、通常、生殖細胞又は多能性幹細胞が利用される。例えば、前記融合タンパク質及び前記タイプI-CRISPR-Casシステムを卵母細胞にマイクロインジェクションし、得られた卵母細胞を偽妊娠状態にした雌非ヒト哺乳動物の子宮に移植し、その後産仔を得ることができる。また、植物においては、古くから、その体細胞が分化全能性を有していることが知られており、例えば、前記融合タンパク質及び前記タイプI-CRISPR-Casシステムを植物細胞にマイクロインジェクションし、得られた植物細胞から植物体を再生することにより、所望のDNAが編集された植物体を得ることができる。また、得られた非ヒト個体からは、所望のDNAが編集された子孫やクロ-ンを得ることもできる。
標的DNA編集の有無の確認、及び遺伝子型の決定は、従来公知の手法に基づいて行うことができ、例えばPCR法、配列決定法、サザンブロッティング法等を利用することができる。
<DNA編集システム>
また、本発明は、上記本発明の標的DNA編集方法、本発明の標的DNAが編集された細胞の製造方法、又は上記本発明の非ヒト個体の作製方法に用いるための、
(1)DNA結合ドメイン及び核酸塩基変換酵素を含む融合タンパク質、並びに、
(2)ヌクレアーゼ活性の一部又は全部を喪失したタイプI-Casタンパク質群及びそのガイドRNAを含むタイプI-CRISPR-Casシステム
を含む、DNA編集システムを提供する。
前記融合タンパク質、及びタイプI-CRISPR-Casシステムは、上記の本発明の標的DNA編集方法及び製造方法で述べたとおりである。これらはそれぞれ独立して、タンパク質又はRNAの形態であっても、当該タンパク質又はRNAをコードするポリヌクレオチドの形態であっても、当該タンパク質又はRNAを発現するベクター(発現ベクター)の形態であってもよい。
また、発現ベクターの形態である場合、本発明は、標的DNAの標的部位に応じて、ユ-ザ-が前記融合タンパク質及びタイプI-CRISPR-Casシステムを設計することができるように、
(a)DNA結合ドメインをコードするポリヌクレオチドの挿入部位と前記融合タンパク質のDNA結合ドメイン以外をコードするポリヌクレオチドとを含むベクター、並びに、
(b)ヌクレアーゼ活性の一部又は全部を喪失したタイプI-Casタンパク質群をコードするポリヌクレオチド、又は、該ポリヌクレオチドを含むベクター、
(c)前記タイプI-Casタンパク質群のガイドRNAをコードするポリヌクレオチド、又は、該ポリヌクレオチドを含むベクター若しくは該ポリヌクレオチドの挿入部位を含むベクター、
を含む、DNA編集システムを提供する。なお、(a)~(c)の各ベクターは、それぞれ、各ポリヌクレオチドを発現可能にする発現ユニットを含むものである。
本発明のDNA編集システムは、それぞれ、前記融合タンパク質及び前記タイプI-CRISPR-Casシステムを含む組み合わせからなる組み合わせ物としても、前記組み合わせを含むキットとしてもよい。キットとする場合、当該キットは、一つ又は複数の追加の試薬をさらに含んでいてもよい。このような追加の試薬としては、例えば、希釈緩衝液、再構成溶液、洗浄緩衝液、核酸導入試薬、タンパク質導入試薬、対照試薬(例えば、対照のデアミナーゼ)が挙げられるが、これらに制限されるものではない。また、当該キットは、本発明の方法を実施するための使用説明書をさらに含んでいてもよい。
前記キットに含まれる各要素は、それぞれ別個の容器に収容されていてもよいし、同一の容器に収容されていてもよい。各要素は、一回の使用量ごとに容器に収容されていてもよいし、複数回分の量が一つの容器に収容されていてもよい。各要素は乾燥形態で容器に収容されていてもよいし、適当な溶媒(緩衝液、安定剤、保存剤、防腐剤等を含む溶媒)中に溶解した形態で容器に収容されていてもよい。
以下、実施例に基づいて本発明をより具体的に説明するが、本発明は以下の実施例に限定されるものではない。
1.レポータープラスミドの作製
レポーターとして、pNLF1-C[CMV Hygro](PROMEGA社製,WI,USA)を用い、部位特異的変異導入法によって71番目と107番目のメチオニンコドン(ATG)をアラニンコドン(GCC)に変更してpNLF-M/Aとした。次いで、pNLF-M/Aに、表1に示した配列に対応するように設計したオリゴヌクレオチドをアニールさせ、NheIとXhoIで処理したpNLF-M/Aプラスミドに挿入し、TALE-AID用、又はBE4-TALE用のレポータープラスミドを作製した。レポータープラスミドの挿入配列を下記の表1に示す。挿入配列は、PAM配列(表1中の下線(*1))、ターゲット塩基を含むコドン(ターゲットコドン;表1の下線(*2):5’-ACG-3’)、TALE認識配列の相補配列(表1中の下線(*3):5’-CCTTTGCCCGCTTCTGTa-3’;小文字はTALEのN末ドメインが認識するチミンの相補塩基を示す)、若しくはTALE認識配列(表1中の下線(*4):5’-tACAGAAGCGGGCAAAGG-3’;小文字はTALEのN末ドメインが認識するチミンを示す)及びこれらの間のスペーサー配列を含み、スペーサーの長さはターゲット塩基の3’側にある塩基を含めて7bp、13bp、19bp、25bp、又は31bpとした。
なお、前記TALE認識配列は、細胞内活性が確認されているhuman adenomatous polyposis coli遺伝子に対するTALENのRight TALE 配列(Sakuma et al.,Sci Rep 3,3379(2013))である。
完成したレポータープラスミドの構造を示す概念図を図2に示す。図2の(a)は、挿入配列がTALE認識配列(11)の相補配列を含む場合(TALE-AID用)、図2の(b)は、挿入配列がTALE認識配列(11)を含む場合(BE4-TALE用)を示す。これらのレポータープラスミドにおいて、ターゲットコドンは、NanoLucルシフェラーゼの開始コドンに相当する箇所に位置しているが、「ACG」となっている。かかるレポータープラスミドによれば、TALE認識配列に結合したTALE-デアミナーゼにより、ターゲットコドンであるACGがATGに変換される(すなわち、ターゲット塩基(標的部位)であるCがTに置換される)と、NanoLucルシフェラーゼを発現する。
2.TALEベクターセット及びTALE発現プラスミドの作製
TALEベクターセットの配列及び構成は、TALEリピートユニットが上記1.で作製したレポータープラスミドのTALE認識配列に対応するように、上記Sakuma et al.(2013)にしたがって構築した。先ず、12番目と13番目の2アミノ酸で構成される可変残基の4種(RVD:HD、NG、NI、NN)をコードする配列以外のモジュ-ル配列(non-repeat-variable di-residue(non-RVD))に改変(特に、4番目と32番目)を加え、さらにその両端に制限酵素BsAI認識サイトを付加した配列(モジュ-ル配列)を人工DNA合成した(計16種:1HD~4HD、1NG~4NG、1NI~4NI、1NN~4NN)。次いで、これらモジュ-ル配列をpEX-A2J2(Eurofins Genomics社製,Tokyo,Japan)に挿入して、モジュ-ルプラスミドセット(計16種:pEX1HD~pEX4HD、pEX1NG~pEX4NG、pEX1NI~pEX4NI、及びpEX1NN~pEX4NN)を作製した。
また、アレイプラスミドを構成するDNA配列FUS2_aXX(計7種:XX=1a、2a、2b、3a、3b、4a、4b)及びFUS2_b(1-4)(計4種)を人工DNA合成により作製した。これらをpCR8/GW/TOPO (Thermo Fisher Scientific社製,Waltham,MA,USA)に挿入して、pCR8_FUS2_aXX及びpCR8_FUS_b(1-4)を作製した。次いで、これを上記Sakuma et al.(2013)に記載のPlatinum Gateシステムにおける最初のアセンブルステップ(ステップ1)の捕捉ベクターとして使用し、同文献に記載の方法にしたがって、TALE配列を連結したアレイプラスミドを作製した。
次いで、pcDNA3.1(+)(Thermo Fisher Scientific社製)から薬剤耐性遺伝子発現ユニットを除去したpcDNA3.1sに、人工DNA合成により作製した、TALEのN末ドメインをコードする配列に加え、前記モジュ-ル配列を1つと、この3’末に続くTALEのC末ドメインをコードする配列と、を挿入したデスティネーションベクター(TALE-63、TALE-47)を作製した。TALEのC末ドメインとしては、C末ドメインのアミノ酸数が63のもの(63)、C末ドメインのアミノ酸数が47のもの(47)、の2種を用い、「63」をコードする配列はAddgeneのpTALEN_v2(ID:32189~32192)に含まれるC末ドメインの配列を、「47」をコードする配列はAddgeneのptCMV-153/47-VR-NG(Addgene ID:50704)に含まれるC末ドメインの配列を、それぞれ参照して人工DNA合成した。また、TALEのN末ドメインとしては、これらC末ドメインに対応させて、63:AddgeneのptCMV-136/63-VR-HD(ID:50699)に含まれるN末ドメインの配列;47:AddgeneのptCMV-153/47-VR-HD(ID:50703)に含まれるN末ドメインの配列を、それぞれ参照して人工DNA合成した。上記で作製したアレイプラスミド及びデスティネーションベクターを用いて、上記Sakuma et al.(2013)に記載の方法にしたがい、Golden Gate法によってTALE発現プラスミドを作製した。
3.TALE-デアミナーゼ発現プラスミドの作製-1(TALE-AIDシリーズ)
(1)104アミノ酸リンカーシリーズ(TALE-104-AID)
先ず、人工DNA合成により作製したAncBE4max遺伝子(Koblan et al.,Nat Biotechnol 36,843-846(2018))と、Target-AID遺伝子(Nishida et al.,Science 353,aaf8729(2016))とをpcDNA3.1sのBamHI認識サイトとEcoRV認識サイトとの間にそれぞれ挿入することにより、AncBE4max発現プラスミド及びTarget-AID発現プラスミドを作製した。
次いで、104アミノ酸リンカー1を有するTALE-デアミナーゼ発現プラスミドを以下の方法により作製した。すなわち、上記AncBE4max発現プラスミドのAncBE4max遺伝子を鋳型として、下記の表2に記載のプライマーを用いて、10アミノ酸リンカー2及びUGI遺伝子の2回繰り返し配列(10aa linker-β-lactamase:プライマー配列番号11、12)をPCRにより増幅した。また、上記Target-AID発現プラスミドを鋳型として、下記の表2に記載のプライマーを用いて、PmCDA1デアミナーゼ遺伝子(PmCDA1:プライマー配列番号13、14)、及び104アミノ酸リンカー1をコードする配列(104aa linker:プライマー配列番号15、16)をPCRにより増幅した。さらに、上記2.で作製したデスティネーションベクターTALE-47を鋳型として、β-lactamaseからTALEのC末ドメイン(47)をコードする配列までを含む配列(β-lactamase-TALE_47:プライマー配列番号18、19)をPCRにより増幅した。
下記の表2に、TALE-デアミナーゼ発現プラスミドを構築するために使用した各プライマー及びその配列番号を示す。表2中、104aa linkerのfor以下の「47-104-AID」は、当該配列が、TALEのC末ドメインが47であり、かつ、前記104アミノ酸リンカー1及びPmCDA1を含むTALE-デアミナーゼ用のリンカー1をコードする配列であることを示す。なお、下記の各表中、「AID」は、デアミナーゼがAIDであることを示すものではなく、「Target-AID」に由来するPmCDA1であることを示す。
β-lactamaseからTALEのC末ドメイン(47)をコードする配列までを含む配列、104アミノ酸リンカー1をコードする配列、PmCDA1デアミナーゼ、及び10アミノ酸リンカー2及びUGI遺伝子の2回繰り返し配列からβ-lactamaseまでを含む配列を、In-Fusion法(TaKaRa Bio Inc,Shiga社製)により連結し、N末から順に、TALE_47、104アミノ酸リンカー1(104aa)、PmCDA1デアミナーゼ(AID)、10アミノ酸リンカー2(10aa)、UGI遺伝子(UGI)、10アミノ酸リンカー2(10aa)、及びUGI遺伝子(UGI)の順で結合されたTALE-デアミナーゼを発現するためのデスティネーションベクタープラスミド47-104-AIDを作製した。このプラスミドと、2.で作製したTALE配列を連結したアレイプラスミドとを用いて、Golden Gate法により、TALE-デアミナーゼ発現プラスミド(TALE-104-AID(47-104-AID))を作製した。前記TALE-デアミナーゼの構造を示す概念図を図3の(a)に示す。
(2)12アミノ酸リンカーシリーズ(TALE-12-AID)
また、前記104アミノ酸リンカー1に代えて、12アミノ酸リンカー1(12aa)を有するTALE-デアミナーゼ発現プラスミドは以下の方法で作製した。すなわち、先ず、下記の表3に記載のオリゴヌクレオチドをアニーリングさせて12アミノ酸リンカー1をコードする配列を作製した。表3中、12aa linkerのfor以下の「TALE_47-12-AID」は、当該配列が、TALEのC末ドメインが47であり、かつ、前記12アミノ酸リンカー1及びPmCDA1デアミナーゼ(AID)を含むTALE-デアミナーゼ用のリンカー1をコードする配列であることを示す。かかる12アミノ酸リンカー1は、Yang et al.,Nat Commun 7 13330(2016)に記載の12アミノ酸からなる。次いで、上記TALE-デアミナーゼ発現プラスミドを作製するためのデスティネーションベクタープラスミド47-104-AIDの104アミノ酸リンカー1をコードする配列以外を、下記の表4に示したプライマーを用いて、それぞれ、インバ-スPCRにて増幅し、前記12アミノ酸リンカー1をコードする配列をIn-Fusion法により挿入して、N末から順に、TALE_47、12アミノ酸リンカー1(12aa)、PmCDA1デアミナーゼ(AID)、10アミノ酸リンカー2(10aa)、UGI遺伝子(UGI)、10アミノ酸リンカー2(10aa)、及びUGI遺伝子(UGI)の順で結合されたTALE-デアミナーゼを発現するためのデスティネーションベクタープラスミド47-12-AIDを作製した。このプラスミドと、2.で作製したTALE配列を連結したアレイプラスミドとを用いて、Golden Gate法により、TALE-デアミナーゼ発現プラスミド(TALE-12-AID(47-12-AID))を作製した。前記TALE-デアミナーゼの構造を示す概念図は図3の(a)と同様である。下記の表3に、12アミノ酸リンカー1をコードする配列及びその配列番号を示し、表4に、インバースPCRに使用したプライマー及びその配列番号を示す。
また、TALE-デアミナーゼのネガティブコントロール(NC)として、TALEリピートユニットがヒトゲノムに結合しないように、上記1.で作製したレポータープラスミドのTALE認識配列に代えて、次のNC配列:5’-tTGCGCGTATAGTCGCG-3’(配列番号:22、NC_TALE)を認識して結合するように構築したTALE-デアミナーゼ-NCを発現するようにしたこと以外は上記と同様にして、各TALE-デアミナーゼに対応するTALE-デアミナーゼ-NCを発現するプラスミド(TALE-デアミナーゼ-NC発現プラスミド;TALE-104/12-AID-NC(47-104/12-AID-NC))をそれぞれ作製した。
作製した各発現プラスミドにおける、TALE-デアミナーゼ、及びそのネガティブコントロール(TALE-デアミナーゼ-NC)の構成及びその配列を示す配列番号(塩基配列の配列番号、アミノ酸配列の配列番号)の一覧を下記の表5にそれぞれ示す。なお、表5中のIDにおいて、「AID」は、デアミナーゼがAIDであることを示すものではなく、「Target-AID」に由来するPmCDA1であることを示す。
4.TALE-デアミナーゼ発現プラスミドの作製-2(BE4-TALEシリーズ)
(1)32アミノ酸リンカーシリーズ(BE4-32-TALE)
N末から、Anc689デアミナーゼ(BE4)、リンカー1(32アミノ酸)、TALE(C末ドメイン:63、又は47)の順に配置されるTALE-デアミナーゼ(以下、場合により「BE4-32-TALE」という)の発現プラスミドを以下の方法により作製した。すなわち、先ず、3.(1)において作製したAncBE4max発現プラスミドを鋳型として、下記の表6に記載のプライマーを用いて、32アミノ酸リンカー1をコードする配列を含めて5’側(プライマー配列番号19、23、24)、10アミノ酸リンカー2及びUGIの2回繰り返しをコードする配列を含めて3’側(プライマー配列番号12、25、26)をそれぞれPCRにより増幅した。また、2.で作製したデスティネーションベクター(TALE-63、TALE-47)をそれぞれ鋳型として、各TALEをコードする配列(プライマー配列番号17、18、27、28)をPCRにより増幅した。下記の表6に、BE4-32-TALE発現プラスミドを構築するために使用した各プライマー及びその配列番号を示す。
上記3断片をそれぞれ組み合わせて、3.(1)と同様に、In-Fusion法により、N末から順に、デアミナーゼ(Anc689デアミナーゼ(BE4))、リンカー1(32アミノ酸)、TALE(C末ドメイン:63、又は47)の順に配置されるBE4-32-TALE発現プラスミドを発現するためのデスティネーションベクター(BE4-32-63、BE4-32-47)をそれぞれ作製した。これらと、2.で作製したTALE配列を連結したアレイプラスミド、又は、3.で作製したNC配列を連結したアレイプラスミドとを用いて、3.と同様に、Golden Gate法により、各TALE-デアミナーゼ発現プラスミド(BE4-32-TALE(BE4-32-63/47))及びTALE-デアミナーゼ-NC発現プラスミド(BE4-32-63/47-NC(BE4-32-63/47-NC))をそれぞれ作製した。前記TALE-デアミナーゼの構造を示す概念図を図3の(b)に示す。
作製した各発現プラスミドにおける、TALE-デアミナーゼ、及びそのネガティブコントロール(TALE-デアミナーゼ-NC)の構成及びその配列を示す配列番号(塩基配列の配列番号、アミノ酸配列の配列番号)の一覧を下記の表7にそれぞれ示す。
(2)135アミノ酸リンカーシリーズ(BE4-135-TALE)
次いで、デアミナーゼとTALEとの間のリンカー1長(32アミノ酸)をコードする配列の下流側に、既知のリンカー配列であるHTS95アミノ酸配列(Sun and Zhao,Mol BioSyst 10,446-453(2014))をコードする配列を挿入したTALE-デアミナーゼ(以下、場合により「BE4-135-TALE」という)の発現プラスミド(リンカー1長:HTS95アミノ酸配列の前後に付加した繋ぎ配列を含めて、135アミノ酸(HTS95a.a.:塩基配列の配列番号114、アミノ酸配列の配列番号115)を以下の方法により作製した。すなわち、4.(1)で作製したBE4-32-63、BE4-32-47の各デスティネーションベクターを鋳型として、下記の表8に記載のプライマーを用いて、32アミノ酸リンカー1をコードする配列を含めて5’側(プライマー配列番号19、29)、各TALEをコードする配列以降の3’側(プライマー配列番号12、30、31)をそれぞれPCRにより増幅した。下記の表8に、使用した各プライマー及びその配列番号を示す。
上記3断片をそれぞれ組み合わせて、3.(1)と同様に、In-Fusion法により、N末から順に、デアミナーゼ(Anc689デアミナーゼ(BE4))、リンカー1(135アミノ酸)、TALE(C末ドメイン:63、又は47)の順に配置されるBE4-135-TALEを発現するためのデスティネーションベクター(BE4-135-63、BE4-135-47、)をそれぞれ作製した。これらと、2.で作製したTALE配列を連結したアレイプラスミド、又は、3.で作製したNC配列を連結したアレイプラスミドとを用いて、3.と同様に、Golden Gate法により、各TALE-デアミナーゼ発現プラスミド(BE4-135-TALE(BE4-135-63/47))、又は、TALE-デアミナーゼ-NC発現プラスミド(BE4-135-63/47-NC(BE4-135-63/47-NC))を作製した。前記TALE-デアミナーゼの構造を示す概念図は図3の(b)と同様である。
作製した各発現プラスミドにおける、TALE-デアミナーゼ、及びそのネガティブコントロール(TALE-デアミナーゼ-NC)の構成及びその配列を示す配列番号(塩基配列の配列番号、アミノ酸配列の配列番号)の一覧を上記の表7にそれぞれ示す。
5.TALE-デアミナーゼ発現プラスミドの作製-3(ABE8e-TALEシリーズ)
先ず、人工DNA合成により作製したABEmax遺伝子(Koblan et al.,Nat Biotechnol 36,843-846(2018))を、pcDNA3.1sのBamHI認識サイトとEcoRV認識サイトとの間にそれぞれ挿入することにより、ABEmax発現プラスミドを作製した。次いで、ABEmaxの改良型であるABE8e(V106W)(Richter et al.,Nat Biotechnol 38,883-891(2020))発現プラスミドを作製した。すなわち、ABEmax発現プラスミドを鋳型として、下記の表9に記載のプライマー(プライマー配列番号154、155)を用いて、3’-ABEmax遺伝子のN末のNLSをコードする配列~32アミノ酸リンカー1のC末迄をコードする配列-5’を、PCRにより増幅してアクセプターとした。また、ABE7.10遺伝子上に、V106W、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I、D167Nとなる変異を含むようにプライマーをデザインし、ABEmax発現プラスミドを鋳型として、断片A(プライマー配列番号156、157)と、断片B(プライマー配列番号158、159)とをPCRにより増幅した。次いで、2個の断片をIn-Fusion法により前記アクセプターに挿入し、ABE8e(TadA-8e(V106W))発現プラスミドを作製した。下記の表9に、使用した各プライマー及びその配列番号を示す。なお、下記の各表中、「ABE8e」は、デアミナーゼがTadA-8e(V106W)であることを示す。
次いで、N末から、ABEデアミナーゼ(ABE8e)、リンカー1(135アミノ酸)、TALE(C末ドメイン:47)の順に配置されるTALE-デアミナーゼ(以下、場合により「ABE8e-135-47」)の発現プラスミドを以下の方法により作製した。すなわち、4.(2)で作製したBE4-135-47のデスティネーションベクターを鋳型として、下記の表10に記載のプライマーを用いて、N末端のNLSをコードする配列を含めた5’側と、32アミノ酸リンカーからC末側をコードする配列を含めた3’側とを、ベクターを含めてPCRにより増幅して(プライマー配列番号160、161)アクセプターとした。また、ABE8e(TadA-8e(V106W))発現プラスミドを鋳型としてPCRにより増幅した(プライマー配列番号162、163)、ABE8e(TadA-8e(V106W))遺伝子部分を、In-Fusion法により前記アクセプターに挿入し、ABE8e-135-47を発現するためのデスティネーションベクターを作製した。下記の表10に、使用した各プライマー及びその配列番号を示す。
6.内因性DNA(ゲノムDNA)をターゲットとするTALE-デアミナーゼ発現プラスミドの作製
内因性DNA上の配列をターゲットとするため、内因性DNA上のAS14サイト、S1サイト、S2サイト、及びAPCサイトの4種類のターゲットサイトに対して、TALE認識配列が下記の表11に記載の6種類の配列となるように、2.と同様の方法でTALE配列を連結したアレイプラスミドを作製した。前記内因性DNA及びターゲットサイトとしては、相同性の高いファミリー遺伝子(CCR2)が存在するCCR5遺伝子上のAS14サイト、相同性の高いファミリー遺伝子(HBD)が存在するHBB遺伝子上のS1サイト及びS2サイト、及びAPC遺伝子上のAPCサイトをそれぞれ設定した。
上記各アレイプラスミドを用いたこと以外は、3.と同様にして、Golden Gate法により、N末から、TALE(C末ドメイン:47)、リンカー1(12アミノ酸、又は104アミノ酸)、デアミナーゼ(AID)の順に配置されるTALE-デアミナーゼ(47(*)-12-AID、47(*)-104-AID:括弧内の*はそれぞれターゲットサイト名)の発現プラスミド(TALE-AID発現プラスミド)を作製した。
また、上記各アレイプラスミドを用いたこと以外は、4.と同様にして、Golden Gate法により、N末から、デアミナーゼ(BE4)、リンカー1(32アミノ酸、又は135アミノ酸)、TALE(C末ドメイン:63、又は47)の順に配置されるTALE-デアミナーゼ(BE4-32-47(*)、BE4-135-63(*):括弧内の*はそれぞれターゲットサイト名)の発現プラスミド(BE4-TALE発現プラスミド)を作製した。
さらに、5.で作製したデスティネーションベクター及び各アレイプラスミドを用いたこと以外は、3.と同様にして、Golden Gate法により、N末から、デアミナーゼ(ABE8e)、リンカー1(135アミノ酸)、TALE(C末ドメイン:47)の順に配置されるTALE-デアミナーゼ(ABE8e-135-47(*):括弧内の*はそれぞれターゲットサイト名)の発現プラスミド(ABE8e-TALE発現プラスミド)を作製した。
下記の表11に、各ターゲットサイトのためのTALE認識配列を示し、表12に、作製した各発現プラスミドにおける、ターゲットサイト、TALE-デアミナーゼの構成、及びその配列を示す配列番号(塩基配列の配列番号、アミノ酸配列の配列番号)の一覧をそれぞれ示す。
7.タイプI-Casタンパク質群発現プラスミドの作製
タイプI-Casタンパク質群として、以下の各文献に記載のCasタンパク質群:
TypeI-F:Pseudomonas aeruginosa UCBPP-PA14株のTypeI-F CRISPR-Cas(Chen et al.,Nat Commun 11、3136(2020)に記載のサブタイプI-FのCRISPR-Casシステムを構成するCasタンパク質群;
TypeI-B:Listeria monocytogenes Finland_1998株のTypeI-B CRISPR-Cas(Pickar-Oliver et al.,Nat Biotechnol 37,1493-1501(2019))に記載のサブタイプI-BのCRISPR-Casシステムを構成するCasタンパク質群;
を用いた。
先ず、人工DNA合成により作製したTypeI-FのCsy1、Csy2遺伝子と、3.で作製した47-12-AID発現プラスミドとを鋳型として、下記の表13に記載のプライマーを用いて、Csy1遺伝子(TypeI-F_Csy1:プライマー配列番号38、39)、Csy2遺伝子(TypeI-F_Csy2:プライマー配列番号40、41)、β-lactamaseからCMVpromoterをコードする配列までを含む配列(β-lactamase-CMVpromoter:プライマー配列番号42、19)、SV40NLS―β-lactamaseを含む配列(NLS-ColE1-β-lactamase:プライマー配列番号43、12)をPCRにより増幅した。下記の表13に、タイプI-Casタンパク質群発現プラスミドを構築するために使用した各プライマー及びその配列番号を示す。
増幅産物をIn-Fusion法により連結して、NLS-Csy1-NLS発現プラスミド、NLS-Csy2-NLS発現プラスミドをそれぞれ作製した。また、作製したNLS-Csy1-NLS発現プラスミドを鋳型として、β-lactamaseからN末のNLSまでの配列(β-lactamase-NLS)を下記の表14に記載のプライマー(プライマー配列番号56、19)を用いて、また、NLS-Csy1-NLS遺伝子の終始コドンからβ-lactamaseまでの配列(Termination-β-lactamase)を下記の表14に記載のプライマー(プライマー配列番号57、12)を用いて、それぞれ増幅した。これら断片と、人工DNA合成により作製したTypeI-FのCsy3、Csy4遺伝子;TypeI-BのCas5、Cas6、Cas7、Cas8b2遺伝子とを鋳型として、下記の表14に記載のプライマーを用いてPCRによりそれぞれ増幅し、各増幅産物をIn-Fusion法により連結して、NLS-Csy3発現プラスミド、NLS-Csy4発現プラスミド、NLS-Lmo-Cas5発現プラスミド、NLS-Lmo-Cas6発現プラスミド、NLS-Lmo-Cas7発現プラスミド、NLS-Cas8b2発現プラスミドをそれぞれ作製した。
さらに、Cas8b2については、Internal Translational Initiation Siteから翻訳される可能性のある2種類の翻訳物(Cas8b2-SSU1、Cas8b2-SSU2)の発現プラスミドも作製した。すなわち、NLS-Cas8b2発現プラスミドを鋳型として、下記の表15に記載のプライマーを用いてPCRにより増幅し、In-Fusion法により連結して、NLS-Cas8b2-SSU1発現プラスミド、NLS-Cas8b2-SSU2発現プラスミドをそれぞれ作製した。作製した各発現プラスミドにおける、各Cas分子の配列を示す配列番号(塩基配列の配列番号、アミノ酸配列の配列番号)の一覧を下記の表16にそれぞれ示す。
8.Cas9用のガイドRNA発現プラスミドの作製
先ず、pX330(Addgene,Cambridge,MA;Plasmid 42230)のU6プロモーターからBGHポリA付加配列までの領域を人工DNA合成し、pBlueScriptII(SK+)(Stratagene,La Jolla,CA,USA)のEcoRV認識サイトとBamHI認識サイトとの間にIn-Fusion法により挿入することでCas9発現プラスミドpX330_BSを作製した。これをXbaI及びNotIで処理してCas9遺伝子を除去し、フィルイン反応後、セルフライゲ-ションによりプラスミド(pX330_BS-ΔCas9)を作製した。次いで、下記の表17に示した、ガイドRNA(Anc-1)の標的配列(target-Anc-1:表17には、ガイドRNAの標的配列(アンチセンス鎖上)の相補配列を示す)に対応するように設計したオリゴヌクレオチドをアニールさせ、BpiI処理及びライゲ-ションによってpX330_BS-ΔCas9に挿入して、Cas9用のガイドRNA(AncBE4max用のガイドRNA)発現プラスミドを作製した。前記ガイドRNA(Anc-1)の標的配列は、1.で作製したレポータープラスミド上にある。
9.タイプI-CRISPR-Casシステム用のガイドRNA発現プラスミドの作製
先ず、下記の表18に記載のオリゴヌクレオチドをそれぞれアニーリングさせて、TypeI-F又はTypeI-BのCRISPR配列のリピート配列間にBbsI認識配列を2箇所有するリンカー配列を挟んだ配列を作製した。次いで、上記pX330_BS-ΔCas9プラスミドのgRNAスキャフォ-ルド配列以外を、下記の表19に示したプライマーを用いてインバ-スPCRにて増幅し、前記配列(リピート配列-リンカー配列-リピート配列)をIn-Fusion法により挿入し、I-F-crRNA発現プラスミド(pcIFcrRNA)、I-B-crRNA発現プラスミド(pcIBcrRNA)をそれぞれ作製した。
次いで、上記の表17に示した、各ガイドRNAの標的配列(表17には、ガイドRNAの標的配列(アンチセンス鎖上)の相補配列を示す)に対応するように設計したオリゴヌクレオチドをそれぞれアニールさせ、BpiI処理及びライゲ-ションによって、作製したcrRNA発現プラスミド(pclFcrRNA、pclBcrRNA)にそれぞれ挿入し、各タイプI-CRISPR-Casシステム用のガイドRNA発現プラスミドを作製した。前記ガイドRNAのうち、gRNA-REP-I-F及びgRNA-REP-I-Bの標的配列は、1.で作製したレポータープラスミド上にあり、それ以外のガイドRNAの配列は、6.で設定した内因性DNA上の各ターゲットサイト上にある。
10.HEK細胞への形質転換
(1)レポーターアッセイ
上記1.で作製した各レポータープラスミドを標的DNAとした場合は、以下のとおりとした。すなわち、上記1.で作製したレポータープラスミドのうちのいずれか20ng;上記3.で作製したTALE-デアミナーゼ発現プラスミド(TALE-AIDシリーズ)及びそのTALE-デアミナーゼ-NC発現プラスミド、並びに、上記4.で作製したTALE-デアミナーゼ発現プラスミド(BE4-TALEシリーズ)及びそのTALE-デアミナーゼ-NC発現プラスミドのうちのいずれか75ng;上記7.で作製したタイプI-Casタンパク質群発現プラスミド(TypeI-F:NLS-Csy1-NLS発現プラスミド、NLS-Csy2-NLS発現プラスミド、NLS-Csy3発現プラスミド、及びNLS-Csy4発現プラスミドの組み合わせ、又は、TypeI-B:NLS-Lmo-Cas5発現プラスミド、NLS-Lmo-Cas6発現プラスミド、NLS-Lmo-Cas7発現プラスミド、及びNLS-Cas8b2発現プラスミドの組み合わせ)をそれぞれ40ngずつ;上記9.で作製したタイプI-CRISPR-Casシステム用のガイドRNA発現プラスミド20ng;並びに、リファレンスプラスミドであるpGL4.54 5ng;を組み合わせて、Lipofectamine LTX(Thermo Fisher Scientific社製)を用いて各ウェルあたり5×10個のHEK293T細胞に導入し、24時間培養した。リファレンスプラスミドは、ホタルルシフェラーゼ(Fluc)を発現するプラスミドである。
また、ポジティブコントロールとして、上記1.で作製したレポータープラスミドのうちのいずれか20ng;上記3.で作製したAncBE4max発現プラスミド75ng;上記7.で作製したCas9用のガイドRNA発現プラスミド20ng;リファレンスプラスミドpGL4.54 5ng;を組み合わせたこと以外は同様にして、HEK293T細胞に導入した。
(2)内因性DNA編集アッセイ
上記6.に記載の内因性DNAを標的DNAとした場合には、以下のとおりとした。すなわち、上記6.で作製したTALE-デアミナーゼ発現プラスミド(TALE-AID発現プラスミド、BE4-TALE発現プラスミド、ABE8e-TALE発現プラスミドのうちのいずれか)60ng;上記7.で作製したタイプI-Casタンパク質群発現プラスミド(TypeI-F:NLS-Csy1-NLS発現プラスミド、NLS-Csy2-NLS発現プラスミド、NLS-Csy3発現プラスミド、及びNLS-Csy4発現プラスミドの組み合わせ、又はTypeI-B:NLS-Lmo-Cas5、NLS-Lmo-Cas6、NLS-Lmo-Cas7発現プラスミド、及びNLS-Cas8b2発現プラスミドの組み合わせ)をそれぞれ10ngずつ;上記9.で作製したタイプI-CRISPR-Casシステム用のガイドRNA発現プラスミド20ng;を組み合わせて、各ウェルあたり3×10個のHEK293T細胞に導入し、72時間培養した。
11.NanoLucルシフェラーゼ活性値の測定
上記10.の(1)で形質転換してから24時間培養後に培地を除去し、PBS(-)で洗浄後、Passive Lysis Buffer(PROMEGA社製)で処理して細胞を溶解し、細胞溶解液とした。前記細胞溶解液をDMEM培地で100倍に希釈し、Nano-Glo Dual-Luciferase Reporter Assay System(PROMEGA社製)を用いて、TriStar S LB942 プレートリーダー(Berthold Technologies社製)でNanoLucルシフェラーゼ活性スコア及びホタルルシフェラーゼ活性スコアを測定した。
各スコアのネガティブコントロールとしては、TALE-デアミナーゼ-NC発現プラスミドを導入した細胞についてのNanoLucルシフェラーゼ活性スコアを測定した。なお、ポジティブコントロール(AncBE4max発現プラスミドを導入した細胞)に対しては、pX330_BS-ΔCas9プラスミドを導入した細胞(ガイドRNAを発現させていない細胞)についての活性スコアを測定してネガティブコントロール(AncBE4max-NC)とした。
活性の数値化は以下のように行った。先ず、リファレンスプラスミドによるホタルルシフェラーゼ活性スコアを用いて各NanoLucルシフェラーゼ活性スコアを標準化した。次いで、標準化された活性スコアを用い、TALE-デアミナーゼ発現プラスミドを導入した細胞の活性スコアからTALE-デアミナーゼ-NC発現プラスミドを導入した細胞の活性スコアを差し引き、TALE-デアミナーゼ活性の活性値とした。また、AncBE4maxの発現プラスミドを導入した細胞の活性スコアからAncBE4max-NCを差し引き、AncBE4max活性値とした。さらに、各試験間でTALE-デアミナーゼ活性を比較するために、TALE-デアミナーゼ活性値は、AncBE4max活性値を1とした時の相対活性で示した。試験は少なくとも3回繰り返して行い、平均値に標準偏差を付与してグラフ化した。
12.塩基編集活性の解析
上記10.の(2)で形質転換してから72時間後に培地を除去し、PBS(-)で洗浄後、DNAzol(Molecular Research Center,Inc.)50μLを添加して細胞を溶解し、細胞溶解液とした。前記細胞溶解液をテンプレートにして、下記の表20に記載のプライマーをそれぞれ用いて、PrimeSTAR Max(Takara Bio Inc.,Siga社製)により、前記内因性DNAのターゲットサイトを含む領域を増幅した。得られたPCR産物を精製後、株式会社ファスマックにシークエンスを依頼した。EditR(Kluesner et al.,The CRISPR J 1,239-250(2018))を用いてシークエンスデータを解析し、ターゲットサイト上の標的(crDNA)範囲内の各CにおけるTの割合(%)、又は各AにおけるGの割合(%)を算出した。
<試験1> TALE-デアミナーゼの活性に及ぼすスペーサー1長の影響
(1)TALE-AIDシリーズ
TALE認識配列とターゲット塩基との間の距離(スペーサー1)が7~31bpである5種類のレポータープラスミドのいずれか;TALEのC末ドメインが47であり、アミノ酸リンカーが12アミノ酸又は104アミノ酸であり、デアミナーゼがAID(PmCDA1)である、上記3.で作製した2種類のTALE-デアミナーゼ(47-12-AID、47-104-AID)のいずれか;2種類のタイプI-Casタンパク質群発現プラスミド(TypeI-F、TypeI-B)のいずれか;並びに2種類のガイドRNA発現プラスミド(gRNA-REP-I-F、gRNA-REP-I-B)のいずれか;を組み合わせて、上記10.(1)の方法で共発現させ、上記11.の方法でTALE-デアミナーゼの活性値(AncBE4max活性値に対する割合)を取得した。また、対照として、ガイドRNA発現プラスミドを共発現させなかったこと以外はそれぞれ同様にして、TALE-デアミナーゼの活性値(AncBE4max活性値に対する割合)を取得した。結果を図4に示す。図4の(a)には、タイプI-Casタンパク質群発現プラスミドとしてTypeI-FのCasタンパク質群を発現するプラスミドを用いた結果を示し、図4の(b)には、タイプI-Casタンパク質群発現プラスミドとしてTypeI-BのCasタンパク質群を発現するプラスミドを用いた結果を示す。
図4に示したように、いずれのタイプI-Casタンパク質群を発現させた場合にも、ガイドRNAが存在しない場合(ガイドなし)、すなわちタイプI-CRISPR-Casシステムがターゲット塩基付近に結合していない場合はほとんど活性が認められなかった。一方、ガイドRNAの存在下では、いずれのタイプI-Casタンパク質群を発現させた場合にも活性が認められた。活性は、タイプI-Casタンパク質群発現プラスミドとしてTypeI-FのCasタンパク質群を発現するプラスミドを用いた場合の方が、TypeI-BのCasタンパク質群を発現するプラスミドを用いた場合よりも高い傾向にあった。また、リンカー1のアミノ酸数が12の場合(47-12-AID)の方が、104の場合(47-104-AID)よりも活性が高い傾向にあった。
また、タイプI-Casタンパク質群発現プラスミドとしてTypeI-FのCasタンパク質群を発現するプラスミドを用いた場合、スペーサー1が13~25bpで活性が高く、47-12-AIDでは19bpで、47-104-AIDでは25bpで、それぞれ最も活性が高かった。タイプI-Casタンパク質群発現プラスミドとしてTypeI-BのCasタンパク質群を発現するプラスミドを用いた場合、スペーサー1が7~19bpで活性が高く、19bpで最も活性が高かった。
(2)BE4-TALEシリーズ
TALE認識配列とターゲット塩基との間の距離(スペーサー1)が7~31bpである5種類のレポータープラスミドのいずれか;デアミナーゼがAnc689デアミナーゼ(BE4)であり、アミノ酸リンカーが32アミノ酸又は135アミノ酸であり、TALEのC末ドメインが47又は63である、上記4.で作製した4種類のTALE-デアミナーゼ(BE4-32-47、BE4-135-47、BE4-32-63、BE4-135-63)のいずれか;2種類のタイプI-Casタンパク質群発現プラスミド(TypeI-F、TypeI-B)のいずれか;並びに2種類のガイドRNA発現プラスミド(gRNA-REP-I-F、gRNA-REP-I-B)のいずれか;を組み合わせて、上記10.(1)の方法で共発現させ、上記11.の方法でTALE-デアミナーゼの活性値(AncBE4max活性値に対する割合)を取得した。また、対照として、ガイドRNA発現プラスミドを共発現させなかったこと以外はそれぞれ同様にして、TALE-デアミナーゼの活性値(AncBE4max活性値に対する割合)を取得した。結果を図5に示す。図5の(a)には、タイプI-Casタンパク質群発現プラスミドとしてTypeI-FのCasタンパク質群を発現するプラスミドを用いた結果を示し、図5の(b)には、タイプI-Casタンパク質群発現プラスミドとしてTypeI-BのCasタンパク質群を発現するプラスミドを用いた結果を示す。
図5に示したように、いずれのタイプI-Casタンパク質群を発現させた場合にも、ガイドRNAが存在しない場合(ガイドなし)、すなわちタイプI-CRISPR-Casシステムがターゲット塩基付近に結合していない場合はほとんど活性が認められなかった。一方、ガイドRNAの存在下では、いずれのタイプI-Casタンパク質群を発現させた場合にも活性が認められた。活性は、タイプI-Casタンパク質群発現プラスミドとしてTypeI-FのCasタンパク質群を発現するプラスミドを用いた場合の方が、TypeI-BのCasタンパク質群を発現するプラスミドを用いた場合よりも高い傾向にあった。
また、タイプI-Casタンパク質群発現プラスミドとしてTypeI-FのCasタンパク質群を発現するプラスミドを用いた場合、スペーサー1が13~31bpで活性が高く、BE4-32-47及びBE4-135-47では13bp及び25bpで、BE4-32-63及びBE4-135-63では25bpで、それぞれ最も活性が高かった。タイプI-Casタンパク質群発現プラスミドとしてTypeI-BのCasタンパク質群を発現するプラスミドを用いた場合、スペーサー1が13~25bpで活性が高かった。
<試験2> 内因性DNAにおける塩基編集効率-1
(サブタイプI-F CRISPR-Casシステム)
デアミナーゼがAID(PmCDA1)であり、アミノ酸リンカーが12アミノ酸又は104アミノ酸であり、TALEのC末ドメインが47である、上記6.で作製したTALE-デアミナーゼ(47(*)-12-AID、47(*)-104-AID);デアミナーゼがAnc689デアミナーゼ(BE4)であり、アミノ酸リンカーが32アミノ酸又は135アミノ酸であり、TALEのC末ドメインが47又は63である、上記6.で作製したTALE-デアミナーゼ(BE4-32-47(*)、BE4-135-63(*));及びデアミナーゼがTadA-8e(V106W)デアミナーゼ(ABE8e)であり、アミノ酸リンカーが135アミノ酸であり、TALEのC末ドメインが47である、上記6.で作製したTALE-デアミナーゼ(ABE8e-135-47(*));のいずれかと、タイプI-Casタンパク質群発現プラスミド(TypeI-F)と、5種類の各ターゲットサイト用のガイドRNA発現プラスミド(gRNA-IF-1、gRNA-IF-2、gRNA-IF-7、gRNA-APC-F2、gRNA-APC-F7-C)のいずれかと、を組み合わせて、上記10.(2)の方法で共発現させ、上記12.の方法で各ターゲットサイト上の標的(crDNA)範囲内の各CにおけるTの割合、又は各AにおけるGの割合(%)を取得した。また、対照として、前記タイプI-Casタンパク質群を共発現させなかったこと以外はそれぞれ同様にして、各標的(crDNA)範囲内の各CにおけるTの割合、又は各AにおけるGの割合(%)を取得した(w/o I-F cascade)。結果を図9A~図11Bに示す。
図6A及び図6Bには、内因性DNAのCCR5遺伝子上のターゲットサイトとしたAS14サイトにおけるPAM配列、ガイドRNA標的配列の相補配列(crDNA)、TALE認識配列又はTALE認識配列の相補配列の位置、これに対応するファミリー遺伝子CCR2とのアラインメントをまとめた概念図を示す。また、CCR5遺伝子上のAS14サイトの配列(図6Aの(a)の配列)を配列番号130に示す。図6A及び図6B中、上記デアミナーゼに編集され得るターゲット塩基C又はAには、それぞれ、ガイドRNA標的配列の相補配列(crDNA)の5’側の端の塩基からの番号を付す。
図7には、内因性DNAのHBB遺伝子上のターゲットサイトとしたS1サイト及びS2サイトにおけるPAM配列、ガイドRNA標的配列の相補配列(crDNA)、TALE認識配列の相補配列の位置、これに対応するファミリー遺伝子HBDとのアラインメントをまとめた概念図を示す。また、HBB遺伝子上のS1サイトの配列(図7の(b)の配列)を配列番号131に、HBB遺伝子上のS2サイトの配列(図7の(c)の配列)を配列番号132に、それぞれ示す。図7中、上記デアミナーゼに編集され得るターゲット塩基Cには、それぞれ、ガイドRNA標的配列の相補配列(crDNA)の5’側の端の塩基からの番号を付す。
図8には、内因性DNAのAPC遺伝子上のターゲットサイトとしたAPCサイトにおけるPAM配列、ガイドRNA標的配列の相補配列(crDNA)、TALE認識配列の相補配列の位置の概念図を示す。APC遺伝子上のAPCサイトの配列(図8の(a)の配列)を配列番号133に示す。図8中、上記デアミナーゼに編集され得るターゲット塩基Cには、それぞれ、ガイドRNA標的配列の相補配列(crDNA)の5’側の端の塩基からの番号を付す。
図9Aには、AS14サイトにおいて、TALEをTALE-AS14-2とした47-12-AIDについて、ガイドRNAをgRNA-IF-1とし、タイプI-Casタンパク質群発現プラスミドとしてTypeI-FのCasタンパク質群を発現するプラスミドを用いたとき(図6Aの(a)、図1Aの(b)の態様)の、標的(crDNA-IF-1)範囲内の各C(C17、18、26、32)におけるTの割合、並びに、TALEをTALE-AS5としたBE4-32-47及びBE4-135-63について、ガイドRNAをgRNA-IF-1とし、タイプI-Casタンパク質群発現プラスミドとしてTypeI-FのCasタンパク質群を発現するプラスミドを用いたとき(図6Aの(b)、図1Aの(a)の態様)の、標的(crDNA-IF-1)範囲内の各C(C17、18、26、32)におけるTの割合を示す。
図9Bには、AS14サイトにおいて、TALEをTALE-AS5としたABE8e-135-47について、ガイドRNAをgRNA-IF-1とし、タイプI-Casタンパク質群発現プラスミドとしてTypeI-FのCasタンパク質群を発現するプラスミドを用いたとき(図6Aの(c)、図1Aの(a)の態様)の、標的(crDNA-IF-1)範囲内の各A(A12、19、22、23)におけるGの割合を示す。
図9Cには、AS14サイトにおいて、TALEをTALE-AS14-2とした47-12-AIDについて、ガイドRNAをgRNA-IF-2とし、タイプI-Casタンパク質群発現プラスミドとしてTypeI-FのCasタンパク質群を発現するプラスミドを用いたとき(図6Bの(a)、図1Aの(b)の態様)の、標的(crDNA-IF-2)範囲内の各C(C20、26、27)におけるTの割合、並びに、TALEをTALE-AS14-3としたBE4-32-47及びBE4-135-63について、ガイドRNAをgRNA-IF-2とし、タイプI-Casタンパク質群発現プラスミドとしてTypeI-FのCasタンパク質群を発現するプラスミドを用いたとき(図6Bの(b)、図1Aの(a)の態様)の、標的(crDNA-IF-2)範囲内の各C(C20、26、27)におけるTの割合を示す。
図10には、S2サイトにおいて、TALEをTALE-S2とした47-104-AIDについて、ガイドRNAをgRNA-IF-7とし、タイプI-Casタンパク質群発現プラスミドとしてTypeI-FのCasタンパク質群を発現するプラスミドを用いたとき(図7の(a)、図1Aの(b)の態様)の、標的(crDNA-IF-7)範囲内の各C(C17、18、20、24、27、32)におけるTの割合を示す。
図11Aには、APCサイトにおいて、TALEをTALE-APC-R17とした47-12-AIDについて、ガイドRNAをgRNA-APC-F2とし、タイプI-Casタンパク質群発現プラスミドとしてTypeI-FのCasタンパク質群を発現するプラスミドを用いたとき(図8の(a)、図1Aの(b)の態様)の、標的(crDNA-APC-F2)範囲内の各C(C18、20、21、23、24、25、30、32)におけるTの割合を示す。
図11Bには、APCサイトにおいて、TALEをTALE-APC-R17とした47-12-AIDについて、ガイドRNAをgRNA-APC-F7-Cとし、タイプI-Casタンパク質群発現プラスミドとしてTypeI-FのCasタンパク質群を発現するプラスミドを用いたとき(図8の(b)、図1Bの(a)の態様)の、標的(crDNA-APC-F7-C)範囲内の各C(C1、5、6、7、15、19)におけるTの割合を示す。
図9A~図11Bに示したように、いずれのターゲットサイトにおいても、タイプI-Casタンパク質群が存在しない場合(w/o)はほとんど塩基編集が確認されなかった。一方、タイプI-Casタンパク質群の存在下では、全てのターゲットサイトで塩基編集が確認された。AC14サイトのガイドRNA:gRNA-IF-1における最大塩基編集効率(Tの割合又はGの割合)は29~33%(図9A)及び19%(図9B)であり、ガイドRNA:gRNA-IF-2では17~21%であった(図9C)。また、S2サイト及びAPCサイトにおける最大塩基編集効率は15%及び16%であった(図10、図11A)。さらに、APCサイトにおいて、ガイドRNA:gRNA-APC-F7-Cとして、PAM配列の位置をターゲット塩基とTALE認識配列との間にした場合でも塩基編集が確認され、最大塩基編集効率は15%であった(図11B)。
TALE-AIDでは、ガイドRNAの標的配列の相補配列の5’側の端から18番目~32番目に存在するCで塩基編集(Tへの置換)の効率が特に高くなったが、BE4-TALEでは、ガイドRNAの標的配列の相補配列の5’側の端から20番目~27番目に存在するCで塩基編集(Tへの置換)の効率が特に高くなった。また、TALE-デアミナーゼは、ターゲットであるCCR5遺伝子及びHBB遺伝子に対して塩基編集活性を示したが、相同性は高いが、ターゲットではないCCR2遺伝子及びHBD遺伝子に対しては、ほとんど塩基編集活性を示さなかった。したがって、サブタイプI-FのCRISPR-CasシステムとTALE-デアミナーゼとの共発現システムによれば、高い特異性で標的DNAの編集を行うことができるといえる。
<試験2> 内因性DNAにおける塩基編集効率-2
(サブタイプI-B CRISPR-Casシステム)
〔Cas8b2-SSUの共導入効果〕
タイプI-Casタンパク質群発現プラスミドとして、w/o:TypeI-BのCasタンパク質群を発現するプラスミド;SSU1:TypeI-BのCasタンパク質群を発現するプラスミド+NLS-Cas8b2-SSU1発現プラスミドの組み合わせ;又はSSU2:TypeI-BのCasタンパク質群を発現するプラスミド+NLS-Cas8b2-SSU2発現プラスミドの組み合わせを用いたとこと以外は上記(サブタイプI-F CRISPR-Casシステム)と同様にして、塩基編集効率(Tの割合)を取得した。結果を図12に示す。
図12の(a)には、S1サイトにおいて、TALEをTALE-S1とした47-12-AIDについて、ガイドRNAをgRNA-IB-1としたとき(図7の(b)、図1Aの(b)の態様)の、標的(crDNA-IB-1)範囲内の各C(C19、21、22、25、28、31、32)におけるTの割合を示す。図12の(b)には、S2サイトにおいて、TALEをTALE-S2とした47-104-AIDについて、ガイドRNAをgRNA-IB-2としたとき(図7の(c)、図1Aの(b)の態様)の、標的(crDNA-IB-2)範囲内の各C(C19、21、27、28、30)におけるTの割合を示す。
図12の(a)に示したように、S1サイトでは、既に塩基編集活性が高いため、NLS-Cas8b2-SSU1発現プラスミド及びNLS-Cas8b2-SSU2発現プラスミドの発現の追加による塩基編集活性の向上効果は大きくなかった。一方、図12の(b)に示したように、S2サイトでは、NLS-Cas8b2-SSU2発現プラスミドの追加によって、塩基編集活性の向上が確認された。これより、サブタイプI-BのCRISPR-Casシステム複合体とTALE-デアミナーゼとの共発現システムにおいては、Cas8b2-SSU2(SSU2)をさらに共発現させることにより、塩基編集活性をさらに向上することが可能であるといえ、これは、塩基編集活性の低いターゲットサイトにおいて特に有効であるといえる。
〔内因性DNAにおける塩基編集効率〕
タイプI-Casタンパク質群発現プラスミドとしてTypeI-BのCasタンパク質群を発現するプラスミドを用いたこと以外は上記(サブタイプI-F CRISPR-Casシステム)と同様にして、塩基編集効率(Tの割合)を取得した。なお、S2サイトにおいては、TypeI-Bの組み合わせに加えて、NLS-Cas8b2-SSU2発現プラスミドも共発現させた。結果を図13~図14に示す。
図13には、S1サイトにおいて、TALEをTALE-S1とした47-12-AIDについて、ガイドRNAをgRNA-IB-1とし、タイプI-Casタンパク質群発現プラスミドとしてTypeI-BのCasタンパク質群を発現するプラスミドを用いたとき(図7の(b)、図1Aの(b)の態様)の、標的(crDNA-IB-1)範囲内の各C(C18、19、21、22、25、28、31、32)におけるTの割合を示す。
図14には、S2サイトにおいて、TALEをTALE-S2とした47-104-AIDについて、ガイドRNAをgRNA-IB-2とし、タイプI-Casタンパク質群発現プラスミドとしてTypeI-BのCasタンパク質群を発現するプラスミド及びNLS-Cas8b2-SSU2発現プラスミドを用いたとき(図7の(c)、図1Aの(b)の態様)の、標的(crDNA-IB-2)範囲内の各C(C19、21、27、28、30)におけるTの割合を示す。
図13~図14に示したように、いずれのターゲットサイトにおいても、タイプI-Casタンパク質群が存在しない場合(w/o)はほとんど塩基編集が確認されなかった。一方、タイプI-Casタンパク質群の存在下では、どちらのターゲットサイトでも塩基編集が起きた。S1サイト及びS2サイトにおける最大塩基編集効率(Tの割合)は23%及び24%であった。また、TALE-デアミナーゼは、ターゲットであるHBB遺伝子に対して塩基編集活性を示したが、相同性は高いが、ターゲットではないHBD遺伝子に対しては、ほとんど塩基編集活性を示さなかった。したがって、サブタイプI-BのCRISPR-CasシステムとTALE-デアミナーゼとの共発現システムによれば、上記のサブタイプI-FのCRISPR-CasシステムとTALE-デアミナーゼとの共発現システムと同様に、高い特異性で標的DNAの編集を行うことができるといえる。
以上説明したように、本発明によれば、特異的かつ効率的に、核酸塩基変換酵素による標的DNAの編集を行うことができる方法、その方法を用いてゲノム編集された細胞を製造する方法、及びそれらに用いるDNA編集システムを提供することが可能となる。そのため、本発明は、高い編集効率と共に高い安全性が求められる遺伝子編集治療などの分野での利活用が期待される。
11…DNA結合ドメイン認識配列、12…スペーサー1、20…融合タンパク質、21…核酸塩基変換酵素、22…DNA結合ドメイン、30…タイプI-Casタンパク質群、31…Cas5タンパク質(Csy2タンパク質)、32…Cas6タンパク質(Csy4タンパク質)、33…Cas7タンパク質(Csy3タンパク質)、34…Cas8タンパク質(Csy1タンパク質)、40…ガイドRNA。

Claims (12)

  1. 標的DNAを編集する方法であり、
    (1)DNA結合ドメイン及び核酸塩基変換酵素を含む融合タンパク質、並びに、
    (2)ヌクレアーゼ活性の一部又は全部を喪失したタイプI-Casタンパク質群及びそのガイドRNAを含むタイプI-CRISPR-Casシステム
    を標的DNAに接触させ、前記核酸塩基変換酵素活性により前記標的DNAの標的部位の塩基を編集する工程を含み、
    前記DNA結合ドメインが認識するDNA結合ドメイン認識配列又はその相補配列は、前記標的部位の5’側又は3’側に7~31塩基の鎖長のスペーサー1を介して存在し、かつ、
    前記タイプI-CRISPR-CasシステムにおけるガイドRNAが認識するガイドRNA標的配列は、前記標的部位の相補塩基を含むように存在する、
    方法。
  2. 標的DNAが編集された細胞を製造する方法であり、
    (1)DNA結合ドメイン及び核酸塩基変換酵素を含む融合タンパク質、並びに、
    (2)ヌクレアーゼ活性の一部又は全部を喪失したタイプI-Casタンパク質群及びそのガイドRNAを含むタイプI-CRISPR-Casシステム
    を細胞に導入又は細胞内で発現させて標的DNAに接触させ、前記融合タンパク質の核酸塩基変換酵素活性により前記標的DNAの標的部位の塩基を編集する工程を含み、
    前記DNA結合ドメインが認識するDNA結合ドメイン認識配列又はその相補配列は、前記標的部位の5’側又は3’側に7~31塩基の鎖長のスペーサー1を介して存在し、かつ、
    前記タイプI-CRISPR-CasシステムにおけるガイドRNAが認識するガイドRNA標的配列は、前記標的部位の相補塩基を含むように存在する、
    方法。
  3. 前記融合タンパク質がさらに、前記DNA結合ドメインと前記核酸塩基変換酵素とを結合するリンカー1を含む、請求項1又は2に記載の方法。
  4. 前記融合タンパク質がさらに、C末側にリンカー2を介して結合された塩基除去修復インヒビターを含む、請求項1~3のうちのいずれか一項に記載の方法。
  5. 前記融合タンパク質におけるDNA結合ドメインがTALEである、請求項1~4のうちのいずれか一項に記載の方法。
  6. 前記融合タンパク質における核酸塩基変換酵素がデアミナーゼである、請求項1~5のうちのいずれか一項に記載の方法。
  7. 前記デアミナーゼが、APOBEC、PmCDA1、Anc689、及びTadAからなる群から選択される少なくとも1種である、請求項6に記載の方法。
  8. 請求項1~7のうちのいずれか一項に記載の方法に用いるためのDNA編集システムであり、
    (1)DNA結合ドメイン及び核酸塩基変換酵素を含む融合タンパク質、並びに、
    (2)ヌクレアーゼ活性の一部又は全部を喪失したタイプI-Casタンパク質群及びそのガイドRNAを含むタイプI-CRISPR-Casシステム
    を含む、DNA編集システム。
  9. 前記融合タンパク質がさらに、前記DNA結合ドメインと前記核酸塩基変換酵素とを結合するリンカー1を含む、請求項8に記載のDNA編集システム。
  10. 前記融合タンパク質がさらに、C末側にリンカー2を介して結合された塩基除去修復インヒビターを含む、請求項8又は9に記載のDNA編集システム。
  11. 前記融合タンパク質における核酸塩基変換酵素がデアミナーゼである、請求項8~10のうちのいずれか一項に記載の方法。
  12. 前記デアミナーゼが、APOBEC、PmCDA1、Anc689、及びTadAからなる群から選択される少なくとも1種である、請求項11に記載のDNA編集システム。
JP2022036476A 2022-03-09 2022-03-09 Dna編集システム、並びに、それを用いた標的dnaの編集方法及び標的dnaが編集された細胞の製造方法 Pending JP2023131616A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022036476A JP2023131616A (ja) 2022-03-09 2022-03-09 Dna編集システム、並びに、それを用いた標的dnaの編集方法及び標的dnaが編集された細胞の製造方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022036476A JP2023131616A (ja) 2022-03-09 2022-03-09 Dna編集システム、並びに、それを用いた標的dnaの編集方法及び標的dnaが編集された細胞の製造方法

Publications (1)

Publication Number Publication Date
JP2023131616A true JP2023131616A (ja) 2023-09-22

Family

ID=88065740

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022036476A Pending JP2023131616A (ja) 2022-03-09 2022-03-09 Dna編集システム、並びに、それを用いた標的dnaの編集方法及び標的dnaが編集された細胞の製造方法

Country Status (1)

Country Link
JP (1) JP2023131616A (ja)

Similar Documents

Publication Publication Date Title
US20240124898A1 (en) Method for producing dna-edited eukaryotic cell, and kit used in the same
WO2019120310A1 (en) Base editing system and method based on cpf1 protein
ES2835673T3 (es) Construcciones de ácido nucleico mejoradas para la expresión de genes eucariotas
CN109983124A (zh) 使用可编程dna结合蛋白增强靶向基因组修饰
CN113881652B (zh) 新型Cas酶和系统以及应用
KR20080003780A (ko) 부위-특이적 세린 리콤비나제 및 그의 이용 방법
JP6958917B2 (ja) 遺伝子ノックイン細胞の作製方法
EP4242237A1 (en) Foki nuclease domain variant
JP2023131616A (ja) Dna編集システム、並びに、それを用いた標的dnaの編集方法及び標的dnaが編集された細胞の製造方法
WO2021175288A1 (zh) 改进的胞嘧啶碱基编辑系统
WO2021251493A1 (ja) 卵白タンパク質遺伝子における目的タンパク質をコードする遺伝子がノックインされた家禽細胞またはその製造方法
WO2022050377A1 (ja) 標的dnaの編集方法、標的dnaが編集された細胞の製造方法、及びそれらに用いるdna編集システム
WO2024116373A1 (ja) Dnaを二本鎖切断するヌクレアーゼドメイン
WO2021171688A1 (ja) 遺伝子ノックイン方法、遺伝子ノックイン細胞作製方法、遺伝子ノックイン細胞、がん化リスク評価方法、がん細胞製造方法、及びこれらに用いるためのキット
JP2023038023A (ja) Dnaを二本鎖切断するヌクレアーゼドメイン
EA040859B1 (ru) Способ получения эукариотических клеток с отредактированной днк и набор, используемый в этом способе