前記の技術的課題は、本開示にて提供され、添付の特許請求の範囲にて特定されるような態様の提供により解決される。
従って、本発明は、タンパク質ライブラリーを作製する方法、特に、所期のタンパク質の複数の突然変異体を発現する細胞のパネルを作製する方法であって、各細胞当たり単一の遺伝子コピーから前記所期のタンパク質の複数の突然変異体のうち一つが発現されると共に、以下の工程を含む方法に関する。
a)細胞のゲノムに対して、前記所期のタンパク質をコードする遺伝子内の突然変異誘発標的部位又はその近傍に、二本鎖切断(double-strand break:DSB)又は一本鎖ニックを誘導する。ここで前記細胞のゲノムには、前記所期のタンパク質をコードする遺伝子が、単一のコピーとして含まれており、ここで前記所期のタンパク質をコードする遺伝子の前記単一のコピーは、前記突然変異誘発標的部位又はその近傍に、不活性化突然変異を含む。
b)好ましくは、(工程a)の)細胞に対して、前記誘導されたDSB又は一本鎖ニックの相同組換えによる修復のための、複数の異なるドナー核酸テンプレートのライブラリーを提供する。ここで前記ライブラリーの前記複数の異なるドナー核酸テンプレートは、前記突然変異誘発標的部位に対応する位置に、異なる突然変異を含み、相同標的化修復(homology directed repair:HDR)、特に相同組換えにより、前記不活性化突然変異を除去する。
c)前記不活性化突然変異が除去された細胞を選択及び/又は濃縮する。
d)工程c)で選択された細胞のパネルを、前記所期のタンパク質の複数の異なる突然変異体を発現する細胞のパネルとして提供する。ここで各細胞毎に、前記所期のタンパク質の前記異なる突然変異体のうちの一つが、単一の遺伝子コピーから発現される。
ゲノムDNA内にDSB又は一本鎖ニックが存在することで、非相同末端連結(non-homologous end joining:NHEJ)等の細胞内修復機構が引き起こされる。従って、工程b)の他でも、本発明の方法によって、所望のタンパク質の複数の異なる変異体が得られ得る。実際に、NHEJによる修復では、多種のランダムな欠失や挿入が導入され、ひいては所期のタンパク質の多様化が達成される。従って、本発明の一側面は、所期のタンパク質の複数の突然変異体を発現する細胞のパネルを作製する方法であって、各細胞当たり単一の遺伝子コピーから前記所期のタンパク質の複数の突然変異体のうち一つが発現されると共に、以下の工程を含む方法に関する。
i)細胞のゲノムに対して、前記所期のタンパク質をコードする遺伝子内の突然変異誘発標的部位又はその近傍に、二本鎖切断(double-strand break:DSB)又は一本鎖ニックを誘導する。ここで前記細胞のゲノムには、前記所期のタンパク質をコードする遺伝子が、単一のコピーとして含まれており、ここで前記所期のタンパク質をコードする遺伝子の前記単一のコピーは、前記突然変異誘発標的部位又はその近傍に、不活性化突然変異を含む。
(ii)前記不活性化突然変異が除去された細胞を、細胞DNA修復プロセスにより選択及び/又は濃縮する。
iii)工程c)で選択された細胞のパネルを、前記所期のタンパク質の複数の異なる突然変異体を発現する細胞のパネルとして提供する。ここで各細胞毎に、前記所期のタンパク質の前記異なる突然変異体のうちの一つが、単一の遺伝子コピーから発現される。
本発明の方法の工程a)に関して以下に提供される全ての記載及び定義が、上記の工程i)にも準用される。更に、本発明の方法の工程c)に関して以下に提供される全ての記載及び定義が、上記の工程ii)にも準用される。これに伴い、本発明の方法の工程d)に関して以下に提供される全ての記載及び定義が、上記の工程iii)にも準用される。
しかし、以下においてより詳細に説明するように、DSB又は一本鎖ニックが相同標的化修復(HDR)によって修復されれば、所望のタンパク質の多様化の程度を顕著に同化させることができる。従って、本発明の方法は、好ましくは工程b)を含むと共に、ここでHDR修復がドナー核酸テンプレートによって誘導される。
従って、本発明は、製造方法(即ち、所期のタンパク質の複数の突然変異体を発現する細胞のパネルを作製する方法)に関する。この方法では、突然変異誘発標的部位の近傍にDSB又は一本鎖ニック(好ましくはDSB)が誘導される(即ち導入される)。このDSB又は一本鎖ニックは、好ましくは相同標的化修復(HDR)、特に相同組換えにより修復される。工程(b)において複数の異なる核酸テンプレートを使用することで、前記所期のタンパク質の幾つかの異なる突然変異体を、一の工程で生成することが可能となり有利である。更に、所期のタンパク質が首尾よく改変された(特に突然変異された)細胞を容易に選択することができる。なぜなら、所望の突然変異の(好ましくはHDRによる)導入の際に、所期のタンパク質内の不活性化突然変異(例えばフレームシフト突然変異)が除去されるからである。従って、所期のタンパク質の突然変異が首尾よく生じた細胞のみが、活性な所期のタンパク質を発現することになり、惹いては容易に選択する(又は濃縮する)ことが可能となる。このタンパク質ライブラリー生成方法を用いることで、複数の異なる細胞、例えば哺乳類細胞内で発現される、所期のタンパク質の幾つかの変異体を調製することが可能となる。従って、本開示にて提供される方法によれば、各々異なる所期のタンパク質の複数の突然変異体を発現する細胞を含む細胞のパネル(即ち細胞ライブラリー)が調製される。特に、本開示にて提供される生成方法によれば、一細胞当たり単一の所期のタンパク質の突然変異体が発現される、細胞(例えば哺乳類細胞)のパネルが提供される。斯かる細胞のパネルは、特性が改善された所期のタンパク質の複数の突然変異体を選択及び/又は同定する有用なツールである。例えば、得られた細胞のパネルは、所期のタンパク質を単一のコピーから、及び任意により同一のプロモーターから発現する細胞との比較により、表現型分析等の下流分析のために使用される。従って、本発明は、タンパク質の多様化のための効率的且つ費用効率に優れた方法を提供する。このアプローチの容易さ、効率性、細胞コンテクスト性、及び突然変異の偏好性の不在は、タンパク質工学を促進する点で有利である。
更に、本発明の製造方法では、標的化された一本鎖ニック又はDSBと、対応するその(好ましくはHDRによる)修復との組合せによって、所期のタンパク質の多様性が、所望の程度のバイアスを以て導入される。これによって、生存細胞のコンテクストで所与のタンパク質内における一連のアミノ酸群の影響を連続的にスキャンするという、従来にない機会が提供されることになる。従って、本開示にて提供される手段及び方法によれば、特性が改善された新たなタンパク質変異体の同定が促進され、これによってホワイト・バイオテクノロジーによるアプローチの適用可能性が顕著に拡大される可能性がある。例えば、本開示にて提供される手段及び方法は、工業生産に使用できる新たな酵素変異体や、疾患の治療及び/又は予防に使用できる新たな抗体変異体の同定に繋がるかも知れない。以下に記載するように、本開示にて提供される手段及び方法によれば、成長因子の新規な変異体も得られる可能性がある。
本発明の製造方法の使用により、既存の技術を超える多数の利点が提供される。例えば、本発明の製造方法を用いることにより、単回のトランスフェクションにて、所期のタンパク質を迅速に多様化させることが可能となる。更に、得られた細胞のパネル内では、各細胞が単一のタンパク質変異体を含むので、選択されたタンパク質変異体の更なる分析及び処理が容易である。更に、トランスフェクトされた(例えばCRISPR)プラスミドが希釈により除外されると、得られた細胞はタンパク質変異体を安定に発現する。更に、突然変異誘発時に除去される不活性化突然変異を使用することにより、多様化を受けたタンパク質を発現する細胞を容易に同定して、親(即ち野生型)タンパク質を発現する細胞から分離することができる。また、本発明の製造方法は、導入される突然変異の性質の点でも、極めて大きな柔軟性を有する。例えば、少なくとも最大12個のクラスター化されたアミノ酸残基の列に対して、並行に飽和突然変異誘発を行うことが可能である。更に、本開示にて提供される製造方法は、実質的に突然変異のバイアスがなく、全ての可能な変異体を生成することができる。しかし、所望の場合には、ドナー核酸テンプレートの相同性の設計により、潜在的なバイアスを導入することも可能である。しかし、本開示にて提供される製造方法は、前記細胞のゲノム内に不所望の突然変異が生成されることがなく、極めて特異性が高い。例えば、所期のタンパク質内の重要な残基は変化せず維持される一方で、その周辺の残基は改変されるように、ドナー核酸テンプレートを容易に設計することが可能である。更に、本開示にて提供される製造方法を用いることで、生存細胞内で首尾よく発現される突然変異体を、直接選択(及び/又は濃縮)することが可能である。更に、本開示にて提供される製造方法に使用される試薬は、何れも費用効率に優れている。
本開示にて提供される製造方法の更なる利点としては、これにより得られる細胞のパネルに含まれる細胞が各々、所期のタンパク質の変異体をコードする遺伝子の単一のコピー(即ち一のアレル)のみを担持するという点が挙げられる。(従来技術の方法の場合のように)第二のコピーが存在すると、得られる細胞は、所期のタンパク質の2種以上の突然変異体を発現することになる。これは下流分析に顕著な影響を及ぼす。従って、単一の遺伝子コピーを用いることで、得られる細胞のパネルには確実に、所期のタンパク質の単一の突然変異体のみを発現する細胞のみが含まれることになり、有利である。
従って、本発明によれば、有利なことに、哺乳類細胞を用いた場合でも、一細胞当たり単一の変異体が発現された、極めて豊富に多様化されたタンパク質ライブラリーを、簡便且つ迅速に生成することが可能である。斯かる多様化は、好ましくはCRISPR/Cas9系及びHDR(特に相同組換え)を用いて達成される。本発明の製造方法は、例えば以下のように実現される。リーディングフレームシフト等の不活性化突然変異を、所期のタンパク質内の突然変異誘発の標的部位に、或いはその近傍に導入すればよい。この目的のためには、所期のタンパク質を単一のコピー数で、細胞内に、例えば哺乳類細胞内に、安定に形質転換すればよい。その後、例えばDSB又は一本鎖ニック(好ましくはDSB)を、突然変異誘発標的部位の近傍に、例えばCRISPR系を用いて導入すればよい。前記の一本鎖ニック又はDSBは、細胞修復機構により、好ましくは細胞HDR系を用いることにより修復すればよい。HDRを誘発するために特別に設計された、修復テンプレートとして機能するオリゴヌクレオチド(即ちドナー核酸テンプレート)は、2つの相同性アーム及び所望の多様化配列を含む。HDRによれば、有利なことに、所望の多様化が挿入されると共に、不活性化突然変異が除去され、例えばリーディングフレームが再生される。
例えば、本開示にて提供される製造方法によれば、前記所期のタンパク質の突然変異体として、直接的に選択可能な(即ち陽性選択可能な)突然変異体を調製することができる。直接選択可能なタンパク質の例としては、蛍光タンパク質が挙げられる。所期のタンパク質を直接選択することができれば、例えば蛍光が増加した突然変異体を選択(及び/又は濃縮)することにより、特性が改善された突然変異体を容易に選択(及び/又は濃縮)することができる。直接選択できないタンパク質(例えば非蛍光タンパク質)を加工する場合には、所期のタンパク質の下流側(即ちC末端側)にインフレームで、蛍光タンパク質をタグ化すればよい。この場合、HDR又はNHEJ(好ましくはHDR)により前記不活性化突然変異(例えばフレームシフト突然変異)を除去することによっても、蛍光タンパク質の発現を再生することができ、惹いては多様化されたタンパク質変異体の全てを蛍光選別法により収穫(即ち選択及び/又は濃縮)することが可能となる。
上述したように、本発明の製造方法によれば、所期のタンパク質の複数の突然変異体を発現する細胞のパネルを生成することが可能となる。具体的に、各細胞が単一の遺伝子コピーから個別の突然変異体を発現する、細胞のパネルを生成することが可能となる。即ち、前記細胞のパネルに含まれる細胞は各々、異なる所期のタンパク質の複数の突然変異体を発現する。
本発明の一側面によれば、本開示にて提供される製造方法は更に、工程a)に使用される細胞を生成する工程を含む。本開示にて提供される製造方法では、所期のタンパク質をコードする遺伝子(即ち所期の遺伝子)の単一のコピーは、内因性遺伝子のコピーであってもよい。しかし、本開示にて提供される製造方法では、所期のタンパク質をコードする遺伝子の単一のコピーは、外因性遺伝子のコピーである(即ち、使用される細胞内に天然では存在しない)ことが好ましい。もし、本開示にて提供される製造方法において、前記所期のタンパク質をコードする遺伝子の単一のコピーが外因性である場合、工程a)の細胞の生成は、前記所期のタンパク質をコードする遺伝子の単一のコピーを、細胞のゲノム内に導入することを含む。所期のタンパク質をコードする遺伝子の単一の外因性のコピーをゲノム内に導入する方法は、本技術分野で周知であり、例えば部位特異的相同組換え系が挙げられる。例えば、所期の遺伝子の単一のコピーの細胞への組み込みは、標準的な抗生物質による選択、Flp-In又はJump-in組換え、レンチウイルスによるトランスフェクション及び選択、或いは、Cas9標的化切断と、例えばAAVS1遺伝子座等の相同性ドメインを用いた組換えとにより達成することができる。
本発明の一側面によれば、工程a)に使用される細胞の生成は、前記所期のタンパク質をコードする遺伝子の単一のコピー内に、前記の不活性化突然変異を導入することを含む。前記の不活性化突然変異は、例えばフレームシフト突然変異であってもよい。斯かるフレームシフト突然変異は、例えば、前記所期の遺伝子のコーディングリーディングフレーム内で、1、2、3又は4塩基の付加又は除去を行うことにより導入できる。即ち、斯かるフレームシフトは、フレームシフトを生じさせるのに必要な欠失よりも大きな欠失により、例えば幾つかのアミノ酸をコードするヌクレオチドの欠失により生じさせてもよい。このように、より大きな領域を欠失させると、修復テンプレートに対する相同性が増加し、惹いては組換え効率が向上しうるため、有利な場合がある。例えば、より大きな欠失(例えば標的化された全アミノ酸をコードするヌクレオチドプラス1~2塩基の除去)によりフレームシフトを生じさせて所期の遺伝子を不活性化すると、DSBの誘導直後に、染色体の自由端にドナー核酸テンプレートとの直接の相同部位を共有させることができる。相同組換え反応を損ないうる中間的な原DNAも生じない。しかし、選択(又は導入)されたPAM部位の下流の4塩基を除去してフレームシフトを作成することにより、1アミノ酸を除去してフレームシフトを生じさせることもできる。前記所期のタンパク質をコードする単一の遺伝子が外因性である場合、前記不活性化突然変異の導入は、前記所期のタンパク質をコードする遺伝子の単一コピーの細胞ゲノムへの導入前に行ってもよく、当該導入後に行ってもよい。原則として、本技術分野で公知の任意の突然変異誘発方法を用いて、前記所期の遺伝子を細胞内に組み込む前に、当該遺伝子内に不活性化突然変異を導入することができる。斯かる突然変異誘発方法の非限定的な例としては、標的化された制限酵素消化及び連結や、PCRを用いた部位特異的突然変異誘発方法が挙げられる(Quick Change Kit, Stratagene; Kunkel, 1985, Proc Natl Acad Sci U S A. 82(2): 488-492)。本発明では、(不活性化突然変異を有さない)所期の遺伝子のコピーを細胞ゲノム内に導入した後で、不活性化突然変異を導入してもよい。これは本技術分野で公知の遺伝子工学的手法により達成することができる。斯かる遺伝子工学的手法としては、例えばフレームシフトを含む適切なドナー核酸テンプレートを用いた、CRISPR/Cas媒介遺伝子編集が挙げられる。斯かる方法は本技術分野で周知であり、例えばRan, 2013, Nature Protocols 8 (11): 2281-2308等に記載されている。
前記所期のタンパク質をコードする遺伝子の単一のコピーが内因性である場合、工程a)に使用される細胞の生成は、例えば前記細胞のゲノム内の所期のタンパク質をコードする遺伝子内に、部位特異的相同組換え系を用いて、不活性化突然変異を導入することを含んでいてもよい。部位特異的相同組換え系、例えばCRISPR/Cas9系は、本技術分野で周知であり、例えばRan, 2013, Nature Protocols 8 (11): 2281-2308等に記載されている。
本開示にて提供される製造方法によれば、所期のタンパク質の複数の突然変異体を発現する細胞のパネルであって、各細胞当たり単一の遺伝子コピーから、所期のタンパク質の複数の突然変異体のうち一つが発現される、細胞のパネルが製造される。即ち、本開示にて提供される製造方法の工程a)では、所期のタンパク質をコードする遺伝子が、細胞内に単一のコピーとして存在する。従って、工程a)の細胞の生成は、所期のタンパク質をコードする遺伝子が一細胞当たり単一コピーのみとなるよう、所期のタンパク質をコードする遺伝子の他のコピーの不活性化(好ましくは欠失)を含んでいてもよい。多くの細胞培養系及び植物では、3つ以上のアレルが存在する。従って、工程a)に使用される細胞を生成するには、最終的に単一のコピーとするために、(1つを除く)他の全てのアレルを不活性化(好ましくは欠失)させなければならない。従って、もし所期のタンパク質をコードする遺伝子が、ゲノム内に2コピー以上存在する内因性遺伝子である場合は、工程a)の細胞の生成は、前記所期のタンパク質をコードする遺伝子を一細胞当たり単一コピーとするために、前記所期のタンパク質をコードする遺伝子の内因性コピーの不活性化(好ましくは欠失)を含んでいてもよい。特定の遺伝子のコピー(即ち特定のアレル)の不活性化又は欠失の方法は、本技術分野では周知である。例えば、CRISPR/Cas9系を用いた遺伝子の一コピーの欠失は、Ran, 2013, Nature Protocols 8 (11): 2281-2308に記載されている。或いは、所期の遺伝子を単一のコピーのみ含む細胞は、例えば国際公開第2013/079670A1号に記載された単数体細胞培養等を用いて得ることができる。
本開示にて提供される方法の工程a)は、DSB又は一本鎖ニック(好ましくはDSB)を、細胞のゲノム内に導入することを含む。前記のDSB又は一本鎖ニックはそれぞれ、部位特異的ヌクレアーゼ又は部位特異的ニッカーゼを用いて実施することが好ましい。従って、工程a)の細胞の生成は、部位特異的ヌクレアーゼ又は部位特異的ニッカーゼをコードする核酸配列を細胞内に導入することを含んでいてもよい。更に、工程a)の細胞の生成は更に、部位特異的ヌクレアーゼ又は部位特異的ニッカーゼのための対応する認識部位を、所期の遺伝子の単一のコピー内に含んでいてもよい。
例えば、部位特異的ヌクレアーゼがCas9又はCpf1である場合、或いは部位特異的ニッカーゼがCas9である場合、前記認識配列は開裂部位の直ぐ下流にプロトスペーサー隣接モチーフ(protospacer-adjacent motif:PAM)を含むことが好ましい。種々のCRISPRヌクレアーゼ及びその変異体のPAM標的配列(例えばSpCas9の場合は5’-NGG、SaCas9の場合は5’-NNGRRT、Cpf1の場合は5’-TTN)は、哺乳類ゲノム内に豊富に存在する。従って、本開示にて提供される方法を用いれば、PAM配列を導入しなくとも、殆どの遺伝子を標的化することができる。しかし、所望の開裂部位の直ぐ下流にPAM配列が存在しない場合には、PAM配列(例えばSpCas9の場合は5’-NGG、SaCas9の場合は5’-NNGRRT、Cpf1の場合は5’-TTN)を所期のタンパク質内に、所望の開裂部位の下流に導入してもよい。従って、使用される部位特異的ヌクレアーゼ又はニッカーゼに応じて、もし所期の遺伝子の所望の位置に存在しない場合には、前記部位特異的ヌクレアーゼ又はニッカーゼによる開裂のための認識部位(例えばCas9又はCpf1を使用する場合にはPAM配列、或いはジンクフィンガーヌクレアーゼ、転写アクティベーター様エフェクターヌクレアーゼ又はmegaTALエンドヌクレアーゼの特異的認識部位)を、所期の遺伝子内に、フレームシフトと共に形成してもよい。
工程a)の細胞の生成は更に、前記の部位特異的ヌクレアーゼ又は部位特異的ニッカーゼを、前記認識部位に対して標的化する手段を、細胞内に導入することを含んでいてもよい。例えばガイドRNA、又は前記ガイドRNAをコードするポリヌクレオチドを、工程a)の細胞に導入してもよい。ガイドRNAは、小型合成キメラtracr/crRNA(「単一ガイドRNA」(single-guide RNA)又はsgRNA)であってもよい。或いは、ガイドRNAは、2つの小型合成tracr/crRNA(「二重ガイドRNA」(dual guide RNA)又はdgRNA)であってもよい。一部の部位特異的ヌクレアーゼ(例えばCpf1)の場合、小型合成crRNAがガイドRNAとして機能しうる。本開示にて提供される方法の一側面によれば、Cas9は認識部位に対して、sgRNA又はdgRNAを介して標的化される。Cpf1は認識部位に対してcrRNAを介して標的化することができる。
従って、工程a)の細胞の生成は、細胞に対して外部から、所期のタンパク質をコードするヌクレオチド配列を、単一のコピーとして導入することを含んでいてもよい。例えば、所期のタンパク質をコードするヌクレオチド配列により、細胞を形質転換、トランスフェクト、又は形質導入すればよく、その結果として所期のタンパク質をコードする遺伝子の単一のコピーが発現されることになる。細胞のトランスフェクション、形質転換、又は形質導入のための手段及び方法は、本技術分野では周知であるが、例としてはリポソーム媒介トランスフェクション、Ca2+-リン酸媒介トランスフェクション、ウイルスベクター媒介送達(例えばGreen, Sambrook, 2012, Molecular Cloning. A laboratory manual. Cold Spring Harbor Laboratory Pressを参照)。得られた細胞は、所期のタンパク質を安定に発現することが好ましい。上述したように、工程a)の細胞の生成は更に、部位特異的ヌクレアーゼ又はニッカーゼ、或いは、部位特異的ヌクレアーゼ又はニッカーゼをコードするポリヌクレオチドを、例えばトランスフェクション、形質転換又は形質導入により、細胞内に導入することを含んでいてもよい。更に、工程a)の細胞の生成は更に、ガイドRNA、或いはガイドRNAをコードするポリヌクレオチドを、例えばトランスフェクション、形質転換又は形質導入により、細胞内に導入することを含んでいてもよい。最後に、工程a)の細胞の生成は、認識部位(例えばPAM配列)を、部位特異的ヌクレアーゼ又はニッカーゼの所望の開裂部位の下流に導入することを含んでいてもよい。
或いは、工程a)では、既に所期のタンパク質を(対応する遺伝子の単一のコピーから)発現する細胞を用いてもよい。斯かる所期のタンパク質は、既に不活性化(例えばフレームシフト)突然変異及び/又は認識部位(例えばPAM配列)を、所望の開裂部位の下流に含んでいてもよい。前記の細胞は、既に部位特異的ヌクレアーゼ又はニッカーゼ、或いは前記部位特異的ヌクレアーゼ又はニッカーゼをコードするポリヌクレオチドを含んでいてもよい。また、前記の細胞は、既にガイドRNA、或いは前記ガイドRNAをコードするポリヌクレオチドを含んでいてもよい。
「所期のタンパク質をコードする遺伝子内の突然変異誘発標的部位」(target site for mutagenesis in the gene encoding for the protein of interest)とは、a)の細胞内の所期のタンパク質をコードする遺伝子(即ち所期の遺伝子)の単一コピーの核酸配列内における位置であって、前記所期のタンパク質の突然変異体を生成するための多様化/突然変異誘発の対象として想定された位置に対応する位置である。従って、突然変異誘発標的部位は、原則として、突然変異を導入すべき所期の遺伝子のコーディング配列内における、任意の特定の位置とすることができる。例えば、所期のタンパク質内の特定のアミノ酸を突然変異させる場合には、突然変異誘発標的部位は、突然変異させるべきアミノ酸をコードする3つのヌクレオチドからなるトリプレットとすればよい。幾つかのアミノ酸を突然変異させる場合には、突然変異誘発の標的部位は、斯かる複数のアミノ酸をコードするヌクレオチド配列とすればよい。
誘導されたDSB又は一本鎖ニックの位置は、所期のタンパク質をコードする遺伝子の単一のコピー内の所定の突然変異誘発標的部位に(直接)存在するか、又はその近傍に存在する。本開示において「突然変異誘発標的部位の近傍」(close proximity to the target site for mutagenesis)とは、以下の様に定義される。例えば、フレームシフトがアミノ酸の欠失及び/又は導入(例えば欠失)によって導入された場合、DSB又は一本鎖ニックは、例えば前記欠失及び/又は導入の上流又は下流1~100bpの位置に存在する。
本発明の方法の工程a)は、DSB又は一本鎖ニック(single-strand nick)(別称一本鎖切断(single-strand break))の誘導(即ち導入)を含み、或いは斯かる誘導からなる。前記のDSB又は一本鎖ニックは、「細胞のゲノム内に」導入される。即ち、DSB又は一本鎖ニックは、細胞ゲノムDNA内に誘導される。前記のゲノムDNAは、例えば内因性ゲノムDNAであってもよい。しかし、前記ゲノムDNAは、例えば安定なトランスフェクション、形質転換、又は形質導入により、ゲノムDNAに対して挿入されたプラスミドに由来するものであってもよい。
本技術分野で公知のように、DSBは、DNA二重螺旋の両DNA鎖の中断である。DSBは、平滑断端(即ち両鎖が同一の位置で切断された端)であってもよく、粘着末端(即ち両鎖が異なる位置で切断され、短い一本鎖の相補性配列がDSBの両端に形成された端)であってもよい。本技術分野では一本鎖ニック(single-strand nick)(又は一本鎖切断(single-strand break))としても知られているのは、DNA二重螺旋の一方のDNA鎖のみの中断である。「中断」(interruption)とは、DSBに関しては、両鎖の2つのヌクレオチド間のホスホジエステル結合の切断を意味し、一本鎖ニックに関しては、二重螺旋の2つの鎖のうち一方のみのホスホジエステル結合の切断を意味する。好ましくは、DSBは、工程a)の細胞のゲノムに誘導(即ち導入)される。
本発明との関連において、前記のDSB又は一本鎖ニックは、前記突然変異誘発標的部位から、例えば120塩基対未満、好ましくは30塩基対未満、又は最も好ましくは10塩基対未満の距離に誘導することができる。同様に、前記不活性化突然変異は、前記突然変異誘発標的部位から120塩基対未満、好ましくは30塩基対未満、又は最も好ましくは10塩基対未満の距離とすることができる。従って、前記不活性化突然変異(例えばフレームシフト)と前記のDSB又は一本鎖切断との距離は、例えば0~120塩基対(これは0~40アミノ酸に相当する)とすることができる。
前記のDSB又は一本鎖ニックは、原則として、部位特異的DSB又は部位特異的一本鎖ニックを生成するための本技術分野で公知の任意の方法により達成することができる。DSBは、部位特異的ヌクレアーゼ(別名「配列特異的ヌクレアーゼ」)により誘導(即ち導入)されることが好ましく、工程a)の所期のタンパク質をコードする遺伝子の不活性化された単一のコピーは、前記部位特異的ヌクレアーゼのための対応する認識部位を含むことが好ましい。同様に、一本鎖ニックは、部位特異的ニッカーゼ(別名「配列特異的ニッカーゼ」)により導入されることが好ましく、工程a)の所期のタンパク質をコードする遺伝子の不活性化された単一のコピーは、前記部位特異的ニッカーゼのための対応する認識部位を含むことが好ましい。従って、本発明の工程a)に使用される細胞は、部位特異的ヌクレアーゼ若しくは部位特異的ニッカーゼ、又は、部位特異的ヌクレアーゼ若しくは部位特異的ニッカーゼをコードするポリヌクレオチドを含んでいてもよい。本発明の一側面によれば、工程a)の細胞のゲノムは、使用される部位特異的ヌクレアーゼ又は部位特異的ニッカーゼのための更なる認識部位を含んでいなくともよい。これにより、細胞のゲノムDNAに対する更なる修飾を回避できるという利点が得られる。前記の部位特異的ヌクレアーゼ又は部位特異的ニッカーゼをコードするポリヌクレオチドは、工程a)の細胞に含まれるベクター(例えばプラスミドベクター)にコードされていてもよく、或いは、前記細胞のゲノムに安定に組み込まれていてもよい。細胞を(プラスミド)ベクターで一過的に形質転換若しくはトランスフェクトし、又は、ポリヌクレオチドを細胞のゲノム内に安定に組み込む手段及び方法は、本技術分野で公知である。プラスミドの一過性トランスフェクションは、DNAのリン酸カルシウム沈殿又はリポソーム媒介性トランスフェクションを用いて簡便に達成することができる。斯かる技術を実施するための指針は、Green, Sambrook, 2012, Molecular Cloning. A laboratory manual. Cold Spring Harbor Laboratory Pressにより提供される。リン酸カルシウムトランスフェクションは、例えばKingston, 2003, Curr Protoc Cell Biol. Chapter 20: Unit 20.3に記載されている。DEAE-デキストランを用いたトランスフェクションは、例えばGulick, 2003, Curr Protoc Cell Biol. Chapter 20: Unit 20.4Tに記載されている。電気穿孔法によるトランスフェクションは、例えばPotter, 2011, Curr Protoc Cell Biol. Chapter 20: Unit 20.5に記載されている。陽イオン性脂質試薬を用いた培養真核細胞のトランスフェクションは、例えばHawley-Nelson, 2003, Curr Protoc Cell Biol. Chapter 20: Unit 20.6に記載されている。前記の部位特異的ヌクレアーゼ又は部位特異的ニッカーゼをコードするポリヌクレオチドは、とりわけ、使用される細胞内で活性な恒常的(即ち恒常的に活性な)プロモーターに作動式に融合されていてもよい。即ち、部位特異的ヌクレアーゼ又はニッカーゼは、恒常的(即ち恒常的に活性な)プロモーターの制御下で発現されてもよい。本技術分野で公知の恒常的プロモーター系の非限定的な例としては、CMV、ユビキチンプロモーター、及びCAGプロモーターが挙げられる。例えば、一側面によれば、前記の部位特異的ヌクレアーゼ又はニッカーゼは、CMVプロモーターの制御下で発現される。或いは、前記の部位特異的ヌクレアーゼ又はニッカーゼは、誘導性プロモーターの制御下で発現されてもよい。即ち、前記の部位特異的ヌクレアーゼ又はニッカーゼをコードするポリヌクレオチドは、誘導性プロモーターに作動式に融合されてもよい。誘導性プロモーター系の非限定的な例は本技術分野で公知であり、例えばTetオン/オフ系、ヒートショックプロモーター、及び光誘導性プロモーターが挙げられる。誘導性プロモーター系を使用すると、前記の部位特異的ヌクレアーゼ又は部位特異的ニッカーゼの発現が、惹いては、DSB又は一本鎖ニックの誘導が、適時に制御できるという利点が得られる。例えば、斯かる誘導可能な系によれば、DSB又は一本鎖ニックが導入されるのに十分な時間の経過後に、発現を停止することが可能となる。即ち、発現は、例えば24~48時間経過後に停止されてもよい。誘導性発現系によれば、前記の部位特異的ヌクレアーゼ又は部位特異的ニッカーゼの発現を、所定の時点で開始することも可能となる。これは、前記の部位特異的ヌクレアーゼ又はニッカーゼが、使用される細胞内で安定に発現される場合に有利である。
好ましくは、前記の部位特異的ヌクレアーゼ又は部位特異的ニッカーゼは、工程a)の細胞に含まれるプラスミドから発現される。このプラスミドは、細胞から除去されてもよい。プラスミドの除去は、例えば、プラスミドを希釈除去(diluting out)することにより達成できる。希釈除去(diluting out)とは、トランスフェクトされたヌクレアーゼ/ニッカーゼをコードするプラスミドがエピソーム性であり、哺乳類細胞において増幅されないことにより、その後の細胞分裂周期において、新たに生成された細胞がこれらのプラスミドの全てを徐々に消失することを意味する。しかし、上述したように、工程a)の細胞は、前記の部位特異的ヌクレアーゼ又は部位特異的ニッカーゼを安定に発現してもよい。
本発明の方法に使用される部位特異的ヌクレアーゼは、公知の何れの部位特異的ヌクレアーゼであってもよい。具体的に、「部位特異的ヌクレアーゼ」(site-specific nuclease)(又は「配列特異的ヌクレアーゼ」(sequence-specific nuclease))という語は、DNA二本鎖にDSBを導入するべく、DNA二本鎖の両鎖を所定の標的部位で切断可能な任意の酵素を意味する。同様に、本発明の方法に使用される部位特異的ニッカーゼは、公知の何れの部位特異的ニッカーゼであってもよい。具体的に、「部位特異的ニッカーゼ」(site-specific nickase)(又は「配列特異的ニッカーゼ」(sequence-specific nickase))という語は、DNA二本鎖に一本鎖ニックを導入するべく、DNA二本鎖の一方の鎖を所定の標的部位で切断可能な酵素を意味する。
本発明では、ジンクフィンガーヌクレアーゼ(zinc finger nucleases:ZFN)又は転写アクティベーター様エフェクターヌクレアーゼ(transcription activator-like effector nucleases:TALEN)を、それぞれ部位特異的ヌクレアーゼ又は部位特異的ニッカーゼとして使用してもよい。なぜなら、これらの分子は、従来からHDR媒介性ゲノム編集に使用されているからである(Li, 2011, Nature 475: 217-221; Bedell, 2012, Nature 491: 114-118; Genovese, 2014, Nature 510: 235-240)。本発明において有用な他の部位特異的ヌクレアーゼとしてはmegaTALエンドヌクレアーゼが挙げられる。これは高い標的特異性を有し、オフ-標的開裂を最小化できることから、遺伝子編集に特に適している。例えばBoissel, 2014, Nucleic Acids Res. 42(4): 2591-2601を参照。しかし、クラスター化規則的間隔形成短小回文配列リピート(clustered regularly interspaced short palindromic repeat:CRISPR)関連(Cas)エフェクタータンパク質、例えばCas9やCpf1によれば、遥かに簡単で汎用性の高いゲノム編集法が提供される。従って、本発明では、前記の部位特異的ヌクレアーゼ又はニッカーゼがCas9であるか、部位特異的ヌクレアーゼがCpf1であることが好ましい。最も好ましくは、Cas9ヌクレアーゼ(別名「CRISPR/Cas9ヌクレアーゼ」)を、本発明の製造方法における部位特異的ヌクレアーゼ又は部位特異的ニッカーゼとして使用することである。
ZFNはジンクフィンガーDNA結合ドメインを含む。これは各標的遺伝子及びFokIヌクレアーゼに合わせて設計すべきである。同様に、TALENはDNA結合ドメインを含む。これは各標的遺伝子及びFokIヌクレアーゼに合わせて設計すべきである。FokIヌクレアーゼは、ジンクフィンガーDNA結合ドメイン又はDNA結合ドメインと結合すると、所定の標的部位においてDNAに一本鎖ニック又は二本鎖切断を導入する活性を有する。実際に、ZFN及びTALENは、所定の標的側のDNAに一本鎖ニックを導入できることから、それぞれジンクフィンガーニッカーゼ(ZFニッカーゼ)及び転写アクティベーター様エフェクターニッカーゼ(TALEニッカーゼ)と呼ばれる場合が多い。従って、本発明では上記のように、ZFN又はTALENを部位特異的ヌクレアーゼ又は部位特異的ニッカーゼとして使用してもよい。Cas9ヌクレアーゼは主にDSBを誘導する。しかし、タンパク質のヌクレアーゼ機能をニック形成機能へと変更した改変Cas9ヌクレアーゼも報告されている。換言すれば、二本鎖標的DNAの両鎖を切断する天然Cas9ヌクレアーゼを、二本鎖の一方のみを切断する(即ちニック形成する)ニッカーゼへと改変することができる。幾つかのCas9ニッカーゼは本技術分野で公知であり、例えばTsai, 2016, Nature Reviews Genetics 17.5: 300-312に記載されている。部位特異的ニッカーゼを得るためにCas9タンパク質を修飾する手段及び方法は、本技術分野で周知であるが、例えばヌクレアーゼドメインの一つを不活性にするアミノ酸置換をCas9に導入することを含む。より具体的には、Cong, 2013, Science, 339: 819-823に示すように、例えば化膿連鎖球菌(Streptococcus pyogenes)Cas9の位置10のアスパラギン酸をアラニンに置換することができる。
ニック形成機能を有する改変Cas9タンパク質を用いることで、ゲノム内に導入されたDNA損傷が非相同末端連結ではなく、相同組換えにより修復される可能性が高まるという利点がある。従って、本発明の方法では、部位特異的ヌクレアーゼ又は部位特異的ニッカーゼとしてCas9を使用してもよい。本開示にて提供される方法では、部位特異的ヌクレアーゼとしてCpf1を使用してもよい。
Foklヌクレアーゼのヌクレオチド配列及びアミノ酸配列は、本技術分野では周知である。Foklヌクレアーゼのアミノ酸配列は、本開示では配列番号19として示される。好ましくは、本開示で使用される部位特異的ヌクレアーゼとして使用されるFoklヌクレアーゼは、部位特異的ヌクレアーゼ活性を有すると共に、配列番号19のアミノ酸配列に対して少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、更に好ましくは少なくとも95%、更に好ましくは少なくとも98%、更に好ましくは少なくとも99%、最も好ましくは100%の配列同一性 を有するアミノ酸配列を含む。
部位特異的ヌクレアーゼ活性は、標的化された遺伝子配列を含むプラスミド又は直鎖dsDNAを用いて、インビトロ(in vitro)で試験することができる。標的化されたDNAを部位特異的ヌクレアーゼと混合し、1時間消化させ、開裂の成否をゲル電気泳動で可視化する。
本開示にて提供される方法において、Foklヌクレアーゼを部位特異的ニッカーゼとして用いる場合には、斯かるFoklヌクレアーゼは部位特異的ニッカーゼ活性を有すると共に、配列番号19に対して少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、更に好ましくは少なくとも95%、更に好ましくは少なくとも98%、更に好ましくは少なくとも99%、最も好ましくは100%の配列同一性を有するアミノ酸配列をふくむことが好ましい。
部位特異的ニッカーゼ活性を試験するための方法は、本技術分野では周知であり、例えばMcConnell, 2009, Proceedings of the National Academy of Sciences of the United States of America. 106(13): 5099-5104に記載されている。要すれば、ニック形成部位の上流及び下流を200bpで挟んだニッカーゼアッセイ標的断片をPCRで生成する。50mM トリス(pH7.5)、100mM NaCl、10mM MgCl2、及び1mM DTTを含む10μLの反応液内で、ニック形成反応を37℃で1時間進行させる。消化後、2μLの5×停止溶液[0.1M トリス・HCl(pH7.5)、0.25M EDTA、5% SDS]を加え、脱イオン化ホルムアミド、0.1%キシレンシアノール、及び0.1%ブロモフェノールブルーと共に、試料を95℃で5分間変性させ、急速冷却した後、6%ポリアクリルアミド変性ゲルを用いた電気泳動で分離する。ゲルを乾燥し、リン酸画像化法(phosphorimaging)により分析する。
メガヌクレアーゼとTALエフェクターとの融合体であるmegaTALエンドヌクレアーゼは、高い活性及び特異性を有する新たなクラスのDNA標的化エンドヌクレアーゼである。MegaTALエンドヌクレアーゼ のヌクレオチド配列及びアミノ酸配列は、本技術分野では周知であり、例えばBoissel, 2014, Nucleic Acids Res. 42(4): 2591-2601に示されている。本開示において部位特異的ヌクレアーゼとして使用されるmegaTALエンドヌクレアーゼは、部位特異的ヌクレアーゼ活性を有すると共に、配列番号20のアミノ酸配列に対して少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、更に好ましくは少なくとも95%、更に好ましくは少なくとも98%、更に好ましくは少なくとも99%、最も好ましくは100%の配列同一性を有するアミノ酸配列を含むことが好ましい。部位特異的ヌクレアーゼ活性は、上記の手順によりインビトロ(in vitro)で試験することができる。
Cfp1ヌクレアーゼのヌクレオチド配列及びアミノ酸配列は、本技術分野で周知であり、例えばhttp://www.ncbi.nlm.nih.gov/protein/U2UMQ6.1又はhttp://www.addgene.org/browse/sequence/124373/に示されている。AsCpf1及びLbCpf1のアミノ酸配列を、それぞれ本開示の配列番号21及び22に示す。本発明において使用されるCpf1ヌクレアーゼは、例えば、部位特異的ヌクレアーゼ活性を有すると共に、配列番号21又は22のアミノ酸配列に対して、少なくとも80%、好ましくは、少なくとも85%、より好ましくは少なくとも90%、更に好ましくは少なくとも95%、更に好ましくは少なくとも98%、更に好ましくは少なくとも99%、最も好ましくは100%の同一性を有するアミノ酸配列を含むことが好ましい。部位特異的ヌクレアーゼ活性は、上記の手順によりインビトロ(in vitro)で試験することができる。
Cas9ヌクレアーゼは、CRISPR/Cas9ファミリーの酵素である。Cas9ヌクレアーゼの非限定的な例は、本技術分野では公知である。本発明では、DSBを誘導するのに、任意の(DSB誘導性)Cas9ヌクレアーゼを使用することができる。同様に、一本鎖ニックを誘導するのに、任意の(一本鎖切断誘導性)Cas9ヌクレアーゼを使用することができる。本開示で使用されるCas9ヌクレアーゼは、細菌種に由来することが好ましい。本開示で使用できるCas9ヌクレアーゼの非限定的な例としては、化膿連鎖球菌(Streptococcus pyogenes)由来のSpCas9ヌクレアーゼ、ストレプトコッカス・サーモフィルス(Streptococcus thermophilus)由来のSt1Cas9ヌクレアーゼ、及び、黄色ブドウ球菌(Staphylococcus aureus)由来のSaCas9ヌクレアーゼが挙げられる。これらのタンパク質のアミノ酸配列は、本技術分野で公知であり、例えばhttp://www.ncbi.nlm.nih.gov/protein/500000239?report=genbank&log$=protalign&blast_rank=1&RID=T6UUUEV901R又はhttp://www.ncbi.nlm.nih.gov/protein/J7RUA5.1に示されている。SpCas9、St1Cas9、及びSaCas9のアミノ酸配列は、それぞれ本開示の配列番号23、24、及び25として提供される。本開示で使用されるCas9ヌクレアーゼは、部位特異的ヌクレアーゼ活性を有すると共に、任意の既知のCas9ヌクレアーゼのアミノ酸配列、例えばそれぞれ配列番号23、24、又は25に示される、SpCas9、St1Cas9、又はSaCas9のアミノ酸配列に対して、少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、更に好ましくは少なくとも95%、更に好ましくは少なくとも98%、より好ましくは少なくとも99%、最も好ましくは100%の配列同一性を有するアミノ酸配列を含む。部位特異的ヌクレアーゼ活性は、上記の手順によりインビトロ(in vitro)で試験することができる。本開示にて提供される方法において、部位特異的ニッカーゼとしてCas9ヌクレアーゼを使用する場合、斯かるCas9ヌクレアーゼは、部位特異的ニッカーゼ活性を有すると共に、任意の既知のCas9ヌクレアーゼのアミノ酸配列、例えばSpCas9、St1Cas9、又はSaCas9のアミノ酸配列に対して、少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、更に好ましくは少なくとも95%、更に好ましくは少なくとも98%、より好ましくは少なくとも99%、最も好ましくは100%の配列同一性を有するアミノ酸配列を含むことが好ましい。部位特異的ニッカーゼ活性は、上記の手順によりインビトロ(in vitro)で試験することができる。
従って、本発明において、部位特異的ヌクレアーゼは、例えばCas9ヌクレアーゼ、Cpf1ヌクレアーゼ、ZFN、TALEN、及びmegaTALエンドヌクレアーゼからなる群より選択される。Cas9をヌクレアーゼ又はニッカーゼとして使用することで、標的特異性を規定する単一の短い合成キメラtracr/crRNA(「単一ガイドRNA」(single-guide RNA)、sgRNA)又は二つの短い合成tracr/crRNA(「二重ガイドRNA」(dual-guide RNA)、dgRNA)との組合せで、Cas9タンパク質を発現させればよいという利点が得られる。同様に、ヌクレアーゼとしてCpf1として使用することで、標的特異性を規定する単一の短い合成crRNAとの組合せで、Cpf1タンパク質を発現させればよいという利点が得られる。従って、部位特異的ヌクレアーゼ又はニッカーゼとしてCas9又はCpf1を使用することにより、標的特異的な一本鎖若しくは二本鎖切断(Cas9)又は二本鎖切断(Cpf1)を生成するための構成を、大幅に簡素化することが可能となる。従って、本発明においては、部位特異的DNAヌクレアーゼがCas9又はCpf1であることが好ましく、或いは、部位特異的ニッカーゼがCas9であることが好ましい。最も好ましくは、前記の部位特異的ヌクレアーゼ又は部位特異的ニッカーゼがCas9(即ちCas9ヌクレアーゼ)であることである。
SpCas9、St1Cas9、及びSaCas9の他にも、幾つかのCas9オルソログが知られており、本発明ではそれらを使用してもよい。斯かるCas9オルソログとしては、髄膜炎菌(Neisseria meningitides)及びフランシセラ・ノビシダ(Francisella novicida)に由来するものが挙げられる。本発明の方法に適用可能な幾つかの既知のCas9ヌクレアーゼの配列は、本技術分野で公知であり、例えば国際公開第2014/131833号に記載されている。本開示において、Cas9ヌクレアーゼは、SpCas9変異体、例えばeSpCas9(Ian, 2016, Science, 351: 84-88)又はSpCas9-HF1(Kleinstiver, 2016, Nature, 529: 490-495)であってもよい。これらは、元のSpCas9よりもより特異的に開裂を誘導することができる。更に、複数の異なるPAMを認識するSpCas9変異体や(Kleinstiver, 2015, Nature 523(7561): 481-485)、PAM特異性が改変された変異体(例えばKleinstiver, 2015, Nature 523(7561): 481-485に記載のVQR及びEQR変異体)も存在し、それらを本開示にて提供される方法に使用してもよい。また、他の既知のCas9変異体、例えばスプリット(split)Cas9、インテイン(intein)Cas9、遺伝子操作(engineered)Cas9、又は二量体RNAガイドFokI-dCas9ヌクレアーゼ(RNA-guided FokI-dCas9 nuclease:RFN)等を、本開示にて提供される方法に使用してもよい。これらのCas9変異体は、例えばZetsche, 2015, Nat Biotechnol. 33(2):139-142; Truong, 2015, Nucleic Acids Res. 43(13): 6450-6458; Tsai, 2014, Nat Biotechnol. 32(6): 569-576等に記載されている。これらのCas9変異体の何れかを本開示にて提供される方法に使用する場合、本技術分野で周知のように実験を適合させなければならない。特にスプリットCas9及びRFNには、それぞれ複数のプラスミド及びテンプレートが必要となり、インテインCas9には、4-ヒドロキシタモキシフェンの添加が必要となる。しかし、これらは当業者には周知の微細な変更に過ぎない。
本開示にて提供される方法は、従来に匹敵するオン-標的開裂活性を維持しつつ、オフ-標的作用が最小化されたCas9変異体、又はオフ-標的作用を有さないCas9変異体を用いることで、その特異性を更に強化することもできる(Kleinstiver, 2016, Nature, 529: 490-495; Slaymaker, 2016, Science 351, 84-88)。しかし、本発明においては、Cas9ヌクレアーゼがSpCas9、St1Cas9又はSaCas9であることが好ましい。最も好ましいCas9ヌクレアーゼはSpCas9である。
ZFN及びTALENによれば、タンパク質ドメインを介した特異的なDNA結合が達成されることから、各ヌクレアーゼ毎に個別の標的部位を挿入しなければならない。或いは、所与の配列に合わせて特異的なヌクレアーゼをカスタマイズする必要がある(Heidenreich, 2016, Nature Reviews Neurosciences, 17: 36-44)。これに対して、Cas9は特異性決定ガイドRNA配列(CRISPR RNA(crRNA))によってガイドされる。斯かるcrRNAは、トランス活性化crRNA(tracrRNA)と関連し、相補的DNA標的配列とワトソン・クリック(Watson-Crick)塩基対を形成することにより、部位特異的二本鎖切断を生じさせる(Heidenreich, 2016, Nature Reviews Neurosciences, 17: 36-44)。(Cas9と、tracrRNA-crRNA二本鎖の「単一ガイドRNA」(single-guide RNA:sgRNA)に対する複合体とからなる)シンプルな二成分系、或いは、(Cas9と、tracrRNA分子と、crRNA分子とからなり、ここで2つのRNA分子は「二重ガイドRNA」(dual-guided RNA)、即ちdgRNAを形成する)シンプルな三成分系を用いることにより、任意の所期のゲノム遺伝子座でDNA開裂を達成することができる。Cpf1、単一のRNAガイドヌクレアーゼ(crRNAのみを使用し、tracrRNAを使用しない)も、部位特異的DSBの誘導に使用できる。それゆえ、ガイドRNAの短い特異性決定部分を変えるだけで、異なるCasタンパク質を特定のDNA配列に標的化することができる。斯かる特異性決定部分の変更は、一回のクローニング工程で容易に達成することができる。
従って、本開示にて提供される方法が、部位特異的ヌクレアーゼとしてCas9を使用する場合には、工程a)の細胞は更に、
(i)少なくとも1つの標的配列特異的CRISPR RNA(crRNA)分子と、少なくとも1つのトランス活性化crRNA(tracrRNA)分子(「二重ガイドRNA」、dgRNA)とからなる、少なくとも1つのガイドRNA、
(ii)前記(i)のRNA分子をコードするポリヌクレオチド、
(iii)少なくとも1つの標的配列特異的crRNAと、少なくとも1つのtracrRNA(「単一ガイドRNA」、sgRNA)とを含むキメラRNA分子である、少なくとも1つのガイドRNA、及び/又は、
(iv)前記(iii)のキメラRNAをコードするポリヌクレオチド
を含んでいてもよい。
前記のガイドRNAは、前記の部位特異的ヌクレアーゼ(例えばCas9又はCpf1)又は部位特異的ニッカーゼ(例えばCas9)を、所望のDSB又は一本鎖ニックの部位に標的化する。例えば、アミノ酸の欠失及び/又は導入(例えば欠失)によりフレームシフトが誘導される場合、前記ガイドRNA(例えばsgRNA)は、例えば前記の部位特異的ヌクレアーゼ又はニッカーゼを、それぞれ前記のDSB又は一本鎖ニックの所望の位置に標的化する。斯かる標的化位置は、例えば、前記欠失及び/又は導入の上流又は下流側の1~100bpの位置(1~33アミノ酸に相当)である。部位特異的DNAヌクレアーゼ(例えばCas9又はCpf1)及びガイドRNAを用いたゲノム編集は、本技術分野では周知であり、例えば"CRISPR-Cas: A Laboratory Manual", 2016, edited by Jennifer Doudna, ISBN 978-1-621821-31-1に記載されている。
本開示にて提供される方法の好ましい側面によれば、工程a)の細胞は、少なくとも1つのsgRNAをコードするポリヌクレオチド(例えばプラスミドベクター)を含む。このポリヌクレオチドは、標的配列に対して相補的な(或いは標的配列の一部に対して相補的な)長さ約20ヌクレオチドの配列と、それに続く長さ約76ヌクレオチドのガイドRNAスキャフォールド配列とをコードする配列を含んでいてもよい。このスキャフォールド配列は、ダイレクトリピート(direct repeat:DR)配列と、tracrRNAとをコードする。
上述のように、本発明の一態様によれば、前記部位特異的ヌクレアーゼはCpf1である。この態様では、ゲノム編集機構は更に、
(i)標的配列特異的crRNA分子を含む少なくとも1つのガイドRNA、又は、
(ii)(i)のRNA分子をコードするポリヌクレオチド
を含んでいてもよい。
本発明において、Cas9又はCpf1ヌクレアーゼをコードするポリヌクレオチドと、ガイドRNAをコードするポリヌクレオチドとは、単一の核酸配列に、例えば単一のプラスミドベクターに含まれていてもよい。或いは、各々Cas9/Cpf1ヌクレアーゼ及びガイドRNAをコードする複数の個別の核酸配列、例えば複数の個別のプラスミドベクターが、工程a)の細胞内に存在し(或いは工程a)の細胞内に送達され)てもよい。しかし、予め構築されたCas9タンパク質-ガイドRNAリボ核タンパク質複合体(RNP)が、本開示にて提供される製造方法の工程a)の細胞内に存在し(或いは工程a)の細胞内に送達され)てもよい。
記述のように、Cas9ヌクレアーゼは、標的配列特異的crRNA分子及びtracrRNA分子を含むガイドRNAと組み合わされると、一本鎖又は二本鎖切断、好ましくは二本鎖切断を、所定の標的部位のDNAに導入する活性を有する。本発明の好ましい側面によれば、Cas9ヌクレアーゼ(例えばSpCas9)及びsgRNAをコードするプラスミドベクターが、工程a)の細胞内に存在する(或いは工程a)の細胞内に送達される)。本発明の他の好ましい側面によれば、Cas9ヌクレアーゼは細胞内で安定に発現される一方、sgRNAは細胞に対して、例えばsgRNAをコードするプラスミドベクターを介して送達される。
本記載の前又は後に示すように、本開示にて提供される製造方法の工程a)の細胞は、使用された部位特異的ヌクレアーゼ又は部位特異的ニッカーゼのための認識部位を、前記のDSB又は一本鎖ニックの標的部位又はその近傍に含むことが好ましい。Cas9を部位特異的ヌクレアーゼ又は部位特異的ニッカーゼとして使用する場合、又は、Cpf1を部位特異的ヌクレアーゼとして使用する場合、所定の認識部位(即ちプロトスペーサー隣接モチーフ、PAM)は、前記のDSB又は一本鎖ニックの標的部位の直ぐ下流にあることが好ましい。本開示において、「前記のDSB又は一本鎖ニックのための標的部位」(target site for the DSB or single-strand nick)とは、前記のDSB又は一本鎖ニックが導入されるポリヌクレオチド内の位置のことである。種々のCRISPRヌクレアーゼ及びその変異体のPAM配列は、本技術分野では周知であり(例えばSpCas9の場合は5’-NGG、SaCas9の場合は5’-NNGRRT(配列番号50)又は5’-NNGRR(N)(配列番号51)、St1Cas9の場合は5’-NNAGAAW(配列番号52)、Cpf1の場合は5’-TTN)、哺乳類のゲノムには豊富に存在する。従って、前記のCas9ヌクレアーゼ又はCpf1ヌクレアーゼを用いれば、PAM配列を人工的に導入することなく、殆どの遺伝子を標的化することができる。しかし、所期の野生型遺伝子内で、適用される部位特異的ヌクレアーゼ又はニッカーゼのためのPAM配列が、前記のDSB又は一本鎖ニックのための所望の標的部位の直ぐ下流に存在しない場合には、PAM配列を外部から導入してもよい。前記のDSB又は一本鎖ニックの標的部位の直ぐ下流に、所望のPAM配列の一部が既に存在している場合には、PAM配列の欠落しているヌクレオチドを外部から導入することにより(即ち、天然では所期の遺伝子内の所望の位置に存在しないPAM配列のヌクレオチドを外部から導入することにより)、完全PAM配列を生成することができる。
c)で選択され、及び/又は、d)で提供される細胞に含まれる、所期のタンパク質をコードする遺伝子の突然変異体には、認識部位(例えばPAM配列が存在していてもいなくてもよい。例えば、前記のDSB又は一本鎖ニックの導入及び細胞修復、例えば HDR又はNHEJの際に、前記認識部位が除去されてもよい。特に、工程b)で提供されるドナー核酸テンプレートを、前記所期の遺伝子から前記認識部位を除去するように設計してもよい。例えば、前記のドナー核酸テンプレートは、前記所期の遺伝子内の前記認識部位に対応する位置の認識部位に対応する配列を、含んでいなくてもよい。従って、本発明の一側面によれば、前記認識部位は、工程c)で選択及び/又は濃縮される細胞に含まれる、所期のタンパク質をコードする遺伝子の突然変異体内に存在していなくてもよい。これにより、Cas9又はCpf1による繰り返しの切断を防止することができる。
認識部位又はその部分の外部からの導入は、所期の遺伝子を前記細胞のゲノム内に導入する前に、前記認識部位又はその部分をその所期の遺伝子に導入することにより、達成することができる。所期の遺伝子が内因性タンパク質である場合には、本技術分野で公知の遺伝子工学的手法、特に相同組換えにより、外因性認識部位又はその部分を組み込んでもよい。
本発明の好ましい側面によれば、工程a)の細胞は所期の遺伝子を含み、ここで、適用される部位特異的ヌクレアーゼ又は部位特異的ニッカーゼのための認識部位(例えばPAM配列)は、それぞれ前記のDSB又は一本鎖ニックのための標的部位の直ぐ下流又は上流に存在する。上述したように、本開示にて提供される方法では、前記の部位特異的ヌクレアーゼ又は部位特異的ニッカーゼが、Cas9であることが好ましい。更に、本開示にて提供される方法では、工程a)の細胞が、前記Cas9ヌクレアーゼを前記認識部位(例えば前記PAM配列)に対して標的化するsgRNA又はdgRNAを発現することがより好ましい。例えば、PAM部位は、所望の切断部位(例えば前記のDSB又は一本鎖ニックのための所望の部位)の1~100bp下流又は上流とすることができる。
上に示すように、ZRN、TALEN、又はmegaTALエンドヌクレアーゼを部位特異的ヌクレアーゼ/ニッカーゼとして使用する場合には、所与の配列に応じて特異的なヌクレアーゼをカスタマイズする必要がある。TALENは、所定の程度の特異性を達成するために、標的特異的なDNA配列、例えば12塩基の配列に合わせて、カスタム設計することが可能である。TALENは、各々特定の塩基を認識する複数のタンパク質モジュールから構成される。例えば、12塩基のDNA配列を認識するには、各々が正確に塩基を認識する12のタンパク質モジュールを融合しなければならない。配列に応じた正しいTALENの設計は、従来技術により定型的に実施することができ、例えばオンラインツールを使用して実施可能である。更に、TALENによる設計及び標的化のための指針は、インターネット上で、例えばTALENターゲッターチュートリアル (TALEN targeter tutorial: https://tale-nt.cac.cornell.edu/tutorials/talentargeterupdated及びhttp://www.e-talen.org/E-TALEN/designtalens.html)等に掲載されている。更に、DNA標的化用のTALENや他のTALエフェクター系コンストラクトのカスタム設計及び組立は、科学文献、例えばCermak, 2011, Nucleic Acids Res. 39(12): e82等に掲載されている。
本開示にて提供される生成方法の工程a)におけるDSBは、前記所期のタンパク質をコードする遺伝子の二本鎖の各々に、2つの一本鎖ニックにより誘導(即ち導入)されてもよい。前記の2つの一本鎖ニックは、同一のニッカーゼにより導入されてもよく、2つの異なるニッカーゼにより導入されてもよい。従って、工程a)の細胞における前記所期のタンパク質をコードする遺伝子の単一のコピーは、2つの認識部位(例えばPAM配列)を含んでいてもよい。両方の一本鎖ニックに同一のニッカーゼを使用する場合には、両者の認識部位は同一であってもよい。両方の一本鎖ニックに2つの異なるニッカーゼを用いる場合には、両者の認識部位は互いに異なっていてもよい。前記第一及び/又は第二のニッカーゼとしては、例えば部位特異的ニック形成活性を有するCas9ヌクレアーゼであってもよい。例えばCas9ヌクレアーゼを用いることで、単一の酵素を用いて2つのニックを導入することが可能となる。これは、酵素をそれぞれの認識部位へと標的化するよう媒介する2つの異なるガイドRNA(例えば2つの異なるsgRNA)を提供することで達成できる。Cas9ヌクレアーゼの場合、2つの異なるsgRNAにより、Cas9ヌクレアーゼを2つの異なる標的部位に標的化することができる。ここで、所望のDSBを導入するのに、少なくとも1つのPAM配列を用いてもよい(例えばTsai, Shengdar Q., and J. Keith Joung. "Defining and improving the genome-wide specificities of CRISPR-Cas9 nucleases." Nature Reviews Genetics 17.5 (2016): 300-312参照)。Cas9ヌクレアーゼ及び/又は2つのガイドRNA(例えば2つの異なるsgRNA)は、それぞれ個別のプラスミドから発現されてもよいが、同一のプラスミドから発現されることが好ましい。ニック形成活性を有するCas9ヌクレアーゼのための認識部位として機能するPAM配列は、本技術分野では公知である。例えば、Cas9n(Cas9のD10A変異体)のPAM配列は5’-NGGである。
ゲノムDNA内にDSB又は一本鎖ニックが存在することで、細胞内修復機構が作動する。典型的には、一本鎖ニックが存在し、修復テンプレートが利用可能であれば、斯かる切断部は相同標的化修復(HDR)により、特に相同組換えにより修復される。一方、二本鎖切断は通常は非相同末端連結(NHEJ)又はHDRにより修復される。なお、一本鎖ニックの場合にもNHEJによる修復は生じうるが、その頻度はHDRによるものよりも遙かに低い。一般的に、一本鎖又は二本鎖切断の導入後、ドナー核酸テンプレートが存在すればHDRが誘導される。例えばHeidenreich, 2016, Nature Reviews Neurosciences, 17: 36-44; Cong, 2013, Science, 339: 819-23; Doudna, 2014, Science, 346: 1258096; Hsu, 2014,Cell 157: 1262-78参照。HDRにより、突然変異誘発標的部位における所望の配列の正確な挿入、欠失又は置換を含む、精密なゲノム編集が可能となる。これに対して、NHEJによる修復によれば、任意の種類のランダムな欠失又は挿入が導入されることから、「INDEL突然変異」とも呼ばれる。斯かるINDEL突然変異により挿入されるヌクレオチドの数や種類は制御困難である。なお、INDEL突然変異は1又は2以上のヌクレオチド挿入の及び/又は欠失二限定されるため、所期のタンパク質に対してHDRと同程度の多様化を達成することはできない。従って、本発明の優先される側面によれば、前記のDSB又は一本鎖ニックは、少なくとも優先的にHDRにより修復されることが想定される。これは、ドナー核酸テンプレートのライブラリーを細胞に供することで達成される。従って、本発明の方法では、NHEJによるHDRの導入を抑制(即ち防止)する必要はない。実際に、前記所期のタンパク質の突然変異体を更に多様化するには、所定の割合のNHEJが存在することが望ましい。
本発明の方法が工程b)を有するか否かとは独立に、NHEJは所期のタンパク質の多様化に寄与する場合がある。工程a)において所期の遺伝子の単一のコピーに含まれる不活性化突然変異がNHEJにより除去される場合、工程c)において斯かる前記所期のタンパク質の突然変異体を発現する細胞を選択してもよく、惹いては斯かる細胞が工程d)により提供される細胞のパネルの一部を構成してもよい。従って、本発明の一側面によれば、工程d)により提供される細胞のパネルは更に、NHEJにより前記のDSB又は一本鎖ニックの修復が生じた細胞を含んでいてもよい。NHEJにより前記のDSB又は一本鎖ニックの修復が生じた細胞は、不活性化突然変異を除去した少なくとも1つのランダムな突然変異を含んでいてもよい。ここで前記ランダムな突然変異は、工程a)で前記のDSB又は一本鎖ニックが導入された位置に直接隣接する位置に、1又は2以上のヌクレオチドの挿入及び/又は欠失を含むことが好ましい。上述したように、斯かるランダムな突然変異は、INDEL突然変異とも呼ばれる。
所望の場合には、工程a)及びb)において、NHEJに対する相同組換えの比率が上昇するような条件下で細胞を培養してもよい。前記条件としては、例えば、NHEJに関与する酵素の阻害又は不活性化、NHEJを阻害するタンパク質の発現、NHEJを阻害する物質の添加、複製フォーク信仰の遅延化、及び/又は、細胞周期のG2/M期での停止誘発等が挙げられる(例えばWu, 2005, Proceedings of the National Academy of Sciences of the United States of America 102.7: 2508-2513参照)。NHEJに関与すると考えられ、抑制対象となる酵素としては、KU70及び/又はDNAリガーゼIVが挙げられる。NHEJを抑制するタンパク質としては、例えばE1B55K及びE4orf6からなるタンパク質複合体、又はこれらを含むタンパク質複合体が挙げられる。NHEJを阻害する物質としては、例えばScr7-ピラジン、ESCR7、L755507、ブレフェルジンA及びL189(CAS64232-83-3)からなる群より選択される物質が挙げられる(例えばYu, 2015, Cell stem cell 16.2: 142-147又はhttp://www.tocris.com/pdfs/5342.pdf参照)。斯かる培養条件ゆえに、NHEJに対する相同組換えの比率は、例えば少なくとも1倍、好ましくは少なくとも3倍、最も好ましくは少なくとも15倍に増加する。NHEJを媒介する酵素、例えばDNAリガーゼIVやKU70等は、適切な細胞系列内で完全にノックアウトされ、或いは対応するタンパク質の変異体で置換されうる。不安定化アミノ酸配列がN-又はC-末端に融合された、安定化薬物によって斯かる酵素を機能的に維持する一方、斯かる薬物を除去すれば、タンパク質は迅速に分解される。例えば Egeler, 2011, Journal of Biol Chemistry 286: 31328-31336を参照。続いて、NHEJの酵素が分解により一過的に除去されるような条件下で、本願のタンパク質多様化プロトコールを用いればよい。タンパク質の多様化の後、再度リガンドを加えることで、新たに発現されるNHEJを媒介する酵素を安定化してもよい。
本開示にて提供される製造方法の工程b)では、ドナー核酸テンプレートのライブラリーを細胞に供する。前記のドナー核酸テンプレートが、所期のタンパク質をコードする遺伝子内の不活性化突然変異を除去する。従って、前記核酸テンプレートは不活性化突然変異を除去するように設計される。換言すれば、前記ドナー核酸テンプレートの核酸配列は、供給されたドナー核酸テンプレートを用いた前記のDSB又は一本鎖ニックのHDR(特に相同組換え)により、所期のタンパク質をコードする遺伝子内の不活性化突然変異が除去されるように設計される。
前記の複数の異なるドナー核酸テンプレートは、二本鎖DNA分子を含んでいてもよく、二本鎖DNA分子であってもよい。例えば、前記複数の異なるドナー核酸テンプレートは、ベクター、例えばプラスミドベクター内に含まれていてもよい。この場合、前記複数の異なるドナー核酸テンプレートは、各々個別のベクターに含まれていてもよい。或いは、前記複数の異なるドナー核酸テンプレートは、一本鎖オリゴヌクレオチドを含んでいてもよく、一本鎖オリゴヌクレオチドであってもよい。例えば、前記一本鎖オリゴヌクレオチドは、ロックド核酸(LNA)及び/又はホスホロチオエート修飾を含んでいてもよい。
「ロックド核酸」(locked nucleic acid)又は「LNA」という語は、本技術分野では周知である。LNAは、リボース部分が2'酸素と4'炭素とを連結する余剰の架橋により修飾されたヌクレオチドである。A型二重鎖にしばしば見られるように、この架橋がリボースを3'-エンド(North)立体構造で「ロック」しているのである。ロックされた立体構造により、オリゴヌクレオチドのハイブリダイゼーション特性、標的特異性、及びヌクレアーゼに対する抵抗性が向上する。
「ホスホロチオエート修飾」(phosphorothioate modification)という語は、当業者には周知であるが、ホスホロチオエート結合によって、オリゴヌクレオチドのリン酸骨格中の非架橋酸素が硫黄原子で置換された構造を意味する。この修飾により、ヌクレオチド間の結合がヌクレアーゼ分解に対して抵抗性を有することになる。
前記複数の異なるドナー核酸テンプレートは各々、突然変異誘発標的部位の両側に存在する領域に対して相同な相同核酸配列を含む。これらの相同核酸配列は、前記の所望の突然変異をコードする領域を挟み込んでいる。例えば、ドナー核酸テンプレートがプラスミドに含まれる場合には、相同配列の長さは例えば少なくとも800ヌクレオチド(即ち、所望の突然変異の両側に各々少なくとも400ヌクレオチド)、好ましくは少なくとも1600(即ち、所望の突然変異の両側に各々少なくとも800ヌクレオチド)、最も好ましくは少なくとも2000ヌクレオチド(即ち、所望の突然変異の両側に各々少なくとも1000ヌクレオチド)である。ドナー核酸テンプレートがssODNの場合、相同配列の長さは例えば約40ヌクレオチド(即ち、所望の突然変異の両側に各々20ヌクレオチド)~約200ヌクレオチド(即ち、所望の突然変異の両側に各々100)、好ましくは約60ヌクレオチド(即ち、所望の突然変異の両側に各々30ヌクレオチド)~約120ヌクレオチド(即ち、所望の突然変異の両側に各々60ヌクレオチド)、最も好ましくは約80ヌクレオチド(即ち、所望の突然変異の両側に各々40ヌクレオチド)~約100ヌクレオチド(即ち、所望の突然変異の両側に各々50ヌクレオチド)である。従って、前記複数の異なるドナー核酸テンプレートは各々、前記突然変異誘発標的部位に対応する位置の上流に、長さ少なくとも20ヌクレオチド、例えば20~500ヌクレオチド、20~300ヌクレオチド、20~100ヌクレオチド、30~60ヌクレオチド、又は40~50ヌクレオチドの第一の相同核酸配列を含んでいてもよい。或いは更に、前記突然変異誘発標的部位に対応する位置の下流に、長さ少なくとも20ヌクレオチド、例えば20~500ヌクレオチド、20~300ヌクレオチド、20~100ヌクレオチド、30~60ヌクレオチド、又は40~50ヌクレオチドの第二の相同核酸配列を含んでいてもよい。
前記第一の相同核酸配列は、前記突然変異誘発標的部位に対応する位置のすぐ上流に存在してもよく、又は、前記突然変異誘発標的部位に対応する位置のすぐ上流から10核酸以内に存在してもよい。同様に、前記第二の相同核酸配列は、前記突然変異誘発標的部位に対応する位置のすぐ下流に存在してもよく、又は、前記突然変異誘発標的部位に対応する位置のすぐ下流から10核酸以内に存在してもよい。
ドナー核酸テンプレート内の相同配列は、突然変異誘発標的部位を挟み込む領域に対して、例えば少なくとも80%の配列同一性、好ましくは少なくとも95%の配列同一性、最も好ましくは少なくとも99%の同一性を有していてもよい。
上述したように、本発明によれば、前記のドナー核酸テンプレートは、前記突然変異誘発標的部位に対応する位置に、複数の異なる突然変異を含んでいてもよい。特に、各ドナー核酸テンプレートは、所期のタンパク質内(の前記突然変異誘発標的部位)に生成するべき所望の突然変異を含んでいてもよい。前記突然変異誘発標的部位に対応する位置における、前記の複数の異なる突然変異は、1又は2以上のヌクレオチドの置換、欠失、又は挿入である。即ち、野生型(即ち非改変)の所期のタンパク質をコードするヌクレオチド配列と比較して、1又は2以上のヌクレオチドの置換、欠失、又は挿入である。例えば、所期のタンパク質に対して内因性のヌクレオチドと、変異されたヌクレオチドとの組み合わせにより、前記の突然変異誘発標的部位結果に異なるアミノ酸配列が形成されうる。或いは、前記の突然変異誘発標的部位に新たに挿入されたヌクレオチドが、野生型(即ち非改変)の所期のタンパク質の対応する位置に存在するアミノ酸残基と比較して、異なる1又は2以上のアミノ酸残基をコードしてもよい。
本発明において、前記ドナー核酸テンプレートは、HDR、特に相同組換えにより、(所期のタンパク質をコードする遺伝子の)不活性化突然変異を除去する。斯かるドナー核酸テンプレート内で、前記不活性化突然変異を除去する核酸配列は、例えば所期のタンパク質をコードする遺伝子に対応する野生型配列であってもよく、及び/又は、所期のタンパク質をコードする遺伝子内のフレームシフト突然変異を除去する配列であってもよい。
典型的には、本開示にて提供される方法では、相同性アームによって挟まれ、プログラムされた多様性を含む、ドナー核酸テンプレートの1バッチが使用される。通常は、全てのドナー核酸テンプレートが1バッチで合成され、これらは同一の相同性アームを共有するが、数百万の異なるドナー分子を構成する。特に、「ドナー核酸配列」(donor nucleic acid sequences)が異なるゆえに、斯かるドナー核酸テンプレートのライブラリーは、少なくとも2、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも100、少なくとも1000、少なくとも10000、又は少なくとも1000000の異なるドナー核酸テンプレートを含む。従って、本発明の一側面は、本開示にて提供される方法であって、複数の異なるドナー核酸テンプレートのライブラリーが、少なくとも2つの異なるドナー核酸テンプレート、好ましくは少なくとも5の異なるドナー核酸テンプレート、より好ましくは少なくとも10の異なるドナー核酸テンプレート、更に好ましくは少なくとも15の異なるドナー核酸テンプレート、更に好ましくは少なくとも20の異なるドナー核酸テンプレート、更に好ましくは少なくとも100の異なるドナー核酸テンプレート、更に好ましくは少なくとも1000の異なるドナー核酸テンプレート、更に好ましくは少なくとも10000の異なるドナー核酸テンプレート、又は更に好ましくは少なくとも1000000の異なるドナー核酸テンプレートを含む方法に関する。上述したように、斯かるドナー核酸テンプレートは、複数の異なる突然変異を含む。1つのドナー核酸分子当たり1つの突然変異を含むことが好ましい。各ドナー核酸テンプレート内の「突然変異」(mutation)は、所期の遺伝子内の対応する配列と比較して異なるヌクレオチド又はヌクレオチド配列である。各ドナー核酸テンプレート内の「突然変異」は、別名「多様化配列」とも呼ばれる。前記の「突然変異」又は「多様化配列」により、所期のタンパク質内に、1又は2以上のアミノ酸置換、置き換え、及び/又は挿入が生じることが好ましい。前記の多様化配列は、1又は2以上の具体的なアミノ酸をコードしていてもよく、及び/又は、縮重コドンを含んでいてもよい。多様化配列の縮重コードとしては、例えばNNN、NNK/NNS、NNB、及び/又は、MAX系が挙げられる。本技術分野で公知のように、Nは、DNAの何れかのヌクレオチド、即ちアデニン(A)、グアニン(G)、シトシン(C)、又はチミン(T)を表す。Bは、アデニン以外の何れかのヌクレオチドを表す。従って、縮重コードNNBは、停止コドン(即ちTAA、TGA)を導入する可能性を低下させる。本技術分野で公知のように、縮重コードにおいて、Kは、アデニン(A)又はシトシン(C)以外、即ち、グアニン(G)又はチミン(T)を表す。Sは、アデニン(A)又はチミン(T)以外、即ち、シトシン(C)又はグアニン(G)を表す。MAX系も本技術分野では公知であり、例えばHughes, 2003, J. Mol. Biol. 331: 973-979に記載されている。この系では、標的化された各部位で、最大20のプライマーが(1アミノ酸アミノ酸当たり1つずつ)生成される。これらは十分にランダム化されたテンプレート(標的化された残基のNNN)にアニールされ、連結されてバイアスのないライブラリーが形成される。
前記のドナー核酸テンプレートは、特定の(1又は2以上の)アミノ酸を、変化させないまま維持すると共に、隣接するアミノ酸(即ち変化しないアミノ酸の両側にあるアミノ酸)が改変されるように設計されてもよい。従って、ドナー核酸テンプレート内の縮重コドンが、所期のタンパク質の元のアミノ酸配列由来の(1又は2以上の)アミノ酸で中断されていてもよい。例えば、突然変異誘発標的部位内の一部のアミノ酸のみが重要と考えられる場合には、これらは多様化すべきではない。
前記の複数の異なるドナー核酸テンプレートのライブラリーは、前記突然変異誘発標的部位に対応する位置に含まれる突然変異が異なる複数のドナー核酸テンプレートを含む。例えば、斯かる複数の異なるドナー核酸テンプレートは、前記突然変異誘発標的部位に対応する位置でコードされるアミノ酸が異なっていてもよい。或いは、斯かる複数の異なるドナー核酸テンプレートは、前記突然変異誘発標的部位に対応する位置でコードされる複数の異なるアミノ酸の量が異なっていてもよい。例えば、複数の異なるドナー核酸テンプレートのライブラリー内において、一部のドナー核酸テンプレートが前記突然変異誘発標的部位に対応する位置で1アミノ酸をコードし、他のテンプレートが前記突然変異誘発標的部位に対応する位置で少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、及び/又は、少なくとも12のアミノ酸(例えば3~5のアミノ酸)をコードしてもよい。
例えば、不活性化された所期の遺伝子(即ち、不活性化突然変異を含む所期の遺伝子)内において、少なくとも1つのアミノ酸のコドンが欠失していてもよい。この場合、ドナー核酸テンプレートは、欠失されるアミノ酸を置換し、フレームシフトを除去し、置換されたアミノ酸に隣接する少なくとも1つのアミノ酸(例えば1又は2アミノ酸)をランダム化するように設計される。
本開示にて提供される製造方法では、工程b)は工程a)の前に実施してもよいが、工程a)と同時に実施することが好ましい。工程a)とb)を同時に実施する場合、前記の部位特異的ヌクレアーゼ又はニッカーゼが、同時にドナー核酸テンプレートの一部を切断してしまってもよい。これにより、本発明の方法が顕著に妨害されることはない。しかし、所望の場合には、斯かるドナー核酸テンプレートの切断を、当業者に周知の幾つかの方法により防止することができる。例えば前記ドナー核酸テンプレートが、例えばプラスミドに含まれた、二本鎖DNA(dsDNA)である場合、サイレント突然変異又は少なくとも中立突然変異を、前記ドナー核酸テンプレートのPAM配列内に導入すればよい。前記ドナー核酸テンプレートがssODNである場合、例えばsgRNA配列と対応するssODN配列とを同一の鎖に配置することで、ssODNの切断を防止することができる。
本発明の工程a)の製造方法において、DSB又は一本鎖ニックは、所期のタンパク質をコードする遺伝子(即ち所期の遺伝子)内の突然変異誘発標的部位又はその近傍に導入される。この場合、細胞はそのゲノム内に、所期の遺伝子の不活性化されたコピーを一つのみ(即ち、所期の遺伝子の不活性化されたアレルを一つのみ)含む。具体的に、前記所期の遺伝子の単一のコピーは、アミノ酸配列を多様化すべき(特に突然変異を誘発すべき)突然変異誘発標的部位又はその近傍に、少なくとも1つの不活性化突然変異を含むことにより不活性化されてなる。
従って、所期のタンパク質をコードする遺伝子の単一のコピーは、前記突然変異誘発標的部位又はその近傍に、不活性化突然変異を含む。前記の不活性化突然変異は、前記のDSB又は一本鎖ニックが導入される位置又はその近傍に存在していてもよい。例えば、選択(又は導入)されたPAM部位の1~21ヌクレオチド(1~7アミノ酸に相当する)下流の4塩基対を除去することで、1アミノ酸を除去すると共にフレームシフトを生じさせてもよい。
不活性化突然変異を含む遺伝子は、不活性化された遺伝子、又は、突然変異により不活性化された遺伝子とも呼ばれる。従って、所期の遺伝子に含まれる不活性化突然変異は、対応するタンパク質の発現を少なくとも抑制し、又はより好ましくは防止する遺伝子の核酸配列内の、何らかの改変/修飾であることが好ましい。換言すれば、前記不活性化突然変異は、不活性化突然変異を有さない対応する野生型遺伝子によりコードされるタンパク質と比較して、所期のタンパク質の発現を少なくとも抑制し、又はより好ましくは防止するものであってもよい。前記不活性化突然変異は、対応する野生型タンパク質と比較して、より活性の低いタンパク質を発現させるものであってもよい。換言すれば、不活性化された所期の遺伝子(即ち、不活性化突然変異を有する所期の遺伝子によりコードされる所期のタンパク質)から発現されるタンパク質は、前記野生型の所期のタンパク質(即ち、不活性化突然変異のない所期の遺伝子によりコードされるタンパク質)と比較して、より活性が低いものであってもよい。例えば、斯かるより低活性のタンパク質の活性は、対応する野生型の所期のタンパク質の活性と比較して、70%以下、好ましくは50%以下、より好ましくは30%以下、更に好ましくは10%以下、最も好ましくは0%である。斯かるより低活性のタンパク質は、対応する野生型タンパク質と比較して、例えば酵素活性(所期のタンパク質が酵素の場合)がより低く、又は、特定のエピトープに対する結合活性(所期のタンパク質が抗体の場合)がより低い。所期のタンパク質が蛍光タンパク質である場合、斯かるより低活性のタンパク質は、例えば蛍光がより低い(或いは、好ましくは蛍光を有さない)。しかし、所期のタンパク質は、酵素、抗体、及び蛍光タンパク質に限定されるものではない。従って、所期のタンパク質によっては、斯かるより低活性のタンパク質は、例えば、親和性物質又は分子構造(例えばDNA、RNA、タンパク質、又はペプチド)に対する結合親和性がより低く、インビボで観察される化学反応(例えば呈色反応)の誘導活性がより低く、或いは、薬物及び/又は抗生物質への抵抗性がより低い。
本発明において、前記不活性化突然変異により生じる所期のタンパク質の活性低下を、工程c)において、相同組換えにより前記不活性化突然変異が除去された細胞の選択及び/又は濃縮に使用することもできる。斯かる例では、前記不活性化突然変異が蛍光活性の低下を生じる場合、蛍光を発する細胞(及び/又は、強い蛍光を発する細胞)を、工程c)で選択及び/又は濃縮すればよい。即ち、蛍光活性化細胞分別(fluorescence-activated cell sorting:FACS)技術を用いることができる。斯かるFACS技術を実施するための非限定的な例は、後述の実施例に記載されている。
不活性化突然変異の例は、所期のタンパク質をコードする遺伝子内にフレームシフトを生じさせる突然変異(即ち、所期の遺伝子のリーディングフレームの改変を生じさせる突然変異)、前記所期のタンパク質をコードする遺伝子内に未成熟停止コドンを導入し、又は、前記所期のタンパク質をコードする遺伝子内に突然変異を導入し、これにより不活性化アミノ酸置換を生じさせる突然変異を含む。前記の不活性化アミノ酸置換は、対応するタンパク質の活性(例えば酵素活性又は結合活性)を抑制又は防止するものであってもよく、或いは対応するタンパク質の発現を好ましくは抑制し、又はより好ましくは防止するものであってもよい。最も好ましい前記不活性化突然変異は、所期のタンパク質をコードする遺伝子(即ちヌクレオチド配列)内のフレームシフト突然変異である。
分子的観点からは、不活性化突然変異は、例えば塩基対の置換、1又は2以上のヌクレオチドの挿入、或いは、1又は2以上のヌクレオチドの欠失であってもよい。例えば、前記不活性化突然変異は、塩基対置換、塩基対挿入、塩基対欠失、停止コドン、又は不活性化アミノ酸置換であってもよく、これらを含んでいてもよい。前記の不活性化アミノ酸置換は、例えば正しく折り畳まれないタンパク質及び/又は触媒的に不活性なタンパク質を生じさせるものであってもよい。当業者であれば、上記の何れかの種類の不活性化突然変異を達成するのに、どのような突然変異が必要であるかを理解するであろう。
上述したように、所期のタンパク質をコードする遺伝子の単一のコピー内の前記不活性化突然変異は、前記突然変異誘発標的部位又はその近傍に存在する。本明細書で使用する場合、「突然変異誘発標的部位の近傍」(close proximity to the target site for mutanogenesis)という語は、前記突然変異誘発標的部位に所望の突然変異を導入し、不活性化突然変異を除去するようなドナー核酸テンプレートの設計を可能とする、突然変異誘発標的部位に対する距離を意味する。従って、「突然変異誘発標的部位近傍」という語は、例えば100ヌクレオチド以下、好ましくは80ヌクレオチド以下、より好ましくは60ヌクレオチド以下、更に好ましくは40ヌクレオチド以下、更に好ましくは30ヌクレオチド以下、最も好ましくは10ヌクレオチド以下の距離を意味する。なお、前記不活性化突然変異は、ちょうど前記突然変異誘発標的部位に存在していてもよい。
本発明において、前記不活性化突然変異は、所期のタンパク質の選択可能な活性(例えば蛍光活性)を防止するものであってもよい。この場合、本開示にて提供される製造方法の工程c)は、前記選択可能な活性(例えば蛍光活性)を有する細胞の選択及び/又は濃縮であってもよく、又はこれらを含んでいてもよい。中でも、前記不活性化突然変異は、所期のタンパク質の発現を防止するものであることが好ましい。この場合、所期のタンパク質の発現は、不活性化突然変異の首尾よき除去を示すものであり、惹いては有利なことには、所期のタンパク質の首尾よき突然変異誘発を示すものである。この場合、本開示にて提供される製造方法の工程c)は、前記所期のタンパク質を発現する細胞の選択及び/又は濃縮であってもよく、これらを含んでいてもよい。前記所期のタンパク質が直接選択可能でない(即ち、例えば蛍光等の固有の特性により選択可能でない)場合、所期のタンパク質を発現する細胞は、前記所期のタンパク質に特異的に結合する抗体を用いることにより、選択及び/又は濃縮されてもよい。
例えばFACSと、所期のタンパク質に特異的に結合する抗体とを用いて、所期のタンパク質を発現する細胞を選択及び/又は濃縮してもよい。斯かる方法は、所期のタンパク質が細胞表面に提示される場合には、とりわけ有用である。これは、市販のベクター、例えばpDisplay等を用いることにより、達成することが可能である。特に、細胞ゲノム内への単一のコピー数の挿入前に、前記所期のタンパク質の突然変異体を細胞表面に送達する標的化配列を、所期のタンパク質をコードする遺伝子カセットにそのまま加えることができる。斯かる技術は非常に強力な手法であり、細胞、例えば哺乳類細胞、例えばHEK293細胞の表面における、タンパク質(例えばFab断片、単一鎖抗体、又は全IgG)の機能的提示を、効率的に達成することを可能とする。効率的な提示及びスクリーニングのためのプロトコールは、本技術分野では既に標準的となっており、例えばHo, 2008, Methods in Molecular Biology, 525: pp 337-352; and Zhou, 2012, Methods in Molecular Biology, 907: 293-302によって提供される。
或いは、所期のタンパク質が抗体等の結合分子である場合、前記所期のタンパク質を発現する細胞の突然変異体を、例えばパニングアプローチにより同定することができる。この目的のためには、特異的な表面に所望の抗原を結合させればよい。抗体ライブラリーを細胞表面に発現する細胞を、この表面上でインキュベートする。有効な抗体を発現する細胞が、この表面に結合する。非結合細胞を洗い流した後、加える可溶性抗原の量を増加させると共に、更なる洗浄によりストリンジェンシーを上昇させてもよい。何ラウンドかの洗浄の後、表面に結合して残存する細胞を、何らかの適切な方法、例えばトリプシン処理等で収穫して回収すればよい。
或いは、斯かるパニングアプローチを逆転させ、抗体を表面に吸着させて、所期のタンパク質を細胞の表面に提示させてもよい。このパニングは、細胞の濃縮に使用することができる。
また、免疫タグ、例えばmycエピトープ又はHAタグ等を、(蛍光タンパク質又は薬物抵抗性タンパク質の代わりに、或いはこれらに加えて)選択可能マーカーとして用い、所期のタンパク質と融合させた融合タンパク質を形成してもよい。
(例えば、所期のタンパク質が蛍光タンパク質である場合には)所期のタンパク質は単量体であることが望ましい。惹いては、発現される所期のタンパク質の二量体又は多量体形成を防止するように、所期の遺伝子を改変してもよい。
或いは、所期のタンパク質をコードする遺伝子が、前記細胞のゲノム内に融合遺伝子として存在していてもよく、ここで前記融合遺伝子が、所期のタンパク質をコードする遺伝子の下流に、マーカー遺伝子を含んでいてもよい。マーカー遺伝子(別名「選択可能マーカー遺伝子」(selectable marker gene))とは、人工的な選択に適した特性を付与する遺伝子である。斯かるマーカー遺伝子は、マーカー(別名「マーカータンパク質」(marker protein))をコードする。「陽性マーカー」とは、宿主生物に対して選択的な利点を付与する選択可能マーカー、或いは、その固有の特性(例えば蛍光等)に基づき選択可能な選択可能マーカーである。「陰性マーカー」(negative marker)(別名「反選択可能マーカー」(counter-selectable marker))とは、選択対象ではない宿主生物の成長を阻害又は抑制する選択可能マーカーである。
上述の融合遺伝子において、マーカー遺伝子と所期のタンパク質をコードする遺伝子とはインフレームで存在する。特に、融合遺伝子においては、所期のタンパク質及びマーカー遺伝子のコーディング配列は、互いに作動式に融合され、単一のmRNA分子として発現されて、対応する融合タンパク質の発現を可能とするように構成される。前記の融合タンパク質は、互いに作動式に連結/融合された所期のタンパク質及びマーカータンパク質を含む。特に、前記融合タンパク質は、所期のタンパク質を含むと共に、そのC末端にマーカータンパク質を含む。
本発明では、前記融合遺伝子に含まれる所期のタンパク質内の前記不活性化突然変異は、マーカー遺伝子の発現をも防止することが好ましい。この場合、前記不活性化突然変異が除去され、それにより所期のタンパク質の多様化が生じた細胞は、マーカー遺伝子を発現する細胞を選択及び/又は濃縮することによって、容易に選択することができる。従って、本開示にて提供される製造方法の一側面によれば、工程c)が、マーカー遺伝子によりコードされるタンパク質を発現する細胞の選択及び/又は濃縮であるか、或いはこれらを含む。好ましくは、マーカー遺伝子によりコードされるタンパク質の発現は、直接選択である(即ち、その固有の特性、例えばその蛍光に基づき選択可能である)。例えば、マーカー遺伝子によりコードされるタンパク質は、蛍光タンパク質であってもよい。この場合、工程c)の選択及び/又は濃縮は、斯かる蛍光タンパク質を発現する細胞の単離を含むことが好ましい。細胞の集団を選択的に単離するための方法としては、幾つかの方法が本技術分野で公知である。例えば、細胞の単離は、FACS又はマイクロ流体細胞選別で達成することができるところ、これらを使用してもよい。所望の(例えばマーカー遺伝子が蛍光タンパク質をコードする場合)、マーカータンパク質(例えばマーカー遺伝子によりコードされるタンパク質)は単量体であることが望ましい。従って、上述したように、発現されるマーカータンパク質の二量体又は多量体形成を防止するように、マーカー遺伝子を改変してもよい。
上述の融合遺伝子(即ち、所期のタンパク質をコードする遺伝子とマーカー遺伝子とを含む融合遺伝子)を発現する細胞の選択及び/又は濃縮は、蛍光による選別以外の機構によっても達成される。例えば、マーカー遺伝子によりコードされるタンパク質の発現は、薬物抵抗性を付与するものであってもよく、抗生物質抵抗性を付与するものであってもよく、栄養要求性を補完するものであってもよく、検出可能な酵素活性を付与するものであってもよく、又は免疫エピトープであってもよい。工程c)において、前記不活性化突然変異が除去された細胞を選択及び/又は濃縮するのに、マーカータンパク質のこれらの特性を用いてもよい。
例えば、マーカー遺伝子によりコードされ、酵素活性を付与するタンパク質としては、例えばβ-ラクタマーゼ、又はプロテアーゼ、例えばエンテロキナーゼ、又はTEV等が挙げられる。薬物(例えば抗生物質)や、斯かる薬物に対する抵抗性を付与するタンパク質をコードする遺伝子は、種々知られている。例えば、ピューロマイシンは、翻訳時にペプチドのリボソームへの移送を妨害し、未成熟鎖終了を生じさせることにより、タンパク質合成を阻害する。ピューロマイシンN-アセチル-トランスフェラーゼをコードするpac遺伝子は、ピューロマイシン抵抗性遺伝子である。ハイグロマイシンBはアミノグリコシド抗生物質であって、転座を妨害し、80Sリボソームの誤訳を促進することにより、タンパク質合成を阻害する。アミノシクリトールホスホトランスフェラーゼをコードするhyg遺伝子は、ハイグロマイシンBに対する抵抗性を付与する。ゼオシンは、DNA内に侵入して切断することにより、細胞死を生じさせる。Sh ble遺伝子産物はゼオシンに結合し、ゼオシンのDNAへの結合を防止することで、抵抗性を付与する。ブラストサイジンは原核細胞及び真核細胞の何れにおいても翻訳阻害剤である。ブラストサイジンに対する抵抗性は、bsd遺伝子産物により付与される。G-418は、80Sリボソームの機能に干渉し、真核細胞でのタンパク質合成を阻害する。neor遺伝子はG-418に対する抵抗性を付与する。マーカー遺伝子によりコードされるタンパク質が、薬物抵抗性若しくは抗生物質抵抗性を付与し、又は栄養要求性を補完する場合、工程c)の選択及び/又は濃縮は、細胞を選択的な条件下で培養することを含むことが好ましい。
本発明では、所期のタンパク質の発現は、陰性選択可能であってもよい。換言すれば、非マーカー遺伝子によりコードされるタンパク質の発現が、所期のタンパク質の発現を示すものであってもよい。即ち、マーカー遺伝子によりコードされるタンパク質が、前記不活性化突然変異の存在下で発現されてもよく、前記不活性化突然変異が除去された細胞では、マーカー遺伝子が発現されなくてもよい。本開示において「発現されない」(not expressed)とは、タンパク質がインフレームで発現されないことを含む概念である。従って、本開示では、マーカー遺伝子のリーディングフレームとは異なるリーディングフレームが転写される場合には、マーカー遺伝子は発現されないものと見做される。従って、本発明の一側面は、本開示にて提供される製造方法において、前記所期のタンパク質をコードする遺伝子内に前記不活性化突然変異が存在すると、マーカー遺伝子によりコードされるタンパク質が発現されると共に、前記所期のタンパク質をコードする遺伝子内の前記不活性化突然変異が除去された細胞では、前記マーカー遺伝子が発現されない、又はインフレームでは発現されないことを含む方法に関する。この場合、本開示にて提供される製造方法の工程c)は、マーカー遺伝子によりコードされるタンパク質を発現しない細胞の選択及び/又は濃縮であるか、これを含むことが好ましい。マーカー遺伝子によりコードされるタンパク質が発現されない場合に所期のタンパク質の発現を達成するための系として、本技術分野で公知のものは少数であるが存在する。例えば、マーカー遺伝子によりコードされるタンパク質は、チミジンキナーゼ(HSVtk)であってもよい。このタンパク質は、哺乳類細胞では条件付き致死マーカーとして機能する。ガンシクロビル等の特定のヌクレオシド類似物をリン酸化して、毒性DNA複製阻害剤に転換するからである。
上述の融合遺伝子(即ち、所期のタンパク質をコードする遺伝子とマーカー遺伝子とを含む融合遺伝子)は、前記所期のタンパク質をコードする遺伝子と前記マーカー遺伝子との間に、リンカー核酸配列を含んでいてもよい。前記のリンカー核酸配列は、自己開裂ペプチドをコードする核酸配列であってもよく、当該配列を含んでいてもよい。自己開裂ペプチドとしては幾つかのものが本技術分野で周知である。例えば、自己開裂ペプチドは、T2Aペプチド、P2Aペプチド、E2Aペプチド、及びF2Aペプチドからなる群より選択されるものであってもよい。2Aペプチドのアミノ酸配列、特にT2A、P2A、E2A、及びF2Aのアミノ酸配列を本開示において配列番号1~4として示す。
また、リンカー核酸配列は、部位特異的プロテアーゼの標的部位をコードする核酸配列であってもよく、当該配列を含んでいてもよい。例えば、前記部位特異的プロテアーゼの標的部位は、例えば配列番号5に示すアミノ酸配列を有するTEVプロテアーゼの標的部位、配列番号6に示すアミノ酸配列を有するジェネナーゼI(Genenase I)の標的部位、配列番号7に示すアミノ酸配列を有するエンテロキナーゼの標的部位、及び、配列番号8に示すアミノ酸配列を有するヒトライノウイルス(HRV)3Cプロテアーゼの標的部位からなる群より選択されてもよい。好ましさの面では劣るが、部位特異的プロテアーゼの標的部位は、配列番号9に示すアミノ酸配列を有する因子Xaの標的部位、又は、配列番号10に示すアミノ酸配列を有するトロンビンの標的部位であってもよい。前記リンカー核酸配列が、部位特異的プロテアーゼの標的部位をコードする核酸配列であるか、当該配列を含む場合、前記細胞(即ち、本開示にて提供される製造方法の工程a)~d)何れかの細胞)は更に、前記標的部位を切断するための、対応する部位特異的プロテアーゼを発現してもよい。前記の部位特異的プロテアーゼは、例えばTEVプロテアーゼ、ジェネナーゼI(Genenase I)、エンテロキナーゼ、ヒトライノウイルス(HRV)3Cプロテアーゼ、因子Xa、及びトロンビンからなる群より選択されてもよい。
好ましくは、本開示にて提供される製造方法の工程a)及びb)の後に、多様化を受けた細胞が、所期のタンパク質に融合されたマーカータンパク質を産生してもよい。マーカー遺伝子は所期の遺伝子と同一のレベルで発現され、マーカータンパク質として蛍光タンパク質を用いた場合には、斯かる蛍光タンパク質はタンパク質濃度の指標として使用できる。従って、所期のタンパク質を利用した結合アッセイの場合、発現レベルに対して結合を校正すればよい。更に、蛍光マーカー遺伝子を発現する細胞は、FACS又はマイクロ流体選別を用いて収集することができ、抗生物質選択よりも迅速なプロセスで回収できる。
マーカー遺伝子が陽性又は陰性の選択可能マーカータンパク質をコードする場合、適切に多様化された変異体からなる細胞集団を得るためには、幾つかの可能性が存在する。複数の開裂可能なペプチドリンカー、例えばT2A又はF2Aと共に、陽性及び陰性の両マーカーを用いることにより、例えば単純ヘルペスウイルス1型チミジンキナーゼ等の遺伝子により、陰性選択で非フレームシフト変異体を除去して、ガンシクロビルに対して選択することができる。細胞が同質となり、本発明の製造方法による多様化に供される際には、残存する不所望のフレームシフト変異体を、陽性選択遺伝子、例えばハイグロマイシンホスホトランスフェラーゼ及びハイグロマイシンB等で除去することができる。しかし、本開示にて上述したように、他の選択マーカーも使用可能である。
本発明の方法の工程c)において、前記不活性化突然変異が除去された細胞が、選択及び/又は濃縮(例えば濃縮)される。前記不活性化突然変異が除去された細胞の選択及び/又は濃縮は、選択を更に少なくとも1回(例えば1~10回、例えば3回)実施することで、更に改善することができる。例えば、工程c)で選択/濃縮された細胞を培養し、所望のフラクション(例えば最も高いタンパク質発現を示す1~30%の細胞、例えば5%の細胞)を選択して更に培養してもよい。斯かる手順を1~10回、例えば3回繰り返すことができる。所期のタンパク質が蛍光タンパク質である場合、又は蛍光タンパク質を含む融合タンパク質の場合、最も高いタンパク質発現を示す1~30%の細胞の選択は、例えば、最も高い蛍光を示す1~30%の細胞を、例えばFACS等により選択することで実施できる。
工程c)により選択される細胞は、工程a)で誘導されたDSB又は一本鎖ニックの修復により、所期のタンパク質をコードする遺伝子内の前記不活性化突然変異が除去された細胞を含み、或いはこうした細胞からなる。ここで前記不活性化突然変異の除去とは、好ましくは、所期のタンパク質の突然変異体が発現されるように、所期のタンパク質をコードする不活性化された単一のコピーの配列が改変されることを意味する。以下に詳述するように、前記突然変異体は所期のタンパク質に対して、少なくとも80%の配列同一性を有する。従って、完全に異なるタンパク質(例えば所期のタンパク質をコードする遺伝子のリーディングフレームとは異なるリーディングフレームの転写により生じたタンパク質)は、所期のタンパク質の突然変異体とは見做されない。上述したように、前記不活性化突然変異により、活性が低下しているか、或いは活性を全く有さない、所期のタンパク質の変異体が発現されてもよい。この場合、前記不活性化突然変異を除去することで、前記所期のタンパク質の突然変異体の少なくとも一部において、所期のタンパク質の活性が回復する。しかし、本開示にて提供される方法では、前記所期のタンパク質の幾つかの異なる突然変異体が産生されるところ、これらの突然変異体の多くは通常、改善対象となるタンパク質活性の面では非機能的である。例えば、前記不活性化突然変異の除去により、対応する所期のタンパク質の活性の少なくとも80%、より好ましくは少なくとも90%、更に好ましくは少なくとも95%、更に好ましくは少なくとも98%、更に好ましくは少なくとも99%、更に好ましくは少なくとも100%の活性を有する、所期のタンパク質の突然変異体が発現される。最も好ましくは、突然変異体が所期のタンパク質の活性の100%超(例えば少なくとも101%、少なくとも110%、少なくとも120%、又は少なくとも150%)の活性を有することである。
本開示にて提供される製造方法の工程d)においては、前記所期のタンパク質の複数の異なる突然変異体を発現する細胞のパネルが提供される。所期のタンパク質のアミノ酸配列は、不活性化突然変異を有さない所期の遺伝子によりコードされる。換言すれば、所期のタンパク質(本開示では「野生型の所期のタンパク質」とも称する)とは、工程a)の細胞における所期のタンパク質をコードする遺伝子が不活性化突然変異を含まなければコードしていたであろうタンパク質である。所期のタンパク質の別名は「野生型の所期のタンパク質」であるものの、原則としては特定のタンパク質の既知の突然変異体であってもよい。例えば、特性の改善されたタンパク質の突然変異体が本技術分野で公知であってもよく、その場合には、斯かる既知の突然変異体に対して更なる突然変異を加えることで、より優れた性能のタンパク質が生じるか否かを検証することが望ましい。
従って、所期のタンパク質は、本開示にて提供される手段及び方法において変異対象となる任意のタンパク質であり得る。所期のタンパク質としては、例えば蛍光タンパク質、抗体、酵素、成長因子、サイトカイン、ペプチドホルモン、転写因子、RNA結合タンパク質、細胞骨格タンパク質、イオンチャンネル、Gタンパク質結合受容体、キナーゼ、ホスファターゼ、シャペロン、トランスポーター、又は膜貫通タンパク質等が挙げられる。所期のタンパク質は、酵素、抗体、又は蛍光タンパク質であることが好ましい。前記所期のタンパク質が蛍光タンパク質である場合、mNeonGreen、mRuby2/3、dTomato、TagRFP、Citrine、Venus、YPet、mTFP1、EGFP、Kusabira Orange、mOrange、mApple、mCerulean3、mTurquoise2、mCardinal、EosFP、Dronpa、Dreiklang、及び赤外iRFPからなる群より選択される蛍光タンパク質であってもよい。所期のタンパク質が蛍光タンパク質である場合、mNeonGreen2であることが好ましい。所期のタンパク質が抗体である場合、前記突然変異誘発標的部位は、斯かる抗体の重鎖又は軽鎖をコードする核酸配列のCDRコーディング領域内に存在することが好ましい。所期のタンパク質が酵素である場合、前記突然変異誘発標的部位は、前記酵素又は前記酵素の制御性サブユニットの活性中心をコードする核酸領域内に存在することが好ましい。
所期のタンパク質の突然変異体とは、所期のタンパク質のアミノ酸配列と同一ではないが、関連するアミノ酸配列を有するタンパク質である。特に、所期の突然変異体のアミノ酸配列は、所期のタンパク質のアミノ酸配列に対して、少なくとも80%、更に好ましくは少なくとも85%、更に好ましくは少なくとも90%、更に好ましくは少なくとも95%、更に好ましくは98%、最も好ましくは少なくとも99%の配列同一性を有していてもよい。本発明の製造方法の一側面によれば、工程d)により提供される細胞のパネルに含まれる細胞が発現する、前記所期のタンパク質の複数の異なる突然変異体は、所期のタンパク質と比較して、1又は2以上のアミノ酸の交換、1又は2以上のアミノ酸の挿入、及び/又は 1又は2以上のアミノ酸の欠失を含む。前記1又は2以上のアミノ酸の交換は、例えば少なくとも1、例えば少なくとも2、少なくとも3、又は少なくとも5のアミノ酸の交換とすることができる。同様に、前記1又は2以上のアミノ酸の挿入は、例えば少なくとも1、例えば少なくとも2、少なくとも3、又は少なくとも5アミノ酸の挿入とすることができる。同様に、前記1又は2以上のアミノ酸の欠失は、例えば少なくとも1、例えば少なくとも2、少なくとも3、又は少なくとも5アミノ酸の欠失とすることができる。
好ましくは、前記所期のタンパク質の突然変異体のアミノ酸配列は、所期のタンパク質と比較して、1又は2以上のアミノ酸置換(即ち交換)、1又は2以上のアミノ酸の挿入、及び/又は、1又は2以上のアミノ酸の欠失を有する他は、所期のタンパク質のアミノ酸配列と同一である。これら1又は2以上のアミノ酸の置換、挿入、及び/又は欠失は、突然変異誘発標的部位に生じる。置換、挿入、及び/又は欠失されるアミノ酸の数は、例えば1~25アミノ酸、好ましくは1~20アミノ酸、より好ましくは1~15アミノ酸、更に好ましくは1~12アミノ酸、更に好ましくは1~5アミノ酸、最も好ましくは3~5アミノ酸とすることができる。
本開示にて提供される製造方法の工程d)により提供される細胞のパネルは、複数の異なるドナー核酸テンプレート内の、所期のタンパク質をコードする遺伝子内の前記突然変異誘発標的部位に対応する位置に含まれる複数の異なる突然変異を、突然変異誘発標的部位に含む細胞を濃縮することが好ましい。突然変異誘発標的部位に対応する位置は、例えば、本開示の別の場所で言及され、及び/又は、本技術分野で公知である、配列アラインメント法により決定することができる。好ましくは、細胞のパネル内で濃縮される細胞は、工程b)で提供される複数の異なるドナー核酸テンプレートのライブラリーのドナー核酸テンプレートとの相同組換えにより、前記DSB又は一本鎖ニック(好ましくはDSB)のHDRが生じた細胞であることが好ましい。換言すれば、本発明の方法の工程d)により提供される細胞のパネルは、所期の遺伝子に変異を形成した変異体によりコードされる前記所期のタンパク質の複数の異なる突然変異体を発現する細胞を濃縮することが好ましい。特に、上述したように、本開示にて提供される製造方法の工程a)では、所期の遺伝子が不活性化突然変異を含む。即ち、所期のタンパク質の活性が低下し、及び/又は、発現が低下する。所期のタンパク質が全く発現されないことが好ましい。本開示にて提供される製造方法の工程b)では、ドナー核酸テンプレートを提供することでHDRが生じ、これにより不活性化突然変異が除去される。結果として、所期のタンパク質の活性及び/又は発現が回復される。更に、ドナー核酸テンプレートに含まれる突然変異が、HDRにより所期のタンパク質に導入される。所期の遺伝子の突然変異誘発標的部位に突然変異が導入される。従って、d)で提供される細胞のパネルは、提供された複数の異なるドナー核酸テンプレートのライブラリーのドナー核酸テンプレートを用いて、誘導されたDSB又は一本鎖ニックのHDRが生じた細胞を含み、或いは斯かる細胞が濃縮されテイルことが好ましい。工程d)により提供される細胞のパネルは、少なくとも4%、好ましくは少なくとも6%、より好ましくは少なくとも8%、更に好ましくは少なくとも12%、更に好ましくは少なくとも15%、更に好ましくは少なくとも20%、更に好ましくは少なくとも30%、更に好ましくは少なくとも40%、更に好ましくは少なくとも50%、最も好ましくは少なくとも60%の細胞が、複数の異なるドナー核酸テンプレートに含まれる突然変異のうちの一つを、突然変異誘発標的部位に含むことが好ましい。
本開示にて提供される方法において、複数の異なるドナー核酸テンプレートのライブラリーを使用することにより、得られる細胞のパネルは、前記所期のタンパク質の複数の異なる突然変異体を含む。従って、本開示にて提供される製造方法では、工程d)において提供される前記細胞のパネルが、前記所期のタンパク質の複数の異なる突然変異体を発現する細胞のプールを含み(或いは、好ましくは斯かる細胞のプールであり)、ここで各細胞において、前記複数の異なる突然変異体のうちの一つが、単一の遺伝子コピーから発現される。従って、前記作製された細胞のパネルが、所期のタンパク質の異なる突然変異体を発現する異なる複数の細胞を含む。前記の異なる複数の細胞を一つのプールとして培養してもよい。或いは、前記異なる複数の細胞を個別に培養してもよい。これらの細胞を個別に培養することで、所期のタンパク質の個別の突然変異体の精製及び/又は分析が容易となる。従って、本開示にて提供される製造方法の一側面によれば、工程d)において提供される前記細胞のパネルは、それぞれ異なる突然変異体を発現する細胞が個別に培養された細胞のライブラリーである。本発明のこの側面によれば、本開示にて提供される製造方法は更に、工程c)とd)との間に、工程c)で選択及び/又は濃縮された細胞から、それぞれ異なる突然変異体を発現する細胞を分離する工程を含んでいてもよい。
本発明によれば、(作製された細胞のパネルに含まれる)前記所期のタンパク質の1又は2以上の突然変異体の核酸及び/又はアミノ酸配列を決定してもよい。所期のタンパク質の突然変異体のヌクレオチド又はアミノ酸配列の分析は、生成された突然変異を決定し、及び/又は、所望の突然変異体をクローニングするのに有用である。従って、本発明の一側面によれば 本開示にて提供される製造方法 更に、工程c)で選択及び/又は濃縮され、或いはd)で提供された細胞に含まれる、前記所期のタンパク質の前記複数の異なる突然変異体をコードする遺伝子の1又は2以上の核酸配列を決定すること、或いは、工程c)で選択及び/又は濃縮され、或いはd)で提供された細胞に含まれる、前記所期のタンパク質の前記複数の異なる突然変異体の1又は2以上のアミノ酸配列を決定することを含む。
前記細胞のパネル(別名「細胞ライブラリー」又は「細胞集団」)は、100,000から数十億の細胞を含むことが好ましい。例えば、FACSの場合、通常は2~3億個の細胞(例えば100,000,000~300,000,000個の細胞)が使用される。パニングの場合、例えば1mL当たり約500,000個の細胞を含むリットル単位の懸濁細胞培養が使用されうる。従って、パニングの場合、数十億の細胞が適用されうる。本発明の方法で使用される細胞は、細胞修復、例えばHDR(特に相同組換え)が生じうる限り、原則としてどのような細胞であってもよい。斯かる細胞は本技術分野で周知である。全ての2倍体生物(複製細菌や複製単数体酵母のように、たとえ2倍体性が一過的なものであったとしても)において、原則としてHDRを誘導することができる。例えば、本開示にて提供される手段及び方法によれば、細胞は(例えばHDR、特に相同組換えが生じうる)如何なる原核細胞又は(例えばHDR、特に相同組換えが生じうる)如何なる真核細胞であってもよい。例えば、本発明で使用される細胞は、例えば酵母細胞、(例えばHDR、特に相同組換えが生じうる)非哺乳類脊椎動物細胞、(例えばHDR、特に相同組換えが生じうる)植物細胞、(例えばHDR、特に相同組換えが生じうる)昆虫細胞、又は(例えばHDR、特に相同組換えが生じうる)哺乳類細胞からなる群より選択される。好ましくは、哺乳類細胞又は非哺乳類脊椎動物細胞が使用される。最も好ましくは、哺乳類細胞が使用される。特に好ましい非哺乳類脊椎動物細胞は、DT-40細胞である。これは、トリ白血病ウイルスによりホワイトレグホーン(white leghorn)種の鶏に誘導された滑液嚢リンパ腫由来のB細胞系列の細胞である。本発明での使用に特に好ましい哺乳類細胞としては、HEK293細胞(別名として、ヒト胚性腎293細胞、HEK-293、293細胞、293T細胞又はHEK細胞と呼ばれる場合もある)、リンパ腫細胞系(例えばNS0、Sp2/0-Ag14)、白血病細胞系、ジャーカット(Jurkat)細胞、チャイニーズハムスター卵巣(Chinese hamster ovary:CHO)細胞、HeLa細胞、PC12細胞、抗体産生ハイブリドーマ細胞系、不死化ヒトB細胞系、又は本技術分野で公知の他の不死化ヒト細胞系等が挙げられる。
本開示にて提供される製造方法では、培養期間は、使用される個々の細胞型に応じて調整すればよい。HDRの誘導後の培養期間(即ち工程a)及びb)の後の培養期間)の間に、前記所期のタンパク質の突然変異体の発現が生じる。その後、本開示にて提供される製造方法の工程c)において、所期のタンパク質を(例えば所期のタンパク質及びマーカータンパク質を含む融合タンパク質の形で)含む細胞を選択及び/又は濃縮することができる。例えば、細胞が哺乳類細胞である場合、工程a)及びb)の後に、斯かる細胞を少なくとも48時間、好ましくは少なくとも72時間最も好ましくは少なくとも96時間に亘って培養すればよい。本開示において記載するように、工程a)及びb)は同時に実施することが好ましい。従って、工程a)及びb)を同時に実施した後に、上述の培養期間を設けることが好ましい。
本開示にて提供される製造方法で製造される細胞のパネルは、前記野生型の所期のタンパク質と比較して、第一の活性が改善された、及び/又は、新たな活性を有する、(所期のタンパク質の)突然変異体を発現する細胞を含んでいてもよい。従って、本開示にて提供される方法の工程d)において細胞のパネルを提供した後、第一の活性が改善された、及び/又は、新たな活性を有する突然変異体を特異的に濃縮するための更なる工程e)を実施してもよい。従って、本発明の一側面は、本開示にて提供される製造方法であって、前記所期のタンパク質の前記複数の突然変異体前記野生型の所期のタンパク質と比較して、第一の活性が改善されてなり、及び/又は、新たな活性を有してなり、ここで前記方法が更に、e)前記の細胞のパネルから、第一の活性が改善されてなり、及び/又は、新たな活性を有してなる、前記所期のタンパク質の突然変異体を発現する第二の細胞のパネルを選択及び/又は濃縮することを含む方法に関する。
或いは、本開示にて提供される製造方法の工程c)において、改善された第一の活性及び/又は新たな活性を直接、特に前記改善された第一の活性及び/又は新たな活性を有する突然変異体を発現する細胞の選択及び/又は濃縮に用いてもよい。例えば、所期のタンパク質が蛍光タンパク質である場合、本開示にて提供される方法の工程c)において、改善された蛍光(例えば改善された第一の活性)を有する前記所期のタンパク質の突然変異体を発現する細胞を、選択的に濃縮してもよい。
従って、本発明の更なる側面は、本開示にて提供される製造方法であって、前記所期のタンパク質の複数の突然変異体前記野生型の所期のタンパク質と比較して、第一の活性が改善されてなり、及び/又は、新たな活性を有してなり、ここで工程c)が、前記野生型の所期のタンパク質と比較して、第一の活性が改善されてなり、及び/又は、新たな活性を有してなる、前記所期のタンパク質の突然変異体を選択及び/又は濃縮することを含む方法に関する。
本開示にて提供される製造方法は、所期のタンパク質と比較して異なる活性又は改変された活性を有する(所期のタンパク質の)突然変異体のスクリーニングを可能とする点で有利である。従って、本発明は、前記野生型の所期のタンパク質と比較して異なる又は改変された(例えば生物学的)活性を有する所期のタンパク質の複数の突然変異体をスクリーニングするための方法、即ち、同定するための方法であって、
a)本発明の製造方法により得られた前記の細胞のパネルから、第一の活性が改善されてなり、及び/又は、新たな活性を有してなる、前記所期のタンパク質の突然変異体を発現する、第二の細胞のパネルを選択及び/又は濃縮し、
b)前記第二のパネルにより発現される前記所期のタンパク質の突然変異体のアミノ酸配列を決定し及び/又は前記第二のパネルにより発現される前記所期のタンパク質の突然変異体をコードする遺伝子の核酸配列を決定する
ことを含む方法を提供する。
上述のように、本開示にて提供される製造方法の工程c)において、改善された第一の活性及び/又は新たな活性を直接、改善された第一の活性及び/又は新たな活性を有する突然変異体を発現する細胞の選択及び/又は濃縮に使用してもよい。従って、本発明は、前記野生型の所期のタンパク質と比較して異なる又は改変された(例えば生物学的)活性を有する、所期のタンパク質の複数の突然変異体をスクリーニングするための、即ち、同定するための更なる方法であって、
a)本開示にて提供される製造方法において、工程c)が、前記野生型の所期のタンパク質と比較して、第一の活性が改善されてなり、及び/又は、新たな活性を有してなる、前記所期のタンパク質の突然変異体を選択及び/又は濃縮することを含み、更に、
b)前記野生型の所期のタンパク質と比較して、第一の活性が改善されてなり、及び/又は、新たな活性を有してなる、前記所期のタンパク質の突然変異体の少なくとも1つのアミノ酸配列を決定し;及び/又は前記野生型の所期のタンパク質と比較して、第一の活性が改善されてなり、及び/又は、新たな活性を有してなる、前記所期のタンパク質の突然変異体をコードする遺伝子の少なくとも1つの核酸配列を決定する
ことを含む方法を提供する。
本開示にて提供される製造方法又は本開示にて提供されるスクリーニング方法は更に、前記野生型の所期のタンパク質と比較して異なる又は改変された生物活性を有する、前記所期のタンパク質を発現させること、及び、任意により斯かる細胞を採取することを含んでいてもよい。前記野生型の所期のタンパク質と比較して、第一の活性が改善された、及び/又は、新たな活性を有する突然変異体を発現する細胞を選択及び/又は濃縮するために使用できる方法として、本技術分野では幾つかの方法が公知である。例えば、前記野生型の所期のタンパク質と比較して、第一の活性が改善されてなり、及び/又は、新たな活性を有してなる、前記所期のタンパク質の突然変異体の選択及び/又は濃縮は、例えばFACS、磁気活性化細胞選別法、マイクロ流体細胞選別法、及び/又は、ビーズを用いた細胞単離法等を用いて実施することができる。
上述のように、「所期のタンパク質」(protein of interest)及び「野生型の所期のタンパク質」(wild-type protein of interest)という語は、本開示では相互交換可能に使用され、本開示にて提供される方法において突然変異型性の対象となるタンパク質を指す。従って、斯かる既知の変異体を更に修飾することが所望される場合には、「野生型の所期のタンパク質」という語は、特定のタンパク質の既知の変異体を指す場合もある。本開示において「第一の活性」(first activity)とは、新たに同定される又は本技術分野で公知の所期のタンパク質の活性を指す。本開示において「新たな活性」(new activity)という語は、前記「第一の活性」とは異なる更なる活性を意味する。従って、「新たな活性」とは、「第一の活性」とは異なる活性であれば、新たに同定される活性であってもよく、本技術分野で公知であってもよい。異なる活性又は改変された活性は、増加した活性であることが好ましい。例えば、増加した活性を有する所期のタンパク質の複数の突然変異体は、野生型の所期のタンパク質の当該活性と比較して、例えば少なくとも101%、好ましくは少なくとも110%、より好ましくは少なくとも120%、又は最も好ましくは少なくとも150%の活性を有していてもよい。
例えば、本開示にて提供される製造方法又はスクリーニング方法の一側面によれば、前記所期のタンパク質が蛍光タンパク質であると共に、前記第一の活性及び/又は前記新たな活性(例えば前記第一の活性)は、蛍光である。細胞を蛍光に基づいて選別する方法は、本技術分野では周知であり、例えばFACS等が挙げられる。本開示にて提供される製造方法又はスクリーニング方法の他の側面によれば、所期のタンパク質が抗体であると共に、前記第一の活性及び/又は前記新たな活性(例えば前記第一の活性)が抗原結合性である。前記抗体の潜在的な「新たな活性」としては、例えば他の生物内の対応する抗原に対する交差反応性などが挙げられる。ヒト抗原に対する抗体であって、非ヒト動物の対応する抗原に対する交差反応性を有する抗体は、前臨床動物実験を実施する際に望ましい。本開示にて提供される製造方法又はスクリーニング方法の他の側面によれば、前記所期のタンパク質が酵素であると共に、前記第一の活性及び/又は前記新たな活性 (例えば前記第一の活性)が前記酵素の酵素活性である。タンパク質のプールから所望の活性を有する細胞を同定するための方法は、本技術分野で周知であり、例えばWojcik, 2015, Int. J. Mol. Sci. 16: 24918-24945; and Xiao, 2015, Ind. Eng. Chem. Res. 54: 4011-4020等に記載されている。
上述のように、本開示にて提供される手段及び方法によれば、所期のタンパク質は、例えば抗体であってもよい。例えば、天然変異体と比較して新たな特異性又はより高い親和性を有するFab断片、単一鎖抗体、又は全長IgG等の遺伝子操作及び選択において、本発明は多数の利点を提供する。
この目的のために、Fab断片、単一鎖抗体、又は軽鎖及び重鎖IgGをコードする遺伝子を、細胞内に単一コピーとして挿入してもよい。本開示にて上述及び後述するように、フレームシフト又は他の不活性化突然変異を、前記突然変異誘発標的部位の近傍に挿入してもよい。この例では、前記突然変異誘発標的部位は、CDR(complementarity determining regions:相補性決定領域)をコードする領域内、即ち、抗原結合ドメインの領域内に位置することが好ましい。しかし、前記突然変異誘発標的部位は、抗体機能に影響を及ぼす他の部位に存在してもよい。必要であれば(例えば、ヒト細胞系においてヒト化抗体遺伝子を多様化するなどの場合には)、外因性遺伝子のみが多様化されるように、内因性抗体遺伝子配列とはコドンを区別してもよい。
まずはライブラリーから、リーディングフレームが有効に回復した細胞、及び/又は、融合されたマーカー遺伝子(例えば蛍光タンパク質又は抵抗性マーカー)が生成した細胞をスクリーニングする。抗体ライブラリーによる効率的な提示及びその後のスクリーニングのために、表面ディスプレイ技術を用いて、抗体変異体が細胞表面に発現させてもよい。所期のタンパク質をコードする遺伝子カセットの単一コピーを細胞ゲノム内に挿入する前に、抗体変異体を細胞表面に移送するための標的化配列を、斯かる遺伝子カセットに付加してもよい。斯かる技術は非常に強力なツールとなっており、例えばFab断片、単一鎖抗体、又は全長IgGを、細胞、例えば哺乳類細胞、例えばHEK293細胞の表面に機能的に提示させる上で有効である。有効なディスプレイ及びスクリーニングのためのプロトコールは、本技術分野では標準的であり、例えばHo, 2008, Methods in Molecular Biology, 525: pp 337-352; and Zhou, 2012, Methods in Molecular Biology, 907: 293-302により提供されている。斯かる表面ディスプレイ抗体ライブラリーのスクリーニングは、例えばFACS選別により行うことができる。
この目的のために、フルオロフォア結合抗原を用いて、斯かる特定の抗原に親和性を有する抗体を提示する細胞のみを標識することができる。FACS選別を行うことで、これらの細胞を収穫することができる。スクリーニングを繰り返し実施することで、ストリンジェンシーを上昇させることができる。ここで非標識抗原の量を増やして細胞を洗浄し、更にFACSによる選別を行ってもよい。これにより、所与の抗原に対して高い親和性を有する変異体を同定することが可能となる。
或いは、パニングアプローチにより、所望の抗体を同定することも可能である。この目的のためには、例えば、特定の表面に所望の抗原を結合させればよい。この表面上で、抗体ライブラリーを細胞表面に発現する細胞をインキュベートする。有効な抗体を発現する細胞は当該表面に結合する。非結合細胞を洗い落とし、加える可溶性抗原を増やして更に洗浄を繰り返すことで、ストリンジェンシーを上昇させることができる。数回の洗浄の後、表面に結合して残った細胞を、トリプシン処理等の適切な方法で採集し、回収すればよい。
選択された抗体変異体をコードする遺伝子を単離するには、これらの細胞からポリA-RNAを調製し、RT-PCRを実施してこれらの遺伝子をcDNAへと転写すればよい。その後、それらを適切なベクターにサブクローニングして、更なる分析に供すればよい。
上述のように、本開示にて提供される製造方法によれば、非所望の突然変異のバイアスを受けることなく、細胞ライブラリー(即ち細胞のパネル)を効率的に産生できる点で有利である。従って、作製された細胞ライブラリー内では、複数のアミノ酸がそれらのコドン占有率に応じた割合で、ランダムに挿入、欠失、及び/又は置換されている。しかし、所望の突然変異のバイアスを誘導するよう特別に設計されたドナー核酸テンプレートを用いることにより、所望の突然変異のバイアスをプログラムすることも可能である。従って、本開示にて提供される細胞ライブラリーは、突然変異のバイアスを有さない、特定の部位がランダムに改変された突然変異体、又は、特定のドナー核酸テンプレートを有することにより生成された所望の突然変異のバイアスを有する、特定の部位がランダムに改変された突然変異体を含む。結果として、本開示にて提供される細胞ライブラリーは、広範なバリエーションを有する。
例えば、本開示にて提供される製造方法を用いれば、例えば僅か8アミノ酸という小さな領域を標的化した場合でも、結果として250億を超える変異体のライブラリーを得ることができる。斯かる大規模なプールからライブラリーを作製するので、重複は殆ど生じない。
これに対して、従来技術の突然変異誘発方法、例えばエラープローン(Error Prone)PCR等では、バイアスを排したコドンの使用は不可能である上に、より重要な点として、PCR複製プロセスゆえに冗長性が極めて高くなってしまう(即ち、ライブラリーの大部分を同一変異体の多数のコピーが占めることとなる)。これにより、スクリーニングの手間の大部分が無駄になってしまう。エラープローン(Error Prone)PCRは、例えばFirth, 2005, Bioinformatics 21(15): 3314-3315に記載されている。本文献の実験によれば、1億個の変異体のライブラリーの中で、6以上の突然変異を有する変異体は僅か約100,000にすぎず、550万もの複製が生じていることになる。
本開示にて提供される製造方法により作製される細胞ライブラリーは、従来技術の細胞ライブラリー、例えば欧州特許公開第2319918A1号等に開示の細胞ライブラリーとは顕著に異なる。本文献では、多様化された配列をレンチウイルスプラスミドにクローン化してレンチウイルスを生成し、これを細胞に感染させて安定に組み込ませる。欧州特許公開第2319918A1号では、レンチウイルスがゲノム内の異なる部位に組み込まれているため、異なる複数の細胞内で発現されたレンチウイルスによりコードされるタンパク質は、(隣接する制御性配列が異なるために)強い変動要因に晒されることになる。これに対して、本開示にて提供される方法により作製される細胞ライブラリーでは、多様化された(即ち説く禅変異を生じさせた)所期のタンパク質は、同一のゲノム遺伝子座から発現されるために、異なる複数の細胞内で発現されたタンパク質であっても、高い再現性及び比較可能性を有することになる。更に、(欧州特許公開第2319918A1号に記載のように)DNAライブラリーを大型のレンチウイルスプラスミドにクローニングするのは、極めて効率が悪く、惹いては、作製される所期のタンパク質の変異体(即ち突然変異体)の多様性も大幅に損なわれることになる。従って、本発明の方法により提供される細胞ライブラリーの方が、所期のタンパク質の異なる変異体をより多く含むことになる。更に、欧州特許公開第2319918A1号に記載のレンチウイルスを用いた方法では、小型のタンパク質しか多様化できない。
本開示にて提供される製造方法を用いると、例えば6つのアミノ酸位置をランダム化する場合、以下の式で計算されるように、1000万個の変異体のライブラリーを得ることができる。
ここで
pは被覆率(Coverage)
sは試料の数、
nは変異体の数である。
p=14.47%、即ち9.26百万(p×n)個の異なる変異体が、1千万のプールから得られることになる。
従って、本開示にて提供される細胞ライブラリーでは、一細胞集団当たりの異なる突然変異体の数は、従来技術の細胞ライブラリーと比較して多くなる。従って、提供される細胞ライブラリーは、本技術分野で公知の細胞ライブラリーと比較して、特性の改善された所期のタンパク質の複数の突然変異体をより効率的にスクリーニングするツールとなる点で有利である。従って、本発明の更なる側面は、本開示にて提供される方法により得られる細胞ライブラリーに関する。
本発明によれば、本開示にて提供される細胞ライブラリーを、前記野生型の所期のタンパク質と比較して異なる又は改変された生物活性を有する、所期のタンパク質の複数の突然変異体の同定に使用してもよい。同定された所期のタンパク質の突然変異体は、ホワイト・バイオテクノロジーに適用することができる。例えば、同定される突然変異体は、疾患の処置、即ち治療及び/又は予防に使用される抗体であってもよい。また、同定される突然変異体は、例えば生分解性プラスチック等の工業生産等に使用される酵素であってもよい。改変された酵素(例えばセルラーゼ)の変異体を、繊維や紙の産生に使用してもよい。或いは、同定された酵素の突然変異体を、バイオ燃料の製造に使用してもよい。例えば、バイオテクノロジーによって製造されたエタノールを、ガソリンの代替燃料として使用することができる。また、所期のタンパク質は、疾患の処置に有用となるように改変したサイトカイン又は成長因子であってもよい。
本開示にて提供される方法を実現する手段は、キットの一部であってもよく、これを用いて本開示にて提供される細胞のパネル(即ち細胞のライブラリー)を作製してもよい。従って、本発明は、
(i)所期の遺伝子を1コピーのみ含む細胞、
(ii)本開示にて定義した複数の異なるドナー核酸テンプレートのライブラリー、及び/又は
(iii)部位特異的ヌクレアーゼ又はニッカーゼ、或いは、部位特異的ヌクレアーゼ又はニッカーゼをコードするポリヌクレオチド
を含むキットに関する。
本発明のキットにおいて、所期の遺伝子は、本開示において記載する不活性化突然変異を含んでいてもよい。本発明のキットは更に、(1又は2以上の)反応緩衝剤、保存溶液、洗浄溶液、及び/又は、本開示に記載される方法の実施に必要なその他の試薬若しくは材料を含む。更に、本発明のキットの要素を、個別のバイアル又はボトルに梱包してもよく、或いは、容器又はマルチコンテナーユニットに纏めて梱包してもよい。斯かるキットは更に、使用指示書を含んでいてもよい。本発明のキットは、標準的な手順により製造することが好ましい。斯かる手順は当業者には既知である。上述したように、本開示にて提供されるキットは、本開示にて提供される方法を実施するのに、特に本発明の細胞ライブラリーを製造する方法の実施に有用である。
本発明では、「同一性」(identity)又は「%同一性」(percent identity)という語は、アミノ酸又はヌクレオチド配列が、本開示に示す配列に対して、例えば少なくとも80%、好ましくは少なくとも90%、より好ましくは少なくとも95%、更に好ましくは少なくとも98%、更に好ましくは少なくとも99%の同一性を有することを意味する。ここで、同一性の値が高い配列ほど、同一性の値が低い配列と比較して好ましい。本発明によれば、2以上の核酸又はアミノ酸配列に関して「同一性」又は「%同一性」とは、比較ウィンドウ内で最大限対応するよう比較及びアラインした場合に、或いは本技術分野で公知の配列比較アルゴリズムを用いて指定領域内を測定した場合に、或いは手動でアラインメントし、目視で検証した場合に、2以上の配列が同一であるか、指定された百分率のアミノ酸残基又はヌクレオチドが同一である(例えば、例えば配列番号19~25の何れかのアミノ酸配列と、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも98%、又は少なくとも99%同一である)ことを意味する。前記指定の同一性は、全長のアミノ酸又はヌクレオチド全体に亘って存在することが好ましい。
本技術分野では公知のように、当業者であれば、種々のアルゴリズム、例えばCLUSTALWコンピューター プログラム(Thompson, 1994, Nucl Acids Res, 2: 4673-4680)又はFASTDB(Brutlag, 1990, Comp App Biosci, 6: 237-245)等を用いて、複数の配列間の%同一性を決定する手法を理解しうる。また、当業者であれば、BLAST及びBLAST 2.0 アルゴリズムも利用可能である(Altschul, 1997, Nucl Acids Res 25: 3389-3402; Altschul, 1993, J Mol Evol, 36: 290-300; Altschul, 1990, J Mol Biol 215: 403-410)。例えば、BLAST 2.0(BLASTはBasic L℃al Alignment Search Toolの略称:Altschul, 1997, loc. cit.; Altschul, 1993, loc. cit.; Altschul, 1990, loc. cit.)を用いて、局所的な配列アラインメントを行うことができる。上述のBLASTによれば、両ヌクレオチド配列及びアミノ酸配列のアラインメントを行って配列の類似性を決定することができる。BLASTはアラインメントの局所性ゆえに、同様の配列の正確なマッチ及び同定に特に有用である。BLASTを用いた類似のコンピューター技術(Altschul, 1997, loc. cit.; Altschul, 1993, loc. cit.; Altschul, 1990, loc. cit.)を用いて、例えばGenBankやEMBL等のヌクレオチドデータベースにおける同一または関連する分子の検索を行うことも可能である。
本明細書で使用される「標的配列特異的CRISPR RNA」(target sequence specific CRISPR RNA)又は「crRNA」という語は、本技術分野では一般に知られている語であり、例えばRan, 2013, Nature Protocols 8 (11): 2281-2308等に記載されている。crRNAは通常、長さ10~30、好ましくは15~25(例えば約20)ヌクレオチドの標的配列に対して相補的な(或いは標的配列の一部に対して相補的な)配列を、長さ21~46ヌクレオチドの2つのダイレクトリピート(direct repeats:DR)に挟まれた状態で含む。crRNAの3'に配置されたDRは、対応するtracrRNAに相補的で且つそれにハイブリダイズする。そのtracrRNAは、Cas9タンパク質にハイブリダイズする。SpCas9又はSaCas9ヌクレアーゼとの使用に好ましいDR配列は、配列番号11(即ちGTTTTAGAGCTA)に示す配列である。他の細菌種のCas9ヌクレアーゼと共に機能するDR配列は、Deltcheva, 2011, Nature, 471: 602-607に示すように、それぞれのCRISPR/Casオペロンに生じる配列リピートのバイオインフォマティクス分析、及び、Cas9ヌクレアーゼ及びtracrRNAと仮想的DR配列で挟まれた標的配列との実験的結合試験で同定される。
本明細書で使用する場合、「トランス活性化crRNA」(trans-activating crRNA)又は「tracrRNA)」という語は、本技術分野で周知であり、例えばHsu, 2014, Cell 157: 1262-78, Yang, 2014, Nature Protocols, 9:1956-1968 and Heidenreich, 2016, Nature Reviews Neurosciences, 17: 36-44に記載されている。「tracrRNA」とは、crRNAと相補的且つ塩基対をなす小型RNAであり、これによりcrRNArとRNA二本鎖を形成する。また、tracrRNAは、pre-crRNAと相補的且つ塩基対をなす小型RNAであってもよい。ここで、このpre-crRNAは、RNA特異的リボヌクレアーゼによって切断され、crRNA/tracrRNAハイブリッドを形成する。特に、この「tracrRNA」は、crRNA又はpre-crRNAのパリンドロミック・リピートに相補的な配列を含む。これにより、ダイレクトリピートを有するcrRNA又はpre-crRNAとハイブリダイズすることができる。このcrRNA/tracerRNAハイブリッドは通称「ガイドRNA」といい、侵入した核酸をCas9ヌクレアーゼが切断するのを補助する。SpCas9又はSaCas9ヌクレアーゼと使用するのに好ましいtracrRNA配列を、本開示では配列番号12に示す(即ちTAGCAAGTTAAAATAAGGCTAGTCCGTTTTTである)。
所望の標的配列 (例えばa 所望の突然変異誘発標的部位)を標的とする少なくとも1つの標的配列特異的crRNA及び少なくとも1つのtracrRNA(即ち単一ガイドRNA、sgRNA)を含むキメラRNA分子は、常用の技術を用いて容易に設計することができる。例えば、sgRNAは、PAM部位に隣接する配列(例えばSpCas9の場合はNGG)に対して相補的な、長さ少なくとも17ヌクレオチド(例えば約19塩基対)の配列を含んでいてもよい。加えて、sgRNAは、前記細胞のゲノム内の配列とは(所期の遺伝子を除いて)実質的に相動性を有しないことが好ましい。例えば、斯かるキメラRNAは、例えばJinek, Science, 337: 816-821に示すものであってもよい。単一ガイドRNAを得るための更なる方法は、Ran, 2013, Nat Protoc 8 2281-2308に記載されている。特に、単一ガイドRNAをバイアスのないゲノムワイド分析により設計し、Cas9によるオフ標的開裂の可能性を最小化してもよい(Ran, 2013, Nat Protoc 8 2281-2308)。このためにオンラインツール(例えばCRISPR設計ツール、http://crispr.mit.edu/)を用いてもよい。
当業者であれば、所望の標的配列(例えば所望の突然変異誘発標的部位)を標的とする二重ガイドRNA(即ち、少なくとも1つの標的配列特異的CRISPR RNA(crRNA)分子及び少なくとも1つのtracrRNA分子を含むガイドRNA)を設計する方法を、容易に知ることができる。例えば、斯かる二重ガイドRNAの設計は、crRNA及びtracrRNAを個別に設計することにより行うことができる。crRNAは、標的配列に対して相補的な配列と、DR配列の部分または全体配列とを用いて設計することができる。tracrRNAの合成は、Jinek, Science, 337: 816-821に示す方法で行うことができる。
Cpf1ヌクレアーゼのためのガイドRNAの生成は、本技術分野で周知である。例えば、斯かるガイドRNAは、Zetsche, 2015, Cell, 163: 759-71に記載の方法で設計できる。斯かるcrRNAは、標的配列に対して相補的な(或いは標的配列の一部に対して相補的な)長さ10~30、好ましくは15~25ヌクレオチドの配列を含むと想定される。斯かるCpf1のためのcrRNAは、標的配列に対して相補的な(或いは標的配列の一部に対して相補的な)、長さ約20ヌクレオチドの配列と、それに続く長さ約19ヌクレオチドのヌクレオチド配列とを含むことが好ましい。この19ヌクレオチド配列は、ダイレクトリピート内の短いステムループ構造である。Cpf1は更なるtracrRNAを必要としない。
本開示において「相同標的化修復」又は「HDR」とは、通常は相同組換えにより実施される、細胞内でDSB又は一本鎖ニックを修復する機構を指す。例えばCong, 2013, Science 339 819-23; Pardo, 2009, Cellular and Molecular Life Sciences 66 (6): 1039-1056; Bolderson, 2009, Clinical Cancer Research, 15: 6314-6320を参照。即ち、「相同標的化修復」又は「HDR」という語は、好ましくは相同組換えを指す。HDR修復機構は、核内にDNAの騒動断片(即ちドナー核酸テンプレート)が存在する場合にのみ、細胞が使用することができる。相同DNA断片が不在だと、代わりに非相同末端連結(non-homologous end joining:NHEJ)と呼ばれる他のプロセスが生じうる。斯かる極めてエラー許容性(error-prone)の高いNHEJ経路は、種々の長さの挿入及び欠失(insertions and deletions:INDELS)を誘導することにより、フレームシフト突然変異を生じさせ、結果として遺伝子をノックアウトする。これに対して、HDR経路は、相同DNAドナーテンプレート(即ち、ドナー核酸テンプレート)と損傷を受けたDNA部位との間に精密な組換え事象を生じさせ、結果として一本鎖又は二本鎖切断が正確に修正される。従って、HDRは、突然変異又はトランス遺伝子をゲノム内に特異的に導入するのに使用される。斯かるドナー核酸テンプレート(通常はssODN)は、修復されるべき領域と相同な配列の領域を含む必要がある。相同組換えがHDRの優先的な手法と考えられているが、単鎖化したオリゴヌクレオチド(ssODN)を修復テンプレートとしてライブラリーに挿入する場合には、別の第二の機構がHDRに関与していることを示す証拠がある。Aarts and te Riel (2010, J. Cell. Mol. Med. 14(6B): 1657-1667)の教示は、オリゴ媒介性HDRが、複製フォークのコンテクストにおいて、ゲノム内の標的領域に対するオリゴヌクレオチドの相同性領域のアニーリングを伴うことを示している。本研究は、岡崎断片様のプライミングの関与を示唆している。即ち、複製フォークの進行の際に斯かるオリゴヌクレオチドが遺伝子標的部位物理的に組み込まれるものと考えられる。
「相同組換え」(homologous recombination)という語は、同様のヌクレオチド配列を含む二本のDNA鎖が遺伝材料を交換する遺伝子組換え機構を指す。細胞は相同組換えを、損傷を受けたDNAの修復、特に一本鎖又は二本鎖切断の修復のために使用する。相同組換えの機構は当業者には周知であり、例えばPaques, 1999, Microbiol Mol Biol Rev, 63: 349404に記載されている。
本発明の方法によれば、前記の部位特異的ヌクレアーゼ又はニッカーゼ(例えばCas9ヌクレアーゼ)が、工程a)の細胞内に存在し、或いは斯かる細胞内に導入されてもよい。例えば、前記の部位特異的ヌクレアーゼ又はニッカーゼは、タンパク質として存在し、或いは導入されてもよい。或いは、前記の部位特異的ヌクレアーゼ又はニッカーゼ(例えばCas9ヌクレアーゼ)は、前記タンパク質をコードするポリヌクレオチドの形態で導入されてもよい。当然ながら、斯かるポリヌクレオチドは、前記部位特異的ヌクレアーゼ又はニッカーゼ(例えばCas9ヌクレアーゼ)、及び/又は、前記ガイドRNAを、発現可能な形態でコードし、これが工程a)の細胞内で発現することにより、機能的な部位特異的ヌクレアーゼ又はニッカーゼと機能的なガイドRNAとが生じることになる。機能的なポリペプチド又はRNAの発現を実現する手段及び方法は、本技術分野で周知である。例えば、斯かるコーディング配列がベクター内、例えばプラスミド、コスミド、ウイルス、バクテリオファージ、又は遺伝子工学等で従来使用されている他のベクター内に存在していてもよい。斯かるベクターは、プラスミドベクターであることが好ましい。ベクター内に挿入されるコーディング配列は、例えば標準的な方法により合成することができ、或いは天然材料から単離することができる。斯かるコーディング配列は更に、転写制御要素、及び/又は、他のアミノ酸コーディング配列と連結されていてもよい。斯かる制御性配列は当業者には周知であり、例としては、限定されるものではないが、転写の開始を誘導する制御性配列、内部リボソーム侵入部位(internal ribosomal entry sites:IRES)(Owens, 2001, Proc Natl Acad Sei, USA, 98: 1471-1476)、及び任意により、転写の終了及び転写産物の安定化を誘導する制御要素が挙げられる。転写の開始を誘導する制御要素の非限定的な例としては、翻訳開始コドン、転写エンハンサー、例えばSV40エンハンサー、インシュレーター、及び/又はプロモーター、例えばサイトメガロウイルス(cytomegalovirus:CMV)プロモーター、SV40プロモーター、RSV(Rous sarcome virus)プロモーター、lacZプロモーター、鶏βアクチンプロモーター、CAGプロモーター(鶏βアクチンプロモーターとサイトメガロウイルス前初期エンハンサーとの組み合わせ)、gai10プロモーター、ヒト伸長因子1αプロモーター、AOX1プロモーター、GAL1プロモーターCaMキナーゼプロモーター、lac、trp又はtacプロモーター、lacUV5プロモーター、又はカリフォルニアガマキンウワバ多核ポリヘドロシスウイルス(autographa californica multiple nuclear polyhedrosis virus:AcMNPV)多面性(polyhedral)プロモーター等が挙げられる。転写終了を誘導する制御要素の非限定的な例としては、V40ポリA部位、tk-ポリA部位、又はSV40、lacZ若しくはAcMNPV多面性(polyhedral)ポリアデニル化シグナル等が挙げられる。更なる制御要素としては、翻訳エンハンサー、コザック(Kozak)配列、及びRNAスプライシングのドナー及びアクセプター部位に挟まれた介在配列等が挙げられる。更に、例えば複製起点、薬物抵抗遺伝子又はレギュレーター(誘導性プロモーターの一部として)等の要素が含まれていてもよい。
本開示において「ポリヌクレオチド」(polynucleotide)、「核酸」(nucleic acid)、「核酸配列」(nucleic acid sequence)、又は「ヌクレオチド配列」(nucleotide sequence)という語は、本開示では相互交換可能に使用され、DNA、例えばcDNA又はゲノムDNA、及びRNAを指す。本発明で使用されるポリヌクレオチドは、天然でもよく、(半)合成由来のものでもよい。従って、斯かるポリヌクレオチドは、例えば従来の有機化学のプロトコールに従って合成された核酸分子であってもよい。当業者であれば、ポリヌクレオチドの調製及び使用には精通しているであろう(例えばSambrook and Russel “Molecular Cloning, A Laboratory Manual”, Cold Spring Harbor Laboratory, N.Y. (2001)等を参照)。本発明で使用されるポリヌクレオチドは、本技術分野で公知の核酸模倣分子を含んでいてもよく、斯かる核酸模倣分子からなるものであってもよい。当業者であれば容易に理解するように、これらは更なる非天然又は誘導体化ヌクレオチド塩基を含んでいてもよい。本発明に係る核酸模倣分子又は核酸誘導体としては、限定されるものではないが、ホスホロチオエート核酸、ホスホロアミド核酸、モルフォリノ核酸、ヘキシトール核酸(hexitol nucleic acid:HNA)、ペプチド核酸(peptide nucleic acid:PNA)、及びロックド核酸(locked nucleic acid:LNA)が挙げられる。
本開示において「遺伝子」(gene)という語は、ヌクレオチドからなるDNAの座(又は領域)を指す。遺伝子は、生物のゲノム内における遺伝の分子単位である。しかし、本開示において「遺伝子」という語は、生物のゲノム内に存在するヌクレオチド配列には限定されない。本開示において「遺伝子」という語は、タンパク質をコードする各ヌクレオチド配列を対象とする。従って、本開示において「遺伝子」という語は、人工的に作成されたヌクレオチド配列、例えばイントロンのないヌクレオチド配列も含む。従って、本開示において「遺伝子」という語は、cDNA配列も含む。従って、本開示において「所期の遺伝子」(gene of interest)又は「所期のタンパク質をコードする遺伝子」(gene encoding (for) the protein of interest)という語は、相互交換可能に使用され、所期のタンパク質をコードするヌクレオチド配列を指す。前記のヌクレオチド配列は、所期のタンパク質をコードするcDNAであることが好ましい。「コードする」を意味する“encode”又は“encoding”という語は、それぞれ“encode for”又は“encoding for”という語と相互交換可能に使用される。更に、本開示において「遺伝子コピー」(gene copy)という語は、ヌクレオチド配列のコピーを指す。従って、「単一の遺伝子コピー」(a single gene copy)という語は、特定のヌクレオチド配列の単一のコピーを指すと共に、前記ヌクレオチド配列が特定の細胞のゲノム内で一つしか存在しないことを意味する。
本開示において「ドナー核酸テンプレート」(donor nucleic acid template)(別名「DNAドナーテンプレート」(DNA donor template)、例えばHeidenreich, 2016, Nature Reviews Neurosciences, 17: 36-44参照)という語は、HDRのプロセス、好ましくは相同組換えのプロセスにおいてテンプレートとして機能する、標的配列に導入されるべき修飾を含む核酸配列を意味する。このドナー核酸テンプレートをテンプレートとして使用することで、斯かる修飾を含む遺伝子情報が、所期の遺伝子内にコピーされる。例えば、ドナー核酸テンプレートは、1~36ヌクレオチドが異なる点を除いては、所期の遺伝子の一部と同一であってもよい。これにより、相同組換えで1~12アミノ酸が導入又は置換される。斯かるドナー核酸テンプレートは、相同組換えによって一部アミノ酸、例えば1~12のアミノ酸が欠失するように設計してもよい。本開示において、ドナー核酸テンプレートは、一本鎖核酸分子(即ちssODN)であることが好ましい。しかし、プラスミドベクターをドナー核酸テンプレートとして用いてもよい。即ち、(プラスミドに基づく)二本鎖DNAをドナー核酸テンプレートとして用いてもよい。
ドナー核酸テンプレートは、挿入されるべき突然変異(即ち、所期の遺伝子に対する修飾)を有する「ドナー核酸配列」(donor nucleic acid sequence)を含む。ドナー核酸テンプレートは更に、ドナー核酸テンプレートの標的配列に対して相同な領域を含む。ここで「ドナー核酸テンプレートの標的配列」(target sequence of the donor nucleic acid template)とは、所期の遺伝子内の突然変異誘発標的部位を取り囲む配列領域である。本開示において「ドナー核酸テンプレートの標的配列に対して相同な領域」(regions homologous to the target sequence of the donor nucleic acid template)とは、いわゆる「相同性アーム」(homology arms)を意味する。相同性アームとは、ドナー核酸テンプレートの標的配列に対して特異的な結合を達成するのに十分な配列同一性を有する領域である。ドナー核酸テンプレートの標的配列に対して相同な領域(相同性アーム)は、所期の遺伝子に挿入されるべき突然変異(即ち修飾)を含む「ドナー核酸配列」の両側に隣接して存在する。換言すれば、相同性アームはドナー核酸配列の5’及び3’末端に存在する。従って、本開示にて提供される方法で使用されるドナー核酸テンプレートは、第一の相同性アームと、それに続くドナー核酸配列と、更にそれに続く第二の相同性アームとを含む。相同性アームは、ドナー核酸配列(即ち突然変異を有する配列)の両側の、好ましくは>30ヌクレオチド、より好ましくは30~150ヌクレオチド、更に好ましくは30~80(例えば40~55)ヌクレオチドの範囲に隣接して存在する。
「ドナー核酸テンプレートの標的配列に対して相同な領域」(regions homologous to the target sequence of the donor nucleic acid template)は、対応するドナー核酸テンプレートの標的配列と、少なくとも95%、好ましくは少なくとも97%、より好ましくは少なくとも98%、更に好ましくは少なくとも99%、更に好ましくは少なくとも99.9%、最も好ましくは100%の配列同一性を有することが好ましい。前記所定の配列同一性は、相同性アームの結合部位として機能する「ドナー核酸テンプレートの標的配列」との関係においてのみ定められる。従って、所期の遺伝子の突然変異誘発標的部位(即ちドナー核酸配列)に挿入されるべき部分がドナー核酸テンプレート内に存在する場合には、全ドナー核酸テンプレートと「ドナー核酸テンプレートの標的配列」との全体の配列同一性は、前記所定の配列同一性とは異なる場合もあり得る。
所望の突然変異誘発標的部位にHDR(特に相同組換え)を誘導するドナー核酸テンプレートは、常用の技術、例えばRan, 2013, Nat Protoc 8 2281-2308に記載の技術等を用いて、容易に設計することができる。
記述のように、本発明において、ドナー核酸テンプレートは一本鎖オリゴデオキシヌクレオチド(ssODN)であってもよい。「オリゴデオキシヌクレオチド(ODN)」という語は、本技術分野では周知であり、デソキシヌクレオチド残基の配列からなる核酸ポリマーである。ODNは、第二の異なる(即ち、相補的又は部分的に相補的な)オリゴヌクレオチド鎖とハイブリダイズしない場合には、一本鎖ODN(ssODN)である。但し当然ながら、ssODNが自身に対して折り畳まれることにより、1本のオリゴデオキシヌクレオチド鎖からなる部分的又は完全な二本鎖分子を形成する場合もある。しかし、ssODNは、自身に対して折り畳まれて部分的又は完全な二本鎖分子を形成するのではなく、その全長に亘って一本鎖であることが好ましい。本発明において、ODNとは、オリゴデオキシヌクレオチド及びポリデソキシヌクレオチドの双方を指し、その長さは30~600ヌクレオチド、好ましくは50~500ヌクレオチド、更に好ましくは70~350ヌクレオチド、最も好ましくは90~150ヌクレオチドである。例えば、短い配列(例えば長さ1~36ヌクレオチドのヌクレオチド配列)を挿入揺する場合、約90~150ヌクレオチド長のssODNを使用することができる。ここで、ssODNは、ドナー核酸配列(即ち突然変異を含む配列)の両側に隣接して、長さ>30ヌクレオチド、より好ましくは30~150ヌクレオチド、更に好ましくは40~55ヌクレオチド(例えば約50ヌクレオチド)の相同性アームを含むことが好ましい。
本開示にて上述及び後述するように、本開示にて提供される手段及び方法を用いることにより、インビボにおいて、例えばCRISPR/Cas9系及び相同組換え修復を用いて、外因性組換遺伝子を哺乳類細胞系に対して、1コピーのみ安定に導入し、多様化することが可能となる。例として、蛍光タンパク質mNeonGreenを用いることにより、添付の実施例に示すように、CRISPRにより所期の部位を標的化して、長さの異なる多様化されたアミノ酸配列の大きなライブラリーを、相同修復により挿入することが可能となる。この目的のために、リーディングフレームシフトを標的化部位の近傍に選択的に導入し、非蛍光タンパク質としてもよい。添付の実施例において実証するように、切断及び修復によって、所望の多様化が挿入され、リーディングフレームが復元される。変異体を(例えばFACSで)分析することにより、大量の変異体及び配列スペースをスクリーニングすることが可能となる。添付の実施例において実証するように、本開示にて提供される方法により、mNeonGreen2というより高い明度(brightness)を有する緑色蛍光変異体の作出に成功している。また、添付の実施例に示すように、このアプローチを非蛍光タンパク質標的に拡大し、多様化されたタンパク質を採集して更なる機能分析に供するために、蛍光タンパク質又は選択マーカーの融合を用いることも可能である。
上述のように、本発明では、タンパク質mNeonGreen2を改変した。このタンパク質は、mNeonGreenと比較してより高い明度を有する点で有利である。従って、本発明はmNeonGreen2にも関する。従って、本発明の一側面は、
(a)配列番号91に示す核酸配列を有する核酸分子によりコードされるアミノ酸配列を含むポリペプチド、
(b)配列番号92に示すアミノ酸配列を含むポリペプチド、
(c)配列番号92に示すアミノ酸配列を含むポリペプチドをコードする核酸分子によりコードされるポリペプチド、
(d)(a)~(c)の何れかのポリペプチドに対して、少なくとも80%の相同性、好ましくは少なくとも85%、より好ましくは少なくとも90%、更に好ましくは少なくとも95%、更に好ましくは少なくとも98%、更に好ましくは少なくとも99%の同一性を有するポリペプチドであって、配列番号28に示すmNeonGreenの位置147~150に対応する位置に、アミノ酸「DACW」を含むポリペプチド、及び、
(e)(a)又は(c)に示す核酸分子のヌクレオチド配列に対する遺伝子コードの結果として縮重した核酸分子によりコードされるアミノ酸配列を含むポリペプチド
からなる群より選択されるポリペプチドに関する。
本開示にて提供されるmNeonGreen2は蛍光活性を有する。実際に、量子収量と消散係数(extinction coefficient)との積により決定されるmNeonGreen2の全体明度(overall brightness)は、(例えば配列番号28に示される)mNeonGreenよりも高い。例えば、本開示にて提供されるmNeonGreen2の全体明度は、(例えば配列番号28に示される)mNeonGreenよりも、少なくとも1%、好ましくは少なくとも2%、より好ましくは少なくとも4%、更に好ましくは少なくとも6%、最も好ましくは少なくとも8%、又は少なくとも10%は明るい。
本発明の一側面は、以下の項に関する。
1.所期のタンパク質の複数の突然変異体を発現する細胞のパネルを作製する方法であって、各細胞当たり単一の遺伝子コピーから前記所期のタンパク質の複数の突然変異体のうち一つが発現され、前記方法が、
a)細胞のゲノムに対して、前記所期のタンパク質をコードする遺伝子内の突然変異誘発標的部位又はその近傍に、二本鎖切断(double-strand break:DSB)又は一本鎖ニックを誘導し、ここで前記細胞のゲノムには、前記所期のタンパク質をコードする遺伝子が、単一のコピーとして含まれており、ここで前記所期のタンパク質をコードする遺伝子の前記単一のコピーは、前記突然変異誘発標的部位又はその近傍に、不活性化突然変異を含み、
b)工程a)の細胞に対して、前記誘導されたDSB又は一本鎖ニックの相同組換えによる修復のための、複数の異なるドナー核酸テンプレートのライブラリーを提供し、ここで前記ライブラリーの前記複数の異なるドナー核酸テンプレートは、前記突然変異誘発標的部位に対応する位置に異なる突然変異を含むと共に、相同標的化修復(HDR)、特に相同組換えにより、前記不活性化突然変異を除去し、
c)前記不活性化突然変異が除去された細胞を選択及び/又は濃縮し、
d)工程c)で選択された細胞のパネルを、前記所期のタンパク質の複数の異なる突然変異体を発現する細胞のパネルとして提供し、ここで各細胞毎に、前記所期のタンパク質の前記異なる突然変異体のうちの一つが、単一の遺伝子コピーから発現されている
ことを含む方法。
2.前記d)で提供される前記細胞のパネルにおいて、前記複数の異なるドナー核酸テンプレート内の、前記突然変異誘発標的部位に対応する位置に含まれていた複数の異なる突然変異を、前記突然変異誘発標的部位に含む細胞が濃縮される、1項の方法。
3.前記細胞のパネルにおいて濃縮される細胞が、前記複数の異なるドナー核酸テンプレートのライブラリーのドナー核酸テンプレートとの相同組換えにより、前記DSB又は一本鎖ニックの修復が生じた細胞を含む、2項の方法。
4.前記d)で提供される前記細胞のパネルにおける、少なくとも4%、好ましくは少なくとも20%、最も好ましくは少なくとも60%の細胞が、前記複数の異なるドナー核酸テンプレートに含まれる突然変異の一つを含む、1~3項の何れか一項の方法。
5.前記d)で提供される前記細胞のパネルが更に、前記のDSB又は一本鎖ニックの修復が非相同末端連結(NHEJ)により生じた細胞を含む、1~4項の何れか一項の方法。
6.前記のDSB又は一本鎖ニックの修復がNHEJにより生じた細胞が、前記不活性化突然変異を除去した少なくとも1つのランダムな突然変異を含み、ここで好ましくは、前記ランダムな突然変異が、工程a)で前記のDSB又は一本鎖ニックが導入された位置に直接隣接する位置に、1又は2以上のヌクレオチドの挿入及び/又は欠失を含む、5項の方法。
7.前記不活性化突然変異が、所期のタンパク質をコードする遺伝子の前記単一のコピー内に導入されてなる、1~6項の何れか一項の方法。
8.前記不活性化突然変異が、前記所期のタンパク質の発現を妨げる、1~7項の何れか一項の方法。
9.前記不活性化突然変異が、塩基対置換、塩基対挿入、塩基対欠失、停止コドン、又は不活性化アミノ酸置換であるか、或いはこれらの何れかを含む、1~8項の何れか一項の方法。
10.前記不活性化突然変異が、所期のタンパク質の選択可能な活性を阻害する、1~9項の何れか一項の方法。
11.工程c)が、前記選択可能な活性を有する細胞の選択及び/又は濃縮を含むか、或いは斯かる選択及び/又は濃縮である、10項の方法。
12.前記不活性化突然変異が、 前記所期のタンパク質をコードする遺伝子内にフレームシフトを導入するか、前記所期のタンパク質をコードする遺伝子内に未成熟停止コドンを導入するか、或いは前記所期のタンパク質をコードする遺伝子内に突然変異を導入し、結果として不活性化アミノ酸置換を生じさせる、1~11項の何れか一項の方法。
13.工程c)が、前記所期のタンパク質を発現する細胞の選択を含むか、或いは斯かる選択である、1~12項の何れか一項の方法。
14.前記所期のタンパク質をコードする遺伝子が、前記細胞のゲノム内に融合遺伝子として含まれており、ここで前記融合遺伝子が、前記所期のタンパク質をコードする遺伝子の下流にマーカー遺伝子を含む、12又は13項の方法。
15.前記所期のタンパク質をコードする遺伝子内の前記不活性化突然変異が、前記マーカー遺伝子の発現を妨げる、14項の方法。
16.前記マーカー遺伝子によりコードされるタンパク質の発現が、直接選択可能である、14又は15項の方法。
17.工程c)が、前記マーカー遺伝子によりコードされるタンパク質を発現する細胞の選択を含むか、或いは斯かる選択である、14~16項の何れか一項の方法。
18.前記マーカー遺伝子によりコードされるタンパク質が、蛍光タンパク質である、14~17項の何れか一項の方法。
19.前記工程c)の選択及び/又は濃縮が、斯かる蛍光タンパク質を発現する細胞の単離を含む、18項の方法。
20.前記細胞の単離が、蛍光活性化細胞分別(FACS)又はマイクロ流体細胞選別であるか、或いはこれらの手法を含む、19項の方法。
21.前記マーカー遺伝子によりコードされるタンパク質の発現が、抗生物質抵抗性を付与するか、薬物抵抗性を付与するか、栄養要求性を補完するか、或いは検出可能な酵素活性を付与する、14~17項の何れか一項の方法。
22.前記工程c)の選択及び/又は濃縮が、選択的な条件下で細胞を培養することを含む、21項の方法。
23.前記マーカー遺伝子によりコードされるタンパク質が、前記所期のタンパク質をコードする遺伝子内に前記不活性化突然変異が存在する場合には発現され、ここで前記所期のタンパク質をコードする遺伝子内の前記不活性化突然変異が除去された細胞では、前記マーカー遺伝子が発現されないか、或いはインフレームでは発現されない、14項の方法。
24.前記所期のタンパク質の発現が、陰性選択可能である、14又は23項の方法。
25.工程c)が、前記マーカー遺伝子によりコードされるタンパク質を発現しない細胞の選択及び/又は濃縮を含むか、或いは斯かる選択及び/又は濃縮である、14、23又は24項の方法。
26.前記マーカー遺伝子によりコードされるタンパク質が、チミジンキナーゼ(HSVtk)である、14及び23~25項の何れかの方法。
27.前記融合遺伝子が更に、前記所期のタンパク質をコードする遺伝子と前記マーカー遺伝子との間に、リンカー核酸配列を含む、14~26項の何れか一項の方法。
28.前記リンカー核酸配列が、自己開裂ペプチドをコードする核酸配列を含むか、或いは斯かる配列からなる、27項の方法。
29.前記自己開裂ペプチドが、T2Aペプチド、P2Aペプチド、E2Aペプチド、及びF2Aペプチドからなる群より選択される。28項の方法。
30.前記リンカー核酸配列が、部位特異的プロテアーゼの標的部位をコードする核酸配列を含むか、或いは斯かる配列からなる、27項の方法。
31.前記部位特異的プロテアーゼの標的部位が、配列番号5に示すアミノ酸配列を有するTEVプロテアーゼの標的部位、配列番号6に示すアミノ酸配列を有するジェネナーゼI(Genenase I)の標的部位、配列番号7に示すアミノ酸配列を有するエンテロキナーゼの標的部位、及び配列番号8に示すアミノ酸配列を有するヒトライノウイルス (HRV)3Cプロテアーゼの標的部位からなる群より選択される、30項の方法。
32.前記細胞が更に、前記標的部位を切断する対応の部位特異的プロテアーゼを含む、30又は31項の方法。
33.前記部位特異的プロテアーゼが、TEVプロテアーゼ、ジェネナーゼI(Genenase I)エンテロキナーゼ、ヒトライノウイルス(HRV)3Cプロテアーゼ、因子Xa、及びトロンビンからなる群より選択される、30又は32項の方法。
34.所期のタンパク質をコードする遺伝子の単一のコピーが、外因性遺伝子のコピーである、1~33項の何れか一項の方法。
35.所期のタンパク質をコードする遺伝子の単一のコピーが、内因性遺伝子のコピーである、1~34項の何れか一項の方法。
36.前記方法が更に、a)で使用される細胞を生成する工程を含む、1~35項の何れか一項の方法。
37.前記生成する工程が、前記所期のタンパク質をコードする遺伝子の単一のコピー内に、前記不活性化突然変異を導入することを含む、36項の方法。
38.前記所期のタンパク質をコードする遺伝子の単一のコピーが外因性であると共に、前記生成する工程が、前記所期のタンパク質をコードする遺伝子の単一のコピーを、細胞のゲノム内に導入することを含む、36又は37項の方法。
39.前記の所期のタンパク質をコードする遺伝子の単一の外因性のコピーをゲノム内に導入する工程が、部位特異的相同組換え系を含む、38項の方法。
40.前記所期のタンパク質をコードする遺伝子の単一のコピーを前記細胞のゲノム内に導入する工程の前又は後に、前記不活性化突然変異が導入される、38又は39項の方法。
41.前記生成する工程が、前記所期のタンパク質をコードする遺伝子の単一のコピーを前記細胞のゲノム内に導入する工程の前又は後に、前記所期の遺伝子内に前記不活性化突然変異を導入することを含む、38又は39項の方法。
42.前記所期のタンパク質をコードする遺伝子の単一のコピーが内因性であると共に、前記生成する工程が、部位特異的相同組換えを用いて、系前記細胞のゲノム内の所期のタンパク質をコードする遺伝子内に、前記不活性化突然変異を導入することを含む、36又は37項の方法。
43.前記所期のタンパク質をコードする遺伝子が、ゲノム内に2コピー以上存在する内因性遺伝子であると共に、前記生成が、前記所期のタンパク質をコードする遺伝子の一部の内因性コピーを不活性化して、一細胞当たり前記所期のタンパク質をコードする遺伝子の単一コピーを得ることを含む、36、37、又は42項の方法。
44.前記生成する工程が、部位特異的ヌクレアーゼ又は部位特異的ニッカーゼをコードする核酸配列を、細胞内に導入することを含む、36~43項の何れか一項の方法。
45.前記生成する工程が更に、前記所期の遺伝子の単一のコピー内における、前記部位特異的ヌクレアーゼ又は前記部位特異的ニッカーゼに対応する認識配列を、細胞内に導入することを含む、44項の方法。
46.前記生成する工程が更に、前記部位特異的ヌクレアーゼ又は前記部位特異的ニッカーゼを前記認識部位に標的化する手段を、細胞内に導入することを含む、44又は45項の方法。
47.前記DSBが誘導される、1~46項の何れか一項の方法。
48.前記DSBが部位特異的ヌクレアーゼにより誘導されると共に、工程a)の細胞における前記所期のタンパク質をコードする遺伝子の単一のコピーが、前記部位特異的ヌクレアーゼに対応する認識部位を含む、1~47項の何れか一項の方法。
49.前記部位特異的ヌクレアーゼが、恒常性又は誘導性プロモーターの制御下で発現される、48項の方法。
50.前記部位特異的ヌクレアーゼがプラスミドにコードされる、48又は49項の方法。
51.前記方法が更に、工程c)とd)との間、又は工程d)の後に、前記部位特異的ヌクレアーゼをコードするプラスミドを、選択及び/又は提供された細胞から除去することを含む、50項の方法。
52.前記所期のタンパク質をコードする遺伝子内の、前記部位特異的ヌクレアーゼの認識部位が、前記所期のタンパク質をコードする遺伝子の単一のコピー内に内因的に存在するか、或いは完全又は部分的に外から導入されたものである、33~36項の何れか一項の方法。
53.前記部位特異的ヌクレアーゼの認識部位が、完全又は部分的に外から導入されると共に、前記外から導入された配列が、c)で選択される細胞又はd)で提供される細胞に含まれる、所期のタンパク質をコードする遺伝子の突然変異体内には存在しない、48~52項の何れか一項の方法。
54.前記部位特異的ヌクレアーゼが、Cas9ヌクレアーゼ、Cpf1ヌクレアーゼ、ジンクフィンガーヌクレアーゼ(ZNF)、転写アクティベーター様ヌクレアーゼ(TALEN)、及びmegaTALエンドヌクレアーゼからなる群より選択される、48~53項の何れか一項の方法。
55.前記部位特異的ヌクレアーゼが、CRISPR/Cas9ヌクレアーゼである、48~53項の何れか一項の方法。
56.前記Cas9ヌクレアーゼが、化膿連鎖球菌(Streptococcus pyogenes)由来のSpCas9、ストレプトコッカス サーモフィルス(Streptococcus thermophiles)由来のSt1Cas9、黄色ブドウ球菌(Staphylococcus aureus)由来のSaCas9、Cas9 VQR変異体、Cas9 EQR変異体、スプリット(Split)Cas9、インテリン(Intein)Cas9、遺伝子改変Cas9、及び、二量体RNAガイドFokI-dCas9ヌクレアーゼ(RFN)からなる群より選択される、54又は55項の方法。
57.工程a)の細胞が、前記Cas9ヌクレアーゼを前記認識部位に対して標的化するsgRNAを含む、54~56項の何れか一項の方法。
58.前記Cas9ヌクレアーゼの対応する認識部位が、前記Cas9ヌクレアーゼによって認識されるPAM部位を含む、54~57項の何れか一項の方法。
59.前記二本鎖切断が、前記所期のタンパク質をコードする遺伝子内の異なる鎖における2つの一本鎖ニックによって認識される、1~47項の何れか一項の方法。
60.前記2つの単鎖ニックが、1又は2以上のニッカーゼによって導入されると共に、工程a)の細胞における前記所期のタンパク質をコードする遺伝子の単一のコピーが、第一の部位特異的ニッカーゼのための第一の認識部位と、第二の部位特異的ニッカーゼのための第二の認識部位とを含む、59項の方法。
61.前記第一の部位特異的ニッカーゼと前記第二の部位特異的ニッカーゼとが同一である、59項の方法。
62.前記第一のニッカーゼ及び/又は前記第二のニッカーゼが、Cas9ニッカーゼである、60~61項の何れか一項の方法。
63.工程a)の細胞が、前記第一の部位特異的ニッカーゼを前記第一の認識部位に、前記第二の部位特異的ニッカーゼを前記第二の認識部位にそれぞれ標的化する、第一のsgRNAを含む、62項の方法。
64.前記第一の認識配列及び/又は前記第二の認識配列が、PAM配列を含む、63項の方法。
65.前記一本鎖ニックが、部位特異的ニッカーゼによって認識されると共に、前記所期のタンパク質をコードする遺伝子の単一のコピーが、前記部位特異的ニッカーゼのための対応する認識部位を含む、1~46項の何れか一項の方法。
66.前記所期のタンパク質をコードする遺伝子内の、前記部位特異的ニッカーゼのための前記認識部位が、前記所期のタンパク質をコードする遺伝子内に内因的に存在するか、或いは完全又は部分的に外から導入される、65項の方法。
67.前記部位特異的ニッカーゼのための前記認識部位が、完全又は部分的に外から導入されると共に、前記の外から導入される配列が、c)で選択される細胞又はd)で提供される細胞に含まれる所期のタンパク質をコードする遺伝子の突然変異体内には存在しない、65又は66項の方法。
68.前記部位特異的ニッカーゼが、Cas9ニッカーゼである、65~67項の何れか一項の方法。
69.前記Cas9ニッカーゼのための対応する認識配列が、前記CRISPR/Cas9ニッカーゼによって認識されるPAM配列である、68項の方法。
70.前記細胞が、原核細胞又は真核細胞である、1~69項の何れか一項の方法。
71.前記細胞が、酵母細胞、非哺乳類脊椎動物細胞、植物細胞、昆虫細胞、又は哺乳類細胞である、1~69項の何れか一項の方法。
72.前記細胞が哺乳類細胞である、1~69項の何れか一項の方法。
73.前記哺乳類細胞が、HEK293細胞、リンパ腫 細胞系 (例えばNS0又はSp2/0-Ag14),白血病 細胞系、ジャーカット(Jurkat)細胞、チャイニーズハムスター卵巣(CHO)細胞、HeLa細胞、PC12細胞、抗体産生ハイブリドーマ細胞系、不死化ヒトB細胞系、及び不死化ヒト細胞系からなる群より選択される、71又は72項の方法。
74.前記非哺乳類脊椎動物細胞が、DT40鶏細胞である、71項の方法。
75.前記DSB又は前記一本鎖ニックが、前記突然変異誘発標的部位に対して100塩基対未満、好ましくは30塩基対未満、又は最も好ましくは10塩基対未満の距離に誘導される、1~74項の何れか一項の方法。
76.前記不活性化突然変異が、前記突然変異誘発標的部位に対して100塩基対未満、好ましくは30塩基対未満、又は最も好ましくは10塩基対未満の距離に誘導される、1~75項の何れか一項の方法。
77.前記複数の異なるドナー核酸テンプレートが、二本鎖DNA分子を含むか、或いは二本鎖DNA分子である、1~76項の何れか一項の方法。
78.前記複数の異なるドナー核酸テンプレートが各々、個別のベクターに含まれる、77項の方法。
79.前記複数の異なるドナー核酸テンプレートが、一本鎖オリゴヌクレオチドを含むか、或いは一本鎖オリゴヌクレオチドである、1~78項の何れか一項の方法。
80.前記一本鎖オリゴヌクレオチドが、ロックド核酸及び/又はホスホロチオエート修飾を含む、79項の方法。
81.前記複数の異なるドナー核酸テンプレートの各々が、前記所期のタンパク質をコードする遺伝子と相同な相同核酸配列を含む、1~80項の何れか一項の方法。
82.前記相同核酸配列が、20~100ヌクレオチド、好ましくは30~60ヌクレオチド、最も好ましくは40~50ヌクレオチドを含む、81項の方法。
83.前記複数の異なるドナー核酸テンプレートの各々が、前記突然変異誘発標的部位に対応する位置の上流に、長さ少なくとも20ヌクレオチド、例えば 20~500ヌクレオチド、20~300ヌクレオチド、20~100ヌクレオチド、30~60ヌクレオチド、又は40~50ヌクレオチドの第一の相同核酸配列を含むと共に、更に、前記突然変異誘発標的部位に対応する位置の下流に、長さ少なくとも20ヌクレオチド、例えば20~500ヌクレオチド、20~300ヌクレオチド、20~100ヌクレオチド、30~60ヌクレオチド、又は40~50ヌクレオチドの第二の相同核酸配列を含む、1~82項の何れか一項の方法。
84.相同が、少なくとも80%の配列同一性、好ましくは少なくとも95%の配列同一性、最も好ましくは少なくとも99%の同一性を意味する、81~83項の何れか一項の方法。
85.前記突然変異誘発標的部位に対応する位置における、前記複数の異なる突然変異が、1又は2以上のヌクレオチドの置換、欠失、又は挿入である、1~84項の何れか一項の方法。
86.d)で提供される細胞のパネルの細胞内で発現される、前記所期のタンパク質の前記複数の異なる突然変異体が、前記所期のタンパク質と比較して、1又は2以上のアミノ酸の置換、1又は2以上のアミノ酸の挿入、及び/又は、1又は2以上のアミノ酸の欠失を含む、1~85項の何れか一項の方法。
87.前記1又は2以上のアミノ酸の置換が、少なくとも1、例えば少なくとも2、少なくとも3、又は少なくとも5のアミノ酸の置換である、86項の方法。
88.前記1又は2以上のアミノ酸の挿入が、少なくとも1、例えば少なくとも2、少なくとも3、又は少なくとも5アミノ酸の挿入である、86項の方法。
89.前記1又は2以上のアミノ酸の欠失が、少なくとも1、例えば少なくとも2、少なくとも3、又は少なくとも5アミノ酸の欠失である、86項の方法。
90.前記不活性化突然変異を除去する核酸配列が、所期のタンパク質をコードする遺伝子に対応する野生型配列であるか、及び/又は、前記所期のタンパク質の遺伝子内のフレームシフト突然変異を除去する、1~89項の何れか一項の方法。
91.工程b)が工程a)の前に、或いは好ましくは工程a)と同時に実施される、1~90項の何れか一項の方法。
92.工程a)及びb)において細胞が、NHEJに対する相同組換えの比率を増加させる条件下で培養される、1~91項の何れか一項の方法。
93.前記条件が、NHEJに関与する酵素の阻害又は不活性化、NHEJを制御するタンパク質の発現、NHEJを抑制する物質の添加、複製フォークの進行の遅延化、又は細胞周期のG2/M期での停止の誘発である、92項の方法。
94.NHEJに関与する酵素が、KU70又はDNAリガーゼIVであると共に、NHEJに関与する酵素が抑制される、93項の方法。
95.NHEJを制御するタンパク質が、E1B55K及びE4orf6を含む、又はこれらからなるタンパク質複合体、93項の方法。
96.前記NHEJを抑制する物質が、Scr7-ピラジン、ESCR7、L755507、ブレフェルジンA、及びL189(CAS 64232-83-3)からなる群より選択される、93項の方法。
97.NHEJに対する相同組換えの比率が、少なくとも1倍、好ましくは少なくとも3倍、最も好ましくは少なくとも15倍に増加される、92~96項の何れか一項の方法。
98.前記細胞が哺乳類細胞であると共に、工程a)及び/又はb)と工程c)との間に、少なくとも48時間、好ましくは少なくとも72時間、最も好ましくは少なくとも96時間に亘って培養される、1~97項の何れか一項の方法。
99.d)で提供される前記細胞のパネルが、前記所期のタンパク質の複数の異なる突然変異体を発現する細胞のプールであると共に、各細胞毎に前記複数の異なる突然変異体のうちの一つが単一の遺伝子コピーから発現される、1~98項の何れか一項の方法。
100.d)で提供される前記細胞のパネルが、それぞれ異なる突然変異体を発現する細胞が個別に培養された細胞のライブラリーである、1~98項の何れか一項の方法。
101.前記方法が更に、工程c)と工程d)との間に、工程c)により選択される細胞から、それぞれ異なる突然変異体を発現する細胞を分離する工程を含む、100項の方法。
102.前記方法が更に、工程c)で選択及び/又は濃縮され、或いはd)で提供された細胞に含まれる、前記所期のタンパク質の前記複数の異なる突然変異体をコードする遺伝子の1又は2以上の核酸配列を決定すること、或いは、工程c)で選択及び/又は濃縮され、或いはd)で提供された細胞に含まれる、前記所期のタンパク質の前記複数の異なる突然変異体の1又は2以上のアミノ酸配列を決定することを含む、1~101項の何れか一項の方法。
103.前記所期のタンパク質が、蛍光タンパク質、抗体、酵素、成長因子、サイトカイン、ペプチドホルモン、転写因子、RNA結合タンパク質、細胞骨格タンパク質、イオンチャンネル、Gタンパク質結合受容体、キナーゼ、ホスファターゼ、シャペロン、トランスポーター、又は膜貫通タンパク質である、1~102項の何れか一項の方法。
104.前記所期のタンパク質が、mNeonGreen、mRuby2/3、dTomato、TagRFP、Citrine、Venus、YPet、mTFP1、EGFP; Kusabira Orange、mOrange、mApple、mCerulean3、mTurquoise2、mCardinal、EosFP、Dronpa、Dreiklang、及び赤外iRFPからなる群より選択される蛍光タンパク質である、1~102項の何れか一項の方法。
105.前記所期のタンパク質が抗体であり、ここで 前記突然変異誘発標的部位が、前記抗体の重鎖又は軽鎖をコードする核酸配列のCDRコーディング領域内に存在する、1~102項の何れか一項の方法。
106.前記所期のタンパク質が酵素であり、ここで前記突然変異誘発標的部位が、前記酵素又は前記酵素の制御性サブユニットの活性中心をコードする核酸領域内に存在する、1~102項の何れか一項の方法。
107.前記所期のタンパク質の前記複数の突然変異体前記野生型の所期のタンパク質と比較して、第一の活性が改善されてなり、及び/又は、新たな活性を有してなり、ここで前記方法が更に、
e)前記の細胞のパネルから、前記第一の活性が改善されてなり、及び/又は、前記新たな活性を有してなる、前記所期のタンパク質の複数の突然変異体を発現する第二の細胞のパネルを選択及び/又は濃縮する
ことを含む、1~106項の何れか一項の方法。
108.前記所期のタンパク質の複数の突然変異体前記野生型の所期のタンパク質と比較して、第一の活性が改善されてなり、及び/又は、新たな活性を有してなり、ここで工程c)が、前記野生型の所期のタンパク質と比較して、第一の活性が改善されてなり、及び/又は、新たな活性を有してなる、前記所期のタンパク質の突然変異体を選択及び/又は濃縮することを含む、1~106項の何れか一項の方法。
109.野生型の所期のタンパク質と比較して異なる又は改変された活性を有する、所期のタンパク質の複数の突然変異体を同定する方法であって、前記方法が、
a)1~106項の何れか一項から得られる前記の細胞のパネルから、前記第一の活性が改善されてなり、及び/又は、前記新たな活性を有してなる、前記所期のタンパク質の複数の突然変異体を発現する第二の細胞のパネルを選択及び/又は濃縮し、
b)前記第二のパネルにより発現される前記所期のタンパク質の突然変異体のアミノ酸配列を決定し及び/又は前記第二のパネルにより発現される前記所期のタンパク質の突然変異体をコードする遺伝子の核酸配列を決定する
ことを含む方法。
110.前記野生型の所期のタンパク質と比較して異なる又は改変された活性を有する、所期のタンパク質の複数の突然変異体を同定する方法であって、前記方法が、
a)1~106項の何れか一項の所期のタンパク質の複数の突然変異体を発現する細胞のパネルを作製する方法を含み、ここで工程c)が、前記野生型の所期のタンパク質と比較して、第一の活性が改善されてなり、及び/又は、新たな活性を有してなる、前記所期のタンパク質の突然変異体を選択及び/又は濃縮することを含み、
b)前記方法が更に、前記野生型の所期のタンパク質と比較して、第一の活性が改善されてなり、及び/又は、新たな活性を有してなる、前記所期のタンパク質の突然変異体の少なくとも1つのアミノ酸配列を決定し;及び/又は前記野生型の所期のタンパク質と比較して、第一の活性が改善されてなり、及び/又は、新たな活性を有してなる、前記所期のタンパク質の突然変異体をコードする遺伝子の少なくとも1つの核酸配列を決定することを含む、方法。
111.前記方法が更に、野生型の所期のタンパク質と比較して異なる又は改変された生物活性を有する所期のタンパク質の発現及び任意により収集を含む、109又は110項の方法。
112.前記前記野生型の所期のタンパク質と比較して、第一の活性が改善されてなり、及び/又は、新たな活性を有してなる、所期のタンパク質の突然変異体の選択及び/又は濃縮が、FACS細胞選別、磁気活性化細胞選別、マイクロ流体細胞選別、及び/又はビーズを用いた細胞単離を含む、107~111項の何れか一項の方法。
113.前記所期のタンパク質が蛍光タンパク質であると共に、前記第一の活性及び/又は前記新たな活性が蛍光である、107~112項の何れか一項の方法。
114.前記所期のタンパク質が抗体であると共に、前記第一の活性及び/又は前記新たな活性が抗原結合性である、107~112項の何れか一項の方法。
115.前記所期のタンパク質が酵素であると共に、前記第一の活性及び/又は前記新たな活性が前記酵素の酵素活性である。107~112項の何れか一項の方法。
116.1~115項の何れか一項の方法により得られる細胞ライブラリー。
117.前記野生型の所期のタンパク質と比較して異なる又は改変された生物活性を有する、所期のタンパク質の複数の突然変異体の同定のための、116項の細胞ライブラリーの使用。
118.同定された所期のタンパク質の突然変異体が、ホワイト・バイオテクノロジーに適用される、117項の使用。
119.前記所期のタンパク質が、成長因子、サイトカイン、ペプチドホルモン、転写因子、RNA結合タンパク質、細胞骨格タンパク質、イオンチャンネル、Gタンパク質結合受容体、キナーゼ、ホスファターゼ、シャペロン、トランスポーター、及び膜貫通タンパク質から選択される何れかのタンパク質である、1~115項の何れか一項の方法、116項の細胞ライブラリー、又は117又は118項の使用。
本開示では、特許公報及び学術文献を含む多数の文献を引用する。これらの文献の開示は、本発明の特許性に関連するわけではないが、それらの全体が引用により本明細書に組み込まれる。