JP2023156337A

JP2023156337A - 改良されたハイスループットコンビナトリアル遺伝子改変システムおよび最適化されたＣａｓ９酵素変異体

Info

Publication number: JP2023156337A
Application number: JP2023119639A
Authority: JP
Inventors: アラン・シウ・ルン・ウォン; Siu Lun Wong Alan; ジジ・チン・ジー・チョイ; Gigi Ching Gee Choi
Original assignee: University of Hong Kong HKU
Current assignee: University of Hong Kong HKU
Priority date: 2018-09-19
Filing date: 2023-07-24
Publication date: 2023-10-24
Also published as: EP3853363A4; EP4253549A2; CN112955549A; JP2022501025A; WO2020057481A1; US20230193251A1; EP4253549A3; EP3853363A1; KR20210060541A

Abstract

【課題】特定のポリペプチド、および前記ポリペプチドを使用して標的部位でＤＮＡ分子を切断する方法を提供する。
【解決手段】特定配列の残基１００３に対応する残基が置換され、かつ前記特定配列の残基６６１に対応する残基が置換されている、特定のアミノ酸配列を含むポリペプチド。前記特定配列の残基１００３に対応する残基がヒスチジンで置換され、かつ前記特定配列の残基６６１に対応する残基がアラニンで置換されている、前記ポリペプチドを提供する。また、標的部位でＤＮＡ分子を切断する方法であって、標的ＤＮＡ部位を含むＤＮＡ分子を前記ポリペプチドおよび標的ＤＮＡ部位に特異的に結合する短いガイドＲＮＡ（ｓｇＲＮＡ）と接触させることにより、該ＤＮＡ分子を標的ＤＮＡ部位で切断することを含む、方法を提供する。
【選択図】図１ａ

Description

関連出願
本出願は、２０１８年９月１９日出願の米国仮特許出願第６２／７３３，４１０号に基づく優先権の利益を主張し、その内容全体は全ての目的に関して引用により本明細書中に包含させる。

背景
組換えタンパク質は、産業用や医療用を含む様々な用途でますます重要性を増している。組換えタンパク質、特に酵素および抗体の機能性は遺伝子変異によって改善される可能性があるため、より望ましい特性を有する組換えタンパク質を特定し、それらの用途での有効性を向上させることができるようにするために、可能性のある組換えタンパク質の遺伝子変異体を幅広く作製し、選択するための継続的な努力が行われてきた。

Ｃａｓ９（ＣＲＩＳＰＲ関連タンパク質９）は、ストレプトコッカス属のグラム陽性菌の一種であるストレプトコッカス・ピオゲネス（Streptococcus pyogenes）などの細菌におけるＣＲＩＳＰＲ（Clustered Regularly Interspaced Short Palindromic Repeat）適応免疫系に関連するＲＮＡ誘導型ＤＮＡエンドヌクレアーゼである。近年、遺伝子編集のためのＣＲＩＳＰＲの利用が増加していることから、Ｃａｓ９は遺伝子組換えによる性能向上を目指す多くの人々の関心を集めている酵素である。しかしながら、特定のタンパク質の多数の遺伝子変異体を体系的に作製し、スクリーニングするための現在利用可能なシステムは、多くの場合、面倒で、労力がかかり、従って非効率的である。

このように、新たなハイスループットコンビナトリアル遺伝子組み換えシステム／方法ならびに改良された特徴を有する遺伝子組換えタンパク質（例えば、Ｃａｓ９酵素）に対する明確なニーズがある。本発明は、このニーズおよび他の関連するニーズを満たす。

発明の概要
これまでに、本発明者らが率いる研究グループは、高次のバーコード化されたコンビナトリアル遺伝子ライブラリーのハイスループット機能解析のためのシステムを考案し、これをコンビナトリアル遺伝子エンマス（en masse）またはＣｏｍｂｉＧＥＭと称した。このシステムは、例えば、バーコード化されたデュアルガイドＲＮＡ（ｇＲＮＡ）の組合せのライブラリー、および二様（two-wise）または三様（three-wise）のバーコード化されたヒトマイクロＲＮＡ（ｍｉＲＮＡ）前駆体のライブラリーを作製するため、所望の機能性についてさらにスクリーニングするために用いられている（例えば、Wong et al. (Nat. Biotechnol. 2015 September; 33(9):952-961)、Wong et al. (Proc. Nat. Acad. Sci., March 1, 2016, 113(9):2544-2549)、WO2016/070037およびWO2016/115033を参照のこと）。米国特許第９，３１５，８０６号も参照のこと。本発明者らは現在、ＣｏｍｂｉＧＥＭシステムをさらに改良し、高次コンビナトリアル変異体ライブラリーの各メンバーの何れか２つの隣接する遺伝子要素間のシームレスな連結を提供する改良されたＣｏｍｂｉｎＳＥＡＬプラットフォームを開発した。言い換えると、このプラットフォームは、連結部位のそれぞれにおいて、如何なる人工的なアミノ酸配列または外来アミノ酸配列も導入しないので、野生型タンパク質の天然アミノ酸配列を維持しながら、コンビナトリアル変異を含むタンパク質変異体の大規模なコレクションを作製することを可能にする。

このように、本発明は、第一に、コンビナトリアル変異体を体系的に作製し、スクリーニングするための改良されたハイスループット遺伝子組換えシステムを提供する。ある面において、本発明は、ＤＮＡ鎖の５'から３'の方向に、第１のタイプのＩＩＳ型制限酵素のための第１の認識部位；ＤＮＡエレメント；第２のタイプのＩＩＳ型制限酵素のための第１および第２の認識部位；ＤＮＡエレメントに一意的に割り当てられたバーコード；ならびに、第１のタイプのＩＩＳ型制限酵素のための第２の認識部位、を含むＤＮＡ構築物を提供する。ある態様において、ＤＮＡ構築物は直線状構築物である。他の態様において、ＤＮＡ構築物は、環状構築物または細菌ベースのＤＮＡプラスミドもしくはＤＮＡウイルスベクターを含むＤＮＡベクターである。ＤＮＡ構築物は、好ましくは単離され、すなわち、有意な量の他のＤＮＡ配列が存在しない状態で単離される。ある態様において、本発明は、上記および本明細書に記載のＤＮＡ構築物のうちの少なくとも２つの、場合により多くのＤＮＡ構築物を含むライブラリーを提供し、ライブラリーメンバーの各々は、一意的に割り当てられたバーコードとともに、異なるポリヌクレオチド配列を有する別個のＤＮＡエレメントを有する。

本発明の別の面において、別のＤＮＡ構築物が提供される：該ＤＮＡ構築物は、ＤＮＡ鎖の５'から３'の方向に、第１のタイプのＩＩＳ型制限酵素のための認識部位；複数のＤＮＡエレメント；プライマー結合部位；ならびに、複数のバーコードの各々が、複数のＤＮＡエレメントのうちの１つに一意的に割り当てられており、第２のタイプのＩＩＳ制限酵素のための認識部位を含み、ここで、複数のＤＮＡエレメントは、複数のＤＮＡエレメントのうちの何れか２つの間の連結点において、如何なる外来配列も含まず、タンパク質のためのコード化配列（例えば、天然または野生型タンパク質のためのコード化配列）を形成するように互いに接続されており、ここで、複数のバーコードの各々が、割り当てられたＤＮＡエレメントの逆の順序で配置されている。ある態様において、ＤＮＡ構築物は直線状である。他の態様において、ＤＮＡ構築物は環状であり、例えば、細菌ベースのＤＮＡプラスミドもしくはＤＮＡウイルスベクターを含むＤＮＡベクターである。そのような構築物のライブラリーもまた、少なくとも２つ、場合により多くの構築物を含むように提供され、各メンバーは、異なるポリヌクレオチド配列のＤＮＡエレメントのセットおよび一意的に割り当てられたバーコードのセットを有する。

上記および本明細書に記載のいずれかのＤＮＡ構築物のいくつかの態様において、第１のタイプのＩＩＳ型制限酵素および第２のタイプのＩＩＳ型制限酵素は、ＤＮＡ分子を切断することにより適合性の端末を作製する。ある態様において、第１のタイプのＩＩＳ型制限酵素はＢｓａＩである。ある態様において、第２のタイプのＩＩＳ型制限酵素はＢｂｓＩである。

１つのさらなる面において、本発明は、コンビナトリアル遺伝子構築物の作製方法に関する。この方法は、以下の工程を含む：(a) 請求項２に記載の第１のＤＮＡベクターを第１のタイプのＩＩＳ型制限酵素で切断して、第１のＤＮＡセグメント、第２のタイプのＩＩＳ型制限酵素のための第１および第２の認識部位ならびに第１のタイプのＩＩＳ型制限酵素により作製された第１および第２の末端に隣接する第１のバーコードを含む第１のＤＮＡフラグメントを遊離させる工程；(b) プロモーターを含む最初の発現ベクターを第２のタイプのＩＩＳ型制限酵素で切断して、該最初の発現ベクターをプロモーターの３’末端付近で線形化(linearize)し、かつ(a)のＤＮＡフラグメントの第１および第２の末端と適合性の２つの末端を作成する工程；(c) (a)の第１のＤＮＡフラグメントを(b)の線形化された発現ベクターにアニーリングおよびライゲーションして、第１のＤＮＡフラグメントおよび第１のバーコードがその３’末端でプロモーターに作動可能に連結されている１ウェイ（1-way）複合型発現ベクター（1-way composite expression vector）を形成する工程；(d) 請求項２に記載の第２のＤＮＡベクターを第１のタイプのＩＩＳ型制限酵素で切断して、第２のＤＮＡセグメント、第２のタイプのＩＩＳ型制限酵素のための第１および第２の認識部位ならびに第１のタイプのＩＩＳ型制限酵素により作製された第１および第２の末端に隣接する第２のバーコードを含む第２のＤＮＡフラグメントを遊離させる工程；(e) (c)の複合型発現ベクターを、第２のタイプのＩＩＳ型制限酵素で切断して、第１のＤＮＡエレメントと第１のバーコードの間で複合型発現ベクターを線形化し、かつ(d)のＤＮＡフラグメントの第１および第２の末端と適合性の２つの末端を作成する工程；ならびに、(f) (d)の第２のＤＮＡフラグメントを第１のＤＮＡエレメントと第１のバーコードの間で(e)の線形化された複合型発現ベクターにアニーリングおよびライゲーションして、第１のＤＮＡフラグメント、第２のＤＮＡフラグメント、第２のバーコードおよび第１のバーコードがこの順でその３’末端でプロモーターに作動可能に連結されている、２ウェイ複合型発現ベクターを形成する工程（ここで、第１および第２のＤＮＡエレメントが、互いに直接隣接するそのＮ末端由来の予め選択されたタンパク質の第１および第２のセグメントをコードし、該第１および第２のＤＮＡフラグメントが、予め選択されたタンパク質に見いだされないアミノ酸残基をもたらす外来ヌクレオチド配列を含まない２ウェイ複合型発現ベクター中で互いに結合しており、かつ該第１および第２のＤＮＡエレメントがそれぞれ、１以上の変異を含む）。

この方法のある態様において、工程(d)から(f)は、ｎ番目のＤＮＡエレメント、第２のタイプのＩＩＳ型制限酵素のための第１および第２の認識部位ならびにｎ番目のバーコードを含むｎ番目のＤＮＡフラグメントを、ｎウェイ（n-way）複合型発現ベクターに組み込むためにｎ回目まで繰り返され、ここで該ｎ番目のＤＮＡエレメントが、予め選択されたタンパク質のｎ番目または第２番目から最後のセグメントをそのＣ末端からコードしている。この方法は、以下の工程をさらに含む：(x) 第１のタイプのＩＩＳ型制限酵素のための第１および第２の認識部位の間に、（ｎ＋１）番目のＤＮＡエレメント、プライマー結合部位ならびに（ｎ＋１）番目のバーコードを含む、最終ＤＮＡベクターを提供する工程；(y) 該最終ＤＮＡベクターを第１のタイプのＩＩＳ型制限酵素で切断して、５’から３’の順に、（ｎ＋１）番目のＤＮＡエレメント、プライマー結合部位ならびに第１のタイプのＩＩＳ型制限酵素により作製された第１および第２の末端に隣接する（ｎ＋１）番目のバーコードを含む最終ＤＮＡフラグメントを遊離させる工程；(z) 該最終ＤＮＡフラグメントを、工程(d)から(f)をｎ回繰り返し後に作製され、かつ第２のタイプのＩＩＳ型制限酵素により線形化されたｎウェイ複合型発現ベクターにアニーリングおよびライゲーションして、最終複合型発現ベクター（final composite expression vector）を形成する工程（ここで、第１、第２およびｎ番目までならびに（ｎ＋１）番目のＤＮＡエレメントが、そのＮ末端から互いにすぐに隣接している予め選択されたタンパク質の第１、第２およびｎ番目までならびに最終セグメントをコードし、第１、第２およびｎ番目までならびに最終ＤＮＡフラグメントが、予め選択されたタンパク質に見出されない何らかのアミノ酸残基をもたらす任意の外来ヌクレオチド配列を含まない最終複合型発現ベクター中で互いに結合されており、かつＤＮＡエレメントの各々が、１個以上の変異を含む）。

上記および本明細書に記載の方法のある態様において、第１のタイプのＩＩＳ型制限酵素および第２のタイプのＩＩＳ型制限酵素は、ＤＮＡ分子を切断することにより適合性の末端を作製する。ある態様において、第１のタイプのＩＩＳ型制限酵素はＢｓａＩである。ある態様において、第２のタイプのＩＩＳ型制限酵素はＢｂｓＩである。

さらなる面において、本発明は、上記および本明細書に記載の方法により作製された少なくとも２つ、場合により多くの最終複合型発現ベクターを含むライブラリーを提供する。

第二に、本発明は、本明細書に記載の改善されたハイスループット遺伝子改変システムを用いることにより作製および同定される、改善したオンターゲット（on-target）の切断能および低減したオフターゲット（off-target）の切断能を有するＳｐＣａｓ９変異体を提供する。一面において、本発明は、配列番号１および４－１３のいずれか１つに記載のアミノ酸配列を含むポリヌクレオチド（好ましくは、単離されたポリヌクレオチド）を提供し、このポリペプチドは基本配列として機能し、ここで、配列番号１の残基６６１、６９５、８４８、９２３、９２４、９２６、１００３または１０６０に対応する少なくとも１つのおそらくより多くの残基が、例えば置換によって修飾されている。本発明のいくつかの例示的なポリペプチドは、本明細書の表２に提供される。ある態様において、配列番号１の残基１００３に対応する残基が置換され、配列番号１の残基６６１に対応する残基が置換される。ある態様において、ポリペプチドはさらに、配列番号１の残基９２６に対応する残基で置換されている。例えば、このポリペプチドは、ヒスチジンで置換された配列番号１の残基１００３に対応する残基およびアラニンで置換された配列番号１の残基６６１に対応する残基を有する。別の例では、ポリペプチドは、残基１００３がヒスチジンで置換され、残基６６１がアラニンで置換されており、要すれば残基９２６においてアラニンでの置換をさらに含んでいてもよい、配列番号１に記載の基本アミノ酸配列を有する。さらなる例では、ポリペプチドは、配列番号１に記載の基本アミノ酸配列を有し、ここで、残基６９５、８４８および９２６はアラニンで置換され、残基９２３はメチオニンで置換され、残基９２４はバリンで置換される。また、（１）上記および本明細書に記載のポリペプチド；および（２）生理学的に許容される賦形剤を含む組成物も提供される。

別の面において、本発明は、上記および本明細書に記載のポリペプチドをコードするポリヌクレオチド配列を含む核酸（好ましくは、単離された核酸）、ならびに該核酸を含む組成物を提供する。本発明はまた、本発明のポリペプチドをコードするポリヌクレオチド配列に操作可能に連結されたプロモーターを含む発現カセット、および該発現カセットを含むベクター（例えば、細菌ベースのプラスミドまたはウイルスベースのベクター）、該本発明の発現カセットまたはポリペプチドを含む宿主細胞を提供する。

さらなる面において、本発明は、標的部位でＤＮＡ分子を切断する方法を提供する。この方法は、標的ＤＮＡ部位を含むＤＮＡ分子を、上記および本明細書に記載のポリペプチドおよび標的ＤＮＡ部位に特異的に結合するショートガイドＲＮＡ（ｓｇＲＮＡ）と接触させる工程を含み、それによって該ＤＮＡ分子を標的ＤＮＡ部位で切断させる。この方法のある態様において、ＤＮＡ分子は、生細胞内のゲノムＤＮＡであり、細胞は、ｓｇＲＮＡおよびポリペプチドをコードするポリヌクレオチド配列でトランスフェクトされている。ある場合において、細胞は、ｓｇＲＮＡをコードする第１のベクターおよびポリペプチドをコードする第２のベクターでトランスフェクトされている。他の場合において、細胞は、ｓｇＲＮＡおよびポリペプチドの両方をコードするベクターでトランスフェクトされている。本方法のある態様において、第１および第２のベクターの各々は、レトロウイルスベクター、特にレンチウイルスベクターなどのウイルスベクターである。

上記および本明細書に記載されたハイスループットコンビナトリアル遺伝子組換えシステム、方法および関連する組成物は、原核細胞および真核細胞のいずれかにおける使用のために、適当なときに改変を加えて、好適である。いくつかの等価物もまた、上記および本明細書の記載から導き出すことができる。例えば、ＤＮＡ構築物の各々におけるＤＮＡエレメントおよびそれに対応するバーコードの配置を入れ替えることができ、すなわち、ＤＮＡ構築物は、５’から３’へ、第１のタイプのＩＩＳ型制限酵素のための第１の認識部位、ＤＮＡエレメントに一意的に割り当てられたバーコード、第２のタイプのＩＩＳ型制限酵素のための第１および第２の認識部位、ＤＮＡエレメント、および第１のタイプのＩＩＳ型制限酵素のための第２の認識部位を含む。このようなＤＮＡ構築物およびそのライブラリーを、本明細書に記載の方法と同様の方法で用いることにより、本明細書に記載のものと同様の中間ベクターおよび最終ベクターを作製することができる。ただし、これらのベクターにおけるＤＮＡエレメントおよびバーコードの相対的な位置が適宜入れ替えられることを除く。

ＳｐＣａｓ９の高カバレッジの組み合わせ変異体ライブラリーの作成およびヒト細胞へのライブラリーの効率的な送達。ａ）ＳｐＣａｓ９の組み合わせ変異体ライブラリーを組み立てるための戦略。ＳｐＣａｓ９のコード化配列は、それぞれが、図に記載のように、定義された位置で所定のアミノ酸残基変異をコードするバーコード化フラグメントのレパートリーを含む、４つの構成可能な部分（すなわち、Ｐ１～Ｐ４）にモジュール化された。９５２個のＳｐＣａｓ９変異体のライブラリーを、複数部分のワンポットのシームレスなライゲーションの連続ラウンドによって組み立てた、各変異体に一意的にタグ付けされた連結バーコードを生成した（詳細については図７を参照）。ｂ）大腸菌から抽出されたプラスミドプール内および感染ＯＶＣＡＲ８－ＡＤＲ細胞プール内のバーコード付き組み合わせ変異体ライブラリーの配列決定リード（reads)の累積分布。プラスミドおよび感染細胞プール内のライブラリーの高カバレッジ（それぞれ～９９．９％および～９９．６％）は、サンプルあたり約８０万個のリードから検出され、ほとんどの組み合わせは、少なくとも３００個の絶対バーコードリードで検出された（影付きで強調表示）。

ヒト細胞におけるＳｐＣａｓ９変異体のオンターゲットおよびオフターゲットの活性をプロファイルするための戦略。ａ）ＳｐＣａｓ９ライブラリーを、ＵＢＣプロモーターおよびＣＭＶプロモーターそれぞれ、ならびにＲＦＰを標的とするｇＲＮＡのタンデムＵ６プロモーター駆動の発現カセット（ＲＦＰｓｇ５またはＲＦＰｓｇ８）部位によって駆動されるＲＦＰ遺伝子およびＧＦＰ遺伝子を発現するＯＶＣＡＲ８－ＡＤＲレポーター細胞株に、～０．３の感染多重度でレンチウイルスを介して送達した。ＲＦＰおよびＧＦＰ発現をフローサイトメトリー下で分析した。ＳｐＣａｓ９のオンターゲット活性を、ｇＲＮＡスペーサー配列がＲＦＰ標的部位と完全に一致したときに測定し、そのオフターゲット活性を、ＲＦＰ標的部位が同義変異（synonymous mutation）を有しているときに測定した。活性なＳｐＣａｓ９変異体を有する細胞は、ＲＦＰ蛍光を失うと予想された。細胞は、ＲＦＰ蛍光に基づいて、集団の約５％を含むビン(bin）に分類され、それらのゲノムＤＮＡは、バーコード化されたＳｐＣａｓ９変異体を定量するために、Illumina HiSeqによって抽出された。ｂ）分類されたビン（すなわち、Ａ、ＢおよびＣ）と分類されていない集団との間の各ＳｐＣａｓ９変異体のバーコード数を比較する散布図。各ドットはＳｐＣａｓ９変異体を表し、野生型（ＷＴ）ＳｐＣａｓ９およびｅＳｐＣａｓ９（１．１）はプロット内でラベル付けされている。実線の参照線（reference line）は、バーコード数の１．５倍の濃縮および０．５倍の減少を示し、点線の参照線は、分類されたビンのバーコード数が、分類されていない集団と比較して変化していないことを示す。

ハイスループットプロファイリングにより、ＳｐＣａｓ９の組み合わせ変異体の広範なスペクトル特異性および効率性が明らかになる。ａ）ＳｐＣａｓ９の組み合わせ変異体を、２つの生物学的複製体からのプロファイリングデータに基づいて、標的分子（ｘ軸）および別の分子（ｙ軸）レポーター細胞株のそれぞれについて、分類されたＲＦＰ枯渇細胞集団におけるそれらの相対的な存在量を表す対数変換された濃縮比（すなわち、log₂(E））によりランク付けする（詳細については、表２および方法を参照）。散布図の各ドットはＳｐＣａｓ９変異体を表し、ＷＴＳｐＣａｓ９、ｅＳｐＣａｓ９（１．１）、Ｏｐｔｉ－ＳｐＣａｓ９およびＯｐｔｉＨＦ－ＳｐＣａｓ９が標識されている。組合せ変異体の９９％以上は、２つのオフターゲットレポーターラインＲＦＰｓｇ５－ＯＦＦ５－２およびＲＦＰｓｇ８－ＯＦＦ５においてＷＴより低いlog₂(E)を有し、一方、該変異体の１６．２％および２．５％は、それぞれ２つのオンターゲットレポーターラインＲＦＰｓｇ５－ＯＮおよびＲＦＰｓｇ８－ＯＮにおいてＷＴより高いlog₂(E)を有した。ｂ）オンターゲット（上パネル）およびオフターゲット（下パネル）の標的部位を有するＯＶＣＡＲ８－ＡＤＲレポーター細胞を個々のＳｐＣａｓ９組合せ変異体に感染させた。ＳｐＣａｓ９変異体の編集効率を、枯渇したＲＦＰレベルの細胞割合により測定し、ＷＴと比較した。

オンターゲット部位およびオフターゲット部位の編集効率およびエピスタシスを示すヒートマップ。編集効率（上パネル；log₂(E)により測定）およびエピスタシス（下パネル；ε）スコアを、方法に記載のように、各ＳｐＣａｓ９組合せ変異体について測定した。視覚化するために、標的ＤＮＡ鎖と接触すると予測されるか、またはＳｐＣａｓ９のＨＮＨおよびＲｕｖＣドメインを接続するリンカー領域に位置するアミノ酸残基をｙ軸にグループ化し、一方、標的でないＤＮＡ鎖と相互作用すると予測されるアミノ酸残基はｘ軸に示す。各組合せのlog₂(E)のＰ値を、２つのサンプル、両側スチューデントｔ検定（MATLAB function ‘ttest2’）を用いて、２つの独立した生物学的複製から得られた集団全体に含まれるものとlog₂(E)を比較することにより計算した。調製されたＰ値（すなわち、Ｑ値）を、多重仮説検定を補正するために、Ｐ値（MATLAB function ‘mafdr’）の分布に基づいて計算した。log₂(E)は、０．１未満のＱ値カットオフに基づいて、集団全体に対して統計的に有意であると考えられ、四角で囲んだ。完全なヒートマップを図１０に示す。濃縮比またはエピスタシススコアが測定されなかった組合せを灰色で示す

Ｏｐｔｉ－ＳｐＣａｓ９は、ロバストなオンターゲット活性および減少したオフターゲット活性を示す。ａ－ｂ）内因性遺伝子座を標的とするｇＲＮＡを用いた効率的なオンターゲット編集のためのＳｐＣａｓ９変異体の評価。挿入または欠失突然変異（インデル;Indel）の割合を、Ｔ７エンドヌクレアーゼＩ（Ｔ７Ｅ１）アッセイを用いて測定した。ＳｐＣａｓ９変異体のＷＴに対するオンターゲット活性の比（ａ）およびＯｐｔｉ－ＳｐＣａｓ９に対する比（ｂ）を決定し、インデル形成の正規化されたパーセンテージの中央値および四分位範囲を、試験した１０～１６個の遺伝子座について示す。各遺伝子座を１回または２回測定し、完全なデータセットを図１２に示す。ｃ）ＳｐＣａｓ９変異体のパネルのＧＵＩＤＥ－Ｓｅｑゲノム全体の特異性プロファイルは、それぞれが示されたｇＲＮＡとペアになっている。オフターゲット部位での不一致位置を色で強調表示し、ＧＵＩＤＥ－Ｓｅｑのリード数は、特定の部位での切断効率の指標として用いた。用いたｇＲＮＡ配列のリストを表５に示す。

タンパク質配列上のコンビナトリアル変異を特徴づけるための戦略例。

バーコード化された組合せ変異体ライブラリープールのシームレスなアセンブリのための戦略。ａ）ストレージベクター（Storage vector）中にバーコード化されたＤＮＡ部分を作成するために、ＰＣＲまたは合成により遺伝子インサート（挿入物）を生成し、ランダムバーコード（ｐＡＷｐ６１およびｐＡＷｐ６２；ＥｃｏＲＩおよびＢａｍＨＩで消化）を有するストレージベクター中に、ギブソンアセンブリー反応によりクローニングした。ＢｓａＩ消化を行い、バーコード化されたＤＮＡ部分（すなわち、Ｐ１、Ｐ２、...Ｐ（ｎ））を生成した。ＢｂｓＩ部位およびバーコード配列決定用のプライマー結合部位を、それぞれｐＡＷｐ６１およびｐＡＷｐ６２のインサートとバーコードの間に導入した。ｂ）バーコード化された組合せ変異体ライブラリーを作製するために、プールされたＤＮＡ部分および目的の（destination）アセンブリベクターを、それぞれＢｓａＩおよびＢｂｓＩで消化した。ワンポットライゲーションにより、プールされたベクターライブラリーを作成し、これをさらに反復消化し、その後のプールされたＤＮＡ部分でライゲーションして、より高次の組合せ変異体を作製した。バーコード化されたインサートは、ＩＩＳ型制限酵素（すなわち、ＢｓａＩおよびＢｂｓＩ）で消化した後、タンパク質をコードする配列に由来する互換性のあるオーバーハングで連結され、それにより、ライゲーション反応において融合スカー（fusion scar）は形成されなかった。すべてのバーコードは、ＤＮＡの連続した伸張部に局在した。最終的な組合せ変異体ライブラリーをレンチウイルスにコードし、標的とするヒト細胞に送達した。各組合せを表す統合されたバーコードを、プールされた細胞集団内のゲノムＤＮＡから偏りのない方法で増幅し、ハイスループット配列決定を用いて定量し、異なる実験条件下での提示のシフトを同定した。ｃ）プラスミドと感染細胞プールとの間、および感染細胞プールの生物学的複製体間で、再現性の高い提示を示す。

オンターゲットレポーターおよびオフターゲットレポーターを有するＳｐＣａｓ９ライブラリー感染ヒト細胞の蛍光活性化細胞選別。ＵＢＣおよびＣＭＶプロモーターによってそれぞれ駆動されるＲＦＰ遺伝子およびＧＦＰ遺伝子を発現するＯＶＣＡＲ８－ＡＤＲレポーター細胞株、およびＲＦＰ部位を標的とするｇＲＮＡのタンデムＵ６プロモーター駆動発現カセット（ＲＦＰｓｇ５またはＲＦＰｓｇ８）を、ＳｐＣａｓ９ライブラリーに感染していないか、または感染させた。ＲＦＰｓｇ５－ＯＮ系およびＲＦＰｓｇ８－ＯＮ系は、ｇＲＮＡ配列と完全に一致する部位を有し、一方、ＲＦＰｓｇ５－ＯＦＦ５－２系およびＲＦＰｓｇ８－ＯＦＦ５系は、ＲＦＰ上の同義変異を含み、ｇＲＮＡとは一致しない。細胞は、フローサイトメトリー下で、ＲＦＰ蛍光が低い集団の約５％を含むビンに分類された。これらの実験を独立して２回繰り返し、同様の結果を得た。

プールされたスクリーンから決定された濃縮スコアと個々の検証データの間の正の相関。各ＳｐＣａｓ９組合せ変異体の正規化log₂(E)は、２つの生物学的レプリケートでのプールされたスクリーンから決定された平均スコアであり、正規化ＲＦＰ破壊値(disruption value)は、３つの生物学的複製体から決定されたＷＴと比較したとき、枯渇したＲＦＰレベルの平均細胞割合である。Ｒはピアソンのｒ（積率相関係数）である。

オンターゲット部位およびオフターゲット部位の編集効率を示すヒートマップ。編集効率は、各ＳｐＣａｓ９組合せ変異体について決定された対数変換された濃縮率（log₂(E)）によって測定された。濃縮された変異体および枯渇した変異体は、それぞれ＞０および＜０を有する。視覚化を助けるために、標的ＤＮＡ鎖と接触すると予測されるアミノ酸残基、またはＳｐＣａｓ９のＨＮＨおよびＲｕｖＣドメインを接続するリンカー領域に位置するアミノ酸残基をy軸にグループ化し、標的ではないＤＮＡ鎖と接触すると予測されるアミノ酸残基をｘ軸に示した。濃縮されていないものの組合せは灰色で示される。

対照ヒトゲノムにおけるＮ２０－ＮＧＧおよびＧ－Ｎ１９－ＮＧＧ部位の頻度。Ｏｐｔｉ－ＳｐＣａｓ９ならびにｅＳｐＣａｓ９（１．１）、ＳｐＣａｓ９－ＨＦ１、ＨｙｐａＣａｓ９およびｅｖｏＣａｓ９を含む他の操作ＳｐＣａｓ９変異体の標的範囲の推定として、対照ヒトゲノムｈｇ１９の両鎖におけるＮ_２０－ＮＧＧおよびＧ－Ｎ_１９－ＮＧＧ部位の出現を見つけるために、カスタムPythonコードを用いた。Ｎ_２０－ＮＧＧ部位は、ヒトゲノムにおいてＧ－Ｎ_１９－ＮＧＧ部位の約４．３倍の頻度で存在する。

ＯＶＣＡＲ８－ＡＤＲ細胞におけるＤＮＡミスマッチ切断のためのＴ７エンドヌクレアーゼＩ（Ｔ７Ｅ１）アッセイ結果の概要。細胞をＳｐＣａｓ９変異体および示されたｇＲＮＡで感染させ、感染後１１～１６日後にＴ７Ｅ１アッセイのためにゲノムＤＮＡを回収した。感染したサンプルのインデル定量化を棒グラフで表示した。

ＯＶＣＡＲ８－ＡＤＲ細胞におけるＳｐＣａｓ９変異体の発現。細胞を、ＷＴＳｐＣａｓ９、Ｏｐｔｉ－ＳｐＣａｓ９、ｅＳｐＣａｓ９（１．１）、ＨｙｐａＣａｓ９、ＳｐＣａｓ９－ＨＦ１、Ｓｎｉｐｅｒ－Ｃａｓ９、ｅｖｏＣａｓ９、ｘＣａｓ９またはＯｐｔｉＨＦ－ＳｐＣａｓ９をコードするレンチウイルスに感染させた。タンパク質溶解物をウェスタンブロット分析のために抽出し、抗ＳｐＣａｓ９抗体で免疫ブロットした。β－アクチンをローディング対照として用いた。ＳｐＣａｓ９－ＨＦ１およびｘＣａｓ９の発現は、哺乳動物細胞における発現のためにそれらの非最適化配列に起因する可能性のあるＯＶＣＡＲ８－ＡＤＲ細胞において検出されなかった^24,49、したがって、ＳｐＣａｓ９－ＨＦ１およびｘＣａｓ９は、他の活性アッセイに含まれていなかった。これらの実験は、独立して３回繰り返され、同様の結果が得られた。

ＧＦＰ破壊アッセイ(disruption assay)を用いた、追加のミスマッチ５’グアニン（５’Ｇ）を有するか、またはそれを欠失したｇＲＮＡを有するＳｐＣａｓ９変異体の編集効率の評価。ＷＴＳｐＣａｓ９、Ｏｐｔｉ－ＳｐＣａｓ９、ｅＳｐＣａｓ９（１．１）またはＨｙｐａＣａｓ９を発現するＯＶＣＡＲ８－ＡＤＲ細胞を、追加のミスマッチ５’Ｇを有するか、または欠失したｇＲＮＡをコードするレンチウイルスに感染させた。編集効率を、フローサイトメトリーを用いて枯渇したＧＦＰレベルの細胞割合により測定した。値およびエラーバーは、４つの独立した生物学的複製体の平均値および標準偏差（s.d.）を反映している。

Ｏｐｔｉ－ＳｐＣａｓ９は、野生型ＳｐＣａｓ９と比較して、オフターゲット活性の低下を示す。８つの内因性遺伝子座におけるＶＥＧＦＡ部位３またはＤＮＭＴ１部位４のｇＲＮＡによってもたらされるオフターゲット編集のためのＳｐＣａｓ９変異体の評価。インデルの割合を、３つの独立した実験から平均した、Ｔ７Ｅ１アッセイを用いて測定した。ダッシュは何も検出されなかったことを示す。ＯＦＦ１遺伝子座におけるＶＥＧＦＡ部位３ｇＲＮＡとのＷＴＳｐＣａｓ９およびその変異体の特異性を、オンターゲット活性とオフターゲット活性の比としてプロットした（オンターゲット活性のデータを図１２から得た）。

ＧＦＰ破壊アッセイを用いて、ｇＲＮＡのスペーサーと完全に一致しているか、またはミスマッチ(複数可）を含む配列を有する標的部位を編集するためのＳｐＣａｓ９変異体の特性化。ＷＴＳｐＣａｓ９、Ｏｐｔｉ－ＳｐＣａｓ９、ｅＳｐＣａｓ９（１．１）またはＨｙｐａＣａｓ９を発現するＯＶＣＡＲ８－ＡＤＲ細胞を、標的に対してミスマッチを有しないか、または１～４塩基のミスマッチを有するｇＲＮＡをコードするレンチウイルスに感染させた。編集効率は、フローサイトメトリーを用いてＧＦＰレベルが枯渇した細胞の割合で測定した。値とエラーバーは、３つの独立した生物学的複製体の平均値および標準偏差を反映している。

切断されたｇＲＮＡを用いたＳｐＣａｓ９変異体のオンターゲット編集活性。ａ,ｂ）ＷＴＳｐＣａｓ９、Ｏｐｔｉ－ＳｐＣａｓ９、ｅＳｐＣａｓ９（１．１）またはＨｙｐａＣａｓ９を発現するＯＶＣＡＲ８－ＡＤＲ細胞を、ＧＦＰ配列（ａ）および内因性遺伝子座（ｂ）を標的とした長さの異なるｇＲＮＡ（１７～１９ヌクレオチド）をコードするレンチウイルスに感染させた。編集効率を、フローサイトメトリー（ａ）およびＴ７Ｅ１アッセイ（ｂ）を用いて、ＧＦＰレベルが枯渇した細胞の割合によって測定した。用いたｇＲＮＡ配列のリストを表５に示す。（ａ）については、値およびエラーバーは、４つの独立した生物学的複製体の平均および標準偏差を反映している。

多重配列アライメント－ストレプトコッカス・ピオゲネスのＣａｓ９ホモログの比較。Ｃａｓ９ホモログ間で保存されているアミノ酸残基、特にＳｐＣａｓ９残基６６１および１００３に対応するアミノ酸残基をマークしている。

定義
本明細書で用いる“ＣＲＩＳＰＲ－Ｃａｓ９”または“Ｃａｓ９”は、ストレプトコッカス・ピオゲネス（Streptococcus pyogenes）を含むいくつかの細菌種に見出されるＣＲＩＳＰＲ（Clustered Regularly Interspaced Short Palindromic Repeats）適応免疫系に関連するＲＮＡ誘導型ＤＮＡエンドヌクレアーゼ酵素であるＣＲＩＳＰＲ関連タンパク質９を意味する。ストレプトコッカス・ピオゲネス由来のＣａｓ９タンパク質であるＳｐＣａｓ９は、配列番号１に記載のアミノ酸配列を有し、このアミノ酸配列は、配列番号２に記載のポリヌクレオチド配列によってコードされている。配列番号１の残基６６１、６９５、８４８、９２３、９２４、９２６、１００３および１０６０のような既知の重要な保存残基の少なくとも一部（例えば、少なくとも２つ、３つ、４つ、５つまたはそれ以上、例えば、少なくとも半分であるが、必ずしも全てではない）を含む有意な配列相同性を有する追加のＣａｓ９酵素は、図１８の配列アラインメントを参照のこと。本明細書で用いる用語“Ｃａｓ９タンパク質”は、配列番号１と実質的なアミノ酸配列同一性を有する、例えば、少なくとも５０％、６０％、７０％、７５％、最大８０％、８５％またはそれ以上の全体的な配列同一性を有する、何れかのＲＮＡ誘導ＤＮＡエンドヌクレアーゼ酵素を包含する。野生型Ｃａｓ９タンパク質の例としては、細菌種Streptococcus mutans、Streptococcus dysgalactiae、Streptococcus equi、Streptococcus oralis、Streptococcus mitis、Listeria monocytogenes、Enterococcus timonensis、Streptococcus thermophilusおよびStreptococcus parasanguinisに由来するものが挙げられ、それぞれ配列番号４～１３に記載のアミノ酸配列を有する。

用語“核酸”または“ポリヌクレオチド”は、いずれかの一本鎖または二本鎖形態のデオキシリボヌクレオチドまたはリボヌクレオチドおよびそれらのポリマーを意味する。特に限定されない限り、この用語は、対照核酸と同様の結合特性を有し、天然のヌクレオチドと同様の方法で代謝される、天然ヌクレオチドの既知の類縁体を含む核酸を包含する。他に特記されない限り、特定の核酸配列はまた、その保存された修飾変異体（例えば、縮重コドン置換）および相対的配列ならびに明示的に記載された配列も当然包含する。具体的には、縮重コドン置換は、１以上の選択された（または全ての）コドンの３番目の位置が混合塩基および／またはデオキシイノシン残基で置換される配列を生成することによって達成され得る（Batzer et al., Nucleic Acid Res., 19:5081 (1991); Ohtsuka et al., J. Biol. Chem., 260:2605-2608 (1985)；および、Cassol et al., (1992); Rossolini et al., Mol. Cell. Probes, 8:91-98 (1994)）。核酸およびポリヌクレオチドという用語は、遺伝子、ｃＤＮＡおよび遺伝子によってコードされるｍＲＮＡと互換的に用いられる。

用語“ポリペプチド”、“ペプチド”および“タンパク質”は、本明細書中で互換的に用いられ、アミノ酸残基のポリマーを意味する。この用語は、１以上のアミノ酸残基が、対応する天然アミノ酸の人工的な化学模倣体、ならびに天然アミノ酸ポリマーおよび非天然アミノ酸ポリマーである、アミノ酸ポリマーに適用される。本明細書で用いるこれらの用語は、アミノ酸残基が共有ペプチド結合によって連結されている、完全長タンパク質（すなわち、抗原）を含む、任意の長さのアミノ酸鎖を包含する。

用語“アミノ酸”は、天然および合成アミノ酸、ならびに天然アミノ酸と同様の方法で機能するアミノ酸類縁体およびアミノ酸模倣体を意味する。天然アミノ酸とは、遺伝コードによってコード化されたアミノ酸、ならびに後に修飾されるアミノ酸、例えばヒドロキシプロリン、γ－カルボキシグルタミン酸およびＯ－ホスホセリンである。アミノ酸類縁体とは、天然アミノ酸と同じ基本的な化学構造を有する化合物、すなわち、水素、カルボキシル基、アミノ基およびＲ基に結合するα炭素を有する化合物、例えば、ホモセリン、ノルロイシン、メチオニンスルホキシド、メチオニンメチルスルホニウムなどを意味する。そのような類縁体は、修飾されたＲ基（例えば、ノルロイシン）または修飾されたペプチド骨格を有するが、天然アミノ酸と同じ基本的な化学構造を保持している。“アミノ酸模倣体”とは、アミノ酸の一般的な化学構造とは異なる構造を有するが、天然アミノ酸と同様の方法で機能する化合物を意味する。

アミノ酸は、本明細書中、それらの一般的に知られている三文字記号、またはＩＵＰＡＣ－ＩＵＢ生化学命名委員会（ＣＢＮ：Biochemical Nomenclature Commission）によって推奨される一文字記号のいずれかによって記載され得る。同様に、ヌクレオチドもそれらの一般的に認められた一文字記号によって記載され得る。

“発現カセット”とは、宿主細胞における特定のポリヌクレオチド配列の転写を可能にする一連の指定された核酸エレメントを有する、組換えまたは合成により生成された核酸構築物である。発現カセットは、プラスミド、ウイルスゲノムまたは核酸フラグメントの一部であってもよい。一般的には、発現カセットは、プロモーターに作動可能に連結された、転写されるべきポリヌクレオチドを含む。この文脈における“作動可能に連結された”とは、ポリヌクレオチドコード化配列およびプロモーターなどの２つまたはそれ以上の遺伝的エレメントが、該コード化配列の転写を指向するプロモーターなどのエレメントの適切な生物学的機能を可能にする相対的位置に配置されたことを意味する。発現カセット内に存在し得る他のエレメントには、転写を増強するもの（例えば、エンハンサー）および転写を終結させるもの（例えば、ターミネーター）、ならびに発現カセットから産生される組換えタンパク質に特定の結合親和性または抗原性を付与するエレメントが含まれる。

“ベクター”は、細菌ベースの構造体（例えば、プラスミド）またはウイルスベースの構造体（例えば、ウイルスゲノム）から組換え的に産生された環状の核酸構築物である。一般的には、ベクターは、目的の１以上の遺伝的構成要素（例えば、１以上のタンパク質をコードするポリヌクレオチド配列）に加えて、自己複製起源を含む。ある場合には、ベクターは発現カセットを含んでもよく、これによりベクターは発現ベクターとなる。他の場合には、ベクターは、コード化配列を発現するための構成(apparatus)を含まず、むしろ、ある遺伝子構築物から別の遺伝子構築物への目的の１以上の遺伝的構成要素（例えば、コード化配列）の貯蔵および／または移動のためのキャリア（担体）またはシャトルとして作用し得る。要すれば、ベクターは、該ベクターを収容し、該ベクターからのタンパク質発現を可能にする、形質転換された宿主細胞またはトランスフェクトされた宿主細胞の容易な検出を可能にするために、抗生物質耐性タンパク質（例えば、細菌宿主細胞の検出のため）または蛍光タンパク質（例えば、真核生物宿主細胞の検出のため）などのタンパク質をコードしてもよい、１以上の選択マーカーまたは同定マーカーをコードする配列をさらに含んでいてもよい。

用語“異種”とは、組換え構築物中の２つのポリヌクレオチド配列または２つのポリペプチド配列のような２つのエレメント間の関係を記載する文脈中で用いられるとき、該２つのエレメントが、２つの異なる起源に由来し、現在、天然に見出されない、互いに相対的な位置に配置されているものとして記載される。例えば、タンパク質のコード化配列の発現を誘導する“異種”プロモーターは、コード化配列の発現を誘導するために天然に見出されないプロモーターである。別の例として、組換えポリペプチドを形成するために“異種”ペプチドと融合されたペプチドの場合、２つのペプチド配列は、２つの異なる親タンパク質に由来するか、または同じタンパク質に由来するが、互いに直接隣接しない２つの別個の部分である。言い換えれば、互いに“異種”な２つのエレメントの配置は、天然に見出され得るより長いポリヌクレオチドまたはポリペプチド配列をもたらさない。

本明細書で用いる用語“バーコード”は、該バーコードの存在に基づいて、予め決定されたポリヌクレオチド配列またはそのコード化されたアミノ酸配列を検出／同定するのを可能にするために、別の、予め決定されたポリヌクレオチド配列（例えば、ＳｐＣａｓ９等の目的のタンパク質のコーディング配列の１つのセグメント）に一意的に割り当てられた、ポリヌクレオチド配列の短い伸張（一般的には最大３０ヌクレオチド長、例えば約４または５ヌクレオチド長から約６、７、８、９、１０、１２、２０または２５ヌクレオチドの間）を意味する。

“ＩＩＳ型制限酵素”は、非対称ＤＮＡ配列を認識し、その認識配列の外側を（３’または５’）切断するエンドヌクレアーゼである。これらの酵素は、対称性または回文性のＤＮＡ配列を認識し、その認識配列内で切断するＩＩＰ型制限酵素とは異なる作用をする。ＩＩＳ型制限酵素は、認識配列の外側でＤＮＡ鎖を切断するため、認識配列とは無関係にあらゆる配列のオーバーハングを生成することができる。従って、２つの異なるＩＩＳ型制限酵素を用いて、同じサイズおよび同じ方向のオーバーハング（すなわち、オーバーハングは両方とも３'または５'オーバーハングであり、同じ数のヌクレオチドを有する）だけでなく、一致したオーバーハングまたは互換性のある末端（すなわち、２つの対向する鎖上のオーバーハングは完全に相補的である）を生成することが可能であり、これにより、２つの異なるＩＩＳ型制限酵素によって生成された２つの末端間のアニーリングおよびライゲーションが可能になる。

本明細書で用いる用語“短いガイドＲＮＡ”または“ｓｇＲＮＡ”とは、予め決められた標的部位でＤＮＡ分子に特異的に結合し、標的部位に隣接するＤＮＡ分子を切断するようにＣＲＩＳＰＲヌクレアーゼを誘導する、約１５～５０（例えば、２０、２５または３０）ヌクレオチド長のＲＮＡ分子を意味する。

ヌクレオチド配列は、２つのポリヌクレオチド配列、特に２つの一本鎖ＤＮＡまたはＲＮＡ配列が、２つの配列間の実質的または完全な（例えば、少なくとも約８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％または１００％までの）ワトソン－クリック相補性に基づいて二本鎖構造を形成するように互いに複合化したときに、他方に“特異的に結合する”。

“生理学的に許容される賦形剤／担体”および“薬学的に許容される賦形剤／担体”とは、送達標的（細胞、組織または生きた生物）への活性剤の投与を補助する物質、および送達標的（細胞、組織または生きた生物）による吸収をしばしば補助する物質を意味し、レシピエントに有意な影響を及ぼすことなく、本発明の組成物中に含有され得る。生理学的／薬学的に許容される賦形剤の限定されない例としては、水、ＮａＣｌ、通常の生理食塩水、乳化リンゲル、通常のスクロース、通常のグルコース、結合剤、充填剤、崩壊剤、滑沢剤、コーティング剤、甘味料、香料および着色剤などが挙げられる。本明細書で用いる用語“生理学的に／薬学的に許容される賦形剤／担体”は、意図された用途に適合する、あらゆるおよび全ての溶媒、分散媒体、コーティング剤、抗菌剤および抗真菌剤、等張剤および吸収遅延剤などを含むことを意図する。

予め決定された値に関連して用いられるとき、用語“約”は、その値の±１０％を包含する範囲を意味する。

詳細な説明
Ｉ．一般
本発明は、望ましい生物学的機能性を有する組換えタンパク質を高効率で生成し、同定するための、新たに改良された高次の遺伝子組換えおよびスクリーニングプラットフォームに関する。本発明はまた、このプラットフォームによって産生される組換えタンパク質を提供する。

Ａ．組換え技術
組換え遺伝学の分野において一般的な方法および技術を開示する基本的なテキストとしては、Sambrook and Russell, Molecular Cloning, A Laboratory Manual (3rd ed. 2001)；Kriegler, Gene Transfer and Expression: A Laboratory Manual (1990)；および、Ausubel et al., eds., Current Protocols in Molecular Biology (1994)が挙げられる。

核酸について、サイズはキロベース（ｋｂ）または塩基対（ｂｐ）のいずれかで示される。これらは、アガロースゲル電気泳動もしくはアクリルアミドゲル電気泳動、配列決定された核酸または公表されているＤＮＡ配列から得られた推定値である。タンパク質について、サイズはキロダルトン（ｋＤａ）またはアミノ酸残基数で示される。タンパク質のサイズは、ゲル電気泳動、配列決定されたタンパク質、それが由来するアミノ酸配列または公表されているタンパク質配列から推定される。

市販されていないオリゴヌクレオチドは、化学的に合成することができ、例えば、Beaucage & Caruthers, Tetrahedron Lett. 22: 1859-1862 (1981)に最初に記載された固相ホスホロアミダイトトリエステル（phosphoramidite triester）法に従って、Van Devanterらの、Nucleic Acids Res. 12: 6159-6168 (1984)に記載のように、自動化された合成装置を用いて、化学的に合成することができる。オリゴヌクレオチドの精製は、何らかの当該技術分野で認められた戦略、例えば、Pearson & Reanier, J. Chrom. 255: 137-149 (1983)に記載の天然アクリルアミドゲル電気泳動またはアニオン交換ＨＰＬＣを用いて行われる。

目的のポリペプチド、例えばＳｐＣａｓ９タンパク質またはそのフラグメントをコードするポリヌクレオチド配列、および合成オリゴヌクレオチドは、例えばWallaceらの、Gene 16: 21-26 (1981)に記載の二本鎖テンプレートを配列決定するための鎖終結法を用いて、クローニングまたはサブクローニング後に確認することができる。

Ｂ．ポリヌクレオチドコーディング配列の修飾
目的の予め選択されたタンパク質（例えば、ＳｐＣａｓ９）の既知のアミノ酸配列を考慮すると、当技術分野で知られているインビトロまたはインビボの方法ならびに本明細書に記載のインビトロまたはインビボの方法によって決定され得るように、当該タンパク質の望ましい特徴または改善された生物学的機能性を達成するために、修飾することができる。アミノ酸配列に対する可能な修飾としては、置換（保存的または非保存的）；アミノ酸配列の１つまたは複数の位置における１以上のアミノ酸残基の欠失または付加が挙げられ得る。

様々な変異作製プロトコルが確立されており、当技術分野で記載されており、目的のタンパク質をコードするポリヌクレオチド配列を改変するために容易に用いることができる。例えば、Zhangら、Proc. Natl. Acad. Sci. USA, 94: 4504-4509 (1997)；および、Stemmer, Nature, 370: 389-391 (1994)を参照のこと。これらの方法は、核酸セットの変異体、ならびにコード化されたタンパク質の変異体を生成するために、別個にまたは組み合わせて用いることができる。

多様性を生成する変異誘発法としては、例えば、部位特異的変異誘発法（Botstein and Shortle, Science, 229: 1193-1201 (1985)）、ウラシル含有テンプレートを用いた変異誘発法（Kunkel, Proc. Natl. Acad. Sci. USA, 82: 488-492 (1985)）、オリゴヌクレオチド介在（oligonucleotide-directed）変異誘発法（Zoller and Smith, Nucl. Acids Res., 10: 6487-6500 (1982)）、ホスホロチオエート修飾ＤＮＡ変異誘発法（Taylor et al., Nucl. Acids Res., 13: 8749-8764および8765-8787 (1985)）、およびギャップ付き二本鎖ＤＮＡを用いた変異誘発法（Kramer et al., Nucl. Acids Res., 12: 9441-9456 (1984))が挙げられる。

他の可能性のある変異誘発法としては、点ミスマッチ修復法（Kramer et al., Cell, 38: 879-887 (1984))、修復欠損宿主株を用いた変異誘発法（Carter et al., Nucl. Acids Res. 13: 4431-4443 (1985))、欠失変異誘発法（Eghtedarzadeh and Henikoff, Nucl. Acids Res., 14: 5115 (1986))、制限選択法および制限精製法(Wells et al., Phil. Trans. R. Soc. Lond. A, 317: 415-423 (1986))、全遺伝子合成による変異誘発法(Nambiar et al., Science, 223: 1299-1301 (1984))、二本鎖切断修復法(Mandecki, Proc. Natl. Acad. Sci. USA, 83: 7177-7181 (1986))、ポリヌクレオチド鎖終結法による変異誘発法（米国特許第５，９６５，４０８号）、ならびにエラープローン（error-prone）ＰＣＲ(Leung et al., Biotechniques, 1: 11-15 (1989))が挙げられる。

Ｃ．好ましいコドン使用のための核酸の修飾
目的のタンパク質またはそのフラグメントをコードするポリヌクレオチド配列は、特定のタイプの宿主細胞における組換え発現を増強するために、または潜在的な開裂／再ライゲーション（re-ligation）のための望ましい部位における制限エンドヌクレアーゼ認識配列の構築を可能にするようなさらなる遺伝子操作を容易にするために、好ましいコドン使用頻度と一致するように、コドン縮重の原理に基づいてさらに変更することができる。後者の使用法は、コンビナトリアル突然変異誘発を受ける標的タンパク質（例えば、ＳｐＣａｓ９タンパク質）の複数のコーディングセグメントのシームレスな結合が、コーディングセグメントをＩＩＳ型制限酵素で消化して、天然タンパク質のコーディング配列に特異的に由来するオーバーハングを生成することに依存し、これらのセグメントの何れか２つの間の連結部における何らかの外来配列またはいわゆるスカー配列（scar sequence）を排除することができるため、本発明では特に重要である。

修飾の完了時に、コード化配列は、配列決定によって確認され、その後、さらなる操作のためまたはタンパク質の組換え発現のために、適切なベクターにサブクローニングされる。

Ｄ．組換えポリペプチドの発現
目的の組換えポリペプチド（例えば、改良されたＣａｓ９タンパク質）を、本明細書に記載のポリペプチドをコードするポリヌクレオチド配列に依存して、組換え遺伝学の分野で常套の技術を用いて発現させることができる。

（Ｉ）発現系
目的のポリペプチドをコードする核酸の高レベルの発現を得るために、一般的に、転写を指向する強力なプロモーター、転写／翻訳ターミネーターおよび翻訳開始のためのリボソーム結合部位を含む発現ベクター中にポリヌクレオチドコーディング配列をサブクローニングする。適切な細菌プロモーターは、当技術分野でよく知られており、例えば、Sambrook and Russell（上記）およびAusubelら（上記）に記載されている。組換えポリペプチドを発現させるための細菌発現系は、例えば、大腸菌、バチルス属菌（Bacillus sp.）、サルモネラ菌およびカウロバクター菌（Caulobacter）が利用可能である。かかる発現系のキットは市販されている。哺乳動物細胞、酵母および昆虫細胞用の真核生物発現系は、当技術分野でよく知られており、また市販されている。いくつかの例示的な真核生物発現ベクターとしては、アデノウイルスベクター、アデノ随伴ベクターおよびレンチウイルス由来のウイルスベクターなどのレトロウイルスベクターが挙げられる。

目的のタンパク質をコードする異種ポリヌクレオチド配列の発現を指向するために用いられるプロモーターは、特定の用途によって変わる。プロモーターは、要すれば、その自然環境における転写開始部位からの距離とほぼ同じ距離で、異種転写開始部位から離れて配置される。しかしながら、当技術分野で知られているように、この距離の多少の変動は、プロモーター機能を損なうことなく可能である。

プロモーターに加えて、発現ベクターは、一般的に、宿主細胞における所望のポリペプチドの発現に必要なすべての付加的要素を含む転写ユニットまたは発現カセットを含む。したがって、一般的な発現カセットは、ポリペプチドをコードする核酸配列に作動可能に連結されたプロモーターと、転写物の効率的なポリアデニル化、リボソーム結合部位および翻訳終結に必要なシグナルとを含む。分泌されたタンパク質の組換え発現の場合、タンパク質をコードするポリヌクレオチド配列は、一般的には、開裂可能なシグナルペプチド配列に連結されて、形質転換された細胞による組換えポリペプチドの分泌を促進する。一方、組換えポリペプチドが宿主細胞表面上で発現されることが意図される場合、適切なアンカー配列がコード化配列と協働して用いられる。カセットの付加的な要素には、エンハンサー、およびゲノムＤＮＡが構造遺伝子として用いられるとき、機能的スプライシングドナー部位およびアクセプター部位を有するイントロンが含まれ得る。

プロモーター配列に加えて、発現カセットはまた、効率的な終結を提供するために、コーディング配列の下流に転写終結領域を含むべきである。終結領域は、プロモーター配列と同じ遺伝子から得られてもよいし、異なる遺伝子から得られてもよい。

真核生物ウイルス由来の調節エレメントを含む発現ベクターは、一般的には真核生物発現ベクター、例えばＳＶ４０ベクター、パピローマウイルスベクター、レンチウイルスベクターおよびエプスタインバーウイルス由来のベクターに用いられる。他の例示的な真核生物発現ベクターとしては、ｐＭＳＧ、ｐＡＶ００９／Ａ^＋、ｐＭＴＯ１０／Ａ^＋、ｐＭＡＭｎｅｏ－５、バキュロウイルスｐＤＳＶＥおよびＳＶ４０初期プロモーター、ＳＶ４０後期プロモーター、メタロチオネインプロモーター、マウス乳腺腫瘍ウイルスプロモーター、ラウス肉腫ウイルスプロモーター、ポリヘドリンプロモーターまたは真核細胞での発現に有効であることが示されている他のプロモーターの指示下でタンパク質の発現を可能にする他の何らかのベクターが挙げられる。

発現ベクターに一般的に含まれるエレメントはまた、大腸菌で機能するレプリコン、組換えプラスミドを宿主とする細菌の選択を可能にするための抗生物質耐性をコード化する遺伝子、および真核生物配列の挿入を可能にするためのプラスミドの非必須領域における固有の制限部位を含んでいてもよい。選択される特定の抗生物質耐性遺伝子は重要ではなく、当技術分野で知られている多くの耐性遺伝子のいずれかが適している。原核生物配列は、必要に応じて、真核生物細胞におけるＤＮＡの複製を妨げないようなものが選択され得る。抗生物質耐性選択マーカーと同様に、既知の代謝経路に基づく代謝選択マーカーもまた、形質転換された宿主細胞を選択するための手段として用いられ得る。

上記のように、当業者は、タンパク質の生物学的活性を保持したまま、タンパク質またはそのコード化配列に対して様々な保存的置換を行うことができることを認識し得る。さらに、ポリヌクレオチドのコード化配列の修飾もまた、特定の発現宿主における好ましいコドン使用に対応するために、または結果として得られるアミノ酸配列を改変することなく制限酵素切断部位を生成するために行われ得る。

（ＩＩ）トランスフェクション法
標準的なトランスフェクション法は、大量の組換えポリペプチドを発現する細菌細胞系、哺乳動物細胞系、酵母細胞系、昆虫細胞系または植物細胞系を作製するために用いられ、これらは標準的技術を用いて精製される（例えば、Colley et al., J. Biol. Chem. 264: 17619-17622 (1989); Guide to Protein Purification, in Methods in Enzymology, vol. 182 (Deutscher, ed., 1990)を参照のこと）。真核細胞および原核細胞の形質転換は、標準的技術に従って行われる（例えば、Morrison, J. Bact. 132: 349-351 (1977); Clark-Curtiss & Curtiss, Methods in Enzymology 101: 347-362 (Wu et al., eds, 1983)を参照のこと）。

宿主細胞に外来ヌクレオチド配列を導入するための周知のいずれかの方法を用いることができる。これらには、リン酸カルシウムトランスフェクション、ポリブレン、プロトプラスト融合、エレクトロポレーション、リポソーム、マイクロインジェクション、プラズマベクター、ウイルスベクターおよびクローン化されたゲノムＤＮＡ、ｃＤＮＡ、合成ＤＮＡまたは他の外来遺伝物質を宿主細胞に導入するための他の周知のいずれかの方法の使用が含まれる（例えば、上記のSambrook and Russellを参照のこと）。用いられる特定の遺伝子工学的方法が、組換えポリペプチドを発現することができる宿主細胞への少なくとも１つの遺伝子の導入に成功し得ることのみが必要である。

ＩＩ．改良されたコンビナトリアル遺伝子改変システム
本発明者らは、以前に開発されたハイスループットＣｏｍｂｉＧＥＭコンビナトリアル遺伝子改変システム等に基づいて、それぞれが目的のタンパク質（例えば、ＳｐＣａｓ９）の一部に対応し、そのアミノ酸配列中に少なくとも１つ、場合によっては複数の変異を含む複数のタンパク質セグメントをコード化するＤＮＡエレメントをシームレスに結合させ、結果として得られる複合タンパク質変異体が、意図的に導入された変異を除いて、無関係なアミノ酸残基を有さないようにすることを目的として、これらのシステムをさらに改良した。以前の方法では、ＩＩＰ型制限エンドヌクレアーゼを利用してＤＮＡ配列（コンビナトリアルタンパク質変異体のセグメントをコードする）を切断し、再ライゲーションしていたが、このタイプのエンドヌクレアーゼの性質（ヌクレオチド配列の短い回文配列に結合して切断する）は、一般的に、使用者（ユーザー）が余分なヌクレオチドを導入して切断部位を設計することを必要とし、その結果、システムによって生成されたタンパク質変異体の２つのセグメント間の各結合点に、外来アミノ酸残基（複数もある）または“ｓｃａｒ”配列を生じることになる。これらの外来アミノ酸残基は、タンパク質配列をさらに変化させ、変異体の機能的スクリーニングを妨げる可能性がある。

これらの望ましくない余分なアミノ酸残基の導入を回避するために、本発明者らは、タンパク質のセグメントをコード化する複数のＤＮＡコーディング配列を構築し、ライゲーションするために、代わりにＩＩＳ型制限酵素を用いて、コンビナトリアル遺伝子変異体のライブラリーを構築するとき、セグメント間のこのような望ましくない“ｓｃａｒ”配列を完全に除去できることを発見した。この方法は、ＩＩＳ型エンドヌクレアーゼが、それらの非対称認識部位の外側でＤＮＡ鎖を切断することができるという事実を利用しており、これにより、これらの酵素によるＤＮＡ切断後に、野生型タンパク質の天然ＤＮＡコーディング配列の一部を有する互換性のある末端または一致したオーバーハングが生成されることを可能にしている。互換性のある末端または一致したオーバーハングにおける天然タンパク質由来のコーディング配列の使用は、タンパク質セグメント間のシームレスな結合を補助するだけでなく、特定の方向性のライゲーションを可能にし、コンビナトリアルタンパク質変異体を構築するプロセスの効率をさらに向上させる。

Ａ．タンパク質セグメントをコードするＤＮＡセグメントのライブラリーの生成
コンビナトリアルタンパク質変異体のライブラリーを作製する第一の工程は、タンパク質のセグメントのそれぞれについてライブラリーを作製することである：タンパク質変異体は、タンパク質セグメントまたはモジュールの予め決定された個数（例えば、３個、４個、５個、６個またはそれ以上）を端から端まで結合することによって生成されるように設計することができる。本明細書に記載のように、予め決定された個数は、ｎ＋１として表され、目的のタンパク質については、ｎ＝５の６個のセグメントからなるように考案される。最初に、野生型タンパク質の最Ｎ末端部分に対応し、タンパク質のこの部分に１個以上の可能な変異を含む第１のタンパク質セグメントをコード化するＤＮＡエレメントのライブラリーまたは個々のメンバーのコレクションを、組換え生産または化学合成などの既知の方法によって生成され、適切な制限酵素部位および予め決定された変異（または予め決定された変異セット）を有するＤＮＡエレメントに一意的に割り当てられたバーコード配列を含むＤＮＡベクター（その目的のためのいわゆるストレージベクター）に組み込まれてもよい。ＤＮＡエレメントが比較的長いときは、ストレージベクターに組み込む前に、ギブソンアセンブリーのような既知の方法で短いフラグメントを結合させることによって最初に作製されてもよい。上記のように、ＤＮＡ配列変異を生成する方法は、当業者にはよく知られており、例えば、１以上のヌクレオチドの欠失、挿入および／または置換によって、天然バージョンまたは野生型配列を改変することによって、配列変異体を生成するために容易に用いられ得る。

図７ａは、タンパク質セグメントをコードするＤＮＡエレメントをベクターに挿入してライゲーションし、５’から３’まで、第１のタイプのＩＩＳ型制限酵素（例えば、ＢｓａＩ）のための第１の認識部位、ＤＮＡエレメント、第２のタイプのＩＩＳ型制限酵素（例えば、ＢｂｓＩ）のための第１および第２の認識部位、それが有する特定の変異（複数可）のためにＤＮＡエレメントに一意的に割り当てられたバーコード、ならびに第１のタイプのＩＩＳ型制限酵素（例えば、ＢｓａＩ）のための第２の認識部位を含むＤＮＡ構築物を形成する方法の例を示す。コンビナトリアル変異試験のための（ｎ＋１）個のセグメントまたはモジュールを有するように設計または“分解された（deconstructed）”タンパク質については、ＤＮＡセグメントを含むストレージベクターのライブラリーを、後続のＤＮＡエレメントのそれぞれについて、２番目、３番目およびｎ番目のＤＮＡエレメント（それぞれ、２番目、３番目およびｎ番目のタンパク質セグメントまでをコード化する）、タンパク質の２番目から最後または最Ｃ末端部分までに対応するｎ番目のタンパク質セグメントについて、同様の方法で構築することができる。

タンパク質の最後のセグメントまたは最Ｃ末端セグメントをコード化するＤＮＡエレメントについては、（ｎ＋１）番目のＤＮＡエレメントを含むベクターのライブラリーを構築するために、構造的に異なるストレージベクターが用いられる。図７ａに例示のように、最後のＤＮＡエレメントのまたは（ｎ＋１）番目のＤＮＡエレメントは、このストレージベクターに挿入されて、５'から３'の順に、第１のタイプのＩＩＳ型制限酵素（例えば、ＢｓａＩ）のための第１の認識部位、（ｎ＋１）番目のＤＮＡエレメント、プライマー結合部位として機能する短いヌクレオチド配列伸張部、それが有する特定の変異（複数もある）のためにＤＮＡエレメントに一意的に割り当てられたバーコード、および第１のタイプのＩＩＳ型制限酵素（例えば、ＢｓａＩ）のための第２の認識部位を含むＤＮＡ構築物を形成する。プライマー結合部位の存在および配置は、タンパク質変異体のための複合コーディング配列（すべてのｎ＋１個のＤＮＡエレメントを組み合わせたもの）が生成された後、ユニバーサルプライマー（プライマー結合部位に特異的に結合する）を利用して結合されたバーコードの迅速な配列決定を可能にし、該変異体に含まれる変異の容易な同定を可能にし、複合コーディング配列全体を配列決定するという手間のかかる作業を行う必要がなくなる。

ライブラリー内の可能性のある組合せタンパク質変異体それぞれの均等な機会を確保するために、変異のユニークなセットを有するＤＮＡエレメントはそれぞれ、好ましくは等モル比でライブラリー中に存在する。

Ｂ．コンビナトリアルタンパク質変異体ライブラリーの作成
第１、第２およびｎ番目までのＤＮＡエレメントならびに（ｎ＋１）番目のＤＮＡエレメントを含むストレージベクターのライブラリーが構築されると、タンパク質セグメントまたはモジュールをコードするＤＮＡエレメントを含むＤＮＡフラグメントは、まず、ストレージベクターの酵素的消化の方法、例えば、第１のタイプのＩＩＳ型制限エンドヌクレアーゼ（例えば、ＢｓａＩ）を用いて、ベクターを２つの部位で切断することによって放出される。ストレージベクターの消化は、タンパク質セグメントをコードするＤＮＡエレメント（変異を有する）およびその一意的に割り当てられたバーコードを含み、２つタイプのＩＩＳ型制限酵素（例えば、ＢｂｓＩ）認識部位が間に挟まれているＤＮＡフラグメントをそれぞれ放出する。ＤＮＡフラグメントの２つの末端は、第１のタイプのＩＩＳ型制限酵素の切断によって生じるオーバーハングを有する。

一方、タンパク質変異体全体をコード化する最終的な複合ＤＮＡエレメントを担持して発現させることを目的とするＤＮＡベクター（その目的のためのいわゆるデスティネーションベクター（destination vector））は、ＤＮＡコーディング配列の発現に必要なすべての遺伝的要素を含む発現ベクターである。前のセクションで記載の通り、転写のための１つの必須要素は、配列の転写を指示するために、コーディング配列に作動可能に連結されるべきプロモーターである。一般的には、プロモーターは、該コーディング配列に対して異種プロモーターである。

ストレージベクターライブラリーから産生されたＤＮＡフラグメントを得るために、デスティネーションベクターは、ＤＮＡフラグメントの挿入／ライゲーションを可能にし、転写のためのプロモーターの制御下でＤＮＡフラグメント内にＤＮＡエレメント（タンパク質セグメントをコードする）を配置するように、プロモーターから下流の適当な距離にある部位で、同じくＩＩＳ型制限酵素による消化により直線化される。デスティネーションベクターを直線化するために用いられるＩＩＳ型制限酵素は、多くの場合、ストレージベクターからＤＮＡフラグメントを放出するために用いられるものとは異なる。しかし、それらは、好ましくは、ＤＮＡフラグメントのデスティネーションベクターへのライゲーションを可能にするように、同じサイズおよび一致したオーバーハングを生じることが好ましい。

図７ｂに記載のように、第１のタンパク質セグメントの完全種(full variety)をコード化する第１のＤＮＡエレメントの完全種を含むストレージベクターのライブラリーを、第１のタイプのＩＩＳ型制限酵素によって消化すると、対応するバーコードとともに第１のＤＮＡエレメントの完全種を含むＤＮＡフラグメントのライブラリーがそのストレージベクターから放出される。これらの第１のＤＮＡフラグメントのこのライブラリーは、好ましくは、各配列種に対して等モル比で、次いで、直線化されたデスティネーションベクターにライゲーションされ、その結果、一様（1-wise）のライブラリーが得られる。結果として得られる一様（1-wise）のライブラリーの各メンバーには、プロモーターが第１のＤＮＡエレメントに作動可能に連結されており、第１のＤＮＡエレメントによってコード化される第１または最Ｎ末端のタンパク質セグメントの発現を指向できる機能的発現カセットが含まれ得る。

一様のライブラリーは、その後、ＩＩＳ型制限酵素で再度消化され、第１のＤＮＡエレメントとそのバーコードとの間でライブラリーの各メンバーが２回切断され、各切断部位に２つのオーバーハングが生成される。

一方、第２のタンパク質セグメントの完全種をコード化する第２のＤＮＡエレメントの完全種を含むストレージベクターのライブラリーを、第１のタイプのＩＩＳ型制限酵素で消化すると、対応するバーコードとともに第２のＤＮＡエレメントの完全種を含むＤＮＡフラグメントのライブラリーが、そのストレージベクターから放出される。これらの第２のＤＮＡフラグメントのこのライブラリーは、好ましくは各配列種に対して等モル比で、次いで、第１のＤＮＡエレメントとその対応するバーコードとの間の直線化された一様（1-wise）の発現ベクターにライゲーションされ、その結果、二様（2-wise）の発現ベクターの新しいライブラリーが得られる。結果として得られる二様（2-wise）のライブラリーの各メンバーは、プロモーターが、第２のＤＮＡエレメントと融合した第１のＤＮＡエレメントに作動可能に連結され、第１のＤＮＡエレメントと第２のＤＮＡエレメントとの融合によってコードされる融合した第１および第２のタンパク質セグメントの発現を指向できる機能的発現カセットを含み得る。第１および第２のタンパク質セグメント間の融合点における何らかの外来アミノ酸残基または“ｓｃａｒ”配列を除去するために、第１のＤＮＡエレメントとそのバーコードとの間に位置する２つの切断部位は、（１）直線化された１方向ベクターの２つの末端のオーバーハングと、第２のＤＮＡエレメントの完全種を含むストレージベクターのライブラリーから放出された第２のＤＮＡフラグメントの２つの末端のオーバーハングとの間に（配列およびオーバーハングの大きさ／方向の両方で）完全に一致すること、および（２）それらのライゲーション時に第１のＤＮＡエレメントの尾部（tail）または３'末端と第２のＤＮＡエレメントの頭部（head）または５’末端との間の一致したオーバーハング配列が、同じ位置で目的の野生型タンパク質中に見出されるアミノ酸配列伸長をコード化すること、を確実にするように慎重に設計されなければならない。言い換えれば、切断部位の設計は、２つの隣接するタンパク質セグメントのシームレスな結合を確実にする。

第２のストレージベクターのライブラリーから放出された第２のＤＮＡフラグメントのライブラリーの、直線化された１方向発現ベクターライブラリーへのライゲーション完了時に、２方向複合発現ベクターのライブラリーが構築される。最後の二段落で概説した工程のサイクルを繰り返して、第３のＤＮＡフラグメントを、ｎ番目および（ｎ＋１）番目のＤＮＡフラグメントまで複合発現ベクターに組み込み、最終的な複合発現ベクターのライブラリーを得ることができ、このライブラリーは、突然変異のすべての可能な組み合わせを含む完全長タンパク質変異体をコードするＤＮＡコーディング配列の完全な配列を含み、各変異体コーディング配列の後に複合バーコード配列が続き、これはＤＮＡエレメントに一意的に割り当てられた対応するすべてのバーコードを有し、該ＤＮＡエレメントがどのように融合されているかを逆の順序で示すことができる。

Ｃ．タンパク質変異体の機能的スクリーニング
デスティネーションベクターの最終的なライブラリーは、特定の変異セットを含む全長のタンパク質バリアントをコードするための全てのｎ＋１個のＤＮＡエレメントを含む複合ＤＮＡコーディング配列に作動可能に連結されたプロモーターをそれぞれ有する発現ベクターであるため、これらのタンパク質変異体は、適当な報告システムにおいて、何らかの特定の望ましい機能的特徴を容易に発現させ、スクリーニングし、選択することができる。例えば、ウイルスベースのデスティネーションベクターを用いて、宿主細胞をトランスフェクトし、機能的分析に適した細胞環境で目的のタンパク質変異体を直接発現させることができる。

図２ａは、ＳｐＣａｓ９変異体がそれらの機能性をスクリーニングする方法の一例を示す：赤色蛍光タンパク質（ＲＦＰ）およびＲＦＰ遺伝子配列を標的とするｇＲＮＡを安定的に発現する細胞株を、各変異体のオンターゲット活性を示すために、ＳｐＣａｓ９変異体をコードする配列を含むレンチウイルスベクターでトランスフェクトし、同義変異を有するＲＦＰおよびｇＲＮＡを安定的に発現する別の細胞株をトランスフェクトし、バリアントのオフターゲット活性を示す。ＣｏｍｂｉＳＥＡＬプラットフォームは、あらゆるタンパク質の有用な変異体を生成することが可能であるように設計されているため、目的のタンパク質の特定の機能性に応じて、種々の機能性スクリーニングアッセイが考えられる。望ましい機能特性（Ｃａｓ９タンパク質の場合のように、オンターゲットおよびオフターゲット活性プロファイル）のクローンが発見されると、複合バーコードの配列決定が行われ、特定の変異体における特定の変異を即座に同定することができる。

ＩＩＩ．最適化されたＣＡＳ９酵素
本発明者らは、新たに改良されたＣｏｍｂｉＳＥＡＬコンビナトリアル遺伝子組換えシステムを利用して、一連のＳｐＣａｓ９変異体を同定し、それらの機能的特性を特徴付けた。試験された変異体中、Ｏｐｔｉ－ＳｐＣａｓ９と称される特定の変異体は、高度に望ましい機能的プロファイルを有することが分かった：それは、効力を損なうことなく増強された遺伝子編集特異性を有し、広い試験範囲を有する。その機能的特性を考慮すると、この改良されたＣａｓ９酵素は、ＣＲＩＳＰＲゲノム編集スキームにおいて非常に価値のあるツールである

野生型ＳｐＣａｓ９タンパク質は、配列番号１に記載のアミノ酸配列を有し、その対応するＤＮＡコーディング配列は配列番号２に記載されている。このエンドヌクレアーゼに関するこれまでの研究は、ＤＮＡと相互作用する領域およびアミノ酸残基を含む、このタンパク質の構造についての洞察を提供した。本発明者らは、ＣｏｍｂｉＳＥＡＬプラットフォームを開発するための試験中に、標的および非標的ＤＮＡ鎖と相互作用することが以前に予測されていたＳｐＣａｓ９のアミノ酸配列の特定残基に導入された変異、特に置換が、エンドヌクレアーゼの性能に直接的な影響を与えることを確認した。具体的には、Ｒ６６１、Ｑ６９５、Ｋ８４８、Ｑ９２６、Ｋ１００３およびＫ１０６０のような残基での置換が、酵素のオンターゲット／オフターゲット編集活性を変化させることがわかった。変異体Ｏｐｔｉ－ＳｐＣａｓ９は、野生型ＳｐＣａｓ９の二重変異体である：配列番号１の残基６６１がアラニンで置換され、残基１００３がヒスチジンで置換されている。そのアミノ酸配列は、配列番号３に記載されている。これらの置換は、修飾されたエンドヌクレアーゼの増加したオンターゲット編集効率、および高度に望ましい表現型である減少したオフターゲット活性の原因である。

本発明者らはまた、Ｒ６６１Ａ、Ｋ１００３ＨおよびＱ９２６Ａの三重変異体を同定したが、この三重変異体は、Ｏｐｔｉ－ＳｐＣａｓ９からのオフターゲット編集をさらに約８０％まで減少させる一方で、そのオンターゲット活性もまた実質的に減少させる。この三重変異体は、オフターゲット切断の回避が特に重要である状況において価値を有し得る。さらに、ＯｐｔｉＨＦ－ＳｐＣａｓ９と称される第二の変異体が作製されており、これは５つの点変異Ｑ６９５Ａ、Ｋ８４８Ａ、Ｅ９２３Ｍ、Ｔ９２４ＶおよびＱ９２６Ａを有する（表２の変異体４６を参照のこと）。Ｏｐｔｉ－ＳｐＣａｓ９およびＯｐｔｉＨＦ－ＳｐＣａｓ９のアミノ酸配列は、それぞれ配列番号３および配列番号１３に記載されている。表２は、それらが含む点突然変異（複数もある）ならびにそれらのオンターゲットおよびオフターゲット開裂プロファイルを詳細に示す本試験で分析されたＳｐＣａｓ９変異体のまとめを提供する。

本明細書に記載のＳｐＣａｓ９変異体は、生細胞ゲノムの遺伝子操作における有益なツールである。ＣＲＩＳＰＲシステムによる標的化ＤＮＡ切断のためにこれらの変異体を用いるため、一般的に、変異体（例えば、Ｏｐｔｉ－ＳｐＣａｓ９）の発現を指向する発現ベクターと、標的部位でゲノムＤＮＡを切断するために、ＳｐＣａｓ９変異体を細胞のゲノム内の予め選択された標的部位に導くための適切な配列のｓｇＲＮＡをコードする発現ベクターとを、生細胞に導入する。ある態様において、発現ベクターは、レトロウイルスベクター、特にレンチウイルスベクターなどのウイルスベクターである。ＳｐＣａｓ９変異体をコードする発現ベクターおよびｓｇＲＮＡをコードする発現ベクターは、２つの別個のベクターであることが多いが、いくつかの態様において、１つの単一発現ベクターが、ＳｐＣａｓ９変異体およびｓｇＲＮＡの両方のコーディング配列を含み、２つのコーディング配列が、同じプロモーターまたは２つの別個のプロモーターのいずれかに作動可能に連結されている。プロモーターは、一般的に、コード化配列に対して異種であるため、特定のタイプの受容細胞に適したプロモーターを用いることをさらに考慮してもよい。

実施例
以下の例は、例示の目的でのみ提供され、限定されるものではない。当業者であれば、本質的に同じかまたは同様の結果を得るために変更または改変され得る様々な重要ではないパラメータを容易に認識し得る。

実施例１：バーコード化されたコンビナトリアル遺伝子ユニットをシームレスに組み立て、ＳｐＣａｓ９変異体のスクリーニングのようなタンパク質最適化のための新規方法を提供するためのハイスループットプラットフォームとしてのＣｏｍｂｉＳＥＡＬ
タンパク質機能上の複数の変異の複合効果を予測することは困難であるため、膨大な数のタンパク質配列の変異体を機能的に評価する能力は、タンパク質工学に実用的に有用であろう。本発明は、コンビナトリアルな変更を加えたバーコード化されたタンパク質変異体の拡大可能な組立および並列特性評価を可能にするハイスループットプラットフォームを提供する。このプラットフォームＣｏｍｂｉＳＥＡＬは、広く用いられているストレプトコッカス・ピオゲネスＣａｓ９（ＳｐＣａｓ９）ヌクレアーゼの９４８個の組合せ変異体のライブラリーを系統的に解析し、ヒト細胞におけるゲノム編集活性を最適化することにより説明される。ＳｐＣａｓ９変異体の多数のオンターゲット部位およびオフターゲット部位での編集活性を一括評価することが容易なため、最適化された変異体の同定が加速され、変異エピスタシスの研究が容易になる。Ｏｐｔｉ－ＳｐＣａｓ９の同定に成功し、これは、効力を損なうことなく増強された編集特異性を有し、幅広い標的範囲を有するものである。このプラットフォームは、コンビナトリアルな大量修飾によるタンパク質操作に広く適用可能である。

説明
タンパク質工学とは、新たなまたは増強された特性を有する、酵素、抗体およびゲノム編集タンパク質を生成するための重要な方法であることが証明されている^１－７。タンパク質配列のコンビナトリアル最適化は、多数の変異体を作成してスクリーニングするための戦略に依存しているが、現在の方法では、ハイスループットな方法で複数の改変体を体系的かつ効率的に構築して試験する能力には限界がある^８－１１。構造的・生化学的知識に基づく従来の部位特異的変異誘発法は、機能的に関連する変異体の生成を容易にするが、このような一対一のアプローチを用いて組合せ変異体をスクリーニングすることは、スループットおよび拡大可能性に欠けている。遺伝子合成技術は、プールされた形式で組合せ変異体を作製するために導入することができ、それは一般的に、合成された１キロ塩基あたり１～１０個のエラーを生じ^{１２，１３}、導入する変異がタンパク質の異なる領域に散在している場合は、不可能な程に高価である。このようなコンビナトリアルＤＮＡアセンブリ^{１４，１５}ならびに組換えおよびシャッフリング^１６のような方法は、タンパク質配列全体を組み立てるために複数の変異配列を共に融合させることにより組合せ変異体を作成するが、その後の遺伝子型決定および変異の特性評価には、クローン単離株の選択または長い読み取り配列決定が必要であり、それらのいずれも多数の変異体を追跡するためには実施可能ではない。エラーを起こしやすいポリメラーゼ連鎖反応および指向進化（directed evolution）のための変異株を用いた変異誘発は、所望の変異体を積極的に選択することができるが、コドン内に２つ以上の特異的なヌクレオチド変異が稀に発生するため、アミノ酸のサブセットに対する選択バイアスに煩わされる。配列無作為化によってタンパク質変異体の多様性を実現できたとしても、選択されたヒットを１つ１つ遺伝子型決定して分析するスループットが非常に限られていることが、タンパク質工学の大きな障害となっている。さらに、残りの非目標変異から所望の表現型を与える正確な変異をピンポイントで特定することは、組み合わせ最適化プロセスを加速させるのに役立つ。

ここで、本発明者らは、ハイスループットショートリード配列決定（図１）によって容易に追跡することができるバーコード付きの組合せ変異体のプールされたアセンブリのためのCombinatorial Genetics En Masse（CombiGEM）^17-19、本発明者らはCombiSEALと称するプラットフォームで用いられているバーコード連結戦略とシームレスなコンビナトリアルＤＮＡアセンブリを結合させるための新しいクローニング法を案出した。CombiSEALは、タンパク質配列を構成可能な部分にモジュール化することで機能し、それぞれの部分は、定義された位置に所定の変異を指定したバーコードでタグ付けされた変異体のレパートリーを含む。ＩＩＳ型制限酵素部位は、バーコード化された部分に隣接するように用いられ、タンパク質をコードする配列に由来する切断されたオーバーハングを形成し、それにより上記部分との融合時にシームレスなライゲーションを達成する。独特のバーコードを連結し、複数部分のプールクローニングを繰り返した後、結果として得られるライブラリー内の各タンパク質コード化配列変異体に結合させる。この方法は、複数の変異をカバーするタンパク質コード領域全体にわたって長いリード配列決定を行う必要性を回避するため、他の戦略よりも有利であり、これは、クローン単離体を選択する必要なく、短い（例えば、～５０塩基対）バーコードのハイスループット配列決定によってプール内の各変異体を定量的に追跡する費用対効果の高い方法を提供する。さらに、プールされた変異体の特性評価により、同じ実験条件下での直接の比較が可能になり、変異エピスタシスの研究が容易になる。CombiGEMが個別の遺伝子要素のコンビナトリアルアセンブリを可能にするのとは異なり、CombiSEALは、連続した配列（例えば、タンパク質の異なるセグメント）をシームレスに結合させるための融合スカー配列を残さない。従って、この新しいプラットフォームは、タンパク質工学のために大きな可能性を秘めている。

結果
ＳｐＣａｓ９組合せ変異体のハイスループットスクリーニング。高い編集特異性および活性を有する最適化された変異体を同定する目的で、ＣｏｍｂｉＳＥＡＬを用いて、ゲノム工学に広く利用されているＣＲＩＳＰＲ（Clustered Regularly Interspaced Short Palindromic Repeats）ヌクレアーゼであるＳｐＣａｓ９の組合せ変異体ライブラリーのアセンブルを行った^20-23。これまでに、ｅＳｐＣａｓ９（１．１）^３、ＳｐＣａｓ９－ＨＦ１^４、ＨｙｐａＣａｓ９^５およびｅｖｏＣａｓ９^６を含む、特定の変異を組み合わせたＳｐＣａｓ９ヌクレアーゼを、オフターゲット編集を最小限に抑えるように操作した。しかしながら、これらの変異体は、ミスマッチした５’－グアニン（５’Ｇ）で始まるｇＲＮＡとの非適合性のために標的化可能な部位が少ない^{３－６,２４－２７}。現在までに作製され、試験された組合せ変異体の数は限られており（表１）、そのため、エキストラ５’Ｇを有するｇＲＮＡとの良好な適合性を有する他のＳｐＣａｓ９変異体をより体系的に探索する必要がある。

ＣｏｍｂｉＳＥＡＬを用いて、ＳｐＣａｓ９配列を４つの部分にモジュール化し、個々の部分で異なる無作為変異および特異的変異を含むバーコード化されたインサートをストレージベクターにクローニングした（図１ａ；図７ａ、ｂ；詳細について方法を参照）。コンビナトリアルバーコード化ライブラリー（４×２×１７×７＝９５２個のＳｐＣａｓ９変異体、野生型（ＷＴ）ＳｐＣａｓ９およびｅＳｐＣａｓ９（１.１）配列を含む）を、レンチウイルスベクターにプールして組み込んだ。ライブラリー中の個々の部分および組み立てられた構築物を配列決定し、バーコード化された変異体の高精度な組立物を確認した（詳細について方法を参照）。本発明者らは、大腸菌（E. coli）に貯蔵されたプラスミドプール（すなわち、９５２個の変異体のうちの９５１個）および感染したヒト細胞プール（すなわち、９５２個の変異体のうちの９４８個）の両方の中で、ライブラリーに対する高いカバレッジを検出し（図１ｂ）、プラスミドと感染細胞プールの間、および感染細胞プールの生物学的複製間での再現性の高い関連（representation）を検出した（図７ｃ）。

ロバストで特異的なＳｐＣａｓ９変異体を探索するために、赤色蛍光タンパク質（ＲＦＰ）およびＲＦＰ遺伝子配列を標的とするｇＲＮＡ（以下、ＲＦＰｓｇ５－ＯＮおよびＲＦＰｓｇ８－ＯＮと称する；図２ａ）を安定的に発現させるモノクローナルヒト細胞株を用いてレポーターシステムを確立した。５’Ｇ^３－６から始まる２０ヌクレオチドのｇＲＮＡを主に用いた以前のスクリーニングとは異なり、レポーター系で追加の５’Ｇを担持するｇＲＮＡを用いて、標的化範囲を犠牲にしない互換性のあるＳｐＣａｓ９変異体を探した。次いで、細胞をＳｐＣａｓ９変異体ライブラリーに感染させ、感染後１４日目のＲＦＰ蛍光レベルに基づいてビンに選別した。ＲＦＰ蛍光の損失は、ＤＮＡの切断および標的部位のＩｎｄｅｌ介在による破壊を反映しており、したがって、活性なＳｐＣａｓ９変異体を有する細胞を、ＲＦＰレベルの低い選別されたビンに濃縮し得る。バーコード化されたＳｐＣａｓ９変異体を追跡するためにＩｌｌｕｍｉｎａＨｉＳｅｑを用いて、変異体の亜集団は、選別されていない集団と比較して、ＲＦＰのレベルが最も低い細胞集団（すなわち、ビンＡ）の約５％を包含する選別されたビンで１．５倍以上濃縮されることが分かった（図２ｂ；図８）。ＷＴＳｐＣａｓ９は、レポーター系ＲＦＰｓｇ５－ＯＮおよびＲＦＰｓｇ８－ＯＮの両方に対して濃縮されたもののうちの１つであり、一方、ｅＳｐＣａｓ９（１．１）はＲＦＰｓｇ８－ＯＮに対して濃縮された。ＳｐＣａｓ９変異体のオンターゲットおよびオフターゲット活性の並行した特徴付けを容易にするために、不一致部位の標的化がＳｐＣａｓ９変異体のオフターゲット活性を示すようなＲＦＰでの同義変異を有する細胞株をさらに作製した（すなわち、ＲＦＰｓｇ５－ＯＦＦ５－２およびＲＦＰｓｇ８－ＯＦＦ５；図２ａ）。ＷＴＳｐＣａｓ９を、ｅＳｐＣａｓ９（１．１）ではなく、ＲＦＰｓｇ５－ＯＦＦ５－２およびＲＦＰｓｇ８－ＯＦＦ５の両方に対して濃縮した（図２ｂ；図８）。

ＳｐＣａｓ９変異体のライブラリーのオンターゲットおよびオフターゲット活性を、選別されていない集団に対する選別されたビンの濃縮度に基づいてランク付けし、プロットして、大多数の変異体がＳｐＣａｓ９のオンターゲットおよびオフターゲット活性の両方を減じることがわかった（図３ａ）。活性が最適化された変異体を、ＲＦＰｓｇ５－ＯＮおよびＲＦＰｓｇ８－ＯＮの両方について、ＷＴの少なくとも９０％、ＲＦＰｓｇ５－ＯＦＦ５－２およびＲＦＰｓｇ８－ＯＦＦ５の両方について、ＷＴの６０％未満の濃縮比を有する変異体として定義した。ｎＯｎｅ変異体（以下、Ｏｐｔｉ－ＳｐＣａｓ９と称する）はこれらの基準を満たし、さらなる特性決定のために評価した（表２）。また、ＲＦＰｓｇ５－ＯＮおよびＲＦＰｓｇ８－ＯＮの両方についてＷＴの少なくとも５０％以上、ならびにＲＦＰｓｇ５－ＯＦＦ５－２およびＲＦＰｓｇ８－ＯＦＦ５の両方についてＷＴの９０％未満の濃縮比に基づいて、ＯｐｔｉＨＦ－ＳｐＣａｓ９と称する高忠実性（high fidelity）の変異体も同定した（表２）。Ｏｐｔｉ－ＳｐＣａｓ９およびＯｐｔｉＨＦ－ＳｐＣａｓ９の効率および特異性を、それらのオンターゲットおよびオフターゲット活性を測定するための個々の検証アッセイにより検証した。一致または不一致のＲＦＰ部位を標的とするｇＲＮＡをそれぞれ発現する複数の細胞株を用いて、ＷＴと比較したとき、Ｏｐｐｉ-ＳｐＣａｓ９は同等のオンターゲット活性（すなわち、９４．６％；３つのミスマッチ部位からの平均）および実質的に減少したオフターゲット活性（すなわち、１．７％；３つのミスマッチ部位からの平均）を示し、一方、ＯｐｔｉＨＦ－ＳｐＣａｓ９は、オンターゲット（すなわち、６３．６％；２つのマッチ部位からの平均）およびオフターゲット（すなわち、２．０％；２つのミスマッチ部位からの平均）の両方で活性の低下を示した（図３ｂ）ことが確認された。

ＳｐＣａｓ９の編集効率のための変異エピスタシスの検討。ＣｏｍｂｉＳＥＡＬによるタンパク質変異体の体系的構築は、アミノ酸置換のセットを中立（neutral）、有益（beneficial）または有害（deleterious）として分類し、それらの予測が困難なエピスタシス相互作用を探索することを可能にする。ＳｐＣａｓ９の編集活性の指標として濃縮率を用いて（図９）、突然変異の組み合わせとエピスタティック相互作用によってもたらされるオンターゲットおよびオフターゲット活性を示すヒートマップを構築した（図４；図１０）。その結果、ＳｐＣａｓ９のアミノ酸残基に導入された置換基の数および種類が、標的および非標的ＤＮＡ鎖（例えば、Ｒ６６１、Ｑ６９５、Ｋ８４８、Ｑ９２６、Ｋ１００３、Ｋ１０６０など）と相互作用することが予測され、オンターゲット（標的）での効率を最大化し、オフターゲット（標的以外）での活性を最小化するという最適なバランスを支配していることが明らかになった。活性を最適化した変異体Ｏｐｔｉ－ＳｐＣａｓ９は、これらのＤＮＡ接触残基（すなわち、Ｒ６６１ＡおよびＫ１００３Ｈ）における２つの置換変異によってＷＴとは異なる。ＳｐＣａｓ９の１００３番目のアミノ酸位置に導入された３つの保存的な塩基性残基（すなわち、リジン、アルギニンおよびヒスチジン）間で比較したところ、Ｋ１００３ＨがＲ６６１Ａ変異と正のエピスタティック相互作用を示し、Ｏｐｔｉ－ＳｐＣａｓ９に高い編集効率を与える好ましい置換であることが明らかになった（図４）。ＳｐＣａｓ９－ＨＦ１^４に対してより高い特異性を与えることが示されたＱ９２６Ａ置換をＯｐｔｉ－ＳｐＣａｓ９に加えると、そのオフターゲット効果がわずかに減少し（すなわち、Ｏｐｔｉ－ＳｐＣａｓ９では１．０％からＯｐｔｉ－ＳｐＣａｓ９＋Ｑ９２６Ａでは０．２％に、３つのミスマッチした標的部位からの平均）、試験した３つのマッチした部位全体でそのオンターゲット活性を２１．６％、６２．４％および９９．９％と大幅に低下させた（図３ｂ）。さらに、これらのＤＮＡ接触残基に３つ以上の変異を有するほとんどのＳｐＣａｓ９変異体は、オンターゲットおよびオフターゲットの両方の標的部位での編集の発生が少ないことが明らかになった（図４）。これらの結果は、これらのＤＮＡ接触残基の過剰なアラニン置換がＳｐＣａｓ９の編集活性を著しく低下させるという以前の知見と一致している^２５。しかし、興味深いことに、２つのドメインをつなぐリンカー領域に位置するＥ９２３Ｍ＋Ｔ９２４Ｖ変異およびＥ９２３Ｈ＋Ｔ９２４Ｌ変異のようなＳｐＣａｓ９のＨＮＨおよびＲｕｖＣヌクレアーゼドメイン^２８のコンフォメーション制御に関与する残基に導入された追加の置換により、ＤＮＡ接触残基に３つ以上の変異を有するＳｐＣａｓ９変異体のいくつかは、ＲＦＰｓｇ５－ＯＮ部位でのオンターゲット編集を回復した（図４）。高忠実性変異体ＯｐｔｉＨＦ－ＳｐＣａｓ９もまた、Ｑ６９５Ａ、Ｋ８４８ＡおよびＱ９２６Ａ置換に加えてＥ９２３Ｍ＋Ｔ９２４Ｖ変異を含み、Ｑ６９５Ａ、Ｋ８４８ＡおよびＱ９２６Ａトリプル変異のみを有する変異体よりも、ＲＦＰｓｇ８－ＯＮ部位でわずかに高いオンターゲット活性を示した（図４）。これらのデータは、ＳｐＣａｓ９のＤＮＡ結合活性および切断活性が機能的に結合してその編集特異性および編集効率を決定するというモデルを支持し^５，２９、リンカー残基を修飾することによってＳｐＣａｓ９の編集性能をプログラムする可能性を強調している。

最適化されたＳｐＣａｓ９変異体の特徴付け。ｇＲＮＡ設計および構築において、５’Ｇは、通常、Ｕ６プロモーター下での効率的な転写を促進するために、ｇＲＮＡ配列の先頭に含まれるか、付加される。ＷＴＳｐＣａｓ９は、プロトスペーサー配列とミスマッチの５’Ｇが追加されたｇＲＮＡと互換性がある。一方、ｅＳｐＣａｓ９（１．１）、ＳｐＣａｓ９－ＨＦ１、ＨｙｐａＣａｓ９およびｅｖｏＣａｓ９は、さらなる５’Ｇ（すなわち、Ｇ－Ｎ_２０）を有するか、または開始グアニン（すなわち、Ｈ－Ｎ_１９）を欠く２０ヌクレオチドのｇＲＮＡを用いたとき、それらの編集効率を失う^{４，６，２４－２６,３０}。プロトスペーサー配列にマッチした５’Ｇを有するｇＲＮＡの使用は、Ｎ_２０－ＮＧＧと比較して、Ｇ－Ｎ_１９－ＮＧＧ部位の利用可能性に基づいてヒトゲノム内の編集可能な部位数を約４．３倍も顕著に減少させることができた（図１１）。Ｏｐｔｉ－ＳｐＣａｓ９の編集活性を、さらに５’Ｇを付加したｇＲＮＡを用いて特徴付けしたところ、Ｏｐｔｉ－ＳｐＣａｓ９は、本発明者らが以前に試験した内因性遺伝子座のアッセイに基づき^{３－５，１８，３１}、ＷＴと同等（すなわち、９５．１％）のオンターゲットＤＮＡ切断活性を示したが、一方、ｅＳｐＣａｓ９（１．１）およびＨｙｐａＣａｓ９は、大幅な活性低下を示した（すなわち、それぞれ３２．４％および２５．６％）（図５ａ；図１２）。編集の減少は、２つのＳｐＣａｓ９変異体のタンパク質発現レベルの低下によるものではなかった（図１３）。これらの結果は、追加の５'Ｇを有するｇＲＮＡが用いられた本発明のスクリーニングシステム（図２；３ａ）で観察されたこれらの変異体のオンターゲット活性の結果、ならびに緑色蛍光タンパク質（ＧＦＰ）破壊アッセイを用いた独立した検証実験に基づく結果と一致する（図３ｂ；図１４）。さらに、Ｏｐｔｉ－ＳｐＣａｓ９、ｅＳｐＣａｓ９（１．１）およびＨｙｐａＣａｓ９は、マッチした５’Ｇで始まる２０ヌクレオチドのｇＲＮＡを用いたとき、ＷＴと同等の編集活性（すなわち、それぞれ１０９．１％、１０３．３％および１０６．８％）を示した（図５ａ）。Ｏｐｔｉ－ＳｐＣａｓ９を、ＯｐｔｉＨＦ－ＳｐＣａｓ９およびより最近特徴づけられた高忠実性変異体－ｅｖｏＣａｓ９^６およびＳｎｉｐｅｒ－Ｃａｓ９^３２とさらに比較したところ、ＯｐｔｉＨＦ－ＳｐＣａｓ９、ｅｖｏＣａｓ９およびＳｎｉｐｅｒ－Ｃａｓ９は、Ｏｐｔｉ－ＳｐＣａｓ９よりも少ないオンターゲット編集を生成したことが明らかになった（すなわち、追加の５’Ｇを有するｇＲＮＡを用いて発現させたとき、それぞれ６０．７％、９９．８％および５１．７％まで減少し、２０ヌクレオチドのｇＲＮＡ配列で一致した５’Ｇから始まるｇＲＮＡを用いたとき、それぞれ４０．１％、８７．７％および６３．９％に減少した）（図５ｂ；図１２；図１３）。すなわち、Ｕ６下での転写のための２０ヌクレオチドのｇＲＮＡ配列の最初の塩基としてマッチした５’Ｇを有するという制限は、特異性を改善した他の以前に操作されたＳｐＣａｓ９の実用性を制限しているが、追加の５’Ｇを有するｇＲＮＡと互換的に作用するＯｐｔｉ－ＳｐＣａｓ９には適用されない。これらの知見は、操作されたＳｐＣａｓ９が特異性のために必ずしも標的範囲を犠牲にする必要はないことを強調している。

異なるＳｐＣａｓ９変異体のオフターゲット活性をさらに調べた。ＶＥＧＦＡ部位３およびＤＮＭＴ１部位４のｇＲＮＡを用いてＷＴＳｐＣａｓ９によって編集される８つの可能性のあるオフターゲット遺伝子座を増幅させ^{３－５，３１}、ＷＴＳｐＣａｓ９によって誘導されるゲノムインデルが、それらのうちの４つの部位（すなわち、ＶＥＧＦＡＯＦＦ１、ＶＥＧＦＡＯＦＦ２、ＶＥＧＦＡＯＦＦ３およびＤＮＭＴ１ＯＦＦ１）でＯＶＣＡＲ８－ＡＤＲ細胞において検出された。ＷＴの代わりにＯｐｔｉ－ＳｐＣａｓ９、ｅＳｐＣａｓ９（１．１）およびＨｙｐａＣａｓ９を用いたとき、ＶＥＧＦＡＯＦＦ１部位のみでオフターゲット編集が検出された（図１５）。４つの変異体のうち、Ｏｐｔｉ－ＳｐＣａｓ９は、その部位で最大のオンターゲット活性およびオフターゲット活性を示した（図１５）。異なるＳｐＣａｓ９変異体のミスマッチ許容度を比較するために、レポーター遺伝子ターゲット（すなわち、ゲノムに組み込まれたＧＦＰ遺伝子配列）に対する１塩基から４塩基のミスマッチを含むｇＲＮＡを生成した。これらのミスマッチ塩基は、ｇＲＮＡのスペーサー配列の異なる位置にまたがっている。ＧＦＰ蛍光の消失は、ＤＮＡの切断および標的部位のインデル介在の破壊を反映するように測定された。Ｏｐｔｉ－ＳｐＣａｓ９は、２塩基以上のミスマッチ塩基を有するｇＲＮＡに対して大部分が不耐性であることが明らかになったが、２塩基のミスマッチを有する８つの部位のうち１つで比較的低レベルの活性（すなわち、Ｏｐｔｉ－ＳｐＣａｓ９では３．５％、ＷＴでは７３．２％）が検出された（図１６）。ｅＳｐＣａｓ９（１．１）およびＨｙｐａＣａｓ９は、本発明者らのレポーターシステムでは、オンターゲット部位およびオフターゲット部位の両方で、編集がより少ない（すなわち、６０％以上減少）ことが観察された（図１６）。ＷＴとＯｐｔｉ－ＳｐＣａｓ９との間の同程度のオンターゲット活性（すなわち、ＷＴの９７．６％）で、Ｏｐｔｉ－ＳｐＣａｓ９は、ＷＴよりも高い特異性を示し、これは、単一塩基ミスマッチを含む２０個の部位のうち１３個でオフターゲット編集の生成が有意に少ないことによって示されたが、それでもかなりの量のオフターゲット編集が検出されていた（図１６）。他にも、ｅＳｐＣａｓ９（１．１）、ＳｐＣａｓ９－ＨＦ１、ＨｙｐａＣａｓ９、ｅｖｏＣａｓ９およびＳｎｉｐｅｒ－Ｃａｓ９^{３，５，６，３２}を用いた単一塩基ミスマッチ部位での編集活性も報告されている。それにもかかわらず、コンピューター内（in silico）で予測されたゲノム中のオフターゲット部位の大部分は、ｇＲＮＡ配列に対して２個以上のミスマッチを含んでおり^３３、したがって、１塩基ミスマッチに対する許容性は、正確なゲノム編集を達成するためにＳｐＣａｓ９の有用性を制限するものであってはならない。さらにＧＵＩＤＥ－Ｓｅｑを実施して、Ｏｐｔｉ－ＳｐＣａｓ９および他の操作されたＳｐＣａｓ９変異体によってもたらされるゲノム全体の切断活性を調べた。その結果、Ｏｐｔｉ－ＳｐＣａｓ９はＷＴに比べてオフターゲット切断の発生が顕著に少なく、ＯｐｔｉＨＦ－ＳｐＣａｓ９は、ｅＳｐＣａｓ９（１．１）、ＨｙｐａＣａｓ９、ｅｖｏＣａｓ９およびＳｎｉｐｅｒ－Ｃａｓ９などの他の報告された高忠実性変異体に匹敵するオン／オフターゲット比の増加を示した（図５ｃ、表３）。ｅＳｐＣａｓ９（１．１）およびＨｙｐａＣａｓ９と比較して、Ｏｐｔｉ－ＳｐＣａｓ９は、切断型ｇＲＮＡの使用とのより良い適合性を示し（図１７）、これはＯｐｔｉ－ＳｐＣａｓ９の編集特異性を改善するための相補的な戦略を提供し得る^３４。

考察
本発明者らは、タンパク質工学のための高次の組合せ変異の迅速かつ同時プロファイリングに対するまだ満たされていない必要性に対応するために、ＣｏｍｂｉＳＥＡＬ称される、簡易でありながら非常に強力なプラットフォームを確立した。この戦略は、プールされたアセンブリアプローチを用いて、個々の組合せ変異体を１つずつ構築するための面倒な工程を回避し、多数のタンパク質変異体から上位のパフォーマーを同定するための並列試験を可能にするためにバーコード化法を利用してタンパク質操作を容易にする。さらに、この方法は、変異間のエピスタシス関係のマッピングにも適用できる。ＣｏｍｂｉＳＥＡＬ法を用いて、本発明者らは、Ｏｐｔｉ－ＳｐＣａｓ９およびＯｐｔｉＨＦ－ＳｐＣａｓ９（ヒト細胞における幅広い範囲の内因性標的に対して優れたゲノム編集効率および特異性を有する新規変異体）を同定することに成功した（表３）。ＣｏｍｂｉＳＥＡＬパイプラインを、より広範なプロトスペーサー隣接モチーフの柔軟性を有するもの^７およびリボ核タンパク質送達との互換性が強化されているもの^３５など、多面的または他の特性を有する変異体の探索を広げるために、さらに多くのＣａｓ９変異体を構築するために容易に適用することができる。ＣｏｍｂｉＳＥＡＬは、ゲノムの正確な編集のためのＣＲＩＳＰＲ酵素（ＳａＣａｓ９^３６およびＣｐｆ１^３７を含む）およびその誘導体（例えば、塩基編集体^{３８－４１}）の操作生成を加速することが想定されている。また、このアプローチの一般化可能性は、多様なタンパク質だけでなく、合成ＤＮＡおよび遺伝子制御回路を含む他の生体分子およびシステムを体系的に設計するための可能性を拡大し、多くの生物医学およびバイオテクノロジーの応用に関連している。

方法
ＤＮＡベクターの構築
この試験で用いたベクター（表４）を、ＰＣＲ、制限酵素消化、ライゲーションおよびギブソンアセンブリーを含む標準的分子クローニング技術を用いて構築した。カスタムオリゴヌクレオチドをは、Integrated DNA TechnologiesおよびGenewizから購入した。ベクター構築物を大腸菌株ＤＨ５αに形質転換し、５０μｇ／ｍｌのカルベニシリン／アンピシリンを用いて該構築物を含むコロニーを単離した。ＤＮＡを、Plasmid Mini（Takara）またはMidi（Qiagen）キットを用いて抽出および精製した。ベクター構築物の配列をサンガー配列決定法で確認した。

選択マーカーとしてのZeocinと共に、ｅＳｐＣａｓ９（１．１）、ＨｙｐａＣａｓ９またはＳｐＣａｓ９－ＨＦ１をコードするレンチウイルス発現ベクターを作成するために、ＳｐＣａｓ９配列を、Phusion DNA polymerase（New England Biolabs）を用いたＰＣＲによりｐＡＷｐ３０(Addgene #73857)、ｅＳｐＣａｓ９（１．１） (Addgene #71814)およびＶＰ１２（Addgene #72247）から増幅／変異させ、Gibson Assembly Master Mix（New England Biolabs）を用いてｐＦＵＧＷレンチウイルス発現ベクター骨格にクローニングした。ｅｖｏＣａｓ９、Ｓｎｉｐｅｒ－Ｃａｓ９およびｘＣａｓ９（３．７）をコードするレンチウイルス発現ベクターを、それぞれAddgene構築物＃107550、＃113912および＃1803380からそれらのＳｐＣａｓ９配列を増幅させ、ｐＦＵＧＷベクター骨格にクローニングすることによって作成した。特定の遺伝子を標的としたｇＲＮＡのＵ６プロモーター駆動発現を含むストレージベクターを構築するために、既報^１８のように、ｇＲＮＡの標的配列とのオリゴペアを合成し、アニーリングし、Ｔ４ＤＮＡリガーゼ（New England Biolabs）を用いてＢｂｓＩ消化したｐＡＷｐ２８ベクター（Addgene＃73850）にクローニングした。Ｕ６プロモーター下での転写を有利にするために、２０ヌクレオチドスペーサー配列の開始位置に追加の５’Ｇを有するｇＲＮＡと適合性のあるＳｐＣａｓ９変異体を探索するために、図５および図１４で用いた幾つかを除いて、追加の５’Ｇを有するｇＲＮＡを本試験で用いた。ｇＲＮＡのスペーサー配列を表５に列記する。ｇＲＮＡのＵ６駆動発現のためのレンチウイルスベクターを構築するために、ストレージベクターをＢｇｌＩＩ酵素およびＭｆｅＩ酵素（ThermoFisher Scientific）で消化してＵ６－ｇＲＮＡ発現カセットを調製し、ベクターをＢａｍＨＩ酵素およびＥｃｏＲＩ酵素（ThermoFisher Scientific）で消化して生成した互換性のある付着性末端を介したライゲーションを用いて、ｐＡＷｐ１２（Addgene #72732）ベクター骨格に挿入した。デュアルＲＦＰおよびＧＦＰ蛍光タンパク質レポーターとともにｇＲＮＡを発現させるために、Ｕ６駆動ｇＲＮＡ発現カセットを、上記と同じ戦略を用いて、ｐＡＷｐ１２の代わりに、レンチウイルスベクター骨格であるｐＡＷｐ９（Addgene #73851）に挿入した。

ＳｐＣａｓ９のバーコード化ＤＮＡパーツの作製
この試験を開始したときに利用可能な先行知識に導かれて、本発明者らは、ｇＲＮＡ誘導ゲノム部位（ＳｐＣａｓ９－ＨＦ１^４およびｅＳｐＣａｓ９（１．１）^３においてそれぞれ同定されたものを含む）における標的ＤＮＡ鎖および非標的ＤＮＡ鎖と接触すること、またはＤＮＡ切断のためのＳｐＣａｓ９のＨＮＨおよびＲｕｖＣヌクレアーゼドメインのコンフォメーションダイナミクスを制御すること^２８が予測されるアミノ酸残基での組合せ変異体のライブラリー構築に焦点を当てた。８つのアミノ酸残基を選択し、特定のまたは無作為に生成された置換変異を保持するように修飾した（図１ａ）。塩基性残基を、それらの荷電残基の役割を評価するために、アラニンに変異させた。ｅＳｐＣａｓ９（１．１）に以前に導入されたＫ１００３でのアラニン置換に加えて、この残基は、タンパク質の安定性への影響を最小にするために、他の正に荷電した残基（すなわち、アルギニンおよびヒスチジン）にも変異させた。ＳｐＣａｓ９上のこれらの変異の特定の組み合わせは、望ましくないオフターゲット活性を最小限に抑えながら、そのオンターゲット編集効率を最大にし、ｇＲＮＡとの適合性を高めることができるという仮説が立てられた。

組合せ変異体を構築するために、ＳｐＣａｓ９配列を４つの部分（すなわち、Ｐ１、Ｐ２、Ｐ３およびＰ４）にモジュール化し、Ｐ１には４個のインサート、Ｐ２には２個のインサート、Ｐ３には１７個のインサート、およびＰ４には７個のインサートを作成した。各インサートは、Ｐｈｕｓｉｏｎ（New England Biolabs）またはＫａｐａＨｉＦｉ（Kapa Biosystems）ＤＮＡポリメラーゼを用いたＰＣＲにより、ｐＡＷｐ３０（Addgene #73857）またはｅＳｐＣａｓ９（１．１）（Addgene #71814）から増幅し、変異させた。ＳｐＣａｓ９のアミノ酸位置９２３、９２４および９２６に部位特異的変異を生成するために、３つの元のコドン配列をＰＣＲプライマー中の縮重コドンＮＮＳで置換した。ストレージベクター（ｐＡＷｐ６１またはｐＡＷｐ６２）にクローニングした後、各ＤＮＡインサートに固有の８塩基対バーコードを付加した。制限酵素部位ＢｓａＩを末端に隣接するように付加した（ＢｂｓＩ部位およびバーコード配列決定用のプライマー結合部位を、それぞれｐＡＷｐ６１およびｐＡＷｐ６２用のインサートとバーコードの間に導入した）。このようにして、本発明の各ｐＡＷｐ６１およびｐＡＷｐ６２ストレージベクターを、それぞれ“ＢｓａＩ-インサート-ＢｂｓＩ－ＢｂｓＩ－バーコード－ＢｓａＩ”および“ＢｓａＩ－インサート－プライマー－結合部位－バーコード－ＢｓａＩ”として構成した。個々のインサートとそれらのバーコードの配列同一性を確認するために、サンガー配列決定を行った。目的の操作された配列にＢｓａＩ部位またはＢｂｓＩ部位が含まれる場合、ＢｓａＩおよびＢｂｓＩの代わりに他のＩＩＳ型制限酵素部位を用いることができるか、または同義変異をタンパク質をコードする配列に導入して、同じアミノ酸残基をコードしながら制限部位を除去することができた。

ＳｐＣａｓ９用のバーコード化組合せ変異ライブラリーの作成
ＳｐＣａｓ９の各部分のインサートを含むストレージベクターを等モル比で混合した。プールされたインサートを、混合したストレージベクターをＢｓａＩでシングルポット消化反応させることで生成した。目的のベクター（ｐＡＷｐ６０）をＢｂｓＩで消化した。消化されたＰ１インサートおよびベクターをライゲーションして、目的のベクターにプールされたＰ１ライブラリーを作成した。このＰ１ライブラリーを再度ＢｂｓＩで消化し、消化されたＰ２インサートとライゲーションして、２ウェイ（two-way）の組合せ（Ｐ１×Ｐ２）でライブラリーを作成した。順次、ライゲーション反応を行い、３ウェイ（Ｐ１×Ｐ２×Ｐ３）および４ウェイ（Ｐ１×Ｐ２×Ｐ３×Ｐ４）の組み合わせのライブラリーを作成した。プールされたアセンブリ工程の後、インサートのタンパク質をコードする部分をベクター構築物の一端にシームレスに結合させて局在させ、もう一方の端にそれぞれのバーコードを連結させた。９５２個のＳｐＣａｓ９変異体の４つの部分（４×２×１７×７）の組合せライブラリーを構築し、それぞれが、ｇＲＮＡで誘導されたゲノム部位の標的ＤＮＡ鎖および非標的ＤＮＡ鎖と相互作用するか^３，４、あるいはＳｐＣａｓ９のヌクレアーゼドメインの立体構造ダイナミクスを変化させる^２８と予測されたアミノ酸残基に１～８個の変異（ＷＴを除く）を有していた（図１ａ）。この組み合わせの複雑さは、バーコード付きのパーツを追加することで拡張でき、数万またはそれ以上のコンビナトリアルな修飾を同時に試験することができるようにスケールアップすることができる。サンガー配列決定分析を行ったところ、２ウェイ（２０／２０コロニー）、３ウェイ（１４／１５コロニー）および４ウェイ（８／８コロニー）のライブラリーにおいて、組み立てられたバーコード付きの組合せ変異体構築物の大部分が予想される変異を有することが確認された。意図しない塩基置換を行った１つの３ウェイ組合せ変異体構築物を除き、他の構築物には無作為な変異は検出されなかった。最終的に得られたライブラリーをｐＦＵＧＷレンチウイルスベクターにサブクローニングし、ＥＦＳプロモーター下で選択マーカーであるゼオシン（Zeocin）とともにＳｐＣａｓ９の変異体を発現させた。レンチウイルスベクターに組み入れたバーコード付きＳｐＣａｓ９変異体（ライブラリーからサンプリングした７つのコロニーのうち７つ）の全長配列をサンガー配列決定法で調べたところ、予想される変異のみが存在し、無作為な変異は存在しないことが確認された。

個々の検証のためのＳｐＣａｓ９変異体の生成
Ｏｐｔｉ－ＳｐＣａｓ９を含む個々のＳｐＣａｓ９変異体をコードするレンチウイルスベクターを、個々のインサートおよびベクターを用いて１つずつ組み立てたことを除いて、上記の組合せ変異体ライブラリーの生成に用いたのと同じ方法で構築した。

ヒト細胞培養
ＨＥＫ２９３Ｔ細胞を、American Type Culture Collection (ATCC)から入手した。ＯＶＣＡＲ８－ＡＤＲ細胞を、落谷(国立がん研究センター、日本)^４２から寄贈された。ＯＶＣＡＲ８－ＡＤＲ細胞の同一性を、細胞株認証テスト（cell line authentication test）(Genetica DNA Laboratories)により確認した。モノクローナルの安定なＯＶＣＡＲ８－ＡＤＲ細胞株を、ＵＢＣプロモーターおよびＣＭＶプロモーターからそれぞれ発現されるＲＦＰ遺伝子およびＧＦＰ遺伝子をコードするレンチウイルスと共に、ＲＦＰ部位を標的とするｇＲＮＡのタンデムＵ６プロモーター駆動発現カセットを細胞に導入することにより作製した。ＲＦＰｓｇ５－ＯＮ、ＲＦＰｓｇ８－ＯＮおよびＲＦＰ－ｓｇ６－ＯＮ系統は、ｇＲＮＡのスペーサーと完全に一致するＲＦＰ上の標的部位を含むが、一方、ＲＦＰｓｇ５－ＯＦＦ５－２、ＲＦＰｓｇ８－ＯＦＦ５およびＲＦＰｓｇ５－ＯＦＦ５系統は、同義変異を有し、ｇＲＮＡスペーサーと不一致であるＲＦＰ上の標的部位を含む（表６）。ＨＥＫ２９３Ｔ細胞を、１０％熱不活化ＦＢＳおよび１×抗生物質－抗真菌剤（Life Technologies）を添加したＤＭＥＭ中、３７℃にて、５％ＣＯ_２で培養した。ＯＶＣＡＲ８－ＡＤＲ細胞を、１０％熱不活化ＦＢＳおよび１×抗生物質－抗真菌剤（Life Technologies）を添加したＲＰＭＩ中、３７℃にて５％ＣＯ_２で培養した。

レンチウイルスの作製および形質導入
レンチウイルスを、１ウェルあたり２．５×１０^５個のＨＥＫ２９３Ｔ細胞を用いて６ウェルプレートにて作製した。細胞を、１００μｌのＯｐｔｉＭＥＭ培地（Life Technologies）中に混合した０．５μgのレンチウイルスベクター、１μgのｐＣＭＶ－ｄＲ８．２－ｄｖｐｒベクター、０．５μgのｐＣＭＶ－ＶＳＶ－Ｇベクターと共に、ＦｕＧＥＮＥＨＤトランスフェクション試薬（Promega）を用いて、１５分間トランスフェクションした。トランスフェクションの１日後に、培地を新鮮な培養液に交換した。その後、トランスフェクションの４８から９６時間後の間に、２４時間毎にウイルス上清を回収して、一緒にプールし、０．４５μｍのポリエーテルスルホン膜を通してろ過した。個々のベクター構築物を用いたトランスダクションでは、５００μｌのろ過したウイルス上清を用いて、８μｇ／ｍｌポリブレン（Sigma）の存在下で２．５×１０^５細胞を一晩感染させた。ヒト細胞（ＯＶＣＡＲ８－ＡＤＲ）にプールされたライブラリーを導入するために、同じ試験条件を用いてレンチウイルス産生をスケールアップした。ほとんどの組合せで十分な再現性を有する高カバレッジのライブラリーを確保するために、試験するライブラリーサイズの３００倍以上の細胞を含む出発細胞集団で感染を行った。レンチウイルスを、感染多重度が約０．３になるように調整して、８μg／ｍｌのポリブレン存在下で感染効率が約３０％になるようにし、ＳｐＣａｓ９変異体ライブラリーが低コピー数で提供されるようにした。

細胞選別
細胞選別を、BD Influx cell sorter (BD Biosciences)で行った。滴下遅延（Drop delay）をBD Accudropビーズを用いて測定した。細胞を、７０μｍナイロンメッシュフィルターを通してろ過した後、1.0 Drop Pure 選別モードで１００μｍのノズルを通して選別した。細胞をＧＦＰ陽性シグナルで分け（gated）、ＲＦＰの蛍光強度に基づいて３つのビン（すなわち、Ａ、Ｂ、Ｃ）に分類し、ＲＦＰレベルの低い細胞を包含する各ビンに集団の約５％の細胞を集めた。各ビンに選別される集団中の細胞の割合を、選別された集団における個々の組合せの存在性（representation）と、ビン間の変異体の濃縮を検出する感度との間のトレードオフのバランスをとるために調整することができる。各サンプルの選別されたビンには、約２０万～３０万個の細胞が集められた。

バーコード配列決定用のサンプル調製
組合せ変異体ベクターライブラリーについては、Plasmid Mini kit（Qiagen）を用いてベクターライブラリーで形質転換した大腸菌からプラスミドＤＮＡを抽出した。組合せ変異体ライブラリーを感染させたヒト細胞プールについては、DNeasy Blood & Tissue Kit（Qiagen）を用いて、様々な試験条件下で採取した細胞のゲノムＤＮＡを抽出した。ＤＮＡ濃度を、Quant-iT PicoGreen dsDNA Assay Kit (Life Technologies)で測定した。個々の組合せ変異体を表す固有のバーコード、Illuminaアンカー配列および多重配列決定用の８塩基対のインデックスバーコードをそれぞれ含む、３９３塩基対のフラグメントのＰＣＲ増幅を、Kapa HiFi Hotstart Ready-mix（Kapa Biosystems）を用いて行った。用いたフォワードプライマーおよびリバースプライマーは、５’-AATGATACGGCGACCACCGAGATCTACACGGAACCGCAACGGTATTC-３’および５’-CAAGCAGAAGACGGCATACGAGATNNNNNNNNGGTTGCGTCAGCAAACACAG-３’であり、ここで、NNNNNNNNは、各試験サンプルに割り当てられた特定のインデックスバーコードを示す。集団分布を歪める可能性のあるＰＣＲにおけるバイアスを避けるため、ＰＣＲ条件を最適化して、増幅が対数増殖期で起こるようにした。ＰＣＲアンプリコンを、StepOnePlus Real Time PCRシステム（Applied Biosystems）でKapa SYBR Fast qPCR Master Mix（Kapa Biosystems）を用いてリアルタイムＰＣＲ定量を行う前に、Agencourt AMPure XPビーズ（Beckman Coulter Genomics）を１：０．５および１：０．９５の比率で用いて、２回のサイズ選択を行って精製した。定量的ＰＣＲに用したフォワードプライマーおよびリバースプライマーは、それぞれ５’-AATGATACGGCGACCACCGA-３’および５’-CAAGCAGAAGACGGCATACGA-３’であった。その後、定量したサンプルを所望の比率でプールして多重化し、高感度ＤＮＡチップ（Agilent）を用いてAgilent 2100 Bioanalyzerで評価し、プライマー（５’-CCACCGAGATCTACGGAACCGCAACGGTATTC-３’）およびインデックスバーコードプライマー（５’-GTGGCGTGGTGCACTGTTTGCTGACGCAACC-３’）を用いてIllumina HiSeqで分析した。

バーコード配列決定データ分析
各組合せ変異体のバーコード読み取りを、配列決定データから処理した。各組合せを表すバーコードリードを、インデックスバーコードによって分類された各サンプルの１００万リードあたりで正規化した。プロファイリングを２つの生物学的複製で行った。選別されたビンＡと選別されていない集団の間の各組合せ変異体の頻度を測定し、残りの集団に対するそれらの間の濃縮率（Ｅ）を計算した。ビンＡを選択したのは、このビンでは変異体の濃縮が最も明らかだったためである（図２ｂ）。用いた式は以下の通りである：

式中、Ｎ_binは、選別されたビンにおける組合せ変異体の頻度を表し、Ｎ_unsortedは、選別されていないビンにおける組合せ変異体の頻度を表す。

選別されたビンＡと選別されていない集団とを比較した複製から検出された対数変換された平均スコア（すなわち、log²（E））を、標的編集活性の尺度として用いた。データの信頼性を高めるために、選別されていない集団において３００個以上の絶対リードを与えたバーコードのみを分析した。プールされたスクリーンから得られたlog₂(E)スコアと個々の検証データとの相関関係（図９）を、プールされたスクリーンにおいて組合せ毎に細胞増殖倍率を増やして実験ノイズを減らすことで改善することができた⁴³。活性が最適化された変異体（すなわち、本試験で同定されたＯｐｔｉ-ＳｐＣａｓ９）は、ｌｏｇ_２（Ｅ）（ビンＡ対選別されていない集団）が、ＲＦＰｓｇ５－ＯＮおよびＲＦＰｓｇ８－ＯＮの両方でＷＴの少なくとも９０％を超える、ＲＦＰｓｇ５－ＯＦＦ５－２およびＲＦＰｓｇ８－ＯＦＦ５の両方でＷＴの６０％未満であるものとして定義された。ＯｐｔｉＨＦ－ＳｐＣａｓ９は、ＲＦＰｓｇ５－ＯＮおよびＲＦＰｓｇ８－ＯＮの両方でＷＴの少なくとも５０％を超え、ＲＦＰｓｇ５－ＯＦＦ５－２およびＲＦＰｓｇ８－ＯＦＦ５の両方でＷＴの９０％未満の濃縮比に基づいて、高忠実性を有する変異体として同定された。全リストを表２に示す。

エピスタシスを決定するために、既報のタンパク質適合性についての文献^44,45と同様のスコアリングシステムを適用して、図４の各組合せについてエピスタシス（ε）スコアを計算した。εスコアを次のように決定した：観察された適合度－予期される適合度（ここで、組合せ［Ｘ,Ｙ］の予期される適合度は、加法モデルによる(ｌｏｇ_２（Ｅ_［Ｘ］）＋ｌｏｇ_２（Ｅ_［Ｙ］）)である）。一般的には、予測よりも優れた適合度を示す組合せを正のエピスタシスと定義し、予測よりも適合度が低い組合せを負のエピスタシスと定義した。致死またはほぼ致死的な組合せ変異体のｌｏｇ_２（Ｅ）値は、比較のために、本試験では８つの変異を有するＳｐＣａｓ９変異体（すなわち、Ｒ６６１Ａ＋Ｑ６９５Ａ＋Ｋ８４８Ａ＋Ｅ９２３Ｍ＋Ｔ９２４Ｖ＋Ｑ９２６Ａ＋Ｋ１００３Ａ＋Ｒ１０６０Ａ）と等しく設定し、本発明者らの個々の検証データにより、標的ＲＦＰ配列を破壊する最小の活性が確認された（図３ｂ）。予期される適合度は、致死または致死に近い組合せ変異体のｌｏｇ_２（Ｅ）値を上限とし、意味のない予測適合度に起因する偽のエピスタシス値を最小限に抑えた。将来的には、プールされたスクリーニングにＳｐＣａｓ９の核酸分解変異体を致死変異体として含めて比較することが有益であり得る。

蛍光タンパク質破壊アッセイ（Fluorescent protein disruption assay）
蛍光タンパク質破壊アッセイを、ＳｐＣａｓ９発現およびｇＲＮＡ発現によってもたらされた蛍光タンパク質（すなわち、ＧＦＰまたはＲＦＰ）の標的部位におけるＤＮＡ切断およびインデル介在破壊を評価するために行い、その結果、細胞蛍光の消失がもたらされた。ＧＦＰまたはＲＦＰレポーター遺伝子をＳｐＣａｓ９およびｇＲＮＡとともに有する細胞を洗浄し、２％の熱不活化ＦＢＳを添加した１×ＰＢＳに再懸濁し、LSR Fortessaアナライザー（Becton Dickinson）でアッセイした。細胞を、前方散乱光（forward Scatter）および側方散乱光（side scatter）で分け（gate）た。各データセットにおいて、サンプルあたり少なくとも１×１０^４個の細胞を記録した。

イムノブロット分析
プロテアーゼ阻害剤（Gold Biotechnology #GB-108-2）を添加した２×ＲＩＰＡ緩衝液で細胞を溶解した。溶解物を、氷上で培養プレートを掻き取って回収し、１５，０００ｒｐｍで１５分間、４℃にて遠心分離した。上清をBradford assay（BioRad）を用いて定量した。タンパク質を９９℃で５分間変性させた後、１０％ポリアクリルアミドゲル（Bio-Rad）でゲル電気泳動を行った。タンパク質を、１１０Ｖ、４℃にて、２時間かけてポリフッ化ビニリデン膜に転写した。用いた一次抗体は、抗Ｃａｓ９（7A9-3A3）（1:2,000、Cell Signaling #14697）および抗βアクチン（1:10,000、Sigma #A2228）であった。二次抗体は、ＨＲＰ結合抗マウスＩｇＧ（1:20,000、Cell Signaling #7076）を用いた。膜を、WesternBright ECL HRP基質（Advansta #K-12045-D20）により発色させた。

Ｔ７エンドヌクレアーゼＩアッセイ
Ｔ７エンドヌクレアーゼＩアッセイを行い、ｇＲＮＡが標的とするゲノム遺伝子座におけるＤＮＡミスマッチ切断を評価した。QuickExtract DNA抽出液（Epicentre）またはDNeasy Blood & Tissue Kit（Qiagen）を用いて、細胞培養物からゲノムＤＮＡを抽出した。表７に示したプライマーおよびＰＣＲ条件でＰＣＲを行い、Agencourt AMPure XP beads （Beckman Coulter Genomics）を用いて精製して、標的遺伝子座を有するアンプリコンを得た。約４００ｎｇのＰＣＲアンプリコンを変性させ、自己アニーリングさせ、４ユニットのＴ７エンドヌクレアーゼＩ（New England Biolabs）と３７℃にて４０分間インキュベートした。反応生成物を２％アガロースゲル電気泳動を用いて分離した。定量化を、ImageJを用いて測定した相対的なバンド強度に基づいて行った。インデルの割合を、式１００×（１－（１－（ｂ＋ｃ）／（ａ＋ｂ＋ｃ））^１/２）（式中、ａは切断されていないＰＣＲ産物の積分強度であり、ｂおよびｃは各切断産物の積分強度である。）で概算した⁴⁶。

ゲノムワイドなオフターゲットのＧＵＩＤＥ－Ｓｅｑ検出
ゲノムワイドなオフターゲットをGUIDE-Seq法⁴⁷を用いて測定した。各GUIDE-Seqサンプルでは、ＳｐＣａｓ９変異体およびｇＲＮＡを感染させた１５０万個のＯＶＣＡＲ８－ＡＤＲ細胞を、製造業者のプロトコルに従って１００μｌのNeonチップ（ThermoFisher Scientific）を用いて、１，０００ｐｍｏｌの新鮮なアニールされたGUIDE-seq末端保護ｄｓＯＤＮとともにエレクトロポレーションした。用いたｄｓＯＤＮオリゴの配列は以下の通りであった：
５’-P-G*T*TTAATTGAGTTGTCATATGTTAATAACGGT*A*T-３’および
５’-P-A*T*ACCGTTATTAACATATGACAACTCAATTAA*A*C-３’
ここで、Ｐは５’リン酸化を示し、*はホスホロチオエート結合を示す。エレクトロポレーションの７２時間後にDNeasy Blood and Tissue kit（Qiagen）を用いてゲノムＤＮＡを抽出した。ゲノムＤＮＡ濃度を、Qubit fluorometer dsDNA HS assay（ThermoFisher Scientific）で定量し、４００ｎｇを若干の変更を加えたGUIDE-Seqプロトコルに従ってライブラリー構築に用いた。要するに、KAPA Frag Kit （KAPA Biosystems）を用いてＤＮＡを酵素的に断片化した後、アダプターをライゲーションし、２回のヘミネステッドＰＣＲを行ってｄｓＯＤＮ組み込み配列を濃縮した。様々なイルミナプラットフォームでシングルインデックスシーケンスワークフローを用いてデュアルインデックスデータを得るためにイルミナシーケンスワークフローを統合するために、サンプルインデックス（インデックス２）を固有の分子インデックス（表８）に従ってリード１の先頭に配置して、半機能アダプターを再設計した。最終的なシーケンスライブラリーを、Illumina用のKAPA Library Quantification Kitで定量化し、Illumina NextSeq 500 Systemで配列決定を行った。インデックス１のデータ逆多重化（de-multiplexing）をbcl2fq v2.19で行い、続いてインデックス２の逆多重化およびGUIDE-Seqソフトウェア⁴⁸を用いた解析のためのフォーマット化のためのカスタムスクリプトを行った。

本明細書に引用されている、ＧｅｎＢａｎｋ受託番号または同等の配列識別番号を含む、すべての特許、特許出願およびその他の刊行物は、すべての目的に関してその内容全体が引用により本明細書中に包含される。

文献

Claims

５’から３’の順に、
第１のタイプのＩＩＳ型制限酵素のための第１の認識部位、
ＤＮＡエレメント、
第２のタイプのＩＩＳ型制限酵素のための第１および第２の認識部位、
ＤＮＡエレメントに一意的に割り当てられたバーコード、および
第１のタイプのＩＩＳ型制限酵素のための第２の認識部位
を含む、ＤＮＡ構築物。
ＤＮＡベクターである、請求項１に記載のＤＮＡ構築物。
請求項１に記載のＤＮＡ構築物を２以上含む、ライブラリー。
５’から３’の順に、
第１のタイプのＩＩＳ型制限酵素のための認識部位、
複数のＤＮＡエレメント、
プライマー結合部位、ならびに
複数のＤＮＡエレメントの１つにそれぞれ一意的に割り当てられた複数のバーコードおよび第２のタイプのＩＩＳ型制限酵素のための認識部位
を含むＤＮＡ構築物であって、ここで、複数のＤＮＡエレメントが互いに連結されて、複数のＤＮＡエレメントの何れか２つの間の何れの連結点でも外来配列を含まないタンパク質をコードする配列を形成し、かつ該複数のバーコードが、それらが割り当てされたＤＮＡエレメントの逆の順で配置されている、ＤＮＡ構築物。
ＤＮＡベクターである、請求項４に記載のＤＮＡ構築物。
第１のタイプのＩＩＳ型制限酵素および第２のタイプのＩＩＳ型制限酵素が、ＤＮＡ分子を切断することにより適合性の末端を作成する、請求項１、２、４および５のいずれか一項に記載のＤＮＡ構築物。
第１のタイプのＩＩＳ型制限酵素がＢｓａＩであり、第２のタイプのＩＩＳ型制限酵素がＢｂｓＩである、請求項１、２、４および５のいずれか一項に記載のＤＮＡ構築物。
コンビナトリアル遺伝子構築物の作製方法であって、
(a) 請求項２に記載の第１のＤＮＡベクターを第１のタイプのＩＩＳ型制限酵素で切断して、第１のＤＮＡセグメント、第２のタイプのＩＩＳ型制限酵素のための第１および第２の認識部位ならびに第１のタイプのＩＩＳ型制限酵素により作成された第１および第２の末端に隣接する第１のバーコードを含む第１のＤＮＡフラグメントを遊離させる工程；
(b) プロモーターを含む最初の発現ベクターを第２のタイプのＩＩＳ型制限酵素で切断して、該最初の発現ベクターをプロモーターの３’末端付近で線形化し、かつ(a)のＤＮＡフラグメントの第１および第２の末端と適合性の２つの末端を作成する工程；
(c) (a)の第１のＤＮＡフラグメントを(b)の線形化された発現ベクターにアニーリングおよびライゲーションして、第１のＤＮＡフラグメントおよび第１のバーコードがその３’末端でプロモーターに作動可能に連結されている一方向複合型発現ベクターを形成する工程；
(d) 請求項２に記載の第２のＤＮＡベクターを第１のタイプのＩＩＳ型制限酵素で切断して、第２のＤＮＡセグメント、第２のタイプのＩＩＳ型制限酵素のための第１および第２の認識部位ならびに第１のタイプのＩＩＳ型制限酵素により作成された第１および第２の末端に隣接する第２のバーコードを含む第２のＤＮＡフラグメントを遊離させる工程；
(e) (c)の複合型発現ベクターを、第２のタイプのＩＩＳ型制限酵素で切断して、第１のＤＮＡエレメントと第１のバーコードの間で複合型発現ベクターを線形化し、かつ(d)のＤＮＡフラグメントの第１および第２の末端と適合性の２つの末端を作成する工程；
(f) (d)の第２のＤＮＡフラグメントを第１のＤＮＡエレメントと第１のバーコードの間の(e)の線形化された複合型発現ベクターにアニーリングおよびライゲーションして、第１のＤＮＡフラグメント、第２のＤＮＡフラグメント、第２のバーコードおよび第１のバーコードがこの順でその３’末端にてプロモーターに作動可能に連結されている、２ウェイ複合型発現ベクターを形成する工程
を含み、ここで、第１および第２のＤＮＡエレメントが、互いに直接隣接するそのＮ末端由来の予め選択されたタンパク質の第１および第２のセグメントをコードし、該第１および第２のＤＮＡフラグメントが、予め選択されたタンパク質に見出されないアミノ酸残基をもたらす外来ヌクレオチド配列を含まない２ウェイ複合型発現ベクター中で互いに結合しており、かつ該第１および第２のＤＮＡエレメントがそれぞれ１以上の変異を含む、
作製方法。
工程(d)から(f)を、ｎ番目のＤＮＡエレメント、第２のタイプのＩＩＳ型制限酵素のための第１および第２の認識部位ならびにｎ番目のバーコードを含む第ｎのＤＮＡフラグメントをｎ方向複合型発現ベクターに組み込むためにｎ回目まで繰り返し、ここで該ｎ番目のＤＮＡエレメントが、そのＣ末端から、予め選択されたタンパク質のｎ番目または２番目から最後のセグメントをコードしている、請求項８に記載の方法であって、
(x) 第１のタイプのＩＩＳ型制限酵素のための第１および第２の認識部位の間に、（ｎ＋１）番目のＤＮＡエレメント、プライマー結合部位ならびに（ｎ＋１）番目のバーコードを含む、最終ＤＮＡベクターを提供する工程；
(y) 該最終ＤＮＡベクターを第１のタイプのＩＩＳ型制限酵素で切断して、５’から３’の順に、（ｎ＋１）番目のＤＮＡエレメント、プライマー結合部位ならびに第１のタイプのＩＩＳ型制限酵素により作成された第１および第２の末端に隣接する（ｎ＋１）番目のバーコードを含む最終ＤＮＡフラグメントを遊離させる工程；
(z) 該最終ＤＮＡフラグメントを、工程(d)から(f)をｎ回繰り返した後に作製され、かつ第２のタイプのＩＩＳ型制限酵素により線形化されたｎウェイ複合型発現ベクターにアニーリングおよびライゲーションして、最終複合型発現ベクターを形成する工程
をさらに含み、ここで、第１、第２および（ｎ＋１）番目までのＤＮＡエレメントが、そのＮ末端から互いにすぐに隣接している予め選択されたタンパク質の第１、第２およびｎ番目までならびに最後のセグメントをコードし、第１、第２およびｎ番目までならびに最後のＤＮＡフラグメントが、予め選択されたタンパク質に見出されないアミノ酸残基をもたらす何らかの外因性ヌクレオチド配列を含まない最終複合型発現ベクター中で互いに結合されており、かつＤＮＡエレメントの各々が、１以上の変異を含む、
作製方法。
第１のタイプのＩＩＳ型制限酵素および第２のタイプのＩＩＳ型制限酵素が、ＤＮＡ分子を切断することにより適合性の末端を作成する、請求項８または９に記載の方法。
第１のタイプのＩＩＳ型制限酵素がＢｓａＩであり、第２のタイプのＩＩＳ型制限酵素がＢｂｓＩである、請求項８または９に記載の方法。
請求項９に記載の方法により作製される、最終複合型発現ベクターの２以上を含む、ライブラリー。
配列番号１の残基１００３に対応する残基が置換され、かつ配列番号１の残基６６１に対応する残基が置換されている、配列番号１および４－１３のいずれか１つに記載のアミノ酸配列を含むポリペプチド。
配列番号１の残基１００３に対応する残基がヒスチジンで置換され、かつ配列番号１の残基６６１に対応する残基がアラニンで置換されている、請求項１３に記載のポリペプチド。
配列番号１に記載のアミノ酸配列を含む請求項１４に記載のポリペプチドであって、残基１００３がヒスチジンで置換され、かつ残基６６１がアラニンで置換されており、さらに残基９２６にてアラニン置換を含んでいてよい、ポリペプチド。
配列番号１の残基６９５、８４８および９２６に対応する残基が、アラニンで置換され、配列番号１の残基９２３に対応する残基が、メチオニンで置換され、かつ配列番号１の残基９２４に対応する残基が、バリンで置換されている、請求項１３に記載のポリペプチド。
配列番号１に記載のアミノ酸配列を含む請求項１６に記載のポリペプチドであって、配列番号１の残基６９５、８４８および９２６に対応する残基がアラニンで置換され、配列番号１の残基９２３に対応する残基がメチオニンで置換され、そして配列番号１の残基９２４に対応する残基がバリンで置換されている、ポリペプチド。
請求項１３に記載のポリペプチドおよび生理学的に許容される賦形剤を含む、組成物。
請求項１３から１７のいずれか一項に記載のポリペプチドをコードするポリヌクレオチド配列を含む、核酸。
請求項１７に記載の核酸および生理学的に許容される賦形剤を含む、組成物。
請求項１３から１７のいずれか一項に記載のポリペプチドをコードするポリヌクレオチド配列に作動可能に連結されたプロモーターを含む、発現カセット。
請求項２１に記載の発現カセットを含む、ベクター。
ウイルスベクターである、請求項２２に記載のベクター。
請求項１９に記載の発現カセットまたは請求項１３から１７のいずれか一項に記載のポリペプチドを含む、宿主細胞。
標的部位でＤＮＡ分子を切断する方法であって、標的ＤＮＡ部位を含むＤＮＡ分子を請求項１３から１７のいずれか一項に記載のポリペプチドおよび標的ＤＮＡ部位に特異的に結合する短いガイドＲＮＡ（ｓｇＲＮＡ）と接触させることにより、該ＤＮＡ分子を標的ＤＮＡ部位で切断することを含む、方法。
ＤＮＡ分子が生細胞内のゲノムＤＮＡであり、かつ該細胞が、ｓｇＲＮＡおよびポリペプチドをコードするポリヌクレオチド配列でトランスフェクトされている、請求項２５に記載の方法。
細胞が、ｓｇＲＮＡをコードする第１のベクターおよびポリペプチドをコードする第２のベクターでトランスフェクトされている、請求項２６に記載の方法。
細胞が、ｓｇＲＮＡおよびポリペプチドの両方をコードするベクターでトランスフェクトされている、請求項２６に記載の方法。
第１および第２のベクターがそれぞれ、ウイルスベクターである、請求項２７に記載の方法。
ベクターがウイルスベクターである、請求項２８に記載の方法。
ウイルスベクターがレトロウイルスベクターである、請求項２９または３０に記載の方法。
レトロウイルスベクターがレンチウイルスベクターである、請求項３１に記載の方法。