JP2024521806A

JP2024521806A - 合成Ｃａｓタンパク質

Info

Publication number: JP2024521806A
Application number: JP2023573060A
Authority: JP
Inventors: ペレス―ヒメネス，ラウール; アロンソ―レルマ，ボルハ
Original assignee: アソシエーションセントロデインベスティゲイションクーペレイティヴァアンナノシエンシアス “シーアイシーナノグネ”
Priority date: 2021-05-25
Filing date: 2022-05-25
Publication date: 2024-06-04
Also published as: WO2022248607A3; WO2022248607A2; EP4347808A2

Abstract

本発明は、向上した能力を有する新しいＣａｓ酵素を生成するための系統学的祖先配列再構築の使用に関する。この戦略により、エンドヌクレアーゼ活性とは別個のニッカーゼ活性と、無効にされていないとしても緩和されているＰＡＭ要件とを示すことができる、現在存在している種のＣａｓ９タンパク質の祖先バリアントを得た。多種多様な既存の細菌種からのＣａｓ９ｇＲＮＡのｔｒａｃｒＲＮＡ構成要素を使用するための能力も観察された。【選択図】なし

Description

本発明は、認識されている微生物源から単離可能でない単体エフェクターＣＲＩＳＰＲシステム関連ヌクレアーゼとして使用するのに適したＣａｓタンパク質、すなわちクラスＩＩのＣａｓタンパク質を得る方法に関する。そのために本発明は、既存の種のＣａｓタンパク質配列を用いて編集された系統樹から進化追跡によって得られた再構築された祖先配列を提供する。従って、そのような再構築されたタンパク質は現代の提供源から単離可能ではないという意味で合成タンパク質であるが、ゲノム編集のために今では広く使用されているクラスＩＩのＣＲＩＳＰＲシステムにおいて天然に生じるＣａｓタンパク質と同じ方法で利用することができる。本発明者らは、そのような再構築された配列のために「祖先Ｃａｓ」または「ＡｎＣａｓ」という用語を造った。新規なＣａｓタンパク質へのこの経路は有利なことに、最もよく使用されているＩＩ型Ｃａｓタンパク質のストレプトコッカス・ピオゲネス（化膿レンサ球菌）（ＳｐｙＣａｓ９）と比較して、ＩＩ型タンパク質のプロトスペーサー隣接モチーフ（ＰＡＭ）要件の緩和を含む有用な特性に関して、ゲノム編集のために利用可能なＣａｓタンパク質の多様性を加えることが分かった。

天然のＣＲＩＳＰＲ－Ｃａｓシステムは、原核生物に感染性遺伝因子からの侵入核酸に応答する免疫を提供する。ＣＲＩＳＰＲコード化ＲＮＡ分子（ｇＲＮＡ）によってガイドされるＣａｓタンパク質は、外来性ゲノムの特異的領域を認識し、不活性化のためにそれを切断する。最初のＣＲＩＳＰＲ－Ｃａｓ９システムはゲノム編集ツールとして別の目的に利用されたため、そのようなＣＲＩＳＰＲシステムおよび他のクラスＩＩのＣＲＩＳＰＲ－Ｃａｓシステムは、ゲノム工学の分野に革命を起こした。それにも関わらず、ＣＲＩＳＰＲは同様の座位における望ましくない突然変異の発生、遺伝的モザイク現象を生じさせる複数の対立遺伝子の産生、低い効率および免疫応答の宿主において生じ得る誘導などの限界により、治療ツールとしての実施のために準備ができていない。研究から、ヒトのドナーからの血液試料がスタフィロコッカス・アウレウス（黄色ブドウ球菌）由来のＳｐｙＣａｓ９およびＣａｓ９への抗体により高い割合を示すことが分かった（Ｃｈａｒｌｅｓｗｏｒｔｈら，２０１９．ＮａｔｕｒｅＭｅｄ．２５（２）：２４９－２５４）。

公知のＣＲＩＳＰＲ－Ｃａｓシステムの数および多様性は、２０１２年のＣＲＩＳＰＲ－Ｃａｓ９システムを用いたインビトロＤＮＡ編集研究の最初の開示以来、劇的に増加している。クラスＩＩシステムの際立った特徴は、ＩＩ型システムを利用するＣａｓ９によって例示されているように、複合体のヌクレアーゼエフェクターが単一のマルチドメインタンパク質からなるという点である。標的認識は、エンドヌクレアーゼ切断作用のために塩基対を介してＣａｓタンパク質をその標的核酸配列部位に誘導する構造的非翻訳ＲＮＡにより達成される。ガイドＲＮＡ（ｇＲＮＡ）認識に加えて、プロトスペーサー隣接モチーフ（ＰＡＭ）と命名された配列モチーフは、Ｃａｓ－ガイドＲＮＡ標的結合および切断の開始のために必要とされる。これは、天然の抗ウイルス防御システムにおいて自己を非自己から区別するために重要である。しかしそれは、遺伝的ツールとしてのクラスＩＩのＣＲＩＳＰＲ－Ｃａｓシステムの別の目的での利用から生じるいくつかの所望の用途のためにあまり訳に立たない。

細菌性Ｃａｓ９タンパク質は最初に研究されたＣａｓタンパク質であり、ＳｐｙＣａｓ９は依然として最も広範囲に研究されているＣａｓ９であり、かつゲノム編集のために多く使用されている。そのようなタンパク質は、ＨＮＨ様およびＲｕｖＣ様ヌクレアーゼドメインである２つのヌクレアーゼドメインと、平滑末端で生じる二本鎖ＤＮＡエンドヌクレアーゼ切断のために必要とされる関連する触媒残基とを含むことにより、ＩＩ型Ｃａｓ９タンパク質として特徴づけられている。２０１２年以来、Ｃａｓエンドヌクレアーゼは多くの異なる細菌および古細菌から単離されている。クラスＩＩのＣａｓヌクレアーゼの最近の分類は、Ｍａｋａｒｏｖａら（２０２０年）（ＮａｔｕｒｅＲｅｖＭｉｃｒｏｂｉｏｌ．１８（２）：６７－８３）において再考されている３つの型および１７個の亜型を含む。従って、クラスＩＩのＣＲＩＳＰＲ－Ｃａｓシステムは現在のところＩＩ、ＶおよびＶＩ型システムを含み、ＶＩ型システムは最初のものであり、かつ今までのところ専らＲＮＡのみを切断するＣＲＩＳＰＲ－Ｃａｓシステムの唯一の変種である。

Ｖ型システムは、それらのエフェクターＣａｓタンパク質のドメイン構造によりＩＩ型システムとは基本的に異なる。ＩＩ型エフェクター（Ｃａｓ９ヌクレアーゼ）は、ＨＮＨヌクレアーゼがＲｕｖＣ様ヌクレアーゼドメイン配列の内部に挿入された状態でそれぞれが標的ＤＮＡの一本鎖の切断に寄与する２つのヌクレアーゼドメインを含み、Ｖ型エフェクター（Ｃａｓ１２ヌクレアーゼ）は対照的に、両方の鎖を切断するＲｕｖＣ様ドメインのみを含む。ＶＩ型エフェクター（Ｃａｓ１３ヌクレアーゼ）は、２つのＨＥＰＮドメインを含み、かつ見たところそれらの天然の環境において侵入ＤＮＡゲノムの転写物を標的にするため、ＩＩ型およびＶ型のエフェクターとは関係がない。Ｃａｓ１３タンパク質は標的認識によって誘発されるコラテラル非特異的リボヌクレアーゼ活性も示す。

Ｖ型バリアントのうち、より小さいＲｕｖＣ様ドメインを有するものは現在のところＶ～Ｕ亜型エフェクターとして分類されている。これらは、ＩＳ６０５様トランスポゾンによってコード化されるＴｎｐＢタンパク質（予測されるＲｕｖＣ様ヌクレアーゼ）との高い配列類似性を示し、かつＴｎｐＢから完全に一人前のＶ型エフェクターへの進化経路上の中間体であると考えられている。ＣＲＩＳＰＲ－Ｃａｓシステムは、ＴｎｐＢファミリーの系統学的解析によって分かっているように、複数の独立した機会に異なるグループのＴｎｐＢから進化した。４つのＶ～Ｕ亜型エフェクターの干渉活性の解析により、ごく最近になってから別個のＶ～Ｆ亜型にアップグレードされている１つのそのようなバリアントが得られた。Ｖ～Ｆ亜型エフェクター、すなわちＣａｓ１２ｆ（最初はＣａｓ１４と示されていた）は一本鎖ＤＮＡ（ｓｓＤＮＡ）を切断することが分かった。しかし、Ｖ型Ｃａｓ酵素の系統学的解析は、単一のＲｕｖＣ様ヌクレアーゼドメインにより単離された天然に生じるそのようなヌクレアーゼを分類する手段としてのみ使用されてきた。

Ｇａｓｉｕｎａｓら（２０２０年）（ＮａｔｕｒｅＣｏｍ．１１（１）：５５１２）によるＣＲＩＳＰＲ－Ｃａｓ９オルソログのための天然源の広範囲な探索によって最近追加された公知の天然に生じるクラスＩＩのＣＲＩＳＰＲ－Ｃａｓシステムの多様性にも関わらず、特に治療分野において容易な様々な遺伝子改変という所望に対してなおさらなる多様性が所望されている。ＳｐｙＣａｓ９はゲノム編集のために、そして転写調節、エピゲノム編集、塩基編集およびプライム編集のための融合酵素として広く改変されてきた。その汎用性にも関わらず、ＳｐｙＣａｓ９はその「ＮＧＧ」ＰＡＭ認識要件によって特定のそのような用途のためになお限られている。新しいオルソログを探索するだけでなく、定向進化技術、例えば淘汰によるＰＡＭ相互作用ドメイン（ＰＩＤ）のランダム突然変異誘発を利用すること、およびＣｏｌｌｉａｓおよびＢｅｉｓｅｌ（２０２１年）（ＮａｔｕｒｅＣｏｍ．１２（１）：５５５）によって再考されているような構造誘導突然変異誘発により、この要件を緩和するための試みがなされてきた。Ｗａｌｔｏｎら（２０２０年）（Ｓｃｉｅｎｃｅ．３６８（６４８８）：２９０－２９６）は、構造誘導突然変異誘発の適用により、コンセンサスＮＲＰＡＭ配列（ＲはＡまたはＧである）、およびより低い有効性でＲＹＰＡＭ配列（ＹはＣまたはＴである）を認識するＳｐＲＹヌクレアーゼバリアントを達成した。これは今日までにＣａｓ９バリアントのために報告されている最も緩和されたＰＡＭ要件である。

上に示されているように、本発明者らはこの場合に、ＲＮＡプログラム可能ＣＲＩＳＰＲ関連ヌクレアーゼの利用可能なツールセットを拡張するための新規な手法を採用した。系統学的祖先配列再構築と呼ばれるこの手法は、数十億年前に生存していた生物中に存在していたと予測される細菌性Ｃａｓ９のバリアントを産生するために使用されてきた。祖先酵素はより大きい安定性および効率を有し、化学的無差別性を示し、かつそれらの現代の子孫よりも汎用である。さらに、遺伝子治療のために祖先酵素に目を向けることの利点は、これらのタンパク質に対する宿主の前から存在する免疫を潜在的に捨てることができるという点である。本発明者らは、例えば祖先ファーミキューテス門、バシラス綱およびストレプトコッカス（レンサ球菌）属のＣａｓ９形態を設計および試験した。それらは、ヒトのＨＥＫ２９３Ｔ細胞株の細胞において高レベルの発現、非特異的ｔｒａｃｒＲＮＡ結合、および高効率の遺伝子編集を示す。

本発明は、ファーミキューテス門由来ならびに例えばストレプトコッカス・ピオゲネス（化膿レンサ球菌）を包含するストレプトコッカス（レンサ球菌）属の多くの種を含むクロストリジウムおよびバシラス綱の細菌クラス内のＣａｓ９酵素の多様な集団＋放線菌門からのいくつかのＣａｓ９配列のための系統学的情報の使用に基づいているが、当然のことながら同じ手法を用いて他の分類型のＣａｓ単体ヌクレアーゼエフェクターの祖先版、例えば祖先Ｖ型もしくはＶＩ型Ｃａｓ酵素を得てもよい。祖先版は同じ型であってもよいが異なる亜型であってもよい。それには、Ｍａｋａｒｏｖａらの同書に記載されているような現在の分類の任意の亜型から新規な亜型を割り当ててもよい。

従って一態様では、本発明は、機能的な単体エフェクターＣａｓタンパク質ヌクレアーゼ（一般にクラスＩＩのＣａｓタンパク質と呼ぶ）、例えば機能的なＣａｓ９バリアントを得るための系統学的祖先再構築方法であって、
（ａ）同じ分類型の天然に生じる単体エフェクターＣａｓヌクレアーゼ配列、例えばＩＩ型Ｃａｓ９配列の集団を含み、かつ複数の既存の種、好ましくは２つ以上の属、なおより好ましくは２つ以上の綱（場合により２つ以上の門を跨ぐ）から得られるＣａｓ配列の集団の配列解析からの系統樹を提供する工程と、
（ｂ）この系統樹から進化経路を遡ることにより祖先バリアント配列を選択する工程であって、選択された祖先バリアントの各アミノ酸のために高確率のアミノ酸を決定する工程と、
（ｃ）Ｃａｓタンパク質エンドヌクレアーゼおよび／またはニッカーゼ活性を示すことができる前記バリアントを産生する工程と
を含む方法を提供する。

当然のことながら、工程（ａ）の系統樹の提供のためのＣａｓ配列の開始集団は、そのような方法の事前適用によって得られる１つ以上の所定の祖先バリアント配列を含んでいてもよい。

タンパク質オルソログのタンパク質配列アラインメントにより系統樹を編集するためのコンピュータ実装方法がよく知られている。本明細書には、進化経路を編集し、それにより天然に生じるＣａｓタンパク質の祖先バリアントを予測し、かつ何百万年も前から再構築することを可能にするコンピュータ実装方法の使用についてさらに記載されている。本発明者らは、高い産生レベルならびに高い効率のＤＮＡの標的化および編集を示す２０～３０億年程も古いＣａｓ９酵素の「復活」を初めて報告する。

要するに、工程（ｂ）のコンピュータ実装は、
（ｉ）同じ属、例えばストレプトコッカス（レンサ球菌）属の配列のある部分を形成するそれぞれが複数の種の配列のためのちょうど祖先バリアントである祖先バリアントの配列を編集すること、好ましくはさらに
（ｉｉ）（ｉ）で達成された配列を使用して、祖先属として割り当てられている１つ以上の祖先バリアント配列、例えば利用可能なストレプトコッカス（レンサ球菌）属Ｃａｓ配列の全てまたは少なくとも大きい割合のためだけに編集されている祖先配列である祖先配列および／または複数の属の開始種の配列まで遡ることができる祖先綱として割り当てられている１つ以上の祖先バリアント配列、例えば複数の属を跨ぐ利用可能なバシラス綱配列の全てまたは少なくとも大きい割合のためだけに祖先配列として編集されている祖先配列を編集すること、好ましくはさらに
（ｉｉｉ）２つ以上の綱の開始種まで遡ることができる少なくとも１つの綱間祖先配列を編集すること
を含んでいてもよい。そのような祖先バリアントは産生のための好ましい選択であり得るが、このように編集された様々な祖先バリアントは有利な特性を有していることを見い出すことができる。

バシラス綱およびクロストリジウム綱の両方の既存の細菌種のＣａｓ９配列を含む、上に記載されているＣａｓ９配列の集団から開始するそのような綱間祖先バリアント配列（または共通祖先門配列）の編集に繋がる１つのそのような進化経路マップが図１に示されている。バシラス綱の細菌種の開始配列は、ＳｐｙＣａｓ９を含むストレプトコッカス（レンサ球菌）属の多く（数は２８）の公知のＣａｓ９配列を含むことに気づくであろう。かなりの数（例えば２５個以上）の既存のストレプトコッカス（レンサ球菌）属のＣａｓ９配列を含むバシラス綱に属する多様な範囲の細菌からのＣａｓ９配列を含む開始配列のそのような多様な集団の使用は、そのような進化マップ構築のために非常に望ましいものとして認識されるであろう。

工程（ｃ）の産生は通常、好適な宿主細胞、例えば大腸菌における発現のために核酸配列を提供することによるものである。コード配列はコドン最適化されていてもよい。

典型的な具体例は、あらゆるＰＡＭ要件の知識がない場合であっても所望されている切断活性をどのように試験することができるかを示している。望ましくは、最初にインビトロ試験によってそのような活性が観察される場合、それはヒトの細胞におけるさらなる試験において維持されるであろう。例えば、複数の既存の種からのＣａｓ９配列の集団から開始して選択された祖先バリアントが達成された場合、選択された祖先バリアントの活性は、インビトロ条件下および既存の種からのＣａｓ９配列、例えばＳｐｙＣａｓ９のエンドヌクレアーゼ活性のために適していることが知られているヒトの細胞株において試験してもよい。ヒトの細胞におけるそのような試験のために、Ｃａｓ酵素のためにヒトのコドン最適化配列が、選択された細胞におけるＣａｓタンパク質発現に適した発現ベクターに望ましくは用いられるであろう。

最初に選択されたバリアントがＣａｓエンドヌクレアーゼである場合、その後にそれを関連するヌクレアーゼ触媒部位のアミノ酸突然変異誘発のために知られている方法でニッカーゼに変換するかｄｅａｄＣａｓ（ｄｃａｓ）に変換してもよく、かつ／または非ヌクレアーゼエフェクターに融合させてもよい。例えば、Ｃａｓ９エンドヌクレアーゼの一方または両方のヌクレアーゼ部位を不活性化させ、かつＣａｓ９酵素を別のエフェクター、例えば塩基編集またはプライム編集のための酵素または転写もしくは後成的調節因子に結合させる方法がよく知られている。

上に記載されている祖先再構築方法によって得られる新規なＣａｓ酵素、および例えば宿主細胞における発現のための発現ベクターにおいて提供されるそれをコードする核酸配列も本発明によって包含される。本発明の範囲内で、本明細書に記載されているＣａｓヌクレアーゼまたはＣａｓヌクレアーゼバリアントを本明細書では互換的に「祖先Ｃａｓ」または「ＡｎＣａｓ」と呼ぶ。

特に興味深いここに教示されている祖先配列再構築とは、参照ヌクレアーゼとしてのＳｐｙＣａｓによるｄｓＤＮＡプラスミド標的の直線化のための条件下でＳｐｙＣａｓ９と比較して、より高い比のニック入りテンプレート：直線化テンプレートによって反映される時間分離可能なニッカーゼおよびエンドヌクレアーゼ活性を示すＡｎＣａｓバリアント酵素の達成である。すなわち、本明細書に記載されているＡｎＣａｓバリアント酵素は、同じ条件下でＳｐｙＣａｓ９と比較してより大きい割合のニック入りプラスミドＤＮＡテンプレートを産生することができたり、あるいは同じ条件下でＳｐｙＣａｓ９と比較してプラスミドＤＮＡテンプレートにおいてより低い割合の二本鎖切断を生じさせたりすることができる。実際によく知られているように、ＳｐｙＣａｓ９は、１つのヌクレアーゼ部位が除去されている場合を除いて、よく用いられる使用条件下ではニッカーゼ酵素として認識されない。対照的にここでは、ＳｐｙＣａｓ９により少なくとも４：１の直線化ＤＮＡプラスミド標的：ニック入りＤＮＡプラスミドテンプレートの比が得られるという条件下で、少なくとも２．３：１～少なくとも１：４の直線化ＤＮＡプラスミドテンプレート：ニック入りＤＮＡプラスミドテンプレートの比を有するＣａｓ９祖先バリアントとして得られるＡｎＣａｓ酵素が提供される。すなわち、３０分後にＬＦＣＡ、ＬＢＣＡおよびＬＳＣＡなどの本発明に従って得られるＡｎＣａｓ酵素は、ＤＮＡテンプレートの少なくとも３０％～ＤＮＡテンプレートの少なくとも７０％、例えば約８０％にニックを入れることができるが、同じ条件下でＳｐｙＣａｓ９は同じ量の時間でＤＮＡテンプレートの約１０％にニックを入れる（図１１を参照）。従って言い換えると、ＡｎＣａｓヌクレアーゼは、ＳｐｙＣａｓ９により実質的に専ら直線化またはほぼ専ら直線化のみが生じさせるがＡｎＣａｓヌクレアーゼおよび目的のバリアントは同じ条件下で観察可能なニック入り標的を提供する条件下で、ｄｓＤＮＡプラスミド標的に対してより高いニック率およびより低い直線化率を有する。

これは、ＡｎＣａｓ酵素において、ＳｐｙＣａｓ９と比較して緩和されたＰＡＭ要件、すなわち実際には、ＳｐｙＣａｓ９がＮＧＧ、例えばＴＧＧのその認識される３ヌクレオチドＰＡＭ要件を維持して有意なＤＮＡ切断活性を示すという条件下で観察不可能な３ヌクレオチドまたは最大７ヌクレオチド特異的ＰＡＭ要件と組み合わせてもよい。

さらに、そのような緩和されたＰＡＭ要件は、非常に柔軟なｇＲＮＡ使用と組み合わせられていることが観察された。従って本明細書において報告されているように、ＡｎＣａｓはＣａｓ９オルソログを有する多種多様な既存の細菌種のいずれかのものに対応するＣａｓ９ｔｒａｃｒＲＮＡ構成要素と共にｓｇＲＮＡを利用できることが分かった。従って標的化配列は異なってもよいが、ｓｇＲＮＡはそれ以外については、複数の公知のＣａｓ９オルソログと共に用いられ得るようなｓｇＲＮＡに似ている。そのような非特異的ｔｒａｃｒＲＮＡの使用は、任意の公知のＣａｓ９オルソログについて以前に報告されたことがある性質ではない。

またそのような有利な特性は、一本鎖ＤＮＡおよび一本鎖ＲＮＡを切断するための能力と組み合わせて達成された。この場合も同様に、これはＳｐｙＣａｓ９から区別される特性である。

そのようなＡｎＣａｓの例として、ここでは、本発明者らによって最終ファーミキューテス門共通祖先（ＬＦＣＡ）と命名されたＳｐｙＣａｓ９を含む既存のファーミキューテス門Ｃａｓ９酵素の非常に有利な祖先が提供される（図１、図９のノード６３および配列番号１を参照）。
配列番号１－ＬＦＣＡ
MKKDYSIGLDIGTNSVGWAVTDDNYNLVRKKMKVLGNTDKKSIGKALWGVRLFDAAETAEERRMHRTTRRRYTRRRQRIDLLQEIFQEEISKVDPSFFIRLNESRLHPEDKTDDRHPLFGDNETDKDYHKQYPTIYHLRKHLMESDEKHDIRLVYLALHHIIKYRGHFLIEGDLNSENTDVEELFKQLVQVFNDTFEEEHLSEEAIDIEEILTDKKSRSTRAKEVVKLFGSEKKQACISALIKLIVGLKGNLKKVFGDAEDTSIHFSKDNYEEDLEAIRDIIPDEYADLFEAIKALYDAIVLSGILGGSTSNTKAKVSASMIARYEQHQKDLKQLKQFVKEHLPEKYNEIFSDNTKNGYSAYIEGGTSQEDFYKYLKKILKELEEAEYLLEEIENENFLPKQRTSDNGVIPYQIHLEELRAILKNQGKYYPFLKENAEKIESILTFRIPYYVGPLARGNGRFAWMIRKKDGKITPWNFDEVVDKEKSAEEFIERMTNNCTYLPGENVLPKNSLLYEKFTVLNELNNVRLTTDKGKTRRFSAEQKQEIFDDLFRKNRKVTKKKLEDYLKREYEEFDSADISGIDGEFKSSLGSYHDFCKIVVKGNSLDEEDYKDIIEEIIKWLTVFEDRKMLRRRLEKYSEILTEEQIKKICKRHYTGWGRLSRKLLTGIRDKETGKSIIDVLRETDSSNRNFMQLLSDEDLSFKEEIEQANAEAEGENLHEIVEDLPGSPAIKRGILQALKIVDEIVKVMGHEPKNIFVEMARENQKTGRGRRSTKKRLKRLQEALKNLGSNLLKELPRDDNELRNDRLFLYYTQMGKCMYTGEPIDLDDLSNYDIDHIIPQSFIKDDSLDNRVLVSREENARKTDNFPSPEIRRKMKSFWQMLLKAGLISKKKFDRLTRADRGDFTDDELAGFIARQLVETRQITKHVATLLKQRYPTEKDEEDKTIRNAKIVSVKANLVSEFRQDFGLYKCREVNDYHHAHDAYLNAVVGNALLKKYPQLAAEFIKGDYRKNNAREENKANAKMHFYSNIMNSFTSDVKIADETGEIVWDKEKDIATVRKVMNYHQVLITRKVEEEKGGFFDQTILSKGNSKKLIPLKKNLDPEKYGGYNSPTVAYSVLVEYDIEKGKKKKLKTVKQLVGIPIRERAKLEKNPIKYLEKKGYQNPKVDLLIKIPKNSLFELDGGRRRILAAAKELKNANQLVLPAEEYTLLDKVAKIIKKNNSESIEYVEEHLSEFDELLESLIDYSPKLALQDKNLEKIKEAFEQLNLADKKEVAKEIINLLHCTATTANAALKFLGGSKNRMRYTSIKELLNASLIHQSITGLYETRIDLGKLGED

さらなる例として、ここでは、本発明者らによって最終バシラス綱共通祖先（ＬＢＣＡ）と命名されたＳｐｙＣａｓ９を含む既存のバシラス綱Ｃａｓ９酵素の非常に有利な祖先バリアントも提供される（図１を参照、図９のノード７０および配列番号２を参照）。このＡｎＣａｓは、ストレプトコッカス（レンサ球菌）属種を含むバシラス綱の幅広い現代の細菌種のＣａｓ配列まで進化追跡可能な祖先綱バリアントを示す。
配列番号２－ＬＢＣＡ
MKKDYSIGLDIGTNSVGWAVITDDYKVVRKKMKVLGNTDKKSIKKNLWGVRLFDSGETAEDTRLKRTTRRRYTRRRNRICYLQEIFQEEMNKVDDSFFHRLDESFLVPEDKKYDRHPIFGNLEEEVAYHEQYPTIYHLRKHLADSSEKADLRLVYLALAHIIKYRGHFLIEGDLNTENTDVEELFKQFVQVYNQTFEEQHLSDETIDVEEILTEKVSKSRRAENVLKLFPNEKKNGLFGQLIKLIVGLQGNFKKVFDLSEDAKLQFSKDTYEEDLENLLAMIGDEYADLFLAAKNLYDAILLSGILTTTDNNTKAKLSASMIKRYEEHQKDLAQLKQFIKEHLPDKYNEIFSDSSKNGYAGYIEGKTSQEDFYKYLKKILSKIDGAEYFLEKIEQENFLRKQRTFDNGVIPHQIHLEELRAILRRQGKYYPFLKENQEKIEQILTFRIPYYVGPLARGNSRFAWLTRKSDEPITPWNFDEVVDKEKSAEAFIERMTNYDTYLPNEKVLPKHSLLYEKFTVFNELTKVRYVTDRGKTQNFSAEQKQEIFDDLFKKNRKVTKKKLENYLKKEYEYFDSPDITGIEDEFNASLGTYHDLLKILKSKDFLDDEENEEILEDIVKILTVFEDRKMIRKRLEKYSDILTEEQLKKLERRHYTGWGRLSRKLINGIRDKQSGKTILDYLIDDDSSNRNFMQLINDDNLSFKEEIEKAQVIGETENLHEIVQDLPGSPAIKKGILQSLKIVDELVKVMGHEPKNIVVEMARENQTTSRGRRNSKQRLKRLEEALKNLGSNLLKEHPVDNQQLQNDRLYLYYLQNGKDMYTGQELDIDNLSNYDIDHIIPQSFIKDNSIDNRVLVSSEENRGKSDNVPSKEVVRKMKSFWQKLLNAGLISQRKFDNLTKAERGGLTEDDKAGFIKRQLVETRQITKHVANILDSRFNTEKDEEDNTIRNVKIITLKSNLVSQFRKDFGLYKVREINDYHHAHDAYLNAVVGTALLKKYPQLEPEFVYGDYRKNNAREENKATAKKHFYSNIMNFFASEVKIADETGEIVWDKEKDIATVRKVLSYHQVNIVKKVEVQKGGFSKETILPKGNSNKLIPRKNNWDPKKYGGFDSPTVAYSVLVTYDIEKGKKKKLKTVKELVGITIMERSAFEKNPIAYLEKKGYQNPQEDVLIKLPKYSLFELENGRRRMLASAKELQKGNQMVLPAHLVTLLYHAKRIDKSNNSESLEYVEEHRNEFDELLDYIIDFSEKYILADKNLEKIKKLYEQNNEADIKELAKSFINLLTFTAMGAPAAFKFFGETIDRKRYTSIKELLNATLIHQSITGLYETRIDLGKLGED

例として、さらにここでは、本発明者らによって最終ストレプトコッカス（レンサ球菌）属共通祖先（ＬＳＣＡ）と命名されたＳｐｙＣａｓ９の非常に有利な祖先バリアントが提供される（図１、図９のノード９１および配列番号３を参照）。このＡｎＣａｓは共通祖先属とみなされるＡｎＣａｓを示す。それはＳｐｙＣａｓ９を含む表１に列挙されている全ての開始ストレプトコッカス（レンサ球菌）属配列の作り出された共通祖先である。
配列番号３－ＬＳＣＡ
MKKPYSIGLDIGTNSVGWAVITDDYKVPAKKMKVLGNTDKQSIKKNLLGALLFDSGETAEATRLKRTARRRYTRRRNRICYLQEIFSEEMNKVDDSFFHRLDESFLVPEDKKYDRHPIFGNLAEEVAYHEQYPTIYHLRKHLADSTEKADLRLVYLALAHIIKFRGHFLIEGDLNAENTDVQKLFQQFVEVYNQTFEESHLSEETIDVEEILTEKISKSRRLENLIKHFPNEKKNGLFGNLIALILGLQPNFKTNFDLSEDAKLQFSKDTYEEDLENLLAQIGDEYADLFLAAKNLYDAILLSGILTVTDNSTKAPLSASMIKRYEEHQKDLAQLKQFIKEHLPDKYNEIFSDKSKNGYAGYIEGKTSQEDFYKYLKKILSKIDGAEYFLDKIDREDFLRKQRTFDNGSIPHQIHLQELHAILRRQGEYYPFLKENQEKIEKILTFRIPYYVGPLARGNSRFAWLTRKSDEKITPWNFDEVVDKESSAEAFIERMTNYDTYLPNEKVLPKHSLLYETFTVYNELTKVKYVTERGKTQFFSAEQKQEIFDHLFKKNRKVTKKKLKDYLEKEFEEFDSVDITGVEDEFNASLGTYHDLLKILKDKDFLDDEENEEILEDIVLTLTLFEDREMIRKRLEKYSDLFTKEQLKKLERRHYTGWGRLSRKLINGIRDKQSGKTILDYLIDDGSSNRNFMQLINDDSLSFKEEIEKAQVIGETDNLHEVVQDLAGSPAIKKGILQSLKIVDELVKVMGHNPENIVVEMARENQTTNRGRRNSRQRLKRLEEALKNLGSNILKEHPVDNQQLQNDRLYLYYLQNGKDMYTGEELDIDNLSQYDIDHIIPQSFIKDDSIDNRVLTSSEENRGKSDNVPSIEVVRKMKSFWQKLLNAGLISQRKFDNLTKAERGGLTEDDKAGFIKRQLVETRQITKHVAQILDSRFNTERDENDKRIRNVKIITLKSNLVSQFRKDFGLYKVREINDYHHAHDAYLNAVVGTALLKKYPKLEPEFVYGDYKKYNDRERGKATAKMFFYSNIMNFFKTEVKLADETGEIVWDKEKDFATVRKVLSYPQVNIVKKVEVQTGGFSKESILPKGNSDKLIPRKNNWDPKKYGGFDSPTVAYSVLVVADVEKGKAKKLKTVKELVGITIMERSAFEKNPIAFLEKKGYQNIQEDLIIKLPKYSLFELENGRRRLLASAKELQKGNEMVLPAHLVTLLYHAKRIDKSNNSENLEYVEKHKNEFDELLDYIIDFSEKYILADKNLEKIKELYDQNDDADINELASSFINLLTFTALGAPAAFKFFGETIDRKRYTSTKEVLNATLIHQSITGLYETRIDLSKLGED

ここでは、本発明者らによって最終化膿性共通祖先（ＬＰＣＡ）および最終化膿性／溶血性共通祖先（ＬＰＤＣＡ）と命名された、ストレプトコッカス・ピオゲネス（化膿レンサ球菌）を含む２種以上のストレプトコッカス（レンサ球菌）属種まで進化追跡可能なＳｐｙＣａｓ９の祖先バリアントも提供される（図９のノード９２および９５のそれぞれならびに配列番号４および５を参照）。
配列番号４－ＬＰＣＡ
MKKPYSIGLDIGTNSVGWAVITDDYKVPAKKMKVLGNTDRQSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSEEMAKVDDSFFHRLEESFLVPEDKKYDRHPIFGNLADEVAYHENYPTIYHLRKKLADSTEKADLRLIYLALAHIIKFRGHFLIEGDLNAENTDVQKLFHQLVDTYNQLFEEDQLDTETIDAKAILTAKISKSRRLENLISQIPGQKKNGLFGNLIALSLGLTPNFKSNFDLSEDAKLQLSKDTYEEDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILTVNDESTKAPLSASMIKRYEEHQQDLALLKQLVKEQLPEKYKEIFSDKSKNGYAGYIDGKTSQEEFYKYIKPILSKLDGAEEFLAKIDREDFLRKQRTFDNGSIPHQIHLEELHAILRRQEEYYPFLKDNQEKIEKILTFRIPYYVGPLARGNSRFAWLTRKSDEAITPWNFEEVVDKEASAQAFIERMTNFDTYLPNEKVLPKHSLLYETFTVYNELTKVKYVTEGMTKPFLSAEQKQAIVDLLFKKNRKVTVKQLKEDYFKKIECFDSVDITGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEKRLAKYADLFDKKVLKKLKRRHYTGWGRLSRKLINGIRDKQSGKTILDFLKADGFANRNFMQLINDDSLSFKEEIEKAQVIGQTDSLHEVVADLAGSPAIKKGILQTIKIVDELVKVMGHNPENIVIEMARENQTTAQGIKNSRQRMKRLEEVLKKLGSNILKEHPVDNTQLQNDRLYLYYLQNGKDMYTGQELDIDNLSQYDIDHIIPQSFIKDDSIDNKVLTSSEENRGKSDNVPSIEVVRKMKSYWQKLLNAGLISQRKFDNLTKAERGGLTESDKAGFIKRQLVETRQITKHVAQILDSRFNTERDENDKPIRNVKIITLKSKLVSDFRKDFGLYKVREINDYHHAHDAYLNAVVGTALLKKYPKLEPEFVYGDYKKYDDKERGKATAKMFFYSNIMNFFKTEVKLANETGEIVWDKEKDFATVRKVLSYPQVNIVKKTEVQTGGFSKESILPKGNSDKLIPRKNNWDPKKYGGFDSPTVAYSVLVVAKVEKGKAKKLKTVKELVGITIMERSAFEKNPIAFLEAKGYQDIQEDLIIKLPKYSLFELENGRRRLLASAKELQKGNEMVLPAHLVTFLYHASRIDKSTSSENLEYVEQHKHEFDEILDYIIDFSERYILADKNLEKIKSLYNQNDDSDINELASSFINLFTFTALGAPAAFKFFDATIDRKRYTSTKEVLNATLIHQSITGLYETRIDLSQLGGD
配列番号５－ＬＰＤＣＡ
MDKKYSIGLDIGTNSVGWAVITDDYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLADSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNSEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLAKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRHYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEEIQKAQVSGQGDSLHEQIANLAGSPAIKKGILQTVKVVDELVKVMGHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFIKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDEQEIGKATAKRFFYSNIMNFFKTEITLANETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKAKKLKSVKELVGITIMERSSFEKNPIDFLEAKGYKDVQKDLIIKLPKYSLFELENGRRRMLASAGELQKGNEMVLPAKLVTFLYHASHIEKSKSPENNAYVEQHKHDLDEILEYISEFSKRYILADKNLSKVKSLFNKHEDSSISELASSIINLFTLTSLGAPAAFKFLDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

ＬＦＣＡＣａｓ、ＬＢＣＡＣａｓおよびＬＳＣＡＣａｓの全てが、ＳｐｙＣａｓ９ｄｓＤＮＡ切断に適した条件下でＳｐｙＣａｓ９よりも高いニック率および低いエンドヌクレアーゼ（二本鎖切断）率を示すことが分かった。これらの活性の比は、これまで観察された最も高い比を有するＬＦＣＡＣａｓを含む祖先の年齢の関数であることが分かった。

ＬＦＣＡＣａｓ、ＬＢＣＡＣａｓおよびＬＳＣＡＣａｓの全てが、上に記載されているＰＡＭ要件の緩和を有するＣａｓ９バリアントを達成するための本発明の祖先再構築戦略の有用性も例示している。従って、そのようなＡｎＣａｓヌクレアーゼをＰＡＭｌｅｓｓとみなしてもよい。

ＬＦＣＡＣａｓ、ＬＢＣＡＣａｓおよびＬＳＣＡＣａｓの全てが、本明細書において報告されている研究によって示されているように、一本鎖ＤＮＡを切断することができることがさらに分かった。ＬＦＣＡおよびＬＢＣＡＣａｓも、本明細書において報告されている研究によって示されているように、一本鎖ＲＮＡを切断することができることが分かった。

最後に、ＬＦＣＡＣａｓ、ＬＢＣＡＣａｓおよびＬＳＣＡＣａｓの全てが、本明細書において報告されている研究によって示されているように、抗Ｃａｓ９抗体に対して弱い応答しか誘発しないことがさらに分かった。この特徴はインビボ用途のために特に興味深いものであり得る。

以下の図および添付の特許請求の範囲を参照しながら、本発明について以下にさらに説明する。

祖先Ｃａｓ９再構築および特性評価を示す。ファーミキューテス門のクロストリジウム綱およびバシラス綱からのＣａｓ９酵素＋いくつかの放線菌からのＣａｓ９酵素の系統樹が示されている。最終ファーミキューテス門共通祖先（ＬＦＣＡ；配列番号１）からバシラス綱祖先（ＬＢＣＡ；配列番号２）、ストレプトコッカス（レンサ球菌）属祖先（ＬＳＣＡ；配列番号３）およびいくつかのストレプトコッカス（レンサ球菌）属種祖先（ＬＰＣＡ；配列番号４およびＬＰＣＤＡ；配列番号５）を経て現代のストレプトコッカス・ピオゲネス（化膿性レンサ球菌）までの進化経路が白色の破線矢印によって示されている。配列関係も図９の簡略化された分岐図に示されている。図２ａ～図２ｃは、ＬＦＣＡの試験によって例示されるＡｎＣａｓエンドヌクレアーゼ活性の試験を示す。図２ａは標的ＤＮＡの直後に７つのランダムヌクレオチドを含むＤＮＡライブラリーを示し、これらの７つのＮは全ての可能なＰＡＭ配列を表している。図２ｂはＬＦＣＡをＳｐｙＣａｓ９と比較するＣａｓ９活性アッセイを示す。ＬＦＣＡＣａｓはＤＮＡライブラリーから増幅されたＰＣＲ標的を切断し、予期したサイズを有する２つの断片を生成する。図２ｃは、ストレプトコッカス・ピオゲネス（化膿性レンサ球菌）ＰＡＭ配列を用いたＣａｓ９活性アッセイを示す。ＬＦＣＡはＳｐｙＣａｓ９が認識するようにＮＧＧＰＡＭ配列を認識することができる。図３ａ～図３ｄは、ＬＦＣＡのニッキングおよびエンドヌクレアーゼ活性の実証を示す。図３ａはＤＮＡ標的の後にＴＧＧＰＡＭ配列を含むＤＮＡプラスミドを示す。Ｃａｓ９はＤＮＡの一方または両方の鎖を切断することができる。図３ｂはエンドヌクレアーゼ活性において生じる３０ｎＭのＣａｓ９との１時間の接触後のＤＮＡプラスミドの１％アガロースゲルを示す。ＬＦＣＡは同じ条件下で１０分間のインキュベーション後にニッキング活性および１時間後に二本鎖切断を示す。対照的に、ＳｐｙＣａｓ９は主として二本鎖切断活性を示す。図３ｃは、時間の関数としてＬＦＣＡおよびＳｐｙＣａｓ９の両方からの％で表される総切断率（ニッキング＋エンドヌクレアーゼ活性）を示す。図３ｄは、ニッキングとエンドヌクレアーゼ活性との間でなされた区別を有する％で表される切断率を示す。ＬＦＣＡはＤＮＡの一本鎖を切断し、インキュベーションの１時間後に他方の鎖を切断し始めた。ＳｐｙＣａｓ９は主としてエンドヌクレアーゼ活性を有する（すなわち両方の鎖を切断する）。図４ａ～図４ｂはＬＦＣＡのためのＰＡＭ決定を示す。図４ａは、３ヌクレオチドＰＡＭの提供によるＬＦＣＡＰＡＭ評価からのＰＡＭ車輪グラフを示す。ＬＦＣＡは、３ヌクレオチドを有するどの特定のＰＡＭとの認識特異性も示さない。７ヌクレオチドＰＡＭを用いた場合に同様の結果が得られた。図４ｂは、ＬＦＣＡおよびＳｐｙＣａｓ９の両方を比較する異なるＰＡＭ配列を有するプラスミドＤＮＡのインビトロ切断アッセイの結果を示す。ＬＦＣＡ（１０ｎＭ）はたった１０分以内の反応で、異なるＰＡＭを含む全てのプラスミドにニックを入れた。対照的に、ＳｐｙＣａｓ９はそのカノニカルＰＡＭ配列すなわちＴＧＧを含むプラスミドのほぼ１００％を切断し、他のＰＡＭ配列とは低い活性を示すか全く活性を示さなかった。図５ａ～図５ｄはＬＦＣＡの熱およびｐＨ安定性試験を示す。図５ａは、ｐＨ７．９および４℃～６０℃の範囲の異なる温度で３０ｎＭのＣａｓ酵素と共にＴＧＧＰＡＭを含むプラスミドＤＮＡを用いた１時間にわたる総Ｃａｓ酵素活性アッセイを示す。ＬＦＣＡは４℃および５３～６０℃でＳｐｙＣａｓ９よりも高い活性を示す。図５ｂは、異なる温度でのＣａｓ酵素のニッキングおよびエンドヌクレアーゼ活性の両方を示す。図５ｃは、３７℃および４～９．５の範囲の異なるｐＨで３０ｎＭのＣａｓ酵素と共にＴＧＧＰＡＭを含むプラスミドＤＮＡを用いた１時間にわたる総Ｃａｓ酵素活性アッセイを示す。ＬＦＣＡはＳｐｙＣａｓ９との比較において、酸性のｐＨ（４～５．５）でより高い活性を示した。図５ｄは、異なるｐＨでのＣａｓ酵素のニッキングおよびエンドヌクレアーゼ活性の両方を示す。図６ａ～図６ｆは、ＨＥＫ２９３Ｔ細胞におけるＬＦＣＡおよびＳｐｙＣａｓ９のゲノム編集の比較を示す。図６ａは、ＡＡＶＳ１座位を標的化するためのｇＲＮＡをＨＥＫ２９３Ｔ細胞にトランスフェクトするために発現プラスミドｐＣＤＮＡ３．１にクローニングされた、ヒト化ＬＦＣＡおよびＳｐｙＣａｓ９コード配列を示す。図６ｂは、いずれかのＣａｓ酵素でトランスフェクトされた細胞からの免疫蛍光画像を示す。ｈＣａｓコード配列を発現する細胞を橙黄色で染色し、核をＤＡＰＩで染色する。図６ｃは、Ｃａｓ酵素活性についてのＴ７アッセイの結果を示す。ｇＲＮＡおよびｈＣａｓコード配列でトランスフェクトされた細胞からのＰＣＲ産物をＴ７Ｅ１と共にインキュベートしてインデル形成を測定した。図６ｄは、ｈＣａｓ９、ｇＲＮＡ、およびＡＡＶＳ１座位へのｅＧＦＰのノックインのためにＨＥＫ２９３Ｔ細胞にトランスフェクトされたｅＧＦＰ遺伝子を運ぶドナーＤＮＡを示す。図６ｅは、ｅＧＦＰを発現する細胞の共焦点顕微鏡法画像を示す。図６ｆは、ｈＣａｓ酵素のトランスフェクション後にｅＧＦＰを発現する細胞からの画像において測定された相対蛍光を示す。ＴＴＣＰＡＭを標的化するＨＥＫ２９３Ｔ細胞におけるＬＦＣＡおよびＳｐｙＣａｓ９ノックインの比較を示す。細胞から抽出されたｇＤＮＡおよび増幅された座位を用いた電気泳動ゲルも示されている。ＳｐｙＣａｓ９で標的化されたＴＴＣＰＡＭ以外で、全ての試料において予期したサイズを有するバンドがゲル上に認められる。ｓｇＲＮＡを使用するためのＬＦＣＡの能力を示すアガロースゲル試験結果であり、ここでは標的化配列は、Ｃａｓ９オルソログを有する多種多様な既存の細菌種の１つのＣａｓ９ｔｒａｃｒＲＮＡ構成要素に対応するｔｒａｃＲＮＡ構成要素に結合される。表１に列挙されている配列を用いて構築された分岐図を提供する。各ノードは配列表に示されている配列と共に祖先の状態を表す。図１０ａ～図１０ｃは、ＳｐｙＣａｓ９と比較したＬＦＣＡ、ＬＢＣＡおよびＬＳＣＡのニッキングおよびエンドヌクレアーゼＣａｓ９活性を示す。図１０ａはＬＦＣＡ、ＬＢＣＡ、ＬＳＣＡおよびＳｐｙＣａｓ９についての総切断率（ニッキングおよびエンドヌクレアーゼ活性の両方）を示す。全てのＣａｓ９酵素が約１０分間のインキュベーション以内に総切断率に達した。図１０ｂはＬＦＣＡ、ＬＢＣＡ、ＬＳＣＡおよびＳｐｙＣａｓ９のプラスミド直線化率を示す。図１０ｃはＬＦＣＡ、ＬＢＣＡ、ＬＳＣＡおよびＳｐｙＣａｓ９のニック率を示す。二本鎖切断（ＤＳＢ）を有するＤＮＡテンプレートの割合、すなわち、それぞれのＣａｓヌクレアーゼとの３０分間のインキュベーション後の直線化テンプレートの割合およびそれぞれのＣａｓヌクレアーゼとの３０分間のインキュベーション後のニック入りＤＮＡテンプレートの割合を示す。ＬＦＣＡ、ＬＢＣＡおよびＬＳＣＡは、ＳｐｙＣａｓ９よりも少量の直線化ＤＮＡテンプレート（すなわち、低い割合のＤＳＢ）を産生するが、ＳｐｙＣａｓ９よりも大量のニック入りテンプレートを産生する。ＳｐｙＣａｓ９と比較した、祖先Ｃａｓ酵素の切断（エンドヌクレアーゼ＋ニッカーゼ）活性における違いを示す代替手段を示す。ＳｐｙＣａｓ９と比較してＬＦＣＡ、ＬＢＣＡおよびＬＳＣＡの全てについて、ＡｎＣａｓの年齢に対してプロットした直線化率およびニック率が示されている。ニック切断によって測定されたより高いニッカーゼ活性はより低い直線率を生じさせるため、ＳｐｙＣａｓ９のより高いニック率は絶対的には、全ての酵素についてｔ＝０分では当てはまるがｔ＞０分では当てはまらない等しい初期点を仮定した当てはめの結果である。従って、ニック率については負の値が示されている。これは、図１１に示されている切断された（ニック入りもしくは直線化）プラスミドテンプレートの割合の、図１０に示されている指数関数的減衰の負のλパラメータを提供する時間単位への変換である。ＬＢＣＡおよびＬＳＣＡはＬＦＣＡよりも高いが、なおＳｐｙＣａｓ９よりも低い直線化率を有し、故にその傾向は直線化率では祖先の年齢と共に減少するものである。対照的にニック率は祖先の年齢と共に上昇する。図１３ａ～図１３ｂはＬＢＣＡおよびＬＳＣＡについてのＰＡＭ決定を示す。図１３ａは、ＬＢＣＡおよびＬＳＣＡＰＡＭシークエンシングからのＰＡＭ車輪グラフを示す。ＬＢＣＡおよびＬＳＣＡはどの３ヌクレオチドＰＡＭに対しても認識の特異性を示さない。７ヌクレオチドを用いて同様の結果が得られた。図１３ｂは、ＬＦＣＡ、ＬＢＣＡ、ＬＳＣＡおよびＳｐｙＣａｓ９を比較する、異なるＰＡＭ配列を有するプラスミドＤＮＡのインビトロ切断アッセイの結果を示す。ＬＢＣＡ（１０ｎＭ）は、１０分間の反応以内に異なるＰＡＭを有する全てのプラスミドにニックを入れた。ＬＳＣＡは同様の選択性を示したが、より高い直線化率切断を有する。一本鎖ＤＮＡに対するエンドヌクレアーゼ活性について、同じ祖先Ｃａｓ９酵素を試験した結果を示す。３種類の祖先酵素がｇＲＮＡの有無に関わらず一本鎖ＤＮＡを切断することが示されている。予期したとおり、ＳｐｙＣａｓ９は同じ一本鎖ＤＮＡを切断することができなかった。図１５Ａ～図１５Ｅは、スーパーコイルＤＮＡ基質に対するＡｎＣａｓエンドヌクレアーゼの活性を示す。図１５Ａは、ニック入り画分および直線状画分を示す、異なる反応時間における４００７ｂｐの基質に対するＳｐＣａｓ９および全てのＡｎＣａｓについてのインビトロ切断アッセイを示す。図１５Ｂは、異なる反応時間における総切断率の定量化および指数関数フィット（線）を示す。図１５Ｃは、異なる時間における全てのＡｎＣａｓおよびＳｐＣａｓ９についてのニック入り画分の定量化を示す。図１５Ｄは、ＤＳＢ切断率の定量化を示す。単一指数関数フィットを使用してｋ_切断および切断された最大画分（振幅）を得た。図１５Ｅは、進化時間に対してプロットしたＤＳＢ画分（左軸）およびニック入り画分（右軸）を示す。図１６Ａ～図１６ＣはＡｎＣａｓのＰＡＭ決定を示す。図１６Ａは、対照として使用した５種類全てのＡｎＣａｓおよびＳｐＣａｓ９についてのＰＡＭ車輪グラフ（Ｋｒｏｎａプロット）を示す。図１６Ｂは、進化時間に対してプロットされた切断位置の３～４ｂｐ下流にＮＧＧＰＡＭ配列を含むリードの割合を示す。図１６Ｃは、対照としてのＴＮＮおよびＣＣＣによって表されている、様々なＰＡＭ配列を用いたインビトロ切断アッセイ（ＤＳＢおよびニック入り産物）を示す。インキュベーション時間は１０分間であった。図１７Ａ～図１７Ｇは、一本鎖基質に対するＡｎＣａｓのｓｇＲＮＡ試験およびヌクレアーゼ活性を示す。図１７Ａは、異なる種からのｓｇＲＮＡを用いたＡｎＣａｓおよびＳｐＣａｓ９のスーパーコイルＤＮＡ基質に対するインビトロ切断アッセイを示す。ＬＦＣＡ［ＦＣＡ］、ＬＢＣＡ［ＢＣＡ］およびＳｐＣａｓ９が示されている。図１７Ｂは、異なるｓｇＲＮＡを用いた全てのＡｎＣａｓおよびＳｐＣａｓ９についてのインビトロ切断率の定量化を示す。図１７Ｃは、ＬＦＣＡ［ＦＣＡ］、ＬＢＣＡ［ＢＣＡ］およびＳｐＣａｓ９についての異なるインキュベーション時間における８５ｎｔのｓｓＤＮＡ断片に対するインビトロ切断アッセイを示す。図１７Ｄは、ＬＦＣＡ［ＦＣＡ］、ＬＢＣＡ［ＢＣＡ］およびＳｐＣａｓ９についての異なるインキュベーション時間における６０ｎｔのｓｓＲＮＡに対するインビトロ切断アッセイを示す。図１７Ｅは、異なる時間におけるｓｓＤＮＡの画分切断率の定量化および動態パラメータの決定のための指数関数フィットを示す。図１７Ｃおよび図１７Ｄの両方において、対照レーンは３種類のタンパク質について同じである。図１７Ｆは、異なる時間におけるｓｓＲＮＡの画分切断率の定量化および動態パラメータの決定のための指数関数フィットを示す。全ての動態パラメータが表２にまとめられている。図１７Ｇは、対照として使用したＳｐＣａｓ９、ＬＦＣＡ［ＦＣＡ］、ＬＢＣＡ［ＢＣＡ］およびＢＳＡに対する抗Ｃａｓ９ウサギ抗体のＥＬＩＳＡ試験からの結果を示す。３つの独立した標的におけるＩｌｌｕｍｉｎａ技術を用いたＮＧＳ標的化シークエンシングによる、ＨＥＫ２９３Ｔ細胞におけるインビトロ部位特異的編集尺度を示す。図１９Ａ～図１９Ｄは、スーパーコイルＤＮＡ基質に対するＬＦＣＡ［ＦＣＡ］Ｈ８３８Ａエンドヌクレアーゼの活性を示す。図１９Ａは、ニック入り画分および直線状画分を示す異なる反応時間における４００７ｂｐの基質に対するＬＦＣＡ［ＦＣＡ］Ｈ８３８Ａについてのインビトロ切断アッセイを示す。図１９Ｂは、異なる反応時間における総切断画分の定量化および指数関数フィット（線）を示す。図１９Ｃは異なる時間におけるニック入り画分の定量化を示す。図１９ＤはＤＳＢ切断率の定量化を示す。単一指数関数フィットを使用してｋ_切断および切断された最大画分（振幅）を得た。全ての祖先ＡｎＣａｓエンドヌクレアーゼの推定される残基のそれぞれの事後確率分布を示す。最も高い事後確率を有する残基を各位置に割り当てる。全ての場合に、事後確率平均は０．７４の平均値を示すＬＦＣＡ［ＦＣＡ］を除いて１に近い。図２１Ａ～図２１Ｂは、異なる温度およびｐＨ値におけるＡｎＣａｓエンドヌクレアーゼの活性を示す。図２１Ａは、５～６０℃の範囲の異なる温度での総切断率の定量化を示す。図２１Ｂは、４～９．５の範囲の異なるｐＨでの総切断率の定量化を示す。７ヌクレオチドＰＡＭ解析を含む５種類全てのＡｎＣａｓおよびＳｐＣａｓ９についてのＰＡＭ車輪グラフ（Ｋｒｏｎａプロット）を示す。ＬＦＣＡ［ＦＣＡ］を除いて、ＮＧＧＰＡＭへの選択性が観察される。トラフィックライトレポーター切断アッセイを示す。相対ＮＨＥＪ頻度はＲＦＰ陽性細胞の数によって推定され、ＳｐＣａｓ９に対して正規化されている。野生型ストレプトコッカス・ピオゲネス（化膿レンサ球菌）Ｃａｓ９［ＳｐＣａｓ９］、国際公開第２０２１／０８４５３３Ａ１号のいわゆる「祖先Ｃａｓ９タンパク質」（ＷＯ’５３３の配列番号２６８）［Ａｎｃ．Ｃａｓ］、およびＷａｌｔｏｎら（２０２０．Ｓｃｉｅｎｃｅ．３６８（６４８８）：２９０－２９６）のいわゆる「ほぼＰＡＭｌｅｓｓのＣａｓ９タンパク質ＳｐＧおよびＳｐＲＹ」［それぞれＳｐＲＹおよびＳｐＧ］に対する、２種類のＡｎＣａｓ［ＬＦＣＡおよびＬＢＣＡ］についてのＰＡＭ選択性の比較評価を示す。これらのヌクレアーゼのそれぞれのＰＡＭ選択性は、Ｎ＝任意のヌクレオチドおよびＲ＝ＡまたはＧを用いて示されている。

ここに教示されている戦略によって機能的な祖先Ｃａｓバリアントを得るための開始配列集団は、好ましくは例示されているように、それにより系統樹を配列アラインメント情報に基づいて構築することができる存在している細菌種からのＣａｓ９配列の集団であってもよい。系統樹を構築するためのコンピュータ実装方法は、配列アラインメントおよび保存された領域の認識を必要とする分野においてよく知られている。但し、上に記載されているように、系統樹を別のクラスＩＩのＣａｓ酵素型の配列から構築し得るということは除外されない。

好ましくは、開始配列は２つ以上の属を跨ぐ。例えば実施例の箇所に示されているように、有利な祖先Ｃａｓ９バリアントを探索する際に、複数のＣａｓ９配列は、ストレプトコッカス、エンテロコッカス、リステリア、クロストリジウム、ペラギルハブダス（Ｐｅｌａｇｉｒｈａｂｄｕｓ）、ハロラクティバシラス（Ｈａｌｏｌａｃｔｉｂａｃｉｌｌｕｓ）、フルオリコッカス（Ｆｌｏｒｉｃｏｃｃｕｓ）、バゴコッカス（Ｖａｇｏｃｏｃｃｕｓ）、ウリナコッカス（Ｕｒｉｎａｃｏｃｃｕｓ）、バゴコッカス（Ｖａｇｏｃｏｃｃｕｓ）、ドレア（Ｄｏｒｅａ）、ルミノコッカス、ラクノスピラ、アナエロスティペス（Ａｎａｅｒｏｓｔｉｐｅｓ）、オルセネラ（Ｏｉｓｅｎｅｌｌａ）およびビフィドバクテリウムのうちの２つ以上から選択されてもよい。２つ以上の種の配列は、各選択された属、例えば２、３、４つ以上、例えば最大２５個以上、例えば２８個のストレプトコッカス（レンサ球菌）属種からの配列から選択されてもよい。上に記載されているように、ＬＳＣＡは、図１によって示されているストレプトコッカス・ピオゲネス（化膿レンサ球菌）を含む表１に列挙されている２８個全てのストレプトコッカス（レンサ球菌）属種の進化追跡可能な共通祖先である。

より好ましくは、配列の開始集団は目的の門の２つ以上の綱を跨ぐ。従って上に示されているように、有利な祖先Ｃａｓ９バリアントを探索する際に、開始集団において細菌のバシラス綱およびクロストリジウム綱の両方由来のＣａｓ９配列を組み合わせることが有用であることが分かった。例えば配列の開始集団は望ましくは、ストレプトコッカス（レンサ球菌）属の異なる種由来の少なくとも複数の配列、エンテロコッカスの異なる種由来の複数の配列、リステリアの異なる種由来の複数の配列およびクロストリジウム属種由来の複数の配列を含んでいてもよい。開始集団の多様性は、実施例の箇所で用いられているＣａｓ９配列の開始集団にいくつかの放線菌配列を含めることにより示されているように、門を横切ってさらに拡大させてもよい。望ましくは、Ｃａｓ配列の開始集団は複数の亜型を跨いでいてもよい。

公知のＣａｓ配列から編集された系統樹から開始して、予測される祖先形態への進化経路を編集してもよく、これは今日から何百万年も遡ることと同等であってもよい。本発明に従って得られる選択された祖先バリアント配列は、現在から少なくとも５億年、例えば少なくとも７～８億年またはさらには１０億年以上の進化期間と同等であってもよい。上に記載されているように、進化期間は２０～３０億年と同程度の長さ、例えば約２２～２４億年と同等であってもよい。

図１によって示されているように、ＬＦＣＡＣａｓは、クロストリジウム綱およびバシラス綱（両方がファーミキューテス門の細菌属）を跨ぎ、かついくつかの放線菌が追加された既存の細菌種の集団由来のＣａｓ９配列の系統樹の進化経路解析から得られた、Ｃａｓ酵素のそのような再構築された祖先である。それは、バシラス綱由来の既存のＣａｓ９酵素までの進化経路のより初期の祖先メンバーの祖先（配列番号２を有するＬＢＣＡＣａｓと命名された再構築された祖先綱）およびより具体的にはストレプトコッカス（レンサ球菌）属由来の幅広いＣａｓ酵素の再構築された祖先（配列番号３を有する再構築された祖先属ＬＳＣＡＣａｓ）の祖先として考えることができる。次いでＬＳＣＡはストレプトコッカス（レンサ球菌）属由来のより小さい選択範囲（２８個のうちの８つ）のＣａｓ酵素の再構築された祖先（配列番号４を有するＬＰＣＡＣａｓと命名された再構築された祖先）の祖先であり、次いでＬＰＣＡはストレプトコッカス・ピオゲネス（化膿レンサ球菌）およびストレプトコッカス・ディスガラクティエ（Ｓｔｒｅｐｔｏｃｏｃｃｕｓｄｙｓｇａｌａｃｔｉａｅ）配列の祖先（配列番号５を有する再構築された祖先ＬＰＤＣＡＣａｓ）である。

本明細書および添付の図で使用される「Ｂｙｓ」、「Ｂｙａ」および「Ｇｙａ」という用語は、数十億年を指すために同義で使用される。

上に記載されているように、ＬＦＣＡＣａｓは図示されている進化経路のノード６３によって表されており、配列番号1に示されているアミノ酸配列を有する。それはインビトロおよびヒトの細胞の両方において、高い産生レベルならびにＤＮＡを標的化および編集する高い効率を示す。

従ってここでは本発明の態様として、そのような新規なＣａｓ酵素の同定のための本明細書において教示されている戦略の採用によって得られた機能的な祖先Ｃａｓの好ましい例を表す、配列番号１のアミノ酸配列を有するＬＦＣＡＣａｓを含むかそれからなるＣａｓヌクレアーゼが提供される。ＬＦＣＡＣａｓはＳｐｙＣａｓ９に進化的に関連しているものとみなされるが、それを特に好ましいＡｎＣａｓヌクレアーゼにさせる多くの有利な違いを有する。

ＬＦＣＡＣａｓの興味深い性質として、以下が報告されている。
（ｉ）ＬＦＣＡＣａｓは天然では知られておらず、かつＳｐｙＣａｓ９とのたった５４％の配列同一性を有する。それにも関わらず、それは実施例の箇所に示されているガイドＲＮＡ／Ｃａｓタンパク質相互作用のためにＳｐｙＣａｓｓｇＲＮＡの３’末端を有するｓｇＲＮＡを用いることができる、
（ｉｉ）ＳｐｙＣａｓ９とは対照的に、それは時間分離可能なニッキング活性と、その後に、ＳｐｙＣａｓ９ＰＡＭ配列を提供し、かつＳｐｙＣａｓ９による同じプラスミドのエンドヌクレアーゼ切断のための条件下で二本鎖プラスミドＤＮＡに対してエンドヌクレアーゼ活性とを示す。
（ｉｉｉ）それは広いＰＡＭ特異性を示し、図４ａのＰＡＭ車輪グラフによって示されているように、ＬＦＣＡＣａｓはＰＡＭ認識の特異性を示さなかった。図４ｂの切断データは、３ヌクレオチド配列に関わらずニック入りプラスミドＤＮＡが１０ｎＭで１０分以内に、提案されているＰＡＭ配列を提供したことを示している。対照的に、ＳｐｙＣａｓ９は同じ条件下で、そのカノニカルＰＡＭ配列すなわちＴＧＧを含むプラスミドのほぼ１００％を切断し、かつ他のＰＡＭ配列との低い活性を示すか全く活性を示さなかった。ＰＡＭ提供について７ヌクレオチドバリアント配列を用いて同様の結果が得られた。従って試験した条件下で、ＬＦＣＡＣａｓを「ＰＡＭｌｅｓｓ」と命名することができる。
（ｉｖ）それはｇＲＮＡ要件における高い柔軟性を示し、図８によって示されているように、それは複数の既存の細菌種のいずれかのものに対応するＣａｓ９ｔｒａｃｒＲＮＡ構成要素を有し、かつストレプトコッカス・サーモフィルス（サーモフィルス菌）、エンテロコッカス・フェシウム、クロストリジウム・パーフリンジェンス（ウェルシュ菌）およびフィネゴルディア・マグナ（Ｆｉｎｅｇｏｌｄｉａｍａｇｎａ）ならびにストレプトコッカス・ピオゲネス（化膿レンサ球菌）を含む多種多様なものを跨ぐｓｇＲＮＡを利用することができる。
（ｖ）ＬＦＣＡＣａｓはより高い切断活性を示し、次いで低い温度（４～２０℃）およびｐＨ７．９でニッキング活性として観察されるＳｐｙＣａｓ９を示した。
（ｖｉ）より高い温度（５３～６０℃）で、それはニッカーゼおよびエンドヌクレアーゼ活性の両方が観察される状態でＳｐｙＣａｓ９よりも高い熱安定性を示した。
（ｖｉｉ）異なるｐＨおよび３７℃でのｐＨ安定性試験において、ＬＦＣＡＣａｓは酸性条件下でＳｐｙＣａｓ９よりも高い活性を維持した。アルカリ性ｐＨでは、ＬＦＣＡＣａｓの活性は同じままであり、ここではＳｐｙＣａｓ９はその最適な性能を示した。
（ｖｉｉｉ）ＬＦＣＡＣａｓは、図１３に示すように一本鎖ＤＮＡ基質に対して切断活性を示す。よく知られているように、これは遺伝子改変分野における通常の使用条件下ではＳｐｙＣａｓ９の活性ではない。

ヒトの細胞において（本明細書ではＨＥＫ２９３Ｔ細胞を用いて例示されている）、ＬＦＣＡＣａｓは好適なｇＲＮＡを用いてそのような細胞において発現される場合に標的化された座位においてインデル形成を促進することができることが分かった（本明細書ではＡＡＶＳ１座位を用いて例示されている）。さらに、同じ座位におけるノックイン遺伝子改変を促進するための能力が、図６および図７に示すように確認された。

本発明の態様として、それぞれ配列番号２、３、４および５のアミノ酸配列を有するＬＢＣＡＣａｓ、ＬＳＣＡＣａｓ、ＬＰＣＡＣａｓおよびＬＰＣＤＡＣａｓを含むかそれからなるＣａｓヌクレアーゼが提供される。ＬＢＣＡＣａｓ、ＬＳＣＡＣａｓ、ＬＰＣＡＣａｓおよびＬＰＣＤＡＣａｓはそれぞれ、それらをＣａｓ酵素として公知のＣａｓ９酵素から区別する興味深い性質をＬＦＣＡＣａｓと共有する。特に興味深いのは、例えば実施例の箇所においてＬＢＣＡＣａｓおよびＬＳＣＡＣａｓについてさらに示されているように、ＳｐｙＣａｓと比較して産生されるニック入りプラスミドテンプレートのより高い割合である（以下の典型的な具体例によって示されているように、ＳｐｙＣａｓと比較してプラスミド直線化率に対するより高いニック率と同等である）。上に記載されているように、ニック入りプラスミドテンプレートの割合（および／またはニック率）は、興味深いことに祖先の年齢と共にこのグループの酵素において上昇することが分かり、この特徴はＬＦＣＡＣａｓにおいて最も明白である。対照的に、直線化率および／または二本鎖切断の割合は祖先の年齢と共に減少することが分かった。

従って、本発明は、
（ｉ）ＬＦＣＡＣａｓとして命名され、かつ配列番号１に記載されているアミノ酸配列を有するＣａｓヌクレアーゼ、
（ｉｉ）ＬＢＣＡＣａｓとして命名され、かつ配列番号２に記載されているアミノ酸配列を有するＣａｓヌクレアーゼ、
（ｉｉｉ）ＬＳＣＡＣａｓとして命名され、かつ配列番号３に記載されているアミノ酸配列を有するＣａｓヌクレアーゼ、
（ｉｖ）ＬＰＣＡＣａｓとして命名され、かつ配列番号４に記載されているアミノ酸配列を有するＣａｓヌクレアーゼ、
（ｖ）ＬＰＤＣＡＣａｓとして命名され、かつ配列番号５に記載されているアミノ酸配列を有するＣａｓヌクレアーゼ、または
ＳｐｙＣａｓ９と比較して以下の際立った特性：
（ａ）ＳｐｙＣａｓ９により実質的に専ら直線化ＤＮＡプラスミドテンプレートのみが得られるという条件下での、より高い割合のニック入りＤＮＡプラスミドテンプレートおよび／またはより低い割合の直線化ＤＮＡプラスミドテンプレート、
（ｂ）当該バリアントが観察可能なニック入り標的を提供する間にＳｐｙＣａｓ９により実質的に専ら直線化またはほぼ専ら直線化のみが得られるという条件下での、ＤＮＡプラスミド標的に対するより高いニック率およびより低い直線化率（好ましくは、少なくとも約４：１の直線化ＤＮＡプラスミド標的：ニック入りＤＮＡプラスミドテンプレートの比）、
（ｃ）ＬＦＣＡＣａｓ、ＬＢＣＡＣａｓおよび／またはＬＳＣＡＣａｓのいずれかに匹敵する緩和されたＰＡＭ要件、
（ｄ）一本鎖ＤＮＡを切断するための能力、
（ｅ）標的化配列が、複数の既存の細菌種によって用いられるＣａｓ９ｇＲＮＡのｔｒａｃｒＲＮＡ構成要素から選択可能なｔｒａｃｒＲＮＡ構成要素に結合されるｓｇＲＮＡを使用するための能力
のうちの１つ以上を保持するそのようなＣａｓヌクレアーゼのバリアント
を含むかそれからなるＣａｓヌクレアーゼに関する。

本明細書で使用される「バリアント」という用語は、配列番号１、配列番号２、配列番号３、配列番号４および配列番号５のいずれか１つの配列とそれぞれ比較して少なくとも１つのアミノ酸突然変異（例えば、付加、置換または欠失）を有するＣａｓヌクレアーゼを指す。典型的にはＣａｓヌクレアーゼバリアントは、配列番号１、配列番号２、配列番号３、配列番号４または配列番号５のアミノ酸配列と少なくとも６０％の配列同一性、好ましくは少なくとも６５％、７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％以上の配列同一性を共有する。当然のことながら、Ｃａｓバリアントのアミノ酸配列は、配列番号１、配列番号２、配列番号３、配列番号４または配列番号５のいずれか１つと１００％同一ではない。

いくつかの実施形態では、Ｃａｓヌクレアーゼバリアントのアミノ酸配列は、配列番号１のアミノ酸配列と少なくとも６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％以上の配列同一性を共有する。

いくつかの実施形態では、Ｃａｓヌクレアーゼバリアントのアミノ酸配列は、配列番号２のアミノ酸配列と少なくとも７５％、８０％、８５％、９０％、９５％以上の配列同一性を共有する。

いくつかの実施形態では、Ｃａｓヌクレアーゼバリアントのアミノ酸配列は、配列番号３のアミノ酸配列と少なくとも８０％、８５％、９０％、９５％以上の配列同一性を共有する。

いくつかの実施形態では、Ｃａｓヌクレアーゼバリアントのアミノ酸配列は、配列番号４のアミノ酸配列と少なくとも８５％、９０％、９５％以上の配列同一性を共有する。

いくつかの実施形態では、Ｃａｓヌクレアーゼバリアントのアミノ酸配列は、配列番号５のアミノ酸配列と少なくとも９５％、９６％、９７％、９８％、９９％以上の配列同一性を共有する。

いくつかの実施形態では、本発明に係るＣａｓヌクレアーゼは置換または欠失、例えばエンドヌクレアーゼおよび／またはニッカーゼ活性がＬＦＣＡＣａｓ、ＬＢＣＡＣａｓおよび／またはＬＳＣＡＣａｓの緩和されたＰＡＭ特異性と共に保持される１つ以上の保存的置換による１つ以上のアミノ酸変化を有する。いくつかの実施形態では、本発明に係るＣａｓヌクレアーゼはニッカーゼ活性を有する。いくつかの実施形態では、本発明に係るＣａｓヌクレアーゼは緩和されたＰＡＭ要件を有する。いくつかの実施形態では、本発明に係るＣａｓヌクレアーゼはＰＡＭ要件を有さず、すなわちＣａｓヌクレアーゼはＰＡＭｌｅｓｓである。

好ましい実施形態では、本発明のＣａｓヌクレアーゼは配列番号１を有するＬＦＣＡまたはそのバリアントであるか、配列番号２を有するＬＢＣＡまたはそのバリアントである。

例として、ＬＢＣＡＣａｓ、ＬＳＣＡＣａｓ、ＬＰＣＡＣａｓおよびＬＰＣＤＡＣａｓは、以下のさらなる興味深い性質を有する。
（ａ）ＬＢＣＡＣａｓは天然では知られておらず、かつＳｐｙＣａｓ９と７０％の同一性しか有しない。ＬＳＣＡＣａｓは天然では知られておらず、かつＳｐｙＣａｓ９と７５％の同一性しか有さない。ＬＰＣＡＣａｓは天然では知られておらず、かつＳｐｙＣａｓ９と８３．５％の同一性を有する。ＬＰＤＣＡＣａｓは天然では知られておらず、かつＳｐｙＣａｓ９と９７．５％の同一性を有する。それにも関わらず、それらは実施例の箇所に示されているガイドＲＮＡ／Ｃａｓタンパク質相互作用のためにＳｐｙＣａｓｓｇＲＮＡの３’末端を有するｓｇＲＮＡを用いることができる。
（ｂ）ＳｐｙＣａｓ９とは対照的に、上に記載されているように、ＬＢＣＡＣａｓおよびＬＳＣＡＣａｓの両方が緩和されたＰＡＭ要件（図１３ａ、図１３ｂおよび図２４）および一本鎖ＤＮＡを切断するためのその能力（図１４）をＬＦＣＡＣａｓと共有することが分かった。

但し、本明細書において例示されている新規なＡｎＣａｓ酵素は、核酸修飾のために有利なそのような酵素を達成するための本発明の新規な祖先配列再構築手法の有用性の単に例示であることが理解されるであろう。当然のことながら、本明細書における教示は、ＳｐｙＣａｓ９と比較して同じ新規な特性、例えば
（ａ）ＳｐｙＣａｓ９により実質的に専ら直線化ＤＮＡプラスミドテンプレートのみが得られるという条件下での、より高い割合のニック入りＤＮＡプラスミドテンプレートおよび／またはより低い割合の直線化ＤＮＡプラスミドテンプレート（すなわち二本鎖切断の割合）、および／または
（ｂ）当該バリアントが観察可能なニック入り標的を提供する間にＳｐｙＣａｓ９により実質的に専ら直線化またはほぼ専ら直線化のみが得られるという条件下での、ＤＮＡプラスミド標的に対するより高いニック率およびより低い直線化率（少なくとも約４：１の直線化ＤＮＡプラスミド標的：ニック入りＤＮＡプラスミドテンプレートの比と同等であってもよい）、および／または
（ｃ）ＬＦＣＡＣａｓ、ＬＢＣＡＣａｓおよびＬＳＣＡＣａｓのいずれに匹敵する緩和されたＰＡＭ要件、および／または
（ｄ）一本鎖ＤＮＡおよび／または一本鎖ＲＮＡを切断するための能力、および／または
（ｅ）標的化配列が、例えばストレプトコッカス・ピオゲネス（化膿レンサ球菌）、ストレプトコッカス・サーモフィルス（サーモフィルス菌）、エンテロコッカス・フェシウム、クロストリジウム・パーフリンジェンス（ウェルシュ菌）およびフィネゴルディア・マグナ（Ｆｉｎｅｇｏｌｄｉａｍａｇｎａ）の全てを含む複数の既存の細菌種によって用いられるＣａｓ９ｇＲＮＡのｔｒａｃｒＲＮＡ構成要素から選択可能なｔｒａｃｒＲＮＡ構成要素に結合されるｓｇＲＮＡを使用するための能力
の１つ以上を共有する例示されているＡｎＣａｓ酵素のバリアントを含む他のＣａｓ９バリアント酵素の達成の道を開く。

特に本発明の態様として、機能的な等価物の好ましい祖先Ｃａｓヌクレアーゼも本明細書において提供され、その機能的な等価物は図９の進化経路上のノードによって表されている。これらの機能的な等価物のＣａｓヌクレアーゼのアミノ酸配列は、添付の配列表に配列番号１０～２３６として与えられている。

本発明は、祖先Ｃａｓヌクレアーゼを得るための方法にまで及び、ここでは選択される祖先酵素は、既存のＣａｓ９酵素まで進化追跡可能であり、好ましくは例えば、ＳｐｙＣａｓ９まで進化追跡可能であり、かつ上に記載されている特性（ａ）～（ｅ）：
（ａ）ＳｐｙＣａｓ９により実質的に専ら直線化ＤＮＡプラスミドテンプレートのみが得られるという条件下での、より高い割合のニック入りＤＮＡプラスミドテンプレートおよび／またはより低い割合の直線化ＤＮＡプラスミドテンプレート、
（ｂ）当該バリアントが観察可能なニック入り標的を提供する間にＳｐｙＣａｓ９により実質的に専ら直線化またはほぼ専ら直線化のみが得られるという条件下での、ＤＮＡプラスミド標的に対するより高いニック率およびより低い直線化率（好ましくは、少なくとも約４：１の直線化ＤＮＡプラスミド標的：ニック入りＤＮＡプラスミドテンプレートの比）、
（ｃ）ＬＦＣＡＣａｓ、ＬＢＣＡＣａｓおよび／またはＬＳＣＡＣａｓのいずれかに匹敵する緩和されたＰＡＭ要件、
（ｄ）一本鎖ＤＮＡを切断するための能力、
（ｅ）標的化配列が、複数の既存の細菌種によって用いられるＣａｓ９ｇＲＮＡのｔｒａｃｒＲＮＡ構成要素から選択可能なｔｒａｃｒＲＮＡ構成要素に結合されるｓｇＲＮＡを使用するための能力
の１つ以上を有する。

場合により、特性（ａ）および（ｄ）の一方もしくは両方または特性（ａ）および（ｅ）の一方もしくは両方と組み合わせられたか、あるいは場合により（ａ）、（ｄ）および（ｅ）の全てと組み合わせられた、上に記載されている緩和されたＰＡＭ特異性を有するＡｎＣａｓの選択が特に好ましいものであり得る。上に記載されているように、選択されたＡｎＣａｓは、例えばＳｐｙＣａｓ９により少なくとも約４：１の直線化ＤＮＡプラスミド標的：ニック入りＤＮＡプラスミドテンプレートの比が得られるという条件下で、少なくとも約２．３：１～少なくとも１：４の間の直線化ＤＮＡプラスミド標的：ニック入りＤＮＡプラスミドテンプレートの比を提供してもよい。

従って本発明の方法を適用して、以下：
・ＳｐｙＣａｓ９により少なくとも約４：１の直線化ＤＮＡプラスミド標的：ニック入りＤＮＡプラスミドテンプレートの比が得られるという条件下での、少なくとも約２．３：１～少なくとも１：４の間の直線化ＤＮＡプラスミド標的：ニック入りＤＮＡプラスミドテンプレートの比、
・ＬＦＣＡＣａｓ、ＬＢＣＡＣａｓおよびＬＳＣＡＣａｓのいずれに匹敵する緩和されたＰＡＭ要件、
・一本鎖ＤＮＡおよび／または一本鎖ＲＮＡを切断するための能力、および
・標的化配列が、複数の既存の細菌種によって用いられるＣａｓ９ｇＲＮＡのｔｒａｃｒＲＮＡ構成要素から選択可能なｔｒａｃｒＲＮＡ構成要素に結合されるｓｇＲＮＡを使用するための能力
という特性うちの１つ以上を有する祖先Ｃａｓヌクレアーゼを得ることができる。

そのような方法は、そのようなＡｎＣａｓヌクレアーゼをニッカーゼのみまたはヌクレアーゼ活性を有しないｄｅａｄＣａｓのいずれかであるバリアントに変換すること、および／または例えば融合タンパク質において非ヌクレアーゼエフェクターへの結合を提供することをさらに含んでいてもよい。ニッカーゼのみまたはヌクレアーゼ活性を有しないｄｅａｄＣａｓのいずれかであるそのようなバリアントおよび／または融合タンパク質も、本発明における産物それ自体として考えられる。

いくつかの実施形態では、Ｃａｓヌクレアーゼは、触媒部位の突然変異誘発によりヌクレアーゼ活性を有しないｄｅａｄＣａｓに変換された、本発明に係るヌクレアーゼの非ヌクレアーゼ修飾されたｄｅａｄＣａｓバリアントである。いくつかの実施形態では、Ｃａｓヌクレアーゼは触媒活性を伴わない。いくつかの実施形態では、ＣａｓヌクレアーゼはｄｅａｄＣａｓである。

いくつかの実施形態では、ＣａｓヌクレアーゼまたはＣａｓヌクレアーゼバリアントは、遺伝子改変もしくは調節のために非ヌクレアーゼエフェクターと結合されている。いくつかの実施形態では、非ヌクレアーゼエフェクターはＣａｓヌクレアーゼまたはＣａｓヌクレアーゼバリアントと前記非ヌクレアーゼエフェクターとを含む融合タンパク質である。

いくつかの実施形態では、祖先Ｃａｓヌクレアーゼは以下の特性：
・一本鎖ＤＮＡを切断するための能力、および／または
・一本鎖ＲＮＡを切断するための能力
のうちの１つ以上をさらに有する。

一実施形態では、祖先Ｃａｓヌクレアーゼは、ＬＦＣＡＣａｓ、ＬＢＣＡＣａｓおよびＬＳＣＡＣａｓのいずれに匹敵する緩和されたＰＡＭ要件を有する。一実施形態では、祖先ＣａｓヌクレアーゼはＰＡＭ要件を有しない。

いくつかの実施形態では、祖先Ｃａｓヌクレアーゼは以下の特性：
・一本鎖ＤＮＡを切断するための能力，
・一本鎖ＲＮＡを切断するための能力、および／または
・ＬＦＣＡＣａｓ、ＬＢＣＡＣａｓおよびＬＳＣＡＣａｓのいずれに匹敵する緩和されたＰＡＭ要件
のうちの１つ以上を有する。

いくつかの実施形態では、祖先Ｃａｓヌクレアーゼは以下の特性：
・一本鎖ＤＮＡを切断するための能力、
・一本鎖ＲＮＡを切断するための能力、および／または
・ＬＦＣＡＣａｓに匹敵するＰＡＭ要件不要状態（すなわちＰＡＭｌｅｓｓ活性）
のうちの１つ以上を有する。

ＳｐｙＣａｓ９と比較して際立った上記特性（ａ）～（ｅ）のうちの１つ以上を保持する上に記載されている例示されているＡｎＣａｓヌクレアーゼのバリアントも提供される。この場合も同様に、例えば場合により上記（ａ）、（ｂ）、（ｄ）および（ｅ）に指定されている１つ、２つまたは全ての特性、例えば上に記載されているＳｐｙＣａｓ９と比較してより多くのニック入りテンプレートおよび／またはより少ない直線化テンプレートの産生（二本鎖切断の量）、および／または上に記載されているＳｐｙＣａｓ９と比較してより高いニック率：直線化率の比、および／または一本鎖ＤＮＡを切断するための能力と共に、ＬＦＣＡＣａｓによって示されるような緩和されたＰＡＭ特異性の保持が特に好ましいものであり得る。好ましくは、全てのこれらの特性が保持される。

上に示されているように機能的等価物である、すなわち上に列挙されているＬＦＣＡＣａｓの特性（ｉ）～（ｖｉｉｉ）の全てを維持するＬＦＣＡＣａｓおよびそのバリアントが特に好ましい。但し、上で考察されている少なくとも緩和されたＰＡＭ特異性および／または柔軟なｔｒａｃｒＲＮＡ利用を保持するＬＦＣＡＣａｓバリアントは、Ｃａｓ酵素ツールボックスへの非常に好ましい追加とみなされる。

慣習によれば、「直線活性」および「エンドヌクレアーゼ活性」という用語は、プラスミドの形態で提供される二本鎖ＤＮＡの両方の鎖を切断するためのヌクレアーゼ活性を指すように本明細書において同義で使用される。「直線化活性率」、「直線化率」および「直線活性率」という用語は、時間の関数として両方の鎖を介して切断された標的ｄｓＤＮＡの量の尺度を指すために本明細書において同義で使用される。本明細書で使用される「ニッカーゼ」は、プラスミドなどのｄｓＤＮＡ分子の一本鎖のみを切断し、それによりニックを形成するヌクレアーゼを指す。「ニッカーゼ活性率」および「ニック率」は同義で使用され、時間の関数として一本鎖を介して切断された標的ｄｓＤＮＡの量の尺度を指す。ニッカーゼおよび／または直線活性率は、
（ｉ）３０ｎＭのＣａｓヌクレアーゼをｇＲＮＡと共に、切断緩衝液（例えば、１００ｍＭのＮａＣｌ、５０ｍＭのＴｒｉｓ－ＨＣｌ、１０ｍＭのＭｇＣｌ_２、１００μｇのＢＳＡ、ｐＨ７．９）中で１：１の比および３７℃で少なくとも５分間インキュベートすること、
（ｉｉ）標的ＤＮＡ、例えばプラスミドを添加すること、
（ｉｉｉ）例えば３０分間インキュベートすること、
（ｉｖ）切断反応を停止すること、および
（ｖ）例えば、最終反応産物をアガロースゲル上で泳動させることにより、最終反応産物を可視化すること
を含む方法によって試験してもよい。

３０分間のインキュベーション時間を用いる記載されている方法と同様の方法を用いて、本発明の好ましいＣａｓヌクレアーゼは、ＳｐｙＣａｓ９により少なくとも４：１の直線化ＤＮＡプラスミド標的：ニック入りＤＮＡプラスミドテンプレートの比が得られるという条件下で、少なくとも２．３：１～少なくとも１：４の間の直線化ＤＮＡプラスミド標的：ニック入りＤＮＡプラスミドテンプレートの比を生成してもよい。従って上に記載されているように３０分後に、ＬＦＣＡ、ＬＢＣＡおよびＬＳＣＡなどの本発明に従って得られるＡｎＣａｓ酵素は、ＤＮＡテンプレートの少なくとも３０％～少なくとも７０％、例えばＤＮＡテンプレートの約８０％にニックを入れてもよく、同じ条件下でＳｐｙＣａｓ９は、図１１に示すように同じ量の時間でＤＮＡテンプレートの約１０％にニックを入れる。

本発明の好ましいＣａｓヌクレアーゼによって形成される二本鎖切断（ＤＳＢ）を有するＤＮＡテンプレート（すなわち、直線化テンプレート）の割合は、１０％～約７０％であってもよい。本発明の好ましいＣａｓヌクレアーゼによって形成される二本鎖切断（ＤＳＢ）を有するＤＮＡテンプレートの割合は、最大で７０％、６０％、５０％、４０％、３０％、２０％または１０％であってもよい。本発明の好ましいＣａｓヌクレアーゼによって形成される二本鎖切断（ＤＳＢ）を有するＤＮＡテンプレートの割合は１５％～約６５％であってもよい。本発明の好ましいＣａｓヌクレアーゼによってＤＮＡテンプレートにおいて形成される二本鎖切断の割合（ＤＳＢ）は１９％～約６２％であってもよい。

ＬＦＣＡＣａｓによって形成される二本鎖切断（ＤＳＢ）を有するＤＮＡテンプレートの割合は約１９％であってもよい。ＬＢＣＡＣａｓによって形成される二本鎖切断（ＤＳＢ）を有するＤＮＡテンプレートの割合は約３６％であってもよい。ＬＳＣＡＣａｓによって形成される二本鎖切断（ＤＳＢ）を有するＤＮＡテンプレートの割合は約６２％であってもよい。逆に、本発明の好ましいＣａｓヌクレアーゼのうちのいずれか１つを試験するために使用されるような同じ実験条件下で、ＳｐｙＣａｓ９によって形成された二本鎖切断（ＤＳＢ）を有するＤＮＡテンプレートの割合は少なくとも７０％、７５％または８０％である。

本発明の好ましいＣａｓヌクレアーゼによって形成されるニックを有するＤＮＡテンプレート（すなわち、ニック入りテンプレートが生成される）の割合は２０％～約１００％であってもよい。本発明の好ましいＣａｓヌクレアーゼによって形成されるニックを有するＤＮＡテンプレートの割合は少なくとも３０％、４０％、５０％、６０％、７０％、８０％または９０％であってもよい。本発明の好ましいＣａｓヌクレアーゼによって形成されるニックを有するＤＮＡテンプレートの割合は２０％～約９０％であってもよい。本発明の好ましいＣａｓヌクレアーゼによって形成されるニックを有するＤＮＡテンプレートの割合は３５％～約８５％であってもよい。

ＬＦＣＡＣａｓによって形成されるニックを有するＤＮＡテンプレートの割合は約８０％であってもよい。ＬＢＣＡＣａｓによって形成されるニックを有するＤＮＡテンプレートの割合は約６５％であってもよい。ＬＳＣＡＣａｓによって形成されるニックを有するＤＮＡテンプレートの割合は約３５％であってもよい。逆に、本発明の好ましいＣａｓヌクレアーゼのうちのいずれか１つを試験するために使用される同じ実験条件下でＳｐｙＣａｓ９によって形成されたニックを有するＤＮＡテンプレートの割合は最大で約２０％または１０％である。

図１２に示すように、本発明の好ましい祖先Ｃａｓ酵素の切断活性の違いは、直線化率およびニック率により示すことができる。従って、本発明の好ましいＣａｓヌクレアーゼの直線化率は約０．００１～約０．１ｍ^－１であってもよいものとみなすことができる。本発明の好ましいＣａｓヌクレアーゼのニック率は約－０．４～約－０．１ｍ^－１であってもよい。例えば直線化率およびニック率は表２に示されているとおりであってもよい。

いくつかの実施形態では、Ｃａｓヌクレアーゼバリアントはニッカーゼ活性のみを保持するように触媒部位の突然変異誘発により改変されている。いくつかの実施形態では、ＣａｓヌクレアーゼバリアントはＣａｓニッカーゼである。いくつかの実施形態では、Ｃａｓヌクレアーゼのアミノ酸配列は、置換または欠失、例えば１つ以上の保存的置換による１つ以上のアミノ酸変化を含み、それによりＬＦＣＡＣａｓの緩和されたＰＡＭ特異性と共にエンドヌクレアーゼおよび／またはニッカーゼ活性が保持されている。

上記から、上で考察されているＬＦＣＡＣａｓ、ＬＢＣＡＣａｓ、ＬＳＣＡＣａｓ、ＬＰＣＡＣａｓおよびＬＰＣＤＡＣａｓおよびそれらのバリアント（ならびにそれらの機能的等価物、例えば図９の進化経路上のノードによって表されているもの、または本発明の祖先再構築戦略に従って得られる他のもの）がＣａｓタンパク質、特に最も高い観察されたニック率を有するＬＦＣＡＣａｓのツールボックスへの非常に有用な新規な追加としてみなされることは明らかであろう。それらは、ニッカーゼのみの作用を促進するための条件下で直接使用してもよい（但し、例えばＬＦＣＡニッカーゼ、ＬＢＣＡニッカーゼおよびＬＳＣＡニッカーゼ、ＬＰＣＡニッカーゼおよびＬＰＤＣＡニッカーゼとしてニッカーゼ活性のみを保持するための触媒部位の突然変異誘発による改変は除外されない）。ＬＦＣＡＣａｓ、ＬＢＣＡＣａｓ、ＬＳＣＡＣａｓ、ＬＰＣＡＣａｓおよびＬＰＣＤＡＣａｓのいずれかまたはそのようなバリアントは、遺伝子改変のためのエフェクタータンパク質、例えば塩基編集のためのデアミナーゼまたはプライム編集のための逆転写酵素などの塩基エディターと結合（例えば融合）されていてもよい。

当然のことながら、置換または欠失、例えば１つ以上の保存的置換により１つ以上のアミノ酸変化を有するＬＦＣＡＣａｓ、ＬＢＣＡＣａｓ、ＬＳＣＡＣａｓ、ＬＰＣＡおよびＬＰＣＤＡＣａｓのいずれのバリアント（または触媒部位の突然変異誘発により得られる対応するニッカーゼ）は、エンドヌクレアーゼおよび／またはニッカーゼ活性が保持されるという条件で、Ｃａｓ９エンドヌクレアーゼまたはＣａｓ９ニッカーゼとして同様に用いてもよい。ＬＦＣＡＣａｓ、ＬＢＣＡＣａｓおよび／またはＬＳＣＡＣａｓのために示されている緩和されたＰＡＭ特異性も保持するそのようなバリアントは特に興味深く、かつ本発明の一部を形成している。

本発明の一部を形成する本発明の祖先再構築戦略によって得られるＡｎＣａｓヌクレアーゼのバリアントまたは触媒部位の突然変異誘発により得られる対応するニッカーゼのバリアントは、例えば１つ以上の所望の際立った特性を保持することを条件として、親酵素と様々な程度の配列同一性を有していてもよい。それらは例えば少なくとも８０％、少なくとも９０％、少なくとも９５％、少なくとも９６％、少なくとも９７％、少なくとも９８％または少なくとも９９％の配列同一性を有していてもよい。

天然に生じるＣａｓ９ヌクレアーゼと同様に、上に記載されているＬＦＣＡＣａｓ、ＬＢＣＡＣａｓ、ＬＳＣＡＣａｓ、ＬＰＣＡＣａｓおよびＬＰＣＤＡＣａｓのいずれかまたはそれらのバリアント（ならびにそれらの機能的等価物、例えば図９の進化経路上のノードによって表されているものまたは本発明の祖先再構築戦略に従って得られるそれ以外のもの）も、触媒部位の突然変異誘発によりヌクレアーゼ活性を有しないｄＣａｓに変換してもよく、かつさらに非ヌクレアーゼエフェクタータンパク質と結合（例えば融合）させてもよい。

従って、上で考察されているＬＦＣＡＣａｓ、ＬＢＣＡＣａｓ、ＬＳＣＡＣａｓ、ＬＰＣＡＣａｓおよびＬＰＣＤＡＣａｓ、それらのバリアント（ならびにそれらの機能的等価物、例えば図９の進化経路上のノードによって表されているものまたは本発明の祖先再構築戦略に従って得られるそれ以外のもの）は、既存の種の天然に生じるＣａｓ９ヌクレアーゼおよびその改変版のために考えられるあらゆる種類の遺伝子改変技術において用いてもよい。これらは塩基エディターなどの遺伝子改変もしくは調節のためのエフェクターと組み合わせた使用にまで及び、ここでの結合は国際公開第２０１７／０１１７２１号（ラトガース大学、ＨｏｒｉｚｏｎＤｉｓｃｏｖｅｒｙ社にライセンスが与えられている）において教示されているようなガイドおよびＲＮＡ結合ドメインのＲＮＡ伸長を介したものである。Ｃｏｌｌａｎｔｅｓら，２０２１．ＣＲＩＳＰＲＪ．４（１）：５８－６８も参照されたい。

好ましくは、例えば非ヌクレアーゼエフェクターに結合または融合されているＣａｓ酵素バリアントは、ニッカーゼ活性のみを有するかヌクレアーゼ活性を有しない（すなわちｄＣａｓである）ために、従来の触媒部位の突然変異誘発により改変されたヌクレアーゼ活性を有する本発明に従って得られる任意のＡｎＣａｓまたはそのバリアントであってもよく、かつ例えばＬＦＣＡＣａｓ、ＬＢＣＡＣａｓおよび／またはＬＳＣＡＣａｓにより観察される緩和されたＰＡＭ特異性を示す。

本発明は、それらのバリアントおよび機能的等価物を含む本明細書に記載されているＡｎＣａｓタンパク質の発現のための核酸、例えばそのようなタンパク質の発現のための発現ベクターをさらに提供する。そのようなベクターは、ガイドＲＮＡまたはＤＮＡから発現されるガイドＲＮＡと共に用いてもよい。従って、本明細書において教示されているＡｎＣａｓヌクレアーゼまたはそのバリアントもしくは機能的等価物を提供するベクターと好適なガイドＲＮＡとの組み合わせが細胞へのトランスフェクションのために提供されてもよい。例えばヒトの細胞におけるＬＦＣＡＣａｓ、ＬＢＣＡＣａｓ、ＬＳＣＡＣａｓ、ＬＰＣＡＣａｓまたはＬＰＣＤＡＣａｓまたはそのバリアントもしくは機能的等価物の発現のためのベクターを含む１つ以上のベクターを含むそのような組み合わせは、薬学的に許容される賦形剤を含む医薬組成物の形態で提供されてもよい。

好ましくは、Ｃａｓタンパク質はＬＦＣＡＣａｓまたは対応するニッカーゼであってもよい。当然のことながら、本明細書において教示されている祖先酵素のいずれかの対応するニッカーゼ、例えばＬＢＣＡニッカーゼ、ＬＳＣＡニッカーゼ、ＬＰＣＡニッカーゼまたはＬＰＣＤＡニッカーゼがそのように提供されてもよい。

従って本発明はさらに、本発明に係るＣａｓヌクレアーゼまたはＣａｓヌクレアーゼバリアントを発現することができる核酸に関する。

いくつかの実施形態では、核酸はＤＮＡもしくはＲＮＡ分子である。いくつかの実施形態では、核酸はＤＮＡ分子、例えば相補的なＤＮＡ分子である。いくつかの実施形態では、核酸はＲＮＡ分子、例えばメッセンジャーＲＮＡ分子である。

いくつかの実施形態では、核酸は一本鎖または二本鎖である。いくつかの実施形態では、核酸は一本鎖である。いくつかの実施形態では、核酸は二本鎖である。

いくつかの実施形態では、核酸は天然のヌクレオチドを含む。いくつかの実施形態では、核酸は天然および非天然のヌクレオチドの組み合わせを含む。

いくつかの実施形態では、核酸はベクターに含まれている。好適なベクターの非限定的な例は、プラスミド、フォスミド、コスミド、人工の染色体またはウイルスベクターを含む。いくつかの実施形態では、当該ベクターはナノ粒子、例えば脂質ナノ粒子に含まれている。

本発明はさらに、本明細書の上に記載されている本発明に係る核酸を含むベクターとＣａｓヌクレアーゼまたはそのバリアントもしくは機能的等価物を標的ＤＮＡ配列に標的化するためのガイドＲＮＡとの組み合わせ、あるいはガイドＲＮＡを発現することができるベクターに関する。

あるいは、ＬＦＣＡＣａｓ、ＬＢＣＡＣａｓ、ＬＳＣＡＣａｓ、ＬＰＣＡＣａｓまたはＬＰＣＤＡＣａｓなどの本明細書において教示されている新規なＡｎＣａｓヌクレアーゼまたはそのバリアントもしくは機能的等価物、例えば上で考察されている対応するニッカーゼは、例えば単離された細胞の中への電気穿孔法による細胞へのトランスフェクションのためのガイドＲＮＡを含むリボ核タンパク質（ＲＮＰ）複合体として提供されてもよい。従って本発明はさらに、本発明に係るＣａｓヌクレアーゼまたはＣａｓヌクレアーゼバリアントを含むリボ核タンパク質複合体、あるいはＣａｓヌクレアーゼまたはＣａｓヌクレアーゼバリアントおよびＣａｓヌクレアーゼまたはＣａｓヌクレアーゼバリアントを標的ＤＮＡ配列に標的化するためのガイドＲＮＡに言及する。

当然のことながら、本明細書で使用される「ガイドＲＮＡ」という用語は、ＲＮＡ（ｓｇＲＮＡ）を標的化する単一の分子、あるいは天然に生じるＣａｓ９に関して好適であれば、（ｉ）標的配列に相補的なヌクレオチド配列を含むＤＮＡ標的化セグメント（ｃｒＲＮＡ）と、（ｉｉ）Ｃａｓタンパク質と相互作用するタンパク質結合セグメント（ｔｒａｃｒＲＮＡ）とを含む２つの配列からなるＲＮＡであってもよい。

さらなる態様では、本発明は標的核酸配列、例えば標的ＤＮＡ配列を改変または調節するための方法であって、標的配列を（ｉ）教示されているＣａｓタンパク質、例えば上で考察されているＬＦＣＡＣａｓ、ＬＢＣＡＣａｓ、ＬＳＣＡＣａｓ、ＬＰＣＡＣａｓまたはＬＰＣＤＡＣａｓあるいはそのバリアントもしくは機能的等価物と、（ｉｉ）標的配列にＣａｓタンパク質を標的化するためのガイドＲＮＡとを含む複合体と接触させることを含み、
（ａ）前記接触させることは、好ましくは人間の生殖細胞系列同一性を改変する方法は除外されるという条件で、インビトロで単離された標的核酸配列とのもの、あるいはエクスビボで細胞内でのものである、および／または
（ｂ）本方法はヒトもしくは動物の体に対して実施される医学的治療方法ではない
のいずれかである方法を提供する。

当該複合体は、例えばこの目的の導入遺伝子を標的ＤＮＡ配列内に導入するために目的の導入遺伝子をコードする核酸分子をさらに含んでいてもよい。

好ましくは、本Ｃａｓタンパク質は、同じ緩和されたＰＡＭ要件を保持する、例えば上に記載されているＬＦＣＡＣａｓ、ＬＢＣＡＣａｓまたは別の例示されているＡｎＣａｓヌクレアーゼであってもよい。好ましくは、本Ｃａｓタンパク質はそのようなＡｎＣａｓであってもよいが、融合タンパク質の形態でニッカーゼ活性のみを示すかヌクレアーゼ活性を示さないように改変されていてもよい。

そのような方法は、例えばエクスビボでのヒトもしくは動物細胞の遺伝子改変にまで及ぶ。ここに教示されているＣａｓタンパク質、例えばＬＦＣＡＣａｓ、ＬＢＣＡＣａｓまたはその他のＡｎＣａｓ（それらのバリアントおよび機能的等価物を含む）を例えば、場合により限定されるものではないが、プロトプラストにおいて標的配列を改変することにより植物における遺伝子改変との関連での用途を有していてもよい。

当然のことながら本発明は、標的核酸配列、例えばＤＮＡ配列を改変または調節することにより治療処置に使用するための組み合わせにまで及び、ここでは当該組み合わせは、
（ｉ）本明細書において教示されているＣａｓタンパク質、例えば上で考察されているＬＦＣＡＣａｓ、ＬＢＣＡＣａｓ、ＬＳＣＡＣａｓ、ＬＰＣＡＣａｓまたはＬＰＣＤＡＣａｓあるいはそのバリアントもしくは機能的等価物またはそれを発現することができるポリヌクレオチドと、
（ｉｉ）本Ｃａｓタンパク質を標的核酸配列に標的化するためのガイドＲＮＡまたはそれを発現することができるポリヌクレオチドと
を含む。

特に治療処置は、遺伝性疾患の予防および／または治療を含んでもよい。次いで当該組み合わせは、目的の導入遺伝子をコードする核酸分子をさらに含んでもよく、ここでは前記目的の導入遺伝子は、例えば遺伝性疾患に関与する遺伝子欠陥を補償してもよい。

上に示されているように、例えばＬＦＣＡＣａｓのＳｐｙＣａｓ９との低い配列同一性は、そのような使用を想定することに関連して有利であるとみなす。そのような使用は例えば病原菌におけるＣａｓ作用を包含してもよく、あるいは腸微生物叢または皮膚微生物叢の操作のためであってもよい。

以下の典型的な具体例は、Ｃａｓ酵素ＬＦＣＡＣａｓ、ＬＢＣＡＣａｓおよびＬＳＣＡＣａｓの取得および試験の両方を参照しながら本発明を例示するが、上に記載されている、進化解析のために系統樹を提供するＣａｓ酵素配列の開始集団の選択に応じて、有利な特性を有する他の祖先Ｃａｓタンパク質を同じ戦略によって得ることができるものと考えられる。予測される復活は３０億年ほどの古さであってもよい。

実施例１
既存のＣａｓ９配列からのＣａｓヌクレアーゼの祖先配列再構築
クエリーとしてＳｐｙＣａｓ９（Ｕｎｉｐｒｏｔコード：Ｑ９９ＺＷ２）配列を用いて、Ｕｎｉｐｒｏｔデータベースからいくつかのファーミキューテス門細菌種由来の遺伝子Ｃａｓ９の配列を収集した。この検索から、ファーミキューテス門由来のバシラス綱およびクロストリジウム綱内のＣａｓ９遺伝子の何百個もの配列の存在を確認した。放線菌からのいくつかの配列も発見した。５９個の配列（表１）をダウンロードした後、配列アラインメントを構築し、これにより有意な保存を示す配列の一部を用いてＣａｓ９配列の共通起源を確認した。ベイズ推定（ＢＥＡＳＴソフトウェア）を用い、系統樹を編集してこれらの配列の系統学的関係を確認した。最尤法を用いて、約２４億年遡ってファーミキューテス門最終共通祖先（ＬＦＣＡ）に対して５つのＡｎＣａｓ配列を再構築した（図１を参照）。ＬＦＣＡＣａｓから現代のストレプトコッカス・ピオゲネス（化膿レンサ球菌）までの進化経路を辿った。ＬＦＣＡＣａｓはＳｐｙＣａｓ９と約５０％の同一性しか有しない（５００以上の突然変異を有する）ことが分かった。クロストリジウムおよびエンテロコッカス属種に至るものなどの他の進化経路を構築した。祖先Ｃａｓ酵素をコードする遺伝子を合成し、発現ベクターにクローニングし、大腸菌において発現させ、実験室で精製した。ＬＦＣＡからストレプトコッカス・ピオゲネス（化膿性レンサ球菌）までの経路から５種類のＡｎＣａｓ酵素（図１に太字で示されている）が得られた。５種類全てが、ＳｐｙＣａｓ９との約５０～ほぼ９５％の範囲の配列同一性に関わらず高レベルで発現され、折り畳まれており、かつ可溶性であることが分かった。

進化解析に関するさらなる情報については、以下の材料および方法の箇所を参照されたい。

ＡｎＣａｓ酵素のエンドヌクレアーゼ活性の試験
祖先Ｃａｓがエンドヌクレアーゼ活性を示すか否かを試験するために、７つのランダムヌクレオチド（ＮＮＮＮＮＮＮ）を有するＤＮＡライブラリーと、これらのヌクレオチドの後の配列を標的化するためのｇＲＮＡとを設計した。ＬＦＣＡＣａｓＰＡＭ配列が未知であったため、このランダムＤＮＡライブラリーが必要であった（図２ａ）。ランダムライブラリーの提供のための配列をプラスミドｐＵＣ１８にクローニングし、８４４ｂｐの配列を増幅させて直線状ＤＮＡ断片を生成した。ＳｐｙＣａｓ９切断により２つの断片、すなわち５６６ｂｐを有するものと、ＰＡＭ配列を含む２７８ｂｐを有するより小さいものとを生成した。ＰＣＲ断片を標的化するｇＲＮＡとのＬＦＣＡＣａｓおよびＳｐｙＣａｓ９の両方のインキュベーションにより、両方の断片の生成に成功し（図２ｂ）、祖先Ｃａｓが触媒活性を有することを確認した。さらに、ＰＣＲによりライブラリーから抽出されたストレプトコッカス・ピオゲネス（化膿性レンサ球菌）ＰＡＭ（ＮＧＧ）を含むＤＮＡ断片は、両方のＣａｓ酵素によって認識された。ＬＦＣＡはストレプトコッカス・ピオゲネス（化膿性レンサ球菌）ＰＡＭを認識し、かつＤＮＡを切断するすることができた（図２ｃ）。

ＬＦＣＡＣａｓのＤＮＡ切断動態を調べるために、ストレプトコッカス・ピオゲネス（化膿性レンサ球菌）ＰＡＭ（ＴＧＧ）を含むＤＮＡ断片をクローニングし、５～１６０分間の範囲の異なる時間でＬＦＣＡＣａｓまたはＳｐｙＣａｓ９と共にインキュベートした。両方の酵素をｇＲＮＡおよび標的ＤＮＡと共にインキュベートし、ローディングバッファーおよびＥＤＴＡを添加することによりこの反応を止めた。この試料を１％アガロースゲル上で泳動させて、スーパーコイルＤＮＡ、ニック入りＤＮＡおよび直線状ＤＮＡを検出した（図３ａ）。アガロースゲル（図３ｂ）上で、Ｃａｓ酵素活性後に異なるＤＮＡ高次構造が観察された。バンド強度を測定し、両方の酵素による総切断率を異なる時間で計算した（図３ｃ）。両方の酵素は１０分後にプラスミドＤＮＡのほぼ１００％を切断した。しかしＬＦＣＡＣａｓはＤＮＡの１本鎖を切断し、かつ他の鎖の切断は時間と共に増加し、すなわち図３ｄに示すように、ニッキングおよびエンドヌクレアーゼ活性が時間において分離されることが観察された。それに対してＳｐｙＣａｓ９はＤＮＡの２つの鎖を同時に切断する。

別の一連の実験では、ＡｎＣａｓ遺伝子を合成し、アラビノース誘導プロモーターとＡｎＣａｓを細胞膜周辺腔に導くｇＩＩＩコード化シグナルとを運ぶｐＢＡＤ／ｇＩＩＩ発現ベクターにクローニングした。全てのＡｎＣａｓが大腸菌ＢＬ２１細胞において高レベルで発現された。

活性試験は、ＡｎＣａｓがストレプトコッカス・ピオゲネス（化膿性レンサ球菌）からのｓｇＲＮＡならびにそのカノニカル５’－ＮＧＧ－３’ＰＡＭ配列を認識する極度に単純化されたシナリオを仮定することにより開始した。ＴＧＧＰＡＭの上流のＤＮＡ断片に向かって標的化される２０ｎｔ長のスペーサ領域を含むｓｇＲＮＡを設計し、全てを４００７ｂｐのスーパーコイルプラスミドの中に配置した。インビトロ切断アッセイは、異なる消化時間で標的ＤＮＡおよびｓｇＲＮＡと共にＡｎＣａｓまたはＳｐＣａｓ９をインキュベートすることにより行った。切断効率において明確な違いはあるが、試験した全ての酵素がニッカーゼおよびＤＳＢ活性をそれぞれ示す、緩和された直線状産物を生成した。予期したとおり、ＳｐＣａｓ９は短いインキュベーション時間後にニック入り産物を示し、より長いインキュベーション時間後に直線状産物を示した（図１５Ａ）。しかしＡｎＣａｓの場合、その挙動は最も古いＬＦＣＡＡｎＣａｓからより最近の酵素に変化した（図１５Ａ）。ＬＦＣＡＡｎＣａｓは主としてニッカーゼ活性を示し、ＤＳＢ活性は６０分を超える時間の経過後にのみ顕著になった。他のＡｎＣａｓは、より若いＡｎＣａｓにおいてより強烈なＤＳＢ活性と共に漸進的挙動を示した（図１５Ａ）。各ＡｎＣａｓおよびＳｐＣａｓ９のためのニック入り画分および直線状画分の両方を３つの形態、すなわち総切断率（図１５Ｂ）、ニック入り画分（図１５Ａ）および直線状画分（図１５Ｄ）において定量化し、かつインキュベーション時間に対してプロットし、これはニック入り画分の漸進的減少および直線状画分の増加を示している。ＳｐＣａｓ９はより高い割合の直線状産物を有し、最も古いＬＦＣＡＡｎＣａｓは最も高い割合のニック入り画分を有していた。直線状画分およびニック入り産物の割合を地質時代に対してプロットし、これはニッカーゼからＤＳＢ活性への進化傾向を示している（図１５Ｅ）。ニッカーゼからＤＳＢ活性への進化傾向と共に、ＨＮＨドメイン変位に関連づけられたＬＦＣＡＡｎＣａｓタンパク質において観察された構造的違いは、最も古いＡｎＣａｓすなわちＬＦＣＡＡｎＣａｓが減少または抑制された活性を有する祖先ＨＮＨドメインを示し得ることを示唆している。これを調べるために、Ｈ８３８ＡＬＦＣＡＡｎＣａｓ突然変異体のインビトロ活性を試験した（野生型ＳｐＣａｓ９アミノ酸配列に関してはＨ８４０Ａ）。この突然変異体はニック入り産物と、驚くべきことに直線状産物とを産生することができ、野生型ＬＦＣＡＡｎＣａｓにより得られたものと実際に同一のプロファイルを示した（図１９Ａ～図１９Ｄ）。これらの結果は、Ｃｐｆ１（Ｃａｓ１２ａ）、Ｃａｓ１４（Ｃａｓ１２ｆ）またはＣａｓΦ（Ｃａｓ１２ｊ）２７～３０などのＨＮＨドメインを欠いているいくつかのＶ型エフェクターヌクレアーゼにおいて以前に示されたことがあるように、ＬＦＣＡＡｎＣａｓがＬＦＣＡＡｎＣａｓにおいて観察されるニッカーゼおよびＤＳＢ活性に寄与するＲｕｖＣドメインと共に未成熟ＨＮＨドメインを含み得ることを示唆している。

別の一連の実験では２種類のＡｎＣａｓ、すなわちＬＢＣＡＣａｓおよびＬＳＣＡＣａｓのＤＮＡ切断活性を、ＬＦＣＡＣａｓおよびＳｐｙＣａｓ９のＤＮＡ切断活性と比較した。

標的配列の後にＴＧＧＰＡＭ配列を含むプラスミドを異なる時間にわたって各酵素と共にインキュベートした。４種類の酵素の切断率は総切断率を比較した場合に同様であった（図１０ａ）。しかし直線化率およびニック率は酵素によって異なった。ＬＢＣＡＣａｓおよびＬＳＣＡＣａｓは、ＬＦＣＡＣａｓよりも高いが、ＳｐｙＣａｓ９よりもなお低い直線化率を有することが分かった（図１０ｂ）。対照的に、ＬＢＣＡＣａｓおよびＬＳＣＡＣａｓのニック率はＬＦＣＡＣａｓのものよりも低かったが、ＳｐｙＣａｓ９のニック率よりも高かった（図１０ｃ）。

ＡｎＣａｓ酵素の切断活性は、図１１に示されている傾向を辿ることを認めることができた。３０分間のインキュベーション時間後の二本鎖切断の割合は、ＳｐｙＣａｓ９について最も高いことを認めることができ、祖先Ｃａｓ酵素の年齢と共に減少する（すなわち、二本鎖切断の割合は、ＳｐｙＣａｓ９の％ＤＳＢ＞ＬＳＣＡＣａｓの％ＤＳＢ＞ＬＢＣＡＣａｓの％ＤＳＢ＞ＬＦＣＡＣａｓの％ＤＳＢのように、祖先酵素が古くなるにつれて減少することを認めることができる）。

形成されたニック入りテンプレートの割合について反対の相関が認められた（すなわち、ＳｐｙＣａｓ９のニック切断率％＜ＬＳＣＡＣａｓのニック切断率％＜ＬＢＣＡＣａｓのニック切断率％＜ＬＦＣＡＣａｓのニック切断率％）。

図１１に示されているＤＳＢおよびニック入りテンプレートの割合を時間依存値に変換することにより、直線化率およびニック率を計算し、プロットすることができた。直線化率およびニック率は、当該率を各祖先の年齢に対してプロットした場合に見られる傾向に従っているように思われる（図１２）。

ＰＡＭ決定
以下のＰＡＭライブラリー構築の箇所に記載されているように、ＤＮＡライブラリーからＰＣＲにより増幅させたＤＮＡ断片を使用してＬＦＣＡＣａｓのＰＡＭ特異性を決定した。ＬＦＣＡＣａｓをｇＲＮＡおよびＤＮＡライブラリーと共に１時間インキュベートし、反応産物を２％アガロースゲルにおいて泳動させた。２７８ｂｐの小さい断片をアガロースゲルから抽出し、ＩｏｎＴｏｒｒｅｎｔ次世代シーケンシング（ＮＧＳ）で解析した。シークエンシングデータから、ＬＦＣＡＣａｓによって認識される各ＰＡＭの頻度を解析し、当該ライブラリーにおける各ＰＡＭの全体的頻度に対する総割合を計算した。計算した頻度をＰＡＭ車輪グラフにおいてプロットして、祖先ＣａｓのＰＡＭ親和性を可視化した（図４ａ）。この車輪グラフは、ＳｐｙＣａｓ９と比較してＬＦＣＡＣａｓのＰＡＭ選択性の喪失を示している。

この結果を確認するために、異なるＰＡＭの組み合わせ（ＴＮＮ３ヌクレオチドの組み合わせおよびＣＣＣ）を含む標的ＤＮＡを運ぶＤＮＡプラスミドを用いてインビトロＰＡＭ決定アッセイを行った。各ＰＡＭと共に１０分間インキュベートしたＬＦＣＡおよびＳｐｙＣａｓ９（１０ｎＭ）は異なる切断活性を有していた。ＬＦＣＡＣａｓは試験した全てのＰＡＭにより同様のニッキング活性を示した。対照的に、ＳｐｙＣａｓ９はＴＧＧＰＡＭ（その周知のカノニカルＰＡＭ配列）により切断を示し、かつ他のＰＡＭによりＬＦＣＡＣａｓよりも低い切断を示した（図４ｂ）。

別の一連の実験では、異なるＰＡＭを認識するＡｎＣａｓエンドヌクレアーゼの能力を調べた。各ＡｎＣａｓの好ましいＰＡＭ配列を決定するために、全ての可能なＰＡＭに対応する標的配列およびその後に７つのランダムヌクレオチド（ＮＮＮＮＮＮＮ）を含むＤＮＡライブラリーを設計した。ストレプトコッカス・ピオゲネス（化膿性レンサ球菌）の足場および標的配列に相補的な２０個のヌクレオチドを用いてｓｇＲＮＡを設計した。標的およびＰＡＭ配列の両方を含む８４４ｂｐの断片を増幅するためにＰＣＲプライマーを設計し、これをＡｎＣａｓおよびＳｐＣａｓ９のための基質として使用した。精製したＣａｓタンパク質および転写されたｓｇＲＮＡを用いるインビトロ消化は、ＰＣＲ標的を用いて行った。５種類のＡｎＣａｓの全てが２つの断片、すなわち５６６ｂｐのものとＡｎＣａｓによって認識されるＰＡＭ配列を含む２７８ｂｐのより小さいものとを生成した。小さい断片を精製し、次世代シークエンシング（ＮＧＳ）により配列決定し、解析して、各ＡｎＣａｓからＰＡＭ配列多様性を決定し、どのように進化がそれを変化させたかを推定することを可能にした。図１６Ａは、５種類のＡｎＣａｓおよびＳｐＣａｓ９について、ＰＡＭ車輪グラフ（Ｋｒｏｎａプロット）の形態でＰＣＲ切断アッセイの結果をまとめている。先に観察されているように、ＬＦＣＡＡｎＣａｓは、試験したＰＡＭ配列のいずれに対しても選択性を示さなかった。他のＣａｓタンパク質では、標的近位位置２および３において特異的なヌクレオチドへの選択性が検出された（図２２）。例えば、ＬＢＣＡＡｎＣａｓの場合、ＮＧＧへの僅かな選択性が明らかになったが、さらなるＰＡＭ配列（ＮＮＧ）も検出された。より最近のＡｎＣａｓでは、ＮＧＧへの偏りがより明白であった（データは示さず）。

全ての配列を解析した後、ＮＧＧＰＡＭを含むリードの割合を系統学的解析において推定される各ＡｎＣａの地質時代に対してプロットした。経時的なＮＧＧ濃縮を反映する傾向が観察され、これはＮＧＧ忠実度がより最近のストレプトコッカス（レンサ球菌）属祖先においてＰＡＭｌｅｓｓからＮＧＧ選択性への徐々の進行を描写する進化的特徴であることを示している（図１６Ｂ）。これにより、宿主細胞によって獲得されるスペーサの数が経時的に増加した際に予期される、ＰＡＭ認識に対する進化する適応応答の仮説が確認される。最終的に、特にニッカーゼ活性を超えるＤＳＢ活性の増大（ほとんどの原核生物において有害である）がこの能力に対して淘汰圧をさらに増加させるというシナリオでは、ＣＲＩＳＰＲ座位の自己切断を回避するために強力なＰＡＭ認識能力が必要とされるであろう。ＰＡＭ許容（すなわち「ほぼＰＡＭｌｅｓｓ」）Ｃａｓ９バリアントが以前に記載されているが、ＬＦＣＡＡｎＣａｓは本発明者らが知っている限りでは、これまでに報告された最初の完全にＰＡＭｌｅｓｓなＣａｓ９エンドヌクレアーゼである。

ＬＦＣＡＡｎＣａｓのＰＡＭｌｅｓｓ能力をさらに探索するために、一般的なＴＮＮＰＡＭ内の全部で６つのＰＡＭ配列（ＴＡＣ、ＴＣＣ、ＴＡＴ、ＴＴＴ、ＴＴＣおよびＴＡＣ）に隣接する標的ＤＮＡの切断を試験するために、インビトロＰＡＭ決定アッセイを設計した。ＣＣＣＰＡＭもそのセットに含めて、最初のＴヌクレオチド以外の可能性を確認した。ＡｎＣａｓエフェクターを標的ＤＮＡのそれぞれおよびｓｇＲＮＡと共に１０分間インキュベートし、切断産物をアガロースゲルにより確認した（データは示さず）。ニック入り産物および直線状産物の両方が観察され、これは全てのＴＮＮＰＡＭ配列による切断活性を示している。ＳｐＣａｓ９の場合、ＴＧＧＰＡＭのみがスーパーコイルＤＮＡ基質の二本鎖切断を示した。ニック入り産物および直線状産物の割合を、図１６Ｃに表されている各ＰＡＭについて定量化した。最も古いＡｎＣａｓ（ＬＦＣＡＣａｓおよびＬＢＣＡＣａｓ）では、切断の割合は試験した全てのＰＡＭ配列について同様であり、その際、インキュベーション時間を考慮して予期したとおり主としてニック入り産物を生じさせた。より若いＡｎＣａｓおよびＳｐＣａｓ９の場合、切断画分はＴＧＧＰＡＭに対して高レベルに達し、ＮＧＧＰＡＭ選択性を示している。ＣＣＣ対照の場合、切断プロファイルは非ＮＧＧＰＡＭ配列から得られたものと同様であった。

別の一連の実験では、この場合も同様に以下のＰＡＭライブラリー構築の箇所に記載されているように、ＤＮＡライブラリーからのＰＣＲにより増幅されたＤＮＡ断片を用いてＰＡＭ決定を行った。ＬＢＣＡＣａｓまたはＬＳＣＡＣａｓを２％アガロースゲルにおける反応の実行により、ｇＲＮＡおよびＤＮＡライブラリーと共に１時間インキュベートした。２７８ｂｐの小さい断片をアガロースゲルから抽出し、ＩｏｎＴｏｒｒｅｎｔ次世代シーケンシング（ＮＧＳ）により解析した。シークエンシングデータからＡｎＣａｓ酵素によって認識される各ＰＡＭの頻度を決定し、ライブラリーにおける各ＰＡＭの全体的頻度に対する総割合を計算した。計算した頻度をＰＡＭ車輪グラフにおいてプロットして両方のＡｎＣａｓに対するＰＡＭ親和性を可視化した（図１３ａ）。この車輪グラフは、ＬＦＣＡＣａｓによって示されているように、ＬＢＣＡおよびＬＳＣＡＣａｓの同様のＰＡＭ選択性を示す。

異なるＰＡＭヌクレオチドの組み合わせ（ＴＮＮ）を有する標的ＤＮＡを運ぶＤＮＡプラスミドを用いて、ＰＡＭ決定アッセイをインビトロで行った。ＬＢＣＡＣａｓおよびＬＳＣＡＣａｓ（１０ｎＭ）を各ＰＡＭと共に１０分間インキュベートした（図１３ｂ）。ＬＢＣＡＣａｓは、いくつかのＰＡＭにより同様またはさらにはＬＦＣＡＣａｓよりも高い切断率を示した。ＬＳＣＡＣａｓは試験した全てのＰＡＭ配列による切断も示したが、より低い活性を有する。試験した全てのＰＡＭについてＬＦＣＡＣａｓと比較して始終より高い直線活性が認められ、ＬＢＣＡＣａｓおよびＬＳＣＡＣａｓのより高い直線状切断率を強調している。

最後に本発明者らは、当該技術分野において開示されているＣａｓ９タンパク質、特に
・国際公開第２０２１／０８４５３３Ａ１号に開示されている、いわゆる「祖先Ｃａｓ９タンパク質」（ＷＯ’５３３の配列番号２６８）、および
・Ｗａｌｔｏｎら（２０２０．Ｓｃｉｅｎｃｅ．３６８（６４８８）：２９０－２９６）のほぼＰＡＭｌｅｓｓのＣａｓ９タンパク質「ＳｐＧ」^＊および「ＳｐＲＹ」^＊＊
に対して、ＬＦＣＡＣａｓ（上に示されているようにどんなＰＡＭ配列にも選択性を有しない）およびＬＢＣＡＣａｓ（ＮＮＧ配列に対する選択性によりほぼＰＡＭｌｅｓｓであることが分かった）のＰＡＭ選択性を比較することを望んだ。
^＊ＳｐＧ：Ｄ１１３５Ｌ／Ｓ１１３６Ｗ／Ｇ１２１８Ｋ／Ｅ１２１９Ｑ／Ｒ１３３５Ｑ／Ｔ１３３７Ｒ
^＊＊ＳｐＲＹ：Ａ６１Ｒ／Ｌ１１１１Ｒ／Ｄ１１３５Ｌ／Ｓ１１３６Ｗ／Ｇ１２１８Ｋ／Ｅ１２１９Ｑ／Ｎ１３１７Ｒ／Ａ１３２２Ｒ／Ｒ１３３３Ｐ／Ｒ１３３５Ｑ／Ｔ１３３７Ｒ

全ての場合に、野生型ＳｐＣａｓ９対照を基準に含めた。

７つのランダムヌクレオチドを含むＤＮＡライブラリーを設計し、ｐＵＣ１８プラスミド（Ｇｅｎｓｃｒｉｐｔ社）にクローニングした。このランダムライブラリーをＸＬ１ｂｌｕｅ大腸菌にトランスフェクトし、数時間増幅させて、ＰＡＭ配列における最大可変性を達成した。

ＰＡＭ決定アッセイは、切断緩衝液中に３０ｎＭの各被験Ｃａｓタンパク質を含む３ｎＭのＤＮＡライブラリープラスミドを、７つのランダムヌクレオチドの上流の２０個のヌクレオチドを標的化するｇＲＮＡと共にインキュベートすることにより行った。この反応系を３７℃で１時間インキュベートし、ＥＤＴＡを含む６×ローディングダイ（ＮＥＢ社）を添加することにより反応を止め、２％アガロースゲル上で泳動させた。ゲルをＳＹＢＲ金（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ社）で染色し、ＣｈｅｍｉＤｏｃＸＲＳ＋システム（Ｂｉｏ－Ｒａｄ社）により画像化した。ＰＡＭライブラリー特異的なＰＣＲベースの増幅をアダプターおよび特異的オリゴを用いて行った：

当該断片はＩｌｌｕｍｉｎａシークエンシングにより配列決定し、それらのリードをＧｅｎｅｉｏｕｓＰｒｉｍｅ（２０２０年版）を用いて参照配列に対してマップした。ＩｌｌｕｍｉｎａｍｉＳｅｑリードを、短いリードのためにｍｉｎｉｍａｐ２を用いて増幅させた配列に対してアラインメントして非特異的配列を除外した。次いで、アラインメントしたリードから、ＰＡＭ領域の前に３つのヌクレオチドを有するリードを選択した。カスタムスクリプトを用いて、目的の領域中のヌクレオチドを抽出した。最後にｇｇｓｅｑｌｏｇｏを用いてＰＡＭ領域のロゴプロットを得、各試料のＰＡＭ車輪グラフをＫｒｏｎａＴｏｏｌｓを用いてグラフで表した。

本発明者らのデータは、試験した６種類の異なるＣａｓタンパク質のうち、ＬＦＣＡＣａｓのみが完全にＰＡＭｌｅｓｓであったことを示した。ＬＢＣＡＣａｓは最も制限のないＰＡＭ要件を有する２番目のＣａｓタンパク質であった。全ての他のＣａｓタンパク質は、より制限的なＰＡＭ選択性を有していた（図２４）。

興味深いことに、国際公開第２０２１／０８４５３３Ａ１号に開示されているいわゆる「祖先Ｃａｓ９タンパク質」は、野生型ＳｐＣａｓ９のものと同一のＮＧＧＰＡＭ要件を示した。

従ってこれらのデータから、本発明者らのＡｎＣａｓタンパク質は当該技術分野において開示されているものとは逆に、真にＰＡＭｌｅｓｓであるか少なくともほぼＰＡＭｌｅｓｓであることが確認される。

ｇＲＮＡ認識
最も古いＡｎＣａｓによって示されたＰＡＭ認識の無差別性は、これらのＡｎＣａｓがｇＲＮＡ認識に対しても無差別性を示すか否かという疑問を提起した。祖先ｇＲＮＡの再構築は理想的であるが、異なる種からのｃｒＲＮＡリピートおよびｔｒａｃｒＲＮＡの配列おける可変性はこれを非常に難しくさせる。この限界を克服し、かつＡｎＣａｓの無差別性をなお評価するために、異なる種からの現代のｓｇＲＮＡを試験した。全部で５種類のｓｇＲＮＡを、いくつかのファーミキューテス門の綱を網羅するストレプトコッカス・サーモフィルス（サーモフィルス菌）、エンテロコッカス・フェシウム、クロストリジウム・パーフリンジェンス（ウェルシュ菌）、スタフィロコッカス・アウレウス（黄色ブドウ球菌）およびフィネゴルディア・マグナ（Ｆｉｎｅｇｏｌｄｉａｍａｇｎａ）から選択した。これらのｓｇＲＮＡは、ｓｇＲＮＡの分類および機能に対する過去の研究に従って選択し、ここではｓｇＲＮＡを７つのクラスターに分けた。これらの異なるｓｇＲＮＡは、「１８ｓｇのＲＮＡ」および「２０ｎｔのｓｇＲＮＡ」とそれぞれ呼ばれる１８および２０ヌクレオチド長の２つのサイズのスペーサを含むストレプトコッカス・ピオゲネス（化膿性レンサ球菌）ガイドと対比させた。

ＳｐＣａｓ９および５種類のＡｎＣａｓを、標的プラスミドＤＮＡおよびＴＧＧＰＡＭ認識部位と共に３７℃で１０分間インキュベートした。図１７Ａの切断産物のアガロースゲルから、予期したとおり、ＳｐＣａｓ９がそれ自体のｓｇＲＮＡを使用した場合にのみプラスミドＤＮＡを直線化したが、２０ｎｔのスペーサ版を使用した場合により効率的であり、かつ他の種からのｓｇＲＮＡが主としてニック入り産物を生じ、大部分のスーパーコイルＤＮＡ基質をそのままにしたことを観察することができる。それどころか、ＬＦＣＡＣａｓおよびＬＢＣＡＣａｓは、全てのｓｇＲＮＡによりプラスミドＤＮＡにニックを入れ、かつ直線化することができ、エンテロコッカス・フェシウムのｓｇＲＮＡはＬＦＣＡＣａｓに対してより良好な効率を示し、ストレプトコッカス・ピオゲネス（化膿性レンサ球菌）からの１８ｎｔのｓｇＲＮＡはＬＢＣＡＣａｓにとって好ましかった。他のＡｎＣａｓも試験し、主としてＬＦＣＡＣａｓおよびＬＢＣＡＣａｓがｓｇＲＮＡに対して顕著な無差別性を有していたことが観察された。全ての他のＡｎＣａｓおよびＳｐＣａｓ９は、ストレプトコッカス・ピオゲネス（化膿性レンサ球菌）からの２０ｎｔのｓｇＲＮＡにより最も良く機能するように見えた（図１７Ｂ）。

過去の研究は、ｓｇＲＮＡ認識の特異性に対するＲＥＣドメインの寄与を示してきた。表３に示すように、このドメインは、最も古いものから最も新しいＡｎＣａｓへと減少するＲＭＳＤ傾向と共に最も高いＲＭＳＤの差を示す。これらの発見は、最も古いＡｎＣａｓにおいて観察されたｓｇＲＮＡ無差別性と共に、淘汰圧がＣａｓヌクレアーゼを経時的に向上したガイド特異性まで誘導したかもしれないことを示唆している。実際にこの無差別性はＩＩ－Ｃ型Ｃａｓ９において既に観察されたことがあり、これはＣａｓ９ヌクレアーゼの昔の記憶であることが示唆されてきた。これらのヌクレアーゼにおいて、この無差別性はＰＡＭに依存しないｓｓＤＮＡ切断およびより弱い基質ＤＮＡ巻き戻し能力にも関連づけられている。

別の一連の実験では、上に記載されている同じインビトロでのプラスミド切断アッセイを用いて、様々なｔｒａｃｒＲＮＡ配列に結合される標的化配列と共にｓｇＲＮＡを使用するためのＬＦＣＡＣａｓの能力を調べた。様々な既存の細菌種のＣａｓ９ｇＲＮＡによって用いられるｔｒａｃｒＲＮＡ構成要素に対応するｔｒａｃｒＲＮＡ配列を用いた。従って、ストレプトコッカス・ピオゲネス（化膿性レンサ球菌）ＰＡＭＴＧＧを含むプラスミドが提供された。それを通常の２０ｎｔのスペーサまたは短縮された１８ｎｔのスペーサを含む細菌種ストレプトコッカス・サーモフィルス（サーモフィルス菌）、エンテロコッカス・フェシウム、クロストリジウム・パーフリンジェンス（ウェルシュ菌）およびフィネゴルディア・マグナ（Ｆｉｎｅｇｏｌｄｉａｍａｇｎａ）またはストレプトコッカス・ピオゲネス（化膿性レンサ球菌）ｓｇＲＮＡのそれぞれに由来するｔｒａｃｒＲＮＡを有するｓｇＲＮＡの存在下で、ＳｐｙＣａｓ９またはＬＦＣＡＣａｓのいずれかと共にインキュベートした。用いられるｇＲＮＡ配列に関するさらなる情報については、Ｇａｓｉｕｎａｓら（２０２０年）（ＮａｔＣｏｍｍｕｎ．１１（１）：５５１２；同定されたＣａｓ９オルソログのｇＲＮＡ配列を提供するサプリメンタルデータを参照）を参照することができる。インキュベーション後に、反応産物をアガロースゲル上で泳動させ、スーパーコイルＤＮＡ、ニック入りＤＮＡおよび直線状ＤＮＡの程度を観察した。ゲルの結果は図８に示されている。ＬＦＣＡＣａｓ９は非常に柔軟なｇＲＮＡ使用を有することは明らかである。それは用いられるｇＲＮＡのｔｒａｃｒＲＮＡ要素に関わらず、プラスミドＤＮＡにニックを入れるか直線化することができた。実際に、従来のストレプトコッカス・ピオゲネス（化膿性レンサ球菌）ｓｇＲＮＡ以外のいくつかのｓｇＲＮＡにより向上した切断が認められた。そのようなｇＲＮＡ柔軟性はＳｐｙＣａｓ９については示されず、上に示されているようにＬＦＣＡＣａｓの別の新規な性質であると考えられる。

熱およびｐＨ安定性
ｐＨ７．９および４℃～６０℃の範囲の異なる温度で１時間にわたって切断反応を行うことにより、ＬＦＣＡＣａｓの熱安定性を調べた。ＬＦＣＡＣａｓは低い温度（４℃および２０℃）でＳｐｙＣａｓ９よりも高い活性を示し、５３℃～６０℃でより高い熱安定性を示した（図５ａ）。ニッキングおよびエンドヌクレアーゼ活性を計算し、ＬＦＣＡＣａｓがより低い温度でニッキング活性を有し、より高い温度ではこの２つの活性は同等に分散されることが観察された（図５ｂ）。

ｐＨ安定性の評価のために、異なるｐＨ値（４～９．５）および３７℃でアッセイを行った（図５ｃ）。酸性のｐＨにおいて、ＬＦＣＡＣａｓはＳｐｙＣａｓ９と比較して、より高い活性を維持した。アルカリ性ｐＨにおいて、ＬＦＣＡＣａｓの活性は同じままであり、ＳｐｙＣａｓ９はその最適な性能を示した。ニッキングおよびエンドヌクレアーゼ活性に関しては、ｐＨは温度と同様に活性に影響を与える（図５ｄ）。これらの結果は、一般に祖先酵素が有する高い安定性を示す。

上述のとおり、ＡｎＣａｓ、特にＬＦＣＡＡｎＣａｓは、ＨＮＨドメインを欠いているＶ型エフェクターヌクレアーゼ（例えば、Ｃｐｆ１（Ｃａｓ１２ａ）、Ｃａｓ１４（Ｃａｓ１２ｆ）またはＣａｓΦ（Ｃａｓ１２ｊ）２７－３０）といくつかの共通点を共有し得る。それらの数多くの祖先酵素がより広いｐＨおよび温度範囲で機能する能力を示し、そのように環境条件への後での適応を示したことを考慮して、別の一連の実験ではＡｎＣａｓヌクレアーゼを異なる温度およびｐＨ条件下で試験した。図２１Ａ～図２１Ｂに示すように、活性が急激に低下するＳｐＣａｓ９およびより新しいＡｎＣａｓとは異なり、ＬＦＣＡＣａｓ、ＬＢＣＡＣａｓおよびＬＳＣＡＣａｓなどの最も古いＡｎＣａｓは７以下のｐＨ値で高い活性を示した。温度に関しては、ＡｎＣａｓエンドヌクレアーゼは低温および高温、すなわち１０℃未満および５０℃超でＳｐＣａｓ９よりも優れていた。

ＬＦＣＡＣａｓによるＨＥＫ２９３Ｔ細胞ゲノム編集
ＨＥＫ２９３Ｔ細胞にＬＦＣＡＣａｓヒト化遺伝子を運ぶ発現プラスミドをトランスフェクトして、編集ゲノムＤＮＡにおける祖先酵素の有効性を調べた。ストレプトコッカス・ピオゲネス（化膿性レンサ球菌）ＰＡＭによりＡＡＶＳ１座位を標的化するためのｇＲＮＡを設計した。コード化ＬＦＣＡＣａｓを含む発現プラスミドを別のプラスミドと同時トランスフェクトしてｇＲＮＡを発現させた（図６ａ）。

次いで、ゲノムＤＮＡを抽出して挿入および欠失イベント（インデル）を調べた。抗Ｃａｓ９抗体（橙黄色）を用いて細胞の免疫蛍光画像を作成することにより、細胞内ＬＦＣＡＣａｓ発現を確認した（図６ｂ）。細胞核をＤＡＰＩで青色に染色した。ＳｐｙＣａｓ９と同様に、核においてＬＦＣＡＣａｓを発現した細胞が観察された。トランスフェクションから７２時間後に、ゲノムＤＮＡをＨＥＫ２９３Ｔ細胞から抽出し、ＡＡＶＳ１座位の断片を増幅させ、ここではＣａｓ酵素切断を標的化した。

これらの断片を用いてＴ７Ｅ１エンドヌクレアーゼアッセイを行ってゲノム編集を確認した（図６ｃ）。Ｔ７Ｅ１のインキュベーション後に、２つの予期した断片が観察され、ＬＦＣＡＣａｓトランスフェクション後にインデル形成が確認された。対照としてのＳｐｙＣａｓ９の細胞内発現により同じことが観察された。

さらに、ＬＦＣＡＣａｓおよびＳｐｙＣａｓ９ゲノム切断後のノックイン活性を調べた。前の実験と同じ戦略に従ったが、ＡＡＶＳ１座位と相同な配列によって挟まれたｅＧＦＰ遺伝子を含むＤＮＡテンプレートを追加して、相同末端結合（ＨＤＲ）を促進した（図６ｄ）。トランスフェクションから７２時間後に、細胞は緑色の蛍光を示した（図６ｅ）。定量化した蛍光強度は、ＬＦＣＡＣａｓでトランスフェクトされた細胞においてより高い値を示した（図６ｆ）。

ＡＡＶＳ１領域を標的化する同様のノックイン実験を行ったが、ＳｐｙＣａｓ９のＰＡＭとは異なるＰＡＭを使用した。この実験では、ＴＴＣＰＡＭを標的化した（図７）。細胞にｇＲＮＡおよびＬＦＣＡＣａｓまたはＳｐｙＣａｓ９をトランスフェクトした。ＤＮＡテンプレートからの全ての試料において、７２時間後に蛍光が観察された（ＳｐｙＣａｓ９を含むＴＴＣ試料では若干の一過性の蛍光）。ｇＤＮＡを抽出し、ＡＡＶＳ１座位を増幅させた。ＰＣＲ単位複製配列をゲル上で泳動させた。全てのＬＦＣＡＣａｓ試料において予期したバンドが観察されたが、ＳｐｙＣａｓ９を含む試料では観察されなかった。ＡＡＶＳ１座位においてｇＤＮＡを抽出し、かつ増幅させた。ＰＣＲ単位複製配列を電気泳動ゲル上で泳動させ、予期したとおり、ＳｐｙＣａｓ９により標的化されたＴＴＣＰＡＭは別として予期したバンドが全ての試料において観察された。

実施例２：一本鎖ＤＮＡおよび一本鎖ＲＮＡに対するエンドヌクレアーゼ活性
上述のとおり、最も古いＡｎＣａｓ（ＬＦＣＡＣａｓおよびＬＢＣＡＣａｓ）は注目すべきニッカーゼ活性を示した。このニッカーゼ活性をｓｓＤＮＡ活性に関連づけてもよい。ｓｓＤＮＡ切断活性はＩＩ－Ｃ亜型Ｃａｓ９などのより小さいＣａｓ９に存在する祖先形質であると示唆された。これを、ＡｎＣａｓなどのサブＩＩ－Ａ型からの祖先形態のニッカーゼ活性において反映させることもできる。より小さい触媒ドメインを有するより初期の形態のＣａｓ９は、より大きい祖先ヌクレアーゼになお存在していたこのｓｓＤＮＡ切断活性の起源であったかもしれず、次いでこれは分化プロセスの一部として経時的にＤＳＢ活性に向かって徐々に進化した。

一本鎖ＤＮＡに対する祖先Ｃａｓ９酵素（ＬＦＣＡＣａｓ、ＬＢＣＡＣａｓおよびＬＳＣＡＣａｓ）の活性を試験した。ＥｃｏＲＩ制限酵素によって直線化された一本鎖プラスミドｍ１３ｍｐ１８を基質として使用した。ＡｎＣａｓ酵素およびＳｐｙＣａｓ９をそれぞれ、プラスミドおよびプラスミドを標的化するように設計したｇＲＮＡと共にインキュベートした。対照として、ＤＮＡおよび酵素（ただしｇＲＮＡは使用しない）を一緒にインキュベートした（図１４）。３種類の祖先酵素は、ｇＲＮＡの有無に関わらず一本鎖ＤＮＡを切断することが分かった。マンガンが反応系中に存在する場合に、同様の活性がＳｐｙＣａｓ９により認められた。ＬＳＣＡＣａｓは一本鎖ＤＮＡについて最も高い切断率を示した。

別の一連の実験では、最も古いＡｎＣａｓをＳｐｙ－ｓｇＲＮＡの２０ｎｔのスペーサ領域に相補的な標的配列を含む８５ｎｔのｓｓＤＮＡ基質を用いて試験した。図１７Ｃおよび図１７Ｅに示すように、ＬＦＣＡＣａｓおよびＬＢＣＡＣａｓはＳｐＣａｓ９のレベルよりも最も高いレベルのｓｓＤＮＡ切断を示した。データへの指数関数フィットは、ＬＦＣＡＣａｓおよびＬＢＣＡＣａｓについて非常により速い速度を示し、ＬＢＣＡＣａｓではほぼ完全な切断に達した（表４）。活性を６０ｎｔのｓｓＲＮＡ標的に対して試験し、これは匹敵する結果を示した（図１７Ｄおよび図１７Ｆ）。切断活性の指数関数フィットはＬＢＣＡＣａｓについて最大速度および振幅を示し、この場合も同様に完全な切断に達した（表４）。これらの結果は、古代のＬＦＣＡＣａｓおよびＬＢＣＡＣａｓの両方、特にＬＢＣＡＣａｓがＲＮＡ誘導性リボヌクレアーゼとして挙動することを示している。

一本鎖基質に対する最も古いＡｎＣａｓの活性は、初期Ｃａｓヌクレアーゼがそれらの基質に対して活性であったかもしれないということを示唆しており、これは先に述べたように古代の形質であるように思われる。ｓｓＤＮＡおよびｓｓＲＮＡに対するＬＢＣＡＣａｓの注目すべき活性がＣａｓ１２ａ、Ｃａｓ１４およびＣａｓ１３ａの活性に似ていることを考慮すると、これらの能力はさらなる重要な意味を有し得、これは全てのクラス１エフェクターヌクレアーゼの活性の中での関係を示唆している。この機能的な無差別性も、ＬＢＣＡＣａｓをゲノム編集用途のための非常に多用途なエンドヌクレアーゼとして推奨する。

より無差別な特徴を示す最も古いＡｎＣａｓエンドヌクレアーゼが抗Ｃａｓ９抗体に対して異なる応答も有し得るか否かをさらに調べた。ＬＢＣＡＣａｓおよびＬＦＣＡＣａｓを抗Ｃａｓ９ウサギ抗体と共にインキュベートした。ＥＬＩＳＡ試験は抗体結合の減少を示した（図１７ｇ）。これらのヌクレアーゼを運ぶ宿主生物が長い間絶滅しており、従ってどんな生物とも接触してきていないことを考慮すると、これは予期されたとおりである。Ｃａｓ９に対する抗体は古代のＣａｓ形態に対してより弱い応答を有し得ると推論することができる。このより低い抗体応答は、インビボ編集における潜在的用途にとって興味深いものであり得、ここではＳｐＣａｓ９および他の現代のエンドヌクレアーゼに対する免疫応答は現在の限界を表す。

実施例３：ＡｎＣａｓバリアントのインビボ活性
これらの合成の祖先ＣａｓがＤＮＡ切断すなわち二本鎖切断（ＤＳＢ）を行い、かつ標準ＳｐＣａｓ９と関連づけられたものと同様の条件下で非相同末端結合（ＮＨＥＪ）によって細胞中で編集を誘発することができるか否かという疑問に答えるために、これらの祖先ヌクレアーゼのゲノム編集活性を培養液中の哺乳類細胞（ＨＥＫ２９３Ｔ）において試験した。これらの細胞に、ヒト化版のＡｎＣａｓまたはＳｐＣａｓ９ならびに対応するｓｇＲＮＡ（配列番号２３７～２３９を有する２０ｎｔのスペーサ標的を運ぶストレプトコッカス・ピオゲネス（化膿性レンサ球菌）からの標準ｓｇＲＮＡ）を含むプラスミドベクターを同時トランスフェクトした。同時トランスフェクションから７２時間後に、細胞を回収し、ゲノムＤＮＡを抽出した。ＭｏｓａｉｃＦｉｎｄｅｒソフトウェアによる高度解析を用いる次世代シークエンシング（ＮＧＳ）によって、ＨＥＫ２９３Ｔ細胞においてインビトロ部位特異的編集を測定した。

図１８に示すようにＡｎＣａｓエンドヌクレアーゼは、ＬＦＣＡＣａｓを除いてヒトのゲノムＤＮＡにおいてロバストな遺伝子編集を行った。これは、切断のためにおそらくＨＮＨドメインを使用しないＬＦＣＡＣａｓの固有の特徴を考慮すれば予期可能であり、他の種類のＣａｓヌクレアーゼに類似して一本鎖基質においてより良く機能するように思われる。

ＲＦＰ再構成に基づいてトラフィックライトレポーター（ＴＬＲ）を用いて部位特異的切断を試験した。この方法は、蛍光活性化セルソーティング（ＦＡＣＳ）に基づくＨＥＫ２９３Ｔ細胞におけるＤＮＡ修復の監視を可能にする。この場合も同様にＳｐＣａｓ９のために最適化された条件を用い、これらの結果はＮＧＳによって決定されたものに一致しており（図２３）、これはそれらのロバスト性を示している。

材料および方法
祖先配列再構築
上に記載され、かつ表１ならびに図１および図９に列挙されている開始Ｃａｓ９配列をＮＣＢＩデータベースからダウンロードした。ＭＥＧＡプラットフォーム上でＭＵＳＣＬＥソフトウェアを用いて配列のアラインメントを行い、手動で編集した。ＭＥＧＡを用いて最良の進化モデルを推定し、ガンマ分布モデルを含むＪｏｎｅｓ－Ｔｙｌｏｒ－Ｔｈｏｒｎｔｏｎ（ＪＴＴ）を得た。並列処理のためにＢＥＡＧＬＥライブラリーを含むＢＥＡＳＴｖ１．８．４パッケージソフトウェアを用い、かつマルコフ連鎖モンテカルロ（ＭＣＭＣ）を用いるベイズ推定に基づいて、系統樹推定を行った。デフォルトの出生および死亡率と共にＴＴＯＬからの分子情報を用いて、相関のない対数正規クロックモデル（ＵＣＬＮ）により分岐時間を推定した。マルチコアサーバにおいて計算を実行した。ＢＥＡＳＴからのＬｏｇＣｏｍｂｉｎｅｒユーティリティを用いて、生成された系統樹からそれらの２５％をバーンインとして破棄した。ＴＲＡＣＥＲを用いてＭＣＭＣログファイルを確認し、全てのパラメータが有効な試料サイズ（ＥＳＳ）＞１００を示すことを保証した。全てのノードの事後確率は０．６５を超えており、それらのうちのほとんどがほぼ１であった。ＦｉｇｕｒｅＴｒｅｅｖ１．４．２を使用して系統樹を可視化し、かつ編集した。最後に、部位およびＪＴＴモデル全体の可変置換率のためのガンマ分布と共にＰＡＭＬ４．８を用いて最尤法により祖先配列再構築を行った。全てのアミノ酸について事後確率を計算し、各部位のために最も高い事後確率を有する残基を選択した。再構築のための系統樹から、最終ファーミキューテス門共通祖先（ＬＦＣＡ）、最終バシラス綱共通祖先（ＬＢＣＡ、最終ストレプトコッカス（レンサ球菌）属共通祖先（ＬＳＣＡ）、最終化膿性共通祖先（ＬＰＣＡ）、最終化膿性／溶血性共通祖先（ＬＰＤＣＡ）を選択した。

上記方法によって同定されたノード配列は、本出願と共に提供されている配列表に記載されており、それはその全体が本明細書に明示的に組み込まれる。

タンパク質の産生および精製
大腸菌細胞発現のためのコドン最適化を用いてＬＦＣＡＣａｓコード配列を合成した。このコード配列をｐＢＡＤ／Ｈｉｓ発現ベクター（ＴｈｅｒｍｏＦｉｓｈｅｒ社）にクローニングし、タンパク質発現のために大腸菌ＢＬ２１（ＤＥ３）（ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ社）にトランスフェクトした。ＳｐｙＣａｓ９発現プラスミドはＡｄｄｇｅｎｅ社から購入した（プラスミド＃６２９３４）。細胞をＯＤ６００が０．６に達するまでＬＢ培地中３７℃でインキュベートした。ＬＦＣＡＣａｓの発現のためにＬ－アラビノースを０．１％になるまで細胞に添加し、ＳｐｙＣａｓ９の発現のためにＩＰＴＧを１ｍＭになるまで細胞に添加し、かつ２０℃で一晩タンパク質誘導した。細胞は４０００ｒｐｍの遠心分離によってペレット化した。ペレットを抽出緩衝液（２０ｍＭのＨＥＰＥＳ（ｐＨ７．５）、３００ｍＭのＮａＣｌ、２５ｍＭのイミダゾール、０．５ｍＭのＴＣＥＰ）に再懸濁させた。１５分間インキュベーションしながら、このペレットに１００ｍｇ／ｍＬのリゾチーム（ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ社）を添加した。次いで、このペレットを３０％の振幅および１０分間の３サイクルで超音波処理した。３３，０００ｇで１時間の超遠心分離により細胞デブリを分離した。精製のために、上澄みをＨｉｓＧｒａｖｉＴｒａｐ親和性カラム（ＧＥＨｅａｌｔｈｃａｒｅ社）を用いて混合し、溶出緩衝液（２０ｍＭのＨＥＰＥＳ（ｐＨ７．５）、３００ｍＭのＮａＣｌ、５００ｍＭのイミダゾール、０．５ｍＭのＴＣＥＰ）で溶離した。タンパク質をＳｕｐｅｒｄｅｘ２００ＨＲカラム（ＧＥＨｅａｌｔｈｃａｒｅ社）を用いるサイズ排除クロマトグラフィによりさらに精製し、２０ｍＭのＨＥＰＥＳ（ｐＨ７．５）、１ＭのＫＣｌ、１０ｍＭのＭｇＣｌ_２、０．５ｍＭのＴＣＥＰで溶離した。タンパク質精製の確認のために、ＳＤＳ－ＰＡＧＥを８％ゲルと共に使用した。Ｎａｎｏｄｒｏｐ２０００Ｃにおいて２８０ｎｍで吸光度を測定することによりタンパク質濃度を計算した。

ｇＲＮＡ合成
標的に相補的な配列を有するｇＲＮＡを合成し、ｐＵＣ１８ベクターにクローニングした。Ｐｈｕｓｉｏｎ（登録商標）ＨｏｔＳｔａｒｔＦｌｅｘＤＮＡポリメラーゼ（ＮＥＢ社）を用いるＰＣＲによりｇＲＮＡ配列を増幅させた。ｍｉ－ＰＣＲ精製キット（Ｍｅｔａｂｉｏｎ社）を用いてＰＣＲ産物を精製した。ＨｉＳｃｒｉｂｅＴ７高収率ＲＮＡ合成キット（ＮＥＢ社）を用いてｇＲＮＡを合成した。ＰＣＲ断片は５’末端にＴ７プロモーターと、３’末端にストレプトコッカス・ピオゲネス（化膿性レンサ球菌）のｓｇＲＮＡからの配列とを有していた。反応系を一晩インキュベートし、Ｍｏｎａｒｃｈ（登録商標）ＲＮＡ精製カラムキットのプロトコルに従ってｓｇＲＮＡを精製した。ＴＢＥ緩衝液を含む２％アガロースゲルによる電気泳動によりｇＲＮＡ完全性を分析した。

インビトロ切断アッセイ
精製したＬＦＣＡＣａｓおよびＳｐｙＣａｓ９を用いてインビトロ切断アッセイを行った。全てのアッセイにおいて、切断緩衝液（１００ｍＭのＮａＣｌ、５０ｍＭのＴｒｉｓ－ＨＣｌ、１０ｍＭのＭｇＣｌ_２、１００μｇのＢＳＡ、ｐＨ７．９）中に１：１の比で、３０ｎＭのＣａｓヌクレアーゼを３０ｎＭのｇＲＮＡと共に３７℃で１５分間インキュベートした。次いで、３ｎＭの標的ＤＮＡを添加し、実験に応じて異なる時間にわたってインキュベートした。ＥＤＴＡを含む６×ローディングダイ（ＮＥＢ社）を添加することにより反応を止め、最終反応産物を２％アガロースゲル上で泳動させた。ゲルをＳＹＢＲ金（ＴｈｅｒｍｏＦｉｓｈｅｒ社）で染色し、ＣｈｅｍｉＤｏｃＸＲＳ＋システム（Ｂｉｏ－Ｒａｄ社）により画像化した。切断をＩｍａｇｅＪにより定量化した。

インビトロでの熱およびｐＨ安定性
条件を変えたこと以外は、インビトロ切断のために先に説明されているプロトコルに従ってアッセイを行った。熱安定性のためのアッセイは４～６０℃で変化させた温度を用いてｐＨ７．９で行った。ｐＨ安定性のためのアッセイは３７℃で行い、ｐＨは４～９．５で変化させた。１時間後に、ＥＤＴＡを含む６×ローディングダイ（ＮＥＢ社）を添加することによりこの反応を止め、最終反応産物を２％アガロースゲル上で泳動させた。ゲルをＳＹＢＲ金（ＴｈｅｒｍｏＦｉｓｈｅｒ社）で染色し、ＣｈｅｍｉＤｏｃＸＲＳ＋システム（Ｂｉｏ－Ｒａｄ社）により画像化した。切断をＩｍａｇｅＪにより定量化した。

ＰＡＭライブラリーの構築
７つのランダムヌクレオチドを含むＤＮＡライブラリーを設計し、Ｇｅｎｓｃｒｉｐｔ社製のｐＵＣ１８プラスミドにクローニングした。このランダムライブラリーをＸＬ１ｂｌｕｅ大腸菌にトランスフェクトし、数時間増幅してＰＡＭ配列における最大可変性を達成した。７つのランダムヌクレオチドを含むＤＮＡライブラリーからのプライマー（Ｆ’ＡＡＴＡＧＧＣＧＴＡＴＣＡＣＧＡＧＧＣ（配列番号６）およびＲ’ＡＧＣＧＡＧＴＣＡＧＴＧＡＧＣＧＡＧ（配列番号７））を用いて、８４４ｂｐのＰＣＲ断片を増幅させた。

ＰＡＭ決定
ＰＡＭ決定アッセイは、切断緩衝液中で３０ｎＭのＬＦＣＡＣａｓを含むＤＮＡライブラリーからの３ｎＭのＰＣＲ断片および７つのランダムヌクレオチドの上流の２０個のヌクレオチドを標的化する３０ｎＭのｇＲＮＡをインキュベートすることにより行った。反応系を３７℃で１時間インキュベートした。ＥＤＴＡを含む６×ローディングダイ（ＮＥＢ社）を添加することにより反応を止め、最終反応産物を２％アガロースゲル上で泳動させた。ゲルをＳＹＢＲ金（ＴｈｅｒｍｏＦｉｓｈｅｒ社）で染色し、ＣｈｅｍｉＤｏｃＸＲＳ＋システム（Ｂｉｏ－Ｒａｄ社）により画像化した。ＧｅｎｅＪｅｔゲル抽出キット（ＴｈｅｒｍｏＦｉｓｈｅｒ社）を用いて、２７８ｂｐの小さい断片をアガロースゲルから精製した。この断片をＩｏｎＴｏｒｒｅｎｔにより配列決定し、得られたリードを参照配列においてマップした。０個のミスマッチを有する参照に対してアラインメントされたリードを選択し、各ＰＡＭについて頻度を計算した。

ＨＥＫ２９３Ｔ細胞のゲノム編集
細胞を１％（ｗ／ｖ）Ｌ－グルタミンおよびペニシリン－ストレプトマイシン（１００ＩＵ／ｍｌ）が添加されたＤＭＥＮ＋１０％ＦＢＳ培地中に維持した。ＬＦＣＡＣａｓおよびＳｐｙＣａｓ９のためのヒト化コード配列をｐＣＤＮＡ３．１（ＴｈｅｒｍｏＦｉｓｈｅｒ社）発現ベクターにクローニングし、ｇＲＮＡをＴＯＰＯベクター（ＴｈｅｒｍｏＦｉｓｈｅｒ社）にクローニングした。プラスミドをリポフェクタミンＬＴＸ（ＴｈｅｒｍｏＦｉｓｈｅｒ社）と共に５分間インキュベートし、細胞に同時トランスフェクトした。この培地をトランスフェクションから２４時間後に変え、７２時間後に細胞を回収した。製造業者のプロトコルに従ってＤＮＡｚｏｌ試薬（ＴｈｅｒｍｏＦｉｓｈｅｒ社）を用いてｇＤＮＡを細胞から抽出した。ｇＤＮＡからのプライマー（Ｆ’ＴＡＴＴＧＴＴＣＣＴＣＣＧＴＧＣＧＴＣＡＧ（配列番号８）およびＲ’ＧＡＣＧＡＧＡＡＡＣＡＣＡＧＣＣＣＣＡ（配列番号９））を用い、Ｐｈｕｓｉｏｎ（登録商標）ＨｏｔＳｔａｒｔＦｌｅｘＤＮＡポリメラーゼ（ＮＥＢ社）を用いるＰＣＲによりＤＮＡ標的を増幅させた。これらのＰＣＲ単位複製配列を基質として用いてＴ７ＥＩアッセイを行ってインデル形成を確認した。製造業者のプロトコルに従って、Ｔ７Ｅ１エンドヌクレアーゼ（ＮＥＢ社）を使用した。ＥＤＴＡを含む６×ローディングダイ（ＮＥＢ社）を添加することにより反応を止め、最終反応産物を２％アガロースゲル上で泳動させた。ゲルをＳＹＢＲ金（ＴｈｅｒｍｏＦｉｓｈｅｒ社）で染色し、ＣｈｅｍｉＤｏｃＸＲＳ＋システム（Ｂｉｏ－Ｒａｄ社）により画像化した。

ｅＧＦＰ遺伝子とＡＡＶＳ１座位の５００ｂｐの相同なアームによって挟まれたＣＭＶプロモーターとを含む二本鎖ＤＮＡテンプレートを利用したこと以外は、ノックイン実験と同じ戦略を使用した。７２時間後に共焦点顕微鏡法によって免疫蛍光を定量化した。

免疫蛍光研究
２４時間のＬＦＣＡＣａｓおよびＳｐｙＣａｓ９プラスミドのトランスフェクション後に、ＨＥＫ２９３Ｔ細胞を４％パラホルムアルデヒドで３０分間固定した。細胞を０．２％ＴｒｉｔｏｎＸ－１００／ＰＢＳと共に室温で３０分間インキュベートし、次いでブロッキング工程のために３％ＢＳＡ、０．０５％Ｔｗｅｅｎ２０と共に１時間インキュベートした。細胞をＴＰＢＳ（０．０５％Ｔｗｅｅｎ－ＰＢＳ）で３回洗浄し、ポリクローナル抗Ｃａｓ９抗体（１：１００、６００－４０１－ＧＫ０、Ｔｈｅｒｍｏｆｉｓｈｅｒ社）と共に３７℃で１時間インキュベートした。細胞をＴＰＢＳで３回洗浄し、二次抗体（ＡｌｅｘａＦｌｕｏｒ５５５で標識したヤギ抗ウサギ、１：２００、Ａ－２１４２８、Ｔｈｅｒｍｏｆｉｓｈｅｒ社）と共に１０分間インキュベートした。この工程でＤＡＰＩを添加し、最後に１回細胞を洗浄し、共焦点顕微鏡法により可視化した。

ｇＲＮＡ無差別性についてのインビトロ切断アッセイ
ｇＲＮＡ無差別性についてのインビトロ切断のために、ＴＧＧＰＡＭを運ぶＤＮＡプラスミドを使用した。切断アッセイは切断緩衝液（１００ｍＭのＮａＣｌ、５０ｍＭのＴｒｉｓ－ＨＣｌ、１０ｍＭのＭｇＣｌ_２、１００μｇ／ＢＳＡ、ｐＨ７．９）中３７℃で行った。３ｎＭのＡｎＣａｓおよびＳｐＣａｓ９を各細菌種の３ｎＭのｓｇＲＮＡと共に１：１の比で、切断緩衝液中で１５分間インキュベートし、３ｎＭのＤＮＡプラスミドを添加した。１０分後にＥＤＴＡを含む６×ローディングダイ（ＮＥＢ社）を添加することにより反応を止め、２％アガロースゲル上で泳動させた。同様に、ゲルをＳＹＢＲ金（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ社）で染色し、ＣｈｅｍｉＤｏｃＸＲＳ＋システム（Ｂｉｏ－Ｒａｄ社）により画像化した。切断をＩｍａｇｅＪにより定量化した。

ｓｓＤＮＡおよびｓｓＲＮＡについてのインビトロ切断アッセイ
精製したＬＦＣＡ（ＦＣＡ）ＡｎＣａｓ、ＬＢＣＡ（ＢＣＡ）ＡｎＣａｓおよびＳｐＣａｓ９エンドヌクレアーゼを用いてインビトロ切断アッセイを行った。全てのアッセイにおいて、３０ｎＭの酵素を３０ｎＭのｓｇＲＮＡ（Ｓｐｙ－ｓｇＲＮＡ２０ｎｔ）と共に１：１の比で切断緩衝液（１００ｍＭのＮａＣｌ、５０ｍＭのＴｒｉｓ－ＨＣｌ、１０ｍＭのＭｇＣｌ_２、１００μｇ／ＢＳＡ、ｐＨ７．９）中３７℃で１５分間インキュベートした。次いで、３ｎＭの標的（ｓｓＤＮＡまたはｓｓＲＮＡ）を添加し、異なる時間間隔（０、５、１０、３０および６０分間）でインキュベートした。ｓｓＤＮＡ標的のために、尿素を含む６×ローディングダイ（ＮＥＢ社）を添加することにより反応を止めた。試料を８０℃で１０分間沸騰させ、２．５％変性尿素アガロースゲルにより分離させた。ｓｓＲＮＡ標的のために、尿素を含む２×ＲＮＡゲルローディングバッファー（ＮＥＢ社）を添加することにより反応を止めた。試料を９５℃で１０分間沸騰させ、１５％変性尿素ポリアクリルアミドゲル電気泳動により分離させた。全ての場合に、ゲルをＳＹＢＲ金（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ社）で染色し、ＣｈｅｍｉＤｏｃＸＲＳ＋システム（Ｂｉｏ－Ｒａｄ社）により画像化した。切断をＩｍａｇｅＪにより定量化し、単一指数関数的減衰曲線に当てはめた。

ＥＬＩＳＡ試験
Ｅｌｉｓａ試験は、他のところに記載されている修正されたプロトコルを使用して行った^６０。簡単に言うと、１μｇ／ウェルのＳｐＣａｓ９、ＬＦＣＡＡｎＣａｓ、ＬＢＣＡＡｎＣａｓおよびウシ血清アルブミン（ＢＳＡ、ＳｉｇｍａＡｌｄｒｉｃｈ社）を１×重炭酸緩衝液で希釈し、９６ウェルプレート（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ社）に４℃で一晩コーティングした。プレートを１×洗浄緩衝液（ＴＢＳＴ、ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ社）で洗浄し、１％ＢＳＡブロッキング溶液を用いて室温で１時間ブロッキングを行った。抗Ｃａｓ９ウサギ抗体（Ｒｏｃｋｌａｎｄ社、６００－４０１－ＧＫ０）を１％ＢＳＡブロッキング溶液で１：２５０００で希釈し、プレートを室温で２時間インキュベートした。次いでプレートを洗浄し、１％ＢＳＡブロッキング溶液で１：２０００で希釈したＨＲＰ結合ヤギ抗ウサギＩｇＧ（Ｈ＋Ｌ）（Ｉｎｖｉｔｒｏｇｅｎ社）を添加し、室温で１時間インキュベートした。最後に、３，３’，５，５’－テトラメチルベンジジンＥＬＩＳＡ基質溶液（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ社）を添加し、室温で１０分間インキュベートした。１Ｎ硫酸により反応を止めた。吸光度はＶＩＣＴＯＲＸ５マイクロプレートリーダー（ＰｅｒｋｉｎＥｌｍｅｒ社）を用いて４５０ｎｍで測定した。

ヒトのＨＥＫ２９３Ｔ細胞のインビボ切断
他のところに記載されているように（Ｈａｒｍｓ，Ｄ．Ｗ．ら．ＨｕｍａｎＧｅｎｅｔｉｃｓ８３，２０１４）、ヒトのＨＥＫ２９３Ｔ細胞において祖先Ｃａｓヌクレアーゼの機能的な検証を行った。無菌の濾過した１０％ウシ胎児血清（ＦＢＳ）、１０ｍＭのＨＥＰＥＳ（ｐＨ７．４）、２ｍＭのＬ－グルタミンおよびペニシリン（１００ＩＵ／ｍｌ）－ストレプトマイシン（１００μｇ／ｍｌ）が添加されたＤＭＥＭ培地（ダルベッコ変法イーグル培地、Ｇｉｂｃｏ社）において細胞を増殖させ、無菌フードを用いて無菌条件下で取り扱った。ＨＥＫ２９３Ｔ細胞を３７℃、９５％の湿度および５％ＣＯ_２のインキュベータ中で培養した。ヒト化ＡｎＣａｓをｐｃＤＮＡ３．１プラスミド発現ベクター（ＴｈｅｒｍｏＦｉｓｈｅｒ社）にクローニングした。ｓｇＲＮＡ標的配列をＢｒｅａｋｉｎｇ－Ｃａｓウェブツール^６２を用いて設計し、ＧｏｌｄｅｎＧａｔｅクローニング方法によりＭＬＭ３６３６プラスミドベクター（Ａｄｄｇｅｎｅ社＃４３８６０）にクローニングした。ｈＣａｓ９プラスミド（Ａｄｄｇｅｎｅ社＃４１８１５）からのＳｐＣａｓ９を陽性対照として使用した。インビボゲノム編集試験のために細胞を、抗生物質を含まない０．５ｍｌの体積のＤＭＥＭ中に４×１０^５細胞／ｍｌの密度で２４ウェルプレートに播種した。これらの細胞に、１μｇのｈＣａｓ／ｈＡｎＣａｓプラスミドおよび０．５μｇの対応するｓｇＲＮＡプラスミドを、１つのウェル当たり１００μｌのＯｐｔｉ－ＭＥＭ（Ｇｉｂｃｏ社）で希釈した２μｌのリポフェクタミン２０００（ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ社）でトランスフェクトした。トランスフェクションから７２時間後に、ＨｉｇｈＰｕｒｅテンプレート調製キット（Ｒｏｃｈｅ社）を用いてゲノムＤＮＡを単離した。標的ＤＳＢを取り囲んでいるＰＣＲ増幅されたＤＮＡ断片に対するＴ７エンドヌクレアーゼＩアッセイによりインデル発生を評価した。

図１に従うノード識別を有する再構築された祖先配列
全てが１３４０または１３６８個のアミノ酸残基（再構築方法に応じる）であった。配列は、配列番号１～５および１０～２３６に記載されているものとして開示されている。

配列番号１～５は上に例示されている祖先Ｃａｓタンパク質に対応している。

Claims

（ｉ）配列番号１に記載されているアミノ酸配列を有するＬＦＣＡヌクレアーゼ、
（ｉｉ）配列番号２に記載されているアミノ酸配列を有するＬＢＣＡヌクレアーゼ、
（ｉｉｉ）配列番号３に記載されているアミノ酸配列を有するＬＳＣＡヌクレアーゼ、
（ｉｖ）配列番号４に記載されているアミノ酸配列を有するＬＰＣＡヌクレアーゼ、
（ｖ）配列番号５に記載されているアミノ酸配列を有するＬＰＤＣＡヌクレアーゼ、または
（ｖｉ）（ｉ）～（ｖ）のいずれか１つに記載のＣａｓヌクレアーゼのバリアントを含むかそれからなるＣａｓヌクレアーゼであって、前記バリアントは、
・配列番号１のアミノ酸配列との少なくとも６０％の配列同一性、または
・配列番号２のアミノ酸配列との少なくとも７５％の配列同一性、または
・配列番号３のアミノ酸配列との少なくとも８０％の配列同一性、または
・配列番号４のアミノ酸配列との少なくとも８５％の配列同一性、または
・配列番号５のアミノ酸配列との少なくとも９５％の配列同一性
を共有し、かつ
さらに、前記バリアントはＳｐｙＣａｓ９と比較した場合に、以下の際立った特性：
（ａ）ＳｐｙＣａｓ９により実質的に専ら直線化ＤＮＡプラスミドテンプレートのみが得られるという条件下での、より高い割合のニック入りＤＮＡプラスミドテンプレートおよび／またはより低い割合の直線化ＤＮＡプラスミドテンプレート、
（ｂ）前記バリアントが観察可能なニック入り標的を提供する間にＳｐｙＣａｓ９により実質的に専ら直線化のみが生じる（少なくとも約４：１の直線化ＤＮＡプラスミド標的：ニック入りＤＮＡプラスミドテンプレートの比）という条件下で、ＤＮＡプラスミド標的に対するより高いニック率および／またはより低い直線化率、
（ｃ）ＬＦＣＡ、ＬＢＣＡまたはＬＳＣＡのうちのいずれかに匹敵する緩和されたＰＡＭ要件、
（ｄ）一本鎖ＤＮＡを切断するための能力、および
（ｅ）前記標的化配列が、複数の既存の細菌種によって用いられるＣａｓ９ｇＲＮＡのｔｒａｃｒＲＮＡ構成要素から選択可能なｔｒａｃｒＲＮＡ構成要素に結合されるｓｇＲＮＡを使用するための能力
の１つまたはいくつかを保持しているＣａｓヌクレアーゼ。
前記Ｃａｓヌクレアーゼは、そのニッカーゼ活性のみを保持するように触媒部位の突然変異誘発により改変されている、請求項１に記載のＣａｓヌクレアーゼ。
前記Ｃａｓヌクレアーゼは、置換または欠失、好ましくは１つまたはいくつかの保存的置換による１つまたはいくつかのアミノ酸変化を含み、それにより前記Ｃａｓヌクレアーゼのエンドヌクレアーゼおよび／またはニッカーゼ活性が保持され、かつそれによりＬＦＣＡＣａｓの緩和されたＰＡＭ特異性が保持される、請求項１または２に記載のＣａｓヌクレアーゼ。
前記Ｃａｓヌクレアーゼは、そのヌクレアーゼ活性を無効にするように触媒部位の突然変異誘発により改変されている、請求項１～３のいずれか１項に記載のＣａｓヌクレアーゼ。
前記Ｃａｓヌクレアーゼは、遺伝子改変もしくは調節の非ヌクレアーゼエフェクターに結合または融合されている、請求項１～４のいずれか１項に記載のＣａｓヌクレアーゼ。
請求項１～５のいずれか１項に記載のＣａｓヌクレアーゼをコードする核酸。
（ｉ）請求項１～５のいずれか１項に記載のＣａｓヌクレアーゼまたは請求項６に記載の核酸を含むベクター、および（ｉｉ）ガイドＲＮＡまたはガイドＲＮＡを発現するベクターを含むかそれからなる組み合わせ産物であって、前記ガイドＲＮＡは標的ＤＮＡ配列に前記Ｃａｓヌクレアーゼを標的化する組み合わせ産物。
請求項１～５のいずれか１項に記載のＣａｓヌクレアーゼおよびガイドＲＮＡを含むリボ核タンパク質複合体であって、前記ガイドＲＮＡは標的ＤＮＡ配列に前記Ｃａｓヌクレアーゼを標的化するリボ核タンパク質複合体。
標的核酸配列、好ましくはＤＮＡ配列を改変または調節するための方法であって、前記標的核酸配列を、（ｉ）請求項１～３または５のいずれか１項に記載のＣａｓヌクレアーゼ、および（ｉｉ）前記標的配列に前記Ｃａｓヌクレアーゼを標的化するガイドＲＮＡと接触させることを含み、さらに
（ａ）前記接触させることは、前記方法が人間の生殖細胞系列同一性を改変する方法ではないという条件で、インビトロで単離された標的核酸とのもの、またはエクスビボで細胞内でのものである、あるいは
（ｂ）前記方法はヒトもしくは動物体に対して実施される医学的治療方法ではない
のいずれかである方法。
前記標的核酸配列は、エクスビボのヒトもしくは動物細胞における標的ＤＮＡ配列である、請求項９に記載の方法。
薬物として使用するための請求項７に記載の組み合わせ産物。
標的核酸配列を改変または調節することによる治療処置の方法に使用するための、請求項７に記載の組み合わせ産物。
前記治療処置方法は遺伝性疾患を予防および／または治療することを含む、請求項１２に記載の使用のための組み合わせ産物。
前記組み合わせ産物は目的の導入遺伝子をコードする核酸分子をさらに含む、請求項１２または１３に記載の使用のための組み合わせ産物。
機能的な単体エフェクターＣａｓタンパク質ヌクレアーゼを得るための系統学的祖先再構築方法であって、
（ａ）同じ分類型の天然に生じる単体エフェクターＣａｓヌクレアーゼ配列を含み、かつ複数の既存の種、好ましくは２つ以上の属、なおより好ましくは２つ以上の綱（場合により２つ以上の門を跨ぐ）から得られる、Ｃａｓ配列の集団の配列解析からの系統樹を提供する工程と、
（ｂ）前記系統樹から進化経路を遡ることにより祖先バリアント配列を選択する工程であって、前記選択された祖先バリアントの各アミノ酸のために高確率のアミノ酸を決定する工程と、
（ｃ）Ｃａｓタンパク質エンドヌクレアーゼおよび／またはニッカーゼ活性を示すことができる前記バリアントを産生する工程と
を含む方法。
工程（ｂ）は、
（ｉ）同じ属の配列のある部分を形成するそれぞれがちょうど複数の種の配列のための祖先バリアントである祖先バリアントの配列を編集すること、好ましくはさらに
（ｉｉ）（ｉ）で達成された前記配列を用いて祖先属として割り当てられている１つ以上の祖先バリアント配列および／または複数の属の開始種の配列に遡ることができる祖先綱として割り当てられている１つ以上の祖先バリアント配列を編集すること、好ましくはさらに
（ｉｉｉ）２つ以上の綱の開始種に遡ることができる少なくとも１つの綱間祖先配列を編集すること
を含む、請求項１５に記載の方法。
前記選択された祖先バリアント配列は、現在から少なくとも５億年、例えば少なくとも７～８億年、より好ましくは少なくとも１０億年、例えば約２０～３０億年の進化期間に匹敵する、請求項１５または１６に記載の方法。
前記選択された祖先バリアント配列は既存の細菌種のＣａｓ９配列の祖先バリアントである、請求項１５～１７のいずれか１項に記載の方法。
Ｃａｓ９配列の開始集団は、ストレプトコッカス、エンテロコッカス、リステリア、クロストリジウム、ペラギルハブダス（Ｐｅｌａｇｉｒｈａｂｄｕｓ）、ハロラクティバシラス（Ｈａｌｏｌａｃｔｉｂａｃｉｌｌｕｓ）、フルオリコッカス（Ｆｌｏｒｉｃｏｃｃｕｓ）、バゴコッカス（Ｖａｇｏｃｏｃｃｕｓ）、Ｕｒｉｎａｃｏｃｃｕｓ、バゴコッカス（Ｖａｇｏｃｏｃｃｕｓ）、ドレア（Ｄｏｒｅａ）、ルミノコッカス、ラクノスピラ、アナエロスティペス（Ａｎａｅｒｏｓｔｉｐｅｓ）、オルセネラ（Ｏｉｓｅｎｅｌｌａ）およびビフィドバクテリウムのうちの２種以上から選択される複数の細菌性Ｃａｓ９配列を含む、請求項１８に記載の方法。
配列の開始集団は、任意に放線菌のＣａｓ９配列が追加された、２つ以上の細菌クラス、好ましくは細菌のバシラス綱およびクロストリジウム綱の両方からのＣａｓ９配列、例えばストレプトコッカス（レンサ球菌）属の異なる種由来の少なくとも複数の配列、エンテロコッカス属の異なる種由来の複数の配列、リステリアの異なる種由来の複数の配列およびクロストリジウム属種由来の複数の配列を跨ぐ、請求項１８または１９に記載の方法。
前記選択された祖先バリアント配列は、２つ以上の綱の開始種まで遡ることができる綱間祖先バリアント配列である、請求項１５～２０のいずれか１項に記載の方法。
前記選択された祖先バリアントは、エンドヌクレアーゼ二本鎖ＤＮＡ切断を示すことができるように決定し、かつニッカーゼのみまたはヌクレアーゼ活性を有しないｄｅａｄＣａｓのいずれかにさらに変換し、かつ／または例えば融合タンパク質において非ヌクレアーゼエフェクターに結合させる、請求項１５～２１のいずれか１項に記載の方法。
Ｃａｓ９配列の祖先バリアントは、以下の特性：
（ａ）ＳｐｙＣａｓ９により少なくとも約４：１の直線化ＤＮＡプラスミド標的：ニック入りＤＮＡプラスミドテンプレートの比が得られるという条件下での、少なくとも約２．３：１～少なくとも１：４の間の直線化ＤＮＡプラスミド標的：ニック入りＤＮＡプラスミドテンプレートの比、
（ｂ）ＬＦＣＡ、ＬＢＣＡまたはＬＳＣＡのうちのいずれかに匹敵する緩和されたＰＡＭ要件、
（ｃ）一本鎖ＤＮＡを切断するための能力、
（ｄ）前記標的化配列が、複数の既存の細菌種によって用いられるＣａｓ９ｇＲＮＡのｔｒａｃｒＲＮＡ構成要素から選択可能なｔｒａｃｒＲＮＡ構成要素に結合されるｓｇＲＮＡを使用するための能力
の１つまたはいくつかを有する、請求項１８～２１のいずれか１項に記載の方法。
前記選択された祖先バリアントを、ニッカーゼのみまたはヌクレアーゼ活性を有しないｄｅａｄＣａｓのいずれかであるバリアントにさらに変換し、かつ／または例えば融合タンパク質において非ヌクレアーゼエフェクターとの結合を提供する、請求項２３に記載の方法。